La prueba exacta de Fisher del es una prueba estadística de la significación usada en el análisis de los datos categóricos donde están pequeños los tamaños de la muestra . Se nombra después de su inventor, R. Fisher, y es una de una clase de las pruebas exactas . Fisher ideó la prueba que seguía un comentario Muriel Bristol, que demandó poder detectar si el té o la leche fue agregado primero a su taza.

La prueba se utiliza para examinar la significación de la asociación entre dos variables en una tabla de contingencia de 2 x 2 . El P-valor de la prueba se computa como si los márgenes de 2 por la tabla 2 sean fijos, e. si, en el ejemplo de la té-prueba, ms Bristol sabe el número de tazas con cada tratamiento (leche o té primero) y por lo tanto provee de conjeturas el número correcto en cada categoría. Según lo precisado por Fisher, esto lleva bajo hipótesis nula de la independencia al uso de la distribución hipergeométrica para una cuenta dada en la tabla.

Con las muestras grandes, una prueba del Ji-cuadrado se puede utilizar en esta situación. Sin embargo, esta prueba no es conveniente cuando los valores previstos en las células unas de los de la tabla, dadas los márgenes, están debajo de 10: la distribución de muestra de la estadística de prueba se calcula que es solamente aproximadamente igual a la distribución teórica del Chi, y a la aproximación es inadecuada en estas condiciones (que se presenten cuando los tamaños de muestra son pequeños, o los datos se distribuyen muy desigual entre las células de la tabla). La prueba de Fisher está, como sus estados conocidos, exactos, y puede por lo tanto ser utilizada sin importar las características de la muestra. Llega a ser difícil calcular con las muestras grandes o las tablas bien equilibradas, pero éstas son afortunadamente exactamente las condiciones donde está apropiada la prueba del ji-cuadrado.

Ejemplo

Las pruebas exactas permiten que una obtenga un análisis más exacto basado en pequeña muestra o los datos que son raras. Las pruebas exactas para los análisis no paramétricos son la estadística apropiada a utilizar al trabajar con datos desequilibrados. Los datos desequilibrados analizados con los métodos asintóticos tienden a producir resultados no fiables. Para los conjuntos de datos grandes y bien equilibrados, los p-valores exactos y asintóticos son muy similares. Pero para pequeño, escaso, o y los datos desequilibrados, los p-valores exactos y asintóticos puede ser absolutamente diferente y puede llevar a las conclusiones opuestas referentes a la hipótesis del interés (Mehta, Patel, y Tsiatis, 1984; Mehta, 1995; Mehta y Patel, 1997).

La necesidad de la prueba de Fisher se presenta cuando tenemos datos que se dividan en dos categorías de dos maneras separadas. Por ejemplo, una muestra de adolescentes se pudo dividir en varón y hembra por una parte, y las que están y no están adietando actual en el otro. Presumimos, quizás, que la proporción de individuos de dieta es más alta entre las mujeres que entre los hombres, y queremos probar si cualquier diferencia de las proporciones que observamos es significativa. Los datos pudieron parecer esto:

menwomentotal
dieting1910
not dieting11314
totals121224

Estos datos no serían convenientes para el análisis por una prueba de Chi, porque los valores previstos en la tabla son todos debajo de 10, y en 2 × la tabla de contingencia 2, el número de grados de libertad es siempre 1.

La pregunta que hacemos acerca de estos datos es: ¿sabiendo que 10 de estos 24 adolescentes son dieters, y que 12 de el 24 son femeninos, cuál es la probabilidad que distribuirían estos 10 dieters tan irregularmente entre las muchachas y los muchachos? ¿Si eligiéramos 10 de los adolescentes al azar, cuál es la probabilidad que 9 de ellos estarían entre las 12 muchachas, y solamente 1 entre de los 12 muchachos?

Antes de que procedamos con la prueba de Fisher, primero introducimos alguna notación. Representamos las células por el a, b, c y d de las letras, llamamos los totales a través de las filas y de los totales marginales del de las columnas, y representamos el importe total por el n . La tabla ahora parece tan esto:

de c del d de del d
menwomentotal
dieting un del b de + b
del c del
not dieting + d
totals + b del c + n

Fisher demostró que la probabilidad de obtener cualquier sistema de valores fue dada por la distribución hipergeométrica :

p = +d} \ eligen { +d} \ eligen { \ dejado n} \ elige {a+c} ¡\ right. = \ frac {(a+b)! ¡(c+d)! ¡(a+c)! (b+d)!}¡{n! ¡a! ¡b! ¡c! d!}

¡donde el símbolo! indica a operador factorial .

Esta fórmula da la probabilidad exacta de observar este arreglo particular de los datos, si se asume que los totales marginales dados, en la hipótesis nula que el cociente de las probabilidades entre el dieter y el no-dieter entre hombres y mujeres iguala a 1 en la población de quien nuestra muestra fue extraída. Fisher demostró que podríamos tratar solamente de los casos donde están iguales los totales marginales que en la tabla observada. En el ejemplo, hay 11 tales casos. De este solamente es más extremo en la misma dirección que nuestros datos; parece esto:

menwomentotal
dieting01010
not dieting12214
totals121224

Para calcular la significación de los datos observados, es decir la probabilidad total de observar datos como extremos o más extremos si la hipótesis nula es verdad, tenemos que calcular los valores del p para ambas estas tablas, y las agregamos juntas. Esto da una prueba Uno-atada ; para una prueba con dos colas debemos también considerar las tablas que son igualmente extremas pero en la dirección opuesta. Desafortunadamente, clasificación de las tablas según si o no son “pues el extremo” es problemático. Un acercamiento usado por el lenguaje de programación R es computar el p-valor sumando las probabilidades para todas las tablas con los mismos totales de la fila y de la columna que la tabla basada en los datos observados. Para las tablas con pequeñas cuentas, el p-valor echado a un lado 2 puede diferenciar substancialmente dos veces del 1 valor echado a un lado, desemejante del caso con las estadísticas de prueba que tienen una distribución de muestra simétrica.

La mayoría de los paquetes estadísticos moderno calcularán la significación de las pruebas de Fisher, en algunos casos incluso donde estaría aceptable la aproximación del Chi también. Los cómputos reales según lo realizado por los paquetes de programas informáticos estadístico en general diferenciarán de ésos descritos. Particularmente, las dificultades numéricas pueden resultar de los valores grandes de los factorials. Un acercamiento de cómputo simple, algo mejor confía en una función gamma o la función de la registro-gamma, pero de hecho el cómputo exacto de probabilidades hipergeométricas y binomiales es un área de la investigación reciente.

Extensión al tablas de m x de n

La prueba exacta de Fisher se puede aplicar a las tablas de cualquier tamaño. Una discusión del m x versión de n de la prueba se puede encontrar detalladamente en wolfram.

  • Zenithic
  • Heiðr
    Random links:Biblioteca del Buey-Carro | Polyketide | Marjoe Gortner | Silla curul | Kabo

  • © 2007-2008 enciclopediaespana.com; article text available under the terms of GFDL, from en.wikipedia.org
    ="http://pagead2.googlesyndication.com/pagead/show_ads.js">