Inferencia Estadística

Guía de Bioestadística Dr.
Julio Idrovo
3. INFERENCIA ESTADÍSTICA
3.1 Introducción
La inferencia estadísticaes la parte de la estadística que permite tomar decisiones sobre una determinada
cuestión con un grado de confianza establecido a priori. Por ejemplo, se puede averiguar si dos muestras
están o no correlacionadas linealmente, si sus medias son iguales, si su variabilidad es diferente, cuáles
son sus distribuciones, etc.
3.2 Teoría de los tests estadísticos

La formulación de la teoría de los tests estadísticos comprende los siguientes pasos:
3.2.1 Planteamiento de la hipótesis nula

La hipótesis nula (H0) generalmente es formulada con la intención de rechazarla. Postula la carencia de
diferencia entre los parámetros motivo del problema. Simultáneamente se plantea la hipótesis alternativa
(HA) o hipótesis de trabajo, la misma que es complementaria a la hipótesis nula. El rechazo de H0
conduce a la aceptación de HA y viceversa.
Se puede saber si un test se realizará a "una cola" o a "dos colas" mirando a cuantos lados va la hipótesis
alternativa.
H0: s2 = 3.25 HA : s2 ≠ 3.25 dos colas
H0: s ≤ 3.25
2
HA : s > 3.25
2
cola derecha
H0: s2 ≥ 3.25 HA : s2 < 3.25 cola izquierda
3.2.2 Nivel de significancia ()

El nivel de significancia se considera como la probabilidad de rechazar la hipótesis nula cuando es
verdadera; es por lo tanto un error denominado de tipo I. Su valor se da a priori, en porcentaje,
generalmente 5%. También es probable que se tenga que aceptar la hipótesis nula cuando es falsa; este es
un error de tipo II y se lo simboliza ß. El complemento de es el nivel de confianza, o sea la probabilidad
de aceptar H0 cuando es verdadera; esta es una decisión correcta de tipo A. La potencia de un test se
entiende como la probabilidad de rechazar H0 cuando es falsa; esta es una decisión correcta de tipo B.
Decisión Verdadera Falsa

Aceptar A β
Rechazar α B
3.2.3 Elección del test estadístico

El test estadístico se seleccionará de acuerdo con la hipótesis planteada. Cuando para un mismo problema
existen dos o más tests disponibles, se elegirá aquel más potente. Generalmente los tests paramétricos
son los más potentes. Se denominan tests paramétricosa aquellos que necesitan del cálculo de parámetros
propios de la distribución, como la media, varianza, etc. Los tests no paramétricos son aquellos que
consideran únicamente el tamaño de la muestra.
3.2.4 Cálculo del valor del test

Con el test seleccionado se procederá a calcular el valor del estadístico, utilizando la fórmula propia de
cada test.
3.2.5 Determinación de los puntos críticos

Conociendo el tamaño de la muestra (o los grados de libertad) y el nivel de significancia, se procederá a
buscar los valores críticos del test, los mismos que se encuentran tabulados. Cuando el test se realiza a
dos colas, los puntos críticos se encuentran utilizando /2 en lugar de . El valor crítico izquierdo
representa la probabilidad de que 1-/2de los datos sean mayores que él. El valor crítico derecho
representa la probabilidad de que /2de los datos sean mayores que él. Estos determinan las zonas de
rechazo y aceptación de H0. La zona o zonas de rechazo comprenderán un área total igual a , mientras
que la zona de aceptación corresponderá a 1-.
Guía de Bioestadística Dr. Julio Idrovo
3.2.6 Decisión
Si el valor del test cae dentro de la zona de rechazo de H0 se procederá a rechazar la hipótesis nula,
aceptando la hipótesis alternativa.
3.3 Normalidad de los datos

La mayoría de las pruebas estadísticas parten del hecho de que los datos analizados están
aproximadamente normalmente distribuidos. En algunos casos puede ser necesario verificar si esto es
cierto, para lo cual nos sirven los tests a continuación detallados.
3.3.1 Test de Kolmogorov – Smirnov

Este test es de gran utilidad cuando se trata de analizar la distribución de la variable en estudio. La
distribución de la variable puede escribirse como una distribución acumulativa de frecuencias relativas.
Se procede de la siguiente manera: se compara el valor observado en la distribución acumulativa de
frecuencias con el valor de de la distribución teórica: Dx=F0x-F(x), donde F0(x) es el valor de la
distribución teórica, F(x) es el valor observado y D(x) es el valor absoluto de la diferencia. La máxima
diferencia se denota como D = max D(x)
La hipótesis nula H0 asume que no hay diferencia entre la distribución acumulativa de frecuencias y la
distribución teórica. Los valores críticos D* se localizan conociendo el tamaño de la muestra y α. Si la
distribución acumulativa de frecuencias hipotética es correcta, es razonable que el valor D sea pequeño.
La hipótesis H0 se acepta si el valor D observado es menor que el valor critico D* del test: D < D*
El test de Kolmogorov - Smirnov se puede aplicar para establecer comparaciones entre dos muestras. Se
procede haciendo las distribuciones acumulativas de frecuencias para cada muestra y se encuentra la
diferencia entre las frecuencias de las dos muestras para un mismo intervalo. La máxima diferencia es
probada en el test estadístico para verificar o no la carencia de diferencia entre las dos medidas. Los
valores críticos se localizan conociendo el tamaño de las dos muestras y α, en la tabla del test de
Kolmogorov - Smirnov para dos muestras. La hipótesis H0 se verifica si D < D*.
La prueba de Kolmogorov - Smirnov puede aplicarse para tamaños de muestra pequeños, lo que no
sucede con la chi cuadrado. Además, es más poderosa que la χ2, es decir, cuando se rechaza la hipótesis
nula, se tiene una mayor confiabilidad en dicho resultado. El test de Kolmogorov - Smirnov debe usarse
cuando la variable de análisis es continua. Sin embargo, si la prueba se usa cuando la distribución de la
población no es continua, el error que ocurre en la probabilidad resultante está en la dirección segura. Es
decir, cuando se rechaza la hipótesis nula, tenemos verdadera confianza en la decisión.
Ejemplo 1:
Se realizaron ocho titulaciones, con los resultados 25.13, 25.02, 25.11, 25.07, 25.03, 24.97, 25.14 y 25.09
mL. ¿Dichos resultados podrían proceder (a) de una población normal con media 25.00 mL y desviación
estándar 0.05 mL, y (b) de cualquier otra población normal?
(a) En este caso transformamos los valores x en valores z utilizando la relación zi=xi-25.000.05
Los valores obtenidos son:
xi 25.13 25.02 25.11 25.07 25.03 24.97 25.14 25.09
zi 2.6 0.4 2.2 1.4 0.6 -0.6 2.8 1.8
xi zi fra P(z) D(x)

24.97 -0.6 0.125 0.2743 0.1493

25.02 0.4 0.250 0.6554 0.4054
25.03 0.6 0.375 0.7257 0.3507
25.07 1.4 0.500 0.9192 0.4192
25.09 1.8 0.625 0.9641 0.3391
25.11 2.2 0.750 0.9861 0.2361
25.13 2.6 0.875 0.9953 0.1203
25.14 2.8 1.000 0.9974 0.0026
El valor crítico es D(8,0.05)*=0.288, y puesto que D=0.4192 la hipótesis de normalidad se rechaza.
(b) En este caso estimamos la media y la desviación estándar de los datos antes de transformarlos en
valores z.
La media es 25.07 y la desviación estándar es 0.0593. Con estas estimaciones se obtienen los
siguientes valores:
xi 25.13 25.02 25.11 25.07 25.03 24.97 25.14 25.09
zi 1.01 -0.84 0.67 0.00 -0.67 -1.69 1.18 0.34
xi zi fra P(z) D(x)

24.97 -1.69 0.1250 0.0458 0.0792
25.02 -0.84 0.2500 0.1995 0.0505
25.03 -0.67 0.3750 0.2499 0.1251
25.07 0.00 0.5000 0.5000 0.0000
25.09 0.34 0.6250 0.6321 0.0071
25.11 0.67 0.7500 0.7501 0.0001
25.13 1.01 0.8750 0.8443 0.0307
25.14 1.18 1.0000 0.8812 0.1188
El valor crítico es D(8,0.05)*=0.288, y puesto que D=0.1251 la hipótesis de normalidad se acepta.
3.3.2 Test Chi cuadrado

Este test se puede interpretar como el test de la “bondad del ajuste”, el cual establece si existe una
diferencia significativa entre un número de objetos o respuestas y un número teórico.
El valor del test estadístico se calcula con la expresión
χ2=O-E2E
donde O es el valor observado y E es el valor esperado o teórico. Es de esperarse que un valor pequeño de
χ2 indique concordancia entre las dos series de frecuencias.
La hipótesis H0 asume que no existe diferencia entre las dos distribuciones y se acepta cuando es menor
que el valor critico localizado en las tablas por conocimiento de los grados de libertad (n—1) y α.
χ2<χ2*
3.4 Valores anómalos

Dada una muestra aleatoria simple de tamaño n procedente de una población univariante, (x1, x2, ..., xn),
podemos sospechar que una de sus observaciones, que forzosamente será la menor o la mayor de la
muestra, es un dato atípico, es decir, el valor registrado para ese individuo es anormalmente pequeño o
grande.
Ante esta situación, el analista debe investigar la procedencia de ese dato, y como consecuencia de ello,
eliminarlo de la muestra si se confirma que ha sido un error (quizás de medida o de transcripción manual
del dato) o modificar sus hipótesis sobre la población en caso de verificarse su exactitud (¿quién nos
asegura que un dato anómalo no es señal de la presencia de una veta de mineral en un análisis geológico
de cierto terreno?).
En todo caso, no se eliminará un dato sospechosamente atípico hasta no tener la certeza absoluta de que
su origen se debe a un error humano o de instrumentación.
La presencia de un valor anómalo puede alterar sensiblemente las conclusiones de un análisis estadístico.
Aquellos métodos poco sensibles a estos datos extraños se denominan robustos, y la estadística robusta es
un área de intensa investigación.
3.4.1 Test Q de Dixon

Esta prueba supone que la población está normalmente distribuida. Una forma de estudiar una medida
sospechosa es comparar la diferencia entre ella y la medida más próxima, con la diferencia entre las
medidas más grande y más pequeña (rango). El cociente de estas diferencias (sin signo) se denomina Q
de Dixon.
Q=valor sospechoso-valor más cercanovalor más grande-valor más pequeño
Si el valor de Q calculado supera el valor crítico Q*, se rechaza el valor sospechoso.
Ejemplo 2:
Se obtuvieron los siguientes valores para la concentración de nitrito (mg/L) en una muestra de agua de
río.
0.403 0.410 0.401 0.380 0.400 0.413 0.411
La medida 0.380 mg/L es sospechosa. ¿Debería rechazarse al nivel de significancia del 5%?
Datos:
Valor sospechoso = 0.380
Valor más cercano = 0.400
Valor más grande = 0.413
Valor más pequeño = 0.380
Q=0.380-0.4000.413-0.380=0.606
El valor crítico al 5% es Q7,0.05*=0.570
Puesto que Q>Q*, se rechaza el valor sospechoso al nivel de significancia del 5%, es decir, el dato es
anómalo.
3.4.2 Test de Grubbs

Como ayuda a la decisión sobre si un dato es o no atípico, se dispone de la prueba de Grubbs, la cual
exige que la muestra proceda de una población normal. Debería probarse, primeramente, que los datos
puedan ser razonablemente aproximados por una distribución normal antes de aplicar el test de Grubbs.
El contraste se plantea en los siguientes términos:
H0: "no hay datos atípicos en la muestra"
frente a la alternativa:
HA: "hay al menos un dato atípico".
Cuando se trata de una prueba a dos colas, se hará uso del estadístico:
G=maxxi-Xs=maxzi
siendo X la media y s la desviación típica muestrales.
El test de Grubbs puede también ser definido como una de las siguientes pruebas a una cola.
1. Probar que el mínimo valor es un anómalo.
G=X-Xmins
2. Probar que el máximo valor es un anómalo.
G=Xmax-Xs
La región crítica de este contraste se puede obtener aproximadamente tomando como referencia la
distribución tn-2 de Student con (n - 2) grados de libertad y nivel de significancia α*=α/(2n) si es a dos
colas, o α*=α/n si la prueba se realiza a una cola.
Se aceptará la hipótesis alternativa HA de existencia de dato atípico si G excede de cierto valor crítico G*:
G*=n-1ntα*,n-22n-2+tα*,n-22
Ejemplo 3:
En un estudio sobre la posible influencia del tamaño del cerebro humano en la inteligencia, se ha
estimado la dimensión del órgano como el número de píxeles que ocupa en sendas imágenes obtenidas
por Resonancia Magnética. Los sujetos bajo estudio han sido 20 estudiantes masculinos de psicología de
cierta Universidad norteamericana. Al representar los datos en un histograma, se ha observado que el
primero aparece algo apartado de los demás, por lo que se sospecha que pueda ser atípico. Se supone que
la población tiene distribución normal.
1201121 1038437 965353 904858 955466
1079549 924059 945088 889083 892420
905940 955003 935494 1062462 949589
997925 879987 949395 930016 935863
Se aplica el test de Grubbs para contrastar la hipótesis nula de que no hay un registro anómalo.
La media de los datos es 964855.40 y la desviación estándar es 78103.09, y con estos valores se obtienen
los siguientes valores absolutos de zi.
3.03 0.94 0.01 0.77 0.12
1.47 0.52 0.25 0.97 0.93
G=maxzi=3.03
0.75 0.13 0.38 1.25 0.20
0.42 1.09 0.20 0.45 0.37
G*=20-120t0.02520,20-2220-2+t0.02520,20-22=192012.320818+12.3208=2.71
Dado que 3.03>2.7, se rechaza la hipótesis nula. Según la prueba de Grubbs, todo parece indicar que el
dato 1201121 es atípico. Un fallo en la transcripción de la información muestral provocó la aparición de
esta cantidad en lugar de la correcta, que era 1001121. Corríjase este primer valor de la muestra y
ejecútese nuevamente el programa; el problema queda ahora resuelto.
3.5 Análisis de la precisión

La precisión depende de la variabilidad de los datos, la cual determinaremos utilizando la varianza.
Analizaremos dos casos:
• Comparar la varianza de una población con un valor preestablecido.
• Comparar las varianzas de dos poblaciones.
3.5.1 Test Chi-cuadrado

Chi-cuadrado es una distribución asimétrica y no negativa. Este test permite verificar si la varianza de
una población es estadísticamente igual a un valor preestablecido. Utiliza la varianza de la muestra
considerada, por lo tanto es paramétrico.
La hipótesis nula postula que no hay diferencia entre la varianza poblacional 2 y el valor v.
H0:σ2=vHA:σ2<>v
El nivel de significancia se fija a priori. El valor del test estadístico se calcula mediante la fórmula que se
presenta a continuación. Los valores críticos se encuentran tabulados y se los localiza conociendo el
número de grados de libertad (n-1) y el nivel de significancia . Se toma la decisión de aceptar H0 cuando
se cumple la doble condición indicada (en un test a dos colas).
χ2=n-1s2σ2
χgl,1-α/22*<χ2<χgl,α/22*
Ejemplo 4:
Un proceso se encuentra fuera de control cuando su varianza excede el valor 5.6 . Se toma una muestra
de tamaño 25 con una varianza igual a 5.78 . Hay evidencia suficiente para decir que el proceso está
fuera de control al nivel de significancia del 5% ?.
1) H0: 2 5.6 HA: 2 > 5.6 (1 cola)
2) = 0.05
3) Test paramétrico chi-cuadrado.
4) Se calcula el valor del test:
s2
χ = (n − 1) 2
2
σ
5.78
χ 2 = (25 − 1) = 24.771
5.6
5) El valor crítico tabulado es:
χ2* = 36.415
( 24 , 0.05)
La zona de rechazo está a la derecha del valor crítico.

6) Puesto que el valor del test cae en la zona de aceptación, se procede a aceptar la hipótesis nula. Por
tanto, se concluye que la evidencia presentada no es suficiente para manifestar que el proceso está
fuera de control.
3.5.2 Test F
La distribución Fes asimétrica y no negativa. Se utiliza para comparar las varianzas de dos poblaciones,
bajo el conocimiento de las varianzas de dos muestras; entonces es paramétrico.
La hipótesis plantea la igualdad entre las varianzas.
H0:σ12=σ22HA:σ12<>σ22
número de grados de libertad tanto del numerador como del denominador (n1-1 y n2-1) y el nivel de
significancia (). Se toma la decisión de aceptar H0 cuando se cumple la doble condición indicada (en un
test a dos colas).
F=s12s22
Fgl1,gl2,1-α/2*<F<Fgl1,gl2,α/2*
Debido a la asimetría de la distribución F, el valor crítico de la izquierda Fgl1,gl2,1-α/2*=1Fgl1,gl2,α/2*
Ejemplo 5:
Dos muestras aleatorias de los resultados de una prueba dan las siguientes estadísticas:
Clase A: n = 16 s2 = 92.3
Clase B: n = 25 s2 = 34.7
Estos datos proveen suficiente evidencia para rechazar la hipótesis de que las dos clases tienen varianzas
iguales para los resultados de la prueba involucrados?. Usar = 0.05 .
1) H0: σ2A = σ2B HA: σ2A ≠ σ2B (dos colas)
2) = 0.05
3) Test paramétrico F.
4) Se calcula el valor del test: F = s2A / s2B = 92.3 / 34.7 = 2.66
5) Los valores críticos son:
F*(15,24,0.025) = 2.44 1/ F*(15,24,0.025) = 1/2.44 = 0.41
6) Las zonas de rechazo están a la izquierda de 0.41 y a la derecha de 2.44 El valor del test (2.66) cae
en la zona de rechazo derecha por lo tanto se rechaza la hipótesis nula y se concluye que los resultados
de la prueba, para las dos clases, tienen varianzas diferentes.
3.6 Análisis de las medias

Dentro del análisis de medias se pueden tener los siguientes casos:
• Comparar la media de una población con un valor preestablecido.
• Comparar las medias de dos poblaciones independientes.
• Comparar las medias de dos poblaciones dependientes.
3.6.1 Test t para una población

La distribución t (conocida también como t de Student) es simétrica alrededor de la media. Tiene algunas
variantes, pero ahora nos ocuparemos de aquella que permite comparar la media de una población con un
valor dado. Requiere el conocimiento de la media y desviación estándar muestrales, por tanto es
paramétrica.
H0:μ=vHA:μ<>v
número de grados de libertad (n-1) y el nivel de significancia . Se toma la decisión de aceptar H0 cuando
se cumple la doble condición indicada (en un test a dos colas).
t=X-μsn
tgl,1-α/2*<t<tgl,α/2*
Por la simetría de la distribución t, se tiene que tgl,1-α/2*=-tgl,α/2*
Ejemplo 6:
La muestra utilizada anteriormente arrojó una media igual a 8.75 . Hay evidencia suficiente para aceptar
el postulado de que la media es igual a 8.32 al nivel del 5% ?.
1) H0: = 8.32 HA: ≠ 8.32 (dos colas)
2) = 0.05
3) Test paramétrico t para una población.
4) El valor del test se calcula:
t=X-μsn=8.75-8.325.78100=1.789
5) Los valores críticos tabulados son: ± t*(24,0.025) = ± 2.064
Las zonas de rechazo están a la derecha de t* y a la izquierda de -t*.
6) Puesto que el valor del test está en la zona de aceptación, se acepta H 0. Esto significa que no hay
evidencia suficiente para decir que la media no es igual a 8.32
3.6.2 Test t para dos poblaciones (muestras independientes)

Dos muestras son independientes cuando la fuente de la cual provienen es diferente. Se necesita conocer
las medias y las varianzas de las dos muestras. La hipótesis nula postula que las medias de las dos
poblaciones son iguales.
H0:μ1=μ2HA:μ1<>μ2
Para el análisis de las medias se debe considerar previamente si las varianzas son o no iguales (realizar un
test F) puesto que el test t es diferente.
• VARIANZAS IGUALES
Cuando las varianzas son iguales es necesario calcular la desviación estándar pesada SP.
sp=gl1s12+gl2s22gl
t=X1-μ1-X2-μ2sp1n1+1n2
El número de grados de libertad es la suma de los grados de libertad de las dos muestras:
gl=gl1+gl2=n1-1+n2-1
número de grados de libertad (n1 + n2 - 2) y el nivel de significancia (). Se toma la decisión de aceptar H0
cuando se satisface la misma condición que en el caso anterior.
Ejemplo 7:
Dos poblaciones normalmente distribuidas se muestrean para comparar sus medias. ¿Los datos
siguientes, soportan la hipótesis de que las dos medias poblacionales son significativamente diferentes?.
Usar =0.05
n1 = 12 x 1 = 75. 6 s 12 = 7.2
n 2 = 15 x 2 = 78. 7 s 22 = 8.1
1) H0: 1 = 2 H A: 1 ≠ 2 (dos colas)

2) = 0.05
3) Test paramétrico t para dos poblaciones con varianzas iguales (se puede probar con un test F).
Muestras independientes.
4) Calculamos el valor del test. Es necesario que se encuentre el valor de la desviación estándar
ponderada sp.
sp=12-1*7.2+15-1*8.112+15-2=2.78
t=75.6-78.72.78*112+115=-2.884
5) Los valores críticos del test son ± t*(25,0.025) = ± 2.060
6) Las zonas de rechazo se encuentran a la izquierda de -2.060 y a la derecha de 2.060 El valor del test
(-2.884) cae en la zona de rechazo izquierda por tanto se rechaza la hipótesis nula aceptándose, por
consiguiente, la hipótesis alternativa. Se concluye que las medias son significativamente diferentes.
Cuando no se sabe nada respecto a las varianzas poblacionales, se debe realizar previamente un test F
para determinar si éstas son iguales o no, y de esta manera escoger el test t apropiado.
• VARIANZAS DESIGUALES
Cuando las varianzas son diferentes, el número de grados de libertad considerado será calculado
utilizando la expresión:
ν=s12n1+s22n22s12n12n1-1+s22n22n2-1
presenta a continuación.
t=X1-μ1-X2-μ2s12n1+s22n2
Los valores críticos se encuentran tabulados y se los localiza conociendo el número de grados de libertad
y el nivel de significancia (). Se toma la decisión de aceptar H0 cuando se satisface la misma condición
que en el caso anterior.
Ejemplo 8:
Dos máquinas dispensadoras de bebidas se muestrean para probar si las dos dispensan la misma cantidad
de bebida. Usar =0.05.
Máq. Cantidad dispensada
C 6.5 6.8 3.0 6.0 5.8 6.1 3.3 3.4 5.9 6.2
P 7.6 6.0 6.1 6.0 7.4 7.3 6.0 6.2 6.3 6.1
1) H0: 1 = 2 H A: 1 = 2 (dos colas)
2) = 0.05
3) Puesto que las varianzas son 2.13 y 0.43 respectivamente, se puede probar con un test Fque son
significativamente diferentes. Se usa por tanto el test paramétrico t para dos poblaciones con
varianzas no iguales.
4) Calculamos el valor del test.
t=5.3-6.52.1310+0.4310=-2.372
5) Los valores críticos tabulados son ± t*(9,0.025) = ± 2.262
La zona de aceptación está comprendida entre -2.262 y 2.262
6) El valor del test cae fuera de la zona de aceptación, por tanto se concluye que las dos máquinas
dispensan diferentes cantidades de bebida.
3.6.3 Test t para dos poblaciones (muestras dependientes)

Dos muestras son dependientes cuando provienen de la misma fuente. En este caso es indispensable que
las muestras tengan el mismo tamaño (datos apareados). La hipótesis nula postula que la media de las
diferencias es igual a cero.
H0:μd=0HA:μd<>0
Es necesario determinar la media y la desviación estándar de las diferencias di=x1i-x2i. El número de

grados de libertad es n-1, donde n es el tamaño de cualquiera de las dos muestras.
presenta a continuación.
t=d-μdsdn
Los valores críticos se encuentran tabulados y se los localiza conociendo el número de grados de libertad
(n-1) y el nivel de significancia . Se toma la decisión de aceptar H 0 cuando se satisface la misma
condición que en el caso anterior.
Ejemplo 9:
Un sociólogo está estudiando los efectos de cierta película sobre las actitudes de los hombres negros con
respecto a los hombres blancos. Al azar se seleccionaron doce hombres negros y se les pidió que llenen
un cuestionario antes y después de ver la película. Los resultados se muestran a continuación.(3)
Antes 10 13 18 12 9 8 14 12 17 20 7 11
Después 5 9 13 17 4 5 11 14 13 18 7 12
1) H0: d = 0 HA: d ≠0 (dos colas)
2) = 0.05
3) Test paramétrico t para dos poblaciones. Muestras dependientes.
4) Para calcular el test es necesario conocer la media y la desviación estándar de las diferencias.
Antes 10 13 18 12 9 8 14 12 17 20 7 11
Después 5 9 13 17 4 5 11 14 13 18 7 12
di 5 4 5 -5 5 3 3 -2 4 2 0 -1
d=1.92 sd=3.23
t=1.923.2312=2.054
5) Los valores críticos del test son ± t*(11,0.025) = ± 2.201
6) La zona de aceptación va desde -2.201 hasta 2.201; el valor del test cae en la zona de aceptación de la
hipótesis. La película realmente no tiene efecto sobre las actitudes de los hombres negros.
3.7 Análisis de varianza

En el trabajo analítico se presentan a menudo comparaciones en las que intervienen más de dos medias.
Entonces, existen dos posibles fuentes de variación: la primera, que siempre está presente, debida al error
aleatorio en la medida; y la segunda, debida al factor controlado.
El análisis de varianza es una técnica estadística muy poderosa que se utiliza para separar y estimar las
diferentes causas de variación.
Generalmente se tienen los datos en forma tabulada y se procede a calcular las medias y varianzas para
cada muestra:
repeticiones
cuenta media varianza
1 2 ………
1 x11 x12 r1 x1 s12
m
ue 2 x21 x22 r2 x2 s22
str
a
k xk1 xk2 rk xk sk2
El número de ensayos (repeticiones) para cada muestra no tiene porque ser el mismo, de modo que ri
representará el número de repeticiones realizadas con la i-ésima muestra. Entonces, el número total de
ensayos n estará dado por la suma de las repeticiones de cada muestra n=ri y la media global X=xi,jn
La hipótesis nula adoptada es que todas las k muestras se extraen de una población con media µ y
varianza σ2. Con base en esta hipótesis se puede estimar la varianza (cuadrado medio) de dos formas: una
estudia la variación dentro de cada muestra, y la otra la variación entre las distintas muestras.
Variación dentro de la muestra: La estimación de la varianza dentro de la muestra se realiza a través de
su cuadrado medio (CM) definido como el cociente entre la suma de cuadrados (SC) y los grados de
libertad (gl). Los grados de libertad para cada muestra están dados por el número de repeticiones
realizadas en la muestra menos uno: gli=ri-1
CMdentro=SC(dentro)gl(dentro)
SCdentro=i=1kgli*si2
gldentro=i=1kgli=n-k
Variación entre muestras: La estimación de la varianza entre las muestras se realiza a través de su
cuadrado medio.
CMentre=SC(entre)gl(entre)
SCentre=i=1kri*xi-X2
glentre=k-1
Se procede a elaborar la tabla ANOVA de la siguiente manera:
Fuente de variación SC gl CM
Entre muestras SCentre=i=1kri*xi-X2 k-1 SC(entre)gl(e
ntre)
Dentro de la SCdentro=i=1kgli*si2 n-k SC(dentro)gl
muestra (dentro)
Total SCtotal gl(total)
Para la variación total se acumulan los parciales tanto para la suma de cuadrados como para los grados de
libertad.
SCtotal=SCentre+SCdentro
gltotal=glentre+gldentro=k-1+(n-k)=n-1
El valor del test está dado por F=CM(entre muestras)CM(dentro de la muestra) , el cual se compara con el
valor crítico a una cola Fgl1,gl2,α*.
Si, por ejemplo, se desea estudiar el efecto de tres diferentes catalizadores sobre el rendimiento de un
producto industrial, ó examinar cinco diferentes técnicas analíticas para la determinación de la
concentración de una especie, es indispensable aplicar el análisis de varianza.
Ejemplo 10:
Considere que 3 diferentes catalizadores han sido utilizados en un estudio respecto al rendimiento de un
producto industrial. La tabla presenta los datos de este experimento y los resultados de algunos cálculos.
repeticiones ri xi si2 gli*si2 xi-X2 ri*xi-X2
A 85 86 83 82 87 90 80 81 8 84.25 11.36 79.50 5.06 40.50
B 87 86 85 93 89 88 86 89 8 87.88 6.41 44.88 1.89 15.13
C 89 85 90 86 83 88 87 91 8 87.38 7.13 49.88 0.77 6.13
Σ
= 24 259.50 174.25 61.75
X= 86.50
Se asume que las observaciones son independientes y que cada serie proviene de una población
normalmente distribuida con varianza σ2. Sin embargo, cada serie tiene media diferente. Entonces, en
este caso se utilizará ANOVA para establecer si la diferencia observada entre las medias surge debido a la
casualidad exclusivamente, o existe evidencia de que existe diferencia significativa entre las medias.
Se definen las siguientes cantidades:
n = número de datos = 24
k = número total de tipos de factor (catalizadores) bajo análisis = 3
SC(dentro) = 174.25
SC(entre) = 61.75
gl(dentro) = n-k = 24-3 = 21
gl(entre) = k-1 = 3-1 = 2
CM(dentro) = 174.25/21 = 8.30
CM(entre) = 61.75/2 = 30.88
Un valor significativo para F indica una variación significativa debida a los distintos tipos de factor, esto
es, las medias de los tres catalizadores no son las mismas.
Los resultados del ANOVA a un factor para los datos se resumen:
Fuente de Variación SC gl CM
Entre series
61.75 2 30.88
(debido al catalizador)
Residual
174.25 21 8.30
(errores casuales)
Total 236.00 23
El test F da el siguiente resultado: F. = 30.88 / 8.30 = 3.72 > F*(2, 21, 0.05) = 3.47
Como se deduce de la observación de la tabla, la variación entre series es claramente mayor que la
variación casual. Por consiguiente el valor de F es significativo. Esto indica que los rendimientos
promedio con los catalizadores A, B, y C son diferentes. Esto significa que uno ó dos de los catalizadores
considerados dan resultados significativamente mejores que el ó los otros.
3.8 Análisis del coeficiente de correlación

Para determinar si existe o no correlación lineal entre dos variables, se procede a realizar la inferencia
estadística sobre el coeficiente de correlación lineal.
A continuación se analizarán dos métodos: uno paramétrico y otro no paramétrico. La hipótesis nula
postula que el coeficiente de correlación lineal es igual a cero, lo cual equivale a decir que no existe
correlación lineal entre las variables.
H0:ρ=0HA:ρ<>0
3.8.1 Test de Pearson

Compara directamente el valor del coeficiente de correlación muestral (r) con el valor crítico que se
localiza conociendo el número de grados de libertad (n-2) y el nivel de significancia (). La hipótesis se
acepta si se cumple la condición r<r(n-2,α)*
3.8.2 Test de Spearman (Rank Correlation)

Se realiza un ranking para cada una de las variables. Como los datos son apareados, se calculan las
diferencias de los ranks correspondientes (di). El valor del test se calcula con la fórmula indicada a
continuación y se compara con el valor crítico que se localiza conociendo el tamaño de la muestra (n) y el
nivel de significancia ().
rs=1-6*di2n(n2-1)
La hipótesis se acepta si se cumple la condición rs<rs(n,α)*

Ejemplo 11:
Las distancias recorridas y los tiempos empleados por 15 trabajadores para llega a sus trabajos se indican
a continuación. Hay evidencia suficiente para decir que estos datos bivariados están linealmente
correlacionados?. Usar =0.05.
X(mil) 3 5 7 8 10 11 12 12 13 15 15 16 18 19 20
Y(min) 7 20 20 15 25 17 20 35 26 25 35 32 44 37 45
Método paramétrico :
1) H0: ρ = 0 H A: ρ ≠ 0 (dos colas)
2) = 0.05
3) Inferencia paramétrica sobre el coeficiente de correlación lineal.
4) El test es el valor del coeficiente de correlación lineal calculado r=0.879.
5) Los valores críticos tabulados son ± r*(13,0.025) = ± 0.514
La zona de aceptación se encuentra entre -0.514 y 0.514 .
6) El test cae en la zona de rechazo derecha, por lo tanto la evidencia presentada es suficiente para
rechazar la hipótesis nula. Esto significa que los datos si están linealmente correlacionados.
Método no paramétrico :
1) H0: ρ = 0 H A: ρ ≠ 0 (dos colas)

2) = 0.05
3) Test de correlación de rango de Spearman.
4) Para calcular el valor del test es necesario elaborar los rankings de cada una de las variables. Esto se
muestra en la siguiente tabla.
i X Y Rx Ry di di2
1 3 7 1.0 1.0 0.0 0.00
2 5 20 2.0 5.0 -3.0 9.00
3 7 20 3.0 5.0 -2.0 4.00
4 8 15 4.0 2.0 2.0 4.00
5 10 25 5.0 7.5 -2.5 6.25
6 11 17 6.0 3.0 3.0 9.00
7 12 20 7.5 5.0 2.5 6.25
8 12 35 7.5 11.5 -4.0 16.00
9 13 26 9.0 9.0 0.0 0.00
10 15 25 10.5 7.5 3.0 9.00
11 15 35 10.5 11.5 -1.0 1.00
12 16 32 12.0 10.0 2.0 4.00
13 18 44 13.0 14.0 -1.0 1.00
14 19 37 14.0 13.0 1.0 1.00
15 20 45 15.0 15.0 0.0 0.00
∑= 70.50
rs = 1 - 6*70.5/[15 (225-1)] = 0.874

5) Los valores críticos tabulados son ± rs*(15,0.025) = ± 0.521
La zona de aceptación va desde -0.521 hasta 0.521
6) El valor del test cae fuera de la zona de aceptación, por tanto se rechaza la hipótesis nula. Se concluye
que las variables están linealmente correlacionadas.
3.9 Actividades
3.9.1 En clase
a) Cuál es la diferencia sustancial entre los tests paramétricos y los no paramétricos?
b) Cuáles son las diferentes aplicaciones del test t?.
c) Dé ejemplos de muestras independientes y dependientes.
d) De los tests estudiados, cuáles son paramétricos y cuáles son no-paramétricos?
e) Las galletas se empaquetan en cajas que se afirma tienen un promedio de 7.25 onzasy 32 galletas. Se
contó el número de galletas en cada una de 18 cajas aleatoriamente seleccionadas. Los resultados se
totalizaron mediante Σx = 535 y Σx2= 16010. Al 0.02 de nivel de significancia, concuerda con que el
número de galletas por paquete podría ser 32 ?.(3)
f) Muestras aleatorias de los resultados de una prueba en dos clases dieron las siguientes estadísticas:
Clase A : n = 16 s2 = 92.3
Clase B : n = 25 s2 = 34.7
Proveen estos datos suficiente razón para rechazar la hipótesis de que las dos clases tienen varianzas
iguales ?. Use α = 0.05 (3)
g) Los siguientes datos fueron obtenidos en un experimento conducido por un jardinero, cuyo objeto era
descubrir cuando un cambio aplicado en la mezcla de fertilizante para sus plantas de tomate resultaría
en mejores frutos. Tenía 11 plantas en una fila; a 5 se les dio la mezcla estándar de fertilizante A, y las
6 restantes fueron alimentadas con una mezcla supuestamente mejorada de fertilizante B. Las mezclas
A y B fueron aplicadas al azar sobre la fila de plantas.
# 1 2 3 4 5 6 7 8 9 10 11
Mezcla A A B B A B B B A A B
Lbs 29.9 11.4 26.6 23.7 25.3 28.5 14.2 17.9 16.5 21.1 24.3
tomate
Al nivel de significancia del 5%, hay suficiente evidencia para sostener que la nueva mezcla de
fertilizante mejora la producción?.
3.9.2 En casa
a) En un gran huerto de cerezas el promedio producido ha sido 4.35 toneladas por acre en los últimos
años. Se probó un nuevo fertilizante sobre 15 lotes de un acre, seleccionados al azar. La producción
de estos lotes fue la siguiente:
3.56 4.93 5.12 4.45 3.48
5.00 3.92 5.13 5.35 4.45
4.88 4.25 4.79 4.81 4.72
Al nivel de significancia del 0.05, se tiene suficiente evidencia para afirmar que hubo un incremento
significativo en la producción ?. (3)
b) Anteriormente la desviación estándar de los pesos de ciertos paquetes de 32.0 onzas llenados por una
máquina fue 0.25 onzas. Una muestra aleatoria de 20 paquetes mostró una desviación estándar de
0.35 onzas. Es el aparente incremento en variabilidad, significativo al nivel de significancia de 0.10 ?.
(3)
c) La desviación estándar de las temperaturas anuales de una ciudad en un período de 100 años es 15°F.
Usando la temperatura media en el 15° día de cada mes durante los últimos 12 meses, una desviación
estándar de temperaturas anuales se calculó como 10.5°F. Es la temperatura en la ciudad
significativamente menos variable que en el pasado a un nivel de significancia de 0.10 ?.(3)
d) La contaminación del aire se determina midiendo varios elementos diferentes que pueden detectarse
en el aire. Uno de ellos es el monóxido de carbono (CO). La muestra de lecturas diarias en la tabla
siguiente se obtuvo del diario local.
3.5 3.9 2.8 3.1 3.1 3.4
4.8 3.2 2.5 3.5 4.4 3.1
1. Calcule la media y la desviación estándar para esta muestra.
El monóxido de carbono es medido e interpretado de acuerdo con la escala :
bajo : de 0 a 4.9; medio : de 4.9 a 14.9; alto : de 14.9 en adelante
2. Presenta la muestra suficiente evidencia para permitir concluir que el nivel de monóxido de
carbono es bajo al nivel de significancia del 5% ?.
3. Presenta la muestra suficiente evidencia para permitir rechazar la afirmación de que la varianza de
las lecturas de CO no es mayor que 0.25 a α=0.05 ? (3)
f) Dos muestras independientes se tomaron de poblaciones normales, con los resultados mostrados en la
tabla adjunta. Esta información provee suficiente razón para rechazar la hipótesis nula en favor de la
afirmación de que la media de la población R es significativamente mayor que la media de la
población S ?. Use α = 0.05 (3)
g) Los efectos corrosivos de varios suelos sobre los filtros de acero con revestimiento y sin revestimiento
fueron probados usando un plan de muestreo dependiente. Los datos recogidos son resumidos en
Muestra n Σx Σ(x -
)2
x
R 10 295 75
S 8 195 90
h) Los efectos corrosivos de varios suelos sobre los filtros de acero con revestimiento y sin revestimiento
fueron probados usando un plan de muestreo dependiente. Los datos recogidos son resumidos en
n = 40 Σd = 220 Σd2 = 62220
donde des la cantidad de corrosión de la porción revestida substraída de la cantidad de corrosión de la
porción no revestida. Provee esta muestra suficiente razón para concluir que el revestimiento es
beneficioso ?. Use α= 0.01. (3)
i) Las dos muestras independientes de la tabla adjunta se obtuvieron esperando demostrar que la media
de la población A es mayor que la media de la población B. Las muestras proveen evidencia
significativa para justificar tal esperanza (utilice el test no paramétrico)?. Use α = 0.05 (3)
j) Se ha efectuado un estudio respecto al tiempo de coagulación de la sangre de 24 animales los cuales

han sido distribuidos de manera casual en 4 grupos y se les ha suministrado 4 diferentes dietas
alimenticias (A, B, C, y D). Los resultados se resumen en la siguiente tabla:
Muestra A 6 7 7 6 6 5 6 8 5 4
Muestra B 7 2 4 3 3 5 4 6 4 2
k) Se ha efectuado un estudio respecto al tiempo de coagulación de la sangre de 24 animales los cuales
han sido distribuidos de manera casual en 4 grupos y se les ha suministrado 4 diferentes dietas
alimenticias (A, B, C, y D). Los resultados se resumen en la siguiente tabla:
A B C D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
66 68 63
68 64
63
59
Media= 61,0 66,2 68,0 61,0
Aplique el análisis de varianza a un factor para establecer si existe o no diferencia significativa entre las
medias de los tiempos de coagulación de sangre obtenidos para las cuatro dietas y de acuerdo a esto
determine si es posible establecer cual es la mejor dieta a usar para el propósito de reducir el tiempo de
coagulación de la sangre de estos animales.
l) En un estudio del corazón se midió la presión sistolítica de la sangre a 24 hombres de 25 años de edad
y a 30 hombres de 40 años de edad. Muestran los datos siguientes suficiente evidencia para concluir
que los hombres de mayor edad tienen presión sistolítica de la sangre más alta, al nivel de
significancia del 0.02 ?. (3)
25 años :
95 100 100 105 106 108 110 110 115 118 120 122
124 125 130 130 130 132 136 138 140 148 150 156
40 años :
108 110 110 114 114 116 118 120 122 124
126 126 128 130 130 132 136 136 136 140
142 142 146 148 150 152 154 160 164 176

Inferencia Estadística

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Inferencia Estadística

Uploaded by

Copyright:

Available Formats

Guía de Bioestadística Dr.

3.2 Teoría de los tests estadísticos

3.2.1 Planteamiento de la hipótesis nula

3.2.2 Nivel de significancia ()

Decisión Verdadera Falsa

3.2.3 Elección del test estadístico

3.2.4 Cálculo del valor del test

3.2.5 Determinación de los puntos críticos

3.3 Normalidad de los datos

3.3.1 Test de Kolmogorov – Smirnov

xi zi fra P(z) D(x)

24.97 -0.6 0.125 0.2743 0.1493

xi zi fra P(z) D(x)

3.3.2 Test Chi cuadrado

3.4 Valores anómalos

3.4.1 Test Q de Dixon

3.4.2 Test de Grubbs

3.5 Análisis de la precisión

3.5.1 Test Chi-cuadrado

La zona de rechazo está a la derecha del valor crítico.

3.6 Análisis de las medias

3.6.1 Test t para una población

3.6.2 Test t para dos poblaciones (muestras independientes)

1) H0: 1 = 2 H A: 1 ≠ 2 (dos colas)

3.6.3 Test t para dos poblaciones (muestras dependientes)

Es necesario determinar la media y la desviación estándar de las diferencias di=x1i-x2i. El número de

3.7 Análisis de varianza

3.8 Análisis del coeficiente de correlación

3.8.1 Test de Pearson

3.8.2 Test de Spearman (Rank Correlation)

La hipótesis se acepta si se cumple la condición rs<rs(n,α)*

1) H0: ρ = 0 H A: ρ ≠ 0 (dos colas)

rs = 1 - 6*70.5/[15 (225-1)] = 0.874

j) Se ha efectuado un estudio respecto al tiempo de coagulación de la sangre de 24 animales los cuales

You might also like