You are on page 1of 39

Benito Ramírez Valverde, bramirez@colpos.

mx

Montecillo, México
2019

analisis.estadistico.brv@gmail.com
Caso desbalanceado

• El análisis no cambia
Modelo:

yij = µ + τ i + ε ij j = 1, 2, . .., n i
i = 1, 2, ..., t
yij = Observación en la j-esima repetición del i-esimo tratamiento
µ= Media general
τi = Efecto del i-esimo tratamiento
εij =Error experimental
Notación
Tratamiento

1 2 . . t
Formalizando Y11 Y21 . . Yt1
ni Y12 Y22 . . Yt2
yi. = ∑ yij ; i = 1,2,....t
i =1
. . . . .
. . . . .
. . . . .
Y1n1 Y2n2 . . Ytn t
Totales de Y1. Y2. . . Yt. Y..
tratamientos
Promedio de Y1. Y2. . . Yt. Y..
tratamientos
Hipótesis
H0: τ1=τ2=…..=τt
Ha: Al menos una diferente
Factor de Grados de Suma de Cuadrados Cuadrados Fc Ft
Variación libertad Medios
Tratamientos t-1 𝑡𝑡 𝑆𝑆𝑆𝑆𝑆𝑆 𝐶𝐶𝐶𝐶𝐶𝐶 𝑔𝑔𝑔𝑔 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 .
𝐹𝐹𝑔𝑔𝑔𝑔 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 ,
𝑦𝑦𝑖𝑖.2 𝑦𝑦..2 𝛼𝛼
� − 𝑡𝑡 − 1 𝐶𝐶𝐶𝐶𝐶𝐶
𝑛𝑛𝑖𝑖 ∑𝑡𝑡𝑖𝑖=1 𝑛𝑛𝑖𝑖
𝑖𝑖=1
Error 𝑡𝑡 Por diferencia 𝑆𝑆𝑆𝑆𝑆𝑆
� 𝑛𝑛𝑖𝑖 − 𝑡𝑡 𝑔𝑔𝑔𝑔. 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
𝑖𝑖=1
𝑡𝑡 𝑛𝑛 𝑖𝑖
Total 𝑡𝑡
𝑦𝑦..2
� 𝑛𝑛𝑖𝑖 − 1 � � 𝑦𝑦𝑖𝑖𝑖𝑖2 −
∑𝑡𝑡𝑖𝑖=1 𝑛𝑛𝑖𝑖
𝑖𝑖=1 𝑖𝑖=1 𝑗𝑗 =1
Hipótesis
H0: τ1=τ2=…..=τt
Ha: Al menos una diferente

Rechazo H0 si

𝑔𝑔𝑔𝑔 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 .
𝐹𝐹𝑐𝑐 > 𝐹𝐹𝑔𝑔𝑔𝑔 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 , 𝛼𝛼 Zona de no
rechazo de Ho

Ft
Ejemplo
En un programa de desarrollo rural, si quieres probar la hipótesis de
que existe un incremento en los rendimientos por tipo de producto
(participante, alguna vez participante y nunca participante del
programa).
Se realizó una muestra aleatoria de los tres grupos con los siguientes
resultados:

TRATAMIENTO OBSERVACIONES
Alguna vez
participante 2 2.5 0.6 0.5 1.3 1.7 0.6 0.9 1.5 2.1
Nunca
participante 1.2 1.5 0.7 0.3 1.8 2 0.9
Participante 3 2.5 2 4 0.8 1.2 3.5 3 2.8
Tratamientos
Alguna vez Nunca
participante participante Participante
2 1.2 3
2.5 1.5 2.5
0.6 0.7 2
0.5 0.3 4
1.3 1.8 0.8
1.7 2 1.2
0.6 0.9 3.5
0.9 3
1.5 2.8
2.1
Totales 13.7 8.4 22.77 44.87
Medias 1.37 1.2 2.53 5.10
r

∑y
2

i =1
ij
23.27 12.32 66.42 102.01
yi2.
ni 2.327 1.76 7.38 11.467
Construcción del ANAVA
1. Se calcula el factor de corrección.
2. Se calcula Suma de Cuadrados Total
3. Se calcula suma de cuadrados de tratamientos.
4. Se calcula Suma de Cuadrados del Error
Construcción del ANAVA
5. Se construye el ANAVA
Factor de Grados de Suma de Cuadrados Fc Ft
Variación libertad Cuadrados Medios
Tratamientos 9.07 𝑔𝑔𝑔𝑔 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 .
𝐹𝐹𝑔𝑔𝑔𝑔 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 , 𝛼𝛼
Error
Total 24.47

Hipótesis
H0: τ1=τ2=…..=τt
Ha: Al menos una diferente
Tarea 8
Se analizó un experimento con cuatro raciones a cerdos con nueve
cerdos por ración, se presentó una enfermedad durante el
experimento muriéndose 16 cerdos. Los aumentos de peso final
fueron los siguientes
Tratamientos
repeticiones I II III IV
1 45 35 34 41
2 46 33 34 41
¿Cuál es el
3 49 35 44
mejor
4 44 34 43
tratamiento?
5 33 41
6 42
7 44
8 41
9 41
Padrón, s/f
yij = μ +τi +ε ij εij ~ NID (0, σ)

Las observaciones deben provenir de


poblaciones normales

Los tratamientos deben tener la misma


varianza (homocedasticidad)

Las observaciones independientes entre sí.


εij ~ NID (0, σ)

yˆ ij = yi .
Residuales Predichos
• Normalidad

Gráfica Q-Q de residuales


para detectar normalidad

Gráfica de cajas y bigotes, para


detectar simetría
Enfoque gráfico
• Independencia Aleatorización

Dispersión de los residuos en función


de la secuencia de observación
Enfoque gráfico
• Heterogeneidad de varianzas
Cuando los errores son homocedásticos,
haciendo un gráfico de dispersión de
residuos versus valores predichos se
debe observar una nube de puntos sin
patrón alguno (patrón aleatorio).

Grafica de residuales versus


tratamientos, para detectar
heterogeneidad de varianzas Residuales

Predichos
Métodos analíticos

• Normalidad
– Shapiro Wilks
– Prueba de Lilliefors

Se trata de pruebas estadísticas no paramétricas


que en todos los casos se plantea la hipótesis:

Ho: la variable tiene buen ajuste a una distribución


normal
Homocedasticidad

Consiste en suponer que todos los


tratamientos
tienen la misma variabilidad
Métodos analíticos
Heterogeneidad de varianzas

– Prueba de Levene para detectar


heterogeneidad de varianzas
– Prueba de Bartlett para detectar
heterogeneidad de varianzas
Ejemplo
Se quiere realizar un experimento para aprobar cuatro dietas de pollo.
Se tienen 20 por jaulas (en cada jaula un pollo). Se quiere comparar
el efecto de la dieta de los pesos de los animales.

Hipótesis
H0: τ1=τ2=…..=τt
Ha: Al menos una diferente
Resultados
Tratamientos
A B C D
55 61 42 169
49 112 97 137
42 30 81 169
21 89 95 85
52 63 92 154
Totales yi . 219 355 407 714 1695
Medias y i. 43.8 71.0 81.4 142.8 84.75
r

∑y
2

i =1
ij
10335.0 29055.0 35223.0 106832.0 181,445
yi2.
5 9592.2 25205.0 33129.8 101959.2 169,886.20
Resultados
Resultados
Resultados
Normalidad
Gráficamente: Grafica QQ
Normalidad
Gráficamente: Grafica QQ
Es un diagrama
de dispersión de
los residuos
obtenidos
comparado con
los cuantiles
teóricos de una
distribución
normal.
Si los residuos son
normales, se alinearán
sobre una recta a 45°
En el ejemplo:
Gráficamente: Gráfica de cajas y bigotes

45.94

18.77
RDUO_Y

-8.40

-35.57

-62.74
Normalidad
hipótesis
H0: los residuos tienen distribución normal
H1: los residuos no tienen distribución normal.
Normalidad
hipótesis
H0: los residuos tienen distribución normal
H1: los residuos no tienen distribución normal.

La prueba se realiza
con el estadístico de
Shapiro-Wilks
modificado por
Mahibbur y
Govindarajulu
(1997).
Gráfico de dispersión de residuos vs. predichos
Título

45.94
Se debe observar
18.77 una nube de puntos
sin patrón alguno
RDUO_Y

-8.40 para comprobar que


las varianzas son
-35.57
homogéneas
-62.74
38.85 66.07 93.30 120.53 147.75
PRED_Y
H0: σ1 = σ2 = … = σk
Ha: al menos una diferente

El test de Levene consiste en realizar un análisis de varianza


(ANAVA), usando como variable dependiente el valor absoluto
de los residuos
H0: σ1 = σ2 = … = σk
Ha: al menos una diferente

¿Conclusión?
TAREA 8

En los ejemplos siguientes realice la prueba de


hipótesis, concluya sobre el mejor tratamiento y
verifique los supuestos del análisis de varianza.

Discuta los resultados


TAREA 8
TAREA 8
En un programa de desarrollo rural, si quieres probar la hipótesis de
que existe un incremento en los rendimientos por tipo de producto
(participante, alguna vez participante y nunca participante del
programa).
Se realizó una muestra aleatoria de los tres grupos con los siguientes
resultados:

TRATAMIENTO OBSERVACIONES
Alguna vez
participante 2 2.5 0.6 0.5 1.3 1.7 0.6 0.9 1.5 2.1
Nunca
participante 1.2 1.5 0.7 0.3 1.8 2 0.9
Participante 3 2.5 2 4 0.8 1.2 3.5 3 2.8
TAREA 8
Se analizó un experimento con cuatro raciones a cerdos con nueve
cerdos por ración, se presentó una enfermedad durante el
experimento muriéndose 16 cerdos. Los aumentos de peso final
fueron los siguientes
Tratamientos
repeticiones I II III IV
1 45 35 34 41
2 46 33 34 41
3 49 35 44
4 44 34 43
5 33 41
6 42
7 44
8 41
9 41
Padrón, s/f