You are on page 1of 21

Estadística Ciencias Ambientales

Facultad de Ciencias
Departamento de Matemáticas
Profesor: Santiago de la Fuente Fernández

ANÁLISIS VARIANZA MULTIFACTORIAL


ANOVA II CON INTERACCIÓN
ANÁLISIS DE LA VARIANZA CON DOS FACTORES E INTERACCIÓN

Modelo: yij = μ + α i + β j + (α β ) ij + U i = 1, 2, L , I j = 1, 2, L , J

yij ≡ representa la respuesta de la variable en el i-ésimo nivel del FACTOR 1 (α ) y en el jésimo nivel del FACTOR 2 (β )

( )
μ ij = E yij = μ + α i + β j + (α β ) ij es el valor medio de yij

αi ≡ representa el efecto que sobre la media global μ tiene en el NIVEL i el FACTOR 1 (α )

βj ≡ representa el efecto que sobre la media global μ tiene en el NIVEL j el FACTOR 2 (β )

(α β ) ij ≡ representa el efecto de la interacción entre el NIVEL i del FACTOR 1 (α ) y el NIVEL j del FACTOR 2 (β )

U ≡ es la variación aleatoria de las yij (igual para todas).

Supondremos que U sigue una distribución N (0, σ ) , lo que implica que yij sigue una distribución (
N μij, σ )
I J I J
∑ α i = ∑ β j = ∑ (α β ) ij = ∑ (α β ) ij = 0
i=1 j =1 i=1 j=1
FACTOR 2 (β )
1 Medias
Niveles 2 J
Filas
y111 y121 y1J1
......... .........
y112 y122 y1J2
......... .........
1 ......... ......... ......... y 1• •
......... .........
......... ......... .........

Muestra aleatoria nij observaciones casilla (i, j)


......... .........
y11 n y12 n y1J n
11 12 1J
y211 y221 y2J1
......... .........
y212 y222 y2J2
FACTOR 1 (α)

......... .........
2 ......... ......... ......... y 2• •
......... .........
......... ......... .........
......... .........
y21 n y22 n y2J n
21 22 2J
......... ......... ......... ......... ......... ......... .........
......... ......... ......... ......... ......... ......... .........
yI11 yI21 yIJ1
yI12 yI22 yIJ2
......... .........
I ......... ......... ......... y I••
......... .........
......... ......... .........
yI1 n yI2 n yIJ n
I1 I2 IJ
Medias y •1 • y •2• y •J• y •••
columnas
(
yijk ∈ N μ + αi + β j + (α β )ij ; σ2 ) independientes

El origen de la descomposición de la varianza total, donde k = n ij

(α β ) βˆ
4α i 48
ij ˆ
6444474 4448 647 4 4 j 48
647 4
( yijk − y••• ) = ( yijk − yij• ) ( )
+ yij• − yi • • − y• j• + y• • • + ( yi • • − y• • • ) + y• j• − y• • • ( )

SCT
I J K −1
64444744448
I J K I J K

∑∑∑ ( yijk − y••• ) 2


= ∑∑∑ ( y ijk − y ij• ) 2
+
i =1 j=1 k =1 i =1 j=1 k =1
1 444424444 3
SCR
I J ( K −1)

I J K 2 I J K I J K
+ ∑∑∑ ( y
i =1 j=1 k =1
ij• − yi • • − y• j• + y• • • ) + ∑∑∑ ( y
i =1 j=1 k =1
i•• − y••• ) 2
+ ∑∑∑ ( y
i =1 j=1 k =1
• j• − y••• )2
1 444444424444444
3 1 4444244443 1 4444244443
SCE (αβ ) SCE (α ) SCE (β )
( I −1)( J −1) I −1 J −1

operando, resulta:
SCT
I J K −1
64444744448
I J K

∑∑∑ ( y ijk − y • • • ) 2
=
i = 1 j = 1 k =1
I J K I J I J

∑∑∑ ( y
i = 1 j = 1 k =1
ijk − y ij• ) 2
+ k ∑∑ ( y ij•
i =1 j = 1
− y i • • − y • j• + y • • • ) 2
+ JK ∑( y i•• − y••• ) 2
+ IK ∑(y • j• − y••• )2
1 444424444 3 1 44444424444443 14i =4
1 424443 j=1
1 4442444
3
SCR SCE (αβ ) SCE (α ) SCE (β )
I J ( K −1) ( I −1)( J −1) I −1 J −1

SCT = SCR + SCE (α β ) + SCE (α ) + SCE (β )

SCT ≡ Variabilidad total de todos los datos


SCR ≡ Variabilidad debida a los factores
SCE (α β ) ≡ Variabilidad debida a las interacciones
SCE (α ) ≡ Variabilidad debida a los distintos niveles del Factor 1
SCE (β ) ≡ Variabilidad debida a los distintos niveles del Factor 2
TABLA ANOVA: ANÁLISIS ESTADÍSTICO
Fuente
Suma cuadrados grados libertad Varianza Test F
variación

SCE (α )
I
Ŝα2
Factor (α ) SCE (α ) = J K ∑( y
i =1
i•• − y••• ) 2
( I −1 ) Ŝα2 =
( I −1 )
Fα =
Ŝ2r
SCE (β )
J

∑(y ) Ŝβ2
Factor (β ) SCE (β ) = I K • j• − y••• 2
( J −1 ) Ŝβ2 = Fβ =
j =1
( J −1) Ŝ2r
SCE (α β ) =
SCE (α β ) 2
Ŝαβ
I J
( I −1 ) ( J −1) =
∑∑ ( yij• − yi•• − y• j• + y••• ) 2
Interacción Ŝα2 β Fα β =
=K ( I − 1 )( J − 1 ) Ŝ2r
i =1 j = 1
I J K
Residual SCR = ∑∑∑ ( y ijk − y ij• ) 2
I J (K − 1) Ŝ2r =
SCR
IJ( k −1)
i =1 j=1 k =1
I J K
Total SCT = ∑∑∑ ( y
i =1 j=1 k =1
ijk − y••• )2 IJ K −1

ANÁLISIS ESTADÍSTICO: Contraste del Efecto de cada factor

H o : α1 = α 2 = L = α I = 0 H o : β1 = β 2 = L = β J = 0 H o : (α β ) i j = 0 ∀ i, j
H1 : A lgún α i ≠ 0 H1 : A lgún β j ≠ 0 H1 : Algún (α β ) i j ≠ 0
EL FACTOR 1 (α ) NO INFLUYE EL FACTOR 2 (β ) NO INFLUYE NO HAY INTERACCIONES
ESTADÍSTICOS DE CONTRASTE:

H o : α1 = α 2 = L = α I = 0 H o : β1 = β 2 = L = β J = 0 H o : (α β ) i j = 0 ∀ i, j
H1 : A lgún α i ≠ 0 H1 : A lgún β j ≠ 0 H1 : Algún (α β ) i j ≠ 0
EL FACTOR 1 (α ) NO INFLUYE EL FACTOR 2 (β ) NO INFLUYE NO HAY INTERACCIONES

Se acepta la hipótesis nula cuando: Se acepta la hipótesis nula cuando: Se acepta la hipótesis nula cuando:
Ŝα2 Ŝβ2 Ŝα2 β
Fα = 2 ≤ Fα, (I −1), I J (K −1) Fβ = 2 ≤ Fα, (J −1), I J (K −1) Fα β = 2 ≤ Fα, (I −1)(J −1), I J (K −1)
Ŝr Ŝr Ŝr

Cuando se rechaza la hipótesis nula Ho se pueden hacer pruebas simultáneas entre todas las posibles parejas de niveles en cada
factor. Uno de los tests más empleados en las Pruebas Post hoc es el Test de Bonferroni.

CONDICIONES DEL ANÁLISIS ESTADÍSTICO ANOVA

• NORMALIDAD .- Los datos obtenidos en cada nivel de los factores se ajustan razonablemente a una distribución normal.
- yij sigue una distribución normal (
N μ ij , σ ) ∀ i, j -
• HOMOCEDASTICIDAD.- La variabilidad de los datos en cada nivel de los factores es similar (contraste de igualdad de
varianzas) - σ = Var y ij
2
( )
∀ i, j
• LINEALIDAD.- Los residuos (diferencia de los datos a su media, en cada nivel de los factores) se distribuyen alrededor del cero.
E (U ) = 0

• INDEPENDENCIA.- Las observaciones se realizan de forma independiente unas de otras (diseño de la obtención de datos).

En caso de existir desviaciones significativas sobre estos requisitos, los resultados posteriores pueden ser incorrectos.
EYSENCK (1974).- En un estudio sobre memoria verbal se seleccionaron al azar 50 personas mayores y 50 jóvenes (Factor 1: Edad).
Dentro de cada uno de estos grupos se asignaron, al azar, 10 personas a 5 distintos grupos a los que se les presentó una misma lista
de 27 palabras. A cada uno de los 5 grupos se les dieron las siguientes instrucciones (Factor 2: Método).
Grupo 1 (Contar): Se les pidió que contasen el número de letras de cada palabra. Grupo 2 (Rimar): Se les pidió que rimasen cada
palabra con otra. Grupo 3 (Adjetivar). Se les pidió que a cada palabra le asignasen un adjetivo. Grupo 4 (Imaginar): Se les pidió que a
cada palabra le asignasen una imagen. Grupo 5 (Recordar):Se les pidió que memorizasen las palabras.

I=2 J=5 K = 10 FACTOR 2 (Método) J = 5


Contar Rimar Adjetivar Imaginar Recordar
9 7 11 12 10
8 9 13 11 19
6 6 8 16 14
8 6 6 11 5
Mayores 10 6 14 9 10
I=2 4 11 11 23 11
6 6 13 12 14
5 3 13 10 15
Factor 1 (Edad)

7 8 10 19 11
7 7 11 11 11
K = 10
8 10 14 20 21
6 7 11 16 19
4 8 18 16 17
6 10 14 15 15
7 4 13 18 22
Jóvenes
6 7 22 16 16
5 10 17 20 22
7 6 16 22 22
9 7 12 14 18
7 7 11 19 21
A los 4 primeros grupos no se les dijo que deberían recordar las palabras. Finalmente, tras revisar la lista 3 veces, se recogió el
número de palabras recordadas por cada grupo (variable respuesta).

FACTOR 2 (Método) J = 5
I=2 J=5 K = 10
Contar Rimar Adjetivar Imaginar Recordar medias por filas

Mayores
y11• = 7 y12 • = 6,9 y13• = 11 y14• = 13,4 y1• • = 10,06
I=1 y15• = 12
Factor 1 (Edad)

Jóvenes
y 21• = 6,5 y 22 • = 7 ,6 y 23• = 14,8 y 24• = 17,6 y 2• • = 13,16
I=2 y 25• = 19,3

medias por
y •1• = 6,75 y • 2 • = 7 , 25 y • 3• = 12 ,9 y • 4 • = 15,5 y • 5 • = 15,65 y • • • = 11,6
columnas

y • • • = 11,61 σ •2• • = 2667 ,79 s •2• • = 2694 ,74 SCT = 2694 ,74
( yi•• − y••• ) 2 = 5 .10 ∑ ( yi•• − y••• ) 2 = 50 [ ( 10,06 − 11,61 ) 2 + ( 13,16 − 11,61 ) 2 ] = 240,25
I 2
SCE (α ) = J K ∑
i =1 i =1

{( 6,75 − 11,61 )
J 5
SCE (β ) = I K ∑ ( y• j• − y••• )
j =1
2
= SCE (β ) = 2 .10 ∑ (
j=1
y • j• − y • • • ) 2
= 20 2
+ ( 7,25 − 11,61 ) 2 +

+ ( 12,9 − 11,61 ) 2 + ( 15,5 − 11,61 ) 2 + ( 15,65 − 11,61 ) 2 = 1514,94}


I J 2 5
SCE (α β ) = K ∑∑ ( yij• − yi•• − y• j• + y••• ) 2
= 10 ∑∑ ( yij• − yi•• − y• j• + y••• ) 2 =
i =1 j = 1 i =1 j=1

= 10 { (7 − 10,06 − 6,75 + 11,61) 2


+ (6,5 − 13,16 − 6,75 + 11,61) 2 + (6,9 − 10,6 − 7,25 + 11,61) 2 +
+ (7,6 − 13,16 − 7,25 + 11,61) 2 + (11 − 10,06 − 12,9 + 11,61) 2 + (14,8 − 13,16 − 12,9 + 11,61) 2 +
+ (13,4 − 10,06 − 15,5 + 11,61) 2 + (17,6 − 13,16 − 15,5 + 11,61) 2 + (12 − 10,06 − 15,65 + 11,61) 2 +
}
+ (19,3 − 13,16 − 15,65 + 11,61) 2 = 10 . 19,03 = 190,3

SCT = SCR + SCE (α β ) + SCE (α ) + SCE (β ) a SCR = SCT − SCE (α β ) − SCE (α ) − SCE (β )

SCR = SCT − SCE (α β ) − SCE (α ) − SCE (β ) ⇒ SCR = 2694,74 − 204,25 − 1514,94 − 190,3 = 785,25
TABLA ANOVA: ANÁLISIS ESTADÍSTICO
Fuente
Suma cuadrados grados libertad Varianza Test F
variación
240,25 240,25
Factor (α ) SCE (α ) = 204,25 I −1= 1 Ŝα2 = = 240,25 Fα = = 27,54
( I −1) 8,725
1514,94 378,74
Factor (β ) SCE (β ) = 1514,94 J −1= 4 Ŝβ2 = = 378,74 Fβ = = 43,41
4 8,725
47,58
Interacción SCE (α β ) = 190.3 ( I − 1 ) ( J − 1 ) = 4 Ŝα2 β = 190,3 = 47,58 Fα β = = 5,45
4 8,725
785,25
Residual SCR = 785,25 I J (K − 1) = 90 Ŝ2r = = 8,725
90

Total SCT = 2694,74 I J K − 1 = 99

SCT ≡ 2694,74 (Variabilidad total de todos los datos)


SCR ≡ 785,25 (Variabilidad debida a los factores)
SCE (α β ) ≡ 190,3 (Variabilidad debida a las interacciones)
SCE (α ) ≡ 204,25 (Variabilidad debida a los distintos niveles del Factor 1)
SCE (β ) ≡ 1514,94 (Variabilidad debida a los distintos niveles del Factor 2)
ANÁLISIS ESTADÍSTICO: Contraste del Efecto de cada factor

H o : α1 = α 2 = L = α I = 0 H o : β1 = β 2 = L = β J = 0 H o : (α β ) i j = 0 ∀ i, j
H1 : A lgún α i ≠ 0 H1 : A lgún β j ≠ 0 H1 : Algún (α β ) i j ≠ 0
EL FACTOR 1 (α ) NO INFLUYE EL FACTOR 2 (β ) NO INFLUYE NO HAY INTERACCIONES

ESTADÍSTICOS DE CONTRASTE:

H o : α1 = α 2 = L = α I = 0 H o : β1 = β 2 = L = β J = 0 H o : (α β ) i j = 0 ∀ i, j
H1 : A lgún α i ≠ 0 H1 : A lgún β j ≠ 0 H1 : Algún (α β ) i j ≠ 0
EL FACTOR 1 (α ) NO INFLUYE EL FACTOR 2 (β ) NO INFLUYE NO HAY INTERACCIONES

Se acepta la hipótesis nula cuando: Se acepta la hipótesis nula cuando: Se acepta la hipótesis nula cuando:
Ŝα2 Ŝβ2 Ŝα2 β
Fα = 2 ≤ Fα, (I −1), I J (K −1) Fβ = 2 ≤ Fα, (J −1), I J (K −1) Fα β = 2 ≤ Fα, (I −1)(J −1), I J (K −1)
Ŝr Ŝr Ŝr

Ŝα2 Ŝβ2 2
Ŝαβ
Fα = = 27,54 > 3,96 = F0,05, 1, 90 Fβ = = 43,41 > 2,49 = F0,05, 4, 90 Fαβ = = 5,45 > 2,49 = F0,05, 4, 90
Ŝr2 Ŝ2r Ŝ2r

Se rechazan todas las hipótesis nulas. En consecuencia, influyen los factores.


Se verifica que la diferencia de medias es significativa, con una significación de 0,05