∀ i, j

ƒ Gráficas de residuos
ƒ Contrastes de igualdad de varianzas

eij = y ij − yˆ ij = y ij − µˆ − τˆi = y ij − y i

.

VERIFICACION DE LAS HIPOTESIS
ESTIMADORES DE LAS PERTURBACIONES: LOS RESIDUOS

• Independientes estre si E u ij u rk  = 0 i ≠ r o j ≠ k
• Distribución sea Normal: u ij → Distribución Normal

• La media sea cero: E u ij  = 0 ∀ i, j
• La varianza sea constante: Var u ij  = σ 2

9Comprobar si las hipótesis básicas del modelo están o no en contradicción con los
datos observados
HIPOTESIS DEL MODELO

™ DIAGNOSIS Y VALIDACION DEL MODELO

18

¾ HOMOCEDASTICIDAD (VARIANZA CONSTANTE)

¾ NORMALIDAD DE LOS RESIDUOS

¾ INDEPENDENCIA DE LOS RESIDUOS

Si el modelo es apropiado para los datos, los residuos observados eij reflejarán las
propiedades exigidas a las perturbaciones ui j

• DETECTAR GRAVES DESVIACIONES DE LAS HIPOTESIS SUPUESTAS EN EL MODELO

LOS MODELOS ANOVA SON RAZONABLEMENTE ROBUSTOS FRENTE A LIGERAS
DESVIACIONES DEL MODELO. POR LO TANTO EL PRINCIPAL OBJETIVO ES:

3º) Si el modelo es el adecuado se realiza el análisis estadístico de los datos y se evalúa el
grado de ajuste del modelo

2º) Examinar la adecuación del modelo planteado. Si el modelo no es el adecuado, tomar
medidas correctoras, como transformaciones de los datos, o modificar el modelo

1º) Plantear un modelo que explique los datos

ESTUDIO DE UN EXPERIMENTO: PASOS A SEGUIR

19

Esto implica que la suposición de independencia de los residuos ha sido violada ♦ GRÁFICO DE RESIDUOS EN FUNCIÓN DEL TIEMPO ¾ INDEPENDENCIA DE LOS RESIDUOS 9 Si las hipótesis relativas al modelo son ciertas. Si. lo cual sería un claro indicio de correlación entre los términos de error y el tiempo. tendremos que sospechar de la validez del modelo 20 . por el contrario. descubrimos que los residuos presentan tendencias sistemáticas inexplicadas.♦ TEST DE DURBIN-WATSON Representación de los residuos frente al orden en el que se recopilaron los datos y buscar rachas de residuos de igual signo. los residuos variarán aleatoriamente. así como cualquier tendencia creciente o decreciente en los mismos.

si se disponen de datos extraidos aleatoriamente de esa distribución. la representación en la escala transformada de la función de distribución muestral no debe separarse gráficamente de la linea recta teórica ♦ GRÁFICO PROBABILÍSTICO NORMAL (Q-Q-PLOT) anómalos (outliers) 9 Discrepancias: valores muy distanciado de los demás. De esta manera.Representación de la función de distribución de una variable aleatoria X. N( m. s). en una escala transformada apropiada de forma que la gráfica quede linealizada. Suelen corresponder a datos Los residuos deben tener la apariencia de una distribución normal centrada en cero ♦ HISTOGRAMA ¾ NORMALIDAD DE LOS RESIDUOS 21 .

por ejemplo. El modelo no es el adecuado ♦ GRÁFICO DE LOS RESIDUOS FRENTE A LOS VALORES AJUSTADOS ¾ HOMOCEDASTICIDAD (VARIANZA CONSTANTE) 22 . que pone de manifiesto un aumento o disminución de los errores en función de los niveles del factor. no es sólo útil para comprobar si los residuos son independientes de estas variables de interés. sino también para examinar si la varianza de los términos de error es constante INTERÉS ♦ GRÁFICO DE LOS RESIDUOS EN FUNCIÓN DE CIERTAS VARIABLES DE Viola la hipótesis si. como la anterior. este gráfico tiene forma de embudo.Esta gráfica.

= σ I 2 ƒ CONTRASTES DE IGUALDAD DE VARIANZAS 23 ..2 2 2 2 Para a lg ún par ( i. j ) ♦ TEST DE BARLETT Tamaños de muestras cualesquiera ♦ TEST DE HARTLEY ♦ TEST DE COCHRAN Tamaños de muestras iguales H1 = σ i ≠ σ j H 0 = σ 1 = σ 2 = ...

I → Se rechaza H 0 Si H exp ≤ H 1−α .∑ I s i2 i =1 max s i2 ( ) H= min ( s i2 ) C= ( ) max s i2 Si H exp > H 1−α . I → Se acepta H 0 ♦ TEST DE HARTLEY Si C exp > C1−α . I → Se acepta H 0 ♦ TEST DE COCHRAN 24 . I → Se rechaza H 0 Si C exp ≤ C1−α .

(∑ I −1 −1 1 n − − N − I ( ) ( ) i =1 i Si Bexp > χ α2 . I −1 → Se acepta H 0 1 C = 1+ 3 ( I − 1) )   I ( n − 1) s 2   ∑ 1 i i  I B =  ( N − I ) ln  i =1 − ∑ ( ni − 1) ln s i2  → i =1    C N −I     ♦ TEST DE BARLETT χ I2−1 25 . I −1 → Se rechaza H 0 Si Bexp ≤ χ α2 .

4 = 9.05.11 < χ 0.67 ) − 23.05.45] = 8.39 10.49 1  37 1  C = 1+ −  = 1.41 4.80 s i2 1/5 1/4 1/4 1/3 1/5 37/30 ( ni − 1) − 1 2 26 1 [ 21× ln ( 4.5 4.14 23.099  3 ( 4 )  30 21  ni Telares ✦Ejemplo Consideramos el ejemplo de la compañía textil.67 2.099 -1.4 = 9.05 χ 0.45 ( ni − 1) ln s i2 Bexp = 8. . 50 57 48 47 45 yi 0.49 ⇒ Bexp = 4 12 54 14 14 98 ( ni − 1) s i2 No se rechaza la hipótesis nula e Se acepta que las varianzas de los cinco telares son iguales 2 α = 0.80 3.62 5.00 13.11 4.11 1.6 5 5 4 6 26 1 2 3 4 5 .

¾ METODO DE DUNNETT ¾ METODO DE SCHEFFE ¾ METODO DE NEWMAN-KEULS ¾ METODO DE RANGOS MULTIPLES DE DUNCAN ¾ METODO DE TUKEY O METODO HSD ¾ METODO DE BONFERRONI ¾ METODO DE LA DIFERENCIA MINIMA SIGNIFICATIVA (LSD) ƒ PROCEDIMIENTOS ANALITICOS ƒ PROCEDIMIENTOS GRAFICOS 9 OBJETIVO FUNDAMENTAL: Comparar entre sí medias de tratamientos o grupos de ellas Técnicas cuyo objetivo es identificar qué tratamientos son estadísticamente diferentes entre sí (Modelo de efectos fijos) ™ COMPARACIONES MULTIPLES 27 .

BASADAS EN LA DISTRIBUCION t DE STUDENT t= . rechazamos H0 ( ( y i. − y j.) + LSD ) ƒ Intervalos de Confianza para Diferencias de Medias 1 2 1 ˆ • LSD = tα 2.) − LSD .de libertad de la varianza residual Si el intervalo no contiene al cero.I : Gr. 1 2 1 ˆ SR  + n n j  i yi − y j .    . ( yi. . N − I S R  + n n j  i Las medias mi y mj son estadísticamente diferentes si: y i − y j > LSD Estadístico de contraste : Se basa en la construcción de test de hipótesis para la diferencia de cualquier par de medias ¾ METODO LSD (MINIMA DIFERENCIA SIGNIFICATIVA) ‰ COMPARACIONES 28 . → t N −I    • ni y nj: Nº de observaciones • N . − y j.

t 0. .. y 4 = 47. Sˆ R2 = 4. α = 0.08 4.67 1 6 + 1 4 = 2. n 4 = 4. . Ejemplo 29 . n 2 = n3 = 5.67 con 21 G.718 Comparamos las medias 1ª y 3ª y 5 − y 4 = 45 − 47 = 2 < LSD ⇒ No hay diferencia significativa entre ellas . y 3 = 48. . y1 = 50.21 = 2. . .05. LSD = 2.67 1 6 + 1 5 = 2.025. y 5 = 45. etc También hay diferencia entre la 1ª y la 4ª y entre la 1ª y la 5ª y 5 − y 3 = 45 − 48 = 3 > LSD ⇒ Hay diferencia significativa entre ellas LSD = 2.L.08 1) Comparamos las medias 1ª y 2ª n1 = n5 = 6. y 2 = 57. . .898 2) Comparamos las medias 2ª y 3ª.08 4.

() () . y i − y j > BSD 1  2 1 ˆ SR  +  n n  j  i Se rechaza H 0 : µ i − µ j = 0 si : α ∗ = α M .67  +  = ( 3. y 5 − y 4 = 45 − 47 = 2 < BSD ⇒ No hay diferencia significativa entre ellas .37 6 4 . 1 1  BSD = t 0. 21 4. M = 2I número de comparaciones posibles () En este procedimiento se fija un nivel de significación  que se reparte entre cada una de las comparaciones consideradas ¾ METODO DE BONFERRONI 30 . y 4 = 47. n 4 = 4.135 )(1. M = I = 5 = 5 × 4 2 = 10 2 2 BSD = tα 2 M .394 ) = 4..025 10. Ejemplo. Comparamos las medias µ 5 y µ 4 y 5 = 45. . n5 = 6.

N − I es el punto crítico del rango estudentizado Los valores críti cos están tabulados y i − y j > HSD. HSD = qα .. N − I nh 2 Sˆ R − Modelo no equilibrado : n h = − Modelo equilibrado : n h = n ∑ 2 1 i =1 n i 2 − qα . Se rechaza H 0 : µ i − µ j = 0 si ¾ METODO DE TUKEY O METODO HSD BASADAS EN EL RANGO ESTUDENTIZADO: TESTS DE RANGOS MULTIPLES ‰ COMPARACIONES 31 . I . I . .

67 1 1 HSD = 4. ..5. n 2 = n3 = 5. Con esta prueba se obtienen los mismos resultados que con el procedimiento de Bonferroni No hay diferencia significativa entre ellas .05. Ejemplo 32 . y 3 = 48. y1 = 50. . I . n 4 = 4.22 + = 4. ∑ 2 1 i =1 n i y 5 − y 4 = 45 − 47 = 2 < HSD Comparamos las medias µ 5 y µ 4 nh 2 α = 0. ( ) . y 2 = 57 . .22 Modelo no equilibrado : n h = 4.21 = 4. N − I 2 Sˆ R n1 = n5 = 6. q 0.161 2 6 4 HSD = qα . y 5 = 45. y 4 = 47.05.

R p = qα ..3..1 comparaciones independientes asociadas a las medias consideradas. sino un valor crítico que depende del número de medias comprendido entre las dos medias que se comparan. . si se verifica ˆ2 ¾ METODO DE RANGOS MULTIPLES DE DUNCAN 33 . en el sentido de no utilizar un único valor crítico para todas las diferencias de medias. α p = 1 − (1−α ) p −1 qα .. p. N − I es el punto crítico del rango estudentizado basado en la comparación de la p y serán consideradas iguales también todas las medias comprendidas entre ellas yi − y j ≤ R p .. Los valores críticos para p = 2. es la probabilidad de rechazar erróneamente al menos una de las p . p.I ( ) media mayor y la menor de p medias.. SR La aplicación es secuencial... habiendo ordenado previamente las medias en orden creciente Se acepta que no hay diferencia significativa entre la media mayor y la media menor de p medias.. N − I p nh p = 2.3. es decir. como el de Tukey.I. están tabulados α p es el nivel de significación conjunto relativo a p medias consecutivas.

n1 = n5 = 6. . 21) = 3. Sˆ R2 = 4.1855 = q ( 0. el nivel de significación conjunto es ( ) 3−1 α 2 = 1 − (1 − 0.05 • Si comparamos parejas de medias separadas por tres media. 4. 2. 21) = 3. y1 = 50.17 3 q = q ( 0. el nivel de significación conjunto es ( ) 5−1 α 4 = 1 − 1 − 0.67 con 21 G.09 = 0.142 q q 4 2 5 q = q ( 0.05 • Si comparamos parejas de medias adyacentes. Ejemplo 34 . . n 2 = n3 = 5.05 .L.05 ) 2−1 = 0. y 3 = 48.10 = 0. .05 • Si comparamos parejas de medias separadas por dos media.05. 3.05. = 0. 21) = 2. el nivel de significación conjunto es ( ) 4−1 α 3 = 1 − 1 − 0.05 • Si comparamos parejas de medias separadas por una media.. 5. n 4 = 4. y 2 = 57.94 α 5 = 1 − 1 − 0.05.24 = q ( 0. α = 0. y 4 = 47. el nivel de significación conjunto es y 5 = 45.05. 21) = 3.

y 5 − y 4 = 2 < 2. .245 ( ∗ ) . .856 6 5 1 1 5 vs 4 : q 2 2.896 6 4 1 1 4 vs 2 : q 4 2..33  +  = 2. y 5 − y1 = 5 > 2. y 4 − y 2 = 10 > 3.856 ( ∗ ) .33  +  = 2.994 6 5 35 . .33  +  = 3.896 . y 5 − y 3 = 3 > 2.793 ( ∗ ) .33  +  = 2.33  +  = 2.994 ( ∗ ) 1 1 5 vs 2 : q 5 2. y 5 − y 2 = 12 > 2. .245  4 5 . 1 1 5 vs 1: q 4 2.793 6 6 1 1 5 vs 3: q 3 2.

N − I es el punto crítico del rango estudentizado basado en la comparación de la yi − y j ≤ K p . Los valores críticos para p = 2. están tabulados qα . desde el punto de vista operacional. K p = qα .I.. p. 2 Sˆ R Se acepta que no hay diferencia significativa entre la media mayor y la media menor de p medias. ..3. si se verifica Al igual que el contraste de Duncan.. N − I nh p = 2. es similar a dicho método ¾ METODO DE NEWMAN-KEULS 36 ...I media mayor y la menor de p medias.. p.. es un procedimiento iterativo y..3.

N − I . es decir. I −1. si ∑ I a2 2 i Sˆ R n i =1 i I = Cˆ − S  Cˆ  ( I − 1) Fα . I −1. Cˆ + S  Cˆ  ( I − 1) Fα . I −1. i Rechazamos H0 si el intervalo de confianza H1 : C ≠ 0 H0 :C = 0 • Objetivo: Realizar el contraste Método para realizar cualquier contraste entre medias de tratamientos ¾ METODO DE SCHEFFE ) 37 . N − I ( C = ∑ ai µ i .∑i ai = 0 Cˆ > S  Cˆ  ( I − 1) Fα . N − I . S  Cˆ  = no contiene al cero.

44.84 5 a2 1 1 1 1 2 ˆ i SR = 4. C = µ1 + µ 3 − µ 4 − µ 5 Ejemplo )= 38 .44 ) El intervalo contiene al cero e ( 6 − 1.05. 12.912 4 × 2. Cˆ + S  Cˆ  ( I − 1) Fα . 4. S  Cˆ  = α = 0.912 n 6 5 4 6 i =1 i No es significativamente distinto de cero C = µ1 + µ 3 − µ 4 − µ 5 4 × 2. Cˆ = y1 + y 3 − y 4 − y 5 = 50 + 48 − 47 − 45 = 6 . . N − I ( . ∑ F0.6 + 1. I −1.84 ..912 I = Cˆ − S  Cˆ  ( I − 1) Fα .05.67  + + +  = 1. N − I . I −1. 21 = 2.84 ) = ( − 0.

I − 1 . a un nivel de significación conjunto  asociado a las I -1 comparaciones.. 1  2 1 y i − y I > d α . I −1. se desean probar las hipótesis Uno de los tratamientos es un control y el experimentador puede estar interesado en comparar los restantes tratamientos con este control ¾ METODO DE DUNNETT ‰ COMPARACIONES DE TRATAMIENTOS CON UN CONTROL 39 .. 2. si H 0 : µi = µ I H1 : µ i ≠ µ I Si el control es el tratamiento I... N − I Sˆ R  +  n n I   i La pareja de medias mi y mj se consideran diferentes. .i = 1.

y 3 = 48. I −1. d 0. y1 = 50. y 3 − y1 = 2 < 3. n 2 = n3 = 5.454 α = 0.64 y 2 − y1 = 7 > 3. Ejemplo 40 ..67  +  = 3. 1 1 3 vs 1: 2. y 2 = 57 n1 = n5 = 6. n 4 = 4 . 1 1 2 vs 1: 2. .454 . 21 = 2.05.454 5 6 Asi se continua con 4 vs 1 y 5 vs 1. . y 4 = 47. .64 4.64 4. . Resultando que las parejas de medias 2 vs 1 y 5 vs 1 resultan significativamente diferentes . .05. N − I Sˆ R  +   ni n I  Supongamos que el control es el tratamiento 1 y 5 = 45.454 5 6 1  2 1 d α . 4.67  +  = 3.