You are on page 1of 23

18

Comprobar si las hipótesis básicas del modelo están o no en contradicción con los

ij u rk Eu 0 i r oj k=

ESTIMADORES DE LAS PERTURBACIONES: LOS RESIDUOS

Distribución Normal

DIAGNOSIS Y VALIDACION DEL MODELO

i , jσ

Var

VERIFICACION DE LAS HIPOTESIS

HIPOTESIS DEL MODELO

u ij = 2

ij Eu 0 ij= ,

Gráficas de residuos Contrastes de igualdad de varianzas

u ij

La varianza sea constante:

Distribución sea Normal:

Independientes estre si

La media sea cero:

datos observados


i .ij

ij −− τ= i = yyµ

ij

ˆ ˆˆ

eyyy

ij =

ij

19

DETECTAR GRAVES DESVIACIONES DE LAS HIPOTESIS SUPUESTAS EN EL MODELO

2º) Examinar la adecuación del modelo planteado. Si el modelo no es el adecuado, tomar

3º) Si el modelo es el adecuado se realiza el análisis estadístico de los datos y se evalúa el

LOS MODELOS ANOVA SON RAZONABLEMENTE ROBUSTOS FRENTE A LIGERAS DESVIACIONES DEL MODELO. POR LO TANTO EL PRINCIPAL OBJETIVO ES:

Si el modelo es apropiado para los datos, los residuos observados e ij reflejarán las propiedades exigidas a las perturbaciones u ij

medidas correctoras, como transformaciones de los datos, o modificar el modelo

ESTUDIO DE UN EXPERIMENTO: PASOS A SEGUIR

INDEPENDENCIA DE LOS RESIDUOS NORMALIDAD DE LOS RESIDUOS HOMOCEDASTICIDAD (VARIANZA CONSTANTE)

1º) Plantear un modelo que explique los datos

grado de ajuste del modelo

20

Representación de los residuos frente al orden en el que se recopilaron los datos y buscar rachas de residuos de igual signo, así como cualquier tendencia creciente o decreciente en los mismos, lo cual sería un claro indicio de correlación entre los términos de error y el tiempo. Esto implica que la suposición de independencia de los

Si las hipótesis relativas al modelo son ciertas, los residuos variarán aleatoriamente. Si, por el contrario, descubrimos que los residuos presentan tendencias sistemáticas inexplicadas, tendremos que sospechar de la validez del modelo

INDEPENDENCIA DE LOS RESIDUOS

GRÁFICO DE RESIDUOS EN FUNCIÓN DEL TIEMPO

TEST DE DURBIN-WATSON

residuos ha sido violada

21

Discrepancias: valores muy distanciado de los demás. Suelen corresponder a datos anómalos (outliers)

Representación de la función de distribución de una variable aleatoria X, N( m; s), en una escala transformada apropiada de forma que la gráfica quede linealizada. De esta manera, si se disponen de datos extraidos aleatoriamente de esa distribución, la

representación en la escala transformada de la función de distribución muestral no debe separarse gráficamente de la linea recta teórica

Los residuos deben tener la apariencia de una distribución normal centrada en cero

NORMALIDAD DE LOS RESIDUOS

GRÁFICO PROBABILÍSTICO NORMAL (Q-Q-PLOT)

HISTOGRAMA

22

Esta gráfica, como la anterior, no es sólo útil para comprobar si los residuos son independientes de estas variables de interés, sino también para examinar si la varianza

manifiesto un aumento o disminución de los errores en función de los niveles del factor. El modelo no es el adecuado

Viola la hipótesis si, por ejemplo, este gráfico tiene forma de embudo, que pone de

GRÁFICO DE LOS RESIDUOS EN FUNCIÓN DE CIERTAS VARIABLES DE INTERÉS

GRÁFICO DE LOS RESIDUOS FRENTE A LOS VALORES AJUSTADOS

HOMOCEDASTICIDAD (VARIANZA CONSTANTE)

de los términos de error es constante

23

CONTRASTES DE IGUALDAD DE VARIANZAS

Tamaños de muestras cualesquiera

TEST DE COCHRAN

Tamaños de muestras iguales

TEST DE HARTLEY

TEST DE BARLETT


2 H = σσ = == σ 0 1 1 22 2 I 2 2
2
H
=
σσ
=
==
σ
0
1
1 22 2
I
2
2
H
=
σ
σ
Para a
lg
ún par
(
i
,
j
)
i
j

24

TEST DE HARTLEY

TEST DE COCHRAN

acepta H H 0 0

Se rechaza

exp > C C 1 1 α α ; ; I I Se

C exp

Si C

Si

i I = ( 1 s s i 2 i 2 )

= max

C

Si H ≤ H → Se acepta H exp 1 Si H > H exp
Si H
H
Se acepta H
exp
1
Si H
>
H
exp
1
α
;
0
Se rechaza H
;
I
I
α
0

min ( ( s s i i 2 2 ) )

max

=

H

25

=+ 1 3 ( I 1 1 ) i I = 1 ( n i 1 ) 1 ( NI ) 1 )(

TEST DE BARLETT

C

11

χ Ii 221 =

( n i 1 ) ln s i   

( n i 1 ) s i 2    I

( NI ) ln i I = NI



C 1 

B =−

2 ; Si B ≤ χ → Se acepta H exp α I − 1
2 ;
Si B
χ
Se acepta H
exp
α
I
1
0
2 ;
Si B
>
χ
Se rechaza H
exp
α
I
1
0

26

exp 1.099 1 21 ×= ln ( 4.67 )[ −=B 23.45 ] 8.11

1 ) ln s i 2 ( n i 1 )n 1

37/30

1/4

1/4

1/5

1/5

1/3

exp 8.11 χ=< 0.05;4 2 = 9.49B

No se rechaza la hipótesis nula e Se acepta que las varianzas de los cinco telares son iguales

Ejemplo Consideramos el ejemplo de la compañía textil.

1.11

23.45

10.41

5.14

4.39

4.62

-

i

(

1 )s s i 2

14

14

54

12

9826

4

( n i

2.80

0.80

3.00

4.67

13.5

i 2

C =+ 1 3 ( 1 4 ) 37 30 21 1 = 1.099

0.05 χ= 0.05;4 2 = 9.49α

50

47

57

48

45

n i

4

6

6

5

5

Telares

4

2

5

3

1

27

Técnicas cuyo objetivo es identificar qué tratamientos son estadísticamente diferentes

OBJETIVO FUNDAMENTAL: Comparar entre sí medias de tratamientos o grupos

METODO DE LA DIFERENCIA MINIMA SIGNIFICATIVA (LSD)

COMPARACIONES MULTIPLES

PROCEDIMIENTOS ANALITICOS

PROCEDIMIENTOS GRAFICOS

METODO DE RANGOS MULTIPLES DE DUNCAN

METODO DE TUKEY O METODO HSD

METODO DE NEWMAN-KEULS

METODO DE BONFERRONI

entre sí (Modelo de efectos fijos)

METODO DE DUNNETT

METODO DE SCHEFFE

de ellas

28

METODO LSD (MINIMA DIFERENCIA SIGNIFICATIVA) Se basa en la construcción de test de hipótesis para la diferencia de cualquier par de medias

de la varianza residual

COMPARACIONES BASADAS EN LA DISTRIBUCION t DE STUDENT

> LSD

t N I

observaciones

Intervalos de Confianza para Diferencias de Medias

Si el intervalo no contiene al cero, rechazamos H 0

S ˆ R 2 y i     . n 1 i y + j . n 1 j    

Las medias m i y m j son estadísticamente diferentes si: y .

−+ y )( LSD−− )

Nº de libertad

n i - y n I j : : Gr.de

LSD ; ( y ij

t =

N

Estadístico de contraste :

)

ij

y

y

(

LSD = t α 2; N I

y j .i

S ˆ R 2     n 1 i + n 1 j
S ˆ R 2     n 1 i + n 1 j    
y y ( • LSD = t α 2 ; N − I y j .

29

45; y 4 47; y 312 48; y 50; y 57; S ˆ R 2 = 4.67 con 21 G . L===== .

No hay diferencia significativa entre ellas

Hay diferencia significativa entre ellas

5 6; n 2 == n 3 5; n 4 = 4, = 0.05, tα== 0.025;21 = 2.08nn

También hay diferencia entre la 1ª y la 4ª y entre la 1ª y la 5ª

= 2.08 4.67 1 6 += 1 5 2.718LSD

= 2.08 4.67 1 6 += 1 4 2.898LSD

2) Comparamos las medias 2ª y 3ª, etc

1) Comparamos las medias 1ª y 2ª

Comparamos las medias 1ª y 3ª

Ejemplo

y 5 . y 4 . = 45 47 =< 2 LSD

LSD

y 5 . y 3 . = 45 48 =>

3

1

y 5

. y 4 . = 45 − 47 =< 2 LSD − LSD − y 5
. y 4 . = 45 − 47 =< 2 LSD − LSD − y 5

30

No hay diferencia significativa entre ellas

2 I ) ( 5 2 )( 5 ×= 4 2 = 10

número de comparaciones posiblesα

= tBSD 0.025 10;21 4.67 1 6 += 1 4 ( 3.135 )( 1.394 ) = 4.37

En este procedimiento se fija un nivel de significación que se reparte entre

Se rechaza H 0 : i µj = 0: siµ y . y j .i > BSD

.Ejemplo Comparamos las medias 5 yµ µ 4

===

METODO DE BONFERRONI

y 5 . 45; y 4 . = 47; nnM

= 4;

cada una de las comparaciones consideradas

54

BSD = t α 2 M

= 6;

BSD

= α M ; M = 2 I )(

y 5 . y 4 . = 45 47 =<

2

) ( y 5 . y 4 . = 45 − 47 =< 2 ∗ S
) ( y 5 . y 4 . = 45 − 47 =< 2 ∗ S

S ˆ R 2 n 1 i + n 1 j

= 45 − 47 =< 2 ∗ S ˆ R 2     n
= 45 − 47 =< 2 ∗ S ˆ R 2     n
= 45 − 47 =< 2 ∗ S ˆ R 2     n
= 45 − 47 =< 2 ∗ S ˆ R 2     n

31

COMPARACIONES BASADAS EN EL RANGO ESTUDENTIZADO:

es el punto crítico del rango estudentizado

METODO DE TUKEY O METODO HSD

TESTS DE RANGOS MULTIPLES

están tabulados

i

1

n

1

2

=

2

i

=

n

h

Modelo no equilibrado : n

=

h

Modelo equilibrado n

:

cos

Los valores críti

I

; IN

,

α

q

Se rechaza H : µ µ − = 0 si 0 i j 2 S
Se rechaza H
:
µ µ
=
0
si
0
i
j
2
S n ˆ R
y
−>
y
HSD
,
HSD
=
q α
i
j
;
IN
,
I
h

32

Con esta prueba se obtienen los mismos resultados que con el procedimiento de Bonferroni

HSD 4.22 4.67 2 1 64 + 1 ) = 4.161 y 5 . y 4( . = 45 47 =< 2 HSD=

Modelo no equilibrado : n h = i 2 = 2 1 n 1 i

5 6; n 2 == n 3 5; n 4 = 4, = 0.05, qα== 0.05;5,21 = 4.22nn

57

yyy=====

312

µ 4

No hay diferencia significativa entre ellas

50;

5 yµ

Comparamos las medias

48;

Ejemplo

47;

4

yy

45;

HSD = q α IN I

5

,

;

1

S n ˆ R h 2
S n ˆ R h 2
ellas 50; 5 y µ Comparamos las medias 48; Ejemplo 47; 4 yy 45; HSD =

33

es el nivel de significación conjunto relativo a p medias consecutivas; es decir, es la

probabilidad de rechazar erróneamente al menos una de las p - 1 comparaciones

están

es el punto crítico del rango estudentizado basado en la comparación de la

La aplicación es secuencial, en el sentido de no utilizar un único valor crítico para todas las diferencias de medias, como el de Tukey, sino un valor crítico que depende del número de medias comprendido entre las dos medias que se comparan, habiendo ordenado previamente las medias en orden creciente Se acepta que no hay diferencia significativa entre la media mayor y la media menor de

serán consideradas iguales también todas las medias comprendidas entre ellas

para p = 2,3,

p = 2,3, I

( α p =− 1 ( 1 α ) p 1 )

METODO DE RANGOS MULTIPLES DE DUNCAN

media mayor y la menor de p medias. Los valores críticos

independientes asociadas a las medias consideradas.

medias, si se verifica

q α p ; p , N I

tabulados

α p

y

p

,I,

34

45; y 4 47; y 312 48; y 50; y 57; S ˆ R 2 = 4.67 con 21 G . L===== .

Si comparamos parejas de medias separadas por una media, el nivel de significación

Si comparamos parejas de medias separadas por tres media, el nivel de significación

Si comparamos parejas de medias separadas por dos media, el nivel de significación

Si comparamos parejas de medias adyacentes, el nivel de significación conjunto es

3.24

3.09

=

=

15 6; n 23 == n 5; n 4 = 4, α== = 0.05nn

()

()

0.05; 5, 21

0.05; 3, 21

5 = 1 ( 1 0.05 ) 5 1 = 0.1855α

4 = 1 ( 1 0.05 ) 4 1 = 0.142α

3 = 1 ( 1 0.05 ) 3 1 = 0.10α

= 1 ( 1 0.05 ) 2 1 = 0.05α

qq

qq

== 2.94

== 3.17

3

5

Ejemplo

() 0.05; 2, 21

() 0.05; 4, 21

2

qq

qq

=

=

2

4

conjunto es

conjunto es

conjunto es


y 5

35

4 vs 2: q 4 2.33 1 4 + 1 5 = 3.245 y 42 . y . => 10 3.245 ()

5 vs 2: q 5 2.33 1 6 + 1 5 = 2.994 y 52 . y . => 12 2.994 ()

5 vs 3: q 3 2.33 1 6 + 1 5 = 2.856 y 53 . y . => 3 2.856 ()

5 vs 1: q 4 2.33 1 6 + 1 6 = 2.793 y 51 . y . => 5 2.793 ()

5 vs 4: q 2 2.33 1 6 + 1 4 = 2.896 y 54 . y . =< 2 2.896

2 2.33    1 6 + 1 4    = 2.896 y
2 2.33    1 6 + 1 4    = 2.896 y
2 2.33    1 6 + 1 4    = 2.896 y
2 2.33    1 6 + 1 4    = 2.896 y
2 2.33    1 6 + 1 4    = 2.896 y
2 2.33    1 6 + 1 4    = 2.896 y
2 2.33    1 6 + 1 4    = 2.896 y
2 2.33    1 6 + 1 4    = 2.896 y
2 2.33    1 6 + 1 4    = 2.896 y
2 2.33    1 6 + 1 4    = 2.896 y

36

es el punto crítico del rango estudentizado basado en la comparación de la

están

Se acepta que no hay diferencia significativa entre la media mayor y la media menor de p medias, si se verifica

Al igual que el contraste de Duncan, es un procedimiento iterativo y, desde el punto de vista operacional, es similar a dicho método

para p = 2,3,

p = 2,3, I

METODO DE NEWMAN-KEULS

media mayor y la menor de p medias. Los valores críticos tabulados

, N Ip

q α ;

,I,

37

=− C ˆˆ SC ( I 1; ) F α I 1, NI C ˆˆ + SC ( I  1 ) F α ; I 1,; NI )(

SC ˆˆ S R 2 i I 1 a n i i 2

Método para realizar cualquier contraste entre medias de tratamientos • Objetivo: Realizar el contraste

Rechazamos H 0 si el intervalo de confianza

i aµ=

=

METODO DE SCHEFFE

no contiene al cero, es decir, si

i = 0

H : C = ≠ 0 0 Ca ∑ i ii ; H : C
H
: C
=
0
0
Ca
∑ i
ii ;
H
: C
0
1

;

>−

SC ˆ

I

ˆ C
ˆ
C

=

38

=

F α I NI

)

0.44;12.44

; 1,;

+++ =1.912

C µ 1345

µµµ=+− −

50 48 47 45 6

+ y y y= =+−−=

+

SC ˆ = S ˆ R 2 i = 5 1 a n i i 2 = 4.67 1111

= 0.05, 4, 210.05; = 2.84Fα

=−

(

C µ 13 µµ 45 µ=+−

)

SC

ˆˆ

No es significativamente distinto de cero

6 1.912 4 2.84;6 1.912 4 2.84

Ejemplo

C

e

1;

1345

El intervalo contiene al cero

+

Cy

=−

SC

ˆˆ

ˆ

C

(

I

6546
6546
1.912 4 2.84 Ejemplo C e 1 ; 1 3 4 5 El intervalo contiene al

×

×
×

39

Uno de los tratamientos es un control y el experimentador puede estar interesado en

COMPARACIONES DE TRATAMIENTOS CON UN CONTROL

La pareja de medias m i y m j se consideran diferentes, a un nivel de significación

yy i . −> I . d α ; I 1, NI S ˆ R 2 n 1 i + n 1 I

Si el control es el tratamiento I, se desean probar las hipótesis

1

METODO DE DUNNETT

I

comparar los restantes tratamientos con este control

i 1, 2,

asociado a las I -1 comparaciones, siconjunto

=

I I

µ µ

µ µ

=

i i

H 1 0 : :

H

,

i 1 , 2 , asociado a las I - 1 comparaciones, siconjunto = I I

40

Asi se continua con 4 vs 1 y 5 vs 1. Resultando que las parejas de medias 2 vs 1 y 5 vs 1 resultan significativamente diferentes

= 0.05, 4, 210.05; = 2.64dα

2 vs 1: 2.64 4.67 1 5 + 1 6 = 3.454 y 2 . y 1 . => 7 3.454

3 vs 1: 2.64 4.67 1 5 + 1 6 = 3.454 y 3 . y 1 . =< 2 3.454

57

yyy=====

Supongamos que el control es el tratamiento 1

312

15 6; n 23 == n 5; n== 4 = 4nn

50;

48;

Ejemplo

47;

d α ; I 1, NI S ˆ R 2 n 1 i + n 1 I

4

yy

45;

5

− 1 , N I − S ˆ R 2    n 1 i
− 1 , N I − S ˆ R 2    n 1 i
− 1 , N I − S ˆ R 2    n 1 i
− 1 , N I − S ˆ R 2    n 1 i
− 1 , N I − S ˆ R 2    n 1 i