PH Broschure PH-Guide ENG

con
Ejemplo test de carencia de ajuste y regresi on

transformaciones
En los siguientes conjuntos de datos se desea dar respuesta a las siguientes cuestiones
1. Indique que informacion
nos proporciona el analisis
del grafico
de Y vs. X acerca de:

a) El tipo de relacion
funcional entre Y vs. X (lineal o no lineal?)
b) El comportamiento de la varianza de Y en cada nivel de X observado Es constante
o no? Si no es constante, como
cambia?
2. Ajuste el modelo de regresion
lineal simple y determine lo siguiente,
a) Interprete los valores ajustados de los parametros.
b) Realice la prueba de significancia de la regresion

(mediante la tabla ANOVA).
c) Realice los test de significancia de cada parametros
(pruebas t).
3. Calcule los residuales estudentizados y responda lo siguiente:
a) De acuerdo a los graficos
de residuales, determine si el supuesto de varianza constante para los respectivos errores se cumple o no.
b) Ahora realice los test de normalidad sobre los errores del modelo, use e interprete
los resultados del test de Shapiro Wilk y el grafico
de probabilidad sobre residuales

estudentizados.
4. Considere de nuevo los graficos
de residuales vs. X, calcule la ANOVA para el test de

carencia de ajuste del modelo y determine si,
a) Hay carencia de ajuste del modelo postulado para la respectiva respuesta media?
(Formule completamente el test de hipotesis,
el estadstico de prueba y los resultados)

b) Caso que exista carencia de ajuste Que modelos seran mas
apropiados? Por que?
1. Ejemplo 1
Se realizo un experimento sobre el efecto del numero
de das de capacitacion
recibida (X)
sobre el desempeno
de los vendedores (Y ) en una serie de situaciones de venta simuladas (Neter et al.,2004). Los datos recolectados sobre 10 vendedores asignados aleatoriamente entre 5
niveles de tratamientos (valores distintos del tiempo de capacitacion),
se ilustran en la Tabla
1. Los ajustes del modelo de RLS aparecen en la Tabla 2 y su ANOVA en la Tabla 3. Ver en
Figura 1 los datos junto con recta ajustada y medias de tratamiento.
Datos experimento capacitacion

vendedores
Obs.
No.dias
Desempeno
1
0.50
42.50
2
0.50
50.60
3
1.00
68.50
4
1.00
80.70
5
1.50
89.00
6
1.50
99.60
7
2.00
105.30
8
2.00
111.80
9
2.50
112.30
10
2.50
125.70
Observaciones
media tratamiento
80
40
60
desempeo
100
120
Tabla 1:
0.5
1.0
1.5
2.0
2.5
No.dias
Figura 1: Datos problema capacitacion

vendedores. Recta ajustada en rojo
vendedores
Tabla 2: Modelos ajustado experimento capacitacion
Parametro
Estimacion
Error estandar
T0
Pr(|t8 | > |T0 |)
0
34.9450
5.9477
5.88
0.0004
35.7700
3.5866
9.97
0.0000
1
MSE = 8.02, R2 = 0.9256, F0 = 99.46, P (f1,8 > F0 ) = 8.66 1006
Tabla 3:
Fuente
No.dias
Error
ANOVA MRLS, experimento capacitacion

vendedores
Df
Sum Sq
Mean Sq
F0
Pr(f1,8 > F0 )
1
6397.46
6397.46
99.46
0.0000
8
514.56
64.32
1
0
1
2
Residuos estudentizados
En la Figura 2 se presentan las graficas
de residuales estudentizados y en la Figura 3 el

grafico
de probabilidad normal usando tambien residuales estudentizados.
50
60
70
80
90
100
110
120
1
0
1
2
desempeo ajustado
0.5
1.0
1.5
2.0
2.5
No. das
Figura 2: Residuales estudentizados, problema capacitacion

vendedores.
Normal QQ Plot
0
2
Sample Quantiles
statistic
0.933870468059182
p.value
0.487022457826849
method
ShapiroWilk normality test
data.name
rstudent(mod1)
1.5
1.0
0.5
0.0
0.5
1.0
1.5
Theoretical Quantiles
Figura 3: QQplot residuales estudentizados, problema capacitacion

vendedores.
Para el test de carencia de ajuste, se ajusta inicialmente el modelos lineal general Yij =
i + Eij . La ANOVA de este modelo se muestra en la Tabla 4. La ANOVA para el test de
carencia de ajuste se muestra en la Tabla 5.
Tabla 4:
ANOVA ML general, experimento capacitacion

vendedores
Fuente
Df
Sum Sq
Mean Sq
F0
Pr(f4,5 > F0 )
No. dias
4
6637.71
1659.43
30.25
0.0011
Error Puro
5
274.31
54.86
Tabla 5:
ANOVA Test de carencia de ajuste, experimento capacitacion

vendedores
Res.Df
RSS
Df
Sum of Sq
FLOF
Pr(f3,5 > FLOF )
carencia
Error(RLS)
8
514.56
Error(puro)
5
274.31
3
240.25
1.46
0.3313
Fuente

Codigo
R 1.1.
ejemplo1=data.frame(matrix(scan(),ncol=2,byrow=T))
0.5 42.5
0.5 50.6
1.0 68.5
1.0 80.7
1.5 89.0
1.5 99.6
2.0 105.3
2.0 111.8
2.5 112.3
2.5 125.7
names(ejemplo1)=c("No.dias","desempe
no")
attach(ejemplo1)
mod1=lm(desempe
noNo.dias)
summary(mod1)
anova(mod1)
mediasy.i=sapply(split(desempe
no,as.factor(No.dias)),mean) #medias de Y en cada tratamiento
#Gr
afica datos con recta ajustada e indicaci
on de medias observadas
#en cada nivel de tratamiento
plot(No.dias,desempe
no,cex=2)
abline(mod1,lwd=2,col=2)
lines(c(0.5,1,1.5,2,2.5),mediasy.i,lty=2,col=4)
points(c(0.5,1,1.5,2,2.5),mediasy.i,pch=3,col=4)
legend("topleft",legend=c("Observaciones","media tratamiento"),col=c(1,4),pch=c(1,3))
#Gr
afica de residuos estudentizados
layout(rbind(c(0,1,1,0),c(0,2,2,0)))
plot(fitted(mod1),rstudent(mod1),ylab="Residuos estudentizados",xlab="desempe
no ajustado",cex=2,ylim=c(-2.5,2.5))
abline(h=c(-2,0,2),col=2)
plot(No.dias,rstudent(mod1),ylab="Residuos estudentizados",xlab="No. d
as",cex=2,ylim=c(-2.5,2.5))
test1=shapiro.test(rstudent(mod1)) #Test de normalidad sobre residuales estudentizados
#Gr
afico de normalidad con informaci
on del test Shapiro
qqnorm(rstudent(mod1),cex=1.5)
qqline(rstudent(mod1),lty=2,lwd=2,col=2)
legend("topleft",legend=rbind(names(test1),test1),cex=0.8)
mod.aux=lm(desempe
noas.factor(No.dias))#ajuste modelo lineal general
anova(mod.aux)
#test de carencia de ajuste
anova(mod1,mod.aux)
detach(ejemplo1)
2. Ejemplo 2
Los siguientes datos se recolectaron con el fin de determinar la relacion
existente entre el
peso corporal del ganado vacuno (X) y la rapidez de eliminacion
metabolica/peso
corporal (Y ).
Los datos que aparecen en la Tabla 6 son el resultado de varias realizaciones del experimento,
en distintos niveles del peso. Observe que la variable explicatoria fue observada en cuatro
niveles: 110, 230, 360 y 505, es decir, tenemos replicas de la variable respuesta en al menos
un nivel de X.
Los ajustes del modelo de RLS aparecen en la Tabla 7 y su ANOVA en la Tabla 8. En la
Figura 4 se muestran los datos, la recta ajustada y las medias por nivel de tratamiento.
Tabla 6:
240
Datos experimento ganado vacuno

Peso
Rapidez
Obs.
corporal
elimin. metab.
1
110.00
235.00
2
110.00
198.00
3
110.00
173.00
4
230.00
174.00
5
230.00
149.00
6
230.00
124.00
7
360.00
115.00
8
360.00
130.00
9
360.00
102.00
10
360.00
95.00
11
505.00
122.00
12
505.00
112.00
13
505.00
98.00
14
505.00
96.00
160
100
120
140
rapid.elim
180
200
220
Observaciones
media tratamiento
100
200
300
400
500
peso.corp
Figura 4: Datos problema ganado vacuno. Recta ajustada en rojo
Tabla 7: Modelos ajustado experimento ganado vacuno

Parametro
Estimacion
Error estandar
T0
Pr(|t12 | > |T0 |)
0
212.7209
15.7841
13.48
0.0000
-0.2355
0.0449
-5.25
0.0002
1
MSE = 24.56, R2 = 0.6967, F0 = 27.57, P (f1,12 > F0 ) = 0.0002043
Tabla 8:
Fuente
peso.corp
Error
Df
1
12
ANOVA MRLS, experimento ganado vacuno

Sum Sq
Mean Sq
F0
Pr(f1,12 > F0 )
16634.20
16634.20
27.57
0.0002
7241.01
603.42
1
0
1
3
En la Figura 5 se presentan las graficas
de residuales estudentizados y en la Figura 6 el

grafico
de probabilidad normal usando tambien residuales estudentizados.
100
120
140
160
180
1
0
1
3
rapidez de eliminacin ajustada
100
200
300
400
500
Peso corporal
Figura 5: Residuales estudentizados, problema ganado vacuno
Normal QQ Plot
1
0
1
Sample Quantiles
statistic
0.952640455984604
p.value
0.602401838080914
method
ShapiroWilk normality test
data.name
rstudent(mod2)
Theoretical Quantiles
Figura 6: QQplot residuales estudentizados, problema ganado vacuno.
Para el test de carencia de ajuste, se ajusta inicialmente el modelos lineal general Yij =
i + Eij . La ANOVA de este modelo se muestra en la Tabla 9. La ANOVA para el test de
carencia de ajuste se muestra en la Tabla 10.
Tabla 9:
Fuente
peso corp
Error(puro)
ANOVA ML general, problema ganado vacuno

Df
Sum Sq
Mean Sq
F0
Pr(f3,10 > F0 )
3
19514.21
6504.74
14.92
0.0005
10
4361.00
436.10
Tabla 10:
Fuente
Error(RLS)
Error(puro)
ANOVA Test de carencia de ajuste, problema ganado vacuno

Res.Df
RSS
Df
Sum of Sq
FLOF
Pr(f2,10 > FLOF )
carencia
12
7241.01
10
4361.00
2
2880.01
3.30
0.0792
Codigo
R 2.1.
ejemplo2=data.frame(matrix(scan(),ncol=2,byrow=T))
110 235
110 198
110 173
230 174
230 149
230 124
360 115
360 130
360 102
360
505
505
505
505
95
122
112
98
96
names(ejemplo2)=c("peso.corp","rapid.elim")
attach(ejemplo2)
mod2=lm(rapid.elimpeso.corp)
summary(mod2)
anova(mod2)
#C
alculo de medias por tratamiento
medias2y.i=sapply(split(rapid.elim,as.factor(peso.corp)),mean) #medias de Y en cada tratamiento
#Graficando los datos, recta ajustada y se
nalando las medias de tratamiento
plot(peso.corp,rapid.elim,cex=2)
abline(mod2,lwd=2,col=2)
lines(c(110,230,360,505),medias2y.i,lty=2,col=4)
points(c(110,230,360,505),medias2y.i,pch=3,col=4)
legend("topright",legend=c("Observaciones","media tratamiento"),col=c(1,4),pch=c(1,3))
#Gr
aficos de residuales estudentizados
layout(rbind(c(0,1,1,0),c(0,2,2,0)))
plot(fitted(mod2),rstudent(mod2),ylab="Residuos estudentizados",xlab="rapidez de eliminaci
on ajustada",cex=2,ylim=c(-3,3))
plot(peso.corp,rstudent(mod2),ylab="Residuos estudentizados",xlab="Peso corporal",cex=2,ylim=c(-3,3))
test2=shapiro.test(rstudent(mod2)) #Test de normalidad sobre residuales estudentizados
#Gr
afico de normalidad con informaci
on del test Shapiro
qqnorm(rstudent(mod2),cex=1.5)
qqline(rstudent(mod2),lty=2,lwd=2,col=2)
legend("topleft",legend=rbind(names(test2),test2),cex=0.8)
mod2.aux=lm(rapid.elimas.factor(peso.corp))#ajuste modelo lineal general
anova(mod2.aux)
#test de carencia de ajuste
anova(mod2,mod2.aux)
detach(ejemplo2)
2.1. Algunos modelos con transformaci

on en este ejemplo
Se propone probar los siguientes modelos con el fin de determinar una transformacion
apropiada, bien sea sobre la respuesta y/o el predictor que corrija la no linealidad al mismo
tiempo que la varianza no constante. Estos modelos son:
i.i.d
Modelo 2: log(Yi ) = 0 + 1 Xi + i , i N (0, 2 )

i.i.d
Modelo 3: log(Yi ) = 0 + 1 log(Xi ) + i , i N (0, 2 )

Modelo 4: Yi = 0 + 1 log(Xi ) + i , i N (0, 2 )
i.i.d
i.i.d
Modelo 5: log(Yi ) = 0 + 1 (1/Xi ) + i , i N (0, 2 )

i.i.d
Modelo 6: Yi = 0 + 1 (1/Xi ) + i , i N (0, 2 )

1. Mediante R ajuste estos cinco modelos
2. Analice los residuales de cada uno de los modelos y realice la prueba de carencia de
ajuste de cada uno de ellos.
3. Con base en el analisis
de residuales y la prueba de carencia de ajuste seleccione el

mejor modelo y resuelva las preguntas siguientes:
a) Se desea calcular la rapidez de eliminacion

metabolica
de un animal de 300 kg.,

encuentre dicha prediccion
y su respectivo intervalo e interprete.
b) Estime la rapidez promedio para un animal de 300 kg, y encuentre un IC del 95 %
de Confianza para dicha estimacion.
NOTA: Tenga presente que para el punto 3. debe primero producir las estimaciones y predicciones en la escala del respectivo modelo y luego destranformar estos resultados, caso que la
variable respuesta en el mejor modelo haya sido transformada.
10

PH Broschure PH-Guide ENG

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

PH Broschure PH-Guide ENG

Uploaded by

Copyright:

Available Formats

con

Ejemplo test de carencia de ajuste y regresi on

de Y vs. X acerca de:

b) Realice la prueba de significancia de la regresion

de probabilidad sobre residuales

de residuales vs. X, calcule la ANOVA para el test de

el estadstico de prueba y los resultados)

Datos experimento capacitacion

Figura 1: Datos problema capacitacion

MSE = 8.02, R2 = 0.9256, F0 = 99.46, P (f1,8 > F0 ) = 8.66 1006

ANOVA MRLS, experimento capacitacion

En la Figura 2 se presentan las graficas

de residuales estudentizados y en la Figura 3 el

de probabilidad normal usando tambien residuales estudentizados.

Figura 2: Residuales estudentizados, problema capacitacion

Figura 3: QQplot residuales estudentizados, problema capacitacion

ANOVA ML general, experimento capacitacion

ANOVA Test de carencia de ajuste, experimento capacitacion

Datos experimento ganado vacuno

Figura 4: Datos problema ganado vacuno. Recta ajustada en rojo

Tabla 7: Modelos ajustado experimento ganado vacuno

MSE = 24.56, R2 = 0.6967, F0 = 27.57, P (f1,12 > F0 ) = 0.0002043

ANOVA MRLS, experimento ganado vacuno

En la Figura 5 se presentan las graficas

de residuales estudentizados y en la Figura 6 el

de probabilidad normal usando tambien residuales estudentizados.

rapidez de eliminacin ajustada

Figura 5: Residuales estudentizados, problema ganado vacuno

Figura 6: QQplot residuales estudentizados, problema ganado vacuno.

ANOVA ML general, problema ganado vacuno

ANOVA Test de carencia de ajuste, problema ganado vacuno

2.1. Algunos modelos con transformaci

Modelo 2: log(Yi ) = 0 + 1 Xi + i , i N (0, 2 )

Modelo 3: log(Yi ) = 0 + 1 log(Xi ) + i , i N (0, 2 )

Modelo 5: log(Yi ) = 0 + 1 (1/Xi ) + i , i N (0, 2 )

Modelo 6: Yi = 0 + 1 (1/Xi ) + i , i N (0, 2 )

de residuales y la prueba de carencia de ajuste seleccione el

a) Se desea calcular la rapidez de eliminacion

de un animal de 300 kg.,

You might also like