Professional Documents
Culture Documents
En los siguientes conjuntos de datos se desea dar respuesta a las siguientes cuestiones
1. Indique que informacion
nos proporciona el analisis
del grafico
cambia?
2. Ajuste el modelo de regresion
lineal simple y determine lo siguiente,
a) Interprete los valores ajustados de los parametros.
(pruebas t).
3. Calcule los residuales estudentizados y responda lo siguiente:
a) De acuerdo a los graficos
de residuales, determine si el supuesto de varianza constante para los respectivos errores se cumple o no.
b) Ahora realice los test de normalidad sobre los errores del modelo, use e interprete
los resultados del test de Shapiro Wilk y el grafico
1. Ejemplo 1
Se realizo un experimento sobre el efecto del numero
de das de capacitacion
recibida (X)
sobre el desempeno
de los vendedores (Y ) en una serie de situaciones de venta simuladas (Neter et al.,2004). Los datos recolectados sobre 10 vendedores asignados aleatoriamente entre 5
niveles de tratamientos (valores distintos del tiempo de capacitacion),
se ilustran en la Tabla
1. Los ajustes del modelo de RLS aparecen en la Tabla 2 y su ANOVA en la Tabla 3. Ver en
Figura 1 los datos junto con recta ajustada y medias de tratamiento.
1
0.50
42.50
2
0.50
50.60
3
1.00
68.50
4
1.00
80.70
5
1.50
89.00
6
1.50
99.60
7
2.00
105.30
8
2.00
111.80
9
2.50
112.30
10
2.50
125.70
Observaciones
media tratamiento
80
40
60
desempeo
100
120
Tabla 1:
0.5
1.0
1.5
2.0
2.5
No.dias
vendedores
Tabla 2: Modelos ajustado experimento capacitacion
Parametro
Estimacion
Error estandar
T0
Pr(|t8 | > |T0 |)
0
34.9450
5.9477
5.88
0.0004
35.7700
3.5866
9.97
0.0000
1
Tabla 3:
Fuente
No.dias
Error
1
0
1
2
Residuos estudentizados
50
60
70
80
90
100
110
120
1
0
1
2
Residuos estudentizados
desempeo ajustado
0.5
1.0
1.5
2.0
2.5
No. das
Normal QQ Plot
0
2
Sample Quantiles
statistic
0.933870468059182
p.value
0.487022457826849
method
ShapiroWilk normality test
data.name
rstudent(mod1)
1.5
1.0
0.5
0.0
0.5
1.0
1.5
Theoretical Quantiles
Para el test de carencia de ajuste, se ajusta inicialmente el modelos lineal general Yij =
i + Eij . La ANOVA de este modelo se muestra en la Tabla 4. La ANOVA para el test de
carencia de ajuste se muestra en la Tabla 5.
Tabla 4:
Tabla 5:
Codigo
R 1.1.
ejemplo1=data.frame(matrix(scan(),ncol=2,byrow=T))
0.5 42.5
0.5 50.6
1.0 68.5
1.0 80.7
1.5 89.0
1.5 99.6
2.0 105.3
2.0 111.8
2.5 112.3
2.5 125.7
names(ejemplo1)=c("No.dias","desempe
no")
attach(ejemplo1)
mod1=lm(desempe
noNo.dias)
summary(mod1)
anova(mod1)
mediasy.i=sapply(split(desempe
no,as.factor(No.dias)),mean) #medias de Y en cada tratamiento
#Gr
afica datos con recta ajustada e indicaci
on de medias observadas
#en cada nivel de tratamiento
plot(No.dias,desempe
no,cex=2)
abline(mod1,lwd=2,col=2)
lines(c(0.5,1,1.5,2,2.5),mediasy.i,lty=2,col=4)
points(c(0.5,1,1.5,2,2.5),mediasy.i,pch=3,col=4)
legend("topleft",legend=c("Observaciones","media tratamiento"),col=c(1,4),pch=c(1,3))
#Gr
afica de residuos estudentizados
layout(rbind(c(0,1,1,0),c(0,2,2,0)))
plot(fitted(mod1),rstudent(mod1),ylab="Residuos estudentizados",xlab="desempe
no ajustado",cex=2,ylim=c(-2.5,2.5))
abline(h=c(-2,0,2),col=2)
plot(No.dias,rstudent(mod1),ylab="Residuos estudentizados",xlab="No. d
as",cex=2,ylim=c(-2.5,2.5))
abline(h=c(-2,0,2),col=2)
test1=shapiro.test(rstudent(mod1)) #Test de normalidad sobre residuales estudentizados
#Gr
afico de normalidad con informaci
on del test Shapiro
qqnorm(rstudent(mod1),cex=1.5)
qqline(rstudent(mod1),lty=2,lwd=2,col=2)
legend("topleft",legend=rbind(names(test1),test1),cex=0.8)
mod.aux=lm(desempe
noas.factor(No.dias))#ajuste modelo lineal general
anova(mod.aux)
#test de carencia de ajuste
anova(mod1,mod.aux)
detach(ejemplo1)
2. Ejemplo 2
Los siguientes datos se recolectaron con el fin de determinar la relacion
existente entre el
peso corporal del ganado vacuno (X) y la rapidez de eliminacion
metabolica/peso
corporal (Y ).
Los datos que aparecen en la Tabla 6 son el resultado de varias realizaciones del experimento,
en distintos niveles del peso. Observe que la variable explicatoria fue observada en cuatro
niveles: 110, 230, 360 y 505, es decir, tenemos replicas de la variable respuesta en al menos
un nivel de X.
Los ajustes del modelo de RLS aparecen en la Tabla 7 y su ANOVA en la Tabla 8. En la
Figura 4 se muestran los datos, la recta ajustada y las medias por nivel de tratamiento.
Tabla 6:
240
160
100
120
140
rapid.elim
180
200
220
Observaciones
media tratamiento
100
200
300
400
500
peso.corp
Estimacion
Error estandar
T0
Pr(|t12 | > |T0 |)
0
212.7209
15.7841
13.48
0.0000
-0.2355
0.0449
-5.25
0.0002
1
Tabla 8:
Fuente
peso.corp
Error
Df
1
12
1
0
1
3
Residuos estudentizados
100
120
140
160
180
1
0
1
3
Residuos estudentizados
100
200
300
400
500
Peso corporal
Normal QQ Plot
1
0
1
Sample Quantiles
statistic
0.952640455984604
p.value
0.602401838080914
method
ShapiroWilk normality test
data.name
rstudent(mod2)
Theoretical Quantiles
Para el test de carencia de ajuste, se ajusta inicialmente el modelos lineal general Yij =
i + Eij . La ANOVA de este modelo se muestra en la Tabla 9. La ANOVA para el test de
carencia de ajuste se muestra en la Tabla 10.
Tabla 9:
Fuente
peso corp
Error(puro)
Tabla 10:
Fuente
Error(RLS)
Error(puro)
Codigo
R 2.1.
ejemplo2=data.frame(matrix(scan(),ncol=2,byrow=T))
110 235
110 198
110 173
230 174
230 149
230 124
360 115
360 130
360 102
360
505
505
505
505
95
122
112
98
96
names(ejemplo2)=c("peso.corp","rapid.elim")
attach(ejemplo2)
mod2=lm(rapid.elimpeso.corp)
summary(mod2)
anova(mod2)
#C
alculo de medias por tratamiento
medias2y.i=sapply(split(rapid.elim,as.factor(peso.corp)),mean) #medias de Y en cada tratamiento
#Graficando los datos, recta ajustada y se
nalando las medias de tratamiento
plot(peso.corp,rapid.elim,cex=2)
abline(mod2,lwd=2,col=2)
lines(c(110,230,360,505),medias2y.i,lty=2,col=4)
points(c(110,230,360,505),medias2y.i,pch=3,col=4)
legend("topright",legend=c("Observaciones","media tratamiento"),col=c(1,4),pch=c(1,3))
#Gr
aficos de residuales estudentizados
layout(rbind(c(0,1,1,0),c(0,2,2,0)))
plot(fitted(mod2),rstudent(mod2),ylab="Residuos estudentizados",xlab="rapidez de eliminaci
on ajustada",cex=2,ylim=c(-3,3))
abline(h=c(-2,0,2),col=2)
plot(peso.corp,rstudent(mod2),ylab="Residuos estudentizados",xlab="Peso corporal",cex=2,ylim=c(-3,3))
abline(h=c(-2,0,2),col=2)
test2=shapiro.test(rstudent(mod2)) #Test de normalidad sobre residuales estudentizados
#Gr
afico de normalidad con informaci
on del test Shapiro
qqnorm(rstudent(mod2),cex=1.5)
qqline(rstudent(mod2),lty=2,lwd=2,col=2)
legend("topleft",legend=rbind(names(test2),test2),cex=0.8)
mod2.aux=lm(rapid.elimas.factor(peso.corp))#ajuste modelo lineal general
anova(mod2.aux)
#test de carencia de ajuste
anova(mod2,mod2.aux)
detach(ejemplo2)
apropiada, bien sea sobre la respuesta y/o el predictor que corrija la no linealidad al mismo
tiempo que la varianza no constante. Estos modelos son:
i.i.d
i.i.d
NOTA: Tenga presente que para el punto 3. debe primero producir las estimaciones y predicciones en la escala del respectivo modelo y luego destranformar estos resultados, caso que la
variable respuesta en el mejor modelo haya sido transformada.
10