You are on page 1of 8

Gua Modelo de regresin lineal en R.

(nota: los textos en azul son los comandos para usar en R, los valores en la base de
datos el decimal debe estar separado con puntos y no utilizar separador de miles).
ibreras en R.
Las libreras son funciones o paquetes preprogramados que tienen diversas utilidades. Para
cargar una librera aplique:
library(!ombre de la librera)
"reacin de ob#etos:
Para crear objetos en R utilice la flecha <-
Ejemplo:
<-!
El objeto es el n"mero escalar !.
Los objetos pueden ser: escalares# matrices# vectores# bases de datos# modelos corridos# etc.
Para limpiar la consola utilice el comando $%&RL ' L(
$mportacin de datos:
Para facilitar la importaci)n de datos e*ternos de otros programas como E*cel# debe guardar el
archivo con formatos como: cvs# csv!# t*t. +i se tiene m,s de una hoja en el libro# se debe hacer
un archivo por cada hoja.
R trabaja sobre un directorio de trabajo o archivo. Para facilitar la lectura de datos e*ternos# se
deben guardar dichos datos en la carpeta o directorio de trabajo sobre el que est- trabajando R.
Para saber el directorio de trabajo sobre el cual est, R# aplique el siguiente comando get.d$(.
Ejemplo:
get.d$(
/01sers0213/
La salida entregada por R /01sers0213/ indica que el directorio actual sobre el que est,
trabajando R es la carpeta 42135 que a su ve6 est, dentro de la carpeta 41sers5.
Para cambiar el directorio utilice el comando set.d$( especificando entre los par-ntesis la
tra7ectoria de la carpeta que se quiere establecer como directorio de trabajo.
Ejemplo:
setwd("C:/JUAN/ensayo")
%#emplo de Regresin lineal.
+e quiere calibrar el modelo del %P8 para una acci)n. +e requiere una serie de precios de una
acci)n 7 de un ndice.
9. Elija el directorio de trabajo utili6ando el comando set.d$( o mediante el siguiente
procedimiento:
:r al men" 4rchivo5 7 elija el directorio de trabajo
3ota: %ambiar dir;.. <ace lo mismo que el comando set.d$(
!. =uarde el archivo de E*cel en formato t*t con separador de tabulaciones con el siguiente
nombre: datos"&'M.txt, en el directorio de trabajo que eligi).
>. %argue en el directorio de trabajo la base de datos para el ejercicio como un
objeto.
?atos<-read.table$/datos%P8.t*t/#sep@/At/#header@&R1E(
Read table: es el comando
datos%P8.t*t: es el nombre del archivo.
sep@/At/: indica que las columnas est,n separadas por tabulaciones.
header@&R1E: :ndica que las columnas tienen encabe6ados.
B. +eparar las variables como objeto para una ma7or facilidad# es decir# crean objetos
en R de cada una de las variables que se quieren anali6ar.
Para el ejemplo.
Rendimientos de la acci)n ll,melo Rtos# 7 los rendimientos del +t,ndar C Poors
ll,melo R&D+8
Rtos<- ?atosERPR
Rtos8 <-?atosER+FP
Puede consultar la longitud de cada vector con el comando length
length $Rtos(
length $Rtos8(
G. =r,fico de dispersi)n de las series. El comando plot hace una gr,fica de
dispersi)n de Rtos8 vs Rtos. Para que este grafico quede guardado en el
directorio de trabajo# anteponga el comando jpeg al comando plot 7 luego aplique el
comando dev.off
jpeg$/grafica de dispersi)n Rtos8 Hs Rtos/(
plot $Rtos#Rtos8(
dev.off$(
I. Llame un objeto 4reglineal5 sobre el cual podr, reali6ar la regresi)n lineal. La
variable dependiente ser, Rtos 7 la variable independiente ser, Rtos8
reglineal <- lm $RtosJ Rtos8(
K. hora imprima los resultados de la regression 7 formule el modelo
summar7$reglineal(

L. =enere un objeto para los residuos de la regresi)n con el comando resid.
errores <- resid $reglineal(
jpeg$/residuos/(
plot$errores(
dev.off$(
M. Puede generar el histograma de cualquier variable# h,galo para la variable
4errores5 7 agr-guele la curva de la normal
hist$errores(
curve$dnorm$*#mean@mean$*(#sd@sd$*((#lt7@!N#add@&(
9N. Es el momento de hacer la evaluaci)n para los residuales# entonces se reali6ar, la
prueba de normalidad# la prueba de homocedasticidad 7 la prueba de
independencia.
hora para desarrollar estas pruebas R necesita unas libreras las cuales son:
6oo
lmtest
tseries
+i el programa R no tiene cargadas estas libreras le pedir, que las cargue# de lo contrario
ejecutar, normalmente el c)digo. Las libreras se utili6an es para e*tender la
funcionalidad de R como tal.
El primer paso es ir a la ventana de R donde se encuentran las opciones de R 7
seleccionamos la opci)n 4Paquetes5. Luego de esto se selecciona la opci)n 4+eleccionar
espejo %R35 all ha7 un listado de varios pases 7 seleccionar para este caso el de
%olombia# los paquetes est,n disponibles por ciudad 7 se puede escoger 4%ali5 o 4Oogota5
7 7a luego se dirige a la opci)n 4Paquetes# :nstalar paquetes5 donde encontrar, un listado
de libreras# en este caso seleccionar las que va7a necesitando por ejemplo 46oo5 7 luego
digitar el comando librar7 $6oo( para comen6ar a utili6ar# le saldr, un mensaje de
confirmaci)n que 7a est, cargada.

99. Prueba de normalidad# se utili6ar,n dos formas de probar normalidad. Para ambas
pruebas la hip)tesis es la misma.
La hip)tesis se plantea como:
<o: Los datos siguen una distribuci)n normal
<a: Los datos no siguen una distribuci)n normal
99.9Prueba de normalidad 2arque Oera
%argue la librera 4tseries5 7 luego ejecute el comando para obtener el estadstico de la prueba
2arque Oera
librar7$tseries(
jarque.bera.test$RE+:?1D+(
%omo los el p-value es N.NNNNNNNNI>> que es menor que una significancia del GP podemos
concluir que los datos no siguen una distribuci)n normal.
99.!Prueba de normalidad de +hapiro QilR la cual organi6a los datos de menor a ma7or 7
hace la comparaci)n con datos estadsticos que siguen una distribuci)n normal utili6ando
mnimos cuadrados. La prueba de hip)tesis planteada es la misma que la prueba de
2arque Oera 7 se eval"a con el p-value
shapiro.test$RE+:?1D+(
Hemos para la prueba que el p-value es menor que GP# se evidencia que la variable
4RE+:?1D+5 no sigue una distribuci)n normal# se recha6a <o.
9!. Prueba de independencia de ?urbin Qatson: utilice el comando d.test para probar
<o: los residuos son independientes
<a: los residuos no son independientes
d.test$reglineal(
print$/prueba de homocedasticidad de .hite/(
.h <- lm$erroresS! J :8% ' edad ' colesterol ' :8%S! ' edadS! ' colesterolS! ' :8%Tedad '
:8%Tcolesterol ' colesterolTedad(
.h <- lm$erroresS! J F ' U! ' U> ' UB ' UG ' FS! ' U!S! ' U>S! ' UBS! ' UGS! ' F TU! ' FTU>
' FTUB ' FTUG(
erroresQ <- residuals$.h(
Rcuadrado.hite<- r+quared$erroresS!#erroresQ(
print$/Rcuadrado .hite/(
print$Rcuadrado.hite(
print$/estadistico calculado/(
. <- Rcuadado.hiteTlength$Rtos(
print$.(
valorP <- 9 - pchisq$.#!( Vojo el ! es el n"mero de parametros /
print$/valor P/(
print$valorP(

You might also like