Professional Documents
Culture Documents
Práctica Regresión Lineal (Fon y Garro)
Práctica Regresión Lineal (Fon y Garro)
Práctica 1.-
Un investigador quiere estudiar las relaciones entre las ventas de electrodomésticos, el
descuento que realiza, la inversión publicitaria y el número de tiendas. Para ello, se han
recogido datos de 20 empresas en relación a 4 variables:
La diagonal de la matriz de correlaciones índica la relación de una variable consigo misma, por
lo que esta relación es perfecta (perfecta = 1)
Debemos de ir a la tabla de correlaciones y ver cuál de ellas tiene una significación menor de
0,05. Mínimo habrá dos (pero es la correlación entre ambas y es sólo se cuenta como una). En
este caso, vemos que El número de tiendas y las ventas tienen una significación de 0,013 y por
lo tanto es la única significativa. También indicamos su correlación. Para ello miramos en la
correlación de Pearson de ese valor. Rxy = 0,546.
Para hacer esto, debemos colocar en un eje una variable, y en otro eje otra variable. Y luego ir
viendo los valores que toma cada sujeto en esas dos variables y donde se crucen, se traza un
punto. Al final nos queda una nube de puntos (tantos puntos como sujetos). Finalmente,
trazamos una línea desde el vértice de la gráfica que haga un ángulo de 45º por arriba y 45º
por debajo, y nuestro gráfico ya está.
6) Especifica el modelo inicial que explicaría las ventas (VD) a partir del descuento, la
inversión publicitaria y el número de tiendas (VI’s)
Se introduce primero la variable con más peso, después la segunda con más correlación
parcial, y así sucesivamente.
Para esta pregunta tenemos que ir a la tabla de Model Sumary, y ver el número de Model.
Vemos que sólo hay 1, que introdujo la variable número de tiendas.
Esta pregunta es fija que caiga. Se inicia viendo la tabla Model Summary. En ella vemos R, que
es el valor de Pearson: 0,546. Los valores de bondad de ajuste vienen a continuación.
Anotamos el de R2, que aparecerá como R Square: 0,298. Anotamos el R Square corregida, que
es 0,259. Y para ver qué % de varianza explica pasamos la R2 corregida a %, en este caso 25,9%.
Decimos que la interpretación sería: el modelo explica el 25,9% de la varianza.
Cómo sólo hubo un paso, e incluyó una única variable, el modelo quedaría: Y = a+b1x1.
12) ¿Cuáles son los mejores predictores (betas) y que peso tienen? ¿qué significan?
Los mejores predictores siempre son β. Ver sus valores, tenemos que ir a la tabla coeficientes.
En este coeficiente vemos el valor de las β. En este caso sólo hay una, ya que nuestro modelo
sólo posee una. Indicamos su valor (el valor de número de tiendas, no la constante), que es
0,546.
Para ver qué significan habría que ir a las b. En ella vemos que el valor es 1,978. Esto significa
que por cada tienda nueva que se abra aumentará 1,978 las ventas.
Sería sustituir la a y la b1 por los valores de la tabla de coeficientes. Vamos a la columna de las
b y tenemos que el modelo quedaría así:
14) Según lo analizado hasta ahora, para una cadena de 100 tiendas ¿Cuántos
electrodomésticos se venderán y cuál será el error de predicción?
Es hacer una simulación, únicamente sería cambiar x1 (la variable de número de tiendas, por el
valor dado). En este caso el modelo sería:
Y= -8,352 + 1,978*100
Para calcular el error estimado vamos a la matriz de datos y buscamos un valor en el que el
número de tiendas sea 100. En el 9 dato de la columna V3 tenemos ese valor, y nos dice que
V4, o Y es 110.
Con esto utilizamos la siguiente fórmula:
Práctica 2
Lo que difiere de la práctica uno a la práctica dos, es que en la uno había un único modelo. En
la dos veremos cómo puede haber varios modelos.
V1: memoria
V2: atención
V3: motivación
V4: ingresos económicos
V5: rendimiento
La VD es el rendimiento, y las VI’s son la memoria, atención, motivación, ingresos
económicos…
Vamos a la tabla de variables entered y vemos que han entrado dos variables, la variable
motivación y la de ingresos, por lo que ha habido dos pasos. Para ver su significación vamos a
la tabla ANOVA, y vemos en la columna de significación que ambas son menores de 0,05. El
programa dice que su significación es 0,000. Nunca se pone eso. Se dice: su significación es
menor de 0,001.
Esto se consigue con la diferencia entre: la varianza explicada del modelo 1 y la del modelo 2.
Seguimos en la Tabla de Model Summary. La R2 ajustada del modelo 1 es 0,502 que es 50,2%
de varianza explicada y la del modelo 2 es 63,2%.
La diferencia entre ambos es de 13%, por lo que ganamos una capacidad predictiva del 13%.
Nos dirigimos a la tabla de coeficientes. Los mejores predictores siempre son los β. Cogemos
los valores del modelo 2 (siempre del modelo mayor) Esto es, que la β de motivación es 0,55 y
la de ingresos es 0,417. Lo indicamos en el ejercicio
Tenemos que sólo hay dos variables, por lo que el modelo sería Y = a + b1x1 + b2x2.