You are on page 1of 7

Práctica regresión lineal

Práctica 1.-
Un investigador quiere estudiar las relaciones entre las ventas de electrodomésticos, el
descuento que realiza, la inversión publicitaria y el número de tiendas. Para ello, se han
recogido datos de 20 empresas en relación a 4 variables:

V1. Descuento (porcentaje de descuento realizado sobre el producto)

V2. Inversión en publicidad (en miles de euros)

V3. Número de tiendas

V4. Número de ventas (en el último año)


Con el enunciamos deducimos que la VD es el número de ventas, y las VI’s son el descuento, la
inversión en publicidad y el número de tiendas.

1) Explica la razón de que la diagonal de la matriz de correlaciones sea igual a 1.

La diagonal de la matriz de correlaciones índica la relación de una variable consigo misma, por
lo que esta relación es perfecta (perfecta = 1)

2) ¿Entre que valores oscila el coeficiente de correlación de Pearson? -1 y 1


3) ¿Entre qué variables existe relación estadísticamente significativa.

Debemos de ir a la tabla de correlaciones y ver cuál de ellas tiene una significación menor de
0,05. Mínimo habrá dos (pero es la correlación entre ambas y es sólo se cuenta como una). En
este caso, vemos que El número de tiendas y las ventas tienen una significación de 0,013 y por
lo tanto es la única significativa. También indicamos su correlación. Para ello miramos en la
correlación de Pearson de ese valor. Rxy = 0,546.

4) Intrepreta la relación anterior.

Debemos ver el signo de la correlación. Si es negativo será inversamente proporcional. Si es


positivo es directamente propocional. En este caso es una relación lineal directamente
proporcional significativa.
5) Dibuja un diagrama de dispersión entre estas dos variables (nº de tienda y nº de
ventas).

Para hacer esto, debemos colocar en un eje una variable, y en otro eje otra variable. Y luego ir
viendo los valores que toma cada sujeto en esas dos variables y donde se crucen, se traza un
punto. Al final nos queda una nube de puntos (tantos puntos como sujetos). Finalmente,
trazamos una línea desde el vértice de la gráfica que haga un ángulo de 45º por arriba y 45º
por debajo, y nuestro gráfico ya está.

6) Especifica el modelo inicial que explicaría las ventas (VD) a partir del descuento, la
inversión publicitaria y el número de tiendas (VI’s)

El modelo sería Y = a+b1x1 + b2x2+ b3x3.


En este modelo Y sería la variable dependiente, es el número de ventas.
La a sería la constante. Es el valor estimado de Y cuando x es 0
La b1,b2,b3 es la variación de y al aumentar x1,x2 y x3 en una unidad.
La x1,x2,x3 serían las variables independendientes: el descuento, la inversión publicitaria y el
número de tiendas.

7) ¿Cómo funciona el método Stepwise?

Se introduce primero la variable con más peso, después la segunda con más correlación
parcial, y así sucesivamente.

8) ¿Cuántos pasos a establecido el análisis?

Para esta pregunta tenemos que ir a la tabla de Model Sumary, y ver el número de Model.
Vemos que sólo hay 1, que introdujo la variable número de tiendas.

9) ¿Es estadísticamente significativo?


Para esta pregunta hay que irse a la tabla ANOVA u otra en la que aparezca en la columna F y
Sig. Iniciamos diciendo si es significativo o no. Para ello debe ser el valor que aparezca menor a
0,05. Y después indicamos el valor de la F. En este caso sería F = 7,632.

10) ¿Cuál es la bondad de ajuste del modelo (capacidad explicativa)?

Esta pregunta es fija que caiga. Se inicia viendo la tabla Model Summary. En ella vemos R, que
es el valor de Pearson: 0,546. Los valores de bondad de ajuste vienen a continuación.
Anotamos el de R2, que aparecerá como R Square: 0,298. Anotamos el R Square corregida, que
es 0,259. Y para ver qué % de varianza explica pasamos la R2 corregida a %, en este caso 25,9%.
Decimos que la interpretación sería: el modelo explica el 25,9% de la varianza.

11) Reespecifica el modelo basándote en el análisis realizado

Cómo sólo hubo un paso, e incluyó una única variable, el modelo quedaría: Y = a+b1x1.

Indicamos que Y es la VD (Número de ventas), a es la constante y que x1 es la VI número de


tiendas.

12) ¿Cuáles son los mejores predictores (betas) y que peso tienen? ¿qué significan?

Los mejores predictores siempre son β. Ver sus valores, tenemos que ir a la tabla coeficientes.
En este coeficiente vemos el valor de las β. En este caso sólo hay una, ya que nuestro modelo
sólo posee una. Indicamos su valor (el valor de número de tiendas, no la constante), que es
0,546.

Para ver qué significan habría que ir a las b. En ella vemos que el valor es 1,978. Esto significa
que por cada tienda nueva que se abra aumentará 1,978 las ventas.

13) Especifica el modelo de nuevo para construir la ecuación definitiva

Sería sustituir la a y la b1 por los valores de la tabla de coeficientes. Vamos a la columna de las
b y tenemos que el modelo quedaría así:

Y= -8,352 (sería a) + 1,978x1 (sería b y x1 es la variable número de tiendas)

14) Según lo analizado hasta ahora, para una cadena de 100 tiendas ¿Cuántos
electrodomésticos se venderán y cuál será el error de predicción?

Es hacer una simulación, únicamente sería cambiar x1 (la variable de número de tiendas, por el
valor dado). En este caso el modelo sería:

Y= -8,352 + 1,978*100

Finalmente nos da que Y es 189,44. Como no podemos vender parte de un electrodoméstico


aproximamos a 189.

Para calcular el error estimado vamos a la matriz de datos y buscamos un valor en el que el
número de tiendas sea 100. En el 9 dato de la columna V3 tenemos ese valor, y nos dice que
V4, o Y es 110.
Con esto utilizamos la siguiente fórmula:

Y-Y’ = error. 110 – 189 = -79. Ese es el error.

Práctica 2
Lo que difiere de la práctica uno a la práctica dos, es que en la uno había un único modelo. En
la dos veremos cómo puede haber varios modelos.

Se desea explicar el rendimiento académico de los estudiantes en función de su puntuación en


un test de memoria, otro de atención, otro de motivación y de los ingresos económicos de los
padres. Se dispone de la información de 20 sujetos en 5 variables:

V1: memoria
V2: atención
V3: motivación
V4: ingresos económicos
V5: rendimiento
La VD es el rendimiento, y las VI’s son la memoria, atención, motivación, ingresos
económicos…

1) Especifica el modelo para las variables de estudio

El modelo sería Y = a+b1x1 + b2x2+ b3x3+b4x4.


Indicamos los valores como en la práctica 1.

2) ¿Cuántos pasos presenta el método? Especifica su significación.

Vamos a la tabla de variables entered y vemos que han entrado dos variables, la variable
motivación y la de ingresos, por lo que ha habido dos pasos. Para ver su significación vamos a
la tabla ANOVA, y vemos en la columna de significación que ambas son menores de 0,05. El
programa dice que su significación es 0,000. Nunca se pone eso. Se dice: su significación es
menor de 0,001.

3) ¿Cuál es la bondad de ajuste del modelo?

Lo mismo que en la práctica 1. Tabla de Model Summary: R2 es R Square, recordemos. Siempre


cogemos el modelo 2 y sus valores, porque es modelo definitivo. R2 es 0,671. R2 ajustada sería
0,632 y el % de varianza explicada es 63,2%.

4) ¿Qué capacidad predictiva ganamos?

Esto se consigue con la diferencia entre: la varianza explicada del modelo 1 y la del modelo 2.
Seguimos en la Tabla de Model Summary. La R2 ajustada del modelo 1 es 0,502 que es 50,2%
de varianza explicada y la del modelo 2 es 63,2%.

La diferencia entre ambos es de 13%, por lo que ganamos una capacidad predictiva del 13%.

5) ¿Cuáles son los mejores predictores?

Nos dirigimos a la tabla de coeficientes. Los mejores predictores siempre son los β. Cogemos
los valores del modelo 2 (siempre del modelo mayor) Esto es, que la β de motivación es 0,55 y
la de ingresos es 0,417. Lo indicamos en el ejercicio

6) Reespecifica el modelo sustituyendo los parámetros calculados en el análisis

Es sustituir los parámetros de la ecuación por los valores de la tabla.

Tenemos que sólo hay dos variables, por lo que el modelo sería Y = a + b1x1 + b2x2.

Sustituimos a (constant en la tabla de coeficientes). Y también sustituimos b1 y b2 por los


valores que indica el modelo. Finalmente nos quedaría:
Y = -2,676 + 0,827x1 + 0,002x2

You might also like