You are on page 1of 9

Corporación Universitaria Minuto de Dios UNIMINUTO

UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS


MATERIA: Estadı́stica Descriptiva Modalidad distancia

ACTIVIDAD VIRTUAL SEMANA 5

Indicaciones generales:
• Formato de entrega: Se debe entregar en forma individual o grupal, según lo indique el docente.
• Se debe anexar como solución un formato .pdf LEGIBLE
• Si alguna de las condiciones de entrega no se cumple, la nota correspondiente de la actividad será 0,0.
• Se recomienda realizar el envı́o de la actividad con suficiente tiempo de anterioridad con el fin de evitar dificultades en el envı́o.

Esta actividad corresponde al trabajo que se debe desarrollar de forma autónoma durante la semana, en la
sesión del dı́a sábado se resolverán dudas y se realizará una evaluación. La nota de la semana corresponde a la
nota de esta actividad y a la evaluación de acuerdo con los porcentajes definidos en los lineamientos del Curso.
Realice una lectura completa de la actividad y siga las indicaciones.

1. OBJETIVOS
Calcular e interpretar el grado de relación lineal que hay entre dos variables cualitativas.

Ajustar una de regresión (la recta que mejor se ajusta a la nube de puntos) y hacer pronósticos a partir de
ella.

2. TEMAS A DESARROLLAR DURANTE LA SEMANA


Coeficiente de correlación de Pearson.

Recta de regresión

3. INTRODUCCIÓN
En esta guı́a se abordará lo referente a la medición de la relación que existe entre variables cuantitativas. Es muy
común que las personas tomen decisiones en la vida cotidiana y profesional basadas en predicciones de sucesos
futuros. Para hacerlo, se fundamentan en la relación intuitiva y calculada entre lo que ya se sabe y lo que se
debe estimar. Si se dieran cuenta de que se puede determinar cómo lo conocido se relaciona con un evento futuro,
facilitarı́an el proceso de toma de decisiones.

Por ejemplo, se sabe que existe una relación entre la frustración y la agresión, entre la presión arterial y un
accidente cerebro-vascular, entre la obesidad y la diabetes; en los tres casos hay una relación entre dos variables,
pero no conocemos la naturaleza y fuerza de la misma. En esta guı́a se estudiará, paso a paso, un método estadı́stico
que se denomina análisis de regresión, que tiene entre sus objetivos establecer una ecuación que permita estimar
el valor desconocido de una variable a partir del valor conocido de otra.

4. Correlación entre dos variables y recta de regresión


4.1. Análisis según variable:
Antes de definir nuevos conceptos, es conveniente recordar como se debe realizar el análisis de una o más variable
dependiendo su naturaleza. La siguiente tabla muestra posibles opciones de análisis, según el tipo de variables
(cuantitativas o cualitativas) que surgen como resultado de un estudio.

1
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia

Situación Herramientas de Análisis


Una variable Tabla de Distribuciones de frecuencia
cualitativa Diagramas de Barra, Torta e Histogramas
Tabla Resumen (promedio, desviación estándar, dato mı́nimo,
Una variable dato máximo, Q1, Q2, Q3)
cuantitativa Box-Plot (Diagrama de caja y bigotes), diagrama de tallo y hojas.
Tabla de Contingencia, Tabla de porcentajes totales
Dos variables Tabla de porcentajes marginales
cualitativas Diagramas de Barras
Tabla Resumen (promedio, desviación estándar, dato mı́nimo,
dato máximo, Q1, Q2, Q3)
Una variable Box-Plot (Diagrama de caja y bigotes), diagrama de tallo y hojas
cualitativa y una Nota: Primero se debe clasificar los datos con base en la variable
cuantitativa cualitativa.
Dos variables
Regresión: Lineal, exponencial, parabólica y múltiple
cuantitativas

4.2. Medidas de Correlación.


El análisis de la correlación es apropiado cuando se necesita conocer el grado de asociación entre dos variables.
Las definiciones que a continuación abordaremos nos conducirán a definir una forma adecuada de medir el grado
de asociación lineal entre dos variables. El siguiente ejemplo servirá de apoyo en esta tarea:

Ejemplo La siguiente tabla indica las notas obtenidas por 11 alumnos de la Uniminuto Soacha en las materias
de Fundamentos de Matemática y Estadı́stica Descriptiva.

Fundamentos de Estadı́stica
Alumno Matemática Descriptiva
x y
1 48 56
2 53 64
3 77 82
4 44 67
5 69 85
6 79 86
7 84 93
8 68 76
9 61 58
10 55 45
11 64 72

Diagrama de Dispersión(Nube de puntos): Llamaremos nube de puntos a la siguiente gráfica. Los puntos
en ella representan los datos de cada estudiante, la primera componente del punto (la componente en x) es nota
la materia de Fundamentos de Matemática, mientras que la segunda componente (la componente en y) es la
nota estadı́stica Descriptiva. Por ejemplo, el primer punto situado del lado izquierdo de la gráfica es (44, 67) que
corresponde a la información para el estudiante 4, pintada en azul en la anterior tabla.

2
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia

Correlación: La correlación es una forma de medir algún tipo de relación entre dos variables, este tipo de medidas
surge cuando vemos que valores mayores de una variable van de manera consistente con valores mayores de la otra,
o cuando valores grandes de una variable corresponden de forma consistente a valores menores de otra variable.
Nuestro propósito en esta guı́a es un modo de medir el grado de relación lineal entre dos variables.

Covarianza : Dadas variables cuantitativas X y Y , la covarianza nos indica si la relación entre las variables es
directa o inversa, pero no nos dice el grado de relación entre las variables. Esté parámetro, puede utilizarse para
medir la relación entre las variables solo si están expresadas en la misma escala o unidad de medida y se obtiene
a partir de la fórmula:
P
(xi − x̄)(yi − ȳ)
sxy =
n−1
Coeficiente de Correlación de Pearson: La correlación o grado de asociación (lineal) entre dos variables se
mide utilizando el coeficiente de correlación de Pearson. Este coeficiente mide le grado de asociación lineal
entre dos variables. Se denota como r, su valor fluctúa en el intervalo [−1, 1] y se calcula mediante la siguiente
expresión:
sxy
rxy =
sx · sy
Note que para efectuar esta cuenta es necesario hacer unos cálculos previos, la siguiente tabla nos muestra en
orden que cálculos se deben realizar para calcular el coeficiente de correlación de Pearson

Medida Fórmula
P
Promedio de la variable X = nxi
x̄ q
(xi−x̄)2
P
Desviación estándar de la X sx =
Pn−1
Promedio de la variable Y = nyi
ȳ q
(yi−ȳ)2
P
Desviación estándar de la Y sy = n−1
P
(xi − x̄)(yi − ȳ)
Covarianza sxy =
n−1
Cuadro 1: Calculo Coeficiente de Correlación.

Según el valor del coeficiente de correlación rxy se puede presentar las siguientes opciones:

3
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia

Si rxy es positivo, la relación lineal entre ambas variables es directa. Se dice que la correlación es positiva.

Si rxy es negativo, la relación lineal entre ambas variables es inversa. Se dice que la correlación es negativa.

Si rxy = 0, no existe relación lineal entre las variables. Se dice que la correlación es nula.

Si rxy = 1, existe una relación de dependencia total directa entr las variables, es decir, si una de ellas aumenta
(disminuye), la otra aumenta (o disminuye) en igual proporción.

Si rxy = −1, existe relación de dependencia total inversa entre las variables, es decir, si una de ellas aumenta
(o disminuye), la otra disminuye (o aumenta) en igual proporción.

La siguiente tabla resume, según el coeficiente hallado, el grado de relación lineal entre un par de variables x y y.

Rango Relación Lineal


±0,96 ±1,0 Perfecta
±0,85 ±0,95 Fuerte
±0,70 ±0,84 Significativa
±0,50 ±0,69 Moderada
±0,20 ±0,49 Débil
±0,10 ±0,19 Muy Débil
±0,09 ±0,0 Nula

Retomando nuestro ejemplo sobre las notas de 10 estudiantes en las materias de Fundamentos de Matemática y
Estadı́stica Descriptiva, vamos a calcular el grado de relación lineal que existe entre estas dos variables.

Para calcular el coeficiente de correlación es común construir una tabla como la siguiente, esta nos permitirá hallar
los promedios, las desviaciones estándar y la covarianza de las variables aleatorias X y Y . Para mostrar como
es su construcción podemos ver el renglón coloreado en azul; en este renglón consideramos las notas del cuarto
estudiante en las dos materias (44 y 67 respectivamente) y realizamos algunas cuentas a partir de ellas.

Lo primero que se hace es calcular el promedio de las notas de Fundamentos de Matemática x̄ y Estadı́stica
Descriptiva ȳ
P
xi 702
x̄ = = = 63,8
n 11
P
yi 784
ȳ = = = 71,2
n 11

4
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia

A continuación, restamos de x4 = 44 el promedio de notas de Fundamentos de Matemáticas y de y4 = 67 el


promedio de las notas de Estadı́stica Descriptiva:

(x4 − x̄) = 44 − 63,8 = −19,8


(y4 − ȳ) = 67 − 71,2,8 = −4,3

A continuación se multiplican las dos últimos valores hallados:

(x4 − x̄)(y4 − ȳ) = (−19,8)(˙ − 4,3) = 84,6

por último, las cantidades del primer item se elevan al cuadrado:

(x4 − x̄)2 = (−19,8)2 = 392,8

(y4 − ȳ)2 = (−4,3)2 = 18,2

Fundamentos Descriptiva
(xi − x̄) (yi − ȳ) (xi − x̄)(yi − ȳ) (xi − x̄)2 (yi − ȳ)2
x y
48 56 -15.8 -15.3 241.6 250.3 233.2
53 64 -10.8 -7.3 78.7 117.1 52.9
77 82 13.2 10.7 141.4 173.7 115.1
44 67 -19.8 -4.3 84.6 392.8 18.2
69 85 5.2 13.7 71.1 26.8 188.5
79 86 15.2 14.7 223.6 230.4 217.0
84 93 20.2 21.7 438.5 407.2 472.2
68 76 4.2 4.7 19.8 17.5 22.4
61 58 -2.8 -13.3 37.4 8.0 176.1
55 45 -8.8 -26.3 231.7 77.8 690.1
64 72 0.2 0.7 0.1 0.0 0.5
702 784 0.0 0.0 1568.6 1701.6 2186.2

Las sumas de algunas de las columnas de esta tabla facilitan el cálculo de los promedios, las desviaciones estándar
y la covarianza de las variables aleatorias X y Y :

Se calcula ahora las desviaciones estándar sx y sy :


r
1701,6 p
qP
(xi −x̄)2
sx = n−1 = = 170,6 = 13,04
10
r
2186,2 p
qP
(yi −ȳ)2
sy = n−1 = = 218,6 = 14,78
10
La covarianza entre las notas de Fundamentos de Matemáticas y Estadı́stica descriptiva está dada por:
P
(xi − x̄)(yi − ȳ) 1568,6
sxy = = = 156,86
n−1 10
Como la covarianza resultante es positiva, se concluye que la relación entre las notas de estas materias es
directa.

5
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia

Por último, se puede calcular el grado de relación lineal que hay entre estas variables a través del coeficiente
de correlación de Pearson:

sxy 156,86
rxy = = = 0,81
sx · sy 13,04 · 14,78

Este valor indica una relación significativa entre las dos variables.

4.3. Recta de Regresión


Cuando la relación lineal entre dos variables es buena, podemos intentar predecir el valor de una de estas en
términos de la otra. La variable que desea predecir se denomina variable dependiente, mientras que la variable
que se usa para predecir el valor de la otra variable se denomina variable independiente. para hacer predicciones
construiremos la recta que mejor se ajusta, esto es, la lı́nea recta que es la mejor aproximación del conjunto de
datos dado; cuya ecuación está dada por:

yb = a + bx
Donde:

La pendiente b de la recta está dada por:


sxy
b=
s2x

Él intercepto a con el eje y está dado por:


a = ȳ − bx̄

A continuación se calcula la ecuación de la recta de regresión para los datos del ejemplo, es decir, se hallan la
pendiente b y el punto de corte a

Pendiente:
sxy 156,86
b= 2
= = 0,92
sx 170,6

Intercepto:
a = ȳ − bx̄ = 71,2 − 0,92 · 63,8 = 12,5

6
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia

De esta manera, la ecuación de la recta de regresión es:

yb = 12,5 + 0,92x

A través de esta ecuación se puede hacer predicciones, por ejemplo, si un alumno saca 50 en Fundamentos de
Matemáticas, se podrı́a cuestionarse, ¿cuánto se espera que saque en Estadı́stica Descriptiva?. En este caso, se
reemplaza x = 50 en la ecuación de la recta hallada, y obtenemos 12,5 + 0,92 · 50 = 58,5, que es la nota esperada
para este estudiante en Estadı́stica descriptiva.
Observaciones:

1. Es común en la literatura de esta materia calcular las medidas antes expuestas (desviación estándar, cova-
rianza, coeficientes de la recta de regresión) de diversas formas.

2. Es aconsejable hacer predicciones solo dentro del rango de los valores de X observados. Por regla general,
no se extrapola sus valores fuera de este rango.

5. MATERIAL DE APOYO
5.1. Lecturas complementarias
Lectura 1: Regresión Simple.

Lectura 3: Modelo de Regresión Lineal Simple/Correlación y regresión lineal simple.

5.2. Vı́deos
Video 1: Recta de regresión lineal

Video 2: Modelo de Regresión Lineal Simple/Interpretación de los Coeficientes.

Video 3: Error Estándar de Estimación.

5.3. Libro Guı́a


Como material de apoyo se propone el capı́tulo 1 del libro Probabilidad y Estadı́stica de Elena Oteyza de la
editorial Pearson páginas 1 a la 22.
Para acceder al material de apoyo realice los siguientes pasos:

Paso 1: Ingrese a la biblioteca virtual http://biblioteca.uniminuto.edu/

Paso 2: Haga click en la pestaña libros Electrónicos

Paso 3: Seleccione la editorial del libro que desea

Paso 4: Ingrese el correo @uniminuto.edu.co y la clave

Paso 5: En buscador escriba el nombre del curso o del libro que desea. Luego presione buscar.

5.4. Aplicaciones
Calculadora de Regresion lineal simple

7
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia

6. ACTIVIDAD
La presente actividad está compuesta de tres ı́tems y cada uno de estos tiene un valor porcentual sobre la nota
final del taller, dicho porcentaje está dividido de la siguiente forma: la primera parte tiene un valor porcentual del
40 %, la segunda de un 10 % y la parte final de un 50 %.

Parte 1 Pregunte al menos a 10 familiares cercanos por su estatura (medida en centı́metros) y su peso
(medido en kg):

1. construya una tabla con la información extraı́da.


2. Identifique que tipo de relación hay entre las dos variables

Parte 2 Haga un pequeño informe con lo hecho en la parte 1. Este informe debe complementarse con lo
aprendido en los anteriores talleres, no olvide usar gráficas y medidas estadı́sticas para analizar cada variable
por separado y en conjunto.

Parte 3 (Valor 50 %) Resolver los siguientes ejercicios:

1. Un psicólogo desea predecir el tiempo que lleva completar una tarea (en minutos) en función del nivel de
alcohol consumido (en ml) durante las horas anteriores. Los siguientes datos se obtienen para una muestra
de n = 5 jóvenes universitarios.

Universitario 1 2 3 4 5
Nivel-Alcohol 55 30 85 140 115
Tiempo 3 2 5 7 8

a) Graficar el diagrama de dispersión.


b) ¿Qué tipo de relación hay entre las variables Nivel de Alcohol y Tiempo que lleva completar
una tarea?
c) Encuentre la recta de regresión.
d ) Prediga el tiempo necesario para completar la tarea si el consumo de alcohol es i.) 30mls, ii.) 130mls

2. Una forma de medir que tan bueno resulta ser el ajuste que proporciona la recta de regresión es el Error
Estándar de Estimación. Tome los datos de punto anterior, vea el video Error Estándar de Estimación

3. Un profesor desea determinar los efectos de ver televisión en los resultados de un examen, para esto toma
siguientes datos, que representan la cantidad de horas que 12 estudiantes vieron televisión durante el fin de
semana y las calificaciones que cada unos de ellos tuvo en una prueba el lunes siguiente.

Estudiante 1 2 3 4 5 6 7 8 9 10 11 12
Horas TV 0 1 2 3 3 5 5 5 6 7 7 10
Notas 96 85 82 74 95 68 76 84 58 65 75 50

a) Graficar el diagrama de dispersión.


b) ¿Qué tipo de relación hay entre las variables?
c) Encuentre la recta de regresión.
d ) Predecir la puntuación de la prueba para un estudiante que ve i.) 3, ii.) 7 horas de televisión.

8
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia

4. Se ha construido una recta de regresión que relaciona linealmente la calificación recibida en un examen
(medida en puntos porcentuales) (Y) es términos del porcentaje de asistencia (X) para 22 estu-
diantes en un curso de Estadı́stica Descriptiva de la Unimininuto. Si la intercepto con el eje y es b = 39,39
y la pendiente está dada por 0, 341 ¿cuál de las siguientes afirmaciones es correcta?, justifique.

a) Si la asistencia aumenta en un 0, 341 %, la puntuación media estimada recibida aumentará en 1 punto


porcentual.
b) Si la asistencia aumenta en un 1 %, la nota media estimada recibida aumentará en 39,39 puntos por-
centuales.
c) Si la asistencia aumenta en un 1 %, la nota media estimada recibida aumentará en 0, 341 puntos por-
centuales.
d ) Si la puntuación recibida aumenta en un 39, 39 %, el promedio estimado la asistencia aumentará en un
1 %.

7. BIBLIOGRAFÍA
Martı́nez, C. (2012). Estadı́stica y Muestreo. Bogotá: Ecoe Ediciones.

Martı́nez. C.(2000). Estadı́stica Básica Aplicada. Bogotá: Ecoe Ediciones.

You might also like