Professional Documents
Culture Documents
Indicaciones generales:
• Formato de entrega: Se debe entregar en forma individual o grupal, según lo indique el docente.
• Se debe anexar como solución un formato .pdf LEGIBLE
• Si alguna de las condiciones de entrega no se cumple, la nota correspondiente de la actividad será 0,0.
• Se recomienda realizar el envı́o de la actividad con suficiente tiempo de anterioridad con el fin de evitar dificultades en el envı́o.
Esta actividad corresponde al trabajo que se debe desarrollar de forma autónoma durante la semana, en la
sesión del dı́a sábado se resolverán dudas y se realizará una evaluación. La nota de la semana corresponde a la
nota de esta actividad y a la evaluación de acuerdo con los porcentajes definidos en los lineamientos del Curso.
Realice una lectura completa de la actividad y siga las indicaciones.
1. OBJETIVOS
Calcular e interpretar el grado de relación lineal que hay entre dos variables cualitativas.
Ajustar una de regresión (la recta que mejor se ajusta a la nube de puntos) y hacer pronósticos a partir de
ella.
Recta de regresión
3. INTRODUCCIÓN
En esta guı́a se abordará lo referente a la medición de la relación que existe entre variables cuantitativas. Es muy
común que las personas tomen decisiones en la vida cotidiana y profesional basadas en predicciones de sucesos
futuros. Para hacerlo, se fundamentan en la relación intuitiva y calculada entre lo que ya se sabe y lo que se
debe estimar. Si se dieran cuenta de que se puede determinar cómo lo conocido se relaciona con un evento futuro,
facilitarı́an el proceso de toma de decisiones.
Por ejemplo, se sabe que existe una relación entre la frustración y la agresión, entre la presión arterial y un
accidente cerebro-vascular, entre la obesidad y la diabetes; en los tres casos hay una relación entre dos variables,
pero no conocemos la naturaleza y fuerza de la misma. En esta guı́a se estudiará, paso a paso, un método estadı́stico
que se denomina análisis de regresión, que tiene entre sus objetivos establecer una ecuación que permita estimar
el valor desconocido de una variable a partir del valor conocido de otra.
1
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia
Ejemplo La siguiente tabla indica las notas obtenidas por 11 alumnos de la Uniminuto Soacha en las materias
de Fundamentos de Matemática y Estadı́stica Descriptiva.
Fundamentos de Estadı́stica
Alumno Matemática Descriptiva
x y
1 48 56
2 53 64
3 77 82
4 44 67
5 69 85
6 79 86
7 84 93
8 68 76
9 61 58
10 55 45
11 64 72
Diagrama de Dispersión(Nube de puntos): Llamaremos nube de puntos a la siguiente gráfica. Los puntos
en ella representan los datos de cada estudiante, la primera componente del punto (la componente en x) es nota
la materia de Fundamentos de Matemática, mientras que la segunda componente (la componente en y) es la
nota estadı́stica Descriptiva. Por ejemplo, el primer punto situado del lado izquierdo de la gráfica es (44, 67) que
corresponde a la información para el estudiante 4, pintada en azul en la anterior tabla.
2
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia
Correlación: La correlación es una forma de medir algún tipo de relación entre dos variables, este tipo de medidas
surge cuando vemos que valores mayores de una variable van de manera consistente con valores mayores de la otra,
o cuando valores grandes de una variable corresponden de forma consistente a valores menores de otra variable.
Nuestro propósito en esta guı́a es un modo de medir el grado de relación lineal entre dos variables.
Covarianza : Dadas variables cuantitativas X y Y , la covarianza nos indica si la relación entre las variables es
directa o inversa, pero no nos dice el grado de relación entre las variables. Esté parámetro, puede utilizarse para
medir la relación entre las variables solo si están expresadas en la misma escala o unidad de medida y se obtiene
a partir de la fórmula:
P
(xi − x̄)(yi − ȳ)
sxy =
n−1
Coeficiente de Correlación de Pearson: La correlación o grado de asociación (lineal) entre dos variables se
mide utilizando el coeficiente de correlación de Pearson. Este coeficiente mide le grado de asociación lineal
entre dos variables. Se denota como r, su valor fluctúa en el intervalo [−1, 1] y se calcula mediante la siguiente
expresión:
sxy
rxy =
sx · sy
Note que para efectuar esta cuenta es necesario hacer unos cálculos previos, la siguiente tabla nos muestra en
orden que cálculos se deben realizar para calcular el coeficiente de correlación de Pearson
Medida Fórmula
P
Promedio de la variable X = nxi
x̄ q
(xi−x̄)2
P
Desviación estándar de la X sx =
Pn−1
Promedio de la variable Y = nyi
ȳ q
(yi−ȳ)2
P
Desviación estándar de la Y sy = n−1
P
(xi − x̄)(yi − ȳ)
Covarianza sxy =
n−1
Cuadro 1: Calculo Coeficiente de Correlación.
Según el valor del coeficiente de correlación rxy se puede presentar las siguientes opciones:
3
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia
Si rxy es positivo, la relación lineal entre ambas variables es directa. Se dice que la correlación es positiva.
Si rxy es negativo, la relación lineal entre ambas variables es inversa. Se dice que la correlación es negativa.
Si rxy = 0, no existe relación lineal entre las variables. Se dice que la correlación es nula.
Si rxy = 1, existe una relación de dependencia total directa entr las variables, es decir, si una de ellas aumenta
(disminuye), la otra aumenta (o disminuye) en igual proporción.
Si rxy = −1, existe relación de dependencia total inversa entre las variables, es decir, si una de ellas aumenta
(o disminuye), la otra disminuye (o aumenta) en igual proporción.
La siguiente tabla resume, según el coeficiente hallado, el grado de relación lineal entre un par de variables x y y.
Retomando nuestro ejemplo sobre las notas de 10 estudiantes en las materias de Fundamentos de Matemática y
Estadı́stica Descriptiva, vamos a calcular el grado de relación lineal que existe entre estas dos variables.
Para calcular el coeficiente de correlación es común construir una tabla como la siguiente, esta nos permitirá hallar
los promedios, las desviaciones estándar y la covarianza de las variables aleatorias X y Y . Para mostrar como
es su construcción podemos ver el renglón coloreado en azul; en este renglón consideramos las notas del cuarto
estudiante en las dos materias (44 y 67 respectivamente) y realizamos algunas cuentas a partir de ellas.
Lo primero que se hace es calcular el promedio de las notas de Fundamentos de Matemática x̄ y Estadı́stica
Descriptiva ȳ
P
xi 702
x̄ = = = 63,8
n 11
P
yi 784
ȳ = = = 71,2
n 11
4
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia
Fundamentos Descriptiva
(xi − x̄) (yi − ȳ) (xi − x̄)(yi − ȳ) (xi − x̄)2 (yi − ȳ)2
x y
48 56 -15.8 -15.3 241.6 250.3 233.2
53 64 -10.8 -7.3 78.7 117.1 52.9
77 82 13.2 10.7 141.4 173.7 115.1
44 67 -19.8 -4.3 84.6 392.8 18.2
69 85 5.2 13.7 71.1 26.8 188.5
79 86 15.2 14.7 223.6 230.4 217.0
84 93 20.2 21.7 438.5 407.2 472.2
68 76 4.2 4.7 19.8 17.5 22.4
61 58 -2.8 -13.3 37.4 8.0 176.1
55 45 -8.8 -26.3 231.7 77.8 690.1
64 72 0.2 0.7 0.1 0.0 0.5
702 784 0.0 0.0 1568.6 1701.6 2186.2
Las sumas de algunas de las columnas de esta tabla facilitan el cálculo de los promedios, las desviaciones estándar
y la covarianza de las variables aleatorias X y Y :
5
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia
Por último, se puede calcular el grado de relación lineal que hay entre estas variables a través del coeficiente
de correlación de Pearson:
sxy 156,86
rxy = = = 0,81
sx · sy 13,04 · 14,78
Este valor indica una relación significativa entre las dos variables.
yb = a + bx
Donde:
A continuación se calcula la ecuación de la recta de regresión para los datos del ejemplo, es decir, se hallan la
pendiente b y el punto de corte a
Pendiente:
sxy 156,86
b= 2
= = 0,92
sx 170,6
Intercepto:
a = ȳ − bx̄ = 71,2 − 0,92 · 63,8 = 12,5
6
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia
yb = 12,5 + 0,92x
A través de esta ecuación se puede hacer predicciones, por ejemplo, si un alumno saca 50 en Fundamentos de
Matemáticas, se podrı́a cuestionarse, ¿cuánto se espera que saque en Estadı́stica Descriptiva?. En este caso, se
reemplaza x = 50 en la ecuación de la recta hallada, y obtenemos 12,5 + 0,92 · 50 = 58,5, que es la nota esperada
para este estudiante en Estadı́stica descriptiva.
Observaciones:
1. Es común en la literatura de esta materia calcular las medidas antes expuestas (desviación estándar, cova-
rianza, coeficientes de la recta de regresión) de diversas formas.
2. Es aconsejable hacer predicciones solo dentro del rango de los valores de X observados. Por regla general,
no se extrapola sus valores fuera de este rango.
5. MATERIAL DE APOYO
5.1. Lecturas complementarias
Lectura 1: Regresión Simple.
5.2. Vı́deos
Video 1: Recta de regresión lineal
Paso 5: En buscador escriba el nombre del curso o del libro que desea. Luego presione buscar.
5.4. Aplicaciones
Calculadora de Regresion lineal simple
7
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia
6. ACTIVIDAD
La presente actividad está compuesta de tres ı́tems y cada uno de estos tiene un valor porcentual sobre la nota
final del taller, dicho porcentaje está dividido de la siguiente forma: la primera parte tiene un valor porcentual del
40 %, la segunda de un 10 % y la parte final de un 50 %.
Parte 1 Pregunte al menos a 10 familiares cercanos por su estatura (medida en centı́metros) y su peso
(medido en kg):
Parte 2 Haga un pequeño informe con lo hecho en la parte 1. Este informe debe complementarse con lo
aprendido en los anteriores talleres, no olvide usar gráficas y medidas estadı́sticas para analizar cada variable
por separado y en conjunto.
1. Un psicólogo desea predecir el tiempo que lleva completar una tarea (en minutos) en función del nivel de
alcohol consumido (en ml) durante las horas anteriores. Los siguientes datos se obtienen para una muestra
de n = 5 jóvenes universitarios.
Universitario 1 2 3 4 5
Nivel-Alcohol 55 30 85 140 115
Tiempo 3 2 5 7 8
2. Una forma de medir que tan bueno resulta ser el ajuste que proporciona la recta de regresión es el Error
Estándar de Estimación. Tome los datos de punto anterior, vea el video Error Estándar de Estimación
3. Un profesor desea determinar los efectos de ver televisión en los resultados de un examen, para esto toma
siguientes datos, que representan la cantidad de horas que 12 estudiantes vieron televisión durante el fin de
semana y las calificaciones que cada unos de ellos tuvo en una prueba el lunes siguiente.
Estudiante 1 2 3 4 5 6 7 8 9 10 11 12
Horas TV 0 1 2 3 3 5 5 5 6 7 7 10
Notas 96 85 82 74 95 68 76 84 58 65 75 50
8
Corporación Universitaria Minuto de Dios UNIMINUTO
UNIDAD TRANSVERSAL DE CIENCIAS BÁSICAS
MATERIA: Estadı́stica Descriptiva Modalidad distancia
4. Se ha construido una recta de regresión que relaciona linealmente la calificación recibida en un examen
(medida en puntos porcentuales) (Y) es términos del porcentaje de asistencia (X) para 22 estu-
diantes en un curso de Estadı́stica Descriptiva de la Unimininuto. Si la intercepto con el eje y es b = 39,39
y la pendiente está dada por 0, 341 ¿cuál de las siguientes afirmaciones es correcta?, justifique.
7. BIBLIOGRAFÍA
Martı́nez, C. (2012). Estadı́stica y Muestreo. Bogotá: Ecoe Ediciones.