You are on page 1of 36

REGRESIÓN Y CORRELACIÓN

Métodos Estadísticos Aplicados a las Auditorías Sociolaborales
Francisco Álvarez González francisco.alvarez@uca.es

DISTRIBUCIONES BIVARIANTES
El estudio de la relación existente entre dos variables X e Y conduce a la consideración simultánea de ambas variables estadísticas. Tal distribución de las dos variables se denomina bivariante. La presentación de los datos experimentalmente observados puede hacerse : a) Mediante los pares (Xi , Yi) : b) Tabla simple de frecuencias : X X1 X2 .... Xn Y Y1 Y2 .... Yn n n1 n2 .... nn X (X1 , Y1) , (X2 , Y2) , (X3 , Y3) , ... c) Tabla de frecuencias de doble entrada : Y1 n11 n21 .... nn1 Y2 n12 n22 .... nn2 Y .... .... .... .... .... Ym n1m n2m .... nnm

X1 X2 .... Xn

Distribuciones marginales :
Son las obtenidas de la distribución bivariante, al considerar de forma independiente cada una de las dos variables. De ellas obtendremos los parámetros de centralización y dispersión característicos : media y desviación típica.

X , s2 X

, sX

, Y , s2 Y

, sY

Covarianza :
Este índice de variación conjunta de X e Y se define como :

s XY =

∑ n .(X
i i

i

− X )(Yi − Y ) .

s XY =

N ∑∑ nij .(X i − X ).(Y j − Y )
i j

=

∑ n . X .Y
i i i

i

N

=

∑∑ n .X .Y
ij i i j

N

− X .Y
j

para tablas simples de frecuencias

N

− X .Y

para tablas de frecuencias de doble

entrada. Si sXY = 0 expresará que las variables X e Y son independientes.

RECTAS DE REGRESIÓN
Representando los pares de observaciones (X,Y) como puntos en un plano cartesiano, obtenemos el denominado diagrama de dispersión o nube de puntos. Por recta de regresión o de ajuste entendemos la recta que más se aproxima a los puntos representativos de las observaciones (X,Y). El método de los mínimos cuadrados proporciona un sistema de obtención de tales rectas, estableciendo que sea mínima la suma de los cuadrados de las separaciones existentes entre cada punto y la recta.

Según se consideren estas separaciones en vertical (lo representado en la figura) o en horizontal, se obtienen, respectivamente, las rectas de regresión de Y sobre X y de X sobre Y.

Regresión y correlación (F. Álvarez) - 1

RECTA DE REGRESIÓN DE Y SOBRE X Y' = a + b.X
a = ordenada en el origen b = coeficiente de regresión de Y sobre X = pendiente de la recta de regresión = tangente del ángulo que forma con el eje horizontal. Y' = predicciones de Y para el valor X observado.

Los coeficientes a y b de la recta de regresión de Y sobre X se obtienen resolviendo el sistema :

a.N a.∑ f . X
el cuál tiene como solución :

+

+ b.∑ n. X
s XY s2 X

b.∑ n. X

= =

2

∑ n.Y ⎫ ⎬ ∑ n.X .Y ⎭

b=

a = Y − b. X

RECTA DE REGRESIÓN DE X SOBRE Y X' = a' + b'.Y
a' = ordenada en el origen b' = coeficiente de regresión de X sobre Y = pendiente de la recta de regresión. X' = predicciones de X para el valor Y observado.

Los coeficientes a' y b' de la recta de regresión de X sobre Y se obtienen igualmente al resolver :

a'.N a '.∑ f .Y
o directamente :

+ b'.∑ n.Y + b'.∑ n.Y 2

= =

∑ n. X ⎫ ⎬ ∑ n.X .Y ⎭

b' =

s XY 2 sY

a ' = X − b'. Y

Otro procedimiento de cálculo simplificado permite obtener los coeficientes de regresión del siguiente modo :

b=

N .∑ X .Y − (∑ X )(∑ Y ) . N .∑ X 2 − (∑ X )
2

b' =

N .∑ X .Y − (∑ X )(∑ Y ) . N .∑ Y 2 − (∑ Y )
2

Si utilizamos puntuaciones diferenciales : x = X − X y = Y− Y , las rectas de regresión pierden el término independiente (ordenadas en el origen a y a' ) al ser las medias nulas, siendo su expresión : y' = b.x x' = b'.y

COEFICIENTE DE CORRELACIÓN DE PEARSON
La recta de regresión es la que pasa más cerca de las observaciones, pero no nos indica si pasa muy cerca o no de ellas. Hemos de definir una medida del grado de asociación o relación entre ambas variables, lo cuál, en términos de recta de ajuste, indicará la bondad de la misma. Tal coeficiente se denomina coeficiente de correlación, definido por Pearson del siguiente modo :

r = b . b' =

s XY sX . sY

ya que : r =

b . b' =

s XY s XY . = s2 s2 X Y

s2 s XY = XY 2 2 sX . sY sX . sY

Según las expresiones finales obtenidas para b y b', podemos también calcularlo como :

r=
La expresión

[N .∑ X

. N .∑ X .Y − (∑ X )(∑ Y )
2 2

− (∑ X ) . N .∑ Y 2 − (∑ Y )
sX sY r = b'. sY sX

][

2

]

conduce a las siguientes relaciones (sin más que multiplicar y dividir por sX o por sY ) :

r = b.

De aquí resulta que, si se trabaja con puntuaciones tipificadas (las desviaciones típicas son iguales a 1) : r = b = b' y las rectas de regresión son : z'Y = r.z'X ; z'X = r.z'Y El coeficiente de correlación toma siempre valores comprendidos entre -1 y 1 : -1 ≤ r ≤ 1

2 - Regresión y correlación (F. Álvarez)

Interpretación :
r próximo a 0 próximo a 1 próximo a -1 Asociación de las variables Variables independientes o no relacionadas linealmente Variables relacionadas directamente (cuando una aumenta la otra también) Variables relacionadas inversamente (cuando una aumenta la otra disminuye) Bondad del ajuste Mala recta de ajuste. No pasa cerca de las observaciones. Buena recta de ajuste. Creciente (pendientes b y b' positivas) Buena recta de ajuste. Decreciente (pendientes b y b' negativas)

CURVA DE REGRESIÓN DE LA MEDIA
Este método es aplicable cuando una de las dos variables (o las dos) contiene un bajo número de valores distintos.

Curva de regresión de la media de Y condicionada a X :
El procedimiento consiste en sustituir todos los pares de observaciones que tienen el mismo valor de X por un único par que tiene por componentes dicho valor de X y la media de los valores de Y. De igual modo puede establecerse la curva de regresión de la media de X condicionada a Y. Así, por ejemplo, la figura muestra los pares siguientes: X=1 : (1,1) , (1,3) sustituidos por el par (1,2) , al ser 2 la media de 1 y 3. X=2 : (2,1) , (2,4) , (2,5) sustituidos por el par (2,3'33) , al ser 3'33 la media de 1, 4 y 5. ... etc ... Con los pares (1,2) , (2,3'33), ... obtenemos la recta de regresión por el procedimiento ya descrito.

Razón de correlación :

η 2 = 1−

2 ni .s y 1 .∑ 2 i N sY

Toma valores comprendidos entre 0 y 1 y siempre verifica que η2 ≥ r2 (r=coef. de correlación lineal). La relación entre las variables X , Y será de tipo lineal, cuanto más 2 2 próximo sea η a r .

OTROS PROCEDIMIENTOS DE CÁLCULO DEL COEFICIENTE DE CORRELACIÓN r Coeficiente de correlación ϕ (phi) :
El siguiente procedimiento se puede utilizar cuando las dos variables X e Y son dicotómicas. Y X 1 0 1 a c 0 b d Asignemos los valores 0 y 1 a ambas variables y realicemos el recuento representado en la tabla de la izquierda. El coeficiente de correlación ϕ toma el valor :

ϕ=

ad − bc (a + b )(c + d )(a + c )(b + d ) . . .

Coeficiente de correlación biserial puntual rbp :
El siguiente procedimiento se puede utilizar cuando una variable es continua y la otra dicotómica. Supuesta X continua :

rbp =

X1 − X0 . p. q sX

Siendo :

X1 X0 sX
p q=1-p

la media de los valores de X que se corresponden con un 1 en Y. la media de los valores de X que se corresponden con un 0 en Y. la desviación típica de X (considerados sus valores globalmente). la proporción de unos en Y. la proporción de ceros en Y.

Coeficiente de correlación por rangos de Spearman ρ :
El siguiente procedimiento se puede utilizar cuando las dos variables son ordinales (reordenaciones de una serie de elementos).

ρ = 1−

6.∑ d 2

N. N 2 − 1

(

)

Siendo d las diferencias entre los valores de X e Y. Regresión y correlación (F. Álvarez) - 3

c (el coeficiente de correlación será positivo) 3º Si a.. localizamos el cociente C en el intervalo que lo contiene (con extremos A y B).c. NOTA : Los cálculos de z y f(z) no es preciso realizarlos ya que. • z' valor de la curva normal tipificada N(0. f(z) la ordenada correspondiente a z en la curva normal. ( z' 2 −1) .d y b. p la proporción de unos en Y. el coeficiente de correlación biserial se calcula del modo siguiente : X − X0 p. z el valor normal tipificado (N(0.1).Los coeficientes de correlación anteriores no son más que una adaptación del coeficiente de correlación de Pearson para tipos especiales de variables.1). pero una de ellas puede dicotomizarse artificialmente. ( B − A ) El coeficiente de correlación tetracórico rt será el resultado de resolver la siguiente ecuación : rt + z. igual a la menor de las cantidades (a+c)/n o (b+d)/n. Esta dificultad aconseja seguir el método abreviado descrito anteriormente.Regresión y correlación (F. se encuentran tabulados los valores de p. igual a la menor de las cantidades (a+b)/n o (c+d)/n.d (el coeficiente de correlación será negativo) 4º Consultando la tabla de cálculo del coeficiente de correlación tetracórico. Coeficiente de correlación biserial rb : Puede utilizarse cuando ambas variables son continuas . = 2 2! 3! 4! n .c . que deja a su derecha un área m. para cada valor de la probabilidad p (o q indistintamente). como un valor numérico (n) más R. la media de los valores de X que se corresponden con un 0 en Y. la mayor exactitud en el cálculo rt . por ello. A) Método abreviado (aproximado) : 1º Calculamos los productos : a. Tabuladas para cada m.d / b. pero ambas pueden dicotomizarse artificialmente. la desviación típica de X (considerados sus valores globalmente). En la ecuación que permite calcular rt : • z valor de la curva normal tipificada N(0.c . sX f ( z) La ordenada f(z) : Siendo : X1 X0 sX la media de los valores de X que se corresponden con un 1 en Y. De aquí : rt = n + R B) Método exacto : con : R = C−A 100 . c + ( z 2 − 1) . t + ( z 3 − 3z) . que deja a su derecha un área m. OTROS COEFICIENTES DE CORRELACIÓN NO BASADOS EN EL PEARSON Coeficiente de correlación tetracórica: Puede utilizarse cuando ambas variables son continuas . d − b. f ( z). t + .d > b. Y X 1 0 1 a c 0 b d Asignemos los valores 0 y 1 a ambas variables y realicemos el recuento que se representa en la tabla de la izquierda. rt 2 r3 r4 a. calculamos el cociente : C = b. su valor coincide con el que habríamos obtenido siguiendo el procedimiento de Pearson (r).c / a.. A su derecha encontramos el coeficiente de correlación tetracórico (rt). f ( z' ) Como es lógico. • f(z) y f(z') ordenadas de la curva normal. ( z' 3 −3z') . su interpretación es la establecida para r . q rb = 1 .q/f(z). z'. En consecuencia. calculamos el cociente : C = a. Supuesta X continua y Y dicotomizada (valores 1 y 0) . se obtiene al considerar un mayor número de sumandos del desarrollo en serie anterior.1)) que deja a su derecha (o a su izquierda) el área p. q=1-p la proporción de ceros en Y. 4 . correspondientes a los valores z y z' anteriores. Álvarez) .d < b. 2º Si a.

la distribución de la variable o variables consideradas continuas debe ser "normal".5 . Procedimiento de cálculo : a) Reordenamos los pares de observaciones de modo que la variable X (primer elemento del par) quede en orden ascendente. Es decir : • Los coeficientes tetracórico y τ toman valores comprendidos entre -1 y 1 : -1 ≤ coeficiente ≤ 1. • Valores próximos a cero implican falta de relación entre las variables (independencia).X ∑ (Y − Y ') = N 2 ∑ (Y − Y ) . Sus valores no tienen porqué coincidir con el del coeficiente de correlación de Pearson. 1 − r 2 ( ) La raíz cuadrada de la varianza residual se denomina error típico de la predicción : s Y . Álvarez) . En términos de varianzas : ∑ (Y − Y ) 2 = ∑ (Y − Y ) = ∑ (Y − Y ') + ∑ (Y '−Y ) ∑ (Y − Y ') + 2 2 ∑ (Y '−Y ) 2 Varianza total Varianza no explicada por X (varianza de los errores o residual) Varianza explicada por X Dividiendo los sumandos anteriores por la varianza de Y obtendremos la proporción de varianza de Y no explicada y explicada por la variable X.r2 Varianza de los errores o residual = s =s 2 e 2 Y . Representa la porción de información no asociada a X. • El coeficiente biserial puede ser mayor que 1 y menor que -1. En valor absoluto. representa.Coeficiente de correlación τ (tau) de Kendall : Como el de rangos de Spearman. este coeficiente es aplicable cuando las dos variables son ordinales (reordenaciones de una serie de elementos). FUENTES DE VARIANZA EN LA CORRELACIÓN Expresemos la desviación de Y respecto de su media como : (Y − Y ') (Y − Y ) = (Y − Y ') + (Y '−Y ) 2 2 (Y '−Y ) es el error cometido en la predicción. en consecuencia. la información asociada a X. La manipulación de esta operación conduce a las expresiones y definiciones siguientes : ∑ (Y − Y ) ∑ (Y − Y ) 2 2 Varianza de las predicciones Y' = s = 2 Y' ∑ (Y − Y ') + ∑ (Y '−Y ) =1= ∑ (Y − Y ) ∑ (Y − Y ) ∑ (Y '−Y ) 2 2 2 2 2 ∑ (Y − Y ') = ∑ (Y − Y ) 2 2 + r2 N s2 ' Y = r2 s2 Y Proporción de varianza de las predicciones Y' = Proporción de varianza explicada por X = r2 = Coeficiente de determinación ( R2 ) Proporción de varianza no explicada por X = 1 . si bien verifican las mismas propiedades que éste. X = s Y . será mayor que el biserial puntual. Regresión y correlación (F. τ= Np − Ni n. Para su aplicación rigurosa es necesario que : 1.( n − 1) 2 Siendo : • n el número de pares de valores (X . contando una permanencia si Y < Yi y una inversión si Y > Yi. 2. la relación que suponemos existe entre ambas variables es de tipo "lineal". 1 − r 2 IMPORTANTE : Observe los diferentes significados e interpretaciones de r2. Y) • Np el número total de "permanencias" • Ni el número total de "inversiones" Utilización e interpretación de los coeficientes estudiados en este epígrafe: Los coeficientes tetracórico y biserial parten de variables continuas que pueden dicotomizarse (ambas o sólo una). ∑ (Y − Y ') = N ∑ (Y − Y ) 2 2 2 2 = sY . b) Comparamos cada valor de Y con los Yi siguientes.

szxzy = (a = 0 .∑ n. zy = ⎟ ⎜zx = sx sy ⎠ ⎝ zx = 0 .y) con : R = C−A 100 . szy = 1 . y b' = Coeficiente de correlación (de Pearson y equivalentes) : Pearson Phí Biserial puntual Rangos de Spearman r = b. y Predicciones : x ' = x a'. y ⎫ ⎬ ∑ n. x d x = 0 . x = b'.x a. y + b'. s y =r r= sxy sx .∑ n. y = = ∑ n. b = r) sxy sx .x + b. d x z y ' = r. ( N 2 − 1) Coeficiente de correlación no basados en el de Pearson : Tetracórico (Tabulado) Biserial Tau de Kendall rt = n + R Puntuaciones directas (x.( a + c). y = N 2 − y2 s xy = ∑ n. y ⎭ ∑ n. Álvarez) s2 y' ∑ ( y '− y ) 2 = N s2 ' y s2 y = r2 .RESUMEN DEL TEMA ∑ n.∑ n. p. x sxy b= sxy Predicciones : y ' = y Recta de regresión de x sobre y (puntuaciones directas) a'.( b + d ) rbp = x1 − x0 .∑ n. q sx ρ = 1− 6.N + b. ∑ d 2 N.x. y − x.FORMULARIO . b se mantiene) ⎛ x−x y− y⎞ . x a. sy sx ad − bc ( a + b).x.x = N 2 −x 2 ∑ n. z x 2 s 2 = se + s 2 ' y y Relación fundamental : Varianza de y = = Varianza residual (de errores) + Varianza de las predicciones. sdx = s x .( c + d ). y y= N s 2 y ∑ n.x. Varianza de las predicciones : Proporción de varianza explicada o asociada a la regresión. o coeficiente de determinación : 6 . y N Recta de regresión de y sobre x (puntuaciones directas) y' = a + b.x ⎫ ⎬ ∑ n. zy = 0 szx = 1 .Regresión y correlación (F. sy d y ' = b. sdy = s y . q rb = 1 . o proporción de varianza de las predicciones. y ⎭ s2 x a = y − b.N + = = x' = a '+ b'. y 2 s2 y a ' = x − b'.∑ n. d y = 0 . b' = sxy ϕ= sx . sdxdy = s xy (a = 0 . sX f ( z) τ= Np − Ni n. sy sy s r = b. dy = y − y) y' = a + b.∑ n. ( B − A ) X − X0 p.x x= N s 2 x ∑ n.( n − 1) 2 Puntuaciones diferenciales (d x Puntuaciones tipificadas = x − x .x 2 b'.

x = s y . Álvarez) . 1 − r 2 2 se = 1− r2 s2 y Signo de b = signo de b’ = signo de r = signo de la covarianza r = 0 ⇔ absoluta independencia r = 1 o r = -1 ⇔ absoluta dependencia (directa o inversa) -1 ≤ r ≤ 1 0 ≤ r2 ≤ 1 Regresión y correlación (F.7 .Varianza de los errores (o residual) : 2 se = s2.x y ∑( y − y') 2 = s2 .( 1 − r 2 ) = N y Error típico de la predicción (raíz de la varianza de los errores): Proporción de varianza no explicada o no asociada a la regresión. o proporción de varianza de los errores : s y.

1331 − 214.Y 36 75 300 144 210 144 294 128 1331 a) Recta de regresión de Y sobre X. X= b= N . 1 − 0' 8279 2 = 0' 6864 8 .Y2 48 125 300 144 245 192 294 128 1476 n. Dicha relación es positiva (directa).X a = Y − b . Obtenga la recta de regresión de X sobre Y. 5' 95 = − 0' 3815 c) Coeficiente de correlación de Pearson. expresan con una elevada aproximación la relación matemática (lineal) existente entre las calificaciones en Matemáticas y Lengua.X2 27 45 300 144 180 108 294 128 1226 n. b' = = = = 0'96 2 Recta de regresión de X sobre Y : 2396 40. Conocidos los coeficientes de regresión puede calcularse como : r = b . Obtenga el error típico de la predicción. Podemos afirmar que las rectas de regresión obtenidas son buenas rectas de ajuste.238 2308 = = 0'71 Recta de regresión de Y sobre X : 3244 40. Calcule e interprete el coeficiente de correlación lineal. X = s Y .X 9 15 60 24 30 18 42 16 214 n.Y − (∑ X )(∑ Y ) 40. Álvarez) .EJERCICIOS RESUELTOS 1 La tabla siguiente contiene los resultados de las calificaciones en Matemáticas (X) y Lengua (Y) de un grupo de 40 alumnos de Secundaria.Y 12 25 60 24 35 24 42 16 238 n.1226 − 214 2 Y' = 2'1436 + 0'7115. ¿ Qué proporción de varianza de Y no queda explicada por X ?.Regresión y correlación (F.∑ X . b' = 0' 7115 . y a la inversa. N . Es decir.Y i i 2 i N 2 −Y 2 = 1476 − 5'95 2 = 1'4975 40 s Y . N .1476 − 238 2 N .X. Calculada la varianza de Y : 2 sY = ∑ n . Y = 5' 35 − 0' 9633 . Tabla de cálculos : X 3 3 5 6 6 6 7 8 Y 4 5 5 6 7 8 7 8 n 3 5 12 4 5 3 6 2 40 n. alumnos con altas calificaciones en Matemáticas se corresponden con altas calificaciones en Lengua. X 3 3 5 6 6 6 7 8 Y 4 5 5 6 7 8 7 8 n 3 5 12 4 5 3 6 2 a) b) c) d) e) Obtenga la recta de regresión de Y sobre X. es decir.Y a ' = X − b ' .Y − (∑ X )(∑ Y ) . 1 − r = 1' 4975 . d) Error típico de la predicción.∑ X .∑ X − (∑ X ) 2 2 214 = 5' 35 40 Y= 238 = 5' 95 40 = 40. 5' 35 = 2' 1436 b) Recta de regresión de X sobre Y. X = 5' 95 − 0' 7115 .∑ Y 2 − (∑ Y ) X' = -0'3815 + 0'9633.238 2308 .1331 − 214. 0' 9633 = 0' 8279 Existe una elevada relación entre las calificaciones en Matemáticas y Lengua.

Calcule su varianza residual.Y2 0 10 20 30 X 2 4 6 Σ X 2 4 6 n 6 9 8 23 n.6.Y = ∑∑ n .X 12 36 48 96 La suma de los productos de X por Y hemos de obtenerla directamente de la tabla proporcionada : ∑ X .0'82792 = 0'3146. X b) Recta de regresión de X sobre Y : b' = s XY −1' 1078 = = − 2' 0207 2 0' 5482 sY a ' = X − b'.2 = 58 Como puede observarse. Calcule e interprete el coeficiente de correlación lineal. Y = 4' 1739 − ( − 2' 0207 ).4.b' = (− 0'4607 )(− 2'0207 ) = ±0'9648 .2 + 0. 4' 1739 = 2' 7925 Y' = 2'7925 . ya que es el que proporciona la covarianza. sY −1' 1078 = − 0' 9648 no se planteará tal dificultad.9 .0'4607 .4.2.r2 = 1 .1 + 0.2 + 9.0 + 9.2 + 8.6. 2 De la distribución bivariante siguiente : 0 0 0 8 Y 1 1 9 0 2 5 0 0 X 2 4 6 a) b) c) d) e) Obtenga la recta de regresión de Y sobre X. en los cálculos solicitados.4.2.Y = ∑ X .1 + 5.4. X = 0' 8696 − ( − 0' 4607 ).0 + 1.2.2'0207 . 0' 5486 Regresión y correlación (F.Y 0 10 10 20 n.0'8696 = −1'1078 N 23 a) Recta de regresión de Y sobre X : b= s XY −1' 1078 = = − 0' 4607 2 2' 4045 sX a = Y − b . Obtenga la recta de regresión de X sobre Y. Álvarez) .X . 2' 4045 .6. Este signo es el de b y b'.1 + 0.X2 24 144 288 456 Y 1 1 9 0 10 2 5 0 0 5 Y 0 1 2 Σ 6 9 8 23 n 8 10 5 23 n.1 + 5. X= 96 = 4' 1739 23 Y= Covarianza = s XY = ∑∑ n . Calculado como r = podemos tener duda en cuanto al signo del coeficiente de correlación. sólo realizamos los productos correspondientes a frecuencias y valores de variables no nulos.Y = 58 − 4'1739. así como la covarianza. s XY = sX .Y − X . Calcule e interprete el coeficiente de determinación.2. X .Y ij i i j j = 0. 0' 8696 = 5' 9310 X' = 5'9310 . La proporciona : 1 .Y ij i i j 20 = 0' 8696 23 s2 = X j 456 − 4' 1739 2 = 2' 4045 23 2 sY = 30 − 0' 8696 2 = 0' 5482 23 N − X . X . Y = 1. Y c) Coeficiente de correlación : Utilizando la expresión r = b. Obtenemos las distribuciones marginales de X y de Y totalizando las frecuencias en filas y columnas : 0 0 0 8 8 n. Es decir el 31'46%.0 + 0.e) Proporción de varianza no explicada por X.2.1 = 58 ∑ Utilicemos las medias y varianzas de X e Y.

Siendo nula la covarianza.0'5 + 2.Y2 1'25 22'5 31'25 55 X 2 3 4 n 4 12 4 20 ij i j n.Y ij i i j 60 =3 20 Y= 30 = 1' 5 20 j N − X .1'5 + 3.1) 1 3 1 Y [1. Al ser nulos los coeficientes de regresión. a coincidirá con la media de Y y a' con la de X.4. 3 De la siguiente distribución bivariante : [0.X2 16 108 64 188 Y 1'5 2 6 2 10 2'5 1 3 1 5 Y 0'5 1'5 2'5 X 2 3 4 4 12 4 20 n 5 10 5 20 n.2.4. Obtenga la recta de regresión de Y sobre X. b) Recta de regresión de Y sobre X : b= s XY 0 = 2 =0 2 sX sX s XY 0 = 2 =0 2 sY sY a = Y − b . también los serán los coeficientes de regresión.4.2.Y = ∑∑ n .1'5 = 4'5 − 4'5 = 0 N 20 Interpretación : Las variables son independientes.Y = ∑ X .2) 2 6 2 [2. 1' 5 = 3 X' = 3 10 .3.0'5 + 2. 1 − (− 0'9648) = 0'0379 ( ) ( ) e) Coeficiente de determinación : Es el cuadrado del coeficiente de correlación. representando la proporción de varianza explicada por la variable X (en el ajuste de Y sobre X). Álvarez) .1'5 + 1.0'5 + 6. Totalizando filas y columnas obtendremos las distribuciones marginales de X e Y : 0'5 1 3 1 5 n.X . X = 1' 5 − 0 .Regresión y correlación (F. R 2 = r 2 = (− 0'9648) = 0'9309 2 La variable X explica el 93'09% de la varianza de Y.2'5 + 1.2. De la varianza total de Y .Y = 90 − 3.1'5 + 1.3.3] 1 3 1 X 2 3 4 a) b) c) d) e) Calcule e interprete el valor de la covarianza. Obtenga la recta de regresión de X sobre Y.3. Sólo el 6'91% no es atribuible a X.Y 2'5 15 12'5 30 n. Calcule el coeficiente de correlación lineal y el de determinación.2'5 = 90 a) Covarianza : X= Covarianza = s XY = ∑∑ n . X . Y = 3 − 0 .Y i j = 1. el coeficiente de correlación y el de determinación. determine la proporción atribuible a la variable X. 3 = 1' 5 ⇒ ⇒ Y' = 1'5 c) Recta de regresión de X sobre Y : b' = a ' = X − b'. dado que en sus cálculos interviene la covarianza en el numerador.d) Varianza residual : 2 2 2 se2 = sY .Y − X . 1 − r 2 = 0'5482. X = sY .2'5 + 3.X 8 36 16 60 ∑ X .

b) Calcule el coeficiente de correlación de Pearson y compare su valor con el calculado en el apartado anterior. q = .11 . Ello nos conduce a calcular las medias de los valores de X que se corresponden con un 1 y con un 0 en Y (X1 y X0) de forma separada. 0=Mujer) y X a la variable puntuación en el test. así como la desviación típica de X. Álvarez) .X1 3 4 9 4 10 30 X0 1 2 4 5 n 1 4 5 1 11 q n. a) Siendo dicotómica la segunda variable.d) Coeficiente de correlación y de determinación : Como se indicó en el apartado a). 0' 5 = − 0' 1351 sX 1' 3453 X1 = b) Coeficiente de correlación de Pearson : El propósito de este apartado no es otro que comprobar que efectivamente coinciden los coeficientes de correlación de Pearson y biserial puntual. procederemos a los cálculos necesarios para su obtención. 0' 5 . Las siguientes tablas facilitan nuestras operaciones : X 1 1 2 2 3 4 4 5 5 Y 1 0 1 0 1 0 1 0 1 n 3 1 2 4 3 5 1 1 2 N= 22 n. Los resultados observados fueron : Test 1 1 2 2 3 4 4 5 5 Sexo Varón Hembra Varón Hembra Varón Hembra Varón Hembra Varón Nº de alumnos 3 1 2 4 3 5 1 1 2 a) Mida el grado de asociación existente entre las dos variables mediante el coeficiente más adecuado. sY R 2 = r2 = 0 e) Proporción de varianza explicada por X : Proporción de varianza explicada por X = r2 = Coeficiente de determinación = 0 4 Se desea estudiar la relación entre las calificaciones obtenidas en un test (puntuado de 0 a 5) y el sexo del alumno que lo realiza.X2 3 1 8 16 27 80 16 25 50 226 X1 1 2 3 4 5 n 3 2 3 1 2 11 p n. así como la covarianza: Regresión y correlación (F. calcularemos el coeficiente de correlación biserial puntual : Denominando Y a la variable sexo (asignamos : 1=Hombre .X0 1 8 20 5 34 30 34 11 11 X0 = p= = 0' 5 q= = 0' 5 = 1 − p = 2' 7273 = 3' 0909 11 11 22 22 64 226 X= = 2' 9091 s2 = − 2' 90912 = 1' 8099 ⇒ s X = 1' 8099 = 1' 3453 X 22 22 X − X0 2' 7273 − 3' 0909 Con esto : rbp = 1 . b' = 0 . ambos coeficientes también lo son : r = b .X 3 1 4 8 9 20 4 5 10 64 n. sY sX . 0 = 0 r= s XY 0 = =0 sX . al ser nula la covarianza. p. Calculemos la media y desviación típica de Y.

Y 3 0 4 0 9 0 4 0 10 30 Y= s XY 11 11 − 0' 5 2 = 0' 25 ⇒ s Y = 0' 25 = 0' 5 = 0' 5 s 2 = Y 22 22 −0' 0909 30 = − 2' 9091.Regresión y correlación (F.X. Dispuesta la tabla como sigue (totalizando filas y columnas) obtenemos : Y X 1 (Hombre) 0 (Mujer) 1 (Fuma) a = 85 c = 10 95 0 (No fuma) b = 12 d = 60 72 97 70 ϕ= b) (a + b )(c + d )(a + c )(b + d ) .Y2 3 0 2 0 3 0 1 0 2 11 n. 0' 5 5 La siguiente tabla nos muestra la distribución por sexo de un grupo de 167 personas.X.Y 3 0 2 0 3 0 1 0 2 11 n.X 85 12 0 0 97 ad − bc = 85. como era de esperar.95. 0' 5689 = 0' 1786 ⇒ r= = 0' 7307 167 0' 4934 . . 0' 5 = − 0' 0909 ⇒ r= = −0' 1351 22 1' 3453. indicando si fuman o no.X2 85 12 0 0 97 = 0'7307 Coeficiente de correlación de Pearson : X 1 1 0 0 n. a) Las dos variables son dicotómicas.X 1 1 2 2 3 4 4 5 5 Y 1 0 1 0 1 0 1 0 1 n 3 1 2 4 3 5 1 1 2 22 f.60 − 12.70. b) Calcule el coeficiente de correlación de Pearson y compare su valor con el calculado en el apartado anterior.Y 85 0 0 0 85 97 97 = 0' 5808 s2 = − 0' 5808 2 = 0' 2435 ⇒ s X = 0' 2435 = 0' 4934 X 167 167 95 95 Y= = 0' 5689 s2 = − 0' 5689 2 = 0' 2453 ⇒ s Y = 0' 2453 = 0' 4952 Y 167 167 85 0' 1786 s XY = − 0' 5808 .10 97. Y 1 0 1 0 n 85 12 10 60 167 n. Álvarez) . 12 . El coeficiente específico para esta situación es el coeficiente de correlación ϕ (phi) . 0' 4952 X= Coincidente con el calculado en el apartado anterior.Y 85 0 10 0 95 n.Y2 85 0 10 0 95 n.72 n. . Hombre Mujer Fuma 85 10 No fuma 12 60 a) Calcule el coeficiente de más adecuado para medir el grado de asociación existente entre el sexo y el ser o no fumador.

Nos encontramos ante dos reordenaciones distintas de los 12 individuos. C.13 .D.. N − 1 12.6 Doce atletas (A. calculados para comprobar que coinciden. Al ser dicotómica la variable sexo.F.∑ d 2 6.E.C.H. a) Coeficiente de correlación ρ : 6. B.G.G. Las clasificaciones en dichas pruebas fueron : 100 metros : A. obtendremos el coeficiente de correlación biserial puntual : Regresión y correlación (F.L Peso : K. Álvarez) .E.D.K. mediante el coeficiente más adecuado. H = hombre) y el número de multas impuestas durante el último año.I. Sexo Nº de multas en el último año 1 2 3 4 5 6 M 9 7 6 1 1 0 H 0 0 2 9 11 18 ¿ Qué conclusión puede deducirse acerca de la relación existente entre sexo y número de denuncias ?.J.. 7 De los archivos de la Dirección provincial de Tráfico se han seleccionado los expedientes de 64 conductores. L) participan en una carrera de 100 metros y en otra de lanzamiento de peso.J. Calcularemos pues el coeficiente de correlación por el método de los rangos de Spearman.L. b) Calcule el coeficiente de correlación de Pearson y compare su valor con el calculado en el apartado anterior.B.552 ρ = 1− = 1− = −0'9301 2 N. 12 2 − 1 ( ) ( ) (Ver tabla siguiente) A continuación se ofrecen las tablas auxiliares de cálculos de ρ y r .. .I.F.B. Utilice para ello el índice de asociación más apropiado. quedando mejor clasificados en una los peor clasificados en la otra.H. 3' 4521 X= En efecto coinciden los coeficientes de correlación obtenidos por los dos métodos.C.A a) Determine la relación existente entre las dos clasificaciones en las pruebas descritas. Su alto valor negativo (próximo a -1) nos indica que existe una fuerte relación entre las dos clasificaciones en las pruebas atléticas. realizando el siguiente recuento en función del sexo (M = mujer . X 1 2 3 4 5 6 7 8 9 10 11 12 78 Para el cálculo de ρ Y d 11 -10 9 -7 10 -7 12 -8 7 -2 8 -2 6 1 4 4 5 4 2 8 3 8 1 11 78 0 d2 100 49 49 64 4 4 1 16 16 64 64 121 552 X 1 2 3 4 5 6 7 8 9 10 11 12 78 Para el cálculo de r Y X2 Y2 11 1 121 9 4 81 10 9 100 12 16 144 7 25 49 8 36 64 6 49 36 4 64 16 5 81 25 2 100 4 3 121 9 1 144 1 78 650 650 X.Y 11 18 30 48 35 48 42 32 45 20 33 12 374 b) Coeficiente de correlación de Pearson : 650 78 = 6' 5 s2 = − 6' 5 2 = 11' 9167 ⇒ s X = 11' 9167 = 3' 4521 X 12 12 650 78 Y= = 6' 5 s 2 = − 6' 5 2 = 11' 9167 ⇒ s Y = 11' 9167 = 3' 4521 Y 12 12 −11' 0833 374 s XY = − 6' 5 . 6' 5 = − 11' 0833 ⇒ r= = − 0' 9301 12 3' 4521.

8 2 − 1 ( ) Es decir. q = . Álvarez) .X1 9 14 18 4 5 0 50 Y=0 n. 14 . Clasificados por orden de puntuación resultó : Alumno P. existe una alta relación entre las calificaciones. Algo que podía advertirse al analizar el recuento de las observaciones. Ordenadas las primeras. 0' 625 = − 0' 831 sX 1' 7721 X1 = Es decir existe una fuerte relación. seleccionamos ocho alumnos a los que sometemos a dos pruebas (una de cada área). Denominamos X e Y a las variables que proporcionan. p. 8 Para analizar si existe o no relación entre las calificaciones en materias científicas y las del área literaria. Generalmente un alumno con altas calificaciones en el área científica tendrá altas calificaciones en el área de conocimientos literarios. Científica P. N −1 2 ( ) = 1− 6.∑ d 2 N. entre ambas variables. de sentido inverso.Y M=1 X 1 2 3 4 5 6 9 7 6 1 1 0 24 H=0 0 0 2 9 11 18 40 n 9 7 8 10 12 18 N=64 n. las clasificaciones en la prueba científica y en la literaria .X2 9 28 72 160 300 648 1217 Y=1 n. Calcularemos el coeficiente de correlación ρ (rangos de Spearman) al presentarse dos variables ordinales (dos reordenaciones de los 8 alumnos).X0 0 0 6 36 55 108 205 50 205 24 40 = 2' 0833 = 5' 125 X0 = p= = 0' 375 q = = 0' 625 = 1 − p 24 40 64 64 1217 255 X= = 3' 9844 s2 = − 3' 9844 2 = 3' 1404 ⇒ s X = 3' 1404 = 1' 7721 X 64 64 X − X0 2' 0833 − 5' 125 Con esto : rbp = 1 . Literaria 1 3º 3º 2 6º 5º 3 7º 7º 4 1º 4º 5 2º 1º 6 8º 8º 7 5º 2º 8 4º 6º Utilizando el índice adecuado establezca el grado de relación que existe entre las calificaciones de dichas áreas de conocimiento.X 9 14 24 40 60 108 255 n. calculemos sus diferencias : X 1 2 3 4 5 6 7 8 Y 4 1 3 6 2 5 7 8 d -3 1 0 -2 3 1 0 0 d2 9 1 0 4 9 1 0 0 24 Con ello : ρ = 1− 6. 0' 375 . respectivamente.Regresión y correlación (F.24 = 0'7143 8.

15 . (a + b )(c + d )(a + c )(b + d ) 17. X y' = b .2 = = 0'8051⇒ alta relación entre las variables. diferenciales y típicas. Los resultados fueron los siguientes : Test A Test B 3 4 4 5 5 5 5 6 6 7 7 8 8 8 9 10 10 11 12 14 a) Obtenga las ecuaciones de las rectas de regresión del test A sobre el B.En puntuaciones diferenciales : 3º.En puntuaciones tipificadas: Y' = a + b .∑ X . Se trata de analizar la relación que puede existir entre la especialidad (Ciencias o Letras) y el ser repetidor o no serlo. Siendo las dos variables dicotómicas.617 − 69.617 − 69. b) Determine la proporción de varianza residual que se presenta en dicho ajuste. . .549 − 69 )(10.78 = 0'9861 a) Rectas de regresión : 1º.13 .∑ Y − (∑ Y ) ][ ] = (10.14. X y' = 1'0809 . x zy' = r . 10 Se somete a 10 alumnos a dos test diferentes encaminados a medir su percepción visual. Calcule el coeficiente de correlación más adecuado para medir el grado de asociación existente entre las variables descritas. es decir. procedemos a realizar los cálculos necesarios : X 3 4 5 5 6 7 8 9 10 12 69 Y 4 5 5 6 7 8 8 10 11 14 78 X2 9 16 25 25 36 49 64 81 100 144 549 Y2 16 25 25 36 49 64 64 100 121 196 696 X. 2 2 10. N . ∑ X = 78 − 1' 0809 . 69 = 0' 3416 N N 10 10 2 2 r= [N .∑ X − (∑ X ) a = Y − b.zx Y' = 0'3416 + 1'0809 .∑ X .Y − (∑ X )(∑ Y ) 2 2 − (∑ X ) . en puntuaciones directas. Regresión y correlación (F. De ellos repiten curso 16 de Ciencias y sólo 2 de Letras. X = ∑ Y − b . x zy' = 0'9861 .En puntuaciones directas : 2º.78 = = 1'0809 2 2 10.Y 12 20 25 30 42 56 64 90 110 168 617 b= .12 − 1.∑ X . a la proporción de varianza de Y que representa la varianza solicitada.696 − 78 ) . Denominando Y a las puntuaciones en el test A (variable dependiente en el ajuste) y X a las correspondientes al text B..zx b) Proporción de varianza residual : Cuando se habla de proporción siempre se refiere al cociente entre la varianza total de Y.. Dispuesta la tabla como sigue (totalizando filas y columnas) obtenemos : Y X 1 (Ciencias) 0 (Letras) 1 (Repite) a = 16 c=2 18 0 (No repite) b=1 d = 12 13 17 14 ϕ= ad − bc 16. calculamos el coeficiente de correlación ϕ (phi) .Y − (∑ X )(∑ Y ) 10.. N . Álvarez) . N .18.549 − 69 2 N .9 Un grupo de COU integran 17 alumnos de Ciencias y 14 de Letras.

11 A partir de los seis pares de valores. es un punto contenido en la recta de regresión. correspondientes a una variable bidimensional (X. 3'3) (5 . 5) .Y 4 10 15 24 35 88 X= 15 =3 5 s2 = X 55 − 32 = 2 5 Y= 27 = 5' 4 5 151 − 5' 4 2 = 1' 04 5 Y = 3'3 + 0'7 . siendo creciente (r > 0).Y) . Cálculos necesarios (realizados en este ejemplo a partir de las medias y varianzas de X e Y y de la covarianza) : X 1 2 3 4 5 15 Y 4 5 5 6 7 27 X2 1 4 9 16 25 55 Y2 16 25 25 36 49 151 2 sY = X. Álvarez) . siendo la proporción de varianza no explicada por el test B (X). X s XY = 88 − 3. (2 . 5' 4 = 1' 4 5 a) b) b= 1' 4 = 0' 7 2 a = 5' 4 − 0' 7. X = sY . así como que dicha recta es creciente (r > 0). 1 − r 2 2 ) = 1− r ( ) 2 = 1 − 0'98612 = 0'0277 Sólo representa un 2'77% de la varianza del test A (Y). 6'8) Para X = 0 Para X = 5 Enlazando los dos puntos anteriores obtenemos la gráfica de la recta. 3 = 3' 3 Y = 3'3 Y = 6'8 (0 . Para representar gráficamente la recta de regresión. localizamos dos puntos cualesquiera de ella : Y = 3'3 + 0'7 . 5'4) .Siendo la varianza de los errores (residual) : s s 2 Y .1− r 2 sY 2 Y ( 2 2 se2 = sY . Apreciamos la proximidad de los puntos a la recta de ajuste.X 2 Y = s . (3 . (1 . (4 . 6) . 4) . c) r= 1' 4 2 . Calcule e interprete el coeficiente de correlación. 7) a) b) c) Calcule la ecuación de la recta de regresión de Y sobre X. 1' 04 = 0' 9707 Elevada relación entre las variables y de signo positivo.Regresión y correlación (F. X 16 . Observe que el punto que tiene por coordenadas las medias de X e Y (3 . La recta de regresión es una buena función de ajuste. Represente gráficamente el diagrama de dispersión y la recta de regresión. 5) . (5 .

Resulta de utilidad escribir las expresiones en las que intervienen los datos suministrados. ¿ qué pronóstico diferencial corresponde a una puntuación directa X = 4 ?.0'9783 .X pasa por (0'5. Y = 2 − ( − 0' 9783 ). luego : r = 0'9383 . calculemos la recta de ajuste de X sobre Y : b' = s s XY 1' 4142 = r .-0'4). por tanto. b) Determinemos la recta de regresión en puntuaciones directas y diferenciales : Si la recta de regresión Y' = a + b. X (a = Y − b.0'9 . a) Calcule los coeficientes de correlación y de determinación.0'5 .r2 = 0'2558 ⇒ r2 = 1 . r = 0'8627. a) calcule la media y varianza de X b) determine la ecuación de la recta de regresión de X sobre Y c) obtenga el valor del coeficiente de correlación. siendo la proporción de varianza no explicada por X del 25'58%. 1' 3565 2 ⇒ − 0' 9383 = − 0' 9 . Y 13 La recta de regresión de Y sobre X corta a los ejes coordenados en los puntos (0'5. ⇒ sX = = 1' 4142 ⇒ s X = 1' 4142 2 = 2 1' 3565 − 0' 9 a ' = X − b' . Álvarez) . X 5' 4 = 3' 6 + 0' 9 . 3' 6 = 5' 5217 Finalmente. X ⎞ ⎛ s ⎜ b = XY = −0'9 ⎟ 2 ⎟ ⎜ sX ⎠ ⎝ s 2 = 1' 84 s Y = 1' 84 = 1' 3565 Y Y' = Y = 3'6 s 2 = 1' 619936 Y' 5' 4 = Y + 0' 9 . r = b. sX sY sX nos permitirá calcular la desviación típica de X : sY sX −0' 9383. por ejemplo. calculada en el estudio de la relación existente entre dos variables.17 . a) Los coeficientes de correlación y de determinación se obtienen directamente de la proporción de varianza no explicada : 1 .0) y (0. La expresión r = b . Si la distribución de las predicciones de Y tiene como media 3'6 y varianza 1'619936. X = − 0' 9383.0 ⇒ -0'4 = a ⇒ 0 = -0'4 + b. X ) 5'4 = Y + 0'9. Iniciamos aquí una serie de ejemplos que requieren para su resolución el empleo de las diferentes relaciones funcionales (fórmulas para entendernos) tratadas en el tema. sustituyendo sus valores conocidos. Tal vez así podamos obtener los que nos pida el problema.-0'4) . tiene por ecuación Y' = 5'4 .- Y ' = 5'4 − 0'9. X . de la proporción de varianza explicada (hace referencia a la varianza de las predicciones) : r2 = s 2 ' 1' 619936 Y = = 0' 8804 1' 84 s2 Y ⇒ r = 0' 8804 = ± 0' 9383 El coeficiente de correlación será negativo. = − 0' 9783 2 sY 1' 3565 sY Su ecuación es : X' = 5'5217 . b) Siendo X = 5.12 La recta de regresión de Y sobre X.para X = 0'5 Y' = 0 : 0 = a + b. 1º. significa que : .0'5 ⇒ b = 0'4 / 0'5 = 0'8 Regresión y correlación (F. ya que lo es el coeficiente de regresión b (b = -0'9). la expresión de a nos permite obtener la media de X : La varianza de X no puede obtenerse de momento (para extraerla del valor del coeficiente de regresión b necesitamos conocer antes la covarianza o el coeficiente de correlación).2º. Uno podría consistir en dibujar la recta de regresión (enlazando los dos puntos conocidos) observando si es creciente (b > 0 y r > 0) o decreciente (b < 0 y r < 0).0) y (0. X ⇒ X= 5' 4 − 3' 6 =2 0' 9 Siendo 3'6 la media de Y. Así resulta que es creciente y.para X = 0 Y' = -0'4 : -0'4 = a + b. siendo la varianza de la variable dependiente Y igual a 1'84.0'2558 = 0'7442 Luego : Coeficiente de determinación : Coeficiente de correlación : R2 = r2 = 0'7442 r = 0' 7442 = ± 0' 8627 Para determinar si el coeficiente de correlación es positivo o negativo se pueden seguir distintos procedimientos.3º. Partiendo.

b . Es decir : 1 + 3 + 5 + 6 + 11 = 5' 2 5 s2 = Y 12 + 3 2 + 5 2 + 6 2 + 112 − 5' 2 2 = 11' 36 5 r = + 0' 7042 = 0' 8392 s Y = 11' 36 = 3' 3705 De la recta de regresión de Y sobre X deducimos (para las medias) : Y ' = Y = 1' 2 + X ⇒ X = Y − 1' 2 = 5' 2 − 1' 2 = 4 La desviación típica de X la podemos obtener ahora de la relación : r = b. sX sY ⇒ sX = r . 14 A las puntuaciones directas 2 y 6 de la variable X le corresponden predicciones 3'2 y 7'2 respectivamente. Teniendo en cuenta el proceso de tipificación. 18 . Y c) z Y' = 0' 8392. 5 . ¿ a qué puntuación directa de X corresponde ?. siendo b = 1 > 0 . b) Con los valores conocidos de Y calculamos su media. el coeficiente de correlación r también será positivo.b Resolviendo el sistema obtenemos : a = 1'2 b = 1 Y' = 1'2 + X Para el cálculo de la recta de regresión de X sobre Y no disponemos de elementos suficientes de momento. x = 0'8 . Los resultados son los siguientes : Sujeto X Y 1 B 5 2 A 3 3 B 3 4 A 0 5 A 1 6 B 3 7 B 2 8 A 0 9 A 1 10 B 2 Elija y calcule el índice de correlación adecuado para medir la relación existente entre X e Y. Y' = 3'2 : 3'2 = a + 2. tal como se dedujo en el apartado a). varianza y desviación típica : Y= Si la proporción de varianza asociada es del 70'42%. Y = 4 − 0' 7042. z X Para el pronóstico tipificado 1'1868 deduciremos el valor tipificado de X.Regresión y correlación (F.X . Y' = 7'2 : 7'2 = a + 6. Si la proporción de varianza asociada a X es del 70'42% y los valores de la variable dependiente Y son: 1 . Álvarez) . 5' 2 = 0' 3380 3' 3705 sX sY La recta de regresión de X sobre Y tiene por ecuación : X' = 0'3380 + 0'7042 .Para X = 2 . concluiremos que el coeficiente de correlación es también positivo (r = 0'8627). X y' = 0'8 . 2' 8284 + 4 = 8 15 En un grupo de 10 sujetos se han aplicado dos pruebas (X. Las puntuaciones obtenidas en X fueron dicotomizadas por la Mediana formándose dos categorías: altos (A) y bajos (B). a) En la recta de regresión de Y sobre X : Y' = a + b. 3' 3705 = = 2' 8284 1 b ⇒ 2 s X = 2' 8284 2 = 8 a bis) Estamos en condiciones de calcular la recta de regresión de X sobre Y : s r . le corresponde una puntuación diferencial : x = X − X = 4 − 5 = − 1 luego el pronóstico diferencial correspondiente es : y' = 0'8 . x A la puntuación directa X = 4 .Para X = 6 . 2' 8284 r = b'. deduciremos la puntuación directa de X z Y' = 1' 1868 zX = 1' 1868 X− X X−4 = 1' 4142 = = 0' 8392 sX 2' 8284 ⇒ X = 1' 4142. Y ⇒ b' = = = 0' 7042 ⇒ a = X − 0' 7042. s X 0' 8392. s Y 0' 8392. 3 . deducimos que : r2 = 0'7042 y. z X La recta de regresión de Y sobre X en puntuaciones típicas es : z Y' = r . 6 y 11 a) obtenga las ecuaciones de las dos rectas de regresión b) calcule el coeficiente de correlación c) un pronóstico tipificado 1'1868 .La recta de regresión es : en puntuaciones directas : en puntuaciones diferenciales : Y' = -0'4 + 0'8 .Y). (-1) ⇒ y' = -0'8 NOTA : Calculado b = 0'8 > 0.

b) la ecuación de regresión para pronosticar Y a partir de X. c) la proporción de varianza de la variable Y no asociada a la variación de X. A mayor puntuación en la prueba Y menor nivel en X. Sabiendo que el porcentaje de varianza de la variable Y no asociada a la variación de X es 4’545% y que la varianza del error es 0’318297. .X 0 1 2 3 4 5 nA nA. = −0'674 SX 1483 10 10 ' Cierta relación entre las variables. 16 La puntuación estimada de la variable Y para un valor 0 de la variable X es 0’5454. = 0'6364 ⇒ SY = 2'656594 ⇒ SY ' = 0'977 2 . y la varianza de la variable X es 16’5.19 1 . X ⇒ b = = = 0'6364 ⇒ Y' = 0'5454 + 0'6364.2'656594 2 = 6'7366 SY SY (4’5471%) Regresión y correlación (F. Álvarez) .0’04545 = 0’95455 ⇒ r = 0’977 a = 0’5454 0'318297 = 0'04545 ⇒ S 2 = 7'003 ⇒ S Y = 2'646 Y S2 Y S r.2'646 r = b.0 → a = 0'5454 . S 2 = 16'5 . siendo la varianza de esta variable 16’5.X a) b) Resolviendo el sistema anterior : b = 0’63635 r2 = s2 ' y s2 y ⇒ s2 ' = r 2 .X nB nB. El coeficiente de correlación entre X e Y es 0’977. XB = = 3 .0’9772 = 0’045471 . Datos : ⎧2'4545 = a + 3. c) la varianza de las puntuaciones pronosticadas. S e = 0'318297 1 .X X 2 2 0 1 0 0 0 2 0 3 0 0 0 0 2 2 0 1 0 0 4 6 0 5 0 1 2 3 4 5 n 2 2 2 3 0 1 n. b) la varianza de las puntuaciones pronosticadas.r2 = 0’04545 ⇒ r2 = 1 . X → ⎨ ⎩ 3'7272 = a + 5. q = . b a = 0’54545 r = 0'977 S2 = 16'5 X Y’ = 0’54545 + 0’63635. p. X SY SX 16'5 c) 2 2 S 2 = S e + S Y' Y 2 2 2 → S Y ' = S Y − S e = 7'003 − 0'318297 = 6'684703 17 Las puntuaciones estimadas de la variable Y para los valores 3 y 5 de la variable X son 2’4545 y 3’7272 respectivamente. b Y' = a + b. c) SX 16'5 2 ⇒ 0'977 = 0'63635. de signo inverso.S Y 0'977. SX = − 2 2 = 1483 ' 5 5 10 10 rbp = XA − X B 1− 3 5 5 . Con estos datos calcular : a) la ecuación de la recta de regresión. s2 y y r = b.r2 = 1 . Datos : 2 Se Y' = a + b. X = = 2 .X2 0 2 4 9 0 5 0 2 8 27 0 25 5 XA = 5 5 15 10 20 62 5 15 20 62 = 1. X a) b) S2 y 2 = 1 − r 2 = 0'04545 .X n. X → 0'5454 = a + b. hallar : a) la correlación de Pearson entre X e Y.

y que X − Y = 1'74 .14 = 57’85 c) Alta relación entre las dos pruebas (r=-0’85) y de signo inverso. 6 = -0’85 ⇒ r2 = 0’7225 (72’25%) a = 40 .( a + c). Es decir.(. S 2 = − 14 2 = 16 . b) Encuentre la parte de la varianza de LKS asociada a la variación de C. calcule : 20 . Elija y calcule el índice de correlación adecuado para interpretar estos datos. De aceptarla. Escasa relación entre la aceptación y el sexo. Álvarez) .40 ad − bc = = 0'3015 ( a + b).0’25 Sabiendo que Sx a) rxy b) la varianza de las puntuaciones pronosticadas.( c + d ). a) Encuentre la puntuación pronosticada en LKS de un sujeto cuya puntuación directa en C es 15.Y 392 640 602 620 444 2698 A 49 8 B 40 16 C 43 14 D 31 20 E 37 12 70 200 1060 = 14 .X . Y = = 40 .100 . S Y = 6 . Sujetos LKS C Y = LKS X=C X 8 16 14 20 12 70 Y 49 40 43 31 37 200 X2 64 256 196 400 144 1060 Y2 2401 1600 1849 961 1369 8180 X. 40 hombres rechazan el producto mientras que 30 mujeres lo aceptan. 15 = 38’725 b) r = -20’4 / 4 . un sujeto con alta puntuación en LKS tendrá baja puntuación en C 19 La empresa de publicidad “VENDEBIEN” quiere saber si la aceptación o rechazo dependen del sexo.Sy . S X = 4 X 5 5 5 8180 2698 S2 = − 40 2 = 36 .70 − 30. X .40 = −20'4 Y 5 5 X= b = -20’4 / 16 = -1’275 a) Y’ = 57’85 .Regresión y correlación (F.X = 57’85 .( b + d ) 90110. 20 La ecuación de la recta de regresión que permite pronosticar las calificaciones en Psicología Matemática II (Y) a partir de las calificaciones en Psicología Matemática I (X) es la siguiente : Y’ = 0’8. = (4/5).1’275 . Para ello se encuesta a 200 personas de las cuáles el 50% son mujeres. S XY = − 14. c) la proporción de varianza error cometida al pronosticar. el mayor rechazo se produce en mujeres. Sy = 3 .1’275.100. utilizando la recta de regresión anterior. H a=60 c=40 M b=30 d=70 Aceptan Rechazan ϕ= 60. Y. c) Interprete el resultado obtenido al calcular el estadístico que expresa la relación entre LKS y C.1’275).18 Las puntuaciones directas obtenidas por 5 sujetos en la escala LKS (Escala de Lucas) y las obtenidas por esos mismos sujetos en el factor C (Control Social) del PSI son las que figura en la tabla final.

32 = 3'6864 y y 1 . b c) 1 S 2 = .0'642 = 0'5904 (59'04%) 21 La recta de regresión de Y sobre X. a) Calcule la ecuación de la recta de regresión anterior en puntuaciones directas. ¿ Cuál fue su puntuación en la variable X ?.X = 0'3025 − 01543 = 01482 ⇒ S Y' = 0'385 ' ' Y Regresión y correlación (F.r2 = 1 . X → ⎨ ⇒⎨ → Y' = 8 + 2. 0'55 = 0'0385 . para X = -4. sy sx = 0'7. que permite el pronóstico en el rendimiento en un trabajo manual a partir de las puntuaciones en un test de destreza manual. Y’ = 0 b) ⎧ 8=a ⎧a = 8 Y' = a + b.X = S Y . a) b = r. X ⎫ ⎧ X = 7'45 ⎬⇒⎨ ' X − Y = 174 ⎭ ⎩ Y = 5'71 b) c) r = 2 s2 ' y s2 y ⇒ s2 ' = r 2 . S = 3 .S 4 Y 3 ⇒ r2 = 1− 2 = 1− 2 = 4 SY SY S2 e ⇒ r = 0'866 22 Estudiando la relación entre las variables X e Y se obtuvieron los siguientes datos : X = 119 . c) Calcule el coeficiente de correlación entre X e Y sabiendo que la varianza de los errores es la cuarta parte de la varianza de Y. 1 − r 2 = 0'55. b) 1’28 = -3’2815+0’0385. X − 0'25 . X − Y = 1'74 5 Y Y a) ⎫ b = 0'8 ⎪ 2'4 S 4 ⎬ ⇒ r = b.Datos : Y' = 0'8. = 0'64 S X = . s2 = 0'64 2 . n = 10 a) Elena C. S . a) Para X = 0 . Álvarez) . obtuvo una puntuación de 130 en X. S X = 4 . corta al eje de ordenadas en Y’ = 8 y al de abscisas en X = -4. 1 − 0'7 2 = 0'3928 2 2 S 2 ' = S Y − S Y. S x = 10 . SY = 0'55 . X −0'25 = Y − 0'8. b) Se estimó la puntuación 1’28 en la variable Y para Gonzalo S. Y = 1'30 . Y’ = 8 y. rxy = 0'70 . X = 0'8.S 2 e 4 Y 2 ⇒ S e = S 2 .. a = 130 − 0'0385x119 = −3'2815 ⇒ Y' = −3'2815 + 0'0385.3 = 2'4 ⎪ 3 SY ⎭ 5 a = Y − b.X ⇒ X = 118’48 c) S Y.21 . Estime su puntuación en Y. X ⎩b = 2 ⎩0 = a − 4. c) Determinar el valor de Sy.(1 − r 2 ) Y 1 2 . X ⇒ ' 10 ⇒ Y' = −3'2815 + 0'0385130 = 1'7235 . en puntuaciones directas.x y la desviación típica de las puntuaciones pronosticadas (Sy’). b) Represente gráficamente la recta de regresión anterior.

Σx = Σy = 0 a) ¿Cuánto valdrá el coeficiente de correlación de Pearson entre X e Y ?. X = = 5'6 .b’ = r2 ⇒ 5. lógicamente. 24 Sabemos que las puntuaciones diferenciales pronosticadas (y’) son cinco veces las puntuaciones diferenciales de la variable X. De aceptarse la relación diríamos que los alumnos que siguen el método B obtienen mejores resultados (signo negativo de r). Elija. y que la proporción de varianza asociada entre X e Y es igual a 0’25.23 La siguiente gráfica muestra las calificaciones obtenidas por dos grupos de alumnos que han estudiado con dos métodos de enseñanza distintos (A y B). Una cuantitativa (calificación) y la otra dicotómica (método). p. calcule e interprete el coeficiente de correlación más adecuado para estudiar la relación entre el método de enseñanza y las calificaciones. XA = 20 36 56 = 5 . c) La pendiente de la recta de regresión de X sobre Y en puntuaciones directas. XA 2 4 6 8 XB 2 4 5 6 9 10 36 4 16 5 25 6 36 9 81 10 100 56 382 20 X X2 2 4 4 16 6 36 8 64 2 4 Biserial puntual (rbp). Sabiendo además que X e Y son dos variables cuantitativas que mantienen una relación lineal y que. Σx2=400 . Datos : a) b) c) b=5 y’ = 5x r2 = 0’25 ⇒ r = 0’5 r = 2 s2 ' y s2 y = 0'25 b. = −0187 ' SX 2'61 10 10 r2 = 0’035 (3’5%) Existe una relación muy baja (del 3’5%) entre el método seguido y las calificaciones. XB = = 6. Recordemos que : 22 .b’ = 0’25 ⇒ b’ = 0’25 / 5 = 0’05 25 Para un grupo de 100 sujetos y en dos variables X e Y. Álvarez) . S X = 4 6 10 rbp = 382 − 5'6 2 = 2'61 10 XA − X B 5− 6 4 6 . Calcular : a) La pendiente de la recta de regresión de Y sobre X en puntuaciones directas y diferenciales. q = . b) ¿Cuánto valdrá la desviación típica de los errores cometidos al pronosticar Y a partir de X ?.Regresión y correlación (F. c) ¿ Qué puntuación directa pronosticaremos en Y a un sujeto que ha obtenido una puntuación x=-2 ?. disponemos de los siguientes datos : Σxy=480 . Se sigue en el enunciado la notación usual de representación de puntuaciones directas (mayúscula) y diferenciales (minúscula). Σy2=ΣY=900. b) La pendiente de la recta de regresión de Y sobre X en puntuaciones típicas. .

¿ qué conclusión obtendrá el gabinete de estudios ?.X2 147 720 1734 1936 1458 12 XA = 159 8 166 20 325 5995 159 166 325 5995 = 13'25 . Álvarez) .14 15 . y la aceptación o rechazo del mismo. que 250 no consumen drogas ni han estado implicados en delitos contra la propiedad y que la muestra constaba de 500 individuos. Regresión y correlación (F.x .X i N −X2 ∑ n . de signo inverso.19 20 . ∑ ni .V. Elija y calcule el índice de correlación adecuado para interpretar estos datos. 1 − 0'8 2 = 18 ' En puntuaciones diferenciales : y’ = b. (-2) = -2’4 Como : sy 3 = 0'8.S XY = .X nR nR. . 1 − r 2 = 3. A mayor duración mayor rechazo.23 .x = s y . con b = r . SX 5'974 20 20 Cierta relación entre las variables.Yi i En puntuaciones diferenciales i − X) N i 2 i − X . X R = = 20'75 . = 12 ' sx 2 y' = Y'− Y ⇒ Y' = y'+ Y = y'+ ∑ Y = −2'4 + 900 = −2'4 + 9 = 6'6 N 100 26 La empresa de publicidad “VENDEBIEN” quiere saber si existe relación entre la duración de un anuncio en T.X 21 60 102 88 54 n. Los resultados de la encuesta se incluyen en la siguiente tabla. (Elija. Para x = -2 : y’ = 1’2 .Y S XY = 2 SX = ∑ n .24 25 . y i i i i N 2 N = ∑ n . S X = − 16'252 = 5'974 12 8 20 20 X − XR 13'25 − 20'75 12 8 rbp = A .(X i i N = ∑ ni . 27 El gabinete de estudios sobre “Malestar Social” desea conocer si existe relación entre la consumición de drogas y la comisión de delitos sobre la propiedad.(X i − X )(Yi − Y ) i En puntuaciones directas 2 SX = ∑ n .x . Para ello se selecciona una muestra y se comprueba que 50 individuos han consumido algún tipo de droga y a la vez han estado implicados en delitos contra la propiedad.X X 3 4 4 1 0 21 48 68 22 0 0 1 2 3 2 0 12 34 66 54 7 12 17 22 27 n 3 5 6 4 2 n. Teniendo en cuenta que un 20% de la muestra ha cometido delitos contra la propiedad. calcule e interprete el coeficiente de correlación adecuado). p. X i .x i i 2 i N a) Para puntuaciones diferenciales : s xy ∑ xy = 480 = 4'8 = n 100 sx = ∑ x2 n 400 = =2 100 sy = ∑ y2 n = 900 =3 100 r = 4’8 / 2'3 = 0’8 b) c) se = s y. q = = −0'615 . Duración 5-9 10 . X = = 16'25 .29 Aceptación 3 4 4 1 0 Rechazo 0 1 2 3 2 X 5-9 10-14 15-19 20-24 25-29 7 12 17 22 27 nA nA.

13 8 .X nH nH.200.( b + d ) 100.11 6-8 3-5 0-2 Y fA 40 40 0 0 fB 0 0 10 10 X X 0-2 3-5 6-8 9-11 1 4 7 10 nA nA. la mayor calificación se produce en mujeres.X X 0 0 40 40 0 0 280 400 10 10 0 0 10 40 0 0 1 4 7 10 n 10 10 40 40 n. Los datos obtenidos aparecen en la siguiente tabla. fA significa frecuencia con alto prejuicio y fB frecuencia con bajo.( c + d ). calcule e interprete el coeficiente de correlación adecuado. la mayor comisión de delitos se produce en consumidores de drogas.X X 2-4 5-7 8-10 11-13 3 6 9 12 1 5 6 8 3 30 54 96 6 6 5 3 18 36 45 36 3 6 9 12 n 7 11 11 11 n.X2 10 160 1960 4000 80 XA = 680 20 50 100 730 6130 730 6130 680 50 = 8'5 .Delito SI Delito NO Droga SI a=50 c=150 Droga NO b=50 d=250 ϕ= . X = = 7'95 . X B = = 2'5 . = 0'377 SX 3186 ' 40 40 Muy débil relación entre las variables. X H = = 6'75 . Elija razonadamente.X2 63 396 891 1584 20 XM = 183 20 135 40 318 2934 183 135 318 2934 = 9'15 . S X = − 7'952 = 3186 ' 40 40 20 20 rbp = XM − XH 9'15 − 6'75 20 20 .300 Escasa relación entre consumo de drogas y comisión de delitos. En este cuadro. p.X 10 40 280 400 n. X 11 . Álvarez) . Calcule el coeficiente de correlación elegido y comente brevemente el resultado obtenido. = 0'848 SX 2'83 100 100 Elevada relación entre las variables. X = = 7'3 . y “prejuicio antiprotestante” (Y). ad − bc 50.10 5-7 2-4 Mujeres 8 6 5 1 Hombres 3 5 6 6 X nM nM.X 21 66 99 132 n.250 − 50150 = 0144 ' = (a + b). . 29 Elija el coeficiente de correlación más apropiado entre las variables “puntuaciones en un test de inteligencia” (X).X nB nB. p. q = . 24 .400. S X = − 7'32 = 2'83 80 20 100 100 rbp = XA − X B 8'5 − 2'5 80 20 .( a + c). A mayor puntuación en el test mayor prejuicio antiprotestante. . 28 Un grupo de hombres y mujeres responde a una prueba (X). de signo directo. 9 . teniendo en cuenta el cuadro adjunto. De aceptarse. para estudiar la relación entre las puntuaciones de la prueba y la variable sexo. De aceptarla. q = .Regresión y correlación (F. de signo directo.

son hijos únicos que no comen en el Colegio. una proporción de 0’6 comían en el Colegio. 32 La desviación típica de un determinado grupo de personas en la variable ansiedad (X) es igual a 2. S Y = 2 . a) b = r. Regresión y correlación (F.X = 4 − 144 = 2'56 ' sy b) S Y. p. También conocemos para esta variable la media de los varones (10) y la de las mujeres (5). q = = 0'4 ⇒ p. Relación perfecta. rxy = 0'8 .5. ¿ Existe una relación entre ser hijo único o no y comer o no en el Colegio ?. Y = 6 .20) 1 5 18 2 [20. con respecto al total. Halle el coeficiente de correlación que corresponda e interprete el resultado. No existe ningún tipo de relación entre ser hijo único y comer en el colegio. n = 5 a) ¿ Qué puntuación directa en Y pronosticaremos a un sujeto que obtuvo una puntuación directa en X de 52 ?.10) 0 0 5 3 Y [10.30) 0 20 6 1 [30. Sabiendo que el índice de asociación entre las variables ansiedad y sexo es igual a +1.2 . 33 0 X 1 2 3 [0.X = S Y .( c + d ). ad − bc =0 = (a + b). = 0'267 .30 Estudiando la relación entre las variables X e Y se obtuvieron los siguientes datos : X = 50 . c) Calcule la proporción de varones que componen nuestra muestra. De los 50 alumnos. a) b) Biserial puntual (rbp). rbp = c) xv − xm 10 − 5 2 . Los varones presentan altas puntuaciones en ansiedad y las mujeres bajas. a = 6 − 0'267 x50 = −7'35 ⇒ sx 6 Y' = −7'35 + 0'267. y que el número de varones es superior al de mujeres : a) ¿ Qué coeficiente de correlación habrá sido utilizado ?. ⇒ 2 = 0'8. X ⇒ Y' = −7'35 + 0'267 x52 = 6'534 2 2 2 S Y ' = S Y − S Y. q = 1 = . 1 − r 2 = 2.20.( b + d ) 30. p.25 .(a + c). S x = 6 .40] 16 3 0 0 Con la presente distribución bivariante obtenga : a) recta de regresión de la media de Y condicionada a X b) coeficiente de correlación de la media de Y condicionada a X c) recta de regresión de Y sobre X d) coeficiente de correlación lineal (de Y sobre X) e) razón de correlación. Álvarez) . Si sabemos que una proporción de 0’04.x ?. 1 − 0'8 2 = 12 ' 31 Estudiando una muestra de 50 alumnos de BUP se observó que una proporción de 0’10 estaba compuesta por alumnos hijos únicos. q = 016 ' 2 5 sx 1 ± 1 − 0'64 1 ± 0'6 ⎧ p = 0'8 = =⎨ 2 2 ⎩ p = 0'2 ' ' ' p.(1 − p) = 016 ⇒ p − p 2 = 016 ⇒ p 2 − p + 016 = 0 ⇒ p = La solución es 0’8 al indicar que hay más varones que mujeres.45 Las variables son independientes. Compare los resultados obtenidos en los apartados a).) b) ¿ Cuánto valen S2 y' y S y. b) Interprete el valor del coeficiente de correlación. Interprete el significado de la razón de correlación calculada. q ⇒ p. Único SI a=3 c=2 Único NO b=27 d=18 Comen SI Comen NO ϕ= 318 − 27. Una cuantitativa y la otra dicotómica. b) con los de los apartados c). d).

Y2 Σ n.10) X=2 y f f.X.y f.y f.Regresión y correlación (F.Y 0 15 0 560 0 75 500 105 25 270 150 0 15 30 25 0 n.X2 Σ n.10) [10.40] 35 0 0 0 Y (*) 33'8 24'3 15'3 11'7 n 17 28 29 6 Σ = 17 Σ = 575 Σ = 2185 Σ = 28 Σ = 680 Σ = 17300 Σ = 29 Σ = 445 Σ = 7925 5 3 15 75 Σ=6 Σ = 70 Σ = 1150 Con las tablas de cálculos anteriores obtenemos : X=0 X=1 X=2 X=3 y 1 = 33'8 y 2 = 24 '3 y 3 = 15'3 y 4 = 11'7 s 21 y 2 sy 2 s23 y s24 y = 22 '1453 = 28'0612 = 37 '8121 = 55'5556 * Medias de cada Y condicionado a X Con esta distribución procedemos a calcular la recta de regresión y el coeficiente de correlación (omitimos la tabla de cálculos) : Σ n.Y 0 0 0 0 0 75 500 105 50 540 300 0 45 90 75 0 80 104 198 1770 46200 1780 26 .X.20) 15 2 30 450 25 0 0 0 [20.40] X=0 y f f.40] 35 0 0 0 [30. [0.10) X=3 y f f.Y Σ n.20) 15 5 75 1125 [10.y2 5 0 0 0 [0.y 2 15 1 15 225 [10.40] 35 3 105 3675 [30.X² 0 0 0 0 0 5 20 3 20 72 24 0 27 18 9 0 n.30) 25 6 150 3750 [20.y2 5 0 0 0 [0.X Σ n.8'2989.30) [30.20) 15 18 270 4050 [10.Y² 0 225 0 19600 0 1125 12500 3675 125 4050 3750 0 75 450 625 0 n.y f.a) b) Para cada valor de la variable X.y2 5 5 25 125 [0.30) 25 20 500 12500 [20.30) 25 1 25 625 X 0 1 2 3 ( ) 35 16 560 1960 [30.10) X=1 y f f.X Coeficiente de correlación de la media de Y condicionada a X 2 r = -0'9856 (r = 0'9714) X 0 0 0 0 1 1 1 1 2 2 2 2 3 3 3 3 Y 5 15 25 35 5 15 25 35 5 15 25 35 5 15 25 35 n 0 1 0 16 0 5 20 3 5 18 6 0 3 2 1 0 n.X 0 0 0 0 0 5 20 3 10 36 12 0 9 6 3 0 n.Y c) d) = = = = = 104 198 1768'9 43565'15 1778'4 Media de X = 1'3 Varianza de X = 0'785 Media de Y = 22'11 Varianza de Y = 55'657 Covarianza = -6'5146 Recta de regresión de la media de Y condicionada a X Y' = 32'8998 . determinamos la media de los correspondientes valores de Y.20) [20. Obtendremos también las varianzas de cada valor Y para calcular posteriormente la razón de correlación (apartado e).y f. Álvarez) .

Esta última conclusión habríamos deducido al comprobar que las rectas de ajuste de Y sobre X y la de la media de Y condicionada a X prácticamente coinciden : Y' = 32'91 . Y es de tipo lineal.27 .21. 5'0075). calculamos el coeficiente de correlación ϕ (phi) . a) Siendo las dos variables dicotómicas. ha permitido aumentar el valor del coeficiente de correlación : r = -0'7836 r = -0'9856 incrementando así la proporción de varianza explicada por el ajuste : 2 r2 = 0'9714 (97'14%) r = 0'6141 (61'41%) • 34 De un grupo de COU. 1º Calculamos los productos : a. . 12 = 180 y b.∑ 2 i = 1 − .s y 1 1 17. al cuál corresponde un coeficiente 0'56 + R.55'5556 η = 1 − . .c = 4 . 2º Como a.12 − 4.c = 180 / 36 = 5 (rt será positivo) 3º Consultamos la tabla XXV.d > b.c . Dispuesta la tabla como sigue (totalizando filas y columnas) obtenemos : Y . 9 = 36.d = 15 . b) Asumiendo que las calificaciones en Matemáticas y en Filosofía se distribuyen normalmente. determine otro coeficiente que estudie el nivel de asociación y no esté basado en el concepto de correlación de Pearson Se trata de analizar la relación que puede existir entre las calificaciones en las dos materias.B) = (4'8305 . Álvarez) .8'2962. = 0'6317 N 80 87'9844 sY 2 2 Conclusiones : • • • Comprobamos que η2 toma un valor comprendido entre 0 y 1 y verifica que η2 ≥ r2 (0'6317 ≥ 0'6141).37'8121 + 6.(B − A) 100. El aprobar o suspender una materia no condiciona el resultado final en la otra. integrado `por 40 alumnos.22'1453 + 28.8'2989. conocemos sus calificaciones finales en Matemáticas y en Filosofía.9 19.X La sustitución de las observaciones Yi por su promedio.28'0612 + 29. concluimos que la relación entre las variables X . b) Siendo las dos variables dicotómicas (normalmente distribuidas inicialmente). localizando el cociente C=5 en el intervalo (A.X Y' = 32'8998 . suspendiendo 12 las dos materias.d / b.Filosofía 1 (Aprueban) 0 (Suspenden) a = 15 b=4 c=9 d = 12 24 16 X Matemáticas 1 (Aprueban) 0 (Suspenden) 19 21 ϕ= (a + b )(c + d )(a + c )(b + d ) . a) Calcule el coeficiente de correlación más adecuado para medir el grado de asociación existente entre las variables descritas. mientras que sólo aprobó Matemáticas el 10% de los alumnos. calculamos el cociente : C = a.(5'0075 − 4'8305) Generalmente se verifica que el coeficiente de correlación tetracórica y el coeficiente ϕ verifican la relación : Regresión y correlación (F.Media de X = 1'3 Varianza de X = 0'785 Media de Y = 22'125 Varianza de Y = 87'9844 Covarianza = -6'5125 e) Razón de correlación : Recta de regresión de Y sobre X Y' = 32'91 . para el cálculo del coeficiente de correlación tetracórico. De aquí : R= NOTA : C−A 5 − 4'8305 = = 0'00958⇒rt = 0'56 + R = 0'56 + 0'00958 = 0'56958 100. calculamos el coeficiente de correlación tetracórica (rt). El número de aprobados en ambas ascendió a 15.24.16 = 0'3679⇒ baja relación entre las variables. Al ser muy próximo η2 a r2. ad − bc = 15.X Coeficiente de correlación lineal 2 r = -0'7836 (r = 0'6141) ni .8'2962.

( 6 2 − 1) 6 .6) P (1.(6 − 1) 15 2 2 28 . podremos medir el grado de asociación : ϕ≈ rt 0'56958 = = 0'37972 15 ' 15 ' ⇒ baja relación entre las variables 35 Con el fin de estudiar si existe o no relación entre las calificaciones en Matemáticas y en Filosofía de COU. 24 = 0'3143 Es decir. Clasificados por orden de puntuación final en cada materia resultó : Alumno Matemáticas Filosofía 1 3º 3º 2 6º 5º 3 4º 6º 4 1º 4º 5 2º 1º 6 5º 2º a) Utilizando el índice adecuado. 0'3679 = 0'55185 ≈ rt Esto permite tener una referencia sobre el intervalo (-1 . ∑ d 2 = 1− 6. Denominamos X e Y a las variables que proporcionan.2) P (1. seleccionamos seis alumnos.rt ≈ 1'5 .2) I (4. Np − Ni 8−4 4 = = = 0'2667 n.6) P (4.Regresión y correlación (F. las clasificaciones en Matemáticas y en Filosofía. como ocurrió con el coeficiente ρ. contando una permanencia (P) si Y < Yi y una inversión (I) si Y > Yi. ϕ = 1'5 . respectivamente.( n − 1) 6.5) P (2. apenas existe relación entre las calificaciones. b) Resuelva lo solicitado en el apartado anterior mediante un índice que no esté basado en el concepto de correlación de Pearson a) Calcularemos el coeficiente de correlación ρ (rangos de Spearman) al presentarse dos variables ordinales (dos reordenaciones de los 8 alumnos). ( N 2 − 1) 6.5) P (3. En nuestro caso : 1'5 . : X 1 2 3 4 5 6 Y 4 1 3 6 2 5 (4.3) P (1.2) I (3. Con ello : τ= Es decir.5) P En total hemos encontrado 8 permanencias (P) y 4 inversiones (I). menores o iguales a 0'5). basado en el concepto de correlación de Pearson. ϕ (con mayor rigor para valores del coeficiente tetracórico. Calculando el valor aproximado de ϕ .5) P (1. establezca el grado de relación que existe entre las calificaciones de las dos asignaturas. 1). Álvarez) .3) I (4. existe una escasa relación entre las calificaciones en Matemáticas y Filosofía. a la hora de interpretar el valor obtenido con el coeficiente de correlación tetracórica.6) P (3. Ordenando las primeras (X). b) Procede ahora el cálculo del coeficiente de correlación τ (tau) de Kendall : Reordenamos los pares de observaciones de modo que la variable X (primer elemento del par) quede en orden ascendente y comparamos cada valor de Y con los Yi siguientes. calculamos sus diferencias con las segundas : X 1 2 3 4 5 6 Y 4 1 3 6 2 5 d -3 1 0 -2 3 1 d2 9 1 0 4 9 1 24 Con ello : ρ = 1− N.1) I (4.

p.X 6 15 48 20 24 16 129 n. q (Tabla XXIII). 0'833. si sumamos 5 a todos los valores de X. que resulta ser igual a 0'55609 .X2 12 45 192 100 144 128 621 Y=1 n. Y Filosofía A S 2 1 5 0 10 2 4 0 3 1 1 1 X Matemáticas 2 3 4 5 6 8 a) utilizando el índice adecuado. a) Al ser dicotómica la 2ª variable.36 Con el fin de estudiar si existe o no relación entre las calificaciones en Matemáticas y en Filosofía de COU. que las rectas de regresión de Y sobre X en puntuaciones directas y típicas son. zx Sabiendo que : X = 5 . c) La recta de regresión de Y sobre X. b) La recta de regresión de Y sobre X.0'55609 = −0'2244 1487 ' sX f ( z) Aunque no coincide su valor con el coeficiente de correlación biserial puntual. respectivamente : Y' = 1'2 . X + 4 zy' = 0'8 . S Y = 3 . utilizando el criterio de mínimos cuadrados. basado en el concepto de correlación de Pearson. seleccionamos 30 alumnos analizando la puntuación final en cada materia .X1 4 15 40 20 18 8 105 Y=0 n. Álvarez) . Teniendo en cuenta que se nos proporcionó en Filosofía solamente si el alumno aprobó (A) o suspendió. en puntuaciones directas. Y = 10 .0167 = −01505 ' ' 1487 ' sX Es decir apenas existe relación entre ambas variables. calcular : a) La varianza de las puntuaciones pronosticadas en Y. f ( z) X1 − X 0 p. 0'167) = 0'167 obtenemos el valor tabulado del cociente Con esto : p. 37 Hemos encontrado. b) Calculemos ahora el coeficiente de correlación biserial rb : Tomando el menor de los valores de p y q : min (p. b) mediante un índice que no esté basado en el concepto de correlación de Pearson.X0 2 0 8 0 6 8 24 105 = 4'2 25 129 X= = 4'3 30 X1 = Con esto : 5 24 25 q= = 0167 ' = 4'8 p= = 0'833 30 5 30 621 − 4'32 = 2'21 ⇒ s X = 2'21 = 1487 ' s2 = X 30 X0 = rbp = X1 − X 0 4'2 − 4'8 . obtendremos el coeficiente de correlación biserial puntual : Y A=1 X 2 3 4 5 6 8 2 5 10 4 3 1 25 S=0 1 0 2 0 1 1 5 n 3 5 12 4 4 2 N=30 n. si sumamos 3 a todos los valores de Y y multiplicamos por 2 todos los valores de X. q 4'2 − 4'8 rb = = . q = .q) = min (0'833 .29 . . establezca el grado de relación que existe entre las calificaciones en dichas materias. también podemos concluir que apenas existe relación entre ambas variables. en puntuaciones directas. S X = 2 . Regresión y correlación (F.

r 2 = 32 . calcule e interprete el coeficiente de correlación adecuado a dicho estudio. X = 10 − 12 .2. 30 . sobra del enunciado el conocer una de las dos desviaciones típicas.550. S XY 2 = . la nueva media se multiplica por 2. 10 = 7 → Y' = 7 + 0'6. b = 1'2 y una de las desviaciones típicas (de X o de Y). S XY = 4' 8. la nueva media se incrementa en 5. 2 = 10 . pero las medidas de dispersión se mantienen inalterables. pero las medidas de dispersión se mantienen inalterables.3 = 4'8 Varianza de los pronósticos : SY' Obtenida de la relación que proporciona la proporción de varianza explicada por el ajuste : S2 ' Y 2 = r 2 → S 2 ' = S Y . Si los valores de X los multiplicamos por 2. Y = 10 + 3 = 13 . X ' ' b= S XY S2 X → 2. SY = 3. r= a) SX SY Su conocimiento permite obtener la covarianza (cuyo cálculo tampoco resulta imprescindible) : S XY S X . 10 = −2 → Y' = −2 + 12. calculamos el coeficiente de correlación ϕ (phi) .50 = 0'798 550. Para ello se analiza una muestra de 1000 personas del INSERSO encontrándose que de todas ellas un 50% presentan simultáneamente diabetes y ceguera. S X = 2 .450 ⇒ alta relación entre las variables. S X = 2 .La recta de ajuste en puntuaciones típicas nos proporciona el coeficiente de correlación : r = 0'8 En consecuencia. SY 2 ⇒ S XY = r. Álvarez) . Siendo las dos variables dicotómicas. Resulta así : X = 5 . S X .0'8 2 = 5'76 Y S2 Y b) Si a los valores de X les sumamos 5. X 38 Se desea estudiar si existe relación entre `padecer diabetes y ceguera en la tercera edad. b = 0'6 2 2 . la nueva media se incrementa en 3.( a + c) .Ceguera 1 (Padece) 0 (No padece) a = 500 b = 50 c = 50 d = 400 550 450 X Diabetes 1 (Padece) 0 (No padece) 550 450 ϕ= ad − bc ( a + b) . • Padecen ambas 50% de 1000 500 • No padecen ninguna 40% de 1000 400 • Padecen sólo diabetes La mitad de los 100 restantes 50 • Padecen sólo ceguera La mitad de los 100 restantes 50 Dispuesta la tabla como sigue (totalizando filas y columnas) obtenemos : Y . S XY = 4' 8 Luego : c) Si a los valores de Y les sumamos 3. X = 13 − 0'6 . 2 = 4 . S2 4 X a = Y − b.Regresión y correlación (F. Y = 10 . Resulta así : X = 5 + 5 = 10 . 2 = 9'6 Luego : b= S XY = 1'2 S2 X a = Y − b.( b + d) = 500. Se trata de analizar la relación que puede existir entre las dos enfermedades. SY = 3.( c + d).400 − 50. Conocido r = 0'8 . El padecer o no una dolencia condiciona el padecer la otra. Con estos datos elija. y las medidas de dispersión también (la varianza por el cuadrado).450. el 40% no presentan ninguna de ambas deficiencias y el resto presentan en la misma medida sólo una u otra deficiencia. la otra la habríamos calculado a partir de la relación : r = b. SY = 0'8.

a) Calcular la recta de regresión de Y sobre X. Álvarez) . b) Calcular e interpretar el coeficiente de correlación lineal c) Determinar la proporción de varianza asociada a X. 5 Edad [10. b) Obtener la recta de regresión de Y sobre X en puntuaciones diferenciales.15) [10.20) [15.EJERCICIOS PROPUESTOS 1 X 4 4 5 6 6 6 Y 0 1 2 2 3 4 n 3 5 6 2 8 1 De la presente distribución conjunta de las dos variables (X. 3 De los 10 pares de valores que se representan en el diagrama de dispersión de la izquierda. c) Calcular la proporción de varianza residual. Regresión y correlación (F. 6 Las siguientes distribuciones bivariantes pretenden estudiar el grado de relación existente entre las variables : a) Puntuación en un test de agresividad y sexo.Y) : a) Obtener la recta de regresión de Y sobre X. d) Calcular la media y varianza de las predicciones Y'.15) [10.15) [15. Calcular e interpretar la proporción de varianza residual. Calcular e interpretar el coeficiente de correlación lineal. 2 Y 0 1 2 2 3 0 0 4 1 6 2 6 0 4 4 8 0 0 5 X De la presente distribución conjunta de las variables (X..25] [20. c) Ser bebedor y ser fumador.Y) : b) b) c) Obtener la recta de regresión de Y sobre X en puntuaciones diferenciales. Obtener la recta de regresión de X sobre Y en puntuaciones típicas.Y) : a) Calcular la frecuencia que falta sabiendo que la media de X es igual a 4.20) [20. Determine y calcule en cada caso el índice adecuado que permite medir el grado de relación entre las variables descritas. b) Clasificación (de mayor a menor) según la nota media obtenida en las asignaturas del curso y en una prueba tendente a determinar su coeficiente intelectual. .25] Hermanos 0 1 2 1 2 1 2 n 3 5 9 5 10 3 5 De la distribución de edades y número de hermanos de 40 jóvenes : a) c) Obtener las rectas de regresión en puntuaciones directas. b) Calcular e interpretar el coeficiente de determinación. c) Calcular su varianza residual. 4 Y 3 4 5 0 0 3 5 1 1 7 2 5 15 1 3 12 2 0 X De la presente distribución conjunta de las variables (X. diferenciales y tipificadas.31 .

10 Determinar las ecuaciones en puntuaciones diferenciales de las rectas de regresión correspondientes a la distribución bivariante (X. en un ajuste de Y sobre X.10) [10. 1’5) . (12 . diferenciales y típicas. 1 2º 3º (III) Beben Sí No 2 4º 4º 3 5º 6º 4 1º 1º 5 6º 5º 6 3º 2º Fuman Sí No 4 31 41 14 7 La proporción de varianza residual. b) Calcule el coeficiente de correlación. (11. A la vista de estos datos.la varianza de la variable dependiente es igual a 2'2857. y que tienen por varianzas 0'1538 y 0'6154. b) Proporción de varianza no asociada a X.Regresión y correlación (F. correspondientes al ajuste de Y sobre X en la distribución anterior. (14 . calcule : a) Ecuaciones de las dos rectas de regresión en puntuaciones directas. c) ¿ Qué pronóstico diferencial corresponde a una puntuación directa X=5. si X = 0 ?.30) [30. calcular : a) Ecuación de la recta de ajuste. 2) . 7) calcular la proporción de varianza que explica el ajuste de Y sobre X.la recta de ajuste de Y sobre X pasa por el punto (2. determine el coeficiente más adecuado para medir el grado de relación de la edad con la superación o no del examen. 14 X Y f 0 -6 3 1 -2 6 1 -1 11 1 1 16 2 3 3 3 8 1 3 9 4 5 12 2 Determine la varianza de los errores y de las predicciones.60) Sexo Hombre Mujer 0 2 5 3 11 9 20 22 14 9 6 6 (II) Alumno Nota media C.20) [20.0'3). 5) . (14 . a) calcule las ecuaciones de las dos rectas de regresión b) determine el error típico de la predicción. se conoce que : . 9) . 9 De los cálculos realizados para estudiar la relación existente entre las variables X e Y.50) [50. (12. 6’5) .las media de X es igual a 1 y la de Y vale 4 . (10. Sabiendo que aprueban 5 con edades : 28. d) Varianza residual y de las predicciones. 11 En el estudio de la relación lineal existente entre dos variables X e Y. Sabiendo que sus respectivas medias son iguales a 2 y 1. ( 11 . ( 11. 7) .Y).2) . a) Determine dicha recta de ajuste sabiendo que a una puntuación directa X=2 corresponde una predicción 2'1 y que dicha recta corta al eje de ordenadas en el punto (0. 32. sabiendo que las varianzas de ambas variables son 4 y 9 respectivamente y que existe una relación lineal perfecta y directa entre ellas. 13 Para los siguientes pares de valores de las variables X e Y : (12 . 12 Analizamos las edades de 8 personas que acuden a un examen para la obtención del carnet de conducir.40) [40. 45 y 30 y que los que suspenden tienen 23. Álvarez) . 8’5) . c) Media y varianza de la variable X. (10 .I. es del 22'12%. y la de las predicciones es 1'9047. 32 . Sabiendo que la proporción de varianza asociada al ajuste es del 94’65% y que la variable dependiente tiene por media 8’2 y varianza 15’36. 3) . 4) . 8 En el estudio de la relación lineal existente entre dos variables X e Y se observó que eran independientes. 24. 21 y 27 años.(I) Puntos test [ 0. b) Coeficiente de correlación. sabemos que a las puntuaciones directas 0 y 2 de X le corresponden unos pronósticos respectivos 3’3243 y 7’7567.

El profesor encargado ordenó tales calificaciones de mayor a menor puntuación. b) con los de los apartados c). 18 Determine y calcule en cada uno de los siguioentes supuestos. Sabiendo que la proporción de varianza de la variable Y no asociada a la variación de X es del 17’32%. calcular : a) la ecuación de la recta de regresión de Y sobre X. d).15 En un grupo de 10 alumnos se han obtenido las calificaciones en Anatomía. f) Compare los resultados obtenidos en los apartados a). Interprete el significado de la razón de correlación calculada.33 . y la varianza de la variable independiente es 2’9375. b) la varianza de las puntuaciones pronosticadas y la varianza residual. c) el coeficiente de correlación entre X e Y 17 Y 0 1 2 1 6 0 2 2 8 7 0 3 3 10 5 4 0 1 8 5 1 0 6 X Con la presente distribución bivariante obtenga : a) recta de regresión de la media de Y condicionada a X b) coeficiente de correlación de la media de Y condicionada a X c) recta de regresión de Y sobre X d) coeficiente de correlación lineal (de Y sobre X) e) razón de correlación. Álvarez) . (I) X -2 -1 0 1 2 0 6 4 2 0 1 Y 1 1 4 6 5 8 (II) (ordinales) X Y A C B F C D D E E A F B (III) X 1 0 1 2 50 Y 0 40 8 Regresión y correlación (F. el índice adecuado (no basado en el concepto de correlación de Pearson) que permita medir el grado de asociación entre las variables X e Y. 16 Para los valores 0 y 2 de la variable X se obtuvieron unos pronósticos de la variable dependiente iguales a 6’8617 y 14’0531 respectivamente. separando el ejercicio teórico del práctico. encontrando los resultados siguientes : Alumno Clasificación teoría Clasificación práctica 1 6 6 2 2 10 3 7 4 4 10 3 5 4 9 6 1 7 7 8 2 8 5 5 9 9 1 10 3 8 Elija y calcule el índice de correlación adecuado para medir si existe relación o no entre las calificaciones en las dos partes del examen.

2 X = 1'28 a) a = 2'6871 b) R2 = r2 = 0'5711 c) s 2 = 1'5097 Y. x zy' = 0'909 . zx La proporción de varianza no explicada por X supone el 17'37% de la de Y. y 34 . x Y = 1'6508 s 2 = 0'9257 Y s XY = -0'5238 5 X = 16'375 s 2 = 14'3594 X Y = 1'525 s 2 = 0'3994 Y s XY = 0'4656 a = 0'994 b = 0'0324 a' = 14'597 b' = 1'1659 r = 0'1944 y' = 0'0324 . zy 10 y' = 1'5 .r2 = 0'1667 y' = -2 .0'6154 7 a) Y = 0'3 + 0'9 . X b) r = 0'8825 c) y' = 4'5 8 a) Y' = 1 X' = 2 b) sY.X = sY = 0'7845 9 a) Y' = 6 . Álvarez) . x x' = -0'4167 . X b = 1'9632 Representa la proporción de varianza de Y explicada por X (el 57'11%) 3 X = 5'5 a) a = 1'9333 b) r = 0'8188 c) R2 = r2 = 0'6704 d) Y ' = Y = 4’05 s 2 = 8'25 X Y = 4'05 s 2 = 1'8225 Y s XY = 3'175 Y' = 1'9333 + 0'3848 .2 .0'4167 . X X' = 2'6667 . zx zx' = -0'9129 .y zx' = 0'1944 .r2 = 0'1737 s 2 = 0'7456 X Y = 1'96 s 2 = 1'1584 Y s XY = 0'8448 y' = 1'133 . X b = 0'3848 Elevada relación entre las variables (de tipo directo) s 2 = 1'2218 Y' 4 X =4 a) n = 12 b) b = -0'9167 c) 1 . zy Las variables no están relacionadas linealmente (son independientes) b) r = 0'1944 6 (I) (II) (III) Coeficiente biserial puntual Coeficiente ρ de los rangos de Spearman Coeficiente ϕ rbp = 0'0389 ρ = 0'8857 ϕ = .X s 2 = 0'5216 X Y = 5'2 s 2 = 3'52 Y s XY = 1'024 Y' = 2'6871 + 1'9632 . Y b) 1 .r2 = 0'4813 s 2 = 0'5714 X y' = -0'9167 . x zy' = 0'1944 . zx a) Y' = 0'994 + 0'0324 . x x' = 0'6667 . Y x' = 1'1659 . X X' = 14'597 + 1'1659 .SOLUCIONES DE LOS EJERCICIOS PROPUESTOS 1 X = 5'12 a) b = 1'133 b) r = 0'909 c) 1 .Regresión y correlación (F.y zy' = -0'9129 .

35 . X 39’98 y 7’96 0’9093 17 a) b) c) d) e) YM’ = 1'9317 + 0'9049 .0'7250 τ = .X 0’9729 2’2.0'7744 Regresión y correlación (F. 14’5384 12 rbp = 0’56 13 0’8331 (o bien el 83’31%) 14 1’9543 . X r = 0'6067 η2 = 0’3749 (próximo a r2 = 0'3681) 18 (I) (II) (III) Coeficiente biserial Coeficiente τ de Kendall Coeficiente tetracórico rb = . Álvarez) . 2’96 0’8216. 15’5069 15 ρ = -0’8667 16 a) b) c) Y’ = 6’8617 + 3’5957 .11 a) b) c) d) Y’ = 3’3243 + 2’2162.0'3333 rt = . X rM = 0'9924 Y’ = 1'9268 + 0'8862 .

Cálculo del coeficiente de correlación biserial La tabla proporciona.q) 0'00 0'01 0'02 0'03 0'04 0'05 0'06 0'07 0'08 0'09 0'10 0'11 0'12 0'13 0'14 0'15 0'16 0'17 0'18 0'19 0'20 0'21 0'22 0'23 0'24 0'25 0'26 0'27 0'28 0'29 0'30 0'31 0'32 0'33 0'34 0'35 0'36 0'37 0'38 0'39 0'40 0'41 0'42 0'43 0'44 0'45 0'46 0'47 0'48 0'49 0'50 0'000 0'37186 0'40502 0'42781 0'44569 0'46061 0'47349 0'48487 0'49508 0'50435 0'51284 0'52066 0'52791 0'53465 0'54096 0'54686 0'55240 0'55762 0'56253 0'56716 0'57154 0'57568 0'57958 0'58328 0'58677 0'59007 0'59319 0'59614 0'59892 0'60154 0'60401 0'60633 0'60851 0'61055 0'61245 0'61422 0'61586 0'61738 0'61878 0'62006 0'62122 0'62226 0'62319 0'62401 0'62471 0'62531 0'62579 0'62617 0'62644 0'62660 0'62666 0'001 0'29788 0'37603 0'40762 0'42977 0'44729 0'46198 0'47469 0'48594 0'49605 0'50523 0'51365 0'52141 0'52860 0'53530 0'54156 0'54743 0'55294 0'55812 0'56301 0'56761 0'57196 0'57608 0'57996 0'58364 0'58711 0'59039 0'59350 0'59643 0'59919 0'60180 0'60425 0'60656 0'60872 0'61074 0'61263 0'61439 0'61602 0'61753 0'61891 0'62018 0'62133 0'62236 0'62328 0'62408 0'62478 0'62536 0'62584 0'62620 0'62646 0'62661 0'002 0'31576 0'37994 0'41014 0'43169 0'44887 0'46333 0'47587 0'48700 0'49701 0'50611 0'51445 0'52215 0'52929 0'53595 0'54217 0'54800 0'55347 0'55862 0'56348 0'56806 0'57239 0'57647 0'58034 0'58399 0'58745 0'59071 0'59380 0'59671 0'59946 0'60205 0'60449 0'60678 0'60893 0'61094 0'61281 0'61456 0'61618 0'61767 0'61904 0'62030 0'62143 0'62245 0'62336 0'62416 0'62484 0'62541 0'62588 0'62623 0'62648 0'62662 0'003 0'32772 0'38363 0'41257 0'43357 0'45042 0'46466 0'47704 0'48804 0'49795 0'50697 0'51525 0'52289 0'52998 0'53659 0'54277 0'54856 0'55400 0'55912 0'56395 0'56850 0'57281 0'57687 0'58071 0'58435 0'58778 0'59103 0'59410 0'59699 0'59973 0'60230 0'60472 0'60700 0'60913 0'61113 0'61299 0'61473 0'61633 0'61781 0'61917 0'62042 0'62154 0'62255 0'62345 0'62423 0'62490 0'62547 0'62592 0'62626 0'62650 0'62663 0'004 0'33699 0'38712 0'41493 0'43540 0'45195 0'46597 0'47820 0'48908 0'49889 0'50783 0'51604 0'52362 0'53066 0'53723 0'54336 0'54912 0'55453 0'55962 0'56442 0'56895 0'57322 0'57726 0'58109 0'58470 0'58811 0'59134 0'59439 0'59727 0'59999 0'60255 0'60496 0'60722 0'60934 0'61132 0'61317 0'61489 0'61649 0'61796 0'61930 0'62053 0'62165 0'62264 0'62353 0'62430 0'62496 0'62552 0'62596 0'62629 0'62652 0'62664 0'005 0'34469 0'39044 0'41722 0'43720 0'45345 0'46726 0'47934 0'49011 0'49982 0'50868 0'51682 0'52435 0'53134 0'53786 0'54396 0'54967 0'55505 0'56011 0'56488 0'56938 0'57364 0'57766 0'58146 0'58505 0'58845 0'59166 0'59469 0'59755 0'60025 0'60280 0'60519 0'60744 0'60954 0'61151 0'61335 0'61506 0'61664 0'61810 0'61943 0'62065 0'62175 0'62274 0'62361 0'62437 0'62502 0'62556 0'62600 0'62632 0'62654 0'62664 0'006 0'35133 0'39360 0'41945 0'43897 0'45492 0'46854 0'48047 0'49112 0'50074 0'50953 0'51760 0'52507 0'53201 0'53849 0'54454 0'55023 0'55557 0'56060 0'56534 0'56982 0'57405 0'57805 0'58182 0'58540 0'58878 0'59197 0'59498 0'59783 0'60051 0'60304 0'60542 0'60765 0'60975 0'61170 0'61353 0'61522 0'61679 0'61824 0'61956 0'62077 0'62186 0'62283 0'62369 0'62444 0'62508 0'62561 0'62603 0'62635 0'62655 0'62665 0'007 0'35722 0'39663 0'42162 0'44069 0'45638 0'46980 0'48159 0'49213 0'50166 0'51036 0'51838 0'52579 0'53268 0'53911 0'54513 0'55078 0'55609 0'56109 0'56580 0'57025 0'57446 0'57843 0'58219 0'58574 0'58910 0'59228 0'59528 0'59811 0'60077 0'60329 0'60565 0'60787 0'60995 0'61189 0'61370 0'61538 0'61694 0'61837 0'61969 0'62088 0'62196 0'62292 0'62377 0'62451 0'62514 0'62566 0'62607 0'62637 0'62657 0'62665 0'008 0'36253 0'39954 0'42373 0'44239 0'45781 0'47105 0'48270 0'49312 0'50256 0'51120 0'51914 0'52650 0'53334 0'53973 0'54571 0'55132 0'55660 0'56157 0'56626 0'57069 0'57487 0'57882 0'58256 0'58609 0'58943 0'59258 0'59557 0'59838 0'60103 0'60353 0'60588 0'60808 0'61015 0'61208 0'61388 0'61554 0'61709 0'61851 0'61981 0'62099 0'62206 0'62301 0'62385 0'62458 0'62520 0'62571 0'62611 0'62640 0'62658 0'62665 36 . Álvarez) .q f ( z) 0'009 0'36738 0'40233 0'42579 0'44406 0'45922 0'47228 0'48379 0'49411 0'50346 0'51202 0'51990 0'52721 0'53400 0'54034 0'54629 0'55186 0'55711 0'56205 0'56671 0'57111 0'57527 0'57920 0'58292 0'58643 0'58975 0'59289 0'59585 0'59865 0'60129 0'60377 0'60611 0'60830 0'61035 0'61226 0'61405 0'61570 0'61724 0'61865 0'61993 0'62111 0'62216 0'62310 0'62393 0'62465 0'62525 0'62575 0'62614 0'62642 0'62659 0'62666 min(p. la cantidad : p.Regresión y correlación (F. para el menor de los valores p y q.