You are on page 1of 36

REGRESIN Y CORRELACIN

Mtodos Estadsticos Aplicados a las Auditoras Sociolaborales


Francisco lvarez Gonzlez francisco.alvarez@uca.es

DISTRIBUCIONES BIVARIANTES
El estudio de la relacin existente entre dos variables X e Y conduce a la consideracin simultnea de ambas variables estadsticas. Tal distribucin de las dos variables se denomina bivariante. La presentacin de los datos experimentalmente observados puede hacerse : a) Mediante los pares (Xi , Yi) : b) Tabla simple de frecuencias : X X1 X2 .... Xn Y Y1 Y2 .... Yn n n1 n2 .... nn X (X1 , Y1) , (X2 , Y2) , (X3 , Y3) , ... c) Tabla de frecuencias de doble entrada : Y1 n11 n21 .... nn1 Y2 n12 n22 .... nn2 Y .... .... .... .... .... Ym n1m n2m .... nnm

X1 X2 .... Xn

Distribuciones marginales :
Son las obtenidas de la distribucin bivariante, al considerar de forma independiente cada una de las dos variables. De ellas obtendremos los parmetros de centralizacin y dispersin caractersticos : media y desviacin tpica.

X , s2 X

, sX

, Y , s2 Y

, sY

Covarianza :
Este ndice de variacin conjunta de X e Y se define como :

s XY =

n .(X
i i

X )(Yi Y ) .

s XY =

N nij .(X i X ).(Y j Y )


i j

n . X .Y
i i i

n .X .Y
ij i i j

X .Y
j

para tablas simples de frecuencias

X .Y

para tablas de frecuencias de doble

entrada. Si sXY = 0 expresar que las variables X e Y son independientes.

RECTAS DE REGRESIN
Representando los pares de observaciones (X,Y) como puntos en un plano cartesiano, obtenemos el denominado diagrama de dispersin o nube de puntos. Por recta de regresin o de ajuste entendemos la recta que ms se aproxima a los puntos representativos de las observaciones (X,Y). El mtodo de los mnimos cuadrados proporciona un sistema de obtencin de tales rectas, estableciendo que sea mnima la suma de los cuadrados de las separaciones existentes entre cada punto y la recta.

Segn se consideren estas separaciones en vertical (lo representado en la figura) o en horizontal, se obtienen, respectivamente, las rectas de regresin de Y sobre X y de X sobre Y.

Regresin y correlacin (F. lvarez) - 1

RECTA DE REGRESIN DE Y SOBRE X Y' = a + b.X


a = ordenada en el origen b = coeficiente de regresin de Y sobre X = pendiente de la recta de regresin = tangente del ngulo que forma con el eje horizontal. Y' = predicciones de Y para el valor X observado.

Los coeficientes a y b de la recta de regresin de Y sobre X se obtienen resolviendo el sistema :

a.N a. f . X
el cul tiene como solucin :

+ b. n. X
s XY s2 X

b. n. X

= =

n.Y n.X .Y

b=

a = Y b. X

RECTA DE REGRESIN DE X SOBRE Y X' = a' + b'.Y


a' = ordenada en el origen b' = coeficiente de regresin de X sobre Y = pendiente de la recta de regresin. X' = predicciones de X para el valor Y observado.

Los coeficientes a' y b' de la recta de regresin de X sobre Y se obtienen igualmente al resolver :

a'.N a '. f .Y
o directamente :

+ b'. n.Y + b'. n.Y 2

= =

n. X n.X .Y

b' =

s XY 2 sY

a ' = X b'. Y

Otro procedimiento de clculo simplificado permite obtener los coeficientes de regresin del siguiente modo :

b=

N . X .Y ( X )( Y ) . N . X 2 ( X )
2

b' =

N . X .Y ( X )( Y ) . N . Y 2 ( Y )
2

Si utilizamos puntuaciones diferenciales : x = X X y = Y Y , las rectas de regresin pierden el trmino independiente (ordenadas en el origen a y a' ) al ser las medias nulas, siendo su expresin : y' = b.x x' = b'.y

COEFICIENTE DE CORRELACIN DE PEARSON


La recta de regresin es la que pasa ms cerca de las observaciones, pero no nos indica si pasa muy cerca o no de ellas. Hemos de definir una medida del grado de asociacin o relacin entre ambas variables, lo cul, en trminos de recta de ajuste, indicar la bondad de la misma. Tal coeficiente se denomina coeficiente de correlacin, definido por Pearson del siguiente modo :

r = b . b' =

s XY sX . sY

ya que : r =

b . b' =

s XY s XY . = s2 s2 X Y

s2 s XY = XY 2 2 sX . sY sX . sY

Segn las expresiones finales obtenidas para b y b', podemos tambin calcularlo como :

r=
La expresin

[N . X

. N . X .Y ( X )( Y )
2 2

( X ) . N . Y 2 ( Y )
sX sY r = b'. sY sX

][

conduce a las siguientes relaciones (sin ms que multiplicar y dividir por sX o por sY ) :

r = b.

De aqu resulta que, si se trabaja con puntuaciones tipificadas (las desviaciones tpicas son iguales a 1) : r = b = b' y las rectas de regresin son : z'Y = r.z'X ; z'X = r.z'Y El coeficiente de correlacin toma siempre valores comprendidos entre -1 y 1 : -1 r 1

2 - Regresin y correlacin (F. lvarez)

Interpretacin :
r prximo a 0 prximo a 1 prximo a -1 Asociacin de las variables Variables independientes o no relacionadas linealmente Variables relacionadas directamente (cuando una aumenta la otra tambin) Variables relacionadas inversamente (cuando una aumenta la otra disminuye) Bondad del ajuste Mala recta de ajuste. No pasa cerca de las observaciones. Buena recta de ajuste. Creciente (pendientes b y b' positivas) Buena recta de ajuste. Decreciente (pendientes b y b' negativas)

CURVA DE REGRESIN DE LA MEDIA


Este mtodo es aplicable cuando una de las dos variables (o las dos) contiene un bajo nmero de valores distintos.

Curva de regresin de la media de Y condicionada a X :


El procedimiento consiste en sustituir todos los pares de observaciones que tienen el mismo valor de X por un nico par que tiene por componentes dicho valor de X y la media de los valores de Y. De igual modo puede establecerse la curva de regresin de la media de X condicionada a Y. As, por ejemplo, la figura muestra los pares siguientes: X=1 : (1,1) , (1,3) sustituidos por el par (1,2) , al ser 2 la media de 1 y 3. X=2 : (2,1) , (2,4) , (2,5) sustituidos por el par (2,3'33) , al ser 3'33 la media de 1, 4 y 5. ... etc ... Con los pares (1,2) , (2,3'33), ... obtenemos la recta de regresin por el procedimiento ya descrito.

Razn de correlacin :

2 = 1

2 ni .s y 1 . 2 i N sY

Toma valores comprendidos entre 0 y 1 y siempre verifica que 2 r2 (r=coef. de correlacin lineal). La relacin entre las variables X , Y ser de tipo lineal, cuanto ms 2 2 prximo sea a r .

OTROS PROCEDIMIENTOS DE CLCULO DEL COEFICIENTE DE CORRELACIN r Coeficiente de correlacin (phi) :


El siguiente procedimiento se puede utilizar cuando las dos variables X e Y son dicotmicas. Y X 1 0 1 a c 0 b d Asignemos los valores 0 y 1 a ambas variables y realicemos el recuento representado en la tabla de la izquierda. El coeficiente de correlacin toma el valor :

ad bc (a + b )(c + d )(a + c )(b + d ) . . .

Coeficiente de correlacin biserial puntual rbp :


El siguiente procedimiento se puede utilizar cuando una variable es continua y la otra dicotmica. Supuesta X continua :

rbp =

X1 X0 . p. q sX

Siendo :

X1 X0 sX
p q=1-p

la media de los valores de X que se corresponden con un 1 en Y. la media de los valores de X que se corresponden con un 0 en Y. la desviacin tpica de X (considerados sus valores globalmente). la proporcin de unos en Y. la proporcin de ceros en Y.

Coeficiente de correlacin por rangos de Spearman :


El siguiente procedimiento se puede utilizar cuando las dos variables son ordinales (reordenaciones de una serie de elementos).

= 1

6. d 2

N. N 2 1

Siendo d las diferencias entre los valores de X e Y. Regresin y correlacin (F. lvarez) - 3

Los coeficientes de correlacin anteriores no son ms que una adaptacin del coeficiente de correlacin de Pearson para tipos especiales de variables. En consecuencia, su valor coincide con el que habramos obtenido siguiendo el procedimiento de Pearson (r); por ello, su interpretacin es la establecida para r .

OTROS COEFICIENTES DE CORRELACIN NO BASADOS EN EL PEARSON Coeficiente de correlacin tetracrica:


Puede utilizarse cuando ambas variables son continuas , pero ambas pueden dicotomizarse artificialmente. Y X 1 0 1 a c 0 b d Asignemos los valores 0 y 1 a ambas variables y realicemos el recuento que se representa en la tabla de la izquierda.

A) Mtodo abreviado (aproximado) :


1 Calculamos los productos : a.d y b.c. 2 Si a.d > b.c , calculamos el cociente : C = a.d / b.c (el coeficiente de correlacin ser positivo) 3 Si a.d < b.c , calculamos el cociente : C = b.c / a.d (el coeficiente de correlacin ser negativo) 4 Consultando la tabla de clculo del coeficiente de correlacin tetracrico, localizamos el cociente C en el intervalo que lo contiene (con extremos A y B). A su derecha encontramos el coeficiente de correlacin tetracrico (rt), como un valor numrico (n) ms R. De aqu :

rt = n + R
B) Mtodo exacto :

con : R =

CA 100 . ( B A )

El coeficiente de correlacin tetracrico rt ser el resultado de resolver la siguiente ecuacin :

rt + z. z'.

rt 2 r3 r4 a. d b. c + ( z 2 1) . ( z' 2 1) . t + ( z 3 3z) . ( z' 3 3z') . t + ... = 2 2! 3! 4! n . f ( z). f ( z' )

Como es lgico, la mayor exactitud en el clculo rt , se obtiene al considerar un mayor nmero de sumandos del desarrollo en serie anterior. Esta dificultad aconseja seguir el mtodo abreviado descrito anteriormente. En la ecuacin que permite calcular rt : z valor de la curva normal tipificada N(0,1), que deja a su derecha un rea m, igual a la menor de las cantidades (a+c)/n o (b+d)/n. z' valor de la curva normal tipificada N(0,1), que deja a su derecha un rea m, igual a la menor de las cantidades (a+b)/n o (c+d)/n. f(z) y f(z') ordenadas de la curva normal, correspondientes a los valores z y z' anteriores. Tabuladas para cada m.

Coeficiente de correlacin biserial rb :


Puede utilizarse cuando ambas variables son continuas , pero una de ellas puede dicotomizarse artificialmente. Supuesta X continua y Y dicotomizada (valores 1 y 0) , el coeficiente de correlacin biserial se calcula del modo siguiente :

X X0 p. q rb = 1 . sX f ( z)
La ordenada f(z) :

Siendo :

X1 X0 sX

la media de los valores de X que se corresponden con un 1 en Y. la media de los valores de X que se corresponden con un 0 en Y. la desviacin tpica de X (considerados sus valores globalmente).

p la proporcin de unos en Y. q=1-p la proporcin de ceros en Y. z el valor normal tipificado (N(0,1)) que deja a su derecha (o a su izquierda) el
rea p.

f(z)

la ordenada correspondiente a z en la curva normal. NOTA : Los clculos de z y f(z) no es preciso realizarlos ya que, para cada valor de la probabilidad p (o q indistintamente), se encuentran tabulados los valores de p.q/f(z).

4 - Regresin y correlacin (F. lvarez)

Coeficiente de correlacin (tau) de Kendall :


Como el de rangos de Spearman, este coeficiente es aplicable cuando las dos variables son ordinales (reordenaciones de una serie de elementos). Procedimiento de clculo : a) Reordenamos los pares de observaciones de modo que la variable X (primer elemento del par) quede en orden ascendente. b) Comparamos cada valor de Y con los Yi siguientes, contando una permanencia si Y < Yi y una inversin si Y > Yi.

Np Ni n.( n 1) 2

Siendo : n el nmero de pares de valores (X , Y) Np el nmero total de "permanencias" Ni el nmero total de "inversiones"

Utilizacin e interpretacin de los coeficientes estudiados en este epgrafe:


Los coeficientes tetracrico y biserial parten de variables continuas que pueden dicotomizarse (ambas o slo una). Para su aplicacin rigurosa es necesario que : 1. la distribucin de la variable o variables consideradas continuas debe ser "normal". 2. la relacin que suponemos existe entre ambas variables es de tipo "lineal". Sus valores no tienen porqu coincidir con el del coeficiente de correlacin de Pearson, si bien verifican las mismas propiedades que ste. Es decir : Los coeficientes tetracrico y toman valores comprendidos entre -1 y 1 : -1 coeficiente 1. El coeficiente biserial puede ser mayor que 1 y menor que -1. En valor absoluto, ser mayor que el biserial puntual. Valores prximos a cero implican falta de relacin entre las variables (independencia).

FUENTES DE VARIANZA EN LA CORRELACIN


Expresemos la desviacin de Y respecto de su media como :

(Y Y ')

(Y Y ) = (Y Y ') + (Y 'Y )
2 2

(Y 'Y )

es el error cometido en la prediccin. Representa la porcin de informacin no asociada a X. representa, en consecuencia, la informacin asociada a X.

En trminos de varianzas :

(Y Y )

(Y Y ) = (Y Y ') + (Y 'Y ) (Y Y ') +


2
2

(Y 'Y )

Varianza total

Varianza no explicada por X (varianza de los errores o residual)

Varianza explicada por X

Dividiendo los sumandos anteriores por la varianza de Y obtendremos la proporcin de varianza de Y no explicada y explicada por la variable X. La manipulacin de esta operacin conduce a las expresiones y definiciones siguientes :

(Y Y ) (Y Y )

2 2

Varianza de las predicciones Y' =

s =
2 Y'

(Y Y ') + (Y 'Y ) =1= (Y Y ) (Y Y ) (Y 'Y )


2 2 2

2 2

(Y Y ') = (Y Y )

+ r2

N
s2 ' Y = r2 s2 Y

Proporcin de varianza de las predicciones Y' =

Proporcin de varianza explicada por X = r2 = Coeficiente de determinacin ( R2 ) Proporcin de varianza no explicada por X = 1 - r2

Varianza de los errores o residual =

s =s
2 e

2 Y .X

(Y Y ') =
N

(Y Y ) . (Y Y ') = N (Y Y )
2

2 = sY . 1 r 2

La raz cuadrada de la varianza residual se denomina error tpico de la prediccin : s Y . X = s Y . 1 r 2 IMPORTANTE : Observe los diferentes significados e interpretaciones de r2. Regresin y correlacin (F. lvarez) - 5

FORMULARIO - RESUMEN DEL TEMA

n.x x=
N

2 x

n.x =
N

n. y y=
N

2 y

n. y =
N

y2

s xy =

n.x. y x. y
N

Recta de regresin de y sobre x (puntuaciones directas)

y' = a + b. x

a.N + b. n.x a. n.x + b. n.x 2 b'. n. y

= =

n. y n.x. y n.x n.x. y

s2 x a = y b. x
sxy

b=

sxy

Predicciones : y ' = y Recta de regresin de x sobre y (puntuaciones directas)

a'.N

= =

x' = a '+ b'. y Predicciones : x ' = x

a'. n. y + b'. n. y 2

s2 y a ' = x b'. y

b' =

Coeficiente de correlacin (de Pearson y equivalentes) :


Pearson Ph Biserial puntual Rangos de Spearman

r = b. b' =

sxy
=

sx . sy sy s r = b. x = b'. sy sx

ad bc ( a + b).( c + d ).( a + c).( b + d )

rbp =

x1 x0 . p. q sx

= 1

6. d 2 N. ( N 2 1)

Coeficiente de correlacin no basados en el de Pearson :


Tetracrico (Tabulado) Biserial Tau de Kendall

rt = n + R
Puntuaciones directas (x,y)

con : R =

CA 100 . ( B A )

X X0 p. q rb = 1 . sX f ( z)

Np Ni n.( n 1) 2

Puntuaciones diferenciales (d x

Puntuaciones tipificadas

= x x , dy = y y)

y' = a + b. x

d x = 0 , d y = 0 , sdx = s x , sdy = s y , sdxdy = s xy


(a = 0 ; b se mantiene)

xx y y , zy = zx = sx sy zx = 0 , zy = 0
szx = 1 , szy = 1 , szxzy =
(a = 0 ; b = r)

sxy sx . s y

=r

r=

sxy sx . sy

d y ' = b. d x

z y ' = r. z x
2 s 2 = se + s 2 ' y y

Relacin fundamental : Varianza de y = = Varianza residual (de errores) + Varianza de las predicciones. Varianza de las predicciones : Proporcin de varianza explicada o asociada a la regresin, o proporcin de varianza de las predicciones, o coeficiente de determinacin :
6 - Regresin y correlacin (F. lvarez)

s2 y'

( y ' y ) 2 =
N

s2 ' y s2 y

= r2

Varianza de los errores (o residual) :


2 se

s2.x y

( y y') 2 = s2 .( 1 r 2 ) =
N
y

Error tpico de la prediccin (raz de la varianza de los errores): Proporcin de varianza no explicada o no asociada a la regresin, o proporcin de varianza de los errores :

s y.x = s y . 1 r 2
2 se = 1 r2 s2 y

Signo de b = signo de b = signo de r = signo de la covarianza r = 0 absoluta independencia r = 1 o r = -1 absoluta dependencia (directa o inversa)

-1 r 1 0 r2 1

Regresin y correlacin (F. lvarez) - 7

EJERCICIOS RESUELTOS
1
La tabla siguiente contiene los resultados de las calificaciones en Matemticas (X) y Lengua (Y) de un grupo de 40 alumnos de Secundaria. X 3 3 5 6 6 6 7 8 Y 4 5 5 6 7 8 7 8 n 3 5 12 4 5 3 6 2 a) b) c) d) e) Obtenga la recta de regresin de Y sobre X. Obtenga la recta de regresin de X sobre Y. Calcule e interprete el coeficiente de correlacin lineal. Obtenga el error tpico de la prediccin. Qu proporcin de varianza de Y no queda explicada por X ?.

Tabla de clculos :
X 3 3 5 6 6 6 7 8 Y 4 5 5 6 7 8 7 8 n 3 5 12 4 5 3 6 2 40 n.X 9 15 60 24 30 18 42 16 214 n.Y 12 25 60 24 35 24 42 16 238 n.X2 27 45 300 144 180 108 294 128 1226 n.Y2 48 125 300 144 245 192 294 128 1476 n.X.Y 36 75 300 144 210 144 294 128 1331

a)

Recta de regresin de Y sobre X.


X=

b=

N . X .Y ( X )( Y ) . N . X ( X )
2 2

214 = 5' 35 40

Y=

238 = 5' 95 40

40.1331 214.238 2308 = = 0'71 Recta de regresin de Y sobre X : 3244 40.1226 214 2
Y' = 2'1436 + 0'7115.X

a = Y b . X = 5' 95 0' 7115 . 5' 35 = 2' 1436

b)

Recta de regresin de X sobre Y. N . X .Y ( X )( Y ) 40.1331 214.238 2308 . b' = = = = 0'96 2 Recta de regresin de X sobre Y : 2396 40.1476 238 2 N . Y 2 ( Y )
X' = -0'3815 + 0'9633.Y

a ' = X b ' . Y = 5' 35 0' 9633 . 5' 95 = 0' 3815

c)

Coeficiente de correlacin de Pearson.


Conocidos los coeficientes de regresin puede calcularse como :

r = b . b' = 0' 7115 . 0' 9633 = 0' 8279


Existe una elevada relacin entre las calificaciones en Matemticas y Lengua. Dicha relacin es positiva (directa); es decir, alumnos con altas calificaciones en Matemticas se corresponden con altas calificaciones en Lengua, y a la inversa. Podemos afirmar que las rectas de regresin obtenidas son buenas rectas de ajuste. Es decir, expresan con una elevada aproximacin la relacin matemtica (lineal) existente entre las calificaciones en Matemticas y Lengua.

d)

Error tpico de la prediccin.


Calculada la varianza de Y :
2 sY =

n .Y
i i

N
2

Y 2 =

1476 5'95 2 = 1'4975 40

s Y . X = s Y . 1 r = 1' 4975 . 1 0' 8279 2 = 0' 6864


8 - Regresin y correlacin (F. lvarez)

e)

Proporcin de varianza no explicada por X.


La proporciona : 1 - r2 = 1 - 0'82792 = 0'3146. Es decir el 31'46%.

2
De la distribucin bivariante siguiente : 0 0 0 8 Y 1 1 9 0 2 5 0 0

2 4 6

a) b) c) d) e)

Obtenga la recta de regresin de Y sobre X. Obtenga la recta de regresin de X sobre Y. Calcule e interprete el coeficiente de correlacin lineal. Calcule su varianza residual. Calcule e interprete el coeficiente de determinacin.

Obtenemos las distribuciones marginales de X y de Y totalizando las frecuencias en filas y columnas : 0 0 0 8 8 n.X2 24 144 288 456 Y 1 1 9 0 10 2 5 0 0 5 Y 0 1 2 6 9 8 23 n 8 10 5 23 n.Y 0 10 10 20 n.Y2 0 10 20 30

2 4 6

X 2 4 6

n 6 9 8 23

n.X 12 36 48 96

La suma de los productos de X por Y hemos de obtenerla directamente de la tabla proporcionada :

X .Y = n .X .Y
ij i i j

0.2.0 + 1.2.1 + 5.2.2 + 0.4.0 + 9.4.1 + 0.4.2 + 8.6.0 + 0.6.1 + 0.6.2 = 58

Como puede observarse, slo realizamos los productos correspondientes a frecuencias y valores de variables no nulos. X . Y = 1.2.1 + 5.2.2 + 9.4.1 = 58

Utilicemos las medias y varianzas de X e Y, as como la covarianza, en los clculos solicitados.

X=

96 = 4' 1739 23

Y=

Covarianza =

s XY =

n . X .Y
ij i i j

20 = 0' 8696 23

s2 = X
j

456 4' 1739 2 = 2' 4045 23

2 sY =

30 0' 8696 2 = 0' 5482 23

X .Y =

X .Y X .Y = 58 4'1739.0'8696 = 1'1078
N 23

a)

Recta de regresin de Y sobre X :


b= s XY 1' 1078 = = 0' 4607 2 2' 4045 sX a = Y b . X = 0' 8696 ( 0' 4607 ). 4' 1739 = 2' 7925

Y' = 2'7925 - 0'4607 . X b) Recta de regresin de X sobre Y :


b' = s XY 1' 1078 = = 2' 0207 2 0' 5482 sY a ' = X b'. Y = 4' 1739 ( 2' 0207 ). 0' 8696 = 5' 9310

X' = 5'9310 - 2'0207 . Y c) Coeficiente de correlacin : Utilizando la expresin r = b.b' = ( 0'4607 )( 2'0207 ) = 0'9648 .
Calculado como r = podemos tener duda en cuanto

al signo del coeficiente de correlacin. Este signo es el de b y b', ya que es el que proporciona la covarianza.

s XY = sX . sY

1' 1078

= 0' 9648 no se plantear tal dificultad.

2' 4045 . 0' 5486


Regresin y correlacin (F. lvarez) - 9

d)

Varianza residual : 2 2 2 se2 = sY . X = sY . 1 r 2 = 0'5482. 1 ( 0'9648) = 0'0379

e)

Coeficiente de determinacin :
Es el cuadrado del coeficiente de correlacin, representando la proporcin de varianza explicada por la variable X (en el ajuste de Y sobre X).

R 2 = r 2 = ( 0'9648) = 0'9309
2

La variable X explica el 93'09% de la varianza de Y. Slo el 6'91% no es atribuible a X.

3
De la siguiente distribucin bivariante : [0,1) 1 3 1 Y [1,2) 2 6 2 [2,3] 1 3 1

2 3 4

a) b) c) d) e)

Calcule e interprete el valor de la covarianza. Obtenga la recta de regresin de Y sobre X. Obtenga la recta de regresin de X sobre Y. Calcule el coeficiente de correlacin lineal y el de determinacin. De la varianza total de Y , determine la proporcin atribuible a la variable X.

Totalizando filas y columnas obtendremos las distribuciones marginales de X e Y : 0'5 1 3 1 5 n.X2 16 108 64 188 Y 1'5 2 6 2 10 2'5 1 3 1 5 Y 0'5 1'5 2'5

2 3 4

4 12 4 20 n 5 10 5 20 n.Y 2'5 15 12'5 30 n.Y2 1'25 22'5 31'25 55

X 2 3 4

n 4 12 4 20
ij i j

n.X 8 36 16 60

X .Y = n .X .Y
i j

1.2.0'5 + 2.2.1'5 + 1.2.2'5 + 3.3.0'5 + 6.3.1'5 + 3.3.2'5 + 1.4.0'5 + 2.4.1'5 + 1.4.2'5 = 90

a)

Covarianza :
X=

Covarianza =

s XY =

n . X .Y
ij i i j

60 =3 20

Y=

30 = 1' 5 20

X .Y =

X .Y X .Y = 90 3.1'5 = 4'5 4'5 = 0


N 20

Interpretacin :
Las variables son independientes. Siendo nula la covarianza, tambin los sern los coeficientes de regresin, el coeficiente de correlacin y el de determinacin, dado que en sus clculos interviene la covarianza en el numerador. Al ser nulos los coeficientes de regresin, a coincidir con la media de Y y a' con la de X.

b)

Recta de regresin de Y sobre X :


b= s XY 0 = 2 =0 2 sX sX
s XY 0 = 2 =0 2 sY sY

a = Y b . X = 1' 5 0 . 3 = 1' 5

Y' = 1'5

c)

Recta de regresin de X sobre Y :


b' = a ' = X b'. Y = 3 0 . 1' 5 = 3

X' = 3

10 - Regresin y correlacin (F. lvarez)

d)

Coeficiente de correlacin y de determinacin :


Como se indic en el apartado a), al ser nula la covarianza, ambos coeficientes tambin lo son :

r = b . b' = 0 . 0 = 0

r=

s XY 0 = =0 sX . sY sX . sY

R 2 = r2 = 0

e)

Proporcin de varianza explicada por X :


Proporcin de varianza explicada por X = r2 = Coeficiente de determinacin = 0

4
Se desea estudiar la relacin entre las calificaciones obtenidas en un test (puntuado de 0 a 5) y el sexo del alumno que lo realiza. Los resultados observados fueron : Test 1 1 2 2 3 4 4 5 5 Sexo Varn Hembra Varn Hembra Varn Hembra Varn Hembra Varn N de alumnos 3 1 2 4 3 5 1 1 2

a) Mida el grado de asociacin existente entre las dos variables mediante el coeficiente ms adecuado. b) Calcule el coeficiente de correlacin de Pearson y compare su valor con el calculado en el apartado anterior.

a)

Siendo dicotmica la segunda variable, calcularemos el coeficiente de correlacin biserial puntual : Denominando Y a la variable sexo (asignamos : 1=Hombre ; 0=Mujer) y X a la variable puntuacin en el test, procederemos a los clculos necesarios para su obtencin. Ello nos conduce a calcular las medias de los valores de X que se corresponden con un 1 y con un 0 en Y (X1 y X0) de forma separada, as como la desviacin tpica de X. Las siguientes tablas facilitan nuestras operaciones : X 1 1 2 2 3 4 4 5 5 Y 1 0 1 0 1 0 1 0 1 n 3 1 2 4 3 5 1 1 2 N= 22 n.X 3 1 4 8 9 20 4 5 10 64 n.X2 3 1 8 16 27 80 16 25 50 226 X1 1 2 3 4 5 n 3 2 3 1 2 11 p n.X1 3 4 9 4 10 30 X0 1 2 4 5 n 1 4 5 1 11 q n.X0 1 8 20 5 34

30 34 11 11 X0 = p= = 0' 5 q= = 0' 5 = 1 p = 2' 7273 = 3' 0909 11 11 22 22 64 226 X= = 2' 9091 s2 = 2' 90912 = 1' 8099 s X = 1' 8099 = 1' 3453 X 22 22 X X0 2' 7273 3' 0909 Con esto : rbp = 1 . p. q = . 0' 5 . 0' 5 = 0' 1351 sX 1' 3453 X1 =

b)

Coeficiente de correlacin de Pearson :


El propsito de este apartado no es otro que comprobar que efectivamente coinciden los coeficientes de correlacin de Pearson y biserial puntual. Calculemos la media y desviacin tpica de Y, as como la covarianza:

Regresin y correlacin (F. lvarez) - 11

X
1 1 2 2 3 4 4 5 5

Y
1 0 1 0 1 0 1 0 1

n
3 1 2 4 3 5 1 1 2 22

f.Y
3 0 2 0 3 0 1 0 2 11

n.Y2
3 0 2 0 3 0 1 0 2 11

n.X.Y
3 0 4 0 9 0 4 0 10 30

Y=
s XY

11 11 0' 5 2 = 0' 25 s Y = 0' 25 = 0' 5 = 0' 5 s 2 = Y 22 22 0' 0909 30 = 2' 9091. 0' 5 = 0' 0909 r= = 0' 1351 22 1' 3453. 0' 5

5
La siguiente tabla nos muestra la distribucin por sexo de un grupo de 167 personas, indicando si fuman o no. Hombre Mujer Fuma 85 10 No fuma 12 60

a) Calcule el coeficiente de ms adecuado para medir el grado de asociacin existente entre el sexo y el ser o no fumador. b) Calcule el coeficiente de correlacin de Pearson y compare su valor con el calculado en el apartado anterior.

a) Las dos variables son dicotmicas. El coeficiente especfico para esta situacin es el coeficiente de correlacin (phi) . Dispuesta la tabla como sigue (totalizando filas y columnas) obtenemos :
Y X 1 (Hombre) 0 (Mujer) 1 (Fuma) a = 85 c = 10 95 0 (No fuma) b = 12 d = 60 72 97 70

=
b)

(a + b )(c + d )(a + c )(b + d ) . . .


Y 1 0 1 0 n 85 12 10 60 167 n.X 85 12 0 0 97

ad bc

85.60 12.10 97.70.95.72


n.X2 85 12 0 0 97

= 0'7307

Coeficiente de correlacin de Pearson :


X 1 1 0 0 n.Y 85 0 10 0 95 n.Y2 85 0 10 0 95 n.X.Y 85 0 0 0 85

97 97 = 0' 5808 s2 = 0' 5808 2 = 0' 2435 s X = 0' 2435 = 0' 4934 X 167 167 95 95 Y= = 0' 5689 s2 = 0' 5689 2 = 0' 2453 s Y = 0' 2453 = 0' 4952 Y 167 167 85 0' 1786 s XY = 0' 5808 . 0' 5689 = 0' 1786 r= = 0' 7307 167 0' 4934 . 0' 4952 X=
Coincidente con el calculado en el apartado anterior, como era de esperar.

12 - Regresin y correlacin (F. lvarez)

6
Doce atletas (A, B, C, ..., L) participan en una carrera de 100 metros y en otra de lanzamiento de peso. Las clasificaciones en dichas pruebas fueron : 100 metros : A,B,C,D,E,F,G,H,I,J,K,L Peso : K,I,J,L,G,H,F,D,E,B,C,A a) Determine la relacin existente entre las dos clasificaciones en las pruebas descritas, mediante el coeficiente ms adecuado. b) Calcule el coeficiente de correlacin de Pearson y compare su valor con el calculado en el apartado anterior. Nos encontramos ante dos reordenaciones distintas de los 12 individuos. Calcularemos pues el coeficiente de correlacin por el mtodo de los rangos de Spearman.

a)

Coeficiente de correlacin : 6. d 2 6.552 = 1 = 1 = 0'9301 2 N. N 1 12. 12 2 1

(Ver tabla siguiente)

A continuacin se ofrecen las tablas auxiliares de clculos de y r , calculados para comprobar que coinciden. X 1 2 3 4 5 6 7 8 9 10 11 12 78 Para el clculo de Y d 11 -10 9 -7 10 -7 12 -8 7 -2 8 -2 6 1 4 4 5 4 2 8 3 8 1 11 78 0 d2 100 49 49 64 4 4 1 16 16 64 64 121 552 X 1 2 3 4 5 6 7 8 9 10 11 12 78 Para el clculo de r Y X2 Y2 11 1 121 9 4 81 10 9 100 12 16 144 7 25 49 8 36 64 6 49 36 4 64 16 5 81 25 2 100 4 3 121 9 1 144 1 78 650 650 X.Y 11 18 30 48 35 48 42 32 45 20 33 12 374

b)

Coeficiente de correlacin de Pearson :


650 78 = 6' 5 s2 = 6' 5 2 = 11' 9167 s X = 11' 9167 = 3' 4521 X 12 12 650 78 Y= = 6' 5 s 2 = 6' 5 2 = 11' 9167 s Y = 11' 9167 = 3' 4521 Y 12 12 11' 0833 374 s XY = 6' 5 . 6' 5 = 11' 0833 r= = 0' 9301 12 3' 4521. 3' 4521 X=
En efecto coinciden los coeficientes de correlacin obtenidos por los dos mtodos. Su alto valor negativo (prximo a -1) nos indica que existe una fuerte relacin entre las dos clasificaciones en las pruebas atlticas, quedando mejor clasificados en una los peor clasificados en la otra.

7
De los archivos de la Direccin provincial de Trfico se han seleccionado los expedientes de 64 conductores, realizando el siguiente recuento en funcin del sexo (M = mujer ; H = hombre) y el nmero de multas impuestas durante el ltimo ao. Sexo N de multas en el ltimo ao 1 2 3 4 5 6 M 9 7 6 1 1 0 H 0 0 2 9 11 18

Qu conclusin puede deducirse acerca de la relacin existente entre sexo y nmero de denuncias ?. Utilice para ello el ndice de asociacin ms apropiado. Al ser dicotmica la variable sexo, obtendremos el coeficiente de correlacin biserial puntual : Regresin y correlacin (F. lvarez) - 13

Y M=1 X 1 2 3 4 5 6 9 7 6 1 1 0 24 H=0 0 0 2 9 11 18 40 n 9 7 8 10 12 18 N=64 n.X 9 14 24 40 60 108 255 n.X2 9 28 72 160 300 648 1217

Y=1 n.X1 9 14 18 4 5 0 50

Y=0 n.X0 0 0 6 36 55 108 205

50 205 24 40 = 2' 0833 = 5' 125 X0 = p= = 0' 375 q = = 0' 625 = 1 p 24 40 64 64 1217 255 X= = 3' 9844 s2 = 3' 9844 2 = 3' 1404 s X = 3' 1404 = 1' 7721 X 64 64 X X0 2' 0833 5' 125 Con esto : rbp = 1 . p. q = . 0' 375 . 0' 625 = 0' 831 sX 1' 7721 X1 =
Es decir existe una fuerte relacin, de sentido inverso, entre ambas variables. Algo que poda advertirse al analizar el recuento de las observaciones.

8
Para analizar si existe o no relacin entre las calificaciones en materias cientficas y las del rea literaria, seleccionamos ocho alumnos a los que sometemos a dos pruebas (una de cada rea). Clasificados por orden de puntuacin result : Alumno P. Cientfica P. Literaria 1 3 3 2 6 5 3 7 7 4 1 4 5 2 1 6 8 8 7 5 2 8 4 6

Utilizando el ndice adecuado establezca el grado de relacin que existe entre las calificaciones de dichas reas de conocimiento. Calcularemos el coeficiente de correlacin (rangos de Spearman) al presentarse dos variables ordinales (dos reordenaciones de los 8 alumnos). Denominamos X e Y a las variables que proporcionan, respectivamente, las clasificaciones en la prueba cientfica y en la literaria . Ordenadas las primeras, calculemos sus diferencias : X 1 2 3 4 5 6 7 8 Y 4 1 3 6 2 5 7 8 d -3 1 0 -2 3 1 0 0 d2 9 1 0 4 9 1 0 0 24

Con ello :

= 1

6. d 2

N. N 1
2

= 1

6.24 = 0'7143 8. 8 2 1

Es decir, existe una alta relacin entre las calificaciones. Generalmente un alumno con altas calificaciones en el rea cientfica tendr altas calificaciones en el rea de conocimientos literarios.

14 - Regresin y correlacin (F. lvarez)

9
Un grupo de COU integran 17 alumnos de Ciencias y 14 de Letras. De ellos repiten curso 16 de Ciencias y slo 2 de Letras. Calcule el coeficiente de correlacin ms adecuado para medir el grado de asociacin existente entre las variables descritas. Se trata de analizar la relacin que puede existir entre la especialidad (Ciencias o Letras) y el ser repetidor o no serlo. Siendo las dos variables dicotmicas, calculamos el coeficiente de correlacin (phi) . Dispuesta la tabla como sigue (totalizando filas y columnas) obtenemos : Y X 1 (Ciencias) 0 (Letras) 1 (Repite) a = 16 c=2 18 0 (No repite) b=1 d = 12 13 17 14

ad bc 16.12 1.2 = = 0'8051 alta relacin entre las variables. (a + b )(c + d )(a + c )(b + d ) 17.14.18.13 . . .

10
Se somete a 10 alumnos a dos test diferentes encaminados a medir su percepcin visual. Los resultados fueron los siguientes : Test A Test B 3 4 4 5 5 5 5 6 6 7 7 8 8 8 9 10 10 11 12 14

a) Obtenga las ecuaciones de las rectas de regresin del test A sobre el B, en puntuaciones directas, diferenciales y tpicas. b) Determine la proporcin de varianza residual que se presenta en dicho ajuste. Denominando Y a las puntuaciones en el test A (variable dependiente en el ajuste) y X a las correspondientes al text B, procedemos a realizar los clculos necesarios : X 3 4 5 5 6 7 8 9 10 12 69 Y 4 5 5 6 7 8 8 10 11 14 78 X2 9 16 25 25 36 49 64 81 100 144 549 Y2 16 25 25 36 49 64 64 100 121 196 696 X.Y 12 20 25 30 42 56 64 90 110 168 617

b=

. N . X .Y ( X )( Y ) 10.617 69.78 = = 1'0809 2 2 10.549 69 2 N . X ( X )

a = Y b. X =

Y b . X = 78 1' 0809 . 69 = 0' 3416


N N 10 10
2 2

r=

[N . X

. N . X .Y ( X )( Y )
2 2

( X ) . N . Y ( Y )

][

(10.549 69 )(10.696 78 ) .
2 2

10.617 69.78

= 0'9861

a)

Rectas de regresin :
1.- En puntuaciones directas : 2.- En puntuaciones diferenciales : 3.- En puntuaciones tipificadas: Y' = a + b . X y' = b . x zy' = r .zx Y' = 0'3416 + 1'0809 . X y' = 1'0809 . x zy' = 0'9861 .zx

b)

Proporcin de varianza residual :


Cuando se habla de proporcin siempre se refiere al cociente entre la varianza total de Y; es decir, a la proporcin de varianza de Y que representa la varianza solicitada. Regresin y correlacin (F. lvarez) - 15

Siendo la varianza de los errores (residual) :

s s

2 Y .X 2 Y

s .1 r 2 sY
2 Y

2 2 se2 = sY . X = sY . 1 r 2
2

) = 1 r

= 1 0'98612 = 0'0277

Slo representa un 2'77% de la varianza del test A (Y), siendo la proporcin de varianza no explicada por el test B (X).

11
A partir de los seis pares de valores, correspondientes a una variable bidimensional (X,Y) , (1 , 4) , (2 , 5) , (3 , 5) , (4 , 6) , (5 , 7) a) b) c) Calcule la ecuacin de la recta de regresin de Y sobre X. Represente grficamente el diagrama de dispersin y la recta de regresin. Calcule e interprete el coeficiente de correlacin.

Clculos necesarios (realizados en este ejemplo a partir de las medias y varianzas de X e Y y de la covarianza) : X 1 2 3 4 5 15 Y 4 5 5 6 7 27 X2 1 4 9 16 25 55 Y2 16 25 25 36 49 151
2 sY =

X.Y 4 10 15 24 35 88

X=

15 =3 5

s2 = X

55 32 = 2 5

Y=

27 = 5' 4 5

151 5' 4 2 = 1' 04 5


Y = 3'3 + 0'7 . X

s XY =

88 3. 5' 4 = 1' 4 5

a) b)

b=

1' 4 = 0' 7 2

a = 5' 4 0' 7. 3 = 3' 3


Y = 3'3 Y = 6'8 (0 , 3'3) (5 , 6'8)

Para X = 0 Para X = 5

Enlazando los dos puntos anteriores obtenemos la grfica de la recta.

Observe que el punto que tiene por coordenadas las medias de X e Y (3 , 5'4) , es un punto contenido en la recta de regresin. Apreciamos la proximidad de los puntos a la recta de ajuste, as como que dicha recta es creciente (r > 0).

c)

r=

1' 4 2 . 1' 04

= 0' 9707

Elevada relacin entre las variables y de signo positivo. La recta de regresin es una buena funcin de ajuste, siendo creciente (r > 0). Para representar grficamente la recta de regresin, localizamos dos puntos cualesquiera de ella : Y = 3'3 + 0'7 . X

16 - Regresin y correlacin (F. lvarez)

12
La recta de regresin de Y sobre X, calculada en el estudio de la relacin existente entre dos variables, tiene por ecuacin Y' = 5'4 - 0'9 . X , siendo la varianza de la variable dependiente Y igual a 1'84. Si la distribucin de las predicciones de Y tiene como media 3'6 y varianza 1'619936, a) calcule la media y varianza de X b) determine la ecuacin de la recta de regresin de X sobre Y c) obtenga el valor del coeficiente de correlacin. Iniciamos aqu una serie de ejemplos que requieren para su resolucin el empleo de las diferentes relaciones funcionales (frmulas para entendernos) tratadas en el tema. Resulta de utilidad escribir las expresiones en las que intervienen los datos suministrados, sustituyendo sus valores conocidos. Tal vez as podamos obtener los que nos pida el problema. 1.2.3.-

Y ' = 5'4 0'9. X

(a = Y b. X )

5'4 = Y + 0'9. X

s b = XY = 0'9 2 sX

s 2 = 1' 84 s Y = 1' 84 = 1' 3565 Y Y' = Y = 3'6 s 2 = 1' 619936 Y' 5' 4 = Y + 0' 9 . X 5' 4 = 3' 6 + 0' 9 . X X= 5' 4 3' 6 =2 0' 9

Siendo 3'6 la media de Y, la expresin de a nos permite obtener la media de X :

La varianza de X no puede obtenerse de momento (para extraerla del valor del coeficiente de regresin b necesitamos conocer antes la covarianza o el coeficiente de correlacin). Partiendo, por ejemplo, de la proporcin de varianza explicada (hace referencia a la varianza de las predicciones) :

r2 =

s 2 ' 1' 619936 Y = = 0' 8804 1' 84 s2 Y

r = 0' 8804 = 0' 9383

El coeficiente de correlacin ser negativo, ya que lo es el coeficiente de regresin b (b = -0'9), luego : r = 0'9383 . La expresin r = b .

r = b.

sX sY

sX nos permitir calcular la desviacin tpica de X : sY sX 0' 9383. 1' 3565 2 0' 9383 = 0' 9 . sX = = 1' 4142 s X = 1' 4142 2 = 2 1' 3565 0' 9 a ' = X b' . Y = 2 ( 0' 9783 ). 3' 6 = 5' 5217

Finalmente, calculemos la recta de ajuste de X sobre Y :

b' =

s s XY 1' 4142 = r . X = 0' 9383. = 0' 9783 2 sY 1' 3565 sY

Su ecuacin es : X' = 5'5217 - 0'9783 . Y

13
La recta de regresin de Y sobre X corta a los ejes coordenados en los puntos (0'5,0) y (0,-0'4), siendo la proporcin de varianza no explicada por X del 25'58%. a) Calcule los coeficientes de correlacin y de determinacin. b) Siendo X = 5, qu pronstico diferencial corresponde a una puntuacin directa X = 4 ?.

a)

Los coeficientes de correlacin y de determinacin se obtienen directamente de la proporcin de varianza no explicada : 1 - r2 = 0'2558 r2 = 1 - 0'2558 = 0'7442 Luego : Coeficiente de determinacin : Coeficiente de correlacin : R2 = r2 = 0'7442

r = 0' 7442 = 0' 8627

Para determinar si el coeficiente de correlacin es positivo o negativo se pueden seguir distintos procedimientos. Uno podra consistir en dibujar la recta de regresin (enlazando los dos puntos conocidos) observando si es creciente (b > 0 y r > 0) o decreciente (b < 0 y r < 0). As resulta que es creciente y, por tanto, r = 0'8627.

b)

Determinemos la recta de regresin en puntuaciones directas y diferenciales : Si la recta de regresin Y' = a + b.X pasa por (0'5,0) y (0,-0'4) , significa que : - para X = 0'5 Y' = 0 : 0 = a + b.0'5 - para X = 0 Y' = -0'4 : -0'4 = a + b.0 -0'4 = a 0 = -0'4 + b.0'5 b = 0'4 / 0'5 = 0'8 Regresin y correlacin (F. lvarez) - 17

La recta de regresin es : en puntuaciones directas : en puntuaciones diferenciales :

Y' = -0'4 + 0'8 . X y' = 0'8 . x

A la puntuacin directa X = 4 , le corresponde una puntuacin diferencial : x = X X = 4 5 = 1 luego el pronstico diferencial correspondiente es : y' = 0'8 . x = 0'8 . (-1) y' = -0'8 NOTA : Calculado b = 0'8 > 0, concluiremos que el coeficiente de correlacin es tambin positivo (r = 0'8627), tal como se dedujo en el apartado a).

14
A las puntuaciones directas 2 y 6 de la variable X le corresponden predicciones 3'2 y 7'2 respectivamente. Si la proporcin de varianza asociada a X es del 70'42% y los valores de la variable dependiente Y son: 1 , 3 , 5 , 6 y 11 a) obtenga las ecuaciones de las dos rectas de regresin b) calcule el coeficiente de correlacin c) un pronstico tipificado 1'1868 , a qu puntuacin directa de X corresponde ?.

a)
En la recta de regresin de Y sobre X : Y' = a + b.X - Para X = 2 , Y' = 3'2 : 3'2 = a + 2.b - Para X = 6 , Y' = 7'2 : 7'2 = a + 6.b Resolviendo el sistema obtenemos : a = 1'2 b = 1

Y' = 1'2 + X

Para el clculo de la recta de regresin de X sobre Y no disponemos de elementos suficientes de momento.

b)
Con los valores conocidos de Y calculamos su media, varianza y desviacin tpica :

Y=

Si la proporcin de varianza asociada es del 70'42%, deducimos que : r2 = 0'7042 y, siendo b = 1 > 0 , el coeficiente de correlacin r tambin ser positivo. Es decir :

1 + 3 + 5 + 6 + 11 = 5' 2 5

s2 = Y

12 + 3 2 + 5 2 + 6 2 + 112 5' 2 2 = 11' 36 5 r = + 0' 7042 = 0' 8392

s Y = 11' 36 = 3' 3705

De la recta de regresin de Y sobre X deducimos (para las medias) :

Y ' = Y = 1' 2 + X

X = Y 1' 2 = 5' 2 1' 2 = 4

La desviacin tpica de X la podemos obtener ahora de la relacin :

r = b.

sX sY

sX =

r . s Y 0' 8392. 3' 3705 = = 2' 8284 1 b

2 s X = 2' 8284 2 = 8

a bis)
Estamos en condiciones de calcular la recta de regresin de X sobre Y : s r . s X 0' 8392. 2' 8284 r = b'. Y b' = = = 0' 7042 a = X 0' 7042. Y = 4 0' 7042. 5' 2 = 0' 3380 3' 3705 sX sY La recta de regresin de X sobre Y tiene por ecuacin : X' = 0'3380 + 0'7042 . Y

c)

z Y' = 0' 8392. z X La recta de regresin de Y sobre X en puntuaciones tpicas es : z Y' = r . z X Para el pronstico tipificado 1'1868 deduciremos el valor tipificado de X. Teniendo en cuenta el proceso de tipificacin, deduciremos la puntuacin directa de X z Y' = 1' 1868 zX = 1' 1868 X X X4 = 1' 4142 = = 0' 8392 sX 2' 8284 X = 1' 4142. 2' 8284 + 4 = 8

15
En un grupo de 10 sujetos se han aplicado dos pruebas (X,Y). Las puntuaciones obtenidas en X fueron dicotomizadas por la Mediana formndose dos categoras: altos (A) y bajos (B). Los resultados son los siguientes : Sujeto X Y 1 B 5 2 A 3 3 B 3 4 A 0 5 A 1 6 B 3 7 B 2 8 A 0 9 A 1 10 B 2

Elija y calcule el ndice de correlacin adecuado para medir la relacin existente entre X e Y. 18 - Regresin y correlacin (F. lvarez)

X
0 1 2 3 4 5

nA nA.X nB nB.X X
2 2 0 1 0 0 0 2 0 3 0 0 0 0 2 2 0 1 0 0 4 6 0 5 0 1 2 3 4 5

n
2 2 2 3 0 1

n.X n.X2
0 2 4 9 0 5 0 2 8 27 0 25

5
XA =

15

10

20

62

5 15 20 62 = 1; XB = = 3 ; X = = 2 ; SX = 2 2 = 1483 ' 5 5 10 10
rbp = XA X B 1 3 5 5 . p. q = . . = 0'674 SX 1483 10 10 '

Cierta relacin entre las variables, de signo inverso. A mayor puntuacin en la prueba Y menor nivel en X.

16
La puntuacin estimada de la variable Y para un valor 0 de la variable X es 05454, siendo la varianza de esta variable 165. Sabiendo que el porcentaje de varianza de la variable Y no asociada a la variacin de X es 4545% y que la varianza del error es 0318297, hallar : a) la correlacin de Pearson entre X e Y. b) la ecuacin de regresin para pronosticar Y a partir de X. c) la varianza de las puntuaciones pronosticadas. Datos :
2 Se

Y' = a + b. X 0'5454 = a + b.0 a = 0'5454 ; S 2 = 16'5 ; X


a) b)

S2 y

2 = 1 r 2 = 0'04545 ; S e = 0'318297

1 - r2 = 004545 r2 = 1 - 004545 = 095455 r = 0977 a = 05454

0'318297 = 0'04545 S 2 = 7'003 S Y = 2'646 Y S2 Y S r.S Y 0'977.2'646 r = b. X b = = = 0'6364 Y' = 0'5454 + 0'6364. X SY SX 16'5
c)
2 2 S 2 = S e + S Y' Y 2 2 2 S Y ' = S Y S e = 7'003 0'318297 = 6'684703

17
Las puntuaciones estimadas de la variable Y para los valores 3 y 5 de la variable X son 24545 y 37272 respectivamente. El coeficiente de correlacin entre X e Y es 0977, y la varianza de la variable X es 165. Con estos datos calcular : a) la ecuacin de la recta de regresin. b) la varianza de las puntuaciones pronosticadas. c) la proporcin de varianza de la variable Y no asociada a la variacin de X. Datos :

2'4545 = a + 3. b Y' = a + b. X 3'7272 = a + 5. b


a = 054545

r = 0'977

S2 = 16'5 X
Y = 054545 + 063635.X

a) b)

Resolviendo el sistema anterior :

b = 063635

r2 =

s2 ' y s2 y

s2 ' = r 2 . s2 y y

r = b.
c)

SX 16'5 2 0'977 = 0'63635. = 0'6364 SY = 2'656594 SY ' = 0'977 2 .2'656594 2 = 6'7366 SY SY


(45471%) Regresin y correlacin (F. lvarez) - 19

1 - r2 = 1 - 09772 = 0045471

18
Las puntuaciones directas obtenidas por 5 sujetos en la escala LKS (Escala de Lucas) y las obtenidas por esos mismos sujetos en el factor C (Control Social) del PSI son las que figura en la tabla final. a) Encuentre la puntuacin pronosticada en LKS de un sujeto cuya puntuacin directa en C es 15. b) Encuentre la parte de la varianza de LKS asociada a la variacin de C. c) Interprete el resultado obtenido al calcular el estadstico que expresa la relacin entre LKS y C. Sujetos LKS C Y = LKS X=C X 8 16 14 20 12 70 Y 49 40 43 31 37 200 X2 64 256 196 400 144 1060 Y2 2401 1600 1849 961 1369 8180 X.Y 392 640 602 620 444 2698 A 49 8 B 40 16 C 43 14 D 31 20 E 37 12

70 200 1060 = 14 ; Y = = 40 ; S 2 = 14 2 = 16 ; S X = 4 X 5 5 5 8180 2698 S2 = 40 2 = 36 ; S Y = 6 ; S XY = 14.40 = 20'4 Y 5 5 X=


b = -204 / 16 = -1275 a) Y = 5785 - 1275.X = 5785 - 1275 . 15 = 38725 b) r = -204 / 4 . 6 = -085 r2 = 07225 (7225%) a = 40 - (.1275).14 = 5785

c) Alta relacin entre las dos pruebas (r=-085) y de signo inverso. Es decir, un sujeto con alta puntuacin en LKS tendr baja puntuacin en C

19
La empresa de publicidad VENDEBIEN quiere saber si la aceptacin o rechazo dependen del sexo. Para ello se encuesta a 200 personas de las cules el 50% son mujeres; 40 hombres rechazan el producto mientras que 30 mujeres lo aceptan. Elija y calcule el ndice de correlacin adecuado para interpretar estos datos. H a=60 c=40 M b=30 d=70

Aceptan Rechazan

60.70 30.40 ad bc = = 0'3015 ( a + b).( c + d ).( a + c).( b + d ) 90110.100.100 .

Escasa relacin entre la aceptacin y el sexo. De aceptarla, el mayor rechazo se produce en mujeres.

20
La ecuacin de la recta de regresin que permite pronosticar las calificaciones en Psicologa Matemtica II (Y) a partir de las calificaciones en Psicologa Matemtica I (X) es la siguiente : Y = 08.X - 025 Sabiendo que Sx a) rxy b) la varianza de las puntuaciones pronosticadas. c) la proporcin de varianza error cometida al pronosticar, utilizando la recta de regresin anterior.

= (4/5).Sy ; Sy = 3 , X , Y.

y que

X Y = 1'74 , calcule :

20 - Regresin y correlacin (F. lvarez)

Datos :

Y' = 0'8. X 0'25 ; S X =

4 . S ; S = 3 ; X Y = 1'74 5 Y Y

a)

b = 0'8 2'4 S 4 r = b. X = 0'8. = 0'64 S X = .3 = 2'4 3 SY 5 a = Y b. X 0'25 = Y 0'8. X X = 7'45 ' X Y = 174 Y = 5'71

b) c)

r =
2

s2 ' y s2 y

s2 ' = r 2 . s2 = 0'64 2 .32 = 3'6864 y y

1 - r2 = 1 - 0'642 = 0'5904 (59'04%)

21
La recta de regresin de Y sobre X, que permite el pronstico en el rendimiento en un trabajo manual a partir de las puntuaciones en un test de destreza manual, corta al eje de ordenadas en Y = 8 y al de abscisas en X = -4, en puntuaciones directas. a) Calcule la ecuacin de la recta de regresin anterior en puntuaciones directas. b) Represente grficamente la recta de regresin anterior. c) Calcule el coeficiente de correlacin entre X e Y sabiendo que la varianza de los errores es la cuarta parte de la varianza de Y. a) Para X = 0 , Y = 8 y, para X = -4, Y = 0 b)

8=a a = 8 Y' = a + b. X Y' = 8 + 2. X b = 2 0 = a 4. b

c)

1 S 2 = .S 2 e 4 Y

2 S e = S 2 .(1 r 2 ) Y

1 2 .S 4 Y 3 r2 = 1 2 = 1 2 = 4 SY SY S2 e

r = 0'866

22
Estudiando la relacin entre las variables X e Y se obtuvieron los siguientes datos :

X = 119 , Y = 1'30 , S x = 10 , SY = 0'55 , rxy = 0'70 , n = 10


a) Elena C. obtuvo una puntuacin de 130 en X. Estime su puntuacin en Y. b) Se estim la puntuacin 128 en la variable Y para Gonzalo S.. Cul fue su puntuacin en la variable X ?. c) Determinar el valor de

Sy.x

y la desviacin tpica de las puntuaciones pronosticadas (Sy).

a)

b = r.

sy sx

= 0'7.

0'55 = 0'0385 ; a = 130 0'0385x119 = 3'2815 Y' = 3'2815 + 0'0385. X ' 10

Y' = 3'2815 + 0'0385130 = 1'7235 .


b) 128 = -32815+00385.X X = 11848

c)

S Y.X = S Y . 1 r 2 = 0'55. 1 0'7 2 = 0'3928


2 2 S 2 ' = S Y S Y.X = 0'3025 01543 = 01482 S Y' = 0'385 ' ' Y

Regresin y correlacin (F. lvarez) - 21

23
La siguiente grfica muestra las calificaciones obtenidas por dos grupos de alumnos que han estudiado con dos mtodos de enseanza distintos (A y B). Elija, calcule e interprete el coeficiente de correlacin ms adecuado para estudiar la relacin entre el mtodo de enseanza y las calificaciones.

XA
2 4 6 8

XB
2 4 5 6 9 10 36 4 16 5 25 6 36 9 81 10 100 56 382

20

X X2

2 4

4 16

6 36

8 64

2 4

Biserial puntual (rbp). Una cuantitativa (calificacin) y la otra dicotmica (mtodo).

XA =

20 36 56 = 5 ; XB = = 6; X = = 5'6 ; S X = 4 6 10
rbp =

382 5'6 2 = 2'61 10

XA X B 5 6 4 6 . p. q = . . = 0187 ' SX 2'61 10 10


r2 = 0035 (35%)

Existe una relacin muy baja (del 35%) entre el mtodo seguido y las calificaciones. De aceptarse la relacin diramos que los alumnos que siguen el mtodo B obtienen mejores resultados (signo negativo de r).

24
Sabemos que las puntuaciones diferenciales pronosticadas (y) son cinco veces las puntuaciones diferenciales de la variable X, y que la proporcin de varianza asociada entre X e Y es igual a 025. Calcular : a) La pendiente de la recta de regresin de Y sobre X en puntuaciones directas y diferenciales. b) La pendiente de la recta de regresin de Y sobre X en puntuaciones tpicas. c) La pendiente de la recta de regresin de X sobre Y en puntuaciones directas.

Datos : a) b) c) b=5

y = 5x
r2 = 025 r = 05

r =
2

s2 ' y s2 y

= 0'25

b.b = r2 5.b = 025 b = 025 / 5 = 005

25
Para un grupo de 100 sujetos y en dos variables X e Y, disponemos de los siguientes datos : xy=480 ; x2=400 ; y2=Y=900. Sabiendo adems que X e Y son dos variables cuantitativas que mantienen una relacin lineal y que, lgicamente, x = y = 0 a) Cunto valdr el coeficiente de correlacin de Pearson entre X e Y ?. b) Cunto valdr la desviacin tpica de los errores cometidos al pronosticar Y a partir de X ?. c) Qu puntuacin directa pronosticaremos en Y a un sujeto que ha obtenido una puntuacin x=-2 ?. Se sigue en el enunciado la notacin usual de representacin de puntuaciones directas (mayscula) y diferenciales (minscula). Recordemos que : 22 - Regresin y correlacin (F. lvarez)

S XY =

. ni .(X i X )(Yi Y )
i

En puntuaciones directas

2 SX =

n .(X
i i

ni . X i .Yi
i

En puntuaciones diferenciales

X)

N
i 2 i

X .Y

S XY =
2 SX =

n .x . y
i i i

n .X
i

X2

n .x
i i

2 i

a)

Para puntuaciones diferenciales :

s xy

xy = 480 = 4'8 =
n 100

sx =

x2
n

400 = =2 100

sy =

y2
n

900 =3 100

r = 48 / 2'3 = 08 b) c)

se = s y.x = s y . 1 r 2 = 3. 1 0'8 2 = 18 '


En puntuaciones diferenciales : y = b.x , con b = r . Para x = -2 : y = 12 . (-2) = -24 Como :

sy

3 = 0'8. = 12 ' sx 2

y' = Y' Y Y' = y'+ Y = y'+

Y = 2'4 + 900 = 2'4 + 9 = 6'6


N 100

26
La empresa de publicidad VENDEBIEN quiere saber si existe relacin entre la duracin de un anuncio en T.V. y la aceptacin o rechazo del mismo. Los resultados de la encuesta se incluyen en la siguiente tabla. Elija y calcule el ndice de correlacin adecuado para interpretar estos datos. Duracin 5-9 10 - 14 15 - 19 20 - 24 25 - 29 Aceptacin 3 4 4 1 0 Rechazo 0 1 2 3 2

X
5-9 10-14 15-19 20-24 25-29 7 12 17 22 27

nA nA.X nR nR.X X
3 4 4 1 0 21 48 68 22 0 0 1 2 3 2 0 12 34 66 54 7 12 17 22 27

n
3 5 6 4 2

n.X
21 60 102 88 54

n.X2
147 720 1734 1936 1458

12
XA =

159

166

20

325

5995

159 166 325 5995 = 13'25 ; X R = = 20'75 ; X = = 16'25 ; S X = 16'252 = 5'974 12 8 20 20 X XR 13'25 20'75 12 8 rbp = A . p. q = = 0'615 . . SX 5'974 20 20

Cierta relacin entre las variables, de signo inverso. A mayor duracin mayor rechazo.

27
El gabinete de estudios sobre Malestar Social desea conocer si existe relacin entre la consumicin de drogas y la comisin de delitos sobre la propiedad. Para ello se selecciona una muestra y se comprueba que 50 individuos han consumido algn tipo de droga y a la vez han estado implicados en delitos contra la propiedad. Teniendo en cuenta que un 20% de la muestra ha cometido delitos contra la propiedad, que 250 no consumen drogas ni han estado implicados en delitos contra la propiedad y que la muestra constaba de 500 individuos, qu conclusin obtendr el gabinete de estudios ?. (Elija, calcule e interprete el coeficiente de correlacin adecuado).

Regresin y correlacin (F. lvarez) - 23

Delito SI Delito NO

Droga SI a=50 c=150

Droga NO b=50 d=250

. ad bc 50.250 50150 = 0144 ' = (a + b).( c + d ).( a + c).( b + d ) 100.400.200.300

Escasa relacin entre consumo de drogas y comisin de delitos. De aceptarla, la mayor comisin de delitos se produce en consumidores de drogas.

28
Un grupo de hombres y mujeres responde a una prueba (X). Los datos obtenidos aparecen en la siguiente tabla. Elija razonadamente, calcule e interprete el coeficiente de correlacin adecuado, para estudiar la relacin entre las puntuaciones de la prueba y la variable sexo. X 11 - 13 8 - 10 5-7 2-4 Mujeres 8 6 5 1 Hombres 3 5 6 6

X nM nM.X nH nH.X X
2-4 5-7 8-10 11-13 3 6 9 12 1 5 6 8 3 30 54 96 6 6 5 3 18 36 45 36 3 6 9 12

n
7 11 11 11

n.X
21 66 99 132

n.X2
63 396 891 1584

20
XM =

183

20

135

40

318

2934

183 135 318 2934 = 9'15 ; X H = = 6'75 ; X = = 7'95 ; S X = 7'952 = 3186 ' 40 40 20 20
rbp = XM XH 9'15 6'75 20 20 . p. q = . . = 0'377 SX 3186 ' 40 40

Muy dbil relacin entre las variables, de signo directo. De aceptarse, la mayor calificacin se produce en mujeres.

29
Elija el coeficiente de correlacin ms apropiado entre las variables puntuaciones en un test de inteligencia (X), y prejuicio antiprotestante (Y), teniendo en cuenta el cuadro adjunto. En este cuadro, fA significa frecuencia con alto prejuicio y fB frecuencia con bajo. Calcule el coeficiente de correlacin elegido y comente brevemente el resultado obtenido. 9 - 11 6-8 3-5 0-2 Y fA 40 40 0 0 fB 0 0 10 10

X
0-2 3-5 6-8 9-11 1 4 7 10

nA nA.X nB nB.X X
0 0 40 40 0 0 280 400 10 10 0 0 10 40 0 0 1 4 7 10

n
10 10 40 40

n.X
10 40 280 400

n.X2
10 160 1960 4000

80
XA =

680

20

50

100

730

6130

730 6130 680 50 = 8'5 ; X B = = 2'5 ; X = = 7'3 ; S X = 7'32 = 2'83 80 20 100 100
rbp = XA X B 8'5 2'5 80 20 . p. q = . . = 0'848 SX 2'83 100 100

Elevada relacin entre las variables, de signo directo. A mayor puntuacin en el test mayor prejuicio antiprotestante.

24 - Regresin y correlacin (F. lvarez)

30
Estudiando la relacin entre las variables X e Y se obtuvieron los siguientes datos :

X = 50 , Y = 6 , S x = 6 , S Y = 2 , rxy = 0'8 , n = 5
a) Qu puntuacin directa en Y pronosticaremos a un sujeto que obtuvo una puntuacin directa en X de 52 ?.) b) Cunto valen

S2 y'

S y.x

?.

a)

b = r.

2 = 0'8. = 0'267 ; a = 6 0'267 x50 = 7'35 sx 6 Y' = 7'35 + 0'267. X Y' = 7'35 + 0'267 x52 = 6'534
2 2 2 S Y ' = S Y S Y.X = 4 144 = 2'56 '

sy

b)

S Y.X = S Y . 1 r 2 = 2. 1 0'8 2 = 12 '

31
Estudiando una muestra de 50 alumnos de BUP se observ que una proporcin de 010 estaba compuesta por alumnos hijos nicos. De los 50 alumnos, una proporcin de 06 coman en el Colegio. Si sabemos que una proporcin de 004, con respecto al total, son hijos nicos que no comen en el Colegio. Existe una relacin entre ser hijo nico o no y comer o no en el Colegio ?. Halle el coeficiente de correlacin que corresponda e interprete el resultado. nico SI a=3 c=2 nico NO b=27 d=18

Comen SI Comen NO

318 27.2 . ad bc =0 = (a + b).( c + d ).(a + c).( b + d ) 30.20.5.45

Las variables son independientes. No existe ningn tipo de relacin entre ser hijo nico y comer en el colegio.

32
La desviacin tpica de un determinado grupo de personas en la variable ansiedad (X) es igual a 2. Tambin conocemos para esta variable la media de los varones (10) y la de las mujeres (5). Sabiendo que el ndice de asociacin entre las variables ansiedad y sexo es igual a +1, y que el nmero de varones es superior al de mujeres : a) Qu coeficiente de correlacin habr sido utilizado ?. b) Interprete el valor del coeficiente de correlacin. c) Calcule la proporcin de varones que componen nuestra muestra. a) b) Biserial puntual (rbp). Una cuantitativa y la otra dicotmica. Relacin perfecta. Los varones presentan altas puntuaciones en ansiedad y las mujeres bajas.

rbp =
c)

xv xm 10 5 2 . p. q = 1 = . p. q p. q = = 0'4 p. q = 016 ' 2 5 sx 1 1 0'64 1 0'6 p = 0'8 = = 2 2 p = 0'2

' ' ' p.(1 p) = 016 p p 2 = 016 p 2 p + 016 = 0 p =

La solucin es 08 al indicar que hay ms varones que mujeres.

33
0 X 1 2 3 [0,10) 0 0 5 3 Y [10,20) 1 5 18 2 [20,30) 0 20 6 1 [30,40] 16 3 0 0 Con la presente distribucin bivariante obtenga : a) recta de regresin de la media de Y condicionada a X b) coeficiente de correlacin de la media de Y condicionada a X c) recta de regresin de Y sobre X d) coeficiente de correlacin lineal (de Y sobre X) e) razn de correlacin.

Compare los resultados obtenidos en los apartados a), b) con los de los apartados c), d). Interprete el significado de la razn de correlacin calculada. Regresin y correlacin (F. lvarez) - 25

a) b) Para cada valor de la variable X, determinamos la media de los correspondientes valores de Y. Obtendremos tambin las varianzas de cada valor Y para calcular posteriormente la razn de correlacin (apartado e). [0,10) [10,20) [20,30) [30,40] X=0 y f f.y f.y2 5 0 0 0 [0,10) X=1 y f f.y f.y2 5 0 0 0 [0,10) X=2 y f f.y f.y2 5 5 25 125 [0,10) X=3 y f f.y f.y
2

15 1 15 225 [10,20) 15 5 75 1125 [10,20) 15 18 270 4050 [10,20) 15 2 30 450

25 0 0 0 [20,30) 25 20 500 12500 [20,30) 25 6 150 3750 [20,30) 25 1 25 625 X 0 1 2 3


( )

35 16 560 1960 [30,40] 35 3 105 3675 [30,40] 35 0 0 0 [30,40] 35 0 0 0 Y (*) 33'8 24'3 15'3 11'7 n 17 28 29 6

= 17 = 575 = 2185

= 28 = 680 = 17300

= 29 = 445 = 7925

5 3 15 75

=6 = 70 = 1150

Con las tablas de clculos anteriores obtenemos : X=0 X=1 X=2 X=3

y 1 = 33'8 y 2 = 24 '3 y 3 = 15'3 y 4 = 11'7

s 21 y 2 sy 2 s23 y s24 y

= 22 '1453 = 28'0612 = 37 '8121 = 55'5556

* Medias de cada Y condicionado a X

Con esta distribucin procedemos a calcular la recta de regresin y el coeficiente de correlacin (omitimos la tabla de clculos) : n.X n.X2 n.Y n.Y2 n.X.Y c) d) = = = = = 104 198 1768'9 43565'15 1778'4 Media de X = 1'3 Varianza de X = 0'785 Media de Y = 22'11 Varianza de Y = 55'657 Covarianza = -6'5146 Recta de regresin de la media de Y condicionada a X Y' = 32'8998 - 8'2989.X Coeficiente de correlacin de la media de Y condicionada a X 2 r = -0'9856 (r = 0'9714)

X
0 0 0 0 1 1 1 1 2 2 2 2 3 3 3 3

Y
5 15 25 35 5 15 25 35 5 15 25 35 5 15 25 35

n
0 1 0 16 0 5 20 3 5 18 6 0 3 2 1 0

n.X
0 0 0 0 0 5 20 3 10 36 12 0 9 6 3 0

n.X
0 0 0 0 0 5 20 3 20 72 24 0 27 18 9 0

n.Y
0 15 0 560 0 75 500 105 25 270 150 0 15 30 25 0

n.Y
0 225 0 19600 0 1125 12500 3675 125 4050 3750 0 75 450 625 0

n.X.Y
0 0 0 0 0 75 500 105 50 540 300 0 45 90 75 0

80

104

198

1770

46200

1780

26 - Regresin y correlacin (F. lvarez)

Media de X = 1'3 Varianza de X = 0'785 Media de Y = 22'125 Varianza de Y = 87'9844 Covarianza = -6'5125 e) Razn de correlacin :

Recta de regresin de Y sobre X Y' = 32'91 - 8'2962.X Coeficiente de correlacin lineal 2 r = -0'7836 (r = 0'6141)

ni .s y 1 1 17.22'1453 + 28.28'0612 + 29.37'8121 + 6.55'5556 = 1 . 2 i = 1 . = 0'6317 N 80 87'9844 sY


2

Conclusiones : Comprobamos que 2 toma un valor comprendido entre 0 y 1 y verifica que 2 r2 (0'6317 0'6141). Al ser muy prximo 2 a r2, concluimos que la relacin entre las variables X , Y es de tipo lineal. Esta ltima conclusin habramos deducido al comprobar que las rectas de ajuste de Y sobre X y la de la media de Y condicionada a X prcticamente coinciden : Y' = 32'91 - 8'2962.X Y' = 32'8998 - 8'2989.X La sustitucin de las observaciones Yi por su promedio, ha permitido aumentar el valor del coeficiente de correlacin : r = -0'7836 r = -0'9856 incrementando as la proporcin de varianza explicada por el ajuste : 2 r2 = 0'9714 (97'14%) r = 0'6141 (61'41%)

34
De un grupo de COU, integrado `por 40 alumnos, conocemos sus calificaciones finales en Matemticas y en Filosofa. El nmero de aprobados en ambas ascendi a 15, suspendiendo 12 las dos materias, mientras que slo aprob Matemticas el 10% de los alumnos. a) Calcule el coeficiente de correlacin ms adecuado para medir el grado de asociacin existente entre las variables descritas. b) Asumiendo que las calificaciones en Matemticas y en Filosofa se distribuyen normalmente, determine otro coeficiente que estudie el nivel de asociacin y no est basado en el concepto de correlacin de Pearson Se trata de analizar la relacin que puede existir entre las calificaciones en las dos materias. a) Siendo las dos variables dicotmicas, calculamos el coeficiente de correlacin (phi) . Dispuesta la tabla como sigue (totalizando filas y columnas) obtenemos : Y - Filosofa 1 (Aprueban) 0 (Suspenden) a = 15 b=4 c=9 d = 12 24 16

X Matemticas

1 (Aprueban) 0 (Suspenden)

19 21

(a + b )(c + d )(a + c )(b + d ) . . .

ad bc

15.12 4.9 19.21.24.16

= 0'3679 baja relacin entre las variables.

El aprobar o suspender una materia no condiciona el resultado final en la otra. b) Siendo las dos variables dicotmicas (normalmente distribuidas inicialmente), calculamos el coeficiente de correlacin tetracrica (rt). 1 Calculamos los productos : a.d = 15 . 12 = 180 y b.c = 4 . 9 = 36. 2 Como a.d > b.c , calculamos el cociente : C = a.d / b.c = 180 / 36 = 5 (rt ser positivo) 3 Consultamos la tabla XXV, para el clculo del coeficiente de correlacin tetracrico, localizando el cociente C=5 en el intervalo (A,B) = (4'8305 , 5'0075), al cul corresponde un coeficiente 0'56 + R. De aqu :

R=
NOTA :

CA 5 4'8305 = = 0'00958rt = 0'56 + R = 0'56 + 0'00958 = 0'56958 100.(B A) 100.(5'0075 4'8305)

Generalmente se verifica que el coeficiente de correlacin tetracrica y el coeficiente verifican la relacin : Regresin y correlacin (F. lvarez) - 27

rt 1'5 . (con mayor rigor para valores del coeficiente tetracrico, menores o iguales a 0'5).
En nuestro caso : 1'5 . = 1'5 . 0'3679 = 0'55185 rt Esto permite tener una referencia sobre el intervalo (-1 , 1), a la hora de interpretar el valor obtenido con el coeficiente de correlacin tetracrica. Calculando el valor aproximado de , podremos medir el grado de asociacin :

rt 0'56958 = = 0'37972 15 ' 15 '

baja relacin entre las variables

35
Con el fin de estudiar si existe o no relacin entre las calificaciones en Matemticas y en Filosofa de COU, seleccionamos seis alumnos. Clasificados por orden de puntuacin final en cada materia result : Alumno Matemticas Filosofa 1 3 3 2 6 5 3 4 6 4 1 4 5 2 1 6 5 2

a) Utilizando el ndice adecuado, basado en el concepto de correlacin de Pearson, establezca el grado de relacin que existe entre las calificaciones de las dos asignaturas. b) Resuelva lo solicitado en el apartado anterior mediante un ndice que no est basado en el concepto de correlacin de Pearson a) Calcularemos el coeficiente de correlacin (rangos de Spearman) al presentarse dos variables ordinales (dos reordenaciones de los 8 alumnos). Denominamos X e Y a las variables que proporcionan, respectivamente, las clasificaciones en Matemticas y en Filosofa. Ordenando las primeras (X), calculamos sus diferencias con las segundas : X 1 2 3 4 5 6 Y 4 1 3 6 2 5 d -3 1 0 -2 3 1 d2 9 1 0 4 9 1 24

Con ello :

= 1

N. ( N 2 1)

6. d 2

= 1

6. ( 6 2 1)

6 . 24

= 0'3143

Es decir, apenas existe relacin entre las calificaciones. b) Procede ahora el clculo del coeficiente de correlacin (tau) de Kendall : Reordenamos los pares de observaciones de modo que la variable X (primer elemento del par) quede en orden ascendente y comparamos cada valor de Y con los Yi siguientes, contando una permanencia (P) si Y < Yi y una inversin (I) si Y > Yi. : X 1 2 3 4 5 6 Y 4 1 3 6 2 5

(4,1) I (4,3) I (4,6) P (4,2) I (4,5) P

(1,3) P (1,6) P (1,2) P (1,5) P

(3,6) P (3,2) I (3,5) P

(2,5) P

En total hemos encontrado 8 permanencias (P) y 4 inversiones (I). Con ello :

Es decir, como ocurri con el coeficiente , existe una escasa relacin entre las calificaciones en Matemticas y Filosofa.

Np Ni 84 4 = = = 0'2667 n.( n 1) 6.(6 1) 15 2 2

28 - Regresin y correlacin (F. lvarez)

36
Con el fin de estudiar si existe o no relacin entre las calificaciones en Matemticas y en Filosofa de COU, seleccionamos 30 alumnos analizando la puntuacin final en cada materia . Teniendo en cuenta que se nos proporcion en Filosofa solamente si el alumno aprob (A) o suspendi, establezca el grado de relacin que existe entre las calificaciones en dichas materias. Y Filosofa A S 2 1 5 0 10 2 4 0 3 1 1 1

X Matemticas

2 3 4 5 6 8

a) utilizando el ndice adecuado, basado en el concepto de correlacin de Pearson. b) mediante un ndice que no est basado en el concepto de correlacin de Pearson. a) Al ser dicotmica la 2 variable, obtendremos el coeficiente de correlacin biserial puntual : Y A=1 X 2 3 4 5 6 8 2 5 10 4 3 1 25 S=0 1 0 2 0 1 1 5 n 3 5 12 4 4 2 N=30 n.X 6 15 48 20 24 16 129 n.X2 12 45 192 100 144 128 621 Y=1 n.X1 4 15 40 20 18 8 105 Y=0 n.X0 2 0 8 0 6 8 24

105 = 4'2 25 129 X= = 4'3 30 X1 =


Con esto :

5 24 25 q= = 0167 ' = 4'8 p= = 0'833 30 5 30 621 4'32 = 2'21 s X = 2'21 = 1487 ' s2 = X 30 X0 =
rbp = X1 X 0 4'2 4'8 . p. q = . 0'833.0167 = 01505 ' ' 1487 ' sX

Es decir apenas existe relacin entre ambas variables. b) Calculemos ahora el coeficiente de correlacin biserial rb : Tomando el menor de los valores de p y q : min (p,q) = min (0'833 , 0'167) = 0'167 obtenemos el valor tabulado del cociente Con esto :

p. q (Tabla XXIII), que resulta ser igual a 0'55609 . f ( z) X1 X 0 p. q 4'2 4'8 rb = = . .0'55609 = 0'2244 1487 ' sX f ( z)

Aunque no coincide su valor con el coeficiente de correlacin biserial puntual, tambin podemos concluir que apenas existe relacin entre ambas variables.

37
Hemos encontrado, utilizando el criterio de mnimos cuadrados, que las rectas de regresin de Y sobre X en puntuaciones directas y tpicas son, respectivamente :

Y' = 1'2 . X + 4

zy' = 0'8 . zx

Sabiendo que : X = 5 , Y = 10 , S X = 2 , S Y = 3 , calcular : a) La varianza de las puntuaciones pronosticadas en Y. b) La recta de regresin de Y sobre X, en puntuaciones directas, si sumamos 5 a todos los valores de X. c) La recta de regresin de Y sobre X, en puntuaciones directas, si sumamos 3 a todos los valores de Y y multiplicamos por 2 todos los valores de X. Regresin y correlacin (F. lvarez) - 29

La recta de ajuste en puntuaciones tpicas nos proporciona el coeficiente de correlacin : r = 0'8 En consecuencia, sobra del enunciado el conocer una de las dos desviaciones tpicas. Conocido r = 0'8 ; b = 1'2 y una de las desviaciones tpicas (de X o de Y), la otra la habramos calculado a partir de la relacin :

r = b.
r=
a)

SX SY

Su conocimiento permite obtener la covarianza (cuyo clculo tampoco resulta imprescindible) :

S XY S X . SY
2

S XY = r. S X . SY = 0'8.2.3 = 4'8

Varianza de los pronsticos : SY'

Obtenida de la relacin que proporciona la proporcin de varianza explicada por el ajuste : S2 ' Y 2 = r 2 S 2 ' = S Y . r 2 = 32 .0'8 2 = 5'76 Y S2 Y
b) Si a los valores de X les sumamos 5, la nueva media se incrementa en 5, pero las medidas de dispersin se mantienen inalterables. Resulta as : X = 5 + 5 = 10 , Y = 10 , S X = 2 , SY = 3, S XY = 4' 8 Luego : c) Si a los valores de Y les sumamos 3, la nueva media se incrementa en 3, pero las medidas de dispersin se mantienen inalterables. Si los valores de X los multiplicamos por 2, la nueva media se multiplica por 2, y las medidas de dispersin tambin (la varianza por el cuadrado). Resulta as : X = 5 . 2 = 10 , Y = 10 + 3 = 13 , S X = 2 . 2 = 4 , SY = 3, S XY = 4' 8. 2 = 9'6 Luego :

b=

S XY = 1'2 S2 X

a = Y b. X = 10 12 . 10 = 2 Y' = 2 + 12. X ' '

b=

S XY S2 X

2. S XY 2 = . b = 0'6 2 2 . S2 4 X

a = Y b. X = 13 0'6 . 10 = 7 Y' = 7 + 0'6. X

38
Se desea estudiar si existe relacin entre `padecer diabetes y ceguera en la tercera edad. Para ello se analiza una muestra de 1000 personas del INSERSO encontrndose que de todas ellas un 50% presentan simultneamente diabetes y ceguera, el 40% no presentan ninguna de ambas deficiencias y el resto presentan en la misma medida slo una u otra deficiencia. Con estos datos elija, calcule e interprete el coeficiente de correlacin adecuado a dicho estudio. Se trata de analizar la relacin que puede existir entre las dos enfermedades. Siendo las dos variables dicotmicas, calculamos el coeficiente de correlacin (phi) . Padecen ambas 50% de 1000 500 No padecen ninguna 40% de 1000 400 Padecen slo diabetes La mitad de los 100 restantes 50 Padecen slo ceguera La mitad de los 100 restantes 50 Dispuesta la tabla como sigue (totalizando filas y columnas) obtenemos : Y - Ceguera 1 (Padece) 0 (No padece) a = 500 b = 50 c = 50 d = 400 550 450

X Diabetes

1 (Padece) 0 (No padece)

550 450

ad bc

( a + b) .( c + d).( a + c) .( b + d)

500.400 50.50 = 0'798 550.450.550.450

alta relacin entre las variables.

El padecer o no una dolencia condiciona el padecer la otra.

30 - Regresin y correlacin (F. lvarez)

EJERCICIOS PROPUESTOS
1
X
4 4 5 6 6 6

Y
0 1 2 2 3 4

n
3 5 6 2 8 1

De la presente distribucin conjunta de las dos variables (X,Y) : b) b) c) Obtener la recta de regresin de Y sobre X en puntuaciones diferenciales. Obtener la recta de regresin de X sobre Y en puntuaciones tpicas.. Calcular e interpretar la proporcin de varianza residual.

2
Y 0 1 2 2 3 0 0 4 1 6 2 6 0 4 4 8 0 0 5 X De la presente distribucin conjunta de las variables (X,Y) : a) Obtener la recta de regresin de Y sobre X. b) Calcular e interpretar el coeficiente de determinacin. c) Calcular su varianza residual.

3
De los 10 pares de valores que se representan en el diagrama de dispersin de la izquierda, a) Calcular la recta de regresin de Y sobre X. b) Calcular e interpretar el coeficiente de correlacin lineal c) Determinar la proporcin de varianza asociada a X. d) Calcular la media y varianza de las predicciones Y'. .

4
Y 3 4 5 0 0 3 5 1 1 7 2 5 15 1 3 12 2 0 X De la presente distribucin conjunta de las variables (X,Y) : a) Calcular la frecuencia que falta sabiendo que la media de X es igual a 4. b) Obtener la recta de regresin de Y sobre X en puntuaciones diferenciales. c) Calcular la proporcin de varianza residual.

5
Edad [10,15) [10,15) [10,15) [15,20) [15,20) [20,25] [20,25] Hermanos 0 1 2 1 2 1 2

n
3 5 9 5 10 3 5

De la distribucin de edades y nmero de hermanos de 40 jvenes : a) c) Obtener las rectas de regresin en puntuaciones directas, diferenciales y tipificadas. Calcular e interpretar el coeficiente de correlacin lineal.

6
Las siguientes distribuciones bivariantes pretenden estudiar el grado de relacin existente entre las variables : a) Puntuacin en un test de agresividad y sexo. b) Clasificacin (de mayor a menor) segn la nota media obtenida en las asignaturas del curso y en una prueba tendente a determinar su coeficiente intelectual. c) Ser bebedor y ser fumador. Determine y calcule en cada caso el ndice adecuado que permite medir el grado de relacin entre las variables descritas.

Regresin y correlacin (F. lvarez) - 31

(I)

Puntos test [ 0,10) [10,20) [20,30) [30,40) [40,50) [50,60)

Sexo Hombre Mujer 0 2 5 3 11 9 20 22 14 9 6 6

(II) Alumno Nota media C.I. 1 2 3 (III) Beben S No 2 4 4 3 5 6 4 1 1 5 6 5 6 3 2

Fuman S No 4 31 41 14

7
La proporcin de varianza residual, en un ajuste de Y sobre X, es del 22'12%. a) Determine dicha recta de ajuste sabiendo que a una puntuacin directa X=2 corresponde una prediccin 2'1 y que dicha recta corta al eje de ordenadas en el punto (0,0'3). b) Calcule el coeficiente de correlacin. c) Qu pronstico diferencial corresponde a una puntuacin directa X=5, si X = 0 ?.

8
En el estudio de la relacin lineal existente entre dos variables X e Y se observ que eran independientes. Sabiendo que sus respectivas medias son iguales a 2 y 1, y que tienen por varianzas 0'1538 y 0'6154, a) calcule las ecuaciones de las dos rectas de regresin b) determine el error tpico de la prediccin.

9
De los clculos realizados para estudiar la relacin existente entre las variables X e Y, se conoce que : - la recta de ajuste de Y sobre X pasa por el punto (2,2) - las media de X es igual a 1 y la de Y vale 4 - la varianza de la variable dependiente es igual a 2'2857, y la de las predicciones es 1'9047. A la vista de estos datos, calcule : a) Ecuaciones de las dos rectas de regresin en puntuaciones directas, diferenciales y tpicas. b) Proporcin de varianza no asociada a X.

10
Determinar las ecuaciones en puntuaciones diferenciales de las rectas de regresin correspondientes a la distribucin bivariante (X,Y), sabiendo que las varianzas de ambas variables son 4 y 9 respectivamente y que existe una relacin lineal perfecta y directa entre ellas.

11
En el estudio de la relacin lineal existente entre dos variables X e Y, sabemos que a las puntuaciones directas 0 y 2 de X le corresponden unos pronsticos respectivos 33243 y 77567. Sabiendo que la proporcin de varianza asociada al ajuste es del 9465% y que la variable dependiente tiene por media 82 y varianza 1536, calcular : a) Ecuacin de la recta de ajuste. b) Coeficiente de correlacin. c) Media y varianza de la variable X. d) Varianza residual y de las predicciones.

12
Analizamos las edades de 8 personas que acuden a un examen para la obtencin del carnet de conducir. Sabiendo que aprueban 5 con edades : 28, 24, 32, 45 y 30 y que los que suspenden tienen 23, 21 y 27 aos, determine el coeficiente ms adecuado para medir el grado de relacin de la edad con la superacin o no del examen.

13
Para los siguientes pares de valores de las variables X e Y : (12 , 4) , (10 , 7) , (12 , 5) , ( 11 , 65) , (14 , 2) , (11, 85) , (12, 3) , (14 , 15) , (10, 9) , ( 11, 7) calcular la proporcin de varianza que explica el ajuste de Y sobre X.

14
X Y f 0 -6 3 1 -2 6 1 -1 11 1 1 16 2 3 3 3 8 1 3 9 4 5 12 2 Determine la varianza de los errores y de las predicciones, correspondientes al ajuste de Y sobre X en la distribucin anterior.

32 - Regresin y correlacin (F. lvarez)

15
En un grupo de 10 alumnos se han obtenido las calificaciones en Anatoma, separando el ejercicio terico del prctico. El profesor encargado orden tales calificaciones de mayor a menor puntuacin, encontrando los resultados siguientes : Alumno Clasificacin teora Clasificacin prctica 1 6 6 2 2 10 3 7 4 4 10 3 5 4 9 6 1 7 7 8 2 8 5 5 9 9 1 10 3 8

Elija y calcule el ndice de correlacin adecuado para medir si existe relacin o no entre las calificaciones en las dos partes del examen.

16
Para los valores 0 y 2 de la variable X se obtuvieron unos pronsticos de la variable dependiente iguales a 68617 y 140531 respectivamente. Sabiendo que la proporcin de varianza de la variable Y no asociada a la variacin de X es del 1732%, y la varianza de la variable independiente es 29375, calcular : a) la ecuacin de la recta de regresin de Y sobre X. b) la varianza de las puntuaciones pronosticadas y la varianza residual. c) el coeficiente de correlacin entre X e Y

17
Y 0 1 2 1 6 0 2 2 8 7 0 3 3 10 5 4 0 1 8 5 1 0 6 X Con la presente distribucin bivariante obtenga : a) recta de regresin de la media de Y condicionada a X b) coeficiente de correlacin de la media de Y condicionada a X c) recta de regresin de Y sobre X d) coeficiente de correlacin lineal (de Y sobre X)

e) razn de correlacin. f) Compare los resultados obtenidos en los apartados a), b) con los de los apartados c), d). Interprete el significado de la razn de correlacin calculada.

18
Determine y calcule en cada uno de los siguioentes supuestos, el ndice adecuado (no basado en el concepto de correlacin de Pearson) que permita medir el grado de asociacin entre las variables X e Y. (I) X -2 -1 0 1 2 0 6 4 2 0 1 Y 1 1 4 6 5 8 (II) (ordinales) X Y A C B F C D D E E A F B

(III) X 1 0 1 2 50

Y 0 40 8

Regresin y correlacin (F. lvarez) - 33

SOLUCIONES DE LOS EJERCICIOS PROPUESTOS


1
X = 5'12
a) b = 1'133 b) r = 0'909 c) 1 - r2 = 0'1737

s 2 = 0'7456 X

Y = 1'96

s 2 = 1'1584 Y

s XY = 0'8448

y' = 1'133 . x zy' = 0'909 . zx La proporcin de varianza no explicada por X supone el 17'37% de la de Y.

2
X = 1'28
a) a = 2'6871 b) R2 = r2 = 0'5711 c) s 2 = 1'5097 Y.X

s 2 = 0'5216 X

Y = 5'2

s 2 = 3'52 Y

s XY = 1'024

Y' = 2'6871 + 1'9632 . X b = 1'9632 Representa la proporcin de varianza de Y explicada por X (el 57'11%)

3
X = 5'5
a) a = 1'9333 b) r = 0'8188 c) R2 = r2 = 0'6704 d) Y ' = Y = 405

s 2 = 8'25 X

Y = 4'05

s 2 = 1'8225 Y

s XY = 3'175

Y' = 1'9333 + 0'3848 . X b = 0'3848 Elevada relacin entre las variables (de tipo directo)

s 2 = 1'2218 Y'

4
X =4
a) n = 12 b) b = -0'9167 c) 1 - r2 = 0'4813

s 2 = 0'5714 X
y' = -0'9167 . x

Y = 1'6508

s 2 = 0'9257 Y

s XY = -0'5238

5
X = 16'375 s 2 = 14'3594 X Y = 1'525 s 2 = 0'3994 Y s XY = 0'4656
a = 0'994 b = 0'0324 a' = 14'597 b' = 1'1659 r = 0'1944 y' = 0'0324 . x zy' = 0'1944 . zx a) Y' = 0'994 + 0'0324 . X X' = 14'597 + 1'1659 . Y x' = 1'1659 .y zx' = 0'1944 . zy Las variables no estn relacionadas linealmente (son independientes) b) r = 0'1944

6
(I) (II) (III) Coeficiente biserial puntual Coeficiente de los rangos de Spearman Coeficiente

rbp = 0'0389
= 0'8857 = - 0'6154

7
a) Y = 0'3 + 0'9 . X b) r = 0'8825 c) y' = 4'5

8
a) Y' = 1 X' = 2 b) sY.X = sY = 0'7845

9
a) Y' = 6 - 2 . X X' = 2'6667 - 0'4167 . Y b) 1 - r2 = 0'1667 y' = -2 . x x' = -0'4167 .y zy' = -0'9129 . zx zx' = -0'9129 . zy

10
y' = 1'5 . x x' = 0'6667 . y

34 - Regresin y correlacin (F. lvarez)

11
a) b) c) d) Y = 33243 + 22162.X 09729 22, 296 08216, 145384

12
rbp = 056

13
08331 (o bien el 8331%)

14
19543 ; 155069

15
= -08667

16
a) b) c) Y = 68617 + 35957 . X 3998 y 796 09093

17
a) b) c) d) e) YM = 1'9317 + 0'9049 . X rM = 0'9924 Y = 1'9268 + 0'8862 . X r = 0'6067 2 = 03749 (prximo a r2 = 0'3681)

18
(I) (II) (III) Coeficiente biserial Coeficiente de Kendall Coeficiente tetracrico

rb = - 0'7250
= - 0'3333

rt = - 0'7744

Regresin y correlacin (F. lvarez) - 35

Clculo del coeficiente de correlacin biserial


La tabla proporciona, para el menor de los valores p y q, la cantidad :

p.q f ( z)
0'009 0'36738 0'40233 0'42579 0'44406 0'45922 0'47228 0'48379 0'49411 0'50346 0'51202 0'51990 0'52721 0'53400 0'54034 0'54629 0'55186 0'55711 0'56205 0'56671 0'57111 0'57527 0'57920 0'58292 0'58643 0'58975 0'59289 0'59585 0'59865 0'60129 0'60377 0'60611 0'60830 0'61035 0'61226 0'61405 0'61570 0'61724 0'61865 0'61993 0'62111 0'62216 0'62310 0'62393 0'62465 0'62525 0'62575 0'62614 0'62642 0'62659 0'62666

min(p,q)
0'00 0'01 0'02 0'03 0'04 0'05 0'06 0'07 0'08 0'09 0'10 0'11 0'12 0'13 0'14 0'15 0'16 0'17 0'18 0'19 0'20 0'21 0'22 0'23 0'24 0'25 0'26 0'27 0'28 0'29 0'30 0'31 0'32 0'33 0'34 0'35 0'36 0'37 0'38 0'39 0'40 0'41 0'42 0'43 0'44 0'45 0'46 0'47 0'48 0'49 0'50

0'000 0'37186 0'40502 0'42781 0'44569 0'46061 0'47349 0'48487 0'49508 0'50435 0'51284 0'52066 0'52791 0'53465 0'54096 0'54686 0'55240 0'55762 0'56253 0'56716 0'57154 0'57568 0'57958 0'58328 0'58677 0'59007 0'59319 0'59614 0'59892 0'60154 0'60401 0'60633 0'60851 0'61055 0'61245 0'61422 0'61586 0'61738 0'61878 0'62006 0'62122 0'62226 0'62319 0'62401 0'62471 0'62531 0'62579 0'62617 0'62644 0'62660 0'62666

0'001 0'29788 0'37603 0'40762 0'42977 0'44729 0'46198 0'47469 0'48594 0'49605 0'50523 0'51365 0'52141 0'52860 0'53530 0'54156 0'54743 0'55294 0'55812 0'56301 0'56761 0'57196 0'57608 0'57996 0'58364 0'58711 0'59039 0'59350 0'59643 0'59919 0'60180 0'60425 0'60656 0'60872 0'61074 0'61263 0'61439 0'61602 0'61753 0'61891 0'62018 0'62133 0'62236 0'62328 0'62408 0'62478 0'62536 0'62584 0'62620 0'62646 0'62661

0'002 0'31576 0'37994 0'41014 0'43169 0'44887 0'46333 0'47587 0'48700 0'49701 0'50611 0'51445 0'52215 0'52929 0'53595 0'54217 0'54800 0'55347 0'55862 0'56348 0'56806 0'57239 0'57647 0'58034 0'58399 0'58745 0'59071 0'59380 0'59671 0'59946 0'60205 0'60449 0'60678 0'60893 0'61094 0'61281 0'61456 0'61618 0'61767 0'61904 0'62030 0'62143 0'62245 0'62336 0'62416 0'62484 0'62541 0'62588 0'62623 0'62648 0'62662

0'003 0'32772 0'38363 0'41257 0'43357 0'45042 0'46466 0'47704 0'48804 0'49795 0'50697 0'51525 0'52289 0'52998 0'53659 0'54277 0'54856 0'55400 0'55912 0'56395 0'56850 0'57281 0'57687 0'58071 0'58435 0'58778 0'59103 0'59410 0'59699 0'59973 0'60230 0'60472 0'60700 0'60913 0'61113 0'61299 0'61473 0'61633 0'61781 0'61917 0'62042 0'62154 0'62255 0'62345 0'62423 0'62490 0'62547 0'62592 0'62626 0'62650 0'62663

0'004 0'33699 0'38712 0'41493 0'43540 0'45195 0'46597 0'47820 0'48908 0'49889 0'50783 0'51604 0'52362 0'53066 0'53723 0'54336 0'54912 0'55453 0'55962 0'56442 0'56895 0'57322 0'57726 0'58109 0'58470 0'58811 0'59134 0'59439 0'59727 0'59999 0'60255 0'60496 0'60722 0'60934 0'61132 0'61317 0'61489 0'61649 0'61796 0'61930 0'62053 0'62165 0'62264 0'62353 0'62430 0'62496 0'62552 0'62596 0'62629 0'62652 0'62664

0'005 0'34469 0'39044 0'41722 0'43720 0'45345 0'46726 0'47934 0'49011 0'49982 0'50868 0'51682 0'52435 0'53134 0'53786 0'54396 0'54967 0'55505 0'56011 0'56488 0'56938 0'57364 0'57766 0'58146 0'58505 0'58845 0'59166 0'59469 0'59755 0'60025 0'60280 0'60519 0'60744 0'60954 0'61151 0'61335 0'61506 0'61664 0'61810 0'61943 0'62065 0'62175 0'62274 0'62361 0'62437 0'62502 0'62556 0'62600 0'62632 0'62654 0'62664

0'006 0'35133 0'39360 0'41945 0'43897 0'45492 0'46854 0'48047 0'49112 0'50074 0'50953 0'51760 0'52507 0'53201 0'53849 0'54454 0'55023 0'55557 0'56060 0'56534 0'56982 0'57405 0'57805 0'58182 0'58540 0'58878 0'59197 0'59498 0'59783 0'60051 0'60304 0'60542 0'60765 0'60975 0'61170 0'61353 0'61522 0'61679 0'61824 0'61956 0'62077 0'62186 0'62283 0'62369 0'62444 0'62508 0'62561 0'62603 0'62635 0'62655 0'62665

0'007 0'35722 0'39663 0'42162 0'44069 0'45638 0'46980 0'48159 0'49213 0'50166 0'51036 0'51838 0'52579 0'53268 0'53911 0'54513 0'55078 0'55609 0'56109 0'56580 0'57025 0'57446 0'57843 0'58219 0'58574 0'58910 0'59228 0'59528 0'59811 0'60077 0'60329 0'60565 0'60787 0'60995 0'61189 0'61370 0'61538 0'61694 0'61837 0'61969 0'62088 0'62196 0'62292 0'62377 0'62451 0'62514 0'62566 0'62607 0'62637 0'62657 0'62665

0'008 0'36253 0'39954 0'42373 0'44239 0'45781 0'47105 0'48270 0'49312 0'50256 0'51120 0'51914 0'52650 0'53334 0'53973 0'54571 0'55132 0'55660 0'56157 0'56626 0'57069 0'57487 0'57882 0'58256 0'58609 0'58943 0'59258 0'59557 0'59838 0'60103 0'60353 0'60588 0'60808 0'61015 0'61208 0'61388 0'61554 0'61709 0'61851 0'61981 0'62099 0'62206 0'62301 0'62385 0'62458 0'62520 0'62571 0'62611 0'62640 0'62658 0'62665

36 - Regresin y correlacin (F. lvarez)