You are on page 1of 5

DISTRIBUCIONES BIDIMENSIONALES RESULTAN DE ESTUDIAR FENMENOS EN LOS QUE PARA CADA OBSERVACIN SE OBTIENE UN PAR DE MEDIDAS Y, EN CONSECUENCIA, DOS

VARIABLES. Ejemplos. Talla y peso de los soldados de un regimiento. Calificaciones en Fsica y Matemticas de los alumnos de una clase. Gastos de publicidad y ventas de una fbrica. Etc.

Estas variables resultantes de la observacin de un fenmeno respecto de dos modalidades se llaman variables estadsticas bidimensionales. Los valores de una variable estadstica bidimensional son pares de nmeros reales de la forma (x i, yi). Representados en un sistema de ejes cartesianos se obtiene un conjunto de puntos llamado diagrama de dispersin o nube de puntos. Ejemplo: Nube de puntos de la distribucin dada por la tabla siguiente: Notas de Matemticas y Fsica de 10 alumnos Matemticas 5 6 2 9 Fsica 4 5 3 8 4 4 5 5 1 2 3 2 7 6 7 8

Notas de Fsica

Notas de Matemticas

Parmetros estadsticos. Media de la variable X: Media de la variable Y:

x= y=

n x
i

N ni y i N

Varianza de la variable X: s

2 x

n x =
i

2 i

2 Varianza de la variable Y: s y =

N ni yi2 N

Covarianza:

s xy =

n x y
i i

x. y

Correlacin. Estudia la relacin o dependencia que existe entre dos variables que intervienen en una distribucin bidimensional. Coeficiente de correlacin lineal. Es un nmero que mide el grado de dependencia entre las variables X e Y. Se mide mediante la siguiente frmula:

r=

s xy s x .s y

Su valor est comprendido entre 1 y 1. Si r = -1 r = 1 todos los valores de la variable bidimensional se encuentran situados sobre una recta. Si 1< r < 0 se dice que las variables X e Y estn tambin en dependencia aleatoria. La correlacin es negativa. Si 0 < r < 1 la correlacin es positiva. Las variables X e Y estn tambin en dependencia aleatoria. La correlacin es tanto ms fuerte a medida que r se aproxima a 1 1 y es tanto ms dbil a medida que se aproxima a 0. Recta de regresin. Tenemos una distribucin bidimensional y representamos la nube de puntos correspondiente. La recta que mejor se ajusta a esa nube de puntos recibe el nombre de recta de regresin. Su ecuacin es la siguiente: Recta de regresin de y sobre x: Recta de regresin de x sobre y:

yy=
xx =

s xy
2 sx

( x x)
( y y)

s xy
2 sy

A partir de esta recta podemos calcular los valores de x conocidos los de y. La fiabilidad que podemos conceder a los clculos obtenidos viene dada por el coeficiente de correlacin: si r es muy pequeo no tiene sentido realizar ningn tipo de estimaciones. Si r es prximo a 1 1, las estimaciones realizadas estarn cerca de los valores reales. Si r = 1 o r = -1 , las estimaciones realizadas coincidirn con los valores reales. Ejercicios resueltos. 1.- Una compaa de seguros considera que el nmero de vehculos (Y) que circulan por una determinada autopista a ms de 120 kms/h, puede ponerse en funcin del nmero de accidentes (X) que ocurren en ella. Durante 5 das obtuvo los siguientes resultados: X 5 7 2 1 9 Y 15 18 10 8 20 a) Calcula el coeficiente de correlacin lineal. b) Si ayer se produjeron 6 accidentes, cuntos vehculos podemos suponer que circulaban por la autopista a ms de 120 kms/h? c) Es buena la prediccin? Solucin:

Disponemos los clculos de la siguiente forma: (Accidentes) Vehculos xi yi xi2 5 15 25 7 18 49 2 10 4 1 8 1 9 20 81 24 71 160

yi2 225 324 100 64 400 1113

xiyi 75 126 20 8 180 409

x=

x
N

24 = 4,8 ; 5
2 i

y=

y
N

71 = 14,2 ; 5

2 sx =

x
N
i

2 i

x =

160 4,8 2 = 8,96 5

s2 y =

y
N
a)

y =
s xy s x .s y

1113 14,2 2 = 20,96 ; s xy = 5


= 13,64 8,96 . 20,96 = 0,996

x y
i

x. y =

409 4,8.14,2 =13,64 5

r=

b) Recta de regresin de y sobre x:

yy=

s xy
2 sx

( x x)

13,64 ( x 4,8) ; y 14,2 = 1,53( x 4,8) 8,96 Para x = 6, y 14,2 = 1,53(6 4,8) , es decir, y = 16,04. Podemos suponer que ayer circulaban 16 vehculos por la autopista a ms de 120 kms/h. c) La prediccin hecha es buena ya que el coeficiente de correlacin est muy prximo a 1. 2.- Las calificaciones de 40 alumnos en psicologa evolutiva y en estadstica han sido las siguientes: X Y Nmero calif. en psicol. calif. en estad. de alumnos. 3 2 4 4 5 6 5 5 12 6 6 4 6 7 5 7 6 4 7 7 2 8 9 1 10 10 2 y 14,2 =
Obtener la ecuacin de la recta de regresin de calificaciones de estadstica respecto de las calificaciones de psicologa. Cul ser la nota esperada en estadstica para un alumno que obtuvo un 4,5 en psicologa? Solucin: Se pide la recta de regresin de y sobre x:

yy=

s xy
2 sx

( x x)
niyi nixi2 niyi2 nixiyi

Disponemos los datos de la siguiente forma: xi yi ni nixi

3 4 5 6 6 7 7 8 10

2 5 5 6 7 6 7 9 10

4 6 12 4 5 4 2 1 2 40

12 24 60 24 30 28 14 8 20 220

8 30 60 24 35 24 14 9 20 224

36 96 300 144 180 196 98 64 200 1314


i i

16 150 300 144 245 144 98 81 200 1378

24 120 300 144 210 168 98 72 200 1336

x=

n x
i

=
i

220 = 5,5 ; 40
i

y=

n y
N

224 = 5,6 40

s xy =

n x y
i

x. y =
2

1336 (5,3).(5,6) = 33,4 30,8 = 2,6 40

2 sx =

n x
i

2 i

x =

1314 (5,6) 2 = 32,85 30,25 = 2,6 40

Sustituyendo en la ecuacin de la recta de regresin, resulta: 2,6 y 5,6 = ( x 5,5) , es decir, y = x + 0,1 2,6 Si un alumno que tiene una nota de 4,5 en psicologa, la nota esperada en estadstica ser: y(4,5) = 4,5 + 0,1 = 4,6 Se sustituye en la recta de regresin. La fiabilidad viene dada por el coeficiente de correlacin: r = s xy = 2,6 ;
2 sy =

s xy s x .s y

sx =
2 i 2

2 sx = 2,6 = 1,61

n y
i

y =

1378 (5,6) 2 = 3,09 ; 40

s y = 3,09 =1,75

y resulta r =

2,6 = 0,92 (1,61).(1,75)

La correlacin es positiva, es decir, a medida que aumenta la nota de estadstica aumenta tambin la nota en psicologa. Su valor est prximo a 1 lo que indica que se trata de una correlacin fuerte, las estimaciones realizadas estn cerca de los valores reales.

Tablas de doble entrada. En las distribuciones bidimensionales, cuando hay pocos pares de valores, se procede como hemos hecho, es decir, enumerndolos. Si algn par est repetido se pone dos veces, pero cuando el nmero de datos es grande, se recurre a las tablas de doble entrada. En cada casilla se pone la frecuencia correspondiente al par de valores que definen esa casilla. Ejemplo: x

y 0 1 2

0 2 3 0

1 1 4 5

2 0 1 3

Lo que indica el nmero de veces que est cada par. El par (0, 1) est 3 veces. El par (1, 2) est 5 veces. Etc. Ejercicios propuestos. 1.- Las notas obtenidas por 10 alumnos en Matemticas y en Msica son: Alumnos Mat. Ms. 1 6 6,5 2 4 4,5 3 8 7 4 5 5 5 3,5 4 6 7 8 7 5 7 8 10 10 9 5 6 10 4 5 a) Calcula la covarianza, las varianzas y el coeficiente de correlacin. b) Existe correlacin entre las dos variables? c) Calcula la recta de regresin. Cul ser la nota esperada en Msica para un alumno que hubiese obtenido un 8,3 en Matemticas? (Soluc. 3,075; 3,76; 2,96; 0,92; y = 1,6 + 0,817x; 8,38)

2.- Cinco nias de 2, 3, 5, 7 y 8 aos de edad pesan respectivamente 14, 20, 30, 42 y 44 Kg. Halla la ecuacin de la recta de regresin de la edad sobre el peso. Cul sera el peso aproximado de una nia de 6 aos?. ( Sol. x = 0,192y-0,76; 35,2 Kg.) 3.- La tabla adjunta da el ndice de mortalidad de una muestra de poblacin en funcin del consumo diario de cigarrillos: Nmero de cigarrillos x 3 5 6 15 20 ndice de mortalidad y 0,2 0,3 0,4 0,5 0,7 a) Determina el coeficiente de correlacin e interpreta el resultado. b) Halla la recta de regresin de y sobre x c) Cul ser el ndice de mortalidad para un consumidor de 40 cigarrillos diarios?

You might also like