You are on page 1of 9

ANALISIS MULTIVARIADO

LA DISTRIBUCIÓN NORMAL BIVARIADA

Fernando Gallego Restrepo


Universidad Nacional Sede Manizales
Carrera de Matemáticas

Abril de 2010
DISTRIBUCIÓN NORMAL BIVARIADA

Las variables aleatorias de mayor dimensión desempeñan un papel importante para describir resulta-
dos experimentales, una de las mas importantes son las variables aleatorias bidimensionales continuas.
Una generalización directa de la distribución normal unidimensional, se define como:

Definición 1. Sea (X, Y ) variable aleatoria continua, bidimensional que toma todos los valores en
el plano euclidiano. Decimos que (X, Y ) tiene una distribución normal bivariada si su función de
densidad de probabilidad conjunta (fdp) está dada por la expresión siguiente:

( " 2  2 #)
1 1 x − µx (x − µx )(y − µy ) y − µy
f (x, y) = exp − − 2ρ +
2(1 − ρ2 )
p
2πσx σy 1 − ρ2 σx σx σy σy

−∞ < x < ∞, −∞ < y < ∞


La fdp anterior depende de 5 parámetros.

σx2 = V (X), Varianza de X


σy2 = V (Y ), Varianza de Y
µx = E(X), Media de X

µy = E(Y ), Media de Y
Cov(X, Y ) E((X − µx )(Y − µy ))
ρ= = , Coeficiente de correlacion entre X y Y
σx σy σx σy
R∞ R∞
Para que f defina una fdp legı́tima [es decir, f (x, y) ≥ 0, −∞ −∞ f (x, y)dxdy = 1], debemos poner
las siguientes restricciones a los parámetros:

−∞ < µx < ∞; −∞ < µy < ∞; σx > 0; σy > 0; −1 < ρ < 1


Para la distribución normal bivariada, tenemos las siguientes propiedades:

FUNCIONES DE DENSIDAD MARGINALES

Las funciones marginales estan definidas por,


Z ∞ Z ∞
fx (x) = f (x, y)dy, fy (y) = f (x, y)dx,
−∞ −∞

( " 2 2 #)
∞ 
x − µx (x − µx )(y − µy ) y − µy
Z
1 1
fx (x) = exp − − 2ρ + dy
2(1 − ρ2 )
p
−∞ 2πσx σy 1 − ρ2 σx σx σy σy
Z ∞  i
1 1 h
2 2 2 2
= exp − (x − µx ) σy − 2ρ(x − µx )(y − µy )σx σy + (y − µy ) σx dy
2(1 − ρ2 )σx2 σy2
p
2πσx σy 1 − ρ2 −∞

1
2
Consideremos el exponente de e, y completemos cuadrados con la expresión (x − µx ) σy2 ρ2

1 h
2 2 2 2
i
− 2 2 2
(x − µx ) σy2 − 2ρ(x − µx )(y − µy )σx σy + (y − µy ) σx2 + (x − µx ) σy2 ρ2 − (x − µx ) σy2 ρ2
2(1 − ρ )σx σy

1 h
2 2 2 2 2 2 2 2
i
− (x − µx ) σ y (1 − ρ ) − 2ρ(x − µx )(y − µy )σ x σ y + (y − µy ) σx + (x − µx ) σ y ρ
2(1 − ρ2 )σx2 σy2

1 h
2 2

2
i
− 2 2 2
(x − µx ) σy2 ρ2 − 2ρ(x − µx )(y − µy )σx σy + (y − µy ) σx2 + (x − µx ) σy2 (1 − ρ2 )
2(1 − ρ )σx σy

1 h
2 2
i
− 2 2 2
((x − µx ) σy ρ − (y − µy ) σx ) + (x − µx ) σy2 (1 − ρ2 )
2(1 − ρ )σx σy
2
(x − µx ) σy2 (1 − ρ2 ) ((x − µx ) σy ρ − (y − µy ) σx )2
− −
2(1 − ρ2 )σx2 σy2 2(1 − ρ2 )σx2 σy2
2 2
(x − µx ) ((x − µx ) σy ρ − (y − µy ) σx )
− 2

2σx 2(1 − ρ2 )σx2 σy2
luego, reemplazando ésta en el exponente de e, en la integral anterior; tenemos:

( )
∞ 2 2
(x − µx ) ((x − µx ) σy ρ − (y − µy ) σx )
Z
1
fx (x) = exp − − dy
2σx2 2(1 − ρ2 )σx2 σy2
p
2πσx σy 1 − ρ2 −∞
( ) ( )
Z ∞ 2 2
1 (x − µx ) ((x − µx ) σy ρ − (y − µy ) σx )
= exp − exp − dy
2σx2 2(1 − ρ2 )σx2 σy2
p
2πσx σy 1 − ρ2 −∞
( )Z ( )
2 ∞ 2
1 (x − µx ) ((x − µx ) σy ρ − (y − µy ) σx )
= exp − exp − dy
2σx2 2(1 − ρ2 )σx2 σy2
p
2πσx σy 1 − ρ2 −∞
( )Z ( )
2 ∞ 2
1 (x − µx ) ((y − µy ) σx − (x − µx ) σy ρ)
= exp − exp − dy
2σx2 2(1 − ρ2 )σx2 σy2
p
2πσx σy 1 − ρ2 −∞
    2 
σ
 σx (y − µy ) − (x − µx ) y ρ 
2
( )Z 
 
2 ∞ 
1 (x − µx )  σx 
= exp − exp − dy
2σx2 2(1 − ρ2 )σx2 σy2
p
2πσx σy 1 − ρ2 −∞ 





 
    2 
 σy
(y − µy ) − (x − µx )

(
2
)Z


 ρ 
1 (x − µx )  σx 
= exp − exp − dy
2σx2 2(1 − ρ2 )σy2
p
2πσx σy 1 − ρ 2
−∞ 





 

     2 
 σy
y − µy + (x − µx )

(
2
)Z


 ρ 

1 (x − µx ) 1  σx 
fx (x) = p exp − exp − dy
2σx2 2(1 − ρ2 )σy2
q
2
2πσx −∞ 2π(1 − ρ2 )σy2 






2
Si analizamos el integrando
 de la integral anterior, notamos que se trata de una fdp normal con media,
µy
µy + (x − µx ) ρ y varianza 5(1 − ρ2 )σy2 , por tanto;
µx
     2 
 σy
y − µy + (x − µx )

Z ∞ 
 ρ 

1  σx 
exp − dy = 1
2(1 − ρ2 )σy2
q
−∞ 2π(1 − ρ2 )σy2 






luego,
( )
2
1 (x − µx ) ∼
fx (x) = p exp − = N (µx , σx2 )
2πσx2 2σx2

Analogamente, se calcula la funcional marginal para y;


( )
2
1 (y − µy ) ∼
fy (y) = q exp − 2 = N (µy , σy2 )
2πσ 2 2σ y
y

FUNCIONES DE DENSIDAD CONDICIONAL


Las funciones de densidad condicional, estan dadas por
f (x, y) f (x, y)
f (X|Y ) = f (Y |X) =
fy (y) fx (x)
por tanto,
( " 2  2 #)
1 1 x − µx (x − µx )(y − µy ) y − µy
exp − − 2ρ +
2(1 − ρ2 )
p
2πσx σy 1 − ρ2 σx σx σy σy
f (Y |X) = (
2
)
1 (x − µx )
exp −
2σx2
p
2πσx2
( " 2 2 # )
2
p
2πσx2

1 x − µx (x − µx )(y − µy ) y − µy (x − µx )
= exp − − 2ρ + +
2(1 − ρ2 ) 2σx2
p
2πσx σy 1 − ρ2 σx σx σy σy
( " 2 2 #)
2
(x − µx ) (1 − ρ2 )

1 1 x − µx (x − µx )(y − µy ) y − µy
=q exp − − 2ρ + −
2πσ 2 (1 − ρ2 ) 2(1 − ρ2 ) σx σx σy σy σx2
y

(x − µx )2 (1 − (1 − ρ2 )) (x − µx )(y − µy ) (y − µy )2
  
1 1
=q exp − − 2ρ +
2πσy2 (1 − ρ2 ) 2(1 − ρ2 ) σx2 σx σy σy2

(y − µy )2 (x − µx )(y − µy ) (x − µx )2 ρ2
  
1 1
= exp − − 2ρ +
2(1 − ρ2 ) σy2 σx2
q
2πσy2 (1 − ρ2 ) σx σy
(   2 )
1 1 (x − µx )ρσy
=q exp − (y − µy ) −
2πσy2 (1 − ρ2 ) 2(1 − ρ2 )σy2 σx
(    2 )
1 1 (x − µx )ρσy
=q exp − y − µy +
2πσ 2 (1 − ρ2 ) 2(1 − ρ2 )σy2 σx
y

3
luego,
(    2 )
1 1 (x − µx )ρσy
f (Y |X) = q exp − y − µy +
2πσy2 (1 − ρ2 ) 2(1 − ρ2 )σy2 σx

ası́  
∼ (x − µx )ρσy 2 2
f (Y |X) = N µy + , σy (1 − ρ )
σx
Actuando de manera analoga, obtenemos
 
(y − µy )ρσx 2
f (X|Y ) ∼
= N µx + , σx (1 − ρ2 )
σy

VALOR ESPERADO Y COVARIANZA

Consideremos si g(X, Y ) es una función escalar en términos de las varialbes aleatorias (X, Y ),
entonces se define el valor esperado de g(X, Y ),
Z ∞Z ∞
E[g(X, Y )] = g(x, y)f (x, y)dxdy
−∞ −∞

ası́,

Z ∞ Z ∞
µx = E[X] = xf (x, y)dxdy
−∞ −∞
Z ∞ Z ∞ 
= x f (x, y)dy dx
−∞ −∞
Z ∞
= xfx (x)dx
−∞

Z ∞ Z ∞
µy = E[Y ] = yf (x, y)dxdy
−∞ −∞
Z ∞ Z ∞ 
= y f (x, y)dx dy
−∞ −∞
Z∞
= yfy (y)dy
−∞

Similarmente,
Z ∞ Z ∞
2
E[X ] = x2 f (x, y)dxdy
−∞ −∞
Z ∞ Z ∞ 
2
= x f (x, y)dy dx
−∞ −∞
Z∞
= x2 fy (y)dx
−∞

4
Z ∞ Z ∞
2
E[Y ] = y 2 f (x, y)dxdy
−∞ −∞
Z ∞ Z ∞ 
2
= y f (x, y)dx dy
−∞ −∞
Z ∞
= y 2 fy (y)dy
−∞

Z ∞ Z ∞
E[XY ] = xyf (x, y)dxdy
−∞ −∞

Por otro lado, sabemos que Cov[Y, X] = Cov[X, Y ] = σxy = E[XY ] − E[X]E[Y ], Cov[X, X] = σx2
y Cov[Y, Y ] = σy2 , y ademas;
Cov[X, Y ]
ρ=
σx σy
ası́
σxy = Cov[X, Y ] = ρσx σy

de esta manera podemos calcular,

E[XY ] = ρσx σy + E[x]E[y] = ρσx σy + µx µy

en otras palabras; Z ∞ Z ∞
xyf (x, y)dxdy = ρσx σy + µx µy
−∞ −∞

Ahora, calculemos la matriz de Covarianzas

σx2
   
Cov[X, X] Cov[X, Y ] ρσx σy
=
Cov[Y, X] Cov[Y, Y ] ρσx σy σy2

VALOR ESPERADO CONDICIONAL Y VARIANZA CONDICIONAL

El Valor esperado condicionado, esta definido por;


Z ∞
E[Y |x] = yf (Y |x)dy
−∞

donde (    2 )
1 1 (x − µx )ρσy
f (Y |x) = q exp − y − µy +
2πσy2 (1 − ρ2 ) 2(1 − ρ2 )σy2 σx

(x − µx )ρσy
la cual es igual a la fdp de una normal, con media µY |x = µy + y varianza σY2 |x = (1−ρ2 )σy2 ,
σx
luego, ( 2 )
1 y − µY |X

1
f (Y |x) = √ exp −
σY |X 2π 2 σY |X

5
por tanto
( 2 )
∞ ∞
y − µY |x
Z Z 
y 1
E[Y |x] = yf (Y |x)dy = √ exp − dy
−∞ −∞ σY |x 2π 2 σY |x

(y−µY |x )
haciendo z = σY |x y dy = σY |x dz, obtenemos;
Z ∞  2
1 z
E[Y |x] = √ (µY |x + zσY |x ) exp − dy
2π −∞ 2
µY |x ∞ σY |x ∞
Z  2 Z  2
z z
= √ exp − dy + √ z exp − dy
2π −∞ 2 2π −∞ 2
= µY |x

luego,
(x − µx )ρσy
E[Y |x] = µy +
σx
De manera analoga, obtenemos
(y − µy )ρσx
E[X|y] = µx +
σy
Ahora, se define la varianza condicional, por

V ar[Y |x] = E[(Y − µY |x )2 |x]

luego,
Z ∞
V ar[Y |x] = (y − µY |x )2 f (Y |x)dy
−∞
( 2 )

y − µY |X
Z 
1 1 2
= √ (y − µY |x ) exp − dy
σY |x 2π −∞ 2 σY |x

(y−µY |x )
haciendo de nuevo z = σY |x y dy = σY |x dz, obtenemos;

σY2 |x Z ∞ 2
 2
z
V ar[Y |x] = √ z exp − dz
2π −∞ 2
n 2o
Haciendo integracion por partes, con u = z y dv = z 2 exp − z2 de modo que du = dz y u =
n 2o
− exp − z2 , encontramos que

V ar[Y |x] = E[(Y − µY |x )2 |x]


 2  ∞  2 !
σY2 |x Z ∞

z z
= √ −z exp − + exp − dz
2π 2 −∞ −∞ 2
= σY2 |x (0 + 1)
= σY2 |x

por tanto tenemos que la varianza condicional es

V ar[Y |x] = (1 − ρ2 )σy2

6
Actuando analogamente, tenemos
V ar[X|y] = (1 − ρ2 )σx2

APLICACIONES

Aplicación 1. La distribución de los gastos en dos productos (X, Y ) de un grupo de consumidores


sigue una distribución normal bivariante con medias respectivas 2 y 3 euros y matriz de varianzas y
covarianzas  
1 0, 8
0, 8 2
Calcular la distribución condicionada de los gastos en los productos y para los consumidores que gastan
4 euros en el producto x.
f (4,y)
Solución. La distribución condicionada f (Y |x = 4) = fx (4) . Además, la distribución marginal de x es
normal, N [2, 1].

Tenemos µx = 2, µy = 3, σx2 = 1, σy2 = 2 y Cov[X, Y ] = 0, 8, por tanto es coeficiente de correlación es:

Cov[X, Y ] 0, 8
ρ= = √ ≈ 0, 566
σx σy 2
luego, la función de densidad de probabilidad conjunta, es:

(x − 2)(y − 3) (y − 3)2
  
1 1 2
f (x, y) = exp − (x − 2) − 2(0, 566) √ +
2(1 − (0, 566)2 )
p
2π 2(1 − (0, 566)2 ) 2 2

(x − 2)(y − 3) (y − 3)2
  
1 1 2
f (x, y) = exp − (x − 2) − 1, 132 √ +
2, 331π 1, 359 2 2

Consideremos la funcion condicional


 
(x − µx )ρσy 2
f (Y |X) ∼
= N µy + , σy (1 − ρ2 )
σx

con media:
(x − µx )ρσy
E[Y |x] = µy +
σx
y varianza:
V ar[Y |x] = σy2 (1 − ρ2 )
Para x=4
0, 8 √
E[Y |x = 4] = 3 + (4 − 2) √ 2 ≈ 4, 6
2
Como hay una correlación positiva de 0,566 entre los gastos en ambos productos, los consumidores que
gastan másn en uno, tambien en promedio; tienen gastos medios más altos en el otro. la variabilidad
de la distribución condicoinada será:

V ar[Y |x = 4] = 2(1 − (0, 566)2 ) ≈ 1, 36

7
y será menor que la varianza de la margina porque cuando condicionamos tenemos más información.
luego,

f (Y |x = 4) = N [4, 6; 1, 36]
1 (4 − 4, 6)2
  
1
=p exp −
2(1, 36)π 2 1, 36
= 0, 3905

Figura 1: Distribución Normal Bivariada, fdp; Aplicación 1

You might also like