Professional Documents
Culture Documents
Abril de 2010
DISTRIBUCIÓN NORMAL BIVARIADA
Las variables aleatorias de mayor dimensión desempeñan un papel importante para describir resulta-
dos experimentales, una de las mas importantes son las variables aleatorias bidimensionales continuas.
Una generalización directa de la distribución normal unidimensional, se define como:
Definición 1. Sea (X, Y ) variable aleatoria continua, bidimensional que toma todos los valores en
el plano euclidiano. Decimos que (X, Y ) tiene una distribución normal bivariada si su función de
densidad de probabilidad conjunta (fdp) está dada por la expresión siguiente:
( " 2 2 #)
1 1 x − µx (x − µx )(y − µy ) y − µy
f (x, y) = exp − − 2ρ +
2(1 − ρ2 )
p
2πσx σy 1 − ρ2 σx σx σy σy
µy = E(Y ), Media de Y
Cov(X, Y ) E((X − µx )(Y − µy ))
ρ= = , Coeficiente de correlacion entre X y Y
σx σy σx σy
R∞ R∞
Para que f defina una fdp legı́tima [es decir, f (x, y) ≥ 0, −∞ −∞ f (x, y)dxdy = 1], debemos poner
las siguientes restricciones a los parámetros:
( " 2 2 #)
∞
x − µx (x − µx )(y − µy ) y − µy
Z
1 1
fx (x) = exp − − 2ρ + dy
2(1 − ρ2 )
p
−∞ 2πσx σy 1 − ρ2 σx σx σy σy
Z ∞ i
1 1 h
2 2 2 2
= exp − (x − µx ) σy − 2ρ(x − µx )(y − µy )σx σy + (y − µy ) σx dy
2(1 − ρ2 )σx2 σy2
p
2πσx σy 1 − ρ2 −∞
1
2
Consideremos el exponente de e, y completemos cuadrados con la expresión (x − µx ) σy2 ρ2
1 h
2 2 2 2
i
− 2 2 2
(x − µx ) σy2 − 2ρ(x − µx )(y − µy )σx σy + (y − µy ) σx2 + (x − µx ) σy2 ρ2 − (x − µx ) σy2 ρ2
2(1 − ρ )σx σy
1 h
2 2 2 2 2 2 2 2
i
− (x − µx ) σ y (1 − ρ ) − 2ρ(x − µx )(y − µy )σ x σ y + (y − µy ) σx + (x − µx ) σ y ρ
2(1 − ρ2 )σx2 σy2
1 h
2 2
2
i
− 2 2 2
(x − µx ) σy2 ρ2 − 2ρ(x − µx )(y − µy )σx σy + (y − µy ) σx2 + (x − µx ) σy2 (1 − ρ2 )
2(1 − ρ )σx σy
1 h
2 2
i
− 2 2 2
((x − µx ) σy ρ − (y − µy ) σx ) + (x − µx ) σy2 (1 − ρ2 )
2(1 − ρ )σx σy
2
(x − µx ) σy2 (1 − ρ2 ) ((x − µx ) σy ρ − (y − µy ) σx )2
− −
2(1 − ρ2 )σx2 σy2 2(1 − ρ2 )σx2 σy2
2 2
(x − µx ) ((x − µx ) σy ρ − (y − µy ) σx )
− 2
−
2σx 2(1 − ρ2 )σx2 σy2
luego, reemplazando ésta en el exponente de e, en la integral anterior; tenemos:
( )
∞ 2 2
(x − µx ) ((x − µx ) σy ρ − (y − µy ) σx )
Z
1
fx (x) = exp − − dy
2σx2 2(1 − ρ2 )σx2 σy2
p
2πσx σy 1 − ρ2 −∞
( ) ( )
Z ∞ 2 2
1 (x − µx ) ((x − µx ) σy ρ − (y − µy ) σx )
= exp − exp − dy
2σx2 2(1 − ρ2 )σx2 σy2
p
2πσx σy 1 − ρ2 −∞
( )Z ( )
2 ∞ 2
1 (x − µx ) ((x − µx ) σy ρ − (y − µy ) σx )
= exp − exp − dy
2σx2 2(1 − ρ2 )σx2 σy2
p
2πσx σy 1 − ρ2 −∞
( )Z ( )
2 ∞ 2
1 (x − µx ) ((y − µy ) σx − (x − µx ) σy ρ)
= exp − exp − dy
2σx2 2(1 − ρ2 )σx2 σy2
p
2πσx σy 1 − ρ2 −∞
2
σ
σx (y − µy ) − (x − µx ) y ρ
2
( )Z
2 ∞
1 (x − µx ) σx
= exp − exp − dy
2σx2 2(1 − ρ2 )σx2 σy2
p
2πσx σy 1 − ρ2 −∞
2
σy
(y − µy ) − (x − µx )
(
2
)Z
∞
ρ
1 (x − µx ) σx
= exp − exp − dy
2σx2 2(1 − ρ2 )σy2
p
2πσx σy 1 − ρ 2
−∞
2
σy
y − µy + (x − µx )
(
2
)Z
∞
ρ
1 (x − µx ) 1 σx
fx (x) = p exp − exp − dy
2σx2 2(1 − ρ2 )σy2
q
2
2πσx −∞ 2π(1 − ρ2 )σy2
2
Si analizamos el integrando
de la integral anterior, notamos que se trata de una fdp normal con media,
µy
µy + (x − µx ) ρ y varianza 5(1 − ρ2 )σy2 , por tanto;
µx
2
σy
y − µy + (x − µx )
Z ∞
ρ
1 σx
exp − dy = 1
2(1 − ρ2 )σy2
q
−∞ 2π(1 − ρ2 )σy2
luego,
( )
2
1 (x − µx ) ∼
fx (x) = p exp − = N (µx , σx2 )
2πσx2 2σx2
(x − µx )2 (1 − (1 − ρ2 )) (x − µx )(y − µy ) (y − µy )2
1 1
=q exp − − 2ρ +
2πσy2 (1 − ρ2 ) 2(1 − ρ2 ) σx2 σx σy σy2
(y − µy )2 (x − µx )(y − µy ) (x − µx )2 ρ2
1 1
= exp − − 2ρ +
2(1 − ρ2 ) σy2 σx2
q
2πσy2 (1 − ρ2 ) σx σy
( 2 )
1 1 (x − µx )ρσy
=q exp − (y − µy ) −
2πσy2 (1 − ρ2 ) 2(1 − ρ2 )σy2 σx
( 2 )
1 1 (x − µx )ρσy
=q exp − y − µy +
2πσ 2 (1 − ρ2 ) 2(1 − ρ2 )σy2 σx
y
3
luego,
( 2 )
1 1 (x − µx )ρσy
f (Y |X) = q exp − y − µy +
2πσy2 (1 − ρ2 ) 2(1 − ρ2 )σy2 σx
ası́
∼ (x − µx )ρσy 2 2
f (Y |X) = N µy + , σy (1 − ρ )
σx
Actuando de manera analoga, obtenemos
(y − µy )ρσx 2
f (X|Y ) ∼
= N µx + , σx (1 − ρ2 )
σy
Consideremos si g(X, Y ) es una función escalar en términos de las varialbes aleatorias (X, Y ),
entonces se define el valor esperado de g(X, Y ),
Z ∞Z ∞
E[g(X, Y )] = g(x, y)f (x, y)dxdy
−∞ −∞
ası́,
Z ∞ Z ∞
µx = E[X] = xf (x, y)dxdy
−∞ −∞
Z ∞ Z ∞
= x f (x, y)dy dx
−∞ −∞
Z ∞
= xfx (x)dx
−∞
Z ∞ Z ∞
µy = E[Y ] = yf (x, y)dxdy
−∞ −∞
Z ∞ Z ∞
= y f (x, y)dx dy
−∞ −∞
Z∞
= yfy (y)dy
−∞
Similarmente,
Z ∞ Z ∞
2
E[X ] = x2 f (x, y)dxdy
−∞ −∞
Z ∞ Z ∞
2
= x f (x, y)dy dx
−∞ −∞
Z∞
= x2 fy (y)dx
−∞
4
Z ∞ Z ∞
2
E[Y ] = y 2 f (x, y)dxdy
−∞ −∞
Z ∞ Z ∞
2
= y f (x, y)dx dy
−∞ −∞
Z ∞
= y 2 fy (y)dy
−∞
Z ∞ Z ∞
E[XY ] = xyf (x, y)dxdy
−∞ −∞
Por otro lado, sabemos que Cov[Y, X] = Cov[X, Y ] = σxy = E[XY ] − E[X]E[Y ], Cov[X, X] = σx2
y Cov[Y, Y ] = σy2 , y ademas;
Cov[X, Y ]
ρ=
σx σy
ası́
σxy = Cov[X, Y ] = ρσx σy
en otras palabras; Z ∞ Z ∞
xyf (x, y)dxdy = ρσx σy + µx µy
−∞ −∞
σx2
Cov[X, X] Cov[X, Y ] ρσx σy
=
Cov[Y, X] Cov[Y, Y ] ρσx σy σy2
donde ( 2 )
1 1 (x − µx )ρσy
f (Y |x) = q exp − y − µy +
2πσy2 (1 − ρ2 ) 2(1 − ρ2 )σy2 σx
(x − µx )ρσy
la cual es igual a la fdp de una normal, con media µY |x = µy + y varianza σY2 |x = (1−ρ2 )σy2 ,
σx
luego, ( 2 )
1 y − µY |X
1
f (Y |x) = √ exp −
σY |X 2π 2 σY |X
5
por tanto
( 2 )
∞ ∞
y − µY |x
Z Z
y 1
E[Y |x] = yf (Y |x)dy = √ exp − dy
−∞ −∞ σY |x 2π 2 σY |x
(y−µY |x )
haciendo z = σY |x y dy = σY |x dz, obtenemos;
Z ∞ 2
1 z
E[Y |x] = √ (µY |x + zσY |x ) exp − dy
2π −∞ 2
µY |x ∞ σY |x ∞
Z 2 Z 2
z z
= √ exp − dy + √ z exp − dy
2π −∞ 2 2π −∞ 2
= µY |x
luego,
(x − µx )ρσy
E[Y |x] = µy +
σx
De manera analoga, obtenemos
(y − µy )ρσx
E[X|y] = µx +
σy
Ahora, se define la varianza condicional, por
luego,
Z ∞
V ar[Y |x] = (y − µY |x )2 f (Y |x)dy
−∞
( 2 )
∞
y − µY |X
Z
1 1 2
= √ (y − µY |x ) exp − dy
σY |x 2π −∞ 2 σY |x
(y−µY |x )
haciendo de nuevo z = σY |x y dy = σY |x dz, obtenemos;
σY2 |x Z ∞ 2
2
z
V ar[Y |x] = √ z exp − dz
2π −∞ 2
n 2o
Haciendo integracion por partes, con u = z y dv = z 2 exp − z2 de modo que du = dz y u =
n 2o
− exp − z2 , encontramos que
6
Actuando analogamente, tenemos
V ar[X|y] = (1 − ρ2 )σx2
APLICACIONES
Cov[X, Y ] 0, 8
ρ= = √ ≈ 0, 566
σx σy 2
luego, la función de densidad de probabilidad conjunta, es:
(x − 2)(y − 3) (y − 3)2
1 1 2
f (x, y) = exp − (x − 2) − 2(0, 566) √ +
2(1 − (0, 566)2 )
p
2π 2(1 − (0, 566)2 ) 2 2
(x − 2)(y − 3) (y − 3)2
1 1 2
f (x, y) = exp − (x − 2) − 1, 132 √ +
2, 331π 1, 359 2 2
con media:
(x − µx )ρσy
E[Y |x] = µy +
σx
y varianza:
V ar[Y |x] = σy2 (1 − ρ2 )
Para x=4
0, 8 √
E[Y |x = 4] = 3 + (4 − 2) √ 2 ≈ 4, 6
2
Como hay una correlación positiva de 0,566 entre los gastos en ambos productos, los consumidores que
gastan másn en uno, tambien en promedio; tienen gastos medios más altos en el otro. la variabilidad
de la distribución condicoinada será:
7
y será menor que la varianza de la margina porque cuando condicionamos tenemos más información.
luego,
f (Y |x = 4) = N [4, 6; 1, 36]
1 (4 − 4, 6)2
1
=p exp −
2(1, 36)π 2 1, 36
= 0, 3905