You are on page 1of 9

§ 6: COVARIANCE VÀ HỆ SỐ TƯƠNG QUAN

Các nội dung chính:


 Kỳ vọng và phương sai của hàm hai biến ngẫu nhiên.
 Định nghĩa, ý nghĩa và cách tính Covariance.
 Định nghĩa, ý nghĩa và cách tính Hệ số tương quan.

Trong những bài giảng trước ta đã thấy giữa các biến ngẫu nhiên
tồn tại khái niệm độc lập và phụ thuộc lẫn nhau. Để trả lời câu hỏi
về mức độ phụ thuộc của 2 biến ngẫu nhiên, ta đưa ra các khái
niệm Covariance và Hệ số tương quan.

I. Kỳ vọng và phương sai của hàm 2 biến ngẫu nhiên


Cho X và Y là các biến ngẫu nhiên với phân phối xác suất đồng
thời là f(x,y). Kỳ vọng của biến ngẫu nhiên g(X,Y) là
 g ( X ,Y )  E[ g ( X , Y )]=  g ( x, y ) f ( x, y)
x y

nếu X và Y là rời rạc, và


+ +
 g ( X ,Y )  E[ g ( X , Y )]=   g(x,y)f(x,y)dxdy
- -

nếu X và Y là các biến ngẫu nhiên liên tục.

37
Ví dụ 1: Cho X và Y là các biến ngẫu nhiên với phân phối xác
suất như sau:
X
0 1 2
Y
0 3/28 9/28 3/28
1 6/28 6/28 0
2 1/28 0 0

Tính kỳ vọng của biến ngẫu nhiên g(X,Y) = XY.


GIẢI
Theo Định nghĩa, ta có
2 2
E ( XY )   xyf(x,y)=(0)(0) f (0,0)  (0)(1) f (0,1)  (0)(2) f (0, 2)
x 0 y 0

 (1)(0) f (1,0)  (1)(1) f (1,1)


 (2)(0) f (2,0)
3
 f (1,1) 
14

38
Y 
Ví dụ 2: Hãy tính E   biết rằng hàm mật độ đồng thời là
X
 x(1  3 y 2 )
 , ( x; y )  (0;2)  (0;1)
f ( x, y )   4
0, ( x; y )  (0;2)  (0;1)

GIẢI
Ta có
 
Y  y
E    . f ( x, y )dxdy

X    x
y x(1  3 y 2 )
1 2
  . dxdy .
0 0
x 4
y  3 y3
1
5
 dy 
0
2 8

39
Định lí
Kỳ vọng của tổng hoặc hiệu hai hay nhiều hàm của các biến ngẫu
nhiên bằng tổng hoặc hiệu của kỳ vọng các hàm. Tức là,
E[ g ( X , Y )  h( X , Y )]  E[ g ( X , Y )]  E[h( X , Y )].
Lưu ý:
 Ta luôn có: E (aX  bY )  aEX  bEY
 Nếu X và Y độc lập thì: E  XY   E  X  .E Y 
 Nếu X và Y không độc lập thì khẳng định trên là không
đúng.

II. Covariance

Cho X và Y là các biến ngẫu nhiên với phân phối xác suất đồng
thời f(x, y). Covariance của X và Y là
 XY  E[( X -  X )(Y  Y )]   ( x  X )( y  Y ) f ( x, y)
x y

nếu X và Y là các biến ngẫu nhiên rời rạc, và


 
 XY  E[( X -  X )(Y  Y )]    ( x  X )( y  Y ) f ( x, y )dxdy
- -

nếu X và Y là các biến ngẫu nhiên liên tục.


Ý nghĩa của Covariance:
Covariance của hai biến ngẫu nhiên cho ta biết mối quan hệ của
chúng, và dấu của Covariance cho ta biết mối quan hệ của chúng là
thuận hay là nghịch.
Công thức thường dùng để tính Covariance
Covariance của hai biến ngẫu nhiên X và Y được xác định bởi
 XY  E ( XY )   X Y

40
Ví dụ 3: Cho biến ngẫu nhiên rời rạc 2 chiều có phân phối xác
suất đồng thời như sau
X
0 1 2
Y
0 3/28 9/28 3/28
1 6/28 6/28 0
2 1/28 0 0

Tìm Covariance của X và Y.


GIẢI
Từ Ví dụ 1, mục I, ta đã có:
3
E  XY   .
14
Mặt khác
2
 5  15   3  3
 X  E ( X )   xg ( x)  (0)    (1)    (2)  
x 0  14   28   28  4

2
 15  3  1  1
Y  E (Y )   yh( y )  (0)    (1)    (2)  
y 0  28  7  28  2
Do đó,
3  3  1  9
 XY  E ( XY )   X Y        .
14  4  2  56

41
Ví dụ 4: Tỉ lệ X các nam vận động viên và tỉ lệ Y các nữ vận động
viên điền kinh hoàn thành bài thi trong cuộc thi marathon được
mô tả bằng hàm mật độ đồng thời sau
8 xy, ( x, y )  [0;1]  [0;1]
f ( x, y )  
0, ( x, y )  [0;1]  [0;1]
Hãy tìm Covariance của X và Y.

42
Ví dụ 5: Hai xạ thủ A và B cùng bắn vào một mục tiêu, xác suất
trúng đích của hai người lần lượt là 0,8 và 0,6. Xạ thủ A bắn 2
viên, xạ thủ B bắn 1 viên. Gọi X, Y là số viên đạn trúng đích của A
và B.
a) Tìm phân phối xác suất đồng thời của X, Y.
b) Tính Covariance của X và Y.
GIẢI
Gọi X, Y là số viên đạn trúng đích của A và B nên tập giá trị của X,Y là

X  0;1;2 ; Y  0,1

Ta lập được bảng phân phối xác suất đồng thời của X và Y như
sau:
X
0 1 2
Y

0 0,016 0,128 0,256

1 0,024 0,192 0,384

Từ đó thu được phân phối biên duyên của X


x 0 1 2
g ( x) 0,04 0,32 0,64
Phân phối biên duyên của Y
y 0 1
h( y ) 0,4 0,26
Từ đó: E ( X )  1,6 ; E (Y )  0,6 ; E ( X .Y )  0,96
Vậy,  XY  E ( X .Y )  E ( X ).E (Y )  0
43
Nhận xét: Trong trường hợp này, X và Y độc lập, nên
E  XY   E  X  .E Y 
Do đó:  XY  E ( X .Y )  E ( X ).E (Y )  0 .
Lưu ý:
Nếu hai biến ngẫu nhiên độc lập thì  XY  0 , ngược lại không
đúng.
Nghĩa là, nếu  XY  0 thì chưa chắc X và Y độc lập.
III. Hệ số tương quan
Định nghĩa
Cho X và Y là các biến ngẫu nhiên với Covariance  XY và các độ
lệch chuẩn tương ứng là  X và  Y . Hệ số tương quan của X và Y là
 XY
 XY  .
 XY
Ý nghĩa:
Mặc dù Covariance của hai biến ngẫu nhiên cho ta biết về mối
liên hệ của hai biến ngẫu nhiên, tuy nhiên độ lớn của Covariance
không cho ta biết về mức độ liên hệ của hai biến ngẫu nhiên.
Hệ số tương quan là đại lượng không phụ thuộc vào đơn vị đo, sẽ
cho ta biết mức độ tương quan của chúng.
 Hệ số tương quan thỏa mãn
1   XY  1
 Nếu  XY  0 thì  XY  0 , trong trường hợp này, ta nói X và Y
không tương quan với nhau.
 Nếu  XY  1 thì X, Y phụ thuộc tuyến tính với nhau, nghĩa
là X  a  bY .

44
Ví dụ 5: Cho biến ngẫu nhiên rời rạc 2 chiều có phân phối xác
suất đồng thời như sau
X
0 1 2
Y
0 3/28 9/28 3/28
1 6/28 6/28 0
2 1/28 0 0
Tìm hệ số tương quan của X và Y.

Ví dụ 6: Cho biến ngẫu nhiên hai chiều có hàm mật độ đồng thời
như sau
 8 xy, 0  y  x  1
f ( x, y )  
0, ( x, y )  [0;1]  [0; x]
Hãy tìm hệ số tương quan của X và Y.

Ví dụ 7: Cho biến ngẫu nhiên hai chiều có hàm mật độ đồng thời
như sau
e  ( x  y ) , x  0, y  0
f ( x, y )  
 0 , x, y khác
Hãy tìm hệ số tương quan của X và Y.

45

You might also like