Professional Documents
Culture Documents
2023 Baigiang XSTK MI2020 Chap3
2023 Baigiang XSTK MI2020 Chap3
HÀ NỘI – 2023
(1)
Email: thuy.nguyenthithu2@hust.edu.vn
Nguyễn Thị Thu Thủy (SAMI-HUST) MI2020-CHƯƠNG 3 1/115
HÀ NỘI – 2023 1 / 115
GIỚI THIỆU
Chương này giới thiệu về biến ngẫu nhiên nhiều chiều, chủ yếu tập trung vào biến ngẫu nhiên hai chiều. Nội
dung chính bao gồm:
Khái niệm và phân loại biến ngẫu nhiên nhiều chiều.
Phân phối xác suất của biến ngẫu nhiên hai chiều (phân phối đồng thời, phân phối biên, phân phối có
điều kiện).
Biến ngẫu nhiên độc lập.
Hiệp phương sai và hệ số tương quan.
Luật số lớn.
NỘI DUNG
Khái niệm và ví dụ
Trong nhiều bài toán thực tế ta thường phải xét đồng thời nhiều biến ngẫu nhiên X1 , X2 , . . . , Xn có quan hệ
với nhau.
Ví dụ 1
Xem xét một sản phẩm đúc do một máy sản xuất và gọi X, Y, Z lần lượt là các biến ngẫu nhiên chỉ chiều
rộng, chiều dài và chiều cao của sản phẩm (đơn vị tính là milimét).
(a) (X, Y, Z) là biến ngẫu nhiên ba chiều mô tả kích thước của sản phẩm.
(b) Nếu chỉ quan tâm đến chiều rộng và chiều dài của sản phẩm ta có biến ngẫu nhiên hai chiều (X, Y ).
Biến ngẫu nhiên rời rạc. Biến ngẫu nhiên liên tục
Khái niệm 2 (Biến ngẫu nhiên rời rạc. Biến ngẫu nhiên liên tục)
Biến ngẫu nhiên n chiều (X1 , X2 , . . . , Xn ) được gọi là liên tục hay rời rạc nếu tất cả các biến ngẫu nhiên
thành phần X1 , X2 , . . . , Xn là liên tục hay rời rạc.
✍
Trong chương này, ta chủ yếu xét biến ngẫu nhiên hai chiều (X, Y ), trong đó X là biến ngẫu nhiên thành
phần thứ nhất và Y là biến ngẫu nhiên thành phần thứ hai.
Hầu hết các kết quả có thể mở rộng dễ dàng cho biến ngẫu nhiên n chiều (X1 , X2 , . . . , Xn ).
Ta không xét trường hợp biến ngẫu nhiên hai chiều trong đó có một biến rời rạc và một biến liên tục (còn
gọi là biến ngẫu nhiên hỗn hợp).
Biến ngẫu nhiên rời rạc. Biến ngẫu nhiên liên tục
Ví dụ 2
Biến ngẫu nhiên ba chiều (X, Y, Z) trong Ví dụ 1 là biến ngẫu nhiên liên tục.
Ví dụ 3
Từ một lô hàng gồm 5 sản phẩm loại I, 4 sản phẩm loại II và 3 sản phẩm loại III, ta lấy ngẫu nhiên ra 3
sản phẩm. Gọi X và Y lần lượt là số sản phẩm loại I và loại II có trong 3 sản phẩm được lấy ra. Khi đó,
(X, Y ) là biến ngẫu nhiên hai chiều rời rạc.
✍
Ví dụ về hàm của hai biến ngẫu nhiên: W = X + Y , W = XY.
Nếu X và Y là hai biến ngẫu nhiên rời rạc thì W cũng là biến ngẫu nhiên rời rạc.
Nếu X và Y là hai biến ngẫu nhiên liên tục và g(., .) là một hàm liên tục thì W là một biến ngẫu nhiên
liên tục.
Luyện tập
Bài 1
Cho ví dụ về biến ngẫu nhiên hai chiều rời rạc, liên tục, hàm của hai biến ngẫu nhiên.
Bài 2
Giả sử thời gian hoạt động của linh kiện điện tử 1 và 2 (đơn vị: năm) là các biến ngẫu nhiên X và Y có
phân phối mũ với tham số tương ứng λ1 , λ2 > 0. Biểu diễn biến ngẫu nhiên chỉ thời gian hoạt động của hệ
một hệ thống gồm 2 linh kiện điện tử trên mắc (a) nối tiếp; (b) song song.
NỘI DUNG
Ví dụ 4
Trong Ví dụ 3, cặp giá trị có thể có (x, y) của (X, Y ) là (0; 0), (0; 1), (0; 2), (0; 3), (1; 0), (1; 1), (1; 2), (2; 0),
(2; 1) và (3; 0). Bằng cách tính xác suất tại từng điểm P (X = x, Y = y) với x = 0; 1; 2; 3 và y = 0; 1; 2; 3 và
x + y ≤ 3,
ta xác định được phân phối xác suất đồng thời của hai biến ngẫu nhiên X và Y như trong bảng dưới đây.
HH Y
0 1 2 3
X HH H
0 1/220 3/55 9/110 1/55
1 3/44 3/11 3/22 0
2 3/22 2/11 0 0
3 1/22 0 0 0
Bảng 1: Bảng phân phối xác suất đồng thời của hai biến ngẫu nhiên rời rạc trong Ví dụ 3
✍
Miền giá trị của biến ngẫu nhiên hai chiều rời rạc (X, Y ) là
Hàm xác suất đồng thời pX,Y (x, y) của X và Y được giả thiết là bằng 0 tại mọi (x, y) ∈
/ SX,Y .
Định lý 1
Với mọi A ⊂ SX,Y ,
XX
P [(X, Y ) ⊂ A] = pX,Y (x, y). (1)
(x,y)∈A
Ví dụ 5
Bảng phân phối xác suất đồng thời của hai biến ngẫu nhiên rời rạc X và Y có dạng
HH Y
y1 ... yj ... yn
X HH H
x1 pX,Y (x1 , y1 ) ... pX,Y (x1 , yj ) ... pX,Y (x1 , yn )
.. .. .. .. .. ..
. . . . . .
xi pX,Y (xi , y1 ) ... pX,Y (xi , yj ) ... pX,Y (xi , yn )
.. .. .. .. .. ..
. . . . . .
xm pX,Y (xm , y1 ) ... pX,Y (xm , y2 ) ... pX,Y (xm , yn )
Bảng 2: Bảng phân phối xác suất đồng thời của hai biến ngẫu nhiên rời rạc X và Y
trong đó, xi , i = 1, . . . , m, yj , j = 1, . . . , n, là các giá trị có thể có của các biến thành phần X và Y tương
ứng. Bảng này có thể ra vô hạn nếu m, n nhận giá trị ∞.
Nguyễn Thị Thu Thủy (SAMI-HUST) MI2020-CHƯƠNG 3 15/115
HÀ NỘI – 2023 15 / 115
3.2 Phân phối xác suất đồng thời 3.2.2 Hàm phân phối xác suất đồng thời
Định nghĩa
Định nghĩa 3 (Hàm phân phối xác suất đồng thời)
Hàm hai biến FX,Y (x, y) xác định bởi
được gọi là hàm phân phối xác suất đồng thời của hai biến ngẫu nhiên X và Y .
✍ Từ (2) và Định nghĩa 2, hàm phân phối xác suất đồng thời của hai biến ngẫu nhiên rời rạc X và Y được xác
định bởi X X
FX,Y (x, y) = pX,Y (xi , yj ). (3)
xi <x yj <y
Ví dụ 6
Tính chất
Tính chất 1
P (x1 ≤ X < x2 , y1 ≤ Y < y2 ) = FX,Y (x2 , y2 ) − FX,Y (x2 , y1 ) − FX,Y (x1 , y2 ) + FX,Y (x1 , y1 ). (4)
Tính chất
Nhận xét 1
Vế phải của (4) chính là xác xuất để điểm ngẫu nhiên (X, Y ) rơi vào hình chữ nhật ABCD trong Hình 1.
y2 D C
y1 A B
X
O x1 x2
Định nghĩa
Giả sử FX,Y (x, y) là hàm phân phối xác suất đồng thời của hai biến ngẫu nhiên liên tục X và Y . Khi đó,
hàm mật độ xác suất đồng thời của hai biến ngẫu nhiên này là hàm hai biến fX,Y (x, y) thỏa mãn:
Zx Zy
FX,Y (x, y) = fX,Y (u, v)dudv. (5)
−∞ −∞
Cho trước FX,Y (x, y), từ Định nghĩa 4 suy ra fX,Y (x, y) là đạo hàm của hàm FX,Y (x, y), nếu đạo hàm này tồn
tại.
Định lý 2
∂ 2 FX,Y (x, y)
fX,Y (x, y) = . (6)
∂x∂y
Tính chất
✍ Với biến ngẫu nhiên hai chiều liên tục (X, Y ), thì
Tính chất 2
Ví dụ
Ví dụ 7
Biến ngẫu nhiên hai chiều liên tục (X, Y ) có hàm mật độ xác suất là
(
k, 0 ≤ x ≤ 6, 0 ≤ y ≤ 3,
fX,Y (x, y) =
0, nếu trái lại.
Ví dụ
Giải. Miền A được minh họa trong Hình 2.
A
3
0 x
2 4 6
Ví dụ
Cách tìm phân phối xác suất của hàm của hai biến ngẫu nhiên
Xét biến ngẫu nhiên W := g(X, Y ), trong đó, phân phối xác suất của X và Y đã biết và g(., .) là một hàm hai
biến nhận giá trị thực. Ta phân tích phân phối xác suất của W trong một số trường hợp đơn giản.
Định lý 3
✍ Trong trường hợp biến ngẫu nhiên W liên tục, để tìm hàm mật độ xác suất fW (w), ta sử dụng tính chất
dFW (w)
fW (w) = . (9)
dw
Ví dụ
Ví dụ 8
Cho X và Y là hai biến ngẫu nhiên trong Ví dụ 7. Tìm hàm phân phối xác suất của biến ngẫu nhiên
W = max(X, Y ).
Giải. Ta có
ZZ
1
FW (w) = P (W < w) = P [max(X, Y ) < w] = P (X < w, Y < w) = dxdy,
18
D
Ví dụ
x
O
0<w≤3 w 3 6
Ví dụ
Z w Z 3
1 w
Nếu 3 < w ≤ 6, FW (w) = dx 18
dy = 6
.
0 0
Nếu w > 6, FW (w) = 1.
Vậy
0 nếu w ≤ 0,
w2
nếu 0 < w ≤ 3,
18
FW (w) = w
nếu 3 < w ≤ 6,
6
1 nếu w > 6.
y
3
x
O
3 w 6
Cách tìm kỳ vọng của hàm của hai biến ngẫu nhiên
Định lý 4
Cho W = g(X, Y ) là một hàm của hai biến ngẫu nhiên X và Y . Khi đó,
X X
E(W ) = E[g(X, Y )] = g(x, y)pX,Y (x, y) (10)
x∈SX y∈SY
nếu X và Y là các biến ngẫu nhiên rời rạc có hàm xác suất đồng thời pX,Y (x, y) và
+∞ Z
Z +∞
nếu X và Y là các biến ngẫu nhiên liên tục có hàm mật độ xác suất đồng thời fX,Y (x, y).
Ví dụ
Ví dụ 9
Cho X và Y là hai biến ngẫu nhiên trong Ví dụ 7. Tìm kỳ vọng của biến ngẫu nhiên W = XY .
Tính chất
Định lý 5
Cho h(X, Y ) và g(X, Y ) là các hàm của hai biến ngẫu nhiên X và Y . Khi đó,
Hệ quả 1
Luyện tập
Bài 3
Lấy ví dụ về hàm xác suất, bảng phân phối xác suất, hàm phân phối xác suất, hàm mật độ xác suất đồng
thời của hai biến ngẫu nhiên X và Y .
Bài 4
Hai biến ngẫu nhiên rời rạc X và Y có phân phối xác suất đồng thời
HH Y
0 1 2 3
X HH H
0 0, 1 0, 1 0, 15 0, 05
1 0, 05 0, 05 0, 1 0, 05
2 0, 1 0, 15 0, 05 0, 05
(a) Tính P [(X, Y ) ⊂ A] với A = {(x, y) ∈ R2 | x + y < 3}; (b) Tìm FX,Y (2, 2).
Luyện tập
Bài 5
hai biến ngẫu nhiên liên tục X và Y có hàm mật độ xác suất đồng thời
(
k, nếu 0 ≤ x ≤ 2, 1 ≤ y ≤ 4,
fX,Y (x, y) =
0, nếu trái lại.
(a) Tìm k? (b) Tìm phân phối xác suất của biến ngẫu nhiên Z = X + Y ; (c) Tính kỳ vọng của biến ngẫu
nhiên W = XY .
Luyện tập
Bài 6
Cho pX,Y (x, y) là hàm xác suất đồng thời của hai biến ngẫu nhiên X và Y . Tính chất nào sau đây là SAI?
P P
A. pX,Y (x, y) ≥ 0 C. x∈SX y∈SY pX,Y (x, y) = ∞
B. pX,Y (x, y) ≤ 1 D. pX,Y (x, y) = P (X = x, Y = y)
Bài 7
Cho FX,Y (x, y) là hàm phân phối xác suất đồng thời của hai biến ngẫu nhiên X và Y . Tính chất nào sau
đây là SAI?
Luyện tập
Bài 8
Từ một lô hàng gồm 5 sản phẩm A, 6 sản phẩm B và 7 sản phẩm C, lấy ngẫu nhiên ra 3 sản phẩm. Gọi X
và Y lần lượt là số sản phẩm A và B trong 3 sản phẩm được lấy ra. Lập bảng phân phối xác suất đồng
thời của X và Y .
Bài 9
Giả sử thời gian hoạt động X và Y (đơn vị: năm) của thiết bị điện tử 1 và 2 tương ứng là các biến ngẫu
nhiên liên tục có hàm mật độ xác suất đồng thời:
(
3e−3x−y , x ≥ 0, y ≥ 0;
fX,Y (x, y) =
0, trái lại.
Tìm xác suất để thiết bị điện tử 1 hoạt động lâu hơn thiết bị điện tử 2 ít nhất 1 năm.
NỘI DUNG
Định lý 6
Nếu hai biến ngẫu nhiên rời rạc X và Y có hàm xác suất đồng thời là pX,Y (x, y), thì các hàm xác suất
biên được xác định bởi
X X
pX (x) = pX,Y (x, y) và pY (y) = pX,Y (x, y). (12)
y∈SY x∈SX
Định lý 7
Nếu hai biến ngẫu nhiên rời rạc X và Y có bảng phân phối xác suất đồng thời như trong Định nghĩa 2 thì
bảng phân phối xác suất của X là
X x1 x2 ... xm
P (X = xi ) P (X = x1 ) P (X = x2 ) ... P (X = xm )
Y y1 y2 ... yn
P (Y = yj ) P (Y = y1 ) P (Y = y2 ) ... P (Y = yn )
Pn Pm
trong đó, P (X = xi ) = j=1 pX,Y (xi , yj ), i = 1, . . . , m và P (Y = yj ) = i=1 pX,Y (xi , yj ), j = 1, . . . , n.
Ví dụ
✍ Từ các hàm xác suất biên hay bảng phân phối xác suất biên, ta có thể dễ dàng xác định các tham số đặc
trưng của các biến ngẫu nhiên thành phần X và Y .
Ví dụ 10
Trong Ví dụ 4,
Bảng phân phối xác suất biên của X là
X 0 1 2 3
P (X = xi ) 7/44 21/44 7/22 1/22
Y 0 1 2 3
P (Y = yj ) 14/55 28/55 12/55 1/55
Ví dụ
Ví dụ 10 (tiếp theo)
Kỳ vọng của X là
V (X) = (0)2 (7/44) + (1)2 (21/44) + (2)2 (7/22) + (3)2 (1/22) − (1, 25)2 ≈ 0, 59659.
FX (x) = P (X < x) = P (X < x, Y < ∞) = lim FX,Y (x, y) = FX,Y (x, ∞).
y→∞
Z +∞
Từ đây suy ra fX (x) = fX,Y (x, y)dy. Tương tự ta cũng có fY (y).
−∞
Định lý 8
Nếu X và Y là hai biến ngẫu nhiên liên tục có hàm mật độ xác suất đồng thời fX,Y (x, y) thì hàm mật độ
xác suất của các biến ngẫu nhiên thành phần X và Y được xác định bởi
+∞
Z +∞
Z
fX (x) = fX,Y (x, y)dy và fY (y) = fX,Y (x, y)dx. (14)
−∞ −∞
Ví dụ
Ví dụ 11
Cho biến ngẫu nhiên hai chiều liên tục (X, Y ) có hàm mật độ xác suất là
(
kx, nếu 0 < y < x < 1,
fX,Y (x, y) =
0, nếu trái lại.
Ví dụ
Giải. Ký hiệu D = (x, y) ∈ R2 | 0 < x < 1; 0 < y < x (xem Hình 5).
y=x
x
O
1
Ví dụ
(a) Theo Tính chất 2(a), k ≥ 0 và theo Tính chất 2(b),
Z +∞
+∞ Z ZZ Z1 Zx Z1
k
1= fX,Y (x, y)dxdy = kxdxdy = dx kxdy = k x2 dx = .
3
−∞ −∞ D 0 0 0
(
3x, nếu (x, y) ∈ D,
Suy ra k = 3 và hàm mật độ xác suất đồng thời fX,Y (x, y) =
0, nếu trái lại.
(b) Tìm các hàm mật độ biên từ (14),
Zx
+∞ (
3x2 ,
3xdy, 0 < x < 1,
Z
0 < x < 1,
fX (x) = fX,Y (x, y)dy = =
0 0, trái lại,
−∞
0, trái lại,
1
Z
+∞
3 − 3 y2 ,
Z 3xdx, 0 < y < 1, 0 < y < 1,
fY (y) = fX,Y (x, y)dx = = 2 2
y
−∞
0, trái lại.
0, trái lại,
Nguyễn Thị Thu Thủy (SAMI-HUST) MI2020-CHƯƠNG 3 44/115
HÀ NỘI – 2023 44 / 115
3.3 Phân phối xác suất biên 3.3.4 Hàm mật độ xác suất biên
Ví dụ
(c) Kỳ vọng và phương sai của biến ngẫu nhiên X được xác định như sau
Z1
3
E(X) = x × 3x2 dx = ,
4
0
Z1 3 2
2 2 3
V (X) = E(X ) − (E(X)) = x2 × 3x2 dx − = .
4 80
0
Luyện tập
Bài 10
Sử dụng dữ liệu trong Bài 4 và 5. (a) Tìm các phân phối biên của các biến ngẫu nhiên thành phần X, Y .
(b) Tính kỳ vọng, phương sai, độ lệch chuẩn của các biến ngẫu nhiên thành phần X, Y .
NỘI DUNG
Cho X và Y là hai biến ngẫu nhiên rời rạc và B là một sự kiện nào đó thỏa mãn P (B) > 0. Khi đó, hàm
xác suất có điều kiện đồng thời của X và Y với điều kiện B được ký hiệu và định nghĩa bởi
Định lý 9
Cho B là một sự kiện với P (B) > 0, hàm mật độ xác suất có điều kiện đồng thời của X và Y với điều kiện
B được ký hiệu và xác định bởi
fX,Y (x, y) , (x, y) ∈ B,
fX,Y |B (x, y) = P (B) (17)
0, trái lại.
Ví dụ 12
Cho X và Y là hai biến ngẫu nhiên trong Ví dụ 7. Tìm hàm mật độ xác suất có điều kiện của X và Y với
điều kiện B, với B = {X + Y ≥ 4}.
Cho hai biến ngẫu nhiên X và Y và sự kiện B có xác suất khác 0, kỳ vọng có điều kiện của hàm
W = g(X, Y ) với điều kiện B là
X X
E(W |B) = E[g(X, Y )|B] = g(x, y)PX,Y |B (x, y) (18)
x∈SX y∈SY
Ví dụ 13
Phương sai có điều kiện của biến ngẫu nhiên W = g(X, Y ) với điều kiện B là
Định lý 10
Cho hai biến ngẫu nhiên rời rạc X, Y và y là một số thực sao cho pY (y) > 0. Hàm xác suất có điều kiện
của X với điều kiện Y = y được ký hiệu và xác định bởi
Định lý 11
Cho X và Y có hàm xác suất đồng thời pX,Y (x, y), x và y là các số thực sao cho pX (x) > 0 và pY (y) > 0.
Khi đó,
Bảng phân phối xác suất có điều kiện của X với điều kiện Y = yj
X|Y = yj x1 x2 ... xm
P P (X = x1 |Y = yj ) P (X = x2 |Y = yj ) ... P (X = xm |Y = yj )
Bảng phân phối xác suất có điều kiện của Y với điều kiện X = xi
Y |X = xi y1 y2 ... yn
P P (Y = y1 |X = xi ) P (Y = y2 |X = xi ) ... P (Y = yn |X = xi )
Ví dụ 14
Từ kết quả phân tích các số liệu thống kê trong tháng về doanh số bán hàng (X) và chi phí cho quảng cáo
(Y ) (đơn vị triệu đồng) của một công ty, thu được bảng phân phối xác suất đồng thời như sau:
HH X
100 200 300
Y HH
H
1 0, 15 0, 1 0, 14
1, 5 0, 05 0, 2 0, 15
2 0, 01 0, 05 0, 15
Bảng phân phối xác suất có điều kiện của X với điều kiện Y = 1, 5 và của Y với điều kiện X = 300 lần
lượt là
Tương tự, hàm mật độ xác suất có điều kiện của Y với điều kiện X = x là
fX,Y (x, y)
fY |X=x (y) = fY |x (y) = với fX (x) > 0. (26)
fX (x)
✍ Các hàm mật độ có điều kiện cũng thỏa mãn các tính chất của một hàm mật độ thông thường, chẳng hạn,
fY |x (y) ≥ 0.
Z +∞
fY |x (y)dy = 1.
−∞
Z
P (Y ∈ B|X = x) = fY |x (y)dy với mọi B ⊂ SY .
B
✍ Từ (25) và (26) ta có thể xác định được hàm mật độ đồng thời fX,Y (x, y) bởi
Ví dụ 15
Cho biến ngẫu nhiên hai chiều (X, Y ) có hàm mật độ xác suất là
1 , nếu 0 < y < x < 1,
fX,Y (x, y) = x
0, nếu trái lại.
(a) Tìm các hàm mật độ xác suất biên fX (x) và fY (y).
(b) Tìm các hàm mật độ xác suất có điều kiện fX|y (x) và fY |x (y).
Giải.
(a) Các hàm mật độ xác suất biên là:
Zx
+∞
1 dy,
(
0 < x < 1,
Z
1, 0 < x < 1,
fX (x) = fX,Y (x, y)dy = x =
0 0, trái lại.
−∞
0, trái lại,
1
Z
+∞
1 dx,
(
0 < y < 1, − ln y,
Z
0 < y < 1,
fY (y) = fX,Y (x, y)dx = x =
y 0, trái lại.
−∞
0, trái lại,
Ví dụ 16
Giả sử tại một trường đại học, một sinh viên đạt được điểm X trong bài kiểm tra năng khiếu toán học và
điểm Y trong bài kiểm tra năng khiếu âm nhạc là một số trong khoảng từ 0 đến 1. Giả sử X và Y được
phân phối theo hàm mật độ sau:
2 (2x + 3y), 0 < x, y < 1,
fX,Y (x, y) = 5
0, nếu ngược lại.
(a) Tính tỷ lệ sinh viên đại học đạt điểm cao hơn 0,8 trong bài kiểm tra năng khiếu toán.
(b) Giả sử điểm kiểm tra năng khiếu âm nhạc của một sinh viên là 0,3, tính xác suất để điểm kiểm tra
năng khiếu toán học của sinh viên này lớn hơn 0,8.
Z1
(b) Ta cần tính P (X > 0, 8|Y = 0, 3) = fX|Y =0,3 (x)dx, trong đó,
0,8
2
5
(2x + 3y)
Z 1
, nếu 0 < x, y < 1,
fX,Y (x, y)
fX|y (x) = = 25 (2x + 3y)dx
fY (y)
0
0, nếu trái lại,
2x + 3y ,
nếu 0 < x, y < 1,
= 1 + 3y
0, nếu trái lại.
Suy ra,
2x + 0, 9 ,
nếu 0 < x < 1,
fX|Y =0,3 (x) = 1, 9
0, nếu trái lại.
Vậy,
Z1
2x + 0, 9 0, 36 + 0, 18
P (X > 0, 8|Y = 0, 3) = dx = = 0, 2842.
1, 9 1, 9
0,8
Định lý 12
Cho W = g(X, Y ) là một hàm của hai biến ngẫu nhiên X và Y . Khi đó, kỳ vọng có điều kiện của
W = g(X, Y ) với điều kiện Y = y là
X
E(W |y) = E[g(X, Y )|Y = y] = g(x, y)pX|Y =y (x) (28)
x∈SX
✍ Kỳ vọng có điều kiện của X với điều kiện Y = y là một trường hợp đặc biệt của Định lý 12:
X
E(X|Y = y) = xPX|y (x) nếu X rời rạc (30)
x∈SX
và
+∞
Z
E(X|Y = y) = xfX|y (x)dx nếu X liên tục. (31)
−∞
Ví dụ 17
(b) Nếu muốn doanh số là 300 triệu đồng thì trung bình phải chi phí cho quảng cáo là
14 15 15
E(Y |X = 300) = 1 × + 1, 5 × +2× ≈ 1, 5136 (triệu đồng).
44 44 44
Kỳ vọng có điều kiện của X với điều kiện Y , E(X|Y ), là một hàm của biến ngẫu nhiên Y sao cho nếu
Y = y thì E(X|Y ) = E(X|Y = y).
Ví dụ 18
Giả sử hàm mật độ xác suất có điều kiện của biến ngẫu nhiên X với điều kiện Y = y có dạng
(
1
, y < x < 1,
fX|Y =y (x) = 1−y
0, nếu trái lại.
Giải. Ta có
+∞ Z1
x2
Z
1 x=1 1+y
E(X|Y = y) = xfX|y (x)dx = xdx = = .
1−y 2(1 − y) x=y 2
−∞ y
1+y
Từ E(X|Y = y) = 2
suy ra
1+Y
E(X|Y ) = .
2
Luyện tập
Bài 11
Sử dụng dữ liệu trong Bài 4. (a) Tìm phân phối xác suất có điều của X và Y với điều kiện B, ở đây
B = {(x, y) ∈ R2 | x + y > 2}; (b) Tìm phân phối xác suất có điều của X với điều kiện Y = 2; (c) Tính kỳ
vọng có điều kiện của X với điều kiện Y = 2.
Bài 12
Sử dụng dữ liệu trong Bài 5. (a) Tìm phân phối xác suất có điều của X và Y với điều kiện B, ở đây
B = {(x, y) ∈ R2 | x + y < 2}; (b) Tìm phân phối xác suất có điều của X với điều kiện Y = y, 1 ≤ y ≤ 4;
(c) Tính kỳ vọng có điều kiện của X với điều kiện Y = y, 1 ≤ y ≤ 4.
NỘI DUNG
Trong một số phép thử ngẫu nhiên, thông tin về các giá trị của X không thay đổi bất kỳ xác suất nào liên
quan đến các giá trị của Y . Trong trường hợp đó ta nói X và Y độc lập với nhau.
Một số dấu hiệu nhận biết tính độc lập của hai biến ngẫu nhiên X và Y dựa trên tính chất của hàm khối
lượng/bảng phân phối xác suất đồng thời, hàm phân phối xác suất đồng thời, hàm mật độ xác suất đồng
thời như trong Định nghĩa 13 dưới đây.
Hai biến ngẫu nhiên X và Y độc lập với nhau nếu với mọi x, y,
(a) pX,Y (x, y) = pX (x)pY (y), nếu X và Y rời rạc;
(b) fX,Y (x, y) = fX (x)fY (y), nếu X và Y liên tục;
(c) FX,Y (x, y) = FX (x)FY (y), nếu X và Y tùy ý.
✍ Từ Định nghĩa 13, nếu X và Y độc lập ta có thể nghiên cứu từng biến ngẫu nhiên theo các phương pháp đã
có ở Chương 2, đồng thời từ các phân phối biên của X và Y ta có thể xác định được hàm xác suất, hàm mật
độ xác suất, hàm phân phối xác suất đồng thời pX,Y (x, y), fX,Y (x, y), FX,Y (x, y) của X và Y theo Định nghĩa
13(a),(b),(c).
Ví dụ 19
Giải. Từ kết quả của Ví dụ 11, fX,Y (x, y) ̸= fX (x)fY (y), nên X và Y không độc lập.
Ví dụ 20
Sử dụng biến ngẫu nhiên hai chiều, tính xác suất để hai người gặp được nhau trong (Ví dụ ở Chương 1)
(2)
(2)
Hai người bạn hẹn gặp nhau ở công viên trong khoảng thời gian từ 17h00 đến 18h00. Họ quy ước nếu người
nào đến trước thì sẽ đợi người kia trong vòng 10 phút, sau 10 phút đợi nếu không gặp sẽ về. Thời điểm đến của
hai người là ngẫu nhiên và độc lập với nhau trong khoảng thời gian trên. Tính xác suất hai người gặp được nhau.
Nguyễn Thị Thu Thủy (SAMI-HUST) MI2020-CHƯƠNG 3 75/115
HÀ NỘI – 2023 75 / 115
3.5 Biến ngẫu nhiên độc lập
Giải. Quy gốc thời gian về lúc 17h00. Gọi X và Y lần lượt là biến ngẫu nhiên chỉ thời điểm đến của hai người
trong khoảng thời gian từ phút thứ 0 đến phút thứ 60. X và Y là các biến ngẫu nhiên liên tục có phân phối đều
trên [0; 60]. Do X và Y độc lập nên chúng có hàm mật độ xác suất đồng thời
1 , (x, y) ∈ [0, 60]2 ,
fX,Y (x, y) = fX (x)fY (y) = 3600
0, ngược lại.
Đặt W = |X − Y |. Khi đó, xác suất hai người gặp được nhau là
trong đó D là giao của miền |x − y| < 10 và hình vuông [0; 60]2 (xem Hình 6).
60
y = x + 10
y = x − 10
10
x
O
10 60
Suy ra
Z60 x−10
Z
1 2500 11
P (W < 10) = 1 − 2 dx dy = 1 − = .
3600 3600 36
10 0
Nguyễn Thị Thu Thủy (SAMI-HUST) MI2020-CHƯƠNG 3 77/115
HÀ NỘI – 2023 77 / 115
3.5 Biến ngẫu nhiên độc lập
Ví dụ 21
Gọi biến ngẫu nhiên X và Y lần lượt là chiều dài và chiều rộng của một chi tiết máy được gia công. Giả sử
X và Y là các biến ngẫu nhiên độc lập và giả sử X tuân theo luật phân phối chuẩn với trung bình 10,5
milimét và phương sai 0,0025 (milimét)2 , Y tuân theo luật phân phối chuẩn với trung bình 3,2 milimét và
phương sai 0,0036 (milimét)2 . Tính xác suất để 10, 4 < X < 10, 6 và 3, 15 < Y < 3, 25.
P (10, 4 < X < 10, 6, 3, 15 < Y < 3, 25) = P (10, 4 < X < 10, 6)P (3, 15 < Y < 3, 25)
h 10, 6 − 10, 5 10, 4 − 10, 5 ih 3, 25 − 3, 2 3, 15 − 3, 2 i
= Φ √ −Φ √ Φ √ −Φ √
0, 0025 0, 0025 0, 0036 0, 0036
= Φ(2) − Φ(−2) Φ(0, 83) − Φ(−0, 83) = (2 × 0, 97725 − 1)(2 × 0, 79673 − 1)
≈ 0, 5665
Tính chất 3
Với hai biến ngẫu nhiên độc lập X và Y ta có
(a) E[g(X)h(Y )] = E[g(X)]E[h(Y )].
(b) E(XY ) = E(X)E(Y ).
(c) E(X|y) = E(X) với mọi y ∈ SY .
(d) E(Y |x) = E(Y ) với mọi x ∈ SX .
Luyện tập
Bài 13
các biến ngẫu nhiên trong Bài 4 và 5 có độc lập không?
Bài 14
Một mạch điện gồm hai thiết bị mắc song song. Giả sử thời gian hoạt động của hai thiết bị (đơn vị: năm)
là hai biến ngẫu nhiên X và Y độc lập có phân phối mũ với tham số λX > 0 và λY > 0. Tìm phân phối
xác suất của biến ngẫu nhiên chỉ thời gian hoạt động của mạch điện.
Bài 15
Hai biến ngẫu nhiên rời rạc X và Y có bảng phân phối xác suất đồng thời là:
H X
H
0 1 2
Y HH
H
1 2/9 1/9 0
2 1/9 2/9 3/9
Nguyễn Thị Thu Thủy (SAMI-HUST) MI2020-CHƯƠNG 3 81/115
HÀ NỘI – 2023 81 / 115
3.6 Hiệp phương sai. Hệ số tương quan
NỘI DUNG
Định nghĩa
Khi hai hoặc nhiều biến ngẫu nhiên được xác định trên một không gian xác suất, sẽ rất hữu ích nếu mô tả được
sự biến thiên đồng thời của chúng; nghĩa là, ta đo lường mối quan hệ giữa các biến ngẫu nhiên. Một thước đo
phổ biến về mối quan hệ giữa hai biến ngẫu nhiên là hiệp phương sai.
Cho hai biến ngẫu nhiên X và Y có E(X) và E(Y ). Hiệp phương sai của hai biến ngẫu nhiên X và Y , ký
hiệu là cov(X, Y ), được định nghĩa bởi
Cov(X, Y ) = E [X − E(X)][Y − E(Y )] . (32)
Ta nhận được một công thức khác để xác định hiệp phương sai, tương đương với công thức (32).
Định lý 14
Nhận xét
Nhận xét 2
Hiệp phương sai được dùng làm độ đo quan hệ giữa hai biến X và Y .
(a) Cov(X, Y ) > 0 cho thấy xu thế Y tăng khi X tăng.
(b) Cov(X, Y ) < 0 cho thấy xu thế Y giảm khi X tăng.
(c) Phương sai là trường hợp riêng của hiệp phương sai khi X = Y và V (X) = Cov(X, X).
Ví dụ
Ví dụ 22
Giải. Khi số sản phẩm loại I tăng lên thì số sản phẩm loại II giảm xuống. Do đó, X và Y có hiệp phương sai
âm. Điều này có thể được xác minh bằng việc tính Cov(X, Y ) trong Ví dụ 3.
Tính chất
Tính chất 4
Ví dụ
Ví dụ 23
Hai biến ngẫu nhiên rời rạc X và Y có bảng phân phối xác suất đồng thời là
H Y
H
−1 0 1
X HH H
−1 4/15 1/15 4/15
1 0 2/15 0
Ví dụ
Giải.
(a) Ta có
9 4 2 7
E(X) = (−1) × +0× +1× =− .
15 15 15 15
5 5 5
E(Y ) = (−1) × +0× +1× = 0.
15 15 15
4 4
E(XY ) = (−1) × (−1) × + (−1) × (1) × + 1 × (−1) × 0 + 1 × 1 × 0 = 0.
15 15
Suy ra Cov(X, Y ) = E(XY ) − E(X)E(Y ) = 0.
(b) Dễ thấy P (X = −1, Y = −1) ̸= P (X = −1)P (Y = −1) nên X, Y không độc lập.
Trong Ví dụ 23, Cov(X, Y ) = 0 nhưng hai biến ngẫu nhiên X và Y không độc lập.
Xây dựng công thức tính phương sai từ hiệp phương sai
Suy ra
2
V (aX + bY + c) = E a[X − E(X)] + b[Y − E(Y )]
= a2 E[X − E(X)]2 + b2 E[Y − E(Y )]2 + 2abE{[X − E(X)][Y − E(Y )]}
= a2 V (X) + b2 V (Y ) + 2ab Cov(X, Y ).
Xây dựng công thức tính phương sai từ hiệp phương sai
Định lý 15
Cho (X, Y ) là biến ngẫu nhiên hai chiều, a, b, c là các hằng số. Khi đó
Hệ quả 2
V (aX + bY ) = a2 V (X) + b2 V (Y ).
V (aX − bY ) = a2 V (X) + b2 V (Y ).
Đặc biệt,
V (X ± Y ) = V (X) + V (Y ).
Ma trận hiệp phương sai của biến ngẫu nhiên hai chiều (X, Y ) được xác định bởi
Cov(X, X) Cov(X, Y ) V (X) Cov(X, Y )
Σ= =
Cov(Y, X) Cov(Y, Y ) Cov(X, Y ) V (Y )
Tính chất 5
Định nghĩa
✍ Hiệp phương sai có hạn chế cơ bản là khó xác định được miền biến thiên, nó thay đổi từ cặp biến thiên này
sang cặp biến thiên khác. Chưa kể về mặt vật lý nó có đơn vị đo bằng bình phương đơn vị đo của biến ngẫu
nhiên X, Y (nếu chúng cùng đơn vị đo). Vì thế cần đưa ra một số đặc trưng khác để khắc phục hạn chế này,
đó là “hệ số tương quan”.
Hệ số tương quan của hai biến ngẫu nhiên X và Y , ký hiệu là ρX,Y , được định nghĩa là
Cov(X, Y ) Cov(X, Y )
ρX,Y = p = . (35)
V (X).V (Y ) σX σY
Tính chất
✍ Vì σX > 0, σY > 0 nên nếu hiệp phương sai giữa X và Y dương, âm hay bằng 0 thì hệ số tương quan giữa
X và Y cũng dương, âm hay bằng 0, tương ứng.
Tính chất 6
(a)
−1 ≤ ρX,Y ≤ 1. (36)
ρX,Y = 0. (37)
Ví dụ
Ví dụ 24
Ví dụ
Ví dụ
Ví dụ 25
Cho hai biến ngẫu nhiên liên tục có hàm mật độ xác suất đồng thời là
(
1
xy, 0 ≤ x ≤ 2, 0 ≤ y ≤ 4,
fX,Y (x, y) = 16
0, nếu trái lại.
Ví dụ
Suy ra
32 4 8
Cov(X, Y ) = − × = 0.
9 3 3
Do đó, ρX,Y = 0.
✍ Ta cũng có thể chứng minh hai biến ngẫu nhiên này độc lập bằng cách chỉ ra fX,Y (x, y) = fX (x)fY (y) với
mọi x, y.
Luyện tập
Bài 16
Tính hiệp phương sai và hệ số tương quan giữa các biến X và Y trong Bài 4 và 5.
NỘI DUNG
Ví dụ 26
(a) Gieo n lần một đồng xu cân đối đồng chất. Gọi x là số lần xuất hiện mặt sấp trong n lần gieo. Khi
đó, tỷ số x/n được gọi là tần suất xuất hiện mặt sấp. Người ta thấy rằng nếu số lần gieo càng lớn thì
x/n càng gần tới 1/2 (xem Chương 1).
(b) Lặp lại n lần đo độc lập biến ngẫu nhiên X trong cùng một điều kiện như nhau, kết quả của các lần
đo là x1 , x2 , . . . , xn . Thực nghiệm cho thấy rằng trung bình số học x1 +x2 +···+x
n
n
gần với số E(X)
(xem Chương 2).
✍ Nếu dãy các biến ngẫu nhiên {Xn }∞ n=1 hội tụ theo xác suất về biến ngẫu nhiên X thì với n đủ lớn, thực tế
gần như chắc chắn ta có thể coi rằng Xn không khác mấy so với X.
Cho Y là biến ngẫu nhiên không âm có kỳ vọng hữu hạn. Khi đó, với ε > 0 tùy ý cho trước, ta có
E(Y 2 )
P (Y ≥ ϵ) ≤ . (40)
ϵ2
Cho X là biến ngẫu nhiên có kỳ vọng E(X) = µ và phương sai V (X) = σ 2 hữu hạn. Khi đó, với ε > 0 tùy
ý cho trước, ta có
σ2
P (|X − µ| ≥ ε) ≤ . (41)
ε2
hay tương đương
σ2
P (|X − µ| < ε) ≥ 1 − . (42)
ε2
(3) Nguyễn Thị Thu Thủy (SAMI-HUST) MI2020-CHƯƠNG 3 104/115
HÀ NỘI – 2023 104 / 115
3.7 Luật số lớn 3.7.2 Luật số lớn Chebyshev
Nhận xét 3
Các bất đẳng thức (41) và (42) được gọi là bất đẳng thức Chebyshev.
Nếu đặt ε = kσ với k là một số thực tùy ý thì bất đẳng thức (42) có dạng
1
P (µ − kσ < X < µ + kσ) ≥ 1 − . (43)
k2
Bất đẳng thức Chebyshev đưa ra một ước lượng quan trọng về xác suất mà một biến ngẫu nhiên
nhận giá trị sai lệch so với giá trị trung bình không quá k lần độ lệch chuẩn, với bất kỳ số thực k nào.
Chẳng hạn, k = 2, định lý nói rằng biến ngẫu nhiên X có xác suất ít nhất là 1 − 1/22 = 3/4 nằm
trong khoảng hai lần độ lệch chuẩn so với giá trị trung bình. Nghĩa là, 3/4 hoặc nhiều hơn các quan
sát của bất kỳ phân phối nào nằm trong khoảng (µ − 2σ, µ + 2σ). Tương tự, định lý nói rằng ít nhất
tám phần chín các quan sát của bất kỳ phân phối nào nằm trong khoảng (µ − 3σ, µ + 3σ).
Ví dụ
Ví dụ 27
Một biến ngẫu nhiên X có kỳ vọng µ = 8 và phương sai σ 2 = 9 và không biết phân phối xác suất. Tìm
(a) P (−4 < X < 20).
(b) P (|X − 8| ≥ 6).
Nhận xét
Nhận xét 4
Bất đẳng thức Chebyshev phù hợp với bất kỳ sự phân phối nào của các quan sát, và vì lý do này, kết
quả thường yếu.
Giá trị được đưa ra bởi bất đẳng thức chỉ là một giới hạn dưới. Nghĩa là, chúng ta biết rằng xác suất
của một biến ngẫu nhiên nằm trong khoảng hai lần độ lệch chuẩn so với giá trị trung bình có thể
không nhỏ hơn 3/4, nhưng chúng ta không bao giờ biết nó thực sự có thể cao hơn bao nhiêu.
Định lý Chebyshev
Nếu dãy các biến ngẫu nhiên X1 , X2 , . . . , Xn , . . . độc lập, có kỳ vọng hữu hạn và phương sai bị chặn đều
(V (Xi ) ≤ C, ∀i = 1, 2, . . . , C là hằng số dương), thì với ε > 0 tùy ý cho trước ta có:
1X n n
1X
lim P Xi − E(Xi ) < ϵ = 1. (44)
n→+∞ n i=1 n i=1
Định lý Chebyshev
Hệ quả 3
Nếu dãy các biến ngẫu nhiên X1 , X2 , . . . , Xn , . . . độc lập, có cùng kỳ vọng hữu hạn (E(Xi ) = µ,
i = 1, 2, . . . ) và phương sai bị chặn đều (V (Xi ) ≤ C ∀i = 1, 2, . . . , C là hằng số dương), thì với ε > 0 tùy ý
cho trước ta có:
1X n
lim P Xi − µ < ε = 1. (45)
n→+∞ n i=1
Nhận xét
Nhận xét 5
(a) Định lý Chebyshev chứng tỏ rằng trung bình số học của các biến ngẫu nhiên độc lập hội tụ theo xác
suất về trung bình số học của kỳ vọng tương ứng của nó.
Nói cách khác có sự ổn định của trung bình số học của một số lớn các biến ngẫu nhiên xung quanh
trung bình số học của các kỳ vọng của các biến ngẫu nhiên ấy.
Như vậy mặc dù từng biến ngẫu nhiên độc lập có thể nhận giá trị khác nhiều so với kỳ vọng của
chúng, song trung bình số học của một số lớn các biến ngẫu nhiên lại nhận giá trị gần bằng trung
bình số học các kỳ vọng của chúng với xác suất rất lớn.
Điều đó cho phép dự đoán giá trị trung bình số học của các biến ngẫu nhiên. Chẳng hạn, gieo một
con xúc xắc cân đối đồng chất. Gọi X là số chấm xuất hiện ở mặt trên con xúc xắc thì E(X) = 3, 5.
Một nhà thống kê đã gieo một con xúc xắc cân đối đồng chất một triệu lần (nhờ sự trợ giúp của máy
vi tính) và ghi lại số chấm xuất hiện ở mặt trên con xúc xắc. Số chấm trung bình của một triệu lần
x1 + x2 + · · · + x106
gieo được tìm thấy là ≈ 3, 500867.
106
Nhận xét
(b) Định lý Chebyshev có ứng dụng rộng rãi trong nhiều lĩnh vực, chẳng hạn nó chính là cơ sở cho
phương pháp đo lường trong vật lý.
Để xác định giá trị của một đại lượng vật lý nào đó người ta thường tiến hành đo n lần độc lập và
lấy trung bình số học của các kết quả đo làm giá trị thực của đại lượng cần đo.
Thật vậy, giả sử xem kết quả của n lần đo là các biến ngẫu nhiên X1 , X2 , . . . , Xn . Ta thấy rằng các
biến ngẫu nhiên này độc lập, có cùng kỳ vọng bằng chính giá trị thực của đại lượng vật lý (giả sử
không có sai số hệ thống), các phương sai của chúng đều bị chặn trên bởi bình phương của độ chính
xác của thiết bị đo. Do đó theo định lý Chebyshev ta có thể cho rằng trung bình số học của các kết
quả đo sẽ sai lệch rất ít so với giá trị thực của đại lượng vật lý với xác suất gần như bằng một.
(c) Định lý Chebyshev còn là cơ sở cho lý thuyết mẫu, ứng dụng trong thống kê.
Định lý Bernoulli
Áp dụng luật số lớn Chebyshev với trường hợp Xi ∼ B(1, p) chính là số lần xảy ra A trong phép thử thứ i,
i = 1, 2, . . . , n ta có luật số lớn Bernoulli.
Giả sử ta có n phép thử Bernoulli với P (A) = p và m là số lần xảy ra A trong n phép thử đó. Khi đó, với
ε > 0 tùy ý cho trước, ta có
m
lim P − p < ε = 1. (46)
n→+∞ n
Nhận xét
Nhận xét 6
Định lý Bernoulli chỉ ra rằng tần suất xuất hiện của sự kiện A trong n phép thử độc lập sẽ hội tụ theo xác
suất về xác suất của sự kiện đó khi số lần thử tăng lên vô hạn. Chính vì vậy định lý Bernoulli là cơ sở lý
m
thuyết của định nghĩa thống kê về xác suất ở Chương 1 “Khi n → +∞ thì → p”.
n
Ví dụ
Ví dụ 28
Giả sử p là tỷ lệ cử tri sẽ bầu cho ứng cử viên A. Để ước lượng trước tỷ lệ này người ta phỏng vấn
ngẫu nhiên n cử tri. Có thể coi kết quả bầu của cử tri thứ i là biến ngẫu nhiên Xi có phân phối
Bernoulli tham số p (Xi nhận giá trị 1 nếu cử tri thứ i bầu cho ứng cử viên A và nhận giá trị 0 trong
trường hợp ngược lại).
Các biến ngẫu nhiên Xi , i = 1, 2, . . . , n độc lập và có cùng phân phối Bernoulli tham số p với kỳ vọng
E(Xi ) = p và phương sai V (Xi ) = p(1 − p). Đặt Kn = X1 + X2 + · · · + Xn , áp dụng bất đẳng thức
Chebyshev ta có
p(1 − p) 1 1
P (|Kn − p| ≥ ε) < ≤ hay P (|Kn − p| < ε) ≥ 1 − .
nε2 4nε2 4nε2
1
Chẳng hạn, nếu ε = 0, 1 và n = 100 thì P (|K100 − p| ≥ 0, 1) < = 0, 25. Nói cách
4 × 100 × (0, 1)2
khác, nếu phỏng vấn 100 cử tri và lấy kết quả này để ước lượng cho tỷ lệ cử tri sẽ bỏ phiếu cho ứng
cử viên A thì sai số vượt quá 0,1 có xác suất nhỏ hơn 0,25.
Ví dụ
Nếu muốn ước lượng tin cậy hơn (chẳng hạn xác suất lớn hơn 95%) và chính xác hơn (với sai số 0,01) thì
1
P (|Kn − p| < 0, 01) ≥ 1 − .
4n(0, 01)2
Vậy số cử tri phải phỏng vấn thỏa mãn
1
1− ≥ 0, 95 suy ra n ≥ 50000.
4n(0, 01)2
Như vậy để ước lượng với độ tin cậy cao và độ chính xác cao thì cần phải lấy mẫu với số lượng lớn. Tuy
nhiên ở đây ta chỉ dựa vào bất đẳng thức Chebyshev để giải quyết bài toán.
Trong Phần thống kê ta sẽ nghiên cứu về bài toán ước lượng này và bằng phương pháp khác ta sẽ chỉ ra
số cử tri phải phỏng vấn nhỏ hơn kết quả trên.