You are on page 1of 297

Các kỹ thuật đếm

Độ đo xác suất

Không gian xác suất

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Các kỹ thuật đếm
Độ đo xác suất

1 Các kỹ thuật đếm


Quy tắc nhân
Chỉnh hợp - Tổ hợp
Định lý Nhị thức

2 Độ đo xác suất
Không gian mẫu
Không gian biến cố
Độ đo xác suất

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Quy tắc nhân
Các kỹ thuật đếm
Chỉnh hợp - Tổ hợp
Độ đo xác suất
Định lý Nhị thức

Nếu E1 là một phép thử (experiment) với n1 kết quả có thể xảy
ra (outcome) và E2 là một phép thử với n2 kết quả có thể xảy ra,
thì phép thử mà trong đó phải thực hiện E1 trước rồi đến E2 bao
gồm n1 · n2 kết quả có thể xảy ra.

Ví dụ
Có bao nhiêu kết quả có thể xảy ra khi tung một con súc sắc rồi
sau đó tung một đồng xu?

Đáp số: 12

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Quy tắc nhân
Các kỹ thuật đếm
Chỉnh hợp - Tổ hợp
Độ đo xác suất
Định lý Nhị thức

Xét một tập hợp gồm n đối tượng. Giả sử ta cần sắp xếp vào r vị
trí (r ≤ n) từ n đối tượng trong tập hợp trên. Khi đó, tổng số cách
mà ta có thể sắp xếp là

n(n − 1)(n − 2) . . . (n − r + 1)
n!
=
(n − r )!
= Arn .

Vậy, Arn là tổng số cách sắp xếp n đối tượng vào r vị trí.

Định nghĩa
Mỗi cách trong tổng số Arn cách sắp xếp được gọi là một chỉnh
hợp của n đối tượng chập r .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Quy tắc nhân
Các kỹ thuật đếm
Chỉnh hợp - Tổ hợp
Độ đo xác suất
Định lý Nhị thức

Trong một chỉnh hợp, thứ tự là rất quan trọng. Nhưng trong
nhiều vấn đề, ta không quan tâm đến thứ tự mà chỉ quan tâm
đến một tập hợp gồm r đối tượng.
Ta ký hiệu Cnr là số lượng tập con gồm r đối tượng được chọn
từ n đối tượng khác nhau.
Trong mỗi tập con, ta có Arr cách để sắp xếp r đối tượng vào
r vị trí. Do đó, ta có Arn = Cnr · Arr , từ đó, ta được

Arn n!
Cnr = r
= .
Ar (n − r )!r !

Định nghĩa
Mỗi tập con trong tổng số Cnr tập con không thứ tự được gọi là
một tổ hợp của n đối tượng chập r .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Quy tắc nhân
Các kỹ thuật đếm
Chỉnh hợp - Tổ hợp
Độ đo xác suất
Định lý Nhị thức

Ví dụ
Ông Jones có 10 cuốn sách và dự định đặt chúng lên kệ sách.
Trong 10 cuốn sách này có 4 cuốn Toán, 3 cuốn Hóa, 2 cuốn Sử,
và 1 cuốn Văn. Ông Jones muốn sắp xếp các cuốn sách sao cho
các cuốn sách cùng môn thì nằm chung với nhau. Hỏi ông ta có
bao nhiêu cách sắp xếp như vậy?

Giải:
Có 4!3!2!1! cách sắp xếp sao cho các sách Toán đứng đầu,
sau đó tới các sách Hóa, sau đó tới sách Sử, và sau đó tới
sách Văn.
Tương tự, với mỗi thứ tự có thể của các chủ đề sách, có
4!3!2!1! cách sắp xếp có thể.
Vì có 4! thứ tự có thể của các chủ đề sách, đáp số cần tìm là
4!4!3!2!1! = 6912.
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Quy tắc nhân
Các kỹ thuật đếm
Chỉnh hợp - Tổ hợp
Độ đo xác suất
Định lý Nhị thức

Ta đã biết rằng

(x + y )2 = x 2 + 2xy + y 2
= C20 x 2 + C21 xy + C22 y 2
2
X
= C2k x 2−k y k .
k=0

Tương tự,

(x + y )3 = x 3 + 3x 2 y + 3xy 2 + y 3
= C30 x 3 + C31 x 2 y + C32 xy 2 + C33 y 3
3
X
= C3k x 3−k y k .
k=0

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Quy tắc nhân
Các kỹ thuật đếm
Chỉnh hợp - Tổ hợp
Độ đo xác suất
Định lý Nhị thức

Tổng quát,
n
X
n
(x + y ) = Cnk x n−k y k .
k=0

Một cách hình dung kiểu tổ hợp của Định lý Nhị thức
(Binomial Theorem) như sau: nếu ta viết (x + y )n như là
tích của n nhân tử (x + y )

(x + y )n = (x + y )(x + y ) · · · (x + y ),

thì hệ số của x n−k y k là Cnk , đó là số cách mà ta có thể chọn


k nhân tử là y .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Một phép thử ngẫu nhiên (random experiment) là một


phép thử mà kết quả xảy ra của nó không thể được dự đoán
một cách chắc chắn.
Tuy nhiên, trong phần lớn các trường hợp, ta có thể liệt kê
được tập hợp tất cả các kết quả có thể xảy ra của một phép
thử ngẫu nhiên.

Định nghĩa
Không gian mẫu (sample space) của một phép thử ngẫu nhiên
là tập hợp tất cả các kết quả có thể xảy ra.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Ví dụ
Hãy xác định không gian mẫu của phép thử tung hai con súc sắc,
trong đó một con có màu đỏ, con còn lại màu xanh.

Giải:
Ω = {(x, y )|x, y ∈ N, 1 ≤ x, y ≤ 6}

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Định nghĩa
Một tập con A của không gian mẫu Ω được gọi là một biến cố
nếu nó thuộc vào một họ F các tập con của Ω thỏa mãn ba quy
tắc sau:
(a) Ω ∈ F;
(b) Nếu A ∈ F thì Ac ∈ F;

S
(c) Nếu Aj ∈ F, j = 1, 2, . . ., thì Aj ∈ F.
j=1

Họ F được gọi là một không gian biến cố (event space) hoặc


σ−trường (σ−field).

Ví dụ:
Họ {∅, Ω} là một không gian biến cố.
Họ gồm tất cả các tập con của Ω là một không gian biến cố.
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Ví dụ
Hãy xác định không gian mẫu của phép thử tung hai con súc sắc
và mô tả biến cố A tổng số chấm xuất hiện bằng 7.

Giải
Ω = {(x, y )|x, y ∈ N, 1 ≤ x, y ≤ 6}
A = {(1, 6), (6, 1), (2, 5), (5, 2), (3, 4), (4, 3)}

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Định nghĩa
Cho Ω là không gian mẫu của một phép thử ngẫu nhiên và F là
một không gian biến cố. Độ đo xác suất (probability measure)
P : F → R là một hàm tập thỏa mãn ba tính chất sau:
(P1) P(A) ≥ 0 với mọi biến cố A ∈ F;
(P2) P(Ω) = 1;

S  P∞
(P3) P Aj = P(Aj ), nếu A1 , A2 , . . . là các biến cố rời
j=1 j=1
nhau.
Ta gọi bộ ba (Ω, F, P) là không gian xác suất.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Định lý
Cho không gian xác suất (Ω, F, P). Khi đó,

P(∅) = 0.

Chứng minh:
Đặt A1 = Ω và Aj = ∅ với mọi j = 2, 3, . . .

Aj và {Aj }∞
S
Ta có Ω = j=1 là dãy các biến cố rời nhau nên
j=1
theo tính chất (P2) và (P3), ta có:
[∞  ∞
X ∞
X
1 = P(Ω) = P Aj = P(A1 ) + P(Aj ) = 1 + P(∅).
j=1 j=2 j=2

P
Suy ra P(∅) = 0. Vì P(∅) ≥ 0 nên ta suy ra P(∅) = 0.
j=2
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Định lý
Cho không gian xác suất (Ω, F, P). Nếu A1 , A2 , . . . , An là n biến
cố rời nhau, thì
[n  X n
P Aj = P(Aj ).
j=1 j=1

Chứng minh:
Đặt Aj = ∅ với mọi j = n + 1, . . .
Tính chất (P3) và P(∅) = 0, ta có:
[ n  [∞  X n ∞
X
P Aj = P Aj = P(Aj ) + P(Aj )
j=1 j=1 j=1 j=n+1
n
X
= P(Aj ).
j=1

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Hệ quả
Cho không gian xác suất (Ω, F, P) trong đó Ω chỉ có hữu hạn
phần tử và xác suất xảy ra của mỗi phần tử đều như nhau. Khi đó,
|A|
xác suất của biến cố A bất kỳ là P(A) = .
|Ω|

Chứng minh:
Giả sử Ω = {ω1 , . . . , ωn }.
Pn
Ta có 1 = P(Ω) = P({ωj }) và P({ω1 }) = . . . = P({ωn })
j=1
1
nên suy ra P({ωj }) = với mọi j = 1, . . . , n.
n
Với A = {ωi1 , . . . , ωim }, ta có:
m
X 1 m
P(A) = P({ωik }) = m · = .
n n
k=1

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Ví dụ
Một lớp học lý thuyết xác suất gồm 6 nam và 4 nữ. Các sinh viên
đã làm một bài kiểm tra và họ được xếp hạng dựa vào điểm của
bài kiểm tra. Giả sử rằng không có hai sinh viên nào bằng điểm.
(a) Có bao nhiêu cách xếp hạng có thể?
(b) Nếu tất cả cách xếp hạng được xem là có khả năng xảy ra
như nhau, thì xác suất để 4 bạn nữ xếp ở 4 vị trí đầu tiên là
bao nhiêu?
4!6! 1
ĐS: (a) 10! = 3628800. (b) = .
10! 210

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Ví dụ
Một ủy ban gồm 5 người được chọn từ một nhóm gồm 6 người
đàn ông và 9 người phụ nữ. Nếu việc chọn là ngẫu nhiên, thì xác
suất để chọn được một ủy ban gồm 3 người đàn ông và 2 người
phụ nữ là bao nhiêu?

Giải:
Ta giả thiết rằng cụm từ "việc chọn là ngẫu nhiên" có nghĩa
5 tổ hợp đều có khả năng xảy ra như
là mỗi tổ hợp trong C15
nhau.
Với giả thiết đó, vì ta có C63 cách chọn 3 người đàn ông và có
C92 cách chọn 2 người phụ nữ, nên ta suy ra xác suất cần tính

C63 · C92 240
5
= .
C15 1001

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Định lý
Cho không gian xác suất (Ω, F, P). Nếu A là một biến cố thì

P(Ac ) = 1 − P(A).

Chứng minh:
Ta có:

1 = P(Ω) = P(A ∪ Ac ) = P(A) + P(Ac ).

Suy ra:
P(Ac ) = 1 − P(A).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Định lý
Cho không gian xác suất (Ω, F, P). Nếu A và B là hai biến cố sao
cho A ⊂ B, thì
P(B \ A) = P(B) − P(A).

Chứng minh:
Ta có:

P(B) = P(A ∪ (B \ A)) = P(A) + P(B \ A).

Suy ra:
P(B \ A) = P(B) − P(A).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Định lý
Cho không gian xác suất (Ω, F, P). Nếu A và B là hai biến cố thì

P(A ∪ B) = P(A) + P(B) − P(A ∩ B).

Chứng minh:
Đặt A1 = A \ B, A2 = A ∩ B, A3 = B \ A thì A1 , A2 , A3 là 3
biến cố rời nhau.
Ta có
P(A ∪ B) = P(A1 ∪ A2 ∪ A3 )
= P(A1 ) + P(A2 ) + P(A3 )
= P(A \ A2 ) + P(A2 ) + P(B \ A2 )
= P(A) − P(A2 ) + P(A2 ) + P(B) − P(A2 )
= P(A) + P(B) − P(A ∩ B).
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Định lý
Cho không gian xác suất (Ω, F, P).
(a) Nếu {Aj }∞
j=1 là một dãy tăng các biến cố, tức là

A1 ⊂ A2 ⊂ . . . ⊂ An ⊂ An+1 ⊂ . . . ,

S 
thì P Aj = lim P(An ).
j=1 n→∞

(b) Nếu {Bj }∞


j=1 là một dãy giảm các biến cố, tức là

B1 ⊃ B2 ⊃ . . . ⊃ Bn ⊃ Bn+1 ⊃ . . . ,

T 
thì P Bj = lim P(Bn ).
j=1 n→∞

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Chứng minh (a):


Đặt E1 = A1 , Ej = Aj \ Aj−1 với mọi j ≥ 2.
Vì {Ej }∞
j=1 là dãy các biến cố rời nhau nên ta có:


[  ∞
[  X∞
P Aj = P Ej = P(Ej )
j=1 j=1 j=1
Xn
= lim P(Ej )
n→∞
j=1
 n
X 
= lim P(A1 ) + (P(Aj ) − P(Aj−1 ))
n→∞
j=2

= lim P(An ).
n→∞

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Không gian mẫu
Các kỹ thuật đếm
Không gian biến cố
Độ đo xác suất
Độ đo xác suất

Chứng minh (b):



\  ∞
h \ c i
P Bj = 1 − P Bj
j=1 j=1
 ∞
[ 
=1−P Bjc
j=1

= 1 − lim P(Bnc )
n→∞
 
= 1 − lim 1 − P(Bn )
n→∞
= lim P(Bn ).
n→∞

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện
Định lý Bayes

Xác suất có điều kiện


và Định lý Bayes

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện
Định lý Bayes

1 Xác suất có điều kiện


Xác suất có điều kiện
Hai biến cố độc lập

2 Định lý Bayes
Công thức xác suất toàn phần
Định lý Bayes

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Xác suất có điều kiện
Định lý Bayes Hai biến cố độc lập

Cho không gian xác suất (Ω, F, P). Cho B là một biến cố.
Trong một số trường hợp, ta chỉ quan tâm đến các kết quả
xảy ra mà các kết quả này là các phần tử của B. Điều này có
nghĩa là ta xem B là một không gian mẫu mới.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Xác suất có điều kiện
Định lý Bayes Hai biến cố độc lập

Định nghĩa
Cho không gian xác suất (Ω, F, P). Xác suất có điều kiện
(conditional probability) của một biến cố A, với điều kiện biến cố
B đã xảy ra và P(B) > 0, được định nghĩa bởi

P(A ∩ B)
P(A|B) = .
P(B)

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Xác suất có điều kiện
Định lý Bayes Hai biến cố độc lập

Rõ ràng là xác suất có điều kiện P(·|B) trong định nghĩa trên thỏa
mãn các tiên đề của một độ đo xác suất, tức là
(CP1) P(A|B) ≥ 0 với mọi biến cố A;
(CP2) P(B|B) = 1;

S  P∞
(CP3) P Aj |B = P(Aj |B), nếu A1 , A2 , . . . là các biến cố rời
j=1 j=1
nhau.
Như vậy, nó là một độ đo xác suất ứng với không gian mẫu mới B.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Xác suất có điều kiện
Định lý Bayes Hai biến cố độc lập

Ví dụ
Trong một hộc tủ có chứa 18 chiếc vớ gồm 4 chiếc màu đen, 6
chiếc màu nâu và 8 chiếc màu ô-liu. Lấy ngẫu nhiên 2 chiếc vớ
trong hộc tủ đó.
(a) Xác suất để lấy được 2 chiếc vớ cùng màu là bao nhiêu?
(b) Nếu biết rằng 2 chiếc vớ được lấy là cùng màu, thì xác suất
để 2 chiếc vớ ấy màu ô-liu là bao nhiêu?

Giải:
(a) Gọi A là biến cố "2 chiếc vớ được lấy có cùng màu".
C42 + C62 + C82 49
P(A) = 2
= .
C18 153
(b) Gọi B là biến cố "2 chiếc vớ được lấy có cùng màu ô-liu".
P(B ∩ A) C 2 153 4
P(B|A) = = 28 · = .
P(A) C18 49 7
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Xác suất có điều kiện
Định lý Bayes Hai biến cố độc lập

Ví dụ
Lấy ngẫu nhiên 2 chiếc tivi (lấy lần lượt từng chiếc không hoàn lại)
từ một lô hàng gồm 240 chiếc tivi trong đó có 15 chiếc bị lỗi. Xác
suất để cả 2 chiếc được lấy đều bị lỗi là bao nhiêu?

Giải
Gọi A là biến cố "chiếc tivi thứ nhất được lấy bị lỗi".
Gọi B là biến cố "chiếc tivi thứ hai được lấy bị lỗi".
Xác suất cần tìm là:
15 14 7
P(A ∩ B) = P(A) · P(B|A) = · = .
240 239 1912

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Xác suất có điều kiện
Định lý Bayes Hai biến cố độc lập

Ví dụ
Lấy ngẫu nhiên 3 cầu chì (lấy lần lượt từng chiếc không hoàn lại)
từ một hộp đựng 20 cầu chì trong đó có 5 cầu chì bị lỗi. Xác suất
để cả 3 cầu chì được lấy đều bị lỗi là bao nhiêu?

Giải:
Gọi A là biến cố "cầu chì thứ nhất được lấy bị lỗi".
Gọi B là biến cố "cầu chì thứ hai được lấy bị lỗi".
Gọi C là biến cố "cầu chì thứ ba được lấy bị lỗi".
Xác suất cần tìm là:
P(A ∩ B ∩ C ) = P(A) · P(B|A) · P(C |A ∩ B)
5 4 3 1
= · · = .
20 19 18 114

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Xác suất có điều kiện
Định lý Bayes Hai biến cố độc lập

Định nghĩa
Cho không gian xác suất (Ω, F, P). Hai biến cố A và B được gọi là
độc lập (independent) nếu

P(A ∩ B) = P(A) · P(B).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Xác suất có điều kiện
Định lý Bayes Hai biến cố độc lập

Định lý
Cho không gian xác suất (Ω, F, P). Nếu A và B là hai biến cố độc
lập và P(B) > 0, thì

P(A|B) = P(A).

Chứng minh:

P(A ∩ B) P(A) · P(B)


P(A|B) = = = P(A).
P(B) P(B)

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Xác suất có điều kiện
Định lý Bayes Hai biến cố độc lập

Định lý
Cho không gian xác suất (Ω, F, P). Giả sử A và B là hai biến cố
độc lập. Khi đó, Ac và B cũng là hai biến cố độc lập.

Chứng minh:

P(Ac ∩ B) = P(B) − P(A ∩ B)


= P(B) − P(A) · P(B)
= (1 − P(A)) · P(B)
= P(Ac ) · P(B).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Xác suất có điều kiện
Định lý Bayes Hai biến cố độc lập

Định nghĩa
Cho không gian xác suất (Ω, F, P).
Hai biến cố A và B được gọi là xung khắc nhau (mutually
exclusive) nếu
A ∩ B = ∅.

Biến cố A được gọi là biến cố có thể (possible) nếu

P(A) 6= 0.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Xác suất có điều kiện
Định lý Bayes Hai biến cố độc lập

Định lý
Cho không gian xác suất (Ω, F, P). Nếu A và B là hai biến cố có
thể và xung khắc nhau, thì chúng không phải là hai biến cố độc
lập.

Chứng minh:
Vì A và B là hai biến cố xung khắc nhau nên
P(A ∩ B) = P(∅) = 0.
Vì A và B là hai biến cố có thể nên P(A) · P(B) 6= 0.
Do đó P(A ∩ B) 6= P(A) · P(B).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Công thức xác suất toàn phần
Định lý Bayes Định lý Bayes

Định nghĩa
Cho S là một tập hợp và P = {Aj }nj=1 là một họ hữu hạn các tập
con của S. Ta nói P là một phân hoạch (partition) của S nếu
Sn
(a) S = Aj ;
j=1

(b) Ai ∩ Aj = ∅, với i 6= j.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Công thức xác suất toàn phần
Định lý Bayes Định lý Bayes

Định lý
Cho không gian xác suất (Ω, F, P). Giả sử họ các biến cố có thể
{Bj }nj=1 là một phân hoạch của Ω. Khi đó, với mọi biến cố A, ta có
n
X
P(A) = P(Bj ) · P(A|Bj ).
j=1

P(Bj ) được gọi là xác suất tiên nghiệm (prior probability).


Chứng minh:

P(A) = P(A ∩ B1 ) + P(A ∩ B2 ) + · · · + P(A ∩ Bn )


= P(B1 ) · P(A|B1 ) + P(B2 ) · P(A|B2 ) + · · · + P(Bn ) · P(A|Bn ).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Công thức xác suất toàn phần
Định lý Bayes Định lý Bayes

Định lý
Cho không gian xác suất (Ω, F, P). Giả sử họ các biến cố có thể
{Bj }nj=1 là một phân hoạch của Ω. Khi đó, với mọi biến cố có thể
A, ta có
P(Bk ) · P(A|Bk )
P(Bk |A) = n , k = 1, 2, . . . , n.
P
P(Bj ) · P(A|Bj )
j=1

P(Bk |A) được gọi là xác suất hậu nghiệm (posterior


probability).
Chứng minh:
P(Bk ∩ A) P(Bk ) · P(A|Bk )
P(Bk |A) = = n .
P(A) P
P(Bj ) · P(A|Bj )
j=1

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Công thức xác suất toàn phần
Định lý Bayes Định lý Bayes

Ví dụ
Trên bàn có 2 hộp B1 và B2 đều đựng đá cẩm thạch. Hộp B1 chứa
7 viên xanh và 4 viên trắng. Hộp B2 chứa 3 viên xanh và 10 viên
1
vàng. Các hộp được sắp xếp sao cho xác suất chọn hộp B1 là và
3
2
xác suất chọn hộp B2 là . Kathy bị bịt mắt và được yêu cầu chọn
3
một viên đá cẩm thạch. Cô ấy sẽ được thưởng một chiếc TV nếu
chọn được viên màu xanh.
(a) Xác suất để Kathy được thưởng một chiếc TV là bao nhiêu?
(b) Trong trường hợp Kathy được thưởng một chiếc TV, xác suất
để cô ấy chọn viên màu xanh từ hộp B1 là bao nhiêu?
157 91
ĐS: (a) . (b) .
429 157

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Công thức xác suất toàn phần
Định lý Bayes Định lý Bayes

Giải:
Gọi A là biến cố "Kathy được thưởng một chiếc TV".
Gọi Bj là biến cố "hộp Bj được chọn", j = 1, 2.
Xác suất tiên nghiệm: P(B1 ) = 1/3, P(B2 ) = 2/3.
(a) Xác suất cần tìm là:

P(A) = P(B1 ) · P(A|B1 ) + P(B2 ) · P(A|B2 )


1 7 2 3 157
= · + · = .
3 11 3 13 429

(b) Xác suất cần tìm là xác suất hậu nghiệm P(B1 |A):

P(B1 ) · P(A|B1 ) 1 7 429 91


P(B1 |A) = = · · = .
P(A) 3 11 157 157

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Công thức xác suất toàn phần
Định lý Bayes Định lý Bayes

Ví dụ
Có 0.5 phần trăm dân số mắc bệnh X. Có một xét nghiệm để phát
hiện bệnh X. Đối với những người mắc bệnh X, xác suất xét
nghiệm này không dương tính là 2 phần trăm. Đối với những người
không mắc bệnh X, xác suất xét nghiệm này dương tính là 3 phần
trăm.
(a) Xác suất một người được chọn ngẫu nhiên có kết quả dương
tính với xét nghiệm phát hiện bệnh X là bao nhiêu?
(b) Trong trường hợp bạn là người có kết quả dương tính với xét
nghiệm phát hiện bệnh X, xác suất bạn mắc bệnh X là bao
nhiêu?
139 98
ĐS: (a) . (b) .
4000 695

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Công thức xác suất toàn phần
Định lý Bayes Định lý Bayes

Giải:
Gọi A là biến cố "người được chọn có kết quả dương tính với
xét nghiệm phát hiện bệnh X".
Gọi B1 , B2 lần lượt là biến cố "người được chọn mắc bệnh
X", "người được chọn không mắc bệnh X".
Xác suất tiên nghiệm: P(B1 ) = 5/1000, P(B2 ) = 995/1000.
(a) Xác suất cần tìm là:

P(A) = P(B1 ) · P(A|B1 ) + P(B2 ) · P(A|B2 )


5 98 995 3 139
= · + · = ≈ 0.035.
1000 100 1000 100 4000

(b) Xác suất cần tìm là xác suất hậu nghiệm P(B1 |A):

P(B1 ) · P(A|B1 ) 5 98 4000 98


P(B1 |A) = = · · = ≈ 0.14.
P(A) 1000 100 139 695

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Công thức xác suất toàn phần
Định lý Bayes Định lý Bayes

Ví dụ
Để trả lời một câu hỏi trong một bài trắc nghiệm m lựa chọn, một
sinh viên hoặc là biết câu trả lời hoặc là đoán. Giả sử p là xác suất
sinh viên đó biết câu trả lời và 1 − p là xác suất sinh viên đó đoán.
Biết rằng sinh viên đoán đúng với xác suất là 1/m. Nếu anh ta trả
lời đúng một câu hỏi nào đó thì xác suất anh ta biết câu trả lời
cho câu hỏi đó là bao nhiêu?
mp
ĐS:
1 + (m − 1)p

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Công thức xác suất toàn phần
Định lý Bayes Định lý Bayes

Giải:
Gọi B1 , B2 lần lượt là biến cố "sinh viên biết câu trả lời",
"sinh viên đoán câu trả lời".
Gọi A là biến cố "sinh viên trả lời đúng".
Xác suất tiên nghiệm: P(B1 ) = p, P(B2 ) = 1 − p.
Xác suất cần tìm là xác suất hậu nghiệm P(B1 |A):

P(B1 ) · P(A|B1 )
P(B1 |A) =
P(B1 ) · P(A|B1 ) + P(B2 ) · P(A|B2 )
p·1
=
p · 1 + (1 − p) · 1/m
mp
= .
1 + (m − 1)p

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Công thức xác suất toàn phần
Định lý Bayes Định lý Bayes

Ví dụ
Có 2 hộp A và B đều đựng các con chip điện tử. Hộp A chứa 4 con
màu đỏ và 5 con màu xanh. Hộp B chứa 6 con màu đỏ và 3 con
màu xanh. Chọn ngẫu nhiên một con chip trong hộp A rồi bỏ vào
hộp B. Sau đó, chọn ngẫu nhiên một con chip trong hộp B. Trong
trường hợp con chip được chọn từ hộp B là màu đỏ, xác suất
chuyển con chip màu xanh trong hộp A sang hộp B là bao nhiêu?
15
ĐS: .
29

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Công thức xác suất toàn phần
Định lý Bayes Định lý Bayes

Giải:
Gọi B1 , B2 lần lượt là biến cố "con chip được chọn trong hộp
A là màu xanh", "con chip được chọn trong hộp A là màu
đỏ".
Gọi A là biến cố "con chip được chọn trong hộp B là màu đỏ".
Xác suất tiên nghiệm: P(B1 ) = 5/9, P(B2 ) = 4/9.
Xác suất cần tìm là xác suất hậu nghiệm P(B1 |A):

P(B1 ) · P(A|B1 )
P(B1 |A) =
P(B1 ) · P(A|B1 ) + P(B2 ) · P(A|B2 )
5/9 · 6/10
=
5/9 · 6/10 + 4/9 · 7/10
15
= .
29

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Công thức xác suất toàn phần
Định lý Bayes Định lý Bayes

Ví dụ
Có 60 phần trăm người mới biết lái xe đã có bằng lái xe. Trong
năm đầu tiên lái xe, những người mới biết lái xe nhưng chưa có
bằng lái xe có xác suất gây tai nạn là 0.08, trong khi những người
mới biết lái xe đã có bằng lái xe có xác suất gây tai nạn là 0.05.
Trong trường hợp một người mới biết lái xe không gây tai nạn
trong năm đầu tiên lái xe, xác suất người đó có bằng lái xe là bao
nhiêu?
285
ĐS: .
469

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Xác suất có điều kiện Công thức xác suất toàn phần
Định lý Bayes Định lý Bayes

Giải:
Gọi B1 , B2 lần lượt là biến cố "một người mới biết lái xe đã có
bằng lái xe", "một người mới biết lái xe chưa có bằng lái xe".
Gọi A là biến cố "một người mới biết lái xe không gây tai nạn
trong năm đầu tiên".
Xác suất tiên nghiệm: P(B1 ) = 0.6, P(B2 ) = 0.4.
Xác suất cần tìm là xác suất hậu nghiệm P(B1 |A):

P(B1 ) · P(A|B1 )
P(B1 |A) =
P(B1 ) · P(A|B1 ) + P(B2 ) · P(A|B2 )
0.6 · 0.95
=
0.6 · 0.95 + 0.4 · 0.92
285
= ≈ 0.6077.
469

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên
Kỳ vọng

Biến ngẫu nhiên và kỳ vọng

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên
Kỳ vọng

1 Biến ngẫu nhiên


Biến ngẫu nhiên rời rạc
Biến ngẫu nhiên liên tục

2 Kỳ vọng
Trung bình của biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Hàm sinh moment

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Trong một số phép thử ngẫu nhiên, các phần tử của không
gian mẫu không phải là các con số. Chẳng hạn, với phép thử
tung một đồng xu, không gian mẫu là Ω = {Sấp, Ngửa}.
Để làm thống kê, người ta phải tìm cách "số hóa" các phần
tử của không gian mẫu. Việc này dẫn đến khái niệm biến
ngẫu nhiên.

Định nghĩa
Cho không gian xác suất (Ω, F, P). Biến ngẫu nhiên (random
variable) là một hàm X : Ω → R thỏa mãn

{ω ∈ Ω : X (ω) ≤ x} ∈ F, với mọi x ∈ R.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Ví dụ
Xét phép thử tung một đồng xu. Hãy xây dựng một biến ngẫu
nhiên X cho phép thử này và cho biết miền giá trị của X .

Giải:
X : Ω → R định bởi: X (Sấp) = 0, X (Ngửa) = 1.
Miền giá trị của X là: X (Ω) = {0, 1}.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Ví dụ
Xét phép thử tung một đồng xu 3 lần. Hãy chỉ ra không gian mẫu
Ω của phép thử. Hãy xây dựng một biến ngẫu nhiên X trên Ω và
cho biết miền giá trị của X .

Giải:
Ω = {SSS, SSN, SNS, SNN, NSS, NSN, NNS, NNN}.
X = số lần xuất hiện mặt ngửa.
Miền giá trị của X là: X (Ω) = {0, 1, 2, 3}.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Ta thường đồng nhất biến ngẫu nhiên X với miền giá trị
X (Ω) của nó.
Nếu X là một biến ngẫu nhiên thì các tập hợp sau đây đều
thuộc không gian các biến cố với mọi số thực x:
{ω ∈ Ω : X (ω) ≤ x};
{ω ∈ Ω : X (ω) < x};
{ω ∈ Ω : X (ω) ≥ x};
{ω ∈ Ω : X (ω) > x};
{ω ∈ Ω : X (ω) = x}.
Để ngắn gọn, nếu X là một biến ngẫu nhiên thì ta ký hiệu các
biến cố {ω ∈ Ω : a < X (ω) ≤ b}, {ω ∈ Ω : X (ω) = x} lần
lượt bởi
{a < X ≤ b}, {X = x}.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Định nghĩa
Cho không gian xác suất (Ω, F, P). Cho X là một biến ngẫu nhiên
trên Ω. Hàm số F : R → R định bởi

F (x) = P(X ≤ x), x ∈ R,

được gọi là hàm phân phối tích lũy (c.d.f - cumulative


distribution function) hay ngắn gọn là hàm phân phối
(distribution function) của X .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Ví dụ
Cho biến ngẫu nhiên X có hàm phân phối:
2
(
1 − e −x , nếu x > 0,
F (x) =
0, nếu x ≤ 0.

Xác suất để X lớn hơn 1 là bao nhiêu?


Giải:
P(X > 1) = 1 − P(X ≤ 1)
= 1 − F (1)
= 1 − (1 − e −1 ) ≈ 0.368.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Định nghĩa
Cho không gian xác suất (Ω, F, P) và X là một biến ngẫu nhiên
trên Ω. Nếu miền giá trị X (Ω) có lực lượng không quá đếm được
thì ta nói X là một biến ngẫu nhiên rời rạc.

Định nghĩa
Cho không gian xác suất (Ω, F, P) và X là một biến ngẫu nhiên
rời rạc trên Ω. Hàm số f : R → R định bởi

f (x) = P(X = x), x ∈ R,

được gọi là hàm mật độ xác suất (p.d.f - probability density


function) của X .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Định lý
Cho không gian xác suất (Ω, F, P) và X là một biến ngẫu nhiên
rời rạc trên Ω. Cho f là hàm mật độ xác suất của X . Khi đó:
(a) f (x) ≥ 0 với mọi x ∈ R;
X
(b) f (x) = 1.
x

Chứng minh (b):


X X
f (x) = P(X = x)
x x
[ 
=P {X = x}
x
= P(Ω) = 1.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Định lý
Cho không gian xác suất (Ω, F, P) và X là một biến ngẫu nhiên
rời rạc trên Ω. Cho f và F lần lượt là hàm mật độ xác suất và hàm
phân phối của X . Khi đó:
X
F (x) = f (t), với mọi x ∈ R.
t≤x

Chứng minh: Lấy tùy ý x ∈ R, ta có:


[ 
F (x) = P(X ≤ x) = P {X = t}
t≤x
X X
= P(X = t) = f (t).
t≤x t≤x

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Ví dụ
Xét phép thử tung một đồng xu 3 lần. Gọi X là số lần xuất hiện
mặt ngửa. Hãy chỉ ra không gian mẫu của phép thử, miền giá trị,
hàm mật độ xác suất, hàm phân phối xác suất của X .

Giải:
Ω = {SSS, SSN, SNS, SNN, NSS, NSN, NNS, NNN}.
Miền giá trị: X (Ω) = {0, 1, 2, 3}.
Hàm mật độ xác suất của X :


 1/8, nếu x = 0,


3/8, nếu x = 1,



f (x) = P(X = x) = 3/8, nếu x = 2,





1/8, nếu x = 3,

0, nếu x ∈
/ {0, 1, 2, 3}.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Hàm phân phối xác suất của X :




0, nếu x < 0,

1/8, nếu 0 ≤ x < 1,




F (x) = P(X ≤ x) = 4/8, nếu 1 ≤ x < 2,





7/8, nếu 2 ≤ x < 3,

1, nếu x ≥ 3.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Định nghĩa
Cho không gian xác suất (Ω, F, P). Biến ngẫu nhiên X được gọi là
biến ngẫu nhiên liên tục (continuous random variable) nếu
tồn tại một hàm số khả tích f : R → [0; +∞) thỏa mãn
Z x
P(X ≤ x) = f (y )dy , với mọi x ∈ R.
−∞

Hàm số f được gọi là hàm mật độ xác suất (p.d.f - probability


density function) của X .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Mệnh đề
Nếu f là hàm mật độ xác suất của biến ngẫu nhiên liên tục X thì
Z ∞
f (x)dx = 1.
−∞

Chứng minh:
Z ∞ Z n
f (x)dx = lim f (x)dx
−∞ n→∞ −∞

= lim P(X ≤ n)
n→∞
[∞ 
=P {X ≤ j}
j=1

= P(Ω) = 1.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Ví dụ
Cho X là biến ngẫu nhiên liên tục có hàm mật độ xác suất là:
(
C · (4x − 2x 2 ), nếu x ∈ [0; 2],
f (x) =
0, nếu x ∈
/ [0; 2].

(a) Giá trị của hằng số C là bao nhiêu?


(b) Hãy tính P(X > 1).
(c) Tìm hàm phân phối xác suất của X .
3 1
ĐS: (a) C = . (b) .
8 2

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Giải:
(a) Ta có:
Z +∞ Z 2
8
1= f (x)dx = C · (4x − 2x 2 )dx = C .
−∞ 0 3

Suy ra C = 3/8.
(b)
P(X > 1) = 1 − P(X ≤ 1)
Z 1
=1− f (x)dx
−∞
Z 1
3
=1− (4x − 2x 2 )dx
0 8
1
= .
2

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Định lý
Cho không gian xác suất (Ω, F, P) và X là biến ngẫu nhiên liên
tục. Gọi F và f lần lượt là hàm phân phối xác suất và hàm mật độ
xác suất của X . Khi đó:
(a) F 0 (x) = f (x) với mọi x ∈ R.
(b) P(X = x) = 0 với mọi x ∈ R.
(c) P(a < X < b) = F (b) − F (a).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Biến ngẫu nhiên Biến ngẫu nhiên rời rạc
Kỳ vọng Biến ngẫu nhiên liên tục

Chứng minh (b):



T
Ta có: {X = x} = {x − 1/j < X ≤ x}.
j=1

Do đó:

\ 
P(X = x) = P {x − 1/j < X ≤ x}
j=1

= lim P(x − 1/n < X ≤ x)


n→∞
 
= lim P(X ≤ x) − P(X ≤ x − 1/n)
n→∞
 
= lim F (x) − F (x − 1/n)
n→∞
= 0.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Định nghĩa
Cho không gian xác suất (Ω, F, P). Cho X là biến ngẫu nhiên trên
Ω và f là hàm mật độ xác suất của X . Cho hàm u : X (Ω) → R
sao cho u ◦ X cũng là biến ngẫu nhiên trên Ω. Giá trị kỳ vọng
(expected value) của biến ngẫu nhiên u ◦ X , ký hiệu E [u ◦ X ],
được định nghĩa bởi
X

 u(x)f (x), nếu X rời rạc,

x
E [u ◦ X ] = Z ∞
u(x)f (x)dx, nếu X liên tục,



−∞

với giả thiết vế phải tồn tại.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Định nghĩa
Cho X là biến ngẫu nhiên và số nguyên dương n. Giá trị kỳ vọng
E [X n ] được gọi moment cấp n của biến ngẫu nhiên X .

Moment cấp 1 của X , tức là E [X ], còn được gọi là trung


bình của X .

Định nghĩa
Cho X là biến ngẫu nhiên. Trung bình (mean) của biến ngẫu
nhiên X , ký hiệu µX , được định nghĩa bởi

µX = E [X ].

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Ví dụ
Một cặp vợ chồng quyết định sinh 3 đứa con. Nếu cả 3 đứa con
của họ đều không phải con gái thì họ sẽ sinh thêm đứa con thứ tư.
Nếu đứa con thứ tư không phải là con gái thì họ sẽ sinh thêm đứa
cuối cùng. Ký hiệu X là số con của cặp vợ chồng này. Giá trị trung
bình của X là bao nhiêu?
51
ĐS:
16

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Giải:
f (3) = P(X = 3) =
P(sinh ít nhất 1 đứa con gái trong 3 lần sinh đầu tiên) =
1 − (1/2)3 = 7/8.
f (4) = P(X = 4) =
P(sinh 3 đứa con trai đầu tiên và 1 đứa con gái cuối cùng) =
(1/2)3 · 1/2 = 1/16.
f (5) = P(X = 5) =
P(sinh 4 đứa con trai đầu tiên và 1 đứa con gái cuối cùng) +
P(sinh 5 đứa con trai) = (1/2)4 · 1/2 + (1/2)5 = 1/16.

µX = 3 · f (3) + 4 · f (4) + 5 · f (5) = 3 · 7/8 + 4 · 1/16 + 5 · 1/16


51
= ≈ 3.19
16

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Định lý
Cho X là biến ngẫu nhiên và a, b là các hằng số. Khi đó:

E [aX + b] = aE [X ] + b.

Chứng minh:
Z ∞
E [aX + b] = (ax + b)f (x)dx
−∞
Z ∞ Z ∞
=a xf (x)dx + b f (x)dx
−∞ −∞
= aE [X ] + b.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Định nghĩa
Cho X là biến ngẫu nhiên có trung bình là µX . Phương sai
(variance) của X , ký hiệu Var(X ), được định nghĩa bởi
h i
Var(X ) = E (X − µX )2 .

Định nghĩa
Cho X là biến ngẫu nhiên có phương sai là Var(X ). Độ lệch chuẩn
(standard deviation) của X , ký hiệu σX , được định nghĩa bởi
p
σX = Var(X ).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Định lý
Cho X là biến ngẫu nhiên có trung bình là µX và độ lệch chuẩn
σX . Khi đó:
σX2 = E [X 2 ] − µ2X .

Chứng minh:
h i
σX2 = Var(X ) = E (X − µX )2
Z ∞
= (x − µX )2 f (x)dx
Z−∞
∞ Z ∞ Z ∞
2 2
= x f (x)dx − 2µX xf (x)dx + µX f (x)dx
−∞ −∞ −∞
= E [X ] − µ2X .
2

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Ví dụ
Cho biến ngẫu nhiên X có hàm mật độ xác suất
(
1 − |x|, nếu x ∈ (−1, 1),
f (x) =
0, nếu x ∈
/ (−1, 1).

Hãy tính phương sai của X .


1
ĐS: .
6

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Giải:
Var(X ) = E [X 2 ] − µ2X
Z ∞ Z ∞ 2
2
= x f (x)dx − xf (x)dx
−∞ −∞
Z 1 Z 1 2
2
= x (1 − |x|)dx − x(1 − |x|)dx
−1 −1
Z 1
=2 x 2 (1 − x)dx − (0)2
0
1
= .
6

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Đối với một số biến ngẫu nhiên, việc tính các moment E [X n ] bằng
định nghĩa là một việc làm không dễ. Tuy nhiên, ta có thể vượt
qua các khó khăn này bằng cách sử dụng hàm sinh moment.

Định nghĩa
Cho X là biến ngẫu nhiên. Hàm số M định bởi

M(t) = E [e tX ],

được gọi là hàm sinh moment (moment generating function)


của X , nếu kỳ vọng ở vế phải tồn tại với mọi t thuộc một lân cận
nào đó của 0.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Định lý
Cho X là biến ngẫu nhiên và M(t) là hàm sinh moment của X .
Khi đó:
E [X n ] = M (n) (0), n = 1, 2, . . .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Chứng minh:

M(t) = E [e tX ]
h tX (tX )2 (tX )n i
=E 1+ + + ··· + + ···
1! 2! n!
E [X ] E [X 2 ] 2 E [X n ] n
= E [1] + t+ t + ··· + t + ···
1! 2! n!
Suy ra:
E [X n ] = M (n) (0), n = 1, 2, . . .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Ví dụ
Cho biến ngẫu nhiên X có hàm mật độ xác suất
( −x
e , nếu x > 0,
f (x) =
0, nếu x ≤ 0.

Hãy tính trung bình và phương sai của X .

ĐS: µX = 1, Var(X ) = 1.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Giải:
Hàm sinh moment của X :
Z ∞ Z ∞ Z ∞
M(t) = e tx f (x)dx = e tx e −x dx = e (t−1)x dx
−∞ 0 0
1 (t−1)x x→∞ 1
= e =− , với t < 1.
t −1 t −1

x=0

1 2
M 0 (t) = 2
, M 00 (t) = − .
(t − 1) (t − 1)3
µX = E [X ] = M 0 (0) = 1.
E [X 2 ] = M 00 (0) = 2.
Var(X ) = E [X 2 ] − µ2X = 2 − 12 = 1.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Trong lý thuyết xác suất, người ta cũng sử dụng hàm đặc trưng để
nghiên cứu phân phối của một biến ngẫu nhiên.

Định nghĩa
Cho X là biến ngẫu nhiên. Hàm số Φ định bởi
Z ∞
itX
Φ(t) = E [e ] = e itx f (x)dx, t ∈ R,
−∞

được gọi là hàm đặc trưng (characteristic function) của X .

Từ định nghĩa ta suy ra mối liên hệ giữa hàm đặc trưng và hàm
sinh moment:
Φ(t) = M(it).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Trung bình của biến ngẫu nhiên
Biến ngẫu nhiên
Phương sai và độ lệch chuẩn của biến ngẫu nhiên
Kỳ vọng
Hàm sinh moment

Không giống như hàm sinh moment, hàm đặc trưng của một
biến ngẫu nhiên bất kỳ lúc này cũng tồn tại.
Hàm mật độ xác suất f (x) có thể tìm ngược lại từ hàm đặc
trưng bởi công thức:
Z ∞
1
f (x) = e −itx Φ(t)dt.
2π −∞

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Cặp biến ngẫu nhiên và kỳ vọng

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

1 Cặp biến ngẫu nhiên


Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên liên tục
Độc lập ngẫu nhiên

2 Kỳ vọng và hiệp phương sai

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Định nghĩa
Cho không gian xác suất (Ω, F, P) và X , Y là hai biến ngẫu nhiên
trên Ω. Ta gọi hàm vectơ

(X , Y ) :Ω → R2
 
ω 7→ X (ω), Y (ω)

là cặp biến ngẫu nhiên (bivariate random variable).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Định nghĩa
Cho không gian xác suất (Ω, F, P). Cho (X , Y ) là một cặp biến
ngẫu nhiên trên Ω. Hàm số F : R2 → R định bởi

F (x, y ) = P(X ≤ x, Y ≤ y ), (x, y ) ∈ R2 ,

được gọi là hàm phân phối đồng thời (joint distribution


function) của (X , Y ).

Trong định nghĩa trên, (X ≤ x, Y ≤ y ) là ký hiệu cho biến cố

(X ≤ x) ∩ (Y ≤ y ).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Định nghĩa
Cho không gian xác suất (Ω, F, P). Cho (X , Y ) là một cặp biến
ngẫu nhiên rời rạc trên Ω. Hàm số f : R2 → R định bởi

f (x, y ) = P(X = x, Y = y ), (x, y ) ∈ R2 ,

được gọi là hàm mật độ xác suất đồng thời (joint probability
density function) của (X , Y ).

Trong định nghĩa trên, (X = x, Y = y ) là ký hiệu cho biến cố

(X = x) ∩ (Y = y ).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Định nghĩa
Cho không gian xác suất (Ω, F, P) và (X , Y ) là một cặp biến
ngẫu nhiên rời rạc trên Ω. Gọi f là hàm mật độ xác suất đồng thời
của (X , Y ).
(a) Hàm số fX : R → R định bởi
X
fX (x) = f (x, y ), x ∈ R,
y

được gọi là hàm mật độ xác suất biên (marginal


probability density function) của X .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Cặp biến nhẫu nhiên rời rạc

Định nghĩa
(b) Hàm số fY : R → R định bởi
X
fY (y ) = f (x, y ), y ∈ R,
x

được gọi là hàm mật độ xác suất biên của Y .

Từ định nghĩa hàm mật độ biên, ta suy ra:


Xác suất P(X = x) chính là giá trị của hàm mật độ biên
fX (x).
Xác suất P(Y = y ) chính là giá trị của hàm mật độ biên
fY (y ).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Ví dụ
Cho cặp biến ngẫu nhiên (X , Y ) có hàm mật độ xác suất đồng
thời là:

 1 (x + y ), nếu (x, y ) ∈ {1, 2} × {1, 2, 3},


f (x, y ) = 21
0, nếu (x, y ) ∈
/ {1, 2} × {1, 2, 3}.

Tìm các hàm mật độ xác suất biên của X và Y .

X Y 1 2 3
1 2/21 3/21 4/21
2 3/21 4/21 5/21

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Giải:

3
 X 1 3x + 6
(x + y ) = , nếu x ∈ {1, 2},


fX (x) = y =1 21 21


0, nếu x ∈
/ {1, 2}.


2
 X 1 3 + 2y
(x + y ) = , nếu y ∈ {1, 2, 3},


fY (y ) = x=1 21 21


0, nếu y ∈
/ {1, 2, 3}.

X Y 1 2 3 fX (x)
1 2/21 3/21 4/21 9/21
2 3/21 4/21 5/21 12/21
fY (y ) 5/21 7/21 9/21

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Định lý
Cho không gian xác suất (Ω, F, P) và (X , Y ) là một cặp biến
ngẫu nhiên rời rạc trên Ω. Gọi f là hàm mật độ xác suất đồng thời
của (X , Y ). Khi đó:
(a) f (x, y ) ≥ 0 với mọi (x, y ) ∈ R2 .
PP
(b) f (x, y ) = 1.
x y

Chứng minh (b):


XX XX
f (x, y ) = P(X = x, Y = y )
x y x y

= P(Ω) = 1.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Định lý
Cho không gian xác suất (Ω, F, P) và (X , Y ) là một cặp biến
ngẫu nhiên rời rạc trên Ω. Gọi F và f lần lượt là hàm phân phối
đồng thời và hàm mật độ xác suất đồng thời của (X , Y ). Khi đó:
XX
F (x, y ) = f (u, v ), (x, y ) ∈ R2 .
u≤x v ≤y

Chứng minh:

F (x, y ) = P(X ≤ x, Y ≤ y )
XX XX
= P(X = u, Y = v ) = f (u, v ).
u≤x v ≤y u≤x v ≤y

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Định nghĩa
Cho không gian xác suất (Ω, F, P) và cặp biến ngẫu nhiên liên tục
(X , Y ). Hàm khả tích f : R2 → [0; +∞) thỏa mãn
ZZ
P(X ≤ x, Y ≤ y ) = f (u, v )dudv , với mọi (x, y ) ∈ R2 ,
(−∞;x]×(−∞;y ]

được gọi là hàm mật độ xác suất đồng thời (joint probability
density function) của (X , Y ).

Từ định nghĩa trên, ta có nhận xét: nếu f là hàm mật độ xác suất
đồng thời của cặp biến ngẫu nhiên liên tục (X , Y ) thì
ZZ
f (x, y )dxdy = 1.
R2

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Ví dụ
Cho cặp biến ngẫu nhiên liên tục (X , Y ) có hàm mật độ xác suất
đồng thời là:
(
C · (x 2 + 2xy ), nếu (x, y ) ∈ [0; 1] × [0; 1],
f (x, y ) =
0, nếu (x, y ) ∈
/ [0; 1] × [0; 1].

(a) Tìm hằng số C .


(b) Xác suất P(X ≤ Y ) bằng bao nhiêu?

ĐS. (a) 6/5. (b) 2/5.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Giải:
(a) Ta có:
ZZ Z 1 Z 1
5
1= f (x, y )dxdy = dx C · (x 2 + 2xy )dy = C .
0 0 6
[0;1]×[0;1]

Suy ra C = 6/5.
(b)
ZZ
P(X ≤ Y ) = f (x, y )dxdy
D
(trong đó D = {(x, y ) ∈ R2 |0 ≤ x ≤ y , 0 ≤ y ≤ 1})
Z 1 Z y
6
= dy · (x 2 + 2xy )dx
0 0 5
2
= .
5
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Định lý
Cho không gian xác suất (Ω, F, P) và (X , Y ) là một cặp biến
ngẫu nhiên liên tục trên Ω. Gọi F và f lần lượt là hàm phân phối
đồng thời và hàm mật độ xác suất đồng thời của (X , Y ). Khi đó:

∂2F
f (x, y ) = (x, y ), (x, y ) ∈ R2 .
∂x∂y

Chứng minh:
(x, y ) ∈ R2 .
RR
Ta có: F (x, y ) = f (u, v )dudv ,
(−∞;x]×(−∞;y ]
Theo định lý cơ bản của Giải tích, ta có:
∂2F
f (x, y ) = (x, y ), (x, y ) ∈ R2 .
∂x∂y

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Định nghĩa
Cho không gian xác suất (Ω, F, P) và (X , Y ) là một cặp biến
ngẫu nhiên liên tục trên Ω. Gọi f là hàm mật độ xác suất đồng
thời của (X , Y ).
(a) Hàm số fX : R → R định bởi
Z ∞
fX (x) = f (x, y )dy , x ∈ R,
−∞

được gọi là hàm mật độ xác suất biên của X .


(b) Hàm số fY : R → R định bởi
Z ∞
fY (y ) = f (x, y )dx, y ∈ R,
−∞

được gọi là hàm mật độ xác suất biên của Y .


TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Định nghĩa
Cho không gian xác suất (Ω, F, P) và Cho (X , Y ) là một cặp biến
ngẫu nhiên trên Ω. Gọi f và fX , fY lần lượt là hàm mật độ xác
suất đồng thời của (X , Y ) và hàm mật độ xác suất biên của X , Y .
Ta nói X và Y độc lập (independent) nếu

f (x, y ) = fX (x) · fY (y ) với mọi (x, y ) ∈ R2 .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Ví dụ
Cho cặp biến ngẫu nhiên liên tục (X , Y ) có hàm mật độ xác suất
đồng thời là
( −x−y
e , nếu (x, y ) ∈ [0; +∞) × [0; +∞),
f (x, y ) =
0, nếu (x, y ) ∈
/ [0; +∞) × [0; +∞).

Hỏi X và Y có độc lập không?

ĐS: Có.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến nhẫu nhiên rời rạc
Cặp biến ngẫu nhiên
Cặp biến ngẫu nhiên liên tục
Kỳ vọng và hiệp phương sai
Độc lập ngẫu nhiên

Giải:
Z ∞
∞ e −x−y dy = e −x , nếu x ∈ [0; +∞),
Z 
fX (x) = f (x, y )dy = 0
−∞ 
0, nếu x ∈
/ [0; +∞).
Z ∞
∞ e −x−y dx = e −y , nếu y ∈ [0; +∞),
Z 
fY (y ) = f (x, y )dx = 0
−∞ 
0, nếu y ∈
/ [0; +∞).
Suy ra: f (x, y ) = fX (x) · fY (y ) với mọi (x, y ) ∈ R2 .
Vậy X và Y độc lập.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Định nghĩa
Cho không gian xác suất (Ω, F, P) và (X , Y ) là cặp biến ngẫu
nhiên trên Ω. Gọi f là hàm mật độ xác suất đồng thời của (X , Y ).
Cho hàm u : X (Ω) × Y (Ω) → R sao cho u ◦ (X , Y ) cũng là biến
ngẫu nhiên trên Ω. Giá trị kỳ vọng (expected value) của
u ◦ (X , Y ), ký hiệu E [u ◦ (X , Y )], được định nghĩa bởi
XX

 u(x, y )f (x, y ), nếu (X , Y ) rời rạc,

x y
E [u ◦ (X , Y )] = Z Z


 u(x, y )f (x, y )dxdy , nếu (X , Y ) liên tục,
R2

với giả thiết vế phải tồn tại.

Đặc biệt, giá trị kỳ vọng E [XY ] còn được gọi moment tích
(product moment) của X và Y .
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Định nghĩa
Cho không gian xác suất (Ω, F, P) và (X , Y ) là cặp biến ngẫu
nhiên trên Ω. Hiệp phương sai (covariance) giữa X và Y , ký
hiệu Cov(X , Y ) hay σXY , được định nghĩa bởi
h i
Cov(X , Y ) = E (X − µX )(Y − µY ) ,

trong đó µX và µY là các giá trị được cho bởi


ZZ
µX = E [X ] = xf (x, y )dxdy ,
2
Z ZR
µY = E [Y ] = yf (x, y )dxdy ,
R2

và được gọi là giá trị trung bình của X và Y .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Định lý
Cho không gian xác suất (Ω, F, P) và (X , Y ) là cặp biến ngẫu
nhiên trên Ω. Khi đó:

Cov(X , Y ) = E [XY ] − E [X ]E [Y ].

Chứng minh:
h i
Cov(X , Y ) = E (X − µX )(Y − µY )
ZZ
= (x − µX )(y − µY )f (x, y )dxdy
2
Z ZR ZZ
= xyf (x, y )dxdy − µX · yf (x, y )dxdy
R2Z Z R2 ZZ
− µY · xf (x, y )dxdy + µX · µY · f (x, y )dxdy
R2 R2
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Ví dụ
Cho cặp biến ngẫu nhiên rời rạc (X , Y ) có hàm mật độ xác suất
đồng thời là

 x + 2y , nếu (x, y ) ∈ {1, 2} × {1, 2},


f (x, y ) = 18
0, nếu (x, y ) ∈
/ {1, 2} × {1, 2}.

Hiệp phương sai giữa X và Y bằng bao nhiêu?


1
ĐS: −
162

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Giải:
2 X
2
X x + 2y
E [XY ] = x ·y ·
18
x=1 y =1
3 5 4 6 45
=1·1· +1·2· +2·1· +2·2· =
18 18 18 18 18

2 X
2
X x + 2y 3 5 4 6 28
E [X ] = x· =1· +1· +2· +2· =
18 18 18 18 18 18
x=1 y =1

2 X
2
X x + 2y 3 5 4 6 29
E [Y ] = y· =1· +2· +1· +2· =
18 18 18 18 18 18
x=1 y =1

1
Cov(X , Y ) = E [XY ] − E [X ]E [Y ] = −
162
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Ví dụ
Cho cặp biến ngẫu nhiên liên tục (X , Y ) có hàm mật độ xác suất
đồng thời là
(
x + y , nếu (x, y ) ∈ [0; 1] × [0; 1],
f (x, y ) =
0, nếu (x, y ) ∈
/ [0; 1] × [0; 1].

Hiệp phương sai giữa X và Y bằng bao nhiêu?


1
ĐS: −
144

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Giải:
ZZ ZZ
1
E [XY ] = xyf (x, y )dxdy = xy (x + y )dxdy =
R2 [0;1]×[0;1] 3
ZZ ZZ
7
E [X ] = xf (x, y )dxdy = x(x + y )dxdy =
R2 [0;1]×[0;1] 12
ZZ ZZ
7
E [Y ] = yf (x, y )dxdy = y (x + y )dxdy =
R2 [0;1]×[0;1] 12
1
Cov(X , Y ) = E [XY ] − E [X ]E [Y ] = −
144

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Định lý
Cho không gian xác suất (Ω, F, P) và (X , Y ) là cặp biến ngẫu
nhiên trên Ω. Nếu X và Y độc lập thì Cov(X , Y ) = 0.

Chứng minh:
ZZ ZZ
E [XY ] = xyf (x, y )dxdy = xyfX (x)fY (y )dxdy
R2 R2
Z ∞ Z ∞
= xfX (x)dx · yfY (y )dy
−∞ −∞
Z ∞ Z ∞  Z ∞ Z ∞ 
= x f (x, y )dy dx · y f (x, y )dx dy
Z−∞
Z −∞
ZZ −∞ −∞

= xf (x, y )dxdy · yf (x, y )dxdy = E [X ] · E [Y ]


R2 R2

Vậy Cov(X , Y ) = 0.
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Ví dụ
Cho cặp biến ngẫu nhiên rời rạc (X , Y ) có hàm mật độ xác suất
đồng thời là

 1 , nếu (x, y ) ∈ {(0, 1); (0, −1); (1, 0); (−1; 0)},

f (x, y ) = 4
0, nếu (x, y ) ∈ / {(0, 1); (0, −1); (1, 0); (−1; 0)}.

(a) Chứng minh rằng Cov(X , Y ) = 0.


(b) X và Y có độc lập không?

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Giải:
1 1 1 1
+ 0 · (−1) · + 1 · 0 · + (−1) · 0 · = 0
E [XY ] = 0 · 1 ·
4 4 4 4
1 1 1 1
E [X ] = 0 · + 0 · + 1 · + (−1) · = 0
4 4 4 4
1 1 1 1
E [Y ] = 1 · + (−1) · + 0 · + 0 · = 0
4 4 4 4
Suy ra Cov(X , Y ) = E [XY ] − E [X ]E [Y ] = 0.
X Y −1 0 1 fX (x)
−1 0 1/4 0 1/4
0 1/4 0 1/4 2/4
1 0 1/4 0 1/4
fY (y ) 1/4 2/4 1/4

Ta thấy: f (−1, −1) = 0 6= fX (−1) · fY (−1) = (1/4) · (1/4). Do đó


X và Y không độc lập.
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Định lý
Cho không gian xác suất (Ω, F, P) và (X , Y ) là cặp biến ngẫu
nhiên độc lập và a, b là hai số thực bất kỳ. Khi đó:

MaX +bY (t) = MX (at) · MY (bt).

Chứng minh:

MaX +bY (t) = E [e t(aX +bY ) ]


= E [e atX e btY ]
= E [e atX ] · E [e atY ]
= MX (at) · MY (bt).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Định lý
Cho không gian xác suất (Ω, F, P). Cho (X , Y ) là cặp biến ngẫu
nhiên và a, b là hai số thực bất kỳ. Khi đó:

Var(aX + bY ) = a2 Var(X ) + 2abCov(X , Y ) + b 2 Var(Y ).

Chứng minh:
h 2 i
Var(aX + bY ) = E aX + bY − E [aX + bY ]
h 2 i
= E aX + bY − aE [X ] − bE [Y ]
h 2 i
= E a(X − µX ) + b(Y − µY )
= a2 Var(X ) + 2abCov(X , Y ) + b 2 Var(Y ).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Định lý
Cho không gian xác suất (Ω, F, P) và (X , Y ) là cặp biến ngẫu
nhiên. Nếu X và Y độc lập và E [X ] = E [Y ] = 0. Khi đó

Var(XY ) = Var(X )Var(Y ).

Chứng minh:

Var(XY ) = E [(XY )2 ] − (E [XY ])2


= E [X 2 Y 2 ] − (E [X ]E [Y ])2
= E [X 2 Y 2 ]
= E [X 2 ]E [Y 2 ]
= Var(X )Var(Y ).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Cặp biến ngẫu nhiên
Kỳ vọng và hiệp phương sai

Định nghĩa
Cho không gian xác suất (Ω, F, P). Cho (X , Y ) là cặp biến ngẫu
nhiên có giá trị phương sai lần lượt là σX2 , σY2 . Hệ số tương quan
(correlation coefficient) giữa X và Y , ký hiệu là ρ(X , Y ), được
định nghĩa bởi
Cov(X , Y )
ρ(X , Y ) = .
σX σY

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt
Một số biến ngẫu nhiên liên tục đặc biệt
Một số phân phối thường gặp trong thống kê

Một số biến ngẫu nhiên có


phân phối đặc biệt

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt
Một số biến ngẫu nhiên liên tục đặc biệt
Một số phân phối thường gặp trong thống kê

1 Một số biến ngẫu nhiên rời rạc đặc biệt


Phân phối Bernoulli
Phân phối nhị thức
Phân phối hình học
Phân phối Poisson
2 Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối đều
Phân phối chuẩn
Phân phối chuẩn chính tắc
3 Một số phân phối thường gặp trong thống kê
Phân phối Chi-bình phương
Phân phối Student
Phân phối Fisher

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Định nghĩa
Ta nói X là biến ngẫu nhiên có phân phối Bernoulli với tham số
p ∈ (0; 1), ký hiệu X ∼ BER(p), nếu X có hàm mật độ xác suất là:

p,

 nếu x = 1,
f (x) = 1 − p, nếu x = 0,


0, nếu x ∈
/ {0, 1}.

Hàm mật độ xác suất của X ∼ BER(p) có thể viết ngắn gọn là:
(
(1 − p)1−x · p x , nếu x ∈ {0, 1},
f (x) =
0, nếu x ∈
/ {0, 1}.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Ví dụ
Xét phép thử tung một đồng xu. Ta đặt (X = 1) cho biến cố xuất
hiện mặt ngửa và (X = 0) cho biến cố xuất hiện mặt sấp. Chứng
minh rằng X ∼ BER(0.5).

Giải: X có hàm mật độ xác suất là


f (0) = 0.5, f (1) = 0.5, f (x) = 0 nếu x ∈
/ {0, 1}.
Do đó, X ∼ BER(0.5).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Định lý
Cho X ∼ BER(p). Khi đó:
(a) X có hàm sinh moment là

M(t) = (1 − p) + p · e t .

(b) Giá trị trung bình và giá trị phương sai của X là

µX = p, σX2 = p(1 − p).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Chứng minh:
Hàm sinh moment của X :
X
M(t) = E [e tX ] = e tx f (x)
x∈{0,1}

= e f (0) + e 1t f (1)
0t

= (1 − p) + p · e t .

Do đó: M 0 (t) = p · e t , M 00 (t) = p · e t .


µX = E [X ] = M 0 (0) = p.
σX2 = E [X 2 ] − µ2X = M 00 (0) − p 2 = p − p 2 = p(1 − p).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Định nghĩa
Ta nói X là biến ngẫu nhiên có phân phối nhị thức (binomial)
với tham số n ∈ N∗ và p ∈ (0; 1), ký hiệu X ∼ BIN(n, p), nếu X
có hàm mật độ xác suất là:
( x
Cn · (1 − p)n−x · p x , nếu x ∈ {0, 1, . . . , n},
f (x) =
0, nếu x ∈
/ {0, 1, . . . , n}.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Ví dụ
Xét phép thử tung một đồng xu 3 lần. Gọi X là số lần xuất hiện
mặt ngửa. Chứng minh rằng X ∼ BIN(3, 0.5).

Giải: X ∼ BIN(3, 0.5) vì X có hàm mật độ xác suất là:


( x
C3 · (1 − 0.5)3−x · 0.5x , nếu x ∈ {0, 1, 2, 3},
f (x) = P(X = x) =
0, nếu x ∈
/ {0, 1, 2, 3}.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Ví dụ
Một bài kiểm tra gồm 10 câu hỏi trắc nghiệm khách quan, mỗi câu
hỏi gồm 4 câu trả lời, trong đó chỉ có một câu trả lời đúng. Một
sinh viên trả lời các câu hỏi bằng cách chọn ngẫu nhiên câu trả lời.
Gọi X là số câu trả lời đúng của sinh viên đó. Xác suất P(X = 5)
là bao nhiêu?
Giải:
Ta có: X ∼ BIN(10, 0.25).
5 · (1 − 0.25)5 · 0.255 ≈ 0.0584.
P(X = 5) = C10

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Ví dụ
Biết rằng xác suất một đứa bé khi mới sinh có cân nặng dưới 2547
grams ở Mỹ là 0.1. Quan sát 20 đứa bé mới sinh, gọi X là số bé có
cân nặng dưới 2547 grams. Xác suất P(X ≤ 3) là bao nhiêu?

Giải:
Ta có: X ∼ BIN(20, 0.1).

P(X ≤ 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3)


3
X
= x
C20 · (1 − 0.1)20−x · 0.1x ≈ 0.867
x=0

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Ví dụ
Giả sử X1 , X2 , . . . , Xn là n biến ngẫu nhiên BER(p) độc lập. Đặt
X = X1 + X2 + · · · + Xn . Chứng minh rằng X ∼ BIN(n, p).

Giải:
Lấy x tùy ý thuộc miền giá trị của X , tức là x ∈ {0, 1, . . . , n}.
Để X = x, điều kiện cần và đủ là có x biến ngẫu nhiên Xi
nhận giá trị bằng 1 và (n − x) biến ngẫu nhiên Xi còn lại
nhận giá trị bằng 0.
Ta có Cnx trường hợp như vậy.
Vì các biến ngẫu nhiên Xi độc lập nên theo quy tắc nhân xác
suất, mỗi trường hợp như vậy có xác suất là (1 − p)n−x · p x .
Suy ra: P(X = x) = Cnx · (1 − p)n−x · p x .
Vậy X ∼ BIN(n, p).
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Định lý
Cho X ∼ BIN(n, p). Khi đó:
(a) X có hàm sinh moment là
h in
M(t) = (1 − p) + p · e t .

(b) Giá trị trung bình và giá trị phương sai của X là

µX = np, σX2 = np(1 − p).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Chứng minh:
Hàm sinh moment của X :
n
X
M(t) = E [e tX ] = e tx Cnx · (1 − p)n−x · p x
x=0
n
X h in
= Cnx · (1 − p)n−x · (p · e t )x = (1 − p) + p · e t .
x=0
h in−1
M 0 (t) = npe t (1 − p) + pe t .
M 00 (t) =
h in−1 h in−2
npe t (1 − p) + pe t + n(n − 1)(pe t )2 (1 − p) + pe t .
µX = E [X ] = M 0 (0) = np.
σX2 = E [X 2 ] − µ2X = M 00 (0) − (np)2 =
np + n(n − 1)p 2 − (np)2 = np(1 − p).
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Định nghĩa
Ta nói X là biến ngẫu nhiên có phân phối hình học (geometric)
với tham số p ∈ (0; 1), ký hiệu X ∼ GEO(p), nếu X có hàm mật
độ xác suất là:
(
(1 − p)x−1 · p, nếu x ∈ {1, 2, . . .},
f (x) =
0, nếu x ∈
/ {1, 2, . . .}.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Ví dụ
Xét phép thử tung một đồng xu nhiều lần. Gọi X là số lần tung
cho đến khi có mặt ngửa đầu tiên xuất hiện. Chứng minh rằng
X ∼ GEO(0.5).

Giải: Với x ∈ {1, 2, . . .}, ta có P(X = x) = 0.5x , suy ra


f (x) = (1 − 0.5)x−1 · 0.5. Vậy X ∼ GEO(0.5).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Ví dụ
Một nhà máy sản xuất sản phẩm bằng máy tự động. Biết rằng xác
suất để máy tự động đó sản suất ra sản phẩm lỗi là 0.02. Mỗi sản
phẩm luôn được kiểm tra lỗi khi vừa được sản xuất ra. Gọi X là số
lượng sản phẩm được sản xuất ra cho đến khi có sản phẩm lỗi đầu
tiên được phát hiện. Xác suất P(X ≥ 100) là bao nhiêu?

Giải:
Ta có X ∼ GEO(0.02).

99
X
P(X ≥ 100) = 1 − P(X ≤ 99) = 1 − P(X = x)
x=1
99
X
=1− (1 − 0.02)x−1 · 0.02 ≈ 0.1353.
x=1

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Ví dụ
Một người chơi đánh bạc tại Monte Carlo. Trong mỗi lần chơi, anh
ta luôn đặt cược vào ô "Đỏ" cho đến khi anh ta thắng lần đầu.
9
Biết rằng xác suất để rơi vào ô "Đỏ" là . Gọi X là số lần đặt
19
cược của anh ta.
(a) Xác suất để anh ta thắng ở lần đặt cược thứ hai là bao nhiêu?
(b) Biết rằng anh ta chỉ có đủ tiền cho 5 lần đặt cược. Xác suất
để anh ta thắng trước khi hết tiền là bao nhiêu?

ĐS: (a) 0.2493. (b) 0.9596.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Giải: Ta có: X ∼ GEO(9/19).


(a) P(X = 2) = (1 − 9/19) · 9/19 ≈ 0.2493.
5
(1 − 9/19)x−1 · (9/19) ≈ 0.9596.
P
(b) P(X ≤ 5) =
x=1

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Định lý
Cho X ∼ GEO(p). Khi đó:
(a) X có hàm sinh moment là

p · et
M(t) = .
1 − (1 − p) · e t

(b) Giá trị trung bình và giá trị phương sai của X là
1 1−p
µX = , σX2 = .
p p2

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Chứng minh:
Hàm sinh moment của X :

X
tX
M(t) = E [e ]= e tx · (1 − p)x−1 · p
x=1

p X
= · [(1 − p)e t ]x
1−p
x=1
p (1 − p)e t pe t
= · t
= , với (1 − p)e t < 1.
1 − p 1 − (1 − p)e 1 − (1 − p)e t
1
µX = E [X ] = M 0 (0) = .
p
2−p
E [X 2 ] = M 00 (0) = .
p2
2−p 1 1−p
σX2 = E [X 2 ] − µ2X = 2
− 2 = .
p p p2
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Định nghĩa
Ta nói X là biến ngẫu nhiên có phân phối Poisson với tham số
λ > 0, ký hiệu X ∼ POI(λ), nếu X có hàm mật độ xác suất là:
 −λ x
e · λ , nếu x ∈ {0, 1, 2, . . .},
f (x) = x!
nếu x ∈
/ {0, 1, 2, . . .}.

0,

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Định lý
Cho X ∼ POI(λ). Khi đó:
(a) X có hàm sinh moment là
t −1)
M(t) = e λ(e .

(b) Giá trị trung bình và giá trị phương sai của X là

µX = λ, σX2 = λ.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Chứng minh:
Hàm sinh moment của X :

X e −λ · λx
M(t) = E [e tX ] = e tx ·
x!
x=0

X (λe t )x
= e −λ ·
x!
x=0
λe t t −1)
= e −λ · e = e λ(e .

µX = E [X ] = M 0 (0) = λ.
E [X 2 ] = M 00 (0) = λ2 + λ.
σX2 = E [X 2 ] − µ2X = λ2 + λ − λ2 = λ.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phân phối Bernoulli
Một số biến ngẫu nhiên rời rạc đặc biệt
Phân phối nhị thức
Một số biến ngẫu nhiên liên tục đặc biệt
Phân phối hình học
Một số phân phối thường gặp trong thống kê
Phân phối Poisson

Ví dụ
Số lượng tai nạn giao thông trong một tuần ở một thị trấn nhỏ là
biến ngẫu nhiên Poisson với trung bình bằng 3. Xác suất xảy ra
đúng 2 tai nạn giao thông trong 2 tuần là bao nhiêu?

Giải:
Gọi X là số tai nạn giao thông trong 2 tuần.
Ta có X ∼ POI(6), vì số tai nạn giao thông trung bình trong
2 tuần là λ = 2 · 3 = 6.
e −6 · 62
P(X = 2) = ≈ 0.0446.
2!

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Định nghĩa
Ta nói X là biến ngẫu nhiên có phân phối đều (uniform) trên
[a, b], ký hiệu X ∼ UNIF(a, b), nếu X có hàm mật độ xác suất là:

 1 , nếu x ∈ [a, b],


f (x) = b − a
0, nếu x ∈
/ [a, b].

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Định lý
Cho X ∼ UNIF(a, b). Khi đó, giá trị trung bình và giá trị phương
sai của X là
a+b (b − a)2
µX = , σX2 = .
2 12

Chứng minh:
b Z
1 a+b
µX = E [X ] = x· dx = .
a b−a 2
Z b
2 1 a2 + ab + b 2
E [X ] = x2 · dx = .
a b−a 3
a2 + ab + b 2 (a + b)2 (b − a)2
σX2 = E [X 2 ] − µ2X = − = .
3 4 12

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Định nghĩa
Ta nói X là biến ngẫu nhiên có phân phối chuẩn (normal) với
các tham số µ và σ 2 , trong đó σ > 0, ký hiệu X ∼ N (µ, σ 2 ), nếu
X có hàm mật độ xác suất là:

1 (x−µ)2
f (x) = √ · e − 2σ2 , x ∈ R.
σ 2π

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Định nghĩa
Phân phối N (0, 1) còn được gọi là phân phối chuẩn chính tắc
(standard normal).

Hàm mật độ xác suất của của X ∼ N (0, 1) là:


1 x2
f (x) = √ · e − 2 , x ∈ R.

Ký hiệu Φ là hàm phân phối của X ∼ N (0, 1), tức là


Z x Z x
1 2
Φ(x) = f (y )dy = √ e −y /2 dy , x ∈ R.
−∞ −∞ 2π

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Bảng phụ lục A1 liệt kê một số giá trị của Φ(x).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Ví dụ
Cho X ∼ N (0, 1). Bằng cách sử dụng bảng phân phối chuẩn chính
tắc A1, hãy suy ra xác suất P(X ≤ −1.72).

Giải:

P(X ≤ −1.72) = P(X ≥ 1.72) (do tính đối xứng của hàm mật độ)
= P(X > 1.72)
= 1 − P(X ≤ 1.72)
= 1 − Φ(1.72)
= 1 − 0.9573 (đọc từ bảng A1)
= 0.0427.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Ví dụ
Cho X ∼ N (0, 1). Bằng cách sử dụng bảng phân phối chuẩn chính
tắc A1, hãy tìm hằng số c sao cho P(|X | ≤ c) = 0.95.

Giải:
Do tính đối xứng của hàm mật độ nên ta có:

1 − P(|X | ≤ c) 1 − 0.95
P(X < −c) = P(X > c) = = = 0.025.
2 2
Do đó: P(X ≤ c) = 1 − P(X > c) = 1 − 0.025 = 0.975.
Tra bảng A1, ta tìm được c = 1.96.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Định lý
X −µ
Cho X ∼ N (µ, σ 2 ). Đặt Z = . Khi đó: Z ∼ N (0, 1).
σ
Chứng minh: Gọi FZ và fZ lần lượt là hàm phân phối và hàm mật
độ xác suất của Z . Ta có:

FZ (z) = P(Z ≤ z) = P((X − µ)/σ ≤ z) = P(X ≤ σz + µ)


Z σz+µ (y −µ)2
1
= √ · e − 2σ2 dy
σ 2π
Z−∞
z
1 u2 y −µ
= √ · e − 2 du (đặt u = ).
−∞ 2π σ

1 z2
Suy ra: fZ (z) = FZ0 (z) = √ · e − 2 . Vậy Z ∼ N (0, 1).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Ví dụ
Cho X ∼ N (3, 16). Bằng cách sử dụng bảng phân phối chuẩn A1,
hãy suy ra xác suất P(4 ≤ X ≤ 8).
X −3
Giải: Đặt Z = . Ta có: Z ∼ N (0, 1).
4
P(4 ≤ X ≤ 8) = P((4 − 3)/4 ≤ (X − 3)/4 ≤ ((8 − 3)/4)
= P(0.25 ≤ Z ≤ 1.25)
= P(0.25 < Z ≤ 1.25)
= P(Z ≤ 1.25) − P(Z ≤ 0.25)
= Φ(1.25) − Φ(0.25)
= 0.8944 − 0.5987
= 0.2957.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Định lý
Cho X ∼ N (0, 1). Khi đó:
(a) X có hàm sinh moment là
t2
M(t) = e 2 .

(b) Giá trị trung bình và giá trị phương sai của X là

µX = 0, σX2 = 1.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Chứng minh:
∞ Z
1 x2
M(t) = E [e ] = tX
e tx · √ · e − 2 dx
−∞ 2π
Z ∞
1 1 2
= √ · e − 2 (x −2tx) dx
−∞ 2π
Z ∞
1 1 2 t2
= √ · e − 2 (x−t) · e 2 dx
−∞ 2π
Z ∞
t2 1 1 2
=e2 · √ · e − 2 (x−t) dx

Z−∞

t2 1 y2
=e2 · √ · e − 2 dy (đổi biến y = x − t)

Z−∞

t2 t2
=e2 · f (y )dy = e 2 .
−∞

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Định lý
Cho X ∼ N (µ, σ 2 ). Khi đó:
(a) X có hàm sinh moment là
1 2t2
M(t) = e µt+ 2 σ .

(b) Giá trị trung bình và giá trị phương sai của X là

µX = µ, σX2 = σ 2 .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Chứng minh:
X −µ
Đặt Z = .
σ
Ta có: Z ∼ N (0, 1) và X = µ + σZ .
Do đó:
MX (t) = E [e tX ]
= E [e t(µ+σZ ) ]
= e µt · E [e t(σZ ) ]
= e µt · MZ (σt)
1 2t2
= e µt · e 2 σ
1 2t2
= e µt+ 2 σ

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối đều
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối chuẩn
Một số phân phối thường gặp trong thống kê Phân phối chuẩn chính tắc

Định lý
Cho X1 ∼ N (µ1 , σ12 ), X2 ∼ N (µ2 , σ22 ) là hai biến ngẫu nhiên độc
lập và a1 , a2 là hai hằng số thực bất kỳ. Khi đó:

a1 X1 + a2 X2 ∼ N (a1 µ1 + a2 µ2 , a12 σ12 + a22 σ22 ).

Chứng minh:
Ma1 X1 +a2 X2 (t) = MX1 (a1 t) · MX2 (a2 t)
1 2 2 2 1 2 2 2
= e µ1 a1 t+ 2 σ1 a1 t · e µ2 a2 t+ 2 σ2 a2 t
1 2 2 2 2 2
= e (a1 µ1 +a2 µ2 )t+ 2 (a1 σ1 +a2 σ2 )t
= hàm sinh moment của N (a1 µ1 + a2 µ2 , a12 σ12 + a22 σ22 ).

Vậy a1 X1 + a2 X2 ∼ N (a1 µ1 + a2 µ2 , a12 σ12 + a22 σ22 ).


TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Hàm Gamma

Hàm Gamma là một sự tổng quát của khái niệm giai thừa.

Định nghĩa
Hàm số Γ : (0; +∞) → R định bởi
Z ∞
Γ(z) = x z−1 · e −x dx, z > 0,
0

được gọi là hàm Gamma.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Hàm Gamma

Bổ đề
Ta có các khẳng định sau:
(a) Γ(1) = 1.
(b) Γ(z + 1) = z · Γ(z), với mọi z > 0.
1 √
(c) Γ = π.
2
Chứng minh:
Z ∞ Z ∞
Γ(z + 1) = x z · e −x dx = x z · d(−e −x )
0 0
x→∞ Z ∞
z −x
= −x e + z · x z−1 · e −x dx = z · Γ(z)
x→0 0

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Định nghĩa
Ta nói X là biến ngẫu nhiên có phân phối Chi-bình phương
(Chi-square) với tham số n > 0, ký hiệu X ∼ χ2n , nếu X có hàm
mật độ xác suất là:

n/2−1 · e −x/2
x

, nếu x > 0,
f (x) = Γ(n/2) · 2n/2

0, nếu x ≤ 0.

Tham số n > 0 được gọi là độ tự do (degree of freedom).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Định lý
Cho X ∼ N (0, 1). Khi đó: X 2 ∼ χ21 .

Chứng minh: Đặt Y = X 2 . Gọi FY và fY lần lượt là hàm phân


phối và hàm mật độ xác suất của Y .
Với y ≤ 0 thì FY (y ) = P(Y ≤ y ) = 0, do đó fY (y ) = 0.
Với y > 0, ta có
√ √
FY (y ) = P(Y ≤ y ) = P(− y ≤ X ≤ y )

= 1 − 2P(X > y )

= 2Φ( y ) − 1.
Do đó:
√ 1 1
fY (y ) = FY0 (y ) = 2Φ0 ( y ) · √ = y −1/2 · √ · e −y /2 .
2 y 2π
Vậy Y ∼ χ21 .
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Định lý
Cho X ∼ χ2n . Khi đó:
(a) X có hàm sinh moment là
 1 n/2
M(t) = .
1 − 2t

(b) Giá trị trung bình và giá trị phương sai của X là

µX = n, σX2 = 2n.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Chứng minh:

x n/2−1 · e −x/2
Z
M(t) = E [e tX ] = e tx · dx
0 Γ(n/2) · 2n/2
Z ∞
1 1
= · x n/2−1 · e − 2 (1−2t)x dx
Γ(n/2) · 2n/2
Z0 ∞ 
1 2y n/2−1 −y 2
= · ·e · dy
Γ(n/2) · 2n/2 0 1 − 2t 1 − 2t
1
(đặt y = (1 − 2t)x, với 1 − 2t > 0)
2
1  2 n/2 Z ∞
= · · y n/2−1 · e −y dy
Γ(n/2) · 2n/2 1 − 2t 0
 1 n/2
= .
1 − 2t

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Định lý
Cho X ∼ χ2n và Y ∼ χ2m là hai biến ngẫu nhiên độc lập. Khi đó:

X + Y ∼ χ2n+m .

Chứng minh:
MX +Y (t) = MX (t) · MY (t)
 1 n/2  1 m/2
= ·
1 − 2t 1 − 2t
 1 (n+m)/2
=
1 − 2t
= hàm sinh moment của phân phối χ2n+m .
Vậy X + Y ∼ χ2n+m .
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Cho X ∼ χ2n .
Với mỗi α ∈ (0; 1), ta ký hiệu χ2α,n là vị trí thỏa mãn
P(X ≥ χ2α,n ) = α.

Bảng A2 liệt kê một số giá trị của χ2α,n .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Ví dụ
Cho X ∼ χ25 . Bằng cách sử dụng bảng A2, hãy suy ra xác suất
P(1.1455 ≤ X ≤ 12.8325).

Giải:
P(1.1455 ≤ X ≤ 12.8325) = P(1.1455 ≤ X < 12.8325)
= P(X ≥ 1.1455) − P(X ≥ 12.8325)
= 0.95 − 0.025
= 0.925.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Định nghĩa
Ta nói X là biến ngẫu nhiên có phân phối Student với tham số
n > 0, ký hiệu X ∼ tn , nếu X có hàm mật độ xác suất là:

Γ( n+1
2 )
f (x) = , x ∈ R.
√ n
 x 2  n+1
2
nπ · Γ( 2 ) · 1 +
n

Tham số n > 0 được gọi là độ tự do (degree of freedom).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Định lý
Cho Z ∼ N (0, 1) và X ∼ χ2n là hai biến ngẫu nhiên độc lập. Khi
đó:
Z
p ∼ tn .
X /n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Định lý
Cho X ∼ tn . Giá trị trung bình và giá trị phương sai của X là:

µX = 0, n > 1,
n
σX2 = , n > 2.
n−2

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Cho X ∼ tn .
Với mỗi α ∈ (0; 1), ta ký hiệu tα,n là vị trí thỏa mãn:
P(X ≥ tα,n ) = α.

Bảng A3 liệt kê một số giá trị của tα,n .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Ví dụ
Sử dụng bảng A3, hãy tính
(a) t0.025,9 .
(b) P(X ≤ 1.3562), với X ∼ t12 .

ĐS. (a) 2.2622. (b) P(X ≤ 1.3562) = 1 − 0.1 = 0.9.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Định nghĩa
Ta nói X là biến ngẫu nhiên có phân phối Fisher với các tham số
n, m > 0, ký hiệu X ∼ Fn,m , nếu X có hàm mật độ xác suất là:
  n n n
2

 Γ( m+n
2 )· · x 2 −1
 m nếu x > 0,
 m+n ,


f (x) = Γ( m ) · Γ( n ) · 1 + n x 2


 2 2 m


0, nếu x ≤ 0.

Tham số n, m > 0 được gọi là độ tự do (degree of freedom).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Định lý
Cho X ∼ χ2n và Y ∼ χ2m là hai biến ngẫu nhiên độc lập. Khi đó:

X /n
∼ Fn,m .
Y /m

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Định lý
Cho X ∼ Fn,m . Khi đó:
1
∼ Fm,n .
X

Chứng minh: Đặt Y = 1/X . Gọi FY và fY lần lượt là hàm phân


phối và hàm mật độ xác suất của Y .
Nếu y ≤ 0 thì FY (y ) = P(Y ≤ y ) = 0, do đó fY (y ) = 0.
Với y > 0, ta có:

FY (y ) = P(Y ≤ y ) = P(1/X ≤ y )
= P(X ≥ 1/y ) = 1 − P(X ≤ 1/y ) (xét y > 0)
= 1 − FX (1/y ).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Do đó:
d
fY (y ) = FY (y )
dy
= −fX (1/y ) · (−1/y 2 )
 n n n
2
Γ( m+n2 ) · · (1/y ) 2 −1 1
= m · 2
m n
 n 1  m+n2 y
Γ( 2 ) · Γ( 2 ) · 1 +
my
mm m
2
Γ( m+n2 )· n · y 2 −1
=  m  m+n 2
Γ( m2 ) · Γ( n2 ) · 1 + y
n
Vậy Y ∼ Fm,n .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Định lý
Cho X ∼ Fn,m . Giá trị trung bình và giá trị phương sai của X là:
m
µX = , m > 2,
m−2
2m2 (n + m − 2)
σX2 = , m > 4.
n(m − 2)2 (m − 4)

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Cho X ∼ Fn,m .
Với mỗi α ∈ (0; 1), ta ký hiệu Fα,n,m là vị trí thỏa mãn:
P(X ≥ Fα,n,m ) = α.
Bảng A4 liệt kê một số giá trị của Fα,n,m ứng với α = 0.05.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Một số biến ngẫu nhiên rời rạc đặc biệt Phân phối Chi-bình phương
Một số biến ngẫu nhiên liên tục đặc biệt Phân phối Student
Một số phân phối thường gặp trong thống kê Phân phối Fisher

Ví dụ
Sử dụng bảng A4, hãy tính
(a) P(X ≥ 6.2561), với X ∼ F5,4 .
(b) F0.95,4,5 .

Giải:
(a) P(X ≥ 6.2561) = 0.05.
(b) Xét X ∼ F4,5 . Ta có P(X ≥ F0.95,4,5 ) = 0.95, do đó
P(X ≤ F0.95,4,5 ) = 0.05, hay

P(1/X ≥ 1/F0.95,4,5 ) = 0.05.

Vì 1/X ∼ F5,4 nên ta suy ra 1/F0.95,4,5 = F0.05,5,4 , hay

F0.95,4,5 = 1/F0.05,5,4 = 1/6.2561 ≈ 0.1598.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Phân phối của các đặc trưng


mẫu

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

1 Mẫu ngẫu nhiên


Tổng thể
Dữ liệu mẫu
Mẫu ngẫu nhiên

2 Phân phối của các đặc trưng mẫu

3 Định lý giới hạn trung tâm

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên Tổng thể
Phân phối của các đặc trưng mẫu Dữ liệu mẫu
Định lý giới hạn trung tâm Mẫu ngẫu nhiên

Trong thống kê toán, ta hiểu tổng thể (population) thông


qua sự mô tả.
Ví dụ: Tổng thể các sản phẩm làm được sau một ca làm việc.
Với một tổng thể Ω, ta xác định một biến ngẫu nhiên X trên
Ω thể hiện đặc tính định lượng của tổng thể đó. Ta nói:
"tổng thể Ω có đặc tính X ".
Ví dụ: Với tổng thể các sản phẩm làm được sau một ca làm
việc, ta xác định X là đại lượng chỉ độ bền (tính bằng đơn vị
thời gian) của từng sản phẩm.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên Tổng thể
Phân phối của các đặc trưng mẫu Dữ liệu mẫu
Định lý giới hạn trung tâm Mẫu ngẫu nhiên

Xét tổng thể Ω có đặc tính X .


Tiến hành chọn ngẫu nhiên n cá thể của Ω, ta được kết quả:

(ω1 , ω2 , . . . , ωn ).

Ta gọi n giá trị

(x1 , x2 , . . . , xn ) = (X (ω1 ), X (ω2 ), . . . , X (ωn ))

là dữ liệu mẫu (sample data) của đặc tính X .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên Tổng thể
Phân phối của các đặc trưng mẫu Dữ liệu mẫu
Định lý giới hạn trung tâm Mẫu ngẫu nhiên

Xét tổng thể Ω có đặc tính X .


Tiến hành n quan sát độc lập về biến ngẫu nhiên X .
Gọi Xi là giá trị của X ở lần quan sát thứ i.
Khi đó X1 , . . . , Xn là các biến ngẫu nhiên độc lập và có cùng
phân phối với X .
Ta gọi vectơ ngẫu nhiên (X1 , . . . , Xn ) là mẫu ngẫu nhiên
(random sample) kích thước n của X .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Định nghĩa
Cho (X1 , . . . , Xn ) là một mẫu ngẫu nhiên từ một tổng thể có đặc
tính X . Thống kê X , định bởi
X1 + · · · + Xn
X =
n

được gọi là trung bình mẫu (sample mean).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Định nghĩa
Giả sử (X1 , . . . , Xn ) là một mẫu ngẫu nhiên từ một tổng thể có
đặc tính X . Gọi X là trung bình mẫu.
(a) Thống kê S 2 , định bởi

(X1 − X )2 + · · · + (Xn − X )2
S2 = ,
n−1

được gọi là phương sai mẫu (sample variance).



(b) Thống kê S = S 2 được gọi là độ lệch chuẩn mẫu (sample
standard deviation).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Định lý
Cho (X1 , . . . , Xn ) là một mẫu ngẫu nhiên từ một tổng thể có đặc
tính X . Giả sử X có trung bình µ và phương sai σ 2 . Khi đó:
h i
(a) E X = µ.
σ2
(b) Var(X ) = .
n
(c) E [S 2 ] = σ 2 .

Chứng minh (a), (b):


h i hX + . . . X i 1
1 n
E X =E = (E [X1 ] + . . . + E [Xn ]) = µ.
n n
  X + · · · + X  1  σ2
1 n
Var X = Var = 2 Var(X1 )+· · ·+Var(Xn ) = .
n n n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Chứng minh (c):


2
Ta có: (n − 1)S 2 = X12 + · · · + Xn2 − nX .
Sử dụng kết quả E [W 2 ] = Var(W ) + (E [W ])2 , ta thu được
h i h i
2
(n − 1)E [S 2 ] = E X12 + · · · + Xn2 − nE X
= n(σ 2 + µ2 ) − n(σ 2 /n + µ2 )
= (n − 1)σ 2 ,

hay E [S 2 ] = σ 2 .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Định lý
Cho (X1 , . . . , Xn ) là một mẫu ngẫu nhiên từ một tổng thể có đặc
tính X ∼ N (µ, σ 2 ). Khi đó:

X ∼ N (µ, σ 2 /n).

Chứng minh:

MX (t) = E [e tX ]
= E [e tX1 /n ] · · · E [e tXn /n ]
= MX1 (t/n) · · · MXn (t/n)
1 2 (t/n)2 1 2 (t/n)2
= e µt/n+ 2 σ · · · e µt/n+ 2 σ
1 2 t 2 /n
= e µt+ 2 σ = hàm sinh moment của phân phối N (µ, σ 2 /n).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Định lý
Cho (X1 , . . . , Xn ) là một mẫu ngẫu nhiên từ một tổng thể có đặc
tính X ∼ N (µ, σ 2 ). Khi đó:

(n − 1)S 2
∼ χ2n−1 .
σ2

Chứng minh:
n n
(Xi − µ)2 = (Xi − X )2 + n(X − µ)2 .
P P
Ta có:
i=1 i=1
n 
X Xi − µ 2 (n − 1)S 2  X − µ 2
Suy ra = + √ .
σ σ2 σ/ n
i=1

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Định lý giới hạn trung tâm là một trong các kết quả đáng chú ý
nhất của Lý thuyết Xác suất.

Định lý (Central limit theorem)


Cho (X1 , . . . , Xn ) là một mẫu ngẫu nhiên từ một tổng thể có đặc
tính X . Giả sử X có trung bình µ và phương sai σ 2 . Khi đó, với n
đủ lớn, phân phối của X1 + · · · + Xn xấp xỉ phân phối N (nµ, nσ 2 ).

Tức là, với n đủ lớn, ta có


 X + · · · + X − nµ 
1
P √ n ≤ x ≈ P(Z ≤ x),
σ n

trong đó Z ∼ N (0, 1).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Chứng minh:
Đặt Yi = Xi − µ và gọi MY là hàm sinh moment chung của
các Yi .
Với h → 0, ta có
1
MY (h) = MY (0) + MY0 (0)h + MY00 (0)h2 + o(h2 )
2
1
= 1 + E [Y ]h + E [Y ]h + o(h2 )
2 2
2
1 2
= 1 + 0h + (σ + 02 )h2 + o(h2 )
2
1 2 2
= 1 + σ h + o(h2 ).
2

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Chứng minh:
Với mỗi n ∈ N, gọi Mn là hàm sinh moment của
X1 + · · · + Xn − nµ
√ . Ta có:
σ n
h X1 +···+X −nµ i
t √n
Mn (t) = E e σ n

h Y√1
t σY√nn
i
tσ n
=E e ···e
h  t in
= MY √
σ n
h t2  t 2 in
= 1+ +o khi n → ∞
2n nσ 2
2
→ e t /2 = hàm sinh moment của N (0, 1) khi n → ∞.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Ví dụ
Một công ty bảo hiểm có 25000 hợp đồng bảo hiểm ô tô. Nếu số
tiền bồi thường mỗi năm của một hợp đồng là một biến ngẫu nhiên
với trung bình là 320 và độ lệch chuẩn là 540, thì xác suất để tổng
số tiền bồi thường hằng năm vượt quá 8.3 triệu xấp xỉ bao nhiêu?

ĐS: xấp xỉ 0.00023

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Giải:
Đặt Xi là số tiền bồi thường hằng năm của hợp đồng bảo
hiểm ô tô thứ i.
Đặt X là tổng số tiền bồi thường hằng năm.
Ta có: X = X1 + · · · + Xn , với n = 25000.
X − nµ
Theo định lý giới hạn trung tâm, phân phối của √ xấp
σ n
xỉ phân phối của N (0, 1) nếu n đủ lớn.
Do đó:
 X − nµ 8.3 · 106 − nµ 
P(X > 8.3 · 106 ) = P √ > √
σ n σ n
≈ P(Z > 3.51)
= 1 − Φ(3.51) ≈ 0.00023.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Ví dụ
Trường đại học A biết rằng (bằng kinh nghiệm trong quá khứ), có
khoảng 30% khả năng đăng ký nhập học đối với một sinh viên đã
được chấp nhận đơn. Biết rằng năm nay trường A có 450 sinh viên
được chấp nhận đơn. Xác suất để có hơn 150 sinh viên đăng ký
nhập học?

ĐS: xấp xỉ 0.06.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Giải:
Gọi X là số sinh viên đăng ký nhập học.
Ta có X = X1 + · · · + Xn , với n = 450, trong đó Xi = 1 nếu
sinh viên thứ i đăng ký nhập học và Xi = 0 nếu ngược lại.
Mỗi Xi đều có µ = p và σ 2 = p(1 − p).
Theo định lý giới hạn trung tâm, phân phối của
X − nµ X − np
√ =p xấp xỉ phân phối của N (0, 1) nếu n
σ n np(1 − p)
đủ lớn.
Do đó:
 X − np 150 − np 
P(X > 150) = P p >p
np(1 − p) np(1 − p)
≈ P(Z > 1.54)
= 1 − Φ(1.54) ≈ 0.06.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Ví dụ
Cân nặng của một tổng thể công nhân có trung bình bằng 167 và
độ lệch chuẩn là 27.
(a) Nếu chọn một mẫu 36 công nhân, thì xác suất để trung bình
mẫu nằm giữa 164 và 170 xấp xỉ bao nhiêu?
(b) Làm lại câu (a) nếu cỡ mẫu bằng 144.

ĐS: (a) 0.5619. (b) 0.8707.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Giải:
Gọi Xi là cân nặng của công nhân thứ i.
Theo giả thiết, mỗi Xi đều có trung bình µ = 167 và độ lệch
chuẩn σ = 27.
Theo định lý giới hạn trung tâm, phân phối của
X1 + · · · + Xn − nµ X −µ
√ = √ xấp xỉ phân phối của N (0, 1)
σ n σ/ n
nếu n đủ lớn.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

(a) Với n = 36, ta có:


 163 − µ X −µ 170 − µ 
P(164 < X < 170) = P √ < √ < √
σ/ n σ/ n σ/ n
≈ P(−0.89 < Z < 0.67)
= Φ(0.67) − Φ(−0.89)
= Φ(0.67) − [1 − Φ(0.89)]
= 0.7486 − (1 − 0.8133) = 0.5619.

(b) Với n = 144, ta có:

P(164 < X < 170) ≈ P(−1.78 < Z < 1.33)


= Φ(1.33) − Φ(−1.78)
= Φ(1.33) − [1 − Φ(1.78)]
= 0.9082 − (1 − 0.9625) = 0.8707.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Ví dụ
Một nhà thiên văn học muốn đo khoảng cách từ đài quan sát của
ông ta đến một vì sao xa xôi. Tuy nhiên, do các nhiễu loạn trong
khí quyển, bất kỳ phép đo nào cũng không thể cho ra khoảng cách
chính xác d. Hệ quả là nhà thiên văn học phải thực hiện một loạt
các phép đo rồi sử dụng giá trị trung bình để ước lượng khoảng
cách d. Nếu nhà thiên văn học cho rằng các giá trị của các phép
đo liên tiếp là các biến ngẫu nhiên độc lập có trung bình là d năm
ánh sáng và độ lệch chuẩn là 2 năm ánh sáng, thì ông ta phải thực
hiện bao nhiêu lần đo để chắc chắn ít nhất 95% rằng ước lượng
của ông ta có độ chính xác 0.5 năm ánh sáng?

ĐS: n ≥ 62.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Mẫu ngẫu nhiên
Phân phối của các đặc trưng mẫu
Định lý giới hạn trung tâm

Giải:
Gọi Xi là giá trị của các phép đo thứ i.
Theo giả thiết, mỗi Xi đều có trung bình µ = d và độ lệch
chuẩn σ = 2.
Theo định lý giới hạn trung tâm, phân phối của
X1 + · · · + Xn − nµ X −µ
√ = √ xấp xỉ phân phối của N (0, 1)
σ n σ/ n
nếu n đủ lớn.
Do đó:
 |X − µ| 0.5  √
P(|X −d| ≤ 0.5) = P √ ≤ √ ≈ P(|Z | ≤ 0.25 n)
σ/ n σ/ n
Ta có:
√ √
P(|Z | ≤ 0.25 n) ≥ 0.95 ⇔ 2Φ(0.25 n) − 1 ≥ 0.95

⇔ Φ(0.25 n) ≥ 0.975

⇔ 0.25 n ≥ 1.96 ⇔ n ≥ 62.
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Ước lượng tham số

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

1 Ước lượng bằng phương pháp hợp lý cực đại


Ước lượng tham số Bernoulli
Ước lượng tham số Poisson
Ước lượng các tham số của tổng thể có phân phối chuẩn
2 Khoảng ước lượng cho tham số của tổng thể có phân phối
chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai
đã biết
Khoảng tin cậy cho trung bình trong trường hợp phương sai
chưa biết
Khoảng tin cậy cho phương sai
3 Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Trường hợp đã biết các phương sai
Trường hợp phương sai bằng nhau và chưa biết
4 Khoảng ước lượng cho tham số Bernoulli
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Đặt vấn đề

Cho (X1 , . . . , Xn ) là một mẫu ngẫu nhiên từ một tổng thể có


đặc tính X ∼ f (x, θ), trong đó θ là tham số chưa biết cần xác
định.
Ví dụ: một mẫu ngẫu nhiên từ một tổng thể phân phối
Poisson trong đó giá trị trung bình chưa biết; hoặc một mẫu
ngẫu nhiên từ một tổng thể phân phối chuẩn có trung bình và
phương sai chưa biết.
Trong lý thuyết xác suất, ta thường giả sử rằng các tham số
của một phân phối là đã biết.
Ngược lại, trong thống kê, các tham số của một phân phối
thường chưa biết, vấn đề trọng tâm là quan sát các dữ liệu
mẫu để suy ra các tham số chưa biết.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Ước lượng tham số Bernoulli
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng tham số Poisson
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Ước lượng các tham số của tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Một thống kê được dùng để ước lượng cho giá trị của tham
số chưa biết θ được gọi là một ước lượng (estimator) của θ.
Ví dụ: Để ước lượng cho trung bình của một tổng thể chuẩn
dựa trên mẫu ngẫu nhiên (X1 , . . . , Xn ), ta thường sử dụng
X1 + · · · + Xn
trung bình mẫu X = .
n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Ước lượng tham số Bernoulli
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng tham số Poisson
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Ước lượng các tham số của tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Xét một tổng thể có đặc tính X ∼ f (x, θ), trong đó θ là tham
số chưa biết cần xác định.
Xét một mẫu ngẫu nhiên (X1 , . . . , Xn ) từ tổng thể trên và gọi
f (x1 , . . . , xn |θ) là hàm mật độ xác suất đồng thời của vectơ
ngẫu nhiên (X1 , . . . , Xn ).
Bởi vì θ được giả sử là chưa biết, nên ta cũng xem f là hàm
theo θ. Hàm f (x1 , . . . , xn |θ) thường được gọi là hàm hợp lý
(likelihood) của θ.
Vì f (x1 , . . . , xn |θ) biểu thị khả năng xảy ra biến cố
(X1 = x1 , . . . , Xn = xn ) khi θ là giá trị đúng của tham số, nên
một ước lượng hợp lý của θ sẽ là giá trị θb mà tại đó hàm
f (x1 , . . . , xn |θ) đạt giá trị lớn nhất.
Phương pháp như trên được gọi là ước lượng hợp lý cực đại
(maximum likelihood estimator).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Ước lượng tham số Bernoulli
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng tham số Poisson
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Ước lượng các tham số của tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Giả sử ta có một tổng thể có phân phối BER(p), trong đó p


là tham số chưa biết. Ta cần ước lượng p.
Xét một mẫu ngẫu nhiên (X1 , . . . , Xn ) từ tổng thể trên. Hàm
hợp lý của tham số p định bởi:

f (x1 , . . . , xn |p) = P{X1 = x1 , . . . , Xn = xn |p}


= p x1 (1 − p)1−x1 · · · p xn (1 − p)1−xn
= p x1 +···+xn (1 − p)n−(x1 +···+xn ) .

Để tìm p sao cho f (x1 , . . . , xn |p) đạt giá trị lớn nhất, trước
hết ta lấy logarit tự nhiên của nó:
h i
ln f (x1 , . . . , xn |p) = (x1 +· · ·+xn ) ln p+ n−(x1 +· · ·+xn ) ln(1−p).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Ước lượng tham số Bernoulli
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng tham số Poisson
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Ước lượng các tham số của tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Lấy đạo hàm theo biến p:

d x1 + · · · + xn n − (x1 + · · · + xn )
ln f (x1 , . . . , xn |p) = − .
dp p 1−p

Cho đạo hàm trên bằng không và giải phương trình, ta được:
x1 + · · · + xn
p= .
n

Vậy ước lượng hợp lý cực đại cho tham số p chính là thống kê
X1 + · · · + Xn
pb = X = .
n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Ước lượng tham số Bernoulli
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng tham số Poisson
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Ước lượng các tham số của tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Giả sử ta có một tổng thể có phân phối POI(λ), trong đó λ là


tham số chưa biết. Ta cần ước lượng λ.
Xét một mẫu ngẫu nhiên (X1 , . . . , Xn ) từ tổng thể trên. Hàm
hợp lý của tham số λ định bởi:

e −λ · λx1 e −λ · λxn
f (x1 , . . . , xn |λ) = ···
x1 ! xn !
e −nλ ·λ x1 +···+x n
= .
x1 ! · · · xn !

Lấy logarit tự nhiên của nó:

ln f (x1 , . . . , xn |λ) = −nλ + (x1 + · · · + xn ) · ln λ − ln(x1 ! · · · xn !).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Ước lượng tham số Bernoulli
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng tham số Poisson
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Ước lượng các tham số của tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Lấy đạo hàm theo biến λ:


d x1 + · · · + xn
ln f (x1 , . . . , xn |λ) = −n + .
dλ λ

Cho đạo hàm trên bằng không và giải phương trình, ta được:
x1 + · · · + xn
λ= .
n

Vậy ước lượng hợp lý cực đại cho tham số λ chính là thống kê
X1 + · · · + Xn
X = .
n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Ước lượng tham số Bernoulli
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng tham số Poisson
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Ước lượng các tham số của tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Giả sử ta có một tổng thể có phân phối chuẩn N (µ, σ 2 ),


trong đó µ và σ > 0 là các tham số chưa biết. Ta cần ước
lượng µ và σ.
Xét một mẫu ngẫu nhiên (X1 , . . . , Xn ) từ tổng thể trên. Hàm
hợp lý của 2 tham số µ và σ định bởi:
1 (x1 −µ)2 1 (xn −µ)2
f (x1 , . . . , xn |µ, σ) = √ e − 2σ2 · · · √ e − 2σ2
2πσ 2πσ
 1 n (x1 −µ)2 +...+(xn −µ)2
= √ · e− 2σ 2 .
2πσ

Lấy logarit tự nhiên của nó:


ln f (x1 , . . . , xn |µ, σ)
√ (x1 − µ)2 + · · · + (xn − µ)2
= −n(ln 2π + ln σ) − .
2σ 2
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Ước lượng tham số Bernoulli
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng tham số Poisson
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Ước lượng các tham số của tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Tính các đạo hàm riêng theo µ và σ, ta được


∂ (x1 − µ) + · · · + (xn − µ)
ln f (x1 , . . . , xn |µ, σ) = ,
∂µ σ2
∂ n (x1 − µ)2 + · · · + (xn − µ)2
ln f (x1 , . . . , xn |µ, σ) = − + .
∂σ σ σ3
Cho các đạo hàm riêng trên bằng không và giải hệ phương
trình, ta tìm được
r
x1 + · · · + xn (x1 − µ)2 + · · · + (xn − µ)2
µ= , σ= .
n n
Vậy ước lượng hợp lý cực đại của µ và σ lần lượt là các thống

s
X1 + · · · + Xn (X1 − X )2 + · · · + (Xn − X )2
µ
b=X = , σ
b= .
n n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng tin cậy cho trung bình trong trường hợp phương sai đã biết
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai chưa biế
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng tin cậy cho phương sai
Khoảng ước lượng cho tham số Bernoulli

Đặt vấn đề

Giả sử ta có một tổng thể có phân phối chuẩn N (µ, σ 2 ),


trong đó µ và σ > 0 là các tham số chưa biết.
X1 + . . . Xn
Ta đã chứng minh rằng X = là ước lượng hợp lý
n
cực đại của tham số µ. Tuy nhiên, ta không mong đợi X sẽ
bằng µ một cách chính xác, mà chỉ mong rằng nó sẽ "gần
bằng" theo một nghĩa nào đó.

Định nghĩa
Ta gọi (L; U) là khoảng tin cậy γ (γ confidence interval) cho
tham số θ nếu
P(L < θ < U) = γ.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng tin cậy cho trung bình trong trường hợp phương sai đã biết
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai chưa biế
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng tin cậy cho phương sai
Khoảng ước lượng cho tham số Bernoulli

Giả sử ta có một tổng thể có phân phối chuẩn N (µ, σ 2 ),


trong đó chỉ có µ là tham số chưa biết. Ta cần chỉ ra khoảng
tin cậy (1 − α) cho tham số µ.
Xét một mẫu ngẫu nhiên (X1 , . . . , Xn ) từ tổng thể trên.
X −µ
Ta đã biết X ∼ N (µ, σ 2 /n). Do đó: Z = √ ∼ N (0, 1).
σ/ n
Với mỗi α ∈ (0; 1), ta ký hiệu zα là vị trí thỏa mãn
P(Z > zα ) = α.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng tin cậy cho trung bình trong trường hợp phương sai đã biết
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai chưa biế
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng tin cậy cho phương sai
Khoảng ước lượng cho tham số Bernoulli

Ta có: P(−zα/2 < Z < zα/2 ) = 1 − α, do đó


 X −µ 
P − zα/2 < √ < zα/2 = 1 − α.
σ/ n

Do đó, khoảng tin cậy (1 − α) cho tham số µ là:


σ
µ = x ± zα/2 · √ .
n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng tin cậy cho trung bình trong trường hợp phương sai đã biết
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai chưa biế
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng tin cậy cho phương sai
Khoảng ước lượng cho tham số Bernoulli

Ví dụ
Giả sử khi một tín hiệu có giá trị µ được truyền đi từ vị trí A thì
giá trị nhận được tại vị trí B là một biến ngẫu nhiên có phân phối
chuẩn với trung bình là µ và phương sai là 4. Để giảm thiểu sai số,
cùng một giá trị được gửi đi 9 lần. Nếu các giá trị nhận được lần
lượt là

5, 8.5, 12, 15, 7, 9, 7.5, 6.5, 10.5,

hãy chỉ ra một khoảng tin cậy 95% cho µ.

ĐS: (7.69; 10.31).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng tin cậy cho trung bình trong trường hợp phương sai đã biết
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai chưa biế
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng tin cậy cho phương sai
Khoảng ước lượng cho tham số Bernoulli

Giải:
Gọi Xi là giá trị nhận được ở lần gửi đi thứ i.
Theo giả thiết, Xi ∼ N (µ, σ 2 ), với σ = 2.
X −µ
Vì √ ∼ N (0, 1) nên ta có:
σ/ n
 X −µ 
P − z0.025 < √ < z0.025 = 0.95.
σ/ n

z0.025 = 1.96 (đọc bảng A1).


Với mẫu đã cho, ta có x = 9.
Khoảng tin cậy 95% cho µ là:
 σ σ 
x − z0.025 · √ ; x + z0.025 · √ = (7.69; 10.31).
n n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng tin cậy cho trung bình trong trường hợp phương sai đã biết
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai chưa biế
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng tin cậy cho phương sai
Khoảng ước lượng cho tham số Bernoulli

Giả sử ta có một tổng thể có phân phối chuẩn N (µ, σ 2 ),


trong đó µ và σ là các tham số chưa biết. Ta cần chỉ ra
khoảng tin cậy (1 − α) cho tham số µ.
Xét một mẫu ngẫu nhiên (X1 , . . . , Xn ) từ tổng thể trên.
X −µ (n − 1)S 2
Ta đã biết √ ∼ N (0, 1) và ∼ χ2n−1 , trong đó
σ/ n σ2
X1 + · · · + Xn
X = là trung bình mẫu và
n
(X1 − X )2 + · · · + (Xn − X )2
S2 =
n−1

là phương sai mẫu.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng tin cậy cho trung bình trong trường hợp phương sai đã biết
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai chưa biế
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng tin cậy cho phương sai
Khoảng ước lượng cho tham số Bernoulli

X −µ
Suy ra √ ∼ tn−1 .
S/ n
 X −µ 
Do đó: P − tα/2,n−1 < √ < tα/2,n−1 = 1 − α.
S/ n
Khoảng tin cậy (1 − α) cho tham số µ là:
s
µ = x ± tα/2,n−1 · √ .
n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng tin cậy cho trung bình trong trường hợp phương sai đã biết
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai chưa biế
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng tin cậy cho phương sai
Khoảng ước lượng cho tham số Bernoulli

Ví dụ
Giả sử khi một tín hiệu có giá trị µ được truyền đi từ vị trí A thì
giá trị nhận được tại vị trí B là một biến ngẫu nhiên có phân phối
chuẩn với trung bình là µ và phương sai là σ 2 chưa biết. Để giảm
thiểu sai số, cùng một giá trị được gửi đi 9 lần. Nếu các giá trị
nhận được lần lượt là

5, 8.5, 12, 15, 7, 9, 7.5, 6.5, 10.5,

hãy chỉ ra một khoảng tin cậy 95% cho µ.

ĐS: (6.63; 11.37).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng tin cậy cho trung bình trong trường hợp phương sai đã biết
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai chưa biế
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng tin cậy cho phương sai
Khoảng ước lượng cho tham số Bernoulli

Giải:
Gọi Xi là giá trị nhận được ở lần gửi đi thứ i.
Theo giả thiết, Xi ∼ N (µ, σ 2 ).
X −µ
Vì √ ∼ t8 , nên ta có:
S/ n
 X −µ 
P − t0.025,8 < √ < t0.025,8 = 0.95.
S/ n

t0.025,8 = 2.3060 (đọc bảng A3).


Với mẫu đã cho, ta có x = 9 và s 2 = 9.5.
Khoảng tin cậy 95% cho µ là:
 s s 
x − t0.025,8 · √ ; x + t0.025,8 · √ = (6.63; 11.37).
n n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng tin cậy cho trung bình trong trường hợp phương sai đã biết
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai chưa biế
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng tin cậy cho phương sai
Khoảng ước lượng cho tham số Bernoulli

Giả sử ta có một tổng thể có phân phối chuẩn N (µ, σ 2 ),


trong đó µ và σ là các tham số chưa biết. Ta cần chỉ ra
khoảng tin cậy (1 − α) cho tham số σ 2 .
Xét một mẫu ngẫu nhiên (X1 , . . . , Xn ) từ tổng thể trên.
(n − 1)S 2 X1 + · · · + Xn
Ta đã biết ∼ χ2n−1 , trong đó X = là
σ2 n
trung bình mẫu và

(X1 − X )2 + · · · + (Xn − X )2
S2 =
n−1

là phương sai mẫu.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng tin cậy cho trung bình trong trường hợp phương sai đã biết
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai chưa biế
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng tin cậy cho phương sai
Khoảng ước lượng cho tham số Bernoulli
 (n − 1)S 2 
Do đó: P χ21−α/2,n−1 < < χ2
α/2,n−1 = 1 − α.
σ2
Khoảng tin cậy (1 − α) cho tham số σ 2 là:
(n − 1)s 2 2 (n − 1)s 2
< σ < .
χ2α/2,n−1 χ21−α/2,n−1

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng tin cậy cho trung bình trong trường hợp phương sai đã biết
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai chưa biế
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng tin cậy cho phương sai
Khoảng ước lượng cho tham số Bernoulli

Ví dụ
Một phương pháp tiêu chuẩn được hy vọng rằng sẽ sản xuất ra
những miếng rửa chén có các độ dày chênh lệch nhau rất nhỏ. Giả
sử 10 miếng rửa chén được chọn ra và quan sát độ dày của chúng,
ta thu được các số liệu (đơn vị là inch):

0.123, 0.124, 0.126, 0.120, 0.130, 0.133, 0.125, 0.128, 0.124,


0.126.

Hãy chỉ ra khoảng tin cậy 90% cho phương sai của độ dày miếng
rửa chén được sản xuất bởi phương pháp trên (được giả thiết có
phân phối chuẩn)?.

ĐS: (7.267 × 10−6 ; 36.973 × 10−6 ).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng tin cậy cho trung bình trong trường hợp phương sai đã biết
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Khoảng tin cậy cho trung bình trong trường hợp phương sai chưa biế
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng tin cậy cho phương sai
Khoảng ước lượng cho tham số Bernoulli

Giải:
Gọi Xi là độ dày của miếng rửa chén thứ i.
Theo giả thiết, Xi ∼ N (µ, σ 2 ).
(n − 1)S 2
Vì ∼ χ29 , nên ta có:
σ2
 (n − 1)S 2 
P χ20.95,9 < < χ2
0.05,9 = 0.9.
σ2
χ20.05,9 = 16.9190, χ20.95,9 = 3.3251 (đọc bảng A2).
Với mẫu đã cho, ta có s 2 = 1.366 × 10−5 .
Khoảng tin cậy 90% cho σ 2 là:
!
(n − 1)s 2 (n − 1)s 2
; = (7.267 × 10−6 ; 36.973 × 10−6 ).
χ2α/2,n−1 χ21−α/2,n−1

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn Trường hợp đã biết các phương sai
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn Trường hợp phương sai bằng nhau và chưa biết
Khoảng ước lượng cho tham số Bernoulli

Giả sử ta có hai tổng thể có phân phối chuẩn lần lượt là


N (µx , σx2 ) và N (µy , σy2 ). Ta cần chỉ ra khoảng tin cậy
(1 − α) cho µx − µy .
Xét hai mẫu ngẫu nhiên độc lập (X1 , . . . , Xn ) và (Y1 , . . . , Ym )
từ hai tổng thể trên.
Vì X ∼ N (µx , σx2 /n) và Y ∼ N (µy , σy2 /m) nên ta suy ra
 
X − Y ∼ N µx − µy , σx2 /n + σy2 /m .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn Trường hợp đã biết các phương sai
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn Trường hợp phương sai bằng nhau và chưa biết
Khoảng ước lượng cho tham số Bernoulli

Với trường hợp đã biết σx2 và σy2 , ta có:

X − Y − (µx − µy )
q ∼ N (0, 1).
σx2 /n + σy2 /m

 
X − Y − (µx − µy )
Do đó: P −zα/2 < q < zα/2  = 1 − α.
2 2
σx /n + σy /m
Khoảng tin cậy (1 − α) cho µx − µy là:
s
σx2 σy2
µx − µy = x − y ± zα/2 · + .
n m

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn Trường hợp đã biết các phương sai
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn Trường hợp phương sai bằng nhau và chưa biết
Khoảng ước lượng cho tham số Bernoulli

Với trường hợp σx2 = σy2 = σ 2 chưa biết, ta có các phân phối:

(n − 1)Sx2 (m − 1)Sy2
∼ χ2n−1 , ∼ χ2m−1 ,
σ2 σ2
trong đó Sx2 và Sy2 là các phương sai mẫu tương ứng, tức là

(X1 − X )2 + · · · + (Xn − X )2
Sx2 = ,
n−1
(Y1 − Y )2 + · · · + (Ym − Y )2
Sy2 = .
m−1

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn Trường hợp đã biết các phương sai
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn Trường hợp phương sai bằng nhau và chưa biết
Khoảng ước lượng cho tham số Bernoulli

(n − 1)Sx2 (m − 1)Sy2
Do đó: + ∼ χ2n+m−2 .
σ2 σ2
X − Y − (µx − µy )
Kết hợp với phân phối p ∼ N (0, 1), ta suy
σ 2 /n + σ 2 /m
ra:
v
u (n − 1)Sx2 (m − 1)Sy2
u
X − Y − (µx − µy ) t
u +
p  σ2 σ2 ∼ tn+m−2 .
2 2
σ /n + σ /m n+m−2

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn Trường hợp đã biết các phương sai
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn Trường hợp phương sai bằng nhau và chưa biết
Khoảng ước lượng cho tham số Bernoulli

(n − 1)Sx2 + (m − 1)Sy2
Đặt Sp2 = , ta thu được:
n+m−2

X − Y − (µx − µy )
p ∼ tn+m−2 .
Sp · 1/n + 1/m

Do đó: !
X − Y − (µx − µy )
P −tα/2,n+m−2 < p < tα/2,n+m−2 =
Sp · 1/n + 1/m
1 − α.
Khoảng tin cậy (1 − α) cho µx − µy là:
r
1 1
µx − µy = x − y ± tα/2,n+m−2 · sp · + .
n m

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Giả sử ta có một tổng thể có phân phối BER(p), trong đó tỉ


lệ (xác suất) p là tham số chưa biết. Ta cần chỉ ra một
khoảng tin cậy (1 − α) cho p.
Xét một mẫu ngẫu nhiên (X1 , . . . , Xn ) từ tổng thể trên. Mỗi
Xi đều có µ = p và σ 2 = p(1 − p).
Theo định lý giới hạn trung tâm, phân phối của

X1 + · · · + Xn − nµ X −p
√ =p
σ n p(1 − p)/n

xấp xỉ phân phối của N (0, 1) nếu n đủ lớn.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Do đó
!
X −p
P −zα/2 < p < zα/2 ≈ 1 − α.
p(1 − p)/n

Vì X là ước lượng hợp lý cực đại cho p, nên ta xấp xỉ khoảng


tin cậy (1 − α) cho p là:
r
x(1 − x)
p = x ± zα/2 · .
n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Ví dụ
Từ một lô thuốc ta kiểm tra 200 ống thì thấy có 17 ống bị đục.
Hãy chỉ ra một khoảng tin cậy 95% cho tỷ lệ thuốc bị đục của
toàn bộ lô thuốc.

ĐS: (0.046; 0.124).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Ước lượng bằng phương pháp hợp lý cực đại
Khoảng ước lượng cho tham số của tổng thể có phân phối chuẩn
Ước lượng hiệu trung bình của hai tổng thể có phân phối chuẩn
Khoảng ước lượng cho tham số Bernoulli

Giải:
Với mỗi i, ta đặt Xi = 1 nếu lọ thuốc được chọn kiểm tra ở
lần thứ i bị đục, và Xi = 0 trong trường hợp ngược lại.
Ta có Xi ∼ BER(p).
X −p
Theo định lý giới hạn trung tâm, phân phối của p
p(1 − p)/n
xấp xỉ phân phối của N (0, 1) nếu n đủ lớn. !
X −p
Do đó: P −z0.025 < p < z0.025 ≈ 0.95.
p(1 − p)/n
z0.025 = 1.96 (đọc bảng A1).
17
Với mẫu đã cho, ta có x = .
200
Xấp xỉ khoảng tin cậy 95% cho p là:
r r !
x(1 − x) x(1 − x)
x − zα/2 ; x + zα/2 = (0.046; 0.124).
n n
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Kiểm định giả thuyết thống kê

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

1 Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Trường hợp đã biết phương sai
Trường hợp chưa biết phương sai

2 Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn
Trường hợp đã biết các phương sai
Trường hợp phương sai bằng nhau và chưa biết

3 Kiểm định giả thuyết về phương sai của tổng thể chuẩn
Kiểm định giả thuyết về phương sai của một tổng thể chuẩn
Kiểm định sự bằng nhau của phương sai hai tổng thể chuẩn

4 Kiểm định giả thuyết về tham số của tổng thể Bernoulli

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Đặt vấn đề

Một giả thuyết thống kê thường phát biểu về tham số trong


phân phối của một tổng thể nào đó.
Ta gọi là giả thuyết (hypothesis) bởi vì ta chưa biết nó
đúng hay sai.
Vấn đề trọng tâm là xác định xem các giá trị của một mẫu
ngẫu nhiên từ tổng thể này có phù hợp với giả thuyết hay
không.
Ví dụ: xét một tổng thể có phân phối chuẩn với trung bình µ
chưa biết. Phát biểu "µ bằng 1" là một giả thuyết thống kê
mà ta phải kiểm định bằng cách quan sát một mẫu ngẫu nhiên
từ tổng thể này. Nếu mẫu ngẫu nhiên này phù hợp với giả
thuyết đang xét, thì ta nói rằng giả thuyết được "chấp nhận"
(accepted); ngược lại ta nói nó bị "bác bỏ" (rejected).
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Xét một tổng thể có phân phối X ∼ f (x, θ), trong đó θ chưa
biết.
Giả sử rằng ta muốn kiểm định một giả thuyết nào đó về θ.
Ta sẽ ký hiệu giả thuyết này là H0 và gọi nó là giả thuyết
không (null hypothesis).
Đối lập với giả thuyết H0 được gọi là đối thuyết (alternative
hypothesis) và được ký hiệu là H1 .
Ví dụ bài toán kiểm định giả thuyết thống kê:
H0 : µ = 1 và H1 : µ 6= 1.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Để kiểm định H0 và H1 , ta phải quan sát một mẫu ngẫu nhiên


(X1 , . . . , Xn ) của tổng thể đang xét.
Ta có thể đạt được phép kiểm định này bằng cách định nghĩa
một miền C sao cho H0 sẽ bị bác bỏ (tức là chấp nhận H1 )
nếu các giá trị quan sát được (x1 , . . . , xn ) của mẫu ngẫu nhiên
(X1 , . . . , Xn ) nằm trong C và được chấp nhận trong trường
hợp ngược lại.
Ta gọi C là miền bác bỏ (critical region).

Định nghĩa
Ta gọi bộ (X1 , . . . , Xn ; H0 , H1 ; C ) là một kiểm định giả thuyết
(hypothesis test).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Khi kiểm định giả thuyết H0 và H1 , có thể xảy ra hai loại sai lầm
như sau:
(a) Sai lầm loại I (type I error): bác bỏ H0 , trong khi H0 thực
sự đúng.
(b) Sai lầm loại II (type II error): chấp nhận H0 , trong khi H0
thực sự sai.

Định nghĩa
Ta gọi α là mức ý nghĩa của phép kiểm định (level of
significance of the test) nếu

P(sai lầm loại I) = α,

tức là P(bác bỏ H0 |H0 đúng) = α.

Thông thường, người ta hay chọn mức ý nghĩa α cỡ 0.1, 0.05,


hoặc 0.005.
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp chưa biết phương sai
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Giả sử ta có một tổng thể có phân phối chuẩn N (µ, σ 2 ), trong


đó µ chưa biết. Ta muốn kiểm định giả thuyết H0 : µ = µ0 ,
và đối thuyết H1 : µ 6= µ0 , trong đó µ0 là hằng số cho trước.
Xét một mẫu ngẫu nhiên (X1 , . . . , Xn ) từ tổng thể trên.
X1 + · · · + Xn
Vì X = là ước lượng hợp lý cực đại cho µ, nên
n
sẽ rất hợp lý để ta chấp nhận H0 nếu X đừng cách µ0 quá xa.
Như vậy, miền bác bỏ của phép kiểm định sẽ có dạng

C = {(x1 , . . . , xn ) : |x − µ0 | > c} .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp chưa biết phương sai
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

X −µ
Với σ 2 đã biết, ta biết rằng √ ∼ N (0, 1).
σ/ n
Do đó, nếu H0 đúng thì ta có µ = µ0 và

X − µ0
Z= √ ∼ N (0, 1).
σ/ n

Khi đó, mức ý nghĩa

P(H1 |H0 ) = P(|X − µ0 | > c|H0 ) = α

trở thành  √ 
c n
P |Z | > = α.
σ

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp chưa biết phương sai
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

σ
Suy ra: c = zα/2 · √ .
n
Vậy miền bác bỏ với mức ý nghĩa α là:
 
|x − µ0 |
C = (x1 , . . . , xn ) : √ > zα/2 .
σ/ n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp chưa biết phương sai
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Ví dụ
Giả sử khi một tín hiệu có giá trị µ được truyền đi từ vị trí A thì
giá trị nhận được tại vị trí B là một biến ngẫu nhiên có phân phối
chuẩn với trung bình là µ và độ lệch chuẩn là 2. Người ta hy vọng
rằng sẽ nhận được tín hiệu có giá trị µ = 8. Hãy kiểm định giả
thuyết này (với mức ý nghĩa lần lượt là α = 0.05, α = 0.1) nếu tín
hiệu có cùng giá trị được gửi đi 5 lần và giá trị trung bình nhận
được tại B là x = 9.5.

ĐS: nếu α = 0.05 thì chấp nhận; nếu α = 0.1 thì bác bỏ.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp chưa biết phương sai
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Giải:
Giả thuyết không H0 : µ = 8.
Đối thuyết H1 : µ 6= 8.
x − µ0 9.5 − 8
Z= √ = √ = 1.6771.
σ/ n 2/ 5
|Z | ≤ z0.025 = 1.96 nên ta chấp nhận H0 với mức ý nghĩa
α = 0.05.
|Z | > z0.05 = 1.65 nên ta bác bỏ H0 với mức ý nghĩa α = 0.1.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp chưa biết phương sai
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

X −µ
Với σ 2 chưa biết, ta có √ ∼ N (0, 1) và
σ/ n
(n − 1)S 2 X −µ
∼ χ2n−1 , do đó √ ∼ tn−1 , trong đó
σ2 S/ n
(X1 − X )2 + · · · + (Xn − X )2
S2 = là phương sai mẫu.
n−1
Nếu H0 đúng thì ta có µ = µ0 và
X − µ0
T = √ ∼ tn−1 .
S/ n

Khi đó, mức ý nghĩa


P(H1 |H0 ) = P(|X − µ0 | > c|H0 ) = α
trở thành  √ 
c n
P |T | > = α.
S
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp chưa biết phương sai
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

S
Suy ra c = tα/2,n−1 · √ .
n
Vậy miền bác bỏ với mức ý nghĩa α là:
 
|x − µ0 |
C = (x1 , . . . , xn ) : √ > tα/2,n−1 .
s/ n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp chưa biết phương sai
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Ví dụ
Một cơ quan sức khỏe cộng đồng tuyên bố rằng trung bình mỗi hộ
dân sử dụng 350 gallon nước mỗi ngày. Để kiểm chứng tuyên bố
này, người ta chọn ngẫu nhiên 20 hộ dân và ghi lại lượng nước
(đơn vị gallon) sử dụng mỗi ngày như sau:

340 344 362 375


356 386 354 364
332 402 340 355
362 322 372 324
318 360 338 370

Với mức ý nghĩa α = 0.05, số liệu này có ủng hộ tuyên bố trên


không? Giả thiết lượng nước sử dụng mỗi ngày của mỗi hộ dân có
phân phối chuẩn.

ĐS: chấp nhận.


TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp chưa biết phương sai
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Giải:
Gọi X là lượng nước sử dụng mỗi ngày của mỗi hộ dân. Ta có
X ∼ N (µ, σ 2 ).
Giả thuyết không H0 : µ = 350.
Đối thuyết H1 : µ 6= 350.
x = 353.8, s = 21.8478.
x − µ0
T = √ = 0.7778.
s/ n
Ta có |T | ≤ t0.025,19 = 2.0930 nên ta chấp nhận H0 với mức ý
nghĩa α = 0.05.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết các phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp phương sai bằng nhau và chưa biết
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Giả sử ta có hai tổng thể có phân phối chuẩn lần lượt là


N (µx , σx2 ) và N (µy , σy2 ). Ta muốn kiểm định giả thuyết
H0 : µx = µy và đối thuyết H1 : µx 6= µy .
Xét hai mẫu ngẫu nhiên độc lập (X1 , . . . , Xn ) và (Y1 , . . . , Ym )
từ hai tổng thể trên.
Vì X và Y lần lượt là ước lượng hợp lý cực đại cho µx và µy ,
nên ta có thể dùng X − Y để ước lượng cho µx − µy . Do đó,
sẽ rất hợp lý để ta chấp nhận H0 nếu X − Y đừng cách 0 quá
xa.
Như vậy, miền bác bỏ của phép kiểm định sẽ có dạng

C = {|x − y | > c} .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết các phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp phương sai bằng nhau và chưa biết
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Với trường hợp σx2 và σy2 đã biết, ta có phân phối:


X − Y − (µx − µy )
q ∼ N (0, 1).
σx2 /n + σy2 /m

Nếu H0 đúng, thì µx − µy = 0 và ta có


X −Y
Z=q ∼ N (0, 1).
σx /n + σy2 /m
2

Khi đó, mức ý nghĩa


P(H1 |H0 ) = P(|X − Y | > c|H0 ) = α
trở thành
 
c
P |Z | > q  = α,
σx2 /n + σy2 /m
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết các phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp phương sai bằng nhau và chưa biết
Kiểm định giả thuyết về tham số của tổng thể Bernoulli
q
Suy ra c = zα/2 · σx2 /n + σy2 /m.
Vậy miền bác bỏ với mức ý nghĩa α là:
 
 |x − y | 
C= q > zα/2 .
 σ 2 /n + σ 2 /m 
x y

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết các phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp phương sai bằng nhau và chưa biết
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Ví dụ
Hai phương pháp sản xuất lốp xe được đề xuất. Để biết xem
phương pháp sản xuất nào tốt hơn, nhà sản xuất lốp xe sản xuất
một mẫu gồm 10 lốp theo phương pháp thứ nhất rồi test thử ở vị
trí A và một mẫu gồm 8 lốp theo phương pháp thứ hai rồi test thử
ở vị trí B. Biết rằng tuổi thọ của các lốp test ở vị trí A có phân
phối chuẩn với độ lệch chuẩn bằng 4000 km, trong khi các lốp test
ở vị trí B có phân phối chuẩn với độ lệch chuẩn bằng 6000 km.
Nếu nhà sản xuất lốp muốn kiểm định giả thuyết rằng không có sự
khác biệt đáng kể nào về tuổi thọ trung bình của các lốp sản xuất
bởi hai phương pháp, thì bảng dữ liệu sau đây (đơn vị 100 km) cho
ta kết luận gì với mức ý nghĩa α = 0.05?

A 61.1 58.2 62.3 64 59.7 66.2 57.8 61.4 62.2 63.6


B 62.2 56.6 66.4 56.2 57.4 58.4 57.6 65.4
ĐS: chấp nhận.
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết các phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp phương sai bằng nhau và chưa biết
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Giải:
Giả thuyết không H0 : µx = µy .
Đối thuyết H1 : µx 6= µy .
x = 61.65, y = 60.025.
x −y
Z=q = 0.0658.
σx2 /n + σy2 /m
Ta có |Z | ≤ z0.025 = 1.96 nên ta chấp nhận H0 với mức ý
nghĩa α = 0.05.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết các phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp phương sai bằng nhau và chưa biết
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Với trường hợp σx2 = σy2 = σ 2 chưa biết, ta có các phân phối:

(n − 1)Sx2 (m − 1)Sy2
∼ χ2n−1 , ∼ χ2m−1 ,
σ2 σ2
trong đó Sx2 và Sy2 là các phương sai mẫu tương ứng, tức là

(X1 − X )2 + · · · + (Xn − X )2
Sx2 = ,
n−1
(Y1 − Y )2 + · · · + (Ym − Y )2
Sy2 = .
m−1

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết các phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp phương sai bằng nhau và chưa biết
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

(n − 1)Sx2 (m − 1)Sy2
Do đó: + ∼ χ2n+m−2 .
σ2 σ2
X − Y − (µx − µy )
Kết hợp với phân phối p ∼ N (0, 1), ta suy
σ 2 /n + σ 2 /m
ra:
v
u (n − 1)Sx2 (m − 1)Sy2
u
X − Y − (µx − µy ) t
u +
p  σ2 σ2 ∼ tn+m−2 .
2 2
σ /n + σ /m n+m−2

(n − 1)Sx2 + (m − 1)Sy2
Đặt Sp2 = , ta thu được:
n+m−2

X − Y − (µx − µy )
p ∼ tn+m−2 .
Sp · 1/n + 1/m

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết các phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp phương sai bằng nhau và chưa biết
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Nếu H0 đúng, thì µx − µy = 0 và ta có

X −Y
T = p ∼ tn+m−2 .
Sp · 1/n + 1/m

Khi đó, mức ý nghĩa

P(H1 |H0 ) = P(|X − Y | > c|H0 ) = α

trở thành
!
c
P |T | > p = α.
Sp · 1/n + 1/m

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Trường hợp đã biết các phương sai
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Trường hợp phương sai bằng nhau và chưa biết
Kiểm định giả thuyết về tham số của tổng thể Bernoulli
p
Suy ra c = tα/2,n+m−2 · Sp · 1/n + 1/m.
Vậy phép kiểm định H0 : µx = µy và H1 : µx 6= µy (trong
trường hợp σx2 = σy2 = σ 2 chưa biết) có miền bác bỏ với mức
ý nghĩa α là:
( )
|x − y |
C= p > tα/2,n+m−2 .
sp · 1/n + 1/m

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Kiểm định giả thuyết về phương sai của một tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Kiểm định sự bằng nhau của phương sai hai tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Giả sử ta có một tổng thể có phân phối chuẩn N (µ, σ 2 ),


trong đó µ và σ 2 chưa biết. Ta muốn kiểm định giả thuyết
H0 : σ 2 = σ02 và đối thuyết H1 : σ 2 6= σ02 , trong đó σ02 là hằng
số cho trước.
Xét một mẫu ngẫu nhiên (X1 , . . . , Xn ) từ tổng thể trên.
(X1 − X )2 + · · · + (Xn − X )2
Vì S 2 = là ước lượng cho σ 2 ,
n−1
nên sẽ rất hợp lý để ta chấp nhận H0 nếu S 2 /σ02 đừng cách
giá trị 1 quá xa.
Như vậy, miền bác bỏ của phép kiểm định sẽ có dạng

C = (x1 , . . . , xn ) : s 2 /σ02 < a hoặc s 2 /σ02 > b .




TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Kiểm định giả thuyết về phương sai của một tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Kiểm định sự bằng nhau của phương sai hai tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

(n − 1)S 2
Ta đã biết phân phối ∼ χ2n−1 .
σ2
Nếu H đúng thì
(n − 1)S 2
∼ χ2n−1 ,
σ02
do đó mức ý nghĩa

P(H1 |H0 ) = P(S 2 /σ02 < a hoặc S 2 /σ02 > b|H0 ) = α

trở thành
(n − 1)S 2 (n − 1)S 2
 
P < (n − 1)a hoặc > (n − 1)b = α.
σ02 σ02

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Kiểm định giả thuyết về phương sai của một tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Kiểm định sự bằng nhau của phương sai hai tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

χ21−α/2,n−1 χ2α/2,n−1
Suy ra a = và b = .
n−1 n−1
Vậy miền bác bỏ với mức ý nghĩa α là:
(n − 1)s 2 (n − 1)s 2
 
2 2
C= < χ1−α/2,n−1 hoặc > χα/2,n−1 .
σ02 σ02

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Kiểm định giả thuyết về phương sai của một tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Kiểm định sự bằng nhau của phương sai hai tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Giả sử ta có hai tổng thể có phân phối chuẩn lần lượt là


N (µx , σx2 ) và N (µy , σy2 ) trong đó µx , µy , σx2 , σy2 chưa biết.
Ta muốn kiểm định giả thuyết H0 : σx2 = σy2 và đối thuyết
H1 : σx2 6= σy2 .
Xét hai mẫu ngẫu nhiên độc lập (X1 , . . . , Xn ) và (Y1 , . . . , Ym )
từ hai tổng thể trên.
(X1 − X )2 + · · · + (Xn − X )2
Vì Sx2 = và
n−1
2
(Y1 − Y ) + · · · + (Ym − Y ) 2
Sy2 = lần lượt là ước lượng cho
m−1
σx2 và σy2 , nên sẽ rất hợp lý để ta chấp nhận H0 nếu Sx2 /Sy2
đừng cách giá trị 1 quá xa.
Như vậy, miền bác bỏ của phép kiểm định sẽ có dạng
C = sx2 /sy2 < a hoặc sx2 /sy2 > b .


TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Kiểm định giả thuyết về phương sai của một tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Kiểm định sự bằng nhau của phương sai hai tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

(n − 1)Sx2
Ta đã biết các phân phối ∼ χ2n−1 ,
σx2
(m − 1)Sy2
∼ χ2m−1 , nên ta có:
σy2

Sx2 /σx2
∼ Fn−1,m−1 .
Sy2 /σy2

Nếu H đúng thì


Sx2
∼ Fn−1,m−1 ,
Sy2
do đó mức ý nghĩa

P(H1 |H0 ) = P(Sx2 /Sy2 < a hoặc Sx2 /Sy2 > b|H0 ) = α

thỏa mãn nếu a = F1−α/2,n−1,m−1 , b = Fα/2,n−1,m−1 .


TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn Kiểm định giả thuyết về phương sai của một tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn Kiểm định sự bằng nhau của phương sai hai tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Vậy miền bác bỏ với mức ý nghĩa α là:


 2
sx2

sx
C= < F1−α/2,n−1,m−1 hoặc 2 > Fα/2,n−1,m−1 .
sy2 sy

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Giả sử ta có một tổng thể có phân phối BER(p), trong đó tỉ


lệ (xác suất) p là tham số chưa biết. Ta muốn kiểm định giả
thuyết H0 : p = p0 , và đối thuyết H1 : p 6= p0 , trong đó p0 là
hằng số cho trước.
Xét một mẫu ngẫu nhiên (X1 , . . . , Xn ) từ tổng thể trên.
X1 + · · · + Xn
Vì X = là ước lượng hợp lý cực đại cho p, nên
n
sẽ rất hợp lý để ta chấp nhận H0 nếu X đừng cách p0 quá xa.
Như vậy, miền bác bỏ của phép kiểm định sẽ có dạng

C = {(x1 , . . . , xn ) : |x − p0 | > c} .

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli

Theo định lý giới hạn trung tâm, phân phối của


X1 + · · · + Xn − nµ X −p
√ =p
σ n p(1 − p)/n

xấp xỉ phân phối của N (0, 1) nếu n đủ lớn.


X − p0
Do đó, nếu H0 đúng thì ta có p = p0 và Z = p
p0 (1 − p0 )/n
có phân phối xấp xỉ N (0, 1).
Khi đó, mức ý nghĩa
P(H1 |H0 ) = P(|X − p0 | > c|H0 ) = α
trở thành
!
c
P |Z | > p = α.
p0 (1 − p0 )/n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết về trung bình của một tổng thể chuẩn
Kiểm định sự bằng nhau của trung bình hai tổng thể chuẩn
Kiểm định giả thuyết về phương sai của tổng thể chuẩn
Kiểm định giả thuyết về tham số của tổng thể Bernoulli
p
Suy ra: c ≈ zα/2 · p0 (1 − p0 )/n.
Vậy miền bác bỏ với mức ý nghĩa α là:
( )
|x − p0 |
C = (x1 , . . . , xn ) : p > zα/2 .
p0 (1 − p0 )/n

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

Hồi quy tuyến tính

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

1 Phương pháp bình phương tối thiểu

2 Suy luận thống kê về tham số hồi quy


Kiểm định giả thuyết thống kê về β
Khoảng tin cậy cho β
Khoảng tin cậy cho α

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

Đặt vấn đề

Giả sử (X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn ) là một mẫu ngẫu nhiên


tương ứng với 2 biến ngẫu nhiên X và Y .
Chẳng hạn, khi xét bài toán dự báo đỉnh lũ hằng năm trên
sông Hồng tại Hà Nội, ta cảm nhận được mối liên hệ giữa
đỉnh lũ (Y ) và lượng mưa hằng năm (X ).
Tuy nhiên, do không có thông tin gì về mối quan hệ giữa Y
và X , nên thông thường ta giả thiết chúng có mối quan hệ
tuyến tính, đại khái là

y = α + βx.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

Chính xác hơn về mặt toán học, do X và Y là 2 biến ngẫu


nhiên nên khi dự báo đỉnh lũ Y với điều kiện lượng mưa hằng
năm X bằng một giá trị x cụ thể nào đó, ta chỉ có thể dự báo
bằng kỳ vọng của biến ngẫu nhiên Y có điều kiện X = x, tức
là E [Y |x].
Ta gọi
E [Y |x] = α + βx
là phương trình hồi quy tuyến tính đơn giản (simple linear
regression equation).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

Mục đích chính của phân tích hồi quy là dự đoán giá trị của
Y từ thông tin đầu vào x bằng cách sử dụng một mô hình hồi
quy, chẳng hạn:
E [Y |x] = α + βx.

Phương pháp thường dùng để ước lượng các tham số của mô


hình hồi quy là phương pháp bình phương tối thiểu.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

Xét mô hình hồi quy tuyến tính E [Y |x] = α + βx, trong đó


các tham số α và β chưa biết. Ta muốn ước lượng α và β.
Xét dãy giá trị x1 , . . . , xn của x.
Xét Y1 , . . . , Yn là các biến ngẫu nhiên tương ứng.
Mỗi biến ngẫu nhiên Yi có giá trị trung bình là yi = α + βxi .
Gọi SS là tổng bình phương các độ lệch giữa Yi và yi , tức là:
n
X n
X
SS = (Yi − yi )2 = (Yi − α − βxi )2 .
i=1 i=1

Cặp (b b làm cho SS đạt giá trị nhỏ nhất sẽ được dùng để
α, β)
ước lượng cho α và β.
Ta gọi phương pháp này là phương pháp bình phương tối
thiểu (the least squares method).

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

Tính các đạo hàm riêng của SS theo α và β, ta được


n
∂SS X
= −2 (Yi − α − βxi ),
∂α
i=1
n
∂SS X
= −2 xi (Yi − α − βxi ).
∂β
i=1

∂SS
Cho = 0, ta thu được
∂α
n
X n
X
Yi − nα − β xi = 0,
i=1 i=1

hay
Y = α + βx.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

∂SS
Cho = 0, ta thu được
∂β
n
X n
X n
X
xi Yi − α xi − β xi2 = 0.
i=1 i=1 i=1

Thay α = Y − βx vào pt trên, ta thu được:


n
P
(xi − x)(Yi − Y )
i=1
β= n .
(xi − x)2
P
i=1

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

Ta ký hiệu:
n
X n
X
SxY = (xi − x)(Yi − Y ) = xi Yi − nxY ,
i=1 i=1
Xn n
X
Sxx = (xi − x)2 = xi2 − nx 2 ,
i=1 i=1
n n
X X 2
SYY = (Yi − Y )2 = Yi2 − nY ;
i=1 i=1

Vậy ước lượng bình phương tối thiểu cho (α, β) là:

SxY SxY
b=Y −
α · x, βb = .
Sxx Sxx

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

Ví dụ
Bảng số liệu sau đây ghi lại dân số (đơn vị: vạn người) của một
tỉnh qua 8 năm từ 1985 đến 1992:

Năm 1985 1986 1987 1988 1989 1990 1991 1992


Dân số 50 51 51 53 54 56 59 60

Hãy ước lượng phương trình hồi quy tuyến tính của dân số theo
thời gian. Từ đó dự báo dân số của tỉnh này vào năm 2000.

ĐS: E [Y |x] = −2928.5 + 1.5x, E [Y |2000] = 71.5 vạn người.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

Định lý
Xét mô hình hồi quy tuyến tính E [Y |x] = α + βx và dãy giá trị
x1 , . . . , xn của x. Giả sử dãy biến ngẫu nhiên tương ứng Y1 , . . . , Yn
độc lập và mỗi Yi đều có phân phối chuẩn với phương sai là σ 2 .
Khi đó:
 σ2 
(a) βb ∼ N β, .
Sxx
 σ2 x 2 
P
i
(b) α b ∼ N α, .
nSxx

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

Chứng minh (a):


Ta có:
n n
SxY 1 X X xi − x
βb = = (xi − x)(Yi − Y ) = (Yi − Y )
Sxx Sxx Sxx
i=1 i=1
n n n
X xi − x X xi − x X xi − x
= Yi − Y = Yi .
Sxx Sxx Sxx
i=1 i=1 i=1

Vì Yi ∼ N (α + βxi , σ 2 ) , i = 1, . . . , n, và chúng độc lập nên


βb cũng có phân phối chuẩn.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

n
X xi − x
E [β]
b = E [Yi ]
Sxx
i=1
n
X xi − x
= (α + βxi )
Sxx
i=1
n
β X
= (xi − x) · xi
Sxx
i=1
n
β X
= (xi − x) · (xi − x)
Sxx
i=1
β
= · Sxx = β.
Sxx

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

n 
X x i − x 2
Var(β)
b = Var(Yi )
Sxx
i=1
n 
X x i − x 2 2
= σ
Sxx
i=1
n
σ2 X
= (xi − x)2
(Sxx )2
i=1
σ2 σ2
= · Sxx =
(Sxx )2 Sxx
 σ2 
Vậy βb ∼ N β, .
Sxx

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

Chứng minh (b):


Ta có:
X xi − xn n
b = 1
X
b = Y − βx
α Yi − x Yi
n Sxx
i=1 i=1
n 
X 1 x 
= − (xi − x) Yi .
n Sxx
i=1

Vì Yi ∼ N (α + βxi , σ 2 ), i = 1, . . . , n, và chúng độc lập nên α


b
cũng có phân phối chuẩn.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

n 
X 1 x 
E [b
α] = − (xi − x) E [Yi ]
n Sxx
i=1
n 
X 1 x 
= − (xi − x) (α + βxi )
n Sxx
i=1
n
X x
= α + βx − (xi − x)(α + βxi )
Sxx
i=1
n
βx X
= α + βx − (xi − x)xi
Sxx
i=1
n
βx X
= α + βx − (xi − x)(xi − x)
Sxx
i=1
βx
= α + βx − · Sxx = α.
Sxx
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

n 
X 1 x 
Var(b
α) = − (xi − x) Var(Yi )
n Sxx
i=1
n 
X 1 x 2
= − (xi − x) · σ 2
n Sxx
i=1
n 
X 1 x x2 2

= − 2 (xi − x) + (x i − x) · σ2
n2 nSxx (Sxx )2
i=1
n n
X σ2
X x 2σ2
= + (xi − x)2
n2 (Sxx )2
i=1 i=1
2 x σ2
2 σ 2 xi2
P
σ
= + · Sxx = .
n (Sxx )2 nSxx
 σ2 P x 2 
i
b ∼ N α,
Vậy α .
nSxx
TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

Định lý
Xét mô hình hồi quy tuyến tính E [Y |x] = α + βx và dãy giá trị
x1 , . . . , xn của x. Giả sử dãy biến ngẫu nhiên tương ứng Y1 , . . . , Yn
độc lập và mỗi Yi đều có phân phối chuẩn với phương sai là σ 2 .
Khi đó:
(a) Giá trị nhỏ nhất của SS là:
(SxY )2
SSR = SS = SYY − .

(b
α,β)
b Sxx

SSR
(b) ∼ χ2n−2 và độc lập với α
b, β.
b
σ2

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Phương pháp bình phương tối thiểu
Suy luận thống kê về tham số hồi quy

Chứng minh:
n
X
SSR = SS

= (Yi − α b i )2
b − βx
(b
α,β)
b
i=1
n  2
X SxY SxY
= Yi − Y + ·x − · xi
Sxx Sxx
i=1
n 
X SxY (SxY )2 
= (Yi − Y )2 − 2 (Yi − Y )(xi − x) + (xi − x)2
Sxx (Sxx )2
i=1
SxY (SxY )2
= SYY − 2 · SxY + · Sxx
Sxx (Sxx )2
(SxY )2
= SYY − .
Sxx

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết thống kê về β
Phương pháp bình phương tối thiểu
Khoảng tin cậy cho β
Suy luận thống kê về tham số hồi quy
Khoảng tin cậy cho α

Xét mô hình hồi quy tuyến tính đơn giản E [Y |x] = α + βx,
trong đó các tham số α và β chưa biết. Ta muốn kiểm định
giả thuyết H0 : β = β0 với đối thuyết H1 : β 6= β0 , trong đó
β0 là hằng số cho trước.
 σ2 
Ta có βb ∼ N β, , do đó
Sxx

βb − β
s ∼ N (0, 1).
σ2
Sxx

SSR
Mặt khác, ta có ∼ χ2n−2 độc lập với β.
b
σ2

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết thống kê về β
Phương pháp bình phương tối thiểu
Khoảng tin cậy cho β
Suy luận thống kê về tham số hồi quy
Khoảng tin cậy cho α

Suy ra
s
βb − β . SSR βb − β
s 2
=r ∼ tn−2 .
σ2 (n − 2)σ SSR
Sxx (n − 2)Sxx

Vậy phép kiểm định giả thuyết H0 : β = β0 với đối thuyết


H1 : β 6= β0 có miền bác bỏ với mức ý nghĩa α là:
 

 

 |βb − β | 
0
C= r > tα/2,n−2 .

 SSR 

 
(n − 2)Sxx

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết thống kê về β
Phương pháp bình phương tối thiểu
Khoảng tin cậy cho β
Suy luận thống kê về tham số hồi quy
Khoảng tin cậy cho α

Ví dụ
Một người tuyên bố rằng chiếc xe ô tô của anh ta có mức tiêu hao
nhiên liệu không phụ thuộc vào việc anh ta lái xe với vận tốc bao
nhiêu. Để kiểm tra tính hợp lý của tuyên bố này, người ta thử
nghiệm chiếc xe của anh ta tại mỗi vận tốc (mile/giờ) khác nhau
và ghi lại mức tiêu hao nhiên liệu (mile/gallon) sau đây:

Vận tốc 45 50 55 60 65 70 75
Tiêu hao 24.2 25.0 23.3 22.0 21.5 20.6 19.8

Với mức ý nghĩa α = 0.05, hãy kiểm định tuyên bố của anh ta.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết thống kê về β
Phương pháp bình phương tối thiểu
Khoảng tin cậy cho β
Suy luận thống kê về tham số hồi quy
Khoảng tin cậy cho α

Gọi Yx là mức tiêu hao nhiên liệu khi chạy xe tại vận tốc x.
Giả sử các biến ngẫu nhiên Yx đều có phân phối chuẩn cùng
phương sai.
Xét mô hình hồi quy tuyến tính E [Yx ] = α + βx.
Ta cần kiểm định giả thuyết H0 : β = 0 với đối thuyết
6 0.
H1 : β =
x = 60, y ≈ 22.3429
P 2 P P 2
x = 25900, xy = 9265, y = 3516.18
Sxx = 700, Sxy ≈ −119.018, Syy ≈ 21.757
βb = Sxy /Sxx = −0.17, SSR ≈ 1.52
|βb − 0|
T =q ≈ 8.158 > t0.025,5 = 2.2706
SSR
(n−2)Sxx

Vậy bác bỏ H0 với mức ý nghĩa α = 0.05.

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết thống kê về β
Phương pháp bình phương tối thiểu
Khoảng tin cậy cho β
Suy luận thống kê về tham số hồi quy
Khoảng tin cậy cho α

Vì s
βb − β . SSR βb − β
= ∼ tn−2 .
(n − 2)σ 2
q r
σ2 SSR
Sxx
(n − 2)Sxx
nên ta có
 
 βb − β 
−tα/2,n−2 < r SSR
P  = 1 − α.
< tα/2,n−2 

(n − 2)Sxx

Do đó, khoảng tin cậy (1 − α) cho tham số β là:


s
SSR
β = βb ± tα/2,n−2 · .
(n − 2)Sxx

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết thống kê về β
Phương pháp bình phương tối thiểu
Khoảng tin cậy cho β
Suy luận thống kê về tham số hồi quy
Khoảng tin cậy cho α

σ 2 xi2 
P 
b ∼ N α,
Ta có α , do đó
nSxx
b−α
α
s ∼ N (0, 1).
σ 2 xi2
P

nSxx

SSR
Ta có ∼ χ2n−2 độc lập với α
b, do đó
σ2
s
b−α .
α SSR b−α
α
s P 2
=s ∼ tn−2 .
σ2 x 2 (n − 2)σ SS · x 2
P
i R i
nSxx n(n − 2)Sxx

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.
Kiểm định giả thuyết thống kê về β
Phương pháp bình phương tối thiểu
Khoảng tin cậy cho β
Suy luận thống kê về tham số hồi quy
Khoảng tin cậy cho α

Ta có
 
 
 αb−α 
P −tα/2,n−2 < s

P 2 < tα/2,n−2  = 1 − α.

 SSR · xi 
n(n − 2)Sxx

Do đó, khoảng tin cậy (1 − α) cho tham số α là:


s
SSR · xi2
P
α=α b ± tα/2,n−2 · .
n(n − 2)Sxx

TS. Đào Huy Cường Bộ môn Toán Ứng Dụng Khoa Toán - Tin, Trường
Xác Suất
ĐHSPThống Kê (Probability
TP.HCM And Statistics)
Email: cuongdh@hcmue.edu.vn Web: sites.

You might also like