You are on page 1of 100

TRƯỜNG ĐẠI HỌC KINH TẾ-KỸ THUẬT CÔNG NGHIỆP

Trần Thị Hoàng Yến- Trần Chí Lê

Giáo trình xác suất và thống kê

NHÀ XUẤT BẢN LAO ĐỌNG-2016

1
LỜI NÓI ĐẦU
Trong các môn Toán ở trường Đại học, môn Xác suất và thống kê là môn học có
nhiều ứng dụng rộng rãi trong các chuyên ngành khoa học, kỹ thuật khác nhau như:
Kinh tế, Quản trị, Điện, Tin học…Xác suất và thống kê là một bộ phận của toán học,
nghiên cứu các hiện tượng ngẫu nhiên – là các hiện tượng mà ta không thể nói trước là
nó xảy ra hay không khi thực hiện một lần quan sát. Nghiên cứu xác suất và thống kê
nhằm tìm ra tính quy luật trong những hiện tượng thực tiễn mà “tưởng chừng” như
không có quy luật. Trong những năm gần đây, giáo trình xác suất và thống kê đã trở
thành cơ sở khoa học của nhiều ngành trong các trường Đại học, do đó nhu cầu học
tập môn và nghiên cứu ứng dụng rất lớn, nhất là đối với sinh viên các ngành kinh tế,
kỹ thuật. Xác suất và thống kê kể cả lý thuyết xác suất cổ điển cũng như hiện đại được
cho là một môn học khó. Với lý do như vậy nên giáo trình này chúng tôi viết theo cách
tiếp cận đơn giản về mặt lý thuyết, song chú trọng nhiều vào ứng dụng thông qua các
ví dụ và bài tập. Do đó, các vấn đề lý thuyết được trình bày trong giáo trình không quá
thiên về yêu cầu đảm bảo sự chặt chẽ hình thức (mặc dù điều này vốn là đặc trưng của
toán học). Các chứng minh khó không đưa vào trong giáo trình. Lời giải của các ví dụ
được trình bày chi tiết và cụ thể nhằm giúp sinh viên tự mình có thể tiếp cận được với
các kiến thức cần lĩnh hội.
Giáo trình được chia thành 5 chương (với hai phần lý thuyết cơ bản đó là: Lý
thuyết xác suất và lý thuyết thống kê).
Chương 1: Biến cố ngẫu nhiên và xác suất.
Chương 2: Đại lượng ngẫu nhiên.
Chương 3: Đại lượng ngẫu nhiên nhiều chiều.
Chương 4: Mẫu thống kê và ước lượng tham số.
Chương 5: Kiểm định các giả thuyết.
Trong quá trình biên soạn giáo trình chúng tôi đã nhận được nhiều góp ý của các
đồng nghiệp. Chúng tôi chân thành cảm ơn những đóng góp quý báu đó. Chúng tôi
cũng hy vọng giáo trình này là một tài liệu tốt để sinh viên có thể tự học, tự tiếp cận
với các kiến thức cơ bản của môn Xác suất và thống kê; đồng thời cũng là tài liệu có ích
để các giảng viên dạy môn học này tham khảo. Mặc dù đã cố gắng nhưng giáo trình
không tránh khỏi những hạn chế và thiếu sót. Chúng tôi râấ mong nhận đợc ý kiến
đóng góp của các bạn đọc để giáo trình ngày một hoàn thiện hơn.

2
CHƯƠNG 1: BIẾN CỐ NGẪU NHIÊN VÀ XÁC SUẤT
1.1. GIẢI TÍCH TỔ HỢP.
1.1.1. Chỉnh hợp
● Định nghĩa: Chỉnh hợp chập k từ n phần tử là một bộ có thứ tự gồm k phần tử
khác nhau (0 ≤ k ≤ n) lấy từ n phần tử đó.
Số chỉnh hợp chập k của n phần tử được ký hiệu Akn và có thể chứng minh được
rằng
n!
Akn = n(n − 1)(n − 2)...(n − k + 1) = (n − k)! .
● Nhận xét: Hai chỉnh hợp khác nhau nếu:
- Có ít nhất một phần tử khác nhau.
- Thứ tự sắp xếp khác nhau.
● Ví dụ 1.1.1: Hỏi có bao nhiêu cách sắp xếp 5 người vào một dãy có 8 ghế ngồi.
Giải:
Một cách sắp xếp 5 người vào 8 ghế là một chỉnh hợp chập 5 của 8 phần tử. Vậy số
cách sắp xếp là: A58 = 8.7.6.5.4 = 6720
1.1.2. Chỉnh hợp lặp
● Định nghĩa: Chỉnh hợp lặp chập k từ n phần tử là một bộ có thứ tự gồm k phần
tử ( mỗi phần tử có thể lập lại tối đa k lần) lấy từ k phần tử đã cho.
Số chỉnh hợp lặp chập k của n phần tử được ký hiệu Ākn và ta có: Ākn = nk
● Ví dụ 1.1.2: Có mấy cách sắp xếp r quả cầu khác nhau vào n hộp?
Giải:
Mỗi quả cầu có thể bỏ vào n hộp khác nhau, nên có thể coi số cách sắp xếp r quả
cầu vào n hộp như số cách chọn ra r hộp (có thể lặp lại và có thứ tự) từ tập n hộp. Vậy
ta có số cách sắp xếp r quả cầu khác nhau vào n hộp là Ārn = nr
1.1.3. Hoán vị
● Định nghĩa: Hoán vị của n phần tử là một bộ gồm n phần tử ấy được sắp xếp theo
thứ tự nào đó ( Hoán vị của n phần tử chính là chỉnh hợp chập n của n phần tử).
Số hoán vị của n phần tử được ký hiệu là Pn và được tính Pn=n!
● Ví dụ 1.1.3: Hỏi có mấy cách sắp xếp ba người A, B, C vào ba chỗ ngồi?
Giải:
Ta có: P3 = 3! = 3.2.1 =6 cách
Cách sắp xếp như sau: ABC, ACB, BCA, BAC, CAB, CBA.
1.1.4. Tổ hợp

3
● Định nghĩa: Tổ hợp chập k của n phần tử là một bộ gồm k phần tử khác nhau (0
≤ k ≤ n) được lấy từ n phần tử đã cho (không phân biệt thứ tự).
Số tổ hợp chập k của n phần tử được ký hiệu là Ckn và ta có công thức tính
n! Ak
k
Cn = = n.
k!(n − k)! k!
● Ví dụ 1.1.4: Hỏi có bao nhiêu cách chọn 2 người từ nhóm 3 người?
Giải:

Ta có: C 2 = 3!
= 3 . Cách chọn như sau: AB, AC và BC.
3 2!(3 − 2)!
Nhận xét:
1) C0n = Cnn = 1 với mọi n ≥ 1
2) Ckn+1 = Cn - kn với mọi 0 ≤ k ≤ n
3) Ckn + 1 = Ckn – 1 + Ckn với mọi 1 ≤ k ≤ n
4) Akn = Ckn × k!
1.1.5. Nhị thức Newtơn
n n
(a + b ) n
= C a bk
n
k n−k
=  C nk a n − k b k
k =0 k =0

Chứng minh: Ta chứng minh công thức trên bằng phương pháp quy nạp:
Với n = 1 thì (a + b)1 = C01ab0 + C11a0b1 = a + b (đúng).
Giả sử công thức đúng với n -1, ta có:
(a + b)n = (a + b)n -1(a + b)
= (C0n – 1a0bn – 1 + C1n – 1a bn – 2 + …+ Cn – 1n -1an – 1 b0) (a + b)
= C0n – 1abn – 1 + C1n – 1a2 bn – 2 + …+ Cn – 1n -1an b + C0n – 1a0bn
+ C1n – 1a bn – 1 + …+ Cn – 1n -1an – 1 b
= C0n – 1abn – 1 + (C1n – 1 + C1n – 1 ) a bn – 1 + …+
+ (Cn – 2n -1 + Cn – 1n -1) an - 1 b + Cn – 1n -1an – 1 b0
Do Ck -1n -1 + Ck n -1 = Ckn và C0n -1 = C0n ; Cn – 1n -1 = Cnn nên ta có thể thấy công thức
trên là đúng với n.
1.2. CÁC KHÁI NIỆM CƠ BẢN
1.2.1. Phép thử và biến cố
1.2.1.1. Khái niệm
Các khái niệm được gặp đầu tiên trong lý thuyết xác suất là “phép thử” và “biến
cố”.

4
● Phép thử: Danh từ “phép thử” được hiểu là thực hiện một bộ các điều kiện xác
định nào đó ( như là một thí nghiệm cụ thể hay việc quan sát) mà kết quả của chúng
không thể biết chính xác được.
● Một phép thử có thể có nhiều kết quả khác nhau, các kết quả đơn giản nhất xảy ra
trong phép thử này được gọi là các “biến cố” sơ cấp hay “sự kiện”.
● Không gian mẫu: Tập tất cả các biến cố sơ cấp xảy ra trong phép thử được gọi là
không gian mẫu. Ký hiệu là Ω.
● Tập con của không gian mẫu được gọi là biến cố ngẫu nhiên (gọi tắt là biến cố).
Biến cố thường được ký hiệu bởi chữ in hoa A, B, C, v.v… đôi khi có kèm theo chỉ số.
Một biến cố ngẫu nhiên A được gọi là xảy ra nếu một biến cố sơ cấp thuộc A xảy ra.
Ví dụ 1.2.1: Gieo một đồng tiền trên mặt phẳng: đó là một phép thử. Các biến cố sơ
cấp trong phép thử là “Xuất hiện mặt sấp”; “Xuất hiện mặt ngửa” Không gian mẫu của
phép thử là tập gồm hai biến cố trên.
Ví dụ 1.2.2: Tung một con xúc sắc là một phép thử. Các biến cố sơ cấp trong phép
thử là “Xuất hiện mặt k chấm”, tương ứng k =1, 2, 3, 4, 5, 6. Không gian mẫu trong
phép thử này là Ω = {A1, A2, A3, A4, A5, A6 }.
Tuy nhiên trong phép thử trên còn có các biến cố khác xảy ra như “Xuất hiện mặt
có số chấm chẵn”. Biến cố này là một biến cố ngẫu nhiên.
1.2.1.2. Các loại biến cố
Trong thực tế người ta thường chia biến cố làm ba loại
● Biến cố chắc chắn: Biến cố chắc chắn là biến cố nhất định xảy ra khi thực hiện
phép thử. Ký hiệu Ω.
● Biến cố không thể có: Biến cố không thể có là biến cố không thể xảy ra khi thực
hiện phép thử. Ký hiệu Ø.
● Biến cố ngẫu nhiên Biến cố ngẫu nhiên là biến cố có thể xảy ra hoặc có thể không
xảy ra trong phép thử.
Ví dụ 1.2.3: Tung một con xúc sắc:
- “Xuất hiện mặt có số chấm 7”: đó là một biến cố, nhưng biến cố này không thể xảy
ra khi phép thử được thực hiện. Biến cố là biến cố không thể có.
- “Xuất hiện mặt có số chấm  6 và  1 ”: đó là một biến cố, biến cố này luôn luôn
xảy ra khi phép thử được thực hiện. Biến cố này là biến cố chắc chắn. Ký hiệu là Ω.
- “Xuất hiện mặt có số chấm chẵn”: đó là một biến cố, biến cố này có thể xảy ra mà
cũng có thể không xảy ra. Biến cố này là biến cố ngẫu nhiên.
1.2.2. Các phép toán về biến cố
1.2.2.1. Tổng của các biến cố

5
● Định nghĩa 1: Tổng của hai biến cố A và B là một biến cố sẽ xảy ra khi và chỉ khi
xảy ra ít nhất một trong các biến cố A hoặc B. Ký hiệu tổng của hai biến cố A và B là A
+ B.
Ví dụ 1.2.4: Xét phép thử: Hai người cùng bắn vào một mục tiêu.
Gọi A: biến cố người thứ nhất bắn trúng mục tiêu.
B: biến cố người thứ hai bắn trúng mục tiêu.
C: biến cố mục tiêu bị bắn trúng.
Rõ ràng mục tiêu bị bắn trúng khi và chỉ khi có ít nhất một người bắn trúng. Do đó
C = A + B.
● Định nghĩa 2: Tổng của n biến cố A1, A2,…, An là một biến cố sẽ xảy ra khi và chỉ
khi có ít nhất một trong n biến cố đó xảy ra.
n
Ký hiệu tổng của n biến cố là: A
i =1
i

1.2.2.1. Tích của các biến cố


● Định nghĩa 1: Tích của hai biến cố A và B là một biến cố sẽ xảy ra khi và chỉ khi
đồng thời xảy ra cả A và B. Ký hiệu tích của hai biến cố A và B là A.B
Ví dụ 1.2.5: Vẫn xét phép thử ở ví dụ 1.2.2.1: Hai người cùng bắn vào một mục
tiêu.
Gọi A: biến cố người thứ nhất bắn trượt.
B: biến cố người thứ hai bắn trượt.
C: biến cố mục tiêu không bị bắn trúng.
Khi đó C = A.B
● Định nghĩa 2: Tích của n biến cố A1, A2,…, An là một biến cố sẽ xảy ra khi và chỉ
cả n biến cố cùng đồng thời xảy ra.
n
Ký hiệu tích của n biến cố là  Ai
i =1

1.2.2.3. Phần bù của một biến cố


Định nghĩa: Phần bù của một biến cố A, ký hiệu là Ā được xác định:
Ā = Ω \ A = {w  Ω | w  A}
1.2.2.4. Các tính chất của các phép toán về biến cố
i) Tính chất phản hồi: A + A = A
A.A = A
ii) Tính chất giao hoán: A + B = B + A
A.B = B.A
iii) Tính chất kết hợp: A + ( B + C) = (A + B) + C
A.(B.C) = (A.B).C
iv) Tính chất phân phối: A.( B + C) = A.B + A.C

6
v) Tính đối ngẫu (De-Morgan)
A + B = A.B
A.B = A + B
1.2.3. Quan hệ giữa các biến cố
1.2.3.1. Quan hệ kéo theo
● Định nghĩa: Biến cố A kéo theo biến cố B khi và chỉ khi biến cố A xảy ra thì suy
ra biến cố B xảy ra. Ký hiệu: A  B.
● Ví dụ 1.2.6: Một sinh viên mua vé số
A: Biến cố sinh viên đó trúng độc đắc.
B: Biến cố sinh viên đó trúng thưởng.
● Nhận xét: Trúng độc đắc  Trúng thưởng. Do đó: Biến cố A xảy ra thì biến cố B
xảy ra. Suy ra A  B.
1.2.3.2. Quan hệ tương đương
● Định nghĩa: Hai biến cố A và B gọi là tương đương với nhau khi và chỉ khi A  B
và B  A. Ký hiệu: A = B.
● Ví dụ 1.2.7: Tung hai con xúc sắc
A: Biến cố tổng số chấm xuất hiện trên hai mặt xúc xắc là một số chẵn.
B: Biến cố chấm xuất hiện trên hai mặt xúc xắc là cùng chẵn hoặc cùng lẻ.
Khi đó A = B.
1.2.3.3. Biến cố xung khắc
● Định nghĩa: Hai biến cố A và B được gọi là xung khắc với nhau nếu chúng không
thể cùng xảy ra trong một phép thử (Nói cách khác A và B là hai biến cố xung khắc
nếu biến cố này xảy ra thì biến cố kia không xảy ra).
● Nhận xét: Nếu A và B xung khắc nhau thì ta có A.B = Ø
● Ví dụ 1.2.8: Một hộp phấn có 10 viên trắng, 5 viên đỏ, 3 viên xanh. Lấy ngẫu
nhiên 1 viên phấn từ hộp.
Gọi A: Biến cố lấy được viên phấn trắng.
B: Biến cố lấy được viên phấn đỏ.
Trong phép thử trên A và B là hai biến cố không thể đồng thời xảy ra. Do đó A và B
là hai biến cố xung khắc, hay có A.B = Ø.
● Nhận xét: Nếu trong cùng một phép thử mà hai biến cố A và B cùng xảy ra khi
đó ta nói A và B không xung khắc nhau, tức là A.B ≠ Ø.
1.2.3.4. Hệ các biến cố xung khắc từng đôi
● Định nghĩa: Hệ n biến cố A1, A2,…, An được gọi là hệ xung khắc từng đôi nếu hai
biến cố bất kỳ trong chúng xung khắc với nhau (hay nếu một biến cố bất kỳ trong hệ
xảy ra thì các biến cố còn lại không xảy ra), tức là Ai. Aj = Ø với mọi i ≠j

7
● Ví dụ 1.2.9: Một hộp có 5 quả cầu trắng, 4 quả cầu xanh và 3 quả cầu vàng. Lấy
ngẫu nhiên 2 quả cầu.
Gọi Ai: biến cố trong hai quả cầu lấy ra có i quả cầu trắng ( i = 0, 1, 2). Khi đó các
biến cố A0, A1, A2 xung khắc từng đôi.
1.2.3.5. Biến cố đối lập
● Định nghĩa: Hai biến cố A và B được gọi là đối lập nhau nếu chúng thoả mãn:
- Xung khắc nhau: A.B = Ø.
- Có một trong hai biến cố xảy ra A + B = Ω
Ký hiệu biến cố đối lập của A là Ā.
Nhận xét: Biến cố đối lập của A là Ā = Ω \ A
● Ví dụ 1.2.10: Gọi A là biến cố sinh viên A thi đỗ môn XS&TK. Khi đó Ā là biến cố
sinh viên A thi trượt môn XS&TK.
1.2.3.6. Hệ đầy đủ các biến cố
● Định nghĩa: Cho n biến cố A1, A2,…, An gọila một nhóm đầy đủ các biến cố nếu
thoả mãn hai điều kiện sau:
a) Chúng xung khắc với nhau từng đôi một: AiAj = Ø với mọi i ≠ j.
b) Tổng của n biến cố tương đương với biến cố chắc chắn:
A1 + A2 + … + An = Ω
● Ví dụ 1.2.11: Hai biến cố Ā, A là một hệ đầy đủ với n = 2.
1.2.3.7. Các biến cố độc lập
● Định nghĩa: Biến cố A độc lập với biến cố B nếu sự xuất hiện hay không xuất
hiện B không ảnh hưởng gì tới sự xuất hiện hay không xuất hiện A, và ngược lại.
Nếu A độc lập với B thì B độc lập với A.
● Ví dụ 1.2.12: Kết quả thi của hai sinh viên A và B cho ta hai biến cố độc lập.
1.3. XÁC SUẤT CỦA BIẾN CỐ
1.3.1. Khái niệm về xác suất của biến cố
Quan sát các sự kiện ngẫu nhiên ta thấy rằng khả năng xuất hiện của chúng nói
chung không đồng đều, một số sự kiện thường hay xảy ra, một số khác thường ít xảy
ra. Từ đó nảy sinh vấn đề tìm cách đo lường “độ chắc” của một sự kiện. Muốn vậy
người ta tìm cách gán cho mỗi biến cố A một số P(A) không âm, số này được gọi là xác
suất của biến cố A. (P viết tắt từ chữ Probability).
Để phù hợp với nội dung thước đo “độ chắc” của biến cố, xác suất P(A) phải xây dựng
sao cho thoả mãn đòi hỏi hợp lý sau:
● Xác suất của biến cố chắc chắn Ω bằng 1: P(Ω)=1.
● Xác suất của biến cố trống bằng 0: P(Ø) = 0.
● Xác suất của mọi biến cố ngẫu nhiên A bị kẹp giữa 0 và 1: 0 ≤ P(A) ≤ 1
1.3.2. Định nghiã xác suất theo cổ điển
8
Cho A  Ω, xác suất của biến cố A ký hiệu P(A) được định nghĩa bởi:
m
P ( A) =
n
Trong đó m là số biến cố sơ cấp đồng khả năng có thể xảy ra trong phép thử
n là số biến cố sơ cấp thuận lợi để biến cố A xảy ra.
Nhận xét: giá trị n chính là số phần tử của không gian mẫu Ω.
● Ví dụ 1.3.1: Một số điện thoại ở thành phố gồm 6 chữ số. Giả sử ta chọn số điện
thoại một cách ngẫu nhiên. Tìm xác suất để chọn được số điện thoại sao cho:
a) Số 5 đầu tiên và 6 số khác nhau.
b) Số 5 đầu tiên và các số còn lại là số chẵn.
c) Số 5 đầu tiên và các số còn lại là khác nhau, số cuối cùng chẵn.
d) Số 5 đầu tiên và 5 số còn lại là đối xứng.
e) Số 5 đầu tiên, số 0 cuối cùng và 4 số giữa trùng với năm sinh của chủ hộ.
Giải:
Ta thấy số điện thoại đều lập nên từ tập hợp gồm 10 chữ số: 0,1, 2,…, 9. Mà số điện
thoại gồm 6 chữ số thì phép thử của ta chính là chọn ngẫu nhiên từng số một có hoàn
lại 6 lần. Do đó số trường hợp đồng khả năng có thể xảy ra là n = Ā610 = 106.
a) Gọi A: biến cố lấy được số điện thoại có số 5 đầu và 6 số khác nhau.
Số biến cố sơ cấp thuận lợi cho A là m = 1.A59
A 5 9.8.7.6.5 15120
Suy ra P(A) = 96 = = = 0.01512
10 106 106
b) Gọi B: biến cố lấy được số điện thoại có số 5 đầu và các số còn lại là số chẵn.
Số biến cố sơ cấp thuận lợi cho B là m = 1.5.5.5.5.5 = 55
55 1
 P( B) = 6 = 5 = 0.003125
10 2 .10
c) Gọi C: biến cố lấy được số điện thoại có số 5 đầu và các số còn lại khác nhau, số
cuối cùng chẵn.
Số biến cố sơ cấp thuận lợi cho C là: m = 1.5.A49
5A 94 5.9.8.7.6. 15120
Suy ra P(C) = = = = 0.01512
106 106 106
d) Gọi D: biến cố lấy được số điện thoại có số 5 đầu và 5 số còn lại đối xứng
Số biến cố sơ cấp thuận lợi cho D là: m = 1.10.10.10.1.1=103
103
 P( D) = = 0.001
106
e) Gọi E: biến cố lấy được số điện thoại có số 5 đầu tiên, số 0 cuối cùng và 4 số giữa
trùng với năm sinh của chủ hộ

9
Số biến cố sơ cấp thuận lợi cho E là: m = 1.1.1.1.1.1 = 1
1
 P(E) = 6
= 10−6
10
● Ví dụ 1.3.2: Trong một thùng có 3 quả cầu trắng và 5 quả cầu đen giống hệt
nhau về kích thước. Lấy ngẫu nhiên 2 quả cầu từ thùng đó. Tính xác suất để được:
a) Hai quả trắng.
b) Một quả trắng và một quả đen.
Giải: Tổng số quả cầu trong thùng là 8. Mỗi cách lấy ra 2 quả cầu ứng với việc chọn
một tổ hợp chập 2 từ 8 phần tử. Do đó có tất cả n = C28 biến cố sơ cấp đồng khả năng.
Gọi A: biến cố xuất hiện hai quả cầu trắng.
Số các biến cố thuận lợi cho A là những cách chọn 2 trong số 3 quả trắng trong
thùng theo ba cách (C13), quả đen có thể chọn từ 5 quả đen theo 5 cách (C15). Khi đó,
số biến cố thuận lợi cho B là m = C13.C15. Do đó
m C1C1 15
P( B) = = 3 2 5 = .
n C8 28
1.3.3. Định nghĩa về xác suất theo thống kê.
Muốn xác định xác suất của biến cố A theo định nghĩa cổ điển thì phải tìm được
một nhóm đầy đủ các biến cố đồng khả năng, để dựa vào đó mà tìm số các trường hợp
thuận lợi cho biến cố A và số các trường hợp có thể có. Điều đó không phải bao giờ
cũng có, để khắc phục nhược điểm trên người ta đưa ra định nghĩa xác suất theo thống
kê.
Xét phép thử ( τ ) và biến cố A nào đó. Lặp lại một phép thử n lần, gọi m là số lần
m
biến cố A xuất hiện trong n phép thử. Tỷ số f n = được gọi là tần suất của biến cố A.
n
● Định nghĩa: Xác suất của biến cố A là giá trị ổn định của tần suất khi số phép thử
tăng lên vô hạn.
P( A) = lim f n
n→

Ví dụ 1.3.4: Đây là các kết quả của Pearson và Buffon khi tung 1 đồng tiền:
Người thí nghiệm Số lần tung Số lần sấp Tần suất
Buffon 4040 2048 0.5080
Pearson 12000 6019 0.5016
Pearson 24000 12012 0.5005
Qua kết quả trong bảng trên, ta chấp nhận xác suất xuất hiện mặt sấp P(S)=0,5.
Ví dụ 1.3.5: Vấn đề tính xác suất sinh con trai hay con gái, từ lâu đã được các nhà
sinh lý học, nhân chủng học nghiên cứu từ lâu. Người cổ Trung Hoa từ năm 2228 trước

10
Công nguyên đã qua thống kê kinh nghiệm đưa ra tỷ số sinh con gái là 0.5. Laplace
nghiên cứu sinh đẻ ở Luân đôn, Petecbua và Beclin trong 10 năm đã đưa ra tỷ số sinh
con gái là 21/43. Đacnon nghiên cứu sinh đẻ ở Pháp và cho các số liệu sau:
Năm 1806 1816 1836 1856 1903 1920
Tần suất sinh 0.485 0.484 0.485 0.487 0.488 0.489
con gái
● Nhận xét: Định nghĩa xác suất dạng thống kê hay định nghĩa xác suất theo tần
suất chỉ cho ta giá trị xấp xỉ và mức độ chính xác của việc xấp xỉ tuỳ thuộc vào số lần
thực hiện phép thử.
Xác suất của biến cố A được định nghĩa theo quan điểm thống kê cũng có những
tính chất đã nêu trong phần định nghĩa cổ điển về xác suất. Tuy nhiên theo định nghĩa
thống kê về xác suất, một biến cố có xác suất bằng 1 chưa thể kết luận nó là biến cố
chắc chắn. Bởi vì theo định nghĩa thống kê thì khi số phép thử n khá lớn, tần suất fn(A)
chỉ xấp xỉ bằng 1, trong n phép thử vẫn có một số ít phép thử mà trong đó biến cố A
không xảy ra. Tương tự, nếu P(A) = 0 cũng chưa thể kết luận đựơc A là biến cố không
thể.
1.4. CÁC ĐỊNH LÝ CƠ BẢN TÍNH XÁC SUẤT
1.4.1. Định lý cộng xác suất
1.4.1.1. Trường hợp có hai biến cố
● Định lý : Với A, B là hai biến cố ngẫu nhiên, ta có:
P(A + B) = P(A) + P(B) – P(A.B) nếu A.B ≠ Ø (1.4.1)
P(A + B) = P(A) + P(B) nếu A.B = Ø (1.4.2)
Chứng minh:
Thật vậy, giả sử trong phép thử có n biến cố sơ cấp đồng khả năng có thể xảy ra,
trong đó có m1 biến cố thuận lợi cho biến cố A, có m2 biến cố thuận lợi cho biến cố B.
Vì A và B là hai biến cố bất kỳ nên sẽ có k biến cố thuận lợi cho cả A và B. Từ đó có
m1 + m2 – k biến cố thuận lợi chó ít nhất một trong hai biến cố A, B. Do vậy:
m1 + m2 − k m1 m2 k
P( A + B) = = + − = P( A) + P( B) − P( A.B)
n n n n

Khi A và B xung khắc nhau nên A.B = Ø nên P(A.B) = 0, do đó có (1.4.2)


● Ví dụ 1.4.1: Trong số 300 sinh viên năm thứ nhất có 100 sinh viên biết tiếng
Anh, 80 sinh viên biết tiếng Pháp, 30 sinh viên biết cả hai ngoại ngữ Anh – Pháp. Chọn
ngẫu nhiên một sinh viên năm thứ nhất. Tính xác suất sinh viên này biết ít nhất một
ngoại ngữ (Anh hoặc Pháp).
Giải:
Đặt A: biến cố sinh viên này biết tiếng Anh.
11
B: biến cố sinh viên này biết tiếng Pháp.
N: biến cố sinhviên này biết ít nhất một ngoại ngữ.
Ta có: N = A + B, A.B ≠ Ø.
100 80 30 1
P(N) = P(A + B) = P(A) + P(B)+ P(AB)= + − =
300 300 300 2
1.4.1.2. Trường hợp có n biến cố bất kỳ
Nếun A1, A2,…,
n
An là các biến cố bất kỳ thì:
P( Ai ) =  P( Ai ) −  P( Ai . A j ) +  P( A .A .A ) − ... + (−1)
i j k
n −1
P( A1 . A2 ... An ) (1.4.3)
i =0 i =0 i j i j k

Nếun A1, A2,…,


n
An là n biến cố xung khắc từng đôi thì:
P( Ai ) =  P( Ai ) (1.4.4)
i =0 i =0

1.4.1.3. Hệ quả: Nếu A và Ā là hai biến cố đối lập thì


P(Ā) = 1 - P(A) (1.4.5)
Thật vậy, do A và theo giả thuyết A và Ā là hai biến cố đối lập nên A + Ā = Ω và A.Ā
= Ø. Theo công thức (1.4.2) ta có 1 = P(Ω) = P(A + Ā) = P(A) + P(Ā) = 1
Do đó ta được (1.4.5)
1.4.2. Định lý nhân xác suất.
1.4.2.1. Xác suất có điều kiện
Ví dụ 1.4.2: Năm sinh viên được 3 suất học bổng, bằng cách bốc thăm. Trước lúc
bắt thăm, xác suất được học bổng của mỗi sinh viên đều như nhau: P(A) =3/5
Nếu cho biết thêm điều kiện trước đó sinh viên B đã được một suất thì xác suất để
sinh viên A được học bổng là 2/4. Như thế sự xuất hiện của B đã làm thay đổi khả năng
được học bổng của A. Khi đó 2/4 được gọi là xác suất có điều kiện của biến cố A (với
điều kiện biến cố B đã xảy ra).
● Định nghĩa: Xác suất của biến cố A được tính với giả thuyết biến cố B đã xảy ra
gọi là xác suất có điều kiện của A với điều kiện B. Ký hiệu là P(A/B) và được tính bởi
công thức
P( A.B)
P( A / B) = (1.4.6)
P( B)

Nhận xét: Nếu hai biến cố A và B độc lập nhau thì P(A/B) = P(A)
Ví dụ 1.4.3: Một hộp có 5 quả cầu xanh và 3 quả cầu đỏ. Lầy ngẫu nhiên từ hộp ra
hai lần, mỗi lần một quả cầu (lấy lần lượt không hoàn lại).
Gọi B: biến cố lần thứ nhất lấy được quả cầu xanh.
A: biến cố lần thứ hai được quả cầu đỏ.
Khi đó P(A/B) = 3/7.
1.4.2.2. Định lý nhân xác suất
12
● Định lý: Xác suất của tích hai biến cố bằng tích xác suất của một trong chúng
nhân với xác suất có điều kiện của biến cố kia với giả thuyết biến cố thứ nhất đã xảy ra:
i) P(A.B) = P(B).P(A/B) = P(A).P(B/A) (1.4.7)
ii) Nếu A và B là độc lập, ta có: P(AB) = P(A).P(B) (1.4.8)
Dùng qui nạp có thể tổng quát hoá định lý nhân xác suất cho một số hữu hạn các biến
cố:
P(A1A2…An) = P(A1)P(A2/A1).P(A3/A1A2)…P(An/A1A2…An-1) (1.4.9)
Trong trường hợp các biến cố Ai (i =1, 2,…, n) độc lập trên toàn thể, công thức trên
trở thành:
P(A1A2…An) = P(A1)P(A2)…P(An) (1.4.10)
Ví dụ 1.4.5: Một hộp có 8 bút xanh và 2 bút đỏ. Lấy ngẫu nhiên lần lượt ra hai bút
(lấy không hoàn lại). Tìm xác suất để cả hai bút lấy ra đều là bút xanh.
Giải:
Gọi A: biến cố cả hai bút đều là bút xanh
A1: biến cố lần thứ nhất lấy được bút xanh
A2: biến cố lần thứ hai lấy được bút xanh
Khi đó A = A1.A2
Theo định lý nhân xác suất ta có:
8 7 28
P(A) = P(A1.A2) = P(A1).P(A2/A1) = . =
10 9 45
Ví dụ 1.4.6: Có hai học sinh cùng thi môn Xác suất và thống kê. Xác suất để các học
sinh thi đỗ tương ứng là 0,6 và 0,7. Tìm xác suất để cả hai học sinh cùng thi đỗ.
Giải:
Gọi A: biến cố cả hai học sinh cùng thi đỗ
A1: biến cố học sinh thứ nhất thi đỗ
A2: biến cố học sinh thứ hai thi đỗ
Khi đó A = A1. A2
Vì A1 và A2 độc lập nên P(A) = P(A1. A2) = P(A1).P(A2) = 0,6.0,7 = 0,42
● Tính chất của xác suất có điều kiện
i) 0 ≤ P(A) ≤1.
ii) P(B/B) = 1.
iii) Nếu A.C = Ø thì P(A  C/B) = P(A/B) + P(C/B)
iv) P(Ā/B)=1- P(A/B)
Ví dụ 1.4.7: Một người có 3 con gà mái, 2 con già trống nhốt chung một lồng. Một
người đến mua, người bán bắt ngẫu nhiên ra một con. Người mua chấp nhận mua con
đó.

13
a) Tìm xác suất để người đó mua được con gà mái. Người thứ hai đến mua, người
bán gà lại bắt ngẫu nhiên ra một con.
b) Tìm xác suất người thứ hai mua được gà trống, biết rằng người thứ nhất đã mua
được gà mái.
c) Xác suất này sẽ bằng bao nhiêu nếu người bán gà quên mất rằng con gà bán cho
người thứ nhất là gà trống hay gà mái?
Giải:
Gọi Ai: biến cố người thứ i mua được gà mái, i = 1,2.
a) Ta có: P(A1) =3/5 = 0,6
b) Vì người thứ hai mua sau khi người thứ nhất đã mua xong, cho nên:
P(Ā2/A1) = 2/4 = 0,5
c) Ta có: Ā2 = Ω. Ā2 = (A1 + Ā1).Ā2 = A1.Ā2 + Ā1.Ā2
Vì A1.Ā1 = Ø nên A1.Ā2 . Ā1.Ā2 = Ø
Theo công thức cộng (1.4.2) ta có: P(Ā2) = P(A1.Ā2 + Ā1.Ā2)
Do A1, A2 không độc lập nên A1, Ā2 và Ā1, Ā2 không độc lập, theo công thức nhân
xác suất ta có:
3 2 2 1
P(Ā2) = P(A1).P(Ā2/A1) + P(Ā1).P(Ā2/Ā1) = . + . = 0,4
5 4 5 4
Ví dụ 1.4.8: Để dập tắt nạ sâu bệnh hại lúa, đội bảo vệ thực vật của hợp tác xã đã
tiến hành phun thuốc ba lần liên tiếp trong một tuần. Xác suất sâu bị chết sau lần
phun thứ I là 0,5. Nếu sâu sống sót thì khả năng bị chết sau lần phun thứ II là 0,7.
Tương tự sau lần phun thứ III là 0,9. Tìm xác suất sâu bị chết sau đợt phun thuốc.
Giải:
Gọi A: biến cố sâu bị chết sau đợt phun thuốc.
Ai: biến cố sâu bị chết sau lần phun thứ i, i = 1, 2, 3.
A1, A2, A3 không độc lập.
Ta có: A = A1 + Ā1.A2 + A1 . A2 . A3
Áp dụng công thức cộng và nhân ta tính được P(A).
1.4.3. Công thức xác suất đầy đủ và Bayes:
1.4.3.1. Công thức xác suất đầy đủ (Công thức xác suất toàn phần)
Một hệ quả quan trọng của định lý cộng và nhân xác suất là công thức xác suất đầy
đủ.
Giả sử A1, A2,…, An là một hệ đầy đủ các biến cố xung khắc và F là một biến cố nào
đó có thể xảy ra đồng thời với một trong các biến cố A1, A2,…, An.
Cho biết các xác suất P(A1) và P(F/Ai) (i = 1,2,…,n). Hãy tính xác suất của P(F)
Theo giả thuyết, rõ ràng ta có:

14
F = F.Ω = F(A1 + A2 + … + An ) = F.A1 + F.A2 + … + F.An
Vì các biến cố A1, A2,…, An xung khắc từng đôi nên các biến cố F.Ai (i = 1, 2,…, n)
cũng xung khắc từng đôi, do đó theo công thức cộng xác suất ta có:
P(F) = P(F.A1 + F.A2 + … + F.An) = P(F.A1) + P(F.A2) + … + P(F.An)
Hơn nữa theo định lý nhân xác suất: P(F.Ai) = P(Ai).P(F/Ai).
Do đó:
P(F) = P(A1).P(F/A1) + P(A2).P(F/A2) + … + P(An).P(F/An) (1.4.11)
Công thức (1.4.11) là công thức xác suất đầy đủ.
Ví dụ 1.4.9: Một lô hạt giống được phân làm 3 loại. Loại I chiếm 2/3 số hạt của lô.
Loại II chiếm 1/4, còn lại là loại III. Loại I có tỷ lệ nảy mầm 80%, loại II có tỷ lệ nảy
mầm 60% và loại III có tỷ lệ nảy mầm 40%. Hỏi tỷ lệ nảy mầm chung của lô hạt giống
là bao nhiêu? (Nói cách khác: Ta lấy ngẫu nhiên từ lô ra 1 hạt. Tìm xác suất để được
hạt nảy mầm).
Giải:
Gọi Ai: biến cố hạt giống lấy ra thuộc loại i, i = 1, 2, 3.
Gọi F là biến cố hạt giống lấy ra thuộc loại hạt nảy mầm.
Ta thấy A1, A2, A3 lập thành một hệ đầy đủ các biến cố; F xảy ra thì hạt đó phải
thuộc một trong ba loại tức là một trong ba biến cố A1, A2, A3 phải xảy ra.
Ta có: P(A1) = 2/3; P(A2) = ¼ và P(A3) = 1/12
P(F/A1) = 0,8; P(F/A2) = 0,6 và P(F/A3) = 0,4
Áp dụng công thức xác suất đầy đủ, ta có:
P(F)= P(A1 )P(F/A1 ) + P(A2 ) P(F/A2 ) + P(A3 )P(F/A 3 )
2 1 1
= .0,8 + .0,6 + .0,4 = 0,7
3 4 12
1.4.3.2. Công thức Bayes
Với cùng giả thuyết như công thức xác suất đầy đủ. Tính xác suất của biến cố Ak với
điều kiện F đã xảy ra.
Theo công thức nhân xác suất ta có:
P(AkF) = P(F).P(Ak/F) = P(Ak).P(F/Ak)
P( Ak ).P( F / Ak ) P( Ak ).P( F / Ak )
=> P( Ak / F ) = = n (1.4.12)
 P( Ak ).P( F / Ak )
P( F )
k =1
Công thức (1.4.12) được gọi là công thức Bayes.
Ví dụ 1.4.10: Trong một trạm cấp cứu phỏng có 80% bệnh nhân phỏng do nóng và
20% phỏng do hoá chất.
Loại phỏng do nóng có 30% bị biến chứng.

15
Loại phỏng do hoá chất có 50% bị biến chứng.
a) Tính xác suất khi bác sỹ mở tập hồ sơ của bệnh nhân gặp một bệnh án cuả bệnh
nhân bị biến chứng.
b) Biết đã gặp một bệnh án của bệnh nhân bị biến chứng. Tính xác suất do:
i) Nóng gây nên.
ii) Hoá chất gây nên.
Giải:
Gọi F: Biến cố bệnh nhân bị biến chứng.
A1: Biến cố bệnh nhân phỏng do nóng.
A2: Biến cố bệnh nhân phỏng do hoá chất.
Ta có A1, A2 lập thành một nhóm đầy đủ.
P(A1) = 0,8; P(A2) = 0,2; P(F/A2) = 0,3; P(F/A2) = 0,5.
a) Áp dụng công thức xác suất đầy đủ ta có:
P(F) = P(A1)P(F/A1) + P(A2)P(F/A2)
= 0,8.0,3 + 0,2.0,5 = 0,34 = 34%
b) Áp dụng công thức Bayes, ta có:
P(A1 ).P(F/A1 ) (0,8).(0,3)
i) P(A1 /F) = = = 0,705 = 70,5%
P(F) 0,34
P(A 2 ).P(F/A2 ) (0,2).(0,5)
ii) P(A 2 /F) = = = 0,295 = 29,5%
P(F) 0,34
Ví dụ 1.4.11: Trong một khoá tốt nghiệpcủa một trường Đại học, tỷ lệ sinh viên tốt
nghiệp loại giỏi là 15%. Trong số các sinh viên tốt nghiệp loại giỏi có 40% được tuyển
dụng vào cơ quan nhà nước. Còn trong số các sinh viên tốt nghiệp loại khác có 25%
được tuyển dụng vào cơ quan nhà nước. Chọn ngẫu nhiên một sinh viên, thấy sinh
viên đó đã được tuyển dụng vào cơ quan nhà nước. Tím xác suất để sinh viên đó tốt
nghiệp loại giỏi.
Giải:
Gọi F: biến cố sinh viện chọn ra được tuyển vào cơ quan nhà nước.
A1: biến cố sinh viên chọn ra tốt nghiệp loại giỏi.
A2: biến cố sinh viên chọn ra tốt nghiệp loại khác.
Do A1, A2 là hệ đầy đủ nên theo công thức xác suất đầy đủ ta có
P(F) = P(A1).P(F/A1) + P(A2).P(F/A2)
= 0,15.0,40 + 0,85.0,25 = 0,2725
Theo công thức Bayes:
P ( A1 ).P ( F / A1 ) 0,15.0,40
P ( A1 / F ) = =
P( F ) 0,2725

16
● Chú ý: Trong các công thức trên, hệ A1, A2,…, An được gọi là các giả thiết và chúng
lập nên một hệ đầy đủ. Do đó, muốn áp dụng công thức xác suất đầy đủ và Bayes thì ta
phải xác định đợc hệ đầy đủ A1, A2,…, An cho phù hợp.
Nếu các biến cố A1, A2,…, An lập nên hệ đầy đủ thì các biến cố (A1/F), (A2/F),…,
(An/F) cũng lập nên hệ đầy đủ. Do đó có thể áp dụng công thức xác suất đầy đủ và
Bayes một lần nữa (nấu cần).
1.4.4. Dãy các phép thử Bernoulli
1.4.4.1. Định nghĩa:
Tiến hành n phép thử độc lập (tức là các kết quả của phép thử này không ảnh
hưởng gì đến kết quả của các phép thử kia) được gọi là n phép thử Bernoulli ( hoặc là
lược đồ Bernoulli) nếu thoả mãn hai điều kiện sau:
i) Mỗi phép thử có 2 kết quả: A, Ā.
ii) P(A) = p như nhau đối với mọi phép thử.
Ví dụ 1.4.12:
- Gieo 1 đồng tiền 10 lần đó là phép thử Bernoulli.
- Gieo 1 đồng xu 1000 lần, A: biến cố xuất hiện mặt ngửa. Đó là 1000 phép thử
Bernoulli.
- Một người tập bắn và anh ta bắn 5 viên đạn. Anh ta bắn từng viên một vào một
mục tiêu. Đó là 5 phép thử Bernuolii. (Nhưng nếu 5 người bắn, mỗi người bắn 1 viên
thì nói chung đó lại không là 5 phép thử Bernoulii)
1.4.4.2. Tần số xuất hiện biến cố A
Ta tìm xác suất sao cho trong n phép thử Bernoulli biến cố A xuất hiện m lần. Ký
hiệu xác suất này là Pn(m, p).
Ta có: Pn(m, p)= Cmn pm (1 − p)(n−m); m = 0,n (1.4.13)
Công thức (1.4.13) gọi là công thức Bernoulli
Thật vậy, các kết quả có thể của n phép thử Bernoulli sẽ là một dãy gồm n chữ A và
Ā (ở phép thử thứ i, A xuất hiện ta ghi A., Ā xuất hiện ta ghi Ā).
Để trong n phép thử này biến cố A xuất hiện m lần thì trong dãy có m chữ A, (n -
m) chữ Ā.
Với một cách sắp xếp cố định m chữ A, (n - m) chữ Ā, do tính độc lập nên xác suất
tương ứng là; pm.(1- p)n - m. Nhưng ta lại có Cmn cách sắp xếp m chữ A trong n vị trí.
Vậy xác suất cần tìm là: Pn(m, p) = Cmn .pm.(1- p)n – m
1.4.4.3. Số có khả năng nhất
Ta tung một đồng tiền cân đối, đồng chất 5 lần.
A: biến cố xuất hiện mặt sấp. Khi đó P(A) = 1/2
Số mặt sấp xuất hiện có thể 0,…, 5. Tương ứng với các xác suất:

17
P5(m,1/2) = Cmn (1/2)m(1/2)5 - m, m = 0,5 .
Trong 6 con số trên sẽ tồn tại số lớn nhất. Số m tương ứng với xác suất lớn nhất sẽ
là số hay xảy ra nhất. Trong trường hợp trên m = 2 và 3, tức là trong 5 lần tung đồng
tiền mặt sấp có thể xuất hiện 0 lần, 1 lần, …, 5 lần, nhưng xuất hiện 2 lần và 3 lần là có
khả năng nhất. Số m0 mà ứng với nó Pn(m0, p) lớn nhất, được gọi là số có khả năng
nhất. Pn(m0, p) = max Pn(m, p)
● Quy tắc tìm số có khả năng nhất như sau:
- Nếu np +p -1 là một số nguyên thì m0 chính là np + p - 1 và np + p.
- Nếu np + p - 1 là một số thập phân thì m0 chính là số nguyên bé nhất nhưng lớn
hơn np + p - 1, tứclà m0 = [np + p - 1] + 1. ([x] là phần nguyên của x]).
Ví dụ 1.4.12: Tỷ lệ mắc bệnh A ở một vùng nào đó là 10%. Trong đợt khám tuyển
nghĩa vụ quân sự người ta đã khám cho 100 người. Tìm xác suất để:
a) Trong 100 người có 6 người bị bệnh A.
b) Trong 100 người có 95 người không bị bệnh A.
c) Trong 100 người có ít nhất 1 người bị bệnh A.
d) Tìm số người bị bệnh A có khả năng nhất. Tính xác suất tương ứng.
Giải:
Ở đây có 100 phép thử Bernoulli.
A: biến cố bị bệnh A, và P(A) = p = 0,1
Do đó ta có:
a) P100(6; 0,1)= C100
6
.0,16.0,94.
b) P100(95;0,9)= C10095
.0,195.0,95.
c) P100(m ≥1; 0,1) = 1- P100(m = 0; 0,1) = 1 - C100 0
.0,10.0,9100=1- 0,9100
d) Ta có np + p – 1 =100.0,1 + 0,1 – 1 = 9,1.
Số người bị bệnh A có khả năng nhất khi khám 100 người là 10 người và xác suất
tương ứng là: P100(10; 0,1)= C10 100
.0,110.0,990.
Ví dụ 1.4.13: Một lô hạt giống tỷ lệ hạt lép là 5%. Cần phải lấy 1 mẫu cỡ bao nhiêu
sao cho xác suất để bị ít nhất 1 hạt lép không bé hơn 0,95.
Giải:
Ta có: Pn(m ≥1; 0,05) = 1 - Pn(m = 0; 0,05) = 1- C0n .0,050.0,95n = 1- 0,95n
Theo đề bài: 1- 0,95n ≥ 0,95.
Suy ra 0,05 ≥ 0,95n hay n  ln 0,05
ln 0,95

18
BÀI TẬP THẢO LUẬN CHƯƠNG I
GIẢI TÍCH TỔ HỢP
Bài 1:
Từ các chữ số 0,1,2,3,4,5,6 có thể lập được bao nhiêu số chẵn có ba chữ số ( không
nhất thiết khác nhau)?
Bài 2:
Từ các chữ số 1,5,6,7 có thể lập được bao nhiêu chữ số có 4 chữ số ( không nhất
thiết khác nhau)?
Bài 3:
Có bao nhiêu chữ số có 5 chữ số, trong đó các chữ số cách đều chữ số giữa giống
nhau?
Bài 5:
Từ thành phố A đến thành phố B có m con đường; từ thành phố A đến thành phố C
có n con đường, từ thành phố B đến thành phố D có q con đường. Không có con đường
nào nối thành phố B và thành phố C. Hỏi có bao nhiêu con đường đi từ thành phố A
đến thành phố D?
Bài 6:
Cho các chữ số 1,2,3,4,5. Từ các chữ số đã cho.
a) Có thể lập được bao nhiêu số chẵn có ba chữ số khác nhau?
b) Có thể lập được bao nhiêu số có ba chữ số khác nhau lớn hơn hay bằng 245?
c) Có thể lập được bao nhiêu số có ba chữ số khác nhau bé hơn nay bằng 245?
Bài 7:
Có bao nhiêu cách phân phối 5 đồ vật cho 3 người, sao cho mỗi người đều nhận
được ít nhất một đồ vật?
Bài 8:
A có 7 quyển sách toán khác nhau, B có 9 quyển sách văn khác nhau. Hỏi hai bạn
có thể trao đổi cho nhau mỗi lần 5 quyển theo bao nhiêu cách?
Bài 9:
Người ta rút hú ra 3 quả cầu từ một cái hộp đựng 6 quả cầu trắng, 4 quả cầu đen.
a) Có bao nhiêu cách rút ra như thế?
b) Có bao nhiêu cách rút ra hai quả cầu trắng và 1 quả cầu đen?
c) Có bao nhiêu cách rút ra ít nhất 2 quả cầu trắng?
Bài 10:
Trong một lô hàng có 20 bóng đèn, trong đó có 6 bóng đèn 110V, còn lại là bóng
220V.
a) Hỏi có bao nhiêu cách chọn ra 4 bóng đèn tuỳ ý?

19
b) Hỏi có bao nhiêu cách chọn ra 4 bóng đèn, trong đó phải có 2 bóng 110V?
c) Hỏi có bao nhiêu cách chọn ra 4 bóng đèn, trong đó phải có ít nhất 2 bóng
110V?
Bài 11:
Một đội công nhân gồm 15 người, gồm 9 nam và 6 nữ:
a) Có bao nhiêu cách thành lập 1 tổ công tác gồm 4 nam và 2 nữ từ đội công nhân
đó.
b) Trong đội có vợ chồng anh Thu và chị Chi vì có con nhỏ nên không thể cùng
tham dự một tổ được. Hỏi có bao nhiêu cách thành lập tổ công tác như trên để chiếu cố
tình hình này?
BIẾN CỐ
Bài 1:
Khi nào thì có đẳng thức:
a) A + B = Ā
b) A.B = Ā
c) A + B = A.B
Bài 2:
Hai đấu thủ chơi 1 ván cờ tướng. Gọi A là biến cố người thứ nhất thắng, B là biến cố
người thứ 2 thắng. Hỏi phải thêm vào biến cố nào để có một hệ đầy đủ các biến cố?
Bài 3:
Một chiếc tàu thuỷ gồm 1 bánh lái, 4 nồi hơi, 2 tuyếc-bin. Gọi A, Bi (i = 1, …, 4) , Cj
(j =1, 2) lần lượt là các biến cố bánh lái hoạt động tốt, nồi hơi thứ i hoạt động tốt,
tuyếc-bin thứ j hoạt động tốt. Biết rằng tàu hoạt động tốt khi và chỉ khi bánh lái, ít
nhất một nồi hơi và ít nhất một tuyếc-bin đều hoạt động tốt. Gọi D là biến cố tàu hoạt
động tốt. Hãy biểu diễn D và D qua A, Bi, Cj.
Bài 4:
Hai xạ thủ cùng đến trường bắn, mỗi người bắn một viên vào bia. Gọi Ai người thứ i
bắn trúng bia (i = 1,2). Hãy biểu diễn các biến cố sau qua A1, A2.
a) Chỉ có người thứ nhất bắn trúng bia.
b) Có đúng một người bắn trúng.
c) Có ít nhất một người bắn trúng.
d) Cả hai người cùng bắn trúng.
e) Không có ai bắn trúng.
g) Có không quá 1 người bắn trúng.
XÁC SUẤT
Bài 1:

20
Lớp học môn xác suất có 70 sinh viên, trong đó có 25 nữ. Chọn ngẫu nhiên ra một
nhóm gồm 10 sinh viên . Tìm xác suất để trong nhóm chọn ra có 4 sinh viên nữ.
Bài 2:
Một sinh viên đi thi môn Triết học chỉ nắm được 20 trong số 25 câu hỏi của chương
trình. Mỗi phiếu ghi gồm 3 câu. Tính xác suất để anh ta trả lời được 3 câu.
Bài 3:
Tung đồng thời 2 con xúc sắc. Tính xác suất để:
a) Tổng số nút xuất hiện trên hai con xúc sắc là 7.
b) Tổng số nút xuất hiện trên hai con xúc sắc là 8.
c) Số nút xuất hiện trên hai con xúc sắc hơn kém nhau là 2.
Bài 4:
Một chiếc hộp đựng 6 quả cầu trắng, 4 quả cầu đỏ và 2 quả cầu đen. Chọn ngẫu
nhiên 6 quả cầu. Tìm xác suất để chọn được 3 quả cầu trắng, 2 quả cầu đỏ và 1 quả cầu
đen.
Bài 5:
Đoàn tàu điện gồm 3 toa tiến vào sân ga, ở đó có 12 khách đang chờ lên tàu. Giả
sủă các hành khách đều lên tàu một cách ngẫu nhiên và độc lập với nhau, mỗi toa còn
ít nhất 12 chỗ trống. Tìm xác suất để:
a) Toa thứ nhất có 4 người lên, toa thứ hai có 5 người kên, số còn lại lên toa thứ ba.
b) Mỗi toa có 4 người lên.
c) Hai hành khách A và B cùng lên một toa.
Bài 6:
Thang máy của một tầng khách sạn 10 tầng xuất phát từ tầng một với 5 khách. Tìm
xác suất để:
a) Tất cả cùng ở tầng 5.
b) Tất cả cùng ra ở một tầng.
c) Mỗi người ra ở một tầng khác nhau.
d) Hai người cùng ra một tầng, ba người còn lại ra ở ba tầng khác nhau.
Bài 7:
Ba xạ thủ, mỗi người bắn một viên đạn vào mục tiêu với xác suất trúng đích của
mỗi người là 0,6;0,7;0,8. Tìm xác suất:
a) Chỉ có đúng người thứ hai bắn trúng.
b) Có đúng một người bắn trúng.
c) Có ít nhất một người bắn trúng.
d) Cả ba người đều bắn trúng.
e) Có đúng hai người bắn trúng.

21
g) Có ít nhất hai người bắn trúng.
h) Có không quá hai người bắn trúng.
Bài 8:
Có 10 hộp bi, trong đó có 4 hộp loại I, 3 hộp loại II, còn lại là hộp loại III. Hộp loại I
có 3 bi trắng và 5 bi đỏ, hộp loại II có 4 bi trắng và 6 bi đỏ, hộp loại III có 2 bi trắng và
2 bi đỏ.
a) Chọn ngẫu nhiên 1 hộp và từ đó lấy ngẫu nhiên 1 bi. Tìm xác suất để được bi đỏ.
b) Chọn ngẫu nhiên một hộp và từ đó lấy ngẫu nhiên 1 bi thì được bi trắng. Tìm xác
suất để viên bi đó lấy ra thuộc loại II.
Bài 9:
Có hai lô sản phẩm, lô thứ nhất có 10 sản phẩm loại I và 2 sản phẩm loại II. Lô thứ
hai có 16 sản phẩm loại I và 4 sản phẩm loại II. Từ mỗi lô ta lấy ngẫu nhiên một sản
phẩm. Sau đó, trong 2 sản phẩm thu được ta lại lấy hú hoạ ra 1 sản phẩm. Tìm xác suất
để sản phẩm lấy ra sau cùng là sản phẩm loại I.
Bài 10:
Có 2 lô gà. Lô thứ nhất gồm 15 con, trong đó có 3 con gà trống. Lô thứ hai gồm 20
con, trong đó có 4 con gà trống. Một con từ lô thứ hai nhảy sang lô thứ nhất. Sau đó từ
lô thứ nhất ta bắt ngẫu nhiên ra một con. Tìm xác suất để con gà bắt ra là gà trống.
Bài 11:
Một người có 3 chỗ ưa thích như nhau để câu cá. Xác suất câu được cá ở chỗ đó lần
lượt là 0,6; 0,7; 0,8. Biết rằng ở mỗi chỗ người đó thả câu 3 lần và chỉ câu được một
con cá. Tìm xác suất để cá câu được ở chỗ thứ nhất.
Bài 12:
Có 3 hộp phấn: hộp I có 7 viên phấn trắng và 3 viên phấn vàng; hộp II có 16 viên
phấn trắng và 4 viên phấn vàng; hộp thứ III có 42 viên phấn trắng và 8 viên phấn
vàng. Ta tung đồng thời 3 đồng xu cân đối và đồng chất: nếu được cả 3 mặt sấp thì
chọn hộp I; nếu được 1 mặt sấp và 2 mặt ngửa thì chọn hộp II; trường hợp còn lại chọn
hộp III. Từ hộp đã chọn đượic ta lấy ngẫu nhiên ra 1 viên phấn.
a) Tính xác suất để lấy được viên phấn trắng.
b) Giả sử ta lấy được viên phấn vàng từ hộp đã chọn. Tính xác suất để viên phấn đó
lấy được từ hộp III.
Bài 13:
Ba máy tự động sản xuất cùng một loại chi tiết, trong đó máy I sản xuất 25%, máy
II sản xuất 30% và máy III sản xuất 45% tổng sản lượng. Tỷ lệ phế phẩm của các máy
lần lượt là 0,1%; 0,2%; 0,4%. Tìm xác suất để khi chọn ngẫu nhiên ra một sản phẩm
từ kho thì:

22
a) Được chi tiết phế phẩm.
b) Chi tiết phế phẩm đó do máy I sản xuất.
Bài 14:
Ba khẩu pháo cùng bắn vào một mục tiêu với xác suất bắn trúng đích của mỗi khẩu
là 0,4; 0,7; 0,8. Biết rằng xác suất để mục tiêu bị tiêu diệt khi trúng một phát đạn là
30%, khi trúng 2 phát đạn là 70%, còn trúng 3 phát đạn thì chắc chắn mục tiêu bị tiêu
diệt. Giả sử mỗi khẩu pháo bắn 1 phát.
a) Tính xác suất để mục tiêu bị tiêu diệt.
b) Biết rằng mục tiêu đã bị tiêu diệt. Tính xác suất để khẩu thứ 3 có đóng góp vào
thành công đó.
Bài 15:
Có 12 lô hàng, mỗi lô có 20 sản phẩm. Các lô chia làm 3 loại: loại 1 có 5 lô, loại II có
4 lô, loại II có 3 lô. Lô loại I có 5 sản phẩm loại A, lô loại II có 10 sản phẩm loại A, lô loại
III có 15 sản phẩm loại A. Lấy ngẫu nhiên một lô hàng, trong lô hàng lấy ngẫu nhiên 1
sản phẩm.
a) Tính xác suất để sản phẩm lấy được là loại A.
b) Theo bạn sản phẩm loại A thường lấy ở lô loại nào.
Bài 16:
Có hai hộp sản phẩm: hộp I có 25 sản phẩm tốt và 5 sản phẩm hỏng; hộp II có 30
sản phẩm tốt và 10 sản phẩm hỏng.
a) Chọn ngẫu nhiên 1 hộp và từ đó lấy ra 1 sản phẩm. Tính xác suất để được 1 sản
phẩm tốt.
b) Dồn 2 hộp thành 1 rồi lấy liên tiếp ( lần lượt không hoàn lại ) 5 sản phẩm. Tính
xác suất để có ít nhất 1 sản phẩm hỏng.

23
CHƯƠNG 2: ĐẠI LƯỢNG NGẪU NHIÊN

Trong chương trước ta đã nghiên cứu các hiện tượng ngẫu nhiên dưới dạng các
biến cố ngẫu nhiên xuất hiện trong các phép thử. Trong thực tế ta thường gặp một loại
biến ngẫu nhiên khác là các đại lượng nhận giá trị với một xác suất nhất định, đó là đại
lượng ngẫu nhiên (hay biến ngẫu nhiên, viết tắt ĐLNN).
Trong chương này ta xét các ĐLNN, phân phối xác suất của chúng và các số đặc
trưng của ĐLNN: Kỳ vọng, phương sai.
2.1. ĐẠI LƯỢNG NGẪU NHIÊN
2.1.1. Định nghĩa
Đại lượng ngẫu nhiên (ĐLNN) là đại lượng mà trong kết quả của phép thử, nó nhận
một và chỉ một trong các giá trị có thể mà trước khi thực hiện phép thử ta không biết
chính xác giá trị đó bằng bao nhiêu.
ĐLNN được kí hiệu là X, Y, Z,… Các giá trị mà ĐLNN có thể nhận được thường viết
bằng chữ nhỏ: x, y, z,…
Ví dụ 2.1.1:
● Tung một đồng tiền xu cân đối đồng chất. Gọi X là số lần xuất hiện mặt sấp, thì X
chính là một ĐLNN với các giá trị có thể nhận được của X là 0,1.
● Gọi X là số đạn trúng đích khi bắn n viên đạn độc lập vào một mục tiêu. X là
ĐLNN với các giá trị có thể nhận được 0, 1, 2,…,n.

24
● Gọi X là số chấm ở mặt trên của con xúc sắc khi gieo một lần con xúc sắc cân đối
và đồng chất. X là biến ngẫu nhiên với giá trị có thể nhận là 0, 1, 2, 3, 4,5,6.
Nhận xét: Nếu X, Y là các ĐLNN thì X ± Y, X.Y, X/Y(Y ≠0), Xn (n > 0), cX ( c là hằng
số), cũng là các ĐLNN.
● Định nghĩa (ĐLNN rời rạc): X được gọi là ĐLNN rời rạc nếu chỉ nhận một số hữu
hạn hoặc vô hạn đếm được các giá trị.
Nghĩa là biến ngẫu nhiên rời rạc chỉ có thể nhận một số hữu hạn hoặc vô hạn các
giá trị rời rạc với nhau. Trong các ví dụ 2.1.1 ở trên X là ĐLNN rời rạc.
● Định nghĩa ( ĐLNN liên tục): X được gọi là ĐLNN liên tục nếu các giá trị của X
lấp đầy một khoảng nào đó.
Ví dụ 2.1.2: Gọi X là trọng lượng của trẻ sơ sinh thì X là ĐLNN. Ta có thể phân phối
xác suất cho trọng lượng của trẻ sơ sinh như sau:

Lớp (kg) Xác suất pi


[2; 3) 0,12 = P ( 2 ≤ X < 3 )
[3; 3,5) 0,28 = P ( 3 ≤ X < 3,5 )
[3,5; 4) 0,25 = P ( 3,5 ≤ X < 4 )
[4; 4,5) 0,15 = P ( 4 ≤ X < 4,5 )
[4,5; 5) 0,12 = P ( 4,5 ≤ X < 5 )
[5; 6] 0,15 = P ( 5 ≤ X ≤ 6 )
Ta có  pi = 1 và X có thể lấy bất kỳ giá trị nào trên [2, 6] nên X là ĐLNN liên tục.
2.1.2. Luật phân phối xác suất của ĐLNN
i

2.1.2.1. Bảng phân phối xác suất:


Bảng phân phối xác suất của ĐLNN rời rạc gồm 2 dòng:
- Dòng thứ nhất ghi các giá trị số của ĐLNN.
- Dòng thứ hai ghi xác suất tương ứng.
X x1 x2 ........ xn

P(X = xi) p1 p2 ………… pn

n
Với pi = P{X = xi};  pi = 1 .
i =1

Ví dụ 2.1.3: Tung đồng thời 2 đồng tiền cân đối và đồng chất. Gọi X là biến ngẫu
nhiên chỉ số lần xuất hiện mặt sấp. Ta có bảng phân phối xác suất sau:
X 0 1 2

25
P(X = xi) 1/4 2/4 1/4

Ví dụ 2.1.4: Một xạ thủ đem theo 5 viên đạn đến trường bắn để chỉnh súng trước
ngày thi đấu. Anh ta bắn từng viên 1 vào bia với xác suất trúng tâm là 0,9. Anh ta thử
súng theo cách sẽ thôi không bắn nữa nếu
a) Có 3 viên liên tiếp trúng tâm.
b) Có 3 viên trúng tâm.
Gọi X, Y là số đạn mà anh ta đã dùng để thử súng tương ứng theo 2 nguyên tắc trên.
Lập bảng phân phối xác suất của X:
X 3 4 5
P(X = xi) 0,93 0,93.0,1 1 - (0,93 + 0,93.0,1 )

Bảng phân phối xác suất của Y:


Y 3 4 5
P(Y = yi) 0,93 C13 .0,93.0,1 1- (0,93 + C13 .0,93.0,1 )

Hai ĐLNN độc lập


● Định nghĩa: Cho hai ĐLNN X, Y với các giá trị có thể của X là {x1, x2, …, xn}; của Y
là {y1, y2, …, ym}.
Hai ĐLNN X và Y được gọi là độc lập với nhau khi và chỉ khi:
P(X = xi, Y = yi) = P(X = xi).P(Y = yi), với mọi i, j.
Ví dụ 2.1.5: Cho hai ĐLNN X và Y độc lập với bảng phân phối xác suất như sau:
X 0 1 2 Y -1 1
P(X=xi) 0,3 0,4 0,3 P(Y=yi) 0,4 0,6

Hãy lập bảng phân phối xác suất của X2, X + Y, X.Y.
Giải:
X và Y độc lập với nhau nên mọi biến cố liên quan đến X độc lập với biến cố bất kỳ
liên quan đến Y.
Ta có P(X2 = xi2) = P(X = xi), tức là khả năng nhận giá trị xi cũng chính là khả năng
X2 nhận gía trị xi2. Vậy
X2 0 1 4
P(X2 = xi2) 0,3 0,4 0,3

Do X và Y độc lập nên:


P(X +Y = -1) = P(X = 0, Y = 1) = P(X = 0).P(Y= -1) = 0,12

26
P(X+Y = 0) = P(X = 1,Y = -1) = P(X = 1).P(Y = -1) = 0,16
Tương tự ta có:
P(X+Y = 1) = P(X = 0,Y = 1) + P(X = 2,Y = -1) = 0,3
P(X+Y = 2) = P(X = 1,Y = 1) = 0,24
P(X+Y = 3) = P(X = 2,Y = 1) = 0,18
Ta có bảng phân phối xác suất của X + Y:
X+Y -1 0 1 2 3
P(X+Y = k) 0,12 0,16 0,3 0,24 0,18

Hoàn toàn tương tự ta nhận được bảng phân phối xác suất của X.Y
X.Y -2 -1 0 1 2
P(X.Y = k) 0,12 0,16 0,3 0,24 0,18

2.1.2.2. Hàm phân phối xác suất


Để đặc trưng đầy đủ cho một biến ngẫu nhiên chúng ta có thể đưa ra một hàm thể
hiện được sự phân phối xác suất của biến ngẫu nhiên trên miền giá trị của nó và gọi là
hàm phân phối xác suất.
● Định nghĩa: Cho ĐLNN X.
Ánh xạ F: Ω → [0,1] thoả điều kiện F(x) = P(X < x) với mọi x R, được gọi là hàm
phân phối xác suất của ĐLNN X.
Từ định nghĩa trên ta có công thức sau:
Nhận xét: Nếu X là ĐLNN rời rạc nhận các giá trị số xi với xác suất tương ứng pi =
P(X = xi) thì F(x) =  pi (2.1.1)
x i x

( trong đó ký hiệu xi < x dưới dấu ∑ có nghĩa là tổng này được lấy theo mọi trị số xi của
ĐLNN nhỏ hơn x).
Ví dụ 2.1.6: Tung một con xúc sắc. Gọi X là số chấm xuất hiện. Tìm hàm phân phối
xác suất của X.
Giải:
Ta có bảng phân phối xác suất của X:
X 1 2 3 4 5 6
P 1/6 1/6 1/6 1/6 1/6 1/6

Theo định nghĩa ta có F(x) = P(X < x)


Với x ≤ 1 thì biến cố (X < x) = Ø nên F(x) = P(Ø) = 0
Với 1 < x ≤ 2 thì biến cố (X < x) = (X = 1) nên F(x) = P(X = 1) = 1/6.

27
Với 2 < x ≤ 3 thì biến cố (X < x) = (X = 1) + (X = 2) nên F(x) = P(X = 1) + P(X = 2) =
1/3.
Tương tự cho các trường hợp còn lại và ta có:
 0 khi x 1
1 / 6 khi 1  x  2

1 / 3 2 x3

F ( x) = 1 / 2 3 x 4
2 / 3 4 x5

5 / 6 5 x6

 1 x6
Ví dụ 2.1.7: Tung đồng thời 4 con xúc sắc. Gọi X là số mặt chẵn xuất hiện. Y là số
mặt lẻ xuất hiện.
a) Hãy lập bảng phân phối xác suất của X, của Y. Xác định hàm phân phối xác suất
của X.
b) Đặt Z = X.Y, lập bảng phân phối xác suất và hàm phân phối xác suất của Z.
Giải:
a) Ta có bảng phân phối xác suất của X:
X 0 1 2 3 4
P 1/16 4/16 6/16 4/16 1/16

Và bảng phân phối xác suất của Y


Y 0 1 2 3 4
P 1/16 4/16 6/16 4/16 1/16

Hàm phân phối xác suất của X là:

 0 khi x0
 1 / 16 0  x 1

 5 / 16 1 x  2
F ( x) = 
11 / 16 2 x3
15 / 16 3 x 4

 1 x4
b) Xét Z = X.Y.
Vì X +Y = 4, nên Z chỉ có thể nhận các giá trị 0, 3, 4.
Thật vậy:
Nếu X = 0 thì Y = 4, Z = 0.
Nếu X = 4 thì Y = 0, Z = 0.

28
Nếu X = 3 thì Y =1, Z = 3.
Nếu X = 2 thì Y = 2, Z = 4.
Nếu X = 1 thì Y = 3, Z = 3.
Từ đó:
(Z = 0) = (X = 0; Y = 4) + (X = 4; Y = 0) = (X = 0) +(X = 4)
Do hai biến cố xung khắc nên
P(Z = 0) = P(X = 0) + P( X = 4) = 1/8.
Tương tự, (Z = 3) = (X = 1; Y = 3)+ (X = 3; Y = 1) = (X = 1) +(X = 3);
P(Z = 3) = P(X = 1) + P( X = 3) = 4/8.
Và (Z = 4) = (X = 2; Y = 2) = (X = 2)
P(Z = 4) = P(X = 2) = 3/8.
Ta có bảng phân phối xác suất của Z:
Z 0 3 4
P 1/8 4/8 3/8

Hàm phân phối xác suất của Z có dạng:

 0 khi x0
1 / 8 0 x3

F ( z) = 
5 / 8 3 x 4
 1 x4
● Tính chất của hàm phân phối
i) 0 ≤ F(x) ≤ 1.
ii) Hàm phân phối của đại lượng ngẫu nhiên X là không giảm tức x1 < x2 thì
F(x1) ≤ F(x2).
iii) lim F ( x) = 1 và lim F ( x) = 0
x → x →−

iv) P( a ≤ X <b) = F(b) – F(a).


2.1.2.3. Hàm mật độ xác suất
Còn nhiều tính chất của ĐLNN mà chỉ nghiên cứu hàm phân phối xác suất của nó
thì không thể biết xác định được hết. Cũng như khi khảo sát một hàm số, nếu hàm
phân phối xác suất F(x) của ĐLNN X mà khả vi thì sự biến thiên của F(x) hay mật độ
tập trung xác suất của X có thể dễ dàng xem xét thông qua đạo hàm F’(x) và gọi là hàm
mật độ của X.
● Định nghĩa: Nếu đại lượng ngẫu nhiên liên tục X có hàm phân phối F(x) khả vi,
khi đó đạo hàm f(x) = F’(x) gọi là hàm mật độ xác suất của X.
● Tính chất của hàm mật độ: Nếu X có hàm mật độ f(x) thì:
29
i) f(x) ≥ 0, với mọi số thực x.
x
ii) F ( x) =  f ( x)dx
−
b
iii) P(a  X  b) =  f ( x)dx
a
+
iv)  f ( x)dx = 1
−

Nhận xét: Hàm mật độ của một ĐLNN liên tục X có vai trò giống bảng phân phối
xác suất của ĐLNN rời rạc, trong bảng cho ta biết mật độ tập trung xác suất của biến
ngẫu nhiên tại một số hữu hạn các điểm x1, x2, …, xn lần lượt là p1, p2, …,pn.
Ví dụ 2.1.8: Cho hàm số:
a khi x  0,1
f ( x) = 
0 khi x  0,1
a) Xác định a để f(x) là hàm mật độ của một ĐLNN liên tục X nào đó.
b) Tính P(1/4 < X < 1/2)
c) Xác định hàm phân phối xác suất của X.
Giải:
a) Điều kiện hàm f(x) là hàm mật độ xác suất của ĐLNN liên tục X là:

 f ( x)  0 x
+ 
 f ( x)dx = 1

− 
Từ điều kiện thứ hai thì ta có:
+ 0 1 +
1=  f ( x)dx =  0dx +  adx +  0dx = a
− − 0 1

Vậy với a = 1> 0 thoả mẫn điều kiện thứ nhất và hàm mật độ xác suất có dạng:
1 khi x  0,1
f ( x) = 
0 khi x  0,1
1/ 2
1
b) P(1/4 < X < 1/2) =  1dx =
1/ 4
4
c) Theo tính chất ii) của hàm mật độ xác suất ta có:
x
Với x ≤ 0 thì F ( x) =  0dx = 0
−
0 x
Với 0 < x ≤ 1 thì F ( x) =  0dx +  1dx = x
− 0
0 1 x
Với x > 1 thì F ( x) =  0dx +  1dx +  0dx = 1
− 0 1

30
Vậy hàm phân phối xác suất của ĐLNN liên tục X:
0 khi x0

F ( x) =  x 0  x 1
1 x 1

2.2.CÁC THAM SỐ ĐẶC TRƯNG CỦA ĐẠI LƯỢNG NGẪU NHIÊN
Các luật phân phối xác suất là sự mô tả đầy đủ nhất của ĐLNN, cho ta thông tin đầy
đủ về nó. Tuy nhiên trong thực tế nhiều khi không đòi hỏi phải biết các quy luật phân
phối của ĐLNN mà chỉ cần biết một số các đặc trưng cho ta thông tin về một mặt nào
đó của ĐLNN. Hai đặc trưng quan trọng nhất là kỳ vọng (hay số trung bình) và
phương sai.
2.2.1. Kỳ vọng của ĐLNN
2.2.1.1. Định nghĩa: Kỳ vọng của ĐLNN X, ký hiệu E(X), là số được xác định như
sau:
● Nếu X là ĐLNN rời rạc nhận các giá trị xi và các xác suất tương ứng pi = P(X = xi)
thì E ( X ) =  xi pi (nếu chuỗi hội tụ tuyệt đối) (2.2.1)
i

Ví dụ 2.2.1: Đại lượng ngẫu nhiên X có bảng phân phối xác suất như sau:
X -1 1 3
P 0,25 0.25 0,5

Khi đó kỳ vọng của X là: E(X) = -1(0,25) + 1.(0,25) + 3.(0,5) = 1,5


+
● X là ĐLNN liên tục có hàm mật độ xác suất f(x) thì E ( X ) =  xf ( x)dx
(2.2.2) −

(nếu tích phân hội tụ tuyệt đối)


Ví dụ 2.2.2: X là ĐLNN liên tục có hàm mật độ xác suất như sau:
 x −1
 khi x  1,4
f ( x) =  3
 0 khi x  1,4
Hãy tìm kỳ vọng của X.
Giải: Vì X liên tục nên theo công thức (2.2.2) ta có:
+ 4
1 27
E( X ) =  xf ( x)dx =
−
31 x( x − 1)dx =
6
2.2.1.2. Tính chất của kỳ vọng
i) E (C) = C với C - ĐLNN hằng.
ii) E ( X+Y ) = E(X) + E(Y)

31
iii) E ( α. X ) = α.E)X) (α R )
iv) E[X – E(X)] = 0
v) Nếu X > 0 thì E(X) > 0
vi) E(X.Y) = E(X).E(Y) thì X,Y độc lập.
( )( )
vii) Với X,Y là hai ĐLNN, ta có: E(X.Y )2  E X 2 .E Y 2 ( Bất đẳng thức Cauchy).
Ví dụ 2.2.3: Tung đồng thời 2 đồng xu. Gọi X là số mặt sấp xuất hiện. Y là số mặt
ngửa xuất hiện. Tính E(X2), E(Y2), E(X.Y).
Giải:
Bảng phân phối của X và Y cùng có dạng:

X 0 1 2
P 1/4 2/4 1/4
Khi đó E(X2) = E(Y2) = 02.(1/4) + 12.(2/4) + 22.(1/4) = 3/2
Do X + Y = 2 nên ta có bảng phân phối của X.Y:
X.Y 0 1

P 2/4 2/4

Và E(X.Y) = 0.(2/4) + 1.(2/4) = 2/4


2.2.2. Phương sai của ĐLNN
Giả sử ta có ĐLNN X với kỳ vọng E(X) = a, E(X) có thể được xem như thể hiện giá trị
trung bình của ĐLNN. Trong thực tế đôi khi người ta muốn xét xem các trị số của
ĐLNN phân phối như thế nào xung quanh kỳ vọng, người ta đưa ra khái niệm phương
sai để đo sự phân tán đó. Hiệu số X- a, biểu thị độ lệch ngẫu nhiên giữa X với kỳ vọng
E(X). Giá trị này liên quan trực tiếp đến độ phân tán của ĐLNN, do đó người ta muốn
dùng nó để làm cơ sở đánh giá độ phân tán của các trị số của ĐLNN xung quanh kỳ
vọng. Tuy nhiên vì E(X- a) = 0, nghĩa là giá trị trung bình của độ lệch luôn luôn bằng 0,
cho nên không thể lấy E (X – a) để đánh giá độ phân tán của X, vì vậy thay vào đó
người ta dùng kỳ vọng của bình phương độ lệch: E(X – a )2
2.2.2.1. Định nghĩa: Phương sai của ĐLNN X là kỳ vọng của bình phương độ lệch,
và ký hiệu là D(X),VarX,  2x .
Khi đó D(X) được xác định như sau:
D( X ) = E ( X − a) 2 =  ( xi − a) 2 pi với X là ĐLNN rời rạc (2.2.3)
i
+
D( X ) = E ( X − a) 2 =  ( x − a) 2 f ( x)dx với X là ĐLNN liên tục (2.2.4)
−

Ta có E(X - a)2 = E( X2 – 2X.a +a2) = E(X2) – 2a.E(X) +a2 =

32
= E(X2) – 2.(E(X))2 + (E(X))2 = E(X2) – (E(X))2(do a = E(X))
Từ đó ta có công thức tính phương sai D(X) = EX2- (EX)2 (2.2.5)
(X) = DX = VarX gọi là độ lệch chuẩn của biến ngẫu nhiên X.
2.2.2.2. Ý nghĩa của phương sai
Phương sai biểu thị độ tập trung hay phân tán của các giá trị của đại lượng ngẫu
nhiên xung quanh kỳ vọng của nó.
Nếu D(X) càng lớn thì các giá trị của đại lượng ngẫu nhiên càng phân tán.
Nếu D(X) càng bé thì các giá trị của đại lượng ngẫu nhiên càng tập trung quanh kỳ
vọng của nó.
● Trong công nghiệp, phương sai biểu thị độ chính xác của các sản phẩm.
● Trong chăn nuôi, phương sai biểu thị độ tăng trưởng đồng đều của các gia súc.
● Trong trồng trọt phương sai biểu thị mức độ ổn định của năng suất.
Ví dụ 2.2.4: X là ĐLNN rời rạc có bảng phân phối xác suất:

X 1 2 3 X2 1 4 9

P 0,3 0,3 0,4 P 0,3 0,3 0,4

Ta có: a = E(X) = 2,1


D(X) = E(X – a )2
= (1-2,1)2(0,3) + (2- 2,1)2(0,3) + (3-2,1)2(0,4) = 0,69.
(X) = DX = VarX = 0,69

Ví dụ 2.2.5: X là ĐLNN liên tục có hàm mật độ xác suất:



khi x  0,1
1
x +
f ( x) =  2
 0 khi x  0,1
Hãy tìm D(X)
Giải: Vì X là ĐLNN liên tục nên
+
 1
1
7
E( X ) = −xf ( x)dx = 0 x x + 2 dx = 12
+
 1
1
5
E ( X 2 ) =  x 2 f ( x)dx =  x 2  x + dx =
− 0  2 12
Từ đó D(X) = E(X2) – (E(X))2 = (5/12) – (7/12)2 = 11/144
2.2.2.3. Tính chất của kỳ phương sai
i) D(C) = 0 ; C – ĐLNN hằng
ii) D(αX) = α2.D(X)
iii) D(X + Y) = DX + DY nếu X và Y độc lập.

33
iv) D(X + C) = DX; C- biến ngẫu nhiên hằng
v) DX ≥ 0 với mọi X và DX = 0 khi và chỉ khi X = C.
Nhận xét:Vì D(X) có cùng đơn vị với (X - a)2 nên ta định nghĩa thêm σ(X ) = DX
gọi là độ lệch chuẩn của biến ngẫu nhiên X. Khi đó σ(X) có cùng đơn vị với (X - a)
nghĩa là cùng đơn vị với X.
2.2.3. Mốt và trung vị
Ngoài kỳ vọng là đặc trưng quan trọng nhất về vị trí của ĐLNN. Trên thực tế đôi khi
người ta còn dùng các đặc trưng về vị trí mốt (mod) và trung vị (Median)
2.2.3.1. Định nghĩa: Mốt của ĐLNN X ký hiệu là modX là:
● Giá trị xi có pi cực đại đối với ĐLNN rời rạc X.
● Giá trị x tại đó hàm mật độ f(x) cực đại đối với ĐLNN liên tục X.
Nhận xét: ĐLNN có thể có một hay nhiều mốt.
Ví dụ 2.2.6: Trong gia đình có hai người con. Gọi X là số con trai. Bảng phân phối
của X là:
X 0 1 2
P 0,25 0,5 0,25

Từ đó ta có mod X= 1 vì P(X =1) = 0,5 là xác suất lớn nhất.


Ví dụ 2.2.7: Trong gia đình có 3 người con. Gọi X là số con trai. Khi đó ta có
X 0 1 2 3
P 1/8 3/8 3/8 1/8
Ta có mod X =1 vì P(X = 1) = 3/8; mod X = 2 vì P(X = 2) = 3/8

Ví dụ 2.2.7: Cho X là ĐLNN liên tục có hàm mật độ:


x2
1 −
f ( x) = e 2
2
Ta có f(x) đạt cực đại tại x = 0. Do đó mod X = 0.
2.2.3.2. Định nghĩa: Trung vị (hay median) của ĐLNN X là số m của X sao cho P(X
< m) ≤ 1/2 và P(X > m) ≥1/2, ký hiệu là med X.
Ý nghĩa hình học của trung vị: Trung vị là hoành độ của đại lượng ngẫu nhiên tại đó
diện tích giới hạn bởi đường cong mật độ được chia làm hai phần có diện tích bằng
nhau. Trường hợp đại lượng ngẫu nhiên X có phân phối đối xứng và có modX thì ba
đặc số: trung vị, mốt và kỳ vọng trùng nhau.
Ta trở lại ví dụ 2.2.6, ta có P(X < 1) = P(X >1), suy ra med X =1.
Trong ví dụ 2.2.7 P(X > 0) = P(X < 0) = 1/2, suy ra med X = 0.
2.3.CÁC QUI LUẬT PHÂN PHỐI XÁC SUẤT THÔNG DỤNG

34
2.3.1. Đại lượng ngẫu nhiên rời rạc
2.3.1.1. Luật phân phối nhị thức B(n,P).
● Định nghĩa: Nếu thực hiện một dãy phép thử Bernoulli, (n phép thử lặp độc lập),
trong mỗi phép thử chỉ quan tâm tới biến cố A với xác suất P(A) = p. ĐLNN X biểu diễn
số lần xuất hiện A trong n phép thử tương ứng sẽ nhận các giá trị 0, 1,…, n và X có hàm
xác suất:
P( X = k ) = Cnk p k q n−k trong đó q = 1 -p (2.3.1)
Hay có bảng phân phối xác suất:
X 0 1 ... x ….. n
P qn npqn-1 … Cxnpx qn− x ….. pn

Khi đó X gọi là tuân theo luật phân phối nhị thức, ký hiệu: X~ B(n,p).
Ví dụ 2.3.1: Tại một địa phương theo số liệu thống kê cho biết có 25% dân số bị
sốt rét. Chọn ngẫu nhiên 6 người. Tính khả năng để có 4 người bị sốt rét.
Giải:
Mỗi lần chọn ngẫu nhiên một người, có hai khả năng xảy ra bị sốt rét hoặc không,
với P(sốt rét) =1/4.
Gọi X là số người bị sốt rét trong 6 lần chọn, X~ B(6, 1/4). Suy ra:
4 2
1 3
P( X = 4) = C64     = 0,0333
4  4
● Định lý: Nếu X ~ N(n, p) thì:
i) np - q ≤ Mod X ≤ np+q
ii) E(X) = np
iii) D(X) = npq
Chứng minh:
i) Đặt pk = P(X= k)
Ta xét trường hợp pk+1 ≥ pk
n! n!
 pk +1q n − k −1  pk q n − k
( k + 1)!( n − k − 1)! k! ( n − k )!
p q
   np − q  k(p + q) = k.
k +1 n − k
Đặt k0 là số nguyên bé nhất lớn hơn hay bằng np-q, ta có:
np – q ≤ k0 <np – q + 1 = np +p. Suy ra np – q ≤ k0 <np+p
Xét k sao cho k ≤ k0 thi k ≥ np-q. Suy ra pk+1 ≤ pk (k ≤ k0)
Vậy {pk} là dãy tăng (k ≤ k0). Suy ra pk≤ pko (k ≤ k0).
Xét k sao cho k0 ≤ k thì np - q ≤ k. Ssuy ra pk+1 ≥ pk (k ≥ k0)
Vậy {pk}là dãy giảm (k ≥ k0)  pk  p ( k  k 0 )
k0
35
Kết luận: np - q ≤ mod X ≤ np + q.
ii)Ta sẽ chứng minh (ii) và (iii) đồng thời.
Đặt Xi là số lần xuất hiện A ở phép thử thứ i (i = 0,1,…,n), khi đó bảng phân phối của
X có dạng:
X 0 1

P p q = 1- p

Suy ra E(Xi) = p, D(Xi) = pq.


Do X = X1 + X2 +…+ Xn và X1, X2,…, Xn độc lập nên
E(X) = E(X1) + E(X2) +…+ E(Xn) = np
D(X) = D(X1) + D(X2) +…+ D(Xn) = npq
Ví dụ 2.3.2: Tung 5 lần một đồng xu. Gọi X là số lần xuất hiện mặt sấp trong 5 lần
tung. Tính mod X, EX, DX.
Giải:
Ta có X~ B(5, 1/2) ; q = p = 1/2
Suy ra: np – q = 2. Mod X = 2. EX = np = 2,5; DX = npq = 1,25
2.3.1.2. Luật phân phối Poisson
● Định nghĩa: Thực hiện n dãy phép thử lặp độc lập, trong mỗi phép thử chỉ quan
tâm đến sự xuất hiện biến cố A với xác suất P(A) = p. Cho n →  , p → 0 sao cho np →
λ là một hằng số, khi đó:
λ x e−λ
Cxn px q n − x →
x!
Đại lượng ngẫu nhiên X nhận các giá trị (0, 1, 2,…) và có hàm xác suất:
x e −
P ( X = x) = (x = 0, 1, 2,…) (2.3.2)
x!
Hay có bảng phân phối xác suất:
X 0 1 …. k …..
P λ1e−λ λ k e−λ
e−λ …. …
1! k!
được gọi là tuân theo luật phân phối Poisson, ký hiệu là X~ P(  )
● Định lý: Nếu X~ P(  ) với tham số λ thì:
i) EX =  .
ii) DX =  .
iii)  -1 ≤ Mod X ≤  .

36
Chú ý: Định lý nói rằng trong phân phối nhị thức nếu n lớn, p nhỏ, np = λ thì ta có
thể xấp xỉ nhị thức bằng Poisson để việc tính dễ dàng hơn.
Ví dụ 2.3.3: Cho X~B(50, 1/10). Tính P(X - 10). Ta có n lớn, p nhỏ và np = 5.
10
P(X = 10)  e− 5  5  0.018 .
10!
Ví dụ 2.3.4:
a) Trong một lô thuốc, tỷ lệ thuốc hỏng p = 0,003. Kiểm nghiệm 1000 ống. Tính xác
suất để gặp 3 ống bị hỏng.
b) Giả sử xác suất tử vong của bệnh sốt xuất huyết là 0,7%. Tính xác suất để có
đúng 5 người chết do sốt xuất huyết trong 1 nhóm 400 bệnh nhân.
Giải:
a) Do p = 0,003 bé, n = 1000 lớn và np = 3 = λ
Gọi X là số viên thuốc hỏng trong 1000 viên. Khi đó X ~ P(λ) nên
3
P(X = 3) = e− 5  3  0.224
3!
b) Với λ = np = 400.0,007 = 2,8 nên
2,85
P(X = 5) = e− 2,8   0.0872 .
5!
2.3.1.3. Luật phân phối siêu bội.
● Định nghĩa: ĐLNN X có phân phối siêu bội là biến ngẫu nhiên rời rạc nhận các
giá trị k = 0, 1, 2,…, n với hàm xác suất
C mk C nn−−mk
pk = P(x) = (2.3.3)
C nk
Hay có bảng phân phối xác suất:
X 0 1 …. i ….. n
k 0
P C0mCkn − m C1mCkn −−1m i k −i
…. CmCn − m … Cm C n − m
Ckn Ckn Ckn Ckn

Khi đó đại lượng ngẫu nhiên X gọi là tuân theo luật phân phối siêu bội, ký hiệu là X
~ H(n, k, p) , với p = m/n.
Ví dụ 2.3.5: Một hộp gồm 20 viên bi, trong đó có 8 viên đỏ. Lấy ngẫu nhiên 5 viên.
Tính xác suất để có không quá 2 viên đó.
Giải:
Gọi X là số viên bi đỏ trong 5 viên được lấy ra.
Xác suất để không có quá hai viên bi đỏ là
1
P ( X  2) = p 0 + p1 + p 2 = 5
(C80 C125 + C81C124 + C82 C123 )
C 20
37
n−k
● Định lý: Nếu X ~ H(n, k, p) thì EX = kp và DX = kpq (2.3.4)
n −1
Ví dụ 2.3.6: Gọi X là đại lượng ngẫu nhiên trong ví dụ 2.3.5. Tính DX và EX.
Giải:
Ta có X ~ H(20, 5, 8/20)
Theo công thức (2.3.4) ta có EX = 2; DX =18/19.
Nhận xét: Cho X ~ H(n, k, p) khi n khá lớn và p khá nhỏ ta có thể xấp xỉ X ≈ B(n, p).
2.3.2. Đại lượng ngẫu nhiên liên tục
2.3.2.1. Luật phân phối đều
● Định nghĩa: ĐLNN X có phân phối đều liên tục trên [a,b], ký hiệu X ~ U(a,b) nếu
có hàm mật độ có dạng:
 1
 a xb
f ( x) =  b − a
 0 x  a; x  b
● Định lý:
a+b (b − a) 2
Nếu X~ U(a,b) thì E ( X ) = ; D( X ) =
2 12
2.3.2.2. Luật phân phối chuẩn
● Định nghĩa :
−x 2
1
i) Hàm ( x ) = e 2 là hàm mật độ của hàm Gauss.
x
2 
ii) Hàm F ( x) =   (t )dt là hàm phân phối Gauss.
−
x
iii) Hàm  ( x ) =  ( t )dt là tích phân Laplace.
0

● Định nghĩa: Đại lượng ngẫu nhiên liên tục X được gọi là tuân theo luật phân phối
chuẩn, ký hiệu X~ N(a, σ2 ), nếu X có hàm mật độ xác suất:
2
1  x−a 
1 −  
2  
f ( x) = e (2.3.5)
 2
Trong đó a và σ là các hằng số, được gọi là các tham số của phân phối (σ > 0).
● Định lý: Cho X ~ N(a, σ2) ta có:
i) E(X) = a
ii) D(X) = σ2
iii) med X = mod X = a
● Định lý: Nếu X ~ N(a, σ2) thì phép đổi biến Z = (X – a)/σ cho ta một ĐLNN phân
phối chuẩn tắc với EZ = 0, DZ = 1, tức là Z ~ N(0, 1).
Chứng minh:
Ta có X < x  X – a < x – a  (X – a)/ σ ~ N(0, 1)

38
 X −a x−a
Do đó P ( Z  z ) = P   = P( X  x)
   
x−a
2
x 1  t −a   1 z 1
1 −   1 − v2 1 − v2
  
2  
= e dt = e 2
dv = e 2
dv
− 2 − 2 − 2
1
1 − z2
Hàm mật độ của Z là f ( z ) = F ' ( z ) = e 2

2
Vậy Z ~ N(0, 1).
● Định lý: Nếu Z ~ N(0, 1) khi đó với t > 0 thì:
i) P(0 ≤ Z ≤ t) = Φ(t), do đó P(-t ≤ Z ≤ t) = P(|Z| ≤ t) = 2Φ(t)
ii) Φ(- t) = - Φ(t) (Φ là hàm lẻ).
● Định lý: Nếu X ~ N(a, σ2) thì:

i) F(x) = 1 +  x − a 
2   
 −a  − a 
ii) P (  X   ) = F (  ) − F ( ) =   −  
     
     
iii) P ( X − a   ) =   −  −  = 2 
     
1  − a 
iv) P( X   ) = F ( ) = +  
2   
1  − a 
v) P( X   ) = 1 − F ( ) = −  
2   
● Hệ quả:
Cho X~ N(a, σ2) thì:
i) P(a – σ ≤ X ≤ a + σ) = 2Φ(1) = 0,68
ii) P(a – 2σ ≤ X ≤ a + 2σ) = P(| X – a | ≤ 2σ) = 0,955
iii) P(a – 3σ ≤ X ≤ a + 3σ) = P(| X – a | ≤ 3σ) = 0,997
● Quan hệ giữa phân phối chuẩn và nhị thức
Cho X ~ B(n, p). Khi n lớn và p không quá gần 0 hay 1 ta có thể xấp xỉ X ≈
N(np,npq)
(xấp xỉ này sẽ tốt hơn nếu np ≥ 5 khi p ≤ 0,5 hoặc nq ≥ 5 khi p ≥ 0,5). Khi đó ta có:
  − np   
P(  X   )    −   − np  (2.3.6)
 npq   npq 
  −np    
  
 npq 
P( X =  )    trong đó φ là hàm Gauus
npq
Ví dụ 2.3.7: Xác suất sinh được bé gái là 0,52. Tính xác suất sao cho trong 300 em
bé sắp sinh:
a) Có 180 bé trai.
b) Số bé trai sinh ra khoảng từ 150 đến 170.
39
c) Số bé trai sinh ra ít hơn 170.
Giải:
Xác suất sinh được bé trai là p = 1 – 0,52 = 0,48
Gọi X là ĐLNN biểu thị số bé trai trong 300 em bé được sinh ra.
Ta có X ~ B(300; 0,48). Do n = 300 khá lớn, p = 0,48 nên ta xấp xỉ X ≈ N(np,npq)
a) Ta có:
1  170 − np  1  170 − 300.0,48 
P( X = 170) =  =   
npq  npq  300.0,48.0,52  300.0,48.0,52 
= 0,1156.φ (3,00) = 0,1156.0,0044 = 0,0055
b) Theo công thức (2.3.6) ta có:
 170 − np       
P(150  X  170) =   −  150 − np  =  170 − 300.0,48  −  150 − 300.0,48 
 npq   npq   300.0,48.0,52   300.0,48.0,52 
       
= Φ (3,00) – Φ (0,69) = 0,4987 – 0,2549 = 0,2438
c) Ta có:
 170 − np  1  
P( X  170) =
1
−   = −  170 − 300.0,48 
2  npq  2  300.0,48.0,52 
   
= (1/2) - Φ (3,00) = (1/2) – 0,4987 = 0,0013
2.3.2.3. Luật phân phối khi bình phương χ 2 ( n ).
● Định nghĩa: ĐLNN liên tục X > 0 được gọi là có phân phối khi bình phương với
bậc tự do n nếu hàm mật độ xác suất của X có dạng:
 1
n
−1 −
x

 n
2
x .e 2
khi x  0
  n 
f ( x ) =  2  
2 (2.3.7)
 2
 0 khi x  0
Ký hiệu X ~ χ2 (n)
Người ta chứng minh được rằng hàm Γ(x) (hàm gamma) này hội tụ khi x > 0 và có
được xác định:

Γ(x) =  t x −1e −t dt
0

Hàm trên có tính chất:


i) Γ(x + 1) = x.p(x)
ii) Γ(k + 1) = k! với k là số nguyên.
1
iii)   = 
2
● Định lý: Cho X ~ χ2 (n). Ta có:
i) E(X) = n
ii) D(X) = 2n
40
● Các tính chất:
i) Cho X ~ χ2 (m) và Y ~ χ2 (n). Nếu X, Y độc lập nhau ta có: X + Y ~ χ2 (m + n).
ii) Nếu X ~ N(0, 1) thì Y = X2 ~ χ2 (1).
iii) Nếu X1 ~ χ2 (m1), X2 ~ χ2 (m2),…, Xk ~ χ2 (mk) và X1, X2,…, Xk độc lập nhau thì:
X1 + X2 +…+ Xk ~ χ2 (m1 + m2 +…+ mk).
iv) Nếu X1, X2,…, Xk độc lập nhau và có phân phối chuẩn N(0, 1) thì X12 + X22 +…+
Xk2 ~ χ2 (k).
Ví dụ 2.3.8:
a) Cho X ~ χ 2(12). Tìm P[X > 23,3]
b) Cho X ~ χ 2(20) . Tìm χ 2 thỏa mãn P[X > χ 2 ] = 0,95.
Giải:
a) Với n = 12, χ 2 = 23,3; lấy hàng n =12, giá trị 23,3 nằm trên cột ứng với 0,025.
Vậy
α = 0,025 hay P[X > 23,3] = 0,025.
b) Với n =20, α = 0,95; tra bảng 5, lấy hàng n = 20 và cột α = 0,95 ta được χ 20,95(20)
= 10,9.
2.3.2.4. Luật Student
● Định nghĩa: Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối Student n
bậc tự do, ký hiệu X ~ T(n), có hàm mật độ xác suất:
 n + 1
  n +1

 2  x2  2
f ( x) = 1 +  ( x R , n > 0) (2.3.8)
 n   n 
 
2
● Định lý: Nếu X ~ T(n), thì EX = 0 và DX = n .
n−2
Với n ≥ 30, phân phối T(n) gần trùng với phân phối N(0,1).

Ví dụ 2.3.9: Cho t là ĐLNN phân phối Student với n = 19, cột 0,1. Ta có t0,119 =
1,792

Điều đó có nghĩa là; P(t ≤ -1,729) = P(t ≥ 1,729) = 5% = 0,05.


2.3.3. Các định lý giới hạn
Các định lý giới hạn và luật số lớn là một trong những kết quả đặc thù và lý thú của
lý thuyết xác suất. Ý nghĩa của chúng không chỉ là những kết quả đẹp về mặt toán học,
mà chủ yếu đem lại nhiều cơ sở cho các lập luận của thống kê toán học khi làm việc với
đám đông (mẫu).
2.3.3.1. Sự của dãy biến ngẫu nhiên
● Định nghĩa: Dãy {Xn} các ĐLNN được gọi là hội tụ theo xác suất đến hằng số C
nếu với mọi ε > 0 thì lim P( X n − C   ) = 0 (2.3.9)
n →

41
Ký hiệu: X n ⎯ p
⎯→ C
● Định nghĩa: Giả sử dãy {Xn} các ĐLNN có dãy các hàm phân phối xác suất tương
ứng {Fn(x)} và ĐLNN X có hàm phân phối F(x). Ta nói rằng dãy {Xn} hội tụ theo luật
đến X, ký hiệu Xn ⎯⎯→
L
X nếu dãy hàm {Fn(x)} hội tụ đến hàm F(x) tại mọi điểm liên
tục của F(x).
2.3.3.2. Các định lý giới hạn Movre-Laplace
● Định lý: Cho một dãy các phép thử độc lập. Gọi p là xác suất xuất hiện biến cố A
trong mỗi phép thử. Pn(k) là xác suất A xuất hiện k lần trong n phép thử. Khi đó
 ( k − np ) 
2


lim Pn (k ) −
1
e 2 npq =0 (2.3.10)
n → 
 2npq 
● Định lý: Cho một dãy các phép thử độc lập. Gọi p là xác suất xuất hiện biến cố A
tròng mỗi phép thử. Pn(k1, k2) là xác suất A xuất hiện k1< k < k2 lần. Khi đó
 1
x2

t2  k − np
lim Pn (k1 , k 2 ) − e 2
dt  = 0 với xi = i (i = 1,2) (2.3.11)
n →  
 2 x1  npq
Khi n khá lớn thì
x2 t2
1 −
Pn (k1 , k 2 ) =
2
e
x1
2
dt = ( x2 ) − ( x1 )

Ví dụ 2.3.10: Loại bệnh B chiếm 10% dân số. Chọn ngẫu nhiên 100 người. Tính
xác suất:
a) Có 6 người bị bệnh B.
b) Không có tới 6 người bị bệnh B.
c) Số người bị bệnh trong khoảng 6 -12 người. Gọi X là số người bị bệnh B trong
100 lần chọn
Giải:
Ta có X ~ B(100,1/10).
6 94
a) P(X = 6) = 6  1 9
C100    
 10   10 
b) P(X ≤ 5) = P(0) + P(1) +…+ P(5)
c) P(6 ≤ X ≤ 12) = P(6) + P(7) +…+ P(12)
Phép tính các xác suất trên rất cồng kềnh, ta áp dụng định lý Moivre-Laplace:
1  6 − 100.0,1  1
P( X = 6) =   =  (−1,34) = 0,3.0,16 = 0,053
100.0,1.0,9  3  3
 12 − 10   6 − 10 
P (6  X  12) =   −   =  (0,67) +  (1,33)
 3   3 

42
2.3.3.3. Định lý giới hạn Poisson
● Định lý: Cho một dãy các phép thử độc lập. Gọi p là xác suất xuất hiện biến cố A
trong mỗi phép thử. Pn(k) là xác suất A xuất hiện k lần trong n phép thử.
Khi đó, nếu n →  và p → 0 sao cho: np = λ =const thì ta có:
k −
lim Pn (k ) = e
n → + k!
Từ công thức trên, khi n đủ lớn và p đủ bé, đặt λ = np ta có công thức xấp xỉ:
k k2
i
Pn (k )  e − và Pn (k1 , k 2 )   e −
k! i = k1 i!
λi −λ
k2
(2.3.12)
Pn ( k1 , k 2 )   e
i = k 1 i!

Ví dụ 2.3.11: Tỷ lệ phế phẩm của một loại sản phẩm là 0,2%. Tìm xác suất để trong
1000 sản phẩm:
a) Có 12 phế phẩm.
b) Có không quá 10 phế phẩm.
Giải:
Ở đây n = 100; p = 0,002; λ = np = 1000.0,0002 = 2
Sử dụng bảng ta được:
12 −2
a) P1000(k =12) = 2 e = 0,000001
12!
10 i −2
b) P1000(0;10) =  2 e = 0,999992
i = 0 i!
2.3.3.4. Định lý giới hạn trung tâm
Trực tiếp suy rộng của định lý giới hạn Moivre - Laplace là định lý giới hạn trung
tâm. Định lý sau đây do Lindeberg chứng minh (1992). Sau đó được nhiều tác giả suy
rộng.
● Định lý giới hạn trung tâm
Cho một dãy {Xn} các đại lượng ngẫu nhiên độc lập có cùng phân phối. Giả sử μ =
E(Xk), σ2 = D(Xk) với mọi k và hai số α < β.
n
 S − n 
Khi đó với S n =  X k ta có P   n    → F (  ) − F ( ) (khi n →  )
k =1   n 
(2.3.13)
x z2
1 −
Trong đó F ( x) =
−
 2
e 2
dz .

Như vậy F(x) là hàm phân phối xác suất của ĐLNN Z có phân phối chuẩn Z ~
S
N(0,1). Để đơn giản, ta ký hiệu X = n . Khi đó:
n

43
S n − n n X − n X −
= =
 n  n 
n
● Hệ quả 1: Trong thực tế người ta sự dụng công thức xấp xỉ này với n ≥ 30 . Từ
đây ta có một kết luận thú vị khác.
n

S X + X 2 + ... + X n X k
Do X = n = 1 = k =1

n n n
Với
n
n ≥ 30: Thực tế trừ những tính toán yêu cầu độ chính xác cao, người ta coi
X =  X k là ĐLNN phân phối chuẩn, tức là X ~ N(EX,  X ).
2

k =1

Đó là hệ quả của định lý giới hạn trung tâm. Ý nghĩa của nó như sau: Khi có nhiều
lần một loại nhân tố ngẫu nhiên nào đó tác động, thì sự tích luỹ thật nhiều lần kết quả
tác động đó có dạng chuẩn.
Nó cho phép kết luận: Rất nhiều tác động ngẫu nhiên trong đời sống là ĐLNN phân
phối chuẩn.
Ví dụ 2.3.12: Khảo sát ở một vùng trồng chuyên canh cam có thể xem trọng lượng
của trái cam là ĐLNN có kỳ vọng là 220 gram và độ lệch tiêu chuẩn là 20 gram.
a) Mỗi sọt cam chứa 100 trái. Gọi X là trọng lượng riêng của sọt (trừ bao bì). Tìm
phân phối của X.
b) Mỗi sọt sẽ được xếp loại A nếu trọng lượng riêng ít nhất là 22kg. Lấy ra một sọt
bất kỳ một cách ngẫu nhiên. Tìm xác suất để xuất lấy ra được một sọt loại A.
c) Mua 36 sọt. Xếp lên xe tải một cách ngẫu nhiên. Tính xác suất để trong đó số sọt
loại A ít nhất được 15 sọt và nhiều nhất được 24 sọt.
Giải:
a) Do số lượng cam nhiều, việc hái và xếp cam vào sọt có thể coi là hoàn toàn ngẫu
nhiên. Mỗi sọt chứa 100 trái. Vậy trọng lượng riêng của sọt là:
X = X1 +…+ Xi +…+ X100.
Các trọng lượng từng trái Xi có thể xem là ĐLNN độc lập.
100
Ta có: EX =  E( X
i =1
i ) = 110.220 gr = 22 kg
100
DX =  D( X
i =1
i ) = 110.(20 gr)2 = 40000 gr2

Suy ra  X = DX = 200gr.

Do n =100 và các Xi có phân phối giống nhau, độc lập. Từ đó, ta có X là đại lượng
ngẫu nhiên có phân phối chuẩn X ~ N(22kg; 0,2kg).
b) Lấy ngẫu nhiên một sọt.
P( Sọt lấy ra thuộc loại A) = P(trọng lượng riêng ≥ 22kg)

44
= P(X ≥ 22kg) = P(X ≥ EX = 22kg) =1/2 ( do X là phân phối chuẩn).
c) Xếp lên xe 36 sọt một cách ngẫu nhiên. Tức là 36 lần lặp lại một công việc. Gọi p
xác suất để lấy ra một sọt loại A bằng 0,5 ( là xác suất thành công của một phép thử
ngẫu nhiên).
Vậy số sọt loại A là một đại lượng ngẫu nhiên có phân phối nhị thức với n = 36;p=
0,5
Gọi Y là số sọt loại A có trong 36 sọt. Ta tìm:
 24 − 18   15 − 18 
P (15  Y  24)    −   =  (2) −  (1) = 0,8175
 3   3 
2.3.3.5. Luật số lớn
● Định lý: Giả sử {Xk} là dãy biến ngẫu nhiên độc lập có kỳ vọng hữu hạn, phương
sai bị chặn bởi một hằng số (DXk < C với mọi k). Khi đó với mọi ε > 0:
 S − E (S n ) 
lim P n    = 1
n →
 n 
Chứng minh:
n
Sn
Do S n =  X k ; X = là ĐLNN, ta có:
k =1 n
 n 
  Xk  n
E ( X ) = E  k =1  = 1 E ( X ) là hữu hạn
 n  n k =1
k

 
 
Theo giả thuyết bị chặn của phương sai D(Xk), ta có:
 n 
 Xk  n
D( X ) = D k =1 = 1 nC C
 n  n k =1 2  D( X k )  2 =
n n
 
 
D( X ) C
Từ đó P( X − E ( X )   )  1 − 2  1 − 2 .
 n

Do xác suất không vượt quá 1, cho nên:


 S − E (S n ) 
lim P( X − E ( X )   ) = 1 hay lim P n    = 1
n → n →
 n 
● Định lý: Cho dãy biến ngẫu nhiên {Xk} có phân phối giống nhau với a = E(Xk), σ2
= D(Xk). Khi đó với mọi ε > 0 tuỳ ý:
 X + ... + X n 
P 1 − a    → 0(n → ) (2.3.14)
 n 
Ý nghĩa thực tế của mệnh đề này rất lớn, khi n đủ lớn gía trị trung bình của các
ĐLNN sẽ rất gần a.

45
Ví dụ 2.3.13: Mỗi chuyến tàu đi qua, sẽ làm mòn đường ray trung bình 0,015 mm
mỗi bên. Sau 1000 chuyến tàu, đường ray mỗi bên sẽ mòn bao nhiêu?
Giải:
Lượng đường ray bị mòn, sau khi chuyến tàu thứ k đi qua, là một biến ngẫu nhiên
Xk, với E(Xk) = 0,015 mm = a với n =1000 khá lớn.
1000
Độ hao mòn tổng cộng là X
k =1
k là một biến ngẫu nhiên.
X 1 + ... + X 1000
Trung bình của nó X = sẽ rất gần giá trị a = 0,015mm.
1000
1000
Vậy tác động tổng cộng có thể tính là X
k =1
k  1000.a = 0,015 mm.

Luật số lớn sẽ còn rất nhiều lợi ích trong thống kê toán học.
● Định lý (Bernoulli): Cho dãy các phép thử Bernoulli. Gọi fn = m/n là tần suất, m
là số lần xuất hiện biến cố A trong n phép thử đầu tiên, p là xác suất xảy ra biến cố A.
Với ε > 0, ta có:
lim P( f n − p   ) = 1 (2.3.15)
n →

Chính kết luận của định lý này đã mang lại cơ sở khoa học cho định nghĩa xác suất
p theo thống kê.

BÀI TẬP THẢO LUẬN CHƯƠNG 2


Bài 1
Cho hai biến ngẫu nhiên độc lập X, Y với các phân phối

X -1 0 1 2

P 0,2 0,3 0,3 0,2

46
Y -1 0 1

P 0,3 0,4 0,3

a) Lập bảng phân phối xác suất của X2, X + Y, 2Y, X - 2Y và X.Y.
b) Tính kỳ vọng, phương sai của X2, X + Y, 2Y, X - 2Y và X.Y.
Bài 2
Tung đồng thời 2 đồng xu. Gọi X là số mặt sấp xuất hiện.
a) Lập bảng phân phối xác suất của X.
b) Lập hàm phân phối xác suất của X.
c) Tính P(X≤ 1).
Bài 3: Hai người thợ săn độc lập bắn vào một con thú, xác suất bắn trúng của mỗi
người lần lượt là 0,7:0,8. Mỗi người bắn 2 viên. Gọi X là số viên đạn bắn trúng con thú.
a) Hãy lập bảng phân phối xác suất của X.
b) Tính xác suất để số viên đạn trúng thú thì bằng nhau.
Bài 4
ĐLNN X được gọi là có phân phối mũ nếu hàm mật độ của nó có dạng:
 −x
 khi x  0
f ( x) = a.e
 0 khi x  0
Hãy xác định:
a) Hệ số a.
b) Hàm phân phối xác suất của X. Tính P(0< X < θ).
Bài 5
Cho hàm số
 c
 x  (−2,2)
f (x) =  4 − x 2
0 x  (−2,2)

a) Xác định c để f là hàm mật độ của ĐLNN X nào đó.
b) Lập hàm phân phối xác suất của X.
c) Tính P(-1≤X≤1).
Bài 6
Cho ĐLNN X có hàm phân phối xác suất là:
1 1
F ( x) = + arctgx
2 
a) Tính P(0 < X < 1)
b) Tìm hàm mật độ của X.
Bài 7
Bắn 2 viên đạn vào 1 tấm bia. Bia có 2 vòng. Bắn trúng vòng 1 được 10 điểm, trúng
vòng 2 được 5 điểm. Gọi X là tổng số điểm của 2 viên đạn đã bắn.

47
a) Lập bảng phân phối xác suất của X. Biết rằng xác suất bắn trúng vòng 1 là 0,6;
bắn trúng vòng 2 là 0,3 và bắn trượt là 0,1.
b) Tính kỳ vọng phương sai và mod của X.
Bài 8
Hai cầu thủ bóng rổ mỗi người ném 2 quả vào rổ. Xác suất ném trúng rổ của mỗi người
lần lượt là 0,7:0,8. Gọi X là số quả ném trúng rổ của 2 người.
a) Lập bảng phân phối xác suất của X.
b) Tính xác suất để số quả ném trúng rổ của hai người bằng nhau.
c) Đặt Y = 2X – 5. Tính E(Y), D(Y).
Bài 9
Một máy sản xuất ra sản phẩm với tỷ lệ phế phẩm là 2%. Có một lô hàng có 10 sản
phẩm có tỷ lệ phế phẩm là 40%. Lấy 2 sản phẩm do máy sản xuất và 2 sản phẩm từ lô
hàng. Gọi X là số sản phẩm tốt trong 4 sản phẩm lấy ra.
a) Lập bảng phân phối xác suất của X.
b) Tính E(X), D(X).
c) Tính xác suất để số sản phẩm tốt do máy sản xuất và số sản phẩm tốt lấy ra từ lô
hàng bằng nhau.
Bài 10
Có 3 lô sản phẩm, mỗi lô có 10 sản phẩm. Biết rằng lô thứ i có i+1 phế phẩm, i = 1, 2,
3. Lấy ngẫu nhiên mỗi lô 1 sản phẩm. Gọi X là số sản phẩm tốt trong 3 sản phẩm lấy ra.
a) Lập bảng phân phối xác suất của X.
b) Tính P( 1 ≤ X ≤ 3 ).
c) Tính xác suất để số sản phẩm tốt lấy ra được bằng tổng số mặt sấp khi tung 2
đồng xu.
Bài 11
Có 3 hộp phấn: Hộp I có 7 viên phấn trắng và 3 viên phấn vàngg, hộp I có 16 trắng và
4 vàng, hộp III có 42 trắng và 8 vàng. Từ mỗi hộp lấy ra 1 viên phấn. Gọi X là số viên
phấn vàng có trong 3 viên phấn lấy ra.
a) Lập bảng phân phối xác suất và hàm phân phối xác suất của X.
b) Tính kỳ vọng và phương sai của X.
c) Tính P(X≤ 2).
Bài 12
Một hộp có 4 quả bóng bàn được đánh số từ 1 đến 4. Lấy ngẫu nhiên 2 quả từ hộp và
gọi X là tổng các số trên 2 quả bóng lấy ra.
a) Lập bảng phân phối xác suất và hàm phân phối xác suất của X.
b) Tính E(X), D(X), Mod(X).

48
Bài 13
Một xạ thủ có xác suất bắn trúng bia mỗi lần là 80%.
a) Bắn 5 lần. Tính xác suất để có đúng 1 lần trúng bia.
b) Bắn tối thiểu mấy lần để xác suất có ít nhất 1 lần trúng bia lớn hơn hay bằng 0,9.
Bài 14
Sản phẩm được đóng thành từng hộp; mỗi hộp có 10 sản phẩm, trong đó có 4 sản
phẩm loại I. Người mua hàng quy định cách kiểm tra như sau: từ hộp lấy ra ngẫu nhiên
3 sản phẩm đều là loại I thì nhận hộp đó. Giả sử kiểm tra 100 hộp. Tính xác suất để:
a) Có 25 hộp được nhận.
b) Có không quá 30 hộp được nhận.
c) Phải kiểm tra ít nhất bao nhiêu hộp để xác suất có ít nhất một hộp được nhận lớn
hơn hay bằng 95%.
Bài 15
Một người nuôi 100 con gà mái. Xác suất để 1 con gà mái bất kỳ đẻ trứng trong ngày là
60%. Người đó xem một ngày thu được không ít hơn 60 quả trứng là “ngày vui”, tính
xác suất để trong 1 năm (365 ngày) người đó sẽ có:
a) 180 ngày vui.
b) Không ít hơn 200 ngày vui.
Bài 16
Một chi tiết máy do máy tiện sản xuất ra là một đại lượng ngẫu nhiên X ~ N (
20mm;4mm2). Chi tiết máy được gọi là hợp quy cách nếu X dao động từ 18mm đến
22mm. Cho sản xuất 100 chi tiết, tính xác suất để có:
a) 50 chi tiết máy hợp qui cách.
b) Không có quá 80 chi tiết máy hợp qui cách.
c) Phải sản xuất bao nhiêu chi tiết để xác suất có ít nhất một chi tiết hợp qui cách ≥
0,95.
Bài 17
Một xí nghiệp có 3 máy. Trong ngày thi thợ giỏi, mỗi công nhân dự thi sẽ chọn ngẫu
nhiên một máy và với máy đó sản xuất không ít hơn 70 thì được vào vòng trong. Xác
suất để được sản phẩm loại I trên 3 máy lần lượt là 0,6:0,7:0,8.
a) Tính xác suất để công nhân N được vào vòng trong.
b) Giả sử công nhân N dự thi 200 lần. Số lần được vào vòng trong tin chắc nhất là
bao nhiêu?
c) Công nhân N phải dự thi ít nhất bao nhiêu lần để xác suất có ít nhất một lần vào
vòng trong ≥ 90%.
Bài 18

49
Cho 3 đại lượng ngẫu nhiên độc lập X, Y , Z với:
X ~ N(12;25); Y ~ B(2:0,6); Z ~ H(10; 6; 3/100).
Đặt U = E(X).Y + D(X).Z – Mod(X).Mod(Y).
a) Tính E(U), D(U).
b) Tính xác suất P(Y = Z).

CHƯƠNG 3: ĐẠI LƯỢNG NGẪU NHIÊN NHIỀU CHIỀU


3.1. ĐẠI LƯỢNG NGẪU NHIÊN HAI CHIỀU RỜI RẠC
Tập hợp n biến ngẫu nhiên, xếp thành vectơ, sẽ được gọi là vectơ ngẫu nhiên hay
biến ngẫu nhiên n chiều. Để cho đơn giản trong phần này ta chỉ xét biến ngẫu nhiên
hai chiều (n = 2 ).
3.1.1. Bảng phân phối xác suất của đại lượng ngẫu nhiên hai chiều (X,Y)

50
yj y1 y2  yn
xi

x1 p11 p12  p1n

x2 P21 p22  P2n

    
xm pm1 pm2  pmn

(x1<x2<…<xm; y1<y2<…<yn; n và m có thể bằng +  )


Trong đó: pij = P(X = xi; Y= yj) = P(xi, yj) được gọi là xác suất đồng thời (xác suất xảy
ra đồng thời hai sự kiện X = xi và Y= yj). Để ý rằng:
P(X = xi) = ∑ P(X = xi; Y = yj) = ∑ pij = p1(xi)
P(Y = yj) = ∑ P(X = xi; Y = yj) = ∑ pij = p2(yj)
∑pij = ∑ P(X = xi) = ∑ P(Y = yj) = 1 (3.1.1)
● Giống như trường hợp 1 chiều, ta có thể xác định hàm phân phối xác suất đồng
thời như sau: F(x; y) = P(X < x; Y < y).
● Hàm phân phối này cảm sinh ra các hàm phân phối lề (hàm phân phối thành
phần):
F1 ( x) = P( X  x; Y  +) = lim F ( x; y )
y → +

F2 ( y) = P( X  +; Y  y) = lim F ( x; y)
x →+

● Một số tính chất của hàm phân phối hai chiều:


i) 0 ≤ F(x; y) ≤ 1
ii) F(x, y) không giảm theo từng đối số.
iii) F(-  , y) = F(x, -  ) = 0; F(+  ; +  ) = 1 (giá trị ±  hiểu theo nghĩa lấy giới
hạn)
iv) Với x1 < x2, y1 < y2 ta luôn có
P(x1 ≤ X < x2; y1 ≤ Y < y2) = F(x2, y2) – F(x2, y1) – F(x1, y2) + F(x1, y1).
● Hai ĐLNN X và Y được gọi là độc lập nếu F(x; y) = F1(x).F2(y)
3.1.2. Xác suất có điều kiện:
p ( x, y )
p( x | y) = P( X = x | Y = y) =
p2 ( y)
p ( x, y )
p ( y | x) = P (Y = y | X = x) = (3.1.2)
p1 ( x)
Ví dụ 3.1.1: Cho ĐLNN hai chiều (X,Y) có luật phân phối đồng thời như sau:

51
xi x1 x2 x3
yj
y1 0,18 0,22 0,16

y2 0,08 0,16 0,2

Tìm luật phân phối của từng đại lượng ngẫu nhiên X và Y.
Giải:
Theo công thức (3.1.1) ta có:
p1(x1) = P(X = x1) = 0,18 + 0,08 = 0,26.
Tương tự: p1(x2) = 0,38; p1(x3) = 0,36.
Luật phân phối của X là:
xi x1 x2 x3

pi 0,26 0,38 0,36

Luật phân phối của Y là:


yj y1 y2

pj 0,56 0,44

● Chú ý: p1(xi) là tổng của cột, còn p2(yj) là tổng của hàng tương ứng của bảng gốc.
Ví dụ 3.1.2: Cho bảng phân phối của đại lượng ngẫu nhiên (X,Y)
xi 1 2 3
yj
1 0,15 0,20 0,10

2 0,35 0,05 0,15

a) Xác định hàm phân phối đồng thời của (X, Y)


b) Hai đại lượng X và Y có độc lập không?
c) Tính P(X = 1|Y = 2) = p(1|2).
Giải:
a) Từ định nghĩa hàm phân phối đồng thời
F(x; y) = P(X < x; Y < y) ta có F(x; y) cho bởi bảng sau
xi x≤1 1< x ≤ 2 2< x ≤3 3<x
yj

52
y≤1 0 0 0 0

1< y ≤2 0 0,15 0,35 0,45

2<y 0 0,5 0,75 1

b) Chẳng hạn p(1; 1) = 0,15, trong khi đó:


p1(1).p2(1) = 0,5.0,45 = 0,225 ≠ p(1; 1) do đó X và Y không độc lập.
c) Theo công thức (3.1.2) ta có:
P ( X = 1, Y = 2) 0,35 7
P ( X = 1 | Y = 2) = = =
p 2 ( 2) 0,55 11
Ví dụ 3.1.3: Ta có hai hộp, mỗi hộp có 6 viên bi:
Hộp I có một bi mang số 1, hai bi số 2 và ba bi số 3
Hộp II có hai bi mang số 1, ba bi số 2 và một bi số 3.
Gọi X và Y tương ứng là số hiệu của viên bi tương ứng chọn ngẫu nhiên từ hai hộp
(mỗi hộp chọn một bi). Xây dựng bảng phân phối của cặp biến (X,Y) và chứng tỏ rằng
X và Y độc lập nhau.
Giải:
Tổng số cách rút ra hai viên bi từ hai hộp là 6.6 = 36 (đồng khả năng), trong đó số
cách rút ra được cặp (1; 1) là 1.2 = 2; cặp (1; 2) là 1.3 = 3; cặp (1; 3) là 1; cặp (2; 1) là
2.2 = 4; cặp (2; 2) là 2.3 = 6; cặp (2; 3) là 2.1 = 2; cặp (3; 1) là 3.2 = 6; cặp (3; 2) là 3.3
= 9; cặp (3; 3) là 3.1 = 3. Từ đó ta có bảng phân phối xác suất cần tìm:
xi 1 2 3
yj
1 1/18 1/9 1/6

2 1/12 1/6 1/2

3 1/36 1/18 1/12

Để kiểm tra tính độc lập, ta xây dựng phân phối (biên) của X và Y hoặc trực tiếp từ
điều kiện bài toán:

xi 1 2 3

pi 1/6 1/3 1/2

53
yj 1 2 3

pj 1/3 1/2 1/6

Dễ dàng kiểm tra rằng p(xi; yj) = p1(xi).p2(yj); với mọi i,j vì vậy X và Y độc lập nhau.
3.2. ĐẠI LƯỢNG NGẪU NHIÊN HAI CHIỀU LIÊN TỤC
Luật phân phối xác suất của đại lượng ngẫu nhiên hai chiều (X;Y) liên tục được xác
định nhờ hàm mật độ xác suất đồng thời f(x; y). Mở rộng trường hợp 1 chiều, có thể
thấy rằng xác suất để điểm ngẫu nhiên (X; Y) rơi vào miền D được tính bằng công thức:
P( X , Y )  D  =  f ( x; y )dx.dy
D

Để ý rằng, trong đó: f(x, y)≥ 0 và  f ( x; y)dx.dy = 1


MP
(lấy trên toàn mặt phẳng).

Hàm f(x; y) được gọi là hàm mật độ của biến (X, Y) (hay hàm mật độ đồng thời của
X và Y).
● Định nghĩa: Hàm phân phối F(x; y) của biến hai chiều (X, Y) có dang:
x y
F ( x; y ) =   f (u; v)dudv
−− 
(3.2.1)
 2 F ( x; y )
● Nhận xét: Hàm phân phối đồng thời F(x; y) là hàm sao cho: f ( x; y ) =
x.y
3.2.1. Hàm phân phối có điều kiện
Hàm phân phối có điều kiện
F(x|y1, y2) = P(X < x |(y1 ≤ Y ≤ y2) được xác định như sau:
x y2

  f (u; v)dudv
−  y1
F ( x | y1 , y 2 ) = +  y2
(3.2.2)
  f (u; v)dudv
−  y1

3.2.2. Hàm mật độ có điều kiện


f ( x; y ) f ( x; y )
f1 ( x | y ) = = +
nếu f2(y) ≠ 0
f 2 ( y)
 f ( x; y)dx
−
f ( x; y ) f ( x; y )
f 2 ( y | x) = = +
nếu f2(y) ≠ 0 (3.2.3)
f 1 ( x)
 f ( x; y)dy
−

Ví dụ 3.2.1: Biến ngẫu nhiên hai chiều (X;Y) có hàm mật độ đồng thời:
a( x 2 + y 2 ) khi x 2 + y 2  r
f ( x) = 
 0 khi x 2 + y 2  r

54
Tìm hệ số a.
Giải:
Hệ số a được xác định từ phương trình:
a  ( x 2 + y 2 )dxdy = 1 , trong đó D là hình tròn x2 + y2 ≤ r2.
D

Đổi biến sang hệ toạ độ cực:


2x r
2
a  d  q 3 dq = 1  a =
0 0 r 4
Ví dụ 3.2.2: Cho hai đại lượng ngẫu nhiên X và Y độc lập và có phân phối đều trên
[a;b]. Xác định hàm phân phối của Z = X + Y.
Giải:
Ta đã biết nếu X có phân phối đều trên [a,b] thì có hàm mật độ:
 1
 khi x  a, b
f ( x) =  b − a
 0 khi x  a, b
Do hai biến X, Y độc lập nên:
 1
 khi ( x, y )  D
f ( x; y ) = f1 ( x). f 2 ( y ) =  (b − a) 2

 0 khi ( x, y )  D
Trong đó D là hình vuông. Xét điểm ngẫu nhiên (X;Y) trên mặt phẳng xOy với miền
biến thiên của nó là hình vuông ABCD. Theo định nghĩa hàm phân phối:
1
F ( z ) = P( Z  z ) =  f ( x; y )dxdy =  dxdy
D1 (b − a) 2 D1

Trong đó D1 là phần hình vuông nằm dưới đường thẳng z = x + y.


Từ đó:
1
F ( z) = S D ; trong đó SD là diện tích của miền D1.
(b − a )
2 1 1

Ta có:
● Nếu z ≤ 2a => F(z) = 0
( z − 2a ) 2
● Nếu 2a < z < a + b => F(z) =
2(b − a ) 2
(2b − z ) 2
● Nếu a + b < z ≤ 2b => F(z) = 1-
2(b − a ) 2
● Nếu z > 2b => F(z) = 1
3.2.3. Kỳ vọng và phương sai của đại lượng ngẫu nhiên nhiều chiều:
3.2.3.1. Kỳ vọng
● Đại lượng ngẫu nhiên liên tục:
+ +
E( X ) =  xf ( x)dx; E (Y ) =  yf
−
1
−
2 ( y)dy (3.2.4)
55
● Đại lượng ngẫu nhiên rời rạc:
E ( X ) =  xi pij ;E (Y ) =  y j pij (3.2.5)
i j i j

3.2.3.2. Phương sai:


D(X) = E[(X- E(X))]2; D(Y) = E[(Y – E(Y))2]
3.3. TÍNH TƯƠNG QUAN GIỮA HAI ĐẠI LƯỢNG NGẪU NHIÊN
X và Y là 2 đại lượng ngẫu nhiên có: DX.DY  0, khi đó trị số
E ( X .Y ) − E ( X ).E (Y )
r= (3.3.1)
DX .DY
được gọi là hệ số tương quan của X và Y.
- Trường hợp r = 0 ta nói X và Y không tương quan.
- Trường hợp r =  1 ta nói X và Y tương quan tuyến tính.
Ví dụ 3.3.1: Tung 3 lần 1 con xúc sắc. Gọi X là số lần xuất hiện mặt chẵn. Y là số lần
xuất hiện mặt lẻ. Tính hệ số tương quan giữa X vàY.
Giải:
Ta có bảng phân phối xác suất của X, Y, XY
X 0 1 2 3

P 1/8 3/8 3/8 1/8

Y 0 1 2 3

P 1/8 3/8 3/8 1/8

XY 0 2

P 2/8 6/8

Ta có: EX = 3/2, EY = 3/2; E(XY) = 3/2; DX = 3 / 4, DY = 3 / 4.


Suy ra hệ số tương quan của X và Y là:
E(X.Y) − E(X).E(Y)
r= = −1
DX.DY
Ví dụ 3.3.2: Giả sử ta có bảng phân phối xác suất đồng thời:
xi 1 2 3
yj
1 0,15 0,20 0,10

56
2 0,35 0,05 0,15

Tính hệ số tương quan giữa X và Y.


Giải:
Các bảng phân phối biên của X và Y có thể tìm được:
xi 1 2 3

pi 0,5 0,25 0,25

yi 1 2

pi 0,45 0,55

Kỳ vọng của chúng: E(X) = 1.0,5 + 2.0.25 + 3.0,25 = 1,75


E(Y) = 1.0,45 + 2.0,55 = 1,55.
Bây giờ tính E(XY):
E ( X .Y ) =  xi y j pij = 1.1.0,15 + 1.2.0,2 + 1.3.0,1 + 2.1.),35 + 2.2.0,05 + 2.3.0,15 = 2,65
i j

Phương sai: DX = 0,69; DY = 0,25.


Hệ số tương quan:
E ( X .Y ) − E ( X ).E (Y )
r= = −0,1505
DX .DY
BÀI TẬP THẢO LUẬN CHƯƠNG 3
Bài 1
Cho đại lượng ngẫu nhiên hai chiều (X, Y) có bảng phân phối như sau:
y y1 y2
x
x1 0,18 0,08
x2 0,22 0,16
x3 0,16 0,20
Xác định luật phân phối biên của từng biến X, Y.
Bài 2
Luật phân phối của biến (X, Y) cho bởi bảng
y 20 40 60
x
10 λ λ 0

57
20 2λ λ λ
30 3λ λ λ
Xác định λ và các phân phối biên của X và Y.
Bài 3
Luật phân phối đồng thời của số lỗi vẽ mầu X và số lỗi đúc Y của một loại sản phẩm
nhựa ở một công ty cho bới bảng
y 0 1 2
x
0 0,58 0,10 0,06
1 0,06 0,05 0,05
2 0,02 0,04 0,01
3 0,02 0,01 0,00
Hai đại lượng X và Y có độc lập không? Tính xác suất để tổng số các lỗi về màu và
lỗi đúc lớn hơn 4. Nếu ta biết trên sản phẩm có 2 lỗi về mầu thì xác suất để không có
lỗi đúc bằng bao nhiêu?
Bài 4
Cho luật phân phối của ĐLNN hai chiều (X, Y) như sau:
y 2 3 5
x
1 0,1 0 0,1
4 0,2 0,5 0,1
Tìm luật phân phối xác suất của X + Y và X.Y. Tính kỳ vọng và phương sai của các
ĐLNN trên.
Bài 5
Cho hàm mật dộ đồng thời của X và Y là f(x; y) = c.x.y với 0 ≤ x ≤ 4; 0 ≤ y ≤ 5. Xác định
hằng số c. Tìm các hàm mật độ biên và hàm mật độ có điều kiện của Y.
Bài 6
Hai máy tự động làm việc độc lập, xác suất để từng máy sản xuất ra sản phẩm tốt
tương ứng là p1, p2. Giả sử mỗi máy làm được 2 sản phẩm và gọi X và Y tương ứng số
sản phẩm tốt của từng máy. Hãy tìm bảng phân phối xác suất của đại lượng ngẫu nhiên
hai chiều (X, Y).
CHƯƠNG 4: MẪU THỐNG KÊ VÀ ƯỚC LƯỢNG THAM SỐ
Khi nghiên cứu thống kê, một lĩnh vực khá rộng lớn, vì vậy khó có thể đưa ra được
một định nghĩa chung. Tuy nhiên, cũng có thể tóm tắt thống kê như một khoa học về
phân tích dữ liệu (thu thập và xử lý số liệu) nhằm thu nhận thông tin chân thực nhất

58
về đối tượng cần nghiên cứu, với cơ sở toán học là Lý thuyết xác suất và với một độ tin
cậy nhất định, từ đó rút ra những kết luận hợp lý. Những quyết định thống kê có ứng
dụng to lớn như: dự báo, chuẩn đoán, điều khiển ngẫu nhiên, kiểm tra chất lượng sản
phẩm, thăm dò dư luận…
4.1. TỔNG THỂ - MẪU
4.1.1. Mẫu
Trong thực tế ta cần nghiêu cứu một dấu hiệu X nào đó trên một tập hợp Ω có số
lượng lớn các phần tử. Tuy nhiên chúng ta không thể quan sát tất cả các phần tử của
tập Ωtập con gồm hữu hạn n phần tử và dựa vào kết quả quan sát n phần tử đó để
nghiên cứu dấu hiệu X mà ta quan tâm trên Ω.
Tập Ω được gọi là tập chính hay tổng thể hay tập nền. Các phần tử thuộc tập chính
Ω gọi là các cá thể. Việc chọn tập con từ Ω ra để quan sát được gọi là phép lấy mẫu, tập
con được lấy ra gọi là tập mẫu. Số lượng các phần tử của Ω ký hiệu là N và được gọi là
kích thước của một tổng thể, còn số phần tử n của tập mẫu gọi là kích thước mẫu. Sau
khi chọn mẫu ta sẽ căn cứ vào mẫu để rút ra các kết luận cần thiết về tính chất cần
khảo sát cho toàn bộ tổng thể, nên đòi hỏi mẫu phải thực sự đại diện cho tổng thể.
Hiện nay có nhiều phương pháp chọn mẫu khác nhau. Tuy nhiên, ở giáo trình này
chỉ giới thiệu phương pháp lấy mẫu đơn giản nhất và được sử dụng rộng rãi trong các
lĩnh vực khác nhau.
● Lấy mẫu ngẫu nhiên có hoàn lai: Lấy ngẫu nhiên một phần tử từ tổng thể và khảo
sát nó. Sau đó trả phần tử đó lại tổng thể trước khi lấy 1 phần tủ khác. Tiếp tục như thế
n lần, ta được một mẫu có hoàn lại gồm n phần tử.
● Lấy mẫu ngẫu nhiên không hoàn lại: Lấy ngẫu nhiên một phần tử tổng thể như
trên, nhưng phần tử lấy ra không được trả lại tổng thể.
Tuy nhiên, khi kích thước tổng thể đủ lớnthì có thể coi hai cách lấy mẫu trên là như
nhau.
Khi xét một tổng thể, ta không quan tâm đến ọi khía cạnh của các phần tử trong
tổng thể, mà chỉ quan tâm đến một dấu hiệu nào đó của các phần tử để tạo nên một đại
lượng ngẫu nhiên X.
Ví dụ 4.1.1: Kiểm tra chất lượng sản phẩm của 1 lô hàng gồm N = 1000 sản phẩm.
Lấy ngẫu nhiên 1 sản phẩm kiểm tra tốt, xấu, sau đó bỏ vào lại, xáo trộn rồi lấy tiếp 1
sản phẩm. Làm như thế 1000 lần ta được một mẫu có hoàn lại gồm n = 1000 phần tử.
4.1.2. Một số dạng mẫu đơn giản thường gặp
4.1.2.1. Mẫu dạng điểm
X n
x1 n1

59
x2 n2
… …
xk nk
ni: số lần X nhận giá trị xi , i = 1,2,…,k, hay gọi là tần số; ∑ni = n và n được gọi là dung
lượng mẫu (kích thước mẫu).
Ví dụ 4.1.2: Điểm thi môn Toán cuả 100 thí sinh dự thi vào Khoa Công nghệ cuả
một trường Đại học năm 2000 cho trong bảng sau:

X n
0 5
1 5
2 10
3 30
4 40
5 5
6 2
7 1
8 0
9 0
10 100

4.1.2.2. Mẫu dạng khoảng

X x1 - x2 x2 – x3 … xk – 1 – xk

n n1 n2 … nk

Chú ý: Khi gặp bài toán dạng khoảng ta đưa về dang điểm với ci = ( x1 + x2)/2
X c1 c2 … ck
n n1 n2 … nk
Ví dụ 4.1.3: Chọn ngẫu nhiên 100 con gà sắp xuất chuồng trong 1 trại chăn nuôi,
xác định trọng lượng, được số liệu sau:

X 1,5 – 1,8 1,8 – 2,0 2,0 – 2,2 2,2 – 2,5 2,5 – 2,8
ni 20 30 30 10 10
Đưa về mẫu dạng điểm được:

60
X 1,65 1,9 2,1 2,35 2,65
ni 20 30 30 10 10
4.1.3. Tần số - Tần suất và phân phối thực nghiệm
4.1.3.1. Tần số
Số lần xuất hiện xi hoặc một lớp thứ i nào đó, ký hiệu ni được gọi là tần số. Các bảng
số trong ví dụ 4.1.2 và 4.1.3 chính là bảng tần số. Để ý là nếu số lớp nhiều hơn, có thể
làm tốt hơn các phân tích, nhưng việc cải thiện đó không nhiều, ngược lại nếu số lớp ít
quá có khả năng sẽ bị mất mát thông tin.
Thông thường người ta hay biểu diễn phân phối tần số bằng đồ thị để quan sat và
nghiên cứu trực giác hơn.
4.1.3.2. Tần suất và phân phối thực nghiệm
Từ bảng tần số nếu ta đặt fi = ni / n (i = 1, 2,…, k), được gọi là tần suất xuất hiện giá
trị xi, trong mẫu ta có thể mô tả bằng bảng tần suất tương ứng. Rõ ràng từ định nghĩa
của fi ta có f1 + f2 + … + fk = 1 và bảng tần suất là:
xi x1 x2 x3 … xk
fi f1 f2 f3 … fk
Nếu đặt wi là tần số tích luỹ của xi và Fn(xi) là tần số tích luỹ của xi, ta sẽ có:

i =  n j ; Fn ( xi ) = i =  f j
x j  xi n x j  xi

thì Fn(xi) là một hàm của xi và được gọi là hàm phân phối thực nghiệmcủa mẫu hay là
hàm phân phối mẫu.
4.1.4. Các đặc trưng mẫu
4.1.4.1. Trung bình mẫu
Cho mẫu {x1, x2,…, xn} lấy từ tập các giá trị của đại lượng ngẫu nhiên X nào đó. Khi
đó trung bìnhnmẫu được tính bởi công thức:
1 1 k
X =  xi hay X =  xi ni (4.1.1)
n i =1 n i =1

Chú ý: Nếu X ~ N(a, σ2)


thì X ~ N(a, σ2/n)
4.1.4.2. Phương sai mẫu
Phương sai mẫu là trung bình cộng của phương sai các độ lệch của từng số liệu so
với trung bìnhnmẫu.
1 1 k
S 2 =  ( xi − X ) 2 = X 2 − ( X ) 2 hay S 2 =  ni ( xi − X ) 2 (4.1.2)
n i =1 n i =1

   n −1 2
2
1 n 1
Ta có E ( S 2 ) =  E ( xi − a) 2 − ( X − a) 2 = n 2 − D( X ) =  2 − = 
n i =1 n n n
Với giá trị trung bình của S2 không đúng bằng σ2, do đó thường dùng S’2 - gọi là
phương sai mẫu điều chỉnh thay cho S2, và được tính bới công thức:

61
n 1 n 1 k
S '2 =
n −1
S2 = 
n − 1 i =1
( xi − X ) 2 hay S ' 2 = 
n − 1 i =1
ni ( x i − X ) 2 (4.1.3)

Độ lệch mẫu là căn bậc hai của phương sai mẫu:


1 n
S = S2 = 
n i =1
( xi − X ) 2 (4.1.4)

4.1.4.3. Tính chất của các tham số mẫu


i) X + Y = X + Y
ii) X =  X với α là hằng số
iii) X + C = X + C với C là đại lượng ngẫu nhiên hằng.
iv) X .Y = X .Y nếu X và Y độc lập.
v) S2(αX) = α2.S2(X) .
vi) S2(X + C) = S2(X).
vii) S2(X + Y) = S2(X) + S2(Y) nếu X và Y là độc lập.
Ví dụ 4.1.4: Xác định trọng lượng của 100 con gà, có số liệu sau:
X(kg) 1,5 – 1,7 1,7 – 1,9 1,9 – 2,1 2,1 – 2,5
ni 30 40 10 10
a) Tính trọng lượng trung bình của một con gà.
b) Tính phương sai mẫu, độ lệch chuẩn mẫu.
Giải:
Đưa về dạng điểm
X(kg) 1,6 1,8 2,0 2,3
ni 30 40 10 10
1 k 1
a) X = 
n i =1
x i ni =
90
(1,6.30 + 1,8.40 + 2,0.10 + 2,3.10) = 1,63(kg )

1 k 1
b) X 2 =  xi2 ni = [(1,6) 2 .30 + (1,8) 2 .40 + (2,0) 2 .10 + (2,3) 2 .10] = 2,99(kg )
n i =1 90
S 2 = X 2 − ( X ) 2 = 2,99 − (1,63) 2 = 0,578(kg) 2
● Nhận xét: Cho mẫu (x1, x2,…, xk) quan sát từ đại lượng ngẫu nhiên X. Khi đó:
k
1 k 1 k
 ni = n; X =
i =1
 i i
n i =1
n x ; S 2
=  ni xi2 − ( X ) 2
n i =1
Do đó ta có thể lập bảng để tính các tham số mẫu như sau:

xi ni xi2 ni.xi ni.xi2

 n

62
Trong việc tính toán bằng các phương tiện thô sơ, thì việc lập bảng tính và thu gọn
số liệu vẫn rất quan trọng.
Ví dụ 4.1.5: Ta xét ví dụ, gọi X là lượng Glucoza trong máu (mg%) được cho bởi
bảng:
Khoảng Glucosa Số người Khoảng Glucosa Số người
65 – 70 1 100 – 105 17
70 – 75 0 105 – 110 16
75 – 80 2 110 – 115 9
80 – 85 5 115 – 120 5
85 – 90 8 120 – 125 2
90 – 95 16 125 – 130 1
95 – 100 18
a) Tính trọng lượng Glucoza trung bình
b) Tính phương sai mẫu, độ lệch chuẩn mẫu.
Theo số liệu đã cho. Ta có bảng tính sau:
khoảng ni xi xi2 ni.xi ni.xi2
Glucoza
60-70 1 67,5 4556,25 65,5 4556,25
70-75 0 72,5 5256,25 0 0
75-80 2 77,5 6006,25 155 12012,5
80-85 5 82,5 6806,25 412,5 34031,25
85-90 8 87,5 7656,25 700 61250
90-95 16 92,5 8556,25 1480 136900
95-100 18 97,5 9506,25 1755 171112,5
100-105 17 102,5 10506,25 1742,5 178606,3
105-110 16 107,5 11556,25 1720 184900
110-115 9 112,5 12656,25 1012,5 113906,3
115-120 5 117,5 13806,25 587,5 69031,25
120-125 2 122,5 15006,25 245 30012,5
125-130 1 127,5 16256,25 127,5 16256,25
 100 1267,5 128131,3 10005 1012575
Ta có: X  100 ,05; S2X  115,75.S  10,76 .
4.1.5. Qui luật phân phối của các tham số mẫu
● Nếu X ~ N(a, σ2) thì X ~ N(a, σ2/n) và

63
( X − a) n
U = ~ N(0, 1).

(n − 1) S 2
● Nếu X ~ N(a, σ2) thì  2 =
2
có phân phối “khi bình phương” với (n – 1) bậc tự do.
( X − a) n
● Nếu X ~ N(a, σ2) thì T =
S'
có phân phối Student (n – 1) bậc tự do. Khi n khá lớn thì phân phối Student hội tụ
khá nhanh về phân phối chuẩn tắc, do đó với n > 30 ta có thể xem T ~ N(0, 1).
● Nếu X1 ~ N(a1, σ21 ) và X2 ~ N(a2, σ22) từ tổng thể ta lấy hai mẫu kích thước n1, n2
thì
( X 1 − X 2 ) − (a1 − a 2 )
U= ~ N(0, 1)
 12  22
+
n1 n2
● Giả sử đại lượng ngẫu nhiên X có phân phối xác suất nào đó, không phải phân
phối chuẩn thì
( X − a) n ( X − a) n
U = và U =
 S'
sẽ có phân phối xấp xỉ chuẩn tắc khi n khá lớn.
● Nếu fn là tỷ lệ mẫu (tần suất mẫu), P tỷ lệ tổng thể khi đó:
( f n − P) n
U=
P (1 − P )
sẽ có phân phối xác suất xấp xỉ chuẩn tắc.
4.2. LÝ THUYẾT ƯỚC LƯỢNG
4.2.1. Khái niệm về ước lượng
Giả sử có một đại lượng ngẫu nhiên X có phân phối xác suất đã biết, nhưng các đặc
trưng của nó phụ thuộc vào một hoặc nhiều thâm số θ chưa biết. thông qua mẫu ngẫu
nhiên phải xác định giá trị gần đúng để thay thế cho các tham số đó, chẳng hạn ta biết
X ~ N(a, σ2), nhưng a và σ2 nhận giá trị nào thì chưa rõ.
Từ tổng thể lấy một mẫu ngẫu nhiên, dựa vào mẫu kích thước n, ta lập một đại
 
lượng thống kê  để thay thế cho θ, khi đó ta gọi  là ước lượng của θ.
4.2.2. Ước lượng điểm
X là đại lượng ngẫu nhiên trên tổng thể. Giả sử đã biết dạng phân phối xác suất của
X phụ thuộc vào 1 hoặc nhiều tham số θ chưa biết. Từ tổng thể lấy ngẫu nhiên một

mẫu, dựa vào mẫu ta có thể lập một đại lượng thống kê  để thay thế θ. Ta sẽ đưa ra

một số phương pháp tính  .

64

Công việc tính và đánh giá  như trên được gọi là phép ước lượng (hay ước lượng).

 là ước lượng của θ.
4.2.2.1. Ước lượng không chệch
 
● Định nghĩa: Ước lượng  của θ được gọi là ước lượng không chệch nếu E(  ) = θ.
 
Nếu E(  ) ≠ θ thì  là ước lượng chệch của θ.
● Nhận xét: Ta có thể chứng minh được rằng:
i) X là ước lượng không chệch của E( X ) = a.
ii) f là ước lượng không chệch của p vì E(f) = p.
iii) S’2 là ước lượng không chệch của σ2.
 
● Ý nghĩa của ước lượng không chệch:  là ước lượng của θ thì  - θ là đại lượng
  
ngẫu nhiên biểu thị sai số của ước lượng. Ta có E(  - θ ) = E(  ) - θ = θ – θ = 0 nếu 

là ước lượng không chệch của θ. Như vậy nếu  là ước lượng không chệch của θ thì sai
 
số trung bình giữa  và θ bằng 0. Tức là giá trị của  không bị lệch về một phía, nếu

dùng  để ước lượng θ thì không mắc phải sai số hệ thống.
4.2.2.2. Ước lượng vững

● Định nghĩa : Ước lượng  của θ được gọi là ước lượng vững nếu với mọi ε > 0
 
nhỏ tuỳ ý cho trước, ta đều có lim P  −     = 1 .
n →
  
● Điều kiện đủ của ước lượng vững là nếu  là ước lượng không chệch của θ và
 
lim D ( ) = 0 thì  là ước lượng vững.
n →

● Định lý: X , f, S'2 (phương sai hiệu chỉnh mẫu) tương ứng là ước lượng vững của
kỳ vọng E(X), xác suất p, phương sai D(X) = σ2.
4.2.3. Ước lượng khoảng
4.2.3.1. Khoảng ước lượng

Để ước lượng giá trị thực của tham số θ, ta dùng một gía trị củ thể  , theo cách làm
này ta không thể đánh giá được sai số của ước lượng cũng không thể trả lời được câu
hỏi: ước lượng đó “đáng tin cậy” tới mức độ nào. Để khắc phục những nhược điểm của
phương pháp ước lượng điểm, người ta đưa ra phương pháp ước lượng bằng khoảng.

● Định nghĩa: Giả sử  là ước lượng của θ, ε là sai số cho phép. Khi đó xác suất γ =

P(|  - θ | < ε) = 1- α được gọi là độ tin cậy của ước lượng.
● Nhận xét:
 
i) Khoảng (  - ε,  + ε) được gọi là khoảng tin cậy.
 
ii) Các điểm  - ε,  + ε là các giới hạn tin cậy.
iii) Khoảng tin cậy là một đại lượng ngẫu nhiên vì nó phụ thuộc vào mẫu chọn ra.
iv) Nếu sai số ε cho phép càng lớn thì độ tin cậy càng cao, nghĩa là muốn tăng độ
tin cậy phải giảm độ chính xác. Vì thế người ta còn gọi ε là độ chính xác.

65
4.2.3.2 Ước lượng trung bình
● Trường hợp n  30
i) Biết phương sai σ 2 của tổng thể
( X − a) n
Ta có Z = ~ N(0, 1)

Ta có γ = P(| X - a| < ε) = 2.Φ(zα)
 n
Từ đó suy ra z = và X - ε < a < X + ε (4.2.1)

ii) Không biết σ 2 – phương sai của tổng thể: Trong trường hợp chưa biết σ, ta có
thể dùng S’ (phương sai mẫu điều chỉnh) để thay thế. Khi đó ta có:
Ta có γ = P(| X - a| < ε) = 2.Φ(zα)
 n
Và z = và X - ε < a < X + ε (4.2.2)
S'
Ví dụ 4.2.1: Chọn ngẫu nhiên 36 công nhân của một xí nghiệp A thấy lương trung
bình là 280 ngàn đồng, biết lương công nhân tuân theo luật phân phối bình thường
với độ lệch chuẩn σ = 14 ngàn đồng. Với độ tin cậy là 95%. Hãy ước lượng mức lương
trung bình của công nhân thuộc xí nghiệp A.
Giải:
a: Lương trung bình của công nhân thuộc xí nghiệp A.
X : Lương trung bình theo mẫu.
Ta có: γ = P(| X - a| < ε) = 2.Φ(zα) = 0,95 => Φ(zα) = 0,475. Theo bảng tích phân
Laplace ta được zα = 1,96
 n z . 1,96.14
Từ công thức z = ta có  =  = = 4,6
 n 36
Từ đó ta có 280 – 4,6 < a < 280 + 4,6
Kết luận: Lương trung bình của công nhân xí nghiệp A nằm trong khoảng (275,4;
284,6).
Ví dụ 4.2.2: Tại một địa phương A, chọn ngẫu nhiên 100 người về hưu thấy tuổi
thọ trung bình là 70 tuổi với độ lệch chuẩn mẫu điều chỉnh là S’ = 8,9 năm. Hãy ước
lượng tuổi thọ trung bình của người về hưu tại địa phương A với độ tin cậy 90%.
Giải:
a : Tuổi thọ trung bình của người về hưu.
X : Tuổi thọ trung bình theo mẫu
Do n ≥ 30 nên X tuân theo phân phối chuẩn.
Ta có độ tin cậy γ = P(| X - a| < ε) = 2.Φ(zα) = 0,9 => Φ(zα) = 0,45
Tra bảng tích phân Laplace ta được zα = 1,65
 n z .S ' 1,65.8,9
Từ công thức z = ta có  =  = = 1,47
S' n 100
66
Ta có 70 – 1,47 < a < 70 + 1,47
Vậy tuổi thọ trung bình tại địa phương A trong khoảng (68,53; 71,47).
● Trường hợp n < 30
i) Tổng thể tuân theo phân phối chuẩn, phương sai σ2 đã biết.
( X − a) n
Ta có Z = ~ N(0, 1)

Ta có γ = P(| X - a| < ε) = 2.Φ(zα)
 n
Từ đó suy ra z = và X - ε < a < X + ε

ii) Tổng thể theo phân phối chuẩn, phương sai σ2 chưa biết.
( X − a) n
Ta xét T = ~ T(n-1)
S'
 n
Khi đó ta có γ = P(| X - a| < ε) = Tn – 1(tα) với t = (4.2.3)
S'
 n
Từ t = tính được ε, suy ra X - ε < a < X + ε
S'
Ví dụ 4.2.3: Trọng lượng các bao bột mì tại một cửa hàng lương thực tuân theo quy
luật phân phối chuẩn. Kiểm tra 20 bao, thấy trọng lượng trung bình của bao bột mì là
48 kg, với phương sai mẫu điều chỉnh là S’ = 0,5 kg. Với độ tin cậy là 95%, hãy ước
lượng trọng lượng trung bình của một bao bột mì thuộc cửa hàng.
Giải:
a: Trọng lượng trung bình một bao bột mì của cửa hàng.
X : trọng lượng trung bình một bao bột mì theo mẫu.
Ta có n = 20 < 30 và σ2 chưa biết nên:
( X − a) n
T= ~ T(n-1)
S'
Với γ = P(| X - a| < ε) = 1 – α = 0,95. Tra bảng phân phối Student ta được tα =
2,039
 n t .S ' 2,039.0,5
Từ t = ta tính được  =  = = 0,223
S' n 20
Từ X - ε < a < X + ε hay 48 – 0,223 < a < 48 + 0,223
Vậy trọng lượng trung bình của một bao bột mì thuộc cửa hàng là (47,78; 48,22)
(kg).
● Nhận xét: Khi đề cập đến các bài toán ước lượng giá trị trung bình (kỳ vọng) tức
là ta đề cập đến các bài toán liên quan tới ba giá trị là độ tin cậy γ, sai số cho phép (độ
chính xác) ε và kích thước của mẫu n. Do đó ta có ba bài toán xoay quanh ba giá trị
trên.
Bài toán 1: Cho biết giá trị γ, biết n. Tìm giá trị ε

67
- Từ γ = P(| X - a| < ε) = 2.Φ(zα) ta tìm được giá trị Φ(zα). Tra bảng Laplace ta tìm
được zα
 n
- Từ công thức tính z = ta tính được giá trị ε.

Bài toán 2: Biết giá trị ε và n. Tính giá trị γ
 n
- Từ công thức z = tìm được giá trị zα

- Tra bảng Laplace ta tìm được giá trị Φ(zα)
- Tính γ = 2.Φ(zα)
Bài toán 3: Biết giá trị γ và ε. Tìm giá trị n
- Từ γ = P(| X - a| < ε) = 2.Φ(zα) ta tìm được giá trị Φ(zα). Tra bảng Laplace ta tìm
được zα
 n z 2 . 2
- Từ công thức z = ta tính được n =  2
 
Tuy nhiên cũng lưu ý các bài toán nêu trên trong trường hợp biết phân phối của
tổng thể, biết σ, và n > 30. Các bài toán này khi thực hiện trong các trường hợp khác
hoàn toàn tương tự.
Ví dụ 4.2.4: Tuổi thọ của một loại bóng đèn do xí nghiệp A sản xuất được biết tuân
theo quy luật phân phối chuẩn, với độ lệch chuẩn 100 giờ.
a) Chọn ngẫu nhiên 100 bóng để thử nghiệm, thấy tuổi thọ trung bình là 1000 giờ.
Hãy ước lượng tuổi thọ trung bình của bóng đèn của xí nghiệp A sản xuất với độ tin cậy
95%.
b) Với độ chính xác là 15 giờ, hãy xác định độ tin cậy.
c) Với độ chính xác là 25 giờ và độ tin cậy 95% thì cần thử nghiệm bao nhiêu bóng?
Giải:
a) Câu này chính là bài toán 1 nêu ở trên.
a: Tuổi thọ trung bình của bóng đèn do XN A sản suất
X : Tuổi thọ trung bình dựa theo mẫu
Do γ = P(| X - a| < ε) = 2.Φ(zα) = 0,95 => zα = 1,96
 n z . 1,96.100
z = nên  =  = = 19,6
 n 100
Khi đó 1000 – 19,6 < a < 1000 + 19,6
Vậy tuổi thọ trung bình của bóng đèn là (980,4; 1019,6) giờ.
b) Câu này chính là bài toán 2 đã nêu.
 n 15. 100
Từ z = = = 1,5 tra bảng Laplace ta được Φ(zα) = 0,43
 100
Ta có γ = 2.Φ(zα) = 0,86

68
Vậy độ tin cậy là 86%.
c) Đây là bài toán 3 đã nêu trên.
Do γ = P(| X - a| < ε) = 2.Φ(zα) = 0,95 => zα = 1,96
 n z2 . 2 (1,96) 2 .(100) 2
Từ z = nên n = = = 61,4656
 2 (25) 2
Vậy với độ chính xác 25 giờ, độ tin cậy 95% thì cần phải thử nghiệm n = 62 bóng.
Ví dụ 4.2.5: Một giống lúa mới được trồng tại một địa phương A, năng suất lúa
tuân theo quy luật chuẩn.
a) Trong thời gian đầu gặt được 10 mẫu thấy năng suất trung bình là 2,5 tấn/mẫu,
độ lệch chuẩn mẫu điều chỉnh S’= 1,08 tấn. Hãy ước lượng năng suất trung bình của
giống lúa mới này với độ tin cậy 90%.
b) Với độ chính xác là 0,78. Hãy xác định độ tin cậy.
Giải:
a) X - năng suất lúa; là ĐLNN tuân theo luật chuẩn vứi S’ = 1,08
( X − a) n
Do n = 10 < 30 nên ta có T = ~ T(n-1)
S'
Với γ = 0,9 = T(n – 1) (tα) =>
 n t .S ' 1,833.1,08
Từ công thức t = suy ra  =  = = 0,62
S' n 10
Từ đó có 2,5 – 0,62 < a < 2,5 + 0,62
Vậy năng suất trung bình của giống lúa mới trong khoảng (1,88; 3,12) (tấn/mẫu)
b) Với ε = 0,78 tấn, S’ = 1,08 tấn; n = 10
 n 0,78. 10
Ta có t = = = 2,28 => γ = 0,95
S' 1,08
Vậy, độ tin cậy là 95%.
4.2.3.3 Ước lượng tỉ lệ
Giả sử ta cần nghiên cứu một đám đông kích thước N, trong đó có M phần tử mang
dấu hiệu A. Khi đó P(A) = M/N là tỷ lệ số phần tử mang dấu hiệu A trên đám đông. Ta
không diều tra được trực tiếp p; do đó ta sẽ lấy f = m/n là tỷ lệ của mẫu được lấy ra từ
đám đông đó, với n là kích thước mẫu. Khi n lớn, theo phần 4.1.5 ta có thống kê
( f n − p) n
U= ~ N(0, 1)
p (1 − p )
 n
Ta có γ = P(| X - a| < ε) = 2.Φ(zα) với z = (4.2.4)
f (1 − f )
Khoảng tin cậy đối xứng cho tỷ lệ là f – ε < p < f + ε
Ở đây ta cũng đi giải quyết ba bài toán như khi ước lượng giá trị trung bình:
Bài toán 1: Cho biết giá trị γ, biết n. Tìm giá trị ε

69
- Từ γ = P(| X - a| < ε) = 2.Φ(zα) ta tìm được giá trị Φ(zα). Tra bảng Laplace ta tìm
được zα
 n
- Từ công thức tính z = ta tính được giá trị ε.
f (1 − f )
Bài toán 2: Biết giá trị ε và n. Tính giá trị γ
 n
- Từ công thức z = tìm được giá trị zα
f (1 − f )
- Tra bảng Laplace ta tìm được giá trị Φ(zα)
- Tính γ = 2.Φ(zα)
Bài toán 3: Biết giá trị γ và ε. Tìm giá trị n
- Từ γ = P(| X - a| < ε) = 2.Φ(zα) ta tìm được giá trị Φ(zα). Tra bảng Laplace ta tìm
được zα
2
 n  z f (1 − f ) 
- Từ công thức z = ta tính được n =  

(4.2.5)
f (1 − f )   
Chú ý:Với bài toán này, nếu chưa biết giá trị f khi đó ta phải tìm giá trị nmax =
z 2
(4.2.6)
4 2
Ví dụ 4.2.6: Để ước lượng tỷ lệ sản phẩm xấu của một kho đồ hộp, người ta kiểm
tra ngẫu nhiên 100 hộp thấy có 10 hộp xấu.
a) Hãy ước lượng tỷ lệ sản phẩm xấu của kho với độ tin cậy 95%.
b) Với độ chính xác là ε = 3%, hãy xác định độ tin cậy.
c) Nếu độ tin cậy là 90%, độ chính xác là 0,05 cần phải kiểm tra bao nhiêu hộp, với
tỷ lệ sản phẩm xấu khoảng 10%.
Giải:
a) Với γ = 2.Φ(zα) = 0,95 => zα = 1,96
 n z f (1 − f ) 1,96. 0,1.0,9
Từ z = suy ra  =  = = 0,06
f (1 − f ) n 100
Vậy tỷ lệ sản phẩm xấu của kho với độ tin cậy 95% là 0,1 – 0,06 < p < 0,1 + 0,06
Hay 0,04 < p < 0,16
b) Với ε = 0,03
 n 0,03. 100
Ta có z = = =1
f (1 − f ) 0,1.0,9
Tra bảng Laplace ta được Φ(zα) = 0,34134 => γ = 2.Φ(zα) = 0,68268
Kết luận độ tin cậy là 68,27 %.
c) Với γ = 0,9 = 2.Φ(zα). Tra bảng Laplace ta được zα = 1,65
Với ε = 0,05 và f = 0,1 và
2
 n  z f (1 − f )  (1,65) 2 .0,1.0,9
Từ công thức z = 
ta tính được n =   = = 59,4
f (1 − f )   ( 0, 05) 2
 
70
Vậy cần kiểm tra 60 sản phẩm
Ví dụ 4.2.7: Để ước lượng số cá trong hồ.
Lần I: người ta vớt lên 100 con cá, đeo vòng cho chúng, rồi thả lại vào hồ.
Lần II: người ta vớt lên 100 con cá, thấy có 20 con cá đeo vòng.
Hãy ước lượng số cá trong hồ với độ tin cậy là 90%.
Giải:
Gọi N là số cá trong hồ. Khi đó p = 100/N là tỷ lệ cá có đeo vòng trong hồ.
f = 20/100 là tỷ lệ cá đeo vòng được vớt ở lần thứ hai.
Với γ = 0,9 = 2.Φ(zα). Tra bảng Laplace ta được zα = 1,65
 n z f (1 − f ) 1,65. 0,2.0,6
Từ z = suy ra  =  = = 0,066
f (1 − f ) n 100
Từ đó ta có 0,2 – 0,066 < p < 0,2 + 0,066 hay 0,134 < p < 0,266
100 100
Vậy số cá trong hồ sẽ ở khoảng N hay 376 < N < 747
0,266 0,134
Vậy, số cá trong hồ trong khoảng: (376-747) con.
4.2.3.4. Ước lượng phương sai
Giả sử ĐLNN X của đám dông có phân phối chuẩn với phương sai σ2 chưa biết. Để
ước lượng σ2, từ đám đông ta lấy ngẫu nhiên mẫu kích thước là n. Theo thống kê ở
phần 4.1.5 ta có
(n − 1) S ' 2
2 = ~ χ2 (n – 1)
 2

Khi đó với độ tin cậy 1 – α cho trước ta có thể tìm được các phân vị  12−(n −/ 12) ;  2 (/n2−1)
sao cho P(  2  2(/n2−1) ) =  / 2 và P(  2  12−(n−/ 12) ) = 1 −  / 2
● Từ đó ta có khoảng tin cậy cho σ2 là
(n − 1) S ' 2 (n − 1) S ' 2
( 2 ( n −1) ; ) (Khoảng tin cậy này không đối xứng) (4.2.7)
 / 2 1− / 2
2 ( n −1)

Ví dụ 4.2.8: Giả sử sản lượng của một giống lúa là một đại lượng ngẫu nhiên phân
phối chuẩn với phương sai chưa biết. Trồng giống lúa đó trên 10 thửa ruộng, sau khi
thu hoạch người ta tính được phương sai mẫu điều chỉnh của sản lượng lúa là S’2 =
5,1529 (kg)2. Với độ tin cậy 90% hãy ước lượng phương sai của sản lượng của loại
giống lúa đó.
Giải:
Vì X có phân phối chuẩn nên thống kê
(n − 1) S ' 2
2 = ~ χ2 (n – 1)
2
Ta có thể tìm được khoảng tin cậy 1 - α của σ2 là

71
(n − 1) S ' 2 (n − 1) S ' 2
( ; )
 / 2
2 ( n −1)
1− / 2
2 ( n −1)

Ở mẫu cụ thể theo đầu bài ta có S’2 = 5,1529(kg)2 và n = 10


Ta có 1 - α = 0,90 -> α/2 = 0,05
Tra bảng phân vị của phân phối khi bình phương ta được
 2(/n2−1) =  02,(059) = 16,92 và 12−(n−/ 12) =  02,(959) = 3,325
9.5,1529 9.5,1529
Vậy khoảng tin cậy của σ2 là ( ; ) hay (2,74; 13,95)
16,92 3,325
● Khoảng tin cậy phải của σ2 là
(n − 1) S ' 2
Ta vẫn dùng thống kê  = ~ χ2 (n – 1)
2

2
Với độ tin cậy 1 - α cho trước ta tìm được phân vị  2 ( n −1) sao cho
P(  2  2( n−1) ) = 1 − 
Khi đó khoảng tin cậy phải 1 - α của σ2 là
(n − 1) S ' 2
( ;+ )
 2 ( n −1)
● Khoảng tin cậy trái của σ2 là
(n − 1) S ' 2
Ta vẫn dùng thống kê  2 = ~ χ2 (n – 1)
2
Với độ tin cậy 1 - α cho trước ta tìm được phân vị  2 ( n −1) sao cho
P(  2  12−(n−1) ) = 1 − 
Khi đó khoảng tin cậy phải 1 - α của σ2 là
(n − 1) S ' 2
(−; )
 12−(n −1)
Ví dụ 4.2.8: Biết trọng lượng của các gói hàng do một máy tự dộng đóng là một
ĐLNN phân phối chuẩn. Cân 30 gói hàng do máy đóng ta được kết quả
Trọng lượng(gam) 48 49 50 51 52
Số gói 3 5 8 8 6
Hãy ước lượng phương sai tối đa của trọng lượng các gói hàng do máy đóng.
Giải: Gọi X là trọng lượng của các gói hàng
(n − 1) S ' 2
Vì X có phân phối chuẩn nên có thống kê  2 = ~ χ2 (n – 1)
2
Với độ tin cậy 1 - α ta có thể tìm được khoảng tin cậy trái của σ2 là
(n − 1) S ' 2
(−; )
 12−(n −1)
Với mẫu cụ thể ta tính được S’2 = 1,60. Do đó ta có 12−(n−1) =  02,(9529) = 17,71

72
29.1,60
Khoảng tin cậy trái của σ2 là (−; ) hay (−;27,1)
17,71
Vậy phương sai tối đa của trọng lượng của các gói hàng là 27,1 (gam)2
BÀI TẬP THẢO LUẬN CHƯƠNG 4
Bài 1
Số lượng khách hàng đến mua ở một cửa hàng được thống kê như sau:
Số khách 95-105 105-115 115-125 125-135 135-145 145-155 155-165
Số ngày 4 14 18 15 10 7 2
a) Hãy xác định các đặc trưng của mẫu.
b) Ước lượng số khách trung bình đến cửa hàng với độ tin cậy 98%, biết rằng số
lượng khách là một ĐLNN phân phối chuẩn.
Bài 2
Trong 3500 sinh viên năm thứ nhất của trường Đại học Bách khoa có 28% muốn học
ngành điện tử - viễn thông. Chọn ngẫu nhiên ra một nhóm sinh viên 350 người (của
năm thứ nhất đó). Tính tỷ lệ số sinh viên muốn học ngành điện tử - viễn thông trong
nhóm sinh viên nói trên.
Bài 3
Nhiệt độ của 24 thành phố Việt nam ở cùng một giờ và một ngày trong tháng 7 như
sau:
36; 30; 31; 32; 31; 40; 37; 29; 41; 37; 35; 34; 34; 35; 32; 33; 35; 33; 33; 31; 34; 34;
35; 32.
Hãy xác định khoảng tin cậy 99% cho nhiệt độ trung bình trên.
Bài 4
Điểm trung bình môn Toán của 100 thí sinh dự thi vào ĐHKT là 5 với độ lệch chuẩn
mẫu S’ = 2,5.
a) Ước lượng điểm trung bình môn Toán của toàn thể thí sinh với độ tin cậy là
95%.
b) Với sai số 0,25 điểm. Hãy xác định độ tin cậy.
Bài 5
Trọng lượng các bao bột mì tại cửa hàng lương thực là ĐLNN tuân theo luật chuẩn.
Kiểm tra 20 bao thấy trọng lượng trung bình của mỗi bao bột mì là 48kg, và phương
sai mẫu điều chỉnh là S’2 = (0,5kg)2.
a) Với độ tin cậy 95%, hãy ước lượng trọng lượng trung bình của một bao bột mì
thuộc cửa hàng.
b) Với độ chính xác 0,26kg, xác định độ tin cậy.
c) Với độ chính xác 160g, độ tin cậy 98% thì cần kiểm tra bao nhiêu bao bột mì.
Bài 6
73
Để ước lượng tỷ lệ sản phẩm xấu cảu một kho đồ hộp, người ta kiểm tra ngẫu nhiên
100 hộp thấy có 11 hộp xấu.
a) Ước lượng tỷ lệ sản phẩm xấu của kho đồ hộp với độ tin cậy 94%.
b) Với sai số cho phép 3%, hãy xác định độ tin cậy.
Bài 7
Lô trái cây của một chủ hàng được đóng thành sọt, mỗi sọt 100 trái cây. Kiểm tra 50
sọt thấy có 450 trái không đạt tiêu chuẩn.
a) Ước lượng tỷ lệ trái cây không đạt tiêu chuẩn của lô hàng với độ tin cậy 95%.
b) Muốn ước lượng tỷ lệ trái cây không đạt tiêu chuẩn với độ chính xác 0,5% thì độ
tin cậy đạt được là bao nhiêu.
c) Muốn ước lượng tỷ lệ trái cây không đạt tiêu chuẩn cới độ tin cậy 99% và độ
chính xác 1% thì cần kiểm tra bao nhiêu sọt.
d) Muốn ước lượng tỷ lệ trái cây không đạt têu chuẩn với độ tin cậy 99,7% thì độ
chính xác đạt được là bao nhiêu.
Bài 8
Điều tra năng suất lúa trên diện tích 100 ha trồng lúa của một vùng, ta thu được bảng
số liệu sau:
XS(tạ/ha) 41 44 45 46 48 52 54
Số ha 10 20 30 15 10 10 5
a) Hãy ước lượng năng suất lúa trung bình của vùng đó với độ tin cậy 95%.
b) Những thửa ruộng có năng suất từ 48 tạ/ha trở lên là những thửa ruộng có năng
suất cao.Hãy ước lượng tỷ lệ diện tích có năng suất cao trong vùng với độ tin cậy 97%.
Bài 9
Quan sát chiều cao X (cm) và sức nặng Y (kg) của một số người, ta ghi nhận:
Y 38-42 42-46 46-50 50-54 54-58 58-62 62-66
X
140-145 1 2 2 1
145-150 1 3 2 1
150-155 1 4 1 1
155-160 1 2 3 2 1
160-165 1 3 6 2 1
165-170 1 1 5 2
Hãy tìm khoảng ước lượng cho chiều cao trung bình và cân nặng trung bình với độ
tin cậy 0,95.

74
CHƯƠNG 5: KIỂM ĐỊNH GIẢ THUYẾT
5.1. CÁC KHÁI NIỆM CƠ BẢN
Cùng với lý thyết ước lượng, lý thuyết kiểm định các giả thuyết thống kê là một bộ
phận quan trọng của thống kê toán. Nó là phương tiện giúp ta giải quyết các bài toán
từ góc độ khác liên quan đến dấu hiệu cần nghiên cứu trong tổng thể.
5.1.1. Giả thuyết thống kê
Trong thực tế sản xuất và nghiên cứu ta thường gặp vấn đề: phải nhận định xem một
giả thuyết H0 nào đó đúng hay sai.
● Định nghĩa: Giả thuyết về dạng phân phối xác suất của ĐLNN, về các tham số đặc
trưng của ĐLNN hoặc về tính độc lập của các ĐLNN được gọi là giả thuyết thống kê, ký
hiệu H0. Vấn đề xác định đúng sai của một giả thuyết được gọi là kiểm định.
Ví dụ 5.1.1: Kiểm tra chất lượng sản phẩm của một xí nghiệp. Ban Giám đốc báo
cáo tỷ lệ sản phẩm xấu của xí nghiệp là 1%. Bài toán đặt ra là ta bác bỏ hay chấp nhận
báo cáo đó, nghĩa là chấp nhận hay bác bỏ giả thuyết:
H0: p = 1%
P: tỷ lệ sản phẩm xấu của tổng thể
H0: được gọi là giả thuyết thống kê.
Ví dụ 5.1.2: Một địa phương báo cáo năng suất lúa tại điạ phương là 3 tấn/mẫu.
Chấp nhận hay bác bỏ giả thuyết :
H0: a = 3 tấn/mẫu.
a: năng suất lúa
Giả thuyết H0 được đưa ra kiểm định gọi là giả thuyết gốc, các giả thuyết khác với
gốc được gọi là giả thuyết đối (hay đối thuyết), ký hiệu H1. Việc chấp nhận hay bác bỏ
giả thuyết H0 trong thống kê gọi là kiểm định giả thuyết. Trong phương pháp thống kê
toán học người ta kiểm định giả thuyết H0 thông qua việc quan sát mẫu ngẫu nhiên lấy
từ tổng thể. Sau đó dựa trên một tiêu chuẩn kiểm tra giả thuyết thống kê để chấp nhận
hay bác bỏ H0. Việc kiểm định giả thuyết là đúng sai dựa trên thông tin mẫu được gọi
là kiểm định thống kê.
5.1.2. Quy tắc kiểm định giả thuyết
● Tiêu chuẩn kiểm định
Tiêu chuẩn được xây dựng phải đơn giản và dựa trên các thông tin mẫu x1, x2,…, xn.
Thông thường người ta chọn một thống kê K = K(x1, x2,…, xn) có thể phụ thuộc vào

75
tham số đã biết trong giả thuyết H0. Nếu giả thuyết H0 đúng thì luật phân phối của K
phải hoàn toàn xác định. Thống kê như vậy gọi là tiêu chuẩn kiểm định.
● Quy tắc kiểm định
Bài toán kiểm định giả thuyết thống kê tổng quát được đặt dưới dạng sau:
- Thiết lập giả thuyết H0 và đối thuyết H1.
- Gỉa sử giả thuyết H0 đúng và từ đó xây dựng một tiêu chuẩn kiểm định.
- Trong quá trình kiểm định có thể mắc phải 2 loại sai lầm:
Sai lầm loại 1: Ta bác bỏ giả thuyết H0 ( nghĩa là chấp nhận H1) mặc dù H0 đúng.
Sai lầm này được đặc trưng bởi xác suất P (bác bỏ H0/H0 đúng)
Sai lầm loại 2: Ta chấp nhận giả thuyết H0 tuy rằng H0 sai. Sai lầm này được đặc
trưng bởi xác suất P (chấp nhận H0/H0 sai).
Hai sai lầm này mâu thuẫn với nhau: Chẳng hạn muốn giảm sai lầm loại 2, nghĩa là
hạn chế sự chấp nhận H0, nhưng làm như thế khả năng bác bỏ H0 khi H0 đúng sẽ tăng
lên, tức là khả năng mắc sai lầm loại 1 sẽ tăng lên. Vì thế người ta tìm các tiêu chuẩn
kiểm định sao cho khi áp dụng tiểu chuẩn này thì xác suất mắc sai lầm loại 1 sẽ nhỏ
hơn một mức quy định trứơc, và xác suất mắc sai lầm loại 2 sẽ bé một cách hợp lý.
Từ đó người ta coi tiêu chuẩn kiểm định là chấp nhận được nếu sai lầm loại 1 bé
hơn một số α cho trước. Nghĩa là P(Bác bỏ H0/H0 đúng) ≤ α; trong đó α được gọi là
mức ý nghĩa, được ấn định khá nhỏ thường là α ≤ 5%. Điều này có nghĩa là nguy cơ để
bác bỏ H0 khi H0 đúng có xác suất nhỏ hơn hoặc bằng 5%. Trong thực tế tuỳ theo từng
trường hợp cụ thể ta có thể lấy α ở mức 5% hay 1%.
5.1.3. Các dạng miền tới hạn
● Nếu H0: θ = θ0 và H1: θ ≠ θ0, ta chọn các phân vị Kα/2 và K1 – α/2 sao cho
P(K > K1 – α/2 | H0) = α/2; P(K < K α/2 | H0) = α/2
Khi đó miền tới hạn là Bα = (- ∞, Kα/2 )  (K1 – α/2, + ∞).
● Nếu H1 bất đối xứng lệch về trái (tức là H1: θ < θ0), ta xác định phân vị Kα sao cho
P(K < Kα| H0) = α và miền tới hạn Bα = (- ∞, Kα ).
● Nếu H1 bất đối xứng lệch về phải (tức là H1: θ > θ0), ta xác định phân vị K1 - α sao
cho P(K < K1 - α | H0) = α và miền tới hạn Bα = (K1 – α, + ∞).
5.2. KIỂM ĐỊNH GIẢ THUYẾT VỀ GIÁ TRỊ TRUNG BÌNH
5.2.1. Kiểm định dùng một mẫu
5.2.1.1. Trường hợp mẫu n  30 (hoặc n < 30) và phương sai σ2 đã biết
Trong trường hợp này ta chọn tiêu chuẩn
X − a0
K= n (5.2.1)

Rõ ràng nếu H0 đúng thì K ~ N(0, 1) xác định hoàn toàn. Phụ thuộc vào đối thuyết
H1 ta có các miền tới hạn khác nhau.
76
● Kiểm định hai phía:
- Giả thuyết H0: a = a0; đối thuyết H1: a ≠ a0.
- Tiêu chuẩn gốc zα được xác định 1 – α = 2Φ(zα)
- Tiêu chuẩn kiểm định được xác định ở công thức (5.2.1)
- Nếu |K| ≤ zα ta chấp nhận H0 (không có cơ sở bác bỏ H0); |K| > zα ta bác bỏ H0.
● Kiểm định phía trái
- Giả thuyết H0: a = a0; đối thuyết H1: a < a0.
- Tiêu chuẩn gốc zα được xác định Φ(zα) = α – 0,5
- Tiêu chuẩn kiểm định được xác định ở công thức (5.2.1)
- Nếu K < zα ta bác bỏ H0.
● Kiểm định phía phải
- Giả thuyết H0: a = a0; đối thuyết H1: a > a0.
- Tiêu chuẩn gốc zα được xác định Φ(zα) = 0,5 - α
- Tiêu chuẩn kiểm định được xác định ở công thức (5.2.1)
- Nếu K > zα ta bác bỏ H0.
Ví dụ 5.2.1: Giám đốc của một xí nghiệp cho biết lương trung bình của một công
nhân thuộc xí nghiệp là 260 ngàn đồng/ tháng. Chọn ngẫu nhiên 36 công nhân thấy
lương trung bình là 240 ngàn / tháng, với độ lệch chuẩn σ = 43 ngàn. Báo cáo của
giám đốc có tin cậy không , với mức có ý nghĩa là α = 5%?
Giải:
X : lương trung bình dựa trên mẫu.
A: lương trung bình thật sự
a0: lương trung bình theo giám đốc.
- Giả thuyết H0: a = 260 ngàn (có nghĩa lương trung bình thực sự không khác lương
trung bình theo lời giám đốc).
Đối thuyết H1: a  260 ngàn
Với α = 5% => 1 – α = 2Φ(zα) => zα = 1,96.
- Tiêu chuẩn kiểm định
X − a0 240 − 260
K= n= 36 = 2,79
 43
- Ta có |K| > zα nên ta bác bỏ giả thuyết H0. Có nghĩa là lương trung bình thực sự
khác với lương trung bình theo lời giám đốc. Vậy lời giám đốc không đáng tin cậy.
Chú ý: Trường hợp n ≥ 30 và σ2 chưa biết thay thế bởi S’2 phương sai mẫu điều chỉnh.
Ví dụ 5.2.2: Ở thập niên 70, trọng lượng trung bình của thanh niên lứa tuổi 20 là
42 kg. Nay để xác định lại trọng lượng ấy người ta chọn ngẫu nhiên 100 thanh niên đo
trọng lượng và được trọng lượng trung bình là 48 kg, với phương sai mẫu điều chỉnh

77
S’2 = 15 (kg)2. Trọng lượng thanh niên hiện nay phải chăng có khuynh hướng tăng, với
mức có ý nghĩa là 5%?
Giải:
Đặt a: trọng luợng trung bình của thanh niên hiện nay.
a0: trọng lượng trung bình của thanh niên thập niên 70.
X : trọng lượng trung bình của thanh niên theo mẫu.
- Giả thuyết H0: a = 42 kg; Đối thuyết H1: a  42 kg
Với α = 5% => 1 – α = 2Φ(zα) => zα = 1,96.
- Tiêu chuẩn kiểm định
X − a0 42 − 48
K= n= 100 = 4
S' 15
- Ta có |K| > zα nên ta bác bỏ giả thuyết H0. Như vậy trọng lượng thanh niên có
khuynh hướng tăng.
Ví dụ 5.2.3: Một ông chủ cửa hàng thùng cho rằng dung tích trung bình của thùng
là 55 lít với độ lệch chuẩn σ = 6 lít. Do kích thước tôn mua về đã cố định nên không có
khả năng đóng được thùng có dung tích lớn hơn nữa. Hãy kiểm định lại ý kiến của ông
chủ trên với mức ý nghĩa 1%, biết rằng khi kiểm tra 36 thùng ta thấy dung tích trung
bình chỉ có 49 lít.
Giải:
- Giả thuyết H0: a = 55 lít; đối thuyết H1: a < 55 lít.
Ta có Φ(zα) = α – 0,5 = - 0,499. Tra bảng Laplace ta được - zα = 3,09.
- Tiêu chuẩn kiểm định
X − a0 49 − 55
K= n= 36 = −6
 6
- Ta thấy – 6 < - 3,09 nên bác bỏ H0. Vậy không có cơ sở để chấp nhận ý kiến của
ông chủ cửa hàng thùng.
5.2.1.2. Trường hợp cỡ mẫu n < 30 và chưa biết σ2
X − a0
Ta sử dụng thống kê K = n (5.2.2)
S'
Khi H0 đúng ta đã biết K sẽ có phân phối Student t(n – 1).
● Kiểm định hai phía
- Giả thuyết H0: a = a0; đối thuyết H1: a ≠ a0.
- Tiêu chuẩn gốc tα = K1 – α/2 = tn – 1, α/2
- Tiêu chuẩn kiểm định được xác định ở công thức (5.2.2)
- Nếu |K| ≤ tα ta chấp nhận H0 (không có cơ sở bác bỏ H0); |K| > tα ta bác bỏ H0.
● Kiểm định phía trái
- Giả thuyết H0: a = a0; đối thuyết H1: a < a0.

78
- Tiêu chuẩn gốc tα được xác định tα = Kα = tn – 1, α
- Tiêu chuẩn kiểm định được xác định ở công thức (5.2.2)
- Nếu K < tα ta bác bỏ H0.
● Kiểm định phía phải
- Giả thuyết H0: a = a0; đối thuyết H1: a > a0.
- Tiêu chuẩn gốc tα được xác định tα = K1- α = tn – 1, 1 - α
- Tiêu chuẩn kiểm định được xác định ở công thức (5.2.2)
- Nếu K > tα ta bác bỏ H0.
Ví dụ 5.2.4: Một cửa hàng thực phẩm nhận thấy thời gian vừa qua trung bình 1
khách hàng mua 15 ngàn đồng thực phẩm. Tuần này cửa hàng chọn ngẫu nhiên 15
khách hàng thấy trung bình 1 khách hàng mua 14 ngàn đồng thực phẩm với phương
sai mẫu điều chỉnh là S’2 = (2ngàn)2, cho biết sức mua của khách hàng tuân theo phân
phối chuẩn. Với mức ý nghĩa là 5%, sức mua của khách hàng hiện nay có thực sự giảm
sút?
Giải:
- Giả thuyết H0: a = 15 ngàn ( sức mua không thay đổi); Đối thuyết H1: a  15 ngàn.
Với n =15 < 30; α = 5% => tα = 2,145
- Tiêu chuẩn kiểm định
X − a0 14 − 15
K= n= 15 = 1,94
S' 2
- Vậy |K| < tα do đó ta chấp nhận H0.
Vậy sức mua của khách hàng không đổi.
Ví dụ 5.2.5: Một nhà nhân chủng học cho rằng chiều cao trung bình của một tộc
người thiểu số là 160cm. Người ta chọn ngẫu nhiên ra 16 người lớn của tộc người đó
thì thấy chiều cao trung bình là 164,25cm với S’ = 6,25cm. Có thể cho rằng tộc người
đó có chiều cao trung bình lớn hơn 160cm hay không (giả sử chiều cao tuân theo luật
chuẩn) với mức ý nghĩa là 5%.
Giải
- Giả thuyết H0: a = 160 và đối thuyết H1: a > 160.
Với n =16 < 30; α = 0,05 => tα = tn – 1, 1 - α = t15, 0,95 = 1,753
- Tiêu chuẩn kiểm định
X − a0 164,25 − 160
K= n= 16 = 1,36
S' 6,25
- Do 1,36 < 1,753 ta không có cơ sở để bác bỏ H0, có nghĩa là ý kiến của nhà nhân
chủng học là có thể tin được.
5.2.2. Kiểm định dùng hai mẫu

79
Giả sử ta có hai tổng thể, từ đó chọn ra hai mẫu tương ứng X ~ N(a1, σ21) và Y ~
N(a2, σ22). Nếu muốn so sánh a1 và a2 người ta đưa ra giả thuyết H0: a1 = a2. Thông tin
mẫu bao gồm hai tập mẫu tương ứng là x1, x2,…, xn1 và y1, y2,…, yn2.
5.2.2.1. Trường hợp mẫu lớn n1 ≥ 30 và n2 ≥ 30 (hoặc n1 và n2 nhỏ nhưng đã
biết σ21 và σ22)
Ta chọn thống kê
X1 − X 2
K= (5.2.3)
 12  22
+
n1 n2
Trong trường hợp với n1 ≥ 30 và n2 ≥ 30 mà chưa biết σ21 và σ22 thì ta dùng
các phương sai điều chỉnh mẫu S’1 và S’2 để thay thế. Khi đó ta xét các bài toán kiểm
định:
● Kiểm định hai phía:
- Giả thuyết H0: a1 = a2; đối thuyết H1: a1 ≠ a2.
- Tiêu chuẩn gốc zα được xác định 1 – α = 2Φ(zα)
- Tiêu chuẩn kiểm định được xác định ở công thức (5.2.3)
- Nếu |K| ≤ zα ta chấp nhận H0 (không có cơ sở bác bỏ H0); |K| > zα ta bác bỏ H0.
● Kiểm định phía trái
- Giả thuyết H0: a1 = a2; đối thuyết H1: a1 < a2.
- Tiêu chuẩn gốc zα được xác định Φ(zα) = α – 0,5
- Tiêu chuẩn kiểm định được xác định ở công thức (5.2.3)
- Nếu K < zα ta bác bỏ H0.
● Kiểm định phía phải
- Giả thuyết H0: a1 = a2; đối thuyết H1: a1 > a2.
- Tiêu chuẩn gốc zα được xác định Φ(zα) = 0,5 - α
- Tiêu chuẩn kiểm định được xác định ở công thức (5.2.3)
- Nếu K > zα ta bác bỏ H0.
5.2.2.1. Trường hợp n1 và n2 nhỏ nhưng không biết σ21 và σ22
Trong trường hợp này ta sẽ dùng đến thống kê
X1 − X 2
K= (5.2.4)
(n1 − 1) S ' + (n2 − 1) S '  1
2 2
1 
1 2
. + 
n1 + n2 − 2  n1 n2 
Nếu hai biến hai gốc có phương sai gióng nhau thì H0 đúng khi đó K ~ t(n1 + n2 –
2). Từ đó cách làm giống như bài toán đã trình bày ở phần kiểm định giá trị trung
bình dùng một mẫu ở phần (5.2.1.2).

80
Ví dụ 5.2.6: Chọn ngẫu nhiên 80 bóng đèn của xí nghiệp A thấy tuổi thọ trung bình
là 1,258 giờ, độ lệch chuẩn σ1 = 94 giờ. Chọn ngẫu nhiên 60 bóng đèn của xí nghiệp B
thấy tuổi thọ trung bình là 1,029 giờ, σ2 = 68 giờ. Với mức có ý nghĩa là 5%, hãy kiểm
định có phải thực sự tuổi thọ của 2 loại bóng đèn khác nhau không?
Giải:
- Lập giả thuyết H0: a1= a2 (tuổi thọ hai bóng đèn như nhau); đối thuyết H1: a1  a2.
Với α = 0,05 nên tra bảng Laplace ta được zα = 1,96.
- Tiêu chuẩn kiểm định: Theo công thức (5.2.3) ta được
X1 − X 2 1,258 − 1,029
K= = = 16,73
 12  22 (94) 2 (68) 2
+ +
n1 n2 80 60
- Ta thấy |K| > zα vậy bác bỏ giả thuyết H0. Do đó tuỏi thọ của bóng đèn XN A lớn
hơn tuổi thọ của bóng đèn XN B.
Ví dụ 5.2.7: Nhà toán học Pearson muốn so sánh chiều cao của thế hệ cha và con
ở lứa tuổi đã trưởng thành, ông đã đo chiều cao của 1078 người cha và 1078 người
con đã trưởng thành, được số liệu sau:
Cha: X 1 = 171,98 cm, S’1 = 47,74 cm
Con: X 2 = 174,42 cm, S’2 = 49,03 cm
Với mức có ý nghĩa là 1%, hãy kiểm định xem chiều cao của thế hệ cha và thế hệ
con có khác nhau?
Giải:
- Lập giả thuyết:H0: a1 = a2 (chiều cao trung bình của 2 thế hệ không khác nhau)
Đối thuyêt H1: a1  a2.
Với α = 0,01 nên tra bảng Laplace ta được zα = 2,58.
- Tiêu chuẩn kiểm định
X1 − X 2 171,98 − 174,42
K= = = 1,17
S '12 S ' 22 (47,74) 2 (49,03) 2
+ +
n1 n2 1078 1078
- Do |K| < zα nên chưa đủ cơ sở bác bỏ giả thuyết H0.
Vậy chiều cao trung bình của thế hệ con không cao hơn chiều cao trung bình của
thế hệ cha.
Ví dụ 5.2.8: Lương trung bình của 10 công nhân thuộc xí nghiệp A là 180 ngàn, với
S’1 = 14 ngàn . Lương trung bình của 12 công nhân thuộc xí nghiệp B là 170 ngàn, S’2 =
10 ngàn. Thực sự lương trung bình của 2 xí nghiệp có khác nhau không, với mức có ý
nghĩa 5%?
Giải:
81
- Giả thuyêt H0: a1 = a2 (lương trung bình của hai xí nghiệp như nhau)
Đối thuyết H1: a1  a2.
- Do n1 và n2 khá nhỏ nên với α = 5%  tα = 2,09 (tra bảng Student 10 + 12 - 2 = 20
bậc tự do).
- Tiêu chuẩn kiểm định
X1 − X 2 180 − 170
K= = = 1,858
(n1 − 1) S ' + (n 2 − 1) S '
2 2
1 1  9.(14) + 11.(10) 2  1
2
1
1 2
. +  . + 
n1 + n2 − 2  n1 n 2  20  10 12 
- Ta có |K| < tα nên không thể bác bỏ H0. Do đó lương trung bình của hai xí nghiệp
như nhau.
Ví dụ 5.2.9: Nghiên cứu trọng lượng sơ sinh của hai nhóm trẻ có mẹ hút thuốc và
hút thuốc trên hai mẫu tương ứng:
n1 = 15; X 1 = 3,5933; S’1 = 0,3707
n2 = 14; X 2 = 3,5933; S’2 = 0,3707
Giả sử trọng lượng trẻ ở hai nhóm trên có phân phối chuẩn cùng phương sai. Với
mức ý nghĩa 0,05 có thể cho rằng trẻ sơ sinh ở nhóm mẹ hút thuốc nhẹ cân hơn của
nhóm mẹ không hút thuốc không?
Giải:
- Lập giả thuyết:H0: a1 = a2 ; Đối thuyêt H1: a1> a2.
Với n1 + n2 – 2 = 27 và α = 0,05 nên ta có tα = t27; 0,05 = 1,703.
- Tiêu chuẩn kiểm định
X1 − X 2 3,5933 − 3,2029
K= =  2,42
(n1 − 1) S ' + (n 2 − 1) S '  1
2 2
1  14.(0,3707) 2 + 13.(0,4927) 2  1 1
1 2
. +  . + 
n1 + n2 − 2  n1 n2  27  15 14 
- Do 2,42 > 1,703 nên có cơ sở để cho rằng trẻ ở nhóm mẹ không hút thuốc nặng
hơn.
5.3. KIỂM ĐỊNH TỶ LỆ
5.3.1. Kiểm định dùng một mẫu
Giống như bài toán kiểm định giá trị trung bình, ta giải quyết bài toán kiểm định về
tỷ lệ sau:
Với mức ý nghĩa α, hãy kiểm định giả thuyết H0: p = p0, biết rằng p là tham số phân
phối B(1, p). Tuy nhiên, ở chương trước ta đã biết nếu dung lượng mẫu n lớn và p
không quá gần 0 hoặc 1 thì phân phối chuẩn có thể được dùng xấp xỉ phân phối nhị
thức B(n, p). Nếu gọi f = m/n là tần suất mẫu - ước lượng của xác suất p, thì f sẽ có
phân phối xấp xỉ chuẩn với kỳ vọng p và phương sai p(1 – p)/n; hay f ~ N(p, p(1 –
p)/n).

82
Khi đó tiêu chuẩn kiểm định sẽ là:
f − p0
K= n (5.3.1)
p0 (1 − p0 )
và ta sẽ bác bỏ H0 nếu |K| > zα với 2.Φ(zα) = 1 – α
Các quy tắc kiểm định của bài toán kiểm định tỷ lệ được xây dựng giống như bài
toán kiểm định giá trị trung bình.
● Kiểm định hai phía:
- Giả thuyết H0: p = p0; đối thuyết H1: p ≠ p0.
- Tiêu chuẩn gốc zα được xác định 1 – α = 2Φ(zα)
- Tiêu chuẩn kiểm định được xác định ở công thức (5.3.1)
- Nếu |K| ≤ zα ta chấp nhận H0 (không có cơ sở bác bỏ H0); |K| > zα ta bác bỏ H0.
● Kiểm định phía trái
- Giả thuyết H0: p = p0; đối thuyết H1: p < p0.
- Tiêu chuẩn gốc zα được xác định Φ(zα) = α – 0,5
- Tiêu chuẩn kiểm định được xác định ở công thức (5.3.1)
- Nếu K < zα ta bác bỏ H0.
● Kiểm định phía phải
- Giả thuyết H0: p = p0; đối thuyết H1: p > p0.
- Tiêu chuẩn gốc zα được xác định Φ(zα) = 0,5 - α
- Tiêu chuẩn kiểm định được xác định ở công thức (5.3.1)
- Nếu K > zα ta bác bỏ H0.
Ví dụ 5.3.1: Theo nguồn tin tỷ lệ hộ dân thích xem chương trình “trong nhà ngoài
phố” trên TV là 80%. Thăm dò 36 hộ dân thấy có 25 hộ thích xem chương trình này.
Với mức ý nghĩa là 5%, kiểm định xem nguồn tin này có đáng tin cậy không?
Giải:
- Giả thuyết H0: p = 0,8; Đối thuyết H1: p  0,8.
Với α = 0,05 => zα = 1,96.
- Tiêu chuẩn kiểm định:
Với tỷ lệ thăm dò là f = 25/36 có
25
− 0,8
f − p0 36
K= n= 36 = 1,5
p 0 (1 − p 0 ) 0,8.0,2
- Do |K| < zα nên chấp nhận H0. Vậy nguồn tin trên là đáng tin cậy.
Ví dụ 5.3.2: Một hiệu làm đầu cho rằng 90% khách hàng của họ hài lòng với chất
lượng phục vụ. Nghi ngờ chủ hiệu nói quá lên, một nhà điều tra xã hội học phỏng vấn
150 khách hàng của hiệu làm đầu thì thấy 132 người nói hài lòng. Với mức ý nghĩa
0,05 có thể trả lời thế nào cho nghi ngờ trên.
83
Giải:
- Giả thuyết H0: p = 0,9; Đối thuyết H1: p < 0,9.
Với α = 0,05 => Φ(zα) = α – 0,5 = - 0,45 nên zα = - 1,645
- Tiêu chuẩn kiểm định:
Với tỷ lệ thăm dò là f = 132/150 có
132
− 0,9
f − p0 150
K= n= 150 = −0,833
p 0 (1 − p 0 ) 0,9.0,1
- Do -0,833 > -1,645 nên chấp nhận H0. Do vậy không có cơ sở bác bỏ ý kiến của
chủ cửa hàng làm đầu.

5.3.2. Kiểm định dùng hai mẫu


Cho hai tổng thể có các biến gốc X ~ B(1, p1) và Y ~ B(1, p2). Ta có thể so sánh các
xác suất p1 và p2 bằng kiểm định giả thuyết H0: p1 = p2
Tiêu chuẩn kiểm định
f1 − f 2
K= (5.3.2)
1 1 
f (1 − f ) + 
 n1 n2 
trong đó fi là tần suất mẫu tương ứng với hai mẫu x1, x2,…, xn1 và y1, y2,…, yn2 và:
n1 f1 + n2 f 2
f = (5.3.3)
n1 + n2
● Kiểm định hai phía:
- Giả thuyết H0: p1 = p2; đối thuyết H1: p1 ≠ p2.
- Tiêu chuẩn gốc zα được xác định 1 – α = 2Φ(zα)
- Tiêu chuẩn kiểm định được xác định ở công thức (5.3.2)
- Nếu |K| ≤ zα ta chấp nhận H0 (không có cơ sở bác bỏ H0); |K| > zα ta bác bỏ H0.
● Kiểm định phía trái
- Giả thuyết H0: p1 = p2; đối thuyết H1: p1 < p2.
- Tiêu chuẩn gốc zα được xác định Φ(zα) = α – 0,5
● Kiểm định phía phải
- Giả thuyết H0: p1 = p2; đối thuyết H1: p1 > p2.
- Tiêu chuẩn gốc zα được xác định Φ(zα) = 0,5 - α
- Tiêu chuẩn kiểm định được xác định ở công thức (5.3.2)
- Nếu K > zα ta bác bỏ H0.
Ví dụ 5.3.3: Từ kho đồ hộp I, lấy ngẫu nhiên 1000 hộp để kiểm tra thấy có 20 hộp
bị hư. Từ kho thứ II, lấy ngẫu nhiên 900 hộp thấy có 30 hộp bị hư. Hỏi chất lượng bảo
quản của 2 kho có thực sự khác nhau hay không ? Với mức ý nghĩa là 5%.

84
Giải:
- Giả thuyết H0: p1= p2; Đối thuyết H1: p1  p2.
Với Với α = 0,05 => zα = 1,96.
- Với f1 = 0,02 tỷ lệ đồ hôpk bị hư ở mẫu của kho I.
f2 = 0,0333 tỷ lệ đồ hôpk bị hư ở mẫu của kho II.
n1 f1 + n2 f 2 1000.0,02 + 900.0,03
Ta có f = = = 0,0263
n1 + n2 1000 + 900
Tiêu chuẩn kiểm định
f1 − f 2 0,02 − 0,0333
K= = = 1,808
1 1   1 1 
f (1 − f ) +  0,0263.(1 − 0,0263) + 
 n1 n2   1000 900 
- Từ đó |K| < zα chưa đủ cơ sở để bác bỏ H0. Vậy hai kho bảo quản tương tự nhau.
5.4. KIỂM ĐỊNH PHƯƠNG SAI
5.4.1. Kiểm định dùng một mẫu
Với giả thiết của biến gốc X và xuất phát từ một mẫu x1, x2,…,xn ta kiểm định giả
thuyết sau:
Giả thuyết H0: DX = σ20 (σ0 đã biết) với mức ý nghĩa α. Để kiểm định giả thuyết trên
ta dùng thống kê
(n − 1) S ' 2
K= (5.4.1)
 02
Nếu giả thuyết H0 đúng thì K ~ χ2 (n – 1). Ta có các bài toán kiểm định:
● Kiểm định hai phía:
- Giả thuyết H0: σ2 = σ20; đối thuyết H1: σ2 ≠ σ20.
Miền tới hạn là Bα= {K: K < χ2n-1,α/2 hoặc K > χ2n-1,1 - α/2 } (5.4.2)
● Kiểm định phía trái
- Giả thuyết H0: σ2 = σ20; đối thuyết H1: σ2 < σ20.
Miền tới hạn là Bα= {K: K < χ2n-1,α } (5.4.3)
● Kiểm định phía phải
- Giả thuyết H0: σ2 = σ20; đối thuyết H1: σ2 > σ20.
Miền tới hạn là Bα= {K: K > χ2n-1,1 - α } (5.4.4)
Ví dụ 5.4.1: Chủ hãng sản xuất một loại thiết bị đo cho biết độ lệch chuẩn của sai
số đo (giả sử nó tuân theo luật chuẩn) là 5mm. Kiểm tra 19 thiết bị đo thì thấy S’2 =
33mm2. Với α = 0,05 có thể kết luận gì về ý kiến trên của chủ hãng?
Giải:
- Giả thuyết H0: σ2 = 15 ; đối thuyết H1: σ2 ≠ 25.
Với α = 0,05 ta có χ2n-1,α/2 = χ218; 0,025 = 8,2 và χ2n-1,1 - α/2 = χ218; 0,975 = 31,5
- Tiêu chuẩn kiểm định

85
(n − 1) S ' 2 18.33
K= = = 23,76
 2
0 25
- Do 8,2 < 23,76 < 31,5 nên chấp nhận được ý kiến của chủ hãng.
5.4.2. Kiểm định dùng hai mẫu
Cho hai tổng thể với hai biến gốc X ~ N(a1, σ21) và Y ~ N(a2, σ22). Từ hai mẫu tương
ứng x1, x2,…, xn1 và y1, y2,…, yn2 ta so sánh hai phương sai σ21 và σ22.
Với mức ý nghĩa α hãy kiểm định H0: σ21 = σ22.
Ta chọn thống kê
S '12
K= và K ~ F(n1 – 1, n2 -1). Khi đó ta có: (5.4.5)
S ' 22
● Kiểm định hai phía:
- Giả thuyết H0: σ21 = σ22; đối thuyết H1: σ21 ≠ σ22.
Miền tới hạn là Bα= {K: K < Fn1-1, n2 - 1,α/2 hoặc K > Fn1 – 1, n2 - 1,1 - α/2 } (5.4.6)
● Kiểm định phía phải
- Giả thuyết H0: σ21 = σ22; đối thuyết H1: σ21 > σ22.
Miền tới hạn là Bα= {K: K < Fn1 – 1, n2 - 1,1 - α } (5.4.7)
5.5. HỒI QUY VÀ TƯƠNG QUAN TUYẾN TÍNH
5.5.1. Khái niệm
Trong các phần trước, ta chỉ khảo sát một đại lượng ngẫu nhiên trên tổng thể, tuy
nhiên trong thực tế đôi khi chúng ta cần xét đồng thời 2 đại lượng ngẫu nhiên trong
mối quan hệ ràng buộc với nhau trên cùng một tổng thể. Để minh hoạ chúng ta xét các
ví dụ sau:
i) Quan hệ giữa chu vi đường tròn Y và bán kính X.
ii) Độ dài đoạn đường di chuyển Y và thời gian di chuyển X.
iii) Giữa chiều cao X và sức nặng Y của một người.
Qua các ví dụ trên, chúng ta thấy sự phụ thuộc giữa các đặc tính có thể thể hiện
dưới hai dạng chính sau:
Sự phụ thuộc hàm:
Trong ví dụ (i) và (ii) có mối tương quan giữa X và Y được xác định bởi các hàm:
Y = 2πX
Y = VX
Nghĩa là với mỗi giá trị X = x có tương ứng một giá trị xác định Y.Ta gọi sự phụ
thuộc đó là sự phụ thuộc hàm.
Sự phụ thuộc thống kê:
Trong ví dụ (iii) các đại lượng ngẫu nhiên X, Y không bị ràng buộc với nhau bằng 1
quy tắc chặt chẽ như ví dụ (i) và (ii), tuy nhiên giữa các đặc tính đó vẫn có một sự
tương quan nhất định.

86
Khi cho X một giá trị x, thì Y có thể nhận nhiều gía trị khác nhau, các giá trị này
phân phối quanh giá trị trung bình YX tương ứng với x.
Trong trường hợp đó ta nói Y có sự phụ thuộc thống kê đối với X. Nói khác đi sự
phụ thuộc thống kê của Y đối với X biểu hiện ở chỗ khi X thay đổi thì phân phối các giá
trị của Y thay đổi. Trong trường hợp đặc biệt khi sự phụ thuộc thống kê biểu hiện dưới
dạng: nếu một trong hai đại lượng X và Y thay đổi thì gía trị trung bình của đại lượng
kia cũng thay đổi như một hàm của đại lượng đó. Khi đó ta nói 2 đại lượng có tương
quan lẫn nhau.
Nhận xét trực quan sự phụ thuộc tương quan bằng đồ thị phân tán
Xét hai đại lượng ngẫu nhiên X và Y. Gọi xi, yi (i = 1, 2,…, n) là các giá trị cụ thể của
các đặc tính X và Y. Ta biểu diễn mỗi cặp số (xi, yi) bởi điểm Mi trên mặt phẳng hệ toạ
độ vuông góc xOy.
Các điểm Mi lập nên một “đám mây thống kê” thường được gọi là đồ thị phân tán.
i) Các điểm Mi nằm sát theo đường thẳng hay một đường Parabol,… ta phải nghĩ
rằng giữa X và Y có liên quan hàm.
ii) Các điểm Mi nằm rải rác không theo một quy tắc nào , ta nghĩ rằng X, Y độc lập.
iii) Các điểm Mi tập trung vào 1 vùng nhất định có dạng hình bầu dục
+) Nếu trục lớn của hình bầu dục nghiêng lên, ta có ý nghĩ X và Y đồng biến và có
tương quan thuận.
+) Nếu trục lớn nghiêng xuống, ta có ý nghĩ X và Y nghịch biến và có tương quan
nghịch.
Trong phạm vi của phần này, chúng ta chỉ xét dạng tương quan tuyến tính.
5.5.2. Mạng tương quan – Bảng tương quan - Đường hồi quy thực nghiệm
5.5.2.1. Mạng tương quan
X và Y là hai đại lượng ngẫu nhiên trên một tổng thể. Chọn ngẫu nhiên một kích
thước n, trong đó (X, Y) nhận các gía trị (x1, y1),…,(xn, yn).
Sắp xếp và đánh số lại, chúng ta có thể viết các cặp gía trị này của X và Y vào bảng
sau:

X x1 x2  x2i  xr ny
Y
y1 n11 n12  n1i  n1r ny1

y2 n21 n22  n2i  n2r ny2

yj nj1 nj2  nji  njr nỵ

87
ys ns1 ns2  nsi  nsr nỵs

ns nx1 nx 2  nx s  nxr n

Bảng trên gọi là mạng tương quan.


Ví dụ 5.5.1: Độ tuổi và chiều cao của 100 em bé. với X: Tuổi; Y: Chiều cao (cm) .
Khi đó mạng tương quan của X và Y

X 4 6 8 nY
Y
80 15 8 2 25
90 10 32 13 55
100 0 5 15 20
nX 25 45 30 n = 100
Ví dụ 5.5.2: Giá thành sản phẩm và số lượng sản phẩm của 50 xí nghiệp. X: số
lượng đơn vị sản phẩm ( chiếc), Y: Giá thành một đơn vị sản phẩm (ngàn đồng)
Mạng tương quan của X và Y.
X 50 100 150 200 nY
Y
10 2 1 3
20 3 6 6 15
30 3 8 6 3 20
40 5 4 1 10
50 2 2
nX 10 15 15 10 n = 50
5.5.2.2. Bảng tương quan
Ứng với mỗi giá trị X = xi ta có 1 dãy gía trị Y xuất với những tần số khác nhau, nên
ta tìm cách thay thế phân phối các giá trị Y đó bằng một đại lượng có đủ tư cách đại
88
diện cho chúng. Người ta sử dụng YX = E (YX) làm gía trị tiêu biểu đại diện cho các giá
trị YX ứng với X = x.
Đặt g(x) = YX .
+) Hàm số này được gọi là hàm hồi quy của Y theo X.
+) Phương trình: g(x) = YX được gọi là phương trình hồi quy của Y theo X.
+) Đồ thị của hàm g được gọi là đường hồi quy của Y theo X.
Tương tự ta có:
+) h(Y) = X Y : phương trình hồi qui của X theo Y
Ví dụ 5.5.3: Xét độ tuổi, chiều cao của 100 em bé.
Ta có: Chiều cao trung bình của một em bé 4 tuổi:
80.15 + 90.10 + 100.0
Y4 = = 84cm
25
Chiều cao trung bình của một em bé 6 tuổi:
80.8 + 90.32 + 100.5
Y6 = = 89,33cm
45
Chiều cao trung bình của một em bé 8 tuổi:
80.2 + 90.13 + 100.15
Y8 = = 94,33cm
30
Suy ra bảng tương quan của Y theo X:
X 4 6 8
YX 84 89,33 94,33
Nhận xét:
Các điểm của hàm g(x) = YX qua 2 ví dụ trên sắp xếp theo một đường gần thẳng, vì
  
vậy ta có thể dự đoán rằng có thể xấp xỉ g(x) với một hàm tuyến tính dạng: y = a x + b
Đương nhiên trong sự xấp xỉ này có sự sai số và ta cần phải xác định các giá trị â, b̂
sao cho sai số bé nhất.
5.5.2.3. Các cách xác định đường hồi qui tuyến tính
Giả sử các đặc tính đại lượng X và Y có hồi qui tuyến tính, khi đó đường hồi qui
tuyến tính là đường thẳng. Để xác định đường thẳng hồi qui ta thực hiện n phếp thử
độc lập và thu được các cặp trị số tương ứng của (X, Y) là: (x1, y1),…,(xn, yn).
Vấn đề đặt ra là từ các số liệu đó hãy xác định đường thẳng hồi qui, ở đây ta xét
trường hợp đơn giản, mỗi gía trị xi của X chỉ tương ứng 1 giá trị của Y là y.
  
Vì đường hồi qui là đường thẳng nên có dạng: y = a x + b . Ta cần xác định đường
thẳng thể hiện sự phụ thuộc của Y theo X dựa vào các cặp (xi, yi), có nhiều cách xác
định đường thẳng đó, ở đây ta tìm đường thẳng sao cho tổng bình phương của các
khoảng cách (theo chiều song song với Oy) từ các điểm Mi(xi, yi) đến đường đó bé
nhất.

89
Bài toán dẫn về việc xác định â, b̂ sao cho tổng sau bé nhất:
n   
Đặt F =  ( y − y i ) 2 =  (axi + b − y i ) 2
i =1

Dùng phương pháp bình tphương bé nhẫt ta xác định được công thức tính:
n

 XY − X .Y
 (x i − X )( y i − Y )
a= = i =1
(5.5.1)
S2 n

 (x
i =1
i − X) 2

 
b = Y − aX
  
Khi đó y = a x + b được gọi là phương trình hồi qui tuyến tính.
Ví dụ 5.5.4: Lập phương trình hồi qui tuyến tính giữa độ tuổi và chiều cao của 100
em bé (X: độ tuổi; Y: chiều cao)
X 4 6 8 nY
Y
80 15 8 2 25
90 10 32 13 55
100 0 5 15 20
nX 25 45 30 n = 100
Ta có : X = 6,1;Y = 89,5; XY = 551,6 và X 2 = 39,4 ; S2 (X) = 2,19
 
Suy ra a = 2,58; b = 73,76
Khi đó g(x) = 2,58x + 73,76 là phương trình hồi qui tuyến tính của Y đối với X.
Tương tự ta tính được Y 2 = 8055; S2(Y) = 44,75
 
Suy ra a = 0,126; b = −5,177
Khi đó h(y) = 0,126y – 5,177 là phương trình hồi qui tuyến tính của X đối với Y.
5.5.3. Hệ số tương quan mẫu
X, Y là 2 đại lượng ngẫu nhiên rời rạc, hệ số tương quan giữa X và Y là:
n

XY − X .Y
 (x i − X )( yi − Y )
r= = i =1
(5.5.2)
S(X).S(Y) n n

 (x
i =1
i − X ) 2 . ( yi − Y ) 2
i =1

● Tính chất của hệ số tương quan:


i) – 1 ≤ r ≤ 1
ii) r = ± 1 thì X và Y tương quan tuyến tính
iii) r = 0 thì X và Y không tương quan tuyến tính (đặc biệt nếu thêm điều kiện X và
Y tuân theo luật chuẩn thì 2 biến sẽ trở nên độc lập).
iv) r đặc trưng cho mối quan hệ tuyến tính giữa X và Y. Khi |r| càng lớn thì X và Y
càng có quan hệ chặt chẽ.
90
● Liên hệ giữa hồi qui và hệ số tương quan:
 SY
a = r.
SX
trong đó r: là hệ số tương quan mẫu; SX, SY: là các độ lệch chuẩn mẫu (hoặc độ lệch
chuẩn mẫu hiệu chỉnh).
Ví dụ 5.5.5: Hệ số tương quan giữa độ tuổi và chiều cao của 100 em bé: (theo số
liệu ở ví dụ 5.5.4).
XY − X .Y
r= = 0,5707
S(X).S(Y)
Ví dụ 5.5.6: Người ta nghiên cứu ảnh hưởng của lượng phân bón với năng suất lúa,
làm thí nghiệm ở 100 mảnh ruộng có kết quả sau:
Phân bón(kg) 9 – 11 11 – 13 13 – 15 15 – 17

Năng suất(kg)
75 – 125 22
125 – 175 8 10 3
175 – 225 14 15 12
225 – 275 16
a) Tìm phương trình tương quan tuyến tính của năng suất đối với lượng phân bón.
Đánh giá mức độ chặt chẽ của mối phụ thuộc tương quan tuyến tính này.
b) Tính năng suất trung bình thực nghiệm với điều kiện lượng phân bón từ 9kg -
11kg.
c) Gọi y0 là năng suất tính theo phương trình tương quan tuyến tính mẫu với điều
kiện 9 < x < 11. Giả sử dùng y0 để kết luận năng suất lúa toàn bộ (với điều kiện lượng
phân bón 9 < x 11), thì có chấp nhận được không?
Giải:
a) Ta lập bảng:
X 10 12 14 16 nY nYY NYY2
Y
100 22 2200 22600
150 8 10 3 21 3150 472500
200 14 15 12 41 8200 1640000
250 16 16
nX 44 25 15 16 n = 100 ∑Y = ∑Y2 =
17550 3332500
nXX 440 300 210 256 ∑X =

91
1206
nXX2 440 360 294 409 ∑X2 = ∑XY =
0 0 0 6 15036 219900
Tính các tham số:
X =
X = 12,06; Y = 175,5
n
 X2 = X 2 − ( X ) 2 = 150,36 − (12,06) 2 = 4,92   X = 2,218
 Y2 = Y 2 − (Y ) 2 = 33325− (175,5) 2 = 2524,75   Y = 50,247
XY − X .Y 2199 − 12,06.175,5
r= = = 0,74
 X . Y 2,218.50,247
Tìm phương sai hồi qui:
Y −Y X −X Y − 175,5 X − 12,06
YX = aˆX + bˆ  X = rXY  X = 0,74
σY σX 50,247 2,218
Suy ra
50,247 0,74.50,247
YX = 0,74 X + 175,5 − .12,06 = 16,76 X − 26,67
2,218 2,218
Giữa X và Y có tương quan thuận (rXY > 0). Điều này cũng dễ hiểu vì lượng phân bón
tăng thì sản lượng nói chung có xu hướng tăng. rXY = 0,74 mối tương quan tuyến tính
cũng không được chặt chẽ lắm.
b) Với điều kiện 9 < X < 11, ta coi như X = 10. Khi đó trung bình thực nghiệm của Y
tính như sau:
100.22 + 150.8 + 200.14
Y10 = = 140,91
44
c) Với điều kiện 9 < X < 11, ta coi như X = 10. Từ phương trình tương quan tuyến
tính mẫu ta tính được giá trị trung bình Y:
Y10 = 16,764.10 − 26,675 = 140,965
Đây là bài toán kiểm định giả thuyết về trung bình với a10 chưa biết. Còn theo giả
thuyết thì trung bình đó là a010 = 140,965.
Ta đặt giả thuyết: H0: a0 = a010 = 140,965.
Với 9 < X < 11 ta có bảng số liệu:
Yi ni
100 22
150 8
200 14
Ta có Y10 = 140,965 tính ở trên và tính được S’2 = 1962,8 => S’ = 44,3
Do n = 44 > 30, σ chưa biết nên tiêu chuẩn kiểm định
Y10 − a100 140,91 − 140,965
K= n= 44 = 0,0081
S' 44,3
92
Do |K| quá nhỏ nên ta chấp nhận giả thuyết và điều dự đoán là đúng.

BÀI TẬP THẢO LUẬN CHƯƠNG 5


Bài 1
Giám đốc một xí nghiêpk cho biết lương trung bình của 1 công nhân thuộc xí nghiệp là
380 ngàn đồng/ tháng. Chọn ngẫu nhiên 36 công nhân thấy lương trung bình là 350
ngàn đồng/tháng. Với dộ lệch chuẩn là 40 ngàn, lới báo cáo của giám đốc có tin cậy
được không ( mức ý nghĩa là 5%).
Bài 2
Một hãng phần mền tuyên bố sẽ cung cấp và cài đặt sản phẩm cho các khách hàng
trong thành phố chậm nhất sau 30 phút tính từ lúc nhận được điện thoại đặt hàng.
Chọn một mẫu gồm 28 khách hàng thì thấy thời gian cung cấp trung bình là 34,5 phút
với S’ = 2,3. Có thể chấp nhận tuyên bố củ hãng đó hay không với mức ý nghĩa là 0,1.
Bài 3
Một cửa hàng thực phẩm nhận thấy thời gian vừa qua trung bình một khách hàng mua
25 ngàn đồng thực phẩm trong ngày. Nay cửa hàng chọn ngẫu nhiên 15 khách hàng
thấy trung bình một khách hàng mua 24 ngàn đồng trong ngày và phươg sai điều
chỉnh mẫu S’2 = (2 ngàn đông)2. Với mức ý nghĩa là 5%, thử xem có phải sức mua của
khách hàng hiện nay có thực sự giảm sút.
Bài 4
Theo nguồn tin tỷ lệ hộ dân thích xem dân ca trên ti vi là 80%. Thăm dò 36 hộ dân
thấy có 25 hộ thích xem dân ca.
Với mức ý nghĩa 5%, kiểm định xem nguồn tinn này có đáng tin cậy không?
Bài 5
Một máy sản xuất tự động, lúc đầu tỷ lệ sản phẩm loại A là 20%. Sau khi áp dụng một
phương pháp sản xuất mới, người ta lấy 40 mẫu, mỗi mẫu gồm 10 sản phẩm để kiểm
tra. Kết quả kiểm tra cho trong bảng:
Số sản phẩm loại A trong 1 2 3 4 5 6 7 8 9 10
mẫu
Số mẫu 2 0 4 6 8 10 4 5 1 0
Với mức ý nghĩa 5%, hãy cho kết luận về phương pháp sản xuất này.
Bài 6
Trong lượng trung bình khi xuất chuồng ở một trại chăn nuôi trước là 3,3 kg/con.
Năm nay người ta sử dụng một loại thức ăn mới, cân thử 15 con khi xuất chuồng ta

93
được các số liệu sau: 3,25 ; 2,50 ; 4,00 ; 3,75 ; 3,80 ; 3,90 ; 4,02 ; 3,60 ; 3,80 ; 3,20 ;
3,82 ; 3,40 ; 3,75 ; 4,00; 3,50.
Giả thiết trọng lượng gà là đại lượng ngẫu nhiên phân phối chuẩn.
a) Với mức ý nghĩa 5% hãy cho kết luận về tác dụng của loại thức ăn này.
b) Nếu trại chăn nuôibáo cáo trọng lượng trung bình khi xuất chuồng là 3,5 kg/con
thì có thể chấp nhận được không với mức ý nghĩa 5%.
Bài 7
Để xác định độ béo của một loại pho mát, người ta chọn ngẫu nhiên ra 10 miếng, cắt
đôi và hai nửa được gửi cho hai phòng thí nghiệm A và B. Kết quả xét nghiệm như sau:
Thứ tự miếng 1 2 3 4 5 6 7 8 9 10
Phòng TN A 40 39 40,2 38,2 39,7 37,7 41,4 36,5 40,7 38,9
Phòng TN B 41,9 39 40,7 39,3 39,2 38,2 41,3 38,5 39,8 38,7
Giả sử các số đo tuân theo luật chuẩn. Với mức ý nghĩa 0,01 có thể cho rằng các kết
quả xét nghiệm của hai phòng thí nghiệm khác nhau cơ bản không?
Bài 8
Người ta chia các vận dộng viên thành hai nhóm: nhóm thứ nhất gồm 130 người được
uống vitamin X, nhóm thứ hai gồm 128 người được uống thuốc giả (placebo). Sau một
mùa thi đấu số người nhiễm cúm ở mỗi nhóm tương ứng là 30 và 39. Với mức ý nghĩa
0,05 ta có thể cho rằng vitamin X làm tăng đáng kể khả năng chống cúm của các vận
động viên không? Có thể dùng kết luận đó với mức ý nghĩa 0,01 không?
Bài 9
Cho bộ số liệu về chiều cao của một giống cây 2 tuần tuổi
Độ cao 5 7 9 11 13 15 17 19 21
Số cây 10 26 27 33 25 22 24 20 13
Với mức ý nghĩa 0,01 hãy kiểm định gủa thuyết về phân phối chuarn của độ cao trên.
Bài 10
Có hai đặc tính X và Y đo đạc trên 5 phần tử, kết quả như sau:
X 1 2 3 4 5
Y 6 5 8 12 13
Tìm phương trình đường hồi qui của Y theo X.
Bài 11
Quan sát chiều cao X(cm) và sức nặng Y(kg) của một số người ta ghi nhận:
Y 38- 42 42- 46 46-50 50-54 54-58 58-62 62-66
X
140-145 1 2 2 1

94
145-150 1 3 2 1
150-155 1 4 1 1
155-160 1 2 3 2 1
160-165 1 3 6 2 1
165-170 1 1 5 2
a) Tìm khoảng ước lượng trung bình của X; Y ở độ tin cậy 0,95.
b) Tính hệ số tương quan thực nghiệm R(X,Y); hai biến X, Y có thực sự tương quan
không?
c) Tìm phương trình hồi qui của Y theo X.
Bài 12
Để nghiên cứu sự phát triển của một loại cây trồng, người ta tiến hành đo chiều cao
và đường kính của một số cây. Kết quả như sau:
Y 3 4 5 6 7 8
X
21 2 5
23 3 11
25 8 15 10
27 4 17 6
29 7 12
Trong đó X là đường kính (đơn vị cm). Y là chiều cao (đơn vị m).Giả sử X, Y phụ
thuộc tương quan tuyến tính.
a) Lập phương trình hồi quy tuyến tính mẫu của Y đối với X.
b) Lập phương trình hồi quy tuyến tính mẫu của X đối với Y

95
CÁC TÀI LIỆU THAM KHẢO
[1] Đinh Văn Gắng, Lý thuyết xác suất và thống kê, NXB Giáo dục, 2000.
[2] Đinh Văn Gắng, Lý thuyết xác suất và thống kê, NXB Giáo dục, 2001.
[3] Đặng Hấn, 33 đề thi xác suất thống kê, NXB Thống kê, 1993.
[4] Đặng Hấn, Xác suất thống kê, NXB thống kê, 1996.
[5] Nguyễn Văn Hộ, Thống kê Toán học, ĐH Bách khoa, Hà Nội, 1983.
[6] Đào Hữu Hồ, Xác xuất thống kê, NXB ĐHQG Hà Nội, 1999.
[7] Phạm Văn Kiều, Lý thuyết xác suất và thống kê toán học, NXB Đại học Sư phạm
– Đại học Quốc gia, Hà Nội, 1996.
[8] Hoàng Hữu Như, Nguyễn Duy Tiến, Lý thuyết xác suất và các kết luận thống kê,
NXB Khoa học và kỹ thuật, Hà Nội, 1969.
[9] Đặng Hùng Thắng, Thống kê và ứng dụng, NXB Giáo dục, 1999.
[10] Đặng Hùng Thắng, Bài tập thống kê, NXB Giáo dục, 2000.
[11] Nguyễn Duy Tiến, Nguyễn Viết Phú, Cơ sở lý thuyết xác suất, NXB Đại học và
Trung học chuyên nghiệp, Hà Nội,1993.
[12] Nguyễn Duy Tiến, Vũ Việt yên, Lý thuyết xác suất, NXB Giáo dục, 2000.
[13] Nguyễn Cao Văn, Trần thái Ninh, Bài giảng, bài tập xác suất và thống kê toán,
NXB thống kê, 1999.
[14] Nguyễn Cao Văn, Trần Thái Ninh, Nguyễn Thế Hệ, Bài tập xác suất và thống kê
toán, NXB Giáo dục, Hà Nội, 2002.

96
[15] Nguyễn Cao Văn (chủ biên), Trần Thái Ninh, Giáo trình lý thuyết xác suất và
thống kê toán, NXB Thống kê, Hà Nội, 2004.

MỤC LỤC
TRANG
LỜI NÓI ĐẦU 1
CHƯƠNG 1: BIẾN CỐ NGẪU NHIÊN VÀ XÁC SUẤT 2
1.1. GIẢI TÍCH TỔ HỢP 2
1.1.1. Chỉnh hợp 2
1.1.2. Chỉnh hợp lặp 2
1.1.3. Hoán vị 2
1.1.4. Tổ hợp 2
1.1.5. Nhị thức Newtơn 3
1.2. CÁC KHÁI NIỆM CƠ BẢN 3
1.2.1. Phép thử và biến cố 3
1.2.2. Các phép toán về biến cố 4
1.2.3. Quan hệ giữa các biến cố 5
1.3. XÁC SUẤT CỦA BIẾN CỐ 7
1.3.1. Khái niệm về xác suất của biến cố 7
1.3.2. Định nghĩa xác suất theo cổ điển 7
1.3.3. Địng nghĩa xác suất theo thống kê 9
1.4. CÁC ĐỊNH LÝ CƠ BẢN TÍNH XÁC SUẤT 10
1.4.1. Định lý cộng xác suất 10

97
1.4.2. Định lý nhân xác suất 11
1.4.3. Công thức xác suất đầy đủ và Bayes 13
1.4.4. Dãy các phép thử Becnoulli 15
BÀI TẬP THẢO LUẬN CHƯƠNG 1 17

CHƯƠNG 2: ĐẠI LƯỢNG NGẪU NHIÊN 23


2.1. ĐẠI LƯỢNG NGẪU NHIÊN 23
2.1.1. Định nghĩa 23
2.1.2. Luật phân phối xác suất của đại lượng ngẫu nhiên 24
2.2. CÁC ĐẶC TRƯNG CỦA ĐẠI LƯỢNG NGẪU NHIÊN 29
2.2.1. Kỳ vọng của đại lượng ngẫu nhiên 29
2.2.2. Phương sai của đại lượng ngẫu nhiên 30
2.2.3. Mốt và trung vị 32
2.3. CÁC QUY LUẬT PHÂP PHỐI XÁC SUẤT THÔNG DỤNG 33
2.3.1. Đại lượng ngẫu nhiên rời rạc 33
2.3.2. Đại lượng ngẫu nhiên liên tục 36
2.3.3. Các định lý giới hạn 40
BÀI TẬP THẢO LUẬN CHƯƠNG 2 45

CHƯƠNG 3. ĐẠI LƯỢNG NGẪU NHIÊN NHIỀU CHIỀU 49


3.1. ĐẠI LƯỢNG NGẪU NHIÊN HAI CHIỀU RỜI RẠC 49
3.1.1.Bảng phân phối xác suất của đại lượng ngẫu nhiên hai chiều (X,Y) 49
3.1.2. Xác suất có điều kiện 50
3.2. ĐẠI LƯỢNG NGẪU NHIÊN HAI CHIỀU LIÊN TỤC 52
3.2.1. Hàm phân phối có điều kiện 52
3.2.2. Hàm mật độ có điều kiện 52
3.2.3. Kỳ vọng và phương sai của đại lượng ngẫu nhiên nhiều chiều 53
3.3. TÍNH TƯƠNG QUAN GIỮA HAI ĐẠI LƯỢNG NGẪU NHIÊN 54
BÀI TẬP THẢO LUẬN CHƯƠNG 3 55

CHƯƠNG 4. MẪU THỐNG KÊ VÀ ƯỚC LƯỢNG THAM SỐ 57


4.1. TỔNG THỂ - MẪU 57
4.1.1. Mẫu 57
4.1.2. Một số dạng mẫu đơn giản thường gặp 58
4.1.3. Tần số - Tần suất và Phân phối thực nghiệm 59
4.1.4. Các đặc trưng của mẫu 59

98
4.1.5. Quy luật phân phối của các tham số mẫu 62
4.2. LÝ THUYẾT ƯỚC LƯỢNG 62
4.2.1. Khái niệm về ước lượng 62
4.2.2. Ước lượng điểm 62
4.2.3. Ước lượng khoảng 63
BÀI TẬP THẢO LUẬN CHƯƠNG 4 71

CHƯƠNG 5. KIỂM ĐỊNH GIẢ THUYẾT 73


5.1. CÁC KHÁI NIỆM CƠ BẢN 73
5.1.1. Giả thuyết thống kê 73
5.1.2. Quy tắc kiểm định 73
5.1.3. Các miền tới hạn 73
5.2. KIỂM ĐỊNH VỀ GIÁ TRỊ TRUNG BÌNH 74
5.2.1. Kiểm định dùng một mẫu 74
5.2.2. Kiểm định dùng hai mẫu 77
5.3. KIỂM ĐỊNH TỶ LỆ 80
5.3.1. Kiểm định dùng một mẫu 80
5.3.2. Kiểm định dùng hai mẫu 82
5.4. KIỂM ĐỊNH PHƯƠNG SAI 83
5.4.1. Kiểm định dùng một mẫu 83
5.4.2. Kiểm định dùng hai mẫu 83
5.5. HỒI QUY VÀ TƯƠNG QUAN TUYẾN TÍNH 84
5.5.1. Khái niệm 84
5.5.2. Mạng tương quan - Bảng tương quan - Đường hồi quy thực 87
nghiệm
5.5.3. Hệ số tương quan mẫu 88
BÀI TẬP THẢO LUẬNCHƯƠNG 5 80
ẨOTÌ LIỆU THAM KHẢO 94

99
100

You might also like