Professional Documents
Culture Documents
Giao Trinh XSTK 3TC PDF
Giao Trinh XSTK 3TC PDF
Giao Trinh XSTK 3TC PDF
Huế, 2011
KHOA TOÁN
Trần Thiện Thành
CHƯƠNG 6. BÀI TOÁN ƯỚC LƯỢNG THAM SỐ ..............................................72
6.1. Ước lượng điểm ..................................................................................................72
6.2. Phương pháp tìm ước lượng ............................................................................... 76
MỤC LỤC
6.3. Ước lượng khoảng tin cậy .........................................................................................79
1 2
Quan sát thời gian đợi thanh toán ở siêu thị thì có khách phải đợi trên 10 phút
hay không …
CHƯƠNG 1.
Nhóm các kết quả như vậy gọi là biến cố của phép thử.
BIẾN CỐ NGẪU NHIÊN VÀ XÁC SUẤT Mỗi biến cố là một tập con của không gian mẫu , thường ký hiệu hay
Biến cố có thể xảy ra hoặc không xảy ra khi thực hiện phép thử, cụ thể
nếu thực hiện phép thử được kết quả thì ta nói là biến cố xảy ra, ngược lại thì
1.1. Các khái niệm không xảy ra. Đặc biệt được gọi là biến cố không thể, được gọi là biến cố chắc
chắn.
1.1.1. Hiện tượng ngẫu nhiên
Ví dụ 1.1.2.
Hiện tượng ngẫu nhiên là hiện tượng khi quan sát trong các điều kiện như nhau
Gieo một con xúc xắc, xét biến cố là “con xúc xắc xuất hiện mặt chẳn” thì
thì các kết quả xảy ra có thể khác nhau, không dự đoán trước được. Đây là đối tượng
biểu diễn .
nghiên cứu của lý thuyết xác suất.
Quan sát thời gian đợi thanh toán của một khách mua ở siêu thị, xét biến cố
1.1.2. Phép thử ngẫu nhiên là “khách đợi trên 10 phút” thì biểu diễn với ký
Phép thử (ngẫu nhiên) là một thí nghiệm hay một quan sát về một hiện tượng hiệu là thời gian đợi của khách.
ngẫu nhiên. Kết quả xảy ra khi thực hiện phép thử có thể khác nhau.
1.1.5. Quan hệ giữa các biến cố
Chẳng hạn:
Mỗi biến cố là một tập hợp, do đó mỗi quan hệ trong lý thuyết tập hợp cho tương
Gieo một con xúc xắc thì mặt xuất hiện của nó có thể là mặt nhất, mặt nhị, …
ứng một quan hệ giữa các biến cố như sau: Giả sử là hai biến cố của một phép
Quan sát thời gian đợi thanh toán của khách hàng ở siêu thị thì có khách sẽ thử thì
được thanh toán ngay, có khách phải xếp hàng đợi 1 phút, 2 phút …
Biến cố kéo theo biến cố , ký hiệu , nếu xảy ra thì xảy ra.
1.1.3. Không gian mẫu Biến cố hợp , ký hiệu , là biến cố xảy ra khi hoặc hoặc xảy ra.
Không gian mẫu là tập hợp tất cả các kết quả có thể xảy ra khi thực hiện phép Biến cố giao , ký hiệu hay , là biến cố xảy ra khi và đều
thử, được ký hiệu là . Không gian mẫu là một tập hợp được biểu diễn dưới dạng xảy ra. Nếu thì gọi là xung khắc nhau.
Biến cố hiệu , ký hiệu , là biến cố xảy ra khi xảy ra và không
(mỗi kết quả của phép thử ký hiệu là , còn gọi là biến cố sơ cấp). xảy ra. Biến cố gọi là biến cố đối của .
Ví dụ 1.1.1. Chú ý. Dùng các tính chất giao hoán, kết hợp và phân phối để mở rộng các quan hệ
Phép thử gieo xúc xắc có không gian mẫu là . trên cho nhiều biến cố.
Phép thử tung đồng xu cho đến khi xuất hiện mặt sấp thì dừng có không gian Ví dụ 1.1.3. Quan sát hoạt động của một hệ thống gồm 3 bộ phận máy trong khoảng
mẫu là . thời gian t. Gọi là biến cố “máy thứ bị hỏng trong khoảng thời gian t”, .
Khi đó:
Phép thử chọn ngẫu nhiên một điểm trong hình tròn bán kính R có không
gian mẫu là . là biến cố “có ít nhất một máy bị hỏng”.
là biến cố “máy 1 còn hoạt động, máy 2, 3 bị hỏng”.
1.1.4. Biến cố
Hai biến cố và xung khắc nhau.
Khi thực hiện phép thử, ta thường quan tâm một nhóm các kết quả của phép thử
có xảy ra hay không, chẳng hạn:
Gieo một con xúc xắc thì nó có xuất hiện mặt chẳn hay không.
3 4
1.1.6. Xác suất Phần tiếp theo đề cập đến việc xây dựng mô hình xác suất trên không gian mẫu
Xác suất là một đại lượng đo khả năng xảy ra (nhiều hay ít) của một biến cố. Xác của phép thử. Việc xây dựng mô hình xác suất phụ thuộc vào lực lượng và cấu trúc
suất của biến cố , ký hiệu , thỏa mãn , trong đó xác suất càng lớn của không gian mẫu. Từ đó đưa ra những định nghĩa và phương pháp tính xác suất của
thì khả năng xảy ra càng cao và ngược lại. Đặc biệt . một biến cố bất kỳ của phép thử đó.
Ví dụ 1.1.4.
Khả năng xuất hiện mỗi mặt khi gieo một đồng xu cân đối, đồng chất là bằng 1.2. Mô hình xác suất rời rạc
nhau với xác suất 0,5.
1.2.1. Tần suất của biến cố
Khả năng trúng giải đặc biệt khi mua một tờ vé số là rất nhỏ với xác suất
Thực hiện lặp lại một phép thử lần độc lập trong các điều kiện như nhau và
(giả sử vé số gồm 5 chữ số).
quan sát biến cố trong mỗi phép thử. Gọi là số lần xảy ra trong dãy phép
thử trên thì tỷ số
BÀI TẬP 1.1
1. Xác định không gian mẫu và biến cố trong các phép thử sau:
a) Gieo 2 con xúc xắc và xét biến cố “Tổng số chấm xuất hiện là 10”. được gọi là tần suất xảy ra của biến cố trong n phép thử.
b) Chọn 2 học sinh từ lớp gồm 20 nam, 18 nữ và xét biến cố “Chọn được 1 nam J. Bernoulli chứng minh được rằng khi tăng lên vô hạn thì hội tụ đến
và 1 nữ”. một giới hạn xác định là - xác suất của (Luật số lớn Bernoulli). Như vậy, xác
c) Lấy ngẫu nhiên lần lượt (không hoàn lại) ra 3 bi từ hộp chứa 5 bi đen, 3 bi vàng suất của một biến cố có thể được xấp xỉ qua tần suất xảy ra của biến cố đó, tức là
và xét biến cố “Lấy được bi đen nhiều hơn”.
khi đủ lớn.
d) Cho phương trình . Chọn ngẫu nhiên 2 số thuộc [0;1] và
xét biến cố “Hai số chọn được làm phương trình có nghiệm thực”. Đây là nội dung của định nghĩa xác suất theo thống kê.
2. Ba xạ thủ A, B, C mỗi người bắn một viên đạn vào mục tiêu. Gọi lần lượt Ví dụ 1.2.1. Thí nghiệm về gieo một đồng xu cân đối, đồng chất như sau:
là biến cố A, B, C bắn trúng mục tiêu. Số mặt sấp Tần suất xuất hiện
Người thực hiện Số lần gieo
a) Hãy mô tả các biến cố: , , , . xuất hiện mặt sấp
b) Biểu diễn các biến cố sau theo : Buffon 4.040 2.048 0,5069
: “có ít nhất 2 xạ thủ bắn trúng”.
Pearson 12.000 6.019 0,5016
: “có nhiều nhất 1 xạ thủ bắn trúng”.
Pearson 24.000 12.012 0,5005
: “chỉ có 1 xạ thủ bắn trúng”.
Như vậy xác suất xuất hiện mặt sấp khi gieo đồng xu có thể xấp xỉ bằng 0,5.
: “có ít nhất 1 xạ thủ không bắn trúng”.
Nhận xét. Định nghĩa xác suất theo thống kê hoàn toàn dựa trên các thí nghiệm quan
3. Chứng minh các hệ thức của các biến cố qua việc mô tả
sát thực tế. Hạn chế của định nghĩa này là chỉ áp dụng cho các phép thử mà có thể lặp
a) ; .
lại trong các điều kiện như nhau. Bên cạnh đó, để xác định tương đối chính xác giá trị
b) ; ; . xác suất thì cần tiến hành một số đủ lớn các phép thử. Tuy nhiên, ngày nay với sự trợ
c) . giúp của công nghệ thông tin, người ta có thể mô phỏng các phép thử ngẫu nhiên mà
không cần thực hiện các phép thử trong thực tế. Điều này cho phép tính xác suất theo
phương pháp thống kê dễ dàng hơn.
5 6
1.2.2. Mô hình xác suất của phép thử có đếm được kết quả
Xét phép thử với không gian mẫu có đếm được các kết quả có thể xảy ra (hữu
hạn hay vô hạn đếm được), được biểu diễn như sau: Khi đó, xác suất để số lần gieo không quá 3 lần là
. .
Mỗi kết quả có xác suất xảy ra tương ứng là sao cho:
i) (tính không âm) BÀI TẬP 1.2
ii) (tính chuẩn hóa). 1. Gieo 3 con xúc xắc. Tính xác suất
a) Xuất hiện 2 mặt “nhất” và 1 mặt “lục”.
Khi đó với biến cố bất kỳ thì
b) Có tổng số chấm xuất hiện chia hết cho 5.
.
2. Một hộp gồm 10 bi xanh, 6 bi đỏ và 4 bi vàng. Lấy ngẫu nhiên ra 4 bi. Tính xác
suất
Ta gọi bộ là mô hình xác suất hay không gian xác suất của phép thử.
a) Lấy được ít nhất mỗi màu 1 bi..
Đặc biệt, giả sử các phép thử thỏa mãn 2 điều kiện:
b) Lấy được bi xanh nhiều hơn.
i) Không gian mẫu có hữu hạn kết quả,
3. Rút ngẫu nhiên 13 con bài từ bộ bài tây 52 con. Tính xác suất
ii) Các kết quả có cùng khả năng xảy ra, gọi là đồng khả năng (thường là các
phép thử có tính đối xứng, ngẫu nhiên …). a) Có 4 con “hai”.
Trong trường hợp này, mô hình xác suất của phép thử có dạng: b) Có sảnh từ “ba” đến “Át”.
c) Có 12 con bài cùng màu.
với
4. Một hộp có 30 thẻ đánh số từ 1 đến 30, trong đó có 15 thẻ có chữ “SU”, 9 thẻ có
Khi đó, xác suất của biến cố bất kỳ được xác định bởi: chữ “ZU”, 5 thẻ có chữ “KI” và 1 thẻ có chữ “SUZUKI”. Chọn ngẫu nhiên 4 thẻ từ
hộp. Tính xác suất để 4 thẻ chọn ra có thể sắp được chữ SUZUKI.
5. Trong một thùng có 6 quả bóng vàng, 5 quả bóng trắng và 4 quả bóng xanh cùng
Đây là nội dung của định nghĩa xác suất theo cổ điển. Để tính xác suất cổ điển, ta kích thước. Rút ngẫu nhiên lần lượt từng quả (không hoàn lại) cho đến khi được bóng
thường sử dụng các quy tắc và phương pháp đếm của giải tích tổ hợp như tổ hợp, vàng thì dừng. Tính xác suất trong số quả bóng lấy ra:
chỉnh hợp, quy tắc cộng, quy tắc nhân ... a) Có 2 bóng trắng, 1 bóng xanh.
Ví dụ 1.2.2. Một hộp chứa 5 cầu trắng, 3 cầu xanh và 4 cầu đen cùng kích thước. Chọn b) Không có quả bóng trắng nào.
ngẫu nhiên từ hộp ra 3 cầu. Tính xác suất có đúng 2 cầu cùng màu. 6. a) Có 10 đội bóng được bốc thăm chia làm 5 cặp đấu, trong đó có hai đội hạt giống
Giải. Chọn ngẫu nhiên 3 cầu từ hộp thì số đồng khả năng là . A, B. Tính xác suất để hai đội A, B không phải gặp nhau.
Gọi A là biến cố “3 cầu chọn ra có đúng 2 cầu cùng màu” thì số phần tử của A b) Có 16 đội bóng được bốc thăm chia làm 4 bảng (mỗi bảng 4 đội), trong đó có
gồm 3 trường hợp: có đúng 2 cầu trắng hoặc có đúng 2 cầu xanh hoặc có đúng 2 cầu hai đội hạt giống A, B. Tính xác suất để hai đội A, B không nằm cùng bảng.
đen. Do đó, . Vậy xác suất của A là 7. Gieo một con xúc xắc cho đến khi xuất hiện 2 lần mặt “lục” thì dừng.
a) Tìm mô hình xác suất cho phép thử trên.
b) Tính xác suất để số lần gieo không vượt quá 5 lần.
Ví dụ 1.2.3. Gieo một đồng xu cân đối, đồng chất cho đến khi nào xuất hiện mặt sấp
thì dừng. Tìm mô hình xác suất của phép thử và tính xác suất số lần gieo không quá 3
lần.
Giải. Không gian mẫu của phép thử là với
7 8
1.3. Mô hình tổng quát - Hệ tiên đề của xác suất Trường hợp không gian là một miền trong không gian Euclide hữu hạn chiều
với độ đo hữu hạn và lớp là -đại số Borel của nó thì xác suất của
Trường hợp không gian mẫu là tập không đếm được thì ta không thể xây dựng biến cố được định nghĩa là
mô hình xác suất như trong mô hình rời rạc được. Để khắc phục, A. N. Kolmogorov
đã đưa ra hệ tiên đề của lý thuyết xác suất năm 1933 để xây dựng mô hình xác suất
tổng quát. Cụ thể hơn là xây dựng mô hình xác suất trên lớp -đại số các biến cố của
trong đó, là ký hiệu độ đo. Chẳng hạn trong
không gian mẫu.
thường dùng là độ đo chiều dài, trong dùng
1.3.1. -đại số là độ đo diện tích, trong dùng là độ đo thể
Lớp các tập con của không gian gọi là một -đại số các biến cố nếu: tích ...
i) , Đây là nội dung định nghĩa xác suất theo hình học. Định nghĩa này là sự mở rộng
của định nghĩa xác suất theo cổ điển, trong đó các kết quả xảy ra cũng đồng khả năng.
ii) Từ suy ra ,
Ví dụ 1.3.3. Cho phương trình . Chọn ngẫu nhiên số thuộc [0;1].
iii) Từ họ suy ra .
Tính xác suất để phương trình có nghiệm thực.
Bộ gọi là không gian đo được. Giải. Mỗi số chọn là một điểm thuộc đoạn
. Gọi là biến cố “phương trình có nghiệm
Ví dụ 1.3.1. 1) Giả sử không gian mẫu có phần tử (có hữu hạn kết quả) thì lớp
thực” thì
gồm tất cả các tập con của là một -đại số. Số biến cố thuộc lớp này là .
.
2) Giả sử phép thử có không gian mẫu . Lớp thường dùng là -đại số
Borel trên đoạn [0;1]. Các biến cố thuộc lớp này có dạng hợp, giao các khoảng Suy ra .
với .
Ví dụ 1.3.4. (Bài toán gặp nhau) Hai người hẹn gặp nhau ở một địa điểm xác định vào
1.3.2. Hệ tiên đề của lý thuyết xác suất
khoảng 8 đến 9 giờ. Người đến trước sẽ đợi người kia 10 phút; sau đó nếu không gặp
Giả sử là không gian đo được và hàm tập thỏa mãn: thì đi khỏi điểm hẹn. Hãy tìm xác suất để 2 người
i) với mọi biến cố , (tính không âm) gặp nhau, nếu biết rằng mỗi người có thể đến chổ
ii) Nếu dãy biến cố sao cho (xung khắc hẹn trong khoảng thời gian quy định một cách
đôi một) thì ngẫu nhiên và không phụ thuộc vào người kia đến
lúc nào.
(tính -cộng tính) Giải. Giả sử (phút) là thời điểm người thứ
nhất và thứ hai đến điểm hẹn thì .
iii) . Vậy mỗi cặp thời điểm đến của hai người đó là
Khi đó gọi là (độ đo) xác suất của biến cố và bộ gọi là mô một điểm của hình vuông .
hình xác suất tổng quát hay không gian xác suất của phép thử. Gọi là biến cố hai người gặp nhau thì
Ví dụ 1.3.2. 1) Giả sử không gian mẫu có kết quả đồng khả năng, lớp gồm tất
cả các tập con của và hàm tập với biến cố bất kỳ thì bộ
tạo thành một không gian xác suất. Suy ra .
2) Giả sử phép thử có không gian mẫu , các kết quả đồng khả năng, lớp
là -đại số Borel trên đoạn [0;1] và hàm tập thì bộ tạo
thành một không gian xác suất.
9 10
1.3.3. Tính chất của xác suất
Từ cơ sở của lý thuyết độ đo, xác suất có các tính chất cơ bản như sau:
i) Với biến cố bất kỳ thì . .
ii) Nếu thì và
iii) . Vậy xác suất có ít nhất 2 cuốn sách Toán đứng cạnh nhau là
iv) .
Đặc biệt, nếu xung khắc thì .
v) . 1.3.4. Nguyên lý xác suất nhỏ, xác suất lớn
Chú ý. - Tính chất (iv) được xem là quy tắc cộng xác suất. Qua thực nghiệm và quan sát thực tế, người ta thấy rằng các biến cố có xác suất
- Tính chất (iv) và (v) được tổng quát như sau: nhỏ sẽ không xảy ra khi ta chỉ thực hiện một phép thử hay một vài phép thử. Từ đó, ta
iv’) Với dãy biến cố bất kỳ thì thừa nhận nguyên lý sau đây, gọi là “Nguyên lý xác suất nhỏ”: Nếu một biến cố có xác
suất rất nhỏ thì thực tế có thể cho rằng khi thực hiện một phép thử, biến cố đó sẽ
không xảy ra.
Chẳng hạn mỗi chiếc máy bay đều có một xác suất rất nhỏ bị xảy ra tai nạn.
Nhưng trên thực tế, vẫn nhiều người dùng phương tiện này để đi lại vì tin tưởng rằng
trong một chuyến bay, biến cố máy bay bị tai nạn không xảy ra. Hiển nhiên việc xác
Nếu thì .
định một mức xác suất thế nào được gọi là nhỏ sẽ phụ thuộc vào từng bài toán.
Tương tự như vậy, ta có thể đưa ra nguyên lý xác suất lớn như sau: Nếu một biến
v’)
cố có xác suất gần bằng 1 thì trên thực tế có thể cho rằng khi thực hiện một phép thử
Ví dụ 1.3.5. Trong một vùng dân cư, tỷ lệ người mắc bệnh tim là 9%, mắc bệnh huyết biến cố đó sẽ xảy ra. Hai nguyên lý này là cơ sở cho phương pháp luận của thống kê
áp là 12% và mắc cả hai bệnh là 7%. Tính xác suất khi chọn ngẫu nhiên một người mà sẽ đề cập trong các chương sau.
dân trong vùng thì người đó không mắc cả bệnh tim và bệnh huyết áp. Ví dụ 1.3.7. (Bài toán ngày sinh) Chọn ngẫu nhiên một nhóm người. Tính xác suất
Giải. Gọi là “người đó mắc bệnh tim”, là “người đó mắc bệnh huyết áp”. Theo để có ít nhất hai người có cùng ngày tháng sinh.
giả thiết ta có Giải. Ngày tháng sinh của một người có thể là một trong 365 ngày của năm. Do đó
. .
Gọi là “người đó không mắc cả bệnh tim và bệnh huyết áp”. Suy ra là Gọi là “có ít nhất hai người có cùng ngày tháng sinh” thì
“người đó mắc bệnh tim hoặc bệnh huyết áp”. Do đó ta có
.
.
Vậy . Nhận xét. Khi số người chọn tăng lên thì Số người Xác suất
Ví dụ 1.3.6. Xếp ngẫu nhiên 10 cuốn sách lên một giá sách, trong đó có 3 cuốn sách xác suất có ít nhất hai người cùng ngày tháng
30 0,706
Toán. Tính xác suất có ít nhất 2 cuốn sách Toán đứng cạnh nhau. sinh cũng tăng lên. Với thì xác suất này
là gần bằng 1, do đó theo nguyên lý xác suất 40 0,891
Giải. Ký hiệu 3 cuốn sách Toán là T1, T2, T3. Gọi các biến cố sau:
lớn thì trong thực tế ta có thể khẳng định có ít 50 0,970
là “Hai cuốn sách T1, T2 đứng cạnh nhau”,
nhất hai người cùng ngày tháng sinh trong một
là “Hai cuốn sách T1, T3 đứng cạnh nhau”, 60 0,994
nhóm từ 50 đến 60 người.
là “Hai cuốn sách T2, T3 đứng cạnh nhau”.
Ta có:
11 12
BÀI TẬP 1.3
1. Giả sử cho . Tính các xác suất
, , . - Xác suất chọn lần hai được cầu trắng, biết rằng lần đầu chọn được cầu đỏ là
2. Giả sử , . Chứng minh rằng . Cho ví
dụ để dấu “=” xảy ra.
Xác suất có điều kiện là một khái niệm quan trọng lý thuyết xác suất. Nó đưa đến
3. Có 4 hộp quà đánh số từ 1 đến 4 và được ẩn số. Một người đặt ngẫu nhiên 4 chiếc
các khái niệm như tính độc lập các biến cố, các quy tắc tính xác suất như quy tắc xác
thẻ cũng đánh số từ 1 đến 4 lên các hộp. Tính xác suất có ít nhất một thẻ đặt đúng số
suất đầy đủ …
với hộp.
Chú ý.
4. Trên đoạn thẳng có độ dài , chọn ngẫu nhiên 2 điểm . Tính xác suất để
a) . Nếu thì . Xác suất có điều kiện có thể tính trực tiếp
b) . mà không cần áp dụng công thức trên.
5. Trên đường tròn tâm bán kính , cho điểm cố định . Xác suất thông thường có thể biểu diễn là
a) Lấy ngẫu nhiên điểm trên đường tròn. Tính xác suất để . . Do đó xác suất có điều kiện
b) Lấy ngẫu nhiên điểm trên hình tròn. Tính xác suất để . có thể được xem như là một xác suất trên không gian
c) Lấy ngẫu nhiên điểm trên đoạn . Qua kẻ dây cung . Tính xác với lớp các biến cố được chọn thích hợp. Điều này
suất để . kéo theo rằng các tính chất của xác suất vẫn được áp
dụng đúng cho xác suất có điều kiện, chẳng hạn:
6. (Bài toán Buffon) Ném ngẫu nhiên một cây kim có chiều dài lên mặt phẳng có kẻ
những đường thẳng song song cách đều nhau một khoảng . Tìm xác suất để .
cây kim cắt một trong các đường thẳng đó. .
7. Gieo một đồng xu cho đến khi nào xuất hiện mặt sấp thì dừng. Dùng nguyên lý xác .
suất lớn chứng tỏ rằng, về thực tế số lần gieo để được mặt sấp là không vượt quá 6 .
lần. Hãy rút ra kết luận tương tự cho bài toán là gieo một con xúc xắc cho đến khi nào
...
xuất hiện mặt “lục” thì dừng.
Ví dụ 1.4.2. Cho . Tính .
Giải. Ta có .
1.4. Xác suất có điều kiện
Suy ra
1.4.1. Xác suất có điều kiện
.
Giả sử là không gian xác suất và là hai biến cố bất kỳ. Xác
suất của được tính trong điều kiện biết rằng đã xảy ra gọi là xác suất của với
1.4.2. Tính độc lập của các biến cố
điều kiện , ký hiệu là hay .
Nhiều bài toán xác suất thường sử dụng giả thiết về tính độc lập của các biến cố,
Ví dụ 1.4.1. Một hộp gồm cầu trắng, cầu đỏ. Chọn ngẫu nhiên lần lượt ra một cầu đó là sự không phụ thuộc lẫn nhau đến xác suất xảy ra giữa các biến cố. Cụ thể hơn, ta
từ hộp. Gọi là “chọn lần được cầu trắng”, Khi đó có một số dạng độc lập cơ bản như sau:
- Xác suất chọn lần đầu tiên được cầu trắng là Hai biến cố được gọi là độc lập nếu .
Dãy biến cố được gọi là độc lập từng đôi nếu với mọi
, thì độc lập.
- Xác suất chọn lần hai được cầu trắng, biết rằng lần đầu chọn được cầu trắng là
13 14
Dãy biến cố được gọi là độc lập toàn thể nếu với mọi tập con Cũng độc lập với nhau.
thì Giải. Do độc lập nên , suy ra
.
Vậy độc lập. Chứng minh tương tự cho các cặp còn lại.
Nhận xét. Ví dụ 1.4.5. Một máy gồm ba bộ phận hoạt động độc lập. Xác suất hỏng trong khoảng
Giả sử và độc lập thì . Do đó, nói cách khác, thời gian t của mỗi bộ phận tương ứng là 0,2; 0,25 và 0,1. Tính xác suất sau khoảng
hai biến cố độc lập nếu việc xảy ra hay không xảy ra của biến cố này không thời gian t thì còn hai bộ phận hoạt động được.
ảnh hưởng đến khả năng xảy ra của biến cố kia và ngược lại. Giải. Gọi là “bộ phận bị hỏng trong khoảng thời gian t”, . Theo giả thiết
Dãy biến cố độc lập toàn thể thì độc lập từng đôi. Điều ngược lại chưa chắc thì độc lập và .
đúng. Gọi là “còn hai bộ phận hoạt động được sau khoảng thời gian t” thì
Phân biệt tính độc lập và tính xung khắc của các biến cố. Nói chung, hai biến
cố xung khắc thì không độc lập.
Suy ra
Ví dụ 1.4.3. Gieo 2 đồng xu. Gọi biến cố là “đồng xu 1 xuất hiện mặt sấp”, là
“đồng xu 2 xuất hiện mặt sấp” và là “Hai đồng xu cùng xuất hiện một mặt”. Xét
tính độc lập của .
Giải. Không gian mẫu của phép thử và các biến cố
BÀI TẬP 1.4
1. Một chùm chìa khóa 9 chìa, trong đó có 2 chìa mở được khóa. Một người mở khóa
Suy ra . Khi đó, bằng cách thử từng chìa (chìa nào không mở được thì loại ra). Tính xác suất mở được
. khóa sau 4 lần thử.
. 2. Để nhập kho, sản phẩm của nhà máy phải trải qua 3 phòng kiểm tra chất lượng. Xác
Theo định nghĩa tính độc lập, suy ra độc lập từng đôi nhưng không độc lập suất phát hiện ra phế phẩm ở các phòng theo thứ tự là 0,8; 0,9 và 0,95. Tính xác suất
toàn thể. phế phẩm được nhập kho.
3. Một hộp gồm 3 bi đỏ, 5 bi đen. Rút ngẫu nhiên 1 bi, ghi nhớ màu của nó rồi bỏ lại
1.4.3. Quy tắc nhân xác suất
bi đó vào hộp cùng với 1 bi cùng màu khác. Tính xác suất trong 4 lần lấy như trên thì
Từ khái niệm xác suất có điều kiện cho ta quy tắc nhân xác suất giữa các biến cố lấy được 2 bi đỏ.
như sau:
4. Gieo hai con xúc xắc cân đối, đồng chất. Gọi là biến cố “Tổng số chấm xuất hiện
i) Với là hai biến cố bất kỳ thì là lẻ”, là biến cố “Có ít nhất 1 mặt một chấm”. Tính , .
5. Giả sử 3 biến cố độc lập. Chứng minh rằng các cặp biến cố và ;
Đặc biệt, nếu độc lập thì . và cũng độc lập.
ii) Tổng quát: Với dãy biến cố bất kỳ thì 6. Người ta dùng một thiết bị để kiểm tra một loại sản phẩm nhằm xác định sản phẩm
có đạt yêu cầu không. Biết rằng sản phẩm có tỉ lệ phế phẩm là 2%. Thiết bị có khả
Đặc biệt, nếu dãy biến cố là độc lập thì . năng phát hiện đúng sản phẩm là phế phẩm với xác suất 0,95 và phát hiện đúng sản
phẩm đạt yêu cầu với xác suất 0,97. Tính xác suất khi dùng thiết bị trên kiểm tra ngẫu
Ví dụ 1.4.4. Giả sử hai biến cố độc lập. Chứng minh rằng các cặp biến cố sau:
nhiên 1 sản phẩm thì
a) Được kết luận là phế phẩm.
b) Được kết luận đúng với thực chất của nó.
15 16
7. Một tín hiệu truyền từ trạm đến trạm theo sơ đồ sau:
Trong mỗi trường hợp có đúng lần xuất hiện và lần xuất hiện, do đó xác
suất của mỗi trường hợp là . Vì vậy,
17 18
1.5.3. Số có khả năng nhất b) Giả sử mỗi câu chọn đúng được 0,5 điểm. Tính xác suất thí sinh đó được 4
Khi thực hiện dãy phép thử Bernoulli thì số lần biến cố xuất hiện có thể là điểm. Hỏi điểm đó có phải là mức điểm có khả năng nhất hay không?
với các xác suất xác định. Số lần xuất hiện có xác suất lớn nhất gọi là số 3. a) Cần phải gieo một con xúc xắc ít nhất bao nhiêu lần để với xác suất lớn hơn 0,7
có khả năng nhất trong dãy phép thử, ký hiệu , cụ thể là thì có ít nhất một lần xuất hiện mặt 6 chấm.
. b) Xác suất để bắn một viên đạn trúng đích là 0,8. Hỏi phải bắn bao nhiêu viên đạn
để với xác suất nhỏ hơn 0,4 thì không có viên nào trật.
Khi thực hiện dãy phép thử Bernoulli, để dự đoán số lần biến cố xuất hiện thì
4. Một sân bay có 10 chuyến bay mỗi ngày. Giả sử xác suất mỗi chuyến bay khởi
thông thường dựa vào số có khả năng nhất.
hành trễ là và mỗi chuyến bay khởi hành là độc lập nhau. Để đảm bảo xác suất các
Quy tắc tìm số có khả năng nhất. chuyến bay đều khởi hành đúng giờ mỗi ngày là trên 90% thì cần điều chỉnh xác suất
Nếu thì và . như thế nào?
Nếu thì . 5. Trên một kênh liên lạc, người ta truyền đi hai tín hiệu 0 và 1. Vì tiếng ồn gây nhiễu
Quy tắc đưa ra trên dựa vào việc khảo sát sự đơn điệu của dãy theo . nên máy thu có thể nhận nhầm dạng tín hiệu với xác suất 0,2. Để tăng độ tin cậy, thay
Thật vậy, xét tỷ số vì truyền chữ số 0, ta truyền một cụm 5 chữ số 0 (00000) và truyền chữ số 1 bằng một
cụm 5 chữ số 1 (11111). Nếu khi nhận được một cụm 5 tín hiệu có đa số là 0 thì ta
xem như nhận được tín hiệu 0, và nếu có đa số là 1 thì xem như nhận được tín hiệu 1.
Tính xác suất nhận dạng nhầm tín hiệu bằng phương pháp trên.
Suy ra rằng, khi và khi . Do vậy,
Nếu thì
1.6. Công thức xác suất đầy đủ - Công thức Bayes
.
Nếu thì 1.6.1. Hệ đầy đủ
. Các biến cố được gọi là một hệ đầy đủ của không gian xác suất
Từ đó suy ra điều phải chứng minh. nếu:
Ví dụ 1.5.4. Trong ví dụ 1.5.2, hãy tìm số thí nghiệm thành công có khả năng xảy ra Chúng đôi một xung khắc nhau, tức là
cao nhất. .
19 20
Định lý. (Công thức xác suất đầy đủ)
.
.
Ví dụ 1.6.3. Trong số bệnh nhân ở một bệnh viện thì có 50% điều trị bệnh A, 30%
điều trị bệnh B và 20% điều trị bệnh C. Xác suất chữa khỏi các bệnh A, B, C trong
Chứng minh. Ta có
bệnh viện này tương ứng là 0,8; 0,9 và 0,7. Hãy tính:
. a) Tỷ lệ bệnh nhân được chữa khỏi trong bệnh viện.
b) Tỷ lệ bệnh nhân được chữa khỏi bệnh A, B, C trong tổng số bệnh nhân được
Các biến cố xung khắc từng đôi, suy ra
chữa khỏi bệnh.
. Giải. Chọn ngẫu nhiên một bệnh nhân. Xét hệ đầy đủ
là “bệnh nhân được điều trị bệnh A”,
Định lý. (Công thức Bayes) là “bệnh nhân được điều trị bệnh B”,
Giả sử thì với mỗi là “bệnh nhân được điều trị bệnh C”.
Theo giả thiết ta có .
Gọi là “bệnh nhân được chữa khỏi bệnh” thì
.
Chứng minh. Suy ra từ công thức xác suất điều kiện và công thức xác suất đầy đủ.
a) Áp dụng công thức xác suất đầy đủ, tỷ lệ bệnh nhân được chữa khỏi là
Nhận xét. Các xác suất được xác định trước khi tiến hành
.
phép thử, được gọi là các xác suất tiên nghiệm. Công thức xác suất đầy đủ cho quy tắc
b) Áp dụng công thức Bayes, tỷ lệ bệnh nhân được chữa khỏi bệnh A, B, C trong
tính xác suất của một biến cố dựa trên các xác suất tiên nghiệm này.
tổng số bệnh nhân được chữa khỏi bệnh là
Các xác suất được xác định sau khi tiến hành
phép thử và biến cố đã xảy ra, được gọi là các xác suất hậu nghiệm. Công thức .
Bayes có rất nhiều ứng dụng, đặc biệt trong các nghiên cứu về y học, xã hội học …
Ví dụ 1.6.2. Một nhóm 18 xạ thủ gồm ba tổ: tổ I có 5 người, tổ II có 7 người và tổ III .
có 6 người. Xác suất bắn trúng mục tiêu của mỗi xạ thủ trong tổ I, tổ II, tổ III tương
.
ứng là 0,9; 0,7 và 0,8. Chọn ngẫu nhiên một xạ thủ trong nhóm.
a) Tính xác suất xạ thủ đó bắn trúng mục tiêu. Ví dụ 1.6.4. Hai cậu bé lần lượt gieo một đồng xu. Ai gieo được mặt sấp trước thì
thắng cuộc. Tính xác suất thắng cuộc của mỗi cậu bé.
b) Cho xạ thủ đó bắn 1 viên đạn thì thấy trúng mục tiêu. Tính xác suất xạ thủ đó
thuộc tổ I. Giải. Gọi là “đồng xu xuất hiện mặt sấp ở lần gieo ”, Xét hệ đầy đủ
với .
Giải. Gọi là “xạ thủ chọn thuộc tổ I”, là “xạ thủ chọn thuộc tổ II” và là “xạ
thủ chọn thuộc tổ III”. Dễ thấy rằng là một hệ đầy đủ với Giả sử cậu bé 1 gieo đầu tiên, gọi là “cậu bé thắng cuộc”, . Áp dụng
công thức đầy đủ, ta có
.
Gọi là “xạ thủ chọn bắn trúng mục tiêu”, theo giả thiết ta có
.
a) Áp dụng công thức xác suất đầy đủ, xác suất xạ thủ bắn trúng mục tiêu là Suy ra , do đó . Như vậy người gieo trước sẽ có
. cơ hội thắng cuộc cao gấp đôi.
b) Áp dụng công thức Bayes, xác suất xạ thủ thuộc tổ I là
21 22
BÀI TẬP 1.6 8. Hai đấu thủ A, B chơi một trò chơi với xác suất A thắng trong một ván là 0,5; hòa
1. Ba phân xưởng cùng sản xuất một loại sản phẩm. Tỷ lệ phế phẩm của phân xưởng I là 0,2 và thua là 0,3. Tính xác suất A thắng trước B.
sản xuất là 3%, phân xưởng II là 2% và phân xưởng III là 4%. Một kho chứa các sản 9. Có hộp được đánh số từ 1 đến , mỗi hộp có quả cầu đỏ và quả cầu đen. Lấy
phẩm của 3 phân xưởng I, II, III sản xuất với tỷ lệ 2:4:3. Kiểm tra ngẫu nhiên 1 sản một quả cầu từ hộp 1 bỏ vào hộp 2, sau đó từ hộp 2 lấy một quả cầu bỏ vào hộp 3, ...
phẩm của kho. cứ như thế, ở bước thứ ta lấy ra 1 quả cầu từ hộp . Tính xác suất để quả cầu lấy ra
a) Tính xác suất sản phẩm đó là phế phẩm. cuối cùng có màu đỏ.
b) Giả sử sản phẩm kiểm tra là phế phẩm. Hỏi khả năng sản phẩm đó do phân
xưởng nào sản xuất nhất?
2. Một trạm chỉ phát hai tín hiệu A hoặc B với xác suất tương ứng là 0,7 và 0,3. Do có
nhiễu trên đường truyền nên 1/7 tín hiệu A bị méo và thu được như tín hiệu B, còn 1/8
tín hiệu B bị méo và thu được như tín hiệu A.
a) Tính xác suất thu được tín hiệu A trong một lần phát tín hiệu.
b) Giả sử trong một lần phát tín hiệu thì thu được tín hiệu A. Tìm xác suất thu
được đúng tín hiệu lúc phát.
3. Trong kỳ thi môn triết, đề cương có 10 câu hỏi. Các sinh viên trong một lớp chuẩn
bị bài theo tỷ lệ sau: 50% học cả 10 câu; 30% học 7 câu và số còn lại chỉ học 5 câu.
Đề thi ra 2 câu trong đề cương. Tính xác suất để một sinh viên của lớp làm được cả 2
câu hỏi.
4. Bắn 3 viên đạn một cách độc lập vào một mục tiêu. Xác suất trúng mục tiêu của
từng viên tương ứng là 0,6; 0,4; 0,5. Nếu chỉ 1 viên đạn trúng mục tiêu thì mục tiêu bị
phá hủy với xác suất 0,4. Nếu có 2 viên đạn trúng thì mục tiêu bị phá hủy với xác suất
0,9. Nếu có 3 viên đạn trúng thì mục tiêu chắc chắn bị phá hủy. Tính xác suất mục tiêu
bị phá hủy khi bắn 3 viên đạn như trên.
5. Có 3 hộp bi: hộp I gồm 3 bi đỏ, 6 bi trắng; hộp II gồm 5 bi đỏ; 2 bi trắng; hộp III
gồm 4 bi đỏ. Xét các bài toán sau:
a) Chọn ngẫu nhiên một hộp, từ hộp đó lấy ra 2 bi. Tính xác suất lấy được 2 bi đỏ.
b) Từ hộp I lấy 2 bi bỏ vào hộp II, rồi từ hộp II lấy ra 3 bi. Tính xác suất lấy sau
cùng được 1 bi đỏ, 2 bi trắng.
c) Từ hộp I lấy 2 bi bỏ vào hộp II, sau đó từ hộp II lấy 1 bi bỏ vào hộp III. Sau đó
từ hộp III lấy ra 2 bi, tính xác suất lấy sau cùng được 2 bi khác màu.
6. (Trò chơi “chú tiểu” trong gameshow Hãy chọn giá đúng) Có 5 tấm thẻ trong đó có
1 thẻ có hình “chú tiểu” và 4 sản phẩm để đoán giá. Nếu người chơi đoán giá đúng 1
sản phẩm thì được chọn 1 tấm thẻ. Sau cùng, nếu các thẻ chọn của người chơi có hình
“chú tiểu” thì chiến thắng. Hỏi, nếu một người chơi có khả năng đoán đúng giá 1 sản
phẩm là 0,6 tham gia trò chơi thì xác suất để chiến thắng là bao nhiêu?
7. Có 3 người đi săn. Họ cùng trông thấy một con nai và cùng nổ súng. Con nai bị
trúng một viên đạn và chết. Nên chia phần theo tỷ lệ nào là công bằng? Biết rằng xác
suất bắn trúng của người thứ nhất là 0,4; người thứ hai là 0,5 và người thứ ba là 0,3.
23 24
CHƯƠNG 2. ( : tọa độ điểm M).
BIẾN NGẪU NHIÊN VÀ PHÂN PHỐI XÁC SUẤT 2.1.2. Phân loại biến ngẫu nhiên
Dựa vào tập giá trị, ta phân biến ngẫu nhiên làm hai loại:
Biến ngẫu nhiên rời rạc nếu các giá trị nhận của nó là tập hữu hạn hoặc vô
2.1. Biến ngẫu nhiên hạn đếm được.
Giả sử là không gian xác suất của một phép thử cho trước. Biến ngẫu nhiên liên tục nếu các giá trị nhận của nó lấp đầy một hay một số
khoảng hữu hạn hay vô hạn trên trục số.
2.1.1. Khái niệm biến ngẫu nhiên
Ví dụ 2.1.2. Trong các biến ngẫu nhiên xét trong ví dụ 2.1.1 thì là biến ngẫu
Biến ngẫu nhiên (còn gọi là đại lượng ngẫu nhiên) là một đại lượng mà giá trị
nhiên rời rạc, là biến ngẫu nhiên liên tục.
nhận của nó là ngẫu nhiên, phụ thuộc vào kết quả của phép thử. Về mặt toán học, biến
Ngoài ra, trong thực tế, các biến ngẫu nhiên sau:
ngẫu nhiên được biểu diễn dưới dạng hàm sao cho với mọi thì
. Số khách hàng vào một điểm phục vụ trong một đơn vị thời gian; số sinh viên
nhập học ở một trường Đại học trong 1 năm; số tiền thưởng thu được trong
Biến ngẫu nhiên thường ký hiệu là hay Tập giá trị của biến
các trò chơi may rủi là các biến ngẫu nhiên rời rạc.
ngẫu nhiên ký hiệu là .
Thời gian dẫn đến hỏng của một thiết bị đang hoạt động; sai số đo lường của
Chú ý. Biểu diễn là một biến cố. Tổng quát hơn,
một đại lượng vật lý; tốc độ tăng trưởng về thu nhập là các biến ngẫu nhiên
nếu thì là một biến cố.
liên tục.
Ví dụ 2.1.1.
2.1.3. Phân phối xác suất
1) Gieo hai con xúc xắc. Gọi là tổng số chấm xuất hiện thì là biến ngẫu
nhiên có và Điều quan tâm đối với một biến ngẫu nhiên là nó nhận một giá trị nào đó hoặc
nhận giá trị trong một khoảng nào đó với xác suất bao nhiêu. Đó chính là sự phân phối
các xác suất trên tập giá trị nhận của biến ngẫu nhiên, gọi là quy luật phân phối xác
suất. Phân phối xác suất của biến ngẫu nhiên cho ta thông tin đầy đủ về biến ngẫu
nhiên đó, từ đó có thể đưa ra các đặc trưng hay giải quyết các bài toán liên quan đến
biến ngẫu nhiên sẽ đề cập ở các phần sau.
Ví dụ 2.1.3. Phân phối xác suất của các biến ngẫu nhiên xét trong ví dụ 2.1.1 là
Khi đó, biến cố “tổng số chấm nhỏ hơn 5” được biểu diễn .
1) là tổng số chấm xuất hiện khi gieo 2 con xúc xắc thì
2) Một người bắn vào mục tiêu cho đến khi nào trúng thì dừng. Gọi là số lần
bắn thì là biến ngẫu nhiên có và 2 3 4 5 6 7 8 9 10 11 12
1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
2) là số lần bắn cho đến khi trúng thì dừng. Giả sử xác suất bắn trúng mỗi lần
là thì
(T: trúng, F: trật). 3) là độ dài đoạn AM khi chọn ngẫu nhiên M trên đoạn AB độ dài thì
3) Trên đoạn AB độ dài , lấy ngẫu nhiên điểm M. Gọi là độ dài đoạn AM thì với .
là biến ngẫu nhiên có và
25 26
2.1.4. Sự độc lập các biến ngẫu nhiên
Từ khái niệm độc lập của các biến cố, ta có thể đưa ra khái niệm độc lập của các
biến ngẫu nhiên như sau: Hai biến ngẫu nhiên được gọi là độc lập nếu với mọi
thì . Nói cách khác, hai biến
ngẫu nhiên gọi là độc lập nếu việc nhận giá trị của biến ngẫu nhiên này không ảnh
hưởng đến việc nhận giá trị của biến ngẫu nhiên kia và ngược lại.
Ví dụ 2.1.4. Có hai chuồng thỏ: chuồng I gồm 5 thỏ trắng, 7 thỏ nâu; chuồng II gồm 4
thỏ trắng, 3 thỏ nâu. Bắt ngẫu nhiên mỗi chuồng ra 2 thỏ. Gọi tương ứng là số hay
thỏ trắng bắt ra của chuồng I, chuồng II thì là hai biến ngẫu nhiên độc lập.
Tính chất. Hàm phân phối có các tính chất cơ bản sau:
BÀI TẬP 2.2
i) với mọi .
1. Một biến ngẫu nhiên có hàm phân phối
ii) là hàm không giảm, liên tục trái.
iii) .
Định lý. Giả sử hàm thỏa mãn các tính chất (i), (ii), (iii) thì tồn tại không gian Tìm và tính xác suất để .
xác suất và biến ngẫu nhiên sao cho . 3. Trên đường tròn tâm O bán kính , cho điểm cố định A. Lấy ngẫu nhiên điểm M
trên đường tròn và đặt . Tìm hàm phân phối xác suất của và tính xác suất
Ví dụ 2.2.1. Gọi là số chấm xuất hiện khi gieo 1 con xúc xắc thì ,
để .
. Khi đó, hàm phân phối của là
27 28
2.3. Biến ngẫu nhiên rời rạc Ví dụ 2.3.2. Một sinh viên được làm thí nghiệm tối đa 5 lần, nếu có 2 lần thành công
thì dừng lại. Mỗi thí nghiệm là độc lập nhau và xác suất thành công của mỗi lần thí
2.3.1. Bảng phân phối xác suất rời rạc nghiệm là 0,8. Tìm phân phối xác suất của số thí nghiệm sinh viên đã làm.
Với biến ngẫu nhiên rời rạc, ta mô tả phân phối xác suất của nó bằng dãy các xác Giải. Gọi là “thí nghiệm thứ thành công”. Theo giả thiết thì các biến cố
suất mà biến ngẫu nhiên nhận giá trị tại một điểm. Giả sử biến ngẫu nhiên rời rạc độc lập nhau và .
có tập giá trị Gọi là số thí nghiệm sinh viên đã làm thì và phân phối xác
. suất là
Đặt thì dãy gọi là phân phối xác suất (rời rạc) của và được 2 3 4 5
mô tả bằng bảng phân phối xác suất như sau:
0,64 0,256 0,0768 0,0272
… …
trong đó,
… …
trong đó .
Hàm phân phối của biến ngẫu nhiên rời rạc xác định như sau:
29 30
2.3.3. Một số phân phối rời rạc thường gặp
Phân phối nhị thức . Biến ngẫu nhiên nhận các giá trị với
phân phối xác suất trong đó , gọi là tuân theo phân phối Poisson tham số , ký hiệu .
Trong thực tế, với một số giả thiết thích hợp thì các biến ngẫu nhiên liên quan
đến quá trình đếm của một dòng vào trong một khoảng thời gian xác định sẽ tuân theo
trong đó , gọi là tuân theo phân phối nhị thức tham số , ký
phân phối Poisson với tham số là tốc độ dòng vào trung bình diễn ra trong khoảng
hiệu .
thời gian này. Chẳng hạn, số cuộc gọi đến một tổng đài; số khách hàng chờ phục vụ;
Trường hợp thì gọi là phân phối Bernoulli hay phân phối 0-1.
số tai nạn hay sự cố xảy ra ở một địa điểm ...
Chú ý. Phân phối nhị thức thu được từ mô hình dãy phép thử Bernoulli. Cụ thể, xét
Định lý. Giả sử là hai biến ngẫu nhiên độc lập và ,
dãy phép thử Bernoulli với biến cố quan sát và . Gọi là số lần xuất
thì .
hiện trong phép thử. Theo công thức Bernoulli, suy ra .
Ví dụ 2.3.5. Giả sử số khách hàng vào một cửa hàng trong 1 giờ là tuân theo phân phối
Hơn nữa, gọi
Poisson với . Giả sử rằng số khách hàng vào mỗi giờ là độc lập nhau. Tính xác
, . suất
a) Có từ 3 đến 5 khách hàng vào cửa hàng trong 1 giờ.
thì các biến ngẫu nhiên là độc lập, cùng phân phối Bernoulli và b) Có từ 35 đến 40 khách hàng vào cửa hàng trong 1 ngày. Biết rằng một ngày
. làm việc 8 giờ.
Định lý. Giả sử là hai biến ngẫu nhiên độc lập và , thì Giải.
. a) Gọi là số khách hàng vào cửa hàng trong 1 giờ, theo giả thiết, thì .
Xác suất có từ 3 đến 5 khách vào cửa hàng là
Ví dụ 2.3.4. Một đề thi trắc nghiệm gồm 30 câu, mỗi câu có 4 phương án trả lời, trong
đó có 1 phương án đúng. Một thí sinh làm bài bằng cách chọn ngẫu nhiên đáp án từng .
câu.
a) Tính xác suất thí sinh đó chọn đúng đáp án 5 câu. b) Gọi là số khách hàng vào cửa hàng trong giờ làm việc thứ , thì
b) Tính xác suất thí sinh đó chọn đúng đáp án ít nhất 5 câu. các biến ngẫu nhiên là độc lập và cùng phân phối . Gọi là số khách
hàng vào cửa hàng trong 1 ngày làm việc thì , do đó .
c) Khả năng nhất thí sinh đó chọn đúng bao nhiêu câu? Tính xác suất tương ứng.
Khi đó xác suất có từ 35 đến 40 khách vào cửa hàng là
Giải. Gọi là số câu chọn đúng đáp án của thí sinh trên thì . Khi đó
a) Xác suất chọn đúng đáp án 5 câu là .
.
b) Xác suất chọn đúng đáp án ít nhất 5 câu là
31 32
a) Lập bảng phân phối xác suất của . 2.4. Biến ngẫu nhiên liên tục
b) Tính xác suất trong thời gian t có nhiều nhất 3 bộ phận bị hỏng, biết rằng có ít
nhất 1 bộ phận bị hỏng trong thời gian t. 2.4.1. Hàm mật độ xác suất
3. Cho hai lô sản phẩm: Lô I gồm 8 chính phẩm và 2 phế phẩm; Lô II gồm 7 chính Định nghĩa. Giả sử biến ngẫu nhiên liên tục có hàm phân phối được biểu
phẩm và 3 phế phẩm. diễn dạng
a) Từ mỗi lô lấy ra hai sản phẩm. Gọi tương ứng là số chính phẩm lấy ra từ ,
lô I, II. Lập bảng phân phối xác suất của và tính .
b) Từ lô I lấy một sản phẩm bỏ vào lô II, sau đó từ lô II lấy ra hai sản phẩm. Gọi thì được gọi là hàm mật độ (xác suất) của .
là số chính phẩm lấy ra từ lô II. Lập bảng phân phối xác suất của .
4. Một hộp gồm 5 bi đỏ, 3 bi đen. Lấy ngẫu nhiên một bi, ghi nhớ màu của nó rồi bỏ
lại bi đó vào hộp cùng với một bi cùng màu khác. Thực hiện 3 lần lấy như trên. Lập
bảng phân phối xác suất của số bi đỏ lấy ra.
5. Một kho hàng chuyên cung cấp hàng cho 12 cửa hàng. Xác suất để mỗi cửa hàng
đặt hàng cho kho đó trong ngày là 0,3. Gọi là số đơn đặt hàng cho kho trong một
ngày.
a) Hỏi có phân phối xác suất gì? Tính chất. Hàm mật độ có các tính chất sau:
b) Tính xác suất trong một ngày có từ 5 đến 7 đơn đặt hàng của các cửa hàng cho i) với mọi .
kho trên.
ii) .
c) Tìm số đơn đặt hàng có khả năng nhiều nhất cho một ngày và tính xác suất
tương ứng với nó. iii) tại các điểm liên tục của .
6. Một nhóm 3 xạ thủ với xác suất bắn trúng mục tiêu tương ứng là 0,8; 0,85; 0,7.
Chọn ngẫu nhiên một xạ thủ và cho người đó bắn ba viên đạn. Tìm phân phối xác suất iv) .
của số viên đạn bắn trúng mục tiêu.
Giả sử là một hàm số thỏa mãn hai tính chất (i) và (ii) của hàm mật độ. Đặt
7. Ở một tổng đài bưu điện, các cuộc điện thoại gọi đến xuất hiện một cách ngẫu
nhiên, độc lập với nhau và trung bình có 2 cuộc gọi trong một phút. Tính xác suất để: ,
a) Có ít nhất một cuộc gọi trong khoảng thời gian 10 giây.
thì thỏa mãn các tính chất của một hàm phân phối. Vì vậy tồn tại một biến ngẫu
b) Trong khoảng thời gian 3 phút có nhiều nhất ba cuộc gọi. nhiên có hàm phân phối là , và do đó có hàm mật độ là . Điều này đưa đến
c) Trong khoảng thời gian 3 phút liên tiếp, mỗi phút có nhiều nhất một cuộc gọi. điều kiện để một hàm bất kỳ là hàm mật độ của một biến ngẫu nhiên nào đó.
8. Giả sử số lỗi in trong 1 trang của một cuốn sách là biến ngẫu nhiên tuân theo phân Chú ý. là biến ngẫu nhiên liên tục thì nên
phối Poisson. Một cuốn sách gồm 500 trang có 10 lỗi in. Tính xác suất khi chọn ngẫu
.
nhiên 1 trang của cuốn sách trên thì
Từ tính chất của hàm mật độ và tích phân thì với khá bé, ta có
a) Có đúng 2 lỗi in.
b) Có ít nhất 1 lỗi in. .
9. a) Gieo một đồng xu cho đến khi xuất hiện mặt sấp thì dừng. Tìm phân phối xác
Do đó, ta thấy xác suất để biến ngẫu nhiên liên tục nhận giá trị thuộc lân cận khá bé
suất của số lần gieo.
gần như tỷ lệ với . Điều này thể hiện rõ ý nghĩa của hàm mật độ.
b) Hai người lần lượt gieo một đồng xu cho đến khi xuất hiện mặt sấp thì dừng.
Tìm phân phối xác suất của số lần gieo cho mỗi người. Ví dụ 2.4.1. Cho là biến ngẫu nhiên có hàm phân phối
33 34
Giả sử là một biến ngẫu nhiên liên tục và là một hàm số thì là
một biến ngẫu nhiên (rời rạc hay liên tục). Việc tìm phân phối xác suất của thường
dựa vào hàm phân phối của . Các ví dụ sau minh họa phương pháp tìm đó.
Tìm và hàm mật độ .
Ví dụ 2.4.3. Xét biến ngẫu nhiên có hàm phân phối
Giải. Ta có và
Suy ra .
Khi đó hàm mật độ của là
Tìm phân phối xác suất của các biến ngẫu nhiên .
Giải. Tập giá trị , suy ra . Do đó là
biến ngẫu nhiên liên tục, là biến ngẫu nhiên rời rạc.
Ví dụ 2.4.2. Cho biến ngẫu nhiên có hàm mật độ dạng
Hàm phân phối và hàm mật độ của :
Xét thì và
Xét thì . 2.4.3. Một số phân phối liên tục thường gặp
Vậy Phân phối mũ . Biến ngẫu nhiên gọi là tuân theo phân phối mũ tham số
, ký hiệu , nếu có hàm mật độ, hàm phân phối dạng:
Đồ thị
Xác suất cần tìm là
.
35 36
Phân phối mũ có mặt trong nhiều ứng dụng thực tiễn. Nó thường xuất hiện trong
các bài toán liên quan đến thời gian sống của một loài sinh vật, thời gian sử dụng của Phân phối chuẩn được Gauss tìm ra năm 1809. Đây là một phân phối có vai trò
một thiết bị, thời gian đợi phục vụ trong một hàng đợi, ... quan trọng trong lý thuyết xác suất và thống kê toán học. Trong thực tế, nhiều biến
ngẫu nhiên tuân theo phân phối chuẩn, chẳng hạn trọng lượng, chiều cao của một loài
Định lý sau đưa ra một đặc trưng của phân phối mũ, gọi là tính không nhớ.
sinh vật; điểm thi của thí sinh; năng suất cây trồng; lãi suất của một công ty, ...
Định lý. Giả sử thì .
Trường hợp thì được gọi là phân phối chuẩn tắc. Hàm mật
Ví dụ 2.4.4. Giả sử tuổi thọ (đv: năm) của một mạch điện tử trong máy tính là biến độ và hàm phân phối, ký hiệu , của phân phối chuẩn tắc có dạng
ngẫu nhiên có phân phối mũ với . Thời gian bảo hành của mạch điện tử này
là 2 năm. Hỏi có bao nhiêu phần trăm mạch điện tử bán ra phải thay thế trong thời , .
gian bảo hành.
Giải. Gọi là tuổi thọ của mạch điện tử, theo giả thiết thì . Mạch . (gọi là tích phân Laplace)
điện tử bị thay thế trong thời gian bảo hành nếu có tuổi thọ dưới 2 năm. Khi đó
Hàm phân phối không biểu diễn được qua các hàm sơ cấp đã biết. Giá trị
. của hàm này được tra từ các bảng phụ lục. Chú ý tính chất . Chẳng
Vậy có khoảng 12,5% số mạch điện tử bán ra phải thay thế trong thời gian bảo hành. hạn …
Phân phối chuẩn . Biến ngẫu nhiên gọi là tuân theo phân phối chuẩn Định lý sau cho mối liên hệ cơ bản giữa phân phối chuẩn và phân phối chuẩn tắc.
tham số ( ), ký hiệu , nếu có hàm mật độ dạng:
Định lý. Giả sử , đặt thì .
. Từ định lý thì các tính toán liên quan đến phân phối chuẩn có thể được thực hiện
qua phép chuẩn hóa về phân phối chuẩn tắc. Chẳng hạn, với giả thiết của định lý trên
Đồ thị
thì
.
Tương tự
.
.
37 38
Định lý. Giả sử , và độc lập thì tổ hợp tuyến 3. Cho biến ngẫu nhiên có hàm mật độ và hàm phân phối liên hệ như
tính bất kỳ của cũng có phân phối chuẩn, đặc biệt sau: . Hãy xác định phân phối xác suất của , biết rằng
.
4. Giả sử thời gian sử dụng (đv: năm) của một loại thiết bị là tuân theo phân phối
Ví dụ 2.4.5. Giả sử trọng lượng của một sản phẩm M (đv: gam) của một máy sản xuất
mũ . Thời gian bảo hành của thiết bị trên là 6 tháng.
tự động là biến ngẫu nhiên có phân phối chuẩn . Sản phẩm được xem là đạt
tiêu chuẩn kỹ thuật nếu trọng lượng của nó đạt từ 98g đến 102g. a) Tính xác suất khi dùng một thiết bị trên không cần phải bảo hành (không bị
hỏng dưới 6 tháng).
a) Tìm tỷ lệ sản phẩm đạt tiêu chuẩn kỹ thuật do máy sản xuất.
b) Hỏi trong 20 thiết bị trên, xác suất để số thiết bị có thời gian sử dụng trên 6
b) Tỷ lệ sản phẩm có trọng lượng trên gam chiếm 15,9%. Xác định .
năm nằm trong khoảng [16; 18] là bao nhiêu?
Giải. Gọi là trọng lượng của một sản phẩm M, theo giả thiết thì với
5. Giả sử thời gian phục vụ S (đv: phút) cho một khách hàng ở một cửa hàng là tuân
. Khi đó
theo có phân phối mũ . Biết rằng xác suất một khách hàng được phục vụ dưới
a) Tỷ lệ sản phẩm đạt tiêu chuẩn kỹ thuật là
5 phút là 0,51.
a) Xác định .
b) Tính xác suất khi phục vụ cho 15 khách thì có từ 3 đến 5 khách có thời gian
phục vụ nằm trong khoảng (5; 10) phút.
b) Ta có
6. Giả sử số tiền dùng mạng/tháng (đvị: nghìn đồng) của một hộ gia đình là biến ngẫu
. nhiên tuân theo phân phối chuẩn với . Tính xác suất
a) Hộ gia đình trên trả tiền mạng không dưới 100 nghìn đồng/tháng.
mà , suy ra gam.
b) Trong một năm sử dụng, hộ trên có 2 tháng trả tiền mạng trên 100 nghìn đồng.
Quy tắc và . Cho thì
7. Giả sử thời gian (đv: phút) đi từ nhà tới trường của sinh viên M tuân theo phân phối
. chuẩn . Biết rằng có 64,8% số ngày M đến trường mất hơn 20 phút và 5,3%
. số ngày mất hơn 30 phút.
Hai kết quả trên cho ta quy tắc như sau: a) Xác định .
“Nếu có phân phối chuẩn thì có đến 95,44% giá trị của nằm trong b) Giả sử M xuất phát từ nhà trước giờ vào học 25 phút. Tính xác suất để M bị
khoảng và 99,73% (hầu như toàn bộ) giá trị của nằm trong muộn học.
khoảng ”.
c) Sinh viên M cần xuất phát trước giờ vào học bao nhiêu phút để khả năng bị
BÀI TẬP 2.4 muộn học là nhỏ hơn 0,02.
39 40
2.5.1. Kỳ vọng .
Định nghĩa. Kỳ vọng của biến ngẫu nhiên , ký hiệu , được xác định như sau:
Ví dụ 2.5.2. Cho biến ngẫu nhiên có hàm mật độ .
Nếu là biến ngẫu nhiên rời rạc với phân phối xác suất
thì Tính , .
Giải. Ta có
.
.
Nếu là biến ngẫu nhiên liên tục với hàm mật độ thì
. .
(Kỳ vọng tồn tại nếu tổng chuỗi hay tích phân trên hội tụ).
2.5.2. Trung vị (Median)
Ý nghĩa. Kỳ vọng là giá trị trung bình (với trọng số xác suất) mà biến ngẫu nhiên
Định nghĩa. Trung vị (hay Median) của biến ngẫu nhiên , ký hiệu , được
nhận được. Chẳng hạn thu nhập trung bình, thời gian đợi trung bình, số khách hàng
xác định như sau:
vào trung bình, lợi nhuận trung bình …
Giả sử biến ngẫu nhiên ứng với phép thử nào đó. Thực hiện phép thử lần,
gọi là giá trị biến ngẫu nhiên nhận trong phép thử thứ . Khi đó, hay
theo Luật số lớn thì
và .
(theo xác suất).
Ý nghĩa. Trung vị là điểm chia phân phối xác suất của biến ngẫu nhiên thành 2 phần
Tính chất. bằng nhau. Chẳng hạn mức thu nhập mà gần 50% người có thu nhập dưới mức đó;
a) với mọi hằng số . mốc thời gian mà xác suất một thiết bị có tuổi thọ dưới mốc đó là gần 0,5 … Trong
b) . nhiều trường hợp, ta thường dùng trung vị thay thế kỳ vọng để đặc trưng cho vị trí của
c) . phân phối, đặc biệt là đối với các biến ngẫu nhiên có thể nhận giá trị bất thường.
Ví dụ 2.5.1. Cho biến ngẫu nhiên có bảng phân phối xác suất như sau:
1 2 3 4 Ví dụ 2.5.3. Xác định trung vị của các biến ngẫu nhiên trong ví dụ 2.5.1 và 2.5.2.
0,2 0,4 0,3 0,1 Giải. Ta có , suy ra .
Tính , . Hàm phân phối của là
Giải. Ta có .
.
Suy ra
41 42
Giải phương trình Tính chất. Từ tính chất của kỳ vọng suy ra một số tính chất của phương sai như sau:
. a) .
b) với mọi hằng số .
Vậy .
c) .
2.5.3. Mốt (Mode) d) Nếu độc lập thì .
Định nghĩa. Mốt (hay Mode) của biến ngẫu nhiên , ký hiệu , được xác Ví dụ 2.5.5. Xác định phương sai, độ lệch tiêu chuẩn của các biến ngẫu nhiên trong ví
định như sau: dụ 2.5.1 và 2.5.2.
Nếu là biến ngẫu nhiên rời rạc với phân phối xác suất Giải. Ta có ; .
thì
; .
.
2.5.5. Các đặc trưng của một số phân phối thường gặp
Nếu là biến ngẫu nhiên liên tục với hàm mật độ thì
Bảng dưới đây tóm tắt các kết quả về đặc trưng kỳ vọng, phương sai của một số
.
phân phối xác suất được đề cập trong các phần trước.
Ý nghĩa. Mốt là giá trị của biến ngẫu nhiên có xác suất xảy ra lớn nhất. Thông thường Phân phối xác suất Kỳ vọng Phương sai
mốt dùng để dự đoán giá trị nhận của biến ngẫu nhiên khi thực hiện phép thử.
Nhị thức
Theo định nghĩa thì việc xác định mốt dựa vào các phương pháp tìm giá trị lớn
nhất của một dãy số hay một hàm số. Poisson
Ví dụ 2.5.4. Xác định mốt của các biến ngẫu nhiên trong ví dụ 2.5.1 và 2.5.2. Mũ
Giải. Ta có là lớn nhất, suy ra . Chuẩn
Ta thấy hàm mật độ là hàm giảm trên đoạn , do đó Chứng minh các kết quả trên xem như bài tập cho độc giả.
. Ví dụ 2.5.6. Giả sử , và độc lập. Tính
43 44
BÀI TẬP 2.5 Kỳ vọng (%) Độ lệch chuẩn (%)
1. Cho biến ngẫu nhiên có hàm mật độ Công ty A 11 4
Công ty B 10,4 2,6
a) Nếu người đó muốn đạt được lãi suất tối thiểu là 10% thì nên mua cổ phiếu của
a) Tính các đặc trưng . công ty nào.
b) Tính kỳ vọng và phương sai của biến ngẫu nhiên . b) Nếu người đó muốn hạn chế rủi ro bằng cách mua cổ phiếu của cả hai công ty
thì nên mua theo tỷ lệ bao nhiêu để mức độ rủi ro về lãi suất là nhỏ nhất.
2. Một hộp gồm 5 bi trắng, 3 bi đen. Lấy ngẫu nhiên từ hộp ra 4 bi. Gọi là số bi
trắng lấy ra. 7. (Trò chơi bầu cua) Giả sử số tiền đặt cược cho một cửa trong trò chơi bầu cua là 1$.
Gọi là số tiền thu được trong một ván khi đặt 1 cửa, là số tiền thu được trong một
a) Lập bảng phân phối xác suất và tính các đặc trưng của .
ván khi đặt 2 cửa. Tìm kỳ vọng và phương sai của . Nhận xét.
b) Giả sử mỗi bi trắng lấy ra được 5 đồng, bi đen được 2 đồng. Gọi là số tiền
thu được từ 4 bi lấy ra. Tính .
3. Thu nhập của dân cư một vùng (đv: trđ/tháng) là biến ngẫu nhiên có hàm mật độ là
a) Xác định thu nhập bình quân và sự phân tán thu nhập của dân cư trong vùng.
b) Hãy xác định mức thu nhập mà có 50% dân cư trong vùng có thu nhập dưới
mức này.
4. Số khách trên một xe buýt tại một tuyến giao thông có phân phối xác suất như sau:
Số khách đi mỗi chuyến 20 25 30 35 40
Xác suất 0,2 0,3 0,15 0,1 0,25
a) Tìm kỳ vọng, mốt và độ lệch chuẩn của số khách đi mỗi chuyến. Nêu ý nghĩa
các giá trị đó.
b) Giả sử chi phí cho mỗi chuyến xe là 120 ngàn đồng. Để công ty xe buýt có thể
thu được lãi bình quân cho mỗi chuyến xe là 20 ngàn đồng thì phải quy định
giá vé là bao nhiêu?
5. Giả sử thời gian đợi (đv: phút) của một hành khách tại một trạm xe buýt tuân
theo phân phối mũ .
a) Tính và nêu ý nghĩa các giá trị tính.
b) Hỏi trong 12 khách đợi ở trạm xe buýt trên thì trung bình có bao nhiêu khách
phải đợi trên 5 phút.
6. Một người cân nhắc giữa việc mua cổ phiếu của công ty A và công ty B hoạt động
trong hai lĩnh vực độc lập nhau. Biết lãi suất cổ phiếu của hai công ty là các biến ngẫu
nhiên có phân phối chuẩn với các tham số như sau:
45 46
e) độc lập khi và chỉ khi .
f) .
CHƯƠNG 3. Ví dụ 3.1.2. Trên mặt phẳng , chọn điểm sao cho ,
VECTƠ NGẪU NHIÊN . Tìm hàm phân phối đồng thời của 2 biến ngẫu nhiên .
Giải. Theo giả thiết, ta có . Dựa vào xác suất hình học với độ
đo diện tích, suy ra
3.1. Vectơ ngẫu nhiên
d) ; với là hàm
phân phối của hay còn gọi là hàm phân phối biên duyên của .
47 48
Ví dụ 3.2.1. Gieo 3 đồng xu cân đối A, B, C. Gọi là số mặt ngửa xuất hiện của 2 2 0 0 1/8 1/8 1/4
đồng xu A, B và là số mặt ngửa xuất hiện của cả 3 đồng xu. Hãy lập bảng phân
1/8 3/8 3/8 1/8 1
phối xác suất đồng thời của .
Giải. Ta có ; . Khi đó, bảng phân phối xác suất Bảng phân phối xác suất của là
đồng thời của là 0 1 2 0 1 2 3
0 1 2 3 1/4 1/2 1/4 1/8 3/8 3/8 1/8
0 1/8 1/8 0 0 Bảng phân phối xác suất của là
1 0 1/4 1/4 0 0 1
2 0 0 1/8 1/8 1/2 1/2
trong đó trong đó .
Tương tự thì .
Do đó không độc lập.
Như vậy từ bảng phân phối xác suất đồng thời, nếu cộng các xác suất theo hàng
hoặc theo cột, ta thu được phân phối xác suất biên duyên của các thành phần ngẫu
BÀI TẬP 3.2
nhiên.
1. Cho hai biến ngẫu nhiên có phân phối xác suất đồng thời như sau:
Ngoài ra, nếu là một hàm hai biến thì dựa vào bảng phân phối đồng thời,
ta có thể thu được phân phối xác suất của biến ngẫu nhiên . 1 2 3
Ví dụ 3.2.2. Với hai biến ngẫu nhiên trong ví dụ 3.2.1, hãy tìm phân phối xác 0
suất của và . 1
Giải. Ta có
a) Xác định và tìm phân phân phối xác suất của .
0 1 2 3 b) Tìm phân phối xác suất của .
0 1/8 1/8 0 0 1/4 c) Hỏi có độc lập với nhau hay không?
1 0 1/4 1/4 0 1/2
49 50
2. Cho hai biến ngẫu nhiên rời rạc độc lập với phân phối như sau:
iv) với miền .
1 2 3 2 4
Ví dụ 3.3.1. Cho vectơ ngẫu nhiên có hàm mật độ dạng
0,3 0,2 0,5 0,6 0,4
a) Tìm phân phối xác suất đồng thời của .
b) Tìm phân phối xác suất của .
3. Một hộp gồm 5 bi trắng, 4 bi đỏ và 3 bi xanh. Lấy ngẫu nhiên từ hộp ra 2 bi. Gọi a) Xác định và tính xác suất .
tương ứng là số bi trắng, bi đỏ lấy ra. Tìm phân phối xác suất đồng thời của b) Tìm hàm phân phối đồng thời .
. Tính xác suất . Hỏi có độc lập không? Giải.
4. Có hai chuồng gà: chuồng I gồm 5 gà mái, 3 gà trống; chuồng II gồm 2 gà mái, 4 gà Từ với mọi , suy ra .
trống. Xét các phép thử sau:
.
a) Từ mỗi chuồng bắt ra hai con gà. Gọi tương ứng là số gà trống bắt ra từ
chuồng I, II. Tìm phân phối xác suất đồng thời của . Vậy .
b) Từ chuồng I bắt một con gà bỏ vào chuồng II, sau đó từ chuồng II bắt ra hai
con gà. Gọi tương ứng là số gà trống bắt ra ở lần 1, 2. Tìm phân phối xác .
suất đồng thời của .
Hàm phân phối đồng thời
5. Cho hai nhóm câu hỏi: nhóm I có 2 câu (20 điểm) và nhóm II có 3 câu (30 điểm).
Xét hoặc thì .
Một thí sinh được chọn ngẫu nhiên một nhóm câu hỏi. Xác suất thí sinh đó trả lời
đúng mỗi câu trong nhóm I là 0,7 và trong nhóm II là 0,9. Gọi là nhóm câu hỏi Xét , thì
chọn và là số điểm đạt được của thí sinh đó. Tìm phân phối xác suất đồng thời của .
. Hỏi có độc lập không?
Xét , thì
, , Xét , thì .
iii) nếu tồn tại đạo hàm tại . tương ứng là hàm mật độ của và .
Trong trường hợp liên tục, hai biến ngẫu nhiên độc lập khi và chỉ khi
với mọi .
51 52
Như vậy nếu hàm mật độ đồng thời có thể nhóm thành tích của hai hàm, mỗi hàm chỉ Tính các xác suất .
phụ thuộc một biến thì hai biến ngẫu nhiên sẽ độc lập. 5. Trên đoạn thẳng có độ dài 1, chọn ngẫu nhiên hai điểm . Gọi tương
Ví dụ 3.3.2. Với hai biến ngẫu nhiên trong ví dụ 3.3.1, hãy tìm hàm mật độ và ứng là độ dài đoạn . Tìm phân phối xác suất đồng thời của . Từ đó suy
xét tính độc lập của . ra xác suất chọn được nằm giữa .
Giải. Ta có, với thì
3.4. Các đặc trưng của vectơ ngẫu nhiên
a) Xác định và tính xác suất . Từ kết quả này, chẳng hạn ta có công thức tính kỳ vọng và phương sai của các biến
b) Tìm hàm phân phối đồng thời . ngẫu nhiên thành phần dựa vào phân phối xác suất đồng thời như sau:
c) Tìm hàm mật độ của . Hỏi có độc lập hay không? Trường hợp rời rạc
. Giải. Ta có .
.
53 54
Suy ra . 3.4.3. Hệ số tương quan
Tương tự . Và Định nghĩa. Hệ số tương quan của hai biến ngẫu nhiên , ký hiệu , được
. xác định bởi:
Ví dụ 3.4.2. Cho vectơ ngẫu nhiên có hàm mật độ đồng thời như sau:
Tính chất.
a) với mọi biến ngẫu nhiên .
Tính kỳ vọng, phương sai của và . b) Nếu độc lập thì .
Giải. Ta có .
c) khi và chỉ khi nếu và
nếu .
Ý nghĩa. Hệ số tương quan đo mức độ phụ thuộc tuyến tính giữa và . Khi
càng gần 1 thì sự phụ thuộc càng chặt, khi càng gần 0 thì sự phụ
Suy ra . thuộc càng yếu. Khi thì gọi là tương quan thuận, gọi là
Tương tự . Và tương quan nghịch và gọi là không tương quan.
Ví dụ 3.4.4. Xét hai biến ngẫu nhiên trong ví dụ 3.4.2, hãy tính .
.
Giải. Ta có
3.4.2. Hiệp phương sai (Covariance) .
Định nghĩa. Covariance (hiệp phương sai) của hai biến ngẫu nhiên , ký hiệu Suy ra
, được xác định bởi:
.
Tính chất. Như vậy hai biến ngẫu nhiên là tương quan nghịch nhưng sự phụ thuộc rất yếu.
a) .
b) . BÀI TẬP 3.4
c) với mọi hằng số . 1. Cho có phân phối xác suất đồng thời
.
d) .
e) Nếu độc lập thì . a) Tìm và tính .
b) Tính và . Nhận xét.
Ví dụ 3.4.3. Xét hai biến ngẫu nhiên trong ví dụ 3.4.1, hãy tính .
2. Cho có hàm mật độ đồng thời
Giải. Ta có . Do đó,
.
Suy ra không độc lập. Thêm vào đó nên
. a) Tính kỳ vọng .
b) Tính và . Hỏi có độc lập không? Tại sao?
3. Cho vectơ ngẫu nhiên có các đặc trưng ; ; ;
; . Tìm kỳ vọng và phương sai của biến ngẫu nhiên
.
55 56
4. Cho hai biến ngẫu nhiên độc lập và có phương sai bằng nhau. Với hằng số ,
hãy tính .
5. Cho hai biến ngẫu nhiên và đặt với . Chứng CHƯƠNG 4.
minh rằng
CÁC ĐỊNH LÝ GIỚI HẠN
Cho dãy biến ngẫu nhiên xác định trên cùng không gian xác
suất . Chương này trình bày một số kết quả về sự hội tụ của dãy các biến
ngẫu nhiên khi chỉ số dần ra vô cùng. Những kết quả này đóng vai trò rất quan trọng
trong lý thuyết xác suất và những ứng dụng cho thống kê toán học.
Trước hết, ta cần nắm định nghĩa về sự hội tụ của dãy biến ngẫu nhiên về một
biến ngẫu nhiên khác.
Như vậy dãy biến ngẫu nhiên hội tụ theo xác suất về thì với đủ
lớn, thực tế ta có thể xem rằng không khác nhiều so với .
Chú ý rằng, giới hạn của hội tụ theo xác suất là duy nhất theo nghĩa: Nếu
và thì .
Ví dụ 4.1.1. Giả sử là biến ngẫu nhiên rời rạc có phân phối xác suất như sau:
khi .
và ,
trong đó , .
Đặc biệt, nếu là dãy các biến ngẫu nhiên độc lập, cùng phân phối với
Dễ thấy rằng với mọi : . Vậy ta có điều phải chứng minh. kỳ vọng , phương sai thì
.
4.2. Luật số lớn
Ý nghĩa. Luật số lớn cho ta một quy tắc xác định giá trị kỳ vọng của biến ngẫu nhiên
4.2.1. Bất đẳng thức Chebyshev xấp xỉ bằng trung bình số học của các giá trị quan sát được từ biến ngẫu nhiên đó với
Định lý. Giả sử biến ngẫu nhiên có kỳ vọng và phương sai hữu hạn thì với mọi số lần thực hiện phép thử khá lớn.
, ta có Ví dụ 4.2.2. Trong một hệ thống, gọi là thời gian phục vụ cho một khách hàng. Bài
toán đặt ra là tìm giá trị là thời gian phục vụ trung bình cho một khách hàng.
.
Quan sát thời gian phục vụ cho 50 khách hàng, tính được thời gian phục vụ trung bình
Bất đẳng thức Chebyshev có nhiều ứng dụng. Nó cho phép đánh giá cận trên, cận của 50 khách hàng trên là 4,25 phút. Theo luật số lớn, ta có thể xem .
dưới xác suất để biến ngẫu nhiên rơi vào một khoảng nào đó chỉ dựa vào hai đặc trưng Một hệ quả quan trọng của Luật số lớn là định lý Bernoulli. Cụ thể, xét dãy biến
cơ bản là kỳ vọng và phương sai. Về mặt lý thuyết, nó được sử dụng để chứng minh ngẫu nhiên độc lập, cùng phân phối Bernoulli có , với
các định lý của luật số lớn. là biến cố quan sát trong dãy phép thử Bernoulli. Khi đó, đại lượng
Ví dụ 4.2.1. Một thiết bị đo chiều dài có sai số đo lường là biến ngẫu nhiên có kỳ vọng
là 0mm, độ lệch chuẩn là 2mm. Hỏi với xác suất trên 90% thì sai số tổng cộng khi
dùng thiết bị trên đo 10 lần là nằm trong khoảng nào? chính là tần suất xuất hiện biến cố trong phép thử. Theo Luật số lớn thì
Giải. Gọi là sai số đo lường ở lần đo , thì các biến ngẫu nhiên là độc .
lập với .
Đây là cơ sở lý thuyết cho định nghĩa xác suất theo thống kê đưa ra ở chương 1.
Sai số tổng cộng trong 10 lần đo là với
59 60
2. Cho là các biến ngẫu nhiên độc lập với hội tụ theo phân phối về phân phối chuẩn tắc .
( ). Sử dụng bất đẳng thức Chebyshev tìm hai hằng số sao cho Định lý giới hạn trung tâm có nhiều ứng dụng trong xác suất và thống kê. Chẳng
hạn, xét trung bình số học , theo định lý giới hạn trung tâm với
3. Xác suất để chi tiết sản xuất ra đạt tiêu chuẩn là 0,8. Dùng bất đẳng thức Chebyshev đủ lớn thì sẽ có phân phối xấp xỉ phân phối chuẩn , trong đó ,
để đánh giá xác suất mà tỷ lệ chi tiết đạt tiêu chuẩn trong 4000 sản phẩm nằm trong .
khoảng từ 78% đến 83%.
Ví dụ 4.3.1. Giả sử thu nhập của một người dân trong một vùng là biến ngẫu nhiên có
4. Gieo một con xúc xắc cân đối lần và gọi là số lần xuất hiện mặt lục. Chứng kỳ vọng là 2,5 trđ/tháng, độ lệch chuẩn là 0,5 trđ/tháng. Chọn ngẫu nhiên 50 người
minh rằng tần suất xuất hiện mặt lục, , sẽ xấp xỉ với khi lớn. dân trong vùng trên. Tính xác suất để thu nhập trung bình của 50 người đó lớn hơn 2,4
5. Giả sử tiền điện của một gia đình phải trả trong 1 tháng là biến ngẫu nhiên với trung trđ/tháng.
bình 160 ngàn đồng, độ lệch chuẩn 10 ngàn đồng. Sừ dụng bất đẳng thức Chebyshev, Giải. Gọi là thu nhập của người dân chọn thứ , . Theo giả thiết ta có
hãy xác định số nhỏ nhất để với xác suất trên 99%, số tiền điện phải trả trong 1 năm . Theo định lý giới hạn trung tâm, thu nhập trung bình
không vượt quá .
của 50 người đó có phân phối xấp xỉ chuẩn . Do đó, xác suất để thu
6. Cho dãy các biến ngẫu nhiên độc lập xác định như sau:
nhập trung bình của 50 người dân lớn hơn 2,4 trđ/tháng có thể xấp xỉ là
Một ứng dụng khác là dùng để xấp xỉ các xác suất liên quan đến phân phối nhị
trong đó là một hằng số. Dãy thỏa mãn luật số lớn Chebyshev không? Tại
thức. Như đã biết, nếu thì . Khi lớn thì
sao?
việc tính toán trực tiếp sẽ rất khó khăn. Trong trường hợp này, ta có thể vận dụng định
7. Cho dãy các biến ngẫu nhiên độc lập xác định như sau: lý giới hạn trung tâm để xấp xỉ các xác suất trên như sau:
Công thức xấp xỉ 1 (Định lý Moivre-Laplace địa phương). Khi lớn thì
trong đó là một hằng số. Dãy thỏa mãn luật số lớn Chebyshev không? Tại
sao?
Công thức xấp xỉ 2 (Định lý Moivre-Laplace). Khi lớn và thì
4.3.1. Định lý giới hạn trung tâm Ví dụ 4.3.2. Xác suất làm ra một phế phẩm của một nhà máy là 0,02. Trong một lô
Trong các quy luật phân phối xác suất, phân phối chuẩn có vai trò đặc biệt quan hàng gồm 2500 sản phẩm, hãy xấp xỉ
trọng, vì trong những điều kiện nhất định, các quy luật phân phối khác hội tụ về phân a) Xác suất có 55 phế phẩm trong lô hàng.
phối chuẩn. Điều này thể hiện qua định lý giới hạn trung tâm sau đây: b) Xác suất có từ 40 đến 70 phế phẩm trong lô hàng.
Định lý. Giả sử là dãy các biến ngẫu nhiên độc lập, cùng phân phối với kỳ Giải. Gọi là số phế phẩm trong lô hàng thì với , .
vọng, phương sai hữu hạn. Đặt thì dãy biến ngẫu nhiên chuẩn Tính được . Khi đó, áp dụng công thức xấp xỉ 1, ta có
hóa
.
61 62
.
Ví dụ 4.3.3. Trong ví dụ 4.3.2. ta thấy xác suất rất nhỏ và lớn. Khi đó, áp dụng
công thức xấp xỉ 3 với , ta có 5.1. Mẫu ngẫu nhiên
. Giả sử ta quan tâm đến biến ngẫu nhiên ứng với một phép thử nào đó. Thực
hiện phép thử lần một cách độc lập, gọi là quan sát về ở lần thứ ,
thì là các biến ngẫu nhiên độc lập và cùng phân phối với . Khi đó, vectơ ngẫu
BÀI TẬP 4.3
nhiên được gọi là một mẫu ngẫu nhiên cỡ , sinh từ .
1. Thời gian phục vụ (đv: phút) cho một khách hàng ở cửa hàng là biến ngẫu nhiên
Chú ý. Trong thuật ngữ thống kê, biến ngẫu nhiên quan tâm gọi là dấu hiệu quan
tuân theo phân phối mũ . Dùng định lý giới hạn trung tâm, tính xác suất để
sát trong tổng thể nghiên cứu, thành phần của mẫu ngẫu nhiên gọi là thể hiện của
thời gian phục vụ cho 50 khách hàng nằm trong khoảng 140 đến 200 phút.
dấu hiệu trên đối tượng lấy ra từ tổng thể hay gọi là bản sao thứ của .
2. Gieo một con xúc xắc 100 lần. Gọi là tổng số chấm xuất hiện. Dùng định lý giới
Tập giá trị của mẫu ngẫu nhiên là
hạn trung tâm xấp xỉ cho xác suất .
,
3. Một máy công cụ gồm 10.000 chi tiết máy. Xác suất hỏng của mỗi chi tiết máy là
0,005. Xấp xỉ các xác suất trong đó, mỗi bộ được gọi là một mẫu thực nghiệm hay mẫu cụ thể.
Đây là một giá trị quan sát có thể của mẫu ngẫu nhiên khi thực hiện lấy mẫu.
a) Số chi tiết máy bị hỏng là 15.
b) Số chi tiết máy bị hỏng nằm trong khoảng (40;60). Ví dụ 5.1.1. Gọi là số chấm xuất hiện khi gieo một con xúc xắc cân đối thì là
biến ngẫu nhiên có phân phối xác suất là , . Giả sử tung
4. Cho biến ngẫu nhiên có phân phối nhị thức . Tính xác suất
con xúc xắc trên 3 lần và gọi là số chấm xuất hiện trong lần tung thứ thì
trong các trường hợp sau:
ta có 3 biến ngẫu nhiên độc lập, cùng phân phối với . Vậy ta có mẫu ngẫu nhiên cỡ
a) . Xấp xỉ xác suất đó bằng công thức xấp xỉ 1 và 3. Nhận xét.
3, sinh từ là . Thực hiện tung con xúc xắc 3 lần, giả sử lần thứ nhất
b) . Xấp xỉ xác suất đó bằng công thức xấp xỉ 1 và 3. Nhận được 5 chấm, lần hai được 2 chấm, lần ba được 4 chấm thì là một mẫu thực
xét. nghiệm của mẫu ngẫu nhiên trên.
5. Gieo 3200 lần một đồng xu cân đối, đồng chất. Gọi là số lần xuất hiện mặt sấp. Tùy theo vấn đề nghiên cứu và mỗi lĩnh vực khoa học mà ta có thể sử dụng các
a) Tìm số lần xuất hiện mặt sấp có khả năng nhất. Tính xác suất tương ứng. phương pháp lấy mẫu sau: phương pháp lấy mẫu có hoàn lại và phương pháp lấy mẫu
b) Tính xác suất nhận giá trị trong khoảng . không hoàn lại.
63 64
5.2. Thống kê và các đặc trưng mẫu
Giả sử là một mẫu ngẫu nhiên sinh từ có hàm phân phối Như vậy, hàm phân phối thực nghiệm là một xấp xỉ (ước lượng) cho hàm
và một mẫu thực nghiệm của mẫu ngẫu nhiên trên là . phân phối lý thuyết dựa trên mẫu. Với cố định thì hàm phân phối thực nghiệm
cho ta hình ảnh hình học về phân phối lý thuyết. Xấp xỉ đó càng tốt khi cỡ mẫu càng
5.2.1. Định nghĩa thống kê lớn.
Định nghĩa. Một hàm của các biến ngẫu nhiên thành phần mẫu
được gọi là một thống kê của mẫu.
Chẳng hạn , , ... là các thống kê của
mẫu. Như vậy một thống kê của mẫu là một thông tin tổng hợp được từ các thành
phần của mẫu.
Chú ý. Từ định nghĩa thì thống kê là một biến ngẫu nhiên, vì vậy nó cũng tuân theo
một quy luật phân phối xác suất nhất định và có các tham số đặc trưng như kỳ vọng
, phương sai , … Mặt khác, khi mẫu ngẫu nhiên nhận một giá trị cụ thể là
thì cũng nhận giá trị quan sát tương ứng là .
Các thống kê cùng với quy luật phân phối xác suất của chúng là cơ sở xây dựng
các phương pháp thống kê để nghiên cứu cho dấu hiệu nghiên cứu của tổng thể. Phần
tiếp theo đề cập đến một số thống kê mẫu quan trọng, gọi là các đặc trưng mẫu.
5.2.3. Trung bình mẫu
5.2.2. Hàm phân phối thực nghiệm Định nghĩa. Ta gọi thống kê, ký hiệu , xác định bởi
Định nghĩa. Hàm xác định bởi
,
là trung bình mẫu ứng với mẫu .
được gọi là hàm phân phối thực nghiệm của mẫu.
Giá trị trung bình mẫu thực nghiệm ký hiệu tương ứng là .
Hàm phân phối thực nghiệm trên một mẫu thực nghiệm được xác
định như sau: Tính chất. Giả sử biến ngẫu nhiên có kỳ vọng và phương sai hữu hạn
thì trung bình mẫu là một biến ngẫu nhiên có các đặc trưng
Từ các đặc trưng của trung bình mẫu, ta thấy rằng nếu cỡ mẫu càng lớn thì phân
Tính chất. Với cố định thì là một biến ngẫu nhiên có các đặc trưng phối xác suất của có xu hướng tập trung xác suất tại . Như vậy, trung bình
mẫu là một ước lượng cho kỳ vọng dựa trên mẫu.
Định lý Glivenko. Với các giả thiết trên thì Thống kê gọi là độ lệch mẫu ứng với mẫu .
65 66
Giá trị phương sai mẫu thực nghiệm và độ lệch mẫu thực nghiệm ký hiệu tương b) Biểu diễn bằng biểu đồ
ứng là và . Dùng các biểu đồ tần số, đa giác tần suất, biểu đồ hình bánh, tổ chức đồ ... để
Tính chất. Giả sử biến ngẫu nhiên có phương sai hữu hạn thì phương sai minh họa phân phối của mẫu thực nghiệm.
mẫu là một biến ngẫu nhiên có kỳ vọng . Ví dụ 5.2.3. Hãy minh họa các số liệu mẫu trong ví dụ 5.2.1 và 5.2.2.
Tương tự như trung bình mẫu, về cơ bản, phương sai mẫu (hay độ lệch mẫu
25
) thường dùng ước lượng cho phương sai (độ lệch tiêu chuẩn ) dựa trên
Tỷ lệ % điểm thi XSTK
mẫu. 20
2 3 4 5 6 7 8 9
Số Sinh viên
15
7% 4% 1% 6%
10%
Thống kê mô tả mẫu là đưa ra các thông tin cơ bản tóm tắt về mẫu như bảng tần 10 20%
số, tần suất mẫu, hàm phân phối thực nghiệm, các giá trị đặc trưng mẫu ... cũng như
21%
dùng các biểu đồ, đồ thị minh họa cho các thông tin đó. Đây là bước đầu tiên của 5
31%
thống kê để có thể đưa ra các phương pháp thống kê thích hợp.
0
2 3 4 5 6 7 8 9
a) Bảng tần số mẫu
Điểm thi XSTK
Thống kê các quan sát mẫu có giá trị lặp lại hay rơi vào cùng một khoảng nào đó.
Bảng tần số thường biểu diễn qua hai dạng:
trong đó là các giá trị khác nhau của mẫu, là tần số xuất hiện.
Số cây
Hay
trong đó là các khoảng chia rời nhau, là số các quan sát mẫu rơi vào khoảng .
Chiều cao
Ví dụ 5.2.1. Thống kê về điểm thi môn XSTK của sinh viên ngành M, ta có bảng sau:
Điểm thi 2 3 4 5 6 7 8 9 c) Các đặc trưng mẫu
Số sinh viên 1 4 7 15 21 14 5 3 Dựa vào bảng tần số mẫu, ta có thể xác định các đặc trưng mẫu như sau:
Ví dụ 5.2.2. Đo chiều cao của 240 cây, ta thu được bảng thống kê như sau:
Chiều cao 4,5-7,5 7,5-10,5 10,5-13,5 13,5-16,5 16,5-19,5 19,5-22,5
Số cây 18 52 69 41 36 24 .
Ví dụ 5.2.4. Tính các đặc trưng mẫu của mẫu số liệu trong ví dụ 5.2.1.
Giải. Lập bảng tính như sau:
67 68
2 3 4 5 6 7 8 9 Tổng b) Phân phối Khi-bình phương
1 4 7 15 21 14 5 3 70 Giả sử là các biến ngẫu nhiên độc lập, cùng phân phối . Khi
đó biến ngẫu nhiên
2 12 28 75 126 98 40 27 408
4 36 112 375 756 686 320 243 2532
gọi là có phân phối Khi-bình phương với bậc tự do .
Suy ra
c) Phân phối Student
. Giả sử ; và độc lập thì biến ngẫu nhiên
Chú ý. Nếu số liệu được thống kê tần số dưới dạng khoảng thì ta chọn giá trị đại diện
của mỗi khoảng là trung điểm khoảng đó, sau đó tính các đặc trưng mẫu như trên. Các
máy tính bỏ túi dòng MS, ES có chức năng tính nhanh các đặc trưng trên! gọi là có phân phối Student với bậc tự do .
69 70
Kết quả này thường dùng để ước lượng cho tham số xác suất với cỡ mẫu lớn. Người ta CHƯƠNG 6.
thấy xấp xỉ này là tốt khi hoặc .
BÀI TOÁN ƯỚC LƯỢNG THAM SỐ
Các kết quả này sẽ được sử dụng trong các phương pháp thống kê đề cập ở các
chương sau.
Phân phối xác suất của biến ngẫu nhiên thường phụ thuộc vào một số tham số.
Việc biết giá trị các tham số này có thể xác định các đặc trưng của biến ngẫu nhiên
cũng như toàn bộ thông tin về phân phối xác suất. Chẳng hạn, giả sử biến ngẫu nhiên
quan tâm có phân phối Poisson, biết tham số thì phân phối của hoàn
toàn được xác định.
Tuy nhiên, trong thực tế thì giá trị các tham số này không được xác định một
cách chính xác mà thường chỉ được ước lượng từ mẫu. Đây là nội dung cơ bản của bài
toán ước lượng tham số và là một trong những bài toán quan trọng của thống kê toán.
Có hai phương pháp ước lượng cơ bản là ước lượng điểm và ước lượng khoảng
tin cậy. Vấn đề quan tâm của mỗi phương pháp ước lượng là đưa ra tiêu chuẩn ước
lượng và phương pháp xây dựng các ước lượng đó.
71 72
6.1.1. Ước lượng không chệch Ví dụ 6.1.3. Giả sử mẫu sinh từ phân phối Poisson . Chứng minh
Định nghĩa. Thống kê được gọi là ước lượng không chệch của rằng trung bình mẫu là ước lượng hiệu quả của tham số .
tham số nếu . Giải. Ta có thì . Do đó
Ngược lại, nếu thì gọi là ước lượng chệch của tham số với độ
chệch, ký hiệu .
Mặt khác, phân phối xác suất của là
Ý nghĩa. Nếu thống kê là ước lượng không chệch của tham số thì ,
nghĩa là sai số ước lượng trung bình bằng 0. Vậy tiêu chuẩn không chệch tránh được
giá trị ước lượng sai lệch về một phía.
Ta có , suy ra
Ví dụ 6.1.1. Giả sử tham số là kỳ vọng thì trung bình mẫu là một ước
lượng không chệch của . Tương tự phương sai mẫu là một ước lượng không chệch và
của tham số .
Khi đó,
Ví dụ 6.1.2. Giả sử là hai ước lượng không chệch của tham số thì với mọi
, thống kê có , do
đó cũng là ước lượng không chệch của tham số . Điều này cho thấy ước lượng
không chệch là không duy nhất. Dễ dàng thấy rằng . Vậy ta có điều phải chứng minh.
6.1.2. Ước lượng hiệu quả Ví dụ 6.1.4. Giả sử mẫu sinh từ phân phối chuẩn . Chứng minh
Nếu là hai ước lượng không chệch của tham số và thì rằng trung bình mẫu là ước lượng hiệu quả của tham số .
suy ra . Và do đó ước lượng gọi là “hiệu quả” hơn so với Giải. Ta có thì . Do đó
. Từ đó ta đưa ra tiêu chuẩn hiệu quả từ tiêu chuẩn không chệch như sau.
Định nghĩa. Thống kê được gọi là ước lượng hiệu quả của tham số
nếu là ước lượng không chệch có phương sai bé nhất, tức là Mặt khác, phân phối xác suất của là
.
với mọi là ước lượng không chệch của tham số .
Việc kiểm tra tiêu chuẩn hiệu quả của một ước lượng là dựa vào bất đẳng thức
Ta có , suy ra
Cramer-Rao như sau:
Định lý (Bất đẳng thức Cramer-Rao). Giả sử mẫu ngẫu nhiên sinh từ và
có phân phối xác suất và là một ước lượng không chệch của
tham số . Khi đó Khi đó,
trong đó gọi là lượng thông tin Dễ dàng thấy rằng . Vậy ta có điều phải chứng minh.
73 74
6.2. Phương pháp tìm ước lượng
Như vậy khi cỡ mẫu càng lớn thì ước lượng vững càng xấp xỉ với giá trị tham
Giả sử là mẫu ngẫu nhiên sinh từ có phân phối xác suất
số ước lượng. Do đó, độ chính xác của một ước lượng vững phụ thuộc vào cỡ mẫu
với tham số . Trong phần này ta đưa ra hai phương pháp tìm ước
quan sát. Việc kiểm tra tiêu chuẩn vững của một ước lượng thường dựa vào hai kết
lượng cho tham số là: phương pháp hợp lý cực đại và phương pháp moment.
quả sau đây.
Định lý. Nếu thống kê thỏa mãn: 6.2.1. Phương pháp hợp lý cực đại
a) là một ước lượng không chệch của , tức là , Ta định nghĩa hàm xác định bởi
b) ,
75 76
Giải phương trình hợp lý Ví dụ 6.2.3. Tìm ước lượng moment cho tham số trong ví dụ 6.2.1.
Giải. Ta có nên moment cấp 1 là .
.
Giải phương trình moment
Hơn nữa, .
Vậy ước lượng moment cho là .
.
Ví dụ 6.2.4. Cho mẫu sinh từ phân phối chuẩn . Tìm ước lượng
Vậy là ước lượng hợp lý cực đại cho . moment cho hai tham số và .
Ví dụ 6.2.2. Cho mẫu ngẫu nhiên sinh từ phân phối có hàm mật độ là Giải. Ta có nên . Suy ra các moment
. Chứng minh rằng ước lượng hợp lý cực đại của tham số là
. Giải hệ phương trình moment
Giải. Hàm hợp lý của mẫu là
.
Vậy ước lượng moment cho tương ứng là .
Do nên và hàm hợp lý là hàm đơn
điệu tăng nên BÀI TẬP 6.2
. 1. Cho mẫu sinh từ phân phối chuẩn với . Tìm ước lượng
Vậy ta suy ra điều phải chứng minh. hợp lý cực đại cho tham số . Kiểm tra các tiêu chuẩn ước lượng của .
2. Cho mẫu sinh từ phân phối Bernoulli . Tìm ước lượng moment
6.2.2. Phương pháp moment và ước lượng hợp lý cực đại cho tham số . Kiểm tra các tiêu chuẩn ước lượng của
Moment bậc của biến ngẫu nhiên được xác định bởi các ước lượng thu được.
3. Tìm ước lượng moment và ước lượng hợp lý cực đại cho tham số từ mẫu ngẫu
Moment mẫu bậc của mẫu ngẫu nhiên được xác định bởi nhiên sinh từ có hàm mật độ sau đây:
a) với .
b) , với .
Chú ý. Từ đặc trưng moment, ta có thể xác định các đặc trưng khác của biến ngẫu c) , với .
nhiên. Chẳng hạn kỳ vọng , phương sai … Moment là Kiểm tra các tiêu chuẩn ước lượng của các ước lượng thu được.
các đặc trưng tổng quát của phân phối xác suất.
4. Cho mẫu sinh từ có phân phối xác suất với
, . Tìm ước lượng moment và ước lượng hợp lý cực đại cho
tham số .
Định nghĩa. Thống kê là nghiệm của hệ phương trình
5. Giả sử thời gian hoạt động (đv: năm) của một loại máy có phân phối mũ .
Độ tin cậy của loại máy trên tại thời điểm được định nghĩa là . Tìm
ước lượng hợp lý cực đại cho từ mẫu .
được gọi là ước lượng moment của .
Chú ý rằng, tùy theo bài toán mà ta dùng moment bậc thích hợp. Số phương
trình moment bằng số tham số cần ước lượng.
77 78
6.3. Ước lượng khoảng tin cậy Ví dụ 6.3.1. Cho mẫu ngẫu nhiên sinh từ phân phối chuẩn . Với
độ tin cậy , hãy xây dựng khoảng ước lượng cho tham số kỳ vọng , biết rằng
Giả sử mẫu ngẫu nhiên sinh từ có phân phối xác suất phụ thuộc đã biết.
vào tham số chưa biết. Bài toán ước lượng khoảng tin cậy là dựa vào mẫu tìm hai
thống kê và sao cho Giải. Từ lý thuyết mẫu thì trung bình mẫu có phân phối chuẩn . Do đó
chọn đại lượng lõi là
Khi đó khoảng gọi là khoảng ước lượng của tham số với độ tin cậy .
có phân phối chuẩn tắc .
, tương ứng gọi là giới hạn tin cậy dưới, giới hạn tin cậy trên.
Khoảng ước lượng thường chọn sao cho có độ tin cậy lớn (thường Khi đó, chọn giá trị gọi là phân vị chuẩn tắc. Theo tính chất
lớn hơn 90%) và độ rộng của khoảng hẹp theo nghĩa nhỏ. hàm , ta có
Ước lượng khoảng mang nhiều thông tin hơn về tham số ước lượng so với ước .
lượng điểm. Nó đưa ra một đo đo tin cậy về sự chính xác của ước lượng. Khi lấy mẫu Và
lặp lại nhiều lần thì độ tin cậy xác định tỷ lệ số lần lấy mẫu mà có khoảng ước lượng .
chứa giá trị của tham số. Do đó, với độ tin cậy cao thì ta có thể kết luận giá trị của
Do đó chọn và . Thực hiện sự biến đổi, ta được
tham số nằm trong khoảng ước lượng được xác định cụ thể trên một mẫu thực nghiệm.
trong đó gọi là sai số ước lượng. Phân vị chuẩn tắc được tra
79 80
Giải. Theo giả thiết, ta có và với độ tin cậy tra từ bảng
trong đó gọi là sai số ước lượng. Phân vị Student
phụ lục được . Khi đó khoảng ước lượng cho sự
được tra từ bảng phụ lục II. Chú ý rằng khi thì . chênh lệch chiều cao của thanh niên vùng trên với độ tin cậy 95% là
Chú ý. Nếu biến ngẫu nhiên không tuân theo phân phối chuẩn thì với cỡ mẫu lớn
hay cm.
( ), áp dụng định lý giới hạn trung tâm và luật số lớn thì
có phân phối xấp xỉ . c) Khoảng ước lượng cho xác suất (tỷ lệ)
Do đó, khoảng ước lượng cho kỳ vọng với độ tin cậy là Cho mẫu ngẫu nhiên sinh từ . Ta xây dựng khoảng ước lượng cho
tham số xác suất với độ tin cậy .
Gọi số quan sát mẫu thì đại lượng là tần suất mẫu của biến
trong đó sai số ước lượng .
cố . Theo lý thuyết mẫu với cỡ mẫu lớn, áp dụng định lý giới hạn trung tâm
Ví dụ 6.3.2. Đo chiều dài một loại chi tiết máy 25 lần, ta tính được chiều dài trung và luật số lớn thì
bình của mẫu là 20,05 cm. Biết rằng chiều dài chi tiết máy trên có phân phối chuẩn
có phân phối xấp xỉ .
với . Hãy tìm khoảng ước lượng cho chiều dài trung bình của chi tiết máy trên
với độ tin cậy 99%.
Do đó, khoảng ước lượng cho xác suất với độ tin cậy là
Giải. Gọi là chiều dài của một chi tiết máy trên, theo giả thiết thì .
Ta có ; ; và với độ tin cậy tra được .
Từ đó tính được sai số ước lượng trong đó sai số ước lượng .
. Chú ý. Khoảng ước lượng cho xác suất như trên thường chính xác khi .
Khi đó, khoảng ước lượng cho chiều dài trung bình của chi tiết máy trên với độ tin cậy Ví dụ 6.3.4. Một lô thuốc ta kiểm tra 200 ống thì thấy có 17 ống bị đục. Với độ tin cậy
99% là cm. 98%, hãy tìm khoảng ước lượng của tỷ lệ ống thuốc bị đục của toàn bộ lô thuốc.
b) Khoảng ước lượng cho phương sai Giải. Gọi biến cố là “ống thuốc bị đục” và là tỷ lệ ống thuốc bị đục của
toàn bộ lô thuốc. Theo giả thiết, từ mẫu ta có suy ra . Với
Giả sử mẫu ngẫu nhiên sinh từ . Theo lý thuyết mẫu,
độ tin cậy tra được . Từ đó tính được sai số ước lượng
ta có
. .
Khi đó khoảng ước lượng cho tỷ lệ ống thuốc bị đục của toàn bộ lô thuốc với độ tin
Theo phương pháp xây dựng trên thì khoảng ước lượng cho phương sai với độ tin
cậy 98% là .
cậy là
81 82
Giả sử ta muốn ước lượng khoảng cho tham số có sai số ước lượng là . Với sai BÀI TẬP 6.3
số ước lượng cho trước (hay sai số mong muốn), ta tìm cỡ mẫu sao cho 1. Hãy xây dựng các khoảng ước lượng cho các tham số trong phần 6.3.2.
. 2. Giả sử mẫu ngẫu nhiên sinh từ phân phối có hàm mật độ ,
a) Ước lượng cho kỳ vọng . Hãy xây dựng khoảng ước lượng cho với độ tin cậy qua đại lượng
lõi .
Giả sử ta muốn ước lượng cho kỳ vọng , theo trên ta có sai số ước
3. Để xác định trọng lượng trung bình của các bao bột mì được đóng gói bằng máy tự
lượng với độ tin cậy là (nếu chưa biết thì ước lượng bằng độ
động, người ta chọn ngẫu nhiên 50 bao và tính được kg và . Tìm
lệch mẫu ). Khi đó, từ biến đổi khoảng ước lượng với độ tin cậy 99% của trọng lượng trung bình các bao bột mì, giả
sử trọng lượng tuân theo phân phối chuẩn.
4. Trong một cuộc thăm dò ý kiến của 100 khách hàng, người ta thấy 55 người nói
rằng ưa thích mặt hàng A. Tìm khoảng tin cậy 95% cho tỷ lệ người tiêu dùng ưa thích
ta chọn cỡ mẫu cần thiết là mặt hàng A.
5. Độ sâu của biển được xác định bằng một máy đo có sai số hệ thống bằng 0, còn sai
b) Ước lượng cho xác suất (tỷ lệ) số ngẫu nhiên tuân theo phân phối chuẩn với độ lệch m. Cần phải tiến hành bao
Giả sử ta muốn ước lượng cho xác suất , theo trên ta có sai số ước nhiêu lần đo để xác định được độ sâu của biển có sai số không quá 15m với độ tin cậy
90%.
lượng với độ tin cậy là . Khi đó, từ biến đổi
6. Khảo sát trọng lượng của một loại quả trái cây, thu được số liệu sau:
Trọng lượng (g) 30 - 33 33 - 36 36 - 39 39 - 42 42 - 45 45 - 48
Số quả 12 25 36 28 14 5
ta chọn cỡ mẫu cần thiết là Giả sử trọng lượng là biến ngẫu nhiên tuân theo phân phối chuẩn.
a) Với độ tin cậy 98%, hãy ước lượng trọng lượng trung bình của loại quả trên.
Ngoài ra ta có chú ý rằng (bất đẳng thức Cauchy) nên có thể chọn Nếu muốn ước lượng trên có sai số không vượt quá 0,5g thì cần khảo sát bao
nhiêu quả trên.
cỡ mẫu cần thiết là trong trường hợp không phụ thuộc vào tần suất b) Hãy ước lượng sự phân tán trọng lượng của loại trái cây trên với độ tin cậy
. 95%
c) Với độ tin cậy 95%, hãy ước lượng tỷ lệ quả có trọng lượng thuộc khoảng 36 -
Ví dụ 6.3.5. Trong một cuộc tranh cử, muốn biết tỷ lệ bầu cử cho một ứng viên có sai
45g. Nếu muốn ước lượng trên có sai số không vượt quá 4% thì cần khảo sát
số không vượt quá 5% với độ tin cậy 99% thì cần thăm dò bao nhiêu cử tri được bỏ
bao nhiêu quả trên.
phiếu.
7. Để xác định số xe máy chưa đăng ký, cảnh sát giao thông kiểm tra ngẫu nhiên 400
Giải. Gọi là tỷ lệ bầu cử của một ứng viên tranh cử. Theo giả thiết, ta có
xe và thấy có 10 xe chưa đăng ký. Dựa vào kết quả đó hãy ước lượng số xe máy chưa
và độ tin cậy tra được . Từ đó tính được
đăng ký với độ tin cậy 98%, biết rằng số xe máy đã đăng ký là 90.000 xe.
Vậy cần thăm dò ít nhất là 666 cử tri để có thể ước lượng cho tỷ lệ bầu cử của một
ứng viên có sai số không vượt quá 5%.
83 84
TÀI LIỆU THAM KHẢO PHỤ LỤC
97 98
Bảng II. Phân vị Student với bậc tự do. Bảng III. Phân vị Khi-bình phương với bậc tự do.
1 2 3 4 5 6 7 8 9 10 0.005 0.010 0.020 0.025 0.050 0.950 0.975 0.980 0.990 0.995
0.005 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 1 7.88 6.63 5.41 5.02 3.84 0.00 0.00 0.00 0.00 0.00
0.010 31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2 10.60 9.21 7.82 7.38 5.99 0.10 0.05 0.04 0.02 0.01
0.020 15.895 4.849 3.482 2.999 2.757 2.612 2.517 2.449 2.398 2.359 3 12.84 11.34 9.84 9.35 7.81 0.35 0.22 0.18 0.11 0.07
0.025 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 4 14.86 13.28 11.67 11.14 9.49 0.71 0.48 0.43 0.30 0.21
0.050 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 5 16.75 15.09 13.39 12.83 11.07 1.15 0.83 0.75 0.55 0.41
11 12 13 14 15 16 17 18 19 20 6 18.55 16.81 15.03 14.45 12.59 1.64 1.24 1.13 0.87 0.68
7 20.28 18.48 16.62 16.01 14.07 2.17 1.69 1.56 1.24 0.99
0.005 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845
8 21.95 20.09 18.17 17.53 15.51 2.73 2.18 2.03 1.65 1.34
0.010 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 2.528
9 23.59 21.67 19.68 19.02 16.92 3.33 2.70 2.53 2.09 1.73
0.020 2.328 2.303 2.282 2.264 2.249 2.235 2.224 2.214 2.205 2.197
10 25.19 23.21 21.16 20.48 18.31 3.94 3.25 3.06 2.56 2.16
0.025 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086
11 26.76 24.72 22.62 21.92 19.68 4.57 3.82 3.61 3.05 2.60
0.050 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 1.725
12 28.30 26.22 24.05 23.34 21.03 5.23 4.40 4.18 3.57 3.07
21 22 23 24 25 26 27 28 29 30 13 29.82 27.69 25.47 24.74 22.36 5.89 5.01 4.77 4.11 3.57
0.005 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.756 2.750 14 31.32 29.14 26.87 26.12 23.68 6.57 5.63 5.37 4.66 4.07
0.010 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.457 15 32.80 30.58 28.26 27.49 25.00 7.26 6.26 5.98 5.23 4.60
0.020 2.189 2.183 2.177 2.172 2.167 2.162 2.158 2.154 2.150 2.147 16 34.27 32.00 29.63 28.85 26.30 7.96 6.91 6.61 5.81 5.14
0.025 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.042 17 35.72 33.41 31.00 30.19 27.59 8.67 7.56 7.26 6.41 5.70
0.050 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.697 18 37.16 34.81 32.35 31.53 28.87 9.39 8.23 7.91 7.01 6.26
19 38.58 36.19 33.69 32.85 30.14 10.12 8.91 8.57 7.63 6.84
31 32 33 34 35 36 37 38 39 40
20 40.00 37.57 35.02 34.17 31.41 10.85 9.59 9.24 8.26 7.43
0.005 2.744 2.738 2.733 2.728 2.724 2.719 2.715 2.712 2.708 2.704 21 41.40 38.93 36.34 35.48 32.67 11.59 10.28 9.91 8.90 8.03
0.010 2.453 2.449 2.445 2.441 2.438 2.434 2.431 2.429 2.426 2.423 22 42.80 40.29 37.66 36.78 33.92 12.34 10.98 10.60 9.54 8.64
0.020 2.144 2.141 2.138 2.136 2.133 2.131 2.129 2.127 2.125 2.123 23 44.18 41.64 38.97 38.08 35.17 13.09 11.69 11.29 10.20 9.26
0.025 2.040 2.037 2.035 2.032 2.030 2.028 2.026 2.024 2.023 2.021 24 45.56 42.98 40.27 39.36 36.42 13.85 12.40 11.99 10.86 9.89
0.050 1.696 1.694 1.692 1.691 1.690 1.688 1.687 1.686 1.685 1.684 25 46.93 44.31 41.57 40.65 37.65 14.61 13.12 12.70 11.52 10.52
41 42 43 44 45 46 47 48 49 50 26 48.29 45.64 42.86 41.92 38.89 15.38 13.84 13.41 12.20 11.16
0.005 2.701 2.698 2.695 2.692 2.690 2.687 2.685 2.682 2.680 2.678 27 49.64 46.96 44.14 43.19 40.11 16.15 14.57 14.13 12.88 11.81
0.010 2.421 2.418 2.416 2.414 2.412 2.410 2.408 2.407 2.405 2.403 28 50.99 48.28 45.42 44.46 41.34 16.93 15.31 14.85 13.56 12.46
0.020 2.121 2.120 2.118 2.116 2.115 2.114 2.112 2.111 2.110 2.109 29 52.34 49.59 46.69 45.72 42.56 17.71 16.05 15.57 14.26 13.12
0.025 2.020 2.018 2.017 2.015 2.014 2.013 2.012 2.011 2.010 2.009 30 53.67 50.89 47.96 46.98 43.77 18.49 16.79 16.31 14.95 13.79
0.050 1.683 1.682 1.681 1.680 1.679 1.679 1.678 1.677 1.677 1.676 40 66.77 63.69 60.44 59.34 55.76 26.51 24.43 23.84 22.16 20.71
50 79.49 76.15 72.61 71.42 67.50 34.76 32.36 31.66 29.71 27.99
60 70 80 90 100 110 120 130 140 150 60 91.95 88.38 84.58 83.30 79.08 43.19 40.48 39.70 37.48 35.53
0.005 2.660 2.648 2.639 2.632 2.626 2.621 2.617 2.614 2.611 2.609 70 104.21 100.43 96.39 95.02 90.53 51.74 48.76 47.89 45.44 43.28
0.010 2.390 2.381 2.374 2.368 2.364 2.361 2.358 2.355 2.353 2.351 80 116.32 112.33 108.07 106.63 101.88 60.39 57.15 56.21 53.54 51.17
0.020 2.099 2.093 2.088 2.084 2.081 2.078 2.076 2.075 2.073 2.072 90 128.30 124.12 119.65 118.14 113.15 69.13 65.65 64.63 61.75 59.20
0.025 2.000 1.994 1.990 1.987 1.984 1.982 1.980 1.978 1.977 1.976 100 140.17 135.81 131.14 129.56 124.34 77.93 74.22 73.14 70.06 67.33
0.050 1.671 1.667 1.664 1.662 1.660 1.659 1.658 1.657 1.656 1.655
99 100