You are on page 1of 61

TIỂU LUẬN MÔN LÝ THUYẾT

XÁC SUẤT

Giảng viên: cô Trần Thái Diệu Hằng

NHÓM THỰC HIỆN: NHÓM 4

LỚP: K58CLC6

TP.HCM, ngày 19 tháng 5 năm 2020.


TÊN THÀNH VIÊN

HỌ VÀ TÊN MÃ SỐ SINH VIÊN

Trần Mai Thảo 1915535338

Nguyễn Bùi Minh Thư 1915535340

Phùng Anh Thư 1915535341

Võ Hải Sơn Trang 1915535344

Huỳnh Thành Tuyền 1915535345

Nguyễn Cẩm Vân 1915535346

Trần Nguyễn Thuý Vy 1915535349

Trần Phương Vy 1915535350

Lại Nguyễn Anh Thiên 1915535489

1
MỤC LỤC
A LỜI NÓI ĐẦU .................................................................................................. 4

B LÝ THUYẾT ..................................................................................................... 5
B.1 CHƯƠNG I: Biến cố và xác suất của biến cố .......................................................................... 5
B.1.1 Dãy phép thử Bernoulli ........................................................................................................................ 5
B.1.2 Xác suất có điều kiện – Định lý nhân xác suất .................................................................................... 8
i Xác suất có điều kiện: ....................................................................................................................... 8
ii Công thức nhân xác suất: ............................................................................................................... 11

B.2 CHƯƠNG III: Một số quy luật phân phối xác suất thông dụng ......................................... 13
B.2.1 Phân phối xác suất của biến ngẫu nhiên rời rạc: ................................................................................ 13
i Phân phối nhị thức B(n, p) .............................................................................................................. 13
ii Phân phối Poisson P(𝝀) .................................................................................................................. 15
B.2.2 Phân phối xác suất của biến ngẫu nhiên liên tục................................................................................ 17
i Phân phối chuẩn N(μ, ර²) ................................................................................................................ 17
ii Phân phối chuẩn tắc: ...................................................................................................................... 19

C BÀI TẬP ......................................................................................................... 22


Ví dụ 1 (Chương I) ................................................................................................................................. 22
Ví dụ 2 (Chương I) ................................................................................................................................. 23
Ví dụ 3 (Chương I) ................................................................................................................................. 24
Ví dụ 4 (Chương I) ................................................................................................................................. 26
Ví dụ 5 (Chương I) ................................................................................................................................. 27
Ví dụ 6 (Chương I) ................................................................................................................................. 28
Ví dụ 7 (Chương II) ............................................................................................................................... 29
Ví dụ 8 (Chương II) ............................................................................................................................... 30
Ví dụ 9 (Chương II) ............................................................................................................................... 31
Ví dụ 10 (Chương II) ............................................................................................................................. 32
Ví dụ 11 (Chương II) ............................................................................................................................. 34
Ví dụ 12 (Chương II) ............................................................................................................................. 34
Ví dụ 13 (Chương III) ............................................................................................................................ 36
Ví dụ 14 (Chương III) ............................................................................................................................ 36
Ví dụ 15 (Chương III) ............................................................................................................................ 37
Ví dụ 16 (Chương III) ............................................................................................................................ 38
Ví dụ 17 (Chương III) ............................................................................................................................ 39
Ví dụ 18 (Chương IV) ............................................................................................................................ 40
Ví dụ 19 (Chương IV) ............................................................................................................................ 41
Ví dụ 20 (Chương IV) ............................................................................................................................ 42

2
Ví dụ 21 (Chương IV) ............................................................................................................................ 43

D ỨNG DỤNG ................................................................................................... 45


D.1 Đời sống..................................................................................................................................... 45

D.2 Kinh tế ....................................................................................................................................... 46


D.2.1 Bảo hiểm ............................................................................................................................................ 46
D.2.2 Quản trị, chiến lược để phát triển doanh nghiệp ................................................................................ 47
D.2.3 Khác ................................................................................................................................................... 49

D.3 Tài chính ................................................................................................................................... 49

D.4 Xã hội ........................................................................................................................................ 50

D.5 Nghiên cứu khoa học ............................................................................................................... 50


D.5.1 Kinh tế học ......................................................................................................................................... 50
D.5.2 Y học .................................................................................................................................................. 51
D.5.3 Thiên văn học, các hiện tượng tự nhiên, dự báo thiên tai, thời tiết ................................................... 53
D.5.4 Giáo dục ............................................................................................................................................. 54
D.5.5 Sinh học ............................................................................................................................................. 55
D.5.6 Vật lý học ........................................................................................................................................... 55

D.6 Nông nghiệp, công nghiệp ....................................................................................................... 56


D.6.1 Các thông số, quy trình kĩ thuật, sản xuất, máy móc, thuật toán ....................................................... 56
D.6.2 Xây dựng............................................................................................................................................ 57
D.6.3 Mùa vụ ............................................................................................................................................... 58

D.7 Nghệ thuật................................................................................................................................. 58

E THAM KHẢO................................................................................................. 59

3
A LỜI NÓI ĐẦU

Ngày nay, việc ứng dụng bộ môn xác suất thống kê vào các lĩnh vực khoa học khác
cũng như trong các lĩnh vực đời sống xã hội ngày càng phổ biến hơn. Không thể phủ
nhận rằng nhờ những kiến thức từ bộ môn xác suất thống kê mà những vấn đề tưởng
chừng như khó khăn để xác định nay đã được làm dễ dàng và nhanh chóng. Nhờ dựa
vào việc xác định xác suất xảy ra của những biến cố có lợi cũng như là những biến cố
xảy đến mà chúng ta có thể đề ra những kế hoạch cụ thể để sẵn sàng gia tăng lợi ích và
giảm thiểu nhiều nhất những rủi ro trong nhiều lĩnh vực đời sống xã hội, phòng chống
thiên tai cũng như là trong lĩnh vực kinh doanh. Không những vậy, nhờ việc am hiểu
những kiến thức về xác suất và thống kê mà những cá nhân tổ chức có thể phát triển cho
mình những cách nhìn nhận sự việc theo cách nhìn đa chiều và có tổ chức hơn.

Tuy nhiên, để có cái nhìn thật sự sâu sắc về những kiến thức và ứng dụng của bộ môn
này vào trong đời sống, cần phải có một sự tìm tòi, nghiên cứu sâu về các vấn đề mà bộ
môn mang lại. Thực tiễn cho thấy rằng, có rất nhiều những lợi ích mà chúng ta đang
được thừa hưởng một cách hiển nhiên đến từ bộ môn xác suất thống kê nhưng không
phải chúng ta đều hầu hết nhận ra được điều đó.

Với mong muốn tìm hiểu sâu hơn những kiến thức của bộ môn xác suất thống kê cũng
như những ứng dụng thực tiễn của nó vào trong đời sống, nhóm 4 chúng em quyết định
làm tiểu luận nghiên cứu về một số vấn đề lý thuyết và bài tập, ứng dụng của môn xác
suất thống kê vào thực tiễn đời sống để từ đó có thể hiểu rõ cũng như là phát huy được
ưu thế tích cực của môn học.

Ngoài bài tập tham khảo và ứng dụng, nội dung tiểu luận còn phân tích lý thuyết của 2
chương:

• Chương I: Biến cố và xác suất của biến cố


• Chương III: Một số quy luật phân phối xác suất thông dụng

Mong cô và các bạn có thể cùng xem và đóng góp để tiểu luận của nhóm chúng em có
thể được hoàn thiện hơn. Chúng em xin chân thành cảm ơn!

4
B LÝ THUYẾT

B.1 CHƯƠNG I: Biến cố và xác suất của biến cố

B.1.1 Dãy phép thử Bernoulli

a) Định nghĩa:

Dãy n phép thử Bernoulli là dãy n phép thử thoả mãn 3 điều kiện sau:

• Các phép thử của dãy độc lập với nhau (nghĩa là các biến cố xuất hiện trong các
phép thử khác nhau là độc lập với nhau, kết quả của mỗi phép thử không phụ thuộc vào
kết quả của các phép thử khác).
• Mỗi phép thử có 2 kết quả : A và 𝐴̅
• Xác suất xuất hiện A trong mọi phép thử của dãy bằng nhau và bằng p

P(A) = p

P(A)= 1-P(A)=1-p=q

Ví dụ: Các trường hợp sau đây là dãy phép thử Bernoulli

• Một nhà máy sản xuất linh kiện điện thoại. Trung bình một ngày nhà máy sản
xuất được 300 sản phẩm. Xác suất trong quá trình sản xuất một sản phẩm bị lỗi là 0,08.
è Coi việc nhà máy sản xuất linh kiện là 1 phép thử.Theo đề nhà máy trung bình
một ngày sản xuất được 300 sản phẩm là dãy 300 phép thử Bernoulli với xác suất
xuất hiện 1 sản phẩm bị lỗi trong mỗi phép thử là 0,08
• Trong một thùng có 80 chiếc bánh, trong đó có 4 chiếc đã hết hạn sử dụng. Lấy
ngẫu nhiên (có hoàn lại) lần lượt từng chiếc ra 80 chiếc bánh.
è Coi việc lấy lần lượt ngẫu nhiên từng chiếc bánh là phép thử. Theo đề bài lấy
ngẫu nhiên lần lượt ra 80 chiếc bánh là dãy 80 phép thử với xác suất xuất hiện 1
!
chiếc bánh hết hạn sử dụng là "# (=0,05)

b) Công thức Bernoulli:

Bài toán: Cho dãy n phép thử Bernoulli với xác suất xuất hiện biến cố A trong mỗi phép
thử là p. Tìm xác suất của biến cố Ak = “có k lần xuất hiện biến cố A trong dãy n phép
thử Bernoulli đã cho”

5
Hướng dẫn:

Mỗi biến cố 𝐴𝐴𝐴̅𝐴. . . 𝐴 (gồm k chữ A và n-k vị trí còn lại là 𝐴̅ ) có các biến cố thành
phần độc lập (vì xuất hiện trong các phép thử khác nhau) do đó xác suất của biến cố này
là 𝑝$ 𝑞 %&$ . Số biến cố dạng này tương ứng với số cách xếp k chữ A (không kể thứ tự)
vào dãy và n-k chữ 𝐴̅ vào các vị trí còn lại, do đó có 𝐶%$ biến cố. Đây là các biến cố
thuận lợi cho 𝐴$ và xung khắc từng đôi, theo công thức cộng xác suất cho các biến cố
xung khắc suy ra:

𝑃% (𝑘) = 𝐶%$ . 𝑝$ . 𝑞 %&$ .

è Công thức Bernoulli: Xác suất để trong dãy n phép thử Bernoulli biến cố A xuất
hiện đúng k lần, kí hiệu 𝑃% (𝑘) được tính bởi công thức:

𝑷𝒏 (𝒌) = 𝑪𝒌𝒏 . 𝒑𝒌 . 𝒒𝒏&𝒌 .

Ví dụ 1: Tuổi thọ (tính theo giờ) của 1 loại van điện lắp trong một thiết bị là biến ngẫu
nhiên có hàm mật độ xác suất như sau:

0 ∀ 𝑥 ≤ 100
𝑓(𝑥) = 5100
∀ 𝑥 > 100
𝑥)
Tìm xác suất để có 2 trong số 5 van điện này bị thay thế trong 150 giờ hoạt động đầu
tiên biết rằng việc hỏng của các van điện là độc lập với nhau.

Giải:

Gọi X là biến ngẫu nhiên tuổi thọ của một van điện.

Xác suất để 1 van điện bất kì bị hỏng trong 150 giờ hoạt động đầu tiên là:
*+# *+#
100 1
𝑃(𝑋 ≤ 150) = = 𝑓(𝑥)𝑑𝑥 = = )
𝑑𝑥 =
𝑥 3
&, *##

Gọi A là biến cố “van điện hỏng trong 150 giờ hoạt động đầu tiên”

1 2
𝑃(𝐴) = ; 𝑃(𝐴̅) =
3 3

6
Coi việc van điện hoạt động là 1 phép thử. Theo đề bài, 5 van điện hoạt động là dãy 5
phép thử Bernoulli với xác suất để 1 van điện bị hỏng trong 150 giờ hoạt động đầu tiên.
Xác suất để 2 trong 5 van điện phải thay thế trong 150 giờ đầu tiên là:

1 ) 2
𝑃+ (2) = 𝐶+) . B C . = 0,3292.
3 3

Ví dụ 2: Một tín hiệu được phát đi 3 lần độc lập với nhau. Xác suất thu được 1 lần là
0,4

a. Tìm xác suất để nguồn thu nhận được tín đúng 2 lần.

b. Tìm xác suất để nguồn thu nhận được tín hiệu đó.

c. Để xác suất thu được thông tin ≥ 0,9 thì phải phát tín hiệu đi ít nhất bao nhiêu lần?

Giải:

Coi tín hiệu phát đi là 1 phép thử. Theo đề bài tín hiệu được phát đi 3 lần là dãy 3 phép
thử Bernoulli với xác suất để nhân được tín hiệu 1 lần là 0.4.

a. Xác suất để nguồn thu nhận tín hiệu đúng 2 lần là:

𝑃- (2) = 𝐶-) . 0,4) . 0,6 = 0,288.

b. Xác suất để nguồn thu nhận được tín hiệu là:

𝑃 = 1 − 0,6- = 0.784.

c. Xác suất để nguồn thu nhận được thông tin khi phát n lần là:

𝑃 = 1 − 0,6% .
./(#.*) &*
Ta có: 1 − 0,6% ≥ 0,9 ⇔ 0,1 ≥ 0,6% ⇔ 𝑛 ≥ .3/(#.4) = &#.55" = 4,504.

Vậy để xác suất thu được tin ≥0,9 thì phải phát tín hiệu ít nhất 5 lần.

7
B.1.2 Xác suất có điều kiện – Định lý nhân xác suất

i Xác suất có điều kiện:

a) Định nghĩa:

Xác suất có điếu kiện : Xác suất có điều kiện của biến cố A biết biến cố B đã xảy ra, kí
hiệu : P(A/B) là xác suất của biến cố A nhưng được tính trong trường hợp biến cố B đã
xảy ra rồi.

b) Công thức:

𝑃 (𝐴𝐵 )
𝑃(𝐴/𝐵) = (𝑃(𝐵 ) > 0).
𝑃(𝐵)

Ví dụ 1: (Bài toán thực tế)

Sau đây là số liệu về báo “Lao động” được bán ra ở 5 quận của thành phố HCM:

Ngày khảo Các quận nội thành


sát
Quận 1 Quận 2 Quận 3 Quận 4 Quận 5

Thứ 2 254 236 267 223 245

Thứ 3 245 212 256 213 234

Thứ 4 236 223 245 230 232

Thứ 5 235 197 243 213 224

Thứ 6 250 210 232 215 233

Thứ 7 247 196 223 207 242

Một vị khách mua ngẫu nhiên một tờ báo lao động

a. Giả sử tờ báo được mua vào thứ 3. Tính xác suất để người đó ở quận 2.
b. Giả sử tờ báo được mua vào thứ 7. Tính xác suất người đó ở quận 5.

8
Giải:

a. Gọi A là biến cố tờ báo được mua vào thứ 3

B là biến cố người mua tờ báo ở quận 2


1160
𝑃(𝐴) =
6918

(Hướng dẫn thực hiện tính bằng EXCEL)

B-1: Tính tổng số báo bán vào các ngày ở 5 quận (n)

B-2: Tính số báo bán vào thứ 3

Xác suất để người mua tờ báo vào thứ 3 đó ở quận 2 là:

𝑃(𝐴𝐵) 212/6918
𝑃(𝐵/𝐴) = = ≈ 0,1828.
𝑃(𝐴) 1160/6918

9
b. Gọi C là biến cố tờ báo được mua vào thứ 7

D là biến cố người mua tờ báo ở quận 5

1115
𝑃 (𝐶 ) =
6918

(Hướng dẫn thực hiện tính bằng EXCEL)

Xác suất để người mua tờ báo vào thứ 7 đó ở quận 5 là

𝑃(𝐶𝐷) 242/6918
𝑃(𝐷/𝐶) = = ≈ 0,217.
𝑃(𝐶) 1115/6918

Ví dụ 2:

Một tin tức điện báo tạo thành từ các tín hiệu (.) và vạch (-). Qua thống kê cho biết là
do tạp âm nên khi truyền tin, bình quân 2/5 tín hiệu chấm và 1/3 tín hiệu vạch bị méo.
Biết rằng tỉ số các tín hiệu chấm và vạch trong truyền tin đi là 5:3. Tính xác suất sao cho
nhận đúng tín hiệu đi nếu:

a. Nhận được chấm (.) ;

b. Nhận được vạch (-) .

Giải:

Giả sử người ta phát đi 1 tín hiệu.

Gọi C1 là biến cố tín hiệu truyền đi là tín hiệu chấm (.)

V1 là biến cố tín hiệu truyền đi là tín hiệu vạch (-).


10
+ -
𝑃(𝐶* ) = " và 𝑃(𝑉* ) = ".

Gọi C2 là biến cố nhận được tín hiệu chấm

V2 là biến cố nhận được tín hiệu vạch.


)
Theo giả thiết: + tín hiệu chấm khi được truyền đi sẽ bị méo, tức là bên nhận tin sẽ nhận
*
nhầm thành tín hiệu vạch; tương tự thì -
số tín hiệu vạch sau khi truyền đi sẽ bị nhận

nhầm thành tín hiệu chấm. {C1, V1} là nhóm biến cố đầy đủ. Các xác suất cần tìm:
#%
6(7! 7" ) 6(7! ).6(7" /7! ) . -
a. 𝑃(𝐶* /𝐶)) = 6(7" )
= 6(7 = $#
#" %" = ! = 75%.
! ).6(7" /7! )96(: ).6(: /: )
! " ! . 9 .
$# $%

& %"
6(:! :" ) 6(:! ).6;&" < . *
b. 𝑃(𝑉* /𝑉)) = = '
!
& = # "$ %% " = ) = 50%.
6(:" ) 6(7! ).6; " <96(:! ).6; " < . 9 .
$# $%
'! &!

Như vậy nếu nhận được tín hiệu chấm thì khả năng nhận đúng là 75% ; nhưng nếu nhận
được tín hiệu vạch thì khả năng nhận đúng chỉ là 50%.

ii Công thức nhân xác suất:

Cho A, B là hai biến cố bất kì. Khi đó:

𝑃(𝐴. 𝐵) = 𝑃(𝐴/𝐵). 𝑃(𝐵) = 𝑃(𝐵/𝐴). 𝑃(𝐴);

𝐵 𝐶
𝑃(𝐴𝐵𝐶 ) = 𝑃(𝐴). 𝑃 B C . 𝑃 B C.
𝐴 𝐴𝐵

a) Hệ quả:

Với A1, A2, A3,…An là các biến cố bất kì thì :

P(A1.A2…An)= P(A1).P(A2/A1).P(A3/A1A2)…P(An/A1.A2….An-1).

b) Hai biến cố độc lập

Biến cố độc lập : A, B là các biến cố độc lập nếu

P(A/B) = P(A) hay P(B/A)=P(B),

Nghĩa là sự xuất hiện của biến cố B không ảnh hưởng đến xác suất của biến cố A, thì ta
nói A độc lập với B.

11
c) Nhận xét
• Nếu A và B độc lập với nhau thì A và 𝐵; 𝐴 và 𝐵; 𝐴 và B cũng độc lập với nhau.
• A, B độc lập ó P (AB) = P(A) P(B) .
• Nhóm các biến cố A1.A2…An được gọi là độc lập từng đôi nếu 2 biến cố bất kì
trong nhóm độc lập với nhau.
• Nhóm các biến cố A1.A2…An được gọi là độc lập toàn phần với nhau nếu mỗi
biến cố độc lập với các biến cố còn lại cũng như với tích của một số bất kỳ các biến cố
còn lại
• Nếu A1.A2…An độc lập toàn phần với nhau thì

P(A1.A2…An) = P(A1)P(A2)….P(An).

Ví dụ 1: Một thủ kho có chùm chìa khoá gồm 9 chiếc trong đó chỉ 1 chiếc mở được của
kho. Thủ kho thử từng chìa khoá một, chiếc nào được thử rồi thì không thử lại. Tính xác
suất mở được của ở lần thứ tư.

Giải:

Gọi Ai là biến cố: “lần thứ i không mở được cửa kho” (i=1,2,3)

Gọi B là biến cố: lần thứ tư mở được cửa kho”

Theo đề bài, thủ kho ngẫu nhiên thử từng chìa một, chiếc nào đã thử thì không thử lại.
Do đó A1, A2, A3, B là các biến cố phụ thuộc
" 5 4 *
P(A1)== ; P(A2/A1)="; P(A3/A1A2)= 5; P(B/A1A2A3)=4

Xác suất để mở được của ở lần thứ tư là:


" 5 4 * *
P(A1A2A3B) = P(A1). P(A2/A1). P(A3/A1A2). P(B/A1A2A3)= =. ". 5. 4= =.

12
Ví dụ 2: Một lô hàng có 9 sản phẩm. Mỗi lần kiểm tra chất lượng lấy ngẫu nhiên 3 sản
phẩm. Sau khi kiểm tra xong lại trả vào lô

Giải:

Gọi Ai là biến cố lần thứ i lấy ra 3 sản phẩm mới để kiểm tra (i=1,2,3)

Gọi A là biến cố sau 3 lần kiểm tra tất cả các sản phẩm đều được kiểm tra.

Vì các biến cố phụ thuộc nên:

7 % 7 % 7%% +
P(A)= P(A1).P(A2/A1).P(A3/A1A2)= (% . )% . =
7( 7( 7(% *54!

B.2 CHƯƠNG III: Một số quy luật phân phối xác suất thông dụng

B.2.1 Phân phối xác suất của biến ngẫu nhiên rời rạc:

i Phân phối nhị thức B(n, p)

a) Bài toán

Gọi X là số lần xuất hiện biến cố A. Xét trong một dãy n phép thử Bernoulli, xác suất
xuất hiện biến cố A là P(A) = p. Ta tìm được xác suất xuất hiện biến cố A k lần là:

𝑷(𝑿 = 𝒌) = 𝑷𝒏 (𝒌) = 𝒑𝒌 (𝟏 − 𝒑)𝒏&𝒌

trong đó k ∈ ℕ , n ∈ ℕ∗ , 0 < p < 1

b) Định nghĩa
Phân phối nhị thức chính là một dạng phân phối xác suất dựa trên bài toán trên. Trong
đó, X được nhận định là một biến ngẫu nhiên rời rạc có phân phối nhị thức với hai tham
số n, p, nếu tập giá trị của nó là X(Ω) = { 0,1,2,…,n}. X có kí hiệu là X ~ B(n, p).

c) Các số tham số đặc trưng

Khi X ~ B(n, p):

• Kỳ vọng: E(X) = np
• Phương sai: V(X) = np(1 – p)
• Mode: p(n + 1) – 1 ≤ ModX ≤ p(n + 1)

13
d) Ví dụ

Ví dụ 1: Tại Canada, mỗi hai giây có một người cần truyền máu. Một trong những công
việc của Hội Chữ Thập Đỏ tại Canada là cung cấp nguồn máu đến những nơi cần thiết.
Những người có nhóm máu O – được gọi là “nhóm máu chuyên cho” bởi vì nhóm máu
có thể được truyền cho bất kỳ người nào. Thế nhưng, tỉ lệ một người dân tại Canada có
nhóm O – là 5%. Điều này là một khó khăn to lớn trong việc quản lý. Do vậy, việc tính
xác suất chiếm một phần quan trọng việc vạch ra kế hoạch phân phối nguồn máu cho
các bệnh viện của Hội Chữ Thập Đỏ.

Nhằm hiểu rõ việc này, bạn hãy tính trong 20 người hiến máu tiếp theo, ta có thể kỳ
vọng bao nhiêu người thuộc nhóm máu O-? Độ lệch chuẩn của số người có nhóm máu
O-? Và số người có nhóm máu O- tin chắc nhất sẽ xuất hiện là?

Giải:

Coi việc kiểm tra nhóm máu của người hiến máu là một phép thử

Gọi X là số người có nhóm máu O – : X ~ B(20, 0.05)

Trong 20 người hiến máu, trung bình số người có nhóm máu O-: E(X) = 20 × 0,05 = 1
(người)

Độ lệch chuẩn của số người có nhóm máu O –:

σ(X) = X𝑉(𝑋) = X20 × 0.06 × (1 − 0,06) = 1,0621

0,06 × (20 + 1) – 1 ≤ ModX ≤ 0,06 × (20 + 1)

⬄ 0,26 ≤ ModX ≤ 1,26

Số người có nhóm máu O – tin chắc nhất sẽ xuất hiện là 1 người.

14
Ví dụ 2: Vào năm 2014, tại Mỹ, diễn ra cuộc bầu cử Tổng Thống lần thứ 57. Trong các
ứng cử viên, tỷ lệ cử tri ủng hộ ông Obama đạt ngưỡng 47%. Trường Đại học George
Washington đã hỏi ý kiến 10 cử tri được chọn ngẫu nhiên.

a. Tìm xác suất để trong 10 cử tri đó, không có ai ủng hộ ông Obama

b. Tìm xác suất để trong 10 cử tri đó, có 2 hoặc 3 người ủng hộ ông Obama

Giải:

Coi việc hỏi ý kiến một người cử tri là một phép thử.

Gọi X là số người ủng hộ cho ông Obama trong số 10 cử tri đó: X ~ B(10, 0,47)

a. Xác suất không có ai ủng hộ ông Obama:


#
P(X = 0) = 𝐶*# (0,47)0 (1 – 0,47)10-0 = 1.75 × 10-3
)
b. P(X = 2) = 𝐶*# (0,47)2 (1 – 0,47)10-2 = 0,0619
-
P(X = 3) = 𝐶*# (0,47)3 (1 – 0,47)10-3 = 0,1464.

Xác suất có 2 hoặc 3 người ủng hộ ông Obama:

P(X = 2) + P(X = 3) = 0,0619 + 0,1464 = 0,2083.

ii Phân phối Poisson P(𝝀)

a) Định nghĩa

Phân phối Poisson cho biết trung bình số lần xuất hiện biến cố quan tâm trong một
khoảng xác định (khoảng thời gian hoặc một khoảng đơn vị tính nào đó). Giá trị trung
bình này được gọi là lambda, kí hiệu là 𝜆.

Các ví dụ sau được mô hình theo phân phối Poisson:

+ Số lượng virut có thể lây nhiễm lên một tế bào trong cấu trúc tế bào.

+ Số lần đột biến xảy ra trên một đoạn DNA sau khi chịu một lượng bức xạ.

Biến ngẫu nhiên rời rạc X được gọi là có phân phối Poisson với tham số 𝜆 > 0, ký hiệu
là X 𝜖 P(𝜆) hay X∼P(𝜆).

𝒆𝒌 &𝝀
𝑷(𝑿 = 𝒌) = . 𝒆 , 𝒌 = 𝟎; 𝟏; 𝟐; . ..
𝒌!
15
b) Tính chất

Trong phân phối Poisson thì kỳ vọng bằng phương sai bằng giá trị trung bình:
E(X)=V(X)=𝜆

+ 𝜆 − 1 ≤ ModX ≤ 𝜆

+ Nếu 𝑋* ; 𝑋) là hai biến ngẫu nhiên độc lập có phân phối Poisson với tham số
lần lượt là 𝜆* ; 𝜆) thì 𝑋* ; 𝑋) cũng có phân phối Poisson với tham số 𝜆* + 𝜆) .

c) Ví dụ:

Ví dụ 1: Nếu mất điện xảy ra theo phân phối Poisson với trung bình là 3 lần mất điện
sau mỗi hai mươi tuần, hãy tính xác suất không có nhiều hơn một lần mất điện trong
một tuần.

Giải:

Gọi X là số lần mất điện trong một tuần.


-
Số lần mất điện trung bình mỗi tuần: 𝜆 = )# = 0,15

X∼P(𝜆) với 𝜆 = 0,15, t= 1 tuần

Không có nhiều hơn một lần mất điện trong một tuần nghĩa là có 1 lần mất điện trong
một tuần hoặc không có lần mất điện nào.
#,*+* #,*+!
P(X≤1)= P(X=0) + P(X=1)= × 𝑒 &#.*+ + × 𝑒 &#.*+ ≈ 0,9898.
#! *!

Ví dụ 2: Một nhân viên bán bảo hiểm nhân thọ bán trung bình 3 hợp đồng bảo hiểm
nhân thọ mỗi tuần. Sử dụng phân phối Poisson để tính xác suất trong một tuần anh ta sẽ
bán

a. Một số hợp đồng bảo hiểm

b. 2 hợp đồng trở lên nhưng ít hơn 5 hợp đồng.

c. Giả sử rằng có 5 ngày làm việc mỗi tuần, xác suất trong một ngày nhất định anh ta sẽ
bán một hợp đồng là bao nhiêu?

16
Giải:

a. Gọi X là số hợp đồng bảo hiểm anh ta bán được trong một tuần.

X∼P(𝜆) với 𝜆 = 3, t= 1 tuần

Một số hợp đồng bảo hiểm nghĩa là bán được 1 hoặc nhiều hợp đồng. Vậy xác suất trong
một tuần anh ta bán được một số hợp đồng bảo hiểm là:
-*
𝑃(𝑋 > 0) = 1 − 𝑃(𝑋 = 0) = 1 − × 𝑒 &- ≈ 0,95021.
#!

b. Xác suất trong một tuần anh ta bán được 2 hợp đồng trở lên nhưng ít hơn 5 hợp đồng
là:

𝑃(2 ≤ 𝑋 < 5) = 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) + 𝑃(𝑋 = 4)

-" -% -+
= × 𝑒 &- + × 𝑒 &- + × 𝑒 &- ≈ 0,61611.
)! -! !!

c. Gọi Y là số hợp đồng bảo hiểm anh ta bán được trong một ngày.
-
Số chính sách trung bình được bán mỗi ngày: 𝜆 = + = 0,6

Y ∼ P(𝜆) với 𝜆 = 0,6, t = 1 ngày

#,4!
P(Y=1) = *!
× 𝑒 &#.4 ≈ 0,3293.

B.2.2 Phân phối xác suất của biến ngẫu nhiên liên tục

i Phân phối chuẩn N(μ, ර²)

a) Định nghĩa

Phân phối chuẩn được dùng để phản ánh giá trị và mức độ phân bố của các dữ liệu đang
nghiên cứu.

Phân phối chuẩn được đặc trưng bởi hai tham số là giá trị kỳ vọng µ (Muy) còn được
hiểu là giá trị trung bình, và độ lệch tiêu chuẩn σ (Sigma). Trong khi giá trị µ là mức
trung bình của tất cả các dữ liệu đang nghiên cứu thì σ phản ánh mức độ đồng đều của
các dữ liệu này.

17
Biến ngẫu nhiên liên tục X được gọi là có phân phối chuẩn với hai tham số 𝜇 và 𝜎 )
(𝜎 > 0), ký hiệu là X𝜖 𝑁(𝜇; 𝜎 ) ) hay X ∼ 𝑁(𝜇; 𝜎 ) )nếu hàm mật độ xác suất của X có
dạng:

𝟏 (𝒙&𝝁)𝟐
&
𝒇(𝒙) = . 𝒆 𝟐𝝈𝟐 , 𝒙 𝝐 ℝ.
𝝈√𝟐𝝅

b) Đồ thị hàm mật độ của phân phối chuẩn

Đường cong mật độ có dạng hình chuông (the bell curve), đối xứng qua đường x = μ và
*
nhận Ox làm tiệm cận ngang, các điểm uốn t𝜇 ± 𝜎; v, đỉnh của hàm mật độ đạt
F√)HI

tại:
𝟏
max f(x) = f(𝝁) = 𝝈√𝟐𝝅𝒆

c) Tính chất
• Kỳ vọng: E(X) = 𝜇.
• Phương sai: V(X)=𝜎 ) .
• Mode, Trung vị (Median): ModX = MedX = 𝜇.
• Nếu X∼ 𝑁(𝜇; 𝜎 ) ) thì aX+b∼ 𝑁(𝑎𝜇 + 𝑏, 𝑎) 𝜎 ) ) với a, b 𝜖 R, a≠0.

• Nếu 𝑋* , 𝑋) là hai biến ngẫu nhiên độc lập có phân phối chuẩn 𝑋* ~𝑁(𝜇* , 𝜎*) );
𝑋) ~𝑁(𝜇) , 𝜎)) ) thì
𝑋* + 𝑋) ~𝑁(𝜇* + 𝜇) ; 𝜎*) + 𝜎)) )

18
• Nếu 𝑋* , 𝑋) là hai biến ngẫu nhiên độc lập có phân phối chuẩn 𝑋* ~𝑁(𝜇* , 𝜎*) );
𝑋) ~𝑁(𝜇) , 𝜎)) ) thì

𝑎𝑋* + 𝑏𝑋) ~𝑁(𝑎𝜇* + 𝑏𝜇) ; 𝑎) 𝜎*) + 𝑏 ) 𝜎)) ) (𝑎, 𝑏 ∈ ℝ, 𝑎𝑏 ≠ 0)

ii Phân phối chuẩn tắc:

Phân phối chuẩn tắc là trường hợp đặc biệt của phân phối chuẩn với hai tham số µ = 0,

σ2 = 1: X ~ N(0, 1).

* -"
&"
Phân phối chuẩn tắc có hàm mật độ Gauss là: 𝑓(𝑧) = .𝑒 .
√)H

"
* M &.
Hàm Laplace: 𝜙(𝑧) = . ∫ 𝑒 " 𝑑𝑡.
√)H #

Khi sử dụng bảng hàm Laplace cẩn chú ý các tính chất của ɸ(x):

• 𝜙(−𝑥) = − 𝜙(𝑥)
• 𝑥 > 5: 𝜙(𝑥) = 0,5 ⟹ 𝜙(+∞) = 0,5; 𝜙(−∞) = −0,5

Chú ý:

Khi X ~ N(µ, 𝜎 ) ):
N&O P&O
• 𝑃(𝑎 < 𝑋 < 𝑏) = 𝜙 t F
v−𝜙t F
v
P&O P&O
• 𝑃(𝑎 < 𝑋) = 𝜙(+∞) − 𝜙 t v = 0,5 − 𝜙 t v
F F
P&O P&O
• 𝑃(𝑎 > 𝑋) = 𝜙 t v − 𝜙(−∞) = 0,5 + 𝜙 t v
F F

Ví dụ 1: Thời gian X (tính bằng phút) của một khách hàng chờ để lấy được đồ uống tại
một quầy hàng Phúc Long là biến ngẫu nhiên có phân phối chuẩn với trung bình 4.5 và
phương sai 1.21.

a. Tính tỷ lệ khách hàng phải chờ để được phục vụ từ 6 – 10 phút; quá 10 phút.

b. Thời gian phải chờ tối thiểu là bao nhiêu, khi tỷ lệ khách hàng phải chờ quá thời gian
đó không quá 10%.

19
Giải:

Theo đề bài, ta có: X ~ N(4,5, 1.21), σ = √1,21 = 1,1


*#&!,+ 4&!,+
a. 𝑃(6 ≤ 𝑋 ≤ 10) = 𝜙 t *,*
v−𝜙t *,*
v = 𝜙(5) − 𝜙(1,36) = 0,5 − 0,41309

= 0,08691.
*#&!,+
𝑃(𝑋 > 10) = 0,5 − 𝜙 t *,*
v = 0,5 − 0,5 = 0.

b. Gọi x là lượng thời gian chờ cần tìm.


Q&!,+
𝑃(𝑋 > 𝑥) = 0,5 − 𝜙 t v ≤ 0,1
*,*

Q&!,+
⟺ 𝜙 t v ≥ 0,4 = 𝜙(1,28)
*,*

⟺ 𝑥 ≥ 5,908.

Ví dụ 2: Lãi suất đầu tư cổ phiếu Vingroup là biến ngẫu nhiên có phân phối chuẩn. Theo
đánh giá của Báo Tài Chính, khả năng đầu tư cho lãi suất cao hơn 20% là 15,78%, còn
khả năng đầu tư cho lãi suất cao hơn 25% là 2,28%.

a. Tính khả năng đầu tư cho lãi suất cao hơn 15%

b. Tính khả năng đầu tư không bị lỗ

Giải:
#,)&O
𝑃(𝑋 > 0,2) = 0,5 − 𝜙 t v = 0,1587.
F

#,)&O
⇔ 𝜙 t F
v = 0,3413 = 𝜙(1,0)

⇔ 𝜎 + 𝜇 = 0,2 (1)
#,)+&O
𝑃(𝑋 > 0,25) = 0,5 − 𝜙 t F
v = 0,0228.

#,)+&O
⇔ 𝜙t v = 0,4772 = 𝜙 (2,0)
F

⇔ 2𝜎 + 𝜇 = 0,2 (2)

20
(1) và (2) ⟹ 𝑋~(0,15; 0,05) )
#,*+&#,*+
a. 𝑃(𝑋 > 0,15) = 0,5 − 𝜙 t v = 0,5.
#,#+

#&#,*+
b. 𝑃(𝑋 < 0) = 0,5 + 𝜙 t #,#+
v = 0,5 + 𝜙(3,0) = 0,5 − 0,49865 = 1,35. 10&- .

21
C BÀI TẬP

Ví dụ 1 (Chương I)

Lai hai giống hoa ly màu hồng và màu vàng thuần chủng, các cây con ở thế hệ F1 có
thể cho hoa màu trắng, vàng, hồng theo tỉ lệ 1:1:2. Lấy 5 hạt giống thế hệ F1 đem gieo
và được 5 cây hoa. Tính xác suất trong 5 cây hoa đó:

a. Có cây cho hoa màu hồng


b. Có cây cho hoa màu vàng, biết rằng có cây cho hoa màu hồng

Giải:

a. Gọi A là biến cố có hoa màu hồng với P(A) = 1 - P(𝐴̅)

TH1: 5 hoa trắng

TH2: 4 hoa trắng + 1 hoa vàng

TH3: 3 hoa trắng + 2 hoa vàng

TH4: 2 hoa trắng + 3 hoa vàng

TH4: 1 hoa trắng + 4 hoa vàng

TH5: 5 hoa vàng

* +* *! * * * * - * * ) * * ) - - * ! +
𝑃(𝐴̅) = t!v + t!v . t!v + t!v . t!v + t!v . t!v + t!v . t!v + t!v = +*).

- +#=
𝑃(𝐴) = 1 − 𝑃(𝐴̅) = 1 − +*) = +*).

b. Gọi B là biến cố có hoa màu vàng với P(B) = 1 - P(𝐵„)

TH1: 4 hoa trắng + 1 hoa hồng

TH2: 3 hoa trắng + 2 hoa hồng

TH3: 2 hoa trắng + 3 hoa hồng

TH4: 1 hoa trắng + 4 hoa hồng

TH5: 5 hoa hồng


! - ) ) - * ! +
1 1 1 1 1 1 1 1 1 31
𝑃(𝐵) = t4v . 2 + t4v . t2v + t4v . t2v + t4v . t2v + t4v = 1024.
22
31 993
è 𝑃(𝐵) = 1 − 𝑃(𝐵„) = 1 − 1024 = 1024.

Ví dụ 2 (Chương I)

Ra khỏi phòng khách, do sự cố cúp điện, N khách cùng xỏ ngẫu nhiên vào cùng một đôi
giày. Mỗi người chỉ có thể phân biệt chiếc giày trái và phải, còn không phân biệt được
giày của mình với giày của người khác. Tìm xác suất để:

a. Mỗi người khách xỏ đúng vào đôi giày của mình.


b. Mỗi người khách xỏ đúng hai chiếc giày của một đôi nào đó.

Giải:

a. Gọi 𝐴$ là biến cố người thứ k xỏ đúng N chiếc giày trái và N chiếc giày phải
(k=1,…,N)

Ta có: A = 𝐴* , 𝐴) , … , 𝐴R và P(A) = P(𝐴* , 𝐴) , … , 𝐴R ) =


𝑃(𝐴* )( 𝐴) |𝐴* )𝑃(𝐴- |𝐴* 𝐴))…P(𝐴R |𝐴* 𝐴) … 𝐴R )

Phòng khách có N người, vì thế có N chiếc giày trái và N chiếc giày phải

Xác suất để người thứ 1 xỏ đúng chiếc giày trái và chiếc giày phải của mình (trong N
* *
chiếc giày trái và N chiếc giày phải) là P(𝐴* ) = R . R.

Xác suất để người thứ 2 xỏ đúng chiếc giày trái và chiếc giày phải của mình (trong N-1
* *
chiếc giày trái và N-1 chiếc giày phải còn lại) là 𝑃(𝐴) |𝐴* ) = R&* . R&*

Xác suất để ngừoi thứ N-1 xỏ đúng chiếc giày trái và chiếc giày phải của mình (trong 2
* *
chiếc giày trái và 2 chiếc phải còn lại) là P(𝐴R&* |𝐴* 𝐴) … 𝐴R&) ) = ) . )

Cuối cùng P(𝐴R |𝐴* 𝐴) … 𝐴R&* ) = 1

Do đó xác suất để mỗi người xỏ đúng đôi giày của mình là


* * * * * * * * *
. R . R&* . R&* … ) . ) . * . * = (R!)"
R

23
b. Giả sử mỗi người đi ra khỏi phòng sẽ xỏ 1 chiếc giày trái bất kì

Gọi 𝐴$ là biến cố người thứ k xỏ đúng chiếc giày còn lại (k=1,…,N)

A là biến cố mỗi người khách xỏ đúng 1 đôi giày nào đó

Ta có: A = 𝐴* , 𝐴) , … , 𝐴R và P(A) = P(𝐴* )( 𝐴)|𝐴* )𝑃(𝐴- |𝐴* 𝐴) )…P(𝐴R |𝐴* 𝐴) … 𝐴R&* )

Xác suất để người thứ 1 xỏ chiếc giày phải cùng đôi với chiếc giày trái (trong N chiếc
*
giày phải) là P(𝐴* ) = R

Xác suất để người thứ 2 xỏ chiếc giày phải cùng đôi với chiếc giày trái (trong N-1 chiếc
*
giày phải còn lại) là 𝑃 ( 𝐴) |𝐴*) = R&*

Xác suất để người thứ N-1 xỏ chiếc giày phải cùng đôi với chiếc giày trái (trong 2 chiếc
*
giày phải còn lại) là P(𝐴R&* |𝐴* 𝐴) … 𝐴R&) ) = )

Cuối cùng P(𝐴R |𝐴* 𝐴) … 𝐴R&* ) = 1

Do đó xác suất để mỗi người có thể xỏ được vào đúng 2 chiếc giày cùng đôi là
* * * * * * *
. … ) . ) . * . * = R!.
R R&*

Ví dụ 3 (Chương I)

Một nhóm nghiên cứu đang nghiên cứu về nguy cơ một sự cố tại một nhà máy điện
nguyên tử ở Việt Nam sẽ gây ra sự rò rỉ phóng xạ. Nhóm nghiên cứu nhận thấy các loại
sự cố chỉ có thể là: hoả hoạn, sự gãy đổ của vật liệu hoặc sai lầm của con người, và 2
hay nhiều hơn 2 sự cố không bao giờ cùng xảy ra.

Nếu có hỏa hoạn thì sự rò rỉ phóng xạ xảy ra khoảng 20% số lần. Nếu có sự gãy đổ của
vật liệu thì sự rò rỉ phóng xạ xảy ra khoảng 50% số lần, và nếu có sự sai lầm của con
người thì sự rò rỉ sẽ xảy ra khoảng 10% số lần. Nhóm nghiên cứu cũng tìm được xác
suất để: Hoả hoạn và sự rò rỉ phóng xạ cùng xảy ra là 0,0010, gãy đổ vật liệu và sự rò rỉ

24
phóng xạ cùng xảy ra là 0,0015, sai lầm của con người và sự rò rỉ phóng xạ cùng xảy ra
là 0,0012. Tìm xác suất để

a. Có hoả hoạn; có gãy đổ vật liệu và có sai lầm của con người;
b. Có một sự rò rỉ phóng xạ;
c. Một sự rò rỉ phóng xạ được gây ra bởi sự sai lầm của con người

Giải:

Gọi A là biến cố xảy ra hoả hoạn

B là biến cố xảy ra gãy đổ

C là biến cố xảy ra sai lầm của con người

D là biến cố sự rò rỉ phóng xạ

Theo đề bài:

P(𝐷|𝐴) = 0,2

P(𝐷|𝐵 ) = 0,5

P(𝐷|𝐶 ) = 0,1

P(DA) = 0,001

P(DB) = 0,0015

P(DC) = 0,0012

a. Xác suất có hoả hoạn


6(ST) #,##* *
P(A) = 6(T/S) = #,)
= )##.

Xác suất có xảy ra gãy đổ


6(UT) #,##*+ -
P(B) = V(W/X) = #,+
= *###.

Xác suất có xảy ra sai lầm của con người


6(T7) #,##*) -
P(C) = V(W/Y) = = )+#.
#,*

25
b. Xác suất có xảy ra sự rò rỉ phóng xạ
-5
P(D) = P(AD) + P(BD) + P(CD) = *####.

c. Xác suất để có sự rò rỉ phóng xạ gây ra do sai lầm con người


6(7T) *)
P(𝐶|𝐷) = V(T)
= -5.

Ví dụ 4 (Chương I)

Giả sử xác suất sinh con trai và con gái là như nhau trong xã hội Việt Nam ngày nay.
Tính xác suất để gia đình đó có:

a. Hai con gái


b. Ít nhất hai con gái
c. Hai con gái biết đứa con đầu lòng là con gái

Giải

a. Gọi A là biến cố gia đình sinh 2 con gái

TH1: Nam – Nữ - Nữ = 0,5 . 0,5 . 0,5

TH2: Nữ - Nam – Nữ = 0,5 . 0,5 . 0,5

TH3: Nữ - Nữ - Nam = 0,5 . 0,5 . 0,5


* * * -
P(A) = " + " + " = "

b. Gọi B là biến cố gia đình đó sinh ít nhất 2 con GÁI

TH1: Nữ - Nữ - Nam = 0,5 . 0,5 . 0,5

TH2: Nữ - Nam – Nữ = 0,5 . 0,5 . 0,5

TH3: Nữ - Nữ - Nữ = 0,5 . 0,5 . 0,5


* * * -
P(B) = " + " + " = ".

26
c. Gọi C là biến cố gia đình đó sinh 2 con gái biết đứa đầu là con gái

TH1: Nữ - Nam – Nữ

TH2: Nữ - Nữ - Nữ

P(C) = 1 . 0,5 . 0,5 + 1 . 0,5 . 0,5 = 0,5

Ví dụ 5 (Chương I)

Một kĩ sư nông nghiệp có một hộp đựng hạt giống (trong đó có 6 hạt loại I, 6 hạt loại
II). Biết rằng hôm trước anh ta đã gieo 3 hạt và hôm nay lấy tiếp 3 hạt để gieo. Hãy tính
xác suất để trong 3 hạt giống hôm sau có 2 hạt loại I và 1 hạt loại I

Giải:

Cách 1: Do hôm sau phải lấy 2 loại hạt I và 1 loại hạt II

• TH1: Hôm thứ nhất có 3 hạt loại I

7)% 7%" .7)! -


% . = *+!
7!" 7(%

• TH2: Hôm thứ nhất lấy 1 hạt loại I, 1 hạt loại II

7)! .7)" 7#" .7+! *+


%
7!"
. 7(%
= 55

• TH3: Hôm thứ nhất lấy 2 hạt loại I, 1 hạt loại II

7)! .7)" 7+" .7#! !+


% . = -#"
7!" 7(%

• TH4: Hôm thứ nhất lấy 3 hoạt loại II

7)% 7)" .7%! *+


% . = -#"
7!" 7(%

- *+ !+ *+ =
Vậy xác suất cần tìm là *+! + 55 + -#" + -#" = ))

Cách 2: Gọi A là biến cố lấy được 2 hạt loại I và 1 hạt loại II vào hôm sau

𝐴#, 𝐴* , 𝐴) , 𝐴- lần lượt là biến cố lấy được 0, 1, 2, 3 hạt loại I vào ngày thứ nhất

𝐴# , 𝐴* , 𝐴) , 𝐴- là một nhóm đầy đủ các biến cố


27
P(A) = P(𝐴# ). P(𝐴|𝐴# ) + P(𝐴* ).P(𝐴|𝐴*) + P(𝐴) ).P(𝐴|𝐴) ) + P(𝐴- ).P(𝐴|𝐴- )

7% 7)" .7%! 7)! .7)" 7#" .7+! 7)! .7)" 7+" .7#! 7% 7%" .7)! =
= 7 %) . + . + . + 7 %) . = )).
!" 7(% %
7!" 7(% %
7!" 7(% !" 7(%

Ví dụ 6 (Chương I)

Ở một xí nghiệp may mặc , sau khi may quần áo , người ta đóng thành từng kiện, mỗi
kiện 3 bộ (3 quần, 3 áo). Khi đóng kiện thường có hiện tượng xếp nhầm số. Xác suất
xếp quần đúng số là 0,8. Xác suất xếp áo đúng số là 0,7. Mỗi kiện gọi là được chấp nhận
nếu số quần xếp đúng số và số áo xếp đúng là bằng nhau.

a. Kiểm tra 100 kiện. Tìm xác suất có 40 kiện được chấp nhận.
b. Phải kiểm tra ít nhất bao nhiêu kiện để xác suất có ít nhất một kiện được chấp
nhận không dưới 90%?

Giải

a. Gọi 𝑋* là số quần xếp đúng số trên 3 quần, 𝑋* ∈ B(3; 0,8)

𝑋) là số áo xếp đúng số trên 3 áo, 𝑋) ∈ B(3; 0,7)

Xác suất một kiện được chấp nhận

𝑃(𝐴) = 𝑃(𝑋* = 0; 𝑋) = 0) + 𝑃(𝑋* = 1; 𝑋) = 1 + 𝑋* = 2; 𝑋) = 2) + 𝑃(𝑋* =


3; 𝑋) = 3)

= 𝐶-# (0,8)# . (0,2)- . 𝐶-# (0,7)# . (0,3)- + 𝐶-* (0,8)* . (0,2)) . 𝐶-* (0,7)* . (0,3)) +
𝐶-) (0,8)) . (0,2)* . 𝐶-) (0,7)) . (0,3)* + 𝐶-- (0,8)- . (0,2)# . 𝐶-- (0,7)- . (0,3)# = 0,36332.

Gọi X là số kiện được chấp nhận trong 100 kiện

X ∈ B(100; 0,36332) ≈ N(36,332; 23,132)


* !#&-4,--) * #,)"="
𝑃(𝑋 = 40) = 𝜑( ) = !,"* 𝜑(0,76) = = 0,062.
√ %Z[ !,"* !,"*

b. Gọi n là số kiện phải kiểm tra

M là biến cố ít nhất một kiện được chấp nhận

P(M) = I - ∏%\]* 𝑃( 𝐴̅) = 1 – (0,63668)% ≥ 0,9

28
⇔ (0,63668)% ≤ 0,1

⇔ 𝑛 ≥ log #,4-44" 0,1 = 5,1 ⟹ 𝑛 ≥ 6

Vậy phải kiểm tra ít nhất 6 kiện.

Ví dụ 7 (Chương II)

Một lô sản phẩm gồm 100 sản phẩm, trong đó có 90 sản phẩm tốt và 10 phế phẩm. Chọn
ngẫu nhiên 3 sản phẩm từ lô hàng (chọn 1 lần). Gọi X là số sản phẩm tốt trong 3 sản
phẩm lấy ra.

a. Tìm phân phối xác suất của X.


b. Tính kì vọng của X.
c. Tính xác suất 𝑃(𝑋 = 1).

Giải:

a. Có X là số sản phẩm tốt trong 3 sản phẩm đc lấy ra (X=1; 2; 3)


-
Số trường hợp đồng khả năng là Ω = 𝐶*##

- TH1: Trong 3 sản phẩm lấy ra không có sản phẩm tốt:

7% )
𝑃(𝑋 = 0) 7 %!* = )4=+.
!**

- TH2: Trong 3 sản phẩm lấy ra có 1 sản phẩm tốt và 2 phế phẩm:
" 7!
7!* )5
(*
𝑃(𝑋 = 1) = % = *#5".
7!**

- TH3: Trong 3 sản phẩm lấy ra có 2 sản phẩm tốt và 1 phế phầm:
! 7"
7!* )45
(*
𝑃(𝑋 = 2) = % = *#5".
7!**

7% *5"
- TH4: Trong 3 sản phẩm lấy ra có 3 sản phẩm tốt: 𝑃(𝑋 = 3) 7 %(* = )!+
!**

29
Phân phối xác suất của X:

X 0 1 2 3

2 27 267 178
P(X)
2695 1078 1078 245

b. Vì X là biến ngẫu nhiên rời rạc nên:


) )5 )45 *5" )5
𝐸(𝑋) = 0. )4=+ + 1. *#5" + 2. *#5" + 3. )!+ = *#.

)5 )45 *5" )4=-


c. 𝑃(𝑋 ≥ 1) = 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) = *#5" + *#5" + )!+ = )4=+.

Ví dụ 8 (Chương II)

Thời gian tính bằng đơn vị giờ mà một máy tính hoạt động trước khi xảy ra lỗi được coi
như một biến ngẫu nhiên liên tục và được xác định với hàm mật độ xác suất sau:
&Q⁄*##
𝑓(𝑥) = Ž𝑘𝑒 𝑛ế𝑢 𝑥 ≥ 0
0 𝑛ế𝑢 𝑥 < 0

Hãy tính xác suất của:

a. Một máy tính hoạt động từ 50 giờ tới 150 giờ trước khi xảy ra lỗi.

b. Một máy tính hoạt động dưới 100 giờ trước khi xảy ra lỗi.

Giải

Gọi X là thời gian một máy tính hoạt động trước khi hỏng (đơn vị: giờ).

X có hàm mật độ xác suất nên X là biến ngẫu nhiên liên tục.
9,
X thoả mãn ∫&, 𝑓(𝑥)𝑑𝑥 = 1

# 9,
⇔ ∫&, 𝑓 (𝑥 )𝑑𝑥 + ∫# 𝑓 (𝑥 )𝑑𝑥 = 1

9,
⇔ 0 + ∫# 𝑘. 𝑒 &Q⁄*## 𝑑𝑥 = 1

+∞
⇔ 𝑘. (−100). 𝑒 &Q⁄*## | =1
0

30
*
⇔ 𝑘. (−100). 𝑒 &,⁄*## − 𝑘. (−100). 𝑒 &#⁄*## = 1 ⇔ 0 + 100𝑘 = 1 ⟹ 𝑘 = *##.

a. Xác suất để 1 máy tính hoạt động trong khoảng (50; 150) giờ là:

*+# * &*## 150


𝑃(50 < 𝑋 < 150) = ∫+# . 𝑒 &Q⁄*## 𝑑𝑥 = ‘ . 𝑒 &_/*## ’“ = −𝑒 &*+#/*## +
*## *## 50
𝑒 &+#/*## = −𝑒 &-/) + 𝑒 &*/) ≈ 0,384.

Vậy tỉ lệ thời gian máy tính làm việc 50-150 giờ trước khi lỗi là 0,384.

b. Xác suất để 1 máy tính hoạt động dưới 100 giờ trước khi xảy ra lỗi:

*## * * * 100 100


𝑃(𝑋 < 100) = ∫# . 𝑒 &Q⁄*## 𝑑𝑥 = ” /! . *## . 𝑒 &Q⁄*## •– = −𝑒 &Q/*## —
*##
!** 0 0

= −𝑒 &* + 1 ≈ 0,633

Vậy xác suất để máy tính làm việc dưới 100 giờ trước khi hỏng là 0,633.

Ví dụ 9 (Chương II)

Cho X, Y là lợi nhuận thu được khi đầu tư 100 triệu đồng cho từng dự án có các bảng
phân phối xác suất:

X -3 -1 0 1 ? 3

P 0,1 0,1 0,2 0,2 ? 0,1

Y -2 -1 0 1 3

P 0,1 0,2 0,2 0,2 0,3

a. Cho E(X)=0,7, điền giá trị còn thiếu trong bảng phân phối xác suất của X.

b. Tìm khả năng đầu tư không bị lỗ của mỗi dự án.

c. Tìm mức lợi nhuận có thể hi vọng khi đầu tư vào mỗi dự án.

d. Đầu tư vào dự án nào ít rủi ro hơn.


31
Giải:

a. Ta có P cần tìm = 1 − (0.1 + 0.1 + 0.2 + 0.2 + 0.1) = 0.3

Vì X là biến ngẫu nhiên rời rạc nên:

𝐸(𝑋) = ∑%\]* 𝑥\ . 𝑝\ = (−3) . 0.1 + (−1) . 0.1 + 0 . 0.2 + 1 . 0.2 + 𝑋 . 0.3 +


3 . 0.1 = 0.7 → 𝑋 = 2.

b. Để đầu tư không bị lỗ thì lợi nhuận phải lớn hơn 0 → 𝑋 > 0 và 𝑌 > 0

• Khả năng để dự án 1 không bị lỗ:

𝑃(𝑋 ≥ 0) = 𝑃 (𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) = 0,8.

• Khả năng để dự án 2 không bị lỗ:

𝑃(𝑌 ≥ 0) = 𝑃 (𝑋 = 0) + 𝑃 (𝑋 = 1) + 𝑃(𝑋 = 3) = 0,7.

c. Ta có:

• Mức lợi nhuận có thể hi vọng của dự án 1 là 𝐸(𝑋) = 0,7


• Mức lợi nhuận có thể hi vọng của dự án 2 là 𝐸(𝑌) = 0,7

d. Ta có:

• Độ rủi ro của dự án 1 là:

𝑉(𝑋) = 𝐸(𝑋 ) ) − [𝐸(𝑋)]) = [(−3)) . 0,1 + (−1)) . 0,1 + 0) . 0,2 + 1) . 0,2 +


2) . 0,3 + 3) . 0,1] − 0,7) = 2,81.

• Độ rủi ro của dự án 2 là:

𝑉(𝑌) = 𝐸(𝑌 ) ) − [𝐸(𝑌)]) = [(−2)) . 0,1 + (−1)) . 0,2 + 0) . 0,2 + 1) . 0,2 +


3) . 0,3] − 0,7) = 3,01.

Mà 2,81 < 3,01 nên độ rủi ro của dự án 1 thấp hơn độ rủi ro của dự án 2.

Ví dụ 10 (Chương II)

Một người đi thi lấy bằng lái xe, nếu không đạt anh ta lại đăng ký thi lại cho đến khi đạt
mới thôi. Gọi X là số lần anh ta dự thi.

32
*
a. Lập phân bố xác suất của X, biết xác suất thi đỗ của anh ta là -.

*
b. Dự đoán xem trong 252 người (mỗi người đều có xác suất thi đỗ là -
) thì có bao

nhiêu người thi đạt ngay lần đầu, bao nhiêu người thi đạt lần thứ 2 và bao nhiêu người
phải thi ít nhất 4 lần?

Giải:

a. Gọi X là số lần anh ta phải thi cho tới khi có được bằng, nhận các giá trị {1; 2; ... n}.
*
Xác suất anh ta thi đậu sau 1 lần 𝑃(𝑋 = 1) =
-

* *
Xác suất anh ta thi đậu sau 2 lần 𝑃(𝑋 = 2) = t1 − -v . -

* * * * ) *
Xác suất anh ta thi đậu sau 3 lần 𝑃(𝑋 = 3) = t1 − -v . t1 − -v . - = t1 − -v . -

* %&* *
=> Xác suất anh ta thi đậu sau n lần 𝑃(𝑋 = 3) = t1 − -v .-

Bảng phân phối xác suất của X:

X 1 2 3 ... n

1 2 4 1 %&* 1
P(X) ... B1 − C .
3 9 27 3 3

b. Ta có:
*
• Số người với khả năng thi đạt ngay lần đầu là - . 252 = 84 (người).
)
• Số người với khả năng thi đạt sau lần 2 là = . 252 = 56 (người).

• Số người với khẳng năng thi đậu sau ít nhất 4 lần:

[1 − 𝑃(𝑋 ≤ 3)].252 = [1 − 𝑃(𝑋 = 1) − 𝑃(𝑋 = 2) − 𝑃(𝑋 = 3)] . 252


* ) !
= ‘1 − - − = − )5’ . 252 = 74 (người).

33
Ví dụ 11 (Chương II)

Tỉ lệ một loại bệnh bẩm sinh trong dân số là p = 1%. Bệnh này cần sự chăm sóc đặc biệt
lúc mới sinh. Một nhà bảo sinh thường có 20 ca sinh mắc bệnh trong 1 tuần. Tính xác
suất để

a. Không có trường hợp nào cần chăm sóc đặc biệt


b. Có đúng một trường hợp cần chăm sóc đặc biệt
c. Có nhiều hơn một trường hợp cần chăm sóc đặc biệt

Giải:

Gọi X là số trường hợp cần chăm sóc đặc biệt trong 20 ca sinh. X có phân phối nhị thức
𝑋~ 𝐵 (20; 0,01).

a. Xác suất để không có trường hợp nào cần chăm sóc đặc biệt
#
𝑃(𝑋 = 0) = 𝐶)# . (0,01)# . (0,99))# = 0,818.
b. Xác suất để có đúng một trường hợp cần chăm sóc đặc biệt
*
𝑃(𝑋 = 1) = 𝐶)# . (0,01)* . (0,99)*= = 0,165.

c. Xác suất để có nhiều hơn 1 trường hợp cần chăm sóc đặc biệt

𝑃(𝑋 > 1) = 1 − 𝑃(𝑋 ≤ 1) = 1 − 𝑃(𝑋 = 0) − 𝑃(𝑋 = 1) = 1 − 0,818 − 0,165

= 0,017.

Ví dụ 12 (Chương II)

Có hai lô hàng I và II, mỗi lô chứa rất nhiều sản phẩm. Tỉ lệ sản phẩm loại A có trong 2
lô I và II lần lượt là 70% và 80%. Lấy ngẫu nhiên từ mỗi lô 2 sản phẩm

a. Tính xác suất để số sản phẩm loại A lấy từ lô I lớn hơn số sản phẩm loại A lấy
từ lô II.
b. Gọi X là số sản phẩm loại A có trong 4 sản phẩm được lấy ra. Tìm kỳ vọng và
phương sai của X.

34
Giải:

Gọi 𝑋\ là số sản phẩm loại A có trong 2 sản phẩm chọn ra từ lô i

𝑋* có phân phối nhị thức 𝑋* ~𝐵(2; 70%)

𝑃(𝑋* = 𝑘) = 𝐶)$ . (0,7)$ . (0,3))&$ .

𝑋* 0 1 2

P 0,09 0,42 0,49

𝑋) có phân phối nhị thức 𝑋) ~𝐵(2; 80%)

𝑃(𝑋) = 𝑘) = 𝐶)$ . (0,8)$ . (0,2))&$ .

𝑋) 0 1 2

P 0,04 0,32 0,64

a. Xác suất để số sản phẩm loại A lấy ra từ lô 1 lớn hơn số sản phẩm loại A lấy ra
từ lô 2 là: (Gọi B là biến cố số sản phẩm loại A lấy ra từ lô 1 lớn hơn số sản phẩm
loại A lấy ra từ lô 2)

𝑃(𝐵) = 𝑃(𝑋* = 2). 𝑃(𝑋) = 0) + 𝑃(𝑋* = 2). 𝑃(𝑋) = 1) + 𝑃(𝑋* = 1). 𝑃(𝑋) = 0)

= 0,49 . 0,04 + 0,49 . 0,32 + 0,42 . 0,04 = 0,1932.

b. Gọi X là số sản phân loại A trong 4 sản phẩm được lấy ra.

Có 𝑋* ; 𝑋) độc lập nên:

Kỳ vọng của X là 𝜇(𝑋* ) + 𝜇(𝑋) ) = 𝑛* . 𝑝* + 𝑛) . 𝑝) = 3.

Phương sai của X là 𝑉(𝑋) = 𝑉 (𝑋*) + 𝑉 (𝑋) ) = 0,74.

35
Ví dụ 13 (Chương III)

Một nữa công nhân quản lý 12 máy dệt. Xác suất để mỗi máy trong khoảng thời gian t
*
cần đến sự chăm sóc của nữ công nhân là -. Tính xác suất để:

a. Trong khoảng thời gian t cần đến đến sự chăm sóc của nữ công nhân.

b. Trong khoảng thời gian t có từ 3 đến 6 máy cần đến sự chăm sóc của nữ công nhân.

Giải:

Gọi X là số máy dệt cần đến sự chăm sóc của nữ công nhân trong khoảng thời gian t.
*
X ~ Bt12; -v.

a. Xác suất trong khoảng thời gian t cần đến sự chăm sóc của nữ công nhân là:

# * # ) *)
P(X ³ 1) = 1 – P(X=0) = 1 – 𝐶*) . t-v . t-v ≈ 0,992.

b. Cần tính 𝑃(3 ≤ 𝑋 ≤ 6) = 𝑃(3) + 𝑃(4) + 𝑃(5) + 𝑃(6)

* $ ) *)–a
= ∑4$]- 𝐶*)
$
t-v t-v ≈ 0,752.

Ví dụ 14 (Chương III)

Bưu điện dùng một máy tự động đọc địa chỉ trên bìa thư để phân loại theo từng khu vực
gởi đi, máy đó có khả năng đọc 5000 bì thư trong 1 phút. Khả năng đọc sai địa chỉ trên
bì thư là 0,04%. Biết rằng các bì thư đọc một cách độc lập.

a. Tính số bì thư trung bình máy đó đọc sai trong mỗi phút.

b. Tính số bì thư có khả năng nhiều nhất mà máy đó đọc sai trong 1 phút.

c. Tính xác suất để trong 1 phút máy đó đọc sai ít nhất 3 bì thư

Giải:

Gọi X là số bì thư máy đó đọc sai trong 1 phút.

Ta có 𝑛 = 500 > 20 và 𝑝 = 0,0004 < 0,1 nên 𝑋~𝑃(𝜆) với 𝜆 = 𝑛𝑝 = 2.

a. Số bì thư trung bình máy đó đọc sai trong mỗi phút là: 𝐸(𝑋) = 𝜆 = 2 bì thư
36
b. Số bì thư có khả năng nhiều nhất mà máy đó đọc sai trong một phút là 𝑚# = 1 hoặc
𝑚# = 2.

c. Cần tính

𝑃(𝑋 ≥ 3) = 1 − 𝑃(𝑋 = 0) − 𝑃 (𝑋 = 1) − 𝑃 (𝑋 = 2)

)* )! )!
=1− #!
𝑒 &) − *!
𝑒 &) − )!
𝑒 &) ≈ 0,3223.

Ví dụ 15 (Chương III)

Lãi suất khi đầu tư vào một công ty là biến ngẫu nhiên phân phối chuẩn. Biết xác suất
để đạt lãi suất trên 20% một năm là 0.2 và dưới 10% một năm là 0.1. Tìm xác suất để
khi đầu tư vào công ty đó sẽ được lãi ít nhất là 14%/năm.

Giải:

Gọi X là lãi suất khi đầu tư vào công ty (%)

Ta có:
)#&O )#&O
• 𝑃(𝑋 > 20) = 0,2 ⇔ 0,5 − 𝜙 t F
v = 0.2 ⇔ 𝜙 t F
v = 0.3 = 𝜙(0,84) (1)
*#&O O&*#
• 𝑃(𝑋 < 10) = 0,1 ⇔ 0,5 + 𝜙 t v = 0.1 ⇔ 𝜙 t v = 0.4 = 𝜙(1,28) (2)
F F

Từ (1) và (2), ta có:


)#&O
𝜙t v = 𝜙(0,84) 0,84𝜎 + 𝜇 = 20 𝜎 = 4,72
F
ž ⇔Ž ⇔Ž
𝜙t
*#&O
v = 𝜙(−1,28) −1,28𝜎 + 𝜇 = 10 𝜇 = 16,04
F

Xác suất để khi đầu tư vào công ty đó sẽ được lãi ít nhất 14%/năm :
*!&O
𝑃(𝑋 > 14) = 0,5 − 𝜙 t F
v = 0,5 − 𝜙(−0,43) = 0,5 + 0,16640 = 0,66640.

37
Ví dụ 16 (Chương III)

Một người cân nhắc giữa việc mua cổ phiếu của công ty A và công ty B hoạt động trong
hai lĩnh vực độc lập. Biết lãi suất cổ phiếu của hai công ty là các biến ngẫu nhiên phân
phối chuẩn với các tham số đặc trưng như sau:

Kì vọng toán (%) Độ lệch chuẩn (%)

Công ty A 11 4

Công ty B 10,4 2,6

a. Muốn đạt lãi suất tối thiểu 10% thì nên đầu tư vào công ty nào?

b. Tìm xác suất để đầu tư vào công ty A thu được lãi cao hơn.

Giải:

𝑋P , 𝑋N lần lượt là lãi suất (%) khi đầu tư vào công ty A, công ty B

𝑋P ~𝑁(𝜇P = 11; 𝜎P) = 4) ) 𝑋N ~𝑁(𝜇N = 10,4; 𝜎N) = 2,6) )

a. Ta có:
*#&**
𝑃(𝑋P ≥ 10) = 0,5 − 𝜙 t v = 0,5 + 0,0987 = 0,5987
!

*#&*#,!
𝑃(𝑋N ≥ 10) = 0,5 − 𝜙 t v = 0,5 + 0,0596 = 0,5596
),4

=> 𝑃(𝑋P ≥ 10) > 𝑃(𝑋N ≥ 10)

Vậy người đó nên đầu tư vào công ty A.

b. Ta cần tìm 𝑃(𝑋P ≥ 𝑋N )

Do 𝑋P ; 𝑋N độc lập: 𝑚𝑋P + 𝑛𝑋N ~ 𝑁(𝑚. 𝜇P + 𝑛. 𝜇N ; 𝑚) . 𝜎P) + 𝑛) . 𝜎N) )

Ta có: 𝑃(𝑋P ≥ 𝑋N ) = 𝑃(𝑋P − 𝑋N > 0)

𝑋P − 𝑋N ~ 𝑁(𝜇P − 𝜇N ; 𝜎P) + (−1)) . 𝜎N))

⟹ 𝑋 = 𝑋P − 𝑋N ~ 𝑁 (0,6; 4,77) )
#&#,4
⟹ 𝑃(𝑋P − 𝑋N > 0) = 𝑃(𝑋 > 0) = 0,5 − 𝜙 t v = 0,5 + 0,0517 = 0,5517.
!,55

38
Ví dụ 17 (Chương III)

Một hộ gia đình nuôi 200 con gà đẻ trứng. Giả sử mỗi con gà đẻ 1 trứng/ngày với xác
suất 0,7.

a. Tìm xác suất trong ngày, hộ gia đình thu được 150 trứng
b. Với xác suất 0,9, hộ sẽ thu được ít nhất bao nhiêu quả trứng một ngày

Giải:

a. Gọi X là số trứng thu được trong ngày. 𝑋~B(200; 0.7)

Cách 1:
*+#
Ta có: 𝑃(𝑋 = 150) = 𝐶)## . 0.7*+# . 0.3+# (kết quả rất nhỏ nên không thể hiển thị)

Cách 2:

𝑛 > 100 ⟹ X phân phối xấp xỉ qui luật 𝑁(𝜇 = 𝑛𝑝 = 140; 𝜎 ) = 𝑛𝑝𝑞 = 42)
* *+#&*!# *
Ta có: 𝑃(𝑋 = 150) = 𝜑t v= . 𝜑(1,543) = 0,1213.
√!) √!) √!)

b. Gọi X là số trứng trong ngày phân phối xấp xỉ 𝑁(𝜇 = 140; 𝜎 ) = 42.

Gọi a là số trứng cần tìm ⇒ 𝑃(𝑋 ≥ 𝑎) = 0,9


P&*!#
⇒ 0,5 − 𝜙 t v = 0,9
√!)

P&*!#
⟺ 𝜙t v = −0,4 = 𝜙(−1,28)
√!)

P&*!#
⟺ = −1,28 ⇒ 𝑎 = 131,7
√!)

Ta so sánh chọn giá trị a=131 hay a =132.

Ta có 𝑃 (𝑋 ≥ 𝑎 ) = 0,9, ta thay 𝑎 = 131 và 𝑎 = 132 vào thì thấy 𝑎 = 132 thoả.

Vậy hộ sẽ thu được ít nhất 132 quả trứng một ngày.

39
Ví dụ 18 (Chương IV)

Xét bảng phân phối xác suất của số người lớn (X) và số trẻ em (Y) trong một hộ gia
đình:

0 1 2

1 0,05 0,1 0,05

2 0,1 0,2 0,15

3 0,05 0,2 0,1

a. Từ bảng phân phối xác suất hai chiều của (X ,Y), hãy lập bảng phân phối xác
suất biên của X và của Y.
b. Tính hệ số tương quan của số người lớn (X) và số trẻ em (Y).

Giải:

a. Bảng phân phối xác suất biên của X

X 1 2 3

P(X) 0,2 0,45 0,35

Bảng phân phối xác suất biên của Y

Y 0 1 2

P(Y) 0,2 0,5 0,3

b.

𝐸(𝑋𝑌) = 1 . 0 . 0,05 + 1 . 1 . 0,1 + 1 . 2 . 0,05 + 2 . 0 . 0,1 + 2 . 1 . 0,2 +


2 . 2 . 0,15 + 3 . 0 . 0,05 + 3 . 1 . 0,2 + 3 . 2 . 0,1 = 2.4

Mà 𝐸(𝑋) = 2,15; 𝐸(𝑌) = 1,1 ⟹ 𝐶𝑜𝑣(𝑋; 𝑌) = 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌)

40
= 2,4 − 2,15 . 1,1 = 0,035.
73d(_; c) #,#-+
⟹ 𝜌_c = F0 .F1
= #,5- . #,5 ≈ 0,07.

Như vậy số người lớn và số trẻ em có tương quan cùng chiều, nhưng rất lỏng.

Ví dụ 19 (Chương IV)

Một em học sinh nhận thấy rằng thời gian tự học ở nhà của em trong một ngày là một
ĐLNN có phân phối chuẩn với trung bình 2,2 giờ và độ lệch tiêu chuẩn 0,4 giờ. Thời
gian giải trí là một ĐLNN có phân phối chuẩn với trung bình 2,5 giờ và độ lệch tiêu
chuẩn 0,6 giờ. Hệ số tương quan giữa thời gian học và thời gian giải trí là -0,5. Phân bố
đồng thời của chúng cũng là phân phối chuẩn hai chiều. Tính xác suất để:

a. Tổng số thời gian học và thời gian chơi lớn hơn 5 giờ.
b. Thời gian học lớn hơn thời gian chơi.

Giải

Gọi X, Y lần lượt là thời gian tự học và thời gian giải trí

X, Y độc lập với nhau

𝑋~𝑁(2,2; 0,4) ) 𝑌~𝑁(2,5; 0,6) )


)
√*-
⟹ (𝑋 + 𝑌)~𝑁 B4,7; t + v C.

a. Ta có:

+&!,5
𝑃[(𝑋 + 𝑌) > 5] = 0,5 − 𝜙 ” √!%
• = 0,5 − 𝜙(0,42) = 0,5 − 0,16276 = 0,33724.
#

)
√*-
b. Ta cần tính 𝑋 > 𝑌 ⟹ 𝑋 − 𝑌 > 0 ⟹ (𝑋 − 𝑌)~𝑁 B−0,3; t v C.
+

#9#,-
⟹ 𝑃(𝑋 > 𝑌) = 𝑃(𝑋 − 𝑌 > 0) = 0,5 − 𝜙 ” √!%
• = 0,5 − 𝜙(0,42) = 0,33724.
#

41
Ví dụ 20 (Chương IV)

Từ kết quả phân tích các số liệu thống kê trong tháng về doanh số bán hàng (D) và chi
phí cho quảng cáo (Q) (đơn vị triệu đồng) của một công ty, thu được bảng phân phối
xác suất đồng thời như sau:

100 200 300

1 0,15 0,1 0,04

1,5 0,05 0,2 0,15

2 0,01 0,05 0,25

a. Tính trung bình và phương sai của doanh số bán hàng


b. Nếu chỉ chi phí cho quảng cáo là 1,5 triệu đồng thì doanh số trung bình là bao
nhiêu?

Giải:

a. Ta lập bảng phân phối xác suất biên:

D 100 200 300

P(D) 0,21 0,35 0,44

Q 1 1,5 2

P(Q) 0,29 0,4 0,31

Từ đó ta có:

Giá trị trung bình: 𝐸(𝐷) = 100 . 0,21 + 200 . 0,35 + 300 . 0,44 = 223

42
Ta tính 𝐸(𝐷 ) ) = 100) . 0,21 + 200) . 0,35 + 300) . 0,44 = 55700

Phương sai: 𝑉(𝐷) = 𝐸(𝐷 ) ) − [𝐸(𝐷)]) = 5971.

b. Từ bảng phân phối xác suất đồng thời ta có:


6[(T]*##).(g]*,+)] #,#+
𝑃(𝐷 = 100/𝑄 = 1,5) = 6(g]*,+)
= #,!
= 0,125.

6[(T])##).(g]*,+)]
𝑃(𝐷 = 200/𝑄 = 1,5) = 6(g]*,+)
= 0,5.

6[(T]-##).(g]*,+)]
P(𝐷 = 300/𝑄 = 1,5) = 6(g]*,+)
= 0,375.

D/Q=1,5 100 200 300

P(D) 0,125 0,5 0,375

Doanh số bán hàng trung bình khi chi phí cho quảng cáo là 1,5 triệu động là:

E(𝐷/𝑄 = 1,5) = 100 . 0,125 + 200 . 0,5 + 300 . 0,375 = 225 (triệu đồng).

Ví dụ 21 (Chương IV)

Cho bảng phân phối xác suất đồng thời của số người trong độ tuổi lao động (X) và không
trong độ tuổi lao động (Y) trong 1 gia đình ở một khu vực như sau:

Y
1 2 3 P(𝑦" )
X

0 0,05 0,12 0,07 0,24

1 0,11 0,25 0,14 0,50

2 0,1 A 0,1 0,26

P(𝑥" ) 0,26 0,434 0,31 1

43
a. Tìm A?

b. Tỉ lệ hộ gia đình có số người trong độ tuổi lao động ít nhất 2 người là bao nhiêu?

c. Tính xác suất để một gia đình có số người không trong độ tuổi lao động lớn hơn số
người trong độ tuổi lao động.

d. Tính giá trị trung bình của số người trong độ tuổi lao động của những gia đình có 1
người không trong độ tuổi lao động.

Giải:

a. 0,05 + 0,12 + 0,07 + 0,11 + 0,25 + 0,14 + 0,1 + A + 0,1 = 1

Þ A = 0,06.

b. 𝑃(𝑋 ≥ 2) = 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) = 0,43 + 0,31 = 0,74.

c. 𝑃(𝑌 > 𝑋) = 𝑃(𝑌 = 2; 𝑋 = 1) = 0,1.

d. Bảng phân phối xác suất của 𝑋|c]*

𝑋|c]* 1 2 3

0,11 0,26 0,14


P 0,5 0,5 0,5

',&& ',*+ ',&,


𝐸(𝑋|$%& ) = 1 . +2. +3. = 2,06.
',) ',) ',)

44
D ỨNG DỤNG

D.1 Đời sống

• Trong game show “Ai là triệu phú?”, 1 câu hỏi người chơi có 4 phương án để
*
chọn. Lúc này, xác suất để người chơi chọn phương án đúng là . Tuy nhiên, người chơi
!

sử dụng quyền trợ giúp 50/50, có nghĩa là chương trình sẽ bỏ đi 2 phương án sai, còn
*
lại 2 phương án. Xác suất để người chơi chọn phương án đúng lúc này là , là xác suất
)

có điều kiện, với điều kiện “đã sử dụng quyền trợ giúp 50/50”.
• Trúng số: khi bạn biết qua tỷ lệ, xác suất trúng của các loại xổ số này là bao nhiêu
thì bạn sẽ có thể lựa chọn cho mình một chiến lược chơi phù hợp nhất.

• Các kết quả của trò chơi điện tử ở các thời điểm khác nhau: Đầu tiên, xác suất
*#
lấy được hũ vàng là *##, xác suất rơi xuống hố trên sàn là 40/100 và xác suất không có
+#
chuyện gì xảy ra là *##. Máy tính sẽ chọn 1 số ngẫu nhiên từ 1 đến 100. Nếu số đó nằm

từ 1 đến 10 là người chơi thắng hũ vàng, từ 11 đến 50 thì người chơi ngã xuống hố và
từ 51 đến 100 thì tiếp tục chơi. Các nhà khoa học thực hiện rất nhiều nghiên cứu và thử
nghiệm về máy tính bằng cách sử dụng một bộ phận chọn 1 số ngẫu nhiên để xác định
mẫu và các kết quả khác nhau.
• Vào những năm 1960, vợt tennis được làm từ gỗ với kích thước là 27 × 9 inch
(68,6 × 22,9 cm). Điều này gây ra rất nhiều trở ngại do tính chất vật lý của gỗ cũng như
quá trình chơi. Vợt tennis hiện đại được cải tiến rất nhiều về thiết kế, chất liệu, khối

45
lượng và điều quan trọng nhất là kích thước mặt vợt (đầu vợt). Mặt vợt càng lớn thì xác
suất đánh trúng bóng sẽ cao hơn. Vậy tại sao người ta không sản xuất loại vợt có mặt
vợt lớn hơn? Kích thước đầu vợt càng lớn sẽ làm tăng độ xoắn của cơ thể người chơi,
khiến họ khó kiểm soát các cú đánh nằm ngoài vùng trung tâm. Bên cạnh đó, nó còn
làm giảm khả năng tạo ra sức mạnh tổng thể của người chơi thường là để bù cho sự biến
dạng của mặt vợt.
• Các casino, sòng bài hay công ty kinh doanh các trò chơi cờ bạc sẽ sử dụng xác
suất để tính tỉ lệ người chơi thắng, từ đó thiết kế các trò chơi để tối đa lợi nhuận.

D.2 Kinh tế

D.2.1 Bảo hiểm

• Công ty muốn bán bảo hiểm nhân thọ cho các khách hàng của mình thì phải ước
lượng chính xác suất khách hàng đó bị tử vong hay bị tai nạn trong các khoảng thời gian
tiếp theo và các khoản phải đền bù tương ứng. Nếu công ty ước lượng quá thấp, tiền đền
bù sẽ vượt quá khoản phí bảo hiểm thu được. Nếu công ty ước lượng quá cao, công ty
sẽ không thể cạnh tranh với các công ty bảo hiểm khác. Từ thống kê quốc gia, các công
ty bảo hiểm có thể biết được nhóm người nào, theo giới tính, tuổi, tình trạng sức khoẻ
hiện tại, nghề nghiệp, v.v dễ bị các nguy cơ bệnh tật và tai nạn. Thống kê có thể xét đến
các sự khác biệt và ước lượng được nguy cơ tử vong và bệnh tật của các đối tượng.
Ngoài ra nếu nguy cơ tử vong ở nam cao hơn ở nữ, nó có thể giúp chúng ta quyết định
sự khác biệt về nguy cơ này có phải là do tình cờ (chance) hay không. Tình cờ là tác
động của các yếu tố không rõ, do chúng ta không có thông tin, ảnh hưởng đến nguy cơ
tử vong như yếu tố di truyền, môi trường, thói quen vệ sinh, tính khí.
• Theo điều tra của công ty bảo hiểm State Farm, một trong những công ty bảo
hiểm lớn nhất nước Mỹ, 3 thành phố với tỉ lệ trộm cắp ô tô cao nhất ở bang Ohio là
Toledo (580.23 vụ trộm ô tô/100,000 phương tiện), Columbus (558.19 vụ/100,000
phương tiện) và Dayton-Springfield (525.06 vụ/100,000 phương tiện). Tuy nhiên cần
có một số liệu cố định về số lượng phương tiện cho cả 3 thành phố. Thành phố nhiều ô
tô hơn thì số vụ trộm sẽ xảy ra nhiều hơn. Để có sự so sánh công bằng, ta thực hiện phép

46
chia nhỏ dưới dạng thập phân thì ta được kết quả là xác suất của một vụ trộm ở các
thành phố lần lượt là 0.58%, 0.56% và 0.53%

D.2.2 Quản trị, chiến lược để phát triển doanh nghiệp

• Thông qua điều tra lấy mẫu, ta sẽ đánh giá được chất lượng sản phẩm phù hợp,
thị trường tiềm năng của sản phẩm để từ đó có những điều chỉnh phù hợp nhằm cải tiến
mẫu mã, chất lượng sản phẩm phù hợp thị hiếu người tiêu dùng. Trong cơ chế thị trường
cạnh tranh khốc liệt, nhờ những thông tin thống kê về đối thủ cạnh tranh, về thị trường
sản phẩm, về tình hình sản xuất đầu kì, cuối kì mà chúng ta có thể lựa chọn phương án
tổ chức kinh doanh hợp lý, hiệu quả để tồn tại và phát triển. Không những thế thông tin
thống kê còn giúp các nhà kế hoạch dự đoán nhu cầu sản phẩm trong tương lai để từ đó
xây dựng kế hoạch sản xuất kinh doanh hợp lý nhằm mang lại nhiều lợi nhuận cho công
ty.
• Một trong những ứng dụng quan trọng mà nghiên cứu thống kê được sử dụng
trong kinh doanh là đưa ra các quyết định về giá. Phân tích thống kê có thể giúp các nhà
quản lí xác định xu hướng giá cả, độ nhạy của người tiêu dùng với giá cao hơn hoặc
thấp hơn và tỉ lệ chi phí sản xuất so với giá. Ngoài các phương pháp truyền thống như
mô hình hồi quy, mô hình chuỗi thời gian để xác định những nhân tố ảnh hưởng đến giá
của sản phẩm, các mô hình nghiên cứu về giá được sử dụng rất nhiều trong các dự án
đầu tư vốn có giá trị, và thường được gọi là "option pricing, the real options revolution".
Có thể thấy, sự phát triển từ lý thuyết tới thực hành của thống kê, phân tích dữ liệu có ý
nghĩa cực kì quan trọng trong quá trình vận hành và phát triển của doanh nghiệp.
• Trong việc phân tích rủi ro phá sản của doanh nghiệp (DN) có sử dụng thủ tục
thống kê đòi hỏi việc đưa ra các giả thuyết liên quan đến tiêu chuẩn rủi ro phá sản tiềm
năng. Những giả thuyết này xem xét đến rủi ro phá sản của DN là cao, thấp hơn rủi ro
phá sản trung bình của những DN có rủi ro phá sản so với DN không có rủi ro phá sản.
Những thông tin về rủi ro phá sản của mỗi DN đều được thể hiện qua bộ số liệu thực
nghiệm, những giả thuyết này có thể bị bác bỏ hoặc chấp nhận một cách phù hợp.
• Disney là một tên tuổi hàng đầu thế giới trong lĩnh vực công viên và khu nghỉ
dưỡng. Disney mở ở nhiều địa điểm trên thế giới bao gồm Hồng Kông, Pari, Tokyo,
Florida California. Lợi nhuận trong năm 2007 của tập đoàn này giúp nó đứng top đầu

47
thế giới. Chìa khóa của sự thành công đến từ việc dự báo, nghiên cứu thu nhập công ty
dựa vào số lượng khách đến công viên và vào việc họ sẽ tiêu tiền ở đó như thế nào. Việc
dự báo chính xác lượng khách đến căn cứ vào báo cáo hàng ngày từ các công viên trong
những ngày hôm trước được Disney thực hiện khá nghiêm túc. Disney sử dụng nhiều
nhà nghiên cứu và phân tích ở 70 lĩnh vực khác nhau để khảo sát một triệu người mỗi
năm. Khảo sát này thống kê số khách vào công viên và 20 khách sạn của Disney. Điều
này không những giúp dự báo số người vào công viên mà còn dự báo tình trạng của
khách hàng ở từng địa điểm (ví dụ khách phải xếp hàng dài bao nhiêu và phải chờ bao
lâu). Disney thậm chí khảo sát 3.000 trường học ở trong và ngoài nước Mỹ về lịch trình
nghỉ lễ/nghỉ hè. Với tiếp cận này, dự báo 5 năm của Disney chỉ có 5% sai lệch trung
bình, dự báo hàng năm sai lệch từ 0% - 3%.
• Nghiên cứu thống kê cũng được sử dụng để quyết định thương hiệu và quảng cáo
sản phẩm hoặc dịch vụ. Từ việc xác định và mô tả nền tảng khách hàng hiện tại, các
phân tích dữ liệu cung cấp các thông tin về chiến lược quảng bá, mục tiêu, xác định
những sản phẩm nào sẽ phù hợp với kênh kinh doanh nào, và thời điểm nào cho từng
phân khúc khách hàng. Tất cả những thông tin này có thể rất hữu ích cho các nhà quản
lí khi đưa ra quyết định về loại thông điệp nào sẽ được sử dụng và những sản phẩm nào
cần đưa vào quảng cáo. Ngoài ra, các nghiên cứu thống kê về phương tiện truyền thông,
nhóm khách hàng sử dụng một loại phương tiện nhất định, có thể giúp nhà quản lí quyết
định về nơi mua quảng cáo. Để làm được điều đó, những kĩ sư phân tích kinh doanh
phải xử lí một lượng dữ liệu khổng lồ; đó không chỉ là các dữ liệu thu thập được về
khách hàng qua các giao dịch, mà còn là dữ liệu về các nhà cung cấp truyền thông. Các
công cụ thống kê được phát triển mạnh mẽ cùng với các kỹ thuật, thuật toán trong phân
tích dữ liệu, các phần mềm thống kê, các mã nguồn mở đã giúp các nhà quản lí định
lượng các quyết định của họ.
• Nghiên cứu thống kê giúp các nhà quản lí xác định được đối tượng khách hàng
nào là khách hàng mục tiêu. Bằng cách hiểu các dữ liệu về thông tin khách hàng, xu
hướng tiêu dùng, sức mua và sở thích, các nhà quản lí doanh nghiệp sẽ quyết định phát
triển các sản phẩm đáp ứng tốt hơn nhu cầu của khách hàng. Để hiểu rõ hơn về loại sản
phẩm và người tiêu dùng cần, cách họ sẽ sử dụng chúng, các công ty cần những người
phân tích kinh doanh để hiểu và phân tích dữ liệu một cách đúng đắn nhất. Rất may mắn
48
là cùng với sự phát triển của khoa học dữ liệu, các phần mềm thống kê ra đời giúp những
kĩ sư phân tích dữ liệu một cách hiệu quả và nhanh chóng.
• Ví dụ máy quét điện tử tại quầy thanh toán ở các cửa hàng bán lẻ thu thập nhiều
dữ liệu hỗ trợ cho các ứng dụng và nghiên cứu trong marketing. Các nhà phân tích tiếp
theo sẽ tiến hành xử lý, áp dụng các phương pháp thống kê để mô tả dữ liệu, tóm tắt dữ
liệu, phân tích để đưa ra các kết luận về đối tượng có trong bộ dữ liệu. Kết hợp với dữ
liệu thống kê về các hoạt động sản xuất, tiếp thị, các chuyên gia marketing có thể để tìm
hiểu được mối liên hệ giữa doanh số bán hàng với các chiến dịch quảng cáo, xúc tiến
bán hàng, để đề xuất ra giải pháp thích hợp trong tương lai.

D.2.3 Khác

Còn rất nhiều ứng dụng khác trong kinh doanh mà các nhà quản lí cần đến đó là, tạo kết
nối giữa các sản phẩm, đảm bảo chất lượng sản phẩm cũng như quản lí hiệu suất của
nhân viên.

D.3 Tài chính

• Xác suất và thống kê có thể giúp định hình các


chính sách tài chính và tiền tệ hiệu quả và phát triển
các mô hình định giá cho các tài sản tài chính như cổ
phiếu, trái phiếu, tiền tệ và chứng khoán phái sinh.
Tầm quan trọng của việc phát triển các phương pháp
mạnh mẽ cho phân tích thực nghiệm như vậy đã trở
nên đặc biệt quan trọng sau cuộc khủng hoảng tài
chính toàn cầu gần đây năm 2008.
• Các nhà phân tích tài chính sử dụng nhiều phương pháp thống kê để có được
những hướng dẫn ăn hay các khuyến nghị đầu tư. Ví dụ xét trong trường hợp đầu tư cổ
phiếu, các nhà phân tích xem xét dữ liệu tài chính như tỷ lệ giá/thu nhập và tỷ suất cổ
tức (cổ tức/giá cổ phiếu). Bằng cách so sánh thông tin của một cổ phiếu riêng lẻ với
thông tin về mức trung bình của thị trường chứng khoán, họ có thể bắt đầu đưa ra kết
luận liệu đầu tư vào cổ phiếu này có tư lại lợi nhuận như mong muốn hay không

49
• Rủi ro tín dụng là xác suất doanh nghiệp mất khả năng thanh toán một phần các
nghĩa vụ tài chính theo cam kết trong tương lai, do đó, rủi ro tín dụng cũng là một trong
những loại rủi ro quan trọng nhất trong tài chính và giao dịch thương mại và quản trị rủi
ro (Klieštik và Cúg, 2015). Một trong những nhánh nghiên cứu tính toán đo lường rủi
ro được sử dụng và phát triển mạnh mẽ hiện nay là tính toán giá trị rủi ro (VaR). VaR
đã được sử dụng tính toán rủi ro trong các nghiên cứu của Ingersoll và cộng sự (1987),
Embrechts và cộng sự (2005) với nhiều kết quả đáng ghi nhận. Những phát triển từ
nhánh nghiên cứu này như TVaR hay CVaR áp dụng cho những dữ liệu không tuân theo
phân phối chuẩn, đáp ứng phần nào những điều kiện thực tế.

D.4 Xã hội

• Các thống kê về quy mô, cơ cấu dân số, phân bố dân cư,… giúp Chính phủ có
cái nhìn toàn diện về hiện tại và hướng phát triển trong tương lai của dân số, từ đó đề ra
các chính sách và chiến lược phát triển thích hợp (Chính phủ Trung Quốc chỉ cho phép
mỗi gia đình sinh 1 con vì dân số quá đông, Nhật Bản và các nước châu Âu có các chính
sách hỗ trợ cho các gia đình sinh con vì dân số đang già hóa, Việt Nam có chính sách
sinh đủ 2 con,…)
• Thống kê về các vấn đề xã hội (tỷ lệ thất nghiệp, tệ nạn xã hội, an ninh trật tự,…)
và các dự báo trong tương lai nhờ các phương pháp tính xác suất, phân tích số liệu,…
giúp các cơ quan Chính phủ, các nhà làm chính sách kịp thời đánh giá và đưa ra hay đề
xuất các chính sách hợp lý.
• Thống kê cung cấp dữ liệu chính xác nhất, giúp chính phủ lập ngân sách và ước
tính chi tiêu, doanh thu của khu vực công.
• Chính phủ cũng áp dụng các phương pháp xác suất để điều tiết môi trường hay
còn gọi là phân tích đường lối.

D.5 Nghiên cứu khoa học

D.5.1 Kinh tế học

Các nhà kinh tế thường đưa ra những dự báo về tương lai của nền kinh tế hoặc một số
khía cạnh trong nền kinh tế nói chung bằng cách sử dụng nhiều phương pháp thống kê
khác nhau.Ví dụ, các nhà kinh tế sử dụng thông tin thống kê về các chỉ số như Chỉ số
50
giá tiêu dùng, Chỉ số giá sản xuất, tỷ lệ thất nghiệp và năng lực sản xuất từ ngành kết
hợp với phương pháp hồi quy hay Time series (dãy số thời gian) để dự báo tỷ lệ lạm
phát.

D.5.2 Y học

• Việc sử dụng toán học, cụ thể là XS-TK trong nghiên cứu y sinh học góp phần
đánh giá một cách chính xác các vấn đề về sức khỏe và bệnh tật của con người, đồng
thời xác định các yếu tố nguy cơ, các mối quan hệ nhân quả, tương quan giữa các yếu
tố của môi trường sinh thái lên sức khỏe và bệnh tật của cộng đồng. Một trong những
ứng dụng của khoa học thống kê trong nghiên cứu y học là về mối liên hệ giữa việc tiếp
xúc trực tiếp với ánh nắng mặt trời và ung thư da đã được một nhà thống kê người Úc
phát hiện ra năm 1956, Ông Oliver Lancaster. Ông quan sát thấy rằng tỷ lệ người bị ung
thư da trong số dân da trắng gốc Bắc Âu có tương quan thuận với vĩ độ của nơi họ ở,
tức có tỷ lệ với lượng ánh nắng mặt trời mà họ tiếp xúc: các tiểu bang ở phía bắc có tỷ
lệ ung thư da cao hơn các tiểu bang phía nam. Quan sát này chỉ có thể đưa ra được bằng
việc thu thập đầy đủ các số liệu và đưa ra các quan sát có phương pháp về tỷ lệ ung thư
da.
• Trong nhiều thế kỷ qua cho đến hiện nay, quá trình và phương pháp chẩn đoán,
điều trị bệnh chủ yếu dựa trên mô hình của Aristole. Theo mô hình này, người thầy
thuốc sẽ khám lâm sàng dựa trên những triệu chứng mà bệnh nhân mô tả sau đó sẽ dự
đoán khả năng bị một bệnh B nào đó với một xác suất ban đầu (xác suất tiền nghiệm)
rồi quyết định phương pháp điều trị. Nếu sau điều trị, bệnh diễn tiến tốt và hoặc khỏi
hoàn toàn thì phương pháp điều trị này được xem là đúng. Qua nhiều lần điều trị, người
thầy thuốc sẽ rút ra kinh nghiệm cho mình và truyền thụ cho các đồng nghiệp. Như vậy,
phương pháp điều trị này chủ yếu dựa trên kinh nghiệm và như thế người thầy thuốc
thường có khuynh hướng chủ quan vì cảm nhận rằng phương pháp điều trị của mình là
tốt, là tối ưu mặc dù có bằng chứng khoa học chứng minh điều ngược lại. Những kinh
nghiệm mà các bác sĩ có được thông qua các tình huống lâm sàng thường có độ tin cậy
không cao vì chúng chưa được kiểm chứng bằng các bằng chứng khoa học. Sự không
thích hợp của những thông tin truyền thống vì đã lỗi thời (sách textbook), có thể sai lầm

51
(kinh nghiệm chuyên gia) đã hình thành một phương pháp khác phương pháp truyền
thống này, đó chính là phương pháp y học thực chứng (Evidence-based medicine)
• Thuốc theo toa nếu được chứa trong gói, vỉ được thiết kế đặc biệt thay vì chai sẽ
làm tăng khả năng người mua sẽ dùng thuốc đúng cách - một nghiên cứu Đại học bang
Ohio. Có nghĩa là xác suất người mua dùng thuốc dùng thuốc đúng cách nếu nếu công
ty phân phối thuốc theo kiểu mới hơn. Dù không biết chính xác xác suất các viên thuốc
được sử dụng đúng hay xác suất tăng lên bao nhiêu với bao bì mới nhưng theo nghiên
cứu này, việc đóng gói bao bì có tác dụng tích cực hơn.
• Tỉ suất sinh và chết của dân số được dựa trên các số thống kê thu thập được trong
một năm lịch. Ðể tiện lợi các tỉ suất này thường được nhân cho 1000 để tránh các số lẻ
và được trình bày chẳng hạn như số sinh cho mỗi 1000 thành viên dân số hàng năm.Tỉ
suất sinh đo lường kích thước dân số được tăng do số sinh mới nhanh như thế nào và tỉ
suất tử vong thô đo lường sự giảm dân số do tử vong nhanh như thế nào. Tỉ suất ác tính
đo lường nguy cơ một người vì một bệnh nào đó khi mắc bệnh đó đã được mô tả bởi
William Farr trong đầu thế kỉ 19. Người ta có thể dùng một số phương pháp tính toán
gián tiếp để đo lường nguy cơ. Thí dụ, tỉ suất tử vong trẻ em là nguy cơ đứa trẻ chết
trước kì sinh nhật đầu tiên của nó. Phương pháp trực tiếp để đo lường là theo dõi một
đoàn hệ các trẻ mới sinh và ghi nhận tỉ lệ trẻ trong đoàn hệ chết trước khi kì sinh nhật
thứ nhát của nó. Dù vậy, để tiện lợi, tỉ suất tử vong trẻ em được ước tính bằng tỷ số chết
dưới một năm tuổi và số sinh sống trong một năm. Do đó tử số sẽ gồm một số chết trong
những đứa trẻ được sinh trong năm trước và như thế cũng bỏ qua một số tử vong trong
số trẻ đã sinh trong năm mà không được theo dõi tới năm sau. Trong một dân số ổn định
người ta giả sử rằng hai yếu tố này sẽ triệt tiêu lẫn nhau. Một quan điểm tương tự sẽ
được áp dụng để ước tính tỉ suất tử vong sơ sinh và tỉ suất tử vong chu sinh.
• Bảng sống: Mô thức sống còn của cộng đồng thường được mô tả trong bảng sống
(life table). Bảng sống có 2 dạng. Dạng thứ nhất, bảng sống đoàn hệ (cohort life table).
Trình bày thời gian sống còn của một nhóm cá nhân thực sự theo thời gian. Ðiểm khởi
phát để đo thời gian sống còn có thể là lúc sinh hay có thể là biến cố khác. Thí dụ, một
bảng sống đoàn hệ có thể dùng thể trình bày tử vong của một nhóm nghề nghiệp tùy
theo khoảng thời gian trong nghề, hay mô thức sống còn của bệnh nhân sau điều trị, thí
dụ như sau khi điều trị, như xạ trị ung thư phế quản tế bào nhỏ. Loại bảng sống thứ nhì,
52
bảng sống hiện hành (current life table) thường được dùng trong mục đích bảo hiểm và
ít phổ biến trong nghiên cứu y khoa. Bảng này trình bày thời gian sống còn kỳ vọng
theo thời gian của một dân số giả thuyết được áp dụng tỉ suất tử vong đặc hiệu tuổi giới
tính hiện nay.
• Phân tích thống kê hộ tịch (vital statistics) ghi nhận đầu tiên được tiến hành bởi
John Graunt ở Luân đôn. Graunt khẳng định rằng nam nhiều hơn nữ trong cả sinh và tử,
tỉ suất tử vong trẻ em cao và sự biến thiên theo mùa của tử vong. Năm 1963, Edmund
Halley dùng các giấy khai tử để xây dựng bảng sống đầu tiên. Graunt đi trước thời đại
của ông và truyền thống phân tích không được tiến hành cho đến giữa thế kỉ 19 khi
William Farr trở thành Tổng Ðăng kiểm (Registrar General) đầu tiên ở Anh và xứ Wales.
Farr đã áp dụng số liệu thống kê hộ tịch vào nhiều vấn đề y tế công cộng bao gồm việc
so sánh các tỉ suất tử vong giữa các nhóm nghề nghiệp khác nhau. Xem xét các số liệu
thống kê hộ tịch được thu thập thường quy về sinh, tử vong và bệnh tật cũng gợi ý cho
sự liên hệ giữa bệnh tật và nguyên nhân.
• Theo thống kê, trẻ sinh ra là nam nhiều hơn là nữ. Phụ nữ có xu hướng sống lâu
hơn nam giới số người chết ngoại trừ trong thời gian dịch bệnh là tương đối ổn định từ
năm nay sang năm khác và do đó tỷ lệ giới tính trong sinh sản là ổn định Mặt khác các
bác sĩ cho biết họ có số bệnh nhân Nam và số bệnh nhân nữ như nhau chứng tỏ các bác
sĩ từng chữa khỏi bệnh cho phụ nữ hoặc là một tỷ lệ lớn hơn nam giới chết vì bệnh tật
và sự trợ giúp của y tế.

D.5.3 Thiên văn học, các hiện tượng tự nhiên, dự báo thiên tai, thời tiết

• Ở lĩnh vực thiên văn học, các nhà khoa học đo khoảng cách giữa mặt trời và trái
đất hoặc mặt trăng và trái đất bằng những phương pháp thống kê. Rất khó để đo khối
lượng, kích thước, khoảng cách, mật độ của các vật thể trong vũ trụ mà không có bất kỳ
lỗi nào. May mắn thay, các công thức thống kê đã xuất hiện và hỗ trợ một cách tích cực.
• Các nhà khoa học sử dụng xác suất để dự đoán thời điểm xảy ra, cường độ và
đường đi của một cơn bão dựa trên số liệu máy tính. Điều này giúp các nhà chức trách
và các công ty bảo hiểm có thể dự đoán thiệt hại và điều chỉnh các khoản chi một cách
hợp lý. Mô hình máy tính làm rất tốt khả năng dự đoán các tổn thất dài hạn trên một khu
vực địa lý rộng lớn dựa trên sai số cao. Sai số cao là kết quả được dự đoán sẽ thay đổi

53
từ mẫu này sang mẫu khác. AIR Worldwide một hãng hàng không vận chuyển hàng hóa
lớn của Mỹ sở hữu máy tính chứa dữ liệu của một nửa thị trường bảo hiểm tài sản dân
cư ở Florida và 85% công ty bảo lãnh người đăng ký bảo hiểm, tính toán ra được sự
hình thành của cơn bão trong khoảng 50,000 năm. Một chuyên gia đã mở rộng khoảng
dự đoán của mô hình thành 100,000 đến 300,000 năm với sai số có thể chấp nhận. Mô
hình chứa rất nhiều biến để có thể thực hiện nhiều phép thử khác nhau nhằm đạt được
một số trung bình có thể đoán được. Càng nhiều biến càng có được kết quả phụ thuộc.
Với việc dự đoán các cơn bão, số lượng biến phải vô cùng lớn. Mô hình máy tính của
Trung tâm dự báo bão Hoa Kỳ sử dụng rất nhiều biến kinh độ và vĩ độ của cơn bão, các
vectơ chuyển động thành phần và cường độ ban đầu của nó,...
• Chất lượng của bản tin dự báo thời tiết phụ thuộc rất nhiều vào tính đầy đủ và
độ chính xác của số liệu quan trắc trạng thái ban đầu của khí quyển. Điều này đòi hỏi
phải quan trắc thường xuyên và
chính xác các lớp khí quyển từ thấp
lên cao bằng các trạm quan trắc bề
mặt, cao không và các các hệ thống
viễn thám như vệ tinh, radar khí
tượng. Số liệu quan trắc khí tượng
trên một khu vực rộng lớn được vẽ
lên bản đồ thời tiết, với các biểu
tượng khác nhau đại diện cho gió,
nhiệt độ, mây, khí áp và các yếu tố
thời tiết khác để xác định được tất cả các yếu tố thời tiết tại một địa điểm nhất định,
phân tích các kiểu hoàn lưu và xác định vị trí các hệ thống thời tiết quan trọng. Các
giản đồ nhiệt động lực cũng được phân tích từ dữ liệu quan trắc khí quyển giúp xác
định độ ổn định (stable) của khí quyển theo phương thẳng đứng để đánh giá khả năng
tạo ra đối lưu mạnh.

D.5.4 Giáo dục

Có thể áp dụng mô hình phân phối chuẩn trong việc kiểm tra, đánh giá và phân loại học
sinh trong trường học. Để phản ánh được trung thực trình độ nhận thức của học sinh,

54
sinh viên, cũng như mức độ vừa sức của bài kiểm tra đánh giá kết quả học tập, kết quả
thi kiểm tra nên có phân phối số điểm theo hình dạng đường cong chuẩn này. Theo đó,
sẽ có khoảng 68,2% học sinh đạt mức điểm trung bình, mức 1σ. Mức 2σ, 3σ bên phải
là các học sinh khá, giỏi chiếm tỉ lệ tương ứng là 13.6% và 2.1%, và tương tự đối với
học sinh yếu, kém. Và như vậy, chúng ta trả lại ý nghĩa ban đầu cho các cụm từ “trung
bình”, “khá”, “giỏi”. Một học sinh có học lực “trung bình” thực ra nằm ở khoảng mặt
bằng chung của lớp (µ-σ, µ+σ), không cần phải quá tự ti về mức học lực này. Nhưng
một học sinh có học lực “giỏi” trong khi tỉ lệ giỏi của lớp chiếm tới hơn 90%, thì cũng
không mang nhiều ý nghĩa. Thực tế, hoàn toàn có thể chọn các giá trị khác nhau của µ
và σ tùy theo hoàn cảnh, ví dụ chọn mức trung bình µ=7 điểm, σ=1 điểm để khuyến
khích động viên tinh thần học tập của học sinh, tuy nhiên chọn µ quá cao sẽ dẫn tới bệnh
thành tích trong giáo dục, vốn là con dao hai lưỡi, đôi khi dẫn mang lại hiệu quả trái
ngược.

D.5.5 Sinh học

• Trong xét nghiệm ADN để xác định huyết thống cha con, người ta thường lấy
mức 4σ, tức trùng khớp 99,99% sẽ được kết luận là có huyết thống cha con.
• Thống kê được sử dụng trong sinh trắc học, hỗ trợ nghiên cứu về thuốc, dược
phẩm,…

D.5.6 Vật lý học

• Trong việc phát hiện ra hạt hạ nguyên tử Higgs, người ta đã làm các thí nghiệm
thực nghiệm có độ tin cậy 5σ tương ứng với sai số là ba phần mười triệu (độ tin cậy
99.9999%), đây cũng là mức mà các nhà vật lý hạt cơ bản sử dụng để công nhận một
phát hiện mới.
• Vật lý lượng tử cũng có phần xác suất, phương trình Schrödinger trong việc mô
tả hàm sóng của các electron là một ví dụ.
• Sự khác biệt giữa quá khứ và tương lai chỉ tồn tại khi có nhiệt. Hiện tượng cơ
bản phân biệt tương lai với quá khứ là thực tế nhiệt truyền từ vật nóng hơn sang vật lạnh
hơn. Tại sao khi thời gian trôi qua, nhiệt truyền từ vật nóng sang vật lạnh chứ không
truyền theo cách nào khác? Nguyên nhân được khám phá bởi nhà vật lí người Áo

55
Ludwig Boltzmann, và đơn giản đến bất ngờ: đó là tình cờ. Ý tưởng của Boltzmann
không dễ mô tả, và nó dùng đến khái niệm xác suất. Nhiệt không truyền từ vật nóng
sang vật lạnh do một định luật tuyệt đối: nó chỉ làm thế với một xác suất lớn mà thôi.
Nguyên nhân là vì về mặt thống kê khả năng một nguyên tử chuyển động nhanh của
chất nóng va chạm với một nguyên tử lạnh để truyền sang nó một ít năng lượng thì cao
hơn ngược lại. Năng lượng được bảo toàn trong các va chạm, nhưng có xu hướng được
phân bố thành những phần ít nhiều ngang nhau khi có nhiều va chạm. Bằng cách này,
nhiệt độ của các vật tiếp xúc với nhau có xu hướng bằng nhau. Không phải không có
khả năng cho một vật nóng trở nên nóng hơn qua việc tiếp xúc với một vật lạnh hơn:
nhưng khả năng đó là cực kì nhỏ. Người ta có thể tính xác suất để khi các phân tử va
chạm nhiệt truyền từ vật nóng hơn sang vật lạnh hơn, và kết quả hóa ra lớn hơn nhiều
so với xác suất để nhiệt truyền sang vật nóng hơn. Ngành khoa học làm sáng tỏ những
điều này được gọi là vật lí thống kê, và một trong những thành tựu của nó, bắt đầu với
Boltzmann, là hiểu được bản chất xác suất của nhiệt độ, tức là nói nhiệt động lực học.

D.6 Nông nghiệp, công nghiệp

D.6.1 Các thông số, quy trình kĩ thuật, sản xuất, máy móc, thuật toán

• Bộ phận kiểm tra chất lượng sử dụng xác suất thống kê để kiểm tra xem quá trình
sản xuất có theo kế hoạch. Họ giữ nhiều sản phẩm mẫu cho đến khi họ phát hiện sản
phẩm lỗi và đếm xem có bao nhiêu sản phẩm họ lấy làm mẫu cho đến khi chuyện này
xảy ra lần nữa. Nếu mất một thời gian dài thì quá trình sản xuất vẫn theo kế hoạch, nếu
không chuyện đó xảy ra ngay lập tức có nghĩa là quá trình đã xảy ra vấn đề.
• Lý thuyết trò chơi cũng dựa trên nền tảng xác suất. Một ứng dụng khác là trong
xác định độ tin cậy. Nhiều sản phẩm tiêu dùng như xe hơi, đồ điện tử sử dụng lý thuyết
độ tin cậy trong thiết kế sản phẩm để giảm thiểu xác suất hỏng hóc. Xác suất hư hỏng
cũng gắn liền với sự bảo hành của sản phẩm.
• Thống kê được ứng dụng trong sản xuất, vận hành để kiểm soát, đảm bảo chất
lượng thành phẩm hay quản lý, đẩy mạnh tiến độ hoàn thành, mức độ hiệu quả các công
việc, nhiệm vụ. Ví dụ biểu đồ kiểm soát chất lượng trong thống kê X-bar chart được
dùng để giám sát các sản phẩm được tạo ra từ một quy trình sản xuất. Giả sử một máy

56
làm đầy chai nước giải khát trong dây chuyền sản xuất có nhiệm vụ đổ đầy 550 ml nước
nước giải khát vào một chai rỗng. Nhân viên nhà máy lấy mẫu 200 trai để kiểm tra xem
cái máy có hoạt động hiệu quả hay không bằng cách tính lượng nước trung bình mỗi
chai trong 200 trai sau đó thể hiện giá trị này bằng một đường thẳng trong đồ thị X-bar.
Ở các lần sản xuất sắp tới, mỗi lần là một điểm, mỗi điểm sẽ tương ứng cho giá trị trung
bình của một mẫu lấy ra từ lần sản xuất ấy. Nếu điểm đó nằm ở trên đường thẳng trong
X-bar thì máy có khả năng bơm hơn 550 ml vào mỗi chai hoặc ngược lại. Đây chính là
một giải pháp hữu ích của thống kê để kiểm soát quy trình sản xuất.

D.6.2 Xây dựng

• Ban quản lý đường cao tốc sử dụng xác suất để tính toán khả năng xảy ra tai và
sự nguy hiểm giữa các giao lộ.
• Thống kê được sử dụng phổ biến trong mọi lĩnh vực khác nhau của ngành xây
dựng công trình và trở thành một công cụ rất hữu ích để thực hiện thành công mọi nhiệm
vụ chiến lược của ngành. Chẳng hạn, nhờ những thông tin thống kê thu thập được qua
mẫu đủ lớn về triều cường, hướng gió, tính chất lý hóa của các tầng đất,... trong khảo
sát Địa chất công trình mà các nhà kỹ thuật lựa chọn chọn phương án thiết kế, thi công
phù hợp, đảm bảo độ ổn định cũng như tuổi thọ của công trình. Bên cạnh đó, nhờ những
thông tin thu thập được qua mẫu điều tra, các nhà kỹ thuật sẽ đánh giá được độ tin cậy
của chất lượng công trình, chất lượng sản phẩm.
• Đối với những cán bộ quản lý các công trường khai thác khoáng sản, đặc biệt là
khai thác than luôn phải thống kê tất cả các tư liệu sản xuất có liên quan, cập nhật có
chu kỳ để đảm bảo an toàn lao động, trữ lượng khai thác. Thống kê từ số công nhân,
lượng thuốc nổ, số kíp nổ, lượng than, số mét lò khai thác được,… từ đó tổng hợp số
liệu, phân tích đưa ra các kết luận về địa chất địa mạo thực tế thế khu vực khai trường,
hiệu suất lao động,… nhằm điều chỉnh phương án khai thác và phương pháp quản lý để
đáp ứng nhu cầu công việc.

57
D.6.3 Mùa vụ

Nông dân dựa vào thống kê các loại nông sản và dự báo thời tiết, thiên tai,… để lựa
chọn phương pháp, thời gian canh tác hợp lý, lựa chọn loại và số lượng nông sản để đầu
tư,…

D.7 Nghệ thuật

• Phương pháp thống kê bao gồm các phương pháp dự báo được kết hợp với lý
thuyết hỗn hợp và hình học nhân bản để tạo ra các tác phẩm video được đánh giá có vẻ
đẹp tuyệt vời.
• Các quá trình nghệ thuật của Jackson Pollock dựa trên thí nghiệm nghệ thuật
phân bố cơ bản trong tự nhiên được tiết lộ. Với sự ra đời của máy tính, các phương pháp
thống kê được áp dụng để hợp thức hóa với các quá trình tự nhiên phân phối theo định
hướng như vậy để thực hiện và phân tích nghệ thuật hình ảnh động.
• Phương pháp thống kê có thể được sử dụng để xác nhận trong nghệ thuật trình
diễn, như trong một thẻ giả dựa trên quá trình Markov và chỉ hoạt động một thời gian
nhất định, qua đó có thể dự đoán được việc sử dụng phương pháp thống kê.
• Thống kê có thể được sử dụng trong việc tạo hình nghệ thuật, như trong âm nhạc
hay thống kê ngẫu nhiên phát minh bởi Lannis Xenakis, nơi âm nhạc biểu diễn rõ ràng.
Mặc dù kiểu nghệ thuật không phải lúc nào cũng như mong đợi, nó diễn ra theo cách đó
là được đoán trước và có hòa âm được bằng cách sử dụng thống kê.

58
E THAM KHẢO

1. Tạp chí giáo dục (https://bom.to/UCOixN)


2. Hindawi (https://bom.to/ue53Kc)
3. Báo cáo bài tập lớn xác suất thống kê (Đại học bách khoa TP HCM)
4. Bài tập lớn xác suất thống kê - Nguyễn Kiều Dung (Đại học bách khoa TPHCM)
5. Xử lý thống kê bằng excel ( Đại học bách khoa TP HCM)
6. Giáo trình xác suất thống kê (Lê Sĩ Đồng) - NXB Giáo dục Việt Nam
7. Căn bản thống kê y học - TRƯỜNG ÐẠI HỌC Y DƯỢC TP HỒ CHÍ MINH
8. Geometric Probability - Art Johnson
9. Probabilities for Dummies - Deborah Rumsey, PhD
10. Subjective Probability - Richard Jeffrey
11. Slideshare (https://bom.to/UL3YaX)
12. Đại học cảnh sát nhân dân (https://bom.to/1oWVtS)
13. Big Data (https://bom.to/867HVx)
14. Wikipedia - Thống kê (https://bom.to/2GcxA4)
15. Github (https://bom.to/LNn93M)
16. Tạp chí tài chính (https://bom.to/V538hu)
17. Y tế công cộng (https://bom.to/qR5i0h)
18. ACADEMIA (https://bom.to/xcG8WB)
19. VATM (https://bom.to/SpCSrs)
20. TOPICA (https://bom.to/STXwzT)
21. VNDOC (https://bom.to/jwhzUd)
22. STAT TREK (https://bom.to/NEiMns)
23. Interactive Mathematics (https://bom.to/nccq2R)
24. Towards Data Science (https://bom.to/vdZMZ7)
25. cuuduongthanhcong (https://bom.to/mdKbLg)
26. Trungxoso (https://bom.to/CtWfjy)
27. Thư viện vật lý (https://bom.to/iO8BkR)
28. World Scientific (https://bom.to/8mMLnK)
29. JSOTR (https://bom.to/RcOsd)

59
60

You might also like