You are on page 1of 72

DIVISION OF MATHEMATICS

THANG LONG UNIVERSITY

PROBABILITY AND STATISTICS

Hanoi, 2023
CONTENTS

1 Sample Space and Probability 11


1.1 Sample space and Events . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2 Calculating Probability . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3 Conditional Probability and independence . . . . . . . . . . . . . . . 25
1.4 Total Probability Theorem and Bayes’ Rule . . . . . . . . . . . . . . 30
1.5 Probability Mass Functions . . . . . . . . . . . . . . . . . . . . . . . 37
1.6 Expectation, Mean, and Variance . . . . . . . . . . . . . . . . . . . . 38
1.7 Distribution of random vector . . . . . . . . . . . . . . . . . . . . . . 42
1.8 Covariance and Correlation . . . . . . . . . . . . . . . . . . . . . . . 44
1.9 Functions of Random Variables . . . . . . . . . . . . . . . . . . . . . 47
1.10 Special Random Variable . . . . . . . . . . . . . . . . . . . . . . . . . 48

2 Continuous Random Variables 57


2.1 Special Random Variable . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.2 Derived Distributions . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.3 Continuous random vector . . . . . . . . . . . . . . . . . . . . . . . . 68
2.4 The Bivariate Normal PDF . . . . . . . . . . . . . . . . . . . . . . . 71

3
Probability and Statistics

CHAPTER 1. SAMPLE SPACE AND PROBABILITY


Probability and Statistics 6

English Terminologies Thuật ngữ tiếng Việt


Probbility Xác suất
Probability Model Mô hình xác suất
Experiment Thí nghiệm/ Phép thử
Sample Space Không gian mẫu
Probability law Luật xác suất
Outcome Kết quả
Event Biến cố
Disjoint events biến cố rời nhau/ xung khắc nhau
Conditional probability Xác suất có điều kiện
Multiplication Rule Quy tắc nhân
Sum rule Quy tắc cộng
Total probability theorem Định lý xác suất đầy đủ
Bayes’ Rule Quy tắc Bayes
Independence Sự độc lập

Nguyen Thi Nhung - Division of Mathematics


Probability and Statistics 7

Fig1. Toss a Coin

Nguyen Thi Nhung - Division of Mathematics


Probability and Statistics 8

Fig2. Roll a Die

Nguyen Thi Nhung - Division of Mathematics


Probability and Statistics 9

Fig3. Deck of Cards

Nguyen Thi Nhung - Division of Mathematics


Probability and Statistics 10

Fig4. Ranks and Suits

Nguyen Thi Nhung - Division of Mathematics


Chương 1

Sample Space and Probability

1.1 Sample space and Events

Problem 1. Nêu định nghĩa: phép thử, kết quả phép thử, không gian mẫu và biến
cố trong phép thử. Cho ví dụ.

Problem 2. Nêu định nghĩa tổng (hợp) và tích (giao) của hai biến cố, biến cố đối
của một biến cố. Cho ví dụ.

Problem 3. Thế nào là hai biến cố xung khắc, các biến cố loại trừ nhau. Cho ví
dụ.

Problem 4. Nêu các tiên đề xác suất.

Problem 5. Dựa trên các tiên đề xác suất, hãy chứng minh các công thức sau.

1. P (∅) = 0

2. P (Ā) = 1 − P (A) (Quy tắc phần bù)

3. A ⊂ B ⇒ P (A) ≤ P (B)

4. P (A ∪ B) = P (A) + P (B) − P (A ∩ B) (Quy tắc cộng)

5. P (A ∪ B) ≤ P (A) + P (B)

11
1.1. Sample space and Events 12

Problem 6. An experiment consists of tossing a coin three times. What is the sam-
ple space of this experiment? Which event corresponds to the experiment resulting
in more heads than tails?

Problem 7. Xét phép thử tung một đồng xu ba lần. Không gian mẫu của phép
thử này là gì? Biến cố nào tương ứng với phép thử có kết quả số mặt ngửa (head)
nhiều hơn số mặt sấp (tail)?

Problem 8. Two dice are thrown. Let E be the event that the sum of the dice is
odd, let F be the event that the first die lands on 1, and let G be the event that the
sum is 5. Describe the events EF, E ∪ F, F G, EF c , EF G
Gieo một con xúc xắc hai lần. Gọi E là biến cố tổng mặt trên của hai con xúc
xắc là lẻ, gọi F là biến cố mặt trên của con xúc xắc đầu là 1, và gọi G là biến cố
tổng của hai con xúc xắc là 5. Hãy mô tả các biến cố EF, E ∪ F, F G, E F̄ , EF G

Problem 9. A system is composed of four components, each of which is either


working or failed. Consider an experiment that consists of observing the status of
each component, and let the outcome of the experiment be given by the vector
(x1 , x2 , x3 , x4 ) where xi is equal to 1 if component i is working and is equal to 0 if
component i is failed.

a. How many outcomes are in the sample space of this experiment?

b. Suppose that the system will work if components 1 and 2 are both working,
or if components 3 and 4 are both working. Specify all the outcomes in the
event that the system works.

c. Let E be the event that components 1 and 3 are both failed. How many
outcomes are contained in event E ?

Hệ thống bao gồm bốn thành phần, mỗi thành phần trong số đó đang hoạt động
hoặc không hoạt động. Xét phép thử quan sát trạng thái của từng thành phần và
một kết quả trong phép thử được biểu diễn bởi một vecto (x1 , x2 , x3 , x4 ) trong đó xi
bằng 1 nếu thành phần i hoạt động và bằng 0 nếu thành phần i không hoạt động.

a. Có bao nhiêu kết quả trong phép thử này?

Nguyen Thi Nhung - Division of Mathematics


1.1. Sample space and Events 13

b. Giả sử rằng hệ thống sẽ hoạt động nếu thành phần thứ 1 và 2 cùng hoạt động,
hoặc nếu thành phần 3 và 4 cùng hoạt động. Xác định tất cả các kết quả trong
phép thử mà hệ thống hoạt động.

c. Gọi E là biến cố thành phần 1 và 3 đều không hoạt động. Có bao nhiêu kết
quả trong biến cố E?

Some extra exercises

Problem 10. Show that if E ⊂ F then P (E) ≤ P (F ). (Hint: Write F as the union
of two mutually exclusive events, one of them being E.)

Problem 11. Prove Boole’s inequality, namely that


n
! n
[ X
P Ei ≤ P (Ei ) .
i=1 i=1

Problem 12. If P (E) = .9 and P (F ) = .9, show that P (EF ) ≥ .8. In general,
prove Bonferroni’s inequality, namely that

P (EF ) ≥ P (E) + P (F ) − 1.

Problem 13. Prove that



a. P E F̄ = P (E) − P (EF ).

b. P Ē F̄ = 1 − P (E) − P (F ) + P (EF ).

Problem 14. Show that the probability that exactly one of the events E or F
occurs is equal to P (E) + P (F ) − 2P (EF ).

Problem 15. The inclusion-exclusion formulaThe inclusion-exclusion formula. Show


the following generalizations of the formula

P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

Let A, B, and C be events. Then,

P(A∪B∪C) = P(A)+P(B)+P(C)−P(A∩B)−P(B∩C)−P(A∩C)+P(A∩B∩C).

Nguyen Thi Nhung - Division of Mathematics


1.2. Calculating Probability 14

1.2 Calculating Probability

Problem 16. We draw the top 5 cards from a well-shuffled standard 52-card deck.
Find the probability that:

a. The 5 cards are 10, Jack, Queen, King and Ace with the same suit (Royal
flush).

b. The 5 cards are consecutive with the same suit (Straight flush excluding royal
flush).

c. The 5 cards include four with the same rank (four of a kind).

d. The 5 cards including three with the same rank and two with the same rank
(Full house).

e. The 5 cards with the same suit (Flush excluding royal and straight flush).

Bốc ngẫu nhiên 5 quân bài từ bộ bài 52 quân. Tính xác suất để trong 5 quân
bốc ra:

a. là các quân 10, J, Q, K và Át có cùng chất (Sảnh rồng).

b. là các quân liên tiếp có cùng chất (Sảnh - trừ sảnh rồng).

Nguyen Thi Nhung - Division of Mathematics


1.2. Calculating Probability 15

c. có một tứ quý (Tứ quý).

d. có một bộ gồm ba và một đôi (Cù lũ).

e. là 5 quân có cùng chất (Thùng trừ sảnh rồng và sảnh).

Problem 17. A woman has 10 keys, of which one will open her door. If she tries
the keys at random, discarding those that do not work, what is the probability that
she will open the door on her 3rd try? What if she does not discard previously tried
keys?
Một phụ nữ có 10 chiếc chìa khóa giống hệt nhau trong đó chỉ có một chiếc là
mở được cửa. Nếu cô ấy thử các chìa khóa một cách ngẫu nhiên, tính xác suất để
cô ấy có thể mở được cửa ở lần thứ 3 nếu

a. để riêng chìa không mở được.

b. không để riêng chìa không mở được.

Problem 18 (THE MONTY HALL PROBLEM/Bài toán Monty Hall). Consider a


television show (loosely modeled on a similar show hosted by Monty Hall) in which
three identical doors hide two goats and a luxury car. You, the contestant, can pick
any door and obtain the prize behind it. Assume that you prefer the car to the goat.
If you did not have any further information, your chance of picking the winning
door is clearly 1/3. Now, suppose that after you pick one of the doors—say, Door
1—the host opens one of the other doors—say, Door 2—and reveals a goat behind
it. Should you switch your choice to Door 3 or stay with Door 1?

Một chương trình truyền hình (được mô hình hóa tương tự chương trình được
dẫn bởi Monty Hall)có 3 cánh cửa giống hệt nhau, trong đó sau 2 cánh có một con
dê còn 1 cánh có ô tô. Một người chơi sẽ chọn một cửa bất kỳ trong ba ô và nhận

Nguyen Thi Nhung - Division of Mathematics


1.2. Calculating Probability 16

quà từ đó. Giả sử bạn thích ô tô hơn còn dê. Khi đó nếu không có thông tin gì thì
khả năng bạn chọn được cửa có ô tô là 1/3. Xét một tình huống như sau, bạn chọn
một cửa, chẳng hạn cửa 1, người dẫn chương trình mở một cửa có con dê, chẳng
hạn cửa 3 và đề nghị bạn đổi cửa bạn chọn lấy cửa số 2 còn lại. Bạn có đổi lựa chọn
của mình sang cửa thứ 2 hay vẫn giữ cửa 1?

Problem 19. Suppose that after 10 years of service, 40% of computers have prob-
lems with motherboards (MB), 30% have problems with hard drives (HD), and 15%
have problems with both MB and HD. What is the probability that a 10-year old
computer still has fully functioning MB and HD?
Giả sử rằng sau 10 năm sử dụng, 40% máy tính gặp sự cố với bảng mạch chính
(motherboards - MB), 30% gặp sự cố với ổ cứng (hard drives - HD) và 15% gặp sự
cố với cả MB và HD. Xác suất để một máy tính 10 tuổi vẫn còn MB và HD hoạt
động tốt là bao nhiêu?
Problem 20. A new computer virus can enter the system through e-mail or through
the internet. There is a 30% chance of receiving this virus through e-mail. There is
a 40% chance of receiving it through the internet. Also, the virus enters the system
simultaneously through e-mail and the internet with probability 0.15. What is the
probability that the virus does not enter the system at all?
Virus của một chiếc máy tính mới có thể xâm nhập vào hệ thống qua e-mail
hoặc qua internet. Người ta thấy có 30% khả năng nhận vi-rút này qua email, 40%
khả năng nhận được nó thông qua mạng Internet và vi rút xâm nhập vào hệ thống
đồng thời qua e-mail và Internet với xác suất 0.15. Tính xác suất vi rút không thể
xâm nhập vào hệ thống.
Problem 21. A shuttle’s launch depends on three key devices that may fail inde-
pendently of each other with probabilities 0.01, 0.02, and 0.02, respectively. If any
of the key devices fails, the launch will be postponed. Compute the probability for
the shuttle to be launched on time, according to its schedule.

Nguyen Thi Nhung - Division of Mathematics


1.2. Calculating Probability 17

Việc phóng tàu con thoi phụ thuộc vào ba thiết bị chính có thể hỏng với xác
suất tương ứng là 0.01, 0.02 và 0.02 một cách độc lập với nhau. Nếu bất kỳ thiết bị
quan trọng nào bị lỗi, việc phóng con tàu sẽ bị hoãn lại. Tính xác suất để tàu con
thoi được phóng đúng giờ, theo lịch trình của nó.

Problem 22. Successful implementation of a new system is based on three inde-


pendent modules. Module1 works properly with probability 0.96. For modules 2 and
3, these probabilities equal 0.95 and 0.90. Compute the probability that at least one
of these three modules fails to work properly.
Việc triển khai thành công một hệ thống mới dựa hoạt động của ba mô-đun độc
lập. Mô-đun 1 hoạt động đúng với xác suất 0.96. Đối với mô-đun 2 và 3, các xác suất
này bằng 0.95 và 0.90. Tính xác suất để ít nhất một trong ba mô-đun này không
hoạt động bình thường.

Problem 23. A spyware is trying to break into a system by guessing its password.
It does not give up until it tries 1 million different passwords. What is the probability
that it will guess the password and break in if by rules, the password must consist
of

a. 6 different lower-case letters

b. 6 different letters, some may be upper-case, and it is case-sensitive

c. any 6 letters, upper- or lower-case, and it is case-sensitive

d. any 6 characters including letters and digits

Một phần mềm gián điệp đang cố gắng xâm nhập vào hệ thống bằng cách đoán
mật khẩu của nó. Nó không bỏ cuộc cho đến khi thử 1 triệu mật khẩu khác nhau.
Xác suất để nó đoán mật khẩu và đột nhập là bao nhiêu nếu theo quy tắc, mật
khẩu phải bao gồm

a. 6 chữ thường khác nhau.

b. 6 chữ cái khác nhau, một số có thể viết hoa và phân biệt chữ hoa chữ thường.

c. 6 chữ cái bất kỳ, viết hoa hoặc viết thường và phân biệt chữ hoa chữ thường.

Nguyen Thi Nhung - Division of Mathematics


1.2. Calculating Probability 18

d. 6 ký tự bất kỳ bao gồm cả chữ cái và chữ số.

Problem 24 (De Mere’s puzzle). A 17th century gambler, the Chevalier de Méré,
made it to history by turning to Blaise Pascal for an explanation of his unexpectd
losses. Pascal combined his efforts with his friend Pierre de Fermat and the two of
them laid out mathematical foundations for the theory of probability.
Gamblers in the 1717 France were used to bet on the event (A) of getting at
least one 1 (ace) in four rolls of a dice. As a more trying variation, two die were
rolled 24 times with a bet on the event (B) of having at least one double ace.
According to the reasoning of Chevalier de Méré, two aces in two rolls are 1/6
as likely as 1 ace in one roll. (Which is correct.) To compensate, de Méré thought,
the two die should be rolled 6 times. And to achieve the probability of 1 ace in four
rolls, the number of the rolls should be increased four fold - to 24. Thus reasoned
Chevalier de Méré who expected a couple of aces to turn up in 24 double rolls with
the frequency of an ace in 4 single rolls. However, he lost consistently.
Calculate the probability of the event A and B and explain why "Méré lost
consistently!"

Chevalier de Méré, nhà văn, nhà triết học người Pháp là một nhân vật nghiện
đánh bạc. Ông đã đi vào lịch sử khi nhờ Blaise Pascal giải thích về những thua lỗ
không lường trước được của mình. Pascal đã cùng với người bạn của mình là Pierre

Nguyen Thi Nhung - Division of Mathematics


1.2. Calculating Probability 19

de Fermat cùng nhau nỗ lực trả lời câu hỏi của Méré và đã đặt ra nền tảng toán
học đầu tiên cho lý thuyết xác suất.
Những người đánh bạc ở Pháp năm 1717 thường đặt cược vào biến cố (A) nhận
được ít nhất một mặt 1 chấm (Ace) trong bốn lần gieo xúc xắc hoặc một dạng khác
là gieo một cặp con xúc xắc 24 lần và đặt cược cho biến cố (B) có ít nhất một lần
được cả hai mặt 1 chấm.
Theo lập luận của Chevalier de Méré, nhận 2 mặt 1 chấm trong hai gieo bằng
1/6 khả năng nhận được mặt 1 trong một lần gieo (Kết quả này được chỉ ra là
đúng.) Để bù lại, de Méré nghĩ, hai con xúc xắc cần được gieo 6 lần. Và để đạt được
xác suất xuất hiện mặt 1 chấm trong bốn lần gieo, số lần gieo phải tăng lên bốn
lần, tức là lên 24. Với lập luận này, Chevalier de Méré đã cho rằng tỷ lệ nhận được
một cặp 1 khi gieo một cặp xúc xắc 24 lần thì cũng bằng tỷ lệ nhận được mặt 1
chấm khi gieo một con xúc xắc 4 lần. Tuy nhiên, ông ấy đã thua liên tục.
Hãy tính xác suất của biến cố A và B và giải thích tại sao "Méré đã thua liên
tục!"

Problem 25 (The birthday problem/Nghịch lý ngày sinh nhật). Consider n people


who are attending a party. We assume that every person has an equal probability of
being born on any day during the year. independent of everyone else, and ignore the
additional complication presented by leap years (i.e. , assume that nobody is born
on February 29).

a. What is the probability that there are at least two have the same birthday?

b. What are the probabilities when n = 23 and n = 70.

Nguyen Thi Nhung - Division of Mathematics


1.2. Calculating Probability 20

Trong một bữa tiệc gồm có n người. Giả sử rằng mọi người trong bữa tiệc đều
có thể sinh vào một ngày bất kỳ trong năm một cách độc lập nhau và không có ai
sinh vào ngày 29 tháng Hai.

a. Tính xác suất có ít nhất hai người có cùng ngày sinh.

b. Xác suất ở câu (a) là bao nhiêu khi n = 23 và n = 70.

Problem 26. Giả sử một hệ thống gồm m thành phần. Giả sử xác suất để thành
phần thứ i hoạt động là pi . Đưa ra xác suất để hệ này hoạt động trong trường hợp:

• Hệ này được mắc nối tiếp;

• Hệ này được mắc song song.

Problem 27. In the following system, each component fails with probability 0.3
independently of other components. Compute the system’s reliability.
Trong hệ thống sau đây, mỗi thành phần không hoạt động với xác suất là 0.3
một cách độc lập nhau. Tính độ tin cậy của hệ thống.

Nguyen Thi Nhung - Division of Mathematics


1.2. Calculating Probability 21

Problem 28. Calculate the reliability of each system shown in the following Figure,
if components A, B, C, D, and E function properly with probabilities 0.9, 0.8, 0.7, 0.6,
and 0.5, respectively.
Tính độ tin cậy của mỗi hệ thống được cho trong hình dưới đây, nếu xác suất
để mỗi thành phần A, B, C, D, và E hoạt động lần lượt là 0.9, 0.8, 0.7, 0.6, và 0.5.

Nguyen Thi Nhung - Division of Mathematics


1.2. Calculating Probability 22

Some extra exercises

Problem 29. A group of 5 boys and 10 girls is lined up in random order — that
is, each of the 15! permutations is assumed to be equally likely.

a. What is the probability that the person in the 4th position is a boy?

b. What about the person in the 12th position?

c. What is the probability that a particular boy is in the 3rd position?

Problem 30. A closet contains 8 pairs of shoes. If 4 shoes are randomly selected,
what is the probability that there will be

a. no complete pair.

b. exactly 1 complete pair?

Problem 31. Of three cards, one is painted red on both sides; one is painted black
on both sides; and one is painted red on one side and black on the other. A card
is randomly chosen and placed on a table. If the side facing up is red, what is the
probability that the other side is also red?

Problem 32. Ninety students, including Joe and Jane, are to be split into three
classes of equal size, and this is to be done at random. What is the probability that
Joe and Jane end up in the same class?

Problem 33. Three computer viruses arrived as an e-mail attachment. Virus A


damages the system with probability 0.4. Independently of it, virus B damages the
system with probability 0.5. Independently of A and B, virus C damages the system
with probability 0.2. What is the probability that the system gets damaged?

Problem 34. A computer program is tested by 5 independent tests. If there is


an error, these tests will discover it with probabilities 0.1, 0.2, 0.3, 0.4, and 0.5,
respectively. Suppose that the program contains an error. What is the probability
that it will be found

a. by at least one test?

Nguyen Thi Nhung - Division of Mathematics


1.2. Calculating Probability 23

b. by at least two tests?

c. by all five tests?

Problem 35. A building is examined by policemen with four dogs that are trained
to detect the scent of explosives. If there are explosives in a certain building, and
each dog detects them with probability 0.6, independently of other dogs, what is the
probability that the explosives will be detected by at least one dog?

Problem 36. An important module is tested by three independent teams of in-


spectors. Each team detects a problem in a defective module with probability 0.8.
What is the probability that at least one team of inspectors detects a problem in a
defective module?

Problem 37. A computer program consists of two blocks written independently by


two different programmers. The first block has an error with probability 0.2. The
second block has an error with probability 0.3. If the program returns an error, what
is the probability that there is an error in both blocks?

Problem 38. Three highways connect city A with city B. Two highways connect
city B with city C. During a rush hour, each highway is blocked by a traffic accident
with probability 0.2, independently of other highways.

a. Compute the probability that there is at least one open route from A to C.

b. How will a new highway, also blocked with probability 0.2 independently of
other highways, change the probability in (a) if it is built

i. between A and B?
ii. between B and C?
iii. between A and C?

Problem 39. An electrical system consists of identical components that are oper-
ational with probability p independently of other components. The components are
connected in three subsystems, as shown in the figure. The system is operational if
there is a path that starts at point A, ends at point B, and consists of operational
components. This is the same as requiring that all three subsystems are operational.
What are the probabilities that the three subsystems, as well asthe entire system,
are operational?

Nguyen Thi Nhung - Division of Mathematics


1.2. Calculating Probability 24

Figure 1: A system of identical components that consists of the three subsystems


1, 2, and 3. The systemis operational if there is a path that starts at point A, ends
at point B, and consists of operational components.

Problem 40 (The Chess Problem). * This year’s Belmont chess champion is to be


selected by the following procedure. Bo and Ci, the leading challengers, first play a
two-game match. If one of them wins both games, he gets to play a two-game second
round with Al, the current champion. Al retains his championship unless a second
round is required and the challenger beats Al in both games. If Al wins the initial
game of the second round, no more games are played.
Furthermore, we know the following:

• The probability that Bo will beat Ci in any particular game is 0.6.

• The probability that Al will beat Bo in any particular game is 0.5.

• The probability that Al will beat Ci in any particular game is 0.7.

Assume no tie games are possible and all games are independent.

a. Determine the apriori probabilities that

i. the second round will be required.


ii. Bo will win the first round.
iii. Al will retain his championship this year.

b. Given that the second round is required, determine the conditional probabili-
ties that

Nguyen Thi Nhung - Division of Mathematics


1.3. Conditional Probability and independence 25

i. Bo is the surviving challenger.


ii. Al retains his championship.

c. Given that the second round was required and that it comprised only one
game, what is the conditional probability that it was Bo who won the first
round?

Problem 41. Out of the students in a class, 60% are geniuses, 70% love chocolate,
and 40% fall into both categories. Determine the probability that a randomly selected
student is neither a genius nor a chocolate lover.

Problem 42. A six-sided die is loaded in a way that each even face is twice as likely
as each odd face. All even faces are equally likely, as are all odd faces. Construct
a probabilistic model for a single roll of this die and find the probability that the
outcome is less than 4.

Problem 43. A four-sided die is rolled repeatedly, until the first time (if ever) that
an even number is obtained. What is the sample space for this experiment?

Problem 44. * You enter a special kind of chess tournament , in which you play
one game with each of three opponents, but you get to choose the order in which you
play your opponents, knowing the probability of a win against each. You win the
tournament if you win two games in a row, and you want to maximize the probability
of winning. Show that it is optimal to play the weakest opponent second, and that
the order of playing the other two opponents does not matter.

1.3 Conditional Probability and independence

Problem 45. Phát biểu công thức tính xác suất có điều kiện, công thức nhân tổng
quát và cho ví dụ.

Problem 46. Thế nào là hai biến cố độc lập và cho ví dụ. Nêu những cách có thể
kiểm tra sự độc lập của hai biến cố.

Problem 47. We roll two fair 6-sided dice. Each one of the 36 possible outcomes
is assumed to be equally likely.

Nguyen Thi Nhung - Division of Mathematics


1.3. Conditional Probability and independence 26

a. Find the probability that doubles are rolled.

b. Given that the roll results in a sum of 4 or less, find the conditional probability
that doubles are rolled.

c. Find the probability that at least one die roll is a 6.

d. Given that the two dice land on different numbers, find the conditional prob-
ability that at least one die roll is a 6.

Gieo hai con xúc xắc cân đối và đồng chất.

a. Tính xác suất mặt trên của hai con xúc xắc như nhau.

b. Tính xác suất hai mặt trên hai con xúc xắc như nhau biết tổng số chấm của
không vượt quá 4.

c. Tính xác suất mà ít nhất một mặt của con xúc xắc là 6.

d. Biết rằng mặt trên của hai con xúc xắc khác nhau, tính xác suất ít nhất một
mặt là 6.

Problem 48. Fifty-two percent of the students at a certain college are females.
Five percent of the students in this college are majoring in computer science. Two
percent of the students are women majoring in computer science. If a student is
selected at random, find the conditional probability that

a. this student is female, given that the student is majoring in computer science;

b. this student is majoring in computer science, given that the student is female.

Một trường đại học có 52% sinh viên là nữ, 5% sinh viên theo học ngành Khoa
học máy tính và 2% sinh viên nữ học ngành Khoa học máy tính. Một sinh viên được
chọn ngẫu nhiên, tính xác suất

a. sinh viên này là nữ biết bạn ấy học ngành Khoa học máy tính;

b. sinh viên này học ngành Khoa học máy tính biết bạn ấy là nữ.

Nguyen Thi Nhung - Division of Mathematics


1.3. Conditional Probability and independence 27

Problem 49. Among employees of a certain firm, 70% know C/C++, 60% know
Fortran, and 50% know both languages. What portion of programmers

a. does not know Fortran?

b. does not know Fortran and does not know C/C++?

c. knows C/C++ but not Fortran?

d. knows Fortran but not C/C++?

e. If someone knows Fortran, what is the probability that he/she knows C/C++
too?

f. If someone knows C/C++, what is the probability that he/she knows Fortran
too?

Trong các nhân viên của một công ty có 70% biết C/C + +, 60% biết Fortran
và 50% biết cả hai ngôn ngữ. Tính tỷ lệ nhân viên

a. không biết Fortran?

b. không biết Fortran và không biết C/C + +?

c. biết C/C++ nhưng không biết Fortran?

d. biết Fortran nhưng không biết C/C + +?

e. Nếu một người biết Fortran, xác suất để nhận viên này cũng biết C/C++ là
bao nhiêu?

f. Nếu một người biết C/C + +, xác suất để người này cũng biết Fortran là bao
nhiêu?

Problem 50. A batch of one hundred items is inspected by testing four randomly
selected items. If one of the four is defective, the batch is rejected. What is the
probability that the batch is accepted if it contains five defectives?
Người ta kiểm tra một lô gồm 100 sản phẩm bằng cách chọn ngẫu nhiên ra 4
sản phẩm để kiểm tra. Nếu một trong 4 sản phẩm bị lỗi, lô hàng bị loại. Xác suất
để lô được chấp nhận là bao nhiêu nếu nó có 5 sản phẩm bị lỗi trong lô hàng?

Nguyen Thi Nhung - Division of Mathematics


1.3. Conditional Probability and independence 28

Problem 51. A bin contains 5 defective (that immediately fail when put in use),
10 partially defective (that fail after a couple of hours of use), and 25 acceptable
transistors. A transistor is chosen at random from the bin and put into use. If it
does not immediately fail, what is the probability it is acceptable?
Một thùng bóng bán dẫn có 5 bị lỗi (hỏng ngay lập tức khi đưa vào sử dụng),
10 bị lỗi một phần (hỏng sau vài giờ sử dụng) và 25 có thể dùng được. Một bóng
bán dẫn được chọn ngẫu nhiên từ thùng và đưa vào sử dụng. Nếu nó không bị lỗi
ngay lập tức, thì xác suất nó có thể chấp nhận được là bao nhiêu?

Problem 52. There are two local factories that produce radios. Each radio produced
at factory A is defective with probability 0.05, whereas each one produced at factory
B is defective with probability 0.01. Suppose you purchase two radios that were
produced at the same factory, which is equally likely to have been either factory A
or factory B. If the first radio that you check is defective, what is the conditional
probability that the other one is also defective?
Có hai nhà máy địa phương sản xuất vô tuyến (radio). Mỗi chiếc vô tuyến được
sản xuất tại nhà máy A bị lỗi với xác suất 0.05, trong khi mỗi chiếc được sản xuất
tại nhà máy B bị lỗi với xác suất 0.01. Giả sử bạn mua hai bộ đàm được sản xuất
tại cùng một nhà máy, có khả năng như nhau là của nhà máy A hoặc nhà máy B.
Nếu chiếc radio đầu tiên mà bạn kiểm tra bị lỗi, thì xác suất có điều kiện là chiếc
kia cũng bị lỗi là bao nhiêu?

Problem 53. A pair of fair dice is rolled. Let E denote the event that the sum of
the dice is equal to 7.

a. Show that E is independent of the event that the first die lands on 4.

b. Show that E is independent of the event that the second die lands on 3.

Gieo hai con xúc xắc cân đối và đồng chất. Gọi E là biến cố tổng của hai con
xúc xắc là 7.

a. Chỉ ra rằng E độc lập với biến cố mặt trên của con xúc xắc đầu là 4.

b. Chỉ ra rằng E độc lập với biến cố mặt trên của con xúc xắc thứ hai là 3.

Nguyen Thi Nhung - Division of Mathematics


1.3. Conditional Probability and independence 29

Problem 54. Events A and B are independent. Show, intuitively and mathemati-
cally, that:

a. Their complements are also independent.

b. If they are disjoint, then P(A) = 0 or P(B) = 0.

c. If they are exhaustive, then P(A) = 1 or P(B) = 1.

Giả sử A và B là hai biến cố độc lập. Hãy chỉ ra về mặt trực giác và bằng toán
học các khẳng định sau.

a. Các biến cố đối của A và B cũng độc lập.

b. Nếu A và B là rời nhau thì P (A) = 0 hoặc P (B) = 0.

c. Nếu A và B là vét cạn (hợp lại bằng không gian mẫu), thì P (A) = 1 hoặc
P (B) = 1.

Some extra exercises

Problem 55. Let A and B be events. Show that P (A ∩ B | B) = P (A | B),


assuming that P (B) > 0.

Problem 56. A coin is tossed twice. Alice claims that the event of two heads is at
least as likely if we know that the first toss is a head than if we know that at least
one of the tosses is a head. Is she right? Does it make a difference if the coin is fair
or unfair? How can we generalize Alice’s reasoning?

Problem 57. We are given three coins: one has heads in both faces, the second has
tails in both faces, and the third has a head in one face and a tail in the other. We
choose a coin at random, toss it, and the result is heads. What is the probability
that the opposite face is tails?

Problem 58. The king’s sibling. The king has only one sibling. What is the proba-
bility that the sibling is male? Assume that every birth results in a boy with proba-
bility /2, independent of other births. Be careful to state any additional assumptions
you have to make in order to arrive at an answer.

Nguyen Thi Nhung - Division of Mathematics


1.4. Total Probability Theorem and Bayes’ Rule 30

Problem 59. * A power utility can supply electricity to a city from n different
power plants. Power plant i fails with probability pi , independent of the others.
(a) Suppose that any one plant can produce enough electricity to supply the entire
city. What is the probability that the city will experience a black-out? (b) Suppose
that two power plants are necessary to keep the city from a black-out. Find the
probability that the city will experience a black-out.
Problem 60. * A system composed of n separate components is said to be a parallel
system if it functions when at least one of the components functions. (See Figure
3.7.) For such a system, if component i, independent of other components, functions
with probability pi , i = 1, . . . , n, what is the probability the system functions?

1.4 Total Probability Theorem and Bayes’ Rule

Problem 61. Nêu định nghĩa về nhóm đầy đủ các biến cố. Phát biểu quy tắc xác
suất đầy đủ và công thức Bayes.
Problem 62. Suppose that an insurance company classifies people into one of three
classes — good risks, average risks, and bad risks. Their records indicate that the
probabilities that good, average, and bad risk persons will be involved in an accident
over a 1-year span are, respectively, .05, .15, and .30. If 20 percent of the population
are “good risks,” 50 percent are “average risks,” and 30 percent are “bad risks,”
what proportion of people have accidents in a fixed year? If policy holder A had no
accidents in 1987, what is the probability that he or she is a good (average) risk?
Giả sử một công ty bảo hiểm chia người dân ra ba nhóm: ít rủi ro, rủi ro trung
bình, rất rủi ro. Số liệu thu thập được cho thấy trong một năm một người thuộc

Nguyen Thi Nhung - Division of Mathematics


1.4. Total Probability Theorem and Bayes’ Rule 31

nhóm ít rủi ro, rủi ro trung bình, rất rủi ro có thể gặp tai nạn với xác suất là 0.05,
0.15, 0.30. Cho biết 20% số người dân thuộc nhóm ít rủi ro, 50% thuộc nhóm rủi ro
trung bình, và 30% thuộc nhóm rất rủi ro.

a. Tỷ lệ số người gặp tai nạn trong một năm là bao nhiêu?

b. Nếu một người nào đó không bị tai nạn trong năm 2009, xác suất để người đó
thuộc nhóm ít rủi ro là bao nhiêu?
Problem 63. In answering a question on a multiple choice test, a student either
knows the answer or she guesses. Let p be the probability that she knows the answer
and 1 − p the probability that she guesses. Assume that a student who guesses at
the answer will be correct with probability 1/m, where m is the number of multiple
choice alternatives. What is the conditional probability that a student knew the
answer to a question given that she answered it correctly?
Trong một bài trắc nghiệm, một sinh viên có thể biết câu trả lời hoặc đoán đáp
án. Giả sử xác suất để cô ấy trả lời đúng câu hỏi là 0.9. Giả sử xác suất để sinh viên
trả lời đúng câu hỏi khi cô ấy đoán đáp án là 1/4. Tính xác suất để một sinh viên
biết câu đáp án khi cô ấy trả lời đúng.
Problem 64. All athletes at the Olympic games are tested for performance-enhancing
steroid drug use. The imperfect test gives positive results (indicating drug use) for
90% of all steroid-users but also (and incorrectly) for 2% of those who do not use
steroids. Suppose that 5% of all registered athletes use steroids. If an athlete is tested
negative, what is the probability that he/she uses steroids?
Tất cả các vận động viên tại Thế vận hội đều được kiểm tra xem có sử dụng
thuốc steroid để tăng cường thành tích hay không. Thử nghiệm không hoàn hảo cho
kết quả dương tính (cho thấy có sử dụng ma túy) cho 90% tất cả những người sử
dụng steroid và (không chính xác) đối với 2% những người không sử dụng steroid.
Giả sử rằng 5% các vận động viên tham gia thi đấu sử dụng steroid. Nếu một vận
động viên được xét nghiệm âm tính, xác suất người này sử dụng steroid là bao
nhiêu?
Problem 65. You ask your neighbor to water a sickly plant while you are on
vacation. Without water it will die with probability 0.8; with water it will die with
probability 0.15. You are 90 percent certain that your neighbor will remember to
water the plant.

Nguyen Thi Nhung - Division of Mathematics


1.4. Total Probability Theorem and Bayes’ Rule 32

a. What is the probability that the plant will be alive when you return?

b. If it is dead, what is the probability your neighbor forgot to water it?

Bạn nhờ hàng xóm của bạn tưới nước cho một cây hoa mới trồng của bạn khi
bạn đi du lịch. Loại cây này nếu không tưới nước sẽ bị chết với xác suất 0.8, nếu
được tưới nước thì xác suất bị chết là 0.15. Biết rằng người hàng xóm của bạn sẽ
tưới nước cho cây với xác suất 90%.

a. Xác suất để cây hoa của bạn vẫn còn sống khi bạn trở về là bao nhiêu?

b. Nếu cây hoa của bạn bị chết, xác suất để người hàng xóm đã quên tưới là bao
nhiêu?

Some more Exercises

Problem 66. A laboratory blood test is 99 percent effective in detecting a certain


disease when it is, in fact, present. However, the test also yields a “false positive”
result for 1 percent of the healthy persons tested. (That is, if a healthy person is
tested, then, with probability .01, the test result will imply he or she has the disease.)
If .5 percent of the population actually has the disease, what is the probability a
person has the disease given that his test result is positive?
Xét nghiệm máu cho khả năng phát hiện đến 99% một loại bệnh (tức là một
người mắc bệnh khi đi xét nghiệm cho kết quả dương tính với xác suất là 0.99). Tuy
nhiên xét nghiệm cũng cho những kết quả "dương tính giả" cho 5% những người
khỏe mạnh (tức là, khi một người khỏe mạnh được tiến hành xét nghiệm thì xác
suất là 0.05 để kết quả xét nghiệm cho thấy anh ta bị mắc bệnh). Cho biết 0.5%
dân số thực sự mắc loại bệnh này.

a. Một người xét nghiệm có kết quả dương tính, tính xác suất để anh ta mắc bệnh?

b. Một người đi xét nghiệm có kết quả âm tính, tính xác suất để anh ta không mắc
bệnh.
Problem 67. Each of 2 balls is painted black or gold and then placed in an urn.
Suppose that each ball is colored black with probability 1/2, and that these events
are independent.

Nguyen Thi Nhung - Division of Mathematics


1.4. Total Probability Theorem and Bayes’ Rule 33

a. Suppose that you obtain information that the gold paint has been used (and
thus at least one of the balls is painted gold). Compute the conditional prob-
ability that both balls are painted gold.

b. Suppose, now, that the urn tips over and 1 ball falls out. It is painted gold.
What is the probability that both balls are gold in this case? Explain.

Có ba ngăn kéo, một ngăn có hai đồng tiền vàng, một ngăn có hai đồng tiền
bạc, và một ngăn có một đồng tiền vàng và một đồng tiền bạc. Rút ra một ngăn
kéo một cách ngẫu nhiên và từ ngăn kéo này lấy ngẫu nhiên ra một đồng tiền. Giả
sử được một đồng tiền vàng. Hỏi xác suất để ngăn kéo được rút ra là ngăn kéo chứa
hai đồng tiền vàng là bao nhiêu?

Problem 68 (Bonferroni’s inequality). a. Prove that for any two events A and
B, we have
P(A ∩ B) ≥ P(A) + P(B) − 1

b. Generalize to the case of n events A1 , A2 , . . . , An , by showing that

P (A1 ∩ A2 ∩ · · · ∩ An ) ≥ P (A1 ) + P (A2 ) + · · · + P (An ) − (n − 1)

Problem 69. The inclusion-exclusion formula* The inclusion-exclusion formula.


Show the following generalizations of the formula

P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

Let A1 , A2 , . . . , An be events. Let S1 = {i | 1 ≤ i ≤ n}, S2 = {(i1 , i2 ) | 1 ≤ i1 <


i2 ≤ n} , and more generally, let Sm be the set of all m -tuples (i1 , . . . , im ) of indices
that satisfy 1 ≤ i1 < i2 < · · · < im ≤ n. Then.
X X
P (∪nk=1 Ak ) = P (Ai ) − P (Ai1 ∩ Ai2 )
i∈S1 (ı1 ,i2 )∈S2
X
+ P (Ai1 ∩ Ai2 ∩ Ai3 ) − · · · + (−1)n−1 P (∩nk=1 Ak )
(i1 ,i2 ,i3 )∈S3

Problem 70. A town contains 4 television repairmen. If 4 sets break down, what
is the probability that exactly 2 of the repairmen are called? What assumptions are
you making?

Nguyen Thi Nhung - Division of Mathematics


1.4. Total Probability Theorem and Bayes’ Rule 34

Problem 71. Let A and B be events such that A ⊂ B. Can A and B be indepen-
dent?

Problem 72. * Alice and Bob have 2n + 1 coins, each coin with probability of
heads equal to 1/2. Bob tosses n + 1 coins, while Alice tosses the remaining n coins.
Assuming independent coin tosses , show that the probability that after all coins
have been tossed , Bob will have gotten more heads than Alice is 1/2.

Problem 73. We deal from a well-shuffled 52-card deck. Calculate the probability
that the 13th card is the first king to be dealt.

Problem 74. A well-shuffled 52-card deck is dealt to 4 players. Find the probability
that each of the players gets an ace.

Problem 75. Each of 2 cabinets identical in appearance has 2 drawers. Cabinet A


contains a silver coin in each drawer, and cabinet B contains a silver coin in one of
its drawers and a gold coin in the other. A cabinet is randomly selected, one of its
drawers is opened, and a silver coin is found. What is the probability that there is
a silver coin in the other drawer?

Problem 76. * Aparallel system functions whenever at least one of its components
works. Consider a parallel system of n components, and suppose that each com-
ponent independently works with probability 1/2. Find the conditional probability
that component 1 works, given that the system is functioning.

Problem 77 (Communication through a noisy channel). * A source transmits a


message (a string of symbols) through a noisy communication channel. Each symbol
is 0 or 1 with probability p and 1 − p, respectively, and is received incorrectly
with probability ϵ0 and ϵ1 , respectively (see Fig. 1.18 ). Errors in different symbol
transmissions are independent.

Nguyen Thi Nhung - Division of Mathematics


1.4. Total Probability Theorem and Bayes’ Rule 35

(a) What is the probability that the k th symbol is received correctly? (b) What
is the probability that the string of symbols 1011 is received correctly? (c) In an
effort to improve reliability, each symbol is transmitted three times and the received
string is decoded by majority rule. In other words, a 0 (or 1 ) is transmitted as 000
(or 111, respectively ), and it is decoded at the receiver as a (or 1) if and only if the
received three-symbol string contains at least two 0s (or Is, respectively). What is
the probability that a 0 is correctly decoded? (d) For what values of ϵ0 is there an
improvement in the probability of correct decoding of a 0 when the scheme of part
(c) is used? (e) Suppose that the scheme of part (c) is used. What is the probability
that a symbol was 0 given that the received string is 101?

Problem 78. * At a certain stage of a criminal investigation, the inspector in


charge is 60 percent convinced of the guilt of a certain suspect. Suppose now that
a new piece of evidence that shows that the criminal has a certain characteristic
(such as left-handedness, baldness, brown hair, etc.) is uncovered. If 20 percent of
the population possesses this characteristic.

a. how certain of the guilt of the suspect should the inspector now be if it turns
out that the suspect is among this group?

b. Let us now suppose that the new evidence is subject to different possible
interpretations, and in fact only shows that it is 90 percent likely that the
criminal possesses this certain characteristic. In this case, how likely would it be
that the suspect is guilty (assuming, as before, that he has this characteristic)?

Nguyen Thi Nhung - Division of Mathematics


1.4. Total Probability Theorem and Bayes’ Rule 36

English Terminologies Thuật ngữ tiếng Việt


Random variable Biến ngẫu nhiên
Discrete random variable Biến ngẫu nhiên rời rạc
Continuous random variable Biến ngẫu nhiên liên tục
Probability Mass Functions (PMF) Hàm xác suất
Cumulative distribution Function (CDF) Hàm phân phối
Probability density function (PDF) Hàm mật độ xác suất
Expectation of a variable Kỳ vọng của biến ngẫu nhiên
Mean of a variable Trung bình của biến ngẫu nhiên
Variance phương sai
standard deviation Độ lệch chuẩn
Binomial distribution Phân phối nhị thức
Poisson distribution Phân phối Poisson
Uniform distribution Phân phối đều
Normal distribution Phân phối chuẩn
Exponential distribution Phân phối mũ
Geometric distribution Phân phối hình học

Nguyen Thi Nhung - Division of Mathematics


1.5. Probability Mass Functions 37

1.5 Probability Mass Functions

Problem 79. Nêu định nghĩa biến ngẫu nhiên. Phân loại biến ngẫu nhiên và cho
ví dụ.

Problem 80. Định nghĩa hàm xác suất của biến ngẫu nhiên rời rạc và cho ví dụ.

Problem 81. Let X represent the difference between the number of heads and the
number of tails obtained when a coin is tossed n times. What are the possible values
of X?
Cho X là biến ngẫu nhiên chỉ hiệu giữa số mặt ngửa và số mặt sấp khi tung một
đồng xu n lần. Các giá trị có thể có của X là gì?

Problem 82. In Problem 81, if the coin is assumed fair, for n = 3, what are the
probabilities associated with the values that X can take on?
Trong Bài tập 81, nếu đồng xu cân đối đồng chất, với giá trị n = 3, thì xác suất
tương ứng với các giá trị mà X có thể nhận là bao nhiêu?

Problem 83. A computer virus is trying to corrupt two files. The first file will be
corrupted with probability 0.4. Independently of it, the second file will be corrupted
with probability 0.3.

a. Compute the probability mass function (pmf) of X, the number of corrupted


files.

b. Draw a graph of its cumulative distribution function (cdf).

Một vi-rút máy tính đang xâm nhập vào hai tệp. Tệp đầu tiên sẽ bị hỏng với
xác suất 0.4. Độc lập với nó, tệp thứ hai sẽ bị hỏng với xác suất 0.3.

a. Gọi X là số tệp bị hỏng. Tính hàm xác suất của X.

b. Lập hàm phân phối (hàm xác suất tích lũy) và vẽ đồ thị của nó.

Problem 84. A family has 5 natural children and has adopted 2 girls. Each natural
child has equal probability of being a girl or a boy, independent of the other children.
Find the PMF of the number of girls out of the 7 children.

Nguyen Thi Nhung - Division of Mathematics


1.6. Expectation, Mean, and Variance 38

Một gia đình có 5 người con đẻ và nhận nuôi 2 bé gái. Mỗi đứa con đẻ có thể là
con gái hoặc con trai với xác suất như nhau, độc lập với những đứa trẻ khác. Tìm
hàm xác suất của biến ngẫu nhiên chỉ bé gái trong số 7 đứa trẻ.

Problem 85. You just rented a large house and the realtor gave you 5 keys, one for
each of the 5 doors of the house. Unfortunately, all keys look identical. so to open
the front door, you try them at random.

a. Find the PMF of the number of trials you will need to open the door, under
the following alternative assumptions: (1) after an unsuccessful trial. you mark
the corresponding key. so that you never try it again. and (2) at each trial you
are equally likely to choose any key.

b. Repeat part (a) for the case where the realtor gave you an extra duplicate key
for each of the 5 doors.

Bạn vừa thuê một căn nhà lớn và chủ nhà đưa cho bạn 5 chiếc chìa khóa để mở
5 chiếc cửa trong căn nhà. Thật không may, tất cả các chìa khóa trông giống hệt
nhau, do đó để mở cửa chính để vào, bạn phải thử chúng một cách ngẫu nhiên.

a. Tìm hàm xác suất cho số lần thử cần thiết để mở được cửa trong hai trường
hợp sau. (1) sau khi không mở được một chiếc, bạn đánh dấu và không mở lại
nó nữa. (2) sau khi thử một chiếc mà không mở được, bạn không đánh dấu và
có thể mở lại nó một lần nữa.

b. Làm lại những yêu cầu của câu (a) cho trường hợp chủ nhà đưa cho bạn 2
chìa khóa cho mỗi cánh cửa.

1.6 Expectation, Mean, and Variance

Problem 86. Định nghĩa kỳ vọng và phương sai của biến ngẫu nhiên rời rạc và cho
ví dụ.

Problem 87. Định nghĩa moment và nêu công thức tính bậc n của một biến ngẫu
nhiên rời rạc. Đưa ra công thức liên hệ giữa moment bậc 2 với kỳ vọng và phương
sai của một biến ngẫu nhiên.

Nguyen Thi Nhung - Division of Mathematics


1.6. Expectation, Mean, and Variance 39

Problem 88. Nêu những tính chất của kỳ vọng và phương sai.

Problem 89. Compute the expected value of the random variable in Problem 123.

Problem 90. Compute the expected value of the random variable in Problem 82.

Problem 91. Compute the mean and variance of the number of heads that appear
in 3 flips of a fair coin.

Problem 92. Ten balls are randomly chosen from an urn containing 17 white and
23 black balls. Let X denote the number of white balls chosen. Compute E[X].

Problem 93. A computer program contains one error. In order to find the error,
we split the program into 6 blocks and test two of them, selected at random. Let X
be the number of errors in these blocks. Compute E(X).
Một chương trình máy tính có một lỗi. Để tìm ra lỗi, họ chia chương trình thành
6 khối và kiểm tra hai khối được chọn ngẫu nhiên trong số chúng. Gọi X là số lỗi
trong các khối này. Tính E(X).

Problem 94. Computer user tries to recall her password. She knows it can be one
of 4 possible passwords. She tries her passwords until she finds the right one. Let
X be the number of wrong passwords she uses before she finds the right one. Find
E(X) and V ar(X).
Một người dùng máy tính cố gắng nhớ lại mật khẩu của mình. Cô ấy biết nó có
thể là một trong 4 mật khẩu khả thi. Cô ấy thử mật khẩu của mình cho đến khi
tìm được mật khẩu đúng. Gọi X là số mật khẩu sai trước khi tìm thấy mật khẩu
đúng. Tìm E(X) và V ar(X).

Problem 95. An insurance company writes a policy to the effect that an amount
of money A must be paid if some event E occurs within a year. If the company
estimates that E will occur within a year with probability p, what should it charge
the customer so that its expected profit will be 10 percent of A?
Một công ty bảo hiểm viết một chính sách có hiệu lực nếu một số sự kiện E xảy
ra trong vòng một năm thì phải thanh toán một số tiền là A. Nếu công ty ước tính
rằng E sẽ xảy ra trong vòng một năm với xác suất p, thì họ nên tính phí cho khách
hàng là bao nhiêu để lợi nhuận kỳ vọng của họ sẽ là 10% của A?

Nguyen Thi Nhung - Division of Mathematics


1.6. Expectation, Mean, and Variance 40

Problem 96. A total of 4 buses carrying 148 students from the same school arrive
at a football stadium. The buses carry, respectively, 40, 33, 25, and 50 students.
One of the students is randomly selected. Let X denote the number of students that
were on the bus carrying this randomly selected student. One of the 4 bus drivers
is also randomly selected. Let Y denote the number of students on her bus.

a. Which of E[X] or E[Y ] do you think is larger? Why?

b. Compute E[X] and E[Y ].

Có 4 chiếc xe buýt chở 148 học sinh cùng trường đến một sân vận động bóng đá.
Các xe buýt lần lượt chở 40, 33, 25 và 50 học sinh. Một học sinh được chọn ngẫu
nhiên. Gọi X là số học sinh trên chiếc xe buýt chở học sinh được chọn ngẫu nhiên
này. Chọn ngẫu nhiên một tài xế xe buýt. Gọi Y là số học sinh trên xe buýt của tài
xế này.

a. So sánh E[X] với E[Y ] và đưa ra lời giải thích.

b. Tính E[X] và E[Y ].

Problem 97. If E[X] = 2 and E [X 2 ] = 8, calculate (a) E [(2 + 4X)2 )] and (b)
E [X 2 + (X + 1)2 ]

Problem 98. Suppose that X is equally likely to take on any of the values 1, 2, 3, 4.
Compute E[X] and Var(X).

Problem 99. Let pi = P {X = i} and suppose that p1 + p2 + p3 = 1. If E[X] = 2,


what values of p1 , p2 , p3 (a) maximize and (b) minimize Var(X) ?

Problem 100. Every day, the number of network blackouts has a distribution (prob-
ability mass function)

x 0 1 2
P (x) 0.7 0.2 0.1

A small internet trading company estimates that each network blackout results in
a $500 loss. Compute expectation and variance of this company’s daily loss due to
blackouts.

Nguyen Thi Nhung - Division of Mathematics


1.6. Expectation, Mean, and Variance 41

Số lần mất mạng hàng ngày trong một hệ thống được cho trong bảng phân phối
xác suất sau.

x 0 1 2
P (x) 0.7 0.2 0.1

Một công ty kinh doanh internet nhỏ ước tính rằng mỗi lần mất mạng, công ty sẽ
bị lỗ 500$. Tính toán kỳ vọng và phương sai của khoản lỗ hàng ngày của công ty
này do mất điện.

Problem 101. There is one error in one of five blocks of a program. To find the
error, we test three randomly selected blocks. Let X be the number of errors in these
three blocks. Compute E(X) and Var(X).
Có một lỗi trong một trong năm khối của chương trình. Để tìm lỗi, người ta
kiểm tra ba khối được chọn ngẫu nhiên. Gọi X là số lỗi trong ba khối này. Tính
E(X) và Var(X).

Problem 102. A software package consists of 12 programs, five of which must be


upgraded. If 4 programs are randomly chosen for testing,

a. What is the probability that at least two of them must be upgraded?

b. What is the expected number of programs, out of the chosen four, that must
be upgraded?

Một gói phần mềm bao gồm 12 chương trình, trong đó có năm chương trình phải
được nâng cấp. Người ta chọn ngẫu nhiên 4 chương trình để thử nghiệm.

a. Tính xác suất để ít nhất hai trong số 4 chương trình phải được nâng cấp.

b. Tính kỳ vọng của số chương trình cần được nâng cấp trong 4 chương trình
được chọn ra.

Problem 103. The number of home runs scored by a certain team in one baseball
game is a random variable with the distribution

x 0 1 2
P (x) 0.4 0.4 0.2

Nguyen Thi Nhung - Division of Mathematics


1.7. Distribution of random vector 42

The team plays 2 games. The number of home runs scored in one game is independent
of the number of home runs in the other game. Let Y be the total number of home
runs. Find E(Y ) and Var(Y ).
Số lần home runs scored (dùng để chỉ một cú đánh quả bóng xa đến độ người
đánh quả bóng có đủ thì giờ chạy quanh các gôn để trở về chỗ cũ và thắng điểm)
bởi một đội trong một trận bóng chày là một biến ngẫu nhiên có phân phối

x 0 1 2
P (x) 0.4 0.4 0.2

Đội bóng thi đấu 2 trận. Số lần home runs scored trong một trận độc lập với số lần
home runs trong một trận khác. Gọi Y là tổng số home runs. Tính E(Y ) và Var(Y ).

1.7 Distribution of random vector

Problem 104. Định nghĩa hàm xác suất đồng thời của một véc tơ ngẫu nhiên hai
chiều (X, Y ). Nêu công thức tính hàm xác suất biên của X và Y từ hàm xác suất
đồng thời của (X, Y ).

Problem 105. Cho X và Y là hai biến ngẫu nhiên rời rạc xác định trên cùng một
không gian xác suất. Nêu định nghĩa hàm xác suất của X đối với Y .

Problem 106. Cho X và Y là hai biến ngẫu nhiên rời rạc xác định trên cùng một
không gian xác suất. Nêu định nghĩa hàm xác suất của X đối với Y .

Problem 107. Cho X và Y là hai biến ngẫu nhiên rời rạc xác định trên cùng một
không gian xác suất. Định nghĩa kỳ vọng điều kiện của biến ngẫu nhiên X đối với
Y.

Problem 108. Cho X và Y là hai biến ngẫu nhiên rời rạc xác định trên cùng một
không gian xác suất. Khi nào X và Y là hai biến ngẫu nhiên độc lập với nhau.

Problem 109. Consider two random variables X and Y with joint PMF given in
the following table.

Nguyen Thi Nhung - Division of Mathematics


1.7. Distribution of random vector 43

Y =0 Y =1 Y =2
1 1 1
X=0
6 4 8
1 1 1
X=1
8 6 6

a. Find P (X = 0, Y ≤ 1).

b. Find the marginal PMFs of X and Y .

c. Find P (Y = 1 | X = 0).

d. Are X and Y independent?

Problem 110. Consider two random variables X and Y with joint PMF given in
Table 5.3.
Y =2 Y =4 Y =5
1 1 1
X=1 12 24 24
1 1 1
X=2 6 12 8
1 1 1
X=3 4 8 12

a. Find P (X ≤ 2, Y ≤ 4).

b. Find the marginal PMFs of X and Y .

c. Find P (Y = 2 | X = 1).

d. Are X and Y independent?

Problem 111. I have a bag containing 40 blue marbles and 60 red marbles. I choose
10 marbles (without replacement) at random. Let X be the number of blue marbles
and y be the number of red marbles. Find the joint PMF of X and Y .
Problem 112. The joint PMF of the random variables X and Y is given by the
following table:

y=3 c c 2c
y=2 2c 0 4c
y=1 3c c 6c
x=1 x=2 x=3

Nguyen Thi Nhung - Division of Mathematics


1.8. Covariance and Correlation 44

a. Find the value of the constant c.

b. Find pY (2), PY (y).

c. Find PX|Y (1 | 2), PX|Y (x | 2).

d. Find E(X) and E(X | Y = 2).

c. Consider the random variable Z = Y X 2 . Find E(Z), E[Z | Y = 2].

d. Are X and Y independent?

e. Find the conditional variance of Y given that X = 2.

Problem 113. A product is classified according to the number of defects it contains


and the factory that produces it. Let X1 and X2 be the random variables that
represent the number of defects per unit (taking on possible values of 0, 1, 2, or
3 ) and the factory number (taking on possible values 1 or 2 ), respectively. The
entries in the table represent the joint possibility mass function of a randomly chosen
product.
X1
X2 1 2
1 1
0 8 16
1 1
1 16 16
3 1
2 16 8
1 1
3 8 4

a. Find the marginal probability distributions of X1 and X2 .

b. Find E [(X1 )] , E [(X2 )] , Var (X1 ) , Var (X2 ) , and Cov (X1 , X2 )

1.8 Covariance and Correlation

Problem 114. Cho X và Y là hai biến ngẫu nhiên. Định nghĩa hiệp phương sai
của X và Y . Dấu của hiệp phương sai liên hệ thế nào với sự biến thiên giữa X và
Y.

Nguyen Thi Nhung - Division of Mathematics


1.8. Covariance and Correlation 45

Problem 115. Cho X và Y là hai biến ngẫu nhiên. Định nghĩa hệ số tương quan
của X và Y . Nêu tính chất của hệ số tương quan.

Problem 116. Chứng minh các tính chất sau về hiệp phương sai và hệ số tương
quan của hai biến ngẫu nhiên X và Y .

• Var(aX + bY + c) = a2 Var(X) + b2 Var(Y ) + 2ab Cov(X, Y )

• Cov(aX + bY, cZ + dW ) = ac Cov(X, Z) + ad Cov(X, W ) + bc Cov(Y, Z) +


bd Cov(Y, W )

• Cov(X, Y ) = Cov(Y, X)

• ρ(X, Y ) = ρ(Y, X)

In particular

• Var(aX + b) = a2 Var(X)

• Cov(aX + b, cY + d) = ac Cov(X, Y )

• ρ(aX + b, cY + d) = ρ(X, Y )

For independent X and Y

• Cov(X, Y ) = 0

• Var(X + Y ) = Var(X) + Var(Y )

Problem 117. Let X have variance σx2 and let Y have variance σy2 . Starting with

0 ≤ Var (X/σx + Y /σy )

show that
−1 ≤ Corr(X, Y )
Now using that
0 ≤ Var (X/σx − Y /σy )
conclude that
−1 ≤ Corr(X, Y ) ≤ 1

Nguyen Thi Nhung - Division of Mathematics


1.8. Covariance and Correlation 46

Using the result that Var(Z) = 0 implies that Z is constant, argue that if Corr(X, Y ) =
1 or -1 then X and Y are related by

Y = a + bx

where the sign of b is positive when the correlation is 1 and negative when it is −1.

Problem 118. If X1 and X2 have the same probability distribution function, show
that
Cov (X1 − X2 , X1 + X2 ) = 0
Note that independence is not being assumed.

Problem 119. Suppose that X and Y are random variables with the same variance.
Show that X − Y and X + Y are uncorrelated.

Problem 120. Consider four random variables. W.X.Y, Z. with

E[W ] = E[X] = E[Y ] = E[Z] = 0


var(W ) = var(X) = var(Y ) = var(Z) = 1

and assume that W, X, Y.Z are pairwise uncorrelated. Find the correlation coeffi-
cients ρ(R.S) and ρ(R.T ). where R = W + X, S = X + Y. and T = Y + Z

Problem 121. Suppose that a random variable X satisfies

E[X] = 0. E X 2 = 1, E X 3 = 0. E X 4 = 3
     

and let
Y = a + bX + cX 2
Find the correlation coefficient ρ(X.Y )

Problem 122. a. You roll a fair six-sided die, and then you flip a fair coin the
number of times shown by the die. Find the expected value and the variance
of the number of heads obtained.

b. Repeat part (a) for the case where you roll two dice, instead of one.

Nguyen Thi Nhung - Division of Mathematics


1.9. Functions of Random Variables 47

1.9 Functions of Random Variables

Problem 123. Five men and 5 women are ranked according to their scores on an
examination. Assume that no two scores are alike and all 10! possible rankings are
equally likely. Let X denote the highest ranking achieved by a woman (for instance,
X = 2 if the top-ranked person was male and the next-ranked person was female).
Find P (X = i), i = 1, 2, 3, ..., 8, 9, 10.

Problem 124. The distribution function of the random variable X is given




 0 x<0

x
0≤x<1


 2

2
F (x) = 3
1≤x<2
 11
2≤x<3




 12
 1 3≤x

a. Plot this distribution function.

b. What is P X > 12 ?


c. What is P {2 < X ≤ 4} ?

d. What is P {X < 3}?

e. What is P {X = 1}?

Problem 125. Let X be a random variable that takes values from 0 to 9 with equal
probability 1/10.

a. Find the P M F of the random variable Y ≡ X mod (3).

b. Find the P M F of the random variable Y ≡ 5 mod (X + 1).

Problem 126. Two random variables, X and Y , have the joint distribution P (x, y),

x
P (x, y) 0 1
y 0 0.5 0.2
1 0.2 0.1

Nguyen Thi Nhung - Division of Mathematics


1.10. Special Random Variable 48

a. Are X and Y independent? Explain.

b. Are (X + Y ) and (X − Y ) independent? Explain.

Problem 127. Two random variables X and Y have the joint distribution, P (0, 0) =
0.2, P (0, 2) = 0.3, P (1, 1) = 0.1, P (2, 0) = 0.3, P (2, 2) = 0.1, and P (x, y) = 0 for all
other pairs (x, y).

a. Find the probability mass function of Z = X + Y .

b. Find the probability mass function of U = X − Y .

c. Find the probability mass function of V = XY .

Problem 128. An internet service provider charges its customers for the time of
the internet use rounding it up to the nearest hour. The joint distribution of the
used time (X, hours) and the charge per hour (Y , cents) is given in the table below.

x
P (x, y)
1 2 3 4
1 0 0.06 0.06 0.10
y 2 0.10 0.10 0.04 0.04
3 0.40 0.10 0 0
Each customer is charged Z = X · Y cents, which is the number of hours multiplied
by the price of each hour. Find the distribution of Z.

Problem 129. Let X and Y be the number of hardware failures in two computer
labs in a given month. The joint distribution of X and Y is given in the table below.

a. Compute the probability of at least one hardware failure.

b. From the given distribution, are X and Y independent? Why or why not?

1.10 Special Random Variable


Problem 130. Study some functions in package scipy.stats in python to calcu-
late probability for some speacial random variables.

Nguyen Thi Nhung - Division of Mathematics


1.10. Special Random Variable 49

Binom. Dist. Pois. Dist. Norm. Dist. Uniform Dist. Expon. Dist. Geom. Dist.
binom.rvs() poisson.rvs() norm.rvs() uniform.rvs() expon.rvs() geom.rvs()
binom.pmf() poisson.pmf() norm.pdf() uniform.pdf() expon.pdf() geom.pmf()
binom.cdf() poisson.cdf() norm.cdf() uniform.cdf() expon.cdf() geom.cdf()
binom.sf() poisson.sf() norm.sf() uniform.sf() expon.sf() geom.sf()
binom.ppf() poisson.ppf() norm.ppf() uniform.ppf() expon.ppf() geom.ppf()
binom.stats() poisson.stats() norm.stats() uniform.stats() expon.stats() geom.stats

Problem 131. Nêu định nghĩa phân phối nhị thức và kỳ vọng cùng với phương sai
của phân phối nhị thức.

Problem 132. Nêu định nghĩa phân phối Poisson và kỳ vọng cùng với phương sai
của phân phối Poisson.

Problem 133. Nêu định nghĩa phân phối hình học. Đưa ra kỳ vọng và phương sai
của phân phối hình học.

Problem 134. It is known that disks produced by a certain company will be defec-
tive with probability .01 independently of each other. The company sells the disks
in packages of 10 and offers a money-back guarantee that at most 1 of the 10 disks is
defective. What proportion of packages is returned? If someone buys three packages,
what is the probability that exactly one of them will be returned?

Problem 135. If the average number of claims handled daily by an insurance com-
pany is 5, what proportion of days have less than 3 claims? What is the probability
that there will be 4 claims in exactly 3 of the next 5 days? Assume that the number
of claims on different days is independent.

Problem 136. It has been established that the number of defective stereos produced
daily at a certain plant is Poisson distributed with mean 4. Over a 2−day span, what
is the probability that the number of defective stereos does not exceed 3?
Số lượng stereo bị lỗi được sản xuất tại một nhà máy được cho là tuân theo phân
phối Poisson với giá trị trung bình là 4.

a. Tính xác suất để stereo bị lỗi được sản xuất hàng ngày không vượt quá 4.

b. Tính xác suất để số lượng stereo bị lỗi được sản xuất trong vòng 2 ngày không
vượt quá 3 là bao nhiêu?

Nguyen Thi Nhung - Division of Mathematics


1.10. Special Random Variable 50

Problem 137 (Catching salmon). Every fall the salmon run occurs – this is the
time when salmon swim back upriver from the ocean to spawn. While swimming
back to the upper river (usually to the place where they were spawned), the fish
may encounter grizzly bears. Some of these bears can eat 18 salmon in 3 hours, and
they have a 0.0333 probability of success in their attempts to catch a fish.
We can model a grizzly bear catching salmon with a geometric distribution.

a. Calculate the probability that the bear will catch a salmon on its third attempt,
after failing two times.

b. Calculate the probability that the bear will get a salmon in less than 5 at-
tempts.

c. Calculate the probability that the bear will get a salmon in less than 21 at-
tempts.

d. Calculate how many attempts the bear has to make to have a 0.9 probability
of catching a salmon.

Vào mỗi mùa thu, cá hồi thường bơi ngược dòng từ đại dương để đẻ trứng và khi
bơi trở lại thượng nguồn sông (thường là nơi đẻ trứng), chúng có thể gặp phải gấu
xám Bắc Mỹ. Loại gấu này có thể ăn 18 con cá hồi trong 3 giờ và xác suất thành
công trong mỗi lần bắt cá của chúng là 0,0333.
Chúng ta có thể lập dạng mô hình một con gấu xám Bắc Mỹ đang bắt cá hồi
theo phân bố hình học.

a. Tính xác suất để một con gấu bắt được cá ở lần thử thứ ba, sau hai lần thất
bại.

b. Tính xác suất để một con gấu bắt được cá với ít hơn 5 lần thử.

c. Tính xác suất để một con gấu bắt được cá với ít hơn 21 lần thử.

d. Tính xem số lần cần thiết để một con gấu phải thử để có xác suất bắt được
cá là 0.9.

Nguyen Thi Nhung - Division of Mathematics


1.10. Special Random Variable 51

Problem 138. A satellite system consists of 4 components and can function ade-
quately if at least 2 of the 4 components are in working condition. If each component
is, independently, in working condition with probability .6, what is the probability
that the system functions adequately?

Problem 139. If each voter is for Proposition A with probability 0.7, what is the
probability that exactly 7 of 10 voters are for this proposition?

Problem 140. At least one-half of an airplane’s engines are required to function


in order for it to operate. If each engine independently functions with probability p,
for what values of p is a 4− engine plane more likely to operate than a 2− engine
plane?

Problem 141. Let X be a binomial random variable with

E[X] = 7 and Var(X) = 2.1

Find

a. P {X = 4}.

b. P {X > 12}.

Problem 142. If you buy a lottery ticket in 50 lotteries, in each of which your
chance of winning a prize is 1/100 , what is the (approximate) probability that you
will win a prize (a) at least once, (b) exactly once, and (c) at least twice?

Problem 143. The number of times that an individual contracts a cold in a given
year is a Poisson random variable with parameter λ = 3. Suppose a new wonder
drug (based on large quantities of vitamin C) has just been marketed that reduces
the Poisson parameter to λ = 2 for 75 percent of the population. For the other
25 percent of the population, the drug has no appreciable effect on colds. If an
individual tries the drug for a year and has 0 colds in that time, how likely is it that
the drug is beneficial for him or her?
Số lần một người bị cảm lạnh trong một năm được cho là tuân theo phân phối
Poisson với tham số λ = 3. Giả sử một loại thuốc kỳ diệu mới (dựa trên một lượng
lớn vitamin C) vừa được bán trên thị trường. Loại thuốc này có lợi cho 75% dân
số và làm giảm số lần cảm trung bình xuống 2, tức là tuân theo Poisson với λ = 2;

Nguyen Thi Nhung - Division of Mathematics


1.10. Special Random Variable 52

đối với 25% dân số còn lại, thuốc không có tác dụng đáng kể đối với cảm lạnh. Nếu
một người thử dùng thuốc trong một năm và không bị cảm lạnh trong thời gian đó,
khả năng thuốc đó có lợi cho người đó là bao nhiêu?

Problem 144. The probability of error in the transmission of a binary digit over
a communication channel is 1/103 . Write an expression for the exact probability of
more than 3 errors when transmitting a block of 103 bits. What is its approximate
value? Assume independence.

Problem 145. A contractor purchases a shipment of 100 transistors. It is his policy


to test 10 of these transistors and to keep the shipment only if at least 9 of the 10
are in working condition. If the shipment contains 20 defective transistors, what is
the probability it will be kept?

Problem 146. You arrive at a bus stop at 10 o’clock, knowing that the bus will
arrive at some time uniformly distributed between 10 and 10 : 30. What is the
probability that you will have to wait longer than 10 minutes? If at 10 : 15 the bus
has not yet arrived, what is the probability that you will have to wait at least an
additional 10 minutes?

Some more exercises

Problem 147. Let X ∼ Bernoulli(p) and Y ∼ Bernoulli(q) be independent, where


0 < p, q < 1. Find the joint PMF and joint CDF for X and Y .

Problem 148. * If X and Y are binomial random variables with respective param-
eters (n, p) and (n, 1 − p), verify and explain the following identities:

a. P {X ≤ i} = P {Y ≥ n − i}.

b. P {X = k} = P {Y = n − k}

Problem 149. * If X is a binomial random variable with parameters n and p,


where 0 < p < 1 show that

p n−k
a. P {X = k + 1} = 1−p k+1
P {X = k}, k = 0, 1, . . . , n − 1

Nguyen Thi Nhung - Division of Mathematics


1.10. Special Random Variable 53

b. As k goes from 0 to n, P {X = k} first increases and then decreases, reaching


its largest value when k is the largest integer less than or equal to (n + 1)p

Problem 150. * Independent trials, each of which is a success with probability p,


are successively performed. Let X denote the first trial resulting in a success. That
is, X will equal k if the first k − 1 trials are all failures and the k th a success. X is
called a geometric random variable. Compute (a) P {X = k}, k = 1, 2, . . . (b) E[X]

Problem 151. * Let Y denote the number of trials needed to obtain r successes.
Y is called a negative binomial random variable. Compute

c. P {Y = k}, k = r, r + 1, . . . ( Hint: In order for Y to equal k, how many


successes must result in the first k − 1 trials and what must be the outcome
of trial k?

d. Show that
E[Y ] = r/p
(Hint: Write Y = Y1 + . . . + Yr where Yi is the number of trials needed to go
from a total of i − 1 to a total of i successes. )

Problem 152. * A communications system consists of n components, each of which


will, independently, function with probability p. The total system will be able to
operate effectively if at least one-half of its components function.

a. For what values of p is a 5−component system more likely to operate effectively


than a 3−component system?

b. n general, when is a 2k + 1 component system better than a 2k − 1 component


system?

Problem 153. * A communications channel transmits the digits 0 and 1. However,


due to static, the digit transmitted is incorrectly received with probability 0.2. Sup-
pose that we want to transmit an important message consisting of one binary digit.
To reduce the chance of error, we transmit 00000 instead of 0 and 11111 instead of
1. If the receiver of the message uses “majority” decoding, what is the probability
that the message will be incorrectly decoded? What independence assumptions are
you making? (By majority decoding we mean that the message is decoded as “0” if
there are at least three zeros in the message received and as “1” otherwise.)

Nguyen Thi Nhung - Division of Mathematics


1.10. Special Random Variable 54

Problem 154. * A crew of workers has 3 interchangeable machines, of which 2 must


be working for the crew to do its job. When in use, each machine will function for
an exponentially distributed time having parameter λ before breaking down. The
workers decide to initially use machines A and B and keep machine C in reserve to
replace whichever of A or B breaks down first. They will then be able to continue
working until one of the remaining machines breaks down. When the crew is forced
to stop working because only one of the machines has not yet broken down, what is
the probability that the still operable machine is machine C?

Nguyen Thi Nhung - Division of Mathematics


Probability and Statistics

CHAPTER 3. Continuous Random Variables


1.10. Special Random Variable 56

English Terminologies Thuật ngữ tiếng Việt


Transform/moment generating function Hàm sinh
Discrete random variable Biến ngẫu nhiên rời rạc
Continuous random variable Biến ngẫu nhiên liên tục
Probability Mass Functions (PMF) Hàm xác suất
Cumulative distribution Function (CDF) Hàm phân phối
Probability density function (PDF) Hàm mật độ xác suất
Expectation of a variable Kỳ vọng của biến ngẫu nhiên
Mean of a variable Trung bình của biến ngẫu nhiên
Variance Phương sai
standard deviation Độ lệch chuẩn
Binomial distribution Phân phối nhị thức
Poisson distribution Phân phối Poisson
Uniform distribution Phân phối đều
Normal distribution Phân phối chuẩn
Exponential distribution Phân phối mũ
Geometric distribution Phân phối hình học

Nguyen Thi Nhung - Division of Mathematics


Chương 2

Continuous Random Variables

Problem 155. Cho X là biến ngẫu nhiên liên tục có hàm mật độ xác suất fX (x).

a. Nêu điều kiện về hàm số fX (x).

b. Viết các biểu thức tích phân tính các xác suất: P (X ≤ a), P (X ≥ a), P (a ≤
X ≤ b).
Problem 156. Cho X là biến ngẫu nhiên liên tục có hàm mật độ xác suất fX (x).
Định nghĩa kỳ vọng, phương sai và moment bậc n của X.
Problem 157. Suppose that X is a continuous random variable whose probability
density function is given by
(
C (4x − 2x2 ) 0 < x < 2,
f (x) =
0 otherwise.

a. What is the value of C?

b. Find P (X > 1).

c. Find E(X) and V (X).


Problem 158. The amount of time, in hours, that a computer functions before
breaking down is a continuous random variable with probability density function
given by (
λe−x/100 x ≥ 0
f (x) =
0 x<0

57
58

What is the probability that a computer will function between 50 and 150 hours
before breaking down? What is the probability that it will function less than 100
hours?
Lượng thời gian, tính bằng giờ, mà một máy tính hoạt động trước khi bị hỏng
là một biến ngẫu nhiên liên tục với hàm mật độ xác suất được cho bởi
(
λe−x/100 x ≥ 0
f (x) =
0 x<0

a. Tham số λ bằng bao nhiêu?

b. Xác suất mà một máy tính sẽ hoạt động trong khoảng từ 50 đến 150 giờ trước
khi bị hỏng là bao nhiêu?

c. Xác suất để nó hoạt động dưới 100 giờ là bao nhiêu?

d. Giá trị kỳ vọng, phương sai và moment bậc 2 của X bằng bao nhiêu?

Problem 159. If the density function of X equals


(
ce−2x 0 < x < ∞
f (x) =
0 x<0

find c. What is P {X > 2}?

Problem 160. The density function of X is given by


(
a + bx2 0 ≤ x ≤ 1
f (x) =
0 otherwise

3
If E[X] = , find a, b.
5
Problem 161. The lifetime in hours of electronic tubes is a random variable having
a probability density function given by

f (x) = a2 xe−ax , x≥0

Compute the expected lifetime of such a tube.

Nguyen Thi Nhung - Division of Mathematics


59

Problem 162. The time it takes to repair a personal computer is a random variable
whose density, in hours, is given by
(
1
2
0<x<2
f (x) =
0 otherwise

The cost of the repair depends on the time it takes and is equal to 40 + 30 x when
the time is x. Compute the expected cost to repair a personal computer.
Thời gian tính theo giờ để sửa một chiếc máy tính cá nhân là một biến ngẫu
nhiên có hàm mật độ cho bởi
(
1
2
0<x<2
f (x) =
0 otherwise

Chi phí của việc sửa chữa phụ thuộc vào thời gian sửa và được ước tính bằng

40 + 30 x theo thời gian. Tính chi phí kỳ vọng để sửa một chiếc máy tính cá nhân.

Problem 163. * A random variable X, which represents the weight (in ounces) of
an article, has density function given by f (z)

 (z − 8)
 for 8 ≤ z ≤ 9
f (z) = (10 − z) for 9 < z ≤ 10

0 otherwise

a. Calculate the mean and variance of the random variable X.

b. The manufacturer sells the article for a fixed price of $2.00. He guarantees to
refund the purchase money to any customer who finds the weight of his article
to be less than 8.25 oz. His cost of production is related to the weight of the
article by the relation x/15 + .35. Find the expected profit per article.

Trọng lượng (tính bằng ounce) của một mặt hàng là một biến ngẫu nhiên X có
hàm mật độ f (z) được cho bởi

 (z − 8)
 for 8 ≤ z ≤ 9
f (z) = (10 − z) for 9 < z ≤ 10

0 otherwise

a. Tính trung bình và phương sai của biến ngẫu nhiên X.

Nguyen Thi Nhung - Division of Mathematics


60

b. Nhà sản xuất bán mặt hàng này với giá cố định là 2$. Người bán hàng đảm
bảo sẽ hoàn lại tiền mua hàng cho bất kỳ khách hàng nào thấy trọng lượng
mặt hàng của mình dưới 8.25 oz. Chi phí sản xuất mặt hàng liên hệ với trọng
lượng theo hàm số x/15 + .35. Tìm lợi nhuận kỳ vọng trên mỗi mặt hàng.

Problem 164. The density function of X is given by


(
a + bx2 0 ≤ x ≤ 1
f (x) =
0 otherwise

If E[X] = 53 , find a, b.

Problem 165. The lifetime in hours of electronic tubes is a random variable having
a probability density function given by

f (x) = a2 xe−ax , x≥0

Compute the expected lifetime of such a tube.

Problem 166. Let X1 , X2 , . . . , Xn be independent random variables having the


common density function
(
1 0<x<1
f (x) =
0 otherwise

Find (a) E [Max (Xi , . . . , Xn )] and (b) E [Min (X1 , . . . , Xn )]

Problem 167. The distribution function of the random variable X is given




 0 x<0

x
0≤x<1


 2

2
F (x) = 3
1≤x<2
 11
2≤x<3




 12
 1 3≤x

a. Plot this distribution function.

b. What is P X > 12 ?


c. What is P {2 < X ≤ 4} ?

Nguyen Thi Nhung - Division of Mathematics


2.1. Special Random Variable 61

d. What is P {X < 3}?

e. What is P {X = 1}?

Problem 168. Let Q be a random variable which is uniformly distributed between


0 and 1. On any given day, a particular machine is functional with probability Q.
Furthermore, given the value of Q, the status of the machine on different days is
independent.

a. Find the probability that the machine is functional on a particular day.

b. We are told that the machine was functional on m out of the last n days. Find
the conditional PDF of Q. You may use the identity
Z 1
k!(n − k)!
pk (1 − p)n−k dp =
0 (n + 1)!

2.1 Special Random Variable


Problem 169. Study some functions in package scipy.stats in python to calcu-
late probability for some speacial random variables.

Binom. Dist. Pois. Dist. Norm. Dist. Uniform Dist. Expon. Dist. Geom. Dist.
binom.rvs() poisson.rvs() norm.rvs() uniform.rvs() expon.rvs() geom.rvs()
binom.pmf() poisson.pmf() norm.pdf() uniform.pdf() expon.pdf() geom.pmf()
binom.cdf() poisson.cdf() norm.cdf() uniform.cdf() expon.cdf() geom.cdf()
binom.sf() poisson.sf() norm.sf() uniform.sf() expon.sf() geom.sf()
binom.ppf() poisson.ppf() norm.ppf() uniform.ppf() expon.ppf() geom.ppf()
binom.stats() poisson.stats() norm.stats() uniform.stats() expon.stats() geom.stats

Problem 170. Nêu định nghĩa phân phối đều và kỳ vọng cùng với phương sai của
phân phối đều.

Problem 171. Nêu định nghĩa phân phối mũ và kỳ vọng cùng với phương sai của
phân phối mũ.

Problem 172. Nêu định nghĩa phân phối chuẩn. Đưa ra đặc điểm của đường mật
độ cũng như kỳ vọng và phương sai của phân phối chuẩn.

Nguyen Thi Nhung - Division of Mathematics


2.1. Special Random Variable 62

Problem 173. Buses arrive at a specified stop at 15− minute intervals starting at
7 A.M. That is, they arrive at 7, 7 : 15, 7 : 30, 7 : 45, and so on. If a passenger arrives
at the stop at a time that is uniformly distributed between 7 and 7 : 30, find the
probability that he waits

a. less than 5 minutes for a bus;

b. at least 12 minutes for a bus.

Problem 174. Data from the National Oceanic and Atmospheric Administration
indicate that the yearly precipitation in Los Angeles is a normal random variable
with a mean of 12.08 inches and a standard deviation of 3.1 inches.

a. Find the probability that the total precipitation during the next 2 years will
exceed 25 inches.

b. Find the probability that next year’s precipitation will exceed that of the
following year by more than 3 inches. Assume that the precipitation totals for
the next 2 years are independent.

Problem 175. Jones figures that the total number of thousands of miles that a
used auto can be driven before it would need to be junked is an exponential random
variable with parameter 1/20. Smith has a used car that he claims has been driven
only 10, 000 miles. If Jones purchases the car, what is the probability that she would
get at least 20, 000 additional miles out of it? Repeat under the assumption that
the lifetime mileage of the car is not exponentially distributed but rather is (in
thousands of miles) uniformly distributed over (0, 40).
Jones nhận thấy rằng tổng số nghìn dặm mà một chiếc ô tô có thể lái được cho
đến khi không sử dụng được nữa là một biến ngẫu nhiên có phân phỗi mũ với tham
số 1/20.

a. Tính số nghìn dặm trung bình mà một chiếc ô tô loại này đi được.

b. John mua một chiếc xe mới, tính xác suất để anh ấy đi xe được ít nhất 20
nghìn dặm.

c. Smith có một chiếc xe đã đi được 10 nghìn dặm, tính xác suất để John mua
xe của Smith và đi được thêm ít nhất 20 nghìn dặm nữa.

Nguyen Thi Nhung - Division of Mathematics


2.1. Special Random Variable 63

d. Tính lại các yêu cầu ở câu a, b, c với giả thiết số nghìn dặm mà ô tô đi được
không phải tuân theo phân phối mũ mà là phân phối đều trên [0, 40].

Problem 176. Suppose that a number of miles that a car can run before its battery
wears out is exponentially distributed with an average value of 10, 000 miles. If a
person desires to take a 5, 000− mile trip, what is the probability that she will be
able to complete her trip without having to replace her car battery? What can be
said when the distribution is not exponential?
Giả sử rằng số dặm mà ô tô có thể chạy trước khi hết pin được cho là có phân
phối mũ với giá trị trung bình là 10.000 dặm. Nếu một người mong muốn để thực
hiện chuyến đi dài 5.000 dặm, xác suất để cô ấy có thể hoàn thành chuyến đi của
mình mà không phải thay bình ắc quy ô tô là bao nhiêu? Có thể nói gì khi phân
phối không theo phân phối mũ?

Problem 177. You arrive at a bus stop at 10 o’clock, knowing that the bus will
arrive at some time uniformly distributed between 10 and 10 : 30. What is the
probability that you will have to wait longer than 10 minutes? If at 10 : 15 the bus
has not yet arrived, what is the probability that you will have to wait at least an
additional 10 minutes?

Problem 178. If X is a normal random variable with parameters µ = 10, σ 2 = 36,


compute

a. P {X > 5}.

b. P {4 < X < 16}.

c. P {X < 8}.

d. P {X < 20}.

e. P {X > 16}.

Problem 179. The Scholastic Aptitude Test mathematics test scores across the
population of high school seniors follow a normal distribution with mean 500 and
standard deviation 100. If five seniors are randomly chosen, find the probability that

a. all scored below 600 and

Nguyen Thi Nhung - Division of Mathematics


2.1. Special Random Variable 64

b. exactly three of them scored above 640 .


Problem 180. The annual rainfall (in inches) in a certain region is normally dis-
tributed with µ = 40, σ = 4. What is the probability that in 2 of the next 4 years
the rainfall will exceed 50 inches? Assume that the rainfalls in different years are
independent.
Problem 181. The width of a slot of a duralumin forging is (in inches) normally
distributed with µ = .9000 and σ = .0030. The specification limits were given as
.9000 ± .0050 What percentage of forgings will be defective? What is the maximum
allowable value of σ that will permit no more than 1 in 100 defectives when the
widths are normally distributed with µ = .9000 and σ = .0030?
Problem 182. A certain type of lightbulb has an output that is normally dis-
tributed with mean 2,000 end foot candles and standard deviation 85 end foot can-
dles. Determine a lower specification limit L so that only 5 percent of the lightbulbs
produced will be defective. (That is, determine L so that P {X ≥ L} = .95, where
X is the of output of a bulb.)
Problem 183. The lifetime of a color television picture tube is a normal random
variable with mean 8.2 years and standard deviation 1.4 years. What percentage of
such tubes lasts

a. more than 10 years;

b. less than 5 years;

c. between 5 and 10 years?

d. What is the warranty period if 5% of products are warranted?


Problem 184. An IQ test produces scores that are normally distributed with mean
value 100 and standard deviation 14.2. The top 1 percent of all scores are in what
range?
Problem 185. The time (in hours) required to repair a machine is an exponentially
distributed random variable with parameter λ = 1.

a. What is the probability that a repair time exceeds 2 hours?

b. What is the conditional probability that a repair takes at least 3 hours, given
that its duration exceeds 2 hours?

Nguyen Thi Nhung - Division of Mathematics


2.1. Special Random Variable 65

Some more exercises

Problem 186. * If X and Y are binomial random variables with respective param-
eters (n, p) and (n, 1 − p), verify and explain the following identities:

a. P {X ≤ i} = P {Y ≥ n − i}.

b. P {X = k} = P {Y = n − k}

Problem 187. * If X is a binomial random variable with parameters n and p,


where 0 < p < 1 show that

p n−k
a. P {X = k + 1} = 1−p k+1
P {X = k}, k = 0, 1, . . . , n − 1

b. As k goes from 0 to n, P {X = k} first increases and then decreases, reaching


its largest value when k is the largest integer less than or equal to (n + 1)p

Problem 188. * Independent trials, each of which is a success with probability p,


are successively performed. Let X denote the first trial resulting in a success. That
is, X will equal k if the first k − 1 trials are all failures and the k th a success. X is
called a geometric random variable. Compute (a) P {X = k}, k = 1, 2, . . . (b) E[X]

Problem 189. * Let Y denote the number of trials needed to obtain r successes.
Y is called a negative binomial random variable. Compute

c. P {Y = k}, k = r, r + 1, . . . ( Hint: In order for Y to equal k, how many


successes must result in the first k − 1 trials and what must be the outcome
of trial k?

d. Show that
E[Y ] = r/p
(Hint: Write Y = Y1 + . . . + Yr where Yi is the number of trials needed to go
from a total of i − 1 to a total of i successes. )

Problem 190. * A communications system consists of n components, each of which


will, independently, function with probability p. The total system will be able to
operate effectively if at least one-half of its components function.

Nguyen Thi Nhung - Division of Mathematics


2.2. Derived Distributions 66

a. For what values of p is a 5−component system more likely to operate effectively


than a 3−component system?

b. n general, when is a 2k + 1 component system better than a 2k − 1 component


system?

Problem 191. * A communications channel transmits the digits 0 and 1. However,


due to static, the digit transmitted is incorrectly received with probability 0.2. Sup-
pose that we want to transmit an important message consisting of one binary digit.
To reduce the chance of error, we transmit 00000 instead of 0 and 11111 instead of
1. If the receiver of the message uses “majority” decoding, what is the probability
that the message will be incorrectly decoded? What independence assumptions are
you making? (By majority decoding we mean that the message is decoded as “0” if
there are at least three zeros in the message received and as “1” otherwise.)

Problem 192. * A crew of workers has 3 interchangeable machines, of which 2 must


be working for the crew to do its job. When in use, each machine will function for
an exponentially distributed time having parameter λ before breaking down. The
workers decide to initially use machines A and B and keep machine C in reserve to
replace whichever of A or B breaks down first. They will then be able to continue
working until one of the remaining machines breaks down. When the crew is forced
to stop working because only one of the machines has not yet broken down, what is
the probability that the still operable machine is machine C?

2.2 Derived Distributions

Problem 193. If X is a random variable that is uniformly distributed between -1


p
and 1. find the PDF of |X| and the PDF of − ln |X|

Problem 194. Find the PDF of eX in terms of the PDF of X. Specialize the answer
to the case where X is uniformly distributed between 0 and 1 .

Problem 195. Find the PDFs of |X|1/3 and |X|1/4 in terms of the PDF of X.

Problem 196. Let X be a random variable with PDFfX . Find the PDF of the
random variable Y = |X|

Nguyen Thi Nhung - Division of Mathematics


2.2. Derived Distributions 67

(
1/3, if − 2 < x ≤ 1
a. when fX (x) =
0, otherwise
(
2e−2x , if x > 0
b. when fX (x) =
0, otherwise

c. for general fX (x).

Problem 197. The metro train arrives at the station near your home every quarter
hour starting at 6: 00 a.m. You walk into the station every morning between 7: 10
and 7: 30 a. m., with the time in this interval being a random variable with given
PDF (cf. Example 3.14, in Chapter 3 ). Let X be the elapsed time, in minutes,
between 7: 10 and the time of your arrival. Let Y be the time that you have to wait
until you board a train. Calculate the CDF of Y in terms of the CDF of X and
differentiate to obtain a formula for the PDF of Y .

Problem 198. Let X and Y be independent random variables, uniformly dis-


tributed in the interval [0, 1]. Find the CDF and the PDF of |X − Y |.

Problem 199. Let X and Y be the Cartesian coordinates of a randomly chosen


point (according to a uniform PDF) in the triangle with vertices at (0, 1), (0, −1),
and (1,0) Find the CDF and the PDF of |X − Y |.

Problem 200. Two points are chosen randomly and independently from the interval
[0.1] according to a uniform distribution. Show that the expected distance between
the two points is 1/3.

Problem 201. Let X and Y be independent Poisson random variables with pa-
rameters λ1 and λ2 , respectively. Define λ = λ1 + λ2 and Z = X + Y . Claim that Z
is a Poisson random variable with parameter λ.

Problem 202. Find the PDF of Z = X + Y, when X and Y are independent


exponential random variables with common parameter λ.

Problem 203. Let X and Y be independent, uniform random variables on [0, 1].
Find the density function and distribution function for X + Y .

Problem 204. Romeo and Juliet have a date at a given time, and each, indepen-
dently. Let us denote by X and Y the amounts by which Romeo and Juliet are

Nguyen Thi Nhung - Division of Mathematics


2.3. Continuous random vector 68

late, respectively. Assume that the random variables X and Y are independent and
exponentially distributed with different parameters λ and µ, respectively. Find the
PDF of X − Y .

Problem 205. Let X and Y be independent random variables with PMFs


 

 
 1/2, if y = 0

 1/3, if x = 1, 2, 3 
 1/3, if y = 1
pX (x) = pY (y) =
 0,
 otherwise 
 1/6, if y = 2

 

0, other wise

Find the PMF of Z = X + Y , using the convolution formula.

2.3 Continuous random vector

Problem 206. The joint density function of X and Y is given by


(
2e−x e−2y , 0 < x < ∞, 0 < y < ∞
f (x, y) =
0 otherwise

Compute

a. P {X > 1, Y < 1};

b. P {X < Y };

c. P {X < a}

Problem 207. Problem 1 Let X and Y be jointly continuous random variables


with joint PDF 
cx + 1 x, y ≥ 0, x + y < 1
fX,Y (x, y) =
0 otherwise

a. Show the range of (X, Y ), RXY , in the x − y plane.

b. Find the constant c.

c. Find the marginal PDFs fX (x) and fY (y).

Nguyen Thi Nhung - Division of Mathematics


2.3. Continuous random vector 69

d. Find P (Y < 2X 2 ).

e. Are X and Y independent?

Problem 208. Let the random variables X and Y have a joint PDF which is
uniform over the triangle with vertices at (0, 0), (0, 1), and (1.0).

a. Find the joint PDF of X and Y .

b. Find the marginal PDF of Y .

c. Find the conditional PDF of X given Y .

d. Find E[X | Y = y], and use the total expectation theorem to find E[X] in
terms of E[Y ].

e. Use the symmetry of the problem to find the value of E[X].

Problem 209. Let X be a discrete random variable with PMFpX and let Y be a
continuous random variable, independent from X, with PDFfY . Derive a formula
for the PDF of the random variable X + Y

Problem 210. The random variables X and Y are described by a joint PDF which
is constant within the unit area quadrilateral with vertices (0, 0), (0, 1), (1, 2), and
(1, 1). Use the law of total variance to find the variance of X + Y .

Problem 211. A stock market trader buys 100 shares of stock A and 200 shares of
stock B. Let X and Y be the price changes of A and B respectively over a certain
time period and assume that the joint PMF of X and Y is uniform over the set of
integers x and y satisfying

−2 ≤ x ≤ 4, −1 ≤ y − x ≤ 1.

a. Find the marginal PMFs and the means of X and Y.

b. Find the mean of the trader’s profit.

Problem 212. Problem 1. Let X be uniformly distributed in the unit interval [0, 1].
Consider the random variable Y = g(X), where
(
1. if x ≤ 1/3
g(x) =
2, if x > 1/3

Nguyen Thi Nhung - Division of Mathematics


2.3. Continuous random vector 70

Find the expected value of Y by first deriving its PMF. Verify the result using the
expected value rule.
Problem 213. Calamity Jane goes t o the bank to make a withdrawal, and i s
equally likely to find 0 or 1 customers ahead of her. The service time of the customer
ahead, if present, is exponentially distributed with parameter λ. What is the CDF
of Jane’s waiting time?
Problem 214. Let X and Y be normal random variables with means 0 and 1,
respectively, and variances 1 and 4, respectively.

a. Find P(X ≤ 1.5) and P(X ≤ −1).

b. Find the PDF of (Y − 1)/2.

c. Find P(−1 ≤ Y ≤ 1).

Let X be a normal random variable with zero mean and standard deviation σ.
Use the normal tables to compute the probabilities of the events {X ≥ kσ} and
{|X| ≤ kσ} for k = 1, 2, 3
Problem 215. A city’s temperature is modeled as a normal random variable with
mean and standard deviation both equal to 10 degrees Celsius. What is the proba-
bility that the temperature at a randomly chosen time will be less than or equal to
59 degrees Fahrenheit?
Problem 216. Let X be a random variable with PDF
(
x/4, if 1 < x ≤ 3
fX (x) =
0, otherwise
and let A be the event {X ≥ 2}.

a. Find E[X], P(A), fX|A (x), and E[X | A].

b. Let Y = X 2 . Find E[Y ] and var(Y ).


Problem 217. An absent-minded professor schedules two student appointments
for the same time. The appointment durations are independent and exponentially
distributed with mean thirty minutes. The first student arrives on time, but the
second student arrives five minutes late. What is the expected value of the time
between the arrival of the first student and the departure of the second student?

Nguyen Thi Nhung - Division of Mathematics


2.4. The Bivariate Normal PDF 71

Problem 218. Suppose that 3 batteries are randomly chosen from a group of 3
new, 4 used but still working, and 5 defective batteries. If we let X and Y denote,
respectively, the number of new and used but still working batteries that are chosen,
find the joint probability mass function of X and Y .

Problem 219. Suppose that 15 percent of the families in a certain community have
no children, 20 percent have 1, 35 percent have 2, and 30 percent have 3 children;
suppose further that each child is equally likely (and independently) to be a boy or
a girl. If a family is chosen at random from this community, then B, the number of
boys, and G, find the joint probability mass function of the number of girls, in this
family.

2.4 The Bivariate Normal PDF

Problem 220. The (zero mean) bivariate normal PDF is of the form

fX,Y (x, y) = ce−q(x,y)

where the exponent term q(x, y) is a quadratic function of x and y


x2 y2
σx2
− 2ρ σxy
x σy
+ σy2
q(x, y) =
2 (1 − ρ2 )
σx and σy are positive constants, ρ is a constant that satisfies −1 < ρ < 1, and c is
a normalizing constant.

a. By completing the square, rewrite q(x, y) in the form (αx − βy)2 + γy 2 , for
some constants α, β, and γ.

b. Show that X and Y are zero mean normal random variables with variance σx2
and σy2 , respectively.

c. Find the normalizing constant c.

d. Show that the conditional PDF of X given that Y = y is normal, and identify
its conditional mean and variance.

e. Show that the correlation coefficient of X and Y is equal to ρ.

Nguyen Thi Nhung - Division of Mathematics


2.4. The Bivariate Normal PDF 72

f. Show that X and Y are independent if and only if they are uncorrelated.

g. Show that the estimation error E[X | Y ] − X is normal with mean zero and
variance (1 − ρ2 ) σx2 , and is independent from Y .

Nguyen Thi Nhung - Division of Mathematics

You might also like