You are on page 1of 7

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN – ĐHQGHN

Môn thi: Xác suất thống kê (MAT1101) Học kỳ 2 năm học 2022-2023
Thời gian: 90 phút (không kể thời gian phát đề)
Bài 1. Một công ty sản xuất bóng đèn khẳng định rằng tuổi thọ của bóng đèn có phân phối
chuẩn với trung bình 4000 giờ và độ lệch chuẩn 200 giờ.
a. Tính tỷ lệ bóng đèn có tuổi thọ lớn hơn 4200 giờ.
b. Chọn ngẫu nhiên 100 bóng đèn và tiến hành thí nghiệm kiểm tra tuổi thọ. Gọi X là số
bóng đèn có tuổi thọ trên 4200 giờ trong 100 bóng. Tính trung bình và phương sai của X.
Bài 2. FB.com/husstudy
a. Một vùng dân cư có tỉ lệ người mắc bệnh sốt rét là 0,03. Cần chọn (ngẫu nhiên) đề kiểm
tra bao nhiêu người để gặp ít nhất một người bị sốt rét với xác suất 99%?
b. Theo thống kê, bệnh sốt rét ở vùng này 40% là do loại ký sinh trùng P. falciparum và
60% do ký sinh trùng P. malariae gây ra. Những ký sinh trùng này truyền bệnh qua vật chủ
trung gian là muỗi Anophen. Hơn nữa, một bệnh nhân bị sốt rét do ký sinh trùng P.
falciparum có tỉ lệ chuyển sang ác tính lên tới 30%, bệnh nhân bị sốt rét do ký sinh trùng P.
malariae có tỉ lệ chuyển sang ác tính chỉ 5%. Nếu một người bị sốt rét. Tính xác suất bệnh
của người đó chuyển sang ác tính.
Bài 3. Điều tra mức thu nhập của hai nhóm tuổi ở một khu dân cư ta có bảng số liệu:

Mức thu nhập (X triệu đồng/tháng)


Nhóm tuổi (Y)
0-3 3-6 6-9 9-12 12-15
30-40 20 42 30 41 20
40-50 18 47 33 50 25
a. Hãy kiểm tra xem độ tuổi có ảnh hưởng đến mức thu nhập hay không, với ∝ = 0,05.
b. Mức thu nhập từ 12 triệu trở lên được xem là mức thu nhập cao. Với độ tin cậy 95%, hãy
tìm khoảng tin cậy của ước lượng cho tỉ lệ người có mức thu nhập cao trong nhóm tuổi 30-
40. Hãy xác định số quan sát cần thiết ở nhóm tuổi 30-40 để có độ chính xác 0,01.
c. Tính P-giá trị cho bài toán kiểm định:” Mức thu nhập trung bình của nhóm tuổi 40-50
cao hơn 7,5 triệu đồng”.

1
Bài 4. Cho dữ liệu quan sát về thời gian luyện tập X (ngày) và trọng lượng cơ thể giảm đi
Y (pounds) của 12 người tham gia lớp học giảm cân vì lý do sức khỏe:
X 30 41 16 32 54 43 68 91 15 13 59 90
Y 2,3 6,0 1,3 3,1 5,4 3,0 7,6 9,6 1,3 3,3 6,6 8,4
a. Xác định hệ số tương quan mẫu. Tìm khoảng tin cậy cho hệ số tương quan lý thuyết giữa
X và Y với độ tin cậy 95%.
b. Hãy xây dựng đường hồi quy tuyến tính thực nghiệm biểu diễn mối quan hệ của Y theo
X. FB.com/husstudy
(Sinh viên được phép sử dụng tài liệu)
Bài làm
Bài 1. Gọi Y là tuổi thọ của bóng đèn do một công ty sản xuất (đơn vị: giờ).


Y  N   4000; 2  2002 . 
a. Tỷ lệ bóng đèn có tuổi thọ lớn hơn 4200 giờ:

 4200     4200  4000 


P  Y  4200   1     1    1   1  1  0,84134  0,15866.
    200 

b. Do các bóng đèn là hoàn toàn độc lập nhau và tỷ lệ bóng đèn có tuổi thọ lớn hơn 4200
giờ đều bằng nhau và bằng 0,15866 nên X có phân phối nhị thức như sau:

B  n  100;p  0,15866  .

Trung bình của X: E  X   np  100  0,15866  15,866.

Phương sai của X: D  X   np 1  p   100  0,15866  1  0,15866   13,3487.

Bài 2.
a. Gọi X là số người mắc bệnh sốt rét trong n người được kiểm tra một cách ngẫu nhiên.
Do mỗi người là hoàn toàn độc lập nhau và tỷ lệ bị mắc bệnh sốt rét đều bằng nhau và
bằng 0,03 nên X có phân phối nhị thức như sau: B  n;p  0,03 .

2
Xác suất có ít nhất một người bị sốt rét:

P  X  1  1  P  X  0   1  C 0n  0,030  1  0,03  1  0,97n  99%  0,97n  0,01


n

 n  log0,97 0,01  151,191  n  152.

Vậy cần chọn ngẫu nhiên 152 người để kiểm tra.


b. Gọi A là biến cố bệnh nhân bị sốt rét ở vùng này do loại ký sinh trùng P. falciparum.
Gọi B là biến cố bệnh nhân bị sốt rét ở vùng này do loại ký sinh trùng P. malariae.
Gọi H là biến cố bệnh của người đó chuyển sang ác tính.
Hệ biến cố {A,B} là một hệ biến cố đầy đủ.
Theo đề bài cho, ta có: FB.com/husstudy
P  A   0,6 P  B   0,4 P  H / A   0,3 P  H / B   0,05

Áp dụng công thức xác suất đầy đủ tính xác suất bệnh của người đó chuyển sang ác tính:

P  H   P  A   P  H / A   P  B   P  H / B   0,6  0,3  0,4  0,05  0,15.

Bài 3.
a.
Mức thu nhập (X triệu đồng/tháng) Tổng dòng
Nhóm tuổi (Y)
0-3 3-6 6-9 9-12 12-15 (Ri)
30-40 20 42 30 41 20 153
40-50 18 47 33 50 25 173
Tổng cột (Cj) 38 89 63 91 45 326
H : Độ tuổi không có ảnh hưởng đến mức thu nhập
Đặt giả thuyết:
H : Độ tuổi có ảnh hưởng đến mức thu nhập
R .C 153.38 2907 R .C 153.89 13617
E = = = E = = =
N 326 163 N 326 326
R .C 153.63 9639 R .C 153.91 13923
E = = = E = = =
N 200 326 N 326 326
R .C 153.45 6885 R .C 173.38 3287
E = = = E = = =
N 326 326 N 326 163

3
R .C 173.89 15397 R .C 173.63 10899
E = = = E = = =
N 326 326 N 326 326
R .C 173.91 15743 R .C 173.45 7785
E = = = E = = =
N 326 326 N 326 326

n −E
Giá trị thống kê kiểm định: χ =
E

2907 7785
20 − 45 −
χ = 163 +. . . + 326 ≈ 0,7505.
2907 7785
163 326
Miền bác bỏ H : χ > χ ;( )( ) FB.com/husstudy
Với mức ý nghĩa α = 5%, r = 2, s = 5, ta có: χ ;( )( ) =χ , ; = 9,49.

Do χ = 0,7505 < χ ;( )( ) = 9,49 nên chấp nhận H , bác bỏ H .

Vậy với mức ý nghĩa 5%, độ tuổi không có ảnh hưởng đến mức thu nhập.
b. Số người thuộc nhóm tuổi 30-40 theo mẫu quan sát là:
n1  20  42  30  41  20  153.

Số người có mức thu nhập cao thuộc nhóm tuổi 30-40 theo mẫu quan sát là: m1  20.

Tỉ lệ người có mức thu nhập cao thuộc nhóm tuổi 30-40 theo mẫu quan sát là:
m1 20
f1   .
n1 153


Độ tin cậy   1    95%    0,05    u /2   1   0,975  u /2  1,96.
2
Khoảng tin cậy 95% của ước lượng cho tỉ lệ người có mức thu nhập cao trong nhóm tuổi
30-40:
 20  20  20  20  
   1    1  
 f 1  f1  f1 1  f1    20 153  153  20 153  153  

 f1  u  /2 1 ;f1  u  /2   1,96  ;  1,96 
 n1 n1   153 153 153 153 
   
 
  0,0773;0,1841 .

4
Độ chính xác của ước lượng tỉ lệ trên:

f1 1  f1 
2 2
u   1,96  20  20 
  u  /2  0  n1    /2  f1 1  f1       1    4365,268  n1  4366.
n1  0   0,01  153  153 

Vậy số quan sát cần điều tra là 4366.


c. Gọi T là mức thu nhập của người thuộc nhóm tuổi 40-50 (đơn vị: triệu đồng/tháng).
Gọi μT là mức thu nhập trung bình của người thuộc nhóm tuổi 40-50 (đơn vị: triệu
đồng/tháng).
FB.com/husstudy
Từ bảng số liệu đã cho, ta thiết lập bảng của T như sau:

T 1,5 4,5 7,5 10,5 13,5


Số người 18 47 33 50 25
Từ bảng số liệu trên, ta tính toán được: n T  173; T  7,7948; sT  3,7401.

 H0 :  T  0  7,5
Đặt giả thuyết: 
 H1 :  T  0  7,5

T  0 7,7948  7,5
Giá trị thống kê kiểm định: U qs  nT  173  1,0367.
sT 3,7401

 
P-giá trị  P Z  U qs  P  Z  1,0367   1   1,0367   0,14994.

Lưu ý: Công thức P-giá trị có 3 trường hợp xảy ra ứng với đối thuyết H 1 như sau:


TH1: H1 :    0  P  gi¸ trÞ  P  U qs  Z  U qs  2 U qs  1.   
 
TH2: H1 :    0  P  gi¸ trÞ  P Z  U qs  1   U qs .  

TH3: H1 :    0  P  gi¸ trÞ  P Z  U qs   U qs .   
Trong đó Z là biến ngẫu nhiên có phân phối chuẩn tắc: Z  N  0,1 .

Nếu đề chỉ bắt tính P-giá trị thì làm đến phần như phía trên, còn không bắt tính P-giá trị thì
có thể không tính. Khi đó đề bài sẽ hỏi xem nhận định ý kiến trên có đúng hay không thì
làm các bước như một bài toán kiểm định giá trị trung bình.

5
Bài 4.
Từ bảng số liệu đã cho, ta tính toán được:

n  12  x  552  y  57,9  xy  3453,8  x 2  33506  y 2  367,37

a. Hệ số tương quan mẫu:

n  xy    x  .   y  12.3453,8  552.57,9
r   0,9354.
n  x    x . n  y    y 12.33506  552 2 . 12.367,37  57,92
2 2 2 2

Gọi ρ là hệ số tương quan giữa X và Y.


Độ tin cậy   1    95%    0,05    u /2   1   0,975  u /2  1,96.
2

1 1 r r 1 1 1  1 1 r r 1
Ta có: ln   u  /2  ln  ln   u /2
2 1  r 2  n  1 n  3 2 1   2 1  r 2  n  1 n 3

1 1  0,9354 0,9354 1 1 1   1 1  0,9354 0,9354 1


 ln   1,96.  ln  ln   1,96.
2 1  0,9354 2. 12  1 12  3 2 1   2 1  0,9354 2. 12  1 12  3
1 1  1 
 1,0041  ln  2,3107  7,4499   101,6362  7,4499 1     1    101,6362 1    .
2 1  1 
Khoảng tin cậy cho hệ số tương quan lý thuyết giữa X và Y với độ tin cậy 95%:
0,7633 < ρ < 0,9805
Lưu ý: FB.com/husstudy
 1  r2 1  r2 
TH1: n > 30 dùng công thức  r  u  /2 ;r  u  /2 
 n n 

TH2: n ≤ 30 dùng công thức như bài làm phía trên.


b. Gọi đường hồi quy tuyến tính thực nghiệm biểu diễn mối quan hệ của Y theo X là:
Y = aX + b.
Trong đó a,b được tính như sau:

n  xy    x  .   y  12.3453,8  552.57,9
a   0,0974.
n  x2    x  12.33506  552 2
2

6
 y  a.  x 57,9  0,0974.552
b   0,3446.
n 12
Vậy đường hồi quy tuyến tính thực nghiệm biểu diễn mối quan hệ của Y theo X là:
Y = 0,0974X + 0,3446. FB.com/husstudy
Lưu ý: Do mình gọi phương trình hồi quy như trên sẽ ngược với trong máy casio nên a,b
tính phía trên sẽ ngược đáp án trong máy tính casio nên các bạn cẩn thận nhé.
Ngoài ra đê có thể bắt dự đoán (hoặc ước tính) trọng lượng cơ thể giảm đi (Y) khi đề đã
cho thời gian luyện tập (X) bằng cách thay X vào phương trình trên sẽ tìm được Y.

You might also like