You are on page 1of 36

CẤU TRÚC ĐỀ KIỂM TRA GIỮA KỲ

Hình thức thi: Tự luận - Thời gian: 50 phút

Câu 1 (3,5 điểm) Xác suất của một biến cố và các phép toán xác suất.
+ Tính xác suất của một biến cố.
+ Tính xác suất theo quy tắc cộng, quy tắc nhân, quy tắc Bayes, xác suất có điều kiện, định
lý xác suất đầy đủ.

Câu 2 (3,5 điểm) Biến ngẫu nhiên và một số phân phối xác suất thường gặp.
+ Tìm phân phối xác suất của biến ngẫu nhiên rời rạc một chiều hoặc hai chiều thường gặp:
phân phối nhị thức, phân phối siêu bội.
+ Các ứng dụng của phân phối chuẩn.

Câu 3 (3 điểm) Các số đặc trưng biến ngẫu nhiên


+ Tính trung bình, phương sai, độ lệch chuẩn và nêu ý nghĩa.

CẤU TRÚC ĐỀ THI KẾT THÚC MÔN


Hình thức thi: Tự luận - Thời gian: 60 phút

Câu 1 (2,5 điểm) Tính xác suất của một biến số và phân phối xác suất thường gặp.
+ Tính xác suất của một biến cố theo định nghĩa hoặc các phép toán xác suất.
+ Tìm phân phối xác suất các biến ngẫu nhiên thường gặp rời rạc và liên tục.

Câu 2 (2,5 điểm) Các số đặc trưng biến ngẫu nhiên.


+ Tính trung bình, phương sai, độ lệch chuẩn của biến ngẫu nhiên.
+ Bài toán tính giá trị trung bình của một đại lượng ngẫu nhiên chưa biết phân phối xác suất.

Câu 3 (2,5 điểm) Bài toán ước lượng.


+ Ước lượng một trung bình và hiệu hai trung bình.
+ Ước lượng một tỷ lệ và hiệu hai tỷ lệ trường hợp cỡ mẫu lớn.

Câu 4 (2,5 điểm) Bài toán kiểm định giả thiết.


+ Kiểm định về một trung bình, hiệu hai trung bình (1 phía và 2 phía).
+ Kiểm định về một tỷ lệ, hiệu hai tỷ lệ trường hợp cỡ mẫu lớn (1 phía và 2 phía).
Chú ý :
Trường hợp 2 mẫu có phương sai chưa biết thì chỉ xét trường hợp 2 phương sai bằng nhau
chưa biết.
(1) Các kết quả làm tròn đến 4 chữ số thập phân.
(2) Chỉ được mang bảng tra A3, A4.
(3) Tính giá trị x , s, S xx ,... chỉ cần viết công thức và sử dụng máy tính viết kết quả.

1
$1. CÁC KHÁI NIỆM CƠ BẢN VỀ XÁC SUẤT
I. PHÉP THỬ NGẪU NHIÊN, KHÔNG GIAN MẪU, BIẾN CỐ.
1. Phép thử là sự thực hiện một số điều kiện đặt ra để nghiên cứu một hiện tượng ngẫu
nhiên.
Tập hợp tất cả kết quả có thể của một phép thử được gọi là không gian mẫu, ký hiệu S hoặc

+ Mỗi kết quả trong không gian mẫu gọi là một điểm mẫu hoặc phần tử.
+ Cách mô tả không gian mẫu: liệt kê các phần tử (nếu hữu hạn) hoặc bằng một mệnh đề,
quy tắc (nếu có thuộc tính chung hoặc vô hạn). Có thể dùng sơ đồ cây liệt kê những phần
tử của không gian mẫu.
Ví dụ 1 Tung một đồng xu.
Ví dụ 2: Lấy ngẫu nhiên hai số x, y   0,2 .

Ví dụ 3 Xét phép thử: tung một xúc xắc.


Ví dụ 4 Tìm không gian mẫu của một phép thử là
tung một đồng xu. Nếu xuất hiện mặt sấp thì tung nó
lần thứ hai, còn xuất hiện mặt ngửa, thì tung một con
xúc xắc lên.
Giải: Không gian mẫu liệt kê theo sơ đồ cây như
sau:

 = {SS, SN, N1, N2, N3, N4, N5, N6}

Ví dụ 5 Một lô hàng có 6 sản phẩm, trong đó có 2 phế phẩm. Lấy ngẫu nhiên 3 sản phẩm.
Tìm không gian mẫu của phép thử.
Ví dụ 6 Một lô hàng có 6 sản phẩm, trong đó có 2 phế phẩm. Lấy ngẫu nhiên lần lượt 3 sản
phẩm. Tìm không gian mẫu của phép thử.
Cách tìm không gian mẫu: Đặt tên các loại phần tử có mặt hoặc các bước hình thành phép
thử. Sau đó mô tả điểm mẫu theo kết quả xẩy ra trong phép thử.

2. Biến cố là một tập con của không gian mẫu.

+ Dùng A, B, C, A1 , A2,… để ký hiệu cho biến cố.

+ Một tập con của S không chứa bất kỳ một phần tử nào gọi là biến cố không thể, ký hiệu
.

+ Tập hợp là toàn bộ không gian mẫu S gọi là biến cố chắc chắc.

+ Mỗi điểm mẫu cũng là một biến cố, còn gọi là biến cố sơ cấp.

2
II. PHÉP TOÁN VÀ QUAN HỆ CÁC BIẾN CỐ
Phép toán các biến cố giúp ta nhận được thông tin về biến cố mới thông qua các biến cố
trong một phép thử. Giả sử A và B là hai biến cố trong một phép thử, hay là tập con của
không gian mẫu S.
1. Phần bù của một biến cố A trong S là tập con gồm tất cả những phần tử của S mà không
nằm trong A. Ký hiệu phần bù của A là A hoặc A' .
2. Giao của hai biến cố A và B, ký hiệu AB hoặc AB, là biến cố chứa tất cả những phần
tử chung của A và B
3. Hai biến cố A và B là xung khắc nếu AB=, tức là A và B không có phần tử chung
4. Hợp của hai biến cố A và B, ký hiệu là AB, là biến cố chứa tất cả những phần tử mà
thuộc A hoặc thuộc B hoặc thuộc cả hai.
Chú ý: Biểu đồ Venn để mô tả các phép
toán và quan hệ giữa 2 biến cố.

VD7 Cho A = {2, 4, 6} và B = {4, 5, 6} là các tập con của cùng không gian mẫu

S = {1, 2, 3, 4, 5, 6}. Tìm A , AB , AB

III. TÍNH CHẤT CÁC PHÉP TOÁN BIẾN CỐ

1. Hằng đẳng thức: * AA = A, AS = S, A=A, AA = A, AS = A,

A=  , A  A, A  A  S , AA  

2. Tính chất : * Giao hoán: AB = BA, AB = BA ,

* Kết hợp: (AB)C = A(BC), (AB)C =A(BC)

* Phân phối: A(BC)= (AB)(AC) , A(BC)=(AB)(AC)

3. Định lý De Morgan: A1  ...  An  A1  ...  An , A1  ...  An  A1  ...  An

Ví dụ 10 Lấy 4 sản phẩm trong kho có nhiều phế phẩm, A là biến cố " có nhiều nhất một
phế phẩm", B là biến cố " có ít nhất một phế phẩm", Ci là biến cố có i phế phẩm trong 4 sản
phẩm lấy ra. Hãy biểu diễn các biến cố A, B qua Ci.
Ví dụ 11: xét phép thử " tung một con xúc xắc", A là biến cố " số chẫm xuất hiện là số

chẵn", B là biến cố "số chấm xuất hiện nhỏ hơn 4". Tìm các biến cố A  B, A  B , A  B .

3
IV. ĐẾM CÁC ĐIỂM MẪU
1. Quy tắc nhân:
Nếu một công việc chia ra k giai đoạn, giai đoạn 1 có n1 cách , giai đoạn 2 có n2 cách ...
giai đoạn k có nk cách thực hiện, thì có n1n2…nk cách thực hiện xong công việc.

Ví dụ: Để đi từ nhà đến trường, An phải đi qua hợp tác xã. Từ nhà đến hợp tác xã có ba con
đường, từ hợp tác xã đến trường có 4 con đường. Hỏi có bao nhiêu con đường từ nhà đến
trường.
2. Qui tắc cộng:
Nếu một công việc được chia ra k trường hợp để thực hiện, trường hợp 1 có n1 cách, trường
hợp 2 có n2 cách ,..., trường hợp n có nk cách thực hiện và không có bất kỳ một cách thực
hiện nào ở trường hợp này lại trùng với cách thực hiện ở trường hợp khác, thì có n1 + n2
+…+ nk cách thực hiện xong công việc.

Ví dụ Có bao nhiêu số có 3 chữ số có tổng bằng 4.


Ví dụ: Một nhà máy cần mua thiết bị sản xuất, họ có thể mua một tron ba công ty A, B, C.
Công ty A có 2 loại thiết bị, công ty B có 4 loại thiết bị, côn ty C có 5 loại thiết bị. Hỏi họ
có bao nhiêu cách lựa chọn thiết bị.
3. Hoán vị.

Định nghĩa: Một hoán vị là một sắp xếp của toàn bộ hoặc một bộ phận của một tập
phần tử.
Định lý:
Số hoán vị của n phần tử riêng biệt là Pn  n ! .

Số hoán vị của k phần tử riêng biệt trong n phần tử ( gọi là chỉnh hợp chập k của n
n!
phần tử) là: Ank  .
(n  k )!
Số hoán vị của n phần tử phân biệt được sắp xếp theo mọt vòng tròn là (n-1)!.
Số hoán vị của n phần tử riêng biệt mà trong đó n1 phàn tử thuộc kiểu thứ nhất, n2

4
phần tử thuộc kiểu thứ hai,..., nk phần tử thuộc kểu thứ k là

n!
n1 !n2 !...nk !

Ví dụ:
1, Có 5 người xin làm hai việc A,B. Hỏi có bao nhiêu cách sắp xếp mỗi người một việc.
2, Có bao nhiêu số có 4 chữ số được tạo thành từ 1,2,3,4.
3, có bao nhiêu cách khác nhau để tạo thành mọt xâu đèn của cây thông noel có 3 bóng đỏ, 4
bóng xanh, 5 bóng vàng.
4. Phân hoạch
Khi ta sắp xếp n phần tử thành r tập con ( r ngăn), mà thứ tự bên trong một ngăn là không
quan trọng, các tập con này đôi một giao nhau bằng  , còn hợp tất cả các tập con bằng tập
phần từ ban đầu thì ta gọi đó là một phân hoạch.
Khi đó số cách phân hoạch một tập hợp n phần tử thành r ngăn, trong đó n 1 phần tử thuộc
ngăn thứ nhất, n2 phần tử thuộc ngăn thứ hai...nr phần tử thuộc ngăn thứ r là

n!
Cnn1...nr  (n1  n2  ...  nr  n)
n1 !n2 !...nr !

Chú ý: Nếu phân hoạch chỉ có hai ngăn, một ngăn chứ r phần tử, một ngăn chứa n-r phần tử
còn lại là tổ hợp. Số các tổ hợp của n phần tử phân biệt được tạo ra khi lấy r phần tử cùng
n!
một lúc là Crn 
n!( n  r )!
Ví dụ: Một đồn có 9 người, bố trí hai người trực, 3 người chốt ở điểm A, 4 người chốt ở
điểm B, hỏi có bao nhiêu cách phân công?
V. XÁC SUẤT CỦA MỘT BIẾN CỐ.
Ta chỉ xét những phép thử mà không gian mẫu có hữu hạn phần tử. Đối với mọi điểm trong
không gian mẫu, ta gán một xác suất sao cho tổng tất cả các xác suất bằng 1. Để tìm xác
suất của một biến cố A, ta lấy tổng tất cả những xác suất được gán cho các điểm mẫu trong
A, ký hiệu P(A).
Định nghĩa: Xác suất của biến cố A là tổng của khối lượng của toàn bộ điểm mẫu trong A.
Khi đó 0  P(A)  1, P() = 0, P(S) = 1.
Ví dụ: Tung một đồng xu đồng chất 2 lần. Xác suất để ít nhất một mặt ngửa xuất hiện là
bao nhiêu?
Ví dụ: Cho một con xúc xắc được đổ chì sao cho khả năn xuất hiện một chấm chẵn ấp 2 lần
khả năng xuất hiện một chấm lẻ. Tìm xác suất để số chấm nhỏ hơn 4 xuất hiện trong một lần
5
tung xúc xắc.
Định lý: Nếu phép thử có thể dẫn đến bất kỳ một trong N kết quả phân biệt đồng khả năng
có đúng n kết quả thuận lợi cho biến cố A, thì xác suất của biến cố A là

n Số khả năng thuận lợi xẩy ra biến cố A


. P ( A)  . =
N Số khả năng có thể
Tính chất: 0  P(A)  1, P() = 0, P(S) = 1.
Ví dụ: Lấy ngẫu nhiên 5 cây bài, tìm xác suất để trong đó có 2 cây Át , 3 cây J.
Ví dụ: Lấy lần lượt hai quân bài từ một bộ bài theo phương thức không hoàn lại. Tính xác
suất để 2 quân bài đều là cơ.
Ví dụ: Trong ngăn bàn có 10 quyển sách: 3 quyển Toán, 4 quyển văn, 3 quyển tiếng anh.
Lấy ngẫu nhiên 3 quyển. Tìm xác suất để trong ba quyển sách lấy được có đúng một quyển
Văn được chọn.
Ví dụ: Một bình có 10 viên bi, trong đó có 6 bi đỏ, 4 bi xanh. lấy nẫu nhiên 3 bi
a, Tính xác suất để tron ba bi lấy được không có quá 1 viên bi xanh.
b, Tính xác suất để trong ba bi lấy được có it nhất một bi xanh, một bi đỏ.

Bài 2: CÁC ĐỊNH LÝ VỀ PHÉP TOÁN XÁC SUẤT


I. QUY TẮC CỘNG.

Định lý 1.4 Nếu A và B là hai biến cố tùy ý thì


. P(A  B) = P(A) + P(B) – P(AB) .

Hệ quả 1 Nếu A và B là 2 biến cố xung khắc thì


. P ( A  B)  P( A)  P ( B ) .

Hệ qủa 2 Nếu A1, … An xung khắc với nhau thì . P ( A1  ...  An )  P ( A1 )  ...  P( An ) .

Hệ quả 3 Nếu B1, … Bn là một phân hoạch của không gian mẫu S, thì:
. P ( B1  B2  ...  Bn )  P ( B1 )  P( B2 )  ...  P ( Bn )  P ( S )  1 .

6
Định lý 1.5 Với 3 biến cố A, B, C ta có:
. P ( A  B  C )  P ( A)  P( B )  P (C )  P( AB)  P ( AC )  P( BC )  P ( ABC ) .

Định lý 1.6 Nếu A và A là hai biến cố đối lập thì . P ( A)  P( A)  1 .

Chú ý: Trong trường hợp tính trực tiếp xác suất của biến cố A quá khó khăn ta có thể tính

gián tiếp thông qua biến cố A .


VD Xác suất để Paula thi đỗ môn toán là 2/3 và xác suất để cô ta thi đỗ môn tiếng Anh là
4/9. Nếu xác xuất để thi đỗ cả 2 môn là 1/4. Tính xác suất để Paula
a, thi đỗ ít nhất một môn?
b, không đỗ môn nào/
c, Thi trượt ít nhất một môn.
d, thi đỗ đúng một môn.
Ví dụ Gieo đồng thời hai con xúc xắc. Tính xác suất để tổng số chấm xuất hiện trên hai con
là 7 hoặc 11.
Ví dụ: Trong một nhà tù liên bang có 2/3 số tù nhân dưới 25 tuổi. Biết rằng 3/5 số từ nhân
là nam, 5/8 số tù nhân là nữ hoặc trên 25 tuổi. Chọn ngẫu nhiên 1 tù nhân, tìm xác suất để tù
nhân đó là nữ và trên 25 tuổi.
II. XÁC SUẤT CÓ ĐIỀU KIỆN.
Định nghĩa: Cho A, B là hai biến cố của một phép thử, P(A) >0. Xác suất của biến cố B với
điều kiện biến cố A đã xảy ra rồi, ký hiệu P(B|A), được xác định là:
P( AB )
. P ( B | A)  nếu P(A) > 0 .
P( A)

Ta gọi ngắn gọn là xác suất của B với điều kiện A.


Ví dụ Xác suất để một chuyến bay khởi hành đúng giờ là P(A) = 0,83, xác suất để nó đến
đúng giờ là P(B) = 0,82, xác suất để nó khởi hành và đến đều đúng giờ là P ( AB)  0,78 .
Tính xác suất để một chiếc máy bay:
(a) đến đúng giờ biết rằng nó đã khởi hành đúng giờ;
(b) khởi hành đúng giờ biết rằng nó đã đến đúng giờ.

7
(c) Xác suất để một máy bay đến đúng giờ, biết rằng nó đã khởi hành không đúng giờ
Định nghĩa: Hai biến cố A và B được gọi là độc lập với nhau khi và chỉ khi
P ( B | A)  P( B) hoặc P ( A | B)  P( A) . Trong trường hợp ngược lại ta nói A và B phụ
thuộc nhau.
III. QUY TẮC NHÂN
Định lý Nếu trong một phép thử, các biến cố A và B có thể cùng xảy ra thì
. P ( AB )  P ( A).P ( B | A) .

Định lý Hai biến cố A và B là độc lập với nhau khi và chỉ khi . P ( AB )  P ( A).P ( B ) .

Định lý Nếu trong một phép thử, các biến cố A1 , A2 ,..., Ak có thể xảy ra thì

. P ( A1 A2 ... Ak )  P ( A1 ).P ( A2 | A1 )...P ( Ak | A1 A2 ... Ak 1 ) .

Nếu các biến cố A1 , A2 ,..., Ak độc lập thì . P ( A1 A2 ... Ak )  P ( A1 ).P( A2 )...P ( Ak ) .

Ví dụ: Giả sử ta có một hộp chứa 20 chiếc cầu chì, trong đó có 5 chiếc bị hỏng. Nếu lấy
ngẫu nhiên lần lượt 2 chiếc theo phương thức không hoàn lại, thì xác suất để cả hai chiếc
đều bị hỏng là bao nhiêu?
VD Một thị trấn nhỏ có một chiếc máy cứu hỏa và một chiếc xe cấp cứu sẵn sàng dùng cho
những trường hợp khẩn cấp. Xác suất để chiếc máy cứu hỏa sẵn có để dùng cho những
trường hợp khẩn cấp là 0,98 và xác suất để chiếc xe cấp cứu khi được gọi là 0,92. Có một
người bị thương do một tòa nhà đang cháy, tìm xác suất để cả chiếc xe cấp cứu và cứu hỏa
đều sẵn sàng có thể dùng.
Ví dụ: Trong một kho hàng, xác suất lấy được sản phẩm loại A là 0,8. Lấy ngẫu nhiên 3 sản
phẩm lần lượt từng chiếc không hoàn lại. tính xác suất để 3 sản phẩm đều loại A.
Ví dụ: Hộp một chứa 2 bi xanh, 5 bi trắng. Hộp 2 chứa chứa 3 bi xanh, 3 bi trắng. từ mỗi
hộp lấy ra 1 viên bi. Tính xác suất để hai viên bi lấy ra là cùng màu.
IV. QUY TẮC BAYES
Định lý (Định lý xác suất đầy đủ) Nếu các biến cố B 1 ,B 2 , …, B k là một phân hoạch của
không gian mẫu S, trong đó P(B i )  0 với mọi i = 1, 2, …, k thì với biến cố A bất kì của S
ta có:
k k
. P ( A)   P ( Bi A) =  P( Bi )P( A | Bi ) .
i 1 i 1

Định lý (Quy tắc Bayes) Nếu các biến cố B 1 , B 2 , …, B k là một phân hoạch của không
gian mẫu S, trong đó P(B i )  0 với mọi i = 1, 2, …, k, thì với biến cố A bất kì của S mà
P ( A)  0 ta có
8
P ( Bi A)
. P ( Bi | A)  , với i = 1, 2, …, k .
P ( A)

Ví dụ: Trong một dây chuyền sản xuất, ba máy B1, B2, và B3 tạo ra 30%, 45%, và 25% sản
phẩm tương ứng. Theo phép thử trước đây biết tỷ lệ phế phẩm được tạo bởi mỗi máy tương
ứng là 2%, 3% và 2%. Chọn ngẫu nhiên 1 sản phẩm.
(a) Tính xác suất để nó là phế phẩm.
(b) Nếu chọn ngẫu nhiên một sản phẩm và thấy nó bị lỗi, thì xác suất để sản phẩm đó thuộc
B3 là bao nhiêu?
VD Túi thứ nhất có 4 quả bóng trắng và 3 quả bóng đen, túi thứ hai có 3 quả bóng trắng và
5 quả bóng đen. Lấy ngẫu nhiên một quả bóng từ túi thứ nhất bỏ sang túi thứ hai. Tính xác
suất để một quả bóng được lấy ra từ túi thứ hai có màu đen.
Chú ý:
Dấu hiệu để nhận biết hệ biến cố {B1,B2,...,Bk} là phân hoạch ( hệ đầy đủ)
+ {B1,B2,...,Bk} là các biến cố xung khắc ( tách rời nhau)
+ P(B1)+P(B2)+ ...+P(Bk)=1.
Dấu hiệu nhận biết một số biến cố quan trọng
+ Biến cố giao thường diễn đạt bởi các từ: và, đồng thời
+ Biến cố hợp thường diễn đạt bởi các từ: hoặc, ít nhất...
+ Biến cố điều kiện thường diễn đạt bởi các từ: Biết rằng, với điều kiện....

Bài 3 BIẾN NGẪU NHIÊN VÀ PHÂN PHỐI XÁC SUẤT


I. BIẾN NGẪU NHIÊN
Thống kê đề cập đến việc rút ra các kết luận về tổng thể và nhữn nét dặc trưng cho tổng thể.
Nếu tiến hành phép thử nhiều lần thì ta có thể nhận được những kết quả khác nhau. Phép
thử thống kê là một thật ngữ dùng để mô tả bất kỳ qúa trình mà quan sát ngẫu nhiên được
thực hiện.
Ví dụ: Kiểm tra ngẫu nhiên lần lượt ba sản phẩm (có thể có chính phẩm C hoặc phế phẩm P)
của một lô hàng, với yêu cầu nếu xuất hiện sản phẩm lỗi thì lô hàng bị loại.

9
Khi đó không gian mẫu S  {CCC,CCP,CPC,PCC,CPP,PCP,PPC,PPP} .
Từ yêu cầu bài toán ta tự nhiên quan tâm tới số phế phẩm trong 3 sản phẩm kiểm tra là bao
nhiêu.
Điểm mẫu Số phế phẩm
CCC 0
CCP 1
CPC 1
PCC 1
CPP 2
PCP 2
PPC 2
PPP 3
Ta thấy mỗi điểm mẫu sẽ xác định một giá trị thực duy nhất 0,1,2,3. Ở đây nếu ta gọi X là
số phế phẩm có tronh ba sản phẩm thì X sẽ nhận các giá trị 0,1,2,3. Khi đó ta gọi X là biến
ngẫu nhiên
Định nghĩa: Biến ngẫu nhiên là một hàm số cho tương ứng mỗi phần tử trong không gian
mẫu với một số thực.
Ký hiệu: Biến ngẫu nhiên (bnn) X,Y,Z. Các giá trị của biến ngẫu nhiên x,y,z....
X :S  
Khi đó
s  X (s)  x
trong đó s là một điểm mẫu của không gian mẫu.
Tập tất cả các số thực mà biến ngẫu nhiên X nhận được gọi là tập giá trị
Dựa vào đặc điểm của tập giá trị, người ta chia biến ngẫu nhiên thành 2 loại:
- biến ngẫu nhiên rời rạc: là bnn mà tập giá trị đếm được
- Biến ngẫu nhiên liên tục: là bnn mà tập giá trị là một khoảng thực ( tập không đếm
được).
II. PHÂN PHỐI XÁC SUẤT.
1. Phân phối xác suất rời rạc
a. Hàm phân phối xác suất
Định nghĩa: Hàm số f(x) là hàm phân phối xác suất của bnn rời rạc X nếu với mỗi kết cục
x ta có
1. f ( x )  0, x

2.  f ( x)  1
x

10
3. P ( X  x)  f ( x)
Ví dụ: Một hộp kẹo sô cô la có 8 chiếc: 3 chiếc kẹo nhân sữa, 5 chiếc kẹo nhân hạt điều.
Lấy ngẫu nhiên ra 4 chiếc. Lập bảng phân phối chỉ số kẹo nhân sữa lấy được.
Ví dụ:Một người bắn ba viên đạn độc lập nhau vào một mục tiêu với xác suất bắn một viên
trúng mục tiêu là 0,6.
a, Gọi X là số viên đạn bắn trúng mục tiêu. Tìm phân phối xác suất f(x) của X.
b, Gọi Y là số viên đạn đã bắn cho đến khi trúng mục tiêu hoặc hết đạn thì dừng lại. Tìm
phân phối xác suất của Y.
b, Hàm phân phối tích lũy
Định nghĩa: Bnn rời rạc X có phân phối xác suất f ( x ) . Khi đó hàm số

F ( x)  P ( X  x )   f (t ),   x
t x

gọi la hàm phân phối tích lũy của X.


Chú ý:
+ P (a  X  b )  P ( X  b )  P ( X  a )  F (b)  F (a )
+ P (a  X  b )  P ( X  b)  P ( X  a )  P ( X  b)  F (b)  F ( a )  P ( X  b)
+ P ( X  a)  1  P ( X  a ) .
Ví dụ: Cho phân phối xác suất
X 0 1 2
f ( x) 10 15 3
28 28 28
Tìm hàm phân phối tích lũy của biến ngẫy nhiên X. Tính P (0, 2  X  1,5)
Chú ý: Hàm phân phối tích lũy à hàm tăng dần, luôn bắt đầu từ 0 và kết thúc tại 1.
c, Biểu đồ xác suất
Vẽ các điểm (x, f(x)) và nối các điểm này đến trục Ox bởi một đường nét đứt (hoặc liền nét),
ta được một biểu đồ hình cây. Thay vì vẽ các điểm (x, f(x)), ta cũng có thể vẽ các hình chữ
nhật sao cho đáy của chúng có bề rộng bằng nhau và mỗi giá trị x được đặt chính giữa đáy,
còn chiều cao của chúng bằng xác suất tương ứng được cho bởi f(x), các đáy được vẽ sao
cho không có khoảng trống giữa các hình chữ nhật, được gọi là một biểu đồ xác suất.

11
2. PHÂN PHỐI XÁC SUẤT LIÊN TỤC.
Mặc dù không thể trình bày phân phối xác suất của biến ngẫu nhiên liên tục dưới dạng bảng
nhưng chúng ta có thể mô tả nó bằng một công thức, đó là một hàm của các giá trị số của
biến ngẫu nhiên liên tục X mà ta kí hiệu là f ( x ) , được gọi là hàm mật độ xác suất hay đơn
giản là hàm mật độ của X. Do đó ta sử dụng diện tích mô tả xác suất và xác suất là một số
dương nên hàm mật độ phải nằm trên toàn bộ trục x . Hình sau là các hàm mật độ điển hình
và xác suất trên khoảng (a, b)

a. Hàm mật độ xác suất


Định nghĩa: Hàm f(x) là hàm mật dộ xác suất của bnn liên tục X xác định trên tập số thực
nếu thỏa mãn:
1. f ( x )  0, x

2. 

f ( x)  1

b
3. P (a  X  b)   f ( x)dx
a

Ví dụ: Cho hàm mật độ của bnn X:


kx 2 , x  ( 1, 2)
f ( x)  
0, x  ( 1, 2)
a, Tính k?
b, Tính P ( X  1) .
Ví dụ: Thời gian mà một gia đình cho chạy máy hút bụi tron một năm là bnn liên tục X có
hàm mật độ sau ( đơn vị 100h)

12
x 0  x 1

f ( x )   2  x, 1 x  2
0, x   0,2 

Tính xác suất để trong một năm, thời gian một gia đình cho chạy máy hút bụi của họ từ 50h
đến 150h.
b. Hàm phân phối tích lũy F(x) của biến ngẫu nhiên liên tục X với hàm mật độ f(x) là:
x
. F ( x )  P ( X  x)   f (t )dt , với -   x   .


dF ( x )
Hệ quả: . P( a < X < b ) = F(b) – F(a) và f ( x)  (nếu đạo hàm tồn tại) .
dx
Ví dụ:
0 x 1

Cho bnn X có hàm phân phối tích lũy là F ( x)   k
1  x3 , 1 x

Tìm k và hàm mật độ xác suất


Ví dụ:
Thời hạn sử dụng ( đơn vị: ngày) của một loại thuốc nào đó là bnn có hàm mật độ như sau:
 2000
 x0
f ( x)   ( x  100)3
0, x0

Tìm xác suất để chai thuốc hết hạn sử dụng
a, ít nhất là 200 ngày
b, từ 80 đến 120 ngày

$4 Các số đặc trung của bnn


Khi nghiên cứu một bnn nào đó, nếu biết thông tin về pp xác suất của nó thì ta sẽ hình dung
được khá đầy đủ về bnn đó. Tuy nhiên trên thực tế thôn tin đó là tương đối hạn chế, vì thế ta
cần nhữn đặc trưng quan trọng khác để giúp ta hình dung được phần nào về bnn đang xét.
I. KỲ VỌNG TOÁN HỌC.
1. Định nghĩa:
BNN rời rạc BNN liên tục
1. Định Cho X là bnn với phân phối xác suất Cho X là bnn với phân phối xác suất
nghĩa: f ( x ) . Giá trị trung bình ( kỳ vọng) f ( x ) . Giá trị trung bình ( kỳ vọng) của

13
của X được xác định như sau X được xác định như sau
  E ( X )   xf ( x) 

x .   E( X )   xf ( x)dx


2. Ý Trong thực tiễn thì các giá trị biến ngẫu nhiên X luôn biến đổi nhưng giá trị
nghĩa:   E ( X ) thường ổn định nên là giá trị đại diện cho X (E(X)) còn gọi là tâm phân
phối xác suất).
3. Định Cho X là bnn với phân phối xác suất Cho X là bnn với phân phối xác suất
lí : f ( x ) . Giá trị trung bình ( kỳ vọng) f ( x ) . Giá trị trung bình ( kỳ vọng) của
của g(x) được xác định như sau g(x) được xác định như sau
 g ( x )  E  g ( x)    g ( x ) f ( x ) 

x  g ( X )  E  g ( x)   g ( x) f ( x)dx


Tính 1. E (aX  b)  aE ( X )  b , a,b là hằng số


chất 2. Nếu X, Y độc lập thì E  XY   E  X  E Y 

Ví dụ: Tung 3 đồng xu giống nhau. Gọi X là số mặt ngửa, ta có phân phối xác suất của X là

x 0 1 2 3
f(x) 1/8 3/8 3/8 1/8
Tính   E ( X )
VD Một vị thanh tra chất lượng kiểm tra một lô hàng gồm 7 sản phẩm trong đó có chứa 4
chính phẩm và 3 phế phẩm. Ông ta lấy ra một mẫu gồm 3 sản phẩm.
a, Hãy tìm giá trị trung bình của số chính phẩm trong mẫu.
b, Biết giá tiền của một chính phẩm là 3 triệu, 1 phế phẩm là 0,2 triệu. Hãy tính số tiền trung
bình của mẫu lấy ra đó.
VD Gọi X là một biến ngẫu nhiên của tuổi thọ tính theo giờ của một thiết bị điện tử nào đó
 20000
 , x  100
có hàm mật độ xác suất là f ( x)   x3 .
 0 , x  100

Hãy tính tuổi thọ trung bình của thiết bị điện tử loại này.
 x2
 , x  (1, 2)
Ví dụ: Cho X là bnn có hàm mật độ là f ( x )   3
0 , x  (1, 2)

Hãy tìm kỳ vọng của hàm g ( X )  4 X  3

14
II. PHƯƠNG SAI .
BNN rời rạc BNN liên tục
1. Đn X là bnn với phân phối xs f ( x ) . X là bnn với phân phối xs f ( x ) . Phương

Phương sai của X ký hiệu là  2 là kỳ sai của X ký hiệu là  2 là kỳ vọng của


vọng của bình phương độ lệch giữa bình phương độ lệch giữa X và giá trị
X và giá trị trung bình  trung bình 

 2  E  ( X   ) 2    ( x   ) 2 f ( x)  2  E  ( X   ) 2    ( x   ) 2 f ( x)
x x

Chú ý Phương sai là để đánh giá độ phân tán của bnn X xung quanh giá trị trun bình.
Nếu các giá trị của X tập trung quanh giá trị trung bình thì phương sai nhỏ, và
ngược lại. Trong thực tế phương sai thể hiện độ đồng đều, mức độ ổn định của
bnn.
Căn bậc hai của phương sai gọi là độ lệch chuẩn của bnn X, ký hiệu 
2. Định 1.  a2Xb  a 2 X2 1.  a2Xb  a 2 X2

 2  E( X 2 )   2  2  E( X 2 )   2
2.
  x 2 f ( x)   2 2. 

x f ( x)   2
2



Ví dụ Gọi X là biến ngẫu nhiên biểu thị số xe ôtô được sử dụng cho mục đích kinh doanh
chính thức trong một ngày làm việc nào đó. Phân phối xác suất của X tại công ty A là
x 1 2 3
f(x) 0,3 0,4 0,3
và tại công ty B là
x 0 1 2 3 4
f(x) 0,2 0,1 0,3 0,3 0,1
Hãy chỉ ra rằng phương sai của phân phối xác suất tại công ty B là lớn hơn so với tại công ty
A.
VD Gọi X là biến ngẫu nhiên biểu thị số thiết bị hỏng trong một hệ thống gồm 3 thiết bị
được kiểm tra của một chiếc máy. Phân phối xác suất của X như sau. Hãy tính  2
x 0 1 2 3
f(x) 0,51 0,38 0,10 0,01
VD Nhu cầu hàng tuần đối với Pepsi, theo đơn vị 1000 lít, tại một chuỗi các cửa hàng ở
một địa phương nào đó, là một biến ngẫu nhiên liên tục X với hàm mật độ xác suất như sau
15
2( x  1), x  (0; 2)
f ( x)  
 0, x  (0; 2)

Hãy tìm giá trị trung bình và phương sai của X. Từ đó tìm kỳ vọng, phương sai, độ lệch
chuẩn của biến ngẫu nhiên g(X) = 3X-1.
Bài 5. PHÂN PHỐI CHUẨN. MỘT SỐ THỐNG KÊ MẪU QUAN TRỌNG.`
I. Phân phối chuẩn
Dạng phân phối xác suất quan trọng và phổ biến bậc nhất trong thực tế là dạng phân phối
chuẩn. Đồ thị của dạng phân phối này giống với hình quả chuông, gọi là đường cong chuẩn

Nó mô tả xấp xỉ nhiều hiện tượng xảy ra trong tự nhiên, trong công nghiệp và trong nghiên
cứu. Năm 1733, Abraham DeMoivre đã tìm ra phương trình toán học của đường cong
chuẩn, là đường cong phụ thuộc vào hai tham số, ký hiệu bởi  và  .

Định nghĩa

Biến ngẫu nhiên liên tục X với hàm mật độ phụ thuộc hai số  và  , như sau

1
e (1 / 2)[  x    /  ] ,  x  
2
n( x ;  ,  ) 
 2

được gọi là biến ngẫu nhiên chuẩn.

Với mỗi cặp giá trị  và  được cho, đường cong chuẩn hoàn toàn xác định.

Phân phối chuẩn cũng thường được nhắc đến như là phân phối Gauss, để tưởng nhớ
đến Karl Friedrich Gauss (1777 - 1855), người cũng tìm thấy phương trình của đường cong
chuẩn nhờ việc nghiên cứu các sai số trong việc lặp đi lặp lại các phép đo với một số lần
như nhau.

Qua việc khảo sát n( x ;  ,  ) , ta có các tính chất của đường cong chuẩn:

1. Mode, là điểm trên trục hoành mà tại đó đường cong đạt giá trị lớn nhất, xảy ra tại x   .
2.Đường cong có trục đối xứng là đường thẳng đứng đi qua  .

3. Đường cong có hai điểm uốn tại x     , lồi nếu     X     và lõm nếu ngược
lại.

4. Đường cong tiệm cận với trục hoành nếu chúng ta cho x di chuyển dần xa khỏi giá trị
trung bình.
16
5. Tổng diện tích của phần bên dưới đường cong và bên trên trục hoành bằng 1.

Định lý Kỳ vọng và phương sai của biến ngẫu nhiên chuẩn X với phân phối n( x ;  ,  ) , lần
lượt là  ,  2

Diện tích phần bên dưới đường cong chuẩn

Phần này ta bàn về việc tính xác suất để biến ngẫu nhiên chuẩn X với phân phối n( x ;  ,  )
nhận giá trị trong một khoảng (x1, x2) cho trước. Như ta đã biết
x2 1 x2 2
P( x1  X  x2 )   n( x;  , )dx   e  (1 / 2)[( x   ) /  ] dx
x1  2 x1

Thế nhưng, việc tính tích phân này khá khó khăn. Ta cần lập một bảng tra sẵn để tính cho
nhanh, vấn đề là không thể lập bảng tra cho các bộ  và  khác nhau. May thay, ta có thể
biểu diễn kết quả cần tính thông qua một tích phân dạng như trên với   0   1 bằng
phép đặt sau
X 
Z .

Biến ngẫu nhiên Z là một biến ngẫu nhiên chuẩn với trung bình bằng 0 và phương sai bằng
1, đây là trường hợp đặc biệt quan trọng của dạng phân phối chuẩn. Ta gọi một biến ngẫu
nhiên chuẩn với trung bình bằng 0 và phương sai bằng 1 là biến ngẫu nhiên tiêu chuẩn và
phân phối của nó là phân phối tiêu chuẩn.

Bảng A.3 chỉ ra diện tích phần bên dưới đường cong tiêu chuẩn ứng với P( Z  z ) , với giá
trị của z chạy từ -3.49 đến 3.49. Để minh họa cách dùng của bảng này, chúng ta sẽ tìm xác
suất để Z nhỏ hơn 1.74. Đầu tiên, chúng ta xác định giá trị của z bằng 1.7 trong cột bên trái,
rồi di chuyển theo hàng ngang tới cột bên dưới số 0.04, ở đó chúng ta sẽ gặp giá trị 0.9591.
Do đó, P( Z  1.74)  0.9591. Để tìm giá trị của z ứng với xác suất cho trước, chúng ta làm
ngược lại quá trình trên. Ví dụ, giá trị z ứng với phần diện tích 0.2148 nằm bên dưới đường
cong và ở bên trái số z được tìm thấy là - 0.79.

Ví dụ Cho phân phối tiêu chuẩn, tìm diện tích phần nằm bên dưới đường cong chuẩn

17
(a) ở bên phải số z = 1.84 và diện tích phần nằm bên dưới đường cong

(b) giữa hai số z = - 1.97 và z = 0.86.

Ví dụ Cho phân phối tiêu chuẩn, tìm giá trị của k sao cho

(a) P( Z  k )  0.3015 (b) P(k  Z  0.18)  0.4197.

Nhiều khi chúng ta được yêu cầu tìm giá trị của z tương ứng với xác suất cho trước mà giá
trị này lại rơi vào giữa các giá trị trong Bảng A.3. Để cho tiện, chúng ta sẽ lựa chọn giá trị z
tương ứng với xác suất có sẵn trong bảng sao cho giá trị này gần nhất với giá trị đầu bài cho.
Tuy nhiên, nếu giá trị xác suất được cho rơi vào chính giữa hai giá trị xác suất ở trong bảng,
khi đó chúng ta sẽ chọn giá trị của z chính là giá trị nằm ở chính giữa hai giá trị tương ứng
của z ở hai đầu mút. Chẳng hạn, để tìm giá trị của z tương ứng với xác suất 0.7975, giá trị
này nằm ở giữa hai giá trị 0.7967 và 0.7995 trong Bảng A.3, chúng ta chọn z = 0.83, vì
0.7975 gần hơn với 0.7967. Còn với xác suất 0.7981, giá trị này nằm chính giữa 0.7967 và
0.7995 nên chúng ta lấy z = 0.835.

Ví dụ: Cho phân phối tiêu chuẩn, tìm gía trị của k sao cho

18
(a) P ( Z  k )  0,3015

(b) P (k  Z  0,18)  0.4197 .

Ví dụ: Cho phân phối chuẩn có   50,  10 . Tìm xác suất để X nhận giá trị trong khoảng
45 và 62.
3. Ứng dụng của phân phối chuẩn.
Ví dụ: Một loại pin có tuổi thọ trung bình là 3 năm và độ lệch chuẩn là 0,5 năm. Giả sử tuổi
thọ của pin có phân phối chuẩn, tìm xác suất để pin có tuổi thọ ít hơn 2,3 năm.
VD Một loại bóng đèn thắp sáng có tuổi thọ tuân theo phân phối chuẩn với trung bình bằng
800h và độ lệch chuẩn là 40h. Tìm xác suất để bóng đèn có tuổi thọ từ 778h đến 834h.

Giải: Gọi X là tuổi thọ của bóng đèn. Ta có X ~ N (800, 40 2 ) nên xác suất là:

778  800 834  800


P (778  X  834)  P( Z )  P(0,55  Z  0,85)  0,8023  0,2912  0,5111
40 40
Ví dụ: Trong một dây chuyền sản xuất công nghiệp, đường kính của một vòn bi là một bộ
phận cấu thành quan trọng. Người mua hàng chỉ đặt mua những vòng bi có đường kính
thuộc phạm vi 3.0  0.01 . Biết rằn đường kính của vòng bi có phân phối chuẩn với trung
bình 3.0 và độ lệch chuẩn là 0.005. hỏi trung bình có bao nhiêu vòng bi sẽ bị làm phế thải.
II. Mẫu ngẫu nhiên
1. Định nghĩa
Tổng thể: Tập hợp gồm tất cả các đối tượng có chung đặc tính nào đó mà chúng ta đang
quan tâm được gọi là tổng thể.
Một số tổng thể có cỡ lớn đển nỗi về mặt lý thuyết chúng ta đã giả thuyết chúng là vô hạn.
Một mẫu : là một tập con của một tổng thể.
Bằng các phương pháp khoa học, từ mẫu này, rút ra được kết luận khách quan về toàn bộ
tổng thể đám đông đó thì gọi là phương pháp mẫu.
Để tránh các kết luận sai lầm liên quan đến tổng thể thì tốt nhất nên lựa chọn mẫu ngẫu
nhiên sao cho các quan sát được thực hiện độc lập và ngẫu nhiên.
2 MỘT SỐ THỐNG KÊ QUAN TRỌNG
Cho X 1 , X 2 ,..., X n biểu diễn một mẫu ngẫu nhiên có cỡ n, khi đó:
n

 Xi
a) Trung bình mẫu . X  i 1
.
n

19
n
Chú ý thống kê X cho giá trị x   xi / n khi X 1 nhận giá trị x1 , X 2 nhận giá trị x2 …
i 1

2) Median mẫu ( Trung vị mẫu)

 X ( n1)/2 khi n =2k+1


 
.. X   X n /2  X ( n /2)1 . với X 1 , X 2 ,..., X n xếp tăng dần
 khi n  2k
 2

Ví dụ:
1). Số tàu nước ngoài đến cản biển phía đông vào 7 ngày được lự chọn ngẫu nhiên là
8,3,9,5,6,8 và 5. Tìm trung vị mẫu
2). Hàm lượng nicotil trong 6 điếu thuốc đc xác định là 2.3 ,2.7, 2.5 , 2.9 , 3.1, 1.9
Tìm trung vị mẫu.
3) Mode M là giá trị của mẫu mà xảy ra thường xuyên nhất hoặc có tần số lớn nhất
Mode có thể không tồn tại, khi tất cả các quan sát xảy ra cùng tần số và khi nó tồn tại
không nhất thiết là giá trị duy nhất khi có nhiều giá trị xảy ra cùng với tần số lớn nhất
n

 ( X i  X )2
4) Phương sai mẫu . S2  i 1
.
n 1
n n
n X i2  ( X i ) 2
Định lý: . S2  i 1 i 1
.
n( n  1)

5) Độ lệch tiêu chuẩn mẫu ký hiệu bằng S là căn số bậc hai dương của phương sai mẫu.

mA
6) Tỉ lệ mẫu có tính chất A: . pˆ  . với mA : tần số xuất hiện tính chất A, n : cỡ
n
mẫu.
Ý nghĩa: Hai tham số chính là μ và σ2, để đo tâm của vị trí và tính biến thiên của phân phối
xác suất. Đây là các tham số tổng thể không đổi và không bị ảnh hưởng hay tác động do các
kết quả của một mẫu ngẫu nhiên.
3. Các hàm phân phối xác suất của thống kê
a) Phân phối mẫu của giá trị trung bình
Định nghĩa: Phân phối xác suất của một thống kê được gọi là phân phối lấy mẫu.
Giả sử một biến nn của n quan sát được lấy từ một tổng thể tuân theo phân phối chuẩn có
giá trị trung bình  và phương sai  2 . Mỗi quan sát X i sẽ có cùng phân phối chuẩn như

20
n

 Xi
tổng thể. Nên từ công thức X  i 1
ta có
n

    ...    2   2  ...   2 2
X    và  X2  
n n2 n
b). Định lý giới hạn trung tâm

Nếu X là giá trị trung bình của một mẫu ngẫu nhiên có kích thước n lấy từ tổng thể có giá
X 
trị trung bình  và phương sai  2 khi đó giới hạn phân phối của thống kê Z  là
/ n
phân phối chuẩn hóa N(z;0;1) khi n dần ra vô cùng.

Chú ý: Phép xấp xỉ chuẩn đối với X chỉ tốt khi n  30 . Nếu n<30 mức xấp xỉ sẽ chỉ tốt
nếu tổng thể không quá khác so với phân phối chuẩn.
Đặc biệt nếu nếu tổng thể có phân phối chuẩn thì ta khôn cần quan tâm tới cỡ mẫu.
Ví dụ:
1). Một công ty điện sản xuất các loại bóng điện có tuổi thọ theo phân phối chuẩn, với giá
trị trung bình bằng 800 và độ lệch chuẩn là 40.
a). Tìm xác suất của biến ngẫu nhiên 16 bóng đèn có tuổi thọ chưa đến 775 giờ.
b). tìm xác suất của biến nẫu nhiên tuổi thọ bóng đèn chưa đến 775 giờ
c. Phân phối mẫu của sự sai khác giữa hai giá trị trung bình.
Định lý: Nếu các mẫu độc lập có kích thước là n1, n2 được lấy nn từ hai tổng thể, rời rạc
haowcj liên tục, có các giá trị trung bình lần lượt là 1 ,  2 , các phương sai  12 ,  2 2 tương
ứng, khi đó phân phối của các thống kê mẫu của sự sai khác giữa hai giá trị trung bình,
X 1  X 2 được phân phối xấp xỉ chuẩn có ía trị trung bình và phương sai lần lượt là

 X  X  1   2 và  2

 12

 22
. khi đó thống kê Z 
X 1 
 X 2   1  2 

X1  X 2
1 2 n1 n2  12  22

n1 n2

phân phối xấp xỉ phân phối chuẩn hóa n(z;0;1).

Nếu n1 , n2 cùng lớn hơn 30 thì xấp xỉ phân phối chuẩn cho X 1  X 2 là rất tốt. Nếu một
trong hai n1 , n2 nhỏ hơn 30 thì phân phối tương đối tốt. Đặc biệt nếu cả hai ùng có phân

phối chuẩn thì X 1  X 2 có phân phối chuẩn dù cỡ mẫ nào.

Ví dụ:

21
Thí nghiệm hai loại sơn khác nhau để so sánh thời gian khô; 50 mẫu sơn laoij A và 50 mẫu
sơn loại B. Ở cả hai trường hợp độ lệch chuẩn tổng thể là 1.0. Giả thiết thời gian khô trung


bình là bằng nhau với cả hai loại sơn. Tính P  X A  X B  1 .
  
4. TÍNH CÁC THỐNG KÊ MỘT CHIỀU BẰNG MÁY CASIO fx-500MS
4.1 Thống kê mẫu một chiều

+ Xoá bộ nhớ cho lần tính mới: SHIFT CLR 3  

+ Vào chế độ SD: MODE 2

+ Nhập số liệu: cho dãy số xi M và cho bảng tần số xi ; mi M

+ Xem kết quả: SHIFT S  VAR 1   x , x n1  s X ,

SHIFT S  SUM 1    x 2 ,  x, n

4.2 Thống kê mẫu một chiều

+ Xoá bộ nhớ cho lần tính mới: SHIFT CLR 3  

+ Vào chế độ REG: MODE 3 1

+ Nhập số liệu: cho dãy số xi , yi M

và cho bảng tần số xi , yi ; mij M

+ Xem kết quả:

SHIFT S  VAR 1   x , x n1  s X ,  y, y n1  sY  A,B,r

SHIFT S  SUM 1    x 2 ,  x, n   y 2 ,  y,  xy

22
$6 BÀI TOÁN ƯỚC LƯỢNG TRUNG BÌNH CỦA MỘT MẪU
6.1 Giới thiệu

Chương trước ta đã tìm hiểu về thống kê và một số thống kê quan trọng với mục đích là xây dựng
nền tảng cho phép những người làm thống kê rút ra những kết luận về các tham số của tổng thể từ
số liệu thực nghiệm. Chẳng hạn, định lý giới hạn trung tâm cho ta biết về dạng phân phối của trung
bình mẫu X . Phân phối đó liên quan mật thiết đến trung bình của tổng thể  . Do vậy bất kỳ một
kết luận gì về  dựa trên mẫu, đều phải dựa vào trung bình mẫu. Tương tự cho phương sai mẫu của
tổng thể có phân phối chuẩn.

Chương này ta bắt đầu bằng việc chỉ rõ mục đích của suy luận thống kê. Sau đó, ta sẽ tìm hiểu về
bài toán ước lượng tham số của tổng thể.

6.2 Suy luận thống kê

Lý thuyết suy luận thống kê chứa đựng các phương pháp mà dựa vào đó ta có thể đưa ra những suy
luận hoặc những kết luận khái quát về tổng thể.

Suy luận thống kê được chia thành hai mảng chính: Ước lượng và kiểm định giả thuyết.

Ví dụ: Một ứng cử viên tổng thống muốn ước lượng tỉ lệ cử tri ủng hộ ông ta trên toàn quốc bằng
cách lấy ý kiến của 500 000 cử tri được chọn ngẫu nhiên và độc lập từ các vùng miền khác nhau. Tỉ
lệ cử tri trong mẫu ủng hộ ông ta làm cơ sở để đưa ra ước lượng về tỉ lệ ủng hộ ông ta trên toàn
quốc.
Đây là bài toán ước lượng tham số.
Khi ông ta tuyên bố tỉ lệ cử tri ủng hộ ông ta trên toàn quốc là 70%, thì vấn đề đặt ra đối với ứng cử
viên đối lập là cần tìm hiểu xem lời phát biểu trên có cơ sở hay không.

Bài toán này thuộc về mảng kiểm định giả thiết.

6.3 Ước lượng điểm

Ước lượng điểm của một tham số tổng thể  nào đó là một giá trị cụ thể  của thống kê 
.

Ví dụ giá trị x của thống kê X , được tính từ một mẫu cỡ n, là một ước lượng điểm của trung bình
 dùng để ước lượng tham số tổng thể  với tính chính
tổng thể  . Ta không mong đợi thống kê 

xác tuyệt đối, thế nhưng cũng hy vọng rằng  không quá xa  .

Đối với một mẫu cụ thể, dùng thống kê 


X để ước lượng  có thể cho ước lượng tốt hơn.
Ví dụ:
Xét một tổng thể với trung bình là  = 4

23
Từ mẫu 2, 5, 11 ta thấy x = 6 còn trung vị mẫu x  5 , như thế thì 
X cho tư ước lượng gần với 
hơn so với X .

Tuy nhiên với mẫu 2, 6, 7 thì x = 5 còn x  6 tức là X lại cho ta ước lượng gần với tham số của

tổng thể hơn so với 


X.
Khi không biết giá trị thực của  thì ta không biết chọn X hay là 
X .
Ước lượng không chệch
Định nghĩa 1
  .
 được gọi là ước lượng không chệch của tham số  nếu   E 
Thống kê    
Phương sai của ước lượng điểm
1, 
Nếu   2 là hai ước lượng không chệch của tham số  , thì ta sẽ chọn thống kê với

 1 là ước lượng của  hiệu quả hơn so với 


phương sai nhỏ hơn. Khi  2   2 , ta nói  2 .
1 2

Định nghĩa2:
Trong số tất cả các ước lượng không chệch của tham số  , ước lượng có phương sai nhỏ
nhất được gọi là ước lượng hiệu quả của  .
Ngoài cách ước lượng điểm nói trên, người ta còn có thể dùng một khoảng của trục số thực
để ước chừng tham số chưa biết rơi vào khoảng đó.
6.4. ƯỚC LƯỢNG KHOẢNG
Đặt vấn đề: Cho X có dạng phân phối xác suất nào đó nhưng các tham số chung  chưa
biết. Từ mẫu thực nghiệm kích thước n, ta muốn ước lượng  với xác suất xẩy ra
(1   )100% khá lớn. Tức là cần xác định một khoảng (ˆL ,ˆU ) chứa được giá trị chưa biết

 sao cho xác suất xảy ra là P (ˆL    ˆU )  1   .

Khi cỡ mẫu tăng thì  X2   2 / n giảm đi, và kết quả là ước lượng của chúng ta có thể gần
hơn đến tham số μ, vì khoảng sinh ra ngắn hơn. Nói chung là các mẫu khác nhau sẽ sinh ra
các giá trị ̂ khác nhau và vì thế có các giá trị khác nhau của ˆL và ˆU . Các điểm mút đó là
ˆ và 
các giá trị của các biến ngẫu nhiên tương ứng  ˆ sao cho P (
ˆ   
ˆ ) 1
L U L U

Định nghĩa: Ta nói rằng khoảng (ˆL ,ˆU ) là khoảng tin cậy (khoảng ước lượng) của  với

độ tin cậy (1   )100% nếu P (ˆL    ˆU )  1  


Chú ý: Với một giá trị của (1   )100% có nhiều khoảng

ước lượng của  nên thường chọn khoảng (ˆL ,ˆU ) sao cho

| ˆU  ˆL | nhỏ nhất, giúp ta xác định chính xác hơn tham số

24
cần tìm.
Hiệu | ˆU  ˆL | gọi là độ dài của khoảng tin cậy.

6.4.1 ƯỚC LƯỢNG CHO MỘT TRUNG BÌNH


Trong phần này ta bàn đến khoảng tin cậy (1 – )100% cho trung bình của tổng thể  .
Nếu mẫu của ta được chọn từ một tổng thể phân phối chuẩn hoặc cỡ mẫu đủ lớn, thì thiết
lập được khoảng tin cậy cho  bằng cách xét thống kê X .

Thật vậy, theo định lý giới hạn trung tâm thì X có phân phối xấp xỉ chuẩn với trung bình
 X   và độ lệch chuẩn là  X   / n . Đặt z / 2 là số sao cho xác suất để biến ngẫu nhiên

tiêu chuẩn Z nhận giá trị lớn hơn z / 2 , bằng  / 2

X 
Ta có P(- zα/2< Z < zα/2) = 1 -  , trong đó Z  .
/ n

   
Như vậy, P X  z / 2    X  z / 2   1   .
 n n

Tức là với một mẫu ngẫu nhiên cỡ n được chọn từ một tổng thể mà  2 đã biết và ta tính
được x , thì ta được một khoảng tin cậy (1 – )100% như trong phát biểu dưới đây.
* Khoảng tin cậy của μ, khi biết σ
Nếu x là trung bình của một mẫu ngẫu nhiên cỡ n được lấy từ tổng thể với  2 đã biết thì
 
khoảng tin cậy (1   )100% của μ , khi biết σ là . x  z /2    x  z /2 .
n n
trong đó z /2 được xác định bởi P(Z > z / 2 ) =  / 2 .

Chú ý: Để tính giá trị z /2 ta tra bảng A.3 với giá trị diện tích là 1  .
2
Với n  30 và chưa biết  hoặc không biết phân phối của tổng thể thì vẫn sử dụng công
thức trên bằn cách thay s cho  .
Ví dụ Hàm lượng kẽm trung bình thu hồi được từ một mẫu các giá trị đo kẽm tại 36 điểm
đo khác nhau được xác định là 2,6g/ml. Xác định các khoảng tin cậy 95% cho mật độ kẽm
trung bình ở sông. Giả thiết độ lệch chuẩn tổng thể là 0,3 g/ml.
25
Định lý: Nếu x được sử dụng để ước lượng điểm cho  thì với độ tin cậy (1   )100% ta

cho rằng sai số của ước lượng không quá x    z /2
n

Định lý: Nếu x được sử dụng để ước lượng điểm cho  thì với độ tin cậy (1   )100% để
2
 
sai số của ước lượng không quá  khi đó cỡ mẫu tối thiểu là n   z /2  ( n được làm
 
tròn đến số nguyên tiếp theo.
* Khoảng tin cậy của μ, khi chưa biết σ , cỡ mẫu nhỏ (n < 30).

X 
Ta đã biết tổng thể có phân phối chuẩn, thì biến ngẫu nhiên T  có phân phối
S/ n
Student với n-1 bậc tự do, trong đó S là độ lệch tiêu chuẩn. Ta dùng T để xây dựng khoảng
tin cậy  với phương sai tổng thể chưa biết. ta có P  t /2  T  t /2   1  

Khi biết  ta xác định được t /2 bằng bảng A.4. Từ đó ta có P  t /2  T  t /2   1  

Định lý: Nếu x và s là số trung bình và độ lệch chuẩn của mẫu ngẫu nhiên được rút ra từ
biến ngẫu nhiên của chuẩn có phương sai σ2 chưa xác định, khoảng tin cậy (1   )100%
cho μ là:

s s
. x  t /2    x  t /2 .
n n

trong đó t /2 là giá trị t với v  n  1 bậc tự do, sinh ra một diện tích bằng  / 2 bên phía
phải.
Chú ý: Kết quả trên có giả thiết là phân phối chuẩn, tuy nhiên phân phối xấp xỉ chuẩn thì sử
dụng kết quả trên cũng khá tốt.
Ví dụ: Hàm lượng axit sulfuric (đơn vị lít) của 7 container là

26
9,8 10,2 10,4 9,8 10,0 10,2 9,6

Tìm khoảng tin cậy 95% cho hàm lượng axit sulfuric trung bình của các container đó, giả
sử ước lượng có phân phối chuẩn.
*Khoảng tin cậy của μ, khi chưa biết σ , cỡ mẫu lớn (n >=30).
Trường hợp này vì cỡ mẫu lớn nên ta coi s   và đưa về trường hợp  đã biết.

BÀI 7: BÀI TOÁN TRUNG BÌNH CỦA HAI MẪU VÀ TỈ LỆ


I. ƯỚC LƯỢNG HIỆU HAI TRUNG BÌNH

1. Khoảng tin cậy cho μ1  μ2 , khi biết 1 , 2

Nếu x1 và x2 là các giá trị trung bình của các mẫu ngẫu nhiên độc lập có kích thước n1 và

n2 từ các tổng thể có các phương sai đã biết  12 và  22 , khoảng tin cậy (1   )100% đối với

 12  22  12  22
1  2 là . ( x2  x1 )  z /2    2  1  ( x2  x1 )  z /2  .
n1 n2 n1 n2

trong đó z /2 là giá trị của z sinh ra một diện tích  / 2 về phía phải của nó

Chú ý: Nếu không giả thiết tính chuẩn tắc, các mẫu lớn hơn 30 sẽ cho phép sử dụng s1 và
s2 thay cho σ1 và σ2 với giá trị hữu tỷ s1   1 và s2   2

Ví dụ
Tiến hành thí nghiệm với hai loại động cơ A và B để so sánh sự tiêu thụ khí gas trên mỗi
gallon. Làm 50 thí nghiệm đối với loại động cơ A và 75 thí nghiệm cho động cơ B. Lượng
tiêu thụ trung bình đối với động cơ A là 36 dặm mỗi gallon và đối với loại máy B là 42 dặm
mỗi gallon. Xác định một khoảng tin cậy 96% trên  B   A , trong đó  B và  A là lượng tiêu
thụ chuẩn tổng thể đối với máy B và A. Giả thiết rằng độ lệch chuẩn tổng thể là 6 và 8 cho
lần lượt máy A và B.

2. Khoảng tin cậy cho μ1  μ2 , chưa biết 1 , 2 nhưng 1 = 2 .


Nếu x1 và x2 là các giá trị trung bình của các mẫu ngẫu nhiên độc lập kích thước n1 và n2,
từ các tổng thể chuẩn ước lượng có các phương sai chưa biết nhưng bằng nhau, thì một
khoảng tin cậy (1   )100% cho 1   2 là

1 1 1 1
. ( x1  x2 )  t /2 s p   1  2  ( x1  x2 )  t /2 s p  .
n1 n2 n1 n2

(n1  1) s12  (n2  1) s22


với s 2p  là ước lượng của độ lệch chuẩn tổng thể,
n1  n2  2
27
và t /2 có v  n1  n2  2 bậc tự do

VD Học viện bách khoa Virginia nghiên cứu độ chênh lệch lượng hóa chất orthophospho
được đo tại hai trạm khác nhau trên sông James. Lấy 15 mẫu được thu thập tại trạm 1 có
hàm lượng orthophospho trung bình là 3,84 mg/l và độ lệch chuẩn 3,07 mg/l. Lấy 12 mẫu
tại trạm 2 có hàm lượng trung bình 1,49 mg/l và độ lệch chuẩn 0,80 mg/l. Tìm một khoảng
tin cậy 95% cho độ lệch của các hàm lượng orthophospho trung bình tổng thể tại hai trạm
này, giả thiết rằng các quan sát lấy từ các tổng thể chuẩn có phương sai bằng nhau.
Ví dụ 2: Cho hai tổng thể A và B. Một mẫu từ A có cỡ mấu 12 cho ta giá trị trung bình mẫu
là 3.11 và độ lệch tiêu chuẩn là 0,771. Một mẫu từ B có cỡ là 10, cho ta gía trị trung bình là
2.04 và độ lệch tiêu chuẩn là 0.448. tìm khoảng tin cậy 90% cho hiệu  A   B giả sử hai
tổng thể có phân phối xấp xỉ chuẩn và có phương sai bằn nhau nhưng chưa biết.
II. ƯỚC LƯỢNG TỶ LỆ VỚI CỠ MẪU LỚN
1. Ước lượng một tỷ lệ.
Ta quan tâm đến tỷ lệ cá thể thành công p trong một tổng thể nào đó, nhưng p chưa biết. Vì

thế ta có thể dùng ước lượng điểm p để ước lượng cho p, p được xác định bằng thống kê
X
Pˆ  , trong đó X là số cá thể thành công trong một mẫu ngẫu nhiên n. Cũng giống như
n
ước lượng cho kỳ vọng, chúng ta có thể xét khoảng tin cậy cho p bằng cách xét phân phối
mẫu P̂ .

Với cách xác định P̂ như trên, P̂ có được phân bố chuẩn với kỳ vọng là  Pˆ  E ( Pˆ )  p

pq Pˆ  p
và phương sai  P̂2  nên Z  có phân phối chuẩn chuẩn hóa.
n pq / n

pq pq
Ta có: P ( z /2  Z  z /2 )  1    P( Pˆ  z /2  p  Pˆ  z /2 )  1
n n

Khi n lớn, rất ít sai số xảy ra, nên thay thế ước lượng điểm p̂ cho p thì:

ˆˆ
pq ˆˆ
pq
P ( Pˆ  z /2  p  Pˆ  z /2 ) 1
n n

Khoảng tin cậy (1   )100% đối với p khi mẫu lớn là

ˆˆ
pq ˆˆ
pq
. pˆ  z /2  p  pˆ  z /2 .
n n

với p̂ là tỷ lệ của các thành công trong một mẫu ngẫu nhiên có kích thước n và qˆ  1  pˆ .

Định lý: Nếu dùng p̂ để làm ước lượng cho p, thì với độ tin cậy (1   )100% ta có thể
28
pq
khẳng định rằn sai số của ước lượng không vượt quá   z /2
n

Định lý: Nếu dùng p̂ để làm ước lượng cho p, thì với độ tin cậy (1   )100% để sai số

z 2 /2  
khoog vượt quá  thì kích thước mẫu tối thiểu là n  pq .
 2

Hệ quả: Nếu dùng p̂ để làm ước lượng cho p, thì với độ tin cậy (1   )100% để sai số

z 2 /2
khoog vượt quá  thì kích thước mẫu cần dùng là n  . ( chưa có tỷ lệ cho trước)
4 2
Ví dụ Trong một mẫu ngẫu nhiên n=500 gia đình có ti vi tại thành phố Hamilton, Canada,
xác định được rằng x=340 đăng ký HBO.
(a). Tìm khoảng tin cậy khoảng tin cậy 95% cho tỷ lệ thật sự các gia đình trong thành phố
này đăng ký sử dụng HBO.
(b) Nếu độ tin cậy là 95% thì cần điều tra bao hiêu gia đình để sai số ước lượng nhỏ hơn
0.02
(c) Nếu không có mẫu sơ bộ nói trên thì cần lấy mẫu bao nhiêu để độ tin cậy 95% của sai số
ước lượng p nhỏ hơn 0.02.
Ví dụ:
Để nghiên cứu về lượng bò sữa của một giống bò sữa mới, người ta tiến hành điều tra một
cách nhẫu nhiên 100 con bò cho kết quả như sau

Lượng sữa X(l)/ngày <9 9-11 11-13 13-15 >15

Số con bò 10 24 42 16 8

hãy ước lượng khoảng lượng sữa trung bình trong một này của con bò và tỉ lệ tổng thể của
số con bò cho trên 11 lít sữa trong một này với cùng độ tin cậy 98%.
2. Ước lượng sai khác giữa hai tỷ lệ với cỡ mẫu lớn.
Nếu p̂1 và p̂2 là tỷ lệ thành công trong các mẫu ngẫu nhiên có n1 và n2 tương ứng
qˆ1  1  pˆ1 và qˆ2  1  pˆ 2 , với độ tin cậy (1   )100% thì khoảng tin cậy cho sự sai khác

pˆ1qˆ1 pˆ 2 qˆ2 pˆ1qˆ1 pˆ 2 qˆ2


giữa hai tỷ lệ là ( pˆ1  pˆ 2 )  z /2   p1  p2  ( pˆ1  pˆ 2 )  z /2  .
n1 n2 n1 n2

Ví dụ Trong quá trình sản xuất các linh kiện, các mẫu thu được sử dụng cả quá trình mới và
quá trình hiện tại để xác định liệu quá trình mới có hiệu quả hơn hay không. Nếu 75 trong
số 1500 linh kiện trong quy trình hiện tại được xác định có lỗi và 80 trong số 2000 linh kiện

29
của quá trình mới được xác định có lỗi, tìm khoảng tin cậy 90% cho sai số chân thực trong
phần các sản phẩm bị lỗi giữa quá trình hiện tại và quá trình mới.

CÁC BƯỚC BÀI TOÁN TÌM KHOẢNG TIN CẬY

+ Gọi  ( 1 , 2 ) là trung bình của biến ngẫu nhiên X hoặc p ( p1 , p2 ) là tỷ lệ của tính chất

A nào đó của X.
+ Số liệu mẫu n, x , s hoặc n, x

+ Ta có giả thiết về độ tin cậy (1   )100% hoặc độ lệch chuẩn  (nếu cho).

+ Bài toán yêu cầu ước lượng 1 trung bình (hiệu 2 trung bình, một tỷ lệ, hiệu 2 tỷ lệ) ,
trong trường hợp biết (hoặc chưa biết) phương sai , cỡ mẫu lớn (hoặc nhỏ)
+ Xác định công thức ước lượng và thay số liệu mẫu.
+ Kết luận

$8 KIỂM ĐỊNH GIẢ THUYẾT MỘT MẪU

I. CÁC KHÁI NIỆM CHUNG.


1. Giả thuyết thống kê
Trong đời sống kinh tế xã hội chúng ta hay đưa ra các nhận định hoặc ước đoán. Ví dụ, một
nhà nghiên cứu y khoa có thể khẳng định dựa trên những chứng cứ thực nghiệm rằng uống
cà phê làm tăng khả năng mắc bệnh ung thư ở người; một kỹ sư có thể khẳng định dựa trên
cơ sở các mẫu số liệu, rằng có sự khác biệt giữa độ chính xác của hai loại máy đo.
Định nghĩa: Một sự xác nhận hay phỏng đoán liên quan tới một hay nhiều tổng thể gọi là
một giả thuyết thống kê.
2. Kiểm định giả thiết.
Sự đúng hay sai của một giả thuyết thống kê không thể biết được một cách chắc chắn, trừ
khi ta khảo sát được toàn bộ tập hợp. Điều này tất nhiên không thực tế trong đa số trường
hợp. Thay vào đó, ta lấy một mẫu ngẫu nhiên từ tập hợp được quan tâm và sử dụng dữ liệu
có trong mẫu để đưa ra bằng chứng mà theo đó, ta chấp nhận hoặc không chấp nhận giả
thuyết. Bằng chứng từ mẫu mà mâu thuẫn với giả thuyết sẽ đưa đến việc bác bỏ giả thuyết;
ngược lại, bằng chứng phù hợp với giả thuyết sẽ đưa đến việc chấp nhận nó gọi là kiểm
định giả thiết.
3. Giả thiết và đối thiết

30
Gọi một giả thiết H 0 :    0 , các giả thiết khác    0 (   0 ,   0 ) gọi là đối thiết H1 .

Với dạng giả thiết H 0 :    0 , đối thiết H1 :    0 gọi là kiểm định hai phía

còn loại H1 :    0 , H1 :    0 gọi là kiểm định một phía.

Giả thiết H 0 luôn được phát biểu bởi dấu "="

+ Nếu yêu cầu đề cập đến hướng như là lớn hơn, nhỏ hơn, tốt hơn, kém hơn... thì H1 sẽ
được phát biểu qua dấu bất đẳng thức
+ Nếu yêu cầu đề cấp đến hướng tới kép như là ít nhất, nhiều nhất, bằng hoặc lớn hơn,
không nhiều hơn thì dấu kép ( ,  ) được biểu diễn cho H 0 ( chỉ sử dụng dấu bằng) và H1
cho hướng ngược lại.
+ Cuối cùng nếu không hướng nào được đề cập đến thì H1 được phát biểu qua dấu không
bằng (  ).
Ví dụ:
(1) trong kiểm định một loại thuốc mới, ta muốn đưa ra chứng cớ rằng hơn 30% bệnh nhân
được chữa khỏi.
Vậy H1 : p  30% do đó giả thiết H 0 : p  30%

(2) Hãng sản xuất ngũ cốc muốn khẳng định lượng chất béo trung bình trong ngũ cốc không
vượt quá 1,5 miligram.
H 0 :   1.5
H1 :   1.5

Mặc dù phát biểu giả thiết với dấu bằng, cần hiểu nó bao ồm cả các giá trị không được nhắc
ới trong đối thiết. do vậy việc chấp nhận H0 không có nghĩa chính xác là   1.5

(3) Một đại lý nhà đất khẳng định rằng 60% số nhà riêng đang được xây dưng ngày nay là
có 3 phòng ngủ. Để kiểm tra kiểm tra khẳng định này, một lượng lớn căn nhà mới xây được
kiểm tra, tỉ lệ nhà có ba phòng ngủ dduwoj hi lại và sử dụng trong chỉ tiêu kiểm định. Phát
biểu giả thiết và đối thiết
Giả thiết : H 0 : p  0.6 đối thiết H1 : p  0.6 .

4. Các khả năng có thể xảy ra trong kiểm định giả thuyết.
H 0 đúng H 0 sai

Chấp nhận H 0 Quyết định đúng Sai lầm loại II

Bác bỏ H0 Sai lầm loại I Quyết định đúng

31
+ Bác bỏ giả thiết đúng gọi là sai lầm loại I. Chấp nhận giả thiết sai gọi là sai lầm loại II.
Xác suất mắc phải sai lầm loại I, cũng được gọi là mức ý nghĩa, được ký hiệu là  .
5. Miền bác bỏ và miền chấp nhận
Thủ tục để quyết định trong kiểm định giả thiết được xây dựng với khái niệm về xác suất
của quyết định sai lầm. Tức là việc chấp nhận một giả thuyết chỉ đơn thuần là dữ liệu
không cho đủ thông tin để bác bỏ nó. Nói cách khác, sự bác bỏ có nghĩa là có một xác
suất rất nhỏ để nhận được thông tin từ mẫu đã được quan sát mà theo đó, giả thuyết là
đúng. Với kết quả rủi ro nhỏ của quyết định sai lầm, dường như sẽ an toàn khi bác bỏ giả
thuyết. Cũng nhấn mạnh rằng việc chấp nhận giả thuyết sẽ không loại bỏ những khả năng
khác khi có mẫu khác.
Xác suất sai lầm loại I và loại II có liên quan đến nhau. Việc giảm xác suất mắc sai lầm này
sẽ làm tăng xác suất mắc sai lầm kia nên trong thực tiễn không thể đồng thời làm giảm xác
suất của cả 2 sai lầm đó trừ khi tăng cỡ mẫu n. Do sai lầm loại I dễ kiểm soát và dễ tính hơn
nên chọn trước số  rất nhỏ như là một ngưỡng để xác định sai lầm loại I . Theo nguyên lý:
“Một biến cố có xác suất nhỏ thì coi như không xẩy ra trong một phép thử” nên kể cả
trường hợp giả thiết đúng mà bị bác bỏ thì khả năng đó hầu như không xảy ra.
6. Các bước của bài toán kiểm định giả thiết
Bước 1: Mô tả H0, chọn đối thiết H1 phù hợp.
Bước 2: Chọn thống kê tiêu chuẩn hợp lý ( chỉ tiêu kiểm định). Từ đó tính các giá trị thống
kê thông qua số liệu mẫu.
Bước 3: Chọn mức ý nhĩa, tìm miền bác bỏ
Bước 4: Kiểm tra xem chỉ tiêu kiểm định nằm trong miền chấp nhận hay bác bỏ.
Bước 5: Từ đó quyết định chấp nhận hay bác br giả thiết.
II. KIỂM ĐỊNH TRUNG BÌNH.
1. Kiểm định về một trung bình, đã biết phương sai

Giả thiết Đối thiết Chỉ tiêu kiểm Giá trị tới Miền bác bỏ
định hạn
H1 :    0 X  0 zth  z /2 D   ,  z /2    z /2 ,  
Z
/ n
H 0 :   0 H1 :    0 zth  z D   z ,  
x  0
H1 :   0 z zth  z D   ,  z 
/ n

Ví dụ:

32
(1). Một nhà sản xuất đưa ra một loại dây câu mới, họ khẳng định trọng lượng trung bình
dây có thể chịu là 8 kg, với độ lệch chuẩn là 0,5 kg. Để kiểm định giả thuyết   8 kg , đối
thuyết   8 , người ta lấy 50 dây ngẫu nhiên kiểm tra thấy trọng lượng trung bình dây có
thể chịu là 7,8 kg. Hãy kiểm định khẳng định của nhà sản xuất với mức ý nghĩa 0,01.
(2). Một mẫu ngẫu nhiên gồm 100 giấy báo tử ở Mỹ cho thấy tuổi thọ trung bình hiện nay là
71.8 năm. Giả sử độ lệch chuẩn là 8.9 năm; có thể cho rằng tuổi thọ trung bình hiện nay là
hơn 70 năm được không? Cho mức ý nghĩa 0.05
2. Kiểm định về một trung bình, chưa biết phương sai và cỡ mẫu nhỏ.
Giả thiết Đối thiết Chỉ tiêu kiểm Giá trị tới Miền bác bỏ
định hạn
H1 :    0
X  0
tth  t /2, n1 
D  , t /2, n 1   t /2, n 1 ,  
T
s/ n
H 0 :   0 H1 :    0 tth  t , n1 D  t , n1 ,  
x  0
t 
H1 :   0 s/ n tth  t , n1 
D  , t , n1 

Ví dụ Một báo cáo khẳng định mỗi máy hút bụi tiêu thụ điện khoảng 46 kWh mỗi năm. Từ
một mẫu gồm 12 gia đình được nghiên cứu, cho thấy máy hút bụi tiêu thụ điện trung bình
42 kWh mỗi năm với độ lệch chuẩn 11,9 kWh. Liệu có thể nói, với mức ý nghĩa 0,05, mức
tiêu thụ điện trung bình của máy hút bụi tiêu thụ bằng 46 kWh mỗi năm hay không? Giả sử
mật độ của số kWh là chuẩn.
vÍ DỤ: Cơ thể người cần khoảng 220 miligram natri một ngày. Khảo sát 20 loại suất ăn của
một hãng ta có số liệu sau.
Natri(mg) 200 210 220 230 240 250 260
Số suất 2 3 4 4 2 3 2
Với mức ý nghĩa 0.05, có thể nói lượng natri trung bình trong các suất ăn của hãng này lớn
hơn 220mg không? Giả sử phân phối là chuẩn.
3. Kiểm định về một trung bình, khi chưa biết phương sai cỡ mẫu lớn
Trường hợp này vì cỡ mẫu lớn nên ta có thể coi s   đưa về trường hợp đã biết phương
sai.

33
Bài 9: KIỂM ĐỊNH GIẢ THIẾT VỀ TRUNG BÌNH HAI MẪU VÀ TỈ LỆ
1. Kiểm định hai trung bình, biết phương sai
1. H 0 : 1   2  d 0 , H1 : 1   2  d 0 (hoặc 1  2  d 0 , 1   2  d 0 )

( X 1  X 2 )  d0 ( x1  x2 )  d 0
2. Chỉ tiêu kiểm định: . Z  z .
 / n1   / n2
2
1
2
2  12 / n1   22 / n2

3. Mức ý nghĩa  , suy ra miền bác bỏ D   ,  z /2    z /2 ,   hoặc D   ,  z  hoặc

D   z ,  

4. Kiểm tra z  D hay z  D

5. Kết luận bài toán


Ví dụ: Người ta thí nghiệm hai phương pháp chăn nuôi gà khác nhau để xem trọng lượng gà
sau một tháng. Kết quả như sau: Phương pháp 1 nuôi 100 con, trọng lượng trung bình là
x1  1.1( kg ) . Phươn pháp 2 nuôi 150 con, trong lượng trung bình là x1  1.2(kg ) . Với mức ý

nghĩa 0.05 có thể kết luận hai phương pháp cho trọng lượng gà khác nhau không. Giả sử
trọng lượng gà theo luật chuẩn với phương sai của phương pháp 1 và 2 lần lượt là
 12  0.04 ,  22  0.098 .

Ví dụ:
Một mẫu ngẫu nhiên n1 = 25 lấy từ tổng thể có phân phối chuẩn với độ lệch chuẩn  1  5 và

giá trị trung bình là x1  80 . Một mẫu nẫu nhiên thứ 2 có n2 = 6 lấy từ tổng thể có phân
phối chuẩn với độ lệch chuẩn  2  3 và giá trị trung bình x 2  75 . Kiểm định gải thiết khôn
có sự sai khác về chất lượng hai tổn thể với mức ý nghĩa 0.05.
4. Kiểm định hai trung bình, khi phương sai chưa biết nhưng bằng nhau
1. H 0 : 1   2  d 0 , H1 : 1   2  d 0 (hoặc 1  2  d 0 , 1   2  d 0 )

( X1  X 2 )  d0 s12 (n1  1)  s22 (n2  1)


2. Chỉ tiêu kiểm định: T  với s 2p  , v  n1  n2  2
s p 1 / n1  1 / n2 n1  n2  2


3. Mức ý nghĩa  , suy ra miền bác bỏ D  , t /2,n1  n2 2   t /2,n1  n2 2 ,   hoặc

 
D  , t ,n1  n2 1  hoặc D  t ,n1  n2 1 ,  .

4. Kiểm tra t  D hay t  D .

5. Kết luận bài toán.

Ví dụ Một thí nghiệm được thực hiện nhằm so sánh mức độ mài mòn của hai loại kim loại

34
khác nhau. Lấy 12 miếng kim loại 1 được kiểm tra bằng cách đưa vào máy đo độ mài mòn
và 10 miếng kim loại 2 được kiểm tra tương tự. Mẫu ứng với kim loại 1 có độ mài mòn
trung bình là 85 đơn vị và độ lệch mẫu bằng 4. Trong khi mẫu ứng với kim loại 2 có độ mài
mòn trung bình là 81 và độ lệch mẫu là 5. Có thể kết luận, với mức ý nghĩa 0,05, rằng mức
độ mài mòn của kim loại 1 hơn kim loại 2 là 2 đơn vị không? Giả sử các mật độ đều xấp xỉ
chuẩn với phương sai bằng nhau.

II. KIỂM ĐỊNH VỀ TỶ LỆ.


1. Kiểm định một tỷ lệ với cỡ mẫu lớn.
1. H 0 : p  p0 , H1 : p  p0 Hoặc p  p0 , p  p0

X  np0
2. Chỉ tiêu kiểm định: . Z .
np0 q0

3. Với mức ý nghĩa  ta suy ra giá trị tới hạn và miền bác bỏ
4. Kiểm tra và kết luận bài toán
VD Một loại thuốc an thần thường được dùng được tin là chỉ có tác động tới 60% người sử
dụng. Kết quả thử nghiệm loại thuốc mới trên 100 người trưởng thành cho thấy 70 người
nhận được tác dụng. Có thể tin được hay không rằng loại thuốc mới khác với loại thường
dùng với mức ý nghĩa 0,05.
Ví dụ:
Thống kê khối lượng X(g) của hộp sữa ta thu được bảng

X 398 399 400 401

m 11 60 117 62

Nhữn hộp sữa dưới 399 là sai quy cách. với mức ý nghĩa 2% hãy kiểm định giả thiết tỷ lệ
hộp sữa sai quy cách nhỏ hơn 5%.
2. Kiểm định về hai tỷ lệ bằng nhau với cỡ mẫu lớn.

pˆ1  pˆ 2 x1  x2
Chỉ tiêu kiểm định: . z . với pˆ  là ước lượng gộp
ˆ ˆ[(1 / n1 )  (1 / n2 )]
pq n1  n2

chung cho tỷ lệ từ hai mẫu.


VD6.5 Một cuộc bỏ phiếu được đưa ra để xác định vị trí xây dựng một nhà máy hóa chất ở
trong thị trấn hay ở ngoại vi thị trấn. Có 120 trên 200 cử tri trong thị trấn đồng ý xây dựng
nhà máy trong thị trấn và 240 trên 500 cử tri ở ngoại vi đồng ý với đề xuất này. Liệu có thể
cho rằng tỷ lệ cử tri trong thị trấn và tỷ lệ cử tri ở ngoại vi đồng ý với đề xuất như nhau hay
35
không? Sử dụng mức ý nghĩa 0,025.

36

You might also like