You are on page 1of 16

Chương 5

Kiểm định giả thiết thống kê


5.1 Một số khái niệm
5.1.1 Giả thiết thống kê
Trong thực tế, chúng ta hay nêu lên những nhận xét khác nhau về các đối tượng mà
chúng ta quan tâm. Những nhận xét như vậy được gọi là các giả thiết. Chúng có thể đúng
mà cũng có thể sai. Việc xác định tính đúng sai của một giả thiết được gọi là kiểm định.
Giả thiết thống kê là một mệnh đề có liên quan đến qui luật phân phối xác suất của
một biến ngẫu nhiên nào đó.
Ví dụ:
* Khi nghiên cứu thu nhập của người dân ở một địa phương, người ta có thể đưa ra
nhiều giả thiết khác nhau như: thu nhập của người dân tuân theo luật phân phối chuẩn, thu
nhập trung bình trong năm của người dân là 60 triệu đồng, …
* Có ý kiến cho rằng học sinh trường Tiểu học A học môn Toán tốt hơn học sinh
trường Tiểu học B, nhưng cũng có ý kiến chưa nhất trí.
* Có ý kiến cho rằng tình trạng đạo đức của thanh thiếu niên phụ thuộc vào hoàn
cảnh gia đình, nhưng cũng có ý kiến chưa nhất trí, …
Giả thiết thống kê đưa ra thường được ký hiệu là H 0 (hoặc H). Mệnh đề đối lập
với H 0 được gọi là đối thiết (đối giả thiết) và được ký hiệu là H1 (hoặc H ).
Giả sử ta cần tìm tham số trong luật phân phối xác suất của biến ngẫu nhiên X.
Ta có thể đưa ra giả thiết H 0 : θ = θ 0 với θ0 là hằng số cho trước. Khi đó đối thiết của H 0
có thể là một trong các trường hợp sau:
H1 : θ ≠ θ 0 ; H1 : θ < θ 0 ; H1 : θ > θ 0
Giả thiết thống kê là một mệnh đề, cho nên nó có thể đúng hoặc sai. Vì thế ta cần
kiểm định, tức là tìm ra kết luận là chấp nhận hay bác bỏ giả thiết H 0 . Khi đó, ta cũng sẽ
bác bỏ hay chấp nhận đối thiết H1 . Việc kiểm định này được gọi là kiểm định giả thiết
thống kê vì nó dựa vào thông tin thực nghiệm của mẫu để kết luận.
Khi phát biểu bài toán kiểm định giả thiết thống kê thì giả thiết H 0 và đối thiết H1
luôn đi kèm với nhau. Chẳng hạn, H 0 : θ = θ 0 ; H1 : θ ≠ θ 0 .

5.1.2 Các bước của một bài toán kiểm định giả thiết thống kê
Giả sử cần nghiên cứu về tham số trong luật phân phối xác suất của biến ngẫu
nhiên X. Ta chưa biết nhưng đã có cơ sở để đưa ra giả thiết: H 0 : θ = θ 0 với đối thiết H1 .
Trước hết, từ biến ngẫu nhiên gốc X, ta lập mẫu ngẫu nhiên ( X1, X 2 ,..., X n ) cỡ n.
Sau đó, ta đi tìm một thống kê:
G = f ( X 1, X 2 ,..., X n ,θ0 )

84
sao cho nếu H 0 đúng thì qui luật phân phối xác suất của G là hoàn toàn xác định và với
mẫu cụ thể ( x1, x2 ,..., xn ) thì G cũng nhận một giá trị cụ thể. Thống kê G được gọi là tiêu
chuẩn kiểm định.
Do qui luật phân phối xác suất của thống kê G là hoàn toàn xác định nên với một
xác suất khá nhỏ (α ≤ 0, 05) , ta có thể tìm được miền W tương ứng sao cho nếu H 0
đúng thì:
P (G ∈ W / H 0 ) = α
Vì khá nhỏ, nên ta có thể coi biến cố (G ∈ W ) không xảy ra. Khi đó, giá trị
được gọi là mức ý nghĩa của kiểm định. Miền W được gọi là miền bác bỏ của giả thiết
H 0.
Lấy mẫu cụ thể ( x1, x2 ,..., xn ) , qua đó tính được một giá trị cụ thể của tiêu chuẩn
kiểm định: Gqs = f ( x1 , x2 ,..., xn , θ 0 ) . Giá trị này được gọi là giá trị quan sát.
Nếu G qs ∈ W thì ta bác bỏ H 0 ; chấp nhận H1 .
Nếu G qs ∉ W thì ta chưa đủ thông tin để bác bỏ H 0 hay nói cách khác là ta chấp
nhận H 0 .

5.1.3 Sai lầm loại I và sai lầm loại II


Khi kiểm định giả thiết thống kê, ta có thể mắc hai loại sai lầm:
a. Sai lầm loại I
Sai lầm loại I là sai lầm mắc phải khi ta bác bỏ H 0 trong khi H 0 đúng.
b. Sai lầm loại II
Sai lầm loại II là sai lầm mắc phải khi ta chấp nhận H 0 trong khi H 0 sai.

Để tìm tiêu chuẩn kiểm định giả thiết ta phải đồng thời hạn chế tới mức tối thiểu
khả năng mắc hai loại sai lầm trên, nghĩa là phải đồng thời tìm cách để xác suất mắc sai
lầm loại I và sai lầm loại II là nhỏ nhất. Nhưng việc làm này rất khó khăn. Thường trong
thực tế, người ta cho phép xác suất mắc sai lầm loại I ở mức nào đó, sau đó cực tiểu hóa
sai lầm loại II.

5.2 Kiểm định giả thiết về trung bình của tổng thể
Cho biến ngẫu nhiên X có a = E ( X ) và σ 2 = Var ( X ) . Ta chưa biết a nhưng đã có
cơ sở để đưa ra giả thiết H 0 : a = a0 với a0 là hằng số cho trước. Ta sẽ kiểm định giả thiết
H 0 với một trong các đối thiết
H1 : a ≠ a0 ; H1 : a < a0 ; H1 : a > a0 với mức ý nghĩa cho trước.
Lập mẫu ngẫu nhiên ( X1, X 2 ,..., X n ) cỡ n từ biến ngẫu nhiên gốc X. Ta lần lượt xét
các trường hợp sau:

Trường hợp 1: σ 2 đã biết, cỡ mẫu n >30 hoặc nếu n ≤ 30 thì X ~ N (a , σ 2 )

85
( X − a0 ) n
Chọn thống kê U = làm tiêu chuẩm kiểm định.
σ
Nếu H 0 đúng thì U ~ N (0,1)
Do đó với mức ý nghĩa cho trước, miền bác bỏ của H 0 sẽ phụ thuộc vào đối
thiết H1 như sau:
 
a ) H1 : a ≠ a0  W = U : U > U α 
1−
 2
với Uα là phân vị chuẩn mức . Chẳng hạn: U 0,995 = 2,575 ; U 0,99 = 2,33 ; U 0,975 = 1,96 ;
U 0,95 = 1, 65 .
b) H1 : a < a0  W = (−∞ ; − U1−α )
c) H1 : a > a0  W = (U1−α ; + ∞)

Lấy mẫu cụ thể ( x1, x2 ,..., xn ) , tính giá trị quan sát:
( x − a0 ) n
U qs =
σ
và suy ra kết luận.

Ví dụ: Trong năm trước, trọng lượng trung bình trước khi xuất chuồng của bò ở
một trại chăn nuôi là 380 . Năm nay, người ta áp dụng thử một chế độ chăn nuôi mới
với hy vọng là bò sẽ tăng trọng nhanh hơn. Sau thời gian áp dụng thử, người ta chọn ngẫu
nhiên 50 con bò trước khi xuất chuồng đem cân và tính được trọng lượng trung bình của
chúng là 390 . Giả sử trọng lượng của bò là biến ngẫu nhiên X ~ N ( a , σ 2 ) với
σ = 35, 2 kg . Với mức ý nghĩa α = 0,01 , có thể cho rằng trọng lượng trung bình của bò
trước khi xuất chuồng đã tăng lên hay không?
Giải: Gọi a là trọng lượng trung bình của bò trước khi xuất chuồng sau khi đã áp
 H 0 : a = 380 (kg )

dụng chế độ chăn nuôi mới. Ta cần kiểm định:  H1 : a > 380 (kg )
α = 0,01

( X − a0 ) n
Chọn thống kê U = làm tiêu chuẩn kiểm định.
σ
Nếu H 0 đúng thì U ~ N (0,1) .
Với mức ý nghĩa α = 0,01 ; H1 : a > 380 ta có miền bác bỏ W của H 0 là:
W = (U 1−α ; + ∞ ) = (U 0,99 ; + ∞ ) = (2,33 ; + ∞ ) .
( x − a0 ) n
(390 − 380) 50
Ta có: U qs = = = 2,01∉ W .
σ 35, 2
Do đó ta chấp nhận H 0 : a = 380 (kg ) nghĩa là chế độ chăn nuôi mới không có
khác biệt so với chế độ chăn nuôi cũ.

86
Trường hợp 2: σ 2 chưa biết, cỡ mẫu n>30
( X − a0 ) n
Chọn thống kê: U = làm tiêu chuẩn kiểm định, với S 2 là phương sai
S
điều chỉnh của mẫu. Do n > 30 nên nếu H 0 đúng thì U ~ N (0,1) .
Khi đó, với mức ý nghĩa cho trước, miền bác bỏ của H 0 sẽ phụ thuộc vào đối
thiết H1 giống như trong trường hợp 1.
Lấy mẫu cụ thể ( x1, x2 ,..., xn ) , tính giá trị quan sát:
( x − a0 ) n
U qs =
s
và suy ra kết luận.

Ví dụ: Được biết nhịp mạch trung bình của nam thanh niên là 72 lần/phút. Kiểm
tra 64 thanh niên làm việc trong hầm lò thấy nhịp mạch trung bình của họ là 74 lần/phút
và độ lệch chuẩn điều chỉnh của mẫu là 9 lần/phút. Với mức ý nghĩa α = 0,05 , hãy xét
xem làm việc trong hầm lò có làm tăng nhịp mạch hay không?
Giải: Gọi X là biến ngẫu nhiên chỉ nhịp mạch của nam thanh niên và = ( ). Ta
 H 0 : a = 72

cần kiểm định:  H1 : a > 72 .
α = 0,05

( X − a0 ) n
Chọn thống kê: U = làm tiêu chuẩn kiểm định.
S
Nếu H 0 đúng thì U ~ N (0,1) .
Với mức ý nghĩa α = 0,05 ; H1 : a > 72 ta có miền bác bỏ W của H 0 là:
W = (U 1−α ; + ∞ ) = (U 0,95 ; + ∞ ) = (1, 65 ; + ∞ ) .
( x − a0 ) n (74 − 72) 64
Ta có U qs = = = 1,78 ∈ W .
s 9
Do đó ta bác bỏ H 0 ; chấp nhận H1 : a > 72 nghĩa là làm việc trong hầm là làm tăng
nhịp mạch của nam thanh niên.

Trường hợp 3: σ 2 chưa biết, n ≤ 30, X ~ N (a , σ 2 )


( X − a0 ) n
Chọn thống kê: T = làm tiêu chuẩn kiểm định.
S
Nếu H 0 đúng thì T ~ tn−1 .
Với mức ý nghĩa cho trước, miền bác bỏ của H 0 sẽ phụ thuộc vào đối thiết H1
như sau:
 
a ) H1 : a ≠ a0  W = t : t > t α ;
n −1;1−
 2 

87
b) H1 : a < a0  W = (−∞ ; − tn−1;1−α ) ;
c) H1 : a > a0  W = (tn−1;1−α ; + ∞) .

Lấy mẫu cụ thể ( x1, x2 ,..., xn ) , tính giá trị quan sát:
( x − a0 ) n
Tqs =
s
và suy ra kết luận.

Ví dụ: Một công ty sản xuất pin tuyên bố rằng pin của họ có tuổi thọ trung bình là
21,5 giờ. Một cơ quan kiểm tra chất lượng kiểm tra 6 chiếc pin của công ty và thu được số
liệu sau đây về tuổi thọ của 6 chiếc pin này: 19, 18, 22, 20, 16, 25. Với mức ý nghĩa
α = 0,05 , hãy xét xem quảng cáo của công ty có đúng hay không?
Giải: Gọi X là biến ngẫu nhiên chỉ tuổi thọ của loại pin nói trên. Khi đó
 H 0 : a = 21,5

X ~ N ( a , σ ) . Ta cần kiểm định:  H1 : a ≠ 21,5
2

α = 0,05

Từ số liệu đề bài ta tính được x = 20; s = 10
( X − a0 ) n
Chọn thống kê T = làm tiêu chuẩn kiểm định.
S
Nếu H 0 đúng thì T ~ tn−1 .
Với mức ý nghĩa α = 0,05 ; H1 : a ≠ 21,5 ta có miền bác bỏ của H 0 là:
 
W = t : t > t
n −1;1−
{ }
α  = t : t > t5 ; 0,975 = {t : t > 2,57}
 2 
( x − a0 ) n (20 − 21,5) 6
Ta có Tqs = = = −1,16 ∉ W
s 10
Do đó ta chấp nhận H 0 : a = 21,5 nghĩa là quảng cáo của công ty là đúng sự thật.

5.3 Kiểm định giả thiết về tỉ lệ của tổng thể


Gọi p là tỉ lệ phần tử mang tính chất A của tổng thể. Ta chưa biết p nhưng đã có cơ
sở để đưa ra giả thiết H 0 : p = p0 với p0 là hằng số cho trước. Ta sẽ kiểm định giả thiết
H 0 với một trong các đối thiết
H1 : p ≠ p0 ; H1 : p < p0 ; H1 : p > p0 với mức ý nghĩa cho trước.
Lập mẫu ngẫu nhiên cỡ n từ tổng thể.
Gọi f n là tỉ lệ phần tử mang tính chất A của mẫu cỡ n.
( f n − p0 ) n
Chọn thống kê U = làm tiêu chuẩn kiểm định.
p0 (1 − p0 )

88
Nếu H 0 đúng thì U ~ N (0,1)
Với mức ý nghĩa cho trước, miền bác bỏ của H 0 sẽ phụ thuộc vào đối thiết H 1
như sau:
 
a ) H1 : p ≠ p0  W = U : U > U α  ;
1−
 2 
b) H1 : p < p0  W = (−∞ ; − U 1−α ) ;
c) H1 : p > p0  W = (U 1−α ; + ∞) .
Lấy mẫu cụ thể, tính giá trị quan sát:
( f n − p0 ) n
U qs =
p0 (1 − p0 )
và suy ra kết luận.

Ví dụ: Một quán ăn cho rằng 90% khách hàng của họ hài lòng với chất lượng
phục vụ của quán. Nghi ngờ chủ quán nói quá về chất lượng phục vụ, người ta phỏng vấn
150 khách hàng của quán thì có 132 người hài lòng. Với mức ý nghĩa α = 0,05 , hãy nhận
xét về điều nghi ngờ trên?
Giải: Gọi p là tỉ lệ khách hàng hài lòng với chất lượng phục vụ của quán. Ta cần
 H 0 : p = 0,9

kiểm định:  H1 : p < 0,9
α = 0,05

Gọi f n là tỉ lệ hài lòng với chất lượng phục vụ của quán trong 150 người được hỏi.
( f n − p0 ) n
Chọn thống kê U = làm tiêu chuẩn kiểm định.
p0 (1 − p0 )
Nếu H 0 đúng thì U ~ N (0,1)
Với α = 0,05 ; H1 : p < 0,1 ta có miền bác bỏ W của H 0 là:
W = (−∞ ; − U 1−α ) = (−∞ ; − U 0,95 ) = (−∞ ; − 1,65)
132
Từ dữ liệu bài toán ta có f n = = 0,88 . Khi đó giá trị quan sát:
150
(0,88 − 0,9) 150
U qs = = −0,833 ∉ W
0,9.(1 − 0,9)

Do đó ta chấp nhận H 0 : p = 0,9 nghĩa là không có cơ sở nghi ngờ quảng cáo của
chủ quán ăn.

89
5.4 Kiểm định giả thiết về phương sai của tổng thể
Cho X ~ N (a,σ 2 ) . Ta chưa biết σ 2 nhưng đã có cơ sở để đưa ra giả thiết:
H 0 : σ 2 = σ 02 với σ 02 là hằng số cho trước. Ta sẽ kiểm định giả thiết H 0 với một trong các
đối thiết
H1 : σ 2 ≠ σ 02 ; H1 : σ 2 < σ 02 ; H1 : σ 2 > σ 02 với mức ý nghĩa cho trước.
Lập mẫu ngẫu nhiên ( X1, X 2 ,..., X n ) cỡ n từ biến ngẫu nhiên gốc X.
(n − 1) S 2
Chọn thống kê χ 2 = làm tiêu chuẩn kiểm định.
σ 02
Nếu H 0 đúng thì χ 2 ~ χ n2−1 .
Với mức ý nghĩa cho trước, miền bác bỏ của H 0 sẽ phụ thuộc vào đối thiết H1
như sau:
a) H1 : σ 2 ≠ σ 02  = :0 < < ;
hoặc > ;
;
b) H1 : σ 2 < σ 02  W = (0 ; χ n2−1; α ) ;
c) H1 : σ 2 > σ 02  W = ( χ n2−1;1−α ; + ∞) .

Lấy mẫu cụ thể, tính giá trị quan sát:


(n − 1) s 2
χ qs
2
=
σ 02
và suy ra kết luận.

Ví dụ: Đường kính của một sản phẩm do một máy sản xuất là biến ngẫu nhiên
X ~ N (a,σ 2 ) với σ 2 = (0, 2) 2 . Nghi ngờ máy móc hoạt động không bình thường, người ta
kiểm tra 12 sản phẩm và tính được s = 0,3 . Với mức ý nghĩa α = 0,05 , hãy xét xem máy
móc có cần điều chỉnh hay không?
Giải: Ta cần kiểm định:
 H 0 : σ 2 = (0, 2)2

 H1 : σ > (0, 2)
2 2

α = 0,05

(n − 1) S 2
Chọn thống kê χ =2
làm tiêu chuẩn kiểm định.
2
σ0
Nếu H 0 đúng thì χ 2 ~ χ n2−1 .
Với α = 0,05 ; H1 : σ 2 > (0, 2)2 ta có miền bác bỏ W của H 0 là:
W = ( χ n2−1;1−α ; + ∞) = ( χ11;
2
0,95 ; + ∞) = (19,98 ; + ∞ ) .

90
(n − 1) s 2 11× 0, 09
Ta có χ qs
2
= = = 24, 75 > 19,98 .
σ 02 0,04
Khi đó χqs
2
∈W nên bác bỏ H 0 ; chấp nhận H1 : σ 2 > (0, 2)2 . Do đó cần điều chỉnh
lại máy móc.

5.5 Kiểm định giả thiết về sự bằng nhau của hai trung bình tổng thể
Cho hai biến ngẫu nhiên độc lập X1 và X 2 . Giả sử a1 = E ( X1) ; σ 12 = Var ( X 1 ) và
a2 = E ( X 2 ) ; σ 22 = Var ( X 2 ) . Ta chưa biết a1 và a2 , nhưng ta đã có cơ sở để đưa ra giả thiết
H 0 : a1 = a2 . Ta sẽ kiểm định giả thiết H 0 với một trong các đối thiết
H1 : a1 ≠ a2 ; H1 : a1 < a2 ; H1 : a1 > a2 với mức ý nghĩa cho trước.
Lập mẫu ngẫu nhiên ( X11, X12 ,..., X1n1 ) cỡ từ biến ngẫu nhiên gốc X1 .
( X 21, X 22 ,..., X 2n2 ) cỡ từ biến ngẫu nhiên gốc X 2 .

Ta lần lượt xét các trường hợp:

Trường hợp 1: σ 12 và σ 22 đã biết, cỡ mẫu n1 > 30 ; n2 > 30 và nếu n1 ≤ 30 ; n2 ≤ 30 thì


X 1 ~ N ( a1 , σ 12 ) , X 2 ~ N (a2 , σ 22 ) :
( X1 − X 2 ) − (a1 − a2 )
Khi đó ta chọn thống kê U = làm tiêu chuẩn kiểm định.
σ12 σ 22
+
n1 n2
Nếu H 0 đúng thì U ~ N (0,1) . Với mức ý nghĩa cho trước, miền bác bỏ của H 0
sẽ phụ thuộc vào đối thiết H1 như sau:
 
a ) H1 : a1 ≠ a2  W = U : U > U α  ;
1−
 2 
b) H1 : a1 < a2  W = (−∞ ; − U 1−α ) ;
c) H1 : a1 > a2  W = (U 1−α ; + ∞) .
1 n1 1 n2
Lấy mẫu cụ thể và tính các trung bình mẫu cụ thể x1 =  1i 2 n  x2i . Ta
n1 i =1
x , x =
2 i =1
tính giá trị quan sát:
x1 − x2
U qs =
σ12 σ 22
+
n1 n2

và suy ra kết luận.

91
Ví dụ: Tại một xí nghiệp, người ta xây dựng hai phương án gia công cùng một loại
chi tiết. Để đánh giá xem hao phí trung bình về nguyên liệu theo hai phương án ấy có
khác nhau hay không, người ta tiến hành sản xuất thử và thu được các kết quả sau:
Phương án 1: 2,5 3,2 3,5 3,8 3,5 (g)
Phương án 2: 2,0 2,7 2,5 2,9 2,3 2,6 (g)
Với mức ý nghĩa α = 0,05 , hãy kết luận về vấn đề trên biết rằng hao phí nguyên
liệu theo cả hai phương án gia công đều là các biến ngẫu nhiên tuân theo luật phân phối
chuẩn với σ 12 = σ 22 = 0,16 .
Giải: Gọi X1 và X 2 tương ứng là mức hao phí nguyên liệu theo hai phương án gia
công trên. Theo đề bài X1 ~ N (a1, σ 12 ) và X 2 ~ N (a2 , σ 22 ) .
Ta cần kiểm định:
 H 0 : a1 = a2

 H1 : a1 ≠ a2
α = 0,05

( X − X 2 ) − (a1 − a2 )
Chọn thống kê U = 1 làm tiêu chuẩn kiểm định.
σ12 σ 22
+
n1 n2
Nếu H 0 đúng thì U ~ N (0,1) .
Với α = 0,05 và H1 : a1 ≠ a2 thì miền bác bỏ W của H 0 là:
 
W = U : U > U α  = {U : U > U 0,975 } = {U : U > 1,96} .
1−
 2
Từ số liệu đề bài ta tính được x1 = 3,3 và x2 = 2,5 . Ta có giá trị quan sát:
x1 − x2 3,3 − 2,5
U qs = = = 3,33 ∈W .
σ12 σ 22 0,16 0,16
+
+
n1 n2 5 6
Do đó ta bác bỏ H 0 và chấp nhận H1 : a1 ≠ a2 , nghĩa là hao phí trung bình về
nguyên liệu theo hai phương án ấy khác nhau.

Trường hợp 2: σ 12 và σ 22 chưa biết, cỡ mẫu n1 > 30 ; n2 > 30 :


Gọi S12 là phương sai điều chỉnh của X1 .
Gọi S22 là phương sai điều chỉnh của X 2 .
( X1 − X 2 ) − (a1 − a2 )
Chọn thống kê: U = làm tiêu chuẩn kiểm định.
S12 S22
+
n1 n2

92
Nếu H 0 đúng thì U ≈ N (0,1) . Với mức ý nghĩa cho trước, miền bác bỏ của H 0
sẽ phụ thuộc vào đối thiết H1 như trường hợp 1.
Lấy mẫu cụ thể và tính x1 , x2 , s12 , s22 . Ta tính giá trị quan sát:
x1 − x2
U qs =
s12 s22
+
n1 n2
và suy ra kết luận.

Ví dụ: Người ta thí nghiệm hai phương pháp chăn nuôi gà khác nhau, sau một
tháng, kết quả tăng trọng như sau:
Phương pháp 1: n1 = 100 con; x1 = 1,1 (kg) ; s12 = 0,04 ;
Phương pháp 2: n2 = 150 con; x2 = 1, 2 (kg) ; s22 = 0,098 .
Với mức ý nghĩa α = 0,05 , có thể kết luận phương pháp 2 hiệu quả hơn phương
pháp 1 hay không? Biết rằng mức tăng trọng của gà theo hai phương pháp đều tuân theo
luật phân phối chuẩn.
Giải: Gọi X1 và X 2 tương ứng là mức tăng trọng của gà theo phương pháp 1 và
phương pháp 2. Theo đề bài X1 ~ N (a1, σ 12 ) và X 2 ~ N (a2 , σ 22 ) .
Ta cần kiểm định:
 H 0 : a1 = a2

 H1 : a1 < a2
α = 0,05

( X1 − X 2 ) − (a1 − a2 )
Chọn thống kê U = làm tiêu chuẩn kiểm định.
S12 S22
+
n1 n2
Nếu H 0 đúng thì U ~ N (0,1) .
Với α = 0,05 và H1 : a1 < a2 ta có miền bác bỏ W của H 0 là:
W = (−∞ ; − U 1−α ) = (−∞ ; − U 0,95 ) = (−∞ ; − 1,65) .
x1 − x2 1,1 − 1, 2
Ta có U qs = = = −3,15 ∈W .
s12 s22 0,04 0,098
+
+
n1 n2 100 150
Do đó bác bỏ H 0 , chấp nhận H1 : a1 < a2 ; nghĩa là phương pháp 2 hiệu quả hơn
phương pháp 1.

93
Trường hợp 3: σ 12 và σ 22 chưa biết, σ12 = σ 22 ; cỡ mẫu n1 ≤ 30 , n2 ≤ 30 và
X 1 ~ N ( a1 , σ 12 ), X 2 ~ N (a2 , σ 22 ) :
( X1 − X 2 ) − (a1 − a2 )
Chọn thống kê T = làm tiêu chuẩn kiểm định.
(n1 − 1) S12 + (n2 − 1) S22 1 1
+
n1 + n2 − 2 n1 n2
Nếu H 0 đúng thì T ~ tn1+n2 −2 .
Với mức ý nghĩa cho trước, miền bác bỏ của H 0 sẽ phụ thuộc vào đối thiết H1
như sau:
 
a ) H1 : a1 ≠ a2  W = T : T > T α ;
n1 + n2 − 2 ;1−
 2 
b) H1 : a1 < a2  W = (−∞ ; − tn1+n2 −2 ; 1−α ) ;
c) H1 : a1 > a2  W = (tn1+n2 −2 ;1−α ; + ∞) .

Lấy mẫu cụ thể ta tính giá trị quan sát:


x1 − x2
Tqs =
(n1 − 1) s12 + (n2 − 1) s22 1 1
+
n1 + n2 − 2 n1 n2

và suy ra kết luận.

Ví dụ: Người ta nghiên cứu trọng lượng của trẻ sơ sinh ở hai nhóm trẻ có mẹ
không hút thuốc lá và hút thuốc lá. Ta có hai mẫu tương ứng và tính được như sau:
Nhóm trẻ có mẹ không hút thuốc lá: = 15; !" = 3,5933; $ = 0,3707.
Nhóm trẻ có mẹ hút thuốc lá: = 14; !''' = 3,2029; $ = 0,4927.
Giả sử trọng lượng của trẻ ở hai nhóm là các biến ngẫu nhiên có phân phối chuẩn
và có phương sai bằng nhau. Với mức ý nghĩa α = 0,05 , có thể cho rằng trẻ sơ sinh ở
nhóm có mẹ hút thuốc lá nhẹ cân hơn trẻ sơ sinh ở nhóm có mẹ hút không thuốc lá hay
không?
Giải: Gọi X1 là biến ngẫu nhiên chỉ trọng lượng của trẻ sơ sinh ở nhóm trẻ có mẹ
không hút thuốc lá thì X1 ~ N (a1, σ 12 ) . Gọi X 2 là biến ngẫu nhiên chỉ trọng lượng của trẻ
sơ sinh ở nhóm trẻ có mẹ hút thuốc lá thì X 2 ~ N (a2 , σ 22 ) .
Ta cần kiểm định:
 H 0 : a1 = a2

 H1 : a1 > a2
α = 0,05

94
( X1 − X 2 ) − (a1 − a2 )
Chọn thống kê T = làm tiêu chuẩn kiểm định.
(n1 − 1) S12 + (n2 − 1) S22 1 1
+
n1 + n2 − 2 n1 n2
Nếu H 0 đúng thì T ~ tn1+n2 −2 .
Với α = 0,05 và H1 : a1 > a2 ta có miền bác bỏ W của H 0 là:
W = (tn1+n2 −2 ;1−α ; + ∞) = (t27 ; 0,95 ; + ∞) = (1,703 ; + ∞) .
Từ số liệu đề bài ta có giá trị quan sát:
3,5933 − 3, 2029
T= = 2, 42 ∈ W .
14 × 0,3707 2 − 13 × 0, 4927 2 1 1
+
15 + 14 − 2 15 14

Do đó ta bác bỏ H 0 , chấp nhận H1 : a1 > a2 , nghĩa là có thể cho rằng trẻ sơ sinh ở
nhóm có mẹ hút thuốc lá nhẹ cân hơn trẻ sơ sinh ở nhóm có mẹ hút không thuốc lá.

5.6 Kiểm định giả thiết về sự bằng nhau của hai tỉ lệ tổng thể
Giả sử p1 và p2 là tỉ lệ các phần tử mang dấu hiệu A nào đó của tổng thể thứ nhất,
thứ hai tương ứng. Ta chưa biết p1 và p2 , nhưng ta đã có cơ sở để đưa ra giả thiết
H 0 : p1 = p2 = p0 , với p0 là hằng số cho trước. Ta sẽ kiểm định giả thiết H 0 với một trong
các đối thiết
H1 : p1 ≠ p2 ; H1 : p1 < p2 ; H1 : p1 > p2 với mức ý nghĩa cho trước.
Ta tiến hành lấy mẫu cỡ n từ tổng thể thứ I, lấy mẫu cỡ m từ tổng thể thứ II.
Gọi f1 là tỉ lệ phần tử mang dấu hiệu A trong mẫu cỡ n của tổng thể thứ I
Gọi f 2 là tỉ lệ phần tử mang dấu hiệu A trong mẫu cỡ m của tổng thể thứ II
( m, n > 30) .
( f1 − f 2 ) − ( p1 − p2 )
Chọn thống kê U = làm tiêu chuẩn kiểm định.
1 1 
p0 (1 − p0 )  + 
n m
Nếu H 0 đúng thì U ≈ N (0,1) . Với mức ý nghĩa cho trước, miền bác bỏ của H 0
sẽ phụ thuộc vào đối thiết H1 như sau:
 
a ) H1 : p1 ≠ p2  W = U : U > U α  ;
1−
 2 
b) H1 : p1 < p2  W = (−∞ ; − U 1−α ) ;
c) H1 : p1 > p2  W = (U 1−α ; + ∞) .

Lấy mẫu cụ thể và tính giá trị quan sát:

95
f1 − f 2
U qs =
1 1 
p0 (1 − p0 )  + 
n m
và suy ra kết luận.

nf1 + mf 2
Chú ý: Nếu chưa biết p0 thì ta có thể thay p0 bằng p∗ = . Khi đó ta chọn
n+m
f1 − f 2
thống kê U = làm tiêu chuẩn kiểm định.
1 1 
p∗ (1 − p∗ )  + 
n m

Ví dụ: Có hai loại thuốc A và B được dùng để điều trị một bệnh nào đó. Qua theo
dõi, ta thấy trong số 160 người dùng thuốc A có 120 người khỏi bệnh; còn trong 224
người dùng thuốc B, có 160 người khỏi bệnh. Với mức ý nghĩa α = 0,05 , hỏi tác dụng của
hai loại thuốc trên có như nhau hay không?
Giải:
Gọi p1 là tỉ lệ khỏi bệnh của người dùng thuốc A.
Gọi p2 là tỉ lệ khỏi bệnh của người dùng thuốc B.
Gọi f1 là tỉ lệ khỏi bệnh trong 160 người dùng thuốc A
Gọi f 2 là tỉ lệ khỏi bệnh trong 224 người dùng thuốc B
 H 0 : p1 = p2

Ta cần kiểm định:  H1 : p1 ≠ p2 .
α = 0,05

f1 − f 2
Ta chưa biết p0 nên chọn thống kê U = làm tiêu chuẩn kiểm
1 1 
p∗ (1 − p∗ )  + 
n m
định.
Nếu H 0 đúng thì U ≈ N (0,1) .
Với α = 0,05 và H1 : p1 ≠ p2 thì miền bác bỏ W của H 0 là:
 
W = U : U > U α  = {U : U > U 0,975 } = {U : U > 1,96} .
1−
 2
120 160 nf + mf 2 120 + 160
Ta có: f1 = = 0,75 , f 2 = = 0,71 , p∗ = 1 = = 0,73 .
160 224 n+m 160 + 224
Giá trị quan sát:
f1 − f 2 0,75 − 0, 71
U qs = = = 0, 435 ∉ W .
1 1   1 1 
p∗ (1 − p∗ )  +  0,73 × 0, 27  + 
n m  160 224 

96
Do đó chấp nhận H0 : p1 = p2 . Vậy công dụng của hai loại thuốc A và B đối với
việc điều trị bệnh nói trên là như nhau.

BÀI TẬP

5.1 Kiểm tra các gói đường loại 1kg trong một siêu thị ta có kết quả:

Khối lượng (Xi) (kg) 0,95 0,96 0,97 0,99 1,00 1,01 1,03 1,05
Số gói (ni) 19 30 32 8 2 3 5 1

Với mức ý nghĩa α = 0, 05 có thể kết luận việc đóng gói đảm bảo yêu cầu hay
không?
5.2 Để xác định chiều cao trung bình của một loại cây giống, người ta chọn ngẫu nhiên
35 cây trong vườn, đo chiều cao của 35 cây đó và tính được chiều cao trung bình là
x = 1,1(m) và s 2 = 0, 01 (m2 ) . Theo qui định của bộ phận kĩ thuật, khi nào cây giống cao
trên 1 ( m ) thì mới được đem trồng để đảm bảo tỉ lệ sống cao. Hỏi loại cây giống nói trên
đã đạt tiêu chuẩn chưa với mức ý nghĩa 0,05?
5.3 Định mức thời gian để sản xuất ra một loại sản phẩm là 1(giờ). Sau cải tiến công
nghệ người ta sản xuất thử 150 sản phẩm thì thấy thời gian trung bình để được một sản
phẩm là 50(phút) với độ lệch chuẩn điều chỉnh của mẫu là 4(phút). Hỏi với mức ý nghĩa
0,05 có thể kết luận rằng công nghệ mới thực sự giúp làm giảm chi phí thời gian sản xuất
không?
5.4 Một lô gà được thông báo là có trọng lượng trung bình 1,6 (kg). Nghi ngờ trọng
lượng trung bình không đạt ở mức này, người ta cân ngẫu nhiên 24 con gà trong lô thì
thấy trọng lượng trung bình của chúng là 1,5 (kg) và $ = 0,1 (kg). Với mức ý nghĩa 0,01,
hãy kết luận về điều nghi ngờ nói trên.
5.5 Tỉ lệ mắc bệnh A ở một địa phương là 34% . Sau một đợt điều trị bằng một loại
thuốc, người ta kiểm tra 120 người thấy còn 24 người mắc bệnh A. Hãy cho biết tác dụng
của loại thuốc nói trên với mức ý nghĩa α = 0, 05 .
5.6 Một thầy giáo cho rằng chỉ có 33% sinh viên có làm bài tập ở nhà. Một sinh viên
lại cho rằng tỉ lệ sinh viên có làm bài tập ở nhà cao hơn. Sinh viên này phỏng vấn 49 sinh
viên và thấy có 17 sinh viên làm bài tập ở nhà. Với mức ý nghĩa α = 0, 05 , hãy xét xem
thầy giáo hay sinh viên có lý hơn?
5.7 Một hãng truyền hình cho biết 70% khán giả xem chương trình phim truyện của
hãng vào tối thứ bảy hàng tuần. Một hãng khác nghi ngờ tính chân thực của tuyên bố này
nên đã phỏng vấn 210 khán giả thì thấy có 137 người cho biết có xem chương trình phim
truyên trên. Với mức ý nghĩa α = 0, 05 , có thể cho rằng tuyên bố của hãng truyền hình đầu
là nói hơi quá lên hay không?
5.8 Một loại thuốc chữa bệnh được nhà sản xuất khẳng định xác suất khỏi bệnh khi
dùng thuốc này là 80%. Theo dõi 150 người dùng ở một bệnh viện thì thấy có 110 người

97
khỏi bệnh. Với mức ý nghĩa α = 0, 05 , có thể chấp nhận ý kiến của nhà sản xuất hay
không? Nếu không thì xác suất trên cao hơn hay thấp hơn 80%?
5.9 Để đánh giá kết quả học tập môn Toán của học sinh hai trường tiểu học A và B
khối lớp 5, người ta lấy hai mẫu từ kết quả kiểm tra chất lượng do quận tổ chức. Kết quả
như sau:
Trường A: = 80; !" = 6,5; $ = 1,0.
Trường B: = 100; !''' = 7,0; $ = 1,2.
Giả sử điểm thi X, Y của hai trường đều có phân phối chuẩn và + ( ) = + (,).
Với mức ý nghĩa α = 0, 05 , có thể kết luận trường B có kết quả thi môn Toán tốt
hơn trường A hay không?
5.10 Nghiên cứu trọng lượng của trẻ em lứa tuổi lên 10 ở thành phố và nông thôn, ta có
hai mẫu như sau:
Trọng lượng (kg) Số trẻ em thành phố Số trẻ em nông thôn
< 35 0 5
-35 − 38) 2 10
-38 − 41) 8 12
-41 − 44) 13 15
-44 − 47) 20 10
-47 − 50) 15 3
-50 − 53) 12 0
≥ 53 8 0

(a) Với mức ý nghĩa α = 0, 05 , có thể nói trọng lượng trung bình của trẻ em lứa
tuổi lên 10 ở hai vùng là như nhau hay không?
(b) Ở lứa tuổi này, ta xem trọng lượng ≥ 50 là diện thừa cân, có nguy cơ béo
phì. Với mức ý nghĩa α = 0,01 , có thể kết luận tỉ lệ trẻ em lên 10 ở thành phố có nguy cơ
béo phì cao hơn 25% hay không?
5.11 Chiều cao trung bình của 100 nam sinh lớp 12 ở một trường trung học nội thành là
1,68m với độ lệch chuẩn điều chỉnh của mẫu là 6cm. Trong khi kiểm tra 120 em ở lớp 12
ở một huyện ngoại thành thì chiều cao trung bình là 1,64m với độ lệch chuẩn điều chỉnh
của mẫu 5cm. Với mức ý nghĩa α = 0,01 có thể kết luận rằng học sinh nội thành phát triển
thể lực tốt hơn hay không?
5.12 Thời gian tự học trong một tuần của 12 sinh viên khoa A và 15 sinh viên khoa B
được thống kê lại như sau (đơn vị: giờ):
Khoa A: 18 15 24 23 12 30 15 24 35 18 30 20
Khoa B: 18 19 25 24 30 36 25 28 30 12 14 28 22 20 28
Với mức ý nghĩa α = 0,01 , có thể kết luận thời gian tự học của sinh viên hai khoa
là như nhau hay không?
5.13 Kiểm tra chất lượng hai lô sản phẩm từ hai cơ sở chuyển đến ta thấy: Trong 120
sản phẩm ở lô I có 70 sản phẩm loại A. Còn trong 150 sản phẩm ở lô II có 98 sản phẩm
loại A. Hỏi với mức ý nghĩa 0,01 có thể coi hai nguồn hàng có cùng tỉ lệ hàng loại A hay
không?

98
5.14 Điều tra về số người mắc bệnh bướu cổ ở một tỉnh phía Bắc cho thấy có 107 người
bị bệnh trong 380 người đến khám. Trong khi ở một tỉnh miền Trung có 90 người trong
số 310 người khám bệnh. Có thể kết luận về tỉ lệ mắc bệnh ở hai tỉnh trên là như nhau
không, với mức ý nghĩa α = 0, 05 ?
5.15 Để thăm dò ý kiến người dân về một điều khoản nào đó, người ta chọn hai mẫu ở
thành thị và ở nông thôn. Kết quả như sau:
Ở thành thị: phỏng vấn 500 người, có 320 ý kiến ủng hộ.
Ở nông thôn: phỏng vấn 400 người, có 300 ý kiến ủng hộ.
Với mức ý nghĩa α = 0, 05 , có thể kết luận người dân ở nông thôn ủng hộ điều
khoản này cao hơn ở thành thị hay không?
5.16 Tham gia dự án trồng 5 triệu ha rừng, người dân một địa phương đã gieo trồng 100
ha rừng bằng hai loại cây A và B. Sau hai tuần lễ người ta thấy kết quả như sau: trong 200
cây loại A có 175 cây sống, trong 150 cây loại B có 110 cây sống. Hỏi với mức ý nghĩa
0,01, có thể kết luận tỉ lệ sống của cây loại A cao hơn của cây loại B hay không?
5.17 Để thăm dò ý kiến của người tiêu dùng, bộ phận tiếp thị của hãng đã điều tra và thu
được kết quả như sau: trong 700 người thì có 280 người thích dùng dầu gội đầu A và có
265 người thích dùng dầu gội đầu B. Hỏi với mức ý nghĩa 0,01, có thể kết luận người tiêu
dùng thích dùng dầu gội đầu loại A hơn loại B hay không?
5.18 Điều tra ngẫu nhiên 250 người ở xã A thì thấy có 140 nữ và 180 người ở xã B thì
thấy có 90 nữ. Với mức ý nghĩa α = 0, 05 , có thể kết luận tỉ lệ nữ ở hai xã là như nhau hay
không?
5.19 Người ta gieo hạt bằng hai phương pháp. Theo phương pháp I: gieo 180 hạt thì có
150 hạt nảy mầm. Theo phương pháp II: gieo 256 hạt thì có 160 hạt nảy mầm. Với mức ý
nghĩa α = 0, 05 , có thể cho rằng tỉ lệ hạt nảy mầm được gieo theo hai phương pháp là như
nhau hay không?
5.20 Người ta nuôi gà bằng hai phương pháp. Theo phương pháp I: nuôi 200 con gà con
thì có 12 con gà con bị chết. Theo phương pháp II: nuôi 100 con gà con thì có 5 con gà
con bị chết. Với mức ý nghĩa α = 0, 05 , có thể kết luận phương pháp II tốt hơn phương
pháp I hay không?
5.21 Để đánh giá chất lượng dạy và học môn Toán ở hai trường Tiếu học A và B khối
lớp 5, người ta lấy hai mẫu từ kết quả kiểm tra chất lượng do quận tổ chức. Kết quả như
sau:
Điểm thi 2 3 4 5 6 7 8 9 10
Số học sinh trường A 1 6 9 21 25 18 12 6 3
Số học sinh trường B 1 3 7 13 19 28 15 8 7

Giả sử điểm thi X, Y của hai trường đều có phân phối chuẩn và + ( ) = + (,).
(a) Với mức ý nghĩa α = 0, 05 , có thể cho rằng điểm thi trung bình môn Toán của
học sinh hai trường là như nhau hay không?
(b) Điểm thi ≥ 9 được xem là giỏi. Với mức ý nghĩa α = 0,01 , có thể cho rằng tỉ lệ
học sinh đạt điểm giỏi của học sinh hai trường là như nhau hay không?

99

You might also like