You are on page 1of 10

18/07/2023

Chương 7 Đứng trước một tập hợp số liệu đã thống kê được, chúng ta phải có
một sự nhận định. Chẳng hạn, sau khi sản xuất một loạt sản phẩm,
ta muốn quan tâm xem các sản phẩm đó có đạt tiêu chuẩn kỹ thuật

KIỂM ĐỊNH
không? năng suất trung bình của cây trồng theo hai phương pháp
có khác nhau không? hoặc căn cứ vào đường đa giác tần suất của
một biến X trong tổng thể có thể kết luật quy luật phân phối của
GIẢ THUYẾT THỐNG KÊ biến X đó là quy luật chuẩn được không? Để kiểm tra nhận định
này, ta phải nêu ra một giả thuyết nào đấy về vấn đề mà ta nghiên
cứu. Các giả thuyết này được gọi là các giả thuyết thống kê. Nhưng
Giảng vên: TS. Lâm Sơn
bằng cách nào để biết các giả thuyết đó là đúng hay sai. Vận dụng
lý thuyết xác suất, người ta đưa ra một số quy tắc để đánh giá giữa
ĐT: 033.6969.909
các kết quả kiểm tra được qua thực nghiệm và mô hình lý thyết mà
Email: sonlam@ftu.edu.vn chúng ta đã đặt giả định. Đó chính là các quy tắc kiểm định giả
thuyết thống kê.

1. Khái niệm
1.1. Giả thuyết thống kê Ví dụ:
ĐN: Giả thuyết thống kê là giả thuyết về dạng a. H0 : Thu nhập là biến ngẫu nhiên phân
phân phối xác suất của biến ngẫu nhiên, về phối chuẩn
các tham số đặc trưng của biến ngẫu nhiên H1 : Thu nhập không phải là biến ngẫu
hoặc về tính độc lập của các biến ngẫu nhiên. nhiên phân phối chuẩn.
Giả thuyết cần kiểm định: H0. b. H0 : Thu nhập trung bình ở thành phố A là
2 triệu
H1 là nhận định mâu thuẫn H0 H1 : Thu nhập trung bình ở thành phố A
lớn hơn 2 triệu

1
18/07/2023

1.3. Phương pháp kiểm định


1.2. Kiểm định giả thuyết
- Đưa ra cặp giả thuyết H0 và H1.
- Giả sử H0 là đúng.
Kiểm định giả thuyết là xác định xem có đủ chứng cứ - Từ đó tìm biến cố A sao cho: P(A) rất bé
thống kê để tin tưởng vào một Giả thuyết nào đó hay - Dùng nguyên lý xác suất nhỏ có thể coi như biến
không. cố A không bao giờ xảy ra.
-Thực hiện phép thử trên mẫu
◼ Trọng lượng trung bình của 1 sản phẩm sản xuất.
+ Nếu A xảy ra chứng tỏ H0 thiếu cơ sở và bác
◼ Thói quen, hành vi tiêu dùng của nhóm dân cư.
bỏ H0
◼ Thay đổi trước khi có dự án và sau khi có dự án.
+ Nếu A không xảy ra thì chưa có cơ sở bác bỏ
nên ta chấp nhận H0.

1.4. Tiêu chuẩn kiểm định và miền bác bỏ


1.5. Quy tắc kiểm định
Lập mẫu ngẫu nhiên W = ( X1, X 2 ,..., X n )
Thực hiện phép thử với mẫu thu được giá trị cụ
Chọn thống kê G G = f ( X1, X 2 ,..., X n ,0 ) thể: w = ( x1 , x2 ,...xn )
Sao cho nếu H0 đúng thì quy luật phân phối của Từ đó tính được: g = f ( x1 , x2 ,...xn , 0 )
G hòan toàn xác định. Từ đó, với 1 xs rất bé ta
g được gọi là giá trị quan sát của tiêu chuẩn kiểm
tìm được 1 tập W sao cho:
định.
P ( G W / H 0 ) =  Nếu g W thì bác bỏ H0 (Chấp nhận H1)
G tiêu chuẩn kiểm định.
W miền bác bỏ. Nếu g W thì chấp nhận H0
 mức ý nghĩa của kiểm định

2
18/07/2023

2. Kiểm định tham số


1.6. Sai lầm trong kiểm định 2.1. Kiểm định giả thuyết về một kỳ vọng toán
Thực tế Quyết định của biến ngẫu nhiên phân phối chuẩn.
tổng thể
Chấp nhận H0 Bác bỏ H0
Giả sử bnn X  N (  , ) chưa biết kỳ vọng
2

Kết luận đúng Sai lầm loại I


nhưng có cơ sở để so sánh nó với 1 số 0 nào đó.
H0 đúng (xác suất =1- = (xác suất =  = mức
độ tin cậy) ý nghĩa ) Ta đưa ra giả thuyết H0:  = 0
Sai lầm loại II Kết luận đúng
H0 sai (xác suất = ) (xác suất = 1-  =lực
kiểm định) Để kiểm định ta chọn mẫu ngẫu kích thước n
và chọn tiêu chuẩn kiểm định G trong 2
trường hợp sau

2.1.1. Trường hợp đã biết phương sai *Kiểm định phía trái
(X − 0 ) n Cặp giả thuyết: H0:  = 0 và H1:   0
G=

Nếu H0 đúng thì: G  N (0,1) P (G  −u ) =  W = ( −; −u )

Ta chọn W tùy vào dạng của H1: *Kiểm định 2 phía


*Kiểm định phía phải Cặp giả thuyết: H0:  = 0 và H1:   0
 = 0 và H1:   0
P (G  −u 2 ) + P (G  u 2 ) = 
Cặp giả thuyết: H0:
Ta tìm được u sao cho:
W = ( −; −u 2 )  (u 2 ; + )
P (G  u ) =  W = (u ; + )

3
18/07/2023

Ví dụ: Một quản lý báo cáo: thời gian trung bình 2.1.2 Trường hợp chưa biết phương sai
gia công 1 chi tiết máy là 26 phút. Thời gian gia
công một chi tiết máy là biến ngẫu nhên phân phối (X − 0 ) n
G=
chuẩn với độ lệch chuẩn 5,2 phút. Người ta lấy S
ngẫu nhiên một mẫu có kích thước n=100 và tính Nếu H0 đúng thì: G  T (n − 1)
được trung bình 27,56 phút.
Với mức ý nghĩa 5%, có thể kết luận gì về báo cáo Ta chọn W tùy vào dạng của H1:
trên ?
*Kiểm định phía phải
g = 3 W = (−; −1,96)  (1,96; +) Cặp giả thuyết: H0:  = 0 và H1:   0
Bác bỏ H0
Vậy với myn 5% thì kết luận thời gian W = (t(n −1) ; + )
trung bình là 26 chưa có cơ sở.

*Kiểm định phía trái Ví dụ:


Cặp giả thuyết: H0:  = 0 và H1:   0 Một công ty sản xuất bóng đèn với tuổi thọ

W = ( −; −t(n −1) )


trung bình của bóng đèn là 1200 giờ. Công ty
mới nhập về một dây chuyền sản xuất mới. Dây
chuyền này khi sản xuất thử 40 bóng và dùng
thử nghiệm thì cho thấy tuổi thọ trung bình là
*Kiểm định 2 phía 1260 giờ với độ lệch chuẩn 215 giờ. Với mức ý
Cặp giả thuyết: H0:  = 0 và H1:   0 nghĩa 5% hãy nhận định xem dây chuyền mới
có tốt hơn dây chuyền cũ hay không?

W = ( −; −t(n −1) )  (t(n −1) ; + ) g = 1,76 W = (1,645; +)


Vậy với myn 5% thì có thể nói dây
chuyền mới tốt hơn.

4
18/07/2023

2.2. Kiểm định giả thuyết về hai giá trị kỳ vọng Khi H0 đúng
X1 − X 2
Giả sử có hai tổng thể nghiên cứu trong đó có các bnn:
G=  N (0,1)
 12  22
X  N ( 1 ,12 ); Y  N ( 2 , 22 ) +
n1 n2
Nếu 1 và 2 chưa biết song có cơ sở để so sánh chúng
với nhau, người ta đưa ra giả thuết thống kê: Tùy theo dạng của đối thuyết ta có miền bác bỏ
H0 : 1 = 2
* Kiểm định phía phải: H 0 : 1 =  2
Lập 2 mẫu ngẫu nhiên và lập tiêu chuẩn kiểm định:
(X1 − X 2 ) − ( 1 − 2 ) H1 : 1  2
G=
 12  22 W = (u , +)
+
n1 n2

H 0 : 1 =  2
* Kiểm định phía trái:
H1 : 1   2 Lưu ý:
khi cả 2 cỡ mẫu đều lớn hơn 30 thì ta có thể thay
W = (−, −u ) phương sai tổng thể bằng phương sai mẫu vẫn
coi như G phân phối chuẩn hóa:

X1 − X 2
* Kiểm định hai phía : H 0 : 1 =  2 G=  N (0,1)
H1 : 1  2 S12 S 22
+
W = (−, −u /2 )  (u /2 , +) n1 n 2

5
18/07/2023

Gọi X1, X2 là….


Ví dụ: Tại một nhà máy người ta lắp rắp hai dây X1 − X 2
H 0 : 1 =  2 G=
chuyền sản xuất cùng sản xuất một loại sản phẩm. S12 S 22
H1 : 1  2 +
để đánh giá xem mức độ hao phí nhiên liệu trung n1 n 2
bình trong một ca sản xuất theo hai dây chuyền này W = (−, −u /2 )  (u /2 , +) = ( −, −1.96 )  (1.96, + )
có khác nhau không.
Theo kết quả phép thử:
Dây chuyền 1: xi 2,5 3,2 3,5 3,8 3,5
ni 9 6 6 4 8 n1 = 5, x1 = 3,3; n 2 = 6, x 2 = 2,5
Dây chuyền 2: yi 2,0 2,7 2,5 2,9 2,3 2,6 3,3 − 2,5
ni 8 7 8 9 5 8 g= = 3,33 W
0, 42 0,52
Với mức ý nghĩa 5%, hãy kết luận về vấn đề trên +
biết rằng hao phí nguyên liệu theo cả hai dây 5 6
chuyền trên đều là biến ngẫu nhiên phân phối Vậy với mức ý nghĩa 5% có thể nói rằng hao phí nguyên vật
chuẩn. liệu của hai dây chuyền sản xuất là thực sự khác nhau.

Sai lầm thường gặp trong trình bày (không được tính điểm) 2.3. Kiểm định một giá trị xác suất
H 0 : 1 =  2
W = (−, −u /2 )  (u /2 , +) Giả sử cần nghiên cứu cơ cấu của tổng thể, tỷ lệ phần
H1 : 1  2
= ( −, −1.96 )  (1.96, + ) tử mang dấu hiệu A trong tổng thể là p chưa biết nhưng
có cơ sở để so sánh nó với một số p0 nào đó. Ta đưa ra
giả thuyết:
X1 − X 2 3,3 − 2,5 H 0 : p = p0
G= = = 3,33 W
2 2 2 2
0, 4 0, 4 0, 4 0, 4 Lập mẫu ngẫu nhiên và lập tiêu chuẩn kiểm định:
+ +
n1 n2 5 6
( f − p0 ) n
Vậy hao phí nguyên vật liệu của hai dây chuyền sản xuất
G=
là khác nhau. p0 (1 − p0 )

6
18/07/2023

Khi H0 đúng * Kiểm định phía trái: H 0 : p = p0


( f − p0 ) n
G=  N (0,1) H1 : p  p0
p0 (1 − p0 )
W = (−, −u )
Tùy theo dạng của đối thuyết ta có miền bác bỏ
* Kiểm định hai phía : H 0 : p = p0
* Kiểm định phía phải: H 0 : p = p0
H1 : p  p0
H1 : p  p0
W = (−, −u /2 )  (u /2 , +)
W = (u , +)

Ví dụ:
Cơ quan cảnh sát giao thông cho rằng 62% số người 2.4. Kiểm định giả thuyết về hai giá trị xác suất
lái xe mô tô trên đường là có mang theo GPLX, kiểm
tra ngẫu nhên 130 người lái xe mô tô thấy có 68 người
Trong 2 tổng thể tỉ lệ phần tử mang dấu hiệu A
có mang theo GPLX.
Với mức ý nghĩa 1%, số liệu này có chứng tỏ tỷ lệ lần lượt là p1 và p2 chưa biết nhưng có cơ sở để so
người mang theo GPLX thấp hơn 62% hay không? sánh chúng với nhau. Đưa ra giả thyết thống kê:
H0 : p1 = p2
H 0 : p = p0 W = (−, −u ) = ( −, −1.645 )
H1 : p  p0 Lập 2 mẫu ngẫu nhiên và tính được các tần số:
g=
(0,523 − 0,62) 130
= −2, 278 W m1 m m + m2
0,62(1 − 0,62) f1 = , f1 = 2 , f = 1
n1 n2 n1 + n 2
Vậy … tỉ lệ người mang GPLX thấp hơn 62%

7
18/07/2023

( f1 − f2 ) − (p1 − p2 )
Lập tiêu chuẩn: G= H 0 : p1 = p2
1 1  W = (u , +)
f (1 − f )  +  H1 : p1  p2
 n1 n 2 
Khi H0 đúng H 0 : p1 = p2
f1 − f2 H1 : p1  p2 W = (−, −u )
G=  N (0,1)
1 1 
f (1 − f )  +  H 0 : p1 = p2
 n1 n 2  W = (−, −u /2 )  (u /2 , +)
H1 : p1  p2
Khi đó ta có các miền bác bỏ tùy theo dạng
của đối thuyết.

2.5. Kiểm định một giá trị phương sai


Ví dụ:
Giả sử trong tổng thể bnn X  N (  , ) chưa
2

Một cuộc nghiên cứu được tiến hành để so sánh biết phương sai nhưng có cơ sở để so sánh nó với
tỷ lệ học sinh lớp trung học cơ sở bỏ học ở hai 1 số  02 nào đó.
huyện miền núi. ở huyện A, trong số 160 học
sinh theo dõi có 48 em bỏ học trước lớp 9 và ở Ta đưa ra giả thuyết: H0 :  2 =  02
huyện B trong số 400 học sinh theo dõi có 90 (n − 1)S 2
em bỏ học trước lớp 9. Với mức ý nghĩ 2%, có Lập mẫu nn và tiêu chuẩn G=
thể cho rằng tỷ lệ bỏ học ở hai huyện trên là  02
khác nhau không?
(n − 1)S 2
Khi H0 đúng G=   2(n −1)
 2

8
18/07/2023

Ví dụ:
H 0 :  =  0
 2 2

 W = ( 2(n −1) , +)


H1 :    0

2 2
Đo đường kính của 12 sản phẩm của một
dây chuyền sản xuất, người kỹ sư kiểm tra
H 0 :  =  0
 chất lượng tính được s=0,3. Biết rằng nếu độ
2 2

 W = (−, 12(−n −1) ) biến động của các sản phẩm lớn hơn 0,2 thì
H1 :    0

2 2
dây chuyền sản xuất phải ngừng lại để điều
chỉnh. Với mức ý nghĩa 5% người kỹ sư có kết
H 0 :  =  0
 2 2
luận gì?

H1 :    0

2 2

W = ( −, 12(−n/2−1) )  ( 2(/2n −1) , + ) Đáp số: Dây chuyền cần ngừng lại để kiểm tra

2.6. Kiểm dịnh giả thuyết về hai giá trị phương sai S12
Khi H0 đúng G = 2  F (n1 − 1, n 2 − 1)
Giả sử có hai tổng thể nghiên cứu trong đó có các bnn: S2
X  N ( 1 ,12 ); Y  N ( 2 , 22 )
H 0 :  1 =  2
 2 2
Nếu 1 và  2 chưa biết song có cơ sở để so sánh chúng
2 2
 (
W = f(n1 −1,n2 −1) ; + )
với nhau, người ta đưa ra giả thuết thống kê:
H1: 1   2

2 2

H0 : 12 =  22
H 0 :  12 =  22

Lập 2 mẫu ngẫu nhiên và lập tiêu chuẩn kiểm định:
 (
W = −; f1−(n1 −1,n2 −1) )
S12 . 22 H1: 1   2

2 2

G= 2 2
S 2 . 1

9
18/07/2023

H 0 :  1 =  2
 2 2


H1 :  1   2

2 2

( ) (
W = −; f1−(n1/2−1,n2 −1)  f(n/21 −1,n2 −1) ; + )

10

You might also like