Professional Documents
Culture Documents
Chương 7 Đứng trước một tập hợp số liệu đã thống kê được, chúng ta phải có
một sự nhận định. Chẳng hạn, sau khi sản xuất một loạt sản phẩm,
ta muốn quan tâm xem các sản phẩm đó có đạt tiêu chuẩn kỹ thuật
KIỂM ĐỊNH
không? năng suất trung bình của cây trồng theo hai phương pháp
có khác nhau không? hoặc căn cứ vào đường đa giác tần suất của
một biến X trong tổng thể có thể kết luật quy luật phân phối của
GIẢ THUYẾT THỐNG KÊ biến X đó là quy luật chuẩn được không? Để kiểm tra nhận định
này, ta phải nêu ra một giả thuyết nào đấy về vấn đề mà ta nghiên
cứu. Các giả thuyết này được gọi là các giả thuyết thống kê. Nhưng
Giảng vên: TS. Lâm Sơn
bằng cách nào để biết các giả thuyết đó là đúng hay sai. Vận dụng
lý thuyết xác suất, người ta đưa ra một số quy tắc để đánh giá giữa
ĐT: 033.6969.909
các kết quả kiểm tra được qua thực nghiệm và mô hình lý thyết mà
Email: sonlam@ftu.edu.vn chúng ta đã đặt giả định. Đó chính là các quy tắc kiểm định giả
thuyết thống kê.
1. Khái niệm
1.1. Giả thuyết thống kê Ví dụ:
ĐN: Giả thuyết thống kê là giả thuyết về dạng a. H0 : Thu nhập là biến ngẫu nhiên phân
phân phối xác suất của biến ngẫu nhiên, về phối chuẩn
các tham số đặc trưng của biến ngẫu nhiên H1 : Thu nhập không phải là biến ngẫu
hoặc về tính độc lập của các biến ngẫu nhiên. nhiên phân phối chuẩn.
Giả thuyết cần kiểm định: H0. b. H0 : Thu nhập trung bình ở thành phố A là
2 triệu
H1 là nhận định mâu thuẫn H0 H1 : Thu nhập trung bình ở thành phố A
lớn hơn 2 triệu
1
18/07/2023
2
18/07/2023
2.1.1. Trường hợp đã biết phương sai *Kiểm định phía trái
(X − 0 ) n Cặp giả thuyết: H0: = 0 và H1: 0
G=
Nếu H0 đúng thì: G N (0,1) P (G −u ) = W = ( −; −u )
3
18/07/2023
Ví dụ: Một quản lý báo cáo: thời gian trung bình 2.1.2 Trường hợp chưa biết phương sai
gia công 1 chi tiết máy là 26 phút. Thời gian gia
công một chi tiết máy là biến ngẫu nhên phân phối (X − 0 ) n
G=
chuẩn với độ lệch chuẩn 5,2 phút. Người ta lấy S
ngẫu nhiên một mẫu có kích thước n=100 và tính Nếu H0 đúng thì: G T (n − 1)
được trung bình 27,56 phút.
Với mức ý nghĩa 5%, có thể kết luận gì về báo cáo Ta chọn W tùy vào dạng của H1:
trên ?
*Kiểm định phía phải
g = 3 W = (−; −1,96) (1,96; +) Cặp giả thuyết: H0: = 0 và H1: 0
Bác bỏ H0
Vậy với myn 5% thì kết luận thời gian W = (t(n −1) ; + )
trung bình là 26 chưa có cơ sở.
4
18/07/2023
2.2. Kiểm định giả thuyết về hai giá trị kỳ vọng Khi H0 đúng
X1 − X 2
Giả sử có hai tổng thể nghiên cứu trong đó có các bnn:
G= N (0,1)
12 22
X N ( 1 ,12 ); Y N ( 2 , 22 ) +
n1 n2
Nếu 1 và 2 chưa biết song có cơ sở để so sánh chúng
với nhau, người ta đưa ra giả thuết thống kê: Tùy theo dạng của đối thuyết ta có miền bác bỏ
H0 : 1 = 2
* Kiểm định phía phải: H 0 : 1 = 2
Lập 2 mẫu ngẫu nhiên và lập tiêu chuẩn kiểm định:
(X1 − X 2 ) − ( 1 − 2 ) H1 : 1 2
G=
12 22 W = (u , +)
+
n1 n2
H 0 : 1 = 2
* Kiểm định phía trái:
H1 : 1 2 Lưu ý:
khi cả 2 cỡ mẫu đều lớn hơn 30 thì ta có thể thay
W = (−, −u ) phương sai tổng thể bằng phương sai mẫu vẫn
coi như G phân phối chuẩn hóa:
X1 − X 2
* Kiểm định hai phía : H 0 : 1 = 2 G= N (0,1)
H1 : 1 2 S12 S 22
+
W = (−, −u /2 ) (u /2 , +) n1 n 2
5
18/07/2023
Sai lầm thường gặp trong trình bày (không được tính điểm) 2.3. Kiểm định một giá trị xác suất
H 0 : 1 = 2
W = (−, −u /2 ) (u /2 , +) Giả sử cần nghiên cứu cơ cấu của tổng thể, tỷ lệ phần
H1 : 1 2
= ( −, −1.96 ) (1.96, + ) tử mang dấu hiệu A trong tổng thể là p chưa biết nhưng
có cơ sở để so sánh nó với một số p0 nào đó. Ta đưa ra
giả thuyết:
X1 − X 2 3,3 − 2,5 H 0 : p = p0
G= = = 3,33 W
2 2 2 2
0, 4 0, 4 0, 4 0, 4 Lập mẫu ngẫu nhiên và lập tiêu chuẩn kiểm định:
+ +
n1 n2 5 6
( f − p0 ) n
Vậy hao phí nguyên vật liệu của hai dây chuyền sản xuất
G=
là khác nhau. p0 (1 − p0 )
6
18/07/2023
Ví dụ:
Cơ quan cảnh sát giao thông cho rằng 62% số người 2.4. Kiểm định giả thuyết về hai giá trị xác suất
lái xe mô tô trên đường là có mang theo GPLX, kiểm
tra ngẫu nhên 130 người lái xe mô tô thấy có 68 người
Trong 2 tổng thể tỉ lệ phần tử mang dấu hiệu A
có mang theo GPLX.
Với mức ý nghĩa 1%, số liệu này có chứng tỏ tỷ lệ lần lượt là p1 và p2 chưa biết nhưng có cơ sở để so
người mang theo GPLX thấp hơn 62% hay không? sánh chúng với nhau. Đưa ra giả thyết thống kê:
H0 : p1 = p2
H 0 : p = p0 W = (−, −u ) = ( −, −1.645 )
H1 : p p0 Lập 2 mẫu ngẫu nhiên và tính được các tần số:
g=
(0,523 − 0,62) 130
= −2, 278 W m1 m m + m2
0,62(1 − 0,62) f1 = , f1 = 2 , f = 1
n1 n2 n1 + n 2
Vậy … tỉ lệ người mang GPLX thấp hơn 62%
7
18/07/2023
( f1 − f2 ) − (p1 − p2 )
Lập tiêu chuẩn: G= H 0 : p1 = p2
1 1 W = (u , +)
f (1 − f ) + H1 : p1 p2
n1 n 2
Khi H0 đúng H 0 : p1 = p2
f1 − f2 H1 : p1 p2 W = (−, −u )
G= N (0,1)
1 1
f (1 − f ) + H 0 : p1 = p2
n1 n 2 W = (−, −u /2 ) (u /2 , +)
H1 : p1 p2
Khi đó ta có các miền bác bỏ tùy theo dạng
của đối thuyết.
Một cuộc nghiên cứu được tiến hành để so sánh biết phương sai nhưng có cơ sở để so sánh nó với
tỷ lệ học sinh lớp trung học cơ sở bỏ học ở hai 1 số 02 nào đó.
huyện miền núi. ở huyện A, trong số 160 học
sinh theo dõi có 48 em bỏ học trước lớp 9 và ở Ta đưa ra giả thuyết: H0 : 2 = 02
huyện B trong số 400 học sinh theo dõi có 90 (n − 1)S 2
em bỏ học trước lớp 9. Với mức ý nghĩ 2%, có Lập mẫu nn và tiêu chuẩn G=
thể cho rằng tỷ lệ bỏ học ở hai huyện trên là 02
khác nhau không?
(n − 1)S 2
Khi H0 đúng G= 2(n −1)
2
8
18/07/2023
Ví dụ:
H 0 : = 0
2 2
W = (−, 12(−n −1) ) biến động của các sản phẩm lớn hơn 0,2 thì
H1 : 0
2 2
dây chuyền sản xuất phải ngừng lại để điều
chỉnh. Với mức ý nghĩa 5% người kỹ sư có kết
H 0 : = 0
2 2
luận gì?
H1 : 0
2 2
W = ( −, 12(−n/2−1) ) ( 2(/2n −1) , + ) Đáp số: Dây chuyền cần ngừng lại để kiểm tra
2.6. Kiểm dịnh giả thuyết về hai giá trị phương sai S12
Khi H0 đúng G = 2 F (n1 − 1, n 2 − 1)
Giả sử có hai tổng thể nghiên cứu trong đó có các bnn: S2
X N ( 1 ,12 ); Y N ( 2 , 22 )
H 0 : 1 = 2
2 2
Nếu 1 và 2 chưa biết song có cơ sở để so sánh chúng
2 2
(
W = f(n1 −1,n2 −1) ; + )
với nhau, người ta đưa ra giả thuết thống kê:
H1: 1 2
2 2
H0 : 12 = 22
H 0 : 12 = 22
Lập 2 mẫu ngẫu nhiên và lập tiêu chuẩn kiểm định:
(
W = −; f1−(n1 −1,n2 −1) )
S12 . 22 H1: 1 2
2 2
G= 2 2
S 2 . 1
9
18/07/2023
H 0 : 1 = 2
2 2
H1 : 1 2
2 2
( ) (
W = −; f1−(n1/2−1,n2 −1) f(n/21 −1,n2 −1) ; + )
10