You are on page 1of 9

8/9/2019

Chương 7 Đứng trước một tập hợp số liệu đã thống kê được, chúng ta phải có
một sự nhận định. Chẳng hạn, sau khi sản xuất một loạt sản phẩm,
ta muốn quan tâm xem các sản phẩm đó có đạt tiêu chuẩn kỹ thuật

KIỂM ĐỊNH
không? năng suất trung bình của cây trồng theo hai phương pháp
có khác nhau không? hoặc căn cứ vào đường đa giác tần suất của
một biến X trong tổng thể có thể kết luật quy luật phân phối của
GIẢ THUYẾT THỐNG KÊ biến X đó là quy luật chuẩn được không? Để kiểm tra nhận định
này, ta phải nêu ra một giả thuyết nào đấy về vấn đề mà ta nghiên
cứu. Các giả thuyết này được gọi là các giả thuyết thống kê. Nhưng
Giảng vên: Lâm Sơn
bằng cách nào để biết các giả thuyết đó là đúng hay sai. Vận dụng
lý thuyết xác suất, người ta đưa ra một số quy tắc để đánh giá giữa
ĐT: 033.6969.909
các kết quả kiểm tra được qua thực nghiệm và mô hình lý thyết mà
Email: sonlam@ftu.edu.vn chúng ta đã đặt giả định. Đó chính là các quy tắc kiểm định giả
thuyết thống kê.

1. Khái niệm
1.1. Giả thuyết thống kê Ví dụ:
ĐN: Giả thuyết thống kê là giả thuyết về dạng a. H0 : Thu nhập là biến ngẫu nhiên phân
phân phối xác suất của biến ngẫu nhiên, về phối chuẩn
các tham số đặc trưng của biến ngẫu nhiên H1 : Thu nhập không phải là biến ngẫu
hoặc về tính độc lập của các biến ngẫu nhiên. nhiên phân phối chuẩn.
Giả thuyết cần kiểm định: H0. b. H0 : Thu nhập trung bình ở thành phố A là
2 triệu
H1 là nhận định mâu thuẫn H0 H1 : Thu nhập trung bình ở thành phố A
lớn hơn 2 triệu

1
8/9/2019

1.3. Phương pháp kiểm định


1.2. Kiểm định giả thuyết
- Đưa ra cặp giả thuyết H0 và H1.
- Giả sử H0 là đúng.
Kiểm định giả thuyết là xác định xem có đủ chứng cứ - Từ đó tìm biến cố A sao cho: P(A) rất bé
thống kê để tin tưởng vào một Giả thuyết nào đó hay - Dùng nguyên lý xác suất nhỏ có thể coi như biến
không. cố A không bao giờ xảy ra.
-Thực hiện phép thử trên mẫu
 Trọng lượng trung bình của 1 sản phẩm sản xuất.
+ Nếu A xảy ra chứng tỏ H0 thiếu cơ sở và bác
 Thói quen, hành vi tiêu dùng của nhóm dân cư.
bỏ H0
 Thay đổi trước khi có dự án và sau khi có dự án.
+ Nếu A không xảy ra thì chưa có cơ sở bác bỏ
nên ta chấp nhận H0.

1.4. Tiêu chuẩn kiểm định và miền bác bỏ


1.5. Quy tắc kiểm định
Lập mẫu ngẫu nhiên W  ( X 1 , X 2 ,..., X n )
Thực hiện phép thử với mẫu thu được giá trị cụ
Chọn thống kê G G  f ( X 1 , X 2 ,..., X n , 0 ) thể: w   x1 , x2 ,...xn 
Sao cho nếu H0 đúng thì quy luật phân phối của Từ đó tính được: g  f  x1 , x2 ,...xn , 0 
G hòan toàn xác định. Từ đó, với 1 xs rất bé ta
g được gọi là giá trị quan sát của tiêu chuẩn kiểm
tìm được 1 tập W sao cho:
định.
P  G W / H 0    Nếu g W thì bác bỏ H0 (Chấp nhận H1)
G tiêu chuẩn kiểm định.
W miền bác bỏ. Nếu g W thì chấp nhận H0
 mức ý nghĩa của kiểm định

2
8/9/2019

2. Kiểm định tham số


1.6. Sai lầm trong kiểm định 2.1. Kiểm định giả thuyết về một kỳ vọng toán
Thực tế Quyết định của biến ngẫu nhiên phân phối chuẩn.
tổng thể Chấp nhận H0 Bác bỏ H0
Giả sử bnn X  N (  , 2 ) chưa biết kỳ vọng
Kết luận đúng Sai lầm loại I
nhưng có cơ sở để so sánh nó với 1 số 0 nào đó.
H0 đúng (xác suất =1- = (xác suất =  = mức
độ tin cậy) ý nghĩa ) Ta đưa ra giả thuyết H0:   0
Sai lầm loại II Kết luận đúng
H0 sai (xác suất = ) (xác suất = 1-  =lực
kiểm định) Để kiểm định ta chọn mẫu ngẫu kích thước n
và chọn tiêu chuẩn kiểm định G trong 2
trường hợp sau

2.1.1. Trường hợp đã biết phương sai *Kiểm định phía trái
(X   0 ) n Cặp giả thuyết: H0:   0 và H1:   0
G

Nếu H0 đúng thì: G  N (0,1) P G  u    W   ; u 

Ta chọn W tùy vào dạng của H1: *Kiểm định 2 phía


*Kiểm định phía phải Cặp giả thuyết: H0:   0 và H1:    0
  0 và H1:   0
P G  u 2   P G  u 2   
Cặp giả thuyết: H0:
Ta tìm được u sao cho:
W   ; u 2   u 2 ;  
P G  u    W  u ;  

3
8/9/2019

2.1.2 Trường hợp chưa biết phương sai

Ví dụ: (X   0 ) n
Một quản lý báo cáo: thời gian trung bình gia G
S
công 1 chi tiết máy là 26 phút. Giả sử thời gian gia Nếu H0 đúng thì: G  T (n  1)
công một chi tiết máy là biến ngẫu nhên phân phối
chuẩn với độ lệch chuẩn 5,2 phút. Ta chọn W tùy vào dạng của H1:
Người ta lấy ngẫu nhiên một mẫu có kích thước
n=100 và tính được trung bình 27,56 phút. *Kiểm định phía phải
Với mức ý nghĩa 5%, có thể kết luận gì về báo cáo Cặp giả thuyết: H0:   0 và H1:   0
trên ?

W  t(n 1) ;  

*Kiểm định phía trái


Ví dụ:
Cặp giả thuyết: H0:   0 và H1:   0
Một công ty sản xuất bóng đèn với tuổi thọ
W   ; t (n 1)
 trung bình của bóng đèn là 1200 giờ. Công ty
mới nhập về một dây chuyền sản xuất mới. Dây
chuyền này khi sản xuất thử 40 bóng và dùng
thử nghiệm thì cho thấy tuổi thọ trung bình là
*Kiểm định 2 phía
1260 giờ với độ lệch chuẩn 215 giờ.
Cặp giả thuyết: H0:   0 và H1:    0
Với mức ý nghĩa 5% hãy nhận định xem dây

W   ; t(n 1)   t(n 1) ;  


chuyền mới có tốt hơn dây chuyền cũ hay
không?

4
8/9/2019

2.2. Kiểm định giả thuyết về hai giá trị kỳ vọng Khi H0 đúng
X1  X 2
Giả sử có hai tổng thể nghiên cứu trong đó có các bnn:
G  N (0,1)
 12  22
X  N ( 1 ,  12 ); Y  N (  2 ,  22 ) 
n1 n2
Nếu 1 và  2 chưa biết song có cơ sở để so sánh chúng
với nhau, người ta đưa ra giả thuết thống kê: Tùy theo dạng của đối thuyết ta có miền bác bỏ
H 0 : 1  2
* Kiểm định phía phải: H 0 : 1  2
Lập 2 mẫu ngẫu nhiên và lập tiêu chuẩn kiểm định:
(X1  X 2 )  ( 1  2 ) H1 : 1   2
G
 12

 22 W  (u , )
n1 n2

H 0 : 1   2
* Kiểm định phía trái:
H1 : 1   2 Lưu ý:
khi cả 2 cỡ mẫu đều lớn hơn 30 thì ta có thể thay
W  (, u ) phương sai tổng thể bằng phương sai mẫu vẫn
coi như G phân phối chuẩn hóa:

X1  X 2
* Kiểm định hai phía : H 0 : 1   2 G  N (0,1)
H1 : 1   2 S 2
S 2

1 2

W  (, u /2 )  (u /2 , ) n1 n 2

5
8/9/2019

Ví dụ: Tại một nhà máy người ta lắp rắp hai dây Sai lầm thường gặp trong trình bày (không được tính điểm)
chuyền sản xuất cùng sản xuất một loại sản phẩm. H 0 : 1   2
để đánh giá xem mức độ hao phí nhiên liệu trung
bình trong một ca sản xuất theo hai dây chuyền này H1 : 1   2
có khác nhau không. Người ta tiến hành sản xuất  W  (, u /2 )  (u /2 , )
thử và thu được số liệu sau:
  , 1.96   1.96,  
Dây chuyền 1: 2,5 3,2 3,5 3,8 3,5
Dây chuyền 2: 2,0 2,7 2,5 2,9 2,3 2,6 X1  X 2 3,3  2,5
G   3,33 W
Với mức ý nghĩa 5%, hãy kết luận về vấn đề trên S1 S 2
2 2
0, 42 0,52
biết rằng hao phí nguyên liệu theo cả hai dây  
n1 n 2 5 6
chuyền trên đều là biến ngẫu nhiên phân phối
chuẩn. Vậy hao phí nguyên vật liệu của hai dây chuyền sản xuất
là khác nhau.

2.3. Kiểm định một giá trị xác suất Khi H0 đúng
( f  p0 ) n
G  N (0,1)
Giả sử cần nghiên cứu cơ cấu của tổng thể, tỷ lệ phần
tử mang dấu hiệu A trong tổng thể là p chưa biết nhưng
p0 (1  p0 )
có cơ sở để so sánh nó với một số p0 nào đó. Ta đưa ra
giả thuyết: Tùy theo dạng của đối thuyết ta có miền bác bỏ
H 0 : p  p0
Lập mẫu ngẫu nhiên và lập tiêu chuẩn kiểm định: * Kiểm định phía phải: H 0 : p  p0
H1 : p  p0
( f  p0 ) n
G
p0 (1  p0 ) W  (u , )

6
8/9/2019

* Kiểm định phía trái: H 0 : p  p0


H1 : p  p0

W  (, u ) Ví dụ:


Cơ quan cảnh sát giao thông cho rằng 62% số người
lái xe mô tô trên đường là có mang theo GPLX, kiểm
* Kiểm định hai phía : H 0 : p  p0 tra ngẫu nhên 130 người lái xe mô tô thấy có 68 người
có mang theo GPLX.
H1 : p  p0
Với mức ý nghĩa 1%, số liệu này có chứng tỏ tỷ lệ
W  ( , u /2 )  (u /2 , ) người mang theo GPLX thấp hơn 62% hay không?

2.4. Kiểm định giả thuyết về hai giá trị xác suất ( f1  f2 )  (p1  p2 )
Lập tiêu chuẩn: G
1 1 
Trong 2 tổng thể tỉ lệ phần tử mang dấu hiệu A f 1  f    
 n1 n 2 
lần lượt là p1 và p2 chưa biết nhưng có cơ sở để so
sánh chúng với nhau. Đưa ra giả thyết thống kê: Khi H0 đúng

H 0 : p1  p2 f1  f2
G  N (0,1)
1 1 
Lập 2 mẫu ngẫu nhiên và tính được các tần số: f 1  f    
m1 m m  m2  n1 n 2 
f1  , f1  2 , f  1
n1 n2 n1  n 2 Khi đó ta có các miền bác bỏ tùy theo dạng
của đối thuyết.

7
8/9/2019

H 0 : p1  p2 Ví dụ:
W  (u , )
H1 : p1  p 2 Một cuộc nghiên cứu được tiến hành để so sánh
tỷ lệ học sinh lớp trung học cơ sở bỏ học ở hai
H 0 : p1  p2 huyện miền núi. ở huyện A, trong số 160 học
H1 : p1  p2 W  (, u ) sinh theo dõi có 48 em bỏ học trước lớp 9 và ở
huyện B trong số 400 học sinh theo dõi có 90
em bỏ học trước lớp 9. Với mức ý nghĩ 2%, có
H 0 : p1  p2 thể cho rằng tỷ lệ bỏ học ở hai huyện trên là
H1 : p1  p2 W  ( , u /2 )  (u /2 , ) khác nhau không?

2.5. Kiểm định một giá trị phương sai


 H 0 :  2   02
Giả sử trong tổng thể bnn X  N (  , ) chưa
2
  W  ( 2(n 1) ,  )
biết phương sai nhưng có cơ sở để so sánh nó với  1
H :  2
  2
0

1 số  02 nào đó.
 H 0 :  2   02
Ta đưa ra giả thuyết: H0 :   
2 2
  W  ( , 12(n 1) )
 H1 :    0
0 2 2

(n  1)S 2
Lập mẫu nn và tiêu chuẩn G  H 0 :  2   02
 02

 H1 :    0
2 2

(n  1)S 2
Khi H0 đúng G   2(n 1)  W   , 12(n/21)    2(/2n 1) ,  
 2

8
8/9/2019

Ví dụ: 2.6. Kiểm dịnh giả thuyết về hai giá trị phương sai
Giả sử có hai tổng thể nghiên cứu trong đó có các bnn:
Đo đường kính của 12 sản phẩm của một X  N ( 1 ,  12 ); Y  N (  2 ,  22 )
dây chuyền sản xuất, người kỹ sư kiểm tra
Nếu  1 và  2 chưa biết song có cơ sở để so sánh chúng
2 2
chất lượng tính được s=0,3. Biết rằng nếu độ
biến động của các sản phẩm lớn hơn 0,2 thì với nhau, người ta đưa ra giả thuết thống kê:
dây chuyền sản xuất phải ngừng lại để điều H 0 :  12   22
chỉnh.
Với mức ý nghĩa 5% người kỹ sư có kết luận Lập 2 mẫu ngẫu nhiên và lập tiêu chuẩn kiểm định:
gì?
S12 . 22
Đáp số: Dây chuyền cần ngừng lại để kiểm tra G 2 2
S 2 . 1

S12
Khi H0 đúng G  2  F (n1  1, n 2  1)
S2
 H 0 :  12   22  H 0 :  12   22
 
W  f(n1 1,n 2 1) ;   
 H1: 1   2  H1 :  1   2
2 2 2 2

 H 0 :  12   22
  
W  ; f1(n1/21,n 2 1)  f(/2n1 1,n2 1) ;  
 
 W  ; f1(n1 1,n 2 1) 
 H1: 1   2
2 2

You might also like