You are on page 1of 31

CHƯƠNG 5

KIỂM ĐỊNH GIẢ THUYẾT


THỐNG KÊ

1
Nội dung chính

 Khái niệm chung


 Các loại sai lầm khi kiểm định
 Cơ sở lý thuyết của kiểm định
 Kiểm định giả thuyết về trung bình
 Kiểm định giả thuyết về tỷ lệ

2
Khái niệm chung

Mô hình tổng quát của bài toán kiểm định là ta


nêu lên hai mệnh đề trái ngược nhau, một mệnh
đề được gọi là giả thuyết H và mệnh đề ngược lại
được gọi là đối thuyết H

Giải quyết một bài toán kiểm định là đưa ra một


quy tắc hành động: chấp nhận H hoặc bác bỏ H
bằng cách dựa vào mẫu quan sát.

3
Khái niệm chung

• Chú ý: Ta nói rằng: chấp nhận giả thuyết H, có


nghĩa là ta tin rằng H đúng; bác bỏ H, có nghĩa là
ta tin rằng H sai.
• Ở đây, ta không thể khẳng định H đúng hay sai, vì
ta chỉ quan sát ngẫu nhiên một số trường hợp nên
không thể khẳng định chắc chắn điều gì cho cả
tổng thể.

4
Các loại sai lầm khi kiểm định

Quan sát ngẫu nhiên một số trường hợp rồi suy


rộng cho cả tổng thể, sự suy rộng này có khi đúng,
có khi sai. Thống kê học phân biệt hai loại sai lầm:
• Sai lầm loại 1: Bác bỏ H trong khi H đúng
• Sai lầm loại 2: Chấp nhận H trong khi H sai

5
Các loại sai lầm khi kiểm định

Quyết định Chấp nhận H Bác bỏ H

Thực tế

H xảy ra Đúng Sai lầm loại 1

H không xảy ra Sai lầm loại 2 Đúng

6
Các loại sai lầm khi kiểm định
• Nếu ta hạ thấp nguy cơ sai lầm loại 1 thì nguy cơ sai lầm
loại 2 sẽ tăng lên và ngược lại. Do đó, thực tế thì ta xem
giữa hai sai lầm này, sai lầm nào tác hại nhiều hơn thì cần
tránh.
• Có 2 cách khống chế khả năng mắc sai lầm:
• Cách thứ 1: Ta ấn định trước mức sai lầm loại 1 và sai
lầm loại 2, rồi tính toán tìm 1 mẫu có kích thước nhỏ nhất
ứng với 2 mức sai lầm.

• Cách thứ 2: Ta ấn định trước xác suất sai lầm loại 1


(tức là cho trước mức ý nghĩa  ), chọn miền bác bỏ W
có xác suất sai lầm loại 2 bé nhất. 7
Các loại sai lầm khi kiểm định

• Thống kê học quy ước sai lầm loại 1 là tác hại


hơn và cần tránh hơn. Do đó, ta chỉ xét các phép
kiểm định có nguy cơ sai lầm loại 1 không vượt
quá một giá trị ấn định trước, thông thường là 1%,
2%, 5% ... Giá trị này còn được gọi là mức ý nghĩa
của phép kiểm định.

8
Cơ sở lý thuyết của kiểm định

• Dựa vào mẫu quan sát X1, X2, …, Xn, ta chọn một
thống kê Q = f(X1, X2, …, Xn) sao cho khi H đúng
thì phân phối của Q hoàn toàn được xác định.
Thống kê Q được gọi là tiêu chuẩn kiểm định giả
thuyết H.
• Từ nguy cơ sai lầm  , ta đi tìm khoảng ước lượng
[a, b] của Q ở độ tin cậy 1  .

9
Cơ sở lý thuyết của kiểm định

• Nếu Q  a,b thì ta chấp nhận H.


• Nếu Q  a,b thì ta bác bỏ H.
Lưu ý:
1) Trong ứng dụng, nếu hàm mật độ của Q có
dạng đối xứng qua trục Oy, chẳng hạn như trong
phân phối Gauss N(0;1) và phân phối Student
St(n), thì ta chọn khoảng tin cậy đối xứng [-C; C]
với 
P  Q  C   P  Q  C   .
2
10
Cơ sở lý thuyết của kiểm định
• Nếu Q  C thì ta chấp nhận H.

• Nếu Q  C thì ta bác bỏ H.

11
Cơ sở lý thuyết của kiểm định
2) Nếu hàm mật độ của Q không đối xứng thì ta quy
ước khoảng tin cậy trong phép kiểm định là [0; C] với
P(Q>C) = α.
• Nếu Q ≤ C thì ta chấp nhận giả thuyết H.
• Nếu Q > C thì ta bác bỏ H.

12
Kiểm định so sánh trung bình với một số

 Xét bài toán kiểm định: so sánh một tham số

trung bình,
H :   0 ,

H :   0 .

Dựa vào mẫu quan sát (X1, X2, …, Xn), ta đưa ra

quyết định: chấp nhận H hoặc bác bỏ H.

Ta có 4 trường hợp sau:


13
Kiểm định so sánh trung bình với một số
 Trường hợp 1: n  30 và 2 đã biết.

- Xác định: X

1 
- Xác định t  từ đẳng thức   t    (Tra bảng F)
2
hoặc P(|U|< t  )=ɣ (Tra bảng G).
X  0
- Xác định giá trị thống kê: t  n.

- Kết luận: Nếu t  t  thì ta chấp nhận H.

Nếu t  t  thì ta bác bỏ H.


14
Kiểm định so sánh trung bình với một số
Lưu ý. Trong trường hợp bác bỏ H, nghĩa là   0 ,
thì:

• Nếu X  0 thì ta kết luận   0 .

• Nếu X  0 thì ta kết luận   0 .

15
Kiểm định so sánh trung bình với một số
 Trường hợp 2: n  30 và  2
chưa biết.

- Xác định: X,S


1 
- Xác định t  từ đẳng thức   t    (Tra bảng F).
2
X  0
- Xác định giá trị thống kê: t  n.
S

- Kết luận: Nếu t  t  thì ta chấp nhận H.

Nếu t  t  thì ta bác bỏ H.


16
Kiểm định so sánh trung bình với một số
 Trường hợp 3: n  30 ,  2
đã biết và dấu hiệu X
có phân phối chuẩn.

Thực hiện tương tự như ở trường hợp 1.

17
Kiểm định so sánh trung bình với một số
 Trường hợp 4: n  30 ,  chưa biết và dấu hiệu
2

X có phân phối chuẩn.

- Xác định: X, S

- Xác định phân vị t  (n  1) từ  (Tra bảng H).

X  0
- Xác định giá trị thống kê: t  n
S

- Kết luận: Nếu t  t  (n  1) thì ta chấp nhận H.

Nếu t  t  (n  1) thì ta bác bỏ H.


18
TH1: n  30, biết TH2: n  30, chưa biết
 x  x, s 2
 1     (G)
 t  1     (G)
 t
 Xác định giá trị thống kê  Xác định giá trị thống kê:
X  0 X  0
t  t n t  t n
 S
Kết luận: Kết luận:
 t  t :  t  t :
Chấp nhận H Chấp nhận H
t  t : t  t :
Bác bỏ H Bác bỏ H
TH3: n  30,X N(  , 2 ), 2 biết TH4: n  30, X N( ,  ), 
2 2
chưa biết

Làm tương tự TH1 2


 x, s
 1      t (n  1)
(H )

 Xác định giá trị thống kê


X  0
t  t (n  1) n
S
Kết luận: t  t (n  1) : Chấp nhận
H; t  t (n  1) : Bác bỏ H
19
Kiểm định so sánh trung bình với một số
Ví dụ 1. Giám đốc một công ty cho biết lương trung
bình của 1 công nhân của công ty là 3,8 triệu
đồng/tháng. Chọn ngẫu nhiên 36 công nhân thấy lương
trung bình là 3,5 triệu đồng/tháng, với độ lệch chuẩn
  400.000 . Lời báo cáo của giám đốc có tin cậy được
không, với mức ý nghĩa   5%.

Giả thuyết H : 0  3.800.000; H : 0  3.800.000;

0 : tiền lương trung bình của công nhân theo lời giám
đốc.
20
Kiểm định trung bình với 1 số

x  3.500.000, n  36,  400.000,  5%.


  5%    1    0,95  t  1,96 (Tra Bảng F)
x  0 n 3.500.000  3.800.000 36
t    4,5  1,96 : Bác bỏ H
 400.000

Kết luận: Với mức ý nghĩa 5%, không tin vào lời
giám đốc. Lương trung bình thực sự của công
nhân bé hơn 3,8 triệu đồng/tháng
(do 3,5 triệu < 3,8 triệu = 0 ).

21
Kiểm định so sánh trung bình với một số
Ví dụ 2. Trong thập niên 80, trọng lượng trung
bình của thanh niên là 48 kg. Nay để xác định lại
trọng lượng ấy, người ta chọn mẫu ngẫu nhiên 100
thanh niên đo trọng lượng trung bình là 50 kg và
2 2
phương sai hiệu chỉnh s = (10kg) .
Hãy xem trọng lượng thanh niên hiện nay phải
chăng có thay đổi, với mức ý nghĩa là 1%.
Giả thuyết H : 0  48 H : 0  48

:trọng lượng trung bình của thanh niên hiện nay.


0  48 : là trọng lượng trung bình của thanh niên
trong thập niên 80.
22
Kiểm định trung bình so sánh với một số
n  100  30; x  50; s  10;  1%
  1%    1    0,99  t  2,58
x  0 n 48  50 100
Ta có t    2  2,58 : Chấp nhận
s 10
H.

Kết luận: với mức ý nghĩa 1%, trọng lượng trung


bình thanh niên hiện nay thật sự không thay đổi so
với thập niên 80.

23
Kiểm định so sánh trung bình với một số
Ví dụ 3. Trọng lượng trung bình khi xuất chuồng ở
một trang trại chăn nuôi gà trước là 3,3 kg/con.
Năm nay, người ta sử dụng một loại thức ăn mới,
cân thử 15 con khi xuất chuồng ta được các số liệu
sau:
3,25; 2,50; 4,00; 3,75; 3,80; 3,90; 4,02; 3,60;
3,80; 3,20; 3,82; 3,40; 3,75; 4,00; 3,50
Giả thiết trọng lượng gà là đại lượng ngẫu nhiên
phân phối theo quy luật chuẩn.
1) Với mức ý nghĩa α = 0,05. Hãy cho kết luận về
tác dụng của loại thức ăn này?
2) Nếu trại chăn nuôi báo cáo trọng lượng trung
bình khi xuất chuồng là 3,5 kg/con thì chấp nhận
được không? (α = 5%). 24
Kiểm định so sánh trung bình với một số

1) Đây là bài toán kiểm định giả thuyết trung bình


đám đông, 0  3,3; n  15  30, chưa biết.
Với mức ý nghĩa 5% tra bảng Student có bậc tự do
14 (Bảng H), ta có: t0,05 (14)  2,1448.
Từ các số liệu đã cho ta tính được x  3,62 (kg), S =
0,405.
3,62  3,3 15
t   3,06.
0,405

Ta thấy t  3,06  t0,05 (14)  2,1448 : Bác bỏ giả thuyết H:


0  3,3 . Tức là loại thức ăn đó có tác dụng làm tăng
trọng lượng gà (vì x  3,62 >3,3). 25
Kiểm định so sánh trung bình với một số

2) Đặt giả thuyết H : 0  3,5 H : 0  3,5

3,62  3,5 15
Ta có: t   1,15.
0,405

Vì t  1,15  t0,05 (14)  2.1448 : Chấp nhận giả thuyết


H :   3,5.
Chấp nhận báo cáo của trại nuôi về trọng lượng gà
xuất chuồng.

26
Kiểm định so sánh tỷ lệ với một số

 Xét bài toán kiểm định: so sánh một tham số tỷ

lệ,
H : p  p0 ,

H : p  p0 .

Ở đây, p là tỷ lệ các phần tử có tính chất A trên tổng

thể. Dựa vào mẫu quan sát (X1, X2, …, Xn), ta đưa

ra quyết định: chấp nhận H hoặc bác bỏ H.


27
Kiểm định so sánh tỷ lệ với một số
m
- Xác định tỷ lệ trên mẫu : f  fn 
n
1 
- Xác định t  từ đẳng thức   t    (Tra bảng F).
2

f  p0
- Xác định giá trị thống kê: t  n.
p0 1  p0 

Kết luận: Nếu t  t  thì ta chấp nhận H.

Nếu t  t  thì ta bác bỏ H.


28
Kiểm định so sánh tỷ lệ với một số
VD 5. Tỷ lệ phế phẩm của một nhà máy trước đây
là 5%. Năm nay nhà máy áp dụng một biện pháp
kỹ thuật mới. Để nghiên cứu tác dụng của biện
pháp kỹ thuật mới, người ta lấy một mẫu gồm 800
sản phẩm để kiểm tra và thấy có 24 phế phẩm.
a) Với mức ý nghĩa 1%, hãy cho kết luận về biện
pháp kỹ thuật mới này ?
b) Nếu nhà máy báo cáo tỷ lệ phế phẩm sau khi áp
dụng biện pháp kỹ thuật mới là 2% thì có chấp
nhận được không ? Kết luận với mức ý nghĩa 1%.
29
Ví dụ 5.
p0 = 0,05. Sau khi áp d ụng biện pháp kỹ thuật mới
tỉ lệ phế phẩm của nhà máy là p, với p chưa biết.
H: p = 0,05.
24
 f   0,03.   1%  t  2,58
800
f  p0 n 0,03  0,05 800
Tính t    2,59  t  2,58
p0 1  p0  0,05  0,95

Ta bác bỏ giả thuyết H: p = 0,05.

Vậy biện pháp kỹ thuật mới làm giảm tỉ lệ phế


phẩm. Biện pháp kỹ thuật mới có hiệu quả. 30
Ví dụ 5.
2) Gọi p là tỉ lệ phế phẩm sau khi áp dụng kỹ
thuật mới, p chưa biết.
Báo cáo của nhà máy là tỉ lệ phế phẩm sau khi áp
dụng kỹ thuật mới là p0 = 0,02, với   5% , ta có
t  1,96.

f  p0 n 0,03  0,02 800


t    2,02  t  1,96
p0 1  p0  0,02  0,98

Ta bác bỏ giả thuyết H: p = 0,02.

Vậy báo cáo của nhà máy tỉ lệ phế phẩm 0,02 là


không đúng thực tế. 31

You might also like