You are on page 1of 29

18:47

Chương 4 .

KIỂM ĐỊNH THỐNG KÊ

1
18:47

Ví dụ có một máy đóng các bao gạo xuất


khẩu hoạt động một thời gian dài và người
ta báo lại rằng hiện nay lượng gạo mỗi bao
do máy đóng không đúng trọng lượng qui
định là 50 ( kg ) .
Bạn là người đi kiểm tra .
Bạn chọn ngẫu nhiên 100 bao để cân .
Bạn sẽ kết luận như thế nào về tình trạng
hoạt động của máy sau khi có các số liệu đó ?

2
18:47

Giả sử nghiên cứu biến ngẫu nhiên X trong


tổng thể .

Giả thuyết thống kê là giả thuyết về :


Dạng phân phối xác suất của biến ngẫu nhiên .
Các tham số đặc trưng của biến ngẫu nhiên .
Tính độc lập của các biến ngẫu nhiên .

3
18:47

Giả thuyết thống kê đưa ra gọi là giả


thuyết gốc ( H0 ) .
Khi đưa ra một giả thuyết thống kê ,
người ta còn nghiên cứu kèm theo nó
mệnh đề mâu thuẫn với nó , gọi là giả
thuyết đối ( H1 ) để khi H0 bị bác bỏ thì
thừa nhận H1 .
H0 và H1 tạo nên cặp giả thuyết thống kê .

4
18:47

VÍ DỤ .
Giả thuyết gốc H0 :
Máy đóng bao gạo vẫn hoạt động tốt .
Giả thuyết đối H1 :
Máy đóng bao gạo không còn hoạt động tốt .

5
18:47

VÍ DỤ .
Các bác sĩ cần so sánh hai phương pháp điều trị bệnh
Covid – 19 .
p1 là tỷ lệ khỏi bệnh khi điều trị bằng phương pháp I .
p2 là tỷ lệ khỏi bệnh khi điều trị bằng phương pháp II .
Kiểm định :
Giả thuyết gốc H0 : p1 = p2
Giả thuyết đối H1 : p1 ≠ p2

6
18:47

VÍ DỤ .
Giả thuyết gốc H0 :
Phương pháp điều trị A chữa khỏi 90 % bệnh nhân .
Giả thuyết đối H1 :
Phương pháp điều trị A chữa khỏi ít hơn 90 % bệnh nhân .

7
18:47

VÍ DỤ .

Giả thuyết gốc H0 :


Tuổi thọ trung bình của hai loại máy tính A , B như nhau .

Giả thuyết đối H1 :


Tuổi thọ trung bình của hai loại máy tính A , B không như nhau .

8
18:47

VÍ DỤ .
Giả thuyết gốc H0 :
Tỷ lệ sản phẩm lỗi của nhà máy bằng 2 % .
Giả thuyết đối H1 :
Tỷ lệ sản phẩm lỗi của nhà máy nhiều hơn 2 % .

9
18:47

Vì các giả thuyết thống kê có thể


đúng hoặc sai nên cần kiểm định ,
tức là tìm ra kết luận về tính thừa
nhận được hay không thừa nhận
được của giả thuyết đó .
Việc kiểm định này gọi là kiểm định
thống kê vì nó dựa vào thông tin
thực nghiệm của mẫu để kết luận .

10
18:47

BÀI TOÁN KIỂM ĐỊNH


Giả thuyết gốc H0 .
Giả thuyết đối H1 .

Hoặc chọn H0 ( bác bỏ H1 ) .


Hoặc chọn H1 ( bác bỏ H0 ) .

11
18:47

Tình huống H0 đúng H0 sai

Quyết định
Bác bỏ H0 Sai lầm loại 1 Quyết định đúng
Xác suất α Xác suất 1 – β

Chọn H0 Quyết định đúng Sai lầm loại 2


Xác suất 1 – α Xác suất β

12
18:47

13
18:47

KIỂM ĐỊNH ĐÚNG


Chọn H0 và thực tế H0 đúng .
Bác bỏ H0 và thực tế H0 sai .
KIỂM ĐỊNH SAI
Bác bỏ H0 nhưng thực tế H0 đúng ( sai lầm loại 1 ) .
Chọn H0 nhưng thực tế H0 sai ( sai lầm loại 2 ) .
Sai lầm này có thể sinh ra do kích thước mẫu
quá nhỏ , do phương pháp lấy mẫu , …

14
18:47

Ta thấy rằng sai lầm loại 1 và


sai lầm loại 2 mâu thuẫn nhau ,
tức là với một mẫu kích thước
n xác định thì không thể cùng
một lúc giảm xác suất mắc hai
loại sai lầm nói trên được .

15
18:47

Khi ta giảm α đi thì đồng thời


sẽ làm tăng β và ngược lại .
Chẳng hạn nếu lấy α = 0 thì sẽ
không bác bỏ bất kỳ giả
thuyết nào , kể cả giả thuyết
sai , như vậy β sẽ đạt cực đại .

16
18:47

Từ tổng thể , lấy ra mẫu ngẫu


nhiên , kích thước n .
Lập tiêu chuẩn kiểm định ( K ) .
Điều kiện đặt ra đối với K là :
Nếu H0 đúng thì quy luật phân phối
xác suất của K hoàn toàn xác định .

17
18:47

Sau khi đã chọn được tiêu


chuẩn kiểm định K , ta sẽ
tìm miền bác bỏ H0 , ký hiệu
W ( α ) , sao cho :
Nếu K nhận giá trị thuộc
miền W ( α ) thì bác bỏ H0 .

18
18:47

QUY TẮC KIỂM ĐỊNH

K thuộc W ( α ) thì bác bỏ H0 .

K không thuộc W ( α ) thì chấp nhận H0 .

19
18:47

Khi kiểm định , ta phải hạn chế khả


năng mắc phải hai loại sai lầm 1 và 2 .
Thường ta làm như sau :
- Ấn định trước α ( xác suất mắc sai
lầm loại 1 ) .
- Tìm miền W ( α ) sao cho xác suất
mắc sai lầm loại 2 là nhỏ nhất .

20
18:47

Người ta thường chọn α nhỏ ( khoảng


1 % đến 5 % ) .
Ta đừng lầm tưởng rằng với một bài
toán kiểm định , α càng bé thì kết quả
kiểm định “ càng tốt ” .
Điều đó là không đúng , bởi vì khi α
quá bé thì đúng là tỷ lệ mắc sai lầm loại
1 là rất bé nhưng ngược lại tỷ lệ mắc
sai lầm loại 2 là rất lớn .

21
18:47

Kiểm định một trung bình


Kiểm định hai trung bình
Kiểm định một tỷ lệ
Kiểm định hai tỷ lệ
Kiểm định một phương sai
Kiểm định hai phương sai
Kiểm định quy luật phân phối xác suất
Kiểm định tính độc lập

22
18:47

KIỂM ĐỊNH TÍNH ĐỘC LẬP

Quan sát hai dấu hiệu A , B trên một tổng thể .


Dấu hiệu A có các thành phần : A1 , … , Ah .
Dấu hiệu B có các thành phần : B1 , … , Bk .

Giả thuyết gốc H0 : A và B độc lập nhau .


Giả thuyết đối H1 : A và B không độc lập nhau .

23
18:47

B B1 B2 … Bk Tổng
A
A1 n11 n12 … n1k n1
A2 n21 n22 … n2k n2
… … … … … …
Ah nh1 nh2 nhk nhk nh
Tổng m1 m2 … mk n

24
18:47

Tiêu chuẩn kiểm định :


 nij2 
K =  – 1 n
 i , j n .m 
 i j 
Miền W ( α ) :
( χ2 ( α ) , + ∞ )
( tra bảng giá trị tới hạn phân phối χ2 ) .
K thuộc W ( α ) thì bác bỏ H0 .
K không thuộc W ( α ) thì chấp nhận H0 .
Kết luận .

25
18:47

VÍ DỤ .
Cần nghiên cứu tác dụng của các loại phân bón 1 , 2 , 3 đối với
việc ra hoa hoặc không ra hoa của một loài hoa .
Thí nghiệm bón ba loại phân khác nhau cho một số cây loài đó ,
ta có tình hình ra hoa của các cây như sau :
B Phân bón 1 Phân bón 2 Phân bón 3
A
Có ra hoa 40 75 63
Không ra hoa 15 12 12

Với mức ý nghĩa 5 % , hãy kiểm định xem việc bón các loại phân
khác nhau có ảnh hưởng tới việc ra hoa của loài hoa trên không ?

26
18:47

Đặt giả thuyết


H0 : Bón phân khác nhau không ảnh hưởng tới việc ra hoa .
H1 : Bón phân khác nhau ảnh hưởng tới việc ra hoa .

B Phân bón 1 Phân bón 2 Phân bón 3 Tổng


A
Có ra hoa 40 75 63 178
Không ra hoa 15 12 12 39
Tổng 55 87 75 217

27
18:47

Tiêu chuẩn kiểm định :


 40 2 752 632 152 122 122 
K= + + + + + – 1  .217
 178 .55 178 .87 178 .75 39 .55 39 .87 39 .75 
≈ 4, 4556

Miền W ( α ) :
( χ2 ( α ) [ bậc tự do ] , + ∞ )
( χ2 ( α ) [ ( h – 1 ) ( k – 1 ) ] , + ∞ )
( χ2 ( α ) [ ( 2 – 1 ) ( 3 – 1 ) ] , + ∞ )
( χ2 ( 0,05 ) [ 2 ] , + ∞ )
( 5,9915 , + ∞ )

K không thuộc W ( α ) .
Chấp nhận H0 .

Việc bón các loại phân khác nhau không ảnh hưởng tới việc ra hoa của loài hoa đó .

28
18:47

29

You might also like