You are on page 1of 31

X ÁC SUẤT - THỐNG KÊ

CHƯƠNG 5: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

TS. Phan Thị Hường

Trường Đại học Bách Khoa TP HCM


Khoa Khoa học ứng dụng, bộ môn Toán ứng dụng
Email: huongphan@hcmut.edu.vn

TP. HCM — 2020.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 1 / 22
Các khái niệm cơ bản

NỘI DUNG

1 CÁC KHÁI NIỆM CƠ BẢN

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 2 / 22
Các khái niệm cơ bản

NỘI DUNG

1 CÁC KHÁI NIỆM CƠ BẢN

2 KIỂM ĐỊNH KỲ VỌNG VỚI PHƯƠNG SAI ĐÃ BIẾT

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 2 / 22
Các khái niệm cơ bản

NỘI DUNG

1 CÁC KHÁI NIỆM CƠ BẢN

2 KIỂM ĐỊNH KỲ VỌNG VỚI PHƯƠNG SAI ĐÃ BIẾT

3 KIỂM ĐỊNH KỲ VỌNG VỚI PHƯƠNG SAI CHƯA BIẾT

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 2 / 22
Các khái niệm cơ bản

NỘI DUNG

1 CÁC KHÁI NIỆM CƠ BẢN

2 KIỂM ĐỊNH KỲ VỌNG VỚI PHƯƠNG SAI ĐÃ BIẾT

3 KIỂM ĐỊNH KỲ VỌNG VỚI PHƯƠNG SAI CHƯA BIẾT

4 KIỂM ĐỊNH KỲ VỌNG CHO MỘT PHÂN PHỐI BẤT KỲ

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 2 / 22
Các khái niệm cơ bản

NỘI DUNG

1 CÁC KHÁI NIỆM CƠ BẢN

2 KIỂM ĐỊNH KỲ VỌNG VỚI PHƯƠNG SAI ĐÃ BIẾT

3 KIỂM ĐỊNH KỲ VỌNG VỚI PHƯƠNG SAI CHƯA BIẾT

4 KIỂM ĐỊNH KỲ VỌNG CHO MỘT PHÂN PHỐI BẤT KỲ

5 KIỂM ĐỊNH CHO TỶ LỆ

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 2 / 22
Các khái niệm cơ bản

BÀI TOÁN THỰC TẾ

Giả sử rằng một kỹ sư đang thiết kế hệ


thống thoát hiểm của phi hành đoàn bao
gồm một ghế phóng và một động cơ để
đẩy ghế phóng. Động cơ có chứa thuốc
phóng, và để hệ thống này hoạt động bình
thường thì thuốc phóng cần cháy với tốc
độ trung bình là 50 cm/giây. Nếu tốc độ
cháy của chất phóng quá chậm hoặc quá
nhanh đều có thể dẫn đến thương tích
cho phi công.
Vì vậy, câu hỏi kỹ thuật thực tế phải được trả lời là: Tốc độ cháy trung
bình của thuốc phóng có bằng 50 cm / giây hay không (cao hơn hoặc
thấp hơn)? Loại câu hỏi này có thể được trả lời bằng cách sử dụng lý
thuyết kiểm định giả thuyết thống kê.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 3 / 22
Các khái niệm cơ bản

CÁC GIẢ THUYẾT THỐNG KÊ (STATISTICAL


HYPOTHESES )

ĐỊNH NGHĨA 1.1


Một giả thuyết thống kê, hay còn gọi tắt là giả thuyết, là một phát biểu
hay khẳng định về một giá trị của một tham số, hay dạng của phân
phối của một quần thể.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 4 / 22
Các khái niệm cơ bản

CÁC GIẢ THUYẾT THỐNG KÊ (STATISTICAL


HYPOTHESES )

ĐỊNH NGHĨA 1.1


Một giả thuyết thống kê, hay còn gọi tắt là giả thuyết, là một phát biểu
hay khẳng định về một giá trị của một tham số, hay dạng của phân
phối của một quần thể.
Giả thuyết không (H0) (Null hypothesis) là một giả thuyết mà ban
đầu được giả định là đúng.
Đối thuyết (H1) (Alternative hypothesis) là giả thuyết ngược lại với
H0 .

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 4 / 22
Các khái niệm cơ bản

CÁC GIẢ THUYẾT THỐNG KÊ (STATISTICAL


HYPOTHESES )

VÍ DỤ 1.1
Trong bài toán về thiết kế hệ thống thoát hiểm của phi hành đoàn,
chúng ta quan tâm đến tốc độ trung bình đốt cháy của chất phóng, thì
có thể có những giả thuyết thống kê như sau:

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 5 / 22
Các khái niệm cơ bản

CÁC GIẢ THUYẾT THỐNG KÊ (STATISTICAL


HYPOTHESES )

VÍ DỤ 1.1
Trong bài toán về thiết kế hệ thống thoát hiểm của phi hành đoàn,
chúng ta quan tâm đến tốc độ trung bình đốt cháy của chất phóng, thì
có thể có những giả thuyết thống kê như sau:
(Giả thuyết hai chiều) H0: µ = 50 cm/giây và H1: µ 6= 50 cm/s.
(Giả thuyết một chiều) H0: µ = 50 cm/giây và H1: µ > 50 cm/s.
(Giả thuyết một chiều) H0: µ = 50 cm/giây và H1: µ < 50 cm/s.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 5 / 22
Các khái niệm cơ bản

CÁC GIẢ THUYẾT THỐNG KÊ (STATISTICAL


HYPOTHESES )

VÍ DỤ 1.2
Mặt khác, thời gian cháy của chất phóng là một đại lượng ngẫu nhiên
và chúng ta cũng có thể sẽ quan tâm đến phân phối của đại lượng này.
Giả sử chúng ta cần kiểm định thời gian cháy của chất phóng có tuân
theo phân phối chuẩn hay không. Để kiểm định điều này ta có các giả
thuyết thống kê sau:
H0: Thời gian cháy của chất phóng có phân phối chuẩn
H1: Thời gian cháy của chất phóng không có phân phối chuẩn.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 6 / 22
Các khái niệm cơ bản

CÁCH ĐẶT GIẢ THUYẾT THỐNG KÊ

ĐỊNH NGHĨA 1.2


Quá trình dẫn đến một quyết định về giả thuyết không (H0) được gọi
là một quy trình kiểm định giả thuyết thống kê.

1 Giả thuyết được đặt ra với ý đồ bác bỏ nó, nghĩa là giả thuyết đặt
ra ngược lại với điều ta muốn chứng minh, muốn thuyết phục.
2 Giả thuyết được đặt ra sao cho khi chấp nhận hay bác bỏ nó sẽ có
tác dụng trả lời bài toán thực tế đặt ra.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 7 / 22
Các khái niệm cơ bản

CÁCH ĐẶT GIẢ THUYẾT THỐNG KÊ

VÍ DỤ 1.3
Một nhóm nghiên cứu y tế được giao nhiệm vụ đánh giá một phương
pháp điều trị mới dùng laser cho một số lạo khối u. Gọi p là tỷ lệ thành
công của phương pháp điều trị mới này. Có hai kịch bản sau:
KỊCH BẢN 1: Phương pháp điều trị tiêu chuẩn hiện hành được cộng
đồng y tế đánh giá là hợp lý và an toàn, không có các tác
dụng phụ lớn, và có tỷ lệ thành công là 0.85.
H0: p = 0.85 vs H1: p > 0.85
KỊCH BẢN 2: Phương pháp điều trị tiêu chuẩn hiện hành đôi khi có
tác dụng phụ nghiêm trọng, rất tốn kém, có tỷ lệ thành
công là 0.3 (30%). H0: p = 0.3 vs H1: p < 0.3.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 8 / 22
Các khái niệm cơ bản

CÁC GIẢ THUYẾT THỐNG KÊ (STATISTICAL


HYPOTHESES )

ĐỊNH NGHĨA 1.3


Xét bài toán kiểm định giả thuyết có giả thuyết H0 và đối thuyết H1.
Một quy trình kiểm định bào gồm 3 bước:
1 Tính giá trị kiểm định thống kê dựa vào dữ liệu mẫu: Tức là H0
được giả sử là đúng, từ mẫu ngẫu nhiên X = (X 1 , X 2 , . . . , X n ) chọn
hàm Z = h(X 1 , . . . , X n ; θ0 ). Biến Z được gọi là tiêu chuẩn kiểm định
giả thuyết H0, và giá trị của nó z = h(x 1 , . . . , x n ; θ0 ) được gọi là giá
trị kiểm định thống kê.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 9 / 22
Các khái niệm cơ bản

CÁC GIẢ THUYẾT THỐNG KÊ (STATISTICAL


HYPOTHESES )

2 Xác định miền bác bỏ Wα , tức là tập tất cả cá giá trị kiểm định
thống kê mà dựa vào đó ta sẽ bác bỏ H0.
Nghĩa là với mức ý nghĩa α, thì

P (Z ∈ Wα ) = α.

Wαc được gọi là miền chấp nhận. Giá trị ngăn cách giữa miền bác
bỏ và miền không bác bỏ được gọi là điểm tới hạn.
3 Đưa ra kết luận: Nếu z ∈ Wα thì ta bác bỏ giả thuyết H0. Nếu
z ∉ Wα thì ta chưa đủ cơ sở để bác bỏ giả thuyết H0.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 10 / 22
Các khái niệm cơ bản

TRỊ SỐ P (P-VALUE)

ĐỊNH NGHĨA 1.4


Trị số p v là mức ý nghĩa α nhỏ nhất mà giả thuyết H 0 có thể bị bác bỏ.
Trị số p v còn được gọi là mức ý nghĩa quan quát được từ dữ liệu.

NGUYÊN TẮC KIỂM ĐỊNH VƠI TRỊ SỐ P


1 Nếu p v ≤ α thì bác bỏ H0 .
2 Nếu p v > α thì không thể bác bỏ H0.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 11 / 22
Các khái niệm cơ bản

P-VALUE

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 12 / 22
Các khái niệm cơ bản

P-VALUE
Bác bỏ giả thuyết H0 ⇔ p v < α.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 12 / 22
Các khái niệm cơ bản

P-VALUE
Bác bỏ giả thuyết H0 ⇔ p v < α.
α càng nhỏ ⇔ kết luận càng thuyết phục.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 12 / 22
Các khái niệm cơ bản

P-VALUE
Bác bỏ giả thuyết H0 ⇔ p v < α.
α càng nhỏ ⇔ kết luận càng thuyết phục.
P-value đánh giá Giá trị P cung cấp một thước đo về độ tin cậy
của giả thuyết H0.
p-value độ tin cậy
<0.01 chứng cứ rất mạnh để bác bỏ H0
0.01 - 0.05 chứng cứ mạnh để bác bỏ H0
0.05 - 0.1 chứng cứ rất yếu để bác bỏ H0
>0.1 không đủ chứng cứ để bác bỏ H0

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 12 / 22
Kiểm định kỳ vọng với phương sai đã biết

KIỂM ĐỊNH KỲ VỌNG VỚI PHƯƠNG SAI ĐÃ BIẾT


Các giả định:
Các quan sát X 1 , . . . , X n độc lập và có cùng phân phối chuẩn
N (µ, σ2 ).
Phương sai σ2 đã biết.

CÁC BƯỚC KIỂM ĐỊNH


x − µ0
1 Tính giá trị kiểm định thống kê: z 0 = p
σ/ n
2 Cho trước mức ý nghĩa α, xác định miền bác bỏ hoặc trị số p v
theo quy tắc:

Đối thuyết H1 Miền bác bỏ Trị số p v


µ 6= µ0 Wα = {z 0 : |z 0 | > z α/2 } 2 [1 − Φ(|z 0 |)]
µ > µ0 Wα = {z 0 : z 0 > z α } 1 − Φ(z 0 )
µ < µ0 Wα = {z 0 : z 0 < −z α } Φ(z 0 )

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 13 / 22
Kiểm định kỳ vọng với phương sai đã biết

KIỂM ĐỊNH KỲ VỌNG VỚI PHƯƠNG SAI ĐÃ BIẾT

3 Kết luận bác bỏ H0 nếu z 0 ∈ Wα hoặc p v < α.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 14 / 22
Kiểm định kỳ vọng với phương sai đã biết

KIỂM ĐỊNH KỲ VỌNG VỚI PHƯƠNG SAI ĐÃ BIẾT

VÍ DỤ 2.1
Trong bài toán về thiết kế hệ thống thoát hiểm của phi hành đoàn,
chúng ta nói rằng hệ thống là đạt tiêu chuẩn nếu tốc độ trung bình đốt
cháy của chất phóng là 50 cm/giây. Ta xem xét giả thuyết:
H0: µ = 50 cm/giây vs H1: µ 6= 50 cm/s.
Giả sử rằng chúng ta biết độ lệch chuẩn của tốc độ cháy của chất
phóng là 2 cm/giây. Người ta thực hiện 25 lần đo và ghi nhận trung
bình mẫu là 51.3 cm/giây. Thực hiện kiểm định với mức ý nghĩa
α = 0.05 để xác định xem liệu hệ thống này có đạt yêu câu chất lượng
hay không.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 15 / 22
Kiểm định kỳ vọng với phương sai chưa biết

KIỂM ĐỊNH KỲ VỌNG VỚI PHƯƠNG SAI CHƯA BIẾT


Các giả định:
Các quan sát X 1 , . . . , X n độc lập và có cùng phân phối chuẩn
N (µ, σ2 ).
Phương sai σ2 chưa biết, cỡ mẫu nhỏ
CÁC BƯỚC KIỂM ĐỊNH
x − µ0
1 Tính giá trị thống kê kiểm định: t 0 = p
s/ n
2 Xác định miền bác bỏ hoặc trị số p v theo quy tắc:

Đối thuyết H1 Miền bác bỏ Trị số p v


µ 6= µ0
© ª
Wα = t 0 : |t 0 | > t α/2,n−1 2P (T > |t 0 |)
µ > µ0
© ª
Wα = t 0 : t 0 > t α,n−1 P (T > t 0 )
µ < µ0
© ª
Wα = t 0 : t 0 < −t α,n−1 P (T < t 0 )

Với T ∼ t (n − 1) có phân phối student với n − 1 bậc tự do.


TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 16 / 22
Kiểm định kỳ vọng với phương sai chưa biết

KIỂM ĐỊNH KỲ VỌNG VỚI PHƯƠNG SAI CHƯA BIẾT

VÍ DỤ 3.1
Một công ty tuyên bố rằng pH trung bình của nước sông gần đó là 6.8.
Bạn chọn ngẫu nhiên 25 mẫu nước và đo độ pH của chngs. Dưới đây
là bảng kết quả
6.6 7.3 6.7 6.6 6.8 6.9 6.4 6. 6 7.1 6. 6 6. 8 7.0 6.5
7.0 6.4 6.1 6.7 6. 8 6.7 6.2 6. 7 6. 2 6. 8 6.1 6.6
Ta có thể bác bỏ tuyên bố của công ty với mức ý nghĩa α = 0.05 hay
không?

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 17 / 22
Kiểm định kỳ vọng cho một phân phối bất kỳ

KIỂM ĐỊNH KỲ VỌNG CHO MỘT PHÂN PHỐI BẤT KỲ

Các giả định:


Cỡ mẫu lớn.
Không biết phân phối của tổng thể, hoặc tổng thể có phân phối
chuẩn, phương sai chưa biết.

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 18 / 22
Kiểm định kỳ vọng cho một phân phối bất kỳ

KIỂM ĐỊNH KỲ VỌNG CHO MỘT PHÂN PHỐI BẤT KỲ


CÁC BƯỚC KIỂM ĐỊNH
1 Tính giá trị kiểm định thống kê:

x − µ0
z0 = p , nếu biết σ2
σ/ n

hoặc
x − µ0
z0 = p , nếu không biết σ2 .
s/ n
2 Xác định miền bác bỏ hoặc trị số p v theo quy tắc:

Đối thuyết H1 Miền bác bỏ Trị số p v


µ 6= µ0 Wα = {z 0 : |z 0 | > z α/2 } 2 [1 − Φ(|z 0 |)]
µ > µ0 Wα = {z 0 : z 0 > z α } 1 − Φ(z 0 )
µ < µ0 Wα = {z 0 : z 0 < −z α } Φ(z 0 )
TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 19 / 22
Kiểm định cho tỷ lệ

KIỂM ĐỊNH CHO TỶ LỆ

Gọi p là tỷ lệ của những phần tử thỏa một đặc tính A của tổng
thể, mà ta quan tâm.
Khảo sát n phần tử, đặt
(
1, nếu phần tử thứ i thỏa tính chất A ,
Yi =
0, nếu không,

Ta có Yi ∼ B (1, p), i = 1, . . . , n .
Đặt X = Y1 + . . . + Yn = ni=1 Yi thì X = tổng số phần tử thóa tính
P

chất A trong n phần tử khảo sát và X ∼ B (n, p).


Tỷ lệ mẫu được tính bởi
X
P̂ = .
n

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 20 / 22
Kiểm định cho tỷ lệ

KIỂM ĐỊNH CHO TỶ LỆ


Giả định: Cỡ mẫu đủ lớn.

CÁC BƯỚC KIỂM ĐỊNH


1 Tính giá trị kiểm định thống kê:

p̂ − p 0
z0 = r
p 0 (1 − p 0 )
n

2 Xác định miền bác bỏ hoặc trị số p v theo quy tắc:

Đối thuyết H1 Miền bác bỏ Trị số p v


p 6= p 0 Wα = {z 0 : |z 0 | > z α/2 } 2 [1 − Φ(|z 0 |)]
p > p0 Wα = {z 0 : z 0 > z 1α } 1 − Φ(z 0 )
p < p0 Wα = {z 0 : z 0 < −z α } Φ(z 0 )

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 21 / 22
Kiểm định cho tỷ lệ

KIỂM ĐỊNH CHO TỶ LỆ

VÍ DỤ 5.1
Năm 2013, ở Việt Nam có 5% dân số bị hen suyển. Một nghiên cứu
cũng trong năm đó trên 6701 trẻ em trong độ tuổi 13-14 ở Hà Nội cho
thấy có 260 em bị chẩn đoán hen suyển. Liệu ta có đủ cơ sở để kết luận
rằng tỷ lệ trẻ em trong độ tuổi 13-14 bị hen suyển ở Hà Nội ít hơn 5%
với mức ý nghĩa 0.01 không?

TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 22 / 22

You might also like