You are on page 1of 25

Outline

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
THUYẾT THUYẾT 1 Bài toán kiểm định giả thuyết thống kê
THỐNG KÊ THỐNG KÊ

Nguyễn Văn
Thìn KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn
Thìn 2 Kiểm định tham số
Bài toán Bài toán
Kiểm định hợp lý
Kiểm định Kiểm định
tham số Nguyễn Văn Thìn tham số 3 Kiểm định giả thuyết cho trường hợp một mẫu
Kiểm định hợp lý Kiểm định hợp lý

Một mẫu Một mẫu


BỘ MÔN THỐNG KÊ TOÁN HỌC 4 Kiểm định giả thuyết cho trường hợp hai mẫu độc lập
Hai mẫu độc Hai mẫu độc
lập KHOA TOÁN - TIN HỌC lập

Hai mẫu ĐẠI HỌC KHOA HỌC TỰ NHIÊN TP.HCM Hai mẫu 5 So sánh hai mẫu không độc lập
không độc lập không độc lập

Kiểm định Chi Kiểm định Chi


bình phương
Tháng 2 năm 2016 bình phương 6 Kiểm định Chi bình phương
(Goodness-of- (Goodness-of-
Fit-test) Fit-test) (Goodness-of-Fit-test)

Outline Bài toán kiểm định giả thuyết thống kê


Những nội dung chính

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
THUYẾT 1 Bài toán kiểm định giả thuyết thống kê THUYẾT
THỐNG KÊ THỐNG KÊ

Nguyễn Văn
Thìn 2 Kiểm định tham số
Nguyễn Văn
Thìn
Định nghĩa giả thuyết thống kê
Bài toán
Kiểm định hợp lý Bài toán
Giả thuyết không và đối thuyết
Kiểm định Kiểm định
tham số 3 Kiểm định giả thuyết cho trường hợp một mẫu tham số
Kiểm định hợp lý Kiểm định hợp lý
Cách đặt giả thuyết
Một mẫu Một mẫu
4 Kiểm định giả thuyết cho trường hợp hai mẫu độc lập
Hai mẫu độc Hai mẫu độc
lập lập Miền bác bỏ - Tiêu chuẩn kiểm định
Hai mẫu 5 So sánh hai mẫu không độc lập Hai mẫu
không độc lập không độc lập

Kiểm định Chi Kiểm định Chi


Sai lầm loại I và loại II
bình phương 6 Kiểm định Chi bình phương bình phương
(Goodness-of- (Goodness-of-
Fit-test) (Goodness-of-Fit-test) Fit-test)
p - giá trị
Định nghĩa

KIỂM ĐỊNH KIỂM ĐỊNH Định nghĩa 2


GIẢ GIẢ
THUYẾT THUYẾT
THỐNG KÊ THỐNG KÊ Phép kiểm định cho một giả thuyết thống kê là một quy
Nguyễn Văn
Thìn
Nguyễn Văn
Thìn
tắc sao cho ứng với mỗi bộ số liệu nhận được từ mẫu, ta
Định nghĩa 1 nhận được một quyết định chấp nhận hay bác bỏ giả
Bài toán Bài toán
thuyết khảo sát.
Kiểm định Giả thuyết thống kê là một phát biểu về phân phối của Kiểm định
tham số tham số Miền bác bỏ của một phép kiểm định là tập các bộ số liệu
một hoặc nhiều biến ngẫu nhiên.
Kiểm định hợp lý Kiểm định hợp lý
mẫu mà phép kiểm định bác bỏ giả thuyết thống kê.
Một mẫu Một giả thuyết thống kê, nếu đúng, xác định một hàm Một mẫu

Hai mẫu độc phân phối xác suất được gọi là giả thuyết đơn. Ngược lại, Hai mẫu độc
lập lập
nó được gọi là giả thuyết hợp. Nhận xét 3
Hai mẫu Hai mẫu
không độc lập không độc lập Một phép kiểm định sẽ xác định miền bác bỏ, và ngược lại,
Kiểm định Chi Kiểm định Chi một cách chọn miền bác bỏ cho ta xác định một phép
bình phương bình phương
(Goodness-of- (Goodness-of- kiểm định.
Fit-test) Fit-test)
Điều này có nghĩa là các từ “phép kiểm định” và “miền bác
bỏ” có thể thay thế nhau.

Định nghĩa Sai lầm loại I và loại II

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ Định nghĩa 4 GIẢ
THUYẾT THUYẾT
THỐNG KÊ
Trong bài toán kiểm định giả thuyết, giả thuyết cần được kiểm THỐNG KÊ
XX
Nguyễn Văn
Thìn
định gọi là Giả thuyết không (null hypothesis), ký hiệu là H0 . Nguyễn Văn
Thìn
XXX Thực tế
Mệnh đề đối lập với H0 gọi là đối thuyết (alternative
XXX H0 đúng H0 sai
Bài toán Bài toán
Quyết định XXX
X
hypothesis), ký hiệu là H1 . Không bác bỏ H0 Không có sai lầm Sai lầm loại II
Kiểm định Kiểm định
tham số tham số
Kiểm định hợp lý Kiểm định hợp lý
Bác bỏ H0 Sai lầm loại I Không có sai lầm
Một mẫu
Nhận xét 5 Một mẫu

Hai mẫu độc Hai mẫu độc


lập Không có một nguyên tắc chung nào cho việc chọn một lập

Hai mẫu giả thuyết thống kê làm giả thuyết không và một giả Hai mẫu
Với một phép kiểm định xác định bởi miền bác bỏ R ⊂ Rn cho
không độc lập
thuyết khác làm đối thuyết.
không độc lập bài toán kiểm định giả thuyết không H0 : θ ∈ Θ0 so với đối
Kiểm định Chi
bình phương Thông thường, người ta có khuynh hướng chấp nhận giả
Kiểm định Chi
bình phương
thuyết H1 : θ ∈ Θ1 , người ta tìm cách đánh giá các nguy cơ sai
(Goodness-of-
Fit-test) thuyết không trừ phi có bằng chứng thuyết phục chống lại
(Goodness-of-
Fit-test)
lầm.
nó.
Outline

KIỂM ĐỊNH Định nghĩa 6 KIỂM ĐỊNH


GIẢ GIẢ
THUYẾT
Với mỗi θ0 ∈ Θ, giá trị THUYẾT 1 Bài toán kiểm định giả thuyết thống kê
THỐNG KÊ THỐNG KÊ

Nguyễn Văn Nguyễn Văn


Thìn KR (θ0 ) = P((X1 , X2 , . . . , Xn ) ∈ R|θ = θ0 ) Thìn 2 Kiểm định tham số
Bài toán Bài toán
Kiểm định hợp lý
Kiểm định
được gọi là năng lực của phép kiểm định tại θ0 . Hàm số Kiểm định
tham số tham số 3 Kiểm định giả thuyết cho trường hợp một mẫu
Kiểm định hợp lý
KR : Θ → R Kiểm định hợp lý

Một mẫu Một mẫu


θ 7→ KR (θ) 4 Kiểm định giả thuyết cho trường hợp hai mẫu độc lập
Hai mẫu độc Hai mẫu độc
lập lập

Hai mẫu
được gọi là hàm năng lực của phép kiểm định cho bởi miền bác Hai mẫu 5 So sánh hai mẫu không độc lập
không độc lập không độc lập

Kiểm định Chi bỏ R. Giá trị α = sup KR (θ) Kiểm định Chi
bình phương
θ∈Θ0 bình phương 6 Kiểm định Chi bình phương
(Goodness-of- (Goodness-of-
Fit-test) Fit-test) (Goodness-of-Fit-test)
được gọi là mức ý nghĩa của phép kiểm định (hay là kích thước
miền bác bỏ tương ứng).

KIỂM ĐỊNH KIỂM ĐỊNH Định nghĩa 7


GIẢ GIẢ
Kiểm định tham số
THUYẾT
THỐNG KÊ
THUYẾT
THỐNG KÊ
Cho C là một tập con của không gian các dữ liệu mẫu. C được
Trong phần này, ta khảo sát mô hình tham số gọi là miền bác bỏ tối ưu kích thước α để kiểm định giả thuyết
Nguyễn Văn Nguyễn Văn
Thìn F = {f (x; θ) : θ ∈ Θ}, nghĩa là xét một tổng thể có hàm mật Thìn đơn H0 : θ = θ0 so với đối thuyết đơn H1 : θ = θ00 nếu
độ xác suất phụ thuộc vào tham số θ lấy giá trị trong miền
Bài toán Bài toán (a) P[(X1 , X2 , . . . , Xn ) ∈ C |H0 ] = α, và
tham số Θ ⊂ Rk .
Kiểm định
tham số
Kiểm định
tham số
(b) P[(X1 , X2 , . . . , Xn ) ∈ C |H1 ] ≥ P[(X1 , X2 , . . . , Xn ) ∈ A|H1 ],
Kiểm định hợp lý Kiểm định hợp lý với mọi tập con A của không gian các dữ liệu mẫu sao cho
Một mẫu Các phép kiểm định Một mẫu P[(X1 , X2 , . . . , Xn ) ∈ A|H0 ] = α.
Hai mẫu độc Hai mẫu độc
lập
Kiểm định tối ưu (mạnh nhất, best test) lập

Hai mẫu
Kiểm định tối ưu đều (mạnh đều nhất, uniformly most Hai mẫu Nhận xét 8
không độc lập không độc lập

Kiểm định Chi powerful test) Kiểm định Chi


bình phương bình phương Điều kiện (a) nói rằng kích thước của miền bác bỏ là α.
(Goodness-of- Kiểm định tỷ số hợp lý (Goodness-of-
Fit-test) Fit-test)
Điều kiện (b) nói rằng trong các miền bác bỏ có kích
Kiểm định hợp lý
thước α, ta chọn miền nào có năng lực của phép kiểm
định tại θ = θ00 là lớn nhất.
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ Định lí 9 (Neyman-Pearson) GIẢ
THUYẾT THUYẾT
THỐNG KÊ Xét mẫu ngẫu nhiên X1 , X2 , . . . , Xn lấy từ tổng thể có hàm THỐNG KÊ Nhận xét 10
Nguyễn Văn
Thìn
mật độ xác suất f (x; θ). Với θ0 và θ00 là hai tham số phân biệt Nguyễn Văn
Thìn
của θ và với số dương k cho trước; gọi C là một tập con của Ba điều kiện (a-c) không chỉ là điều kiện đủ mà còn là
Bài toán
không gian số liệu mẫu sao cho Bài toán điều kiện cần để C là miền bác bỏ tối ưu kích thước α.
Kiểm định Kiểm định
tham số L(x1 , x2 , . . . , xn ; θ0 ) tham số
Với mỗi k > 0, tập C tất cả các điểm (x1 , x2 , . . . , xn ) thỏa
Kiểm định hợp lý (a) ≤ k, với mọi điểm Kiểm định hợp lý

Một mẫu
L(x1 , x2 , . . . , xn ; θ00 ) Một mẫu L(x1 , x2 , . . . , xn ; θ0 )
(x1 , x2 , . . . , xn ) ∈ C , ≤ k,
Hai mẫu độc
lập L(x1 , x2 , . . . , xn ; θ0 )
Hai mẫu độc
lập
L(x1 , x2 , . . . , xn ; θ00 )
(b) > k, với mọi điểm
Hai mẫu L(x1 , x2 , . . . , xn ; θ00 ) Hai mẫu
không độc lập không độc lập đều là một miền bác bỏ tối ưu.
(x1 , x2 , . . . , xn ) ∈
/ C,
Kiểm định Chi Kiểm định Chi Giá trị k được xác định từ điều kiện (c).
bình phương (c) α = P[(X1 , X2 , . . . , Xn ) ∈ C |H0 ]. bình phương
(Goodness-of- (Goodness-of-
Fit-test)
Ta có C là một miền bác bỏ tối ưu kích thước α kiểm định giả Fit-test)

thuyết đơn H0 : θ = θ0 so với đối thuyết đơn H1 : θ = θ00 .

KIỂM ĐỊNH Nhận xét 11 KIỂM ĐỊNH


GIẢ GIẢ
THUYẾT Nếu H0 là giả thuyết đơn xác định hàm mật độ đồng thời trên THUYẾT
THỐNG KÊ mẫu ngẫu nhiên là g (x1 , x2 , . . . , xn ) và đối thuyết đơn H1 xác THỐNG KÊ

Nguyễn Văn định hàm mật độ đồng thời h(x1 , x2 , . . . , xn ), thì C là miền bác Nguyễn Văn
Định nghĩa 12
Thìn Thìn
bỏ tối ưu kích thước α của phép kiểm định H0 so với H1 khi,
Bài toán với k > 0, Bài toán Miền bác bỏ C được gọi là một miền bác bỏ tối ưu đều kích
Kiểm định g (x1 , x2 , . . . , xn ; θ0 ) Kiểm định thước α để kiểm định giả thuyết đơn H0 so với đối thuyết hợp
tham số (a’) ≤ k, với mọi điểm tham số
H1 nếu tập C là miền bác bỏ tối ưu kích thước α để kiểm định
Kiểm định hợp lý h(x1 , x2 , . . . , xn ; θ00 ) Kiểm định hợp lý

Một mẫu (x1 , x2 , . . . , xn ) ∈ C , Một mẫu H0 so với từng giả thuyết đơn lấy từ H1 . Một phép kiểm định
Hai mẫu độc g (x1 , x2 , . . . , xn ; θ0 ) Hai mẫu độc tương ứng với miền bác bỏ C như thế được gọi là một kiểm
lập (b’) > k, với mọi điểm lập
h(x1 , x2 , . . . , xn ; θ00 ) định tối ưu đều kích thước α để kiểm định giả thuyết đơn H0
Hai mẫu Hai mẫu
không độc lập
(x1 , x2 , . . . , xn ) ∈/ C, không độc lập so với giả thuyết đối phức hợp H1 .
Kiểm định Chi
(c’) α = P[(X1 , X2 , . . . , Xn ) ∈ C |H0 ]. Kiểm định Chi
bình phương bình phương
(Goodness-of- Giả thuyết đơn H0 và H1 không nhất thiết phải là các giả thuyết (Goodness-of-
Fit-test) Fit-test)
liên quan đến các tham số của phân phối cũng như không nhất
thiết các biến ngẫu nhiên X1 , X2 , . . . , Xn phải là độc lập từng
đôi.
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ
THUYẾT
Cho biết THUYẾT Hàm hợp lý (mật độ đồng thời của (X1 , X2 , . . . , Xn )),
THỐNG KÊ THỐNG KÊ

Nguyễn Văn Nguyễn Văn n


Thìn X1 , X2 , . . . , Xn là n biến ngẫu nhiên độc lập từng đôi, lần Thìn
Y
L(θ1 , θ2 , . . . , θm ) = fi (xi ; θ1 , θ2 , . . . , θm ),
Bài toán
lượt có hàm mật độ xác suất Bài toán i=1
Kiểm định
fi (xi ; θ1 , θ2 , . . . , θm ), i = 1, 2, . . . , n. Kiểm định
tham số
Kiểm định hợp lý
Ω = {(θ1 , θ2 , . . . , θm )} (không gian tham số) tham số
Kiểm định hợp lý
Giả sử L đạt giá trị lớn nhất trên ω và Ω và đặt
Một mẫu
ω ⊂ Ω. Một mẫu

Hai mẫu độc Hai mẫu độc L(ω) = max L(θ1 , . . . , θm ) và L(Ω) = max L(θ1 , . . . , θm ).
lập lập (θ1 ,...,θm )∈ω (θ1 ,...,θm )∈Ω
Hai mẫu Giả thuyết cần kiểm định Hai mẫu
không độc lập không độc lập
Tỷ số hợp lý,
Kiểm định Chi Kiểm định Chi
bình phương bình phương
(Goodness-of- H0 : (θ1 , θ2 , . . . , θm ) ∈ ω so với mọi H1 . (1) (Goodness-of- L(ω)
Fit-test) Fit-test) λ(x1 , x2 , . . . , xn ) = λ = .
L(Ω)

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
THUYẾT THUYẾT
THỐNG KÊ THỐNG KÊ

Nguyễn Văn Phép kiểm định tỷ số hợp lý Nguyễn Văn


Phép kiểm định hợp lý
Thìn Thìn

Bài toán
Giả thuyết H0 trong (1) bị bác bỏ nếu và chỉ nếu Bài toán Xét Y = u(X1 , X2 , . . . , Xn ) là một thống kê trên mẫu ngẫu
Kiểm định Kiểm định nhiên mà phân phối xác suất của nó được hoàn toàn xác định
tham số λ(x1 , x2 , . . . , xn ) = λ ≤ λ0 . tham số
khi giả thuyết không H0 đúng. Miền bác bỏ kích thước α của
Kiểm định hợp lý Kiểm định hợp lý

Một mẫu Một mẫu phép kiểm định hợp lý được xác định bởi phần bù của khoảng
Hai mẫu độc Giá trị λ0 < 1 được xác định từ mức ý nghĩa: Hai mẫu độc tin cậy R của thống kê Y , khi H0 đúng, ở độ tin cậy
lập lập
γ = 1 − α, trong đó khoảng tin cậy R được chọn một cách
Hai mẫu Hai mẫu
không độc lập α = P[λ(X1 , X2 , . . . , Xn ) ≤ λ0 |H0 ] không độc lập “hợp lý” tùy vào đối thuyết H1 .
Kiểm định Chi Kiểm định Chi
bình phương bình phương
(Goodness-of- (Goodness-of-
Fit-test) Fit-test)
p - giá trị (p - value)

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ Phép kiểm định dùng khoảng tin cậy R = (a, b), với GIẢ Định nghĩa 13
THUYẾT THUYẾT
THỐNG KÊ α THỐNG KÊ Tương ứng với một giá trị thống kê kiểm định tính trên một
Nguyễn Văn
P(Y ≤ a|H0 ) = P(Y ≥ b|H0 ) = , Nguyễn Văn mẫu các giá trị quan trắc xác định, p - giá trị là mức ý nghĩa
Thìn 2 Thìn
nhỏ nhất dùng để bác bỏ giả thuyết H0 .
Bài toán được gọi là phép kiểm định hai bên. Khi đó, ta bác bỏ H0 Bài toán

Kiểm định khi Y ≤ a hay khi Y ≥ b. Kiểm định Dựa vào đối thuyết H1 , các bước tính p-giá trị như sau:
tham số tham số
Kiểm định hợp lý Kiểm định hợp lý 1 Xác định thống kê kiểm định: TS. Tính giá trị thống kê
Phép kiểm định dùng khoảng tin cậy R = (−∞, C ) (hay
Một mẫu Một mẫu kiểm định dựa trên mẫu (x1 , . . . , xn ), giả sử bằng a.
R = (C , ∞)), với
Hai mẫu độc Hai mẫu độc 2 p-giá trị cho bởi
lập lập

Hai mẫu P(Y ≥ C |H0 ) = α (hay P(Y ≤ C |H0 ) = α) Hai mẫu 


không độc lập không độc lập
P(|TS| > |a||H0 ), kiểm định hai phía

Kiểm định Chi Kiểm định Chi
bình phương được gọi là phép kiểm định một bên. Khi đó, ta bác bỏ H0 bình phương
p = P(TS < a|H0 ), kiểm định một phía - bên trái
(Goodness-of- (Goodness-of-

Fit-test) khi YgleC (hay khi Y ≤ C ). Fit-test)

P(TS > a|H0 ), kiểm định một phía - bên phải
Y được gọi là thống kê kiểm định. (2)
Kết luận: Bác bỏ giả thuyết H0 nếu p-giá trị ≤ α.

Outline Kiểm định giả thuyết cho trường hợp một mẫu
Nội dung chính

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
THUYẾT 1 Bài toán kiểm định giả thuyết thống kê THUYẾT
THỐNG KÊ THỐNG KÊ

Nguyễn Văn Nguyễn Văn Kiểm định giả thuyết cho kỳ vọng
Thìn 2 Kiểm định tham số Thìn
Trường hợp biết phương sai,
Bài toán
Kiểm định hợp lý Bài toán

Kiểm định Kiểm định


tham số 3 Kiểm định giả thuyết cho trường hợp một mẫu tham số
Kiểm định hợp lý Kiểm định hợp lý
Trường hợp không biết phương sai, mẫu nhỏ,
Một mẫu Một mẫu
4 Kiểm định giả thuyết cho trường hợp hai mẫu độc lập
Hai mẫu độc Hai mẫu độc
lập lập

Hai mẫu 5 So sánh hai mẫu không độc lập Hai mẫu Trường hợp không biết phương sai, mẫu lớn.
không độc lập không độc lập

Kiểm định Chi Kiểm định Chi Kiểm định giả thuyết cho tỷ lệ
bình phương 6 Kiểm định Chi bình phương bình phương
(Goodness-of- (Goodness-of-
Fit-test) (Goodness-of-Fit-test) Fit-test)
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH biết σ 2 TH biết σ 2
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ
THUYẾT
• Các giả định: THUYẾT
THỐNG KÊ
Mẫu ngẫu nhiên X1 , . . . , Xn được chọn từ tổng thể có
THỐNG KÊ Các bước kiểm định
phân phối chuẩn N(µ, σ 2 ) với kỳ vọng µ chưa biết.
Nguyễn Văn Nguyễn Văn
Thìn Thìn

Bài toán Bài toán


1 Phát biểu giả thuyết không và đối thuyết
Kiểm định
Phương sai σ 2 đã biết. Kiểm định
tham số tham số
Kiểm định hợp lý Kiểm định hợp lý
2 Xác định mức ý nghĩa α
Một mẫu
Cho trước giá trị µ0 , cần so sánh kỳ vọng µ với µ0 . Một mẫu

Hai mẫu độc • Bài toán kiểm định có 3 trường hợp: Hai mẫu độc 3 Lấy mẫu ngẫu nhiên cỡ n: X1 , . . . , Xn và tính thống kê
lập lập

Hai mẫu
( ( ( Hai mẫu
kiểm định
không độc lập H0 : µ = µ0 H0 : µ = µ 0 H0 : µ = µ0 không độc lập X̄ − µ0
(a) (b) (c) Z0 = √ (3)
Kiểm định Chi
bình phương
H1 : µ 6= µ0 H1 : µ < µ0 H1 : µ > µ0 Kiểm định Chi
bình phương
σ/ n
(Goodness-of- (Goodness-of-
Fit-test) Fit-test) 4 Xác định miền bác bỏ Wα : bảng 1
với mức ý nghĩa α cho trước.

Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH biết σ 2 TH biết σ 2
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ • Sử dụng p-giá trị (p - value): tính p-giá trị dựa theo đối
THUYẾT THUYẾT thuyết và kết luận bác bỏ H0 khi p -giá trị ≤ α, với mức ý
THỐNG KÊ Giả thuyết Miền bác bỏ THỐNG KÊ
nghĩa α cho trước. Công thức tính p - giá trị theo các trường
Nguyễn Văn
H0 : µ = µ0 n o Nguyễn Văn
Thìn Wα = z0 : |z0 | > z1−α/2 Thìn hợp xem ở bảng 2.
H1 : µ 6= µ0
Bài toán Bài toán
H0 : µ = µ0 n o
Giả thuyết p - giá trị
Kiểm định Wα = z0 : z0 < −z1−α Kiểm định
tham số H1 : µ < µ0 tham số
H0 : µ = µ0
Kiểm định hợp lý
H0 : µ = µ0 n o Kiểm định hợp lý
p = 2 [1 − Φ(|z0 |)]
Một mẫu Wα = z0 : z0 > z1−α Một mẫu H1 : µ 6= µ0
Hai mẫu độc
H1 : µ > µ0 Hai mẫu độc H0 : µ = µ0
lập lập p = Φ(z0 )
Bảng 1: Miền bác bỏ với đối thuyết tương ứng H1 : µ < µ0
Hai mẫu Hai mẫu
không độc lập không độc lập H0 : µ = µ0
p = 1 − Φ(z0 )
Kiểm định Chi Kiểm định Chi H1 : µ > µ0
bình phương bình phương
(Goodness-of- (Goodness-of-
Fit-test) 5. Kết luận: Bác bỏ H0 / Chưa đủ cơ sở để bác bỏ H0 . Fit-test) Bảng 2: p-giá trị với đối thuyết tương ứng
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH biết σ 2 TH biết σ 2
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ Gọi X là trọng lượng của một tuýt kem đánh răng, giả sử
THUYẾT THUYẾT
X ∼ N(µ, 0.22 ). Các bước kiểm định như sau:
THỐNG KÊ Ví dụ 14 (Kiểm định 2 phía) THỐNG KÊ

Nguyễn Văn Nguyễn Văn 1 Phát biểu giả thuyết:


Thìn Dây chuyền sản xuất kem đánh răng P/S được thiết kế để Thìn
(
Bài toán đóng hộp những tuýt kem có trọng lượng trung bình là 6 oz (1 Bài toán H0 : µ = 6
oz = 28g). Một mẫu gồm 30 tuýt kem được chọn ngẫu nhiên
Kiểm định
tham số
Kiểm định
tham số
H1 : µ 6= 6
Kiểm định hợp lý
để kiểm tra định kỳ. Bộ phận điều khiển dây chuyền phải đảm Kiểm định hợp lý

Một mẫu bảo để trọng lượng trung bình mỗi tuýt kem là 6 oz; nếu nhiều Một mẫu
2 Xác định mức ý nghĩa: α = 0.03
Hai mẫu độc hơn hoặc ít hơn, dây chuyền phải được điều chỉnh lại. Hai mẫu độc
lập lập
Giả sử trung bình mẫu của 30 tuýt kem là 6.1 oz và độ lệch 3 Tính giá trị thống kê kiểm định
Hai mẫu Hai mẫu
không độc lập tiêu chuẩn của tổng thể σ = 0.2 oz. không độc lập
x̄ − µ0 6.1 − 6.0
Kiểm định Chi Thực hiện kiểm định giả thuyết với mức ý nghĩa 3% để xác Kiểm định Chi z0 = √ = √ = 2.74
bình phương bình phương σ/ n 0.2/ 30
(Goodness-of- định xem dây chuyền sản xuất có vận hành tốt hay không? (Goodness-of-
Fit-test) Fit-test)

4 Xác định miền bác bỏ: Bác bỏ H0 khi |z0 | > z1−α/2

Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH biết σ 2 TH biết σ 2
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ α = 3% nên z1−α/2 = z0.985 = 2.17. Vậy bác bỏ H0 nếu GIẢ
THUYẾT THUYẾT
THỐNG KÊ THỐNG KÊ Ví dụ 15 (Kiểm định một phía)
Nguyễn Văn
z0 < −2.17 hoặc z0 > 2.17 Nguyễn Văn
Thìn Thìn Metro EMS: Một bệnh viện tại trung tâm thành phố cung cấp
Bài toán
5. Kết luận: do z0 = 2.74 > 2.17 nên bác bỏ H0 . Ta kết luận Bài toán dịch vụ cấp cứu tại nhà. Với khoảng 20 xe cấp cứu, mục tiêu
Kiểm định với 97% độ tin cậy rằng trọng lượng trung bình mỗi tuýt Kiểm định của trung tâm là cung cấp dịch vụ cấp cứu trong khoảng thời
tham số tham số
Kiểm định hợp lý
kem không bằng 6. Kiểm định hợp lý
gian trung bình là 12 phút sau khi nhận được điện thoại yêu
Một mẫu
• Sử dụng p - giá trị: Một mẫu cầu. Một mẫu ngẫu nhiên gồm thời gian đáp ứng khi có yêu
Hai mẫu độc Hai mẫu độc cầu của 40 ca cấp cứu được chọn. Trung bình mẫu là 13.25
lập 4a. Tính p-giá trị, bài toán kiểm định hai phía lập
phút. Biết rằng độ lệch tiêu chuẩn của tổng thể là σ = 3.2
Hai mẫu Hai mẫu
không độc lập
p = 2[1−Φ(|z0 |)] = 2[1−Φ(2.74)] = 2[1−0.9969] = 0.0062 không độc lập phút. Giám đốc EMS muốn thực hiện một kiểm định, với mức
Kiểm định Chi Kiểm định Chi ý nghĩa 5%, để xác định xem liệu thời gian một ca cấp cứu có
bình phương bình phương
(Goodness-of- 5a. Kết luận: với α = 0.03, ta có p = 0.0062 < 0.03 nên bác (Goodness-of- bé hơn hoặc bằng 12 phút hay không?
Fit-test) Fit-test)
bỏ H0 . Ta kết luận với 97% độ tin cậy rằng trọng lượng
trung bình mỗi tuýt kem không bằng 6.
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH biết σ 2 TH biết σ 2
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ 4. Xác định miền bác bỏ: bác bỏ H0 nếu
Các bước kiểm định:
THUYẾT
THỐNG KÊ
THUYẾT
THỐNG KÊ
z0 > z1−α = z0.95 = 1.645
1. Phát biểu giả thuyết 5. Kết luận: z0 = 2.47 > 1.645 nên bác bỏ H0 . Ta kết luận
Nguyễn Văn Nguyễn Văn
Thìn H0 : µ = 12: Thời gian đáp ứng của dịch vụ cấp cứu đạt Thìn rằng với 95% độ tin cậy, Mertro EMS không đáp ứng được
yêu cầu, không cần phải thay đổi. mục tiêu thời gian phục vụ khách hàng từ 12 phút trở
Bài toán Bài toán

Kiểm định H1 : µ > 12: Thời gian đáp ứng của dịch vụ không đạt yêu Kiểm định xuống.
tham số tham số
cầu, cần thay đổi.
Kiểm định hợp lý Kiểm định hợp lý
• Sử dụng p - giá trị:
Một mẫu Một mẫu

Hai mẫu độc


2. Xác định mức ý nghĩa: α = 0.05 Hai mẫu độc
4a. Tính p-giá trị, bài toán kiểm định một phía - bên phải
lập lập

Hai mẫu 3. Tính giá trị thống kê kiểm định Hai mẫu p = 1 − Φ(z0 ) = 1 − Φ(2.47) = 1 − 0.9932 = 0.0068
không độc lập không độc lập

Kiểm định Chi


x̄ − 12 13.25 − 12 Kiểm định Chi
5a. Kết luận: với α = 0.05, ta có p = 0.0068 < 0.05 nên bác
bình phương
(Goodness-of- z0 = √ = √ = 2.47 bình phương
(Goodness-of-
Fit-test) σ/ n 3.2/ 40 Fit-test) bỏ H0 . Ta kết luận với 95% độ tin cậy rằng Metro EMS
không đáp ứng được mục tiêu thời gian phục vụ khách
hàng từ 12 phút trở xuống.

Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH không biết σ 2 , mẫu nhỏ TH không biết σ 2 , mẫu nhỏ
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ • Các giả định: GIẢ
THUYẾT THUYẾT Các bước kiểm định
THỐNG KÊ Mẫu ngẫu nhiên X1 , . . . , Xn được chọn từ tổng thể có THỐNG KÊ

Nguyễn Văn
Thìn
phân phối chuẩn N(µ, σ 2 ) với kỳ vọng µ và phương sai σ 2 Nguyễn Văn
Thìn
không biết. 1 Phát biểu giả thuyết không và đối thuyết
Bài toán Bài toán

Kiểm định Kiểm định


2 Xác định mức ý nghĩa α
tham số
Sử dụng ước lượng S thay cho σ. tham số
Kiểm định hợp lý Kiểm định hợp lý
3 Lấy mẫu ngẫu nhiên cỡ n: X1 , . . . , Xn và tính thống kê
Một mẫu Cỡ mẫu nhỏ: n ≤ 30. Một mẫu
kiểm định
Hai mẫu độc
• Bài toán kiểm định có 3 trường hợp: Hai mẫu độc
X̄ − µ0
lập lập
T0 = √ (4)
Hai mẫu ( ( ( Hai mẫu S/ n
không độc lập không độc lập
H0 : µ = µ0 H0 : µ = µ 0 H0 : µ = µ0
Kiểm định Chi (a) (b) (c) Kiểm định Chi Biến ngẫu nhiên T0 có phân phối Student với n − 1 bậc tự
bình phương H1 : µ 6= µ0 H1 : µ < µ0 H1 : µ > µ0 bình phương
do.
(Goodness-of- (Goodness-of-
Fit-test) Fit-test)

với mức ý nghĩa α cho trước. 4 Xác định miền bác bỏ Wα : bảng 3
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH không biết σ 2 , mẫu nhỏ TH không biết σ 2 , mẫu nhỏ
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ
• Sử dụng p-giá trị (p - value): tính p-giá trị dựa theo đối
THUYẾT THUYẾT thuyết và kết luận bác bỏ H0 khi p -giá trị ≤ α, với mức ý
THỐNG KÊ Giả thuyết Miền bác bỏ THỐNG KÊ
nghĩa α cho trước. Công thức tính p - giá trị theo các trường
Nguyễn Văn H0 : µ = µ0 n
n−1
o Nguyễn Văn
Thìn Wα = t0 : |t0 | > t1−α/2 Thìn hợp xem ở bảng 4.
H1 : µ 6= µ0
Bài toán Bài toán
H0 : µ = µ0 n
n−1
o
Giả thuyết p - giá trị
Kiểm định Wα = t0 : t0 < −t1−α Kiểm định
tham số H1 : µ < µ0 tham số
H0 : µ = µ0
Kiểm định hợp lý
H0 : µ = µ0 n o Kiểm định hợp lý
p = 2P(Tn−1 ≥ |t0 |)
Một mẫu
n−1
Wα = t0 : t0 > t1−α Một mẫu H1 : µ 6= µ0
Hai mẫu độc
H1 : µ > µ0 Hai mẫu độc H0 : µ = µ0
lập lập p = P(Tn−1 ≤ t0
Bảng 3: Miền bác bỏ với đối thuyết tương ứng (trường hợp mẫu nhỏ) H1 : µ < µ0
Hai mẫu Hai mẫu
không độc lập không độc lập H0 : µ = µ0
p = P(Tn−1 ≥ t0 )
Kiểm định Chi Kiểm định Chi H1 : µ > µ0
bình phương bình phương
(Goodness-of- (Goodness-of-
Fit-test) 5. Kết luận: Bác bỏ H0 / Chưa đủ cơ sở để bác bỏ H0 . Fit-test) Bảng 4: p-giá trị với đối thuyết tương ứng (trường hợp mẫu nhỏ)

Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH không biết σ 2 , mẫu lớn TH không biết σ 2
KIỂM ĐỊNH • Các giả định: KIỂM ĐỊNH
GIẢ GIẢ Ví dụ 16
THUYẾT Mẫu ngẫu nhiên X1 , . . . , Xn được chọn từ tổng thể có kỳ THUYẾT
THỐNG KÊ
vọng µ và phương sai σ 2 không biết.
THỐNG KÊ
Trạm cảnh sát giao thông trên đường cao tốc sẽ thực hiện việc
Nguyễn Văn Nguyễn Văn
Thìn Thìn
bắn tốc độ định kỳ tại các địa điểm khác nhau để kiểm tra tốc
Sử dụng ước lượng không chệch S thay cho σ.
độ của các phương tiện giao thông. Một mẫu về tốc độ của các
Bài toán
Cỡ mẫu lớn: n > 30. Bài toán
loại xe được chọn để thực hiện kiểm định giả thuyết sau
Kiểm định Kiểm định
tham số • Khi cỡ mẫu lớn biến ngẫu nhiên tham số (
Kiểm định hợp lý Kiểm định hợp lý
H0 : µ = 65
Một mẫu
X̄ − µ0 Một mẫu
H1 : µ > 65
Hai mẫu độc Z0 = √ (5) Hai mẫu độc
lập S/ n lập

Hai mẫu Hai mẫu


Những vị trí mà bác bỏ H0 là những vị trí tốt nhất được chọn
không độc lập
sẽ hội tụ về phân phối chuẩn hóa Z ∼ N(0, 1). Khi đó miền không độc lập

Kiểm định Chi Kiểm định Chi để đặt radar kiểm soát tốc độ.
bình phương bác bỏ Wα hoặc p-giá trị sẽ được tính tương tự như trường bình phương
Tại địa điểm F, một mẫu gồm tốc độ của 64 phương tiện được
(Goodness-of-
X̄ − µ0 (Goodness-of-
Fit-test)
hợp biết phương sai, chỉ thay thế √ bằng Z0 ở phương Fit-test)
bắn tốc độ ngẫu nhiên có trung bình là 66.2 mph và độ lệch
σ/ n
tiêu chuẩn 4.2 mph. Sử dụng α = 5% để kiểm định giả thuyết.
trình (5).
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH không biết σ 2 TH không biết σ 2
KIỂM ĐỊNH
GIẢ
• Các bước kiểm định: KIỂM ĐỊNH
GIẢ
THUYẾT
THỐNG KÊ
1 Phát biểu giả thuyết: THUYẾT
THỐNG KÊ
5. Kết luận: z0 = 2.286 > 1.645 nên bác bỏ H0 , ta kết luận
Nguyễn Văn
( Nguyễn Văn
với 95% độ tin cậy rằng tốc độ trung bình tại địa điểm F
Thìn H0 : µ = 65 Thìn lớn hơn 65 mph. Địa điểm F là địa điểm tốt để đặt radar
Bài toán H1 : µ > 65 Bài toán kiểm soát tốc độ.
Kiểm định Kiểm định
tham số tham số • Sử dụng p-giá trị:
Kiểm định hợp lý 2 Xác định mức ý nghĩa: α = 0.05 Kiểm định hợp lý
4a. Tính p-giá trị:
Một mẫu
3 Tính giá trị thống kê kiểm định khi σ 2 không biết và cỡ Một mẫu
Với z0 = 2.286, p = 1 − Φ(z0 ) = 1 − Φ(2.286) = 0.0111
Hai mẫu độc Hai mẫu độc
lập mẫu n = 64 (lớn) lập

Hai mẫu Hai mẫu


không độc lập x̄ − µ0 66.2 − 65 không độc lập 5a. Kết luận: p = 0.0111 < 0.05 nên bác bỏ H0 , ta kết luận
z0 = √ = √ = 2.286 với 95% độ tin cậy rằng tốc độ trung bình tại địa điểm F
Kiểm định Chi
bình phương
s/ n 4.2/ 64 Kiểm định Chi
bình phương
(Goodness-of- (Goodness-of- lớn hơn 65 mph. Địa điểm F là địa điểm tốt để đặt radar
Fit-test) Fit-test)
4 Xác định miền bác bỏ: Bác bỏ H0 khi kiểm soát tốc độ.
z0 > z1−α = z0.95 = 1.645

Kiểm định giả thuyết cho tỷ lệ Kiểm định giả thuyết cho tỷ lệ

KIỂM ĐỊNH KIỂM ĐỊNH • Quan sát sự xuất hiện của biến cố "phần tử mang đặc tính
GIẢ • Bài toán: GIẢ
THUYẾT THUYẾT A" trong n phép thử độc lập. Gọi Y là số lần xuất hiện biến cố
THỐNG KÊ THỐNG KÊ
Cho tổng thể X , trong đó tỷ lệ phần tử mang đặc tính A nào trên thì Y ∼ B(n, p). Và
Nguyễn Văn Nguyễn Văn
Thìn đó là trong tổng thể là p (p chưa biết). Từ mẫu ngẫu nhiên Thìn
(X1 , X2 , ..., Xn ) hãy kiểm định Y
Bài toán Bài toán
P̂ =
n
Kiểm định Kiểm định
tham số tham số
là một ước lượng không chệch cho p.
( ( (
Kiểm định hợp lý
H0 : p = p0 H0 : p = p 0 H0 : p = p0 Kiểm định hợp lý

Một mẫu (a) (b) (c) Một mẫu


H1 : p 6= p0 H1 : p < p 0 H1 : p > p0 • Nếu H0 đúng, thống kê
Hai mẫu độc Hai mẫu độc
lập lập

Hai mẫu với mức ý nghĩa α. Hai mẫu P̂ − p0


không độc lập không độc lập Z0 = r
p0 (1 − p0 )
Kiểm định Chi • Giả định: Kiểm định Chi
bình phương
(Goodness-of-
bình phương
(Goodness-of-
n
Fit-test) Cỡ mẫu n lớn; để phân phối chuẩn xấp xỉ phân phối nhị Fit-test)
thức tốt cần có np0 ≥ 5 và n(1 − p0 ) ≥ 5. có phân phối chuẩn hóa N(0, 1). Chọn Z0 làm tiêu chuẩn kiểm
định.
Kiểm định giả thuyết cho tỷ lệ Kiểm định giả thuyết cho tỷ lệ

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
THUYẾT THUYẾT
THỐNG KÊ Các bước kiểm định THỐNG KÊ Giả thuyết Miền bác bỏ
Nguyễn Văn Nguyễn Văn H0 : p = p 0 n o
Thìn Thìn Wα = z0 : |z0 | > z1−α/2
1 Phát biểu giả thuyết và đối thuyết H1 : p 6= p0
Bài toán Bài toán H0 : p = p 0 n o
Wα = z0 : z0 < −z1−α
Kiểm định
tham số
2 Xác định mức ý nghĩa α Kiểm định
tham số
H1 : p < p 0
Kiểm định hợp lý Kiểm định hợp lý H0 : p = p 0 n o
Tính giá trị thống kê kiểm định Wα = z0 : z0 > z1−α
Một mẫu 3 Một mẫu H1 : p > p 0
Hai mẫu độc Hai mẫu độc
lập lập
P̂ − p0 Bảng 5: Miền bác bỏ cho bài toán kiểm định tỷ lệ
Hai mẫu Z0 = r Hai mẫu
không độc lập p0 (1 − p0 ) không độc lập

Kiểm định Chi Kiểm định Chi


bình phương n bình phương
(Goodness-of- (Goodness-of- 5. Kết luận: Bác bỏ H0 / Chưa đủ cơ sở để bác bỏ H0 .
Fit-test) Fit-test)
4 Xác định miền bác bỏ: bảng 5 Sử dụng p-giá trị: p-giá trị tính tương tự như bảng 2.

Kiểm định giả thuyết cho tỷ lệ Kiểm định giả thuyết cho tỷ lệ

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ Ví dụ 17 GIẢ
THUYẾT THUYẾT 3. Tính giá trị thống kê kiểm định
THỐNG KÊ Trong kỳ nghỉ giáng sinh và đầu năm mới, Cục An toàn giao thông THỐNG KÊ
đã thống kê được rằng có 500 người chết và 25000 người bị thương r r
Nguyễn Văn Nguyễn Văn p0 (1 − p0 ) 0.5(1 − 0.5
Thìn do các vụ tại nạn giao thông trên toàn quốc. Theo thông cáo của Thìn σp̂ = = = 0.045644
Cục ATGT thì khoảng 50% số vụ tai nạn có liên quan đến rượu bia. n 120
Bài toán Bài toán
Khảo sát ngẫu nhiên 120 vụ tai nạn thấy có 67 vụ do ảnh hưởng của p̂ − p0 (67/120) − 0.5
Kiểm định Kiểm định z0 = = = 1.28
tham số rượu bia. Sử dụng số liệu trên để kiểm định lời khẳng định của Cục tham số σp̂ 0.045644
Kiểm định hợp lý Kiểm định hợp lý
An toàn giao thông với mức ý nghĩa α = 5%.
Một mẫu Một mẫu
4. Xác định miền bác bỏ: bác bỏ H0 khi |z0 | > z0.975 = 1.96
Hai mẫu độc
lập
Các bước kiểm định: Hai mẫu độc
lập hoặc tính p-giá trị
Hai mẫu 1 Phát biểu giả thuyết: Hai mẫu
không độc lập không độc lập
( p = [(1−Φ(z0 )] = 2[1−Φ(1.28)] = 2(1−0.8977) = 0.2006
Kiểm định Chi Kiểm định Chi
bình phương H0 : p = 0.5 bình phương
(Goodness-of-
Fit-test) H1 : p 6= 0.5
(Goodness-of-
Fit-test)
5. Kết luận: do z0 = 1.28 < 1.96 (hoặc p = 0.2006 > 0.05)
nên kết luận chưa đủ cơ sở để bác bỏ giả thuyết H0 .
2 Xác định mức ý nghĩa: α = 0.05
Kiểm định giả thuyết cho trường hợp hai mẫu độc
Outline lập
Nội dung chính

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
THUYẾT 1 Bài toán kiểm định giả thuyết thống kê THUYẾT
So sánh hai kỳ vọng
THỐNG KÊ THỐNG KÊ

Nguyễn Văn Nguyễn Văn


Trường hợp biết phương sai
Thìn 2 Kiểm định tham số Thìn

Bài toán
Kiểm định hợp lý Bài toán Trường hợp không biết phương sai, mẫu lớn
Kiểm định Kiểm định
tham số 3 Kiểm định giả thuyết cho trường hợp một mẫu tham số
Kiểm định hợp lý Kiểm định hợp lý Trường hợp không biết phương sai, mẫu nhỏ
Một mẫu Một mẫu So sánh hai phương sai
4 Kiểm định giả thuyết cho trường hợp hai mẫu độc lập
Hai mẫu độc Hai mẫu độc
lập lập

Hai mẫu 5 So sánh hai mẫu không độc lập Hai mẫu Trường hợp σ12 = σ22 = σ 2
không độc lập không độc lập

Kiểm định Chi Kiểm định Chi


bình phương 6 Kiểm định Chi bình phương bình phương Trường hợp σ12 6= σ22
(Goodness-of- (Goodness-of-
Fit-test) (Goodness-of-Fit-test) Fit-test) So sánh hai tỉ lệ

So sánh hai kỳ vọng, trường hợp biết phương sai So sánh hai kỳ vọng, trường hợp biết phương sai

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ • Các giả định: GIẢ
THUYẾT
X1 , X2 , . . . , Xn là mẫu ngẫu nhiên được chọn từ tổng thể 1
THUYẾT Các bước kiểm định
THỐNG KÊ THỐNG KÊ

Nguyễn Văn có phân phối chuẩn với kỳ vọng µ1 và phương sai σ12 . Nguyễn Văn
Thìn Thìn
1 Phát biểu giả thuyết H0 và đối thuyết H1
Y1 , Y2 , . . . , Ym là mẫu ngẫu nhiên được chọn từ tổng thể
Bài toán Bài toán

Kiểm định
2 có phân phối chuẩn với kỳ vọng µ2 và phương sai σ22 . Kiểm định
2 Xác định mức ý nghĩa α
tham số tham số
Kiểm định hợp lý Tổng thể 1 và 2 (đại diện bởi X và Y ) độc lập với nhau. Kiểm định hợp lý 3 Tính thống kê kiểm định
Một mẫu Một mẫu

Hai mẫu độc


Các phương sai σ12 và σ22 đã biết. Hai mẫu độc X̄ − Ȳ − (µ1 − µ2 )
lập lập Z0 = (6)
• Bài toán kiểm định giả thuyết trên hai mẫu độc lập gồm các
r
Hai mẫu Hai mẫu
σ12 σ22
không độc lập dạng sau: không độc lập +
( ( ( n m
Kiểm định Chi Kiểm định Chi
bình phương H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 bình phương
(Goodness-of- (a)
H1 : µ1 − µ2 6= D0
(b)
H1 : µ1 − µ2 < D0
(c)
H1 : µ1 − µ2 > D0 (Goodness-of- thống kê Z0 ∼ N(0, 1).
Fit-test) Fit-test)

4 Xác định miền bác bỏ


với mức ý nghĩa α cho trước.
So sánh hai kỳ vọng, trường hợp biết phương sai So sánh hai kỳ vọng

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
Ví dụ 18
THUYẾT THUYẾT
THỐNG KÊ THỐNG KÊ Một công ty sản xuất sơn nghiên cứu về 1 loại phụ gia làm
Nguyễn Văn Miền bác bỏ và p-giá trị tương ứng Nguyễn Văn giảm thời gian khô của sơn. Thực hiện thí nghiệm trên 2 mẫu:
Thìn Thìn
mẫu thứ nhất gồm 10 mẫu vật được sơn bằng loại sơn bình
Đối thuyết Miền bác bỏ p - giá trị
Bài toán Bài toán thường; mẫu thứ hai gồm 10 mẫu vật được sơn với sơn có chất
Kiểm định H1 : µ 1 − µ 2 =
6 D0 |z0 | > z1−α/2 p = 2[1 − Φ(|z0 |)] Kiểm định phụ gia mới. Trong những nghiên cứu trước, biết rằng độ lệch
tham số tham số
Kiểm định hợp lý H1 : µ 1 − µ 2 < D 0 z0 < −z1−α p = Φ(z0 ) Kiểm định hợp lý tiêu chuẩn của thời gian khô sau khi quét sơn là 8 phút và
Một mẫu H1 : µ 1 − µ 2 > D 0 z0 > z1−α p = 1 − Φ(z0 ) Một mẫu không thay đổi khi thêm phụ gia vào. Trung bình của mẫu 1 và
Hai mẫu độc
lập 5. Kết luận: Nếu bác bỏ H0 , ta kết luận H1 đúng với
Hai mẫu độc
lập
2 lần lượt là x̄ = 121 phút và ȳ = 112 phút. Với mức ý nghĩa
Hai mẫu (1 − α)100% độ tin cậy. Ngược lại ta kết luận chưa đủ cơ Hai mẫu
5%, hãy cho kết luận về loại sơn với chất phụ gia mới.
không độc lập không độc lập
sở để bác bỏ H0 với α cho trước.
Kiểm định Chi Kiểm định Chi 1 Phát biểu giả thuyết và đối thuyết
bình phương bình phương (
(Goodness-of- (Goodness-of-
Fit-test) Fit-test) H0 : µ1 − µ2 = 0 chất phụ gia mới không có hiệu quả
H1 : µ1 > µ2 chất phụ gia mới có hiệu quả
2 Mức ý nghĩa: α = 0.05

So sánh hai kỳ vọng, trường hợp không biết


So sánh hai kỳ vọng
phương sai, mẫu lớn
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ 3. Tính giá trị thống kê kiểm định, với x̄ = 121, ȳ = 112 và GIẢ
THUYẾT THUYẾT
THỐNG KÊ
σ1 = σ2 = 8 ta có THỐNG KÊ

Nguyễn Văn
x̄ − ȳ − 0 121 − 112 Nguyễn Văn • Các giả định:
Thìn Thìn
z0 = r =r = 2.52
2
σ1 σ22 82 82 X1 , X2 , . . . , Xn là mẫu ngẫu nhiên được chọn từ tổng thể 1
Bài toán Bài toán
+ + có kỳ vọng µ1 và phương sai σ12 không biết.
Kiểm định n m 10 10 Kiểm định
tham số tham số
Kiểm định hợp lý Kiểm định hợp lý

Một mẫu
4. Xác định miền bác bỏ: bác bỏ H0 khi Một mẫu Y1 , Y2 , . . . , Ym là mẫu ngẫu nhiên được chọn từ tổng thể
Hai mẫu độc
z0 > z1−α = z0.95 = 1.65. Hai mẫu độc 2 có kỳ vọng µ2 và phương sai σ22 không biết.
lập lập
5. Kết luận: Ta có z0 = 2.52 > 165 nên bác bỏ H0 . Ta kết
Hai mẫu Hai mẫu
không độc lập luận rằng với 95% độ tin cậy, chất phụ gia có hiệu quả không độc lập
Tổng thể 1 và 2 (đại diện bởi X và Y ) độc lập với nhau.
Kiểm định Chi làm giảm thời gian khô sau khi sơn. Kiểm định Chi
bình phương bình phương
(Goodness-of- 5a. Sử dụng p - giá trị: ta có (Goodness-of-
Fit-test) Fit-test) Cỡ mẫu lớn: n > 30 và m > 30.
p = 1 − Φ(z0 ) = 1 − Φ(2.52) = 0.0059 < 0.05 nên bác bỏ
H0 .
So sánh hai kỳ vọng, trường hợp không biết So sánh hai kỳ vọng, trường hợp không biết
phương sai, mẫu lớn phương sai, mẫu lớn
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ
THUYẾT
Đối với trường hợp mẫu lớn, khi phương sai tổng thể σ12 GIẢ
THUYẾT
THỐNG KÊ và σ22 không biết, ta thay thế bằng các phương sai mẫu S12 THỐNG KÊ

Nguyễn Văn
Thìn
và S22 mà không tạo ra nhiều khác biệt. Nguyễn Văn
Thìn
Ví dụ 19
Bài toán Khi cả n > 30 và m > 30, đại lượng Bài toán
Khảo sát về chiều cao của sinh viên hai khoa Toán và CNTT:
Kiểm định Kiểm định
tham số X̄ − Ȳ − (µ1 − µ2 ) tham số chọn ngẫu nhiên 50 sinh viên khoa Toán, tính được chiều cao
Kiểm định hợp lý Z0 = r (7) Kiểm định hợp lý
trung bình là 163 (cm) và độ lệch tiêu chuẩn 5 (cm). Đo chiều
Một mẫu S12 S22 Một mẫu
+ cao 50 khoa CNTT, có trung bình mẫu là 166 (cm) và độ lệch
Hai mẫu độc
lập
n m Hai mẫu độc
lập tiêu chuẩn 8 (cm). Với mức ý nghĩa α = 1%, hãy cho kết luận
Hai mẫu
sẽ xấp xỉ phân phối chuẩn hóa N(0, 1). Hai mẫu về chiều cao của sinh viên hai khoa.
không độc lập không độc lập

Kiểm định Chi Kiểm định Chi


bình phương Miền bác bỏ (hoặc p - giá trị) trong trường hợp này được bình phương
(Goodness-of- (Goodness-of-
Fit-test) tính tương tự như trường hợp biết phương sai (thay thế Fit-test)

σ1 và σ2 bởi S1 và S2 ).

So sánh hai kỳ vọng, trường hợp không biết


So sánh hai phương sai
phương sai, mẫu nhỏ
KIỂM ĐỊNH KIỂM ĐỊNH • Giả sử X1 , . . . , Xn và Y1 , . . . , Ym lần lượt là hai mẫu ngẫu
GIẢ • Các giả định: GIẢ
THUYẾT THUYẾT
nhiên chọn từ hai tổng thể độc lập và có phân phối chuẩn với
THỐNG KÊ X1 , X2 , . . . , Xn là mẫu ngẫu nhiên được chọn từ tổng thể 1 THỐNG KÊ kỳ vọng và phương sai là (µ1 , σ12 ) và (µ2 , σ22 ). Ta cần kiểm
Nguyễn Văn có phân phối chuẩn với kỳ vọng µ1 và phương sai σ12 Nguyễn Văn định giả thuyết
Thìn Thìn
không biết.
(
H0 : σ12 = σ22
Bài toán Bài toán (8)
Kiểm định
Y1 , Y2 , . . . , Ym là mẫu ngẫu nhiên được chọn từ tổng thể Kiểm định
H1 : σ12 6= σ22
tham số 2 có phân phối chuẩn với kỳ vọng µ2 và phương sai σ22 tham số
Kiểm định hợp lý
không biết.
Kiểm định hợp lý
• Nếu S12 là phương sai mẫu ngẫu nhiên (X1 , . . . , Xn ) thì
Một mẫu Một mẫu

Hai mẫu độc Tổng thể 1 và 2 (đại diện bởi X và Y ) độc lập với nhau. Hai mẫu độc (n − 1)S12
lập lập ∼ χ2 (n − 1) (9)
σ12
Hai mẫu
không độc lập
Cỡ mẫu nhỏ: n ≤ 30 hoặc m ≤ 30. Hai mẫu
không độc lập

Kiểm định Chi • Ta xét hai trường hợp: Kiểm định Chi tương tự, ta có
bình phương bình phương
(Goodness-of- 1 Trường hợp phương sai bằng nhau σ12 = σ22 , (Goodness-of-
Fit-test) Fit-test)
(m − 1)S22
2 Trường hợp phương sai khác nhau σ12 6= σ22 . 2
∼ χ2 (m − 1)
σ2
So sánh hai phương sai So sánh hai phương sai

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ • Khi đó, đại lượng GIẢ Các bước kiểm định
THUYẾT
S 2 /σ 2 THUYẾT
THỐNG KÊ F = 12 12 (10) THỐNG KÊ

Nguyễn Văn S2 /σ2 Nguyễn Văn


1 Phát biểu giả thuyết H0 : σ12 = σ22 và đối thuyết
Thìn Thìn H1 : σ12 6= σ22
sẽ có phân phối F với (n − 1, m − 1) bậc tự do. 2 Xác định mức ý nghĩa α
Bài toán Bài toán

Kiểm định • Xét biến ngẫu nhiên F ∼ F(u, v ) có hàm mật độ xác suất là Kiểm định 3 Khi H0 đúng, thống kê
tham số tham số
f (x), phân vị trên mức α của F là fα,u,v được định nghĩa như
Kiểm định hợp lý Kiểm định hợp lý
S12
Một mẫu sau Z ∞ Một mẫu F = (13)
S22
Hai mẫu độc P(F > fα,u,v ) = f (x)dx = α (11) Hai mẫu độc
lập lập

Hai mẫu
fα,u,v
Hai mẫu
có phân phối F với (n − 1, m − 1) bậc tự do.
không độc lập
• Phân vị dưới mức 1 − α của F cho bởi không độc lập 4 Xác định miền bác bỏ: bác bỏ H0 khi F > fα/2,n−1,m−1
Kiểm định Chi Kiểm định Chi
bình phương bình phương hoặc F < f1−α/2,n−1,m−1
(Goodness-of- 1 (Goodness-of-
Fit-test) f1−α,u,v = (12) Fit-test) 5 Kết luận: Nếu bác bỏ H0 , ta kết luận H1 đúng với
fα,u,v
(1 − α) ∗ 100% độ tin cậy. Ngược lại kết luận chưa đủ cơ
sở để bác bỏ H0 .

So sánh hai kỳ vọng, mẫu nhỏ, trường hợp So sánh hai kỳ vọng, mẫu nhỏ, trường hợp
σ12 = σ22 = σ 2 σ12 = σ22 = σ 2
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ
THUYẾT
THỐNG KÊ Trường hơp σ12 = σ22 = σ 2 , ta sử dụng một ước lượng THUYẾT
THỐNG KÊ
chung cho cả σ12 và σ22 là Sp2 gọi là phương sai mẫu chung
Nguyễn Văn
Thìn
Nguyễn Văn
Thìn
Đặt df = n + m − 2, miền bác bỏ và p - giá trị trong
(pooled sample variance)
trường hợp này có dạng
Bài toán Bài toán
(n − 1)S12 + (m − 1)S22 Đối thuyết Miền bác bỏ p - giá trị
Kiểm định
tham số Sp2 = (14) Kiểm định
tham số
df
Kiểm định hợp lý
n+m−2 Kiểm định hợp lý H1 : µ1 − µ2 6= D0 |t0 | > t1−α/2 p = 2P(Tdf ≥ |t0 |)
Một mẫu Một mẫu df
Thống kê H1 : µ 1 − µ 2 < D 0 t0 < −t1−α p = P(Tdf ≤ t0 )
Hai mẫu độc Hai mẫu độc
lập X̄ − Ȳ − (µ1 − µ2 ) lập
H1 : µ 1 − µ 2 > D 0 t0 > df
t1−α p = P(Tdf ≥ t0 )
Hai mẫu
T0 = r (15) Hai mẫu
không độc lập 1 1 không độc lập
Kết luận: Bác bỏ H0 /Chưa đủ cơ sở để bác bỏ H0 .
Sp +
Kiểm định Chi n m Kiểm định Chi
bình phương bình phương
(Goodness-of- (Goodness-of-
Fit-test) có phân phối Student với n + m − 2 bậc tự do Fit-test)
So sánh hai kỳ vọng, trường hợp không biết
So sánh hai kỳ vọng, mẫu nhỏ, trường hợp σ12 6= σ22
phương sai
KIỂM ĐỊNH
GIẢ
Khi σ12 6= σ22 , sử dụng thống kê KIỂM ĐỊNH
GIẢ
THUYẾT THUYẾT
THỐNG KÊ
X̄ − Ȳ − (µ1 − µ2 ) THỐNG KÊ

Nguyễn Văn T0 = r (16) Nguyễn Văn


Thìn S12 S22 Thìn
+ Ví dụ 20
Bài toán n m Bài toán

Kiểm định Kiểm định Tại một thành phố, ở khu vực A, người ta chọn ngẫu nhiên 17
tham số Khi đó T0 có phân phối Student với bậc tự do df được tham số
Kiểm định hợp lý Kiểm định hợp lý
sinh viên và cho làm 1 bài kiểm tra để đo chỉ số IQs, thu được
xác định như sau
Một mẫu Một mẫu trung bình mẫu là 106 và độ lệch tiêu chuẩn bằng 10; tại khu
Hai mẫu độc
 2
(s1 /n) + (s22 /m)
2 Hai mẫu độc vực B, chỉ số IQs trung bình của một mẫu gồm 14 sinh viên
lập lập
df = 2 2 (17) bằng 109 với độ lệch tiêu chuẩn là 7. Giả sử phương sai bằng
Hai mẫu (s1 /n) (s 2 /m)2 Hai mẫu
không độc lập + 2 không độc lập nhau. Có sự khác biệt về chỉ số IQs của sinh viên ở hai khu vực
n−1 m−1
Kiểm định Chi
bình phương
Kiểm định Chi
bình phương
A và B hay không? α = 0.02.
(Goodness-of- (Goodness-of-
Fit-test)
Miền bác bỏ trong trường hợp này giống như trường hợp Fit-test)
phương sai bằng nhau, chỉ thay bậc tự do df cho bởi
phương trình (17).

So sánh hai kỳ vọng, trường hợp không biết


So sánh hai tỷ lệ
phương sai
KIỂM ĐỊNH KIỂM ĐỊNH
• Khảo sát những phần tử thỏa một tính chất A nào đó trên
GIẢ GIẢ
THUYẾT THUYẾT hai tổng thể độc lập với tỷ lệ tương ứng là p1 và p2 ; từ hai
THỐNG KÊ THỐNG KÊ
tổng thể chọn ra hai mẫu với cỡ lần lượt là n và m. Gọi X và
Nguyễn Văn
Thìn
Ví dụ 21 Nguyễn Văn
Thìn Y là số phần tử thỏa tính chất A trong mẫu 1 và mẫu 2. Khi
Bài toán
Hàm lượng thạch tín (Asen) (Đv: ppb) trong nước càng cao Bài toán
đó, ta có X ∼ B(n, p1 ) và Y ∼ B(m, p2 ).
Kiểm định
càng có hại cho sức khỏe. Người ta kiểm tra hàm lượng thạch Kiểm định • Bài toán: so sánh tỷ lệ p1 và p2 .
tham số
tín ở hai khu vực là trung tâm thành phố Biên Hòa và khu vực tham số
Kiểm định hợp lý Kiểm định hợp lý
• Bài toán kiểm định giả thuyết gồm các trường hợp sau:
Một mẫu
gần sân bay Biên Hòa. Tại mỗi khu vực, người ta đo ngẫu Một mẫu ( ( (
Hai mẫu độc nhiên hàm lượng thạch tín trong nước ứng với 10 địa điểm Hai mẫu độc H0 : p1 − p2 = D0 H0 : p1 − p2 = D0 H0 : p1 − p2 = D0
lập lập (a) (b) (c)
khác nhau. Số liệu cho bởi bảng thống kê bên dưới H1 : p1 − p2 6= D0 H1 : p1 − p2 < D0 H1 : p1 − p2 > D0
Hai mẫu Hai mẫu
không độc lập Trung tâm TP 3 7 25 10 15 6 12 25 15 7 không độc lập

Kiểm định Chi Khu vực gần sân bay 48 44 40 38 33 21 20 12 1 18 Kiểm định Chi
• Các giả định
bình phương bình phương
(Goodness-of- Với α = 0.05, hãy kiểm tra xem có sự khác biệt về hàm lượng (Goodness-of- Hai mẫu độc lập,
Fit-test) Fit-test)
thạch tín ở hai khu vực này. Cỡ mẫu lớn và np1 > 5; n(1 − p1 ) > 5 và mp2 > 5;
m(1 − p2 ) > 5.
So sánh hai tỷ lệ So sánh hai tỷ lệ

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ
THUYẾT
Các bước kiểm định GIẢ
THUYẾT
THỐNG KÊ THỐNG KÊ

Nguyễn Văn
Thìn 1 Phát biểu giả thuyết H0 và đối thuyết H1 Nguyễn Văn
Thìn
4. Xác định miền bác bỏ
2 Xác định mức ý nghĩa α Đối thuyết Miền bác bỏ p - giá trị
Bài toán Bài toán

Kiểm định
3 Tính thống kê kiểm định Kiểm định H1 : p 1 − p 2 =
6 D0 |z0 | > z1−α/2 p = 2[1 − Φ(|z0 |)]
tham số tham số
H1 : p 1 − p 2 < D 0 z0 < −z1−α p = Φ(z0 )
Kiểm định hợp lý
Pˆ1 − Pˆ2 − D0 Kiểm định hợp lý

Một mẫu Z0 = s   (18) Một mẫu H1 : p 1 − p 2 > D 0 z0 > z1−α p = 1 − Φ(z0 )


Hai mẫu độc 1 1 Hai mẫu độc
lập P̂(1 − P̂) + lập 5. Kết luận: Nếu bác bỏ H0 , ta kết luận H1 đúng với
n m (1 − α)100% độ tin cậy. Ngược lại ta kết luận chưa đủ cơ
Hai mẫu Hai mẫu
không độc lập không độc lập
sở để bác bỏ H0 với α cho trước.
Kiểm định Chi với Kiểm định Chi
bình phương
X Y X +Y bình phương
(Goodness-of-
Fit-test)
Pˆ1 = ; Pˆ2 = ; P̂ = (Goodness-of-
Fit-test)
n m n+m
nếu H0 đúng, Z0 ∼ N(0, 1).

So sánh hai tỷ lệ Outline

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
THUYẾT THUYẾT 1 Bài toán kiểm định giả thuyết thống kê
THỐNG KÊ THỐNG KÊ

Nguyễn Văn Nguyễn Văn


Thìn Ví dụ 22 Thìn 2 Kiểm định tham số
Bài toán Một công ty sản xuất thuốc cần kiểm tra một loại thuốc có tác Bài toán
Kiểm định hợp lý
Kiểm định dụng là giảm việc xuất hiện cơn đau ngực ở các bệnh nhân. Kiểm định
tham số tham số 3 Kiểm định giả thuyết cho trường hợp một mẫu
Kiểm định hợp lý Công ty thực hiện thí nghiệm trên 400 người, chia làm hai Kiểm định hợp lý

Một mẫu nhóm: nhóm 1 gồm 200 được uống thuốc và nhóm 2 gồm 200 Một mẫu
4 Kiểm định giả thuyết cho trường hợp hai mẫu độc lập
Hai mẫu độc người được uống giả dược. Theo dõi thấy ở nhóm 1 có 8 người Hai mẫu độc
lập lập
lên cơn đau ngực và nhóm 2 có 25 người lên cơn đau ngực. Với
Hai mẫu Hai mẫu 5 So sánh hai mẫu không độc lập
không độc lập α = 0.05, hay cho kết luận về hiệu quả của thuốc mới sản xuất. không độc lập

Kiểm định Chi Kiểm định Chi


bình phương bình phương 6 Kiểm định Chi bình phương
(Goodness-of- (Goodness-of-
Fit-test) Fit-test) (Goodness-of-Fit-test)
1 1
So sánh hai mẫu không độc lập (paired t - test) So sánh hai mẫu không độc lập (paired t - test)

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ Xét (X1i , X2i ), với i = 1, 2, . . . , n, là tập gồm n cặp giá trị
THUYẾT Khi hai mẫu không độc lập thì mỗi giá trị quan trắc được THUYẾT
quan trắc với giả sử rằng kỳ vọng và phương sai của tổng
THỐNG KÊ
trong một mẫu có mối liên hệ tương ứng với một giá trị THỐNG KÊ
thể đại diện bởi X1 là µ1 và σ12 và kỳ vọng và phương sai
Nguyễn Văn
quan trắc ở mẫu thứ hai. Như vậy, ta có thể ghép cặp Nguyễn Văn
Thìn Thìn
của tổng thể đại diện bởi X2 là µ2 và σ22 . X1i và X2j
từng giá trị trong hai mẫu với nhau.
Bài toán Bài toán (i 6= j) độc lập.
Kiểm định
tham số
Việc ghép cặp là kết quả của việc Kiểm định
tham số Định nghĩa độ sai khác giữa mỗi cặp trong tập hợp các giá
Kiểm định hợp lý quan trắc giá trị trước và sau khi thực hiện 1 thí nghiệm. Kiểm định hợp lý
trị quan trắc là
Một mẫu Chẳng hạn như đo trọng lượng trước và sau khi thực hiện Một mẫu

Hai mẫu độc một chế độ ăn kiêng. Hai mẫu độc Di = X1i − X2i , i = 1, . . . , n (19)
lập lập

Hai mẫu so sánh cùng 1 đặc tính. Hai mẫu


không độc lập không độc lập Các Di ,i = 1, . . . , n được giả sử có phân phối chuẩn.
Kiểm định Chi
bình phương
thí nghiệm trên cùng 1 địa điểm. Kiểm định Chi
bình phương Goi µD = E (Di ), bởi vì D1 , . . . , Dn là những biến ngẫu
(Goodness-of- (Goodness-of-
Fit-test) thí nghiệm với cùng thời gian. Fit-test) nhiên độc lập và có cùng phân phối, nếu d1 , . . . , dn là
những giá trị của D1 , . . . , Dn , ta định nghĩa
1 1
Phần đọc thêm Phần đọc thêm

1 1
So sánh hai mẫu không độc lập (paired t - test) So sánh hai mẫu không độc lập (paired t - test)

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ
Goi µD = E (Di ), bởi vì D1 , . . . , Dn là những biến ngẫu GIẢ
THUYẾT nhiên độc lập và có cùng phân phối, nếu d1 , . . . , dn là THUYẾT Các bước kiểm định
THỐNG KÊ THỐNG KÊ
những giá trị của D1 , . . . , Dn , ta định nghĩa
Nguyễn Văn Nguyễn Văn
Thìn n Thìn
1X 1 Phát biểu giả thuyết H0 và đối thuyết H1
Bài toán d̄ = di (20) Bài toán
n 2 Xác định mức ý nghĩa α
Kiểm định i=1 Kiểm định
tham số n n tham số
Kiểm định hợp lý 1 X 1 X n Kiểm định hợp lý
Tính thống kê kiểm định
sd2 = (di − d̄ )2 = di2 − (d̄ )2 3
Một mẫu n−1 n−1 n−1 Một mẫu
i=1 i=1
Hai mẫu độc
(21)
Hai mẫu độc D̄ − D0
lập lập
T0 = √ (22)
Hai mẫu Hai mẫu SD / n
không độc lập không độc lập
Ta cần kiểm định các giả thuyết và đối thuyết sau
Kiểm định Chi
bình phương
( ( ( Kiểm định Chi
bình phương
thống kê T0 có phân phối Student với n − 1 bậc tự do.
(Goodness-of- H0 : µ D = D 0 H0 : µD = D0 H0 : µD = D0 (Goodness-of-
Fit-test) (a) (b) (c) Fit-test)
4 Xác định miền bác bỏ
H1 : µD 6= D0 H1 : µD < D0 H1 : µD > D0
1 1
Phần đọc thêm Phần đọc thêm
1 1
So sánh hai mẫu không độc lập (paired t - test) So sánh hai mẫu không độc lập

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
Ví dụ 23
THUYẾT Miền bác bỏ và p - giá trị trong trường hợp này có dạng THUYẾT
THỐNG KÊ THỐNG KÊ Một bác sĩ dinh dưỡng nghiên cứu một chế độ ăn kiêng và tập
Đối thuyết Miền bác bỏ p - giá trị thể dục mới để làm giảm lượng đường trong máu của các bệnh
Nguyễn Văn Nguyễn Văn
Thìn n−1 Thìn
nhân bị bệnh tiểu đường. 10 bệnh nhân bị bệnh tiểu đường
H1 : µD 6= D0 |t0 | > t1−α/2 p = 2P(Tn−1 ≥ |t0 |)
Bài toán
n−1 Bài toán được chọn để thử nghiệm chương trình này, bảng kết quả bên
H1 : µ D < D 0 t0 < −t1−α p = P(Tn−1 ≤ t0 )
Kiểm định Kiểm định dưới cho biết lượng đường trong máu trước và sau khi các
tham số n−1 tham số
Kiểm định hợp lý H1 : µ D > D 0 t0 > t1−α p = P(Tn−1 ≥ t0 ) Kiểm định hợp lý bệnh nhân tham gia chương trình
Một mẫu Một mẫu
5. Kết luận: Nếu bác bỏ H0 , ta kết luận H1 đúng với
Hai mẫu độc Hai mẫu độc
lập (1 − α) ∗ 100% độ tin cậy. Ngược lại kết luận chưa đủ cơ lập Trước 268 225 252 192 307 228 246 298 231 185
Hai mẫu sở để bác bỏ H0 . Hai mẫu Sau 106 186 223 110 203 101 211 176 194 203
không độc lập không độc lập

Kiểm định Chi • Trường hợp cỡ mẫu n > 30, bài toán kiểm định hai mẫu phụ Kiểm định Chi
bình phương
(Goodness-of- thuộc thực hiện tương tự như trường hợp một mẫu dựa trên
bình phương
(Goodness-of-
Số liệu được cung cấp có đủ bằng chứng để kết luận rằng chế
Fit-test)
mẫu ngẫu nhiên (D1 , . . . , Dn ).
Fit-test) độ ăn kiêng và tập thể dục có tác dụng làm giảm lượng đường
trong máu không? α = 0.05.
1 1
Phần đọc thêm Phần đọc thêm

Outline Kiểm định giả thuyết về phân phối

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
THUYẾT 1 Bài toán kiểm định giả thuyết thống kê THUYẾT
THỐNG KÊ THỐNG KÊ

Nguyễn Văn Nguyễn Văn


Thìn 2 Kiểm định tham số Thìn

Bài toán
Kiểm định hợp lý Bài toán

Kiểm định
tham số 3 Kiểm định giả thuyết cho trường hợp một mẫu
Kiểm định
tham số • Bài toán: Khảo sát biến ngẫu nhiên X liên liên quan đến
Kiểm định hợp lý Kiểm định hợp lý
một tổng thể có phân phối chưa biết. Cần kiểm định xem
Một mẫu Một mẫu

Hai mẫu độc


4 Kiểm định giả thuyết cho trường hợp hai mẫu độc lập
Hai mẫu độc
phân phối của tổng thể có phải là F (x; θ) hay không?
lập lập Chẳng hạn, ta cần kiểm định phân phối của tổng thể đang
Hai mẫu 5 So sánh hai mẫu không độc lập Hai mẫu
xét là phân phối chuẩn.
không độc lập không độc lập

Kiểm định Chi Kiểm định Chi


bình phương 6 Kiểm định Chi bình phương bình phương
(Goodness-of- (Goodness-of-
Fit-test) (Goodness-of-Fit-test) Fit-test)
Kiểm định giả thuyết về phân phối Kiểm định giả thuyết về phân phối

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ Các bước kiểm định GIẢ
THUYẾT THUYẾT
4. Thống kê kiểm định Q 2 cho bởi công thức
THỐNG KÊ
1 Chọn mẫu ngẫu nhiên cỡ n: (X1 , . . . , Xn ). Chia miền giá THỐNG KÊ

Nguyễn Văn Nguyễn Văn


trị của các biến ngẫu nhiên Xi thành K khoảng không K
Thìn Thìn X (Oj − Ej )2
trùng nhau l1 , l2 , . . . , lK (Trường hợp X là biến ngẫu nhiên Q2 = (23)
Bài toán
rời rạc, ta chia thành K điểm: x1 , x2 , . . . , xK ).
Bài toán Ej
j=1
Kiểm định Kiểm định
tham số 2 Gọi Oj là số các giá trị mẫu nằm trong khoảng lj tham số
Kiểm định hợp lý
(j = 1, 2, . . . , K ) (Trường hợp X là biến ngẫu nhiên rời rạc
Kiểm định hợp lý
Q 2 xấp xỉ phân phối χ2 với K − 1 bậc tự do.
Một mẫu Một mẫu

Hai mẫu độc


là tần số lặp lại của giá trị xj ). Oj gọi là các tần số thực Hai mẫu độc
lập nghiệm. lập 5. Bác bỏ H0 nếu
Hai mẫu
không độc lập
3 Phát biểu giả thuyết H0 : X tuân theo luật phân phối Hai mẫu
không độc lập
Q 2 ≥ χ2α,K −r −1 (24)
Kiểm định Chi F (x; θ). Kiểm định Chi
bình phương bình phương với r là số tham số ước lượng. Tìm χ2α,K −r −1 : tra bảng
(Goodness-of- Khi đó, tính pj = P(X ∈ lj ) (hoặc P(X = xj ) nếu X rời (Goodness-of-
Fit-test) Fit-test) Chi - bình phương.
rạc). Đặt Ej = npj , Ej gọi là các tần số lý thuyết.
Điều kiện: Ej ≥ 5, j = 1, 2, . . . , K .

Kiểm định giả thuyết về phân phối Kiểm định giả thuyết về phân phối

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
1 Gọi X = số vụ tai nạn xe máy/ngày ở Q.5; phát biểu giả
THUYẾT Ví dụ 24 THUYẾT thuyết
THỐNG KÊ THỐNG KÊ
Bảng thống kê số vụ tai nạn xe máy/ngày ở quận 5 trong 80
Nguyễn Văn Nguyễn Văn H0 : X tuân theo luật phân phối Poisson với tham số λ
Thìn ngày Thìn

Bài toán Bài toán 2 Tính các tần số thực lý thuyết Ej , j = 1, . . . , 5.


Kiểm định Số vụ tai nạn Số ngày Kiểm định Ej = npj = nP(X = xj ). Nếu X ∼ P(λ), các xác suất pj
tham số tham số
Kiểm định hợp lý
0 34 Kiểm định hợp lý được tính như sau
Một mẫu 1 25 Một mẫu

Hai mẫu độc 2 11 Hai mẫu độc e −λ λxj


lập lập pj = P(X = xj ) =
3 7 xj !
Hai mẫu Hai mẫu
không độc lập 4 3 không độc lập

Kiểm định Chi Kiểm định Chi Do λ chưa biết nên ta sử dụng ước lượng của λ là
bình phương bình phương
(Goodness-of- Với mức ý nghĩa 5%, hãy kiểm tra xem số vụ tai nạn xe máy (Goodness-of- 5
Fit-test) Fit-test) 1X
hàng ngày có tuân theo luật phân phối Poisson hay không? λ̂ = Oi xi = 1
n
i=1
Kiểm định giả thuyết về phân phối Kiểm định giả thuyết về phân phối

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ
3. Xác suất và kết quả tính tần số lý thuyết cho ở bảng bên GIẢ
THUYẾT dưới THUYẾT
THỐNG KÊ THỐNG KÊ

Nguyễn Văn
pi = P(X = xi ) Ei = npi Nguyễn Văn
5. Bác bỏ H0 khi:
Thìn Thìn
e −1 10
p1 = = 0.368 29.44
Bài toán
0!
Bài toán
Q 2 ≥ χ2α,K −r −1 = χ20.05,5−1−1
e −1 11
Kiểm định
p2 = 1! = 0.368 29.44 Kiểm định
tham số
p3 = e −1 12
= 0.184 14.72
tham số Tra bảng, ta có χ20.05,3 = 7.815.
Kiểm định hợp lý Kiểm định hợp lý
2!
Một mẫu e −1 13 Một mẫu
p4 = = 0.061
3! 4.88
Hai mẫu độc P4 Hai mẫu độc
lập lập
p5 = 1 − i=1 pi = 0.019 1.52 6. Do Q 2 = 4.67 < 7.815 nên kết luận chưa đủ cơ sở để bác
Hai mẫu Hai mẫu
không độc lập không độc lập bỏ H0 . Vậy, số vụ tai nạn giao thông/ ngày ở Q.5 tuân
4. Tính thống kê Q 2 ,
Kiểm định Chi
bình phương
Kiểm định Chi
bình phương
theo luật phân phối Poisson.
(Goodness-of- 5 (Goodness-of-
Fit-test)
X (Oj − Ej )2 (34 − 29.44)2 (3 − 1.52)2 Fit-test)
Q2 = = +. . .+ = 4.67
Ej 29.44 1.52
j=1

Kiểm định giả thuyết về phân phối Kiểm định giả thuyết về phân phối

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
THUYẾT THUYẾT
THỐNG KÊ THỐNG KÊ

Nguyễn Văn
Ví dụ 25 Nguyễn Văn
Ví dụ 26
Thìn Thìn
Điểm thi của 200 sinh viên trong một lớp học cho bởi bảng bên Nhóm máu của 500 người chọn ngẫu nhiên từ một khu vực cho
Bài toán dưới. Có ý kiến cho rằng điểm thi của sinh viên là đại lượng Bài toán bởi bảng sau
Kiểm định
tham số
ngẫu nhiên có phân phối chuẩn với điểm trung bình bằng 75 và Kiểm định
tham số
Kiểm định hợp lý độ lệch chuẩn bằng 8. Với α = 0.05, hãy kiểm tra ý kiến này. Kiểm định hợp lý A B AB O
Một mẫu Một mẫu 75 150 15 260
Hai mẫu độc Hai mẫu độc
lập lập

Hai mẫu
Điểm thi (0, 60] (60, 70] (70, 80] (80, 90] (90, 100] Hai mẫu
Theo từ điển y khoa thì tỷ lệ nhóm máu trong dân số là 0.18,
không độc lập Số sinh viên 12 36 90 44 18 không độc lập 0.28, 0.05, 0.49. Hỏi nhóm máu trong dân số có phù hợp với
Kiểm định Chi Kiểm định Chi
bình phương bình phương
từ điển y khoa hay không? Mức ý nghĩa 1%.
(Goodness-of- (Goodness-of-
Fit-test) Fit-test)
Kiểm định giả thuyết về phân phối Kiểm định giả thuyết về tính độc lập

KIỂM ĐỊNH KIỂM ĐỊNH • Bài toán:


GIẢ GIẢ
THUYẾT THUYẾT
Giả sử mỗi phần tử trong một tổng thể có thể được phân
THỐNG KÊ THỐNG KÊ loại theo hai đặc tính khác nhau, gọi là đặc tính X và đặc
Nguyễn Văn Ví dụ 27 Nguyễn Văn tính Y . X có r giá trị và Y có s giá trị. Gọi
Thìn Thìn

Chọn 100 người bệnh tâm thần được phân loại vào mùa mà họ Pij = P(X = xi , Y = yj )
Bài toán Bài toán

Kiểm định
sinh ra, số liệu cho ở bảng sau: Kiểm định
tham số tham số
với i = 1, . . . , r và j = 1, . . . , s. Pij là xác suất chọn được
Kiểm định hợp lý
Xuân Hạ Thu Đông Kiểm định hợp lý
một phần tử trong tổng thể có đặc tính X bằng i và đặc
Một mẫu Một mẫu
20 35 20 25 tính Y bằng j.
Hai mẫu độc Hai mẫu độc
lập lập Gọi
s
Hai mẫu Hỏi bệnh có phụ thuộc vào mùa được sinh ra hay không? Mức Hai mẫu
X
không độc lập không độc lập pi = P(X = xi ) = Pij , i = 1, . . . , r
ý nghĩa 1%.
Kiểm định Chi Kiểm định Chi j=1
bình phương bình phương
(Goodness-of-
Fit-test)
(Goodness-of-
Fit-test)

r
X
qj = P(Y = yj ) = Pij , j = 1, . . . , s
i=1

Kiểm định giả thuyết về tính độc lập Kiểm định giả thuyết về tính độc lập

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
THUYẾT THUYẾT
Khảo sát N phần tử, ta được bảng kết quả, trong bài toán
THỐNG KÊ
pi là xác suất chọn được một phần tử của tổng thể có đặc THỐNG KÊ này gọi là bảng ngẫu nhiên (contingency table):
Nguyễn Văn tính X bằng xi , qj là xác suất chọn được môt phần tử của Nguyễn Văn
Thìn Thìn
HH Y
H
tổng thể có đặc tính Y bằng yj . y1 y2 ··· ys Tổng hàng
Bài toán Bài toán X H
H
H
Kiểm định
tham số Ta cần kiểm định xem X có độc lập với Y hay không? Kiểm định
tham số
x1 n11 n12 ··· n1s n1
Kiểm định hợp lý
Phát biểu giả thuyết Kiểm định hợp lý x2 n21 n22 ··· n2s n2
Một mẫu Một mẫu .. .. .. .. .. ..
. . . . . .
Hai mẫu độc
H0 : Pij = pi qj ∀i = 1, . . . , r ; j = 1, . . . , s Hai mẫu độc
lập lập xr nr 1 nr 2 ··· nrs nr
Hai mẫu Hai mẫu
không độc lập và đối thuyết không độc lập Tổng cột m1 m2 ··· ms N
Kiểm định Chi Kiểm định Chi
bình phương bình phương Bảng 6:
(Goodness-of- H1 : ∃ (i, j) sao cho Pij 6= pi qj (Goodness-of-
Fit-test) Fit-test)

trong đó, các nij gọi là tần số thực nghiệm.


Kiểm định giả thuyết về tính độc lập Kiểm định giả thuyết về tính độc lập

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ Ước lượng của pi và qj lần lượt bằng GIẢ
THUYẾT THUYẾT
THỐNG KÊ THỐNG KÊ
ni
Nguyễn Văn p̂i = , i = 1, . . . , r Nguyễn Văn
Thìn N Thìn
mj Định lí 28 (Pearson)
Bài toán q̂j = , j = 1, . . . , s Bài toán
N
Kiểm định Kiểm định Với Nij và Eij = NPij , biến ngẫu nhiên
tham số tham số
Kiểm định hợp lý Gọi Nij là số phần tử có đặc tính (xi , yj ) trong N phần tử Kiểm định hợp lý
r X
s
Một mẫu khảo sát, thì Nij ∼ B(N, Pij ). Khi đó, Một mẫu
X (Nij − Eij )2
Hai mẫu độc Hai mẫu độc Eij
lập lập i=1 j=1
E(Nij ) = NPij = Npi qj khi H0 đúng
Hai mẫu Hai mẫu
không độc lập không độc lập
sẽ hội tụ theo phân phối về biến ngẫu nhiên Chi bình phương
Kiểm định Chi Đặt Kiểm định Chi
bình phương ni mj bình phương χ2(r −1)(s−1) bậc tự do.
(Goodness-of- eij = N p̂i q̂j = (Goodness-of-
Fit-test) N Fit-test)

eij gọi là tần số lý thuyết.

Kiểm định giả thuyết về tính độc lập Kiểm định giả thuyết về tính độc lập

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
3. Tính thống kê kiểm định
THUYẾT THUYẾT
r X
s r s 2
THỐNG KÊ
Các bước kiểm định
THỐNG KÊ X (nij − eij )2 X X nij
Nguyễn Văn Nguyễn Văn Q2 = = −N (25)
Thìn Thìn eij eij
i=1 j=1 i=1 j=1
Bài toán 1 Phát biểu giả thuyết H0 : X và Y độc lập Bài toán

Kiểm định Kiểm định Nếu H0 đúng, thống kê Q 2 có phân phối Chi bình phương
tham số
Kiểm định hợp lý
tham số
Kiểm định hợp lý
với (r − 1)(s − 1) bậc tự do
2 Xác định tần số thực nghiệm nij và tần số lý thuyết 4. Bác bỏ H0 khi
Một mẫu Một mẫu

Hai mẫu độc ni mj Hai mẫu độc


lập eij = lập Q 2 > χ2(r −1)(s−1) (α) (26)
Hai mẫu
N Hai mẫu
không độc lập không độc lập
4b. Sử dụng p-giá trị:
Kiểm định Chi với ni và mj là tổng hàng i và tổng cột j tương ứng, Kiểm định Chi
bình phương bình phương
Điều kiện: eij ≥ 5.
 
(Goodness-of-
Fit-test)
(Goodness-of-
Fit-test) p = P χ2(r −1)(s−1) ≥ Q 2 (27)

Bác bỏ H0 khi: p ≤ α.
Kiểm định giả thuyết về tính độc lập Kiểm định giả thuyết về tính độc lập

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
Ví dụ 29
THUYẾT THUYẾT 1 Phát biểu giả thuyết, H0 : Bệnh lên cơn đau tim độc lập
THỐNG KÊ THỐNG KÊ
Một báo cáo khoa học trong y khoa tuyên bố rằng việc sở hữu một với việc nuôi thú cưng,
Nguyễn Văn Nguyễn Văn
Thìn
thú cưng trong nhà (chó hoặc mèo) sẽ làm tăng khả năng sống sót Thìn
của những người chủ mà thường bị lên cơn đau tim. Một mẫu ngẫu
Bài toán Bài toán
2 Tính tần số thực nghiệm: với n1 = 72, n2 = 23, m1 = 36,
nhiên gồm 95 người đã lên cơn đau tim được chọn để khảo sát. Dữ m2 = 59
Kiểm định
tham số
liệu của mỗi người khảo sát được chia làm 2 loại: Kiểm định
tham số
n1 m1 72 × 36 n1 m2 72 × 59
Kiểm định hợp lý
- Những người sống sót/tử vong 1 năm sau khi lên cơn đau tim.
Kiểm định hợp lý
e11 = = = 27.284; e12 = = = 44.716
Một mẫu Một mẫu
N 95 N 95
- Người sống sót/tử vong có nuôi thú cưng trong nhà hay không. n2 m1 23 × 36 n2 m2 23 × 59
Hai mẫu độc Hai mẫu độc e21 = = = 8.716; e22 = = = 14.284
lập lập N 95 N 95
Kết quả cho bởi bảng sau
Hai mẫu
không độc lập
Hai mẫu
không độc lập 3 Tính giá trị thống kê Q 2
Kiểm định Chi
Có nuôi thú cưng Không nuôi thú cưng Kiểm định Chi 2 X 2
nij2 282 442 82 152
 
bình phương bình phương
Sống sót 28 44
X
(Goodness-of- (Goodness-of- Q2 = −n = + + + −95 = 0.125
eij 27.284 44.716 8.716 15.284
Fit-test) Tử vong 8 15 Fit-test) i=1 j=1

Kiểm định giả thuyết về tính độc lập Kiểm định giả thuyết về tính độc lập

KIỂM ĐỊNH KIỂM ĐỊNH


GIẢ GIẢ
Ví dụ 30
THUYẾT THUYẾT
THỐNG KÊ THỐNG KÊ Vé máy bay của hãng hàng không Việt Nam Airline được chia
Nguyễn Văn Nguyễn Văn làm 3 loại: Hạng thường (C), hạng trung (B) và hạng doanh
Thìn Thìn
nhân (A). Hành khách đi máy bay của VN Airlines nằm trong 1
Bài toán 4. Bác bỏ H0 khi: Q 2 > χ2(r −1)(s−1) (α) = χ21 (0.05). Bài toán trong 2 dạng sau: bay nội địa hoặc quốc tế. Khảo sát 920 hành
Kiểm định Tra bảng Chi - bình phương, ta được χ21 (0.05) = 3.841. Kiểm định khách đã bay của hãng, cho kết quả sau:
tham số tham số
Kiểm định hợp lý Q 2 = 0.125, suy ra Q 2 < 3.841. Ta kết luận chưa đủ cơ sở Kiểm định hợp lý

Một mẫu để bác bỏ H0 tức là bệnh lên cơn đau tim độc lập với việc Một mẫu Loại chuyến bay
Hai mẫu độc
lập
nuôi thú cưng. Hai mẫu độc
lập
Loại vé Nội địa Quốc tế
Hai mẫu Hai mẫu
Hạng thường 29 22
không độc lập không độc lập
Hạng trung 95 121
Kiểm định Chi Kiểm định Chi
bình phương bình phương Hạng doanh nhân 518 135
(Goodness-of- (Goodness-of-
Fit-test) Fit-test) Có ý kiến cho rằng hành khách mua loại vé nào (A, B, C) sẽ
phụ thuộc vào việc người đó bay nội địa hay quốc tế. Với mức
ý nghĩa 5%, hãy kiểm tra ý kiến trên.

You might also like