Professional Documents
Culture Documents
Nguyễn Văn
Thìn KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Nguyễn Văn
Thìn 2 Kiểm định tham số
Bài toán Bài toán
Kiểm định hợp lý
Kiểm định Kiểm định
tham số Nguyễn Văn Thìn tham số 3 Kiểm định giả thuyết cho trường hợp một mẫu
Kiểm định hợp lý Kiểm định hợp lý
Hai mẫu ĐẠI HỌC KHOA HỌC TỰ NHIÊN TP.HCM Hai mẫu 5 So sánh hai mẫu không độc lập
không độc lập không độc lập
Nguyễn Văn
Thìn 2 Kiểm định tham số
Nguyễn Văn
Thìn
Định nghĩa giả thuyết thống kê
Bài toán
Kiểm định hợp lý Bài toán
Giả thuyết không và đối thuyết
Kiểm định Kiểm định
tham số 3 Kiểm định giả thuyết cho trường hợp một mẫu tham số
Kiểm định hợp lý Kiểm định hợp lý
Cách đặt giả thuyết
Một mẫu Một mẫu
4 Kiểm định giả thuyết cho trường hợp hai mẫu độc lập
Hai mẫu độc Hai mẫu độc
lập lập Miền bác bỏ - Tiêu chuẩn kiểm định
Hai mẫu 5 So sánh hai mẫu không độc lập Hai mẫu
không độc lập không độc lập
Hai mẫu độc phân phối xác suất được gọi là giả thuyết đơn. Ngược lại, Hai mẫu độc
lập lập
nó được gọi là giả thuyết hợp. Nhận xét 3
Hai mẫu Hai mẫu
không độc lập không độc lập Một phép kiểm định sẽ xác định miền bác bỏ, và ngược lại,
Kiểm định Chi Kiểm định Chi một cách chọn miền bác bỏ cho ta xác định một phép
bình phương bình phương
(Goodness-of- (Goodness-of- kiểm định.
Fit-test) Fit-test)
Điều này có nghĩa là các từ “phép kiểm định” và “miền bác
bỏ” có thể thay thế nhau.
Hai mẫu giả thuyết thống kê làm giả thuyết không và một giả Hai mẫu
Với một phép kiểm định xác định bởi miền bác bỏ R ⊂ Rn cho
không độc lập
thuyết khác làm đối thuyết.
không độc lập bài toán kiểm định giả thuyết không H0 : θ ∈ Θ0 so với đối
Kiểm định Chi
bình phương Thông thường, người ta có khuynh hướng chấp nhận giả
Kiểm định Chi
bình phương
thuyết H1 : θ ∈ Θ1 , người ta tìm cách đánh giá các nguy cơ sai
(Goodness-of-
Fit-test) thuyết không trừ phi có bằng chứng thuyết phục chống lại
(Goodness-of-
Fit-test)
lầm.
nó.
Outline
Hai mẫu
được gọi là hàm năng lực của phép kiểm định cho bởi miền bác Hai mẫu 5 So sánh hai mẫu không độc lập
không độc lập không độc lập
Kiểm định Chi bỏ R. Giá trị α = sup KR (θ) Kiểm định Chi
bình phương
θ∈Θ0 bình phương 6 Kiểm định Chi bình phương
(Goodness-of- (Goodness-of-
Fit-test) Fit-test) (Goodness-of-Fit-test)
được gọi là mức ý nghĩa của phép kiểm định (hay là kích thước
miền bác bỏ tương ứng).
Hai mẫu
Kiểm định tối ưu đều (mạnh đều nhất, uniformly most Hai mẫu Nhận xét 8
không độc lập không độc lập
Một mẫu
L(x1 , x2 , . . . , xn ; θ00 ) Một mẫu L(x1 , x2 , . . . , xn ; θ0 )
(x1 , x2 , . . . , xn ) ∈ C , ≤ k,
Hai mẫu độc
lập L(x1 , x2 , . . . , xn ; θ0 )
Hai mẫu độc
lập
L(x1 , x2 , . . . , xn ; θ00 )
(b) > k, với mọi điểm
Hai mẫu L(x1 , x2 , . . . , xn ; θ00 ) Hai mẫu
không độc lập không độc lập đều là một miền bác bỏ tối ưu.
(x1 , x2 , . . . , xn ) ∈
/ C,
Kiểm định Chi Kiểm định Chi Giá trị k được xác định từ điều kiện (c).
bình phương (c) α = P[(X1 , X2 , . . . , Xn ) ∈ C |H0 ]. bình phương
(Goodness-of- (Goodness-of-
Fit-test)
Ta có C là một miền bác bỏ tối ưu kích thước α kiểm định giả Fit-test)
Nguyễn Văn định hàm mật độ đồng thời h(x1 , x2 , . . . , xn ), thì C là miền bác Nguyễn Văn
Định nghĩa 12
Thìn Thìn
bỏ tối ưu kích thước α của phép kiểm định H0 so với H1 khi,
Bài toán với k > 0, Bài toán Miền bác bỏ C được gọi là một miền bác bỏ tối ưu đều kích
Kiểm định g (x1 , x2 , . . . , xn ; θ0 ) Kiểm định thước α để kiểm định giả thuyết đơn H0 so với đối thuyết hợp
tham số (a’) ≤ k, với mọi điểm tham số
H1 nếu tập C là miền bác bỏ tối ưu kích thước α để kiểm định
Kiểm định hợp lý h(x1 , x2 , . . . , xn ; θ00 ) Kiểm định hợp lý
Một mẫu (x1 , x2 , . . . , xn ) ∈ C , Một mẫu H0 so với từng giả thuyết đơn lấy từ H1 . Một phép kiểm định
Hai mẫu độc g (x1 , x2 , . . . , xn ; θ0 ) Hai mẫu độc tương ứng với miền bác bỏ C như thế được gọi là một kiểm
lập (b’) > k, với mọi điểm lập
h(x1 , x2 , . . . , xn ; θ00 ) định tối ưu đều kích thước α để kiểm định giả thuyết đơn H0
Hai mẫu Hai mẫu
không độc lập
(x1 , x2 , . . . , xn ) ∈/ C, không độc lập so với giả thuyết đối phức hợp H1 .
Kiểm định Chi
(c’) α = P[(X1 , X2 , . . . , Xn ) ∈ C |H0 ]. Kiểm định Chi
bình phương bình phương
(Goodness-of- Giả thuyết đơn H0 và H1 không nhất thiết phải là các giả thuyết (Goodness-of-
Fit-test) Fit-test)
liên quan đến các tham số của phân phối cũng như không nhất
thiết các biến ngẫu nhiên X1 , X2 , . . . , Xn phải là độc lập từng
đôi.
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ
THUYẾT
Cho biết THUYẾT Hàm hợp lý (mật độ đồng thời của (X1 , X2 , . . . , Xn )),
THỐNG KÊ THỐNG KÊ
Hai mẫu độc Hai mẫu độc L(ω) = max L(θ1 , . . . , θm ) và L(Ω) = max L(θ1 , . . . , θm ).
lập lập (θ1 ,...,θm )∈ω (θ1 ,...,θm )∈Ω
Hai mẫu Giả thuyết cần kiểm định Hai mẫu
không độc lập không độc lập
Tỷ số hợp lý,
Kiểm định Chi Kiểm định Chi
bình phương bình phương
(Goodness-of- H0 : (θ1 , θ2 , . . . , θm ) ∈ ω so với mọi H1 . (1) (Goodness-of- L(ω)
Fit-test) Fit-test) λ(x1 , x2 , . . . , xn ) = λ = .
L(Ω)
Bài toán
Giả thuyết H0 trong (1) bị bác bỏ nếu và chỉ nếu Bài toán Xét Y = u(X1 , X2 , . . . , Xn ) là một thống kê trên mẫu ngẫu
Kiểm định Kiểm định nhiên mà phân phối xác suất của nó được hoàn toàn xác định
tham số λ(x1 , x2 , . . . , xn ) = λ ≤ λ0 . tham số
khi giả thuyết không H0 đúng. Miền bác bỏ kích thước α của
Kiểm định hợp lý Kiểm định hợp lý
Một mẫu Một mẫu phép kiểm định hợp lý được xác định bởi phần bù của khoảng
Hai mẫu độc Giá trị λ0 < 1 được xác định từ mức ý nghĩa: Hai mẫu độc tin cậy R của thống kê Y , khi H0 đúng, ở độ tin cậy
lập lập
γ = 1 − α, trong đó khoảng tin cậy R được chọn một cách
Hai mẫu Hai mẫu
không độc lập α = P[λ(X1 , X2 , . . . , Xn ) ≤ λ0 |H0 ] không độc lập “hợp lý” tùy vào đối thuyết H1 .
Kiểm định Chi Kiểm định Chi
bình phương bình phương
(Goodness-of- (Goodness-of-
Fit-test) Fit-test)
p - giá trị (p - value)
Kiểm định khi Y ≤ a hay khi Y ≥ b. Kiểm định Dựa vào đối thuyết H1 , các bước tính p-giá trị như sau:
tham số tham số
Kiểm định hợp lý Kiểm định hợp lý 1 Xác định thống kê kiểm định: TS. Tính giá trị thống kê
Phép kiểm định dùng khoảng tin cậy R = (−∞, C ) (hay
Một mẫu Một mẫu kiểm định dựa trên mẫu (x1 , . . . , xn ), giả sử bằng a.
R = (C , ∞)), với
Hai mẫu độc Hai mẫu độc 2 p-giá trị cho bởi
lập lập
Outline Kiểm định giả thuyết cho trường hợp một mẫu
Nội dung chính
Nguyễn Văn Nguyễn Văn Kiểm định giả thuyết cho kỳ vọng
Thìn 2 Kiểm định tham số Thìn
Trường hợp biết phương sai,
Bài toán
Kiểm định hợp lý Bài toán
Hai mẫu 5 So sánh hai mẫu không độc lập Hai mẫu Trường hợp không biết phương sai, mẫu lớn.
không độc lập không độc lập
Kiểm định Chi Kiểm định Chi Kiểm định giả thuyết cho tỷ lệ
bình phương 6 Kiểm định Chi bình phương bình phương
(Goodness-of- (Goodness-of-
Fit-test) (Goodness-of-Fit-test) Fit-test)
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH biết σ 2 TH biết σ 2
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ
THUYẾT
• Các giả định: THUYẾT
THỐNG KÊ
Mẫu ngẫu nhiên X1 , . . . , Xn được chọn từ tổng thể có
THỐNG KÊ Các bước kiểm định
phân phối chuẩn N(µ, σ 2 ) với kỳ vọng µ chưa biết.
Nguyễn Văn Nguyễn Văn
Thìn Thìn
Hai mẫu độc • Bài toán kiểm định có 3 trường hợp: Hai mẫu độc 3 Lấy mẫu ngẫu nhiên cỡ n: X1 , . . . , Xn và tính thống kê
lập lập
Hai mẫu
( ( ( Hai mẫu
kiểm định
không độc lập H0 : µ = µ0 H0 : µ = µ 0 H0 : µ = µ0 không độc lập X̄ − µ0
(a) (b) (c) Z0 = √ (3)
Kiểm định Chi
bình phương
H1 : µ 6= µ0 H1 : µ < µ0 H1 : µ > µ0 Kiểm định Chi
bình phương
σ/ n
(Goodness-of- (Goodness-of-
Fit-test) Fit-test) 4 Xác định miền bác bỏ Wα : bảng 1
với mức ý nghĩa α cho trước.
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH biết σ 2 TH biết σ 2
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ • Sử dụng p-giá trị (p - value): tính p-giá trị dựa theo đối
THUYẾT THUYẾT thuyết và kết luận bác bỏ H0 khi p -giá trị ≤ α, với mức ý
THỐNG KÊ Giả thuyết Miền bác bỏ THỐNG KÊ
nghĩa α cho trước. Công thức tính p - giá trị theo các trường
Nguyễn Văn
H0 : µ = µ0 n o Nguyễn Văn
Thìn Wα = z0 : |z0 | > z1−α/2 Thìn hợp xem ở bảng 2.
H1 : µ 6= µ0
Bài toán Bài toán
H0 : µ = µ0 n o
Giả thuyết p - giá trị
Kiểm định Wα = z0 : z0 < −z1−α Kiểm định
tham số H1 : µ < µ0 tham số
H0 : µ = µ0
Kiểm định hợp lý
H0 : µ = µ0 n o Kiểm định hợp lý
p = 2 [1 − Φ(|z0 |)]
Một mẫu Wα = z0 : z0 > z1−α Một mẫu H1 : µ 6= µ0
Hai mẫu độc
H1 : µ > µ0 Hai mẫu độc H0 : µ = µ0
lập lập p = Φ(z0 )
Bảng 1: Miền bác bỏ với đối thuyết tương ứng H1 : µ < µ0
Hai mẫu Hai mẫu
không độc lập không độc lập H0 : µ = µ0
p = 1 − Φ(z0 )
Kiểm định Chi Kiểm định Chi H1 : µ > µ0
bình phương bình phương
(Goodness-of- (Goodness-of-
Fit-test) 5. Kết luận: Bác bỏ H0 / Chưa đủ cơ sở để bác bỏ H0 . Fit-test) Bảng 2: p-giá trị với đối thuyết tương ứng
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH biết σ 2 TH biết σ 2
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ Gọi X là trọng lượng của một tuýt kem đánh răng, giả sử
THUYẾT THUYẾT
X ∼ N(µ, 0.22 ). Các bước kiểm định như sau:
THỐNG KÊ Ví dụ 14 (Kiểm định 2 phía) THỐNG KÊ
Một mẫu bảo để trọng lượng trung bình mỗi tuýt kem là 6 oz; nếu nhiều Một mẫu
2 Xác định mức ý nghĩa: α = 0.03
Hai mẫu độc hơn hoặc ít hơn, dây chuyền phải được điều chỉnh lại. Hai mẫu độc
lập lập
Giả sử trung bình mẫu của 30 tuýt kem là 6.1 oz và độ lệch 3 Tính giá trị thống kê kiểm định
Hai mẫu Hai mẫu
không độc lập tiêu chuẩn của tổng thể σ = 0.2 oz. không độc lập
x̄ − µ0 6.1 − 6.0
Kiểm định Chi Thực hiện kiểm định giả thuyết với mức ý nghĩa 3% để xác Kiểm định Chi z0 = √ = √ = 2.74
bình phương bình phương σ/ n 0.2/ 30
(Goodness-of- định xem dây chuyền sản xuất có vận hành tốt hay không? (Goodness-of-
Fit-test) Fit-test)
4 Xác định miền bác bỏ: Bác bỏ H0 khi |z0 | > z1−α/2
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH biết σ 2 TH biết σ 2
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ α = 3% nên z1−α/2 = z0.985 = 2.17. Vậy bác bỏ H0 nếu GIẢ
THUYẾT THUYẾT
THỐNG KÊ THỐNG KÊ Ví dụ 15 (Kiểm định một phía)
Nguyễn Văn
z0 < −2.17 hoặc z0 > 2.17 Nguyễn Văn
Thìn Thìn Metro EMS: Một bệnh viện tại trung tâm thành phố cung cấp
Bài toán
5. Kết luận: do z0 = 2.74 > 2.17 nên bác bỏ H0 . Ta kết luận Bài toán dịch vụ cấp cứu tại nhà. Với khoảng 20 xe cấp cứu, mục tiêu
Kiểm định với 97% độ tin cậy rằng trọng lượng trung bình mỗi tuýt Kiểm định của trung tâm là cung cấp dịch vụ cấp cứu trong khoảng thời
tham số tham số
Kiểm định hợp lý
kem không bằng 6. Kiểm định hợp lý
gian trung bình là 12 phút sau khi nhận được điện thoại yêu
Một mẫu
• Sử dụng p - giá trị: Một mẫu cầu. Một mẫu ngẫu nhiên gồm thời gian đáp ứng khi có yêu
Hai mẫu độc Hai mẫu độc cầu của 40 ca cấp cứu được chọn. Trung bình mẫu là 13.25
lập 4a. Tính p-giá trị, bài toán kiểm định hai phía lập
phút. Biết rằng độ lệch tiêu chuẩn của tổng thể là σ = 3.2
Hai mẫu Hai mẫu
không độc lập
p = 2[1−Φ(|z0 |)] = 2[1−Φ(2.74)] = 2[1−0.9969] = 0.0062 không độc lập phút. Giám đốc EMS muốn thực hiện một kiểm định, với mức
Kiểm định Chi Kiểm định Chi ý nghĩa 5%, để xác định xem liệu thời gian một ca cấp cứu có
bình phương bình phương
(Goodness-of- 5a. Kết luận: với α = 0.03, ta có p = 0.0062 < 0.03 nên bác (Goodness-of- bé hơn hoặc bằng 12 phút hay không?
Fit-test) Fit-test)
bỏ H0 . Ta kết luận với 97% độ tin cậy rằng trọng lượng
trung bình mỗi tuýt kem không bằng 6.
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH biết σ 2 TH biết σ 2
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ 4. Xác định miền bác bỏ: bác bỏ H0 nếu
Các bước kiểm định:
THUYẾT
THỐNG KÊ
THUYẾT
THỐNG KÊ
z0 > z1−α = z0.95 = 1.645
1. Phát biểu giả thuyết 5. Kết luận: z0 = 2.47 > 1.645 nên bác bỏ H0 . Ta kết luận
Nguyễn Văn Nguyễn Văn
Thìn H0 : µ = 12: Thời gian đáp ứng của dịch vụ cấp cứu đạt Thìn rằng với 95% độ tin cậy, Mertro EMS không đáp ứng được
yêu cầu, không cần phải thay đổi. mục tiêu thời gian phục vụ khách hàng từ 12 phút trở
Bài toán Bài toán
Kiểm định H1 : µ > 12: Thời gian đáp ứng của dịch vụ không đạt yêu Kiểm định xuống.
tham số tham số
cầu, cần thay đổi.
Kiểm định hợp lý Kiểm định hợp lý
• Sử dụng p - giá trị:
Một mẫu Một mẫu
Hai mẫu 3. Tính giá trị thống kê kiểm định Hai mẫu p = 1 − Φ(z0 ) = 1 − Φ(2.47) = 1 − 0.9932 = 0.0068
không độc lập không độc lập
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH không biết σ 2 , mẫu nhỏ TH không biết σ 2 , mẫu nhỏ
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ • Các giả định: GIẢ
THUYẾT THUYẾT Các bước kiểm định
THỐNG KÊ Mẫu ngẫu nhiên X1 , . . . , Xn được chọn từ tổng thể có THỐNG KÊ
Nguyễn Văn
Thìn
phân phối chuẩn N(µ, σ 2 ) với kỳ vọng µ và phương sai σ 2 Nguyễn Văn
Thìn
không biết. 1 Phát biểu giả thuyết không và đối thuyết
Bài toán Bài toán
với mức ý nghĩa α cho trước. 4 Xác định miền bác bỏ Wα : bảng 3
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH không biết σ 2 , mẫu nhỏ TH không biết σ 2 , mẫu nhỏ
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ
• Sử dụng p-giá trị (p - value): tính p-giá trị dựa theo đối
THUYẾT THUYẾT thuyết và kết luận bác bỏ H0 khi p -giá trị ≤ α, với mức ý
THỐNG KÊ Giả thuyết Miền bác bỏ THỐNG KÊ
nghĩa α cho trước. Công thức tính p - giá trị theo các trường
Nguyễn Văn H0 : µ = µ0 n
n−1
o Nguyễn Văn
Thìn Wα = t0 : |t0 | > t1−α/2 Thìn hợp xem ở bảng 4.
H1 : µ 6= µ0
Bài toán Bài toán
H0 : µ = µ0 n
n−1
o
Giả thuyết p - giá trị
Kiểm định Wα = t0 : t0 < −t1−α Kiểm định
tham số H1 : µ < µ0 tham số
H0 : µ = µ0
Kiểm định hợp lý
H0 : µ = µ0 n o Kiểm định hợp lý
p = 2P(Tn−1 ≥ |t0 |)
Một mẫu
n−1
Wα = t0 : t0 > t1−α Một mẫu H1 : µ 6= µ0
Hai mẫu độc
H1 : µ > µ0 Hai mẫu độc H0 : µ = µ0
lập lập p = P(Tn−1 ≤ t0
Bảng 3: Miền bác bỏ với đối thuyết tương ứng (trường hợp mẫu nhỏ) H1 : µ < µ0
Hai mẫu Hai mẫu
không độc lập không độc lập H0 : µ = µ0
p = P(Tn−1 ≥ t0 )
Kiểm định Chi Kiểm định Chi H1 : µ > µ0
bình phương bình phương
(Goodness-of- (Goodness-of-
Fit-test) 5. Kết luận: Bác bỏ H0 / Chưa đủ cơ sở để bác bỏ H0 . Fit-test) Bảng 4: p-giá trị với đối thuyết tương ứng (trường hợp mẫu nhỏ)
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH không biết σ 2 , mẫu lớn TH không biết σ 2
KIỂM ĐỊNH • Các giả định: KIỂM ĐỊNH
GIẢ GIẢ Ví dụ 16
THUYẾT Mẫu ngẫu nhiên X1 , . . . , Xn được chọn từ tổng thể có kỳ THUYẾT
THỐNG KÊ
vọng µ và phương sai σ 2 không biết.
THỐNG KÊ
Trạm cảnh sát giao thông trên đường cao tốc sẽ thực hiện việc
Nguyễn Văn Nguyễn Văn
Thìn Thìn
bắn tốc độ định kỳ tại các địa điểm khác nhau để kiểm tra tốc
Sử dụng ước lượng không chệch S thay cho σ.
độ của các phương tiện giao thông. Một mẫu về tốc độ của các
Bài toán
Cỡ mẫu lớn: n > 30. Bài toán
loại xe được chọn để thực hiện kiểm định giả thuyết sau
Kiểm định Kiểm định
tham số • Khi cỡ mẫu lớn biến ngẫu nhiên tham số (
Kiểm định hợp lý Kiểm định hợp lý
H0 : µ = 65
Một mẫu
X̄ − µ0 Một mẫu
H1 : µ > 65
Hai mẫu độc Z0 = √ (5) Hai mẫu độc
lập S/ n lập
Kiểm định Chi Kiểm định Chi để đặt radar kiểm soát tốc độ.
bình phương bác bỏ Wα hoặc p-giá trị sẽ được tính tương tự như trường bình phương
Tại địa điểm F, một mẫu gồm tốc độ của 64 phương tiện được
(Goodness-of-
X̄ − µ0 (Goodness-of-
Fit-test)
hợp biết phương sai, chỉ thay thế √ bằng Z0 ở phương Fit-test)
bắn tốc độ ngẫu nhiên có trung bình là 66.2 mph và độ lệch
σ/ n
tiêu chuẩn 4.2 mph. Sử dụng α = 5% để kiểm định giả thuyết.
trình (5).
Kiểm định giả thuyết cho kỳ vọng Kiểm định giả thuyết cho kỳ vọng
TH không biết σ 2 TH không biết σ 2
KIỂM ĐỊNH
GIẢ
• Các bước kiểm định: KIỂM ĐỊNH
GIẢ
THUYẾT
THỐNG KÊ
1 Phát biểu giả thuyết: THUYẾT
THỐNG KÊ
5. Kết luận: z0 = 2.286 > 1.645 nên bác bỏ H0 , ta kết luận
Nguyễn Văn
( Nguyễn Văn
với 95% độ tin cậy rằng tốc độ trung bình tại địa điểm F
Thìn H0 : µ = 65 Thìn lớn hơn 65 mph. Địa điểm F là địa điểm tốt để đặt radar
Bài toán H1 : µ > 65 Bài toán kiểm soát tốc độ.
Kiểm định Kiểm định
tham số tham số • Sử dụng p-giá trị:
Kiểm định hợp lý 2 Xác định mức ý nghĩa: α = 0.05 Kiểm định hợp lý
4a. Tính p-giá trị:
Một mẫu
3 Tính giá trị thống kê kiểm định khi σ 2 không biết và cỡ Một mẫu
Với z0 = 2.286, p = 1 − Φ(z0 ) = 1 − Φ(2.286) = 0.0111
Hai mẫu độc Hai mẫu độc
lập mẫu n = 64 (lớn) lập
Kiểm định giả thuyết cho tỷ lệ Kiểm định giả thuyết cho tỷ lệ
KIỂM ĐỊNH KIỂM ĐỊNH • Quan sát sự xuất hiện của biến cố "phần tử mang đặc tính
GIẢ • Bài toán: GIẢ
THUYẾT THUYẾT A" trong n phép thử độc lập. Gọi Y là số lần xuất hiện biến cố
THỐNG KÊ THỐNG KÊ
Cho tổng thể X , trong đó tỷ lệ phần tử mang đặc tính A nào trên thì Y ∼ B(n, p). Và
Nguyễn Văn Nguyễn Văn
Thìn đó là trong tổng thể là p (p chưa biết). Từ mẫu ngẫu nhiên Thìn
(X1 , X2 , ..., Xn ) hãy kiểm định Y
Bài toán Bài toán
P̂ =
n
Kiểm định Kiểm định
tham số tham số
là một ước lượng không chệch cho p.
( ( (
Kiểm định hợp lý
H0 : p = p0 H0 : p = p 0 H0 : p = p0 Kiểm định hợp lý
Kiểm định giả thuyết cho tỷ lệ Kiểm định giả thuyết cho tỷ lệ
Bài toán
Kiểm định hợp lý Bài toán Trường hợp không biết phương sai, mẫu lớn
Kiểm định Kiểm định
tham số 3 Kiểm định giả thuyết cho trường hợp một mẫu tham số
Kiểm định hợp lý Kiểm định hợp lý Trường hợp không biết phương sai, mẫu nhỏ
Một mẫu Một mẫu So sánh hai phương sai
4 Kiểm định giả thuyết cho trường hợp hai mẫu độc lập
Hai mẫu độc Hai mẫu độc
lập lập
Hai mẫu 5 So sánh hai mẫu không độc lập Hai mẫu Trường hợp σ12 = σ22 = σ 2
không độc lập không độc lập
So sánh hai kỳ vọng, trường hợp biết phương sai So sánh hai kỳ vọng, trường hợp biết phương sai
Nguyễn Văn có phân phối chuẩn với kỳ vọng µ1 và phương sai σ12 . Nguyễn Văn
Thìn Thìn
1 Phát biểu giả thuyết H0 và đối thuyết H1
Y1 , Y2 , . . . , Ym là mẫu ngẫu nhiên được chọn từ tổng thể
Bài toán Bài toán
Kiểm định
2 có phân phối chuẩn với kỳ vọng µ2 và phương sai σ22 . Kiểm định
2 Xác định mức ý nghĩa α
tham số tham số
Kiểm định hợp lý Tổng thể 1 và 2 (đại diện bởi X và Y ) độc lập với nhau. Kiểm định hợp lý 3 Tính thống kê kiểm định
Một mẫu Một mẫu
Nguyễn Văn
x̄ − ȳ − 0 121 − 112 Nguyễn Văn • Các giả định:
Thìn Thìn
z0 = r =r = 2.52
2
σ1 σ22 82 82 X1 , X2 , . . . , Xn là mẫu ngẫu nhiên được chọn từ tổng thể 1
Bài toán Bài toán
+ + có kỳ vọng µ1 và phương sai σ12 không biết.
Kiểm định n m 10 10 Kiểm định
tham số tham số
Kiểm định hợp lý Kiểm định hợp lý
Một mẫu
4. Xác định miền bác bỏ: bác bỏ H0 khi Một mẫu Y1 , Y2 , . . . , Ym là mẫu ngẫu nhiên được chọn từ tổng thể
Hai mẫu độc
z0 > z1−α = z0.95 = 1.65. Hai mẫu độc 2 có kỳ vọng µ2 và phương sai σ22 không biết.
lập lập
5. Kết luận: Ta có z0 = 2.52 > 165 nên bác bỏ H0 . Ta kết
Hai mẫu Hai mẫu
không độc lập luận rằng với 95% độ tin cậy, chất phụ gia có hiệu quả không độc lập
Tổng thể 1 và 2 (đại diện bởi X và Y ) độc lập với nhau.
Kiểm định Chi làm giảm thời gian khô sau khi sơn. Kiểm định Chi
bình phương bình phương
(Goodness-of- 5a. Sử dụng p - giá trị: ta có (Goodness-of-
Fit-test) Fit-test) Cỡ mẫu lớn: n > 30 và m > 30.
p = 1 − Φ(z0 ) = 1 − Φ(2.52) = 0.0059 < 0.05 nên bác bỏ
H0 .
So sánh hai kỳ vọng, trường hợp không biết So sánh hai kỳ vọng, trường hợp không biết
phương sai, mẫu lớn phương sai, mẫu lớn
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ
THUYẾT
Đối với trường hợp mẫu lớn, khi phương sai tổng thể σ12 GIẢ
THUYẾT
THỐNG KÊ và σ22 không biết, ta thay thế bằng các phương sai mẫu S12 THỐNG KÊ
Nguyễn Văn
Thìn
và S22 mà không tạo ra nhiều khác biệt. Nguyễn Văn
Thìn
Ví dụ 19
Bài toán Khi cả n > 30 và m > 30, đại lượng Bài toán
Khảo sát về chiều cao của sinh viên hai khoa Toán và CNTT:
Kiểm định Kiểm định
tham số X̄ − Ȳ − (µ1 − µ2 ) tham số chọn ngẫu nhiên 50 sinh viên khoa Toán, tính được chiều cao
Kiểm định hợp lý Z0 = r (7) Kiểm định hợp lý
trung bình là 163 (cm) và độ lệch tiêu chuẩn 5 (cm). Đo chiều
Một mẫu S12 S22 Một mẫu
+ cao 50 khoa CNTT, có trung bình mẫu là 166 (cm) và độ lệch
Hai mẫu độc
lập
n m Hai mẫu độc
lập tiêu chuẩn 8 (cm). Với mức ý nghĩa α = 1%, hãy cho kết luận
Hai mẫu
sẽ xấp xỉ phân phối chuẩn hóa N(0, 1). Hai mẫu về chiều cao của sinh viên hai khoa.
không độc lập không độc lập
σ1 và σ2 bởi S1 và S2 ).
Hai mẫu độc Tổng thể 1 và 2 (đại diện bởi X và Y ) độc lập với nhau. Hai mẫu độc (n − 1)S12
lập lập ∼ χ2 (n − 1) (9)
σ12
Hai mẫu
không độc lập
Cỡ mẫu nhỏ: n ≤ 30 hoặc m ≤ 30. Hai mẫu
không độc lập
Kiểm định Chi • Ta xét hai trường hợp: Kiểm định Chi tương tự, ta có
bình phương bình phương
(Goodness-of- 1 Trường hợp phương sai bằng nhau σ12 = σ22 , (Goodness-of-
Fit-test) Fit-test)
(m − 1)S22
2 Trường hợp phương sai khác nhau σ12 6= σ22 . 2
∼ χ2 (m − 1)
σ2
So sánh hai phương sai So sánh hai phương sai
Kiểm định • Xét biến ngẫu nhiên F ∼ F(u, v ) có hàm mật độ xác suất là Kiểm định 3 Khi H0 đúng, thống kê
tham số tham số
f (x), phân vị trên mức α của F là fα,u,v được định nghĩa như
Kiểm định hợp lý Kiểm định hợp lý
S12
Một mẫu sau Z ∞ Một mẫu F = (13)
S22
Hai mẫu độc P(F > fα,u,v ) = f (x)dx = α (11) Hai mẫu độc
lập lập
Hai mẫu
fα,u,v
Hai mẫu
có phân phối F với (n − 1, m − 1) bậc tự do.
không độc lập
• Phân vị dưới mức 1 − α của F cho bởi không độc lập 4 Xác định miền bác bỏ: bác bỏ H0 khi F > fα/2,n−1,m−1
Kiểm định Chi Kiểm định Chi
bình phương bình phương hoặc F < f1−α/2,n−1,m−1
(Goodness-of- 1 (Goodness-of-
Fit-test) f1−α,u,v = (12) Fit-test) 5 Kết luận: Nếu bác bỏ H0 , ta kết luận H1 đúng với
fα,u,v
(1 − α) ∗ 100% độ tin cậy. Ngược lại kết luận chưa đủ cơ
sở để bác bỏ H0 .
So sánh hai kỳ vọng, mẫu nhỏ, trường hợp So sánh hai kỳ vọng, mẫu nhỏ, trường hợp
σ12 = σ22 = σ 2 σ12 = σ22 = σ 2
KIỂM ĐỊNH KIỂM ĐỊNH
GIẢ GIẢ
THUYẾT
THỐNG KÊ Trường hơp σ12 = σ22 = σ 2 , ta sử dụng một ước lượng THUYẾT
THỐNG KÊ
chung cho cả σ12 và σ22 là Sp2 gọi là phương sai mẫu chung
Nguyễn Văn
Thìn
Nguyễn Văn
Thìn
Đặt df = n + m − 2, miền bác bỏ và p - giá trị trong
(pooled sample variance)
trường hợp này có dạng
Bài toán Bài toán
(n − 1)S12 + (m − 1)S22 Đối thuyết Miền bác bỏ p - giá trị
Kiểm định
tham số Sp2 = (14) Kiểm định
tham số
df
Kiểm định hợp lý
n+m−2 Kiểm định hợp lý H1 : µ1 − µ2 6= D0 |t0 | > t1−α/2 p = 2P(Tdf ≥ |t0 |)
Một mẫu Một mẫu df
Thống kê H1 : µ 1 − µ 2 < D 0 t0 < −t1−α p = P(Tdf ≤ t0 )
Hai mẫu độc Hai mẫu độc
lập X̄ − Ȳ − (µ1 − µ2 ) lập
H1 : µ 1 − µ 2 > D 0 t0 > df
t1−α p = P(Tdf ≥ t0 )
Hai mẫu
T0 = r (15) Hai mẫu
không độc lập 1 1 không độc lập
Kết luận: Bác bỏ H0 /Chưa đủ cơ sở để bác bỏ H0 .
Sp +
Kiểm định Chi n m Kiểm định Chi
bình phương bình phương
(Goodness-of- (Goodness-of-
Fit-test) có phân phối Student với n + m − 2 bậc tự do Fit-test)
So sánh hai kỳ vọng, trường hợp không biết
So sánh hai kỳ vọng, mẫu nhỏ, trường hợp σ12 6= σ22
phương sai
KIỂM ĐỊNH
GIẢ
Khi σ12 6= σ22 , sử dụng thống kê KIỂM ĐỊNH
GIẢ
THUYẾT THUYẾT
THỐNG KÊ
X̄ − Ȳ − (µ1 − µ2 ) THỐNG KÊ
Kiểm định Kiểm định Tại một thành phố, ở khu vực A, người ta chọn ngẫu nhiên 17
tham số Khi đó T0 có phân phối Student với bậc tự do df được tham số
Kiểm định hợp lý Kiểm định hợp lý
sinh viên và cho làm 1 bài kiểm tra để đo chỉ số IQs, thu được
xác định như sau
Một mẫu Một mẫu trung bình mẫu là 106 và độ lệch tiêu chuẩn bằng 10; tại khu
Hai mẫu độc
2
(s1 /n) + (s22 /m)
2 Hai mẫu độc vực B, chỉ số IQs trung bình của một mẫu gồm 14 sinh viên
lập lập
df = 2 2 (17) bằng 109 với độ lệch tiêu chuẩn là 7. Giả sử phương sai bằng
Hai mẫu (s1 /n) (s 2 /m)2 Hai mẫu
không độc lập + 2 không độc lập nhau. Có sự khác biệt về chỉ số IQs của sinh viên ở hai khu vực
n−1 m−1
Kiểm định Chi
bình phương
Kiểm định Chi
bình phương
A và B hay không? α = 0.02.
(Goodness-of- (Goodness-of-
Fit-test)
Miền bác bỏ trong trường hợp này giống như trường hợp Fit-test)
phương sai bằng nhau, chỉ thay bậc tự do df cho bởi
phương trình (17).
Kiểm định Chi Khu vực gần sân bay 48 44 40 38 33 21 20 12 1 18 Kiểm định Chi
• Các giả định
bình phương bình phương
(Goodness-of- Với α = 0.05, hãy kiểm tra xem có sự khác biệt về hàm lượng (Goodness-of- Hai mẫu độc lập,
Fit-test) Fit-test)
thạch tín ở hai khu vực này. Cỡ mẫu lớn và np1 > 5; n(1 − p1 ) > 5 và mp2 > 5;
m(1 − p2 ) > 5.
So sánh hai tỷ lệ So sánh hai tỷ lệ
Nguyễn Văn
Thìn 1 Phát biểu giả thuyết H0 và đối thuyết H1 Nguyễn Văn
Thìn
4. Xác định miền bác bỏ
2 Xác định mức ý nghĩa α Đối thuyết Miền bác bỏ p - giá trị
Bài toán Bài toán
Kiểm định
3 Tính thống kê kiểm định Kiểm định H1 : p 1 − p 2 =
6 D0 |z0 | > z1−α/2 p = 2[1 − Φ(|z0 |)]
tham số tham số
H1 : p 1 − p 2 < D 0 z0 < −z1−α p = Φ(z0 )
Kiểm định hợp lý
Pˆ1 − Pˆ2 − D0 Kiểm định hợp lý
Một mẫu nhóm: nhóm 1 gồm 200 được uống thuốc và nhóm 2 gồm 200 Một mẫu
4 Kiểm định giả thuyết cho trường hợp hai mẫu độc lập
Hai mẫu độc người được uống giả dược. Theo dõi thấy ở nhóm 1 có 8 người Hai mẫu độc
lập lập
lên cơn đau ngực và nhóm 2 có 25 người lên cơn đau ngực. Với
Hai mẫu Hai mẫu 5 So sánh hai mẫu không độc lập
không độc lập α = 0.05, hay cho kết luận về hiệu quả của thuốc mới sản xuất. không độc lập
Hai mẫu độc một chế độ ăn kiêng. Hai mẫu độc Di = X1i − X2i , i = 1, . . . , n (19)
lập lập
1 1
So sánh hai mẫu không độc lập (paired t - test) So sánh hai mẫu không độc lập (paired t - test)
Kiểm định Chi • Trường hợp cỡ mẫu n > 30, bài toán kiểm định hai mẫu phụ Kiểm định Chi
bình phương
(Goodness-of- thuộc thực hiện tương tự như trường hợp một mẫu dựa trên
bình phương
(Goodness-of-
Số liệu được cung cấp có đủ bằng chứng để kết luận rằng chế
Fit-test)
mẫu ngẫu nhiên (D1 , . . . , Dn ).
Fit-test) độ ăn kiêng và tập thể dục có tác dụng làm giảm lượng đường
trong máu không? α = 0.05.
1 1
Phần đọc thêm Phần đọc thêm
Bài toán
Kiểm định hợp lý Bài toán
Kiểm định
tham số 3 Kiểm định giả thuyết cho trường hợp một mẫu
Kiểm định
tham số • Bài toán: Khảo sát biến ngẫu nhiên X liên liên quan đến
Kiểm định hợp lý Kiểm định hợp lý
một tổng thể có phân phối chưa biết. Cần kiểm định xem
Một mẫu Một mẫu
Kiểm định giả thuyết về phân phối Kiểm định giả thuyết về phân phối
Kiểm định Chi Kiểm định Chi Do λ chưa biết nên ta sử dụng ước lượng của λ là
bình phương bình phương
(Goodness-of- Với mức ý nghĩa 5%, hãy kiểm tra xem số vụ tai nạn xe máy (Goodness-of- 5
Fit-test) Fit-test) 1X
hàng ngày có tuân theo luật phân phối Poisson hay không? λ̂ = Oi xi = 1
n
i=1
Kiểm định giả thuyết về phân phối Kiểm định giả thuyết về phân phối
Nguyễn Văn
pi = P(X = xi ) Ei = npi Nguyễn Văn
5. Bác bỏ H0 khi:
Thìn Thìn
e −1 10
p1 = = 0.368 29.44
Bài toán
0!
Bài toán
Q 2 ≥ χ2α,K −r −1 = χ20.05,5−1−1
e −1 11
Kiểm định
p2 = 1! = 0.368 29.44 Kiểm định
tham số
p3 = e −1 12
= 0.184 14.72
tham số Tra bảng, ta có χ20.05,3 = 7.815.
Kiểm định hợp lý Kiểm định hợp lý
2!
Một mẫu e −1 13 Một mẫu
p4 = = 0.061
3! 4.88
Hai mẫu độc P4 Hai mẫu độc
lập lập
p5 = 1 − i=1 pi = 0.019 1.52 6. Do Q 2 = 4.67 < 7.815 nên kết luận chưa đủ cơ sở để bác
Hai mẫu Hai mẫu
không độc lập không độc lập bỏ H0 . Vậy, số vụ tai nạn giao thông/ ngày ở Q.5 tuân
4. Tính thống kê Q 2 ,
Kiểm định Chi
bình phương
Kiểm định Chi
bình phương
theo luật phân phối Poisson.
(Goodness-of- 5 (Goodness-of-
Fit-test)
X (Oj − Ej )2 (34 − 29.44)2 (3 − 1.52)2 Fit-test)
Q2 = = +. . .+ = 4.67
Ej 29.44 1.52
j=1
Kiểm định giả thuyết về phân phối Kiểm định giả thuyết về phân phối
Nguyễn Văn
Ví dụ 25 Nguyễn Văn
Ví dụ 26
Thìn Thìn
Điểm thi của 200 sinh viên trong một lớp học cho bởi bảng bên Nhóm máu của 500 người chọn ngẫu nhiên từ một khu vực cho
Bài toán dưới. Có ý kiến cho rằng điểm thi của sinh viên là đại lượng Bài toán bởi bảng sau
Kiểm định
tham số
ngẫu nhiên có phân phối chuẩn với điểm trung bình bằng 75 và Kiểm định
tham số
Kiểm định hợp lý độ lệch chuẩn bằng 8. Với α = 0.05, hãy kiểm tra ý kiến này. Kiểm định hợp lý A B AB O
Một mẫu Một mẫu 75 150 15 260
Hai mẫu độc Hai mẫu độc
lập lập
Hai mẫu
Điểm thi (0, 60] (60, 70] (70, 80] (80, 90] (90, 100] Hai mẫu
Theo từ điển y khoa thì tỷ lệ nhóm máu trong dân số là 0.18,
không độc lập Số sinh viên 12 36 90 44 18 không độc lập 0.28, 0.05, 0.49. Hỏi nhóm máu trong dân số có phù hợp với
Kiểm định Chi Kiểm định Chi
bình phương bình phương
từ điển y khoa hay không? Mức ý nghĩa 1%.
(Goodness-of- (Goodness-of-
Fit-test) Fit-test)
Kiểm định giả thuyết về phân phối Kiểm định giả thuyết về tính độc lập
Chọn 100 người bệnh tâm thần được phân loại vào mùa mà họ Pij = P(X = xi , Y = yj )
Bài toán Bài toán
Kiểm định
sinh ra, số liệu cho ở bảng sau: Kiểm định
tham số tham số
với i = 1, . . . , r và j = 1, . . . , s. Pij là xác suất chọn được
Kiểm định hợp lý
Xuân Hạ Thu Đông Kiểm định hợp lý
một phần tử trong tổng thể có đặc tính X bằng i và đặc
Một mẫu Một mẫu
20 35 20 25 tính Y bằng j.
Hai mẫu độc Hai mẫu độc
lập lập Gọi
s
Hai mẫu Hỏi bệnh có phụ thuộc vào mùa được sinh ra hay không? Mức Hai mẫu
X
không độc lập không độc lập pi = P(X = xi ) = Pij , i = 1, . . . , r
ý nghĩa 1%.
Kiểm định Chi Kiểm định Chi j=1
bình phương bình phương
(Goodness-of-
Fit-test)
(Goodness-of-
Fit-test)
và
r
X
qj = P(Y = yj ) = Pij , j = 1, . . . , s
i=1
Kiểm định giả thuyết về tính độc lập Kiểm định giả thuyết về tính độc lập
Kiểm định giả thuyết về tính độc lập Kiểm định giả thuyết về tính độc lập
Kiểm định Kiểm định Nếu H0 đúng, thống kê Q 2 có phân phối Chi bình phương
tham số
Kiểm định hợp lý
tham số
Kiểm định hợp lý
với (r − 1)(s − 1) bậc tự do
2 Xác định tần số thực nghiệm nij và tần số lý thuyết 4. Bác bỏ H0 khi
Một mẫu Một mẫu
Bác bỏ H0 khi: p ≤ α.
Kiểm định giả thuyết về tính độc lập Kiểm định giả thuyết về tính độc lập
Kiểm định giả thuyết về tính độc lập Kiểm định giả thuyết về tính độc lập
Một mẫu để bác bỏ H0 tức là bệnh lên cơn đau tim độc lập với việc Một mẫu Loại chuyến bay
Hai mẫu độc
lập
nuôi thú cưng. Hai mẫu độc
lập
Loại vé Nội địa Quốc tế
Hai mẫu Hai mẫu
Hạng thường 29 22
không độc lập không độc lập
Hạng trung 95 121
Kiểm định Chi Kiểm định Chi
bình phương bình phương Hạng doanh nhân 518 135
(Goodness-of- (Goodness-of-
Fit-test) Fit-test) Có ý kiến cho rằng hành khách mua loại vé nào (A, B, C) sẽ
phụ thuộc vào việc người đó bay nội địa hay quốc tế. Với mức
ý nghĩa 5%, hãy kiểm tra ý kiến trên.