You are on page 1of 27

Mr_U_Giảng viên PTDLKD 7/6/2023

Chương 3
KIỂM ĐỊNH PHI THAM SỐ
Non-parametric test

Mr U_Giảng viên PTDLKD

Vi 1 bin X (numerical) có 3
Chương 3. KIỂM ĐỊNH PHI THAM SỐ
Tham s là mt giá tr i din cho d liu ca bin X, c th là:
tham s c trng:
- Muy x là giá tr trung bình ca bin X: ây là giá tr i din cho toàn b d liu ca bin X, nm trung
- Giá tr trung bình
tâm ca tp d liu;
- Xích ma bình
- Pa Nội dung chính - Xích ma bình (x) là giá tr i din cho mc bin ng (phân tán) ca bin X
- Pa là giá tr i din cho t l s phn t có tính cht a ca bin X
Các giá tr i din này (tham s - parametric) ch thc s tt khi và ch khi d liu ca bin X tuân theo
3.1 Khái niệm phân phi chun

3.2 Kiểm định dấu và hạng Wilconxon Trong thc t có rt nhiu numerical có d liu không tuân theo pp chun, ngha
là th lch trái hoc lch phi

3.3 Kiểm định tổng hạng Wilconxon


3.4 Kiểm định Kruskal- Walis
3.5 Kiểm định “Chi- bình phương” Med X (giá tr i din phi
tham s)

Trường hợp 1: Kiểm định tính độc lập trên 2 biến định tính
Trường hợp 2: Kiểm định quy luật phân phối xác suất (đều, chuẩn) của
Biến ngẫu nhiên (BNN) X

1
Mr_U_Giảng viên PTDLKD 7/6/2023

3.1 Khái niệm


Ý tưởng: Kiểm định tham số ở chương trước đòi hỏi tổng thể phải tuân theo
phân phối chuẩn, phương sai bằng nhau,… đây là một điều không phải lúc nào
cũng xảy ra trong thực tế nhất là khi dữ liệu thu thập ở các thang đo có độ tin
cậy thấp như thang đo Ordinal, Norminal.
Kiểm định phi tham số là kiểm định có thể áp dụng trên các thang đo có độ tin
cậy thấp như Ordinal, Norminal, Interval và kể cả thang đo Ratio nếu dữ liệu
thu thập không tuân theo các điều kiện hết sức nghiêm ngặt của kiểm định tham
số đặc biệt là giả thiết tuân theo phân phối chuẩn
Lưu ý: Khi một bài toán kiểm định được đưa ra cần kiểm tra xem bài toán này
sẽ áp dụng được kiểm định tham số hay không ? trước khi sử dụng kiểm định
phi tham số
i vi bài toán kim nh, thc cht bc tin x lí d liu là bc chúng ta kim tra xem d liu ca bin X c cho sn có hay không tuân theo pp chun.
- Nu có, s dng kim nh tham s
- Nu không, s dng kim nh phi tham s, vi MedX là giá tr gia tp d liu i din cho tp d liu ca bin X

Kiểm định tham số Kiểm định phi tham số


1. Kiểm định giá trị trung bình trên một 1. Kiểm định dấu và hạng Wilconxon
mẫu Ho : muy(x) = muy(o) trên một mẫu Ho: MedX = Med0

2. Kiểm định sự sai khác trung bình 2. Kiểm định dấu và hạng Wilconxon
trên mẫu cặp Ho: muyd = muy1 - muy2 = muyo
trên mẫu cặp Ho: Medd = Med1 - Med2 = Medo

3. Kiểm định giá trị trung bình trên hai 3. Kiểm định tổng và hạng Wilconxon
mẫu độc lập Ho: Muy1 = muy2
trên hai mẫu độc lập Ho: Med1 = Med2

4. Phân tích phương sai một yếu tố 4. Kiểm định Kruskal-Wallis


Ho: muy1 = muy2 = ... = muyk Ho: Med1 = Med2 = ... = Medk

2
Mr_U_Giảng viên PTDLKD 7/6/2023

3.2 Kiểm định dấu và hạng Wilconxon

Kiểm định phi tham số Kiểm định tham số


Kiểm định dấu và hạng Wilconxon Kiểm định giá trị trung bình trên 1 mẫu
trên một mẫu (tuân theo phân phối chuẩn)

Kiểm định dấu và hạng Wilconxon Kiểm định sự sai khác trung bình trên
trên mẫu cặp mẫu cặp (tuân theo phân phối chuẩn)

- i vi các bài toán nu có gi nh X tuân theo pp chun thì mc nhiên là kim nh tham s (muyX là giá tr i din)
- Nu bài toán không nói gì n bin X có hay không tuân theo pp chun thì mc nhiên thì mc nhiên là kim nh phi tham s (MedX là
giá tr i din)
Mu cp là mu mà ta thu thp giá tr ca bin X trên 2 nhóm tính cht khác nhau ca bin X, rt ph bin trong QTKD và Mar, vi ch duy nht 1
mu

3.2 Kiểm định dấu và hạng Wilconxon


Trường hợp 1: Trên 1 mẫu
Bài toán: Xét một biến (đặc điểm quan sát) ngẫu nhiên X không tuân theo phân
phối chuẩn với giá trị trung bình là μ0 (MedX0) được đưa ra bởi một tổ chức,
công ty, cá nhân uy tín,… hoặc là một giả thuyết đáng tin cậy.
Hãy cho biết giá trị μ0 (MedX0) có còn chính xác hay không? đgl bài toán kiểm
định phi tham số.
Bước 1: Xây dựng cặp giả thuyết cần kiểm định phi tham số

Bước 2: Tính giá trị sai lệnh di = xi – Medo (i=1,…,n)


Bước 3: Lấy trị tuyệt đối các sai lệch |di| và xếp hạng các |di| này bắt đầu từ 1

3
Mr_U_Giảng viên PTDLKD 7/6/2023

Lưu ý:
- Nếu |di| = 0 thì không được xếp hạng
- Nếu có nhiều giá trị |di| bằng nhau thì tính hạng trung bình cho các giá trị
này (mỗi phần tử này có hạng chính là hạng trung bình cộng)
Bước 4: Với các giá trị di > 0 thì ta đặt hạng của nó vào cột R+ và ngược lại thì
đặt vào R-
Bước 5: Tính giá trị kiểm định Wo
- Kiểm định 2 phía Wo= min { tổng hạng R+; tổng hạng R-}
- Kiểm định 1 phía (phải) Wo= { tổng hạng R+} ~ vùng chấp nhận H1 phải
- Kiểm định 1 phía (trái) Wo= { tổng hạng R-}~ vùng chấp nhận H1 trái
Bước 6: So sánh và kết luận

Bước 6: So sánh và kết luận (tt)


pvalue > alpha

pvalue < alpha

Lưu ý:
- WL (nhỏ) và WM (lớn) là 2 giá trị tra trong bảng tra Wilconxon dựa trên giá
trị tra bảng của kiểm định 2 phía (Wα/2, n’ ) và 1 phía (Wα, n’ )
- n' là số giá trị quan sát được xếp hạng
- Khi n > 20 thì giá trị kiểm định W0 sẽ được thay thế bằng giá trị kiểm định
Z0 (phân phối chuẩn) qua công thức

4
Mr_U_Giảng viên PTDLKD 7/6/2023

Bước 6: So sánh và kết luận


Lu ý: Vi 1 bài toán kim nh ta nên thc hin 1
s thao tác tin x lý nh sau:
- B1: kim tra xem có gi thuyt bin X tuân
theo pp chun trong bài không
- B2: kim tra xem c mu < hay > hn 20

Ví dụ 3.1 Một mẫu ngẫu nhiên mức lương của 10 sinh viên cũ của trường được
chọn ra với giá trị được cho ở bảng sau:

Sinh viên 1 2 3 4 5 6 7 8 9 10
Mức lương 364 385 270 350 290 400 520 340 389 410
Với mức ý nghĩa 5% hãy cho kết luận về giả thiết cho rằng thu nhập sinh viên
tốt nghiệp sau khi ra trường làm việc vượt quá con số 350 đô la ?

Ví dụ 3.1 (tt)
Nhận xét: Đây là bài toán kiểm định phi tham số trên 1 mẫu vì không có giả
thiết lương tuân theo phân phối chuẩn
Bước 1: Cặp giả thuyết cần kiểm định

Bước 2, 3 và 4 có thể làm chung trong bảng sau


Lương (xi) di = xi -350 |di| Hạng R+ R-
364 14 14 2 2
385 35 35 3 3
270 -80 80 8 8
350 0 0
290 -60 60 6,5 6.5
400 50 50 5 5
520 170 170 9 9
340 -10 10 1 1
389 39 39 4 4
410 60 60 6.5 6.5
Tổng 29.5 15.5

5
Mr_U_Giảng viên PTDLKD 7/6/2023

Bước 5: Tính giá trị kiểm định Wo


- Kiểm định 1 phía (phải) Wo= {tổng hạng R+} = 29.5
Bước 6: So sánh và kết luận

với giá trị tra bảng Wilconxon W0.05, n’=9 = (8; 37)
Kết luận: Với mức ý nghĩa 5%, không thể nói rằng thu nhập sinh viên tốt
nghiệp sau khi ra trường làm việc vượt quá con số 350 đô la

6
Mr_U_Giảng viên PTDLKD 7/6/2023

3.2 Kiểm định dấu và hạng Wilconxon


Med(d) = Med1 - Med2 :là giá tr ca bin X trên 2 nhóm tính cht 1 và 2 khi kho sát trên mt mu, thng c gi là mu cp
Trường hợp 2: Trên mẫu cặp
Bước 1: Xây dựng cặp giả thuyết cần kiểm định phi tham số

Lưu ý: Khi Med0 = 0 là kiểm định có hay không sự khác biệt theo 2 phương
phác khác nhau.
Bước 2: Tính giá trị sai lệnh giữa hai phương pháp di = xi – yi (i=1,…,n)
Bước 3: Lấy trị tuyệt đối các sai lệch |di| và xếp hạng các |di| này bắt đầu từ 1
Lưu ý:
- Nếu |di| = 0 thì không được xếp hạng
- Nếu có nhiều giá trị |di| bằng nhau thì tính hạng trung bình cho các giá trị
này (mỗi phần tử này có hạng chính là hạng trung bình cộng)

Bước 4: Với các giá trị di > 0 thì ta đặt hạng của nó vào cột R+ và ngược lại thì Mt trung tâm ngoi ng qung cáo rng
bt k ngi hc nào có im Ielts 5.0 nu
vào hc ti Trung tâm ch sau 3
đặt vào R- tháng s t c im ielts ít nht là 6.0. Vi
mc ý ngha 5%, bn hãy xây dng gi
thuyt kim nh qung cáo trên
Bước 5: Tính giá trị kiểm định Wo
- Kiểm định 2 phía Wo= min { tổng hạng R+; tổng hạng R-}
- Kiểm định 1 phía (phải) Wo= { tổng hạng R+}
- Kiểm định 1 phía (trái) Wo= { tổng hạng R-}
Bước 6: So sánh và kết luận

7
Mr_U_Giảng viên PTDLKD 7/6/2023

Bước 6: So sánh và kết luận (tt)


Lưu ý:
- WL (nhỏ) và WM (lớn) là 2 giá trị tra trong bảng tra Wilconxon dựa trên giá
trị tra bảng của kiểm định 2 phía (Wα/2, n’ ) và 1 phía (Wα, n’ )
- n' là số giá trị quan sát được xếp hạng
- Khi n > 20 thì giá trị kiểm định W0 sẽ được thay thế bằng giá trị kiểm định
Z0 (phân phối chuẩn) qua công thức

H0: Qung cáo úng <=> Med after - Med before > 1 = Med0
H1: Quáng cáo không úng <=> Med after - Med before <1 = Med0

Bước 6: So sánh và kết luận (tt)


bng Laplace

Ví dụ 3.2 Mẫu 9 khách hàng được chọn ngẫu nhiên và yêu cầu họ cho biết sở
thích về 2 loại kem đánh răng cùng loại A, B thông qua thang điểm từ 1 (thấp
nhất) đến 5 (cao nhất). Kết quả thu thập số liệu như sau:
Khách hàng 1 2 3 4 5 6 7 8 9
Sản phẩm A 4 5 2 3 3 1 3 2 2
Sản phẩm B 3 5 5 2 5 5 3 5 5
Với mức ý nghĩa 5% hãy kiểm định giả thuyết rằng kem đánh răng A được ưa
thích hơn kém đánh răng B ?

8
Mr_U_Giảng viên PTDLKD 7/6/2023

Ví dụ 3.2 (tt)
Nhận xét: Đây là bài toán kiểm định phi tham số trên mẫu cặp vì không có giả
thiết điểm tuân theo phân phối chuẩn
Bước 1: Cặp giả thuyết cần kiểm định

trong đó
- Medd= MedA – MedB
- MedA là giá trị trung vị về điểm số của kem đánh răng A
- MedB là giá trị trung vị về điểm số của kem đánh răng B
Bước 2, 3 và 4 có thể làm chung trong bảng sau

Ví dụ 3.2 (tt)
Khách hàng 1 2 3 4 5 6 7 8 9 Tổng
Sản phẩm A(xA) 4 5 2 3 3 1 3 2 2
Sản phẩm B (xB) 3 5 5 2 5 5 3 5 5
di = xA – xB 1 0 -3 1 -2 -4 0 -3 -3
|di| 1 3 1 2 4 3 3
Hạng 1,5 5 1,5 3 7 5 5
R+ 1,5 1,5 3
R- 5 3 7 5 5 25
Bước 5: Tính giá trị kiểm định Wo
- Kiểm định 1 phía (phải) Wo= {tổng hạng R+} = 3
Bước 6: So sánh và kết luận

với giá trị tra bảng Wilconxon là W0.05; 7 = (3, 25)

9
Mr_U_Giảng viên PTDLKD 7/6/2023

Kết luận: Với mức ý nghĩa 5%, không thể nói rằng khách hàng ưa thích sản
phẩm kem đánh răng A hơn B.
Lưu ý: Để thuận lợi trong tính toán, các giá trị (B2, 3, 4) thường được cho sẵn
ở bảng sau (tính trên phần mềm SPSS)

HOMEWORK 3.1 Làm bài 6.5; 6.6 trong sách Thống kê ứng dụng, p.343

7/5/2023

10
Mr_U_Giảng viên PTDLKD 7/6/2023

3.3 Kiểm định tổng hạng Wilconxon


Bài toán: Người ta cần so sánh xem có hay không sự khác biệt giữa giá trị
trung bình trên tổng thể thứ 1 (μ1) và giá trị trung bình trên tổng thể thứ 2 (μ2)
trên cùng một dấu hiệu định tính X khi không có giả thiết tuân theo phân phối
chuẩn đgl bài toán kiểm định phi tham số

Kiểm định tham số Kiểm định phi tham số

Kiểm định sự khác biệt trên 2 trung bình Kiểm định tổng và hạng Wilconxon (hai
(hai mẫu độc lập) mẫu độc lập)
Bước 1: Xây dựng cặp giả thuyết cần kiểm định phi tham số

Bước 2: Kết hợp mẫu 1 và mẫu 2 thành 1 mẫu gọi là mẫu kết hợp. Từ đó xếp
hạng các phần tử trên mẫu kết hợp bắt đầu từ 1

Lưu ý: Các phần tử trong mẫu kết hợp có giá trị bằng nhau thì tính hạng trung
bình cộng cho các giá trị này (mỗi phần tử này có hạng chính là hạng trung
bình cộng)
Bước 3: Tính tổng hạng (T0) mẫu có số phần tử ít hơn trên mẫu kết hợp
Lưu ý: Nếu hai mẫu có số phần tử bằng nhau thì tính mẫu nào cũng được
Bước 4: So sánh và kết luận

trong đó WL và WM được tìm dựa trên giá trị tra bảng Wilconxon đối với kiểm
định 2 phía (Wα/2; n1;n2 ) và 1 phía (Wα; n1;n2 )

11
Mr_U_Giảng viên PTDLKD 7/6/2023

Lưu ý: Khi n1, n2 > 20 thì giá trị kiểm định T0 sẽ được thay thế bằng giá trị
kiểm định Z0 (phân phối chuẩn) qua công thức

Ví dụ 3.3 Để kiểm định xem việc trưng bày hàng hóa có tác động đến doanh số
không người ta chọn ngẫu nhiên 2 mẫu, mẫu thứ 1 gồm 10 cửa hàng trưng bày
bình thường, mẫu thứ 2 cũng gồm 10 cửa hàng trưng bày đặc biệt sau đó quan
sát doanh số của các cửa hàng này (đơn vị: triệu đồng/tháng). Với giả định
doanh số không có phân phối chuẩn, hãy kiểm định xem có hay không sự
khác biệt giữa hai cách trung bày này với mức ý nghĩa 5%.

Doanh số (trưng bày bình thường) 22 34 52 62 30 40 64 84 56 59


Doanh số (trưng bày đặc biệt) 52 71 76 54 67 83 66 90 77 84

Bước 1: Xây dựng cặp giả thuyết

trong đó Med1,Med2 lần lượt là doanh số bán theo trung vị của 2 cách trưng bày
bình thường và đặc biệt

12
Mr_U_Giảng viên PTDLKD 7/6/2023

Bước 2: Kết hợp mẫu 1 và mẫu 2 thành 1 mẫu gọi là mẫu kết hợp. Từ đó xếp
hạng các phần tử trên mẫu kết hợp bắt đầu từ 1
Doanh số Hạng kết hợp Doanh số Hạng kết hợp
22 1 66 12
30 2 67 13
34 3 71 14
40 4 72 15
52 5,5 77 16
52 5,5 83 17
54 7 84 18,5
56 8 84 18,5
59 9 90 20
62 10
64 11

Bước 3. Tính T0 =72


Lưu ý: Vì 2 mẫu có số phần tử bằng nhau nên T0 cũng có thể là 138
Bước 4: So sánh và kết luận

với giá trị tra bảng Wilconxon là Wα/2; n1;n2 = W0.025; 10;10 = (78; 132)
Kết luận: Với mức ý nghĩa 0,05 có sự khác biệt về doanh số giữa trưng bày bình
thường và trưng bày đặc biệt
Lưu ý: Bước 2, 3 có thể được tính sẵn trên phần mềm SPSS như sau

13
Mr_U_Giảng viên PTDLKD 7/6/2023

CÂU HỎI TRONG ĐỀ THI CÁC NĂM TRƯỚC

Mr U_Giảng viên LTTK

HOMERWORK 3.2 Làm bài 6.3 trong sách Thống kê ứng dụng, p.343
HOMEWORK 3.3 Làm bài 12.49 – 12.57, trong sách “Basic Business
Statistics Concepts and Applications”, p. 498- 499.
HOMEWORK 3.4 (GROUP) Làm bài 12.58- 12.62 , trong sách “Basic
Business Statistics Concepts and Applications”, p. 498- 499.

7/5/2023

14
Mr_U_Giảng viên PTDLKD 7/6/2023

3.4 Kiểm định Kruskall-Wallis


Nhận xét: Khi các giả thiết trên các nhóm tính chất đòi hỏi tuân theo phân phối
chuẩn, phương sai bằng nhau không thoả mãn thì ta sử dụng kiểm định phi
tham số (Kruskall-Wallis) thay thế phân tích phương sai 1 yếu tố
Bước 1: Xây dựng giả thuyết

Bước 2: Tính giá trị kiểm định


Ri là tổng hạng của mẫu thứ i dựa trên hạng của mẫu kết hợp
Bước 3: So sánh và kết luận:
- Nếu thì chấp nhận H0 và ngược lại
Bước 4: Khi chấp nhận H1. Xây dựng các cặp giả thuyết cần kiểm định

Bước 5: Tính hạng trung bình cho từng nhóm cần kiểm định

& tính hạng chênh lệch trung bình cho từng nhóm cần kiểm định

Bước 6: Tính giá trị kiểm định (Cij) cho từng cặp kiểm định

Bước 7: So sánh và kết luận


- Nếu Dij < Cij chấp nhận H0 trong cặp kiểm định hai mẫu i, j và ngược lại

15
Mr_U_Giảng viên PTDLKD 7/6/2023

Ví dụ 3.4 Để kiểm định xem việc làm thêm có ảnh hưởng đến kết quả học tập
không người ta chọn ngẫu nhiên một số sinh viên và hỏi họ về kết quả học tập
với thời gian làm thêm trong các khoảng : < 8 giờ/tuần; 8 – 16 giờ/tuần; >16
giờ/tuần. Nếu các giả định về các tổng thể có phân phối chuẩn và phương sai
bằng nhau không được thỏa mãn thì hãy sử dụng kiểm định phi tham số với
mức ý nghĩa 5% cho biết việc làm thêm có ảnh hưởng kết quả học tập ko?
Thời gian làm thêm Thời gian làm thêm Thời gian làm thêm
< 8h ( 8h – 16h) ( >16h)
6,3 7,0 6,3
7,2 6,6 5,8
6,5 6,1 6,0
6,6 5,8 5,5
7,3 6,8 5,3
7,1 6,5

Ví dụ 3.4 (tt)
Thời gian làm thêm Hạng kết hợp Thời gian làm thêm Hạng kết hợp
5.3 1 6.6 11.5
5.5 2 6.6 11.5
5.8 3.5 6.8 13
5.8 3.5 7.0 14
6.0 5 7.1 15
6.1 6 7.2 16
6.3 7.5 7.3 17
6.3 7.5
6.5 9.5
6.5 9.5

Tổng hạng trên mẫu 1 là R1 = 61.5


Tổng hạng trên mẫu 2 là R2 = 63
Tổng hạng trên mẫu 3 là R3 = 28.5

16
Mr_U_Giảng viên PTDLKD 7/6/2023

Bước 2: Tính giá trị kiểm định

Bước 3: So sánh và kết luận

Kết luận: Với mức ý nghĩa 0.05 thời gian làm thêm có ảnh hưởng đến kết quả
học tập
Bước 4:

Bước 5:

Bước 5 (tt)

Bước 6:

Bước 7: So sánh và kết luận


- D12 < C12 chấp nhận H0
- D23 < C23 chấp nhận H0
- D13 > C13 bác bỏ H0

17
Mr_U_Giảng viên PTDLKD 7/6/2023

Lưu ý: Các bước 2, 5 thường được tính sẵn trong phần mềm SPSS

CÂU HỎI TRONG ĐỀ THI CÁC NĂM TRƯỚC

7/5/2023

18
Mr_U_Giảng viên PTDLKD 7/6/2023

HOMEWORK 3.5 Làm bài 12.65 – 12.67, trong sách “Basic Business
Statistics Concepts and Applications”, p. 504.
HOMERWORK 3.6 Làm bài 6.T1 – 6.T6 trong sách Thống kê ứng dụng,
p.346
HOMEWORK 3.7 (GROUP) Làm bài 12.68- 12.70 , trong sách “Basic
Business Statistics Concepts and Applications”, p. 505.

7/6/2023

3.5 Kiểm định “Chi-bình phương”


Trường hợp 1: Kiểm định tính độc lập trên 2 biến định tính
Ý tưởng: Khi muốn xem có hay không sự phụ thuộc giữa 1 biến định tính và 1
biến định lượng người ta thường sử dụng phân tích phương sai (phân phối
chuẩn, phương sai bằng nhau, mẫu độc lập) hoặc kiểm định phi tham số
(Kruskal-Wallis)
Nhưng khi muốn kiểm định có hay không sư phụ thuộc giữa 2 biến định tính thì
ta không thể sử dụng các phương pháp trên, mà chỉ có thể sử dụng kiểm định
phi tham số (Kiểm định “Chi- bình phương)
Bước 1: Xây dựng cặp giả thuyết

19
Mr_U_Giảng viên PTDLKD 7/6/2023

r là s nhóm tính cht ca nhóm bin nh tính 1


c là s nhóm tính cht ca nhóm bin nh tính 2

Bước 2: Tính giá trị kiểm định

với
-
- Oij là tần số quan sát thực tế của ô ở địa chỉ ij
- Eij là tần số lý thuyết của ô ở địa chỉ ij
- r là số hàng của bảng; c là số cột của bảng
Bước 3: So sánh và kết luận

Nếu chấp nhận H0 và ngược lại

7/5/2023

Ví dụ 3.5 Một nghiên cứu được thực hiện nhằm xem xét mối liên hệ giữa giới
tính và sự ưa thích các nhãn hiệu nước giải khát. một mẫu ngẫu nhiên 2425
người tiêu dùng với các nhãn hiệu nước giải khát được ưa thích như sau:
Nhãn hiệu ưa thích Coca Pepsi 7Up Tổng
Giới tính
Nam 308 177 114 599
Nữ 502 627 697 1826
Tổng số 810 804 811 2425

Bước 1: Xây dựng cặp giả thuyết


H0: Giới tính và Sự ưa thích các nhãn hiệu giải khát độc lập
H1: Giới tính và Sự ưa thích các nhãn hiệu giải khát không độc lập

20
Mr_U_Giảng viên PTDLKD 7/6/2023

Bước 2: Tính giá trị kiểm định


Nhãn hiệu ưa thích Coca Pepsi 7Up Tổng
Giới tính
Nam 308 177 114
(E11=200.1) (E12=198.6) (E13= 200.3) 599
Nữ 502 627 697
(E21=609.9) (E22=605.4) (E23=610.7) 1826
Tổng số 810 804 811 2425

Bước 3: Vì
ta bác bỏ H0

Lưu ý: Các bước 2, 5 thường được tính sẵn trong phần mềm SPSS

21
Mr_U_Giảng viên PTDLKD 7/6/2023

HOMERWORK 3.8 Làm bài 6.1; 6.2 trong sách Thống kê ứng dụng, p.342
HOMEWORK 3.9 Làm bài 12.22 - 12.24, trong sách “Basic Business
Statistics Concepts and Applications”, p. 473.
HOMEWORK 3.10 (GROUP) Làm bài 12.25- 12.26, trong sách “Basic
Business Statistics Concepts and Applications”, p. 474.

7/5/2023

3.5 Kiểm định “Chi-bình phương”


Trường hợp 2: Kiểm định quy luật phân phối xác suất
Ý tưởng: Để khẳng định một biến ngẫu nhiên X tuân theo một quy luật phân
phối xác suất (chuẩn, nhị thức, poisson, đều,…) ta cần thực hiện kiểm định đgl
kiểm định quy luật phân phối xuất
Bước 1: Xây dựng cặp giả thuyết
Ho: X tuân theo phân phối xác suất đã cho
H1: X không tuân theo phân phối xác suất đã cho
Bước 2: Gọi pi = P(X=xi) là xác suất của X tại giá trị xi nếu X là biến ngẫu
nhiên rời rạc; khi X là biến ngẫu nhiên liên tục thì pi = P(xi-1≤ X ≤ xi)
Bước 3: Tính giá trị kiểm định

22
Mr_U_Giảng viên PTDLKD 7/6/2023

trong đó
- k là số nhóm tính chất
- n là cỡ mẫu
- ni là số phần tử ứng với giá trị xi
Bước 4: So sánh và kết luận
Nếu χ20 ≤ χ2k-1,α thì chấp nhận H0 và ngược lại
Lưu ý:
- χ2k-1,α là giá trị tra trong bảng tra Chi bình phương (SGK, P.391)
- Điều kiện để áp dụng tiêu chuẩn phù hợp theo K. Pearson là khi các tần số
quan sát ứng với một giá trị quan sát ni ≥ 5. Nếu các ni quá nhỏ thì phải
ghép các giá trị hay khoảng các giá trị của mẫu lại để ni tăng lên.

* Kiểm định BNN X tuân theo phân phối xác suất đều
Ví dụ 3.6 Ở một bar có 4 nhãn hiệu bia khác nhau. 160 khách hàng được chọn
khảo sát ngẫu nhiên cho thấy sự lựa chọn về các nhãn hiệu như sau:

Nhãn hiệu A B C D
Số khách hàng 34 46 29 51
Có thể kết luận sự ưa chuộng của khách hàng về 4 loại bia là như nhau được
không ở mức ý nghĩa 5%?
Nhận xét: Nếu sự ưa chuộng của khách hàng về 4 loại bia là như nhau ~ xác
suất khách uống bia tại mỗi nhãn hiệu là bằng nhau và là 25%. Đây chính là bài
toán kiểm định BNN X tuân theo phân phối xác suất đều
Bước 1: Xây dựng cặp giả thuyết
Ho: X tuân theo phân phối xác suất đều ~ Bốn loại bia cùng xác suất ưa thích
H1: X không tuân theo phân phối xác suất đều ~ Bốn loại bia không cùng xác
suất ưa thích

23
Mr_U_Giảng viên PTDLKD 7/6/2023

Bước 2: pi là xác suất ưa thích loại bia thứ i (i =A, B, C, D)


Nhận xét: Theo H0 thì pi =25% trên mỗi loại bia
Bước 3: Tính giá trị kiểm định

Bước 4: Vì χ20 =7.85 > χ23; 005 = 7.81 nên ta bác bỏ Ho


Kết luận : Với mức ý nghĩa 5%, có sự khác biệt về mức độ ưa thích 4 loại bia

* Kiểm định BNN X tuân theo phân phối chuẩn


Cách 1: Áp dụng Kiểm định “Chi- bình phương"
Cách 2: Sử dụng tiêu chuẩn Kiểm định Jarque-Bera
Bước 1: Xây dựng cặp giả thuyết
Ho: X tuân theo phân phối chuẩn
H1: X không tuân theo phân phối chuẩn
Bước 2: Tính giá trị kiểm JB (Jarque-Bera)
Skewness Kurtosis

24
Mr_U_Giảng viên PTDLKD 7/6/2023

Bước 4: So sánh và kết luận


Nếu JB > χ2n;α thì ta bác bỏ H0 và ngược lại
Lưu ý: χ2n,α là giá trị tra trong bảng tra Chi bình phương (SGK, P.391)
Trong tính toán, để đỡ mất thời gian, tiêu chuẩn JB thường được tính sẵn trên
phần mềm SPSS như sau

Ví dụ 3.7 (Bài 3, Dạng 2, SGK Thống kê ứng dụng P.339)


Cách 2: Sử dụng tiêu chuẩn Kiểm định Jarque-Bera

25
Mr_U_Giảng viên PTDLKD 7/6/2023

Bước 4: So sánh và kết luận


Nếu JB < χ2200;0.01 =249.4 thì ta chấp nhận H0
Kết luận: Với mức ý nghĩa 1% thì X tuân theo phân phối chuẩn

TÓM TẮT KIẾN THỨC CHƯƠNG 3


1. Cần phân biệt rõ khi nào sử dụng kiểm định tham số (biến ngẫu nhiên tuân
theo phân phối chuẩn,….) và kiểm định phi tham số (thang đo có độ tin cậy
thấp (Interval, Ordinal, Norminal), BNN không có giả thiết tuân theo phân phối
chuẩn (Ratio), mẫu nhỏ,…)
2. Nắm vững cách đặt giả thuyết cho kiểm định tham số, phi tham số , đặc biệt
là kiểm định 1 phía (trái, phải) và cách tra các bảng tra (Chi bình phương,
Fisher, dấu và hạng Wilconxon, tổng và hạng Wilconxon, Turkey)
3. Đối với kiểm định phi tham số cần phân biệt cách sử dụng kiểm định dấu
hạng Wilconxon, tổng hạng Wilconxon, Kruskall-Wallis và Chi-bình phương.

26
Mr_U_Giảng viên PTDLKD 7/6/2023

5. Kiểm định 1 phía (trái) là kiểm định mà vùng chấp nhận H1 là phía trái,
tương tự cho 1 phía (phải)

7/5/2023

27

You might also like