Professional Documents
Culture Documents
Ch3 2023-2024
Ch3 2023-2024
Chương 3
KIỂM ĐỊNH PHI THAM SỐ
Non-parametric test
Vi 1 bin X (numerical) có 3
Chương 3. KIỂM ĐỊNH PHI THAM SỐ
Tham s là mt giá tr i din cho d liu ca bin X, c th là:
tham s c trng:
- Muy x là giá tr trung bình ca bin X: ây là giá tr i din cho toàn b d liu ca bin X, nm trung
- Giá tr trung bình
tâm ca tp d liu;
- Xích ma bình
- Pa Nội dung chính - Xích ma bình (x) là giá tr i din cho mc bin ng (phân tán) ca bin X
- Pa là giá tr i din cho t l s phn t có tính cht a ca bin X
Các giá tr i din này (tham s - parametric) ch thc s tt khi và ch khi d liu ca bin X tuân theo
3.1 Khái niệm phân phi chun
3.2 Kiểm định dấu và hạng Wilconxon Trong thc t có rt nhiu numerical có d liu không tuân theo pp chun, ngha
là th lch trái hoc lch phi
Trường hợp 1: Kiểm định tính độc lập trên 2 biến định tính
Trường hợp 2: Kiểm định quy luật phân phối xác suất (đều, chuẩn) của
Biến ngẫu nhiên (BNN) X
1
Mr_U_Giảng viên PTDLKD 7/6/2023
2. Kiểm định sự sai khác trung bình 2. Kiểm định dấu và hạng Wilconxon
trên mẫu cặp Ho: muyd = muy1 - muy2 = muyo
trên mẫu cặp Ho: Medd = Med1 - Med2 = Medo
3. Kiểm định giá trị trung bình trên hai 3. Kiểm định tổng và hạng Wilconxon
mẫu độc lập Ho: Muy1 = muy2
trên hai mẫu độc lập Ho: Med1 = Med2
2
Mr_U_Giảng viên PTDLKD 7/6/2023
Kiểm định dấu và hạng Wilconxon Kiểm định sự sai khác trung bình trên
trên mẫu cặp mẫu cặp (tuân theo phân phối chuẩn)
- i vi các bài toán nu có gi nh X tuân theo pp chun thì mc nhiên là kim nh tham s (muyX là giá tr i din)
- Nu bài toán không nói gì n bin X có hay không tuân theo pp chun thì mc nhiên thì mc nhiên là kim nh phi tham s (MedX là
giá tr i din)
Mu cp là mu mà ta thu thp giá tr ca bin X trên 2 nhóm tính cht khác nhau ca bin X, rt ph bin trong QTKD và Mar, vi ch duy nht 1
mu
3
Mr_U_Giảng viên PTDLKD 7/6/2023
Lưu ý:
- Nếu |di| = 0 thì không được xếp hạng
- Nếu có nhiều giá trị |di| bằng nhau thì tính hạng trung bình cho các giá trị
này (mỗi phần tử này có hạng chính là hạng trung bình cộng)
Bước 4: Với các giá trị di > 0 thì ta đặt hạng của nó vào cột R+ và ngược lại thì
đặt vào R-
Bước 5: Tính giá trị kiểm định Wo
- Kiểm định 2 phía Wo= min { tổng hạng R+; tổng hạng R-}
- Kiểm định 1 phía (phải) Wo= { tổng hạng R+} ~ vùng chấp nhận H1 phải
- Kiểm định 1 phía (trái) Wo= { tổng hạng R-}~ vùng chấp nhận H1 trái
Bước 6: So sánh và kết luận
Lưu ý:
- WL (nhỏ) và WM (lớn) là 2 giá trị tra trong bảng tra Wilconxon dựa trên giá
trị tra bảng của kiểm định 2 phía (Wα/2, n’ ) và 1 phía (Wα, n’ )
- n' là số giá trị quan sát được xếp hạng
- Khi n > 20 thì giá trị kiểm định W0 sẽ được thay thế bằng giá trị kiểm định
Z0 (phân phối chuẩn) qua công thức
4
Mr_U_Giảng viên PTDLKD 7/6/2023
Ví dụ 3.1 Một mẫu ngẫu nhiên mức lương của 10 sinh viên cũ của trường được
chọn ra với giá trị được cho ở bảng sau:
Sinh viên 1 2 3 4 5 6 7 8 9 10
Mức lương 364 385 270 350 290 400 520 340 389 410
Với mức ý nghĩa 5% hãy cho kết luận về giả thiết cho rằng thu nhập sinh viên
tốt nghiệp sau khi ra trường làm việc vượt quá con số 350 đô la ?
Ví dụ 3.1 (tt)
Nhận xét: Đây là bài toán kiểm định phi tham số trên 1 mẫu vì không có giả
thiết lương tuân theo phân phối chuẩn
Bước 1: Cặp giả thuyết cần kiểm định
5
Mr_U_Giảng viên PTDLKD 7/6/2023
với giá trị tra bảng Wilconxon W0.05, n’=9 = (8; 37)
Kết luận: Với mức ý nghĩa 5%, không thể nói rằng thu nhập sinh viên tốt
nghiệp sau khi ra trường làm việc vượt quá con số 350 đô la
6
Mr_U_Giảng viên PTDLKD 7/6/2023
Lưu ý: Khi Med0 = 0 là kiểm định có hay không sự khác biệt theo 2 phương
phác khác nhau.
Bước 2: Tính giá trị sai lệnh giữa hai phương pháp di = xi – yi (i=1,…,n)
Bước 3: Lấy trị tuyệt đối các sai lệch |di| và xếp hạng các |di| này bắt đầu từ 1
Lưu ý:
- Nếu |di| = 0 thì không được xếp hạng
- Nếu có nhiều giá trị |di| bằng nhau thì tính hạng trung bình cho các giá trị
này (mỗi phần tử này có hạng chính là hạng trung bình cộng)
Bước 4: Với các giá trị di > 0 thì ta đặt hạng của nó vào cột R+ và ngược lại thì Mt trung tâm ngoi ng qung cáo rng
bt k ngi hc nào có im Ielts 5.0 nu
vào hc ti Trung tâm ch sau 3
đặt vào R- tháng s t c im ielts ít nht là 6.0. Vi
mc ý ngha 5%, bn hãy xây dng gi
thuyt kim nh qung cáo trên
Bước 5: Tính giá trị kiểm định Wo
- Kiểm định 2 phía Wo= min { tổng hạng R+; tổng hạng R-}
- Kiểm định 1 phía (phải) Wo= { tổng hạng R+}
- Kiểm định 1 phía (trái) Wo= { tổng hạng R-}
Bước 6: So sánh và kết luận
7
Mr_U_Giảng viên PTDLKD 7/6/2023
H0: Qung cáo úng <=> Med after - Med before > 1 = Med0
H1: Quáng cáo không úng <=> Med after - Med before <1 = Med0
Ví dụ 3.2 Mẫu 9 khách hàng được chọn ngẫu nhiên và yêu cầu họ cho biết sở
thích về 2 loại kem đánh răng cùng loại A, B thông qua thang điểm từ 1 (thấp
nhất) đến 5 (cao nhất). Kết quả thu thập số liệu như sau:
Khách hàng 1 2 3 4 5 6 7 8 9
Sản phẩm A 4 5 2 3 3 1 3 2 2
Sản phẩm B 3 5 5 2 5 5 3 5 5
Với mức ý nghĩa 5% hãy kiểm định giả thuyết rằng kem đánh răng A được ưa
thích hơn kém đánh răng B ?
8
Mr_U_Giảng viên PTDLKD 7/6/2023
Ví dụ 3.2 (tt)
Nhận xét: Đây là bài toán kiểm định phi tham số trên mẫu cặp vì không có giả
thiết điểm tuân theo phân phối chuẩn
Bước 1: Cặp giả thuyết cần kiểm định
trong đó
- Medd= MedA – MedB
- MedA là giá trị trung vị về điểm số của kem đánh răng A
- MedB là giá trị trung vị về điểm số của kem đánh răng B
Bước 2, 3 và 4 có thể làm chung trong bảng sau
Ví dụ 3.2 (tt)
Khách hàng 1 2 3 4 5 6 7 8 9 Tổng
Sản phẩm A(xA) 4 5 2 3 3 1 3 2 2
Sản phẩm B (xB) 3 5 5 2 5 5 3 5 5
di = xA – xB 1 0 -3 1 -2 -4 0 -3 -3
|di| 1 3 1 2 4 3 3
Hạng 1,5 5 1,5 3 7 5 5
R+ 1,5 1,5 3
R- 5 3 7 5 5 25
Bước 5: Tính giá trị kiểm định Wo
- Kiểm định 1 phía (phải) Wo= {tổng hạng R+} = 3
Bước 6: So sánh và kết luận
9
Mr_U_Giảng viên PTDLKD 7/6/2023
Kết luận: Với mức ý nghĩa 5%, không thể nói rằng khách hàng ưa thích sản
phẩm kem đánh răng A hơn B.
Lưu ý: Để thuận lợi trong tính toán, các giá trị (B2, 3, 4) thường được cho sẵn
ở bảng sau (tính trên phần mềm SPSS)
HOMEWORK 3.1 Làm bài 6.5; 6.6 trong sách Thống kê ứng dụng, p.343
7/5/2023
10
Mr_U_Giảng viên PTDLKD 7/6/2023
Kiểm định sự khác biệt trên 2 trung bình Kiểm định tổng và hạng Wilconxon (hai
(hai mẫu độc lập) mẫu độc lập)
Bước 1: Xây dựng cặp giả thuyết cần kiểm định phi tham số
Bước 2: Kết hợp mẫu 1 và mẫu 2 thành 1 mẫu gọi là mẫu kết hợp. Từ đó xếp
hạng các phần tử trên mẫu kết hợp bắt đầu từ 1
Lưu ý: Các phần tử trong mẫu kết hợp có giá trị bằng nhau thì tính hạng trung
bình cộng cho các giá trị này (mỗi phần tử này có hạng chính là hạng trung
bình cộng)
Bước 3: Tính tổng hạng (T0) mẫu có số phần tử ít hơn trên mẫu kết hợp
Lưu ý: Nếu hai mẫu có số phần tử bằng nhau thì tính mẫu nào cũng được
Bước 4: So sánh và kết luận
trong đó WL và WM được tìm dựa trên giá trị tra bảng Wilconxon đối với kiểm
định 2 phía (Wα/2; n1;n2 ) và 1 phía (Wα; n1;n2 )
11
Mr_U_Giảng viên PTDLKD 7/6/2023
Lưu ý: Khi n1, n2 > 20 thì giá trị kiểm định T0 sẽ được thay thế bằng giá trị
kiểm định Z0 (phân phối chuẩn) qua công thức
Ví dụ 3.3 Để kiểm định xem việc trưng bày hàng hóa có tác động đến doanh số
không người ta chọn ngẫu nhiên 2 mẫu, mẫu thứ 1 gồm 10 cửa hàng trưng bày
bình thường, mẫu thứ 2 cũng gồm 10 cửa hàng trưng bày đặc biệt sau đó quan
sát doanh số của các cửa hàng này (đơn vị: triệu đồng/tháng). Với giả định
doanh số không có phân phối chuẩn, hãy kiểm định xem có hay không sự
khác biệt giữa hai cách trung bày này với mức ý nghĩa 5%.
trong đó Med1,Med2 lần lượt là doanh số bán theo trung vị của 2 cách trưng bày
bình thường và đặc biệt
12
Mr_U_Giảng viên PTDLKD 7/6/2023
Bước 2: Kết hợp mẫu 1 và mẫu 2 thành 1 mẫu gọi là mẫu kết hợp. Từ đó xếp
hạng các phần tử trên mẫu kết hợp bắt đầu từ 1
Doanh số Hạng kết hợp Doanh số Hạng kết hợp
22 1 66 12
30 2 67 13
34 3 71 14
40 4 72 15
52 5,5 77 16
52 5,5 83 17
54 7 84 18,5
56 8 84 18,5
59 9 90 20
62 10
64 11
với giá trị tra bảng Wilconxon là Wα/2; n1;n2 = W0.025; 10;10 = (78; 132)
Kết luận: Với mức ý nghĩa 0,05 có sự khác biệt về doanh số giữa trưng bày bình
thường và trưng bày đặc biệt
Lưu ý: Bước 2, 3 có thể được tính sẵn trên phần mềm SPSS như sau
13
Mr_U_Giảng viên PTDLKD 7/6/2023
HOMERWORK 3.2 Làm bài 6.3 trong sách Thống kê ứng dụng, p.343
HOMEWORK 3.3 Làm bài 12.49 – 12.57, trong sách “Basic Business
Statistics Concepts and Applications”, p. 498- 499.
HOMEWORK 3.4 (GROUP) Làm bài 12.58- 12.62 , trong sách “Basic
Business Statistics Concepts and Applications”, p. 498- 499.
7/5/2023
14
Mr_U_Giảng viên PTDLKD 7/6/2023
Bước 5: Tính hạng trung bình cho từng nhóm cần kiểm định
& tính hạng chênh lệch trung bình cho từng nhóm cần kiểm định
Bước 6: Tính giá trị kiểm định (Cij) cho từng cặp kiểm định
15
Mr_U_Giảng viên PTDLKD 7/6/2023
Ví dụ 3.4 Để kiểm định xem việc làm thêm có ảnh hưởng đến kết quả học tập
không người ta chọn ngẫu nhiên một số sinh viên và hỏi họ về kết quả học tập
với thời gian làm thêm trong các khoảng : < 8 giờ/tuần; 8 – 16 giờ/tuần; >16
giờ/tuần. Nếu các giả định về các tổng thể có phân phối chuẩn và phương sai
bằng nhau không được thỏa mãn thì hãy sử dụng kiểm định phi tham số với
mức ý nghĩa 5% cho biết việc làm thêm có ảnh hưởng kết quả học tập ko?
Thời gian làm thêm Thời gian làm thêm Thời gian làm thêm
< 8h ( 8h – 16h) ( >16h)
6,3 7,0 6,3
7,2 6,6 5,8
6,5 6,1 6,0
6,6 5,8 5,5
7,3 6,8 5,3
7,1 6,5
Ví dụ 3.4 (tt)
Thời gian làm thêm Hạng kết hợp Thời gian làm thêm Hạng kết hợp
5.3 1 6.6 11.5
5.5 2 6.6 11.5
5.8 3.5 6.8 13
5.8 3.5 7.0 14
6.0 5 7.1 15
6.1 6 7.2 16
6.3 7.5 7.3 17
6.3 7.5
6.5 9.5
6.5 9.5
16
Mr_U_Giảng viên PTDLKD 7/6/2023
Kết luận: Với mức ý nghĩa 0.05 thời gian làm thêm có ảnh hưởng đến kết quả
học tập
Bước 4:
Bước 5:
Bước 5 (tt)
Bước 6:
17
Mr_U_Giảng viên PTDLKD 7/6/2023
Lưu ý: Các bước 2, 5 thường được tính sẵn trong phần mềm SPSS
7/5/2023
18
Mr_U_Giảng viên PTDLKD 7/6/2023
HOMEWORK 3.5 Làm bài 12.65 – 12.67, trong sách “Basic Business
Statistics Concepts and Applications”, p. 504.
HOMERWORK 3.6 Làm bài 6.T1 – 6.T6 trong sách Thống kê ứng dụng,
p.346
HOMEWORK 3.7 (GROUP) Làm bài 12.68- 12.70 , trong sách “Basic
Business Statistics Concepts and Applications”, p. 505.
7/6/2023
19
Mr_U_Giảng viên PTDLKD 7/6/2023
với
-
- Oij là tần số quan sát thực tế của ô ở địa chỉ ij
- Eij là tần số lý thuyết của ô ở địa chỉ ij
- r là số hàng của bảng; c là số cột của bảng
Bước 3: So sánh và kết luận
7/5/2023
Ví dụ 3.5 Một nghiên cứu được thực hiện nhằm xem xét mối liên hệ giữa giới
tính và sự ưa thích các nhãn hiệu nước giải khát. một mẫu ngẫu nhiên 2425
người tiêu dùng với các nhãn hiệu nước giải khát được ưa thích như sau:
Nhãn hiệu ưa thích Coca Pepsi 7Up Tổng
Giới tính
Nam 308 177 114 599
Nữ 502 627 697 1826
Tổng số 810 804 811 2425
20
Mr_U_Giảng viên PTDLKD 7/6/2023
Bước 3: Vì
ta bác bỏ H0
Lưu ý: Các bước 2, 5 thường được tính sẵn trong phần mềm SPSS
21
Mr_U_Giảng viên PTDLKD 7/6/2023
HOMERWORK 3.8 Làm bài 6.1; 6.2 trong sách Thống kê ứng dụng, p.342
HOMEWORK 3.9 Làm bài 12.22 - 12.24, trong sách “Basic Business
Statistics Concepts and Applications”, p. 473.
HOMEWORK 3.10 (GROUP) Làm bài 12.25- 12.26, trong sách “Basic
Business Statistics Concepts and Applications”, p. 474.
7/5/2023
22
Mr_U_Giảng viên PTDLKD 7/6/2023
trong đó
- k là số nhóm tính chất
- n là cỡ mẫu
- ni là số phần tử ứng với giá trị xi
Bước 4: So sánh và kết luận
Nếu χ20 ≤ χ2k-1,α thì chấp nhận H0 và ngược lại
Lưu ý:
- χ2k-1,α là giá trị tra trong bảng tra Chi bình phương (SGK, P.391)
- Điều kiện để áp dụng tiêu chuẩn phù hợp theo K. Pearson là khi các tần số
quan sát ứng với một giá trị quan sát ni ≥ 5. Nếu các ni quá nhỏ thì phải
ghép các giá trị hay khoảng các giá trị của mẫu lại để ni tăng lên.
* Kiểm định BNN X tuân theo phân phối xác suất đều
Ví dụ 3.6 Ở một bar có 4 nhãn hiệu bia khác nhau. 160 khách hàng được chọn
khảo sát ngẫu nhiên cho thấy sự lựa chọn về các nhãn hiệu như sau:
Nhãn hiệu A B C D
Số khách hàng 34 46 29 51
Có thể kết luận sự ưa chuộng của khách hàng về 4 loại bia là như nhau được
không ở mức ý nghĩa 5%?
Nhận xét: Nếu sự ưa chuộng của khách hàng về 4 loại bia là như nhau ~ xác
suất khách uống bia tại mỗi nhãn hiệu là bằng nhau và là 25%. Đây chính là bài
toán kiểm định BNN X tuân theo phân phối xác suất đều
Bước 1: Xây dựng cặp giả thuyết
Ho: X tuân theo phân phối xác suất đều ~ Bốn loại bia cùng xác suất ưa thích
H1: X không tuân theo phân phối xác suất đều ~ Bốn loại bia không cùng xác
suất ưa thích
23
Mr_U_Giảng viên PTDLKD 7/6/2023
24
Mr_U_Giảng viên PTDLKD 7/6/2023
25
Mr_U_Giảng viên PTDLKD 7/6/2023
26
Mr_U_Giảng viên PTDLKD 7/6/2023
5. Kiểm định 1 phía (trái) là kiểm định mà vùng chấp nhận H1 là phía trái,
tương tự cho 1 phía (phải)
7/5/2023
27