You are on page 1of 141

NGUYÊN LÝ KIỂM ĐỊNH

KIỂM ĐỊNH THỐNG KÊ

1
TS. Nguyễn Thị Minh Trang
Bộ môn Thống kê – Khoa Y tế Công cộng
Đại học Y Dược TPHCM
Email: drminhtrang@gmail.com
25/10/2022
NỘI DUNG

1 • Khái niệm kiểm định giả thuyết

2 • Khái niệm P value

3 • Sai lầm và lực thống kê

4 • Chọn lựa phương pháp thống kê

5 • Kiểm định biến định tính

6 • Kiểm định biến định lượng


25/10/2022 2
➢ GIẢ THUYẾT (GT)
1 KHÁI NIỆM
➢ KIỂM ĐỊNH GT

Giả thuyết: Hypothesis


Kiểm định giả thuyết: Hypothesis testing
25/10/2022
KHÁI NIỆM GIẢ THUYẾT NGHIÊN CỨU

Giả thuyết nghiên cứu:


Mệnh đề có thể kiểm định được về việc dự đoán mối liên
quan giữa 2 hoặc nhiều biến số với nhau.

4
KHÁI NIỆM GIẢ THUYẾT NGHIÊN CỨU

Ví dụ:
Nghiên cứu về mối liên quan giữa mất ngủ và điểm số thi
có giả thuyết nghiên cứu là
“Những người mất ngủ sẽ có điểm số thi thấp hơn
những người ngủ đủ giấc”

5
KHÁI NIỆM GIẢ THUYẾT NGHIÊN CỨU

Ví dụ:

▪ Nghiên cứu về mối liên quan giữa tiền căn gia đình về

K vú và K vú

-> Giả thuyết của NC này là:

……………………………………………………………….

▪ Note: lưu ý về loại biến số nghiên cứu

6
KHÁI NIỆM GIẢ THUYẾT HO - HA

• Ho (o: null hypothesis):

• Không có sự liên hệ thống kê nào giữa 2 yếu tố đang


xem xét.

• Ha (a: alternative):

• Giả thuyết thay thế hay đảo thuyết.

• Có mối liên quan có ý nghĩa thống kê giữa 2 yếu tố


đang xem xét.
25/10/2022 7
KHÁI NIỆM GIẢ THUYẾT HO - HA

• Ho: Không có sự khác biệt về điểm số thi giữa 2 nhóm


người mất ngủ và ngủ đủ giấc
• Ha:
• Có mối liên quan giữa giấc ngủ và điểm thi
Hoặc
• Có sự khác biệt về điểm thi giữa 2 nhóm người
mất ngủ và ngủ đủ giấc

8
KHÁI NIỆM GIẢ THUYẾT HO - HA

Ví dụ:

Nghiên cứu về mối liên quan giữa tiền căn gia đình về
K vú và K vú

-> Ho:
……………………………………………………………….
-> Ha:
……………………………………………………………….
25/10/2022 9
Note: lưu ý về loại biến số nghiên cứu
QUI TRÌNH KIỂM ĐỊNH GIẢ THUYẾT

1. Xây dựng giả thuyết Ho

2. Chọn lựa kiểm định thích hợp

3. Tính giá trị thống kê của kiểm định đã chọn

4. Tính xác suất thống kê (giá trị P) từ giá trị thống kê

tính được

5. Nêu kết luận dựa trên giá trị P (P-value)

25/10/2022 10
QUI TRÌNH KIỂM ĐỊNH GIẢ THUYẾT

▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia đình có

K vú và mắc K vú. Giả sử tỷ lệ K vú quan sát trong mẫu NC


cho nhóm có tiền căn là 5% và nhóm không có tiền căn là 2%.

▪ Các bước xây dựng kiểm định thống kê

1. Xây dựng GT Ho:

Không có mối liên hệ giữa tiền căn gđ và K vú hay

Tỷ lệ K vú/ nhóm tiền căn gđ = Tỷ lệ K vú/ không tiền căn


25/10/2022 11
P1=P2
QUI TRÌNH KIỂM ĐỊNH GT

▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia

đình có K vú và mắc K vú. Giả sử tỷ lệ K vú quan sát


trong mẫu NC cho nhóm có tiền căn là 5% và nhóm
không có tiền căn là 2%.

▪ Các bước xây dựng kiểm định thống kê

2. Chọn kiểm định phù hợp:

Kiểm định Chi bình phương để so sánh 2 tỷ lệ


25/10/2022 12
QUI TRÌNH KIỂM ĐỊNH GT

▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia

đình có K vú và mắc K vú. Giả sử tỷ lệ K vú quan sát


trong mẫu NC cho nhóm có tiền căn là 5% và nhóm
không có tiền căn là 2%.

▪ Các bước xây dựng kiểm định thống kê

3. Tính giá trị thống kê của kiểm định đã chọn

Giá trị thống kê của Chi bình phương là χ2


25/10/2022 13
QUI TRÌNH KIỂM ĐỊNH GT

▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia

đình có K vú và mắc K vú. Giả sử tỷ lệ K vú quan sát


trong mẫu NC cho nhóm có tiền căn là 5% và nhóm
không có tiền căn là 2%.

▪ Các bước xây dựng kiểm định thống kê

4. Tính xác suất thống kê (giá trị P) từ giá trị thống kê tính
được

Tra bảng χ2 theo độ tự do hoặc dùng phần mềm thống kê


25/10/2022 14
QUI TRÌNH KIỂM ĐỊNH GT
▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia

đình có K vú và mắc K vú. Giả sử tỷ lệ K vú quan sát


trong mẫu NC cho nhóm có tiền căn là 5% và nhóm
không có tiền căn là 2%.

▪ Các bước xây dựng kiểm định thống kê

5. Kết luận

Giả sử P(K vú /Ho) <0.001: nếu tỷ lệ K vú ở nhóm có và


không có tiền căn là như nhau thì xác suất có được sự
khác biệt như chúng ta quan sát thấy là nhỏ hơn 1/1000.
25/10/2022 15
QUI TRÌNH KIỂM ĐỊNH GT
▪ Các bước xây dựng kiểm định thống kê

5. Kết luận

Giả sử P(K vú /Ho) <0.001: nếu Ho đúng hay tỷ lệ K vú ở


nhóm có và không có tiền căn là như nhau thì xác suất có
được sự khác biệt như chúng ta quan sát thấy là nhỏ hơn
1/1000.

Xác suất này rất thấp nếu Ho đúng. Do đó, có khả


năng Ho không đúng => Bác bỏ GT Ho
25/10/2022 16
2 KHÁI NIỆM P VALUE

P: Probability

25/10/2022
KHÁI NIỆM VỀ P-VALUE

• Nghiên cứu về tiền căn gia đình và Ung thư vú


• Giả sử tỷ lệ mắc Ung thư vú ở phụ nữ không có tiền căn
gia đình là 2%
• Câu hỏi: Vậy phụ nữ có tiền căn gia đình bị K vú có tỷ lệ
bị K vú khác so với tỷ lệ trên không?
• Đặt giả thuyết Ho và Ha
𝐻0 : 𝑝 = 0.02
𝐻𝐴 : 𝑝 ≠ 0.02

18
KHÁI NIỆM VỀ P-VALUE

• Chọn 𝑁 = 100 phụ nữ có tiền căn gia đình bị K vú


• Quan sát 𝑋 = # phụ nữ trong nhóm này bị K vú
• Chú ý: Nếu GT 𝐻0 is đúng, chúng ta trông đợi rằng số
phụ nữ này tương tự như số phụ nữ không có tiền căn
gia đình
• Cụ thể, chúng ta trông đợi rằng 2 trong số 100 người phụ
nữ này bị K vú (dựa theo 𝐻0 : 𝑝 = 0.02)
• Giả sử chúng ta quan sát thấy 𝑋 = 5 ca K vú (5%)

19
KHÁI NIỆM VỀ P-VALUE
Câu hỏi:

Khả năng chúng ta quan sát được (𝑋 = 5) trong khi chúng ta kì


vọng X=2 là bao nhiêu?

Hoặc, xác suất chúng ta quan sát được từ 5 ca bị K vú trong khi


chúng ta kì vọng chỉ 2 ca là bao nhiêu?

𝑃(𝑋 ≥ 5 | 𝐻0 : p = 0.02 đúng)?

Trả lời: 𝑃 𝑋 ≥ 5 𝑝 = 0.02) = 1 − 𝑃 𝑋 < 5 𝑝 = 0.02) =


4
𝑁!
1−෍ × 𝑝𝑐 × 𝑞 𝑁−𝑐 =
𝑐! × 𝑁 − 𝑐 !
𝑐=0
100! 0 100
100!
1− × 0.02 × 0.98 +⋯ × 0.024 × 0.9896 =
0! × 100! 4! × 96!
20
1 − 0.1326 + ⋯ 0.0902 = 0.0508 (khoảng 1/20)
KHÁI NIỆM VỀ P-VALUE

Khái niệm: 𝟎. 𝟎𝟓𝟎𝟖 là giá trị P , hay P value (p=0.0508)

Giải thích: Nếu GT Ho đúng (không có mối liên quan giữa tiền
căn gđ và K vú), cơ hội quan sát thấy có từ 5 ca trở lên trong
số 100 phụ nữ có tiền căn gia đình là 1/20.

Qui ước chung:

P<0,05: Bác bỏ Ho

21
KHÁI NIỆM VỀ P-VALUE

● Giá trị P (P-value) đo lường khả năng (xác suất) quan


sát được 1 giá trị khác với giá trị kì vọng (expected) nếu
giả thuyết H0 đúng
● Giá trị P nhỏ có ý nghĩa là giá trị quan sát được là bất
thường nếu GT Ho đúng
=> Bác bỏ Ho
● Giá trị P lớn có ý nghĩa là giá trị quan sát được không
phải là bất thường khi GT Ho đúng.
=> Chấp nhận Ho

22
➢ CÁC LOẠI SAI LẦM
3
➢ LỰC THỐNG KÊ

Sai lầm loại 1, loại 2: Type I, type II error


Lực thống kê: Power
25/10/2022
CÁC SAI LẦM (ERROR)

▪ Trong NC thống kê, không thể kết luận chắc chắn về

kết quả.

▪ Nhà nghiên cứu có thể mắc 2 loại sai lầm khi kết luận:

✓Bác bỏ giả thuyết Ho

✓Không bác bỏ giả thuyết Ho

với 1 xác suất nào đó.

25/10/2022 24
SAI LẦM LOẠI 1: TYPE I ERROR

▪ Ký hiệu: α

▪ Là xác suất bác bỏ giả thuyết Ho trong khi Ho đúng

▪ Qui ước:

✓Phổ biến: chọn α=0.05

✓Ít phổ biến: chọn α=0.01

25/10/2022 25
SAI LẦM LOẠI 1: TYPE I ERROR

▪ Ví dụ:

NC về mối liên quan giữa tiền căn gđ bị K vú và K vú

Ho: P(K vú/tiền căn) = P(K vú/không tiền căn)

Ha: P(K vú/tiền căn)  P(K vú/không tiền căn)

Sai lầm α là xác suất cho rằng tiền căn gia đình có liên quan
với K vú (GT Ha) trong khi thực tế không có mối liên quan
(GT Ho). 25/10/2022 26
SAI LẦM LOẠI 1: TYPE I ERROR

K vú (+) K vú (-)
Tiền căn gđ (+) Sai lầm loại I (α)
Tiền căn gđ (-)

Sai lầm loại I (α) là sai lầm cho rằng tiền căn gia đình có
liên quan với K vú (GT Ha) trong khi thực tế không có
mối liên quan (GT Ho).

*Xem tiền căn gia đình như 1 yếu tố nguy cơ, tương tự
1 “test” tầm soát 25/10/2022 27
SAI LẦM LOẠI 2: TYPE II ERROR

▪ Ký hiệu: β

▪ Là xác suất không bác bỏ giả thuyết Ho khi Ho không

đúng

▪ Qui ước

▪ Phổ biến: chọn β=0.2

▪ Ít phổ biến: chọn β=0.1

25/10/2022 28
SAI LẦM LOẠI 2: TYPE II ERROR

▪ Ví dụ:

NC về mối liên quan giữa tiền căn gđ bị K vú và K vú

Ho: P(K vú/tiền căn) = P(K vú/không tiền căn)

Sai lầm β là xác suất cho rằng tiền căn gia đình không
có liên quan với K vú (GT Ho) trong khi thực tế có mối
liên quan (GT Ha).

25/10/2022 29
SAI LẦM LOẠI 2: TYPE 2 ERROR

K vú (+) K vú (-)
Tiền căn gđ (+)
Tiền căn gđ (-) Sai lầm loại II (β)

Sai lầm loại II (β) là sai lầm cho rằng tiền căn gia đình
không có liên quan với K vú (GT Ho) trong khi thực tế
có mối liên quan (GT Ha).

25/10/2022 30
LỰC THỐNG KÊ: POWER

▪ Power=1-β

▪ Là xác suất bác bỏ Ho khi Ho không đúng

▪ Được sử dụng khi tính cỡ mẫu cho mục tiêu kiểm định

giả thuyết.

▪ Qui ước:

✓Phổ biến: power=0.8 (β=0.2)

✓Ít phổ biến: power=0.9 (β=0.1)


25/10/2022 31
LỰC THỐNG KÊ: POWER

K vú (+) K vú (-)
Tiền căn gđ (+) Power
Tiền căn gđ (-) β

▪ Là xác suất cho rằng tiền căn gia đình có liên quan

đến K vú (bác bỏ Ho) khi thực tế có mối liên quan này


(Ho không đúng).

25/10/2022 32
CÁC SAI LẦM VÀ POWER

NC về tiền căn gđ và K vú

K vú (+) K vú (-)
Tiền căn gđ (+) Dương tính thật Dương tính giả
Độ nhạy (Power) Sai lầm loại I (α)
Tiền căn gđ (-) Âm tính giả Âm tính thật
Sai lầm loại II (β) Độ đặc hiệu

25/10/2022 33
CÁC SAI LẦM VÀ POWER
Trong NC về test chẩn đoán:

K vú (+) K vú (-)
Test chẩn đoán (+) Dương tính thật Dương tính giả
Độ nhạy (Power) Sai lầm loại I (α)
Test chẩn đoán (-) Âm tính giả Âm tính thật
Sai lầm loại II (β) Độ đặc hiệu

25/10/2022 34
4 CHỌN PHƯƠNG PHÁP
THỐNG KÊ PHÂN TÍCH

25/10/2022
CHỌN PP THỐNG KÊ PHÂN TÍCH

▪ Xác định loại biến kết cuộc (biến phụ thuộc) và biến

giải thích/ tiên lượng (biến độc lập):


✓Biến định lượng

✓Biến phân loại

o Nhị giá

o Danh định

o Thứ tự
25/10/2022 36
CHỌN PP THỐNG KÊ PHÂN TÍCH
Các nhóm so sánh độc lập: các đối tượng nghiên cứu khác nhau

Biến phụ Biến độc lập


thuộc Nhị giá >2 nhóm Định lượng
Nhị giá Chi2/Fisher Chi2/Fisher Hồi qui Logistic Nhị giá
Danh định Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Danh định
Thứ tự Wilcoxon Kruskal Hồi qui Logistic
Rank sum Wallis Thứ tự
(Mann Whitney)
Định lượng T 2 nhóm độc lập ANOVA Tương quan Pearson/
(phân phối Hồi qui tuyến tính
chuẩn)
Định lượng Wilcoxon Kruskal Tương quan
(phân phối lệch) Rank sum Wallis Spearman
(Mann Whitney) 25/10/2022 37
CHỌN PP THỐNG KÊ PHÂN TÍCH
Các nhóm so sánh không độc lập: đo lường lặp

Biến phụ thuộc Biến độc lập


Nhị giá > 2 nhóm Định lượng
Nhị giá McNemar-Bowker/ GEE
McNemar
Stuart Maxwell
Danh định McNemar-Bowker/ McNemar-Bowker/ GEE
Stuart Maxwell Stuart Maxwell
Thứ tự Wilcoxon Friedman test GEE
Signed rank
Định lượng (phân T bắt cặp ANOVA lặp/GEE GEE /Mixed Model
phối bình thường)
Định lượng (phân Wilcoxon Friedman test GEE/ GLMM38
25/10/2022

phối lệch) Signed rank


5 KIỂM ĐỊNH
BIẾN KẾT CUỘC ĐỊNH TÍNH

• Chi bình phương (Chi-squared test)


• Fisher’s Exact Test

25/10/2022
CHỌN PP THỐNG KÊ PHÂN TÍCH
Khi các nhóm so sánh độc lập:

Biến phụ Biến độc lập


thuộc Nhị giá >2 nhóm Định lượng
Nhị giá Chi2/Fisher Chi2/Fisher Hồi qui Logistic Nhị giá
Danh định Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Danh định
Thứ tự Wilcoxon Kruskal Hồi qui Logistic
Rank sum Wallis Thứ tự
(Mann Whitney)
Định lượng T 2 nhóm độc lập ANOVA Tương quan Pearson/
(phân phối Hồi qui tuyến tính
chuẩn)
Định lượng Wilcoxon Kruskal Tương quan
(phân phối lệch) Rank sum Wallis Spearman
(Mann Whitney) 25/10/2022 40
MỤC ĐÍCH

Kiểm định Chi bình phương được sử dụng để xác


định

❖ Có hay không mối liên quan có ý nghĩa thống kê

❖ Giữa 2 biến số định tính (nhị giá/ phân loại).

41
VÍ DỤ

Nghiên cứu về các yếu tố liên quan đến tiểu đường típ 2.

Câu hỏi:

Các yếu tố như chủng tộc, béo phì, hút thuốc lá, uống rượu,
ít vận động thể lực có liên quan đến việc mắc phải tiểu
đường típ 2 ở cộng đồng nghiên cứu hay không?

42
VÍ DỤ

Nghiên cứu về các yếu tố liên quan đến tiểu đường típ 2.

Biến số độc lập Giá trị biến số Loại biến số


(yếu tố liên quan)
Giới tính Nam, nữ Danh định
Béo phì Có, không Nhị giá
Hút thuốc lá Có, không Nhị giá
Uống rượu bia Có, không Nhị giá
Vận động thể lực Ít, trung bình, nhiều Thứ tự
Biến số phụ thuộc
(kết cuộc)
Tiểu đường típ 2 Có, không Nhị giá
43
BẢNG PHÂN PHỐI TẦN SUẤT

▪ Bảng phân phối tần suất còn được gọi là bảng dự


trù.

▪ Bảng dự trù r  c biểu diễn tần số quan sát của 2


biến số.

▪ R: row_hàng; C: column_cột

44
BẢNG PHÂN PHỐI TẦN SUẤT

Nghiên cứu về các yếu tố liên quan đến tiểu đường típ 2: Giới tính

Tiểu đường típ 2


Giới Tổng
Có Không
Nam 3487 5994 9481
Nữ 4678 7527 12205
Tổng 8165 13521 21686

Bảng dự trù 2 hàng x 2 cột

45
TẦN SỐ KÌ VỌNG (VỌNG TRỊ)

❖ Vọng trị là giá trị kì vọng quan sát được trong các ô
của bảng dự trù khi chưa thu thập dữ liệu thực tế.

❖ Giả sử 2 biến số khảo sát độc lập, có thể dùng


bảng dự trù để tính giá trị kì vọng của mỗi ô trong
bảng.

Tính vọng trị cho các ô trong bảng dự trù


Er,c: vọng trị (tần số kì vọng)
(Sum of row r )  (Sum of column c )
Expected frequency E = r ,c .
Sample size
VỌNG TRỊ (EXPECTED)

Tiểu đường típ 2


Giới Tổng
Có (cột 1) Không (cột 2)
Nam (hàng 1) 3487 5994 9481
Nữ (hàng 2) 4678 7527 12205
Tổng 8165 13521 21686

Vọng trị của ô (1,1) (ô giao của hàng 1 và cột 1): E(1,1)

E(1,1)=

47
VỌNG TRỊ (EXPECTED)

Tiểu đường típ 2


Giới Tổng
Có (cột 1) Không (cột 2)
Nam (hàng 1) 3487 5994 9481
Nữ (hàng 2) 4678 7527 12205
Tổng 8165 13521 21686

Vọng trị của ô (1,1) (ô giao của hàng 1 và cột 1): E(1,1)

E(1,1)=(9481x8165)/21686=3570
E(1,2)=(9481x13521)/21686=5911
E(2,1)=(12205x8165)/21686=4595
48
E(2,2)=(12205x13521)/21686=7609
VỌNG TRỊ (EXPECTED)

Tiểu đường típ 2


Giới Tổng
Có (cột 1) Không (cột 2)
Nam (hàng 1) 3487 (3570) 5994 (5911) 9481
Nữ (hàng 2) 4678 (4595) 7527 (7609) 12205
Tổng 8165 13521 21686

Vọng trị: số màu đỏ trong ngoặc đơn trông các ô của bảng
dự trù

49
GIẢ ĐỊNH CỦA KIỂM ĐỊNH Χ2

❖Mẫu nghiên cứu là mẫu ngẫu nhiên

❖Các biến số là biến định tính (phân loại)

❖Vọng trị trong các ô của bảng phân phối tần suất ≥ 5

50
CÁC BƯỚC HÌNH THÀNH
KIỂM ĐỊNH THỐNG KÊ

1. Qui định mức alpha (giá trị P)

2. Nêu giả thuyết, Ho và Ha

3. Tính toán giá trị thống kê phù hợp

4. Xác định mức ý nghĩa.

5. Nêu luật ra quyết định.

6. Nêu kết luận.


51
CÁC BƯỚC HÌNH THÀNH
KIỂM ĐỊNH THỐNG KÊ

1. Αlpha α=0.05

2. Ho: Giới tính có liên quan với tiểu đường típ 2

Ha: Không có mối liên quan giữa giới tính và tiểu


đường típ 2

3. Giá trị thống kê cần tính: Chi bình phương (χ2)

4. Mức ý nghĩa của χ2 theo bảng χ2

5. So sánh χ2 tính được và bảng χ2 52


CÁC BƯỚC TÍNH TOÁN

1. Tính độ tự do của χ2: d.f. = (r – 1)(c – 1)

Độ tự do của bảng 2x2 là d.f=(2-1)(2-1)=1

2. Tính vọng trị (Expected value)

Tính vọng trị cho các ô trong bảng dự trù


Er,c: vọng trị (tần số kì vọng)

(Sum of row r )  (Sum of column c )


Expected frequency E r ,c = .
Sample size
53
CÁC BƯỚC TÍNH TOÁN

3. Tính giá trị thống kê χ2

2
(observed - expected)
 =
2

expected

54
CÁC BƯỚC TÍNH TOÁN

3. Tính giá trị thống kê χ2

O E (0-E)2 (0-E)2
E
3487 3570 1.9
5994 5911 1.2
4678 4595 1.5
7527 7609 0.9
Χ2 =
55
KẾT LUẬN

4. χ2 = 5.47 > χ2 = 3.84 theo bảng với df=1 và


alpha=0.05

Có mối liên quan có ý nghĩa thống kê giữa giới tính và


mắc tiểu đường típ 2.

P<0.05

57
KIỂM ĐỊNH FISHER

**Khi có trên 20% ô có giá trị kì vọng nhỏ (<5), Fisher’s


exact test dùng thay thế Chi bình phương
KIỂM ĐỊNH FISHER
- Thay thế kiểm định chi bình phương khi có >20% các ô có vọng trị
<5 hoặc có ô vọng trị <1
Quy trình tiến hành:
1. Sắp xếp lại bảng sao số liệu có tổng hàng nhỏ hơn nằm trên
a b a+b
c d c+d
a+c b+d N

5 30 35 2 23 25
2 23 25 5 30 35
7 53 60 7 53 60
KIỂM ĐỊNH
Quy trình tiến hành:
FISHER
2. Bắt đầu liệt kê bảng đầu tiên có ô (1,1) = 0; (1,2)
= a + b; (2,1) = a + c; (2,2) =(c + d) – (a + c)
0 25
7 28

3. Bảng kế tiếp sẽ tăng ô (1,1) lên 1 đơn vị; giảm ô (1,2) và (2,1)
đi 1 và tăng (2,2) lên 1
1 24
6 29
KIỂM ĐỊNH FISHER
Quy trình tiến hành:
4. Tiếp tục cho đến khi nào có 1 ô có giá trị là 0 thì dừng
0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31

4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
KIỂM ĐỊNH
FISHER
Quy trình tiến hành:
5. Tính xác suất cho mỗi bảng:
0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
p = 0,018 p = 0,105 p = 0,252 p = 0,312

4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p = 0,214 p = 0,082 p = 0,016 p = 0,001

(a + b)!(c + d )!(a + c)!(b + d )!


a!b!c!d!n!
KIỂM ĐỊNH FISHER
Quy trình tiến hành:
6. Giá trị p của kiểm định Fisher (2 đuôi) là là tổng giá trị
nhỏ hơn giá trị p của bảng ban đầu:
0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
p = 0,018 p = 0,105 p = 0,252 p = 0,312

4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p = 0,214 p = 0,082 p = 0,016 p = 0,001
• Giá trị p của bảng ban đầu = 0,252

• pFisher = 0,018 + 0,105 + 0,252 + 0,214 + 0,082


+ 0,016 + 0,001 = 0,688
p = 0,688
6 KIỂM ĐỊNH
BIẾN KẾT CUỘC ĐỊNH LƯỢNG

• Kiểm định tham số: Parametric test


• Kiểm định phi tham số: Non-parametric test

25/10/2022
KIỂM ĐỊNH THAM SỐ
Khi các nhóm so sánh độc lập:

Biến phụ Biến độc lập


thuộc Nhị giá >2 nhóm Định lượng
Nhị giá Chi2/Fisher Chi2/Fisher Hồi qui Logistic Nhị giá
Danh định Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Danh định
Thứ tự Wilcoxon Kruskal Hồi qui Logistic
Rank sum Wallis Thứ tự
(Mann Whitney)
Định lượng T 2 nhóm độc lập ANOVA Tương quan Pearson/
(phân phối Hồi qui tuyến tính
chuẩn)
Định lượng Wilcoxon Kruskal Tương quan
(phân phối lệch) Rank sum Wallis Spearman
(Mann Whitney) 25/10/2022 65
KIỂM ĐỊNH THAM SỐ
Khi các nhóm so sánh không độc lập:
Biến phụ thuộc Biến độc lập
Nhị giá > 2 nhóm Định lượng
Nhị giá McNemar-Bowker/ GEE
McNemar
Stuart Maxwell
Danh định McNemar-Bowker/ McNemar-Bowker/ GEE
Stuart Maxwell Stuart Maxwell
Thứ tự Wilcoxon Friedman test GEE
Signed rank
Định lượng (phân T bắt cặp ANOVA lặp/GEE GEE /Mixed Model
phối bình thường)
Định lượng (phân Wilcoxon Friedman test GEE/ GLMM66
25/10/2022

phối lệch) Signed rank


PHÂN PHỐI T
Phân phối bình
thường
0.95

Phân phối t
0.95

00

-3-3

−𝑡 −1.96 0 1.96 𝑡 33

Tính chất:
● Hình chuông và tập trung tại giá trị 0(giống phân phối chuẩn)
● Biến thiên lớn hơn phân phối chuẩn
● Nếu mẫu càng tăng, phân phối t trở nên gần giống hình dạng
phân phối chuẩn
67
CÁC LOẠI KIỂM ĐỊNH T

1. Kiểm định T 1 nhóm (One sample T-test)


2. Kiểm định T không bắt cặp (Independent T-test)
a) Phương sai bằng nhau
b) Phương sai không bằng nhau
3. Kiểm định T bắt cặp (Paired T-test)

68
GIẢ ĐỊNH CỦA KIỂM ĐỊNH T

1. Thang đo biến số: biến liên tục


2. Dữ liệu được thu thập ngẫu nhiên (random
sampling)
3. Dữ liệu có phân phối bình thường (đường
cong phân phối hình chuông)
4. Phương sai đồng nhất

69
KIỂM ĐỊNH T ĐỘC LẬP
(INDEPENDENT T TEST)

70
KIỂM ĐỊNH T ĐỘC LẬP

▪ 2 mẫu độc lập (Vd: nhóm điều trị - nhóm chứng)


▪ Công thức:

SD12 SD22
Sai số chuẩn gộp SEdiff = +
N1 N2

X1 − X 2
Giá trị thống kê t t X1 − X 2 =
SEdiff
71
KIỂM ĐỊNH T ĐỘC LẬP

Ví dụ:

Giả sử kiểm tra ảnh hưởng của cafeinne trên vận


động bằng cách ghi nhận thời gian giữ con trỏ di
động theo 1 điểm chuyển động.
Các đối tượng tham gia thử nghiệm được chia làm 2
nhóm:
Nhóm 1 uống chất lỏng chứa cafeinne, nhóm còn lại
dùng placebo.
Không đối tượng nào biết mình thuộc nhóm nào.

72
KIỂM ĐỊNH T ĐỘC LẬP
Experimental (Caff) Control (No Caffeine)
12 21
14 18
10 14
8 20
16 11
5 19
3 8
9 12
11 13
15
N1= , M1=, SD1= N2=, M2=, SD2= 73
KIỂM ĐỊNH T ĐỘC LẬP
Experimental (Caff) Control (No Caffeine)
12 21
14 18
10 14
8 20
16 11
5 19
3 8
9 12
11 13
15
N1=9, M1=9.778, N2=10, M2=15.1,
74
SD1=4.1164 SD2=4.2805
KIỂM ĐỊNH T ĐỘC LẬP

1. Đặt mức Alpha = .05


2. Nêu giả thuyết.
GT “không” H0: 1 = 2.
Đảo thuyết H1: 1  2.

75
KIỂM ĐỊNH T ĐỘC LẬP

3. Tính toán giá trị thống kê

2 2
SD SD
SEdiff = +
1 2
N1 N2

X1 − X 2
t=
SEdiff
76
KIỂM ĐỊNH T ĐỘC LẬP

3. Tính toán giá trị thống kê

X 1 − X 2 9.778 − 15.1 − 5.322


t= = = = −2.758
SEdiff 1.93 1.93

2 2 2 2
SD SD (4.1164) (4.2805)
SEdiff = +
1
= 2
+ = 1.93
N1 N2 9 10

77
KIỂM ĐỊNH T ĐỘC LẬP

4. Xác định giá trị tới


hạn t (bảng) tại
ngưỡng alpha =
0.05
với độ tự do
df = N1+N2-2
=10+9-2 = 17.
Giá trị t này là 2.11.
78
KIỂM ĐỊNH T ĐỘC LẬP

4. Nêu luật quyết định. Nếu |-2.758| > 2.11, bác bỏ


GT “không”.

5. Kết luận: Có sự khác biệt có ý nghĩa thống kê về


trung bình giữa 2 nhóm?.

P value?

Caffeine có ảnh hưởng đến vận động (P<0,05)

79
KIỂM ĐỊNH T BẮT CẶP
(PAIRED T TEST)

80
KIỂM ĐỊNH T BẮT CẶP

Kiểm định t bắt cặp được sử dụng khi so sánh 2 nhóm


dữ liệu có liên quan.

Ví dụ:
▪ Đo lường lặp lại (dữ liệu được thu thập ở thời điểm

T0, T1,..Ti) trên cùng 1 nhóm người

▪ Anh em, vợ chồng

▪ Tay phải, tay trái,…


81
KIỂM ĐỊNH T BẮT CẶP

Công thức:

SDD
Sai số chuẩn SEdiff =
n pairs

D
Giá trị thống kê t tXD =
SEdiff

82
KIỂM ĐỊNH T BẮT CẶP

Ví dụ:

Nghiên cứu về Painfree, 1 loại thuốc thay thế aspirin.

5 người được chọn vào nghiên cứu

Ngày đầu tiên, ½ được cho sử dụng painfree, ½ dùng


placebo. Sau đó tất cả nhúng tay vào nước đá đến khi
cảm thấy không chịu đựng được. Nhà nghiên cứu ghi
nhận thời gian này. Ngày hôm sau, các đối tượng đổi
nhóm và lặp lại thí nghiệm trên. 83
KIỂM ĐỊNH T BẮT CẶP

Người Painfree Placebo Khác biệt


(time in
sec)
1 60 55 5
2 35 20 15
3 70 60 10
4 50 45 5
5 60 60 0
M
SD 84
KIỂM ĐỊNH T BẮT CẶP

Painfree
Differenc
Person (time in Placebo
e
second)
1 60 55 5
2 35 20 15
3 70 60 10
4 50 45 5
5 60 60 0
M 55 48 7
85
SD 13.23 16.81 5.70
KIỂM ĐỊNH T BẮT CẶP

1. Mức alpha = .05


2. GT “không” H0: 1 = 2.
Đảo thuyết H1: 1  2.
3. Tính toán giá trị thống kê t:

SD D
SEdiff = t=
n pairs SEdiff

86
KIỂM ĐỊNH T BẮT CẶP

3. Tính toán giá trị thống kê t:

SD 5.70
SEdiff = = = 2.55
n pairs 5

D 55 − 48 7
t= = = = 2.75
SEdiff 2.55 2.55
87
KIỂM ĐỊNH T BẮT CẶP

4. Xác định giá trị tới


hạn t (bảng) với
alpha=0.05
Độ tự do
df =5-1=4.
Giá trị t là 2.776

88
KIỂM ĐỊNH T BẮT CẶP

5. Luật quyết định: |2.75| < 2.776, không bác bỏ GT


“không”.
6. Kết luận.

89
90 KIỂM ĐỊNH ANOVA

25/10/2022
ANOVA
(ANALYSIS OF VARIANCE)
Ý tưởng:
Kiểm định sự khác biệt giữa
các trung bình của 2 nhóm trở lên
đối với những biến số định lượng
có phân phối bình thường.

❖Là sự mở rộng của t-test( ANOVA trên 2 nhóm có kết


quả tính toán tương tự t-test).

91
PHÂN TÍCH PHƯƠNG SAI MỘT CHIỀU
ONE-WAY ANOVA
Các giả định của kiểm định ANOVA
1. Số liệu có phân phối bình thường

2. Phương sai bằng nhau giữa các nhóm

3. Các nhóm so sánh độc lập

92
GIẢ THUYẾT CỦA ONE-WAY ANOVA

H0 : μ1 = μ 2 = μ 3 = 
H a : Trung bình các nhóm khác nhau

93
KIỂM ĐỊNH ANOVA

▪ Giá trị thống kê F

▪ Có 2 độ tự do (df degree of freedom):

✓Độ tự do nội bộ nhóm (df within-group)

✓Độ tự do giữa các nhóm (df between groups)

▪ Kí hiệu: F(df between, df within)

94
CÁC BƯỚC TÍNH TOÁN F

Kí hiệu:

N: số đối tượng trong mẫu nghiên cứu

k: số nhóm

j: số thứ tự nhóm

df: độ tự do

95
CÁC BƯỚC TÍNH TOÁN F
Bước 1:Tổng bình phương nội bộ nhóm SSw
Within-group sum of square SSw: df = N – k

SS w =  ( N j − 1) s j
2

Bước 2:Tổng bình phương giữa các nhóm SSb


Between-group sum of square SSb: df = k - 1

SSb =  N j ( X j − X ) 2

j
96
CÁC BƯỚC TÍNH TOÁN F

Bước 3: Tổng bình phương toàn bộ SS


Total sum of square _ SS: df = N-1

SS = SSw + SSb

97
CÁC BƯỚC TÍNH TOÁN F

Bước 4: Trung bình bình phương nội bộ nhóm


Within_group mean squares_MSw

SSW
MSW =
N −k
Bước 5: Trung bình bình phương giữa các nhóm
Between_group mean squares_MSb

SSb
MSb =
k −1 98
CÁC BƯỚC TÍNH TOÁN F

Bước 6: Tính giá trị thống kê F

MSb
F=
MSW
ĐộĐộtự
tự do của F
do của F

F(k-1, N-k)

Ha: Trung bình giữa các nhóm khác nhau, MSb > MSw
99
PHÂN PHỐI CỦA F
Là phân phối xác suất liên tục dựa vào 2 tham số k-1 và N-k

Kiểm định dựa trên phân phối F > 1

100
PHÂN PHỐI CỦA F
▪ Tỷ số phương sai theo phân phối F:

 2
between
~ Fn ,m
 2
within

⚫Kiểm định F kiểm tra giả thuyết 2 phương sai bằng nhau.
⚫F gần bằng 1 nếu phương sai giữa các nhóm bằng nhau.

H 0 :  between
2
=  within
2

H a :  between
2
  within
2
101
VÍ DỤ

Phân ngẫu nhiên 33 đối tượng vào 3 nhóm: bổ sung


800 mg calcium vs. 1500 mg calcium vs. placebo.

So sánh mật độ xương sống của cả 3 nhóm sau 1 năm.

102
Mật độ xương theo điều trị
1.2

1.1

Within group
Between variability
1.0
S
group
P variation
I
N Within group
E
Within group variability
0.9
variability

0.8

0.7
PLACEBO 800mg CALCIUM 1500 mg CALCIUM 103
VÍ DỤ

▪ Nhóm Placebo (n=11):


▪ Mean spine BMD = .92 g/cm2
▪ standard deviation = .10 g/cm2

▪ Nhóm bổ sung 800 mg calcium (n=11)


▪ Mean spine BMD = .94 g/cm2
▪ standard deviation = .08 g/cm2

▪ Nhóm bổ sung 1500 mg calcium (n=11)


▪ Mean spine BMD =1.06 g/cm2
▪ standard deviation = .11 g/cm2

104
Cỡ mẫu
Dao động giữa Hiệu số giữa
các nhóm trung bình từng

KIỂM ĐỊNH F
nhóm và trung
bình chung

(.92 − .97) 2
+ (.94 − .97) 2
+ (1.06 − .97) 2
2
sMS B = nsx = 11* (
2
) = .063
3 −1
between

2
sMS = avg s 2
= 1 (.102
+ .082
+ .112
) = .0095
W
within 3
2MS
sbetweenB
.063
F2,30 = 2 = = 6.6
swithin
MS W .0095
F lớn cho thấy
Dao động trung MSb>MSw
bình nội bộ nhóm Phương sai của từng
nhóm.
105
BẢNG F

▪ Tra bảng F trong sách giáo khoa với ngưỡng α=0.05.

▪ Nếu F>F ngưỡng trong bảng, kết luận rằng có sự

khác biệt có ý nghĩa thống kê giữa các trung bình với


P < 0.05.

▪ Theo bảng, F(2,30)=3.32 < F = 6.6

106
BẢNG F

Theo bảng, F(2,30)=3.32 < F = 6.6 25/10/2022 107


KẾT QUẢ
Kết luận:

1. Mật độ xương trung bình của 3 nhóm lần lượt là


0,92, 0,94 và 1,06.

2. Khác biệt này có ý nghĩa thống kê

3. P<0.05

Lưu ý: Kết quả ở bước phân tích này không cho biết sự
khác biệt cụ thể giữa các cặp so sánh

108
BẢNG ANOVA

Nguồn MS
SS
biến thiên d.f. F p-value
Go to
Giữa k-1 SSb MSb
các MSb Fk-1,N-k
nhóm F=
MSW
Nội bộ N-k SSw MSw
nhóm

Tổng N-1 SS
cộng SS=SSb + SSw 109
ANOVA TÓM TẮT

▪ 1 phép kiểm ANOVA có ý nghĩa thống kê chỉ cho biết

có ít nhất 2 trung bình khác nhau, nhưng không biết


cụ thể những nhóm nào.

▪ Để xác định cụ thể những nhóm nào khác nhau, cần 1

số phân tích sâu hơn để hiệu chỉnh vấn đề so sánh đa


nhóm. (Post Hoc Test)

110
KIỂM ĐỊNH PHI THAM SỐ
Khi các nhóm so sánh độc lập:

Biến phụ Biến độc lập


thuộc Nhị giá >2 nhóm Định lượng
Nhị giá Chi2/Fisher Chi2/Fisher Hồi qui Logistic Nhị giá
Danh định Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Danh định
Thứ tự Wilcoxon Kruskal Hồi qui Logistic
Rank sum Wallis Thứ tự
(Mann Whitney)
Định lượng T 2 nhóm độc lập ANOVA Tương quan Pearson/
(phân phối Hồi qui tuyến tính
chuẩn)
Định lượng Wilcoxon Kruskal Tương quan
(phân phối lệch) Rank sum/ Mann Wallis Spearman
Whitney 25/10/2022 111
KIỂM ĐỊNH PHI THAM SỐ
Khi các nhóm so sánh không độc lập:
Biến phụ thuộc Biến độc lập
Nhị giá > 2 nhóm Định lượng
Nhị giá McNemar-Bowker/ GEE
McNemar
Stuart Maxwell
Danh định McNemar-Bowker/ McNemar-Bowker/ GEE
Stuart Maxwell Stuart Maxwell
Thứ tự Wilcoxon Friedman test GEE
Signed rank
Định lượng (phân T bắt cặp ANOVA lặp/GEE GEE /Mixed Model
phối bình thường)
Định lượng (phân Wilcoxon Friedman test GEE/ GLMM112
25/10/2022

phối lệch) Signed rank


PHÂN BIỆT
THAM SỐ VÀ PHI THAM SỐ
❖ Dữ liệu thường phân phối theo 1 dạng nhất định.
✓ Phân phối bình thường
✓ Phân phối nhị thức
✓ Phân phối Poisson
✓ ……
❖ Các phép kiểm dựa trên các phân phối này
❖ Kiểm định tham số cần có một số giả định

10/25/2022 113
PHÂN BIỆT
THAM SỐ VÀ PHI THAM SỐ
Các phương pháp tham số đã học
❖ Kiểm định t
❖ Kiểm định ANOVA
❖ Hệ số tương quan Pearson
❖ Hồi qui tuyến tính
Giả định chung của các phương pháp này
✓ Số liệu có phân phối bình thường (tùy vào độ lớn cỡ
mẫu)
✓ Phương sai giữa các nhóm so sánh bằng nhau
10/25/2022 114
PHƯƠNG PHÁP PHI THAM SỐ
(NON-PARAMETRIC METHODS)

Kĩ thuật thống kê
❖Không cần các giả thuyết về tính phân phối bình

thường của số liệu.


❖Kết quả đúng khi số liệu phân phối bình thường và

phân phối không bình thường

10/25/2022 115
PHƯƠNG PHÁP PHI THAM SỐ
(NON-PARAMETRIC METHODS)

❖ Hữu dụng khi:

▪ Trong một nhóm số liệu nhỏ mà không thể sửa

chữa bằng phép biến đổi thích hợp.


▪ Khi không cần kiểm tra tính bình thường

❖ Khuyết điểm

▪ Khó tính được khoảng tin cậy

▪ Không thể mở rộng sang đa biến


10/25/2022 116
KIỂM ĐỊNH PHI THAM SỐ THAY THẾ
KIỂM ĐỊNH THAM SỐ

KIỂM ĐỊNH THAM SỐ PHI THAM SỐ


Tương quan Pearson Spearman
Mẫu bắt cặp Paired T test Wilcoxon Signed-
rank test
2 mẫu độc lập Independent Wilcoxon rank
samples T test sum test
≥ 3 mẫu độc lập Oneway ANOVA Kruskal-Wallis
10/25/2022 117
WILCOXON SIGNED-RANK TEST

▪ Kiểm định sắp hạng có dấu

▪ Kiểm định phi tham số tương đương với kiểm định T

bắt cặp

▪ Không dùng số liệu thật

▪ Sử dụng dấu và hạng để so sánh mẫu bắt cặp

10/25/2022 118
Số giờ ngủ
Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)
1 6,1 5,2 0,9 3,5*
2 7,0 7,9 -0,9 3,5*
3 8,2 3,9 4,3 10
4 7,6 4,7 2,9 7
5 6,5 5,3 1,2 5
6 8,4 5,5 3,0 8
7 6,9 4,2 2,7 6
8 6,7 6,1 0,6 2
9 7,4 3,8 3,6 9
10 5,8 6,3 -0,5 1

10/25/2022 119
WILCOXON SIGNED-RANK TEST

1. Loại bỏ mọi hiệu số bằng zero. Sắp xếp các hiệu số


còn lại theo thứ tự tăng dần
Số giờ ngủ
Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)
1 6,1 5,2 0,9 3,5*
2 7,0 7,9 -0,9 3,5*
3 8,2 3,9 4,3 10
4 7,6 4,7 2,9 7
5 6,5 5,3 1,2 5
6 8,4 5,5 3,0 8
7 6,9 4,2 2,7 6
8 6,7 6,1 0,6 2
9 7,4 3,8 3,6 9
10 5,8 6,3 -0,5 1
10/25/2022 120
WILCOXON SIGNED-RANK TEST

2. Cộng các hạng có hiệu số dương (T+)


T + = 3,5 + 10 + 7 + 5 + 8 + 6+ 2 + 9 = 50,5
Cộng các hạng theo hiệu số âm (T-)
T - = 3,5 + 1 = 4,5
Số giờ ngủ
Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)
1 6,1 5,2 0,9 3,5*
2 7,0 7,9 -0,9 3,5*
3 8,2 3,9 4,3 10
4 7,6 4,7 2,9 7
5 6,5 5,3 1,2 5
6 8,4 5,5 3,0 8
7 6,9 4,2 2,7 6
8 6,7 6,1 0,6 2
9 7,4 3,8 3,6 9
10/25/2022 121
10 5,8 6,3 -0,5 1
WILCOXON SIGNED RANK TEST

3. Nếu không có sự khác biệt hiệu quả giữa thuốc ngủ


và placebo thì tổng T+ và T- phải bằng nhau. Nếu có
sự khác biệt thì một tổng sẽ lớn hơn và tổng kia sẽ
nhỏ hơn. Kí hiệu tổng nhỏ hơn là T

T = số nhỏ hơn của T+ và T-

Trong thí dụ này T = 4,5

4. Kiểm định sắp hạng có dấu Wilcoxon dựa trên việc


đánh giá T, số nhỏ hơn
10/25/2022 122
N = 10; P = 0.05;
T tới hạn = 8
T = 4.5
Vậy T < T tới hạn

Kết luận:
Thời gian ngủ giữa nhóm dùng
thuốc và không dùng thuốc khác
biệt có ý nghĩa thống kê với P <
0,05
10/25/2022 123
WILCOXON RANK SUM TEST
Không hút thuốc Hút thuốc lá nặng
Trọng lượng lúc sinh Hạng Trọng lượng lúc sinh Hạng
3,99 27 3,18 7
3,79 24 2,84 5
3,60* 18 2,90 6
3,73 22 3,27 11
3,21 8 3,85 26
3,60* 18 3,52 14
4,08 28 3,23 9
3,61 20 2,76 4
3,83 25 3,60* 18
3,31 12 3,75 23
4,13 29 3,59 16
3,26 10 3,63 21
3,54 15 2,38 2
3,51 13 2,34 1
2,71 3
Tổng số = 272 Tổng số = 163

10/25/2022 124
WILCOXON RANK SUM TEST
1. Sắp hạng các quan sát trong cả hai nhóm theo thứ tự độ lớn như
trong bảng. Nếu có các giá trị nào bằng nhau thì lấy trung bình của
chúng
Không hút thuốc Hút thuốc lá nặng
Trọng lượng lúc sinh Hạng Trọng lượng lúc sinh Hạng
3,99 27 3,18 7
3,79 24 2,84 5
3,60* 18 2,90 6
3,73 22 3,27 11
3,21 8 3,85 26
3,60* 18 3,52 14
4,08 28 3,23 9
3,61 20 2,76 4
3,83 25 3,60* 18
3,31 12 3,75 23
4,13 29 3,59 16
3,26 10 3,63 21
3,54 15 2,38 2
3,51 13 2,34 1
2,71 3 10/25/2022 125
Tổng số = 272 Tổng số = 163
WILCOXON RANK SUM TEST

2. Cộng các hạng trong nhóm có cỡ mẫu nhỏ.

Trong trường hợp này chính là nhóm người hút thuốc


lá và tổng sắp hạng là 163.

Nếu hai nhóm có cỡ mẫu bằng nhau thì lấy nhóm nào
cũng được.

T = Tổng các hạng của nhóm có cỡ mẫu nhỏ

10/25/2022 126
WILCOXON RANK SUM TEST

3. So sánh tổng số này với giá trị quyết định trong bảng
được sắp đặt hơi khác

10/25/2022 127
N1 = 15; N2 = 14; P=0,05
Khoảng giá trị tương ứng của T 164 - 256 10/25/2022 128

T =163 => P<0,05


PHÉP KIỂM KRUSKAL WALLIS

▪ Ho: Trung vị các nhóm bằng nhau

▪ Ha: Trung vị các nhóm khác nhau

Kiểm định cho biết có ít nhất 1 cặp so sánh có trung vị


khác nhau

25/10/2022 129
PHÉP KIỂM KRUSKAL WALLIS

▪ So sánh thứ hạng của biến định lượng giữa k nhóm (k

≥3)

▪ Biến số không phân phối bình thường giữa các nhóm

▪ Không quan tâm đến độ lớn của sự khác biệt

10/25/2022 130
PHÉP KIỂM KRUSKAL WALLIS

▪ Thang đo:

✓Biến phụ thuộc: biến định lượng có phân phối không

bình thường

✓Biến độc lập: biến danh định

▪ Không đòi hỏi giả định như phép kiểm tham số

10/25/2022 131
PHÉP KIỂM KRUSKAL WALLIS

Nguyên tắc

1. Mẫu: n1, n2,…,nc, với c là số nhóm so sánh

2. Xếp chung tất cả giá trị quan sát thành 1 chuỗi duy
nhất từ thấp đến cao

3. Xếp hạng các quan sát

10/25/2022 132
PHÉP KIỂM KRUSKAL WALLIS

4. Xác định giá trị H, độ tự do c-1

n: tổng số quan sát


c: số nhóm
Tj: tổng hạng ở nhóm thứ j
nj: số quan sát nhóm thứ j

10/25/2022 133
PHÉP KIỂM KRUSKAL WALLIS

5. Tra bảng Chi bình phương, độ tự do c-1

6. So sánh giá trị H với giá trị Chi bình phương tới hạn
trong bảng

7. Nêu luật quyết định, nếu H > Chi bình phương tới
hạn thì bác bỏ giả thuyết Ho

25/10/2022 134
PHÉP KIỂM KRUSKAL WALLIS

Ví dụ: Kiểm định sự khác biệt về mức thu nhập giữa 3


nhóm

▪ Nhóm 1: 23, 41, 54, 66, 78

▪ Nhóm 2: 45,55,60, 70,72

▪ Nhóm 3: 18,30,34, 40,44

25/10/2022 135
PHÉP KIỂM KRUSKAL WALLIS
3 1 3 3 3 1 3 2 1 2 2 2 2 2 1
20 23 30 34 40 41 44 45 54 55 60 66 70 72 90
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Tính tổng các hạng từng nhóm:


Nhóm 1: 2+6+9+15=44
Nhóm 2: 8+10+11+13+14=56
Nhóm 3: 1+3+4+5+7=20

25/10/2022 136
PHÉP KIỂM KRUSKAL WALLIS

▪ Tính giá trị H

▪ H=6,72
25/10/2022 137
PHÉP KIỂM KRUSKAL WALLIS

P=0,05 và df=2, Chi=5.99


25/10/2022 138
PHÉP KIỂM KRUSKAL WALLIS

So sánh H và Chi tới hạn

▪ H=6,72 > Chi tới hạn = 5,99

▪ => Bác bỏ Ho

▪ Có sự khác biệt về trung vị mức thu nhập giữa 3 nhóm

25/10/2022 139
NỘI DUNG

1 • Khái niệm kiểm định giả thuyết

2 • Khái niệm P value

3 • Sai lầm và năng lực thống kê

4 • Chọn lựa phương pháp thống kê

5 • Kiểm định biến định tính

6 • Kiểm định biến định lượng


25/10/2022 140
TÀI LIỆU THAM KHẢO

▪ Sách:
1. ARMITAGE, P., BERRY, G. & MATTHEWS, J. N. S. 2008.
Statistical Methods in Medical Research, Chichester:, John
Wiley & Sons, Ltd
2. Ðỗ Văn Dũng. Xác suất và sinh thống kê căn bản. TP Hồ Chí
Minh, Khoa Y tế công cộng, Trường Ðại học Y Dược, 2001
▪ Web:
https://www.graphpad.com/support/faqid/1790/

25/10/2022 141

You might also like