Professional Documents
Culture Documents
2.nguyen Ly Kiem Dinh-Kiem Dinh Thong Ke 10.2022
2.nguyen Ly Kiem Dinh-Kiem Dinh Thong Ke 10.2022
1
TS. Nguyễn Thị Minh Trang
Bộ môn Thống kê – Khoa Y tế Công cộng
Đại học Y Dược TPHCM
Email: drminhtrang@gmail.com
25/10/2022
NỘI DUNG
4
KHÁI NIỆM GIẢ THUYẾT NGHIÊN CỨU
Ví dụ:
Nghiên cứu về mối liên quan giữa mất ngủ và điểm số thi
có giả thuyết nghiên cứu là
“Những người mất ngủ sẽ có điểm số thi thấp hơn
những người ngủ đủ giấc”
5
KHÁI NIỆM GIẢ THUYẾT NGHIÊN CỨU
Ví dụ:
▪ Nghiên cứu về mối liên quan giữa tiền căn gia đình về
K vú và K vú
……………………………………………………………….
6
KHÁI NIỆM GIẢ THUYẾT HO - HA
• Ha (a: alternative):
8
KHÁI NIỆM GIẢ THUYẾT HO - HA
Ví dụ:
Nghiên cứu về mối liên quan giữa tiền căn gia đình về
K vú và K vú
-> Ho:
……………………………………………………………….
-> Ha:
……………………………………………………………….
25/10/2022 9
Note: lưu ý về loại biến số nghiên cứu
QUI TRÌNH KIỂM ĐỊNH GIẢ THUYẾT
tính được
25/10/2022 10
QUI TRÌNH KIỂM ĐỊNH GIẢ THUYẾT
▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia đình có
▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia
▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia
▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia
4. Tính xác suất thống kê (giá trị P) từ giá trị thống kê tính
được
5. Kết luận
5. Kết luận
P: Probability
25/10/2022
KHÁI NIỆM VỀ P-VALUE
18
KHÁI NIỆM VỀ P-VALUE
19
KHÁI NIỆM VỀ P-VALUE
Câu hỏi:
Giải thích: Nếu GT Ho đúng (không có mối liên quan giữa tiền
căn gđ và K vú), cơ hội quan sát thấy có từ 5 ca trở lên trong
số 100 phụ nữ có tiền căn gia đình là 1/20.
P<0,05: Bác bỏ Ho
21
KHÁI NIỆM VỀ P-VALUE
22
➢ CÁC LOẠI SAI LẦM
3
➢ LỰC THỐNG KÊ
kết quả.
▪ Nhà nghiên cứu có thể mắc 2 loại sai lầm khi kết luận:
25/10/2022 24
SAI LẦM LOẠI 1: TYPE I ERROR
▪ Ký hiệu: α
▪ Qui ước:
25/10/2022 25
SAI LẦM LOẠI 1: TYPE I ERROR
▪ Ví dụ:
Sai lầm α là xác suất cho rằng tiền căn gia đình có liên quan
với K vú (GT Ha) trong khi thực tế không có mối liên quan
(GT Ho). 25/10/2022 26
SAI LẦM LOẠI 1: TYPE I ERROR
K vú (+) K vú (-)
Tiền căn gđ (+) Sai lầm loại I (α)
Tiền căn gđ (-)
Sai lầm loại I (α) là sai lầm cho rằng tiền căn gia đình có
liên quan với K vú (GT Ha) trong khi thực tế không có
mối liên quan (GT Ho).
*Xem tiền căn gia đình như 1 yếu tố nguy cơ, tương tự
1 “test” tầm soát 25/10/2022 27
SAI LẦM LOẠI 2: TYPE II ERROR
▪ Ký hiệu: β
đúng
▪ Qui ước
25/10/2022 28
SAI LẦM LOẠI 2: TYPE II ERROR
▪ Ví dụ:
Sai lầm β là xác suất cho rằng tiền căn gia đình không
có liên quan với K vú (GT Ho) trong khi thực tế có mối
liên quan (GT Ha).
25/10/2022 29
SAI LẦM LOẠI 2: TYPE 2 ERROR
K vú (+) K vú (-)
Tiền căn gđ (+)
Tiền căn gđ (-) Sai lầm loại II (β)
Sai lầm loại II (β) là sai lầm cho rằng tiền căn gia đình
không có liên quan với K vú (GT Ho) trong khi thực tế
có mối liên quan (GT Ha).
25/10/2022 30
LỰC THỐNG KÊ: POWER
▪ Power=1-β
▪ Được sử dụng khi tính cỡ mẫu cho mục tiêu kiểm định
giả thuyết.
▪ Qui ước:
K vú (+) K vú (-)
Tiền căn gđ (+) Power
Tiền căn gđ (-) β
▪ Là xác suất cho rằng tiền căn gia đình có liên quan
25/10/2022 32
CÁC SAI LẦM VÀ POWER
NC về tiền căn gđ và K vú
K vú (+) K vú (-)
Tiền căn gđ (+) Dương tính thật Dương tính giả
Độ nhạy (Power) Sai lầm loại I (α)
Tiền căn gđ (-) Âm tính giả Âm tính thật
Sai lầm loại II (β) Độ đặc hiệu
25/10/2022 33
CÁC SAI LẦM VÀ POWER
Trong NC về test chẩn đoán:
K vú (+) K vú (-)
Test chẩn đoán (+) Dương tính thật Dương tính giả
Độ nhạy (Power) Sai lầm loại I (α)
Test chẩn đoán (-) Âm tính giả Âm tính thật
Sai lầm loại II (β) Độ đặc hiệu
25/10/2022 34
4 CHỌN PHƯƠNG PHÁP
THỐNG KÊ PHÂN TÍCH
25/10/2022
CHỌN PP THỐNG KÊ PHÂN TÍCH
▪ Xác định loại biến kết cuộc (biến phụ thuộc) và biến
o Nhị giá
o Danh định
o Thứ tự
25/10/2022 36
CHỌN PP THỐNG KÊ PHÂN TÍCH
Các nhóm so sánh độc lập: các đối tượng nghiên cứu khác nhau
25/10/2022
CHỌN PP THỐNG KÊ PHÂN TÍCH
Khi các nhóm so sánh độc lập:
41
VÍ DỤ
Nghiên cứu về các yếu tố liên quan đến tiểu đường típ 2.
Câu hỏi:
Các yếu tố như chủng tộc, béo phì, hút thuốc lá, uống rượu,
ít vận động thể lực có liên quan đến việc mắc phải tiểu
đường típ 2 ở cộng đồng nghiên cứu hay không?
42
VÍ DỤ
Nghiên cứu về các yếu tố liên quan đến tiểu đường típ 2.
▪ R: row_hàng; C: column_cột
44
BẢNG PHÂN PHỐI TẦN SUẤT
Nghiên cứu về các yếu tố liên quan đến tiểu đường típ 2: Giới tính
45
TẦN SỐ KÌ VỌNG (VỌNG TRỊ)
❖ Vọng trị là giá trị kì vọng quan sát được trong các ô
của bảng dự trù khi chưa thu thập dữ liệu thực tế.
Vọng trị của ô (1,1) (ô giao của hàng 1 và cột 1): E(1,1)
E(1,1)=
47
VỌNG TRỊ (EXPECTED)
Vọng trị của ô (1,1) (ô giao của hàng 1 và cột 1): E(1,1)
E(1,1)=(9481x8165)/21686=3570
E(1,2)=(9481x13521)/21686=5911
E(2,1)=(12205x8165)/21686=4595
48
E(2,2)=(12205x13521)/21686=7609
VỌNG TRỊ (EXPECTED)
Vọng trị: số màu đỏ trong ngoặc đơn trông các ô của bảng
dự trù
49
GIẢ ĐỊNH CỦA KIỂM ĐỊNH Χ2
❖Vọng trị trong các ô của bảng phân phối tần suất ≥ 5
50
CÁC BƯỚC HÌNH THÀNH
KIỂM ĐỊNH THỐNG KÊ
1. Αlpha α=0.05
2
(observed - expected)
=
2
expected
54
CÁC BƯỚC TÍNH TOÁN
O E (0-E)2 (0-E)2
E
3487 3570 1.9
5994 5911 1.2
4678 4595 1.5
7527 7609 0.9
Χ2 =
55
KẾT LUẬN
P<0.05
57
KIỂM ĐỊNH FISHER
5 30 35 2 23 25
2 23 25 5 30 35
7 53 60 7 53 60
KIỂM ĐỊNH
Quy trình tiến hành:
FISHER
2. Bắt đầu liệt kê bảng đầu tiên có ô (1,1) = 0; (1,2)
= a + b; (2,1) = a + c; (2,2) =(c + d) – (a + c)
0 25
7 28
3. Bảng kế tiếp sẽ tăng ô (1,1) lên 1 đơn vị; giảm ô (1,2) và (2,1)
đi 1 và tăng (2,2) lên 1
1 24
6 29
KIỂM ĐỊNH FISHER
Quy trình tiến hành:
4. Tiếp tục cho đến khi nào có 1 ô có giá trị là 0 thì dừng
0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
KIỂM ĐỊNH
FISHER
Quy trình tiến hành:
5. Tính xác suất cho mỗi bảng:
0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
p = 0,018 p = 0,105 p = 0,252 p = 0,312
4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p = 0,214 p = 0,082 p = 0,016 p = 0,001
4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p = 0,214 p = 0,082 p = 0,016 p = 0,001
• Giá trị p của bảng ban đầu = 0,252
25/10/2022
KIỂM ĐỊNH THAM SỐ
Khi các nhóm so sánh độc lập:
Phân phối t
0.95
00
-3-3
−𝑡 −1.96 0 1.96 𝑡 33
Tính chất:
● Hình chuông và tập trung tại giá trị 0(giống phân phối chuẩn)
● Biến thiên lớn hơn phân phối chuẩn
● Nếu mẫu càng tăng, phân phối t trở nên gần giống hình dạng
phân phối chuẩn
67
CÁC LOẠI KIỂM ĐỊNH T
68
GIẢ ĐỊNH CỦA KIỂM ĐỊNH T
69
KIỂM ĐỊNH T ĐỘC LẬP
(INDEPENDENT T TEST)
70
KIỂM ĐỊNH T ĐỘC LẬP
SD12 SD22
Sai số chuẩn gộp SEdiff = +
N1 N2
X1 − X 2
Giá trị thống kê t t X1 − X 2 =
SEdiff
71
KIỂM ĐỊNH T ĐỘC LẬP
Ví dụ:
72
KIỂM ĐỊNH T ĐỘC LẬP
Experimental (Caff) Control (No Caffeine)
12 21
14 18
10 14
8 20
16 11
5 19
3 8
9 12
11 13
15
N1= , M1=, SD1= N2=, M2=, SD2= 73
KIỂM ĐỊNH T ĐỘC LẬP
Experimental (Caff) Control (No Caffeine)
12 21
14 18
10 14
8 20
16 11
5 19
3 8
9 12
11 13
15
N1=9, M1=9.778, N2=10, M2=15.1,
74
SD1=4.1164 SD2=4.2805
KIỂM ĐỊNH T ĐỘC LẬP
75
KIỂM ĐỊNH T ĐỘC LẬP
2 2
SD SD
SEdiff = +
1 2
N1 N2
X1 − X 2
t=
SEdiff
76
KIỂM ĐỊNH T ĐỘC LẬP
2 2 2 2
SD SD (4.1164) (4.2805)
SEdiff = +
1
= 2
+ = 1.93
N1 N2 9 10
77
KIỂM ĐỊNH T ĐỘC LẬP
P value?
79
KIỂM ĐỊNH T BẮT CẶP
(PAIRED T TEST)
80
KIỂM ĐỊNH T BẮT CẶP
Ví dụ:
▪ Đo lường lặp lại (dữ liệu được thu thập ở thời điểm
Công thức:
SDD
Sai số chuẩn SEdiff =
n pairs
D
Giá trị thống kê t tXD =
SEdiff
82
KIỂM ĐỊNH T BẮT CẶP
Ví dụ:
Painfree
Differenc
Person (time in Placebo
e
second)
1 60 55 5
2 35 20 15
3 70 60 10
4 50 45 5
5 60 60 0
M 55 48 7
85
SD 13.23 16.81 5.70
KIỂM ĐỊNH T BẮT CẶP
SD D
SEdiff = t=
n pairs SEdiff
86
KIỂM ĐỊNH T BẮT CẶP
SD 5.70
SEdiff = = = 2.55
n pairs 5
D 55 − 48 7
t= = = = 2.75
SEdiff 2.55 2.55
87
KIỂM ĐỊNH T BẮT CẶP
88
KIỂM ĐỊNH T BẮT CẶP
89
90 KIỂM ĐỊNH ANOVA
25/10/2022
ANOVA
(ANALYSIS OF VARIANCE)
Ý tưởng:
Kiểm định sự khác biệt giữa
các trung bình của 2 nhóm trở lên
đối với những biến số định lượng
có phân phối bình thường.
91
PHÂN TÍCH PHƯƠNG SAI MỘT CHIỀU
ONE-WAY ANOVA
Các giả định của kiểm định ANOVA
1. Số liệu có phân phối bình thường
92
GIẢ THUYẾT CỦA ONE-WAY ANOVA
H0 : μ1 = μ 2 = μ 3 =
H a : Trung bình các nhóm khác nhau
93
KIỂM ĐỊNH ANOVA
94
CÁC BƯỚC TÍNH TOÁN F
Kí hiệu:
k: số nhóm
j: số thứ tự nhóm
df: độ tự do
95
CÁC BƯỚC TÍNH TOÁN F
Bước 1:Tổng bình phương nội bộ nhóm SSw
Within-group sum of square SSw: df = N – k
SS w = ( N j − 1) s j
2
SSb = N j ( X j − X ) 2
j
96
CÁC BƯỚC TÍNH TOÁN F
SS = SSw + SSb
97
CÁC BƯỚC TÍNH TOÁN F
SSW
MSW =
N −k
Bước 5: Trung bình bình phương giữa các nhóm
Between_group mean squares_MSb
SSb
MSb =
k −1 98
CÁC BƯỚC TÍNH TOÁN F
MSb
F=
MSW
ĐộĐộtự
tự do của F
do của F
F(k-1, N-k)
Ha: Trung bình giữa các nhóm khác nhau, MSb > MSw
99
PHÂN PHỐI CỦA F
Là phân phối xác suất liên tục dựa vào 2 tham số k-1 và N-k
100
PHÂN PHỐI CỦA F
▪ Tỷ số phương sai theo phân phối F:
2
between
~ Fn ,m
2
within
⚫Kiểm định F kiểm tra giả thuyết 2 phương sai bằng nhau.
⚫F gần bằng 1 nếu phương sai giữa các nhóm bằng nhau.
H 0 : between
2
= within
2
H a : between
2
within
2
101
VÍ DỤ
102
Mật độ xương theo điều trị
1.2
1.1
Within group
Between variability
1.0
S
group
P variation
I
N Within group
E
Within group variability
0.9
variability
0.8
0.7
PLACEBO 800mg CALCIUM 1500 mg CALCIUM 103
VÍ DỤ
104
Cỡ mẫu
Dao động giữa Hiệu số giữa
các nhóm trung bình từng
KIỂM ĐỊNH F
nhóm và trung
bình chung
(.92 − .97) 2
+ (.94 − .97) 2
+ (1.06 − .97) 2
2
sMS B = nsx = 11* (
2
) = .063
3 −1
between
2
sMS = avg s 2
= 1 (.102
+ .082
+ .112
) = .0095
W
within 3
2MS
sbetweenB
.063
F2,30 = 2 = = 6.6
swithin
MS W .0095
F lớn cho thấy
Dao động trung MSb>MSw
bình nội bộ nhóm Phương sai của từng
nhóm.
105
BẢNG F
106
BẢNG F
3. P<0.05
Lưu ý: Kết quả ở bước phân tích này không cho biết sự
khác biệt cụ thể giữa các cặp so sánh
108
BẢNG ANOVA
Nguồn MS
SS
biến thiên d.f. F p-value
Go to
Giữa k-1 SSb MSb
các MSb Fk-1,N-k
nhóm F=
MSW
Nội bộ N-k SSw MSw
nhóm
Tổng N-1 SS
cộng SS=SSb + SSw 109
ANOVA TÓM TẮT
110
KIỂM ĐỊNH PHI THAM SỐ
Khi các nhóm so sánh độc lập:
10/25/2022 113
PHÂN BIỆT
THAM SỐ VÀ PHI THAM SỐ
Các phương pháp tham số đã học
❖ Kiểm định t
❖ Kiểm định ANOVA
❖ Hệ số tương quan Pearson
❖ Hồi qui tuyến tính
Giả định chung của các phương pháp này
✓ Số liệu có phân phối bình thường (tùy vào độ lớn cỡ
mẫu)
✓ Phương sai giữa các nhóm so sánh bằng nhau
10/25/2022 114
PHƯƠNG PHÁP PHI THAM SỐ
(NON-PARAMETRIC METHODS)
Kĩ thuật thống kê
❖Không cần các giả thuyết về tính phân phối bình
10/25/2022 115
PHƯƠNG PHÁP PHI THAM SỐ
(NON-PARAMETRIC METHODS)
❖ Khuyết điểm
bắt cặp
10/25/2022 118
Số giờ ngủ
Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)
1 6,1 5,2 0,9 3,5*
2 7,0 7,9 -0,9 3,5*
3 8,2 3,9 4,3 10
4 7,6 4,7 2,9 7
5 6,5 5,3 1,2 5
6 8,4 5,5 3,0 8
7 6,9 4,2 2,7 6
8 6,7 6,1 0,6 2
9 7,4 3,8 3,6 9
10 5,8 6,3 -0,5 1
10/25/2022 119
WILCOXON SIGNED-RANK TEST
Kết luận:
Thời gian ngủ giữa nhóm dùng
thuốc và không dùng thuốc khác
biệt có ý nghĩa thống kê với P <
0,05
10/25/2022 123
WILCOXON RANK SUM TEST
Không hút thuốc Hút thuốc lá nặng
Trọng lượng lúc sinh Hạng Trọng lượng lúc sinh Hạng
3,99 27 3,18 7
3,79 24 2,84 5
3,60* 18 2,90 6
3,73 22 3,27 11
3,21 8 3,85 26
3,60* 18 3,52 14
4,08 28 3,23 9
3,61 20 2,76 4
3,83 25 3,60* 18
3,31 12 3,75 23
4,13 29 3,59 16
3,26 10 3,63 21
3,54 15 2,38 2
3,51 13 2,34 1
2,71 3
Tổng số = 272 Tổng số = 163
10/25/2022 124
WILCOXON RANK SUM TEST
1. Sắp hạng các quan sát trong cả hai nhóm theo thứ tự độ lớn như
trong bảng. Nếu có các giá trị nào bằng nhau thì lấy trung bình của
chúng
Không hút thuốc Hút thuốc lá nặng
Trọng lượng lúc sinh Hạng Trọng lượng lúc sinh Hạng
3,99 27 3,18 7
3,79 24 2,84 5
3,60* 18 2,90 6
3,73 22 3,27 11
3,21 8 3,85 26
3,60* 18 3,52 14
4,08 28 3,23 9
3,61 20 2,76 4
3,83 25 3,60* 18
3,31 12 3,75 23
4,13 29 3,59 16
3,26 10 3,63 21
3,54 15 2,38 2
3,51 13 2,34 1
2,71 3 10/25/2022 125
Tổng số = 272 Tổng số = 163
WILCOXON RANK SUM TEST
Nếu hai nhóm có cỡ mẫu bằng nhau thì lấy nhóm nào
cũng được.
10/25/2022 126
WILCOXON RANK SUM TEST
3. So sánh tổng số này với giá trị quyết định trong bảng
được sắp đặt hơi khác
10/25/2022 127
N1 = 15; N2 = 14; P=0,05
Khoảng giá trị tương ứng của T 164 - 256 10/25/2022 128
25/10/2022 129
PHÉP KIỂM KRUSKAL WALLIS
≥3)
10/25/2022 130
PHÉP KIỂM KRUSKAL WALLIS
▪ Thang đo:
bình thường
10/25/2022 131
PHÉP KIỂM KRUSKAL WALLIS
Nguyên tắc
2. Xếp chung tất cả giá trị quan sát thành 1 chuỗi duy
nhất từ thấp đến cao
10/25/2022 132
PHÉP KIỂM KRUSKAL WALLIS
10/25/2022 133
PHÉP KIỂM KRUSKAL WALLIS
6. So sánh giá trị H với giá trị Chi bình phương tới hạn
trong bảng
7. Nêu luật quyết định, nếu H > Chi bình phương tới
hạn thì bác bỏ giả thuyết Ho
25/10/2022 134
PHÉP KIỂM KRUSKAL WALLIS
25/10/2022 135
PHÉP KIỂM KRUSKAL WALLIS
3 1 3 3 3 1 3 2 1 2 2 2 2 2 1
20 23 30 34 40 41 44 45 54 55 60 66 70 72 90
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
25/10/2022 136
PHÉP KIỂM KRUSKAL WALLIS
▪ H=6,72
25/10/2022 137
PHÉP KIỂM KRUSKAL WALLIS
▪ => Bác bỏ Ho
25/10/2022 139
NỘI DUNG
▪ Sách:
1. ARMITAGE, P., BERRY, G. & MATTHEWS, J. N. S. 2008.
Statistical Methods in Medical Research, Chichester:, John
Wiley & Sons, Ltd
2. Ðỗ Văn Dũng. Xác suất và sinh thống kê căn bản. TP Hồ Chí
Minh, Khoa Y tế công cộng, Trường Ðại học Y Dược, 2001
▪ Web:
https://www.graphpad.com/support/faqid/1790/
25/10/2022 141