Professional Documents
Culture Documents
TKYH - Ung Dung Kiem Dinh T, ANOVA, Phi Tham So
TKYH - Ung Dung Kiem Dinh T, ANOVA, Phi Tham So
ỨNG DỤNG
KIỂM ĐỊNH T, ANOVA, PHI THAM SỐ
2
3
ÔN TẬP
Biến độc lập
Biến Nhị giá Danh định Thứ tự - Định lượng
phụ thuộc
Đa biến
Định lượng Tương quan Pearson
có phân phối T-test ANOVA
bình thường Hồi quy tuyến tính
Định lượng
phân phối Mann- Kruskal-
Tương quan Spearman
KHÔNG bình Whitney Wallis
thường
1. KIỂM ĐỊNH T
1.1. Kiểm định giả thuyết cho 1 trung bình
Một nghiên cứu được tiến hành trên 20 người về
việc tuân thủ chế độ ăn đặc biệt. Kết quả là lượng
đường huyết trung bình là 90mg% và độ lệch
chuẩn là 12mg%. Trong khi đó, đường huyết trung
bình của dân số là 100mg%.
→Câu hỏi: đường huyết trung bình của mẫu có bằng
với trung bình của dân số hay không?
5
1.1. Kiểm định giả thuyết cho 1 trung bình
1. Ho: lượng đường huyết trung bình là 100mg%
2. Lựa chọn kiểm định phù hợp: kiểm định t một mẫu
với 20 – 1 = 19 độ tự do
3. Tính giá trị phân phối t nếu giả thuyết Ho đúng
(x - ) 90 − 100 − 10
t= = = = −3,73
sd / n 12 / 20 2,68
4. Tính xác suất xảy ra | t | = 3,73 dựa trên bảng phân
phối t với 19 độ tự do → 0,001 < p < 0,002.
5. Kết luận: số liệu này rất ít phù hợp với giả thuyết Ho
và chúng ta bác bỏ giả thuyết Ho. 6
Tra bảng phân phối t
3,73
7
1.1. Kiểm định giả thuyết cho 1 trung bình
Câu lệnh Stata:
ttesti quansatmau tbinhmau dolechmau tbinhdanso
ttesti 20 90 12 100
One-sample t test
Ha: mean < 100 Ha: mean != 100 Ha: mean > 100
Pr(T < t) = 0.0007 Pr(|T| > |t|) = 0.0014 Pr(T > t) = 0.9993
8
1.1. Kiểm định giả thuyết cho 1 trung bình
Mở tập tin tlsosinh.dta. Biết rằng trọng lượng sơ
sinh trung bình của dân số là 3000gr.
→Câu hỏi: Trọng lượng sơ sinh trung bình của mẫu
có bằng với trung bình của dân số hay không?
9
1.1. Kiểm định giả thuyết cho 1 trung bình
Câu lệnh Stata:
ttest biendinhluong = #
ttesti tlsosinh = 3000
One-sample t test
Variable Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
Ha: mean < 3000 Ha: mean != 3000 Ha: mean > 3000
Pr(T < t) = 1.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 0.0000
10
1.2. Kiểm định t bắt cặp
Một nghiên cứu muốn so sánh chỉ số huyết áp tâm
thu của 10 bệnh nhân trước và sau khi dùng thuốc
hạ áp. Kết quả nghiên cứu thu thập được như sau:
11
1.2. Kiểm định t bắt cặp
Đối tượng Trước Sau Hiệu số
(X0) (X1) (d)
1 128 115 13
2 115 112 3
3 106 107 -1
4 128 119 9
5 122 115 7
6 145 138 7
7 132 126 6
8 109 105 4
9 102 104 -2
10 117 115 2
Trung bình 120,4 115,6 4,8
Ðộ lệch chuẩn 13,2 10,3 4,6 12
1.2. Kiểm định t bắt cặp
Bước 1: Xây dựng giả thuyết Ho
- Sau điều trị HATT của mỗi cá nhân không thay đổi
- Trung bình hiệu số của HATT bằng zero
Bước 2: Chọn kiểm định phù hợp
Kiểm định t bắt cặp với 10 – 1 = 9 độ tự do
Bước 3:
- Tính trung bình, độ lệch chuẩn của hiệu số
- Giá trị t
13
1.2. Kiểm định t bắt cặp
Bước 3: Tính trung bình, độ lệch chuẩn của hiệu số,
giá trị t
d
d = 4,8 sd = 4,6 t= = 3,3
sd / n
Bước 4: Tra bảng t với 9 độ tự do
→0,005 < p < 0,01
15
1.2. Kiểm định t bắt cặp
Câu lệnh Stata:
ttest dinhluong_truoc = dinhluong_sau
ttest hatruoc = hasau
Paired t test
Variable Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
16
1.3. Kiểm định t
với phương sai đồng nhất
Trong 641 đối tượng tham gia nghiên cứu có 326
trẻ trai và 315 trẻ gái. Trọng lượng sơ sinh trung
bình của trẻ trai là 3211,3 gram với độ lệch chuẩn
là 666,0 gram. Trọng lượng sơ sinh trung bình của
trẻ gái là 3044,1 gram với độ lệch chuẩn là 628,7
gram.
17
1.3. Kiểm định t
với phương sai đồng nhất
1. Ho: Trọng lượng sơ sinh trung bình của trẻ trai
= trọng lượng sơ sinh trung bình của trẻ gái
2. Lựa chọn kiểm định: Kiểm định t không bắt cặp với
n1 + n2 – 2 = 639 độ tự do
3. Tính giá trị t nếu giả thuyết Ho đúng
(ntrai − 1) sd trai
2
+ (ngái − 1) sd gái
2
325 666,0 2 + 314 628,7 2
sd = = = 647,9
(ntrai − 1) + (ngái − 1) 325 + 314
( xtrai − x gái ) 3211,3 − 3044,1 167,2
t= = = = 3,27
1 1 1 1 51,19
sd ( + ) 647,9 +
ntrai ngái 326 315 18
1.3. Kiểm định t
với phương sai đồng nhất
Ðiểm phần trăm
0.5 0.67
4. Tính xác suất của thống
0.4 0.84 kê: 0,001 < p < 0,002
0.3 1.04
5. Kết luận: Bác bỏ Ho
0.2 1.28
0.1 1.64 Trọng lượng sơ sinh trung bình
0.05 1.96 của trẻ trai khác biệt có ý nghĩa
0.02 2.33
thống kê so với trọng lượng sơ
0.01 2.58
0.005 2.81 sinh trung bình của trẻ gái.
0.002 3.09 3.27
0.001 3.29
0.0001 3.89 19
1.3. Kiểm định t
với phương sai đồng nhất
Câu lệnh Stata: ttesti n1 m1 sd1 n2 m2 sd2
ttesti 326 3211.3 666 315 3044.1 628.7
Two-sample t test with equal variances
21
1.3. Kiểm định t
với phương sai đồng nhất
1
2
Bước 1: So
sánh độ lệch
chuẩn giữa 4
2 nhóm 22
22
1.3. Kiểm định t
với phương sai đồng nhất
Bước 1: So sánh độ lệch chuẩn giữa 2 nhóm
6 7
Biến nhị giá
Biến định lượng
8 23
1.3. Kiểm định t
với phương sai đồng nhất
Bước 1: So sánh độ lệch chuẩn giữa 2 nhóm
Câu lệnh Stata: sdtest dinhluong,by(nhigia)
sdtest tlsosinh,by(gioi)
Variance ratio test
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
3 4
25
1.3. Kiểm định t
với phương sai đồng nhất
Bước 2: So sánh trung bình giữa 2 nhóm
5
Biến định lượng
6 7
Biến nhị giá
8 26
1.3. Kiểm định t
với phương sai đồng nhất
Bước 2: So sánh trung bình giữa 2 nhóm
Câu lệnh Stata: ttest dinhluong,by(nhigia)
ttest tlsosinh,by(gioi)
Two-sample t test with equal variances
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
Hỏi trọng lượng sơ sinh trung bình của trẻ sinh non
so với trẻ không sinh non khác nhau có ý nghĩa
thống kê hay không?
28
1.4. Kiểm định t
với phương sai KHÔNG đồng nhất
1
2
Bước 1: So
sánh độ lệch
chuẩn giữa 4
2 nhóm 29
29
1.4. Kiểm định t
với phương sai KHÔNG đồng nhất
Bước 1: So sánh độ lệch chuẩn giữa 2 nhóm
6 7
Biến nhị giá
Biến định lượng
8 30
1.4. Kiểm định t
với phương sai KHÔNG đồng nhất
Bước 1: So sánh độ lệch chuẩn giữa 2 nhóm
Câu lệnh Stata: sdtest dinhluong,by(nhigia)
sdtest tlsosinh,by(sinhnon)
Variance ratio test
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
3 4
32
1.4. Kiểm định t
với phương sai KHÔNG đồng nhất
Bước 2: So sánh trung bình giữa 2 nhóm
5
Biến định lượng
6 7
8
Biến nhị giá
9 33
1.4. Kiểm định t
với phương sai KHÔNG đồng nhất
Bước 2: So sánh trung bình giữa 2 nhóm
Câu lệnh Stata: ttest dinhluong,by(nhigia) unequal
ttest tlsosinh,by(sinhnon) unequal
Two-sample t test with unequal variances
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
Nhà nghiên cứu muốn tìm hiểu yếu tố ảnh hưởng đến
trọng lượng sơ sinh của trẻ. Câu hỏi đặt ra là ở những
bà mẹ có nghề nghiệp khác nhau thì sinh con có trọng
lượng khác nhau hay không?
37
2. Kiểm định ANOVA
Bước 3: Tính giá trị của thống kê
Tự do Công nhân Viên chức
Ta có:
n 104 238 299
X = 3129.136
Xj 2981.41 3118.08 3189.32
sj 643.76 646.69 654.2
Bảng phân tích phương sai:
𝑆𝑆 MSb
Nguồn biến thiên SS d.f. 𝑀𝑆 =
𝑛−𝑘
F=
MS w
Giữa các nhóm 3382844.5 2 1691422.2
4.01
Trong các nhóm 269338597 638 422160.81
38
2. Kiểm định ANOVA
F= 4.01 df1=2 df2=638
4.01 0.01<p<0.025
39
2. Kiểm định ANOVA
40 40
2. Kiểm định ANOVA
Câu lệnh Stata:
aovsum, n(n1 n2 n3) m(m1 m2 m3) sd(sd1 sd2 sd3)
aovsum, n(104 238 299) m(2981.41 3118.08 3189.32) sd(643.76 646.69 654.2)
Groups Summary of Response variable
(cells) Mean Std. Dev. Obs.
Analysis of Variance
Source SS df MS F Prob > F
42
2. Kiểm định ANOVA
1
43
2. Kiểm định ANOVA
5 6
8
44
2. Kiểm định ANOVA
Câu lệnh Stata: oneway dinhluong dinhtinh, tab
oneway tlsosinh nghenghiep, tab
Summary of trong luong so sinh
Nghe nghiep (gram)
cua me Mean Std. Dev. Freq.
Analysis of Variance
Source SS df MS F Prob > F
U1 = 52.5 – 6 x (6 + 1) / 2 = 31.5
U2 = 38.5 – 7 x (7 + 1) / 2 = 10.5
Chọn giá trị U nhỏ nhất → U = 10.5
Bước 4: Tra bảng
51
3.1. Kiểm định phi tham số
Mann-Whitney
U = 10.5 > 6
→ p > 0.05
52
3.1. Kiểm định phi tham số
Mann-Whitney
Mở tập tin tlsosinh.dta.
Hãy so sánh tuổi thai của trẻ giữa những bà mẹ có
cao huyết áp so với những bà mẹ không cao huyết áp.
Biết rằng tuổi thai có phân phối bị lệch.
53
3.1. Kiểm định phi tham số
Mann-Whitney
1
2
54
3.1. Kiểm định phi tham số
Mann-Whitney
5 6
55
3.1. Kiểm định phi tham số
Mann-Whitney
Câu lệnh Stata: ranksum dinhluong,by(nhigia)
ranksum tuoithai,by(cha)
Two-sample Wilcoxon rank-sum (Mann-Whitney) test
1. Loại bỏ mọi hiệu số bằng zero. Sắp xếp các hiệu số còn
lại theo thứ tự tăng dần.
T+ = 3,5 + 10 + 7 + 5 + 8 + 6+ 2 + 9 = 50,5
T- = 3,5 + 1 = 4,5
3.2. Kiểm định sắp hạng
có dấu Wilcoxon
Các bước tiến hành:
3. Kiểm định sắp hạng có dấu Wilcoxon dựa trên việc đánh
giá T, số nhỏ hơn.
→ Chọn T = 4,5
4. Tra bảng
3.2. Kiểm định sắp hạng
có dấu Wilcoxon
4.5<8.47
P<0.05
3.2. Kiểm định sắp hạng
có dấu Wilcoxon
Mở tập tin antihyr.dta.
So sánh nhịp tim trước và sau điều trị. Biết rằng nhịp
tim có phân phối lệch.
61
3.2. Kiểm định sắp hạng
có dấu Wilcoxon
1
2
62
3.2. Kiểm định sắp hạng
có dấu Wilcoxon
5 6
63
3.2. Kiểm định sắp hạng
có dấu Wilcoxon
Câu lệnh Stata: signrank dinhluongtrước = dinhluongsau
signrank hrate1 = hrate2
Wilcoxon signed-rank test
all 12 78 78
r 12 gi
ij
j =1 k= ni (ri − r )
ri = N ( N + 1) i =1
ni
65
3.3. Kiểm định phi tham số
Kruskall-Wallis
Mở tập tin tlsosinh.dta.
Hãy so sánh tuổi thai của trẻ giữa những bà mẹ có
nghề nghiệp khác nhau.
Biết rằng tuổi thai có phân phối bị lệch.
66
3.3. Kiểm định phi tham số
Kruskall-Wallis
1
2
67
3.3. Kiểm định phi tham số
Kruskall-Wallis
7
68
3.3. Kiểm định phi tham số
Kruskall-Wallis
Câu lệnh Stata: kwallis dinhluong,by(danhdinh)
kwallis tuoithai,by(nghenghiep)
Kruskal-Wallis equality-of-populations rank test
1 104 34714.50
2 238 72973.50
3 299 98073.00
BÀI TẬP
Bài tập 1
Trung bình và độ lệch chuẩn của đường huyết của
15 người tuân thủ chế độ ăn đặc biệt là 90mg% và
độ lệch chuẩn là 12. Kiểm định giả thuyết Ho:
đường huyết trung bình của nhóm người này bằng
với đường huyết trung bình của quần thể bằng
100mg%. Giá trị của phép kiểm t là (lấy trị số tuyệt
đối của t)
a. 2,54 b. 3,23
c. 2,12 d. 2,80
71
Bài tập 2
Trong một nghiên cứu có 9 người nam tuổi từ 20 -
29 được tiêm Digoxin. Bốn và tám giờ sau khi tiêm,
số liệu của 9 người này lần lượt là
(1,0 - 1,0), (1,3 - 1,3), (0,9 - 0,7), (1,0 - 1,0),
(1,0 - 0,9), (0,9 - 0,8), (1,3 -1,2), (1,1 - 1,0),
(1,0 - 1,0).
Hãy cho biết nồng độ Digoxin có thay đổi hay
không?
72
Bài tập 3
Một nghiên cứu thực nghiệm để so sánh thời gian
không có triệu chứng giữa 2 nhóm bệnh nhân hen
(mỗi nhóm 10 bệnh nhân) được chia ngẫu nhiên và
sử dụng 2 loại thuốc: Ở nhóm A thời gian không có
triệu chứng (theo ngày) là: 16; 16; 20; 22; 28; 30;
30; 30; 34; 40 và của 10 người dùng thuốc B là:
9; 12; 14; 15; 17; 19; 19; 22; 29; 30.
Hãy so sánh thời gian không triệu chứng trung bình
giữa 2 nhóm bệnh nhân hen?
73
Bài tập 4
Để so sánh lượng corticoid/24h trong nước tiểu của
phụ nữ béo phì và phụ nữ bình thường, người ta
thu được kết quả, trong 120 người béo phì có
lượng corticoid trung bình là 6,3mg, sd=1,7mg và
trong 148 người bình thường có lượng corticoid
trung bình là 4,5 mg, sd=1,5mg.
Hỏi lượng corticoid trung bình trong 24 giờ có khác
biệt giữa 2 nhóm hay không?
74
Bài tập 5
( x1 − x2 ) ( x1 − x2 )
- Giá trị t: t= =
SE 1 1
sd ( + )
n1 n2
- Độ tự do: df = n1 + n2 - 2
77
TÓM TẮT
d. Kiểm định ANOVA: k
X =
N k
SS w SS w
- Trung bình bình phương nội bộ: MS w = =
d. f2 n − k
SSb SSb
- Tr.bình bình phương giữa các nhóm MSb = =
d . f1 k − 1
MSb
- Trung bình bình phương: F =
MSw
78
CÂU LỆNH STATA
1. Kiểm định t:
Đã có biến số:
ttest dinhluong = #
ttest dinhluong_truoc = dinhluong_sau
ttest dinhluong, by(nhigia)