Professional Documents
Culture Documents
Bài 3-Môn phân tích xử lý số liệu thực nghiệm-IUH
Bài 3-Môn phân tích xử lý số liệu thực nghiệm-IUH
Bài 3-Môn phân tích xử lý số liệu thực nghiệm-IUH
1
Xấp xỉ phân phối chuẩn của một phân phối nhị
thức
• Đối với cá nhân người tiêu dùng i, xác suất thích sản phẩm A là
pi. Giả thiết rằng tất cả người tiêu dùng là độc lập thì pi = p.
• Phương sai của pi là var(pi) = p(1-p)
• Đối với 1 mẫu của n người tiêu dùng, xác suất ước lượng mức
độ ưa thích sản phẩm A là: p + p2 + p3 + ... + pn
p= 1
n
Và phương sai của p là:
p (1 - p )
var( p ) =
n
Độ lệch chuẩn: p (1 - p )
s= 3
n
3
Xấp xỉ phân phối chuẩn của một phân phối nhị thức
• 10 người, 8 người thích A.
• Tỉ lệ ưa thích A: p = 0.8
• Phương sai: var(p) = 0.8(0.2)/10 = 0.016
• Độ lệch chuẩn của p: s = 0.126
• 95% CI of p: 0.8 + 1.96(0.126) = 0.55 to 1.00
2
Kiểm định giả thiết và Trị số p
Chương 7, Giáo trình Phân tích số liệu và vẽ biểu đồ bằng R.
3
Các giả định của kiểm định T-Student (T-Test)
• Số liệu dạng số (numeric) và liên tục (continuous)
• Phân phối chuẩn (normal distribution)
4
Paired t-test – ví dụ
• Vấn đề: Đánh giá một loại thịt dưới ánh sáng trắng và ánh sáng đỏ về
mức độ ưa thích loại thịt. 12 người tham gia được hỏi đánh giá mức
độ đỏ của thịt dưới ánh sáng đỏ và ánh sáng trắng
Kết quả:
Người AS đỏ AS trắng
1 20 22
2 18 19
3 19 17
4 22 18
5 17 21
6 20 23
7 19 19
8 16 20
9 21 22
10 17 20
11 23 27
12 18 24
10
5
Paired t-test – R phân tích
red<-c(20,18,19,22,17,20,19,16,21,17,23,18)
white<-c(22,19,17,18,21,23,19,20,22,20,27,24)
t.test(red, white, paired=TRUE)
11
11
df=n1+n2-2 12
12
6
Two-group comparison: Ví dụ
20 người tiêu dùng đánh giá mức độ ưa thích
của hộ đối với 2 món ăn tráng miệng làm từ gạo
(A & B)
13
13
14
14
7
Two sample t-test Unequal variance - dùng R
a<-c(3,7,1,9,3,4,1,2,6,7,5,8,5,9,4,6,4,3,9,5)
b<-c(3,1,2,4,5,2,2,5,3,2,3,4,2,3,5,4,3,1,3,2)
t.test(a,b)
15
15
Ví dụ sau thể hiện mức độ enzym lysozyme có trong gastric juice của 29
bệnh nhân bị bệnh (peptic ulcer) và 30 người bình thường ( normal
controls). Kết quả cho thấy có sự khác biệt giữa hai nhóm.
Group 1:
0.2 0.3 0.4 1.1 2.0 2.1 3.3 3.8 4.5 4.8 4.9 5.0 5.3 7.5 9.8 10.4
10.9 11.3 12.4 16.2 17.6 18.9 20.7 24.0 25.4 40.0 42.2 50.0 60.0
Group 2:
0.2 0.3 0.4 0.7 1.2 1.5 1.5 1.9 2.0 2.4 2.5 2.8 3.6 4.8 4.8 5.4 5.7
5.8 7.5 8.7 8.8 9.1 10.3 15.6 16.1 16.5 16.7 20.0 20.7 33.0
16
16
8
Unpaired t-test by R
g1 <-c( 0.2, 0.3, 0.4, 1.1, 2.0, 2.1, 3.3, 3.8,
4.5, 4.8, 4.9, 5.0, 5.3, 7.5, 9.8, 10.4,
10.9, 11.3, 12.4, 16.2, 17.6, 18.9, 20.7,
24.0, 25.4, 40.0, 42.2, 50.0, 60)
g2 <-c(0.2, 0.3, 0.4, 0.7, 1.2, 1.5, 1.5, 1.9, 2.0,
2.4, 2.5, 2.8, 3.6, 4.8, 4.8, 5.4, 5.7, 5.8,
7.5, 8.7, 8.8, 9.1, 10.3, 15.6, 16.1, 16.5,
16.7, 20.0, 20.7, 33.0)
t.test(g1, g2)
data: g1 and g2
t = 2.0357, df = 40.804, p-value = 0.04831
alternative hypothesis: true difference in means is not
equal to 0
95 percent confidence interval:
0.05163216 13.20239083
sample estimates:
mean of x mean of y
14.310345 7.683333
17
17
15
hist(g1)
hist(g2)
Group 1:
10
10
Frequency
Frequency
mean(g1) = 14.3
sd(g1) = 15.7
Group 2:
5
mean(g2) = 7.7
sd(g2) = 7.8
0
0 10 20 30 40 50 60 0 5 10 20 30
g1 g2
18
18
9
Phân tích lại số liệu về lysozyme
log.g1 <- log(g1)
log.g2 <- log(g2)
t.test(log.g1, log.g2)
data: log.g1 and log.g2
t = 1.406, df = 55.714, p-value = 0.1653
alternative hypothesis: true difference in means is not
equal to 0
95 percent confidence interval:
-0.2182472 1.2453165
sample estimates:
mean of x mean of y
1.921094 1.407559
exp(1.921-1.407) = 1.67
Giá trị trung bình của nhóm 1 lớn hơn GTTB nhóm 2 là 67%
19
19
Trị số p = 0.682 > alpha=0.05, cho thấy quả thật độ khác biệt về igfi giữa hai nhóm
nam và nữ không có ý nghĩa thống kê.
20
20
10
Kiểm định Wilcoxon cho các biến số theo cặp (wilcox.test)
• Thay vì dùng kiểm định t cho từng cặp, chúng ta cũng có thể sử dụng hàm wilcox.test
cho cùng mục đích:
• Ví dụ: Một nhóm bệnh nhân gồm 10 người được điều trị bằng một thuốc nhằm giảm
huyết áp. Huyết áp của bệnh nhân được đo lúc khởi đầu nghiên cứu (lúc chưa điều
trị), và sau khi điều khị. Số liệu huyết áp của 10 bệnh nhân như sau:
Trước khi điều trị (x0): 180, 140, 160, 160, 220, 185, 145, 160, 160, 170
Sau khi điều trị (x1): 170, 145, 145, 125, 205, 185, 150, 150, 145, 155
21
22
22
11
So sánh hai tỉ lệ
Nhóm
1 2
____________________________________________
Z = D / SE
Với (n1 + n2) > 20, và nếu Z > 2, có thể từ chối giả thiết Ho.
23
23
24
24
12
So sánh 2 tỉ lệ - R
events <- c(90, 36)
total <- c(100, 100)
prop.test(events, total)
25
25
table(sex, ethnicity)
ethnicity
sex African Asian Caucasian Others
Female 4 43 22 0
Male 4 17 8 2
26
26
13
So sánh hơn 2 tỉ lệ – Prop.test
4-sample test for equality of proportions without
continuity correction
Warning message:
Chi-squared approximation may be incorrect in:
prop.test(females, total)
27
27
Warning message:
Chi-squared approximation may be incorrect in:
chisq.test(sex, ethnicity)
28
28
14