Professional Documents
Culture Documents
5-6. One-Way ANOVA (2)
5-6. One-Way ANOVA (2)
(one-way ANOVA)
Trình bày: MSc. Vũ Bích Phượng, Radboud University (the Netherlands)
Faculty of Psychology, USSH
phuongvu@hcmussh.edu.vn
Nội dung buổi học
1. Phân tích phương sai 1 yếu tố là gì?
Xem xét tương quan Kiểm tra khả năng Xem xét sự khác biệt giữa điểm
giữa các điểm số dự đoán kết quả TB của các nhóm
• Tuy nhiên, khi t-test chỉ so sánh điểm trung bình giữa 2 nhóm, ANOVA có thể so sánh điểm trung
bình của 3 nhóm trở lên.
• One-way ANOVA: phân tích phương sai 1 yếu tố (1 biến độc lập) với ba+ level.
• Lựa chọn phân tích ANOVA sẽ phụ thuộc vào cách thiết kế ta có (thiết kế độc lập hoặc thiết kế
lặp).
• Tóm lại, one-way ANOVA dùng để so sánh sự khác biệt giữa 3+ điểm trung bình của 3+ level
trong 1 biến độc lập.
Phương sai (variance là gì?)
• Phương sai = trung bình cộng* của độ lệch
bình phương (deviation2), nghĩa là = MS =
SS/df (n-1).
[MS: mean sum of squares; SS: sum of squares]
SD = Σ (x – M)2
n -1
*We usually divide by n-1 rather than n as this yields a better estimate
of population variance for small samples (TBC chi cho n – 1, chính là
df, thay vì n để ước tính đúng hơn về phương sai cho mẫu nhỏ).
Logic của ANOVA
• Để tính mức độ đáng kể trong sự khác biệt của các TBC, chúng ta cần
có hai điều:
• Phương sai của từng nhóm (within-group variance): sự chênh lệch trung
bình giữa mỗi điểm giá trị và TBC nhóm của nó (là phương sai mà ta đã biết).
• Phương sai giữa các nhóm (between-group variance): sự chênh lệch trung
bình giữa TBC của từng nhóm và TBC chung (grand mean).
• Cùng 1 logic cho cả thiết kế cùng nhóm và khác nhóm.
F=
Signal
Phương sai của từng nhóm Phương sai giữa các nhóm
(within-group variance) (between-group variance)
M1 M2 M3
M1 M2 Mgrand M3
Tại sao cần dùng 1 ANOVA thay vì 3 t-test?
• Nhắc lại, t-test chỉ so sánh điểm trung bình
giữa 2 nhóm, ANOVA có thể so sánh điểm
trung bình của 3 nhóm trở lên.
• Lỗi loại I (type I error): bác bỏ giả thuyết H0 khi nó đúng (cho rằng M1 ≠ M2 ≠ M3
khi thật ra chúng không khác nhau).
Sử dụng 1 ANOVA thay vì 3 t-test để tránh lỗi loại I. ANOVA có thể thực hiện
3 lần phân tích chỉ với 1 mức α = 5%.
Kiểm định giả thuyết trong ANOVA 1 chiều
• H0 cho rằng khác biệt giữa các
điểm trung bình trong mẫu là
rất nhỏ và xác suất tìm thấy sự
chênh lệch này trong quần thể
là rất thấp. Nếu có tìm thấy thì
chỉ là do sự tình cờ.
• H1: phương sai của sự chênh lệch giữa tất cả các cặp level với thiết kế
lặp BỊ bất đồng.
• α = 5%.
Điều gì xảy ra khi Sphericity bị vi phạm?
• Sphericity sẽ dễ bị vi phạm khi các phép đo lặp lại được thực hiện trong
một khoảng thời gian quá ngắn, bởi các yếu tố ngẫu nhiên gây ra một giá
trị cụ thể cao (hoặc thấp) chưa bị tiêu biến trước khi lần đo lường tiếp
theo bắt đầu.
• Để tránh vi phạm sphericity, hãy đợi đủ lâu giữa các lần thao túng để các
nghiệm thể trở về mốc cân bằng giống như trước khi họ được đo lường
lần đầu. Nếu cần thiết, nên sử dụng thứ tự thao túng ngẫu nhiên (random
order).
• Nếu giả định này bị vi phạm và không được xử lý thì p-value của các phép
đo lặp trong ANOVA sẽ quá nhỏ gia tăng type I error hiệu chỉnh của
Greenhouse-Geisser sẽ gia tăng p-value.
https://www.graphpad.com/guides/prism/latest/statistics/stat_spherici
ty_and_compound_symmet.htm
Ôn lại: Cách viết phần Kết quả theo APA
1. Giới thiệu lý do phân tích và loại test sử dụng.
2. Báo cáo kết quả kiểm tra dữ liệu, i.e. thống kê mô tả kiểm tra phân
phối, điểm dị biệt, đồng nhất phương sai, v.v.
• Cách báo cáo: Chỉ báo cáo những yêu cầu bị vi phạm kèm kết quả, hoặc ghi
ngắn gọn: “Dữ liệu đạt được các yêu cầu của independent/repeated
measures ANOVA” nếu không có yêu cầu nào bị vi phạm.
3. Báo cáo kết quả phân tích chính (Pearson r, t-test, ANOVA, v.v.)
4. Diễn giải kết quả và cho biết giả thuyết ban đầu có được ủng hộ hay
không.
Cách báo cáo kết quả ANOVA (bước 3)
• F(df1,df2) = …., p =….
• Nếu số p có ý nghĩa thống kê, tiếp tục báo cáo phân tích post
hoc.
• Báo cáo loại hiệu chỉnh nào đã sử dụng (ví dụ: Tukey/Bonferroni
hay Games-Howell) và các cặp điểm trung bình có khác biệt đáng
kể, số p tương ứng kèm theo M và SD của từng levels.
• Diễn giải kết quả.
• Kết quả của one-way repeated measures ANOVA với sự hiệu chỉnh của Greehouse-
Geisser cho thấy, có sự khác biệt đáng kể trong mức độ tự tin giữa 3 thời điểm đo
lường, F(1.42, 41.2) = 33.2, p < .001. Cụ thể, phân tích post-hoc với hiệu chỉnh
Bonferroni cho thấy, mức độ tự tin sau khi học cao hơn đáng kể trước khi học, t(58) = -
3.87, p <.001, và mức độ tự tin vẫn tiếp tục tăng đáng kể sau khi học 1 tháng so với khi
học xong, t(58) = -4.3, p < .001. Bảng 2 thể hiện M và SD của từng nhóm.
• (Bước 4…)
Mẫu báo cáo KQ bằng bảng
Ví dụ đoạn mô tả đặc điểm mẫu
• Các thai phụ báo cáo mức trung bình hoạt động thể chất với cường độ vừa và cao vượt hơn 4 lần ( M = 43,80 MET*giờ/tuần,
SD = 48,20) mức khuyến nghị của WHO (10 MET*giờ/tuần). Lưu ý rằng độ lệch chuẩn cũng rất lớn, cho thấy không phải
hầu hết các thai phụ cũng đều có mức HĐTC có cường độ vừa và cao nhiều như vậy. Tương tự, mức trung bình hành vi thụ
động cũng khá cao (M = 74,97 MET*giờ/tuần, SD = 32,09) so với điểm cut-off nếu lấy dựa trên mức khuyến nghị của Tổ
chức Y tế Thế giới là 1,5 MET × 6 giờ × 7 ngày (63 MET*giờ/tuần). Về các hình thức HĐTC, mẫu thai phụ có mức hoạt
động làm việc nhà cao nhất (M = 104,31 MET*giờ/tuần, SD = 72,01), sau đó đến hoạt động nghề nghiệp (M = 49,97
MET*giờ/tuần, SD = 36,24), hoạt động tập thể dục (M = 21,79 MET*giờ/tuần, SD = 25,69), và di chuyển (M = 14,78
MET*giờ/tuần, SD = 12,88).
• Về đặc điểm tâm lý, mẫu thai phụ có điểm trung bình mức độ triệu chứng trầm cảm trên thang EPDS tương đối cao ( M =
9,02, SD = 4,26) nhưng không vượt quá điểm cut-off 15. Tuy nhiên, có 6 phụ nữ trong mẫu (12,5%) đạt điểm từ 15 trở lên.
Điểm trung bình trạng thái lo âu (M = 35,67, SD = 8,22) và nét lo âu (M = 37,31, SD = 9,32) thấp hơn điểm cut-off 40. Tuy
nhiên, có 14 phụ nữ (29,17%) đạt điểm trên 40 trong STAI-State và 15 phụ nữ (31,25%) đạt trên 40 trong STAI-Trait. Toàn
bộ thống kê mô tả được thể hiện trong Bảng 1 bên dưới.