You are on page 1of 22

Phân tích phương sai 1 yếu tố

(one-way ANOVA)
Trình bày: MSc. Vũ Bích Phượng, Radboud University (the Netherlands)
Faculty of Psychology, USSH
phuongvu@hcmussh.edu.vn
Nội dung buổi học
1. Phân tích phương sai 1 yếu tố là gì?

2. Cách phân tích one-way independent


ANOVA (cho thiết kế độc lập/khác
nhóm)

3. Cách phân tích one-way repeated


measures ANOVA (cho thiết kế
lặp/cùng nhóm)
LỰA CHỌN TEST THỐNG KÊ
Câu hỏi NC

Xem xét tương quan Kiểm tra khả năng Xem xét sự khác biệt giữa điểm
giữa các điểm số dự đoán kết quả TB của các nhóm

Phi Mô hình hồi Một biến Hai biến


Tham số: tham quy đơn giản ĐL ĐL
tương số:
quan tương
Pearson r Hồi Hồi Một Hai Ba level
quan Cả hai Cả hai Tk hỗn
Spear- quy quy level level hoặc hơn biến ĐL hợp (1
biến
man tuyến logit có tk biến
ĐL có
rho tính nhị Tham Cùng Khác Cùng Khác khác cùng
tk
linear phân số: nhóm nhóm nhóm nhóm nhóm nhóm 1
cùng
regres binary one- biến
nhóm
-sion logistic sample khác
regres- t-test Tham Tham
Tham Tham số: nhóm)
sion số: số: one-
Phi số: one-way Two-
indepen- way
tham paired repeated Two-way way
dent ANOVA
số: sign samples measure repeated ANOVA
t-test samples Phi Two-
test t-test ANOVA measure
tham ANOVA way
Phi Phi tham
Phi tham số: mixed
tham số: Fried-
số: Kruskal- ANOVA
Sơ đồ quyết đinh số:
Wilco- Mann- man Wallis
Whitney
(Decision flowchart) xon
Phân tích phương sai ANOVA là gì?
• Analysis of variance: phân tích phương sai (sự lệch/khác nhau). Giống như t-test, ANOVA kiểm
định nếu có 1 sự khác biệt đáng kể giữa các điểm trung bình của các nhóm (difference in means).

• Tuy nhiên, khi t-test chỉ so sánh điểm trung bình giữa 2 nhóm, ANOVA có thể so sánh điểm trung
bình của 3 nhóm trở lên.

• One-way ANOVA: phân tích phương sai 1 yếu tố (1 biến độc lập) với ba+ level.

• Lựa chọn phân tích ANOVA sẽ phụ thuộc vào cách thiết kế ta có (thiết kế độc lập hoặc thiết kế
lặp).

• Tóm lại, one-way ANOVA dùng để so sánh sự khác biệt giữa 3+ điểm trung bình của 3+ level
trong 1 biến độc lập.
Phương sai (variance là gì?)
• Phương sai = trung bình cộng* của độ lệch
bình phương (deviation2), nghĩa là = MS =
SS/df (n-1).
[MS: mean sum of squares; SS: sum of squares]

SD = Σ (x – M)2
n -1
*We usually divide by n-1 rather than n as this yields a better estimate
of population variance for small samples (TBC chi cho n – 1, chính là
df, thay vì n để ước tính đúng hơn về phương sai cho mẫu nhỏ).
Logic của ANOVA
• Để tính mức độ đáng kể trong sự khác biệt của các TBC, chúng ta cần
có hai điều:
• Phương sai của từng nhóm (within-group variance): sự chênh lệch trung
bình giữa mỗi điểm giá trị và TBC nhóm của nó (là phương sai mà ta đã biết).
• Phương sai giữa các nhóm (between-group variance): sự chênh lệch trung
bình giữa TBC của từng nhóm và TBC chung (grand mean).
• Cùng 1 logic cho cả thiết kế cùng nhóm và khác nhóm.

F=
Signal

Logic của ANOVA F=


Error

Phương sai của từng nhóm Phương sai giữa các nhóm
(within-group variance) (between-group variance)

M1 M2 M3

M1 M2 Mgrand M3
Tại sao cần dùng 1 ANOVA thay vì 3 t-test?
• Nhắc lại, t-test chỉ so sánh điểm trung bình
giữa 2 nhóm, ANOVA có thể so sánh điểm
trung bình của 3 nhóm trở lên.

• Cho 1 câu hỏi NC, ta muốn kiểm tra xem M1


có khác M2 có khác M3 hay không…

• Ta có thể làm 3 t-test được không?


• So sánh M1 và M2
• So sánh M1 và M3
• So sánh M2 và M3
 KHÔNG! Vì sao?
Tại sao cần dùng 1 ANOVA thay vì 3 t-test?
• Xác suất sẽ bị nhân lên…
• Mỗi một lần thực hiện thống kê suy luận, ta đều sẽ có xác suất phạm phải lỗi loại I. Kể cả
khi kết quả có ý nghĩa thống kê, xác suất phạm lỗi kết luận sai loại I là 5%.
• Khi thực hiện 2 lần phân tích và mỗi lần đều có type I error là 5%, vậy lúc này xác suất
kết luận sai đã bị nhân lên thành 10%!
• Qua 3 lần thực hiện t-test với α = 5%, type I error lúc này đã trở thành 15%, nghĩa là ta
đang có xác suất kết luận rằng H0 sai khi thật ra nó đúng bị gia tăng quá cao!

• Lỗi loại I (type I error): bác bỏ giả thuyết H0 khi nó đúng (cho rằng M1 ≠ M2 ≠ M3
khi thật ra chúng không khác nhau).

 Sử dụng 1 ANOVA thay vì 3 t-test để tránh lỗi loại I. ANOVA có thể thực hiện
3 lần phân tích chỉ với 1 mức α = 5%.
Kiểm định giả thuyết trong ANOVA 1 chiều
• H0 cho rằng khác biệt giữa các
điểm trung bình trong mẫu là
rất nhỏ và xác suất tìm thấy sự
chênh lệch này trong quần thể
là rất thấp. Nếu có tìm thấy thì
chỉ là do sự tình cờ.

• H1 cho rằng có ít nhất 1 sự


chênh lệch đủ lớn giữa các
điểm trung bình và xác suất tìm
thấy sự chênh lệch này trong
quần thể là rất cao mà không
phải do sự tình cờ mang lại.
Logic chấp nhận giả thuyết của one-way
ANOVA
Nếu:
• p > α (xác suất phạm lỗi loại I cao hơn mức ý nghĩa TK)  chấp
nhận H0  không có sự khác biệt giữa các điểm trung bình.
• p < α (xác suất phạm lỗi loại I thấp hơn mức ý nghĩa TK) 
chấp nhận H1  có ít nhất 1 điểm TB có sự chênh lệch đáng kể
so với những điểm TB còn lại.
• Tuy nhiên, ta chưa biết M nào khác M nào.
Phân tích post hoc cùng kỹ thuật hiệu chỉnh (correction) để so sánh
từng cặp M với nhau (pairwise comparison)
M1 vs. M2M1 vs. M3 M2 vs. M3
Yêu cầu của one-way independent ANOVA
1. Mẫu được lấy ngẫu nhiên từ nhóm dân số.
2. Biến PT phải được đo bằng thang khoảng hoặc tỷ lệ, i.e. dữ liệu liên tục.
3. Có 1 biến ĐL và nó phải là biến định danh gồm 2+ levels độc lập nhau, i.e. dữ liệu cho các
levels được lấy từ những nhóm người độc lập nhau (thiết kế độc lập/khác nhóm).
4. Normality: Biến PT trong các levels của biến ĐL cần được phân phối bình thường. Tuy nhiên
ANOVA, cũng như các test thống kê tham số khác, vẫn nhạy trong trường hợp có mẫu lớn
nhưng bị vi phạm yêu cầu phân phối.
5. Outlier: Không có điểm dị biệt trong từng levels của biến ĐL.
6. Homogeneity of variance: Dữ liệu của các levels có phương sai tương đồng nhau. Nếu
không bị vi phạm, sử dụng ANOVA của Fisher. Nếu vi phạm thì dùng Welch’s.
Lưu ý:
 Test phi tham số tương đương với one-way independent ANOVA là Kruskal-Wallis test.
 Khi nhập liệu, hãy tạo 1 cột biến độc lập và 1 cột biến phụ thuộc (giống independent t-test).
Yêu cầu của one-way repeated measures ANOVA
1. Mẫu được lấy ngẫu nhiên từ nhóm dân số.
2. Biến PT phải được đo bằng thang khoảng hoặc tỷ lệ, i.e. dữ liệu liên tục.
3. Biến ĐL phải là biến định danh gồm ít nhất 2+ levels có liên quan tới nhau, i.e.
dữ liệu cho các levels được lấy từ cùng 1 nhóm người (thiết kế lặp/cùng nhóm).
4. Normality: Các biến PT cần được phân phối cân xứng. Tuy nhiên, ANOVA khá
"mạnh" đối với các trường hợp có mẫu lớn nhưng bị vi phạm yêu cầu phân phối
chuẩn 1 chút.
5. Sphericity: Phương sai của sự chênh lệch giữa tất cả các cặp level có thiết kế lặp
bằng nhau, được gọi là giả định sphericity của Mauchly. Nếu vi phạm thì cần
dùng hiệu chỉnh của Greenhouse-Geisser.
Lưu ý:
• Test phi tham số tương đương với one-way RM ANOVA là Fried-man test.
• Khi nhập liệu, không tạo 1 cột biến ĐL riêng mà hãy tạo các cột biến PT riêng biệt,
là dữ liệu của các level.
Giả định Sphericty là gì?
• Là khi phương sai của sự chênh lệch giữa tất
cả các cặp level có thiết kế lặp bằng nhau.
• Dễ hiểu hơn…. là khi phương sai của A-B ≈
A-C ≈ A-D ≈ B-C ≈ B-D ≈ C-D.
• Giống như tất cả các giả định thống kê khác,
giả định này liên quan đến các quần thể mà
từ đó dữ liệu được lấy mẫu, chứ không chỉ
liên quan đến các tập dữ liệu của mẫu.
 Sử dụng test thống kê kiểm tra giả thuyết
về Sphericity của Mauchly.
https://www.graphpad.com/guides/prism/latest/statistics/stat_spherici
ty_and_compound_symmet.htm
Giả định Sphericty là gì?
Mauchly’s test of sphericity:
• H0: phương sai của sự chênh lệch giữa tất cả các cặp level với thiết kế
lặp bằng nhau (KHÔNG bị bất đồng).

• H1: phương sai của sự chênh lệch giữa tất cả các cặp level với thiết kế
lặp BỊ bất đồng.

• α = 5%.
Điều gì xảy ra khi Sphericity bị vi phạm?
• Sphericity sẽ dễ bị vi phạm khi các phép đo lặp lại được thực hiện trong
một khoảng thời gian quá ngắn, bởi các yếu tố ngẫu nhiên gây ra một giá
trị cụ thể cao (hoặc thấp) chưa bị tiêu biến trước khi lần đo lường tiếp
theo bắt đầu.
• Để tránh vi phạm sphericity, hãy đợi đủ lâu giữa các lần thao túng để các
nghiệm thể trở về mốc cân bằng giống như trước khi họ được đo lường
lần đầu. Nếu cần thiết, nên sử dụng thứ tự thao túng ngẫu nhiên (random
order).
• Nếu giả định này bị vi phạm và không được xử lý thì p-value của các phép
đo lặp trong ANOVA sẽ quá nhỏ  gia tăng type I error  hiệu chỉnh của
Greenhouse-Geisser sẽ gia tăng p-value.
https://www.graphpad.com/guides/prism/latest/statistics/stat_spherici
ty_and_compound_symmet.htm
Ôn lại: Cách viết phần Kết quả theo APA
1. Giới thiệu lý do phân tích và loại test sử dụng.
2. Báo cáo kết quả kiểm tra dữ liệu, i.e. thống kê mô tả kiểm tra phân
phối, điểm dị biệt, đồng nhất phương sai, v.v.
• Cách báo cáo: Chỉ báo cáo những yêu cầu bị vi phạm kèm kết quả, hoặc ghi
ngắn gọn: “Dữ liệu đạt được các yêu cầu của independent/repeated
measures ANOVA” nếu không có yêu cầu nào bị vi phạm.
3. Báo cáo kết quả phân tích chính (Pearson r, t-test, ANOVA, v.v.)
4. Diễn giải kết quả và cho biết giả thuyết ban đầu có được ủng hộ hay
không.
Cách báo cáo kết quả ANOVA (bước 3)
• F(df1,df2) = …., p =….
• Nếu số p có ý nghĩa thống kê, tiếp tục báo cáo phân tích post
hoc.
• Báo cáo loại hiệu chỉnh nào đã sử dụng (ví dụ: Tukey/Bonferroni
hay Games-Howell) và các cặp điểm trung bình có khác biệt đáng
kể, số p tương ứng kèm theo M và SD của từng levels.
• Diễn giải kết quả.

• Lưu ý: F, p, M, SD viết in nghiêng.


Mẫu báo cáo KQ one-way RM ANOVA
• Để so sánh sự khác biệt trong mức độ tự tin giữa 3 thời điểm đo lường là trước khi
học, khi kết thúc và sau khi học xong 1 tháng, one-way repeated ANOVA được sử dụng.
• (Bước 2…)

• Kết quả của one-way repeated measures ANOVA với sự hiệu chỉnh của Greehouse-
Geisser cho thấy, có sự khác biệt đáng kể trong mức độ tự tin giữa 3 thời điểm đo
lường, F(1.42, 41.2) = 33.2, p < .001. Cụ thể, phân tích post-hoc với hiệu chỉnh
Bonferroni cho thấy, mức độ tự tin sau khi học cao hơn đáng kể trước khi học, t(58) = -
3.87, p <.001, và mức độ tự tin vẫn tiếp tục tăng đáng kể sau khi học 1 tháng so với khi
học xong, t(58) = -4.3, p < .001. Bảng 2 thể hiện M và SD của từng nhóm.
• (Bước 4…)
Mẫu báo cáo KQ bằng bảng
Ví dụ đoạn mô tả đặc điểm mẫu
• Các thai phụ báo cáo mức trung bình hoạt động thể chất với cường độ vừa và cao vượt hơn 4 lần ( M = 43,80 MET*giờ/tuần,
SD = 48,20) mức khuyến nghị của WHO (10 MET*giờ/tuần). Lưu ý rằng độ lệch chuẩn cũng rất lớn, cho thấy không phải
hầu hết các thai phụ cũng đều có mức HĐTC có cường độ vừa và cao nhiều như vậy. Tương tự, mức trung bình hành vi thụ
động cũng khá cao (M = 74,97 MET*giờ/tuần, SD = 32,09) so với điểm cut-off nếu lấy dựa trên mức khuyến nghị của Tổ
chức Y tế Thế giới là 1,5 MET × 6 giờ × 7 ngày (63 MET*giờ/tuần). Về các hình thức HĐTC, mẫu thai phụ có mức hoạt
động làm việc nhà cao nhất (M = 104,31 MET*giờ/tuần, SD = 72,01), sau đó đến hoạt động nghề nghiệp (M = 49,97
MET*giờ/tuần, SD = 36,24), hoạt động tập thể dục (M = 21,79 MET*giờ/tuần, SD = 25,69), và di chuyển (M = 14,78
MET*giờ/tuần, SD = 12,88).

• Về đặc điểm tâm lý, mẫu thai phụ có điểm trung bình mức độ triệu chứng trầm cảm trên thang EPDS tương đối cao ( M =
9,02, SD = 4,26) nhưng không vượt quá điểm cut-off 15. Tuy nhiên, có 6 phụ nữ trong mẫu (12,5%) đạt điểm từ 15 trở lên.
Điểm trung bình trạng thái lo âu (M = 35,67, SD = 8,22) và nét lo âu (M = 37,31, SD = 9,32) thấp hơn điểm cut-off 40. Tuy
nhiên, có 14 phụ nữ (29,17%) đạt điểm trên 40 trong STAI-State và 15 phụ nữ (31,25%) đạt trên 40 trong STAI-Trait. Toàn
bộ thống kê mô tả được thể hiện trong Bảng 1 bên dưới.

You might also like