Professional Documents
Culture Documents
VTLU PTDL 1 / 35
NỘI DUNG
VTLU PTDL 2 / 35
Bài toán phân tích phương sai một yếu tố
1 Phân tích phương sai một yếu tố được sử dụng trong trường hợp chỉ có yếu
tố nào đó được xem xét nhằm xác định ảnh hưởng của nó đến một yếu tố
khác.
2 Yếu tố được xem xét ảnh hưởng sẽ được dùng để phân loại các quan sát
thành các nhóm khác nhau.
VTLU PTDL 3 / 35
Bài toán phân tích phương sai một yếu tố
Tổng quát:
1 Giả sử ta có k- nhóm (mẫu); n1 , n2 , . . . , nk quan sát được chọn ngẫu nhiên
độc lập từ k tổng thể (n1 , n2 , . . . , nk có thể khác nhau về kích thước).
2 Gọi µ1 , µ2 , . . . , µk là các trung bình tổng thể; xij là quan sát thứ j của
nhóm thứ i.
3 Bảng các giá trị quan sát của k nhóm
Nhóm 1 Nhóm 2 ... Nhóm k
x11 x12 ... x1k
x21 x22 ... x2k
... ... ... ...
x n1 1 x n2 2 ... x nk k
VTLU PTDL 4 / 35
Bài toán phân tích phương sai một yếu tố
VTLU PTDL 5 / 35
Bài toán phân tích phương sai một yếu tố
Bước 1
1 Tính giá trị trung bình xi cho từng nhóm;
Pni
j=1 xij
xi =
ni
2 Tính giá trị trung bình chung cho tất cả các nhóm: x̄
Pk
i=1 ni xi
x̄ = ,
n
k
P
trong đó n = ni .
i=1
VTLU PTDL 6 / 35
Bài toán phân tích phương sai một yếu tố
Bước 2
1 Gọi SSW là sự biến thiên trong nội bộ từng nhóm;
k
X
SSW = SSi .
i=1
với
ni
2
X
SSi = (xij − xi ) ; i = 1, 2, . . . , k.
j=1
VTLU PTDL 7 / 35
Bài toán phân tích phương sai một yếu tố
1 SST là tổng bình phương các chênh lệch giữa từng quan sát với trung bình
tất cả các quan sát;
Ví dụ
Có một cuộc khảo sát ở bốn cửa hàng về số lượng sản phẩm của công ty X bán
được trong mỗi tháng với kết quả như sau:
Cửa hàng 1 Cửa hàng 2 Cửa hàng 3 Cửa hàng 4
20 13 23 34
19 30 18 13
19 20 23 16
21 21 17
22 19 21
22
Ở mức ý nghĩa 0.05, hãy kiểm tra trung bình của 4 cửa hàng trên là như nhau hay
không? Với cả giả định như các tổng thể có phân phối chuẩn, phương sai bằng
nhau và các sai số độc lập với nhau.
VTLU PTDL 9 / 35
Bài toán phân tích phương sai một yếu tố
Giải
1 Bài toán kiểm định
H0 : µ1 = µ2 = µ3 = µ4
H : Tồn tại ít nhất một cặp khác nhau
1
Mức ý nghĩa α = 0.05
VTLU PTDL 10 / 35
Bài toán phân tích phương sai một yếu tố
1 Bước 1 x1 = 20.5, x2 = 20.6, x3 = 20.4, x4 = 21
6 × 20.5 + 5 × 20.6 + 5 × 20.4 + 3 × 21
x= = 20.5789
6+5+5+3
2 Bước 2 Tính SSi = (ni − 1) × Si2
1 Bước 3
SSW 447.9
MSW = = = 29.86
n−k 19 − 4
SSG 0.7316
MSG = = = 0.24387
k −1 4−1
2 Bước 4 Giá trị kiểm định
MSG 0.24387
F = = = 0.0082
MSW 29.86
3 Miền H0 là
(0, Fk−1,n−k,α ) = (0, F3,15,0.05 ) = (0, 3.2874).
4 Kết luận Giá trị kiểm định thuộc miền H0 nên chưa có cơ sở bác bỏ H0 .
Chấp nhận trung bình của 4 cửa hàng bằng nhau với mức ý nghĩa 0.05.
VTLU PTDL 12 / 35
Bài toán phân tích phương sai một yếu tố
VTLU PTDL 13 / 35
Bài toán phân tích phương sai một yếu tố
VTLU PTDL 14 / 35
Bài toán phân tích phương sai một yếu tố
VTLU PTDL 15 / 35
Bài toán phân tích phương sai một yếu tố
Có thể tiến hành ANOVA trực tiếp trên thanh công cụ như hình sau:
VTLU PTDL 16 / 35
Bài toán phân tích phương sai một yếu tố
Sử dụng bộ dữ liệu "Math2003.dta", bằng phần mềm Stata, ở mức ý nghĩa 0.05,
hãy cho biết có sự khác biệt về trung bình diểm Toán (mrawsc) theo chủng tộc
người (race) không?
VTLU PTDL 17 / 35
Bài toán phân tích phương sai một yếu tố
Sử dụng bộ dữ liệu "Math2003.dta", bằng phần mềm Stata, ở mức ý nghĩa 0.05,
hãy cho biết có sự khác biệt về trung bình diểm Toán (mrawsc) theo chủng tộc
người (race) không?
VTLU PTDL 17 / 35
Bài toán phân tích phương sai một yếu tố
VTLU PTDL 18 / 35
Bài toán phân tích phương sai một yếu tố
VTLU PTDL 19 / 35
So sánh trung bình tổng thể: kiểm định Turkey
Trong trường hợp giả thuyết H0 cho rằng trung bình của k tổng thể bằng nhau bị
bác bỏ thì chấp nhận H1 .
Do so sánh từng cặp trung bình tổng thể nên ta có tất cả Ck2 bài toán kiểm định
trung bình tổng thể như sau:
H0 : µ1 = µ2
H1 : µ1 ̸= µ2
H0 : µ1 = µ3
H1 : µ1 ̸= µ3
...
H0 : µk−1 = µk
H1 : µk−1 ̸= µk
VTLU PTDL 20 / 35
So sánh trung bình tổng thể: kiểm định Turkey
VTLU PTDL 21 / 35
So sánh trung bình tổng thể: kiểm định Turkey
Ví dụ Một công ty muốn so sánh bốn chương trình đào tạo cho công nhân về kỹ
năng sử dụng các thiết bị. Hai mươi nhân viên mới được chọn ngẫu nhiên để
tham gia các chương trình đào tạo, với 5 người cho mỗi chương trình. Kết quả
tóm tắt về điểm của các công nhân như sau:
VTLU PTDL 22 / 35
So sánh trung bình tổng thể: kiểm định Turkey
Kết quả bảng phân tích phương sai ANOVA như sau
Ở mức ý nghĩa 0.05, chứng tỏ số điểm trung bình của công nhân ở 4 chương trình
tập huấn là không bằng nhau, do p − value = 0.0031 < 0.05
Cần phải thực hiện kiểm đinh sâu ANOVA, tức là kiểm định Turkey so sánh trung
bình của hai tổng thể.
VTLU PTDL 23 / 35
So sánh trung bình tổng thể: kiểm định Turkey
Bài toán kiểm định so sánh trung bình của hai tổng thể
H0 : µprog1 = µprog2
H1 : µprog1 ̸= µprog2
VTLU PTDL 24 / 35
So sánh trung bình tổng thể: kiểm định Turkey
4 Quy tắc quyết định: D12 , D14 , D23 và D43 > T nên bác bỏ H0
VTLU PTDL 25 / 35
So sánh trung bình tổng thể: kiểm định Turkey
VTLU PTDL 26 / 35
So sánh trung bình tổng thể: kiểm định Tukey
Kết quả phân tích sâu ANOVA theo Tukey bằng Stata
Ở mức ý nghĩa 0.05, so sánh giá trị p − value được cho trong bảng kết quả với
0.05, ta cũng
VTLU
thu được các kết luận tương
PTDL
tự như trên. 27 / 35
So sánh trung bình tổng thể: kiểm định Bonferroni
Ở mức ý nghĩa 0.05, so sánh giá trị p − value được cho trong bảng kết quả với
0.05, ta có thể kết luận rằng có sự khác biệt về trung bình giữa các cặp chương
trình 1 và 4; 2 và 3; 3 và 4.
VTLU PTDL 28 / 35
So sánh trung bình tổng thể: kiểm định Scheffe
Ở mức ý nghĩa 0.05, so sánh giá trị p − value được cho trong bảng kết quả với
0.05, ta cũng thu được các kết luận tương tự như kiểm định Bonferronni.
VTLU PTDL 29 / 35
So sánh trung bình tổng thể: kiểm định Sidak
Ở mức ý nghĩa 0.05, so sánh giá trị p − value được cho trong bảng kết quả với
0.05, ta cũng thu được các kết luận tương tự như kiểm định Bonferronni và
Scheffe.
VTLU PTDL 30 / 35
Bài toán phân tích sâu ANOVA
Sử dụng bộ dữ liệu "Math2003.dta", bằng phần mềm Stata, ở mức ý nghĩa 0.05,
hãy cho biết có sự khác biệt về trung bình diểm Toán (mrawsc) theo chủng tộc
người (race) không? Nếu có, đó là sự khác biệt về trung bình điểm Toán giữa
những chủng tộc người nào?
VTLU PTDL 31 / 35
Bài toán phân tích sâu ANOVA
Sử dụng bộ dữ liệu "Math2003.dta", bằng phần mềm Stata, ở mức ý nghĩa 0.05,
hãy cho biết có sự khác biệt về trung bình diểm Toán (mrawsc) theo chủng tộc
người (race) không? Nếu có, đó là sự khác biệt về trung bình điểm Toán giữa
những chủng tộc người nào?
VTLU PTDL 31 / 35
Bài toán phân tích sâu ANOVA
Sử dụng bộ dữ liệu "Math2003.dta", bằng phần mềm Stata, ở mức ý nghĩa 0.05,
hãy cho biết có sự khác biệt về trung bình diểm Toán (mrawsc) theo chủng tộc
người (race) không? Nếu có, đó là sự khác biệt về trung bình điểm Toán giữa
những chủng tộc người nào?
VTLU PTDL 32 / 35
So sánh trung bình tổng thể: kiểm định Turkey
VTLU PTDL 33 / 35
So sánh trung bình tổng thể: kiểm định Turkey
Bài tập về nhà
VTLU PTDL 34 / 35