You are on page 1of 36

TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT

KHOA TOÁN KINH TẾ

PHÂN TÍCH DỮ LIỆU KINH TẾ


CHƯƠNG 2. PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ

Thành phố Hồ Chí Minh, Ngày 11 tháng 9 năm 2023

VTLU PTDL 1 / 35
NỘI DUNG

1 Bài toán phân tích phương sai một yếu tố

2 So sánh trung bình tổng thể: kiểm định Turkey

VTLU PTDL 2 / 35
Bài toán phân tích phương sai một yếu tố

1 Phân tích phương sai một yếu tố được sử dụng trong trường hợp chỉ có yếu
tố nào đó được xem xét nhằm xác định ảnh hưởng của nó đến một yếu tố
khác.
2 Yếu tố được xem xét ảnh hưởng sẽ được dùng để phân loại các quan sát
thành các nhóm khác nhau.

VTLU PTDL 3 / 35
Bài toán phân tích phương sai một yếu tố

Tổng quát:
1 Giả sử ta có k- nhóm (mẫu); n1 , n2 , . . . , nk quan sát được chọn ngẫu nhiên
độc lập từ k tổng thể (n1 , n2 , . . . , nk có thể khác nhau về kích thước).
2 Gọi µ1 , µ2 , . . . , µk là các trung bình tổng thể; xij là quan sát thứ j của
nhóm thứ i.
3 Bảng các giá trị quan sát của k nhóm
Nhóm 1 Nhóm 2 ... Nhóm k
x11 x12 ... x1k
x21 x22 ... x2k
... ... ... ...
x n1 1 x n2 2 ... x nk k

VTLU PTDL 4 / 35
Bài toán phân tích phương sai một yếu tố

Với giả định


1 các tổng thể phân phối chuẩn
2 có phương sai bằng nhau
3 các sai số là độc lập với nhau
Bài toán phân tích phương sai một yếu tố thực hiện như sau:

 H0 : µ1 = µ2 = . . . = µk
H1 : Tồn tại ít nhất một cặp khác nhau.
Mức ý nghĩa α

VTLU PTDL 5 / 35
Bài toán phân tích phương sai một yếu tố

Bước 1
1 Tính giá trị trung bình xi cho từng nhóm;
Pni
j=1 xij
xi =
ni

2 Tính giá trị trung bình chung cho tất cả các nhóm: x̄
Pk
i=1 ni xi
x̄ = ,
n
k
P
trong đó n = ni .
i=1

VTLU PTDL 6 / 35
Bài toán phân tích phương sai một yếu tố
Bước 2
1 Gọi SSW là sự biến thiên trong nội bộ từng nhóm;
k
X
SSW = SSi .
i=1

với
ni
2
X
SSi = (xij − xi ) ; i = 1, 2, . . . , k.
j=1

SSi là sự biến thiên trong nội bộ nhóm i.


2 SSG là sự biến thiên giữa các nhóm;
k
2
X
SSG = ni (xi − x̄) .
i=1

VTLU PTDL 7 / 35
Bài toán phân tích phương sai một yếu tố
1 SST là tổng bình phương các chênh lệch giữa từng quan sát với trung bình
tất cả các quan sát;

SST = SSW + SSG .


Công thức này chính là cơ sở của phương pháp phân tích phương sai một yếu
tố.
2 Bước 3 Tính các ước lượng cho phương sai chung của k tổng thể
SSW SSG
MSW = ; MSG = .
n−k k −1
MSG
1 Bước 4 Tính giá trị kiểm định F = .
MSW
2 Quy tắc quyết định: Bác bỏ H0 ở mức ý nghĩa α, nếu
F > Fk−1, n−k, α

trong đó Fk−1, n−k, α có phân phối Fisher với (k − 1) bậc tự do của tử số và


(n − k) bậc tự do của mẫu số.
VTLU PTDL 8 / 35
Bài toán phân tích phương sai một yếu tố

Ví dụ
Có một cuộc khảo sát ở bốn cửa hàng về số lượng sản phẩm của công ty X bán
được trong mỗi tháng với kết quả như sau:
Cửa hàng 1 Cửa hàng 2 Cửa hàng 3 Cửa hàng 4
20 13 23 34
19 30 18 13
19 20 23 16
21 21 17
22 19 21
22
Ở mức ý nghĩa 0.05, hãy kiểm tra trung bình của 4 cửa hàng trên là như nhau hay
không? Với cả giả định như các tổng thể có phân phối chuẩn, phương sai bằng
nhau và các sai số độc lập với nhau.

VTLU PTDL 9 / 35
Bài toán phân tích phương sai một yếu tố

Giải
1 Bài toán kiểm định

 H0 : µ1 = µ2 = µ3 = µ4
H : Tồn tại ít nhất một cặp khác nhau
 1
Mức ý nghĩa α = 0.05

2 Các giá trị k = 4, n = 19


n1 = 6, x1 = 20.5, S12 = 1.9
n2 = 5, x2 = 20.6, S22 = 37.3
n3 = 5, x3 = 20.4, S32 = 7.8
n4 = 3, x4 = 21, S42 = 129

VTLU PTDL 10 / 35
Bài toán phân tích phương sai một yếu tố
1 Bước 1 x1 = 20.5, x2 = 20.6, x3 = 20.4, x4 = 21
6 × 20.5 + 5 × 20.6 + 5 × 20.4 + 3 × 21
x= = 20.5789
6+5+5+3
2 Bước 2 Tính SSi = (ni − 1) × Si2

SS1 = 9.5, SS2 = 149.2, SS3 = 31.2, SS4 = 258


SSW = 447.9

SSG = 6 × (20.5789 − 20.5)2 + 5 × (20.5789 − 20.6)2


+5 × (20.5789 − 20.4)2 + 3 × (20.5789 − 21)2
= 0.7316

⇒ SST = 447.9 + 0.7316 = 448.6316


VTLU PTDL 11 / 35
Bài toán phân tích phương sai một yếu tố

1 Bước 3
SSW 447.9
MSW = = = 29.86
n−k 19 − 4
SSG 0.7316
MSG = = = 0.24387
k −1 4−1
2 Bước 4 Giá trị kiểm định
MSG 0.24387
F = = = 0.0082
MSW 29.86
3 Miền H0 là
(0, Fk−1,n−k,α ) = (0, F3,15,0.05 ) = (0, 3.2874).
4 Kết luận Giá trị kiểm định thuộc miền H0 nên chưa có cơ sở bác bỏ H0 .
Chấp nhận trung bình của 4 cửa hàng bằng nhau với mức ý nghĩa 0.05.

VTLU PTDL 12 / 35
Bài toán phân tích phương sai một yếu tố

Bảng phân tích trung bình bằng Stata

Hình: Trung bình các cửa hàng

VTLU PTDL 13 / 35
Bài toán phân tích phương sai một yếu tố

Bảng kết quả ANOVA bằng Stata

Hình: Phân tích phương sai các cửa hàng

VTLU PTDL 14 / 35
Bài toán phân tích phương sai một yếu tố

Giải thích các thuật ngữ


1 Sum of Squares: tổng các chênh lệch bình phương
2 df: bậc tự do
3 Mean Squares: trung bình các chênh lệch bình phương - phương sai,
4 F : giá trị kiểm định F ,
5 Sig.: giá trị p − value của kiểm định F ,
MSG
6 Between Groups: giữa các nhóm, SSG , k − 1, MSG , F = MSW
7 Within Groups: trong nội bộ nhóm, SSW , n − k, MSW
8 Total: tổng số, n − 1, SST .

VTLU PTDL 15 / 35
Bài toán phân tích phương sai một yếu tố

Có thể tiến hành ANOVA trực tiếp trên thanh công cụ như hình sau:

Hình: Cách tiến hành phân tích ANOVA bằng Stata

VTLU PTDL 16 / 35
Bài toán phân tích phương sai một yếu tố

Sử dụng bộ dữ liệu "Math2003.dta", bằng phần mềm Stata, ở mức ý nghĩa 0.05,
hãy cho biết có sự khác biệt về trung bình diểm Toán (mrawsc) theo chủng tộc
người (race) không?

VTLU PTDL 17 / 35
Bài toán phân tích phương sai một yếu tố

Sử dụng bộ dữ liệu "Math2003.dta", bằng phần mềm Stata, ở mức ý nghĩa 0.05,
hãy cho biết có sự khác biệt về trung bình diểm Toán (mrawsc) theo chủng tộc
người (race) không?

VTLU PTDL 17 / 35
Bài toán phân tích phương sai một yếu tố

VTLU PTDL 18 / 35
Bài toán phân tích phương sai một yếu tố

VTLU PTDL 19 / 35
So sánh trung bình tổng thể: kiểm định Turkey

Trong trường hợp giả thuyết H0 cho rằng trung bình của k tổng thể bằng nhau bị
bác bỏ thì chấp nhận H1 .
Do so sánh từng cặp trung bình tổng thể nên ta có tất cả Ck2 bài toán kiểm định
trung bình tổng thể như sau:

H0 : µ1 = µ2
H1 : µ1 ̸= µ2

H0 : µ1 = µ3
H1 : µ1 ̸= µ3
...

H0 : µk−1 = µk
H1 : µk−1 ̸= µk

VTLU PTDL 20 / 35
So sánh trung bình tổng thể: kiểm định Turkey

1 Tính giá trị kiểm định

Dij = |xi − xj | ; ∀i, j = 1, 2, . . . , k.

2 Tiêu chuẩn so sánh r


MSW
T = qα, k, n−k ,
n0
trong đó
qα, k, n−k là giá trị tra bảng phân phối q ở mức ý nghĩa α;
với bậc tự do tương ứng là k và (n − k) ; n0 = min {n1 ; n2 ; . . . ; nk }.
3 Quy tắc quyết định: Bác bỏ H0 trong bài toán (i, j) ở mức ý nghĩa α nếu
Dij > T .

VTLU PTDL 21 / 35
So sánh trung bình tổng thể: kiểm định Turkey

Ví dụ Một công ty muốn so sánh bốn chương trình đào tạo cho công nhân về kỹ
năng sử dụng các thiết bị. Hai mươi nhân viên mới được chọn ngẫu nhiên để
tham gia các chương trình đào tạo, với 5 người cho mỗi chương trình. Kết quả
tóm tắt về điểm của các công nhân như sau:

VTLU PTDL 22 / 35
So sánh trung bình tổng thể: kiểm định Turkey

Kết quả bảng phân tích phương sai ANOVA như sau

Ở mức ý nghĩa 0.05, chứng tỏ số điểm trung bình của công nhân ở 4 chương trình
tập huấn là không bằng nhau, do p − value = 0.0031 < 0.05
Cần phải thực hiện kiểm đinh sâu ANOVA, tức là kiểm định Turkey so sánh trung
bình của hai tổng thể.

VTLU PTDL 23 / 35
So sánh trung bình tổng thể: kiểm định Turkey

Bài toán kiểm định so sánh trung bình của hai tổng thể

H0 : µprog1 = µprog2
H1 : µprog1 ̸= µprog2

D12 = |11.8 − 8.8| = 3



H0 : µprog1 = µprog3
H1 : µprog1 ̸= µprog3
D13 = |11.8 − 12.2| = 0.4

H0 : µprog1 = µprog4
H1 : µprog1 ̸= µprog4
D14 = |11.8 − 8.6| = 3.2

VTLU PTDL 24 / 35
So sánh trung bình tổng thể: kiểm định Turkey

1 Tiêu chuẩn so sánh


n0 = min{n1 , n2 , n3 , n4 } = 5
2 Giá trị tra bảng phân phối Turkey

q0.05,4,20−4 = q0.05,4,16 = 4.05

3 Tiêu chuẩn so sánh


r r
MSW 2.6
T = 4.05 × = 4.05 × = 2.92
n0 5

4 Quy tắc quyết định: D12 , D14 , D23 và D43 > T nên bác bỏ H0

VTLU PTDL 25 / 35
So sánh trung bình tổng thể: kiểm định Turkey

Kết luận: Ở mức ý nghĩa 0.05


1 Có sự khác biệt về trung bình giữa chương trình 1 và chương trình 2.
2 Có sự khác biệt về trung bình giữa chương trình 1 và chương trình 4.
3 Có sự khác biệt về trung bình giữa chương trình 2 và chương trình 3.
4 Có sự khác biệt về trung bình giữa chương trình 4 và chương trình 3.
5 Không có sự khác biệt giữa các cặp trung bình còn lại.

VTLU PTDL 26 / 35
So sánh trung bình tổng thể: kiểm định Tukey
Kết quả phân tích sâu ANOVA theo Tukey bằng Stata

Ở mức ý nghĩa 0.05, so sánh giá trị p − value được cho trong bảng kết quả với
0.05, ta cũng
VTLU
thu được các kết luận tương
PTDL
tự như trên. 27 / 35
So sánh trung bình tổng thể: kiểm định Bonferroni

Kết quả phân tích sâu ANOVA theo Bonferronni

Ở mức ý nghĩa 0.05, so sánh giá trị p − value được cho trong bảng kết quả với
0.05, ta có thể kết luận rằng có sự khác biệt về trung bình giữa các cặp chương
trình 1 và 4; 2 và 3; 3 và 4.

VTLU PTDL 28 / 35
So sánh trung bình tổng thể: kiểm định Scheffe

Kết quả phân tích sâu ANOVA theo Scheffe

Ở mức ý nghĩa 0.05, so sánh giá trị p − value được cho trong bảng kết quả với
0.05, ta cũng thu được các kết luận tương tự như kiểm định Bonferronni.

VTLU PTDL 29 / 35
So sánh trung bình tổng thể: kiểm định Sidak

Kết quả phân tích sâu ANOVA theo Sidak

Ở mức ý nghĩa 0.05, so sánh giá trị p − value được cho trong bảng kết quả với
0.05, ta cũng thu được các kết luận tương tự như kiểm định Bonferronni và
Scheffe.

VTLU PTDL 30 / 35
Bài toán phân tích sâu ANOVA
Sử dụng bộ dữ liệu "Math2003.dta", bằng phần mềm Stata, ở mức ý nghĩa 0.05,
hãy cho biết có sự khác biệt về trung bình diểm Toán (mrawsc) theo chủng tộc
người (race) không? Nếu có, đó là sự khác biệt về trung bình điểm Toán giữa
những chủng tộc người nào?

VTLU PTDL 31 / 35
Bài toán phân tích sâu ANOVA
Sử dụng bộ dữ liệu "Math2003.dta", bằng phần mềm Stata, ở mức ý nghĩa 0.05,
hãy cho biết có sự khác biệt về trung bình diểm Toán (mrawsc) theo chủng tộc
người (race) không? Nếu có, đó là sự khác biệt về trung bình điểm Toán giữa
những chủng tộc người nào?

VTLU PTDL 31 / 35
Bài toán phân tích sâu ANOVA
Sử dụng bộ dữ liệu "Math2003.dta", bằng phần mềm Stata, ở mức ý nghĩa 0.05,
hãy cho biết có sự khác biệt về trung bình diểm Toán (mrawsc) theo chủng tộc
người (race) không? Nếu có, đó là sự khác biệt về trung bình điểm Toán giữa
những chủng tộc người nào?

VTLU PTDL 32 / 35
So sánh trung bình tổng thể: kiểm định Turkey

Bài tập về nhà

VTLU PTDL 33 / 35
So sánh trung bình tổng thể: kiểm định Turkey
Bài tập về nhà

VTLU PTDL 34 / 35

You might also like