You are on page 1of 39

NỘI DUNG HỌC PHẦN

 Bài 1. Khái niệm cơ bản


 Bài 2. Thống kê mô tả
 Bài 3. Phân phối Mẫu
 Bài 4. Ước lượng điểm
 Bài 5. Ước lượng khoảng
 Bài 6. Kiểm định giả thuyết một tham số
 Bài 7. Suy diễn trên hai mẫu
 Bài 8. Phân tích phương sai
 Bài 9. Kiểm định phi tham số
 Bài 10. Giới thiệu thống kê Bayes
THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 1
Bài 8. PHÂN TÍCH PHƯƠNG SAI
 ANOVA (Analysis of Variance)
 8.1. Phân tích biến động
 8.1. ANOVA một nhân tố
 8.2. ANOVA hai nhân tố không tương tác
 8.3. ANOVA hai nhân tố có tương tác

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 2


8.1. Phân tích biến động
 Hai công ty, mỗi công ty 4 lao động, xét lương
 Mỗi công ty có 2 người được đào tạo thêm, 2 người
không
Công ty A Công ty B
5 6 8 9 5 6 8 9

Non-trained Trained Non-trained Trained

 Phân tích biến động lương công ty A


 So sánh hai công ty A, B
THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 3
Phân tích
Công ty A
Quan sát 5 6 8 9
Trung bình chung: 7
Độ lệch: –2 –1 +1 +2 SST
Nhóm Non- Trained = 10
Giá trị của nhóm: 5 6 8 9
Trung bình nhóm: 5.5 8.5
Độ lệch trong mẫu: –1.5 –1.5 +1.5 +1.5
SSB
Độ lệch do sai số: –0.5 +0.5 –0.5 +0.5
=9
SSW
=1

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 4


Tổng bình phương (SS)
 SST (Sum of Squares Total): Tổng biến động trong mẫu
 SSB (Sum of Squares Between groups): Biến động giữa
các nhóm, được giải thích bởi nhân tố,
 SSW (Sum of Squares Within group): Biến động trong
các nhóm, giải thích bởi sai số
 SST = SSB + SSW

 Ký hiệu khác của SSB: SSM (model), SSTR (treatment),


SSG (group)
 Ký hiệu khác của SSW: SSE (error), SSR (residual)

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 5


Bảng ANOVA
 Tổng bậc tự do: n – 1 = 4 – 1 = 3, df của SST là 3
 Nhân tố có hai nhóm: df của SSB là 2 – 1 = 1
 Df của SSW is 4 – 2 = 2
 Bảng:
Source of Variation SS df MS
Between Group SSB = 9 2–1=1 MSB = 9/1
Within Group SSW = 1 4–2=2 MSW = 1/2
Total SST = 10 4–1=3

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 6


8.2. ANOVA một nhân tố
 Single-factor ANOVA A1 A2 … Ak
 Biến định lượng …
 Nhân tố A có k nhóm: A1, …
… … … …
A2,…, Ak
… …
 Trong nhóm i, có ni quan …
sát của
 Phân tích biến động của X
 Đánh giá khác biệt về
trung bình của X

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 7


Các giả thiết của ANOVA
 X phân phối Chuẩn trong mỗi nhóm
 Phương sai của trong mỗi nhóm là bằng nhau
 Mẫu là ngẫu nhiên và độc lập

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 8


Kiểm định giả thuyết
 Đặt trung bình của X trong các nhóm Ai là
 Giả thuyết:

• Các trung bình bằng nhau: nhân tố không tác động


đến trung bình
 Not : ’ với ít nhất một cặp
• Ít nhất một trung bình khác biệt
• Nhân tố có tác động đến trung bình

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 9


Tổng bình phương (SS)
 Tổng biến động A1 … Ak
 SST = X1,1 Xk,1
= X1,2 Xk,2
 Biến động trong các nhóm … …
X1,n1 …
 SSW = =
Xk,nk
=
Group
 Biến động giữa các nhóm mean …
 SSB = Overall
 SST = SSB + SSW mean

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 10


Minh họa
 Trung bình bằng nhau hay khác nhau?

A1 A2 A3 A1 A2 A3

 Large variation within  Small variation within


group: weak evidence for group: strong evidence for
different means different means
THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 11
Minh họa
 SST = SSB + SSE

𝑥3 𝑥3
𝑥2 𝑥2
𝒙
𝑥1 𝑥1

SST: Total SSB: Variation SSE: Variation


variation between groups within groups

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 12


Bảng ANOVA
Source of
Variation SS df MS (Variance) F ratio
Between SSB
Groups
Within
Groups SSW
Total SST


 Nếu thì bác bỏ H0

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 13


Ví dụ 8.1
Ca1 Ca2 Ca3
 Năng suất của 16 lao động 8 9 5
 3 ca sản xuất 6 6 6
9 9 5
 Lập bảng ANOVA và kiểm định 8 7 7
7 6 6
8
 Sample size: n = 16
 TB chung:
 TB: , ,
 SST = (8 – 7)2 + … + (6 – 7)2 = 28
 SSB = 5(7.6 – 7)2 + 6(7.5 – 7)2 + 5(5.8 – 7)2 = 10.5
 SSW = SST – SSB = 28 – 10.5 = 17.5
THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 14
Ví dụ
Source of SS df MS F ratio
Variation
Giữa các nhóm
Between Groups 10.5 2

Trong các nhóm 17.5 13


Within Groups
Total 28 15

 Mức 5%:
 Mức 1%:

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 15


Excel
 Data Analysis  ANOVA: Single-factor

  Column : Dữ liệu theo cột


 Alpha: 0.05
  Output Range
THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 16
Excel
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
F1 5 38 7.6 1.3
F2 6 45 7.5 1.9
F3 5 29 5.8 0.7
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 10.5 2 5.25 3.9 0.047 3.805
Within Groups 17.5 13 1.346
Total 28 15        

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 17


8.3. ANOVA hai nhân tố không tương
tác
 Hai nhân tố : A and B
 A có nhóm: A1, A2,…, Ah
 B có nhóm: B1, B2,…, Bk
 Với mỗi trường hợp , một giá trị của :
 (Trường hợp nhiều giá trị xét sau)
 Kiểm định: xét riêng
• Nhân tố A có tác động đến trung bình của ?
• Nhân tố B có tác động đến trung bình của ?

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 18


Dữ liệu

Nhân tố B: nhóm
B1 B2 … Bk
A1 …
Nhân tố
A2 …
A
… … … … …
nhóm Ah …

giá trị

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 19


SS và MS
B1 … Bk TB theo
hàng
A1 …
… … … … …
Ah …
TB theo … TB
cột chung SSB =

SSA = SST =

SSW =

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 20


SS và bậc tự do Df
 SST: Tổng biến động
 SSA: Biến động do nhân tố A
 SSB: Biến động do nhân tố B
 SSW: Biến động do sai số
 SST = SSA + SSB + SSW
 Bậc tự do
• SST:
• SSA:
• SSB:
• SSW:
THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 21
 Tính chất: SST = SSA + SSB + SSW
Source of
Variation SS df MS (Variance) F ratio
Nhân tố SSA
A
Nhân tố SSB
B

Sai số SSW

Total
SST

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 22


Kiểm định tác động
 H0: : nhân tố A không tác động
 H1: Nhân tố A có tác động đến TB
 Nếu thì bác bỏ H0

 H0: : nhân tố B không tác động


 H1: Nhân tố B có tác động đến TB
 If thì bác bỏ H0

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 23


Ví dụ
 Doanh thu các cửa hàng City area
 3 khu vực Inner Sub Outer
High 12 11 10

Advertising
 4 mức quảng cáo
Medium 10 9 8
Low 9 5 7
None 6 7 5

 Xây dựng bảng ANOVA và kiểm định xem các nhân tố


có tác động đến doanh thu trung bình không

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 24


Ví dụ 8.2
City area (B)
Inner Sub Outer Mean
High 12 11 10 11
Adv. (A)

Medium 10 9 8 9
Low 9 5 7 7  SST = (12 – 8.25)2 +
None 6 7 5 6 … + (5 – 8.25)2 =
Mean 9.25 8 7.5 8.25 58.25

 SSAdv = 3[(11 – 8.25)2 + (9 – 8.25)2 + (7 – 8.25)2 +


(6 – 8.25)2] = 44.25
 SSArea = 4[(9.25 – 8.25)2 + (8 – 8.25)2 + (7.5 – 8.25)2] = 6.5

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 25


 SSW = SST – SSR – SSC = 58.25 – 44.25 – 6.5 = 7.5
 n = 12, h = 4, k = 3
Source SS df MS F ratio
Advertising 44.25 3 14.25 11.8
City area 6.5 2 3.25 2.6
Error 7.5 6 1.25
Total 58.25 11

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 26


Excel
 Data Analysis  ANOVA: Two-factor without replication
Anova: Two-Factor Without Replication
SUMMARY Count Sum Average Variance
High 3 33 11 1
Medium 3 27 9 1
Low 3 21 7 4
No 3 18 6 1
Inner 4 37 9.25 6.25
Sub 4 32 8 6.667
Outer 4 30 7.5 4.333
ANOVA
Sources of variation SS df MS F P-value F crit
Rows 44.25 3 14.75 11.8 0.006 4.757
Columns 6.5 2 3.25 2.6 0.154 5.143
Error 7.5 6 1.25
Total 58.25 11       
THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 27
8.4. ANOVA hai nhân tố có tương tác
 Hai nhân tố A và B
 Nhân tố A có nhóm
 Nhân tố B có nhóm
 Với mỗi trường hợp có quan sát
 Phân tích tác động không chỉ A, B mà còn tương tác
của A*B đến trung bình của X
 Tổng số quan sát

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 28


Dữ liệu
Nhân tố B: k nhóm
B1 B2 … Bk
X111 X121 X1k1
A1 … … … … m giá trị
X11m X12m X1km
Nhân tố A: h nhóm

mỗi trường
X211 X221 X2k1 hợp
A2 … … … …
X21m X22m X2km
… … … … …
Xh11 Xh21 Xhk1 Tổng
Ah … … … … n = hkm
Xh1m Xh2m Xhkm giá trị Xijl

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 29


Trung bình
B1 B1 Bk Row
… mean
A1 X111 … X11m X121 … X12m … X1k1…X1km

X211 … X21m X221 … X22m … X2k1…X2km


A2
… … … … … …
Ah Xh11…Xh1m Xh11…Xh1m … Xhk1…Xhkm

Column … Overall
mean mean

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 30


Tổng bình phương
B1 Bk Row

Mean
A1 X111…X11m … X1k1…X1km
… … … … …
Ah Xh11…Xh1m … Xhk1…Xhkm
Col. Overall
Mean … mean SSB =

SSA = SST =

SSI =
SSW =
THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 31
ANOVA table
Source of
Variation SS df MS (Variance) F ratio

Nhân tố
A SSA

Nhân tố
B SSB

Tương
tác A*B SSI

Sai số SSW

Total SST

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 32


Kiểm định F
 H0: Nhân tố A không tác động đến trung bình
 Nếu thì bác bỏ H0

 H0: Nhân tố B không tác động đến trung bình


 Nếu thì bác bỏ H0

 H0: Tương tác A*B không tác động đến trung bình
 Nếu thì bác bỏ H0

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 33


Ví dụ 8.3
Area
 24 cửa hàng Inner Sub Outer
 3 khu vực High 12 11 10
14 12 11
 4 chính sách Q.cáo

Advertising
Medium 10 9 8
9 7 8
Low 9 5 7
10 6 6
None 6 7 5
5 6 5

 Dùng ANOVA phân tích tác động, có tương tác

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 34


Excel
Anova: Two-Factor With Replication Anova: Two-Factor With Replication

SUMMARY Inner Sub Outer Total SUMMARY Inner Sub Outer Total
High         Low        
Count 2 2 2 6 Count 2 2 2 6
Sum 26 23 21 70 Sum 19 11 13 43
Average 13 11.5 10.5 11.67 Average 9.5 5.5 6.5 7.17
Variance 2 0.5 0.5 1.87 Variance 0.5 0.5 0.5 3.77

Medium         None        
Count 2 2 2 6 Count 2 2 2 6
Sum 19 16 16 51 Sum 11 13 10 34
Average 9.5 8 8 8.5 Average 5.5 6.5 5 5.67
Variance 0.5 2 0 1.1 Variance 0.5 0.5 0 0.67

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 35


Excel
Anova: Two-Factor With Replication
SUMMARY Inner Sub Outer
Total          
Count 8 8 8
Sum 75 63 60
Average 9.375 7.875 7.5
Variance 8.553 6.411 4.857
ANOVA
Source of Variation SS df MS F P-value F crit
Sample 117.5 3 39.167 58.75 1.9E-07 3.490
Columns 15.75 2 7.875 11.812 0.001 3.885
Interaction 13.25 6 2.208 3.312 0.037 2.996
Within 8 12 0.667
Total 154.5 23       

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 36


8.5. Một số bổ sung
 ANOVA hai nhân tố không tương tác: mỗi trường hợp
có thể có nhiều hơn 1 giá trị.
 ANOVA hai nhân tố có tương tác: mỗi trường hợp có
thể có số giá trị khác nhau.
 Excel không thực hiện cho hai trường hợp trên, nhưng
phần mềm khác thì có: SPSS, R

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 37


Dữ liệu cho ANOVA trong SPSS, R
Lương Ca
 ANOVA một nhân tố tương đương 8 1
6 1
 1 biến định lượng 9 1
 1 biến định tính 8 1
7 1
9 2
6 2
Ca1 Ca2 Ca3 9 2
7 2
8 9 5
6 2
6 6 6
8 2
9 9 5
5 3
8 7 7
6 3
7 6 6
5 3
8 7 3
6 3
THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 38
Dữ liệu cho ANOVA trong SPSS, R
Sale Area Advertising
12 1 3
 ANOVA hai nhân tố tương đương 14
10
1
1
3
2
9 1 2
 1 biến định lượng 9
10
1
1
1
1
6 1 0
 2 biến định tính 5 1 0
11 2 3
12 2 3
9 2 2
City area 7
5
2
2
2
1
6 2 1
Inner Sub Outer 7 2 0
6 2 0
High 12 11 10 10 3 3
Advertising

11 3 3
8 3 2
Medium 10 9 8 8 3 2
7 3 1
Low 9 5 7 6 3 1
5 3 0
None 6 7 5 5 3 0

THỐNG KÊ TOÁN– Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 39

You might also like