You are on page 1of 45

Th.

S Hà Văn Hiệp
 Hồi quy với biến độc lập là biến định tính
 Hồi quy với biến phụ thuộc là biến định tính
 Phân tích ANOVA

2
 Biến độc lập định tính như giới tính (nam, nữ),
phương thức thanh toán (tiền mặt, séc, thẻ tín
dụng), v.v…
Ví dụ: biến x2 là giới tính trong đó x2 = 0 chỉ nam và x2
= 1 chỉ nữ.
 Trong trường hợp này, x2 được gọi là một biến giả
hay biến chỉ báo.
 Nếu một biến định tính có k mức độ thì ta cần có k -
1 biến giả, mỗi biến giả được mã hoá là 0 hoặc 1.
 Ví dụ như một biến có các mức độ A, B, và C sẽ
được biểu thị bằng các giá trị x1 và x2 một cách
tương ứng là (0, 0), (1, 0), và (0,1).

3
Exp. Score Degr. Salary Exp. Score Degr. Salary
4 78 No 24 9 88 Yes 38
7 100 Yes 43 2 73 No 26,6
1 86 No 23,7 10 75 Yes 36,2
5 82 Yes 34,3 5 81 No 31,6
8 86 Yes 35,8 6 74 No 29
10 84 Yes 38 8 87 Yes 34
0 75 No 22,2 4 79 No 30,1
1 80 No 23,1 6 94 Yes 33,9
6 83 No 30 3 70 No 28,2
6 91 Yes 33 3 89 No 30

4
 Phương trình hồi quy bội
E(y ) = β0 + β1x1 + β2x2 + β3x3
 Phương trình hồi quy ước lượng
y^ = b0 + b1x1 + b2x2 + b3x3
trong đó
y = tiền lương hàng năm (000$)
x1 = số năm kinh nghiệm
x2 = số điểm đạt được dựa trên trắc nghiệm
năng khiếu lập trình viên
x3 = 0 nếu cá nhân không có bằng đại học
1 nếu cá nhân có bằng đại học
Lưu ý: x3 được xem như là một biến giả.

5
ƯỚC LƯỢNG VÀ DỰ BÁO

Ước lượng khoảng tin cậy cho E(yp) với x1p và x2p đã cho
yˆ p ± tα 2;n − 2 s yˆ p
Ước lượng khoảng dự báo cho yp với x1p và x2p đã cho
yˆ p ± tα 2;n − 2 sind
trong đó hệ số tin cậy là 1 - α và
tα/2;n-2 dựa trên phân phối t với n - 2 df

6
Khoảng tin cậy cho giá trị trung bình của y,
với x1p và x2p đã cho

Maët hoài quy boäi cuûa maãu seõ khaùc nhau ñoái vôùi caùc
maãu khaùc nhau vaø coù sai soá chuaån s yˆ p vôùi moät coâng
thöùc khaù phöùc taïp.

1 ( x1 p − x1 ) 2 ( x2 p − x2 ) 2 2( x1 p − x1 )( x2 p − x2 )( SCPx1x2 )
s yˆ p = sε + + −
n SSX 1 (1 − r12 ) SSX 2 (1 − r12 )
2 2
SSX 1 ( SSX 2 )(1 − r122 )

Σx1Σx2
trong ñoù : SSX 1 = Σ( xi − x1 ) ; SSX 2 = Σ( xi − x2 ) ; SCPx1x2
2 2
= Σx1 x2 −
n

Ñeå tìm ñoä leäch chuaån cuûa maãu sind cho khoaûng döï
baùo, haõy theâm vaøo moät soá haïng coù giaù trò laø 1 ôû döôùi
caên baäc hai.
7
 Biến phụ thuộc Y chỉ có 2 trạng thái (0,1) - Phân phối
nhị thức (Binary)
 VD: 1- Thu nhập hộ tăng sau thu hồi đất và 0 - Thu
nhập hộ không tăng sau thu hồi đất.
 Nếu gọi P là xác suất để một biến cố xảy ra (ví dụ:
Thu nhập hộ tăng sau thu hồi đất), thì 1-P là xác
suất để biến cố không xảy ra (ví dụ: Thu nhập hộ
không tăng sau thu hồi đất).
 Phương trình hồi quy Logistic phát biểu:

8
 Phương trình hồi quy Binary Logistics
𝑷𝑷 𝒀𝒀=𝟏𝟏
𝑳𝑳𝑳𝑳 = 𝑩𝑩𝟎𝟎 + 𝑩𝑩𝟏𝟏 𝒙𝒙𝟏𝟏 + 𝑩𝑩𝟐𝟐 𝒙𝒙𝟐𝟐 + . . + 𝑩𝑩𝒊𝒊 𝒙𝒙𝒊𝒊
𝑷𝑷 𝒀𝒀=𝟎𝟎
 Trong đó:
P(Y = 1) = P0 : Xác suất xảy ra sự kiện.
P(Y = 0)= 1- P0 : Xác xuất không xảy ra sự kiện..
Xi: Các biến độc lập; Ln: Log của cơ số e (e = 2.714)
 Hệ số Odds: Odds = P0 / (1 – P0)
 𝑳𝑳𝑳𝑳(𝑶𝑶𝑶𝑶𝑶𝑶𝑶𝑶) = 𝑩𝑩𝟎𝟎 + 𝑩𝑩𝟏𝟏 𝒙𝒙𝟏𝟏 + 𝑩𝑩𝟐𝟐 𝒙𝒙𝟐𝟐 + . . + 𝑩𝑩𝒊𝒊 𝒙𝒙𝒊𝒊
 dạng hàm logit

9
 Phương pháp ước lượng hợp ý tối đa (Maximum
Likelihood) để ước lượng Bi
𝑌𝑌 𝑃𝑃
𝐸𝐸 = = 𝑒𝑒 𝐵𝐵0+ 𝐵𝐵1 𝑥𝑥1+ 𝐵𝐵2 𝑥𝑥2+⋯+𝐵𝐵𝑖𝑖 𝑥𝑥𝑖𝑖
𝑋𝑋𝑖𝑖 (1−𝑃𝑃)

10
 Phân tích phương sai (ANOVA) có thể được sử
dụng để kiểm định sự bằng nhau của ba hay
nhiều trung bình tổng thể.
 Các giả thuyết sau.
H0: µ1 = µ2 = µ3 = . . . = µk
Ha: Không phải tất cả các trung bình tổng
thể đều bằng nhau
 Xem xét ảnh hưởng của một yếu tố đến một
yếu tố khác
 Giả định:
 Tổng thể phân phối chuẩn
 Phương sai bằng nhau
 Các sai số là độc lập
Phát biểu giả thuyết
H0: µ1= µ2=µ3=. . . = µk
Ha: Không phải tất cả các trung bình tổng thể
đều bằng nhau
 Thống kê kiểm định
F = MSG/MSW

Quy tắc bác bỏ: Sử dụng thống kê kiểm định:


Bác bỏ H0 nếu F > Fα,k-1,n-k
Với Fα,k-1,n-k có phân phối F với k-1 bậc tự do ở tử
số và n-k bậc tự do ở mẫu số
Phân phối mẫu
của MSG/MSW

Bác bỏ H0
Khoâng baùc boû H0 α
MSG/MSW

Giá trị tới hạn
 Ước lượng của σ2 giữa các nhóm được gọi là
trung bình các bình phương do xử lý (MSG).

∑𝑘𝑘 𝑛𝑛 (𝑥𝑥
𝑖𝑖=1 𝑗𝑗 𝑗𝑗 ̅ −𝑥𝑥) 2
𝑀𝑀𝑀𝑀𝑀𝑀 = 𝑘𝑘 − 1

 Tử số của MSG được gọi là tổng các chênh lêch


bình phương giữa các nhóm (SSG).
 Mẫu số của MSG là bậc tự do ứng với SSG.
 𝑥𝑥̅𝑗𝑗 : trung bình nhóm j
 𝑥𝑥̅ : trung bình chung cho tất cả các nhóm
 Ước lượng của σ2 dựa trên sự biến thiên của các
quan sát mẫu trong nội bộ từng nhóm được gọi
là trung bình các bình phương do sai số (MSW).

∑𝑘𝑘 (𝑛𝑛
𝑗𝑗=1 𝑗𝑗 −1)𝑠𝑠 𝑗𝑗
2
𝑀𝑀𝑀𝑀𝑀𝑀 = 𝑛𝑛−𝑘𝑘

 Tử số của MSE được gọi là tổng các bình


phương do sai số (SSW).
 Mẫu số của MSW là bậc tự do ứng với SSW.
Nguồn Tổng các Bậc Bình phương
Biến thiên bình phương tự do trung bình F

Xử lý SSG k-1 MSG MSG/MSW


Sai số SSW nT – k MSW
Tổng cộng SST nT - 1
𝑛𝑛𝑗𝑗
𝑘𝑘
𝑆𝑆𝑆𝑆𝑆𝑆 = � �(𝑥𝑥𝑖𝑖𝑖𝑖 − 𝑥𝑥̅ )2 = 𝑆𝑆𝑆𝑆𝑆𝑆 + 𝑆𝑆𝑆𝑆𝑆𝑆
𝑗𝑗=1
𝑗𝑗=1
Một GĐ muốn biết thời gian làm việc của các trưởng phòng
thuộc nhà máy có giống nhau không, Một mẫu ngẫu nhiên
đơn giản gồm 5 trưởng phòng từ 3 nhà máy được chọn và
số giờ làm việc của từng trưởng phòng trong tuần vừa qua
được ghi nhận
Quan saùt NM 1 NM 2 NM 3
1 48 73 51
2 54 63 63
3 57 66 61
4 54 64 54
5 62 74 56

Trung bình maãu 55 68 57


Phöông sai maãu 26,0 26,5 24,5
Các giả thuyết
H0: µ1= µ2=µ3
Ha: Không phải tất cả µ i đều bằng nhau
trong đó:
µ 1 = số giờ làm việc trung bình mỗi tuần của
tất cả các trưởng phòng tại Nhà máy 1
µ 2 = số giờ làm việc trung bình mỗi tuần của
tất cả các trưởng phòng tại Nhà máy 2
µ 3 = số giờ làm việc trung bình mỗi tuần của
tất cả các trưởng phòng tại Nhà máy 3
Giá trị thống kê kiểm định
 Phương sai do xử lý
Vì các_ cỡ mẫu tất cả đều bằng nhau
x = (55 + 68 + 57)/3 = 60
SSG = 5(55 - 60)2 + 5(68 - 60)2 + 5(57 - 60)2
= 490
MSG = 490/(3 - 1) = 245
 Phương sai do sai số
SSW = 4(26,0) + 4(26,5) + 4(24,5) = 308
MSW = 308/(15 - 3) = 25,667
F = MSG/MSW = 245/25,667 = 9,55
Baûng ANOVA
Toång caùc
Nguoàn cheânh leäch Baäc
bieán thieân bình phöông töï do Phöông sai F

Caùc xöû lyù 490 2 245 9,55


Sai soá 308 12 25,667
Toång coäng 798 14
Kết luận
F = 9,55 > F0,05,2,12 = 3,89, vì vậy bác bỏ H0.
Số giờ làm việc trung bình mỗi tuần của các trưởng
phòng tại từng nhà máy là không bằng nhau
Bước 1 Chọn menu kéo xuống Tools
Bước 2 Chọn dùng tùy chọn Data Analysis
Bước 3 Chọn dùng Anova: Single Factor
Bước 4 Khi hộp thoại Anova: Single Factor hiện ra:
Nhập B1:D6 vào hộp Input Range
Chọn Grouped By Columns
Chọn Labels in First Row
Nhập 0,05 vào hộp Alpha
Chọn Output Range
Nhập A8 (tùy bạn) vào hộp Output Range
Nhắp vào OK
 Các nghiên cứu thống kê có thể được phân loại
thành thử nghiệm/thực nghiệm hay quan sát.
 Trong một nghiên cứu thử nghiệm, Một hoặc
nhiều yếu tố (factor) được kiểm soát sao cho dữ
liệu có thể thu được về cách mà các yếu tố ảnh
hưởng đến các biến quan tâm.
 Trong một nghiên cứu quan sát, không một nỗ lực
nào được thực hiện nhằm kiểm soát các yếu tố .
 Các mối liên hệ nhân quả thì dễ thiết lập hơn
trong các nghiên cứu thử nghiệm so với các
nghiên cứu quan sát.
 Một yếu tố (factor) là một biến mà người thử nghiệm
chọn để điều tra.
 Một xử lý/nhóm (treatment) là một mức bậc của một yếu
tố.
 Các đơn vị thử nghiệm (Experimental units) là các đối
tượng quan tâm trong thử nghiệm.
 Một thiết kế ngẫu nhiên hoá hoàn toàn (completely
randomized design) là một thiết kế thử nghiệm mà các
xử lý/nhóm được ngẫu nhiên định cho các đơn vị thử
nghiệm.
 Nếu các đơn vị thử nghiệm là không đồng nhất, việc tạo
khối (blocking) có thể được sử dụng để hình thành các
nhóm đồng nhất, đưa đến một thiết kế ngẫu nhiên hoá
theo khối (randomized block design).
KHỐi NHÓM
1 2 … k
1 X11 X21 … Xk1
2 X12 X22 … Xk2
.. … … … …
m X1m X2m … Xkm

 Tính giá trị trung bình nhóm 𝑥𝑥̅𝑖𝑖 (xét theo cột)
 Tính giá trị trung bình khối 𝑥𝑥̅𝑗𝑗 (xét theo hàng)
 Tính giá trị tất cả quan sát 𝑥𝑥̅ (theo hàng và cột)
 Bước 1 Tính Tổng các chênh lệch bình phương toàn bộ
𝑚𝑚
𝑘𝑘
𝑆𝑆𝑆𝑆𝑆𝑆 = � � (𝑥𝑥𝑖𝑖𝑖𝑖 − 𝑥𝑥̅ )2
𝑗𝑗=1
𝑖𝑖=1
 Bước 2 Tính Tổng các chênh lệch bình phương do xử lý
𝑘𝑘

𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑚𝑚 �(𝑥𝑥̅𝑖𝑖 − 𝑥𝑥̅ )2


𝑖𝑖=1

 Bước 3 Tính Tổng các chênh lệch bình phương do khối


𝑚𝑚

𝑆𝑆𝑆𝑆𝐵𝐵𝐵𝐵 = 𝑘𝑘 �(𝑥𝑥̅𝑗𝑗 − 𝑥𝑥̅ )2


𝑗𝑗=1
 Bước 4 Tính Tổng các chênh lệch bình phương do sai số
𝑚𝑚
𝑘𝑘
𝑆𝑆𝑆𝑆𝐸𝐸 = � � (𝑥𝑥𝑖𝑖𝑖𝑖 − 𝑥𝑥̅𝑖𝑖 − 𝑥𝑥̅𝑗𝑗 − 𝑥𝑥̅ )2
𝑗𝑗=1
𝑖𝑖=1
SSE = SST – SSTR - SSBL
 Phân chia Tổng các chênh lệch bình phương toàn
bộ (SST) thành ba nhóm: Tổng các chênh lệch
bình phương do nhóm (SSG), Tổng các chênh lệch
bình phương do các khối (SSBL), và Tổng các
chênh lệch bình phương sai số (SSE).
SST = SSG + SSBL + SSE

 Bậc tự do toàn bộ, n - 1, được phân chia sao cho k


- 1 bậc tự do thuộc về nhóm, m - 1 thuộc về các
khối, và (k - 1)(m - 1) thuộc về số hạng sai số.
Tổng các
Nguồn chênh lệch Bậc Phương
biến thiên bình phương tự do sai F

SSG MSG
Xử lý SSTR k-1 MSG = k−1 MSE

SSBL MSBL
Khối SSBL m–1 MSBL = m−1 MSE

𝑆𝑆𝑆𝑆𝑆𝑆
Sai số SSE (k - 1)(m - 1) 𝑀𝑀𝑀𝑀𝑀𝑀 =
(𝑘𝑘−1)(𝑚𝑚−1)

Tổng cộng SST n-1


Thiết kế ngẫu nhiên hoá theo khối
Một nghiên cứu về phân loại ba hỗn hợp xăng theo
số dặm mỗi galông đã được tiến hành để xác định
các số đo trung bình của ba hỗn hợp có bằng nhau
hay không.
Năm chiếc xe ô tô đã được cho thử dùng từng hỗn
hợp xăng và số dặm mỗi galông được ghi nhận
Xe ô tô Loại xăng (xử lý) Trung bình
(Khối) Hỗn hợp X Hỗn hợp Y Hỗn hợp Z các khối
1 31 30 30 30,333
2 30 29 29 29,333
3 29 29 28 28,667
4 33 31 29 31,000
5 26 25 26 25,667
Trung bình
xử lý 29,8 28,8 28,4
Trung bình mẫu toàn bộ là 29. Vì vậy,
Tổng các chênh lệch bình phương toàn bộ
SST = (31 - 29)2 + (30 - 29)2 + . . . + (26 - 29)2 = 62
Trung bình các chênh lệch bình phương do xử lý
SSG = 5[(29,8 - 29)2 + (28,8 - 29)2 + (28,4 - 29)2] = 5,2
MSG = 5,2/(3 - 1) = 2,6
Trung bình các chênh lệch bình phương do khối
SSBL = 3[(30,333 - 29)2 + . . . + (25,667 - 29)2] = 51,33
MSBL = 51,33/(5 - 1) = 12,8
Trung bình các chênh lệch bình phương do sai số
SSE = 62 - 5,2 - 51,33 = 5,47
MSE = 5,47/[(3 - 1)(5 - 1)] = 0,68
Kiểm định trung bình các nhóm
H0: µ1 = µ2 = µ3 = . . . = µk
Ha: Không phải tất cả các trung bình các nhóm đều
bằng nhau
 Giá trị thống kê kiểm định
F1 = MSG/MSE = 2,6/0,68 = 3,82
Bác bỏ H0 nếu F > Fα,k-1,(k-1)(m-1)
Với Fα,k-1,(k-1)(m-1) có phân phối F với k-1 bậc tự do ở tử số
và (k-1)(m-1) bậc tự do ở mẫu số
 Kết luận
Vì 3,82 < F0,05,2,8 = 4,46, không thể bác bỏ H0
ở mức ý nghĩa 5%. Không có đủ chứng cứ để kết
luận số dặm mỗi galông của 3 hỗn hợp xăng khác
nhau.
Kiểm định trung bình các khối
H0: µ1 = µ2 = µ3 = . . . = µm
Ha: Không phải tất cả các trung bình các khối đều bằng nhau
 Giá trị thống kê kiểm định
F1 = MSBL/MSE = 12,8/0,68 = 18,823
Bác bỏ H0 nếu F > Fα,m-1,(k-1)(m-1)
Với Fα,m-1,(k-1)(m-1) có phân phối F với m-1 bậc tự do ở tử số và
(k-1)(m-1) bậc tự do ở mẫu số
Kết luận
Vì 18,823 > F0,05,2,8 = 3,838, bác bỏ H0 ở mức ý
nghĩa 5%. kết luận số dặm mỗi galông của 5 xe là
khác nhau.
 Böôùc 1 Choïn menu keùo xuoáng Tools
 Böôùc 2 Choïn duøng Data Analysis
 Böôùc 3 Choïn duøng Anova: Two Factor Without
Replication töø danh saùch Analysis Tools
 Böôùc 4 Khi hoäp thoaïi Anova: Two Factor Without
Replication hieän ra:
Nhaäp A1:D6 vaøo hoäp Input Range
Choïn Labels
Nhaäp 0,05 vaøo hoäp Alpha
Choïn Output Range
Nhaäp A8 vaøo hoäp Output Range
Nhaép vaøo OK
 Mục đích: so sánh trung bình của các tổng thể
xét theo hai yếu tố nghiên cứu đến một yếu tố
(định lượng)
 Có nhiều hơn một quan sát trong các ô
 Yếu tố khối được xem là yếu tố thứ hai
 Sự tương tác giữa hai yếu tố nghiên cứu được
xem xét
 Ví dụ như với a mức độ của yếu tố A (trình độ
văn hóa) và b mức độ của yếu tố B (nghề
nghiệp) đến số con trong gia đình.
YẾU TỐ YẾU TỐ THỨ NHẤT
THỨ HAI 1 2 … k
1 X111, X112,… X11s X211, X212,… X21s … Xk11, Xk12,… X11s
2 X121, X122,… X12s X221, X222,… X22s … Xk21, Xk22,… Xk2s
.. … … … …
m X1m1, X1m2,… X1ms X2m1, X2m2,… X2ms … Xkm1, Xkm2,… Xkms

 Tính giá trị trung bình nhóm 𝑥𝑥̅𝑖𝑖 (xét theo cột)
 Tính giá trị trung bình khối 𝑥𝑥̅𝑗𝑗 (xét theo hàng)
 Tính giá trị trung bình khối 𝑥𝑥̅𝑖𝑖𝑗𝑗 (từng ô)
 Tính giá trị tất cả quan sát 𝑥𝑥̅ (theo cả hàng và cột)
 Bước 1 Tính Tổng các chênh lệch bình phương toàn
bộ
𝑘𝑘 𝑚𝑚 𝑠𝑠

𝑆𝑆𝑆𝑆𝑆𝑆 = � � �(𝑥𝑥𝑖𝑖𝑖𝑖𝑖𝑖 − 𝑥𝑥̅ )2


𝑖𝑖=1 𝑗𝑗=1 𝑠𝑠=1

 Bước 2 Tính Tổng các chênh lệch bình phương cho


yếu tố A
𝑘𝑘
𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑚𝑚𝑚𝑚 � (𝑥𝑥̅𝑖𝑖 − 𝑥𝑥̅ )2
𝑖𝑖=1

 Bước 3 Tính Tổng các chênh lệch bình phương cho


yếu tố B
𝑚𝑚
𝑆𝑆𝑆𝑆𝐵𝐵 = 𝑘𝑘𝑘𝑘 � (𝑥𝑥̅𝑗𝑗 − 𝑥𝑥̅ )2
𝑗𝑗=1
 Bước 4 Tính Tổng các chênh lệch bình phương cho
tương tác
𝑘𝑘 𝑚𝑚

𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑠𝑠 � �(𝑥𝑥̅𝑖𝑖𝑖𝑖 − 𝑥𝑥̅𝑖𝑖 − 𝑥𝑥̅𝑗𝑗 − 𝑥𝑥̅ )2


𝑖𝑖=1 𝑗𝑗=1
 Bước 5 Tính Tổng các chênh lệch bình phương do sai
số

𝑆𝑆𝑆𝑆𝑆𝑆 = ∑𝑘𝑘𝑖𝑖=1 ∑𝑚𝑚 ∑ 𝑠𝑠


(𝑥𝑥
𝑗𝑗=1 𝑠𝑠=1 𝑖𝑖𝑖𝑖𝑖𝑖 − 𝑥𝑥̅ 𝑖𝑖 − 𝑥𝑥̅
𝑗𝑗 − 𝑥𝑥̅ 𝑖𝑖𝑖𝑖 − 𝑥𝑥̅ ) 2

SSE = SST – SSA – SSB - SSAB


 Thủ tục ANOVA cho hai yếu tố giống như thử
nghiệm ngẫu nhiên hoá hoàn toàn và thử nghiệm
ngẫu nhiên hoá theo khối.
 Phân chia Tổng các chênh lệch bình phương toàn
bộ (SST) thành các nguồn của nó:
SST = SSA + SSB + SSAB + SSE
 Bậc tự do toàn bộ, kms - 1, được phân chia sao
cho (k – 1) df thuộc về Yếu tố A, (m – 1) df thuộc
về Yếu tố B, (k – 1)(m – 1) df thuộc về sự Tương
tác, và km(s – 1) df thuộc về Sai số
Toång caùc
Nguoàn cheânh leäch Baäc Phöông
bieán thieân bình phöông töï do sai F

SS𝐴𝐴 MSA
Yeáu toá A SSA k–1 MSA = k−1
MSE

SSB MSB
Yeáu toá B SSB m–1 MSB = m−1
MSE

𝑆𝑆𝑆𝑆𝐴𝐴𝐴𝐴 MSAB
Töông taùc SSAB (k – 1)(m – 1) 𝑀𝑀𝑀𝑀𝐴𝐴𝐴𝐴 =
(𝑘𝑘−1)(𝑚𝑚−1) MSE

𝑆𝑆𝑆𝑆𝑆𝑆
Sai soá SSE km(s - 1) 𝑀𝑀𝑀𝑀𝑀𝑀 =
𝑘𝑘𝑚𝑚(𝑠𝑠−1)

Toång coäng SST kms - 1


 Kiểm định các giả thuyết
• Ảnh hưởng của yếu tố thứ nhất
𝐹𝐹1 = 𝑀𝑀𝑀𝑀𝑀𝑀�𝑀𝑀𝑀𝑀𝑀𝑀
• Ảnh hưởng của yếu tố thứ hai
𝐹𝐹2 = 𝑀𝑀𝑀𝑀𝐵𝐵�𝑀𝑀𝑀𝑀𝑀𝑀
• Ảnh hưởng giữa hai yếu tố
𝐹𝐹3 = 𝑀𝑀𝑀𝑀𝐴𝐴𝐴𝐴�𝑀𝑀𝑀𝑀𝑀𝑀
Bác bỏ H0 nếu F > Fα, z,km(s-1)
Với Fα,z,km(s-1) có phân phối F với (k-1) hoặc (m-1) hoặc
(k-1)(m-1) bậc tự do ở tử số và km(s-1) bậc tự do ở mẫu số
Dữ liệu sau đây cho biết tiền lương giờ cho một
mẫu gồm các công nhân ở hai ngành tại ba địa
điểm, mục đích của khảo sát tiền lương là để xác
định xem có sự khác biệt nào trong hai loại ngành
và địa điểm.

Ngành A B C
I 5,50 5,10 5,90
I 5,80 5,00 6,20
I 6,10 5,50 6,10
II 6,40 5,80 6,50
II 6,50 6,00 6,00
II 6,00 5,60 6,10
 Bảng ANOVA

Nguồn biến Tổng các chênh Bậc tự Phương


thiên lệch bình phương do sai F
Yếu tố A 0,76 1 0,76 12,6
Yếu tố B 1,42 2 0,71 11,7
Tương tác 0,18 2 0,09 1,5
Sai số 0,73 12 0,06
Tổng cộng 3,09 17
Kết luận
 Ngành:
F = 12,7 > Fα = 4,75
Tiền lương trung bình khác nhau theo loại ngành
 Địa điểm:
F = 11,8 > Fα = 3,89
Tiền lương trung bình khác nhau theo địa điểm
 Tương tác:
F = 1,5 < Fα = 3,89
Sự tương tác không có ý nghĩa
 Böôùc 1 Choïn menu keùo xuoáng Tools
 Böôùc 2 Choïn duøng Data Analysis
 Böôùc 3 Choïn duøng Anova: Two Factor With
Replication töø danh saùch Analysis Tools
 Böôùc 4 Khi hoäp thoaïi Anova: Two Factor With
Replication hieän ra:
Nhaäp A1:D7 vaøo hoäp Input Range
Nhaäp 3 vaøo hoäp Rows per sample
Nhaäp 0,05 vaøo hoäp Alpha
Nhaäp A9 vaøo hoäp Output Range
Nhaép vaøo OK

You might also like