Professional Documents
Culture Documents
CHƯƠNG 3
𝛽2 : tác động của 𝑒𝑥𝑝𝑒𝑟 lên 𝑤𝑎𝑔𝑒 trong điều kiện các yếu tố khác không
thay đổi.
So với mô hình (1), yếu tố số năm kinh nghiệm (𝑒𝑥𝑝𝑒𝑟 ) được tách tường
minh nên ta có thể đo lường tác động của số năm kinh nghiệm (𝑒𝑥𝑝𝑒𝑟 )
đến tiền lương trong điều kiện các yếu tố khác, bao gồm cả học vấn,
không đổi
3.1 Mô hình hồi quy nhiều biến và phương
pháp bình phương nhỏ nhất
3.1.1 Mô hình hồi quy nhiều biến
Trong đó:
Yi giá trị của biến phụ thuộc Y ( 𝑖 = 1, 𝑛 )
𝛽1 hệ số chặn (hệ số tự do)
𝛽𝑗 hệ số góc (hệ số hồi quy riêng) của biến giải thích
Xj ( 𝑗 = 2, 𝑘 )
Ui sai số ngẫu nhiên
Mô hình hồi quy mẫu xây dựng dựa trên mẫu ngẫu nhiên
Yˆ1 ˆ1
Yˆ2 ˆ
Yˆ = ˆ = 2
... ...
Yˆ ˆ
n k
Thì mô hình hồi quy mẫu (3.2) có thể biểu diễn
dưới dạng ma trận như sau:
= X𝛽መ
Y (3.4)
3.1.2 Các giả thiết cơ bản của MHHQ nhiều biến
𝜎 2 (∀𝑖 = 𝑗)
Giả thiết 3. 𝐸(𝑈𝑖 . 𝑈𝑗 ) = ൝
0(∀𝑖 ≠ 𝑗)
Giả thiết 4. Hạng ma trận X bằng k
rank(X) = k
Giả thuyết này có nghĩa giữa các biến Xj không có
hiện tượng cộng tuyến hay các cột của ma trận X
độc lập tuyến tính
Xét hàm hồi quy tổng thể và hàm hồi quy mẫu
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 +. . . +𝛽𝑘 𝑋𝑘𝑖 + 𝑈𝑖 3.1
𝑌𝑖 = 𝛽መ1 + 𝛽መ2 𝑋2𝑖 + 𝛽መ3 𝑋3𝑖 +. . . +𝛽መ𝑘 𝑋𝑘𝑖 (3.2)
e1 Y1 Yˆ1
e 2 Y2 Yˆ2
e = = − = Y − Ŷ = Y − Xˆ
... ... ...
e Y Yˆ
n n n
Theo phương pháp bình phương nhỏ nhất, khi xây
dựng hàm hồi quy mẫu, các hệ số hồi quy mẫu 𝛽መ𝑗
phải được xác định sao cho tổng bình phương các
phần dư đạt giá trị nhỏ nhất, tức là:
𝑒𝑖2 → 𝑚𝑖𝑛
Ta có σ 𝑒𝑖2 = 𝑒 𝑇 𝑒
𝜕(𝑒 𝑇 𝑒)
𝑒𝑖2 → min ⇔ =0
𝜕𝛽መ
𝛽መ = 𝑋 𝑇 𝑋 −1 . 𝑋 𝑇 𝑌 (3.5)
1 1 ... 1 1 X 21 ... X k1
X 21 X 22 ... X 2 n 1 X 22 ... X k 2
XTX =
... ... ... ... ... ... ... ...
X ... X kn 1 X 2 n ... X kn
k1 X k2
n
X 2i X 3i ... X ki
X 2i X X X X X2i ki
2
...
= 2i 2i 3i
... ... ... ... ...
X X ki X 2i X ki X 3i ... X ki
2
ki
Ma trận XTY cũng được xác định tương tự:
1 1 ... 1 Y1 Yi
X 21 X 22 ... X 2 n Y2 Yi X 2i
XTY = =
... ... ... ... ... ...
X ... X kn Yn Yi X ki
k1 X k2
Bài tập: Xây dựng hàm hồi quy
mẫu trong trường hợp 𝑘 = 3,
cụ thể mô hình
𝑌 1 + 𝛽
𝑖 = 𝛽 2 𝑋𝑖 + 𝛽
2 𝑍𝑖
Ví dụ 3.1 Nghiên cứu mối quan hệ phụ thuộc giữa doanh số bán ra
với chi phí dành cho quảng cáo và giá bán, người ta thu thập được các
số liệu sau đây tại 10 cửa hàng cùng kinh doanh một loại mặt hàng:
Yi 84 90 92 96 100 108 120 126 130 136
Xi 8 9 10 9 10 12 13 14 14 15
Zi 9 8 8 7 7 8 7 7 6 6
Trong đó:
Yi: doanh số bán ra trong một tháng của cửa hàng thứ i (triệu
đồng)
Xi: chi phí dành cho quảng cáo trong một tháng của cửa hàng thứ
i (triệu đồng)
Zi: giá bán của cửa hàng thứ i (ngàn đồng/1sản phẩm)
Bằng phương pháp bình phương nhỏ nhất và dựa vào số liệu trên, hãy
xây dựng hàm hồi quy mẫu dưới dạng sau:
𝑌𝑖 = 𝛽መ1 + 𝛽መ2 𝑋𝑖 + 𝛽መ3 𝑍𝑖
Đáp số:
𝑌𝑖
1082
𝑇
𝑋 𝑌= 𝑌𝑖 𝑋𝑖 = 12746
7766
𝑌𝑖 𝑍𝑖
𝑛 𝑋𝑖 𝑍𝑖
10 114 73
𝑇
𝑋 𝑋= 𝑋𝑖 𝑋𝑖2 𝑋𝑖 𝑍𝑖 = 114 1356 816
73 816 541
𝑍𝑖 𝑍𝑖 𝑋𝑖 𝑍𝑖2
𝑋 𝑇 𝑋 = 1944
𝛽መ = 𝑋 𝑇 𝑋 −1 . 𝑋 𝑇 𝑌
1 67740 −2106 −5964 1082 69,53704
= −2106 81 162 12746 = 6,08333
1944
−5964 162 564 7766 −4,20370
𝛽መ2 = 6.08333 : Khi giá bán không đổi, chi phí dành cho
quảng cáo tăng lên 1 triệu đồng, thì doanh số bán ra trung
bình của cửa hàng tăng lên 6.08333 triệu đồng.
𝛽መ3 = −4.2037: Khi chi phí dành cho quảng cáo không
đổi, giá bán tăng lên 1ngàn đồng/ 1 đv sản phẩm, thì doanh
số bán ra trung bình của cửa hàng giảm xuống 4.2037 triệu
đồng.
Lưu ý: Diễn giải phương trình hồi quy OLS
Xét mô hình hồi quy mẫu
1 + 𝛽
𝑌 = 𝛽 2 𝑋1 + 𝛽 3 𝑋2 (*)
❖Hệ số chặn 𝛽1 là giá trị dự đoán của Y khi 𝑋1 = 0 và 𝑋2 =
0. Việc gán 𝑋1 = 𝑋2 = 0 có thể có ý nghĩa hoặc không.
❖Các ước lượng 𝛽 2 và 𝛽3 cho biết tác động trong điều kiện
yếu tố khác không đổi.
Δ𝑌 = 𝛽2 Δ𝑋1 + 𝛽 3 Δ𝑋2 (**)
Ví dụ: Khi 𝑋2 cố định thì Δ𝑋2 = 0, khi đó
2 Δ𝑋1
Δ𝑌 = 𝛽
Ý nghĩa: Khi cố định 𝑋2 và 𝑋1 tăng 1 đơn vị (Δ𝑋1 = 1), thì
2 đơn vị.
giá trị Y thay đổi 𝛽
Ví dụ với dữ liệu thực: Các yếu tố tác động đến
điểm GPA ở bậc đại học (n = 141)
GPA là từ viết tắt của từ Grade Point Average
colGPA: Điểm trung bình (GPA) đại học
hsGPA: Điểm GPA ở trung học
ACT: Điểm kiểm tra thành tích Câu hỏi:
Tính các số đặc trưng của biến colGPA
Xây dựng hàm hồi quy mẫu
=𝛽
𝒄𝒐𝒍𝑮𝑷𝑨 1 + 𝛽
2 ℎ𝑠𝐺𝑃𝐴 + 𝛽3 𝐴𝐶𝑇
- Hệ số chặn 𝛽1 có ý nghĩa không?
2 và 𝛽
- Ý nghĩa của các hệ số ước lượng 𝛽 3
= 1.28628 + 0.453456 ℎ𝑠𝐺𝑃𝐴 + 0.009426 𝐴𝐶𝑇
𝒄𝒐𝒍𝑮𝑷𝑨
trong đó:
1 1
𝑌 = 𝑌𝑖 , 𝑋𝑗 = 𝑋𝑗𝑖 (𝑗 = 2, 𝑘)
𝑛 𝑛
2. Giá trị trung bình của các giá trị 𝑌𝑖 được xác định theo
hàm hồi quy mẫu bằng giá trị trung bình của biến phụ
thuộc, tức là:
1
𝑌 = 𝑌𝑖 = 𝑌
𝑛
3. Tổng các phần dư của hàm hồi quy mẫu bằng 0:
σ 𝑒𝑖 = 0
4. Các phần dư ei không tương quan với 𝑌𝑖 :
𝑒𝑖 𝑌𝑖 = 0
𝛽𝑗 (𝑗 = 1, 𝑘) .
3.2 Khoảng tin cậy và kiểm định giả thuyết về các
hệ số hồi quy
Xét hàm hồi quy tổng thể và hàm hồi quy mẫu
𝜎2
𝑉𝑎𝑟 𝛽መ𝑗 = 𝐴𝑗𝑗 (3.9)
𝑋𝑇𝑋
σ 2
𝑒𝑖
𝜎ො 2 = (3.10)
𝑛−𝑘
Trong thực hành người ta thường sử dụng công thức sau đây để
xác định σ 𝑒𝑖2 :
𝑒𝑖2 = 𝑒 𝑇 𝑒 = 𝑌 𝑇 𝑌 − 𝛽መ 𝑇 𝑋 𝑇 𝑌 3.11
❖ Viết công thức tính tổng bình phương các phần dư σ 𝑒𝑖2
𝟏 𝒀𝒊 + 𝜷
𝒆𝟐𝒊 = 𝒀𝟐𝒊 − 𝜷 𝟐 𝒀𝒊 𝑿𝒊 + 𝜷
𝟐 𝒀𝒊 𝒁𝒊
𝛽መ𝑗 − 𝛽𝑗
𝑇= ~ 𝑇 (𝑛 − 𝑘) (𝑗 = 1, 𝑘)
𝑠𝑒(𝛽መ𝑗 )
Bài toán: Xác định khoảng tin cậy
𝜸 = 𝟏 − 𝜶 của hệ số hồi quy 𝜷𝒋
Trả lời
𝑗 −𝛽𝑗
𝛽
Xây dựng thống kê: 𝑇= 𝑗 )
𝑠𝑒(𝛽
𝑛−𝑘
Với độ tin cậy 𝛾 = 1 − 𝛼, tìm phân vị Student 𝑡𝛼 sao cho
2
𝑛−𝑘
𝑃( 𝑇 < 𝑡𝛼 )=𝛾
2
𝑛−𝑘 𝑛−𝑘
𝑃(𝛽መ𝑗 − 𝑡𝛼 ∗ 𝑠𝑒 𝛽መ𝑗 < 𝛽𝑗 < 𝛽መ𝑗 + 𝑡𝛼 ∗ 𝑠𝑒 𝛽መ𝑗 ) = 𝛾
2 2
ෝ2
𝜎 σ 𝑒𝑖2
Trong đó, 𝑠𝑒 𝛽መ𝑗 = 𝐴𝑗𝑗 và 2
𝜎ො =
𝑋𝑇𝑋 𝑛−𝑘
Từ đó, với độ tin cậy 𝛾 = 1 − 𝛼, Khoảng tin cậy của 𝛽𝑗 là:
𝑛−𝑘 𝑛−𝑘
𝛽መ𝑗 −𝑡𝛼 ∗ 𝑠𝑒 𝛽መ𝑗 , 𝛽መ𝑗 + 𝑡𝛼 ∗ 𝑠𝑒 𝛽መ𝑗
2 2
Ví dụ 3.1 Nghiên cứu mối quan hệ phụ thuộc giữa doanh số bán ra với chi phí dành
cho quảng cáo và giá bán, người ta thu thập được các số liệu sau đây tại 10 cửa
hàng cùng kinh doanh một loại mặt hàng:
Zi 9 8 8 7 7 8 7 7 6 6
Trong đó:
Yi: doanh số bán ra trong một tháng của cửa hàng thứ i (triệu đồng)
X i: chi phí dành cho quảng cáo trong một tháng của cửa hàng thứ i (triệu
đồng)
Zi: giá bán của cửa hàng thứ i (ngàn đồng/1sản phẩm)
a) Bằng phương pháp bình phương nhỏ nhất và dựa vào số liệu trên, hãy xây dựng
hàm hồi quy mẫu dưới dạng sau:
𝑌𝑖 = 𝛽መ1 + 𝛽መ2 𝑋𝑖 + 𝛽መ3 𝑍𝑖
Xem xét phương trình tiền lương (các giải thuyết của mô hình hồi
quy tuyến tính cổ điển được thoải mãn)
𝐥𝐨𝐠 𝒘𝒂𝒈𝒆 = 𝜷𝟏 + 𝜷𝟐 𝒆𝒅𝒖𝒄 + 𝜷𝟑 𝒆𝒙𝒑𝒆𝒓 + 𝜷𝟒 𝒕𝒆𝒏𝒖𝒓𝒆 + 𝑼 (1)
𝛽2 là tham số của tổng thể => KHÔNG bao giờ biết chính xác
Mục đích: Lập giả thuyết về giá trị của hệ số 𝛽𝑗 và dùng suy diễn
thống kê để kiểm định giả thuyết này.
3.2.3 Kiểm định giả thuyết về các hệ số hồi
quy
Giả sử với mức ý nghĩa cho trước và 𝛽𝑗∗ là giá trị giả định của 𝛽𝑗 ,
ta cần kiểm định giả thuyết:
𝐻0 : 𝛽𝑗 = 𝛽𝑗∗
൝
𝐻1 : 𝛽𝑗 ≠ 𝛽𝑗∗ (𝛽𝑗 < 𝛽𝑗∗ , 𝛽𝑗 > 𝛽𝑗∗ )
Ta xây dựng tiêu chuẩn kiểm định
𝛽መ𝑗 − 𝛽𝑗∗
𝑇=
𝑠𝑒(𝛽መ𝑗 )
Zi 9 8 8 7 7 8 7 7 6 6
Trong đó:
Yi: doanh số bán ra trong một tháng của cửa hàng thứ i (triệu đồng)
X i: chi phí dành cho quảng cáo trong một tháng của cửa hàng thứ i (triệu
đồng)
Zi: giá bán của cửa hàng thứ i (ngàn đồng/1sản phẩm)
a) Bằng phương pháp bình phương nhỏ nhất và dựa vào số liệu trên, hãy xây dựng
hàm hồi quy mẫu dưới dạng sau:
𝑌𝑖 = 𝛽መ1 + 𝛽መ2 𝑋𝑖 + 𝛽መ3 𝑍𝑖
b) Xác định khoảng tin cậy 95% của 𝛽2 .
c) Với mức ý nghĩa 𝜶 = 𝟎. 𝟎𝟓, kiểm định giải thuyết: chi phí quảng cáo không
ảnh hưởng tới doanh số bán ra.
Lời giải:
Ví dụ với dữ liệu thực: Các yếu tố tác động đến
điểm GPA ở bậc đại học (n = 141)
𝐸𝑆𝑆 𝑅𝑆𝑆
R2 = =1−
𝑇𝑆𝑆 𝑇𝑆𝑆
Tuy nhiên không thể dùng R2 làm tiêu chuẩn để xét việc
đưa thêm hay không đưa thêm biến độc lập mới vào mô
hình mà phải dùng hệ số xác định bội đã điều chỉnh
Định nghĩa 2: Hệ số xác định bội đã điều chỉnh,
ký hiệu 𝑅ത 2 được định nghĩa như sau:
𝑛−1
𝑅ത 2 = 1 − (1 − 𝑅2 )
𝑛−𝑘
ഥ 𝟐 có các tính chất:
𝑹
1. Nếu k > 1 thì 𝑅ത 2 < 𝑅2 ≤ 1
và 𝑅ത 2 cũng là hàm không giảm đối với số biến giải
thích có trong mô hình
2. 𝑅ത 2 có thể nhận giá trị âm dù R2 luôn dương
Vậy khi nào cần đưa thêm biến độc lập mới vào
mô hình? Có thể chứng minh được rằng việc đưa
thêm biến giải thích mới vào mô hình là cần thiết
2
chừng nào 𝑅 còn tăng lên và hệ số hồi quy của
biến mới Xj là j 0 (có ý nghĩa thống kê mức
0.1, 0.05, 0.01)
3.3.2 Kiểm định giả thuyết đồng thời
𝑅2 𝑛 − 𝑘
𝐹= 2
.
1−𝑅 𝑘−1
Nếu H0 đúng thì F~F(k-1, n-k): Phân phối fisher (k-1, n-
k) bậc tự do.
(𝑘−1,𝑛−𝑘)
𝑃(𝐹 > 𝑓𝛼 )=𝛼
(𝑘−1,𝑛−𝑘)
𝑊𝛼 = 𝑓𝑡𝑛 : 𝑓𝑡𝑛 > 𝑓𝛼
Ví dụ 3.1 Nghiên cứu mối quan hệ phụ thuộc giữa doanh số bán ra với chi phí dành
cho quảng cáo và giá bán, người ta thu thập được các số liệu sau đây tại 10 cửa
hàng cùng kinh doanh một loại mặt hàng:
Zi 9 8 8 7 7 8 7 7 6 6
Trong đó:
Yi: doanh số bán ra trong một tháng của cửa hàng thứ i (triệu đồng)
X i: chi phí dành cho quảng cáo trong một tháng của cửa hàng thứ i (triệu
đồng)
Zi: giá bán của cửa hàng thứ i (ngàn đồng/1sản phẩm)
a) Bằng phương pháp bình phương nhỏ nhất và dựa vào số liệu trên, hãy xây dựng
hàm hồi quy mẫu dưới dạng sau:
𝑌𝑖 = 𝛽መ1 + 𝛽መ2 𝑋𝑖 + 𝛽መ3 𝑍𝑖
d) Với mức ý nghĩa 𝜶 = 𝟎. 𝟎𝟓, kiểm định giả thuyết: chi phí dành cho quảng
cáo và giá bán của của hang đều không ảnh hưởng tới doanh số bán ra.
(Dạng bài: Kiểm định giả thuyết đồng thời)
d) Với mức ý nghĩa 𝜶 = 𝟎. 𝟎𝟓, kiểm định giả thuyết: chi phí dành cho quảng cáo và giá
bán của của hang đều không ảnh hưởng tới doanh số bán ra.
(Dạng bài: Kiểm định giả thuyết đồng thời)
Giải:
Với mức ý nghĩa 𝛼 = 0.05, kiểm định giả thuyết
𝐻0 : 𝛽2 = 𝛽3 = 0
ቊ
𝐻1 : 𝛽2 ≠ 0 ℎ𝑜ặ𝑐 𝛽3 ≠ 0.
hay giả thuyết tương đương là
𝐻0 : 𝑅2 = 0
൝
𝐻1 : 𝑅2 > 0
𝑅2 𝑛−𝑘
Xây dựng tiêu chuẩn kiểm định: 𝐹 = .
1−𝑅2 𝑘−1
(𝑘−1,𝑛−𝑘) (2,7)
Nếu H0 đúng thì F~F(k-1, n-k) = F(2, 7). Tìm phân vị Fisher 𝑓𝛼 = 𝑓0.05 =
4.74
𝑘−1,𝑛−𝑘
𝑃 𝐹 > 𝑓𝛼 = 𝛼 ℎ𝑜ặ𝑐𝑃 𝐹 > 4.74 = 0.05.
Miền bác bỏ: 𝑊𝛼 = 𝑓: 𝑓 > 4.74
Trên mẫu
3.4 Phân tích hồi quy và dự báo
Xét hàm hồi quy tổng thể và hàm hồi quy mẫu
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 +. . . +𝛽𝑘 𝑋𝑘𝑖 + 𝑈𝑖 3.1
𝑌𝑖 = 𝛽መ1 + 𝛽መ2 𝑋2𝑖 + 𝛽መ3 𝑋3𝑖 +. . . +𝛽መ𝑘 𝑋𝑘𝑖 (3.2)
𝑌0 − 𝐸(𝑌/𝑋0 )
𝑇= ~ 𝑇 (𝑛 − 𝑘)
𝑠𝑒(𝑌0 )
𝑃 𝑇 < 𝑡𝛼/2 (𝑛 − 𝑘) = 1 − 𝛼 = 𝛾
𝑃 𝑇 < 𝑡𝛼/2 (𝑛 − 𝑘) = 1 − 𝛼 = 𝛾
𝑌0 − 𝐸(𝑌/𝑋0 )
𝑃 < 𝑡𝛼/2 (𝑛 − 𝑘) = 1 − 𝛼 = 𝛾
𝑠𝑒(𝑌0 )
𝑃൫𝑌0 − 𝑡𝛼/2 (𝑛 − 𝑘). 𝑠𝑒(𝑌0 ) < 𝐸(𝑌/𝑋0 )
< 𝑌0 + 𝑡𝛼/2 (𝑛 − 𝑘). 𝑠𝑒(𝑌0 )൯ = 1 − 𝛼 = 𝛾
Với độ tin cậy cần dự báo giá trị Y=Y0 khi X=X0
Bằng phép biến đổi tương đương ta cũng suy ra được khoảng
tin cậy của Y0 là
൫𝑌0 − 𝑡𝛼/2 (𝑛 − 𝑘). 𝑠𝑒(𝑌0
− 𝑌0 ) ; 𝑌0 + 𝑡𝛼/2 (𝑛 − 𝑘). 𝑠𝑒(𝑌0 − 𝑌0 )൯
Trong đó
𝑉𝑎𝑟(𝑌0 − 𝑌0 ) = 𝑉𝑎𝑟(𝑌0 ) + 𝜎 2
𝑠𝑒(𝑌0 − 𝑌0 ) = 𝑉𝑎𝑟(𝑌0 − 𝑌0 )
Ví dụ: Xét tiếp ví dụ 3.1. Với độ tin cậy = 0,98 hãy
dự báo doanh số bán ra trung bình trong một tháng
của các cửa hàng có chi phí dành cho quảng cáo là 10
triệu đồng/ tháng và giá bán là 8 ngàn đồng/ đơn vị.