Professional Documents
Culture Documents
Ui = Yi - E(Yi|X2,X3)
CÁC GIẢ THIẾT CỦA MÔ HÌNH
Giả thiết 1: Các Ui có kỳ vọng bằng 0: E(U|X2i ,X3i) = 0 ∀i
Giả thiết 2: Không có sự tương quan giữa các Ui:
Cov(Ui,Uj) = 0, i≠j
Giả thiết 3: Var (Ui|Xi) = 2 ∀i
Giả thiết 4: Giữa biến độc lập X2, X3 không có quan hệ
tuyến tính
Giả thiết 5: Ui có phân phối chuẩn N(0, 2)
ƯỚC LUỢNG CÁC THAM SỐ CỦA MÔ HÌNH HỒI QUY
BAĐể
BIẾN
ước lượng các tham số của mô hình
E(Y|X2,X3) = β1 + β2X2 + β3X3
Ta dùng phương pháp OLS
Giả sử chúng ta có n quan sát, quan sát thứ i có 3 giá trị
ứng với Y, X2 và X3, kí hiệu (Yi, X2i,X3i)
Hàm SRF được xây dựng từ quan sát này có dạng:
+
Trong đó là ước lượng cho
ƯỚC LUỢNG CÁC THAM SỐ CỦA MÔ HÌNH HỒI QUY
BA BIẾN
Khi đó Yi = + + ei
n n 2
RSS e Yi βˆ 1 βˆ 2 X 2i βˆ 3X 3i min
2
i
i=1 i 1
ƯỚC LUỢNG CÁC THAM SỐ CỦA MÔ HÌNH HỒI QUY
BACác tham số , , được tính từ hệ phương trình sau
BIẾN
n 2
e i
n
i=1
0 2 Yi ˆ 1 ˆ 2 X2i ˆ 3 X3i 1 0
ˆ 1 i 1
n
e i 2
n
i=1
ˆ 0 2 Yi ˆ 1 ˆ 2 X 2i ˆ 3 X3i X 2i 0
2 i=1
n
e 2i n
i 1
i=1 0 2 Y ˆ ˆ X ˆ X X 0
ˆ i 1 2 2i
3 3i 3i
3
ƯỚC LUỢNG CÁC THAM SỐ CỦA MÔ HÌNH HỒI QUY
BA BIẾN n n n
1 2 2i 3 2i i
n ˆ ˆ X ˆ X = Y
i=1 i=1 i=1
n
ˆ n n n
Û1 X2i 2 X2i ˆ 3 X3i X2i Yi X2i
ˆ 2
i=1 i=1
2
n n
n
2
x 2i x 3i x 2i x 3i
2 2
i=1
i=1 i=1
n n n n
β̂ i=1
yi x 3i x 2i yi x 2i x 2i x 3i
i=1
2
i=1 i=1
3 n n
n
2
x 2i x 3i x 2i x 3i
2 2
i=1
i=1 i=1
ƯỚC LUỢNG CÁC THAM SỐ CỦA MÔ HÌNH HỒI QUY
BA BIẾN
Ví dụ 1. Bảng dưới đây cho các số liệu về doanh số bán
(Y), chi phí chào hàng (X2) và chi phí quảng cáo (X3) trong
năm 2011 ở 12 khu vực bán hàng của một công ty. Hãy
ước lượng hàm hồi quy tuyến tính của doanh số bán theo
chi phí chào hàng và chi phí quảng cáo
ƯỚC LUỢNG CÁC THAM SỐ CỦA MÔ HÌNH HỒI QUY
Doanh số bán Y
BA BIẾN Chi phí chào hàng ( ) Chi phí quảng cáo ( )
(triệu đồng) (triệu đồng) (triệu đồng)
1270 100 180
1490 106 248
1060 60 190
1626 160 240
1020 70 150
1800 170 260
1610 140 250
1280 120 160
1390 116 170
1440 120 230
1590 140 220
1380 150 150
ƯỚC LUỢNG CÁC THAM SỐ CỦA MÔ HÌNH HỒI QUY
BATừBIẾN
bảng số liệu trên ta tính được các tổng
12 12 12
Y 16956 X
i=1
i 2i
i=1
1452 Xi=1
3i
2448
Y
16956
1413
12 12 12
12
i=1 Yi 24549576 i=1 X2i 188192 i=1 X3i 518504
2 2 2
X2
1452
121
12 12 12
12
i=1 X2i Yi 2128740 i=1 X3iYi 3542360 i=1 X2i X3i 303608 X3 2448 204
12
Ta tính được các hệ số hồi quy ...
n n n
X 2 x 3i +X3 x 2i -2X 2 X3 x 2i x 3i
2 2 2 2
ˆ 1
var(β1 ) σ 2
i=1 i=1 i=1
n 2
2
n n n
i=1
x 2i x 3i - x 2i x 3i
2
i=1 i=1
PHƯƠNG SAI VÀ ĐỘ LỆCH CHUẨN CỦA CÁC ƯỚC
LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT
2
σ
var(βˆ 2 )= n
se(βˆ 2 )= var(βˆ 2 )
x 1 r
i=1
2
2i
2
23
x 2i x 3i
i=1
2
i=1
2
Y2 β2 U2
Ký hiệu Y ; β ; U ;
... ... ...
Yn βk Un
1 X 21 ... X k1
1 X ... X k2
X 22
... ... ... ...
1 X 2n ... X kn
Khi đó Y = Xβ + U
ƯỚC LƯỢNG CÁC THAM SỐ -OLS
Hàm hồi qui mẫu SRF có dạng
Ŷi βˆ 1 βˆ 2 X 2i βˆ 3X3i ... βˆ k X ki
Yi =Yˆ i ei βˆ 1 βˆ 2 X 2i βˆ 3X 3i ... βˆ k X ki ei
Hay Y = X + e
e1
e
Trong đó e 2
Y Xˆ
…
e n
ƯỚC LƯỢNG CÁC THAM SỐ -OLS
Các ước lượng OLS được tìm bằng cách
2
n n 2 n
i i i 1 2 2i 3 3i
e
i=1
= Y
2
i
ˆ
Y Y
i=1
ˆ βˆ X βˆ X ... βˆ X min
β
i 1
k ki
T
e e Y Xβˆ
T
Y Xβ Y β X Y Xβˆ
ˆ T ˆ T T
ˆ ˆ ˆ T T ˆ
=Y Y Y Xβ β X Y β X Xβ
T TT T
ˆ ˆ T T ˆ
=Y Y 2β X Y β X Xβ
T T T
(eT e)
2X Y 2X X β=0 X Y X X β β̂ X X X Y
-1 T
T ˆ T
T T ˆ T
β̂
ƯỚC LƯỢNG CÁC THAM SỐ -OLS
Với
n n
n X 2i ... X ki
i=1 i=1
n n n
X 2i X
2
T 2i ... X 2i X ki
X X= i=1 i=1 i=1
... ... ... ...
n n n
X ki X 2
ki X 2i ... X ki
i=1 i=1 i=1
ƯỚC LƯỢNG CÁC THAM SỐ -OLS
Ví dụ. Số liệu quan sát về lượng hàng hóa bán được (Y:
tấn/ tháng), Thu nhập (X2: triệu/năm), Giá bán (X3: 1000
VNĐ/kg)
Y X2 X3 Y X2 X3
20 8 2 17 6 5
18 7 3 16 5 6
19 8 4 15 5 7
18 8 4 13 4 8
17 6 5 12 3 8
ƯỚC LƯỢNG CÁC THAM SỐ -OLS
Y 165
i X 60
2i X 52
3i
Y 2781
i
2
X 388
2
2i X 308
2
3i
X Y n Y
T 2
ESS=β T
Ý nghĩa R2
- Đánh giá mức độ phù hợp của mô hình
- So sánh hai mô hình có cùng biến độc lập
HỆ SỐ XÁC ĐỊNH BỘI R2 VÀ HỆ SỐ XÁC ĐỊNH BỘI
ĐÃ HIỆU CHỈNH
0 ≤ R2 ≤ 1. Nếu R2 = 1, có nghĩa là đường hồi quy giải thích
100% sự thay đổi của Y. Nếu R2 = 0, có nghĩa là mô hình
không giải thích sự thay đổi của Y
* Chú ý: Khi tăng số biến độc lập trong mô hình thì R2 cũng
tăng cho dù các biến độc lập thêm vào có ảnh hưởng mô
hình hay không. Do đó không thể dùng R2 để quyết định có
hay không nên thêm biến vào mô hình mà thay vào đó có
thể sử dụng hệ số xác định được hiệu chỉnh
HỆ SỐ XÁC ĐỊNH BỘI R2 VÀ HỆ SỐ XÁC ĐỊNH BỘI
ĐÃ HIỆU CHỈNH
R 1
2 i /(n k)
e 2
ˆ 2
1 2 1 (1 R )
2 n 1
y i /(n 1)
2
Sy nk
2
R 1 R 2
2
R12 R 22
Nếu > thì chọn mô hình (1), tức là không cần đưa thêm biến
X3 vào mô hình. Ngược lại, ta chọn mô hình (2).
HỆ SỐ XÁC ĐỊNH BỘI R2 VÀ HỆ SỐ XÁC ĐỊNH BỘI
ĐÃ HIỆU CHỈNH
Ví dụ: Ta xét hai mô hình
(MH1): DS 667,0205 + 6,1652*CPCH
R 0,8043; R 0,7847
2 2
- So sánh hai MH: MH1 và MH2 khác nhau ở số biến độc lập
- Mô hình (2) phù hợp hơn mô hình (1)
- Khi thêm vào MH (1) biến CPQC làm cho giá trị của hệ số hiệu
chỉnh tăng lên, tức là biến mói đưa vào mô hình có ý nghĩa
MA TRẬN PHƯƠNG SAI CỦA
Ma trận hiệp phương sai
Để kiểm định giả thuyết, tìm khoảng tin cậy cũng như
thực hiện các suy luận thống kê khác cần phải tìm var( và
cov(
MA TRẬN PHƯƠNG SAI CỦA
var βˆ
1
cov βˆ 1 ,βˆ 2
cov βˆ ,βˆ
1 k
ˆ
cov β
cov βˆ ,βˆ
2 1
var βˆ 2
cov βˆ ,βˆ
2 k
Ý nghĩa
cov βˆ k ,βˆ 1
cov βˆ k ,βˆ 2
var βˆ k
- Đánh giá sự ảnh hưởng của các hệ số hồi quy trong mô hình
- Tính các giá trị về phương sai, hiệp phương sai, độ lệch
chuẩn các hệ số hồi quy
ˆ
cov β (X X)
2 T 1
với σˆ
2 RSS
nk
MA TRẬN PHƯƠNG SAI CỦA
Ví dụ. Số liệu quan sát về lượng hàng hóa bán được (Y:
tấn/ tháng), Thu nhập (X2: triệu/năm), Giá bán (X3: 1000
VNĐ/kg) Y X X Y X X
2 3 2 3
20 8 2 17 6 5
18 7 3 16 5 6
19 8 4 15 5 7
18 8 4 13 4 8
17 6 5 12 3 8
Hãy tìm ma trận hiệp phương sai của
MA TRẬN PHƯƠNG SAI CỦA
Ta có 1
10 60 52 39980 3816 3256
1 3816 376
X X 60 388 282 300
T 1
1528
52 282 308 3256 300 280
Ta cần tính
Y
2 2
2781 10 16,5 58,5
2
TSS Y Y n Y
T
i
2
n Y
X Y n Y
2
ESS β T T
165
14,99215 0,76178 0,58901 1029 10 16,5 56, 211
2
813
MA TRẬN PHƯƠNG SAI CỦA
• Xét thống kê :
β̂i βi
t ~T(n k)
se βˆi
KIỂM ĐỊNH GIẢ THUYẾT VÀ KHOẢNG TIN CẬY
CỦA CÁC HỆ SỐ HỒI QUY RIÊNG – KIỂM ĐỊNH T
Với độ tin cậy cho trước, ta tìm được tα/2(n-k) thoả mãn.
ˆ i i
P t /2 (n k ) t /2 (n k ) 1
se (ˆ)
i
ˆ i se ˆ i *t /2 n k i ˆ i se ˆ i * t /2 n k
KIỂM ĐỊNH GIẢ THUYẾT VÀ KHOẢNG TIN CẬY
CỦA CÁC HỆ SỐ HỒI QUY RIÊNG – KIỂM ĐỊNH T
Chúng ta có thể kiểm định giả thuyết về giá trị
β̂i β i
*
(βˆ i βˆ j )
Giá trị t khi H0 đúng t
se(βˆ βˆ )
i j
(n k)R 2
Tiêu chuẩn kiểm định F ~F(k 1,n k)
(k 1)(1 R )
2
X X
-1
trong đó ˆ ˆ X
se Y 2 0T T
X 0
0
DỰ BÁO
Khoảng dự báo giá trị cá biệt
0 0 0
ˆ * t n k Y Y
ˆ se Y Y
Y /2 0 0 0 0
ˆ * t n k
ˆ se Y Y
/2
trong đó ˆ
ˆ
se Y0 Y0 var Y0 ˆ 2
MỘT SỐ DẠNG CỦA HÀM HỒI QUY
1. Mô hình hồi quy tuyến tính logarit (log-log)
Hàm sản xuất Cobb – Douglas Y =
lnY = lnβ1 + β2lnX2 + β3lnX3 = β0 + β2lnX2 + β3lnX3 (1)
Y: sản lượng ; X2: lượng lao động, X3 : lượng vốn,
(1) là mô hình hồi quy tuyến tính lôgarit
β2 là hệ số co dãn riêng của sản lượng đối với lao động,
nó cho biết sản lượng tăng (giảm) bao nhiêu % khi lao
động tăng (giảm) 1%, khi vốn không đổi
MỘT SỐ DẠNG CỦA HÀM HỒI QUY
β3 là hệ số co dãn riêng của sản lượng đối với vốn, nó cho
biết sản lượng tăng (giảm) bao nhiêu % khi vốn tăng
(giảm) 1%, khi lao động không đổi
Tổng quát, mô hình tuyến tính lôgarit có dạng
lnY = lnβ1 + β2lnX2 + β3lnX3 + …+ βklnXk
0 X
2 / 1
MỘT SỐ DẠNG CỦA HÀM HỒI QUY
Giả sử có mẫu thống kê như sau
X 16 20 24 28 32 36 40 44 48 52
Y 12 15 18 22 23 25 30 31 36 38
0 X
1
MỘT SỐ DẠNG CỦA HÀM HỒI QUY
Ví dụ. Bảng sau cho ta số liệu về tỷ lệ thay đổi tiền lương
(Y) và tỷ lệ thất nghiệp (X) của vương quốc Anh trong giai
đoạn 1950-1966
Năm Y(%) X(%) Năm Y(%) X(%)
1950 1.8 1.4 1959 2.6 1.9
1951 8.5 1.1 1960 2.6 1.5
1952 8.4 1.5 1961 4.2 1.4
1953 4.5 1.5 1962 3.6 1.8
1954 4.3 1.2 1963 3.7 2.1
1955 6.9 1 1964 4.8 1.5
1956 8 1.1 1965 4.3 1.3
1957 5 1.3 1966 4.6 1.4
1958 3.6 1.8
MỘT SỐ DẠNG CỦA HÀM HỒI QUY
9
6
Y
1
0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2
X
MỘT SỐ DẠNG CỦA HÀM HỒI QUY
Dependent Variable: Y
Method: Least Squares
Sample: 1950 1966
Included observations: 17
Variable Coefficient Std. Error t-Statistic Prob.
C -1.428177 2.067478 -0.690782 0.5003
1/X 8.724344 2.847779 3.063561 0.0079
R-squared 0.384878 Mean dependent var 4.788235
Adjusted R-squared 0.343870 S.D. dependent var 2.017078
S.E. of regression 1.633871 Akaike info criterion 3.929912
Sum squared resid 40.04300 Schwarz criterion 4.027937
Log likelihood -31.40425 Hannan-Quinn criter. 3.939656
F-statistic 9.385404 Durbin-Watson stat 1.569828
Prob(F-statistic) 0.007882
MỘT SỐ DẠNG CỦA HÀM HỒI QUY
Tỷ lệ giảm lương tối đa là = 1,43 (%/năm)
Tỷ lệ thất nghiệp tự nhiên
ˆ 2
X 0 6,11 % / naêm
ˆ 1
MỘT SỐ DẠNG CỦA HÀM HỒI QUY
5. Mô hình đa thức
Dạng bậc hai Y 1 2 X2 3 X2
2
Ví dụ: Bảng sau cho biết sản lượng và tổng chi phí sản xuất
ngắn hạn của một loại sản phẩm
Sản lượng Tổng chi Sản lượng Tổng chi
(X) phí (Y) (X) phí (Y)
1 193 6 260
2 226 7 274
3 240 8 297
4 244 9 350
5 257 10 420
MỘT SỐ DẠNG CỦA HÀM HỒI QUY
Đồ thị phân tán giữa chi phí sản xuất và sản lượng
440
400
360
320
Y
280
240
200
160
0 2 4 6 8 10 12
X
MỘT SỐ DẠNG CỦA HÀM HỒI QUY
Dependent Variable: Y
Method: Least Squares
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 141.7667 6.375322 22.23678 0.0000
X 63.47766 4.778607 13.28372 0.0000
X^2 -12.96154 0.985665 -13.15005 0.0000
X^3 0.939588 0.059106 15.89677 0.0000
R-squared 0.998339 Mean dependent var 276.1000
Adjusted R-squared 0.997509 S.D. dependent var 65.81363
S.E. of regression 3.284911 Akaike info criterion 5.505730
Sum squared resid 64.74382 Schwarz criterion 5.626764
Log likelihood -23.52865 Hannan-Quinn criter. 5.372956
F-statistic 1202.220 Durbin-Watson stat 2.700212
Prob(F-statistic) 0.000000