You are on page 1of 54

Chương 2

Mô hình hồi qui hai biến


Ước lượng và kiểm định giả thiết
1. Phương pháp bình phương bé nhất
Giả sử : Yi = 1 + 2Xi + Ui (PRF)
và có một mẫu n quan sát (Yi, Xi).
Cần ước lượng (PRF).
Ta có : Yi = Ŷi + ei

với Ŷi = βˆ1 + βˆ2 X i (SRF)


PRF vs. SRF
Y PRF

E(Y|X)
SRF(
Ŷi ui
ei 1)
Yi

Xi X

2
Phương pháp bình phương nhỏ nhất
Ý tưởng của phương pháp: Yi - Ŷi = ei => min
n
 ei = 0
i =1 E ( Y|X)
n Y
 | ei | = min e (+)
i =1

n Ŷi = fˆ(Xi )
 ei2 = min e (-)
i =1

0
X4
Theo phương pháp OLS, để
Ŷi càng gần với Y ˆ
β , ˆ
β
i thì 1 2 cần thỏa mãn :
n n

RSS =  e =  ( Yi − β1 − β 2 X i ) → min
ˆ ˆ
2 2
i
i =1 i =1
Suy ra βˆ1 , βˆ2 cần thỏa mãn :
 n 2
   ei n
 i =1
 βˆ1
=  2( Y
i =1
i − βˆ1 − βˆ2 X i )(−1) = 0
 n

 
2
e i n


i =1
=  i 1
2( Y − ˆ
β − ˆ
β 2 X i )(− X i ) = 0
 βˆ 2 i =1
 ˆ1 = Y − ˆ2 X


n n n

(I )   n. Yi X i −  X i  Yi
ˆ = i =1 i =1 i =1
 2 n n
(?)
 n  X i − ( X i )
2 2


 i =1 i =1

n
1
X =
n
X
i =1
i

n
1
Y =
n
Y
i =1
i
giải hệ, ta có :
n

x y i i
ˆ 2 = i =1
n
ˆ1 = Y − ˆ 2 X
x
i =1
2
i

xi = X i − X ; yi = Yi − Y
n

x i yi
ˆ 2 = i =1
n
ˆ1 = Y − ˆ 2 X
i =1
x i2
PRF vs. SRF
E(Y|X) SRF(n) SRF(2)
PRF

SRF(1)

X
VD: thu nhập theo kinh nghiệm
VD-2: cho bảng số liệu sau:
Số hộ TN (X) CT (Y)
1 10 12
2 10 11
3 12 13
4 14 12
5 14 13
6 16 16
7 16 14
8 18 17
9 18 15
10 20 16
1. Viết hàm hồi quy tổng tổng thể, hàm hồi
quy mẫu?
2. Nêu các bước tính hệ số dựa vào
bảng số liệu sau đây.
3. Kết quả ước lượng các hệ số có phù hợp
lý thuyết kinh tế không?
4. Ý nghĩa các hệ số ước lượng?
Ví dụ 3: Giả sử cần nghiên cứu chi tiêu tiêu dùng của
hộ gia đình phụ thuộc thế nào vào thu nhập của họ,
người ta tiến hành điều tra, thu được một mẫu gồm 10
hộ gia đình với số liệu như sau :
Y 70 65 90 95 110 115 120 140 155 150
X 80 100 120 140 160 180 200 220 240 260

Trong đó : Y – chi tiêu hộ gia đình


(USD/tuần)
X – thu nhập hộ gia đình
(USD/tuần)
Giả sử Y và X có quan hệ tuyến tính. Hãy ước lượng
mô hình hồi quy của Y theo X.
2. Các giả thiết cổ điển của mô hình
hồi qui tuyến tính

• Giả thiết 1 : Biến độc lập Xi là phi ngẫu


nhiên, các giá trị của chúng phải được
xác định trước.
• Giả thiết 2 : Kỳ vọng có điều kiện của
sai số ngẫu nhiên bằng 0 :
E (Ui / Xi) = 0 i
• Giả thiết 3 : (Phương sai thuần nhất )
Các sai số ngẫu nhiên có phương sai
bằng nhau :
Var (Ui / Xi) = 2 i
• Giả thiết 4 : Không có hiện tượng tương
quan giữa các sai số ngẫu nhiên :
Cov (Ui , Uj ) = 0  i  j
• Giả thiết 5 : Không có hiện tượng tương
quan giữa biến độc lập Xi và sai số ngẫu
nhiên Ui : Cov (Xi , Ui ) = 0  i
• Định lý Gauss – Markov : Với các giả
thiết từ 1 đến 5 của mô hình hồi qui
tuyến tính cổ điển, các ước lượng OLS
là các ước lượng tuyến tính, không
chệch và có phương sai bé nhất trong
lớp các ước lượng tuyến tính, không
chệch.

là BLUE của 1 , 2
(Best Linear Unbiased Estimates)
3. Phương sai và sai số chuẩn của các ước lượng
Phương sai Sai số chuẩn
n

X
n

 i
2
2
i X
var( ˆ1 ) = i =1
n
2 se( ˆ1 ) = i =1
ˆ
n x 2 n

i =1
i
n xi2
i =1

2
var( ˆ 2 ) = ˆ
n se( ˆ 2 ) =
 i
x 2

i =1
n
(  xi2 )
i =1

Trong đó : 2 = var (Ui). Do 2 chưa biết


nên dùng ước lượng của nó là 2  ei2
σˆ =
n−2
•  2
là chưa biết, khi giả thiết 2,3 thỏa mãn:
 2 = var( u | X i ) = E(( u |X )2 )
i

• Giả sử với mẫu kích thước n, ̂ 2 là ước


lượng không chệch của  2
n

e 2
+ e 2
+ .. + e 2 i
e 2

ˆ 2 = 1 2 n
= i =1
n−2 n−2
4. Hệ số xác định và hệ số tương quan
a. Hệ số xác định : Dùng để đo mức độ phù
hợp của hàm hồi qui. 2
dn
ESS RSS
R = =1−
TSS TSS
Trong đó : TSS = ESS + RSS
n n
TSS =  i
( Y
i =1
− Y ) 2
=  i
y 2

i =1
n
ESS =  i
( Ŷ
i =1
− Y ) 2

n n
RSS =  i
( Y
i =1
− Ŷi ) 2
=  i
e 2

i =1
b. Hệ số tương quan : Là số đo mức độ
chặt chẽ của quan hệ tuyến tính giữa
X và Y.

r=
 (X − X)(Y − Y)
i i
=
 xi y i
 ( X − X)  ( Y − Y )
i
2
i
2
 i i
x 2
y 2

2
Chứng minh được : r = R
Và dấu của r trùng với dấu của hệ số của
X trong hàm hồi qui ( βˆ2 ).
Tính chất của hệ số tương quan :
1. Miền giá trị của r : -1  r  1
| r| → 1 : quan hệ tuyến tính giữa X và
Y càng chặt chẽ.
2. r có tính đối xứng : rXY = rYX
3. Nếu X, Y độc lập thì r = 0. Điều
ngược lại không đúng.
Ví dụ : Bảng sau cho số liệu về lãi suất ngân hàng (Y) và
tỷ lệ lạm phát (X) trong năm 2020 ở 9 quốc gia:

X 7.4 4.0 3.1 1.6 4.8 51.0 2.0 6.6 4.4


Y 11.9 9.4 7.5 4.0 11.3 66.3 2.2 10.3 7.6
5. Phân phối xác suất của các ước lượng
Giả thiết 6 : Ui có phân phối N (0, 2),
Với giả thiết 6, các ước lượng có thêm
các tính chất sau :
1. Khi số quan sát đủ lớn thì các ước
lượng xấp xỉ với giá trị thực của phân
phối :
ˆ ˆ
β1 ⎯⎯⎯→ β1 , β 2 ⎯⎯⎯→ β 2
n→  n→ 
ˆ
β 1 − β1
ˆ
2. β 1 ~ N( β 1 , σ βˆ )  Z =
2
~ N(0,1)
1
σ βˆ
1

βˆ2 − β 2
βˆ2 ~ N( β 2 , σ β2ˆ ) Z= ~ N(0,1)
2
σ βˆ
2

(n − 2)σ
ˆ 2
3. ~ χ (n − 2)
2

σ 2

4. Yi ~ N (1+ 2Xi, 2)


6. Khoảng tin cậy của các hệ số hồi qui
• Sử dụng phân phối của thống kê t :
βˆj − β j
t= ~ t (n − 2) j = 1,2
sê( βˆj )
Đồ thị phân phối của thống kê t
6. Khoảng tin cậy của các hệ số hồi qui
6. Khoảng tin cậy của các hệ số hồi qui
6. Khoảng tin cậy của các hệ số hồi qui
7. Kiểm định giả thiết về các hệ số hồi qui
7. Kiểm định giả thiết về các hệ số hồi qui
Các giả thuyết cần kiểm định gồm:
• Các giả thuyết về hệ số hồi quy
• Các giả thuyết về phương sai của
• Các giả thuyết về sự phù hợp của mô hình

Các loại giả thuyết:


• Giả thuyết 2 phía, giả thuyết phía trái và giả thuyết phía phải

Các cách kiểm định cơ bản:


• Phương pháp khoảng tin cậy
• Phương pháp giá trị tới hạn
• Phương pháp p-value (dùng máy vi tính)
7. Kiểm định giả thiết về các hệ số hồi qui
7. Kiểm định giả thiết về các hệ số hồi qui

Có 2 cách kiểm định :

- Nếu a  [, ]  bác bỏ H0


- Nếu a  [, ]  chấp nhận H0
7. Kiểm định giả thiết về các hệ số hồi qui

Dùng kiểm định t :


8. Kiểm định sự phù hợp của hàm hồi
qui. Phân tích hồi qui và phân tích
phương sai
• Giả thiết H0 : 2 = 0 ( hàm hồi qui
không phù hợp)
H1 : 2  0 (hàm hồi qui phù hợp)
Sử dụng phân phối của thống kê F :

F=
( 2 2
)
(β 2 − β 2 )  xi / 1
ˆ
~ F(1, n − 2)
e 2
i /(n − 2)
Khi 2 = 0 , F có thể viết :
β 2  xi
ˆ 2 2
ESS / 1 R2 /1
F= = = (*)
 ei /(n − 2) RSS /(n − 2) (1 − R ) /(n − 2)
2 2

Nên có thể dùng qui tắc kiểm định sau :


Mặt khác, cũng từ (*) cho thấy :
Phân tích phương sai cho phép đưa ra
các phán đoán thống kê về độ thích
hợp của hồi qui ( xem bảng phân tích
phương sai).
* Một số chú ý khi kiểm định giả thiết :
- Khi nói “chấp nhận giả thiết H0”,
không có nghĩa H0 đúng.
- Lựa chọn mức ý nghĩa  :  có thể
tùy chọn, thường người ta chọn mức
1%, 5%, nhiều nhất là 10%.
7. Kiểm định giả thiết về các hệ số hồi qui
• Giả sử H0 : 2 = a ( a = const)
H 1 : 2  a
Có 2 cách kiểm định :
1. Dùng khoảng tin cậy :
Khoảng tin cậy của 2 là [, ]
- Nếu a  [, ]  bác bỏ H0
- Nếu a  [, ]  chấp nhận H0
2. Dùng kiểm định t :
βˆ2 − β 2
Thống kê sử dụng : t = ˆ
~ t(n − 2)
sê( β 2 )
Có hai cách đọc kết quả kiểm định t :
Cách 1 : dùng giá trị tới hạn.
- Tính βˆ2 − a
t=
sê( βˆ2 )
- Tra bảng t tìm t/2(n-2)
- Nếu | t| > t/2(n-2)  bác bỏ H0.
- Nếu | t|  t/2(n-2)  chấp nhận H0.
Cách 2 : Dùng p-value (mức ý nghĩa
chính xác)
p = P(| T| > ta)
βˆ2 − a
với ta = t =
sê( βˆ2 )
- Nếu p    bác bỏ H0.
- Nếu p >   chấp nhận H0.
8. Kiểm định sự phù hợp của hàm hồi
qui. Phân tích hồi qui và phân tích
phương sai
• Giả thiết H0 : 2 = 0 ( hàm hồi qui
không phù hợp)
H1 : 2  0 (hàm hồi qui phù hợp)
Sử dụng phân phối của thống kê F :

F=
( 2 2
)
(β 2 − β 2 )  xi / 1
ˆ
~ F(1, n − 2)
e 2
i /(n − 2)
Khi 2 = 0 , F có thể viết :
β 2  xi
ˆ 2 2
ESS / 1 R2 /1
F= = = (*)
 ei /(n − 2) RSS /(n − 2) (1 − R ) /(n − 2)
2 2

Nên có thể dùng qui tắc kiểm định sau :


- Tính 2
R /1
F= 2
(1 − R ) /(n − 2)
- Nếu F > F(1, n-2)  bác bỏ H0
 hàm hồi qui phù hợp.
Mặt khác, cũng từ (*) cho thấy :
Phân tích phương sai cho phép đưa ra
các phán đoán thống kê về độ thích
hợp của hồi qui ( xem bảng phân tích
phương sai).
* Một số chú ý khi kiểm định giả thiết :
- Khi nói “chấp nhận giả thiết H0”,
không có nghĩa H0 đúng.
- Lựa chọn mức ý nghĩa  :  có thể
tùy chọn, thường người ta chọn mức
1%, 5%, nhiều nhất là 10%.
9. Dự báo
a. Dự báo giá trị trung bình :
Cho X =X0 , tìm E(Y/X0).
- Dự báo điểm của E(Y/X0) là :
Ŷ0 = βˆ1 + βˆ2 X 0
- Dự báo khoảng của E(Y/X0) là :
(n − 2) (n − 2)
Ŷ0 − sê( Ŷ0 ).t α /2  E( Y / X 0 )  Ŷ0 + sê( Ŷ0 ).t α /2

Trong đó :
 1 ( X 0 − X)2 
 σ
ˆ 2
vâr( Ŷ0 ) =  +
 n  xi 
2
b. Dự báo giá trị cá biệt :
Cho X =X0 , tìm Y0.
(n − 2) (n − 2)
Ŷ0 − sê( Y0 − Ŷ0 ).t α /2  Y0  Ŷ0 + sê( Y0 − Ŷ0 ).t α /2

Trong đó :
var( Y0 − Ŷ0 ) = var( Ŷ0 ) + σ 2
nên
vâr( Y0 − Ŷ0 ) = vâr( Ŷ0 ) + σˆ2
dải tin cậy của
Y giá trị cá biệt

dải tin cậy của


giá trị trung
bình

X X
* Đặc điểm của dự báo khoảng
10. Trình bày kết quả hồi qui
Ŷi = βˆ + β ˆX R2 =
1 2 i
se = sê (βˆ1 ) sê (βˆ2 ) n =
t = t1 t2 F =
p = p(>t1) p(>t2) p(> F) =
Trong đó : βˆ − 0 βˆ2 − 0
t1 = 1
t2 =
sê( βˆ1 ) sê( βˆ2 )

Ŷi = 24,4545 + 0,5091 Xi R2 = 0,9621


se = (6,4138) (0,0357) n = 10
t = (3,813) (14,243) F = 202,87
p = (0,005) (0,000) p = (0,000)
11. Đánh giá kết quả của phân tích hồi
qui
• Dấu của các hệ số hồi qui ước lượng
được phù hợp với lý thuyết hay tiên
nghiệm không.
• Các hệ số hồi qui ước lượng được có ý
nghĩa về mặt thống kê hay không.
• Mức độ phù hợp của mô hình (R2).
• Kiểm tra xem mô hình có thỏa mãn các
giả thiết của mô hình hồi qui tuyến tính
cổ điển hay không.

You might also like