Professional Documents
Culture Documents
Bai Giang - Hoi Quy Voi Bien Cong Cu - Uoc Luong Tsls
Bai Giang - Hoi Quy Voi Bien Cong Cu - Uoc Luong Tsls
Võ Thị Lệ Uyển
VTLU PTDLB 1 / 77
Nội dung
1 ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT
2 HIỆN TƯỢNG NỘI SINH
DO SAI SỐ ĐO LƯỜNG
DO BỎ SÓT BIẾN
DO TÍNH NHÂN QUẢ ĐỒNG THỜI
3 BIẾN CÔNG CỤ (IV)
4 ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT HAI GIAI ĐOẠN
5 CÁC KIỂM ĐỊNH CHẨN ĐOÁN
KIỂM ĐỊNH BIẾN CÔNG CỤ YẾU
KIỂM ĐỊNH HAUSMAN
KIỂM ĐỊNH SỰ PHÙ HỢP CỦA BIẾN CÔNG CỤ
CÁC KIỂM ĐỊNH CHẨN ĐOÁN VỚI TSLS
6 ỨNG DỤNG 1: ƯỚC LƯỢNG OLS, IV VÀ TSLS THỦ CÔNG
7 ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 2 / 77
ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT
Xét mô hình:
y = β0 + β1 x1 + β2 x2 + . . . + βK xK + ε
VTLU PTDLB 3 / 77
ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT
1 Giả định A1: Xu hướng chung của tổng thể có dạng tuyến tính,
y = Xβ + ε.
2 Giả định A2: Kỳ vọng của số hạng sai số ngẫu nhiên bằng 0:
E(ε) = 0,
hay nói cách khác: E(y ) = Xβ.
VTLU PTDLB 4 / 77
ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT
3 Giả định A3: Ma trận ma trận phương sai-hiệp phương sai của sai
số ngẫu nhiên thỏa
var(ε) = E εε′ = I σ 2
var(ε) = σ 2 = var(y ).
cov (εi , εj ) = 0
VTLU PTDLB 5 / 77
ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT
E(Xε) = 0
6 Giả định A5: Ma trận các biến giải thích có hạng đầy đủ (không có
đa cộng tuyến),
rank(X) = K + 1 ≤ N.
7 Giả định A6: Số hạng sai số ngẫu nhiên phân phối chuẩn ,
ε ∼ N 0, σ 2 .
VTLU PTDLB 6 / 77
ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT
Theo các giả định A1-A5 của mô hình hồi quy tuyến tính đa biến thì:
βbOLS là ước lượng có phương sai nhỏ nhất trong tất cả các ước
lượng tuyến tính không chệch của β.
βbOLS là ước lượng tuyến tính không chệch tốt nhất (BLUE) của β.
VTLU PTDLB 7 / 77
ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT
• Khi đó, ước lượng OLS được tính theo công thức
−1
βbOLS = X′ X X′ y
• Phương sai của các ước lượng OLS được cho bởi công thức:
−1
Var βbOLS = σ 2 X′ X
β ∼ N βbOLS , Var βbOLS .
VTLU PTDLB 8 / 77
HIỆN TƯỢNG NỘI SINH
Định nghĩa
Một biến giải thích được gọi là nội sinh khi nó tương quan với số hạng sai
số ngẫu nhiên.
Hay E(ε | x) ̸= 0.
Hiện tượng nội sinh của các biến giải thích là do:
1 Sai số đo lường.
2 Bị chệch do bỏ sót biến.
3 Tính nhân quả đồng thời.
Ngoài ra, còn do
1 Mô hình dữ liệu bảng động.
2 Có tự tương quan chuỗi trong số hạng sai số ngẫu nhiên của mô hình
tự hồi quy.
VTLU PTDLB 10 / 77
HIỆN TƯỢNG NỘI SINH DO SAI SỐ ĐO LƯỜNG
Sai số đo lường
Ví dụ
Xét mô hình với mức tiêu dùng (c) như sau:
c = α + βinc ∗ + ε (1)
Thông thường, ta có dữ liệu về thu nhập inc nhưng đây không phải là
thu nhập vĩnh viễn.
Do đó, biểu diễn thu nhập vĩnh viễn theo thu nhập hiện tại dưới dạng:
inc ∗ = inc + η
trong đó η là sai số ngẫu nhiên với η ∼ N 0, ση2 .
VTLU PTDLB 11 / 77
HIỆN TƯỢNG NỘI SINH DO SAI SỐ ĐO LƯỜNG
Sai số đo lường
Thu nhập hiện tại (inc) là đại diện cho thu nhập vĩnh viễn (inc ∗ ).
Khi đó, hiệp phương sai giữa inc và số hạng sai số ngẫu nhiên (ν) :
VTLU PTDLB 12 / 77
HIỆN TƯỢNG NỘI SINH DO BỎ SÓT BIẾN
Ví dụ
Suất sinh lợi của việc đi học.
Giả sử mô hình thực sự cho mức lương (w ) có dạng:
w = α + ρS + βA + ε, (2)
trong đó S là số năm cao nhất đã đi học và A là thước đo khả năng cá
nhân hoặc (và) động lực.
trong đó số hạng sai số ngẫu nhiên η nắm bắt khả năng cá nhân A,
tức là η = ε + βA.
VTLU PTDLB 13 / 77
HIỆN TƯỢNG NỘI SINH DO BỎ SÓT BIẾN
Ước lượng OLS của ρ có thể được đơn giản hóa thành:
cov(w , S)
ρbOLS = .
Var(S)
VTLU PTDLB 14 / 77
HIỆN TƯỢNG NỘI SINH DO BỎ SÓT BIẾN
1 cov(A, S)
ρbOLS = E[(α + ρS + ε)S + βAS] = ρ + β ̸= ρ.
Var(S) Var(S)
| {z }
=bị chệch
Hệ số ước lượng OLS cho số năm đi học sẽ bị lệch theo hướng tăng
nếu dấu của β và cov(A,S)
Var(S) giống nhau.
VTLU PTDLB 15 / 77
HIỆN TƯỢNG NỘI SINH DO TÍNH NHÂN QUẢ ĐỒNG THỜI
Ví dụ
Mô hình tiêu dùng đơn giản (Keynesian):
C = α + βy + ε
y =c +i
trong đó:
c là mức tiêu dùng,
y là tổng sản phẩm,
i là khoản đầu tư
và ε là số hạng sai số ngẫu nhiên, tức là ε ∼ N 0, σε2 .
VTLU PTDLB 16 / 77
HIỆN TƯỢNG NỘI SINH DO TÍNH NHÂN QUẢ ĐỒNG THỜI
Định nghĩa
Dạng rút gọn của hệ phương trình đồng thời được định nghĩa là: một
hệ mà trong đó (các) biến nội sinh được xác định chỉ bởi các biến
ngoại sinh và các sai số ngẫu nhiên.
Ước lượng OLS cho xu hướng tiêu dùng cận biên, hệ số β của (3),
được cho bởi công thức:
P
OLS (y − ȳ )ε
βb =β+ P .
(y − ȳ )2
| {z }
=0 nếu E(y |ε)=0
Nếu y phụ thuộc vào ε (trong dạng rút gọn), thì βbOLS ̸= β
và ước lượng OLS không nhất quán.
VTLU PTDLB 18 / 77
BIẾN CÔNG CỤ (IV)
VTLU PTDLB 19 / 77
BIẾN CÔNG CỤ (IV)
VTLU PTDLB 20 / 77
BIẾN CÔNG CỤ (IV)
VTLU PTDLB 21 / 77
BIẾN CÔNG CỤ (IV)
VTLU PTDLB 22 / 77
BIẾN CÔNG CỤ (IV)
y = α + βx + ε và cov(ε | x) ̸= 0.
VTLU PTDLB 23 / 77
BIẾN CÔNG CỤ (IV)
y = α + β1 x1 + . . . + βk xk + βk+1 w1 + . . . + βk+r wr + ε,
trong đó,
y là biến phụ thuộc;
ε là số hạng sai số ngẫu nhiên;
Do có vấn đề nội sinh trong mô hình nên số hạng sai số ngẫu
nhiên này sẽ bao gồm các yếu tố bị bỏ sót và sai số đo lường
x1 , . . . , xk là k biến nội sinh có tương quan với sai số ngẫu nhiên ε;
w1 , . . . , wr là r biến ngoại sinh không có tương quan với ε;
z1 , . . . , zm là m biến công cụ.
VTLU PTDLB 24 / 77
BIẾN CÔNG CỤ (IV)
Nhận dạng
Để áp dụng hồi quy IV, các hệ số phải được nhận dạng chính xác hoặc
nhận dạng quá mức.
VTLU PTDLB 25 / 77
BIẾN CÔNG CỤ (IV)
VTLU PTDLB 26 / 77
BIẾN CÔNG CỤ (IV)
Ví dụ
Nguồn gốc của
Biến phụ thuộc Biến NỘI SINH X Tham khảo
biến công cụ
Vùng và thời gian
Thu nhập Năm học Duflo (2001)
trường xây dựng
Thu nhập Năm học Gần trường đại học Card (1995)
Angrist và Krueger
Thu nhập Năm học Quý sinh
(1991)
Tình trạng Imbens và van der
Thu nhập Biến giả đoàn thể
cựu chiến binh Klaauw (1995)
Cân nặng Việc hút thuốc Thuế thuốc lá Evans và Ringel
khi sinh của mẹ của nhà nước (1999)
Gần trung tâm McClellan,Mc-Neil
Sức khỏe Phẫu thuật đau tim
điều trị tim và Newhouse (1994)
Ghi danh Sự gián đoạn trong Van der Klaauw
Hỗ trợ tài chính
đại học hỗ trợ tài chính (1996)
Tội phạm Cảnh sát Chu kỳ bầu cử Levitt (1997)
VTLU PTDLB 27 / 77
ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT HAI GIAI ĐOẠN
Định nghĩa
Ước lượng bình phương nhỏ nhất hai giai đoạn (TSLS):
y = β0 + β1 x + ε.
VTLU PTDLB 28 / 77
ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT HAI GIAI ĐOẠN
Định nghĩa
Ước lượng bình phương nhỏ nhất hai giai đoạn (TSLS):
y = β0 + β1 x1 + . . . + βk xk + βk+1 w1 + . . . + βk+r wr + ε.
• Dựa vào kết quả ước lượng OLS tính toán các giá trị dự báo xbi .
VTLU PTDLB 29 / 77
ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT HAI GIAI ĐOẠN
ước lượng thu được trong hồi quy giai đoạn hai.
VTLU PTDLB 30 / 77
CÁC KIỂM ĐỊNH CHẨN ĐOÁN
Các thuộc tính tiệm cận của các ước lượng OLS và TSLS:
σe
plim βbOLS = β + cor(x, e) ,
σx
cor(z, e) σe
plim βbIV = β + .
cor(z, x) σz
VTLU PTDLB 31 / 77
CÁC KIỂM ĐỊNH CHẨN ĐOÁN KIỂM ĐỊNH BIẾN CÔNG CỤ YẾU
xi = π0 + π1 z1 + . . . + πm zm + πm+1 w1 + . . . + πm+r wr + η,
Nhận xét
Đây là kiểm định đồng thời ý nghĩa thống kê của các hệ số hồi quy,
còn được gọi là kiểm định F.
Quy tắc ngón tay cái: H0 bị bác bỏ khi trị thống kê F > 10.
VTLU PTDLB 32 / 77
CÁC KIỂM ĐỊNH CHẨN ĐOÁN KIỂM ĐỊNH HAUSMAN
Nhận xét
Kiểm định Hausman được sử dụng nhằm kiểm định tính nội sinh của
biến giải thích.
Giả định chính: các ước lượng IV là không bị chệch, tức là, các biến
công cụ là mạnh và ngoại sinh.
• Giả thuyết:
H0 : cov(x, ε) = 0,
H1 : cov(x, ε) ̸= 0,
⇒ Nếu giả thuyết H0 bị bác bỏ ⇒ Biến giải thích là nội sinh ⇒ các ước
lượng OLS không nhất quán.
VTLU PTDLB 33 / 77
CÁC KIỂM ĐỊNH CHẨN ĐOÁN KIỂM ĐỊNH HAUSMAN
VTLU PTDLB 34 / 77
CÁC KIỂM ĐỊNH CHẨN ĐOÁN KIỂM ĐỊNH HAUSMAN
Nhận xét
Phiên bản này của kiểm định Hausman được sử dụng nhằm kiểm định
xem ước lượng IV hay ước lượng OLS phù hợp hơn.
Giả định: Ước lượng IV là nhất quán theo cả H0 và H1 .
H0 : Không có sự khác biệt các Ước lượng OLS và TSLS
(hay OLS là nhất quán)
H : Có sự khác biệt giữa ước lượng OLS và TSLS
1
(hay ước lượng OLS không nhất quán).
VTLU PTDLB 35 / 77
CÁC KIỂM ĐỊNH CHẨN ĐOÁN KIỂM ĐỊNH HAUSMAN
y = β0 + β1 x + ε,
VTLU PTDLB 36 / 77
CÁC KIỂM ĐỊNH CHẨN ĐOÁN KIỂM ĐỊNH HAUSMAN
(b) Ước lượng phương trình cấu trúc mở rộng bởi phần dư ηb như sau:
y = β0 + β1 x + δb
η + ε,
VTLU PTDLB 37 / 77
CÁC KIỂM ĐỊNH CHẨN ĐOÁN KIỂM ĐỊNH SỰ PHÙ HỢP CỦA BIẾN CÔNG CỤ
Lặp lại hồi quy trong bước đầu tiên cho tất cả các biến giải thích.
Thu thập phần dư từ mỗi mô hình ước lượng.
Hồi quy phụ trong bước thứ hai được mở rộng bởi phần dư từ mỗi
hồi quy ở bước đầu tiên.
Thống kê F được sử dụng để kiểm định đồng thời ý nghĩa các hệ số
của phần dư.
Khi số lượng công cụ lớn hơn số lượng biến nội sinh (nhận dạng quá
mức), ta phải kiểm định tính hợp lệ của chúng.
• Chiến lược không chính thống:
Thử các kết hợp khác nhau của các biến công cụ và so sánh các ước
lượng.
VTLU PTDLB 38 / 77
CÁC KIỂM ĐỊNH CHẨN ĐOÁN KIỂM ĐỊNH SỰ PHÙ HỢP CỦA BIẾN CÔNG CỤ
VTLU PTDLB 39 / 77
CÁC KIỂM ĐỊNH CHẨN ĐOÁN CÁC KIỂM ĐỊNH CHẨN ĐOÁN VỚI TSLS
Với vấn đề về sai số chuẩn của các ước lượng OLS, cần tiến hành:
Kiểm định tương quan chuỗi và phương sai sai số thay đổi.
Kiểm định biến công cụ yếu.
Các công cụ yếu giải thích rất ít cho sự biến động của các biến nội
sinh.
Do đó, với các công cụ yếu thì ước lượng TSLS không đáng tin cậy.
Kiểm định F với giả thuyết H0 : các hệ số trên tất cả các công
cụnđồng thời bằng 0 trong hồi quy ở giai đoạn đầu tiên.
Kiểm định tính nội sinh của biến công cụ.
Lưu ý: Chưa có kiểm định thống kê chính thống nào được sử dụng để
kiểm định xem các công cụ có tương quan với số hạng sai số ngẫu nhiên
hay không.
VTLU PTDLB 40 / 77
ỨNG DỤNG 1: ƯỚC LƯỢNG OLS, IV VÀ TSLS THỦ CÔNG
VTLU PTDLB 41 / 77
ỨNG DỤNG 1: ƯỚC LƯỢNG OLS, IV VÀ TSLS THỦ CÔNG
VTLU PTDLB 43 / 77
ỨNG DỤNG 1: ƯỚC LƯỢNG OLS, IV VÀ TSLS THỦ CÔNG
VTLU PTDLB 44 / 77
ỨNG DỤNG 1: ƯỚC LƯỢNG OLS, IV VÀ TSLS THỦ CÔNG
VTLU PTDLB 45 / 77
ỨNG DỤNG 1: ƯỚC LƯỢNG OLS, IV VÀ TSLS THỦ CÔNG
Ước lượng IV
. ivreg lpassen (lfare=concen) ldist ldistsq, nohe
. estimates store iv1
Nhận xét
• concen có thể xuất hiện trong hàm cung, do đó không được đưa
vào hàm cầu.
• Hệ số của lfare trong mô hình log-log này nhỏ hơn -1, do đó nhu
cầu là co giãn.
VTLU PTDLB 46 / 77
ỨNG DỤNG 1: ƯỚC LƯỢNG OLS, IV VÀ TSLS THỦ CÔNG
VTLU PTDLB 47 / 77
ỨNG DỤNG 1: ƯỚC LƯỢNG OLS, IV VÀ TSLS THỦ CÔNG
VTLU PTDLB 48 / 77
ỨNG DỤNG 1: ƯỚC LƯỢNG OLS, IV VÀ TSLS THỦ CÔNG
VTLU PTDLB 49 / 77
ỨNG DỤNG 1: ƯỚC LƯỢNG OLS, IV VÀ TSLS THỦ CÔNG
VTLU PTDLB 50 / 77
ỨNG DỤNG 1: ƯỚC LƯỢNG OLS, IV VÀ TSLS THỦ CÔNG
VTLU PTDLB 51 / 77
ỨNG DỤNG 1: ƯỚC LƯỢNG OLS, IV VÀ TSLS THỦ CÔNG
VTLU PTDLB 52 / 77
ỨNG DỤNG 1: ƯỚC LƯỢNG OLS, IV VÀ TSLS THỦ CÔNG
VTLU PTDLB 53 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
• Đọc dữ liệu
. import excel "D:.̇. labor.xls", sheet("Sheet1") firstrow
VTLU PTDLB 54 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
• Vẽ đồ thị
. graph bar supply, over(morekids)
VTLU PTDLB 55 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 56 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 57 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
• Kết quả thường thấy là: các ước lượng OLS là có ý nghĩa thống kê,
trong khi các ước lượng IV thì không. Tại sao?
• Tại sao sai số chuẩn của các ước lượng OLS và ước lượng IV lại khác
nhau nhiều như vậy?
. cor morekids samesex, cov
. dis 1/r(Var_1)
. dis r(Var_2)/r (cov _12)2
VTLU PTDLB 58 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 59 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 60 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 61 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 62 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
⇒ Giá trị p lớn cho thấy morekids là biến ngoại sinh, vì vậy OLS nhất
quán và tốt hơn so với ước lượng IV
VTLU PTDLB 63 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
• Kết quả hồi quy bao gồm cả giai đoạn một và giai đoạn hai
. ivreg supply (morekids = samesex) age, r first
VTLU PTDLB 64 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 65 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 66 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 67 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
⇒ giá trị p-value nhỏ hoặc giá trị F lớn cho thấy hispan có tương quan, do
đó không phải là IV yếu.
VTLU PTDLB 68 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 69 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 70 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 71 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 72 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
⇒ Giá trị p lớn cho thấy cả samesex và hispan đều là ngoại sinh (hợp lệ)
VTLU PTDLB 73 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 75 / 77
ỨNG DỤNG 2: ƯỚC LƯỢNG IV BẰNG LỆNH ivreg
VTLU PTDLB 76 / 77