Professional Documents
Culture Documents
Phân Tích Dữ Liệu Bảng - gv Mai Vu
Phân Tích Dữ Liệu Bảng - gv Mai Vu
LIỆU BẢNG
FDI ODA
1990 180 248,35
1991 375,19 308,6
1992 473,946 646,06
1993 926,304 373,34
… … …
2005 2021 2021,53
2006 2360 1960,61
2007 6739 2496,73
• Là các số liệu về một hoặc nhiều biến được thu thập tại cùng
một thời điểm ở nhiều địa phương, đơn vị khác nhau
• Các số liệu loại này có dạng như sau : Ci, Yi với i = 1,…, N
✓ Trong đó i chỉ hộ gia đình (người tiêu dùng), doanh nghiệp hoặc một
lĩnh vực của quan sát tương ứng
✓ N chỉ tổng số lượng các quan sát
• Là các số liệu được thu thập theo thời gian và không gian.
• Số liệu loại này có hai chỉ số như sau : Cit, Yit
✓ với i = 1,…, N
✓ t = 1,…, T
2 65 4.3 4.8
1
ID
An Giang
YEAR
2004
FDI
145
ODA
40,61
POPU
2170,1
IZ
0
MOUTAIN
0
1 An Giang 2005 139 41,51 2194 0 0
• Bộ dữ liệu bảng cân 2 Ba Ria Vung Tau 2004 64776 1220,01 897,6 7 0
liệu bảng nhất định 63 Vinh Phuc 2006 12776 27,73 1180,4 3 0
một số quan sát của một 2 Ba Ria Vung Tau 2005 157,99 7 0
số/các nhóm 2 Ba Ria Vung Tau 2006 106618 11,55 926,3 7 0
tích dữ liệu
bảng
Generalized
FE/RE
Pooled OLS least IV model
model
squares
Stationary
test (unit-
root test)
Static IV
Dynamic IV
(2SLS, 3SLS (GMM)
models)
12/23/2022 MAI V.T.P- FIE- FTU 19
Một ví dụ về nghiên cứu sử dụng dữ liệu bảng
phân tích dữ
phần
liệu bảng
𝑋𝑖𝑡
Các yếu tố này có thể quy mô doanh
không đổi cho từng đối nghiệp, chi tiêu,
tượng quan sát theo thời dân số, GDP
• Xét mô hình có dạng: gian (VD: giới tính, chủng
𝒚𝒊𝒕 = 𝜷𝑿𝒊𝒕 + 𝜹𝒁𝒊 + 𝜺𝒊𝒕 (1) tộc) hoặc có thể thay đổi
theo thời gian (VD: độ tuổi)
• Trong mô hình này, X đại
diện cho các yếu tố quan sát
được như độ tuổi, quy mô
doanh nghiệp, mức độ chi
tiêu; Z đại diện cho các yếu 𝑍𝑖 Các yếu tố không quan sát Kỹ năng, tiềm
tố không quan sát được, ví được → gây ra tính không năng doanh
dụ như chất lượng quản lý, đồng nhất của mô hình nghiệp,
cơ hội tăng trưởng, kỹ năng, (model heterogeneity)
vv.
𝜀𝑖𝑡 Yếu tố ngẫu nhiên N/A
• Đây là giả định tốt nhất có thể đạt được theo các giả thuyết của MHHQTTCĐ: tất cả
các quan sát trong các nhóm là độc lập với nhau. Khi đó, mô hình (1) trở thành:
• Điều này có nghĩa là không tồn tại sự phụ thuộc giữa các nhóm quan sát trong bảng dữ
liệu → có thể xử lý dữ liệu như một tập lớn gọi là dữ liệu gộp (pooled dataset). Các
tham số trong mô hình 𝜷 và 𝜶 có thể được ước lượng trực tiếp bằng PP bình phương
nhỏ nhất gộp (POLS).
• Hệ số chặn, 𝜶𝒊 , thay đổi theo các giá trị quan sát nhưng không đổi theo thời gian. Hệ số
này vì vậy bao gồm 2 phần: một phần là hệ số chặn không đổi, 𝝁, và một phần là sai số
riêng của từng quan sát, 𝜸𝒊 .
• Đặc điểm quan trọng nhất của mô hình FE là tồn tại 𝛾𝑖 nhưng không quan sát được mà
phải tiến hành ước lượng. Quan trọng hơn, nếu ước lượng 𝜷 bằng PP POLS thì sẽ không
tính tới được sự tồn tại của 𝛾𝑖 . Vì thế, kết quả ước lượng sẽ không còn chính xác và nhất
quán.
- Không làm sai lệnh kết quả ước lượng của các
hệ số nếu chạy bằng PP OLS tuy nhiên có thể
gây ra kết quả ước lượng không hiệu quả và
các suy diễn thống kê thiếu chính xác.
Đặc điểm:
• Đặc điểm nổi bật của mô hình tác động ngẫu nhiên là không tồn tại giá trị thực
của 𝜹𝒁𝒊 mà tuân theo phân phối ngẫu nhiên với các tham số mà chúng ta phải
ước tính.
- Tác động tới cấu trúc hiệp phương sai của các phần dư trong mô hình → Các giá trị ƯL sẽ không
còn hiệu quả và các kiểm định thống kê (VD: t-stat) sẽ không còn chính xác.
29
6.5. Lựa chọn POLS vs FE vs RE
• Nếu biến bị bỏ sót là không đáng kể => MH hồi qui gộp là tốt nhất
• Nếu biến bị bỏ sót không tương quan với X => RE là hiệu quả hơn FE
(nhưng phải giả thiết về sự không tương quan giữa c và u)
• Nếu biến bị bỏ sót là tương quan với X thì RE là chệch và không vững=>
chọn FE
• Lựa chọn giữa POLS và RE: sử dụng xttest0
• Nếu RE được lựa chọn => sẽ chọn giữa FE hay RE: Hausman
30
6.6. Các bước chạy trong STATA
1. Chạy mô hình RE
2. Xttest0
• Nếu p-value lớn chọn MH hồi qui gộp
• Nếu p-value nhỏ chạy tiếp FE
3. Hausam
• Nếu p-value lớn quay trở lại RE
• Nếu p-value nhỏ chọn FE
31
6.6. Mộ số lệnh trong STATA
1. xtset id time: khai báo số liệu dạng mảng
2. xtreg y x1 x2 xk, re : chạy mô hình r.e
3. xttest0: lựa chọn re và pols
4. xtreg y x1 x2 xk, fe
5. est store tdcd: lưu giữ kết quả vừa ước lượng
6. hausman tdcd: kiểm định lựa chọn re và fe
32
7. MÔ HÌNH HỒI QUY VỚI BIẾN CÔNG CỤ
7.1. Biến nội sinh vs biến ngoại sinh
7.2. Hồi quy với biến công cụ