Professional Documents
Culture Documents
LIỆU BẢNG
PANEL DATA ANALYSIS
MỤC TIÊU
§Hiểu được cấu trúc của dữ liệu bảng và nhập được dữ liệu bảng
vào Eviews;
§Trình bày ưu nhược điểm và ứng dụng phổ biến của phân tích
dữ liệu bảng;
§Phân biệt được mô hình FEM và REM;
§Thực hiện được kiểm định đồng nhất của các đơn vị chéo;
§Thực hiện ước lượng mô hình FEM và REM trong Eviews;
§Thực hiện kiểm định Hausman để lựa chọn giữa FEM và REM.
NỘI DUNG
§Giới thiệu về dữ liệu bảng
§Thực hành: Nhập dữ liệu bảng vào Eviews
§Vấn đề biến bị bỏ sót
§Mô hình tác động cố định (FEM)
§Mô hình tác động ngẫu nhiên (REM)
§Lựa chọn giữa FEM và REM
§Thực hành: Ước lượng mô hình CAPM
§Kiểm định tự tương quan
§Thực hành: Ước lượng nhân tố ảnh hưởng hiệu quả hoạt động
ngân hàng
GIỚI THIỆU VỀ DỮ LIỆU BẢNG
Đơn vị chéo: i = 1, 2, 3, 4,
5
1: VPBank
2: VIB
3: Eximbank
4: SCB
5: Sacombank
Nhà nghiên cứu muốn xác định những yếu tố ảnh hưởng đến lợi
nhuận quí của cổ phiếu ngân hàng
Nhà nghiên cứu quan sát 500 cổ phiếu trong 4 năm liên tục (N =
500, T = 16)
Nếu tại mỗi quan sát thời gian (t = 1, 2, … 16) 500 cổ phiếu
được lựa chọn ngẫu nhiên, phân tích dữ liệu gộp sẽ phù hợp
hơn phân tích dữ liệu bảng
Nếu 500 cổ phiếu quan sát là cố định tại mỗi quan sát thời gian,
phân tích dữ liệu bảng phù hợp hơn
Ưu điểm của dữ liệu bảng:
Cho phép kiểm soát sự không đồng nhất của các đơn vị chéo, đặc
biệt là khi những đặc điểm không đồng nhất này thường không thể
quan sát được;
Việc đưa vào tham số đặc trưng đơn vị chéo còn giúp giải quyết vấn
đề biến bị bỏ sót (omitted variables problems).
Số lượng quan sát lớn nhờ kích thước hai chiều
Có thể nghiên cứu những vấn đề rộng hơn, và giải quyết được
những vấn đề phức tạp hơn.
THỰC HÀNH:
NHẬP DỮ LIỆU BẢNG VÀO EVIEWS
File: panel_beta_return.xls
Mục đích: Tạo workfile trong Eviews bằng các dữ liệu trong file
panel_beta_return.xls
Lưu ý dữ liệu trên file excel trước khi nhập vào Eviews:
Cấu trúc dữ liệu bảng
2 cột quan trọng: tên đơn vị chéo và thời gian
Các cột tên biến
Mở EViews, File/ Import/ Import from file...
Chọn file: panel_beta_return.xls
Tại cửa sổ Excel Read - Step 1 of 3: chọn Predefined Range
Đỏi tên:
Series01àcode
Series02àdate
series03 à beta;
series04 à
return
Dữ liệu bảng có:
Kích thước đơn vị chéo: 2500 công ty UK
Kích thước thời gian: 11 năm, 1996 - 2006
VẤN ĐỀ BIẾN BỊ BỎ SÓT
OMITTED VARIABLE
Khi các đơn vị chéo được quan sát là đồng nhất, mô hình
phản ánh tác động của k biến giải thích (Xit,k) đến biến phụ thuộc
Yit có dạng mô hình tác động cố định gộp:
Yit = α + βX'it + uit
γZi = 0: không tồn tại sự khác biệt giữa các đơn vị chéo (các đơn vị
chéo là đồng nhất)
α: hằng số chung cho tất cả các đơn vị chéo
Phương pháp OLS phù hợp để ước lượng mô hình
MÔ HÌNH TÁC ĐỘNG CỐ ĐỊNH
FIXED EFFECT MODEL (FEM)
Khi các đơn vị chéo được quan sát không đồng nhất và các
biến bị bỏ sót có tác động cố định (fix effect) và có tương quan
với biến độc lập, mô hình phản ánh tác động của k biến giải
thích (Xit,k) đến biến phụ thuộc Yit có tính đến đặc trưng riêng
của từng đơn vị chéo có dạng mô hình FEM:
Yit = α + βX’it + γZ’i + uit
E(Xit,k, Zi) ≠ 0
Ước lượng OLS không còn nhất quán
PHƯƠNG PHÁP ƯỚC LƯỢNG FEM
Phương pháp 1: chuyển FEM sang dạng mô hình biến giả bình
phương tối thiểu (LSDV, Least Squares Dummy Variable)
Sử dụng các biến giả để gán giá trị cho từng đơn vị chéo
Yit = α + β1Xit,1 + β2Xit,2 + ....+ βkXit,k + γ1D1i + γ 2D2i + γ3D3i +....+ uit
Trong đó, D1i là biến giả có giá trị 1 đối với những quan sát của đơn
vị chéo 1 và có giá trị 0 cho những đơn vị chéo còn lại; D2i là biến
giả có giá trị 1 đối với những quan sát của đơn vị chéo 2 và giá trị 0
cho những đơn vị chéo còn lại...
Phương pháp 1:
Mô hình có thể được viết lại đơn giản như sau:
Yit = αi + βX’it + uit
Lưu ý: lúc này E(Xit,k, αi) ≠ 0: αi có thể tương quan với Xit,k
Mô hình lúc này có thể được ước lượng bằng OLS
Các giả định khác
E(uit|Xi , αi) = 0
var(uit|Xi ,αi) = var(uit) = s2u
cov(uit, uis|Xi ,αi) = 0 với t¹s
E(Xit,k,uis) = 0 với s = 1, 2, ..., T: không có vấn đề nội sinh
uit ~ N(0; s2u)
Ý nghĩa của các tham số mô hình:
Tham số β chung cho tất cả các đơn vị chéo phản ánh tác động của biến
độc lập đến biến phụ thuộc.
Tham số αi bao gồm hằng số (constant) và biến bị bỏ sót của từng
đơn vị chéo, được gọi là tham số đặc trưng của đơn vị chéo (subject-
specific parameters).
Phương pháp 1:
Phù hợp khi số lượng đơn vị chéo của mẫu nhỏ (N nhỏ)
Số lượng đơn vị chéo của mẫu lớn (N lớn), nhưng nhà nghiên cứu
tập trung vào đặc trưng của nhóm đơn vị chéo hơn là từng đơn vị
chéo cụ thể
KIỂM ĐỊNH SỰ KHÔNG ĐỒNG NHẤT
TEST FOR HETEROGENEITY/ POOLING TEST
Kiểm định có tồn tại sự không đồng nhất giữa các đơn vị chéo.
Giả thuyết kiểm định:
H0: α1 = α2 = ... = αn: các hệ số chặn không khác nhau giữa các
đơn vị chéo
H1: α1 ≠ α2 ≠ ... ≠ αn ≠ 0: các hệ số chặn khác nhau tùy thuộc
vào đơn vị chéo.
Các bước kiểm định:
Bước 1: Ước lượng mô hình có hệ số chặn không đồng nhất giữa
các đối tương, lấy tổng bình phương phần dư, gọi là RSSU và s2
Bước 2: Ước lượng mô hình có hệ số chặn chung cho các đơn vị
chéo, để lấy tổng bình phương phần dư, gọi là RSSR
Bước 3: Tính toán
Với
Hoặc:
Mô hình lúc này có thể được ước lượng bằng phương pháp OLS
Phương pháp 3: Lấy sai phân (differencing)
Chuyển FEM sang dạng sai phân, để loại bỏ hằng số
Mô hình có dạng: ∆Yit = β∆X'it+ ∆uit
Mô hình có thể được ước lượng bằng phương pháp OLS
MÔ HÌNH CÓ TÁC ĐỘNG THỜI GIAN CỐ ĐỊNH
TIME-FIXED EFFECTS MODEL
Khi giá trị trung bình của Yit thay đổi theo thời gian chứ không
thay đổi theo đơn vị chéo, mô hình có dạng:
Yit = λt + β1Xit,1 + β2Xit,2 + ....+ βkXit,k + vit
λt là hằng số thay đổi theo thời gian (time-specific intercept)
phản ánh những biến số có tác động đến Yit, tác động này thay
đổi theo thời gian và không phụ thuộc vào đơn vị chéo.
Ước lượng mô hình: Chuyển mô hình thành dạng LSDV
Yit = β1Xit,1 + β2Xit,2 + ....+ βkXit,k + λ1D1t + λ2D2t + λ3D3t +....+ uit
trong đó D1 là biến giá có giá trị 1 cho giai đoạn thứ nhất (T =
1) và giá trị 0 cho các giai đoạn còn lại,...
MÔ HÌNH TÁC ĐỘNG NGẪU NHIÊN
RANDOM EFFECT MODEL (REM)
Khi các đơn vị chéo được quan sát không đồng nhất và các
biến bị bỏ sót có tác động ngẫu nhiên (random effect) và không
tương quan với biến độc lập, mô hình phản ánh tác động của k
biến giải thích (Xit,k) đến biến phụ thuộc Yit có tính đến đặc
trưng riêng của từng đơn vị chéo có dạng mô hình REM:
Yit = α + β1Xit,1 + β2Xit,2 + ....+ βkXit,k + ωit
ωit = εi + υit
cov(Xit,k, εi) = 0
Ý nghĩa tham số và sai số
α là hệ số chặn chung của tất cả đơn vị chéo
Tham số β chung cho tất cả các đơn vị chéo phản ánh tác động
của biến độc lập đến biến phụ thuộc
ωit là sai số phức hợp (composite error term or error
components)
εi phản ánh tác động đặc trưng của từng đơn vị chéo và được gọi là
thành phần tác động ngẫu nhiên (random effect).
υit là hạng nhiễu không tương quan lẫn nhau giữa các đơn vị chéo.
Các giả định khác của REM
E(ωit) = 0
var(ωit) =
cov(ωit, ωis) = với t¹s
E(εi, Xit,k) = 0
E(Xit,k, υit) = 0 với s = 1, 2, ..., T
Khác nhau giữa FEM và REM
FEM cho rằng biến bị bỏ sót nằm trong thành phần của hằng số và
cov(Xit,k, αi) ≠ 0
REM xem biết bị bỏ sót nằm trong thành phần của sai số và cov(Xit,k,
εi) = 0
PHƯƠNG PHÁP ƯỚC LƯỢNG REM
REM có giả định cov(εi, Xit,k) = 0 nếu giả định này không tồn tại sẽ
phát sinh vấn đề nội sinh
Kiểm định Hausman
H0: cov(εi, Xit,k) = 0
H1: cov(εi, Xit,k) ≠ 0
Do không tính được giá trị chính xác của εi nên trong thực hành
thường thay thế bằng giả thuyết:
H0: βFEM = βREM
H1: βFEM ≠ βREM
Nếu giá trị Prob < α (10%, 5%, 1%), giả thuyết H0 bị bác bỏ, và kết luận
REM không phù hợp để ước lượng dữ liệu bảng
THỰC HÀNH:
ƯỚC LƯỢNG MÔ HÌNH CAPM