You are on page 1of 50

MÔ HÌNH HỒI QUI DỮ

LIỆU BẢNG
PANEL DATA ANALYSIS
MỤC TIÊU
§Hiểu được cấu trúc của dữ liệu bảng và nhập được dữ liệu bảng
vào Eviews;
§Trình bày ưu nhược điểm và ứng dụng phổ biến của phân tích
dữ liệu bảng;
§Phân biệt được mô hình FEM và REM;
§Thực hiện được kiểm định đồng nhất của các đơn vị chéo;
§Thực hiện ước lượng mô hình FEM và REM trong Eviews;
§Thực hiện kiểm định Hausman để lựa chọn giữa FEM và REM.
NỘI DUNG
§Giới thiệu về dữ liệu bảng
§Thực hành: Nhập dữ liệu bảng vào Eviews
§Vấn đề biến bị bỏ sót
§Mô hình tác động cố định (FEM)
§Mô hình tác động ngẫu nhiên (REM)
§Lựa chọn giữa FEM và REM
§Thực hành: Ước lượng mô hình CAPM
§Kiểm định tự tương quan
§Thực hành: Ước lượng nhân tố ảnh hưởng hiệu quả hoạt động
ngân hàng
GIỚI THIỆU VỀ DỮ LIỆU BẢNG

Dữ liệu bảng (Panel data, còn gọi là longitudinal data) là sự kết


hợp của dữ liệu chuỗi thời gian (time series data) và dữ liệu
chéo (cross-sectional data)
Một bảng (panel), Yit, có hai kích thước:
­ Kích thước của đơn vị chéo (cross-section): i = 1, 2, 3, ..., N
­ Kích thước của thời gian (time): t = 1, 2, 3, ...., T
Bảng cân đối (balanced panel) có số lượng quan sát thời gian t
của từng đơn vị chéo i bằng nhau
­ Số lượng quan sát đơn vị chéo i của từng giai đoạn t bằng nhau
Bảng không cân đối (unbalanced panel) có số lượng quan sát
thời gian t của từng đơn vị chéo i không như nhau
­ Số lượng quan sát đơn vị chéo i của từng thời gian t là khác nhau
Chỉ số tài chính của 5
ngân hàng giai đoạn
2010-2014

Đơn vị chéo: i = 1, 2, 3, 4,
5
­ 1: VPBank
­ 2: VIB
­ 3: Eximbank
­ 4: SCB
­ 5: Sacombank

Thời gian: t = 2010, 2011,


2012, 2015, 2014
Dữ liệu gộp (pooled data):
­ Rất dễ nhầm với dữ liệu bảng
­ Các đối tượng (đơn vị chéo) được lựa chọn ngẫu nhiên tại từng
quan sát thời gian (không lặp lại)
VÍ DỤ:

Nhà nghiên cứu muốn xác định những yếu tố ảnh hưởng đến lợi
nhuận quí của cổ phiếu ngân hàng
Nhà nghiên cứu quan sát 500 cổ phiếu trong 4 năm liên tục (N =
500, T = 16)
Nếu tại mỗi quan sát thời gian (t = 1, 2, … 16) 500 cổ phiếu
được lựa chọn ngẫu nhiên, phân tích dữ liệu gộp sẽ phù hợp
hơn phân tích dữ liệu bảng
Nếu 500 cổ phiếu quan sát là cố định tại mỗi quan sát thời gian,
phân tích dữ liệu bảng phù hợp hơn
Ưu điểm của dữ liệu bảng:
­ Cho phép kiểm soát sự không đồng nhất của các đơn vị chéo, đặc
biệt là khi những đặc điểm không đồng nhất này thường không thể
quan sát được;
­ Việc đưa vào tham số đặc trưng đơn vị chéo còn giúp giải quyết vấn
đề biến bị bỏ sót (omitted variables problems).
­ Số lượng quan sát lớn nhờ kích thước hai chiều
­ Có thể nghiên cứu những vấn đề rộng hơn, và giải quyết được
những vấn đề phức tạp hơn.
THỰC HÀNH:
NHẬP DỮ LIỆU BẢNG VÀO EVIEWS

File: panel_beta_return.xls
Mục đích: Tạo workfile trong Eviews bằng các dữ liệu trong file
panel_beta_return.xls
Lưu ý dữ liệu trên file excel trước khi nhập vào Eviews:
­ Cấu trúc dữ liệu bảng
­ 2 cột quan trọng: tên đơn vị chéo và thời gian
­ Các cột tên biến
Mở EViews, File/ Import/ Import from file...
Chọn file: panel_beta_return.xls
Tại cửa sổ Excel Read - Step 1 of 3: chọn Predefined Range
Đỏi tên:
Series01àcode
Series02àdate
series03 à beta;
series04 à
return
Dữ liệu bảng có:
­ Kích thước đơn vị chéo: 2500 công ty UK
­ Kích thước thời gian: 11 năm, 1996 - 2006
VẤN ĐỀ BIẾN BỊ BỎ SÓT
OMITTED VARIABLE

Cho mô hình sau:


Yit = α + β1Xit,1 + β2Xit,2 + ....+ βkXit,k + uit
­ α là hệ số chặn
­ Y là biến phụ thuộc
­ X là các biến độc lập
Viết gọn: Yit = α + βX’it + uit
­ X’ là vectơ k x 1 biến độc lập
­ β là vectơ k x 1 hệ số hồi qui riêng phần của từng biến độc lập
Y còn chịu tác động của biến giải thích không thể quan sát
được và không thay đổi theo thời gian (Z)
Yit = α + βX’it + γZ’i + uit
­ γZ’I đại diện cho tác động của các biến không quan sát được (đặc
điểm ngành công nghiệp, chất lượng quản trị, loại hình sở hữu, văn
hóa doanh nghiệp…)
Nếu bỏ qua Z’ trong khi Z’ có tồn tại, mô hình gặp vấn đề biến bị
bỏ sót
Các cách giải quyết Z’ khác nhau, tạo thành các mô hình dữ liệu
bảng khác nhau
MÔ HÌNH DỮ LIỆU GỘP
POOLED (CONSTANT EFFECT) MODEL

Khi các đơn vị chéo được quan sát là đồng nhất, mô hình
phản ánh tác động của k biến giải thích (Xit,k) đến biến phụ thuộc
Yit có dạng mô hình tác động cố định gộp:
Yit = α + βX'it + uit
­ γZi = 0: không tồn tại sự khác biệt giữa các đơn vị chéo (các đơn vị
chéo là đồng nhất)
­ α: hằng số chung cho tất cả các đơn vị chéo
Phương pháp OLS phù hợp để ước lượng mô hình
MÔ HÌNH TÁC ĐỘNG CỐ ĐỊNH
FIXED EFFECT MODEL (FEM)

Khi các đơn vị chéo được quan sát không đồng nhất và các
biến bị bỏ sót có tác động cố định (fix effect) và có tương quan
với biến độc lập, mô hình phản ánh tác động của k biến giải
thích (Xit,k) đến biến phụ thuộc Yit có tính đến đặc trưng riêng
của từng đơn vị chéo có dạng mô hình FEM:
Yit = α + βX’it + γZ’i + uit
­ E(Xit,k, Zi) ≠ 0
Ước lượng OLS không còn nhất quán
PHƯƠNG PHÁP ƯỚC LƯỢNG FEM

Phương pháp 1: chuyển FEM sang dạng mô hình biến giả bình
phương tối thiểu (LSDV, Least Squares Dummy Variable)
­ Sử dụng các biến giả để gán giá trị cho từng đơn vị chéo
Yit = α + β1Xit,1 + β2Xit,2 + ....+ βkXit,k + γ1D1i + γ 2D2i + γ3D3i +....+ uit
Trong đó, D1i là biến giả có giá trị 1 đối với những quan sát của đơn
vị chéo 1 và có giá trị 0 cho những đơn vị chéo còn lại; D2i là biến
giả có giá trị 1 đối với những quan sát của đơn vị chéo 2 và giá trị 0
cho những đơn vị chéo còn lại...
Phương pháp 1:
­ Mô hình có thể được viết lại đơn giản như sau:
Yit = αi + βX’it + uit
­ Lưu ý: lúc này E(Xit,k, αi) ≠ 0: αi có thể tương quan với Xit,k
­ Mô hình lúc này có thể được ước lượng bằng OLS
Các giả định khác
­ E(uit|Xi , αi) = 0
­ var(uit|Xi ,αi) = var(uit) = s2u
­ cov(uit, uis|Xi ,αi) = 0 với t¹s
­ E(Xit,k,uis) = 0 với s = 1, 2, ..., T: không có vấn đề nội sinh
­ uit ~ N(0; s2u)
­ Ý nghĩa của các tham số mô hình:
­ Tham số β chung cho tất cả các đơn vị chéo phản ánh tác động của biến
độc lập đến biến phụ thuộc.
­ Tham số αi bao gồm hằng số (constant) và biến bị bỏ sót của từng
đơn vị chéo, được gọi là tham số đặc trưng của đơn vị chéo (subject-
specific parameters).
Phương pháp 1:
­ Phù hợp khi số lượng đơn vị chéo của mẫu nhỏ (N nhỏ)
­ Số lượng đơn vị chéo của mẫu lớn (N lớn), nhưng nhà nghiên cứu
tập trung vào đặc trưng của nhóm đơn vị chéo hơn là từng đơn vị
chéo cụ thể
KIỂM ĐỊNH SỰ KHÔNG ĐỒNG NHẤT
TEST FOR HETEROGENEITY/ POOLING TEST

Kiểm định có tồn tại sự không đồng nhất giữa các đơn vị chéo.
Giả thuyết kiểm định:
­ H0: α1 = α2 = ... = αn: các hệ số chặn không khác nhau giữa các
đơn vị chéo
­ H1: α1 ≠ α2 ≠ ... ≠ αn ≠ 0: các hệ số chặn khác nhau tùy thuộc
vào đơn vị chéo.
Các bước kiểm định:
­ Bước 1: Ước lượng mô hình có hệ số chặn không đồng nhất giữa
các đối tương, lấy tổng bình phương phần dư, gọi là RSSU và s2
­ Bước 2: Ước lượng mô hình có hệ số chặn chung cho các đơn vị
chéo, để lấy tổng bình phương phần dư, gọi là RSSR
­ Bước 3: Tính toán

­ Bước 4: Nếu F-ratio > F-distribution với n - 1, N - (n - k) bậc tự do,


hoặc giá trị Prob < α (1%, 5%, 10%), bác bỏ giả thuyết H0,
,
,

Phương pháp 2: Chuyển dạng bên trong (within transformation)


­ Tính biến số đã trừ trung bình (demeaned variable) để loại trừ thành
phần αi khỏi mô hình bằng cách

Với
­ Hoặc:
­ Mô hình lúc này có thể được ước lượng bằng phương pháp OLS
Phương pháp 3: Lấy sai phân (differencing)
­ Chuyển FEM sang dạng sai phân, để loại bỏ hằng số
­ Mô hình có dạng: ∆Yit = β∆X'it+ ∆uit
­ Mô hình có thể được ước lượng bằng phương pháp OLS
MÔ HÌNH CÓ TÁC ĐỘNG THỜI GIAN CỐ ĐỊNH
TIME-FIXED EFFECTS MODEL

Khi giá trị trung bình của Yit thay đổi theo thời gian chứ không
thay đổi theo đơn vị chéo, mô hình có dạng:
Yit = λt + β1Xit,1 + β2Xit,2 + ....+ βkXit,k + vit
λt là hằng số thay đổi theo thời gian (time-specific intercept)
phản ánh những biến số có tác động đến Yit, tác động này thay
đổi theo thời gian và không phụ thuộc vào đơn vị chéo.
Ước lượng mô hình: Chuyển mô hình thành dạng LSDV
Yit = β1Xit,1 + β2Xit,2 + ....+ βkXit,k + λ1D1t + λ2D2t + λ3D3t +....+ uit
trong đó D1 là biến giá có giá trị 1 cho giai đoạn thứ nhất (T =
1) và giá trị 0 cho các giai đoạn còn lại,...
MÔ HÌNH TÁC ĐỘNG NGẪU NHIÊN
RANDOM EFFECT MODEL (REM)
Khi các đơn vị chéo được quan sát không đồng nhất và các
biến bị bỏ sót có tác động ngẫu nhiên (random effect) và không
tương quan với biến độc lập, mô hình phản ánh tác động của k
biến giải thích (Xit,k) đến biến phụ thuộc Yit có tính đến đặc
trưng riêng của từng đơn vị chéo có dạng mô hình REM:
Yit = α + β1Xit,1 + β2Xit,2 + ....+ βkXit,k + ωit
­ ωit = εi + υit
­ cov(Xit,k, εi) = 0
Ý nghĩa tham số và sai số
­ α là hệ số chặn chung của tất cả đơn vị chéo
­ Tham số β chung cho tất cả các đơn vị chéo phản ánh tác động
của biến độc lập đến biến phụ thuộc
­ ωit là sai số phức hợp (composite error term or error
components)
­ εi phản ánh tác động đặc trưng của từng đơn vị chéo và được gọi là
thành phần tác động ngẫu nhiên (random effect).
­ υit là hạng nhiễu không tương quan lẫn nhau giữa các đơn vị chéo.
Các giả định khác của REM
­ E(ωit) = 0
­ var(ωit) =
­ cov(ωit, ωis) = với t¹s
­ E(εi, Xit,k) = 0
­ E(Xit,k, υit) = 0 với s = 1, 2, ..., T
Khác nhau giữa FEM và REM
­ FEM cho rằng biến bị bỏ sót nằm trong thành phần của hằng số và
cov(Xit,k, αi) ≠ 0
­ REM xem biết bị bỏ sót nằm trong thành phần của sai số và cov(Xit,k,
εi) = 0
PHƯƠNG PHÁP ƯỚC LƯỢNG REM

REM không thể được ước lượng bằng OLS


REM được ước lượng bằng phương pháp bình phương bé nhất
tổng quát (GLS, Generalised Least Squares) khi biết được cấu
trúc của sai số phức hợp
Cấu trúc của sai số phức hợp thường không được biết, nên
REM thường được ước lượng bằng phương pháp bình phương
bé nhất tổng quát ước tính hoặc khả thi (Estimated or Feasible
Generalised Least Squares-EGLS/FGLS)
LỰA CHỌN GIỮA FEM VÀ REM

REM có giả định cov(εi, Xit,k) = 0 nếu giả định này không tồn tại sẽ
phát sinh vấn đề nội sinh
Kiểm định Hausman
­ H0: cov(εi, Xit,k) = 0
­ H1: cov(εi, Xit,k) ≠ 0
Do không tính được giá trị chính xác của εi nên trong thực hành
thường thay thế bằng giả thuyết:
­ H0: βFEM = βREM
­ H1: βFEM ≠ βREM
­ Nếu giá trị Prob < α (10%, 5%, 1%), giả thuyết H0 bị bác bỏ, và kết luận
REM không phù hợp để ước lượng dữ liệu bảng
THỰC HÀNH:
ƯỚC LƯỢNG MÔ HÌNH CAPM

Mục đích: Ước lượng mô hình CAPM theo Fama và MacBeth


(1973)
Rit - Rfr = λ0 + λmβPi + ui
­ Rit - Rfr là lợi nhuận vượt mức (excess return) của cổ phiếu i tại thời
gian t
­ β (beta) được ước lượng của danh mục đầu tư (P) có cổ phiếu i
Bước 1: Ước
lương mô hình
FEM
Quick/ Estimate
Equation...
­ Tab Specification:
nhập return c beta
Để thấy được hệ số ước lượng của các tác động cố định theo
đơn vị chéo và theo thời gian
Tại cửa sổ Equation: View/ Fixed/Random effect
­ Chọn Cross-section Effects để thấy hệ số ước lượng của tác động
cố định theo đơn vị chéo (đơn vị chéo)
­ Chọn Period Effects để thấy hệ số ước lượng của tác động cố định
theo thời gian
¢ Hệ số chặn của
năm 1996 được tính
bằng:
C + 0.0050
Bước 2: Kiểm định tồn tại sự không đồng nhất giữa các đơn
vị chéo và thời gian (pooling test)
View/ Fixed/Randem Effects Testing/ Redundant Fixed Effects - Likelihood
Ratio
Giả thiết đồng nhất giữa các đơn vị chéo bị bác bỏ ở mức ý nghĩa 1%,
Giả thiết đồng nhất theo thời gian cũng bị bác bỏ ở mức ý nghĩa 1%
Bước 3: Lựa chọn
mô hình FEM hoặc
REM
Để thực hiện lựa chọn
giữa hai mô hình, cần
ước lượng mô hình
REM
Thực hiện kiểm Correlated Random Effects - Hausman Test
Equation: Untitled
định Hausman để Test cross-section random effects
xem xét sự phù hợp
của mô hình REM Test Summary Chi-Sq. Statistic Chi-Sq. d.f. Prob.

View/ Cross-section random 12.633602 1 0.0004


Fixed/Randem
Effects Testing/
Cross-section random effects test comparisons:
Correlated Random
Effects - Hausman Variable Fixed Random Var(Diff.) Prob.
Test
BETA -0.011893 -0.001499 0.000009 0.0004
KIỂM ĐỊNH TỰ TƯƠNG QUAN

Phần dư có thể có hiện tượng tự tương quan nếu dữ liệu bảng


có kích thước T lớn
Phương pháp: hồi qui phần dư với các biến trễ của chính nó
­ Nếu hệ số ước lượng các biến trễ t-s của phần dư có ý nghĩa thống
kê, phần dư có hiện tượng tự tương quan tại bậc trễ s
Ước lượng lại mô hình CAPM bằng FEM
Lưu lại phần dư: genr u = resid
Hồi qui phần dư: u = c u(-1) beta
THỰC HÀNH:
ƯỚC LƯỢNG NHÂN TỐ ẢNH HƯỞNG HIỆU
QUẢ HOẠT ĐỘNG NGÂN HÀNG
Mục đích: Các nhân tố tác động đến hiệu quả hoạt động ngân
hàng
Hiệu quả hoạt động: ROA
Các nhân tố:
­ SIZE: qui mô
­ FA: tài sản cố định
­ NINCOME: thu nhập ngoài lãi
­ INCOME: thu nhập lãi
­ LLR: Dự phòng/tổng nợ
­ EAR: tỷ lệ vốn chủ sở hữu/tài sản
1. Xác định kỳ vọng tác động của các biến độc lập đến biến phụ thuộc (dựa
vào lý thuyết)
2. Viết mô hình ước lượng
3. Nhập data trong file bankdata.xlsx vào Eviews
4. Ước lượng mô hình FEM, REM và lựa chọn mô hình phù hợp
5. Hệ số ước lượng của các biến độc lập có như kỳ vọng hay không?
6. Đặt biến giả để phân nhóm ngân hàng: (i) Có vốn nhà nước; (ii) Không có
vốn nhà nước
7. Ước lượng để trả lời câu hỏi: hiệu quả hoạt động có sự khác nhau giữa
ngân hàng có vốn nhà nước và không có vốn nhà nước hay không?

You might also like