Professional Documents
Culture Documents
Nội dung
1.1. Phân tích hồi quy
1.2. Số liệu trong phân tích hồi quy
1.3. Hồi quy tổng thể
1.4. Sai số ngẫu nhiên
1.5. Hồi quy mẫu
Biến độc lập X: Thu nhập khả dụng hàng tuần của hộ gia đình (đơn vị:
USD).
Mẫu nghiên cứu: Số liệu chi tiêu và thu nhập của 60 hộ gia đình. Kết quả
được phân nhóm tương đối và sắp xếp theo thu nhập tăng dần.
Thu nhập
P(Y/Xi)
80 100 120 140 160 180 200 220 240 260
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/6 1/7 1/6 1/6 1/7 1/6 1/7
1/7 1/7 1/7
E(Y/Xi) 65 77 89 101 113 125 137 149 161 173
Hình 1.1: Hàm mật độ xác suất của Y với từng giá trị thu nhập X
Khi thu nhập hàng tuần tăng thì tiêu dùng của gia đình cũng tăng nhưng
mức tăng của tiêu dùng luôn nhỏ hơn thu nhập (hệ số góc lớn hơn 0, nhỏ
hơn 1). Điều này phù hợp với lý thuyết kinh tế.
Kiểm định các giả thuyết về bản chất của mối quan hệ giữa biến phụ thuộc
và biến độc lập mà lý thuyết kinh tế đưa ra.
Dự báo giá trị trung bình và giá trị cá biệt của biến phụ thuộc ứng với giá trị
dự đoán của các biến độc lập phù hợp với mẫu.
Phân tích hồi quy và phân tích tương quan (correlation analysis)
Số liệu chéo (Undate - Cross section data): Là số liệu thu thập về nhiều đối
tượng tại một thời điểm.
Số liệu kết hợp: Kết hợp hai loại số liệu trên, là số liệu thu thập về nhiều đối
tượng tại nhiều thời điểm. Số liệu bảng (Panel data) là dạng đặc biệt của số
liệu kết hợp.
Đơn vị tính: % - Nguồn: Tổng hợp từ BC của các doanh nghiệp
Đối với kinh tế học nói riêng và khoa học xã hội nói chung rất khó bố trí thí
nghiệm có kiểm soát.
✓ Kết quả các nghiên cứu không chỉ phụ thuộc vào mô hình được lựa chọn mà
còn phụ thuộc rất nhiều vào chất lượng của số liệu.
Tổng thể (Population) là toàn bộ tập hợp các phần tử đồng nhất theo một
dấu hiệu nghiên cứu định tính hoặc định lượng nào đó.
Giả sử một tổng thể nghiên cứu gồm N phần tử với hai dấu hiệu nghiên cứu
X, Y tạo thành một biến ngẫu nhiên hai chiều (X, Y), có bảng phân phối xác
suất đồng thời như sau:
X1 X2 … Xk
… … …
h k
P(Y , X ) = 1;
j =1 i =1
j i P(Y j , X i ) 0 j = 1, h; i = 1, k ;
(Y / X i ) Y1 Y2 … Yh
P(Y / X i ) P(Y1 / X i ) P(Y2 / X i ) … P(Yh / X i )
X = X i ! E (Y /X i ) E (Y / X i ) = f ( X i ) (i = 1, k )
E(Y/X) là hàm số biểu diễn sự phụ thuộc của giá trị trung bình của Y theo X,
gọi là hàm hồi quy tổng thể (Population Regression Function - PRF).
2 3 P(Y)
Y│X1 Y1 Y2 Y│X2 Y1 Y2
2 3 8
E (Y | X 1 ) = Y1.P(Y1 | X 1 ) + Y2 .P(Y2 | X 1 ) = 1. + 2. =
5 5 5
4 1 6
E (Y | X 2 ) = Y1.P(Y1 | X 2 ) + Y2 .P(Y2 | X 2 ) = 1. + 2. =
5 5 5
1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 23
1.3. Hồi quy tổng thể
Nếu hàm hồi quy tổng thể có một biến độc lập thì gọi là hàm hồi quy đơn -
Simple regression: E(Y/Xi) = f(Xi)
Nếu hàm hồi quy tổng thể có nhiều hơn một biến độc lập thì gọi là hàm hồi
quy bội - Multiple regression: E(Y/X1i, X2i,…) = f(X1i, X2i, …)
PRM: Yi = 1 + 2 X i + U i (i = 1 N )
Mô hình hồi quy tuyến tính được hiểu là mô hình có dạng tuyến tính đối
với các tham số, nên mô hình có thể là tuyến tính hoặc phi tuyến đối với các
biến số. Ví dụ một số dạng mô hình hồi quy tuyến tính:
Yi = 1 + 2 X i2 + U i ; Yi = 1 + 2 X i−1 + U i ; Ln(Yi ) = 1 + 2 X i + U i ;
Yi = 1 + 2 Ln( X i ) + U i ; Ln(Yi ) = 1 + 2 Ln( X i ) + U i ;...
1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 25
1.3. Hồi quy tổng thể
Bảng 1.7. Mô tả hàm hồi quy tổng thể trên đồ thị
Ui
▪ Tầm quan trọng khác nhau giữa các biến giải thích
▪ Sự tình cờ trong hành vi của con người đôi lúc mang tính ngẫu nhiên không
tuân theo quy luật thường lệ....
Hàm hồi quy được xây dựng dựa trên mẫu ngẫu nhiên được gọi là hàm hồi
quy mẫu - SRF (Sample Regression Function). Dạng hàm hồi quy mẫu
tương tự như hàm hồi quy tổng thể và là một ước lượng của hàm hồi quy
tổng thể.
trong đó:
Khi mẫu chưa được chọn cụ thể thì các ước lượng ˆ1 , ˆ2 là biến ngẫu nhiên.
Chúng có quy luật phân phối xác suất và có tương quan với nhau.
Khi mẫu được chọn cụ thể thì ˆ1 , ˆ2 là các con số và là các ước lượng điểm
của tham số 1, 2 tương ứng.
Phần dư ei là sai số ngẫu nhiên của mẫu, là ước lượng điểm của các sai số
ngẫu nhiên U i trong tổng thể.
Bản chất cũng như nguyên nhân tồn tại của ei được giải thích giống như sự
tồn tại của sai số ngẫu nhiên U i .