Chuong 1 - 12 - 2019

Bộ môn Kinh tế lượng – Học viện Tài chính
Nội dung
1.1. Phân tích hồi quy
1.2. Số liệu trong phân tích hồi quy
1.3. Hồi quy tổng thể
1.4. Sai số ngẫu nhiên
1.5. Hồi quy mẫu
1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 2

1.1.1. Bản chất của phân tích hồi quy
Thuật ngữ “regression” - hồi quy do Francis Galton đề cập lần đầu vào năm 1886
trong bài báo nghiên cứu chiều cao của những đứa trẻ có cha mẹ cao và thấp
không bình thường. Khi đó ông sử dụng thuật ngữ “regression to mediocrity” -
quy về trung bình.
▪ Khái niệm: Phân tích hồi quy nghiên cứu mối liên hệ phụ thuộc của một biến,
gọi là biến phụ thuộc (dependent variable) vào một hay nhiều biến khác, gọi là
biến độc lập (independent variable), trong đó ước lượng giá trị trung bình (kỳ
vọng) của biến phụ thuộc theo các giá trị xác định của biến độc lập.

▪ Có nhiều cách gọi tên biến
 Biến phụ thuộc: Biến được giải thích, biến được dự báo, biến được hồi quy,
biến phản ứng, biến nội sinh.
 Biến độc lập: Biến giải thích, biến dự báo, biến hồi quy, biến tác nhân, biến
kiểm soát, biến ngoại sinh.

▪ Ví dụ: Giả sử dự đoán mức tiêu dùng trung bình hàng tuần của hộ gia đình
trong một khu dân cư khi biết thu nhập khả dụng (Nguồn: Gujarati, trang 38)
▪ Các biến nghiên cứu:

 Biến phụ thuộc Y: Chi tiêu hàng tuần của hộ gia đình (đơn vị: USD).
 Biến độc lập X: Thu nhập khả dụng hàng tuần của hộ gia đình (đơn vị:
USD).
 Mẫu nghiên cứu: Số liệu chi tiêu và thu nhập của 60 hộ gia đình. Kết quả
được phân nhóm tương đối và sắp xếp theo thu nhập tăng dần.

Bảng 1.1: Số liệu thu thập theo tuần được sắp tăng dần theo thu nhập
Thu nhập
X 80 100 120 140 160 180 200 220 240 260

Tiêu dùng 55 65 79 80 102 110 120 135 137 150
của các hộ 60 70 84 93 107 115 136 137 145 152

65 74 90 95 110 120 140 140 155 175
gia đình Y
70 80 94 103 116 130 144 152 165 178
($)
75 85 98 108 118 135 145 157 175 180
88 113 125 140 160 189 185
115 162 191
Tổng 325 462 445 707 678 750 685 1043 966 1211
E(Y/Xi) 65 77 89 101 113 125 137 149 161 173

Bảng 1.2: Xác suất có điều kiện của tiêu dùng theo các mức thu nhập
P(Y/Xi)
80 100 120 140 160 180 200 220 240 260
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/6 1/7 1/6 1/6 1/7 1/6 1/7
1/7 1/7 1/7
E(Y/Xi) 65 77 89 101 113 125 137 149 161 173

Điểm trung bình có điều kiện
Tiêu dùng theo tuần ($)

Mật độ phân phối xác suất của tiêu
dùng ứng với mức thu nhập 220 $
Thu nhập theo tuần ($)
Hình 1.1: Hàm mật độ xác suất của Y với từng giá trị thu nhập X

▪ Kết quả nghiên cứu:
 Như vậy ứng với mức thu nhập hàng tuần xác định tiêu dùng của hộ gia
đình sẽ là một khoảng, dao động quanh giá trị trung bình.
 Khi thu nhập hàng tuần tăng thì tiêu dùng của gia đình cũng tăng nhưng
mức tăng của tiêu dùng luôn nhỏ hơn thu nhập (hệ số góc lớn hơn 0, nhỏ
hơn 1). Điều này phù hợp với lý thuyết kinh tế.

▪ Một số mối quan hệ kinh tế khác
 Lượng cầu của người tiêu dùng về một hàng hóa (ký hiệu Y) phụ thuộc vào
giá của hàng hóa đó (X).
 Tỷ lệ thay đổi của tiền lương (Y) phụ thuộc vào tỷ lệ thất nghiệp (X).
 Tỷ lệ tiền mặt nắm giữ trong tổng thu nhập (Y) phụ thuộc vào tỷ lệ lạm phát
(X).
 Mức cầu về một mặt hàng (Y) phụ thuộc mức chi cho quảng cáo (X).
 Sản lượng của một loại nông sản (Y) phụ thuộc lượng phân bón, lượng mưa,
nhiệt độ, v.v…
1.1.2. Mục đích của phân tích hồi quy
 Ước lượng giá trị trung bình của biến phụ thuộc khi biết giá trị xác định của
biến độc lập.
 Kiểm định các giả thuyết về bản chất của mối quan hệ giữa biến phụ thuộc
và biến độc lập mà lý thuyết kinh tế đưa ra.
 Dự báo giá trị trung bình và giá trị cá biệt của biến phụ thuộc ứng với giá trị
dự đoán của các biến độc lập phù hợp với mẫu.

1.1.3. Phân tích hồi quy và các mối quan hệ khác
 Phân tích hồi quy và quan hệ hàm số (functional relationship)
 Phân tích hồi quy và phân tích tương quan (correlation analysis)
 Phân tích hồi quy và quan hệ nhân quả (causation relationship)

▪ Các loại số liệu:
 Số liệu chuỗi thời gian (Time series data): Là số liệu thu thập về một đối
tượng tại nhiều thời điểm.
 Số liệu chéo (Undate - Cross section data): Là số liệu thu thập về nhiều đối
tượng tại một thời điểm.
 Số liệu kết hợp: Kết hợp hai loại số liệu trên, là số liệu thu thập về nhiều đối
tượng tại nhiều thời điểm. Số liệu bảng (Panel data) là dạng đặc biệt của số
liệu kết hợp.

Bảng 1.2. Tốc độ tăng trưởng GDP của Việt Nam qua các năm
Năm GDP (%)
1995 9.5
1996 9.3
1997 8.2
1998 5.8
1999 4.8
2000 6.8
2001 6.9
2002 7.1
2003 7.3
2004 7.8
2005 8.4
2006 8.2
2007 8.48
2008 6.18
2009 5.32
2010 6.78
2011 5.89
2012 5.25
2013 5.42
2014 5.98
2015 6.68
2016 6.21
2017 6.81
Nguồn Tổng cục Thống kê

Bảng 1.3. Chỉ số giá tiêu dùng của các mặt hàng của Việt Nam
Chỉ tiêu Tháng 1/2019

Chỉ số giá tiêu dùng 0.1
Hàng ăn và dịch vụ ăn uống 0.66
Lương thực 0.52
Thực phẩm 0.85
Ăn uống ngoài gia đình 0.28
Đồ uống và thuốc lá 0.69
May mặc, giày dép mũ nón 0.39
Nhà ở và vật liệu xây dựng 0.35
Thiết bị và đồ dùng gia đình 0.16
Thuốc và dịch vụ y tế 0.01
Giao thông -3.04
Bưu chính viễn thông -0.09
Giáo dục 0.15
Văn hóa, giải trí và du lịch 0.33
Đồ dùng và dịch vụ khác 0.34
Đơn vị tính: %- Nguồn Tổng cục Thống kê

Bảng 1.4. Dữ liệu về 29 doanh nghiệp xây dựng niêm yết trên sàn chứng khoán VN
Đơn vị tính: % - Nguồn: Tổng hợp từ BC của các doanh nghiệp

▪ Nguồn gốc của số liệu
 Số liệu từ các nguồn được phát hành như: Niên giám thống kê, tạp
chí,…hoặc có thể do các cơ quan Nhà nước, các tổ chức quốc tế, các công ty
tư nhân thu thập.
 Số liệu từ các cuộc điều tra thực tế hoặc đi mua.

▪ Bản chất chung của số liệu kinh tế - xã hội
 Phần lớn là các số liệu phi thực nghiệm nên mức độ tin cậy không cao.
 Đối với kinh tế học nói riêng và khoa học xã hội nói chung rất khó bố trí thí
nghiệm có kiểm soát.
✓ Kết quả các nghiên cứu không chỉ phụ thuộc vào mô hình được lựa chọn mà
còn phụ thuộc rất nhiều vào chất lượng của số liệu.

▪ Hạn chế của số liệu
 Hầu hết số liệu trong kinh tế là số liệu phi thực nghiệm nên độ tin cậy
không cao.
 Các cuộc điều tra bằng bảng hỏi khó nhận được câu trả lời chính xác hoặc
các câu hỏi không được trả lời hết.
 Các mẫu thu thập trong các cuộc điều tra khác nhau thường khác nhau về
kích thước nên khó khăn trong việc so sánh hoặc kết hợp kết quả giữa các
đợt điều tra.
 Các số liệu kinh tế thường đã được tổng hợp, không cho phép đi sâu vào
phân tích các đơn vị nhỏ.
 Có những số liệu thuộc bí mật quốc gia nên không tiếp cận và thu thập
được.
1.1.3. Hàm hồi quy tổng thể
 Tổng thể (Population) là toàn bộ tập hợp các phần tử đồng nhất theo một
dấu hiệu nghiên cứu định tính hoặc định lượng nào đó.
 Giả sử một tổng thể nghiên cứu gồm N phần tử với hai dấu hiệu nghiên cứu
X, Y tạo thành một biến ngẫu nhiên hai chiều (X, Y), có bảng phân phối xác
suất đồng thời như sau:

Bảng 1.5. Phân phối xác suất đồng thời của X và Y.
X1 X2 … Xk
Y1 P(Y1,X1) P(Y1,X2) … P(Y1,Xk)
Y2 P(Y2,X1) P(Y2,X2) … P(Y2,Xk)
… … …
Yh P(Yh,X1) P(Yh,X2) … P(Yh,Xk)
h k
 P(Y , X ) = 1;
j =1 i =1
j i P(Y j , X i )  0 j = 1, h; i = 1, k ;

▪ Bảng phân phối xác suất có điều kiện của Y theo Xi ( i = 1, k )
(Y / X i ) Y1 Y2 … Yh
P(Y / X i ) P(Y1 / X i ) P(Y2 / X i ) … P(Yh / X i )
▪ Kỳ vọng toán của Y với điều kiện của Xi:

h
E (Y / X i ) =  Y j . P(Y j / X i )
j =1
X = X i  ! E (Y /X i )  E (Y / X i ) = f ( X i ) (i = 1, k )
E(Y/X) là hàm số biểu diễn sự phụ thuộc của giá trị trung bình của Y theo X,
gọi là hàm hồi quy tổng thể (Population Regression Function - PRF).

▪ Ví dụ 1: X
2 3 P(Y)
1 0.1 0.4 0.6

Y
2 0.3 0.1 0.4
P(X) 0.5 0.5 1.0
Y│X1 Y1 Y2 Y│X2 Y1 Y2
P P(Y1│X1) = 2/5 P(Y2│X1) = 3/5 P P(Y1│X2) = 4/5 P(Y2│X2) = 1/5
2 3 8
E (Y | X 1 ) = Y1.P(Y1 | X 1 ) + Y2 .P(Y2 | X 1 ) = 1. + 2. =
5 5 5
4 1 6
E (Y | X 2 ) = Y1.P(Y1 | X 2 ) + Y2 .P(Y2 | X 2 ) = 1. + 2. =
5 5 5
 Nếu hàm hồi quy tổng thể có một biến độc lập thì gọi là hàm hồi quy đơn -
Simple regression: E(Y/Xi) = f(Xi)
 Nếu hàm hồi quy tổng thể có nhiều hơn một biến độc lập thì gọi là hàm hồi
quy bội - Multiple regression: E(Y/X1i, X2i,…) = f(X1i, X2i, …)
 Giả sử hàm hồi quy có dạng tuyến tính: E (Y / X ) =  +  X

i 1 2 i
trong đó: 1 = E (Y / X i = 0) là hệ số chặn (intercept coefficient)

dE (Y / X )
2 = là hệ số góc (slope coefficient)
dX

1.3.2. Mô hình hồi quy tổng thể
 Nếu hàm hồi quy tổng thể là tuyến tính thì mô hình hồi quy tổng thể tương
ứng có dạng tuyến tính (Population Regression Model - PRM).
PRM: Yi = 1 +  2 X i + U i (i = 1  N )
 Mô hình hồi quy tuyến tính được hiểu là mô hình có dạng tuyến tính đối
với các tham số, nên mô hình có thể là tuyến tính hoặc phi tuyến đối với các
biến số. Ví dụ một số dạng mô hình hồi quy tuyến tính:
Yi = 1 +  2 X i2 + U i ; Yi = 1 +  2 X i−1 + U i ; Ln(Yi ) = 1 +  2 X i + U i ;
Yi = 1 +  2 Ln( X i ) + U i ; Ln(Yi ) = 1 +  2 Ln( X i ) + U i ;...
Bảng 1.7. Mô tả hàm hồi quy tổng thể trên đồ thị
Ui

1.4.1. Bản chất của sai số ngẫu nhiên (SSNN)
U i = Yi – E (Y / X i )
E (U / X i ) = 0
▪ SSNN đại diện cho những yếu tố không biết, không có số liệu hay các nhân
tố ngoài biến độc lập có tác động đến biến phụ thuộc nhưng có trung bình
ảnh hưởng đến biến phụ thuộc bằng 0.
▪ Sự tồn tại của SSNN là tất yếu khách quan và có vai trò đặc biệt quan trọng
trong mô hình kinh tế lượng, SSNN cần phải thoả mãn những điều kiện
nhất định thì kết quả phân tích hồi quy mới có ý nghĩa.

1.4.2. Nguyên nhân tồn tại của sai số ngẫu nhiên (SSNN)
▪ Sự mập mờ về lý thuyết kinh tế
▪ Tầm quan trọng khác nhau giữa các biến giải thích
▪ Sự kém tin cậy của số liệu thống kê
▪ Khả năng chỉ định sai dạng hàm
▪ Sự tình cờ trong hành vi của con người đôi lúc mang tính ngẫu nhiên không
tuân theo quy luật thường lệ....

1.5.1. Hàm hồi quy mẫu
 Từ tổng thể lập một mẫu ngẫu nhiên kích thước n:
W= {(Xi ,Yi) ; i =1÷n}
 Hàm hồi quy được xây dựng dựa trên mẫu ngẫu nhiên được gọi là hàm hồi
quy mẫu - SRF (Sample Regression Function). Dạng hàm hồi quy mẫu
tương tự như hàm hồi quy tổng thể và là một ước lượng của hàm hồi quy
tổng thể.

 Giả sử PRF có dạng: E (Y / X i ) = 1 +  2 X i thì SRF có dạng: Yˆi = ˆ1 + ˆ2 X i
trong đó:
ˆ1 , ˆ2 : là các hệ số hồi quy mẫu

Yˆ : (Fitted value) là ước điểm của E(Y/Xi).
i
 Khi mẫu chưa được chọn cụ thể thì các ước lượng ˆ1 , ˆ2 là biến ngẫu nhiên.
Chúng có quy luật phân phối xác suất và có tương quan với nhau.
 Khi mẫu được chọn cụ thể thì ˆ1 , ˆ2 là các con số và là các ước lượng điểm
của tham số 1, 2 tương ứng.

1.5.2. Mô hình hồi quy mẫu (Sample Regression Model - SRM):
SRM: Yi = ˆ1 + ˆ2 X i + ei (i = 1  n);
trong đó: e = Y − Yˆ gọi là phần dư (Residual).
i i i
 Phần dư ei là sai số ngẫu nhiên của mẫu, là ước lượng điểm của các sai số
ngẫu nhiên U i trong tổng thể.
 Bản chất cũng như nguyên nhân tồn tại của ei được giải thích giống như sự
tồn tại của sai số ngẫu nhiên U i .

Phân biệt tổng thể và mẫu
Tổng thể Mẫu

(Population) (Sample)
PRF : E (Y / X i ) = 1 +  2 X i SRF : Yˆi = ˆ1 + ˆ2 X i

PRM : Yi = 1 +  2 X i + U i SRM : Yi = ˆ1 + ˆ2 X i + ei
(i = 1  N ) (i = 1  n)
Sai số ngẫu nhiên Ui Phần dư ei

Các thuật ngữ cơ bản
Tiếng Anh Tiếng Việt
Regression analysis Phân tích hồi quy
Dependent variable Biến phụ thuộc
Explanatory variable/ Independent variable Biến giải thích/ biến độc lập
Time series data Số liệu theo thời gian
Cross section data Số liệu chéo
Pooled data Số liệu kết hợp
Panel data Số liệu bảng
Population Tổng thể
PRF – Population Regression Function Hàm hồi quy tổng thể
PRM - Population Regression Model Mô hình hồi quy tổng thể

Các thuật ngữ cơ bản
Tiếng Anh Tiếng Việt
Simple regression Hồi quy đơn
Multiple regression Hồi quy bội
Intercept coefficient Hệ số chặn hoặc hệ số tự do
Slope coefficient Hệ số góc
Random error Sai số ngẫu nhiên
SRF – Sample Regression Function Hàm hồi quy mẫu
SRM – Sample Regression Model Mô hình hồi quy mẫu
Estimated regression coefficient Các hệ số hồi quy ước lượng
Residual Phần dư

Chuong 1 - 12 - 2019

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Chuong 1 - 12 - 2019

Uploaded by

Copyright:

Available Formats

Bộ môn Kinh tế lượng – Học viện Tài chính

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 2

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 3

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 4

▪ Các biến nghiên cứu:

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 5

X 80 100 120 140 160 180 200 220 240 260

của các hộ 60 70 84 93 107 115 136 137 145 152

E(Y/Xi) 65 77 89 101 113 125 137 149 161 173

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 6

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 7

Điểm trung bình có điều kiện

Tiêu dùng theo tuần ($)

Thu nhập theo tuần ($)

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 8

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 9

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 11

 Phân tích hồi quy và quan hệ nhân quả (causation relationship)

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 12

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 13

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 14

Chỉ tiêu Tháng 1/2019

Đơn vị tính: %- Nguồn Tổng cục Thống kê

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 15

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 16

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 17

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 18

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 20

Y1 P(Y1,X1) P(Y1,X2) … P(Y1,Xk)

Y2 P(Y2,X1) P(Y2,X2) … P(Y2,Xk)

Yh P(Yh,X1) P(Yh,X2) … P(Yh,Xk)

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 21

▪ Kỳ vọng toán của Y với điều kiện của Xi:

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 22

1 0.1 0.4 0.6

P(X) 0.5 0.5 1.0

P P(Y1│X1) = 2/5 P(Y2│X1) = 3/5 P P(Y1│X2) = 4/5 P(Y2│X2) = 1/5

 Giả sử hàm hồi quy có dạng tuyến tính: E (Y / X ) =  +  X

trong đó: 1 = E (Y / X i = 0) là hệ số chặn (intercept coefficient)

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 24

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 26

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 27

▪ Sự kém tin cậy của số liệu thống kê

▪ Khả năng chỉ định sai dạng hàm

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 28

W= {(Xi ,Yi) ; i =1÷n}

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 29

ˆ1 , ˆ2 : là các hệ số hồi quy mẫu

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 30

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 31

Tổng thể Mẫu

PRF : E (Y / X i ) = 1 +  2 X i SRF : Yˆi = ˆ1 + ˆ2 X i

Sai số ngẫu nhiên Ui Phần dư ei

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 32

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 33

1/3/2021 Bộ môn Kinh tế lượng – Học viện Tài chính 34

You might also like