Chương 3. Các Mô Hình Hồi Quy

CHƯƠNG 3: MÔ HÌNH HỒI QUY
1
Phần 1. Mô hình hồi quy 2 biến
1.1. Phân tích hồi quy
(Regression analysis)
a. Bản chất của phân tích hồi quy

• Là phân tích mối liên hệ phụ thuộc giữa một biến gọi
là biến phụ thuộc (dependent variable) vào một hoặc
một số biến khác gọi là biến giải thích (explanatory
variable)
Biến phụ thuộc, ký hiệu là Y
Biến giải thích, ký hiệu là X hoặc X1 , X2, …
2
Thí dụ: “Luật Francis Galton - Karl Pearson”
• Vấn đề: nghiên cứu mối liên hệ phụ thuộc

giữa chiều cao của các cháu trai vào chiều
cao của các ông bố.
Y = chiều cao của các cháu trai (inches)
X = chiều cao của các ông bố (inches)
• Đồ thị (tham khảo giáo trình trang 10). Đồ
thị này được vẽ với một tổng thể giả định.
3
• Kết quả nghiên cứu của F.Galton – K.Pearson :
- Với chiều cao đã biết của người bố thì chiều cao của
các cháu trai sẽ là một khoảng, dao động quanh giá trị
trung bình;
- Chiều cao của người bố tăng thì chiều cao của các
cháu trai cũng tăng (hệ số góc lớn hơn 0);
- Với nhóm các ông bố có chiều cao nhỏ (thấp) thì
chiều cao trung bình của các cháu trai cao hơn bố.
Ngược lại, với nhóm các ông bố có chiều cao lớn
(cao) thì chiều cao trung bình của các cháu trai thấp
hơn bố (hệ số góc nhỏ hơn 1).
4
Các thí dụ khác
• Chi cho tiêu dùng cá nhân – thu nhập khả dụng

• Lượng cầu (Y) – giá (X)
• Tỷ lệ thay đổi của tiền lương (Y) – tỷ lệ thất
nghiệp (X)
• Tỷ lệ tiền mặt(Y) nắm giữ trong tổng thu nhập –
tỷ lệ lạm phát (X)
• Lượng cầu (Y)– mức chi cho quảng cáo (X)
• Sản lượng của một loại nông sản – lượng phân
bón, lượng mưa, nhiệt độ, v.v…
5
Mục đích của phân tích hồi qui
• Ước lượng giá trị trung bình của biến phụ thuộc khi biết
giá trị của biến độc lập, tức là phải ước lượng các tham
số của mô hình. ( pp bình phương bé nhất)
• Kiểm định các giả thuyết về bản chất của mối quan hệ
giữa biến phụ thuộc và biến độc lập mà lý thuyết kinh tế
đưa ra. Trong trường hợp này phải trả lời hai câu hỏi:
- Có tồn tại quan hệ giữa biến phụ thuộc và biến độc lập
hay không?
- Nếu tồn tại quan hệ thì mức độ chặt chẽ như thế nào?
• Dự báo giá trị trung bình của biến phụ thuộc khi biết giá
trị của biến độc lập.
6
b. Phân tích hồi quy và các quan hệ khác
Phân tích hồi quy nghiên cứu quan hệ thống kê

(statistical relationship)
Ta phân biệt với các quan hệ sau:
• Phân tích hồi quy và quan hệ hàm số (functional
relationship)
• Phân tích hồi quy và phân tích tương quan
(correlation analysis)
• Phân tích hồi quy và quan hệ nhân quả (causation
relationship)
7
• Phân tích hồi quy và quan hệ hàm số
- Trong quan hệ hàm số:

+ Ứng với mỗi giá trị của biến độc lập cho duy nhất
một giá trị của biến phụ thuộc.
+ Các biến không phải là các biến ngẫu nhiên.
- Trong phân tích hồi quy

+ Ứng với mỗi giá trị cho trước của biến độc lập có
thể có nhiều giá trị khác nhau của biến phụ thuộc.
+ Các biến là các biến ngẫu nhiên.
8
• Phân tích hồi quy và phân tích tương quan
- Phân tích tương quan

+ Đo mức độ kết hợp tuyến tính giữa hai biến
bằng hệ số tương quan.
+ Các biến có tính chất đối xứng.
- Trong phân tích hồi quy

+ Ước lượng và dự báo một biến trên cơ sở giá trị
đã cho của các biến khác.
+ Các biến không có tính chất đối xứng.
9
• Phân tích hồi quy và quan hệ nhân quả
- Quan hệ nhân quả là hệ hai chiều giữa hai đối

tượng trong đó vai trò của các đối tượng được xác
định rõ đâu là nguyên nhân và đâu là kết quả.
- Trong phân tích hồi quy biến giải thích không

nhất thiết là nguyên nhân gây lên biến phụ thuộc,
mối quan hệ giữa các biến được xác lập tuỳ thuộc
vào mục đích nghiên cứu.
10
1.2. Bản chất nguồn số liệu cho phân tích
hồi quy
a. Các loại số liệu

• Số liệu theo thời gian (Time series data)
Ví dụ: CPI, GDP,…
• Số liệu chéo (Undate – Cross section data)
Ví dụ: Doanh thu, lợi nhuận (của các DN)
• Số liệu kết hợp (Pooled data)
• Số liệu bảng (Panel data)
11
b. Nguồn gốc các số liệu
• Số liệu từ các nguồn được phát hành như:

Niên giám thống kê, tạp chí,…
• Số liệu từ các cuộc điều tra thực tế hoặc đi

mua.
12
c. Bản chất chung của số liệu KT – XH
• Phần lớn là các số liệu phi thực nghiệm,

mang tính ngẫu nhiên, kém tin cậy.
• Có sẵn để thu thập, tính toán phù hợp với
mục đích nghiên cứu.
Ghi nhớ: Kết quả của nghiên cứu sẽ
không chỉ phụ thuộc vào mô hình được
lựa chọn mà còn phụ thuộc rất nhiều vào
chất lượng của số liệu.
13
1.3. Mô hình hồi qui tổng thể
• Tổng thể (Population) là toàn bộ tập hợp các
phần tử đồng nhất theo một dấu hiệu nghiên
cứu định tính hoặc định lượng nào đó .
• Giả sử có một tổng thể nghiên cứu gồm N
phần tử với hai dấu hiệu nghiên cứu X, Y tạo
thành một biến ngẫu nhiên hai chiều (X, Y).
• Để nghiên cứu BNN (X, Y) ta lập các bảng
phân phối xác suất.
14
• Bảng phân phối xác suất đồng thời của X và Y
X1 X2 … Xk
Y1 P(Y1, X1) P(Y1, X2) … P(Y1, Xk)
Y2 P(Y2, X1) P(Y2, X2) …. P(Y2, Xk)
… … … … …
Yh P(Yh, X1) P(Yh, X2) … P(Yh, Xk)
h k
 P(Y , X )  1
j 1 i 1
j i
15
• Kỳ vọng toán của Y với điều kiện của Xi:
h
E (Y / X i )   Y j P (Y j / X i )  E (Y / X i )  f ( X i )(i  1  k )
j 1
X = X i  (Y/X i )  ! E(Y/X i )
• E(Y/Xi) là một hàm số và gọi là hàm hồi quy tổng

thể của Y đối với Xi (Population Regression
Function – PRF). Nó cho biết giá trị trung bình của
Y thay đổi như thế nào theo Xi.
16
• Nếu hàm hồi quy tổng thể có một biến độc
lập X thì gọi là hàm hồi quy đơn
• Nếu hàm hồi quy tổng thể có hơn một biến
độc lập X thì gọi là hàm hồi quy bộI
17
• Giả sử PRF có dạng tuyến tính:
E (Y / X i )  1   2 X i (i  1  k )
hoặc E (Y / X )  1   2 X
• Hàm này gọi là hàm hồi quy tuyến tính đơn
• Trong đó:
1  E (Y / X i  0) gọi là hệ số chặn (intercept
coefficient)
dE (Y / X )
2 
dX gọi là hệ số góc (slope coefficient)
18
• Tại một giá trị cá biệt của Yi ta có:
Yi  1   2 X i  U i (i  1  N )
gọi là mô hình hồi quy tổng thể (Population Regression
Model – PRM)
• Thuật ngữ “tuyến tính” được hiểu theo hai nghĩa
+ Tuyến tính đối với các tham số ( 1 ,  2 )
+ Tuyến tính đối với các biến số (X, Y)
• Khi nói đến “hàm hồi quy tuyến tính” tức là hàm hồi
quy tuyến tính đối với các tham số, nó có thể là tuyến
tính hoặc phi tuyến đối với các biến số.
E(Y/X) = 1 + 2X2
E(Y/X) = 1 + 2lnX
E(Y/X) = 1X2
19
1.4. Sai số ngẫu nhiên và bản chất của nó
• Đặt Ui = Yi – E(Y/Xi) gọi là sai số ngẫu nhiên (random

errors)
• Sai số ngẫu nhiên đại diện cho tất cả những yếu tố không
phải biến độc lập nhưng cũng tác động đến biến phụ thuộc.
• Sự tồn tại của SSNN là tất yếu khách quan => QUAN
TRỌNG
20
1.5. Hàm hồi qui mẫu
• Khái niệm:
• Mẫu ngẫu nhiên là một bộ phận mang thông tin của
tổng thể được lấy ra từ tổng thể theo những nguyên
tắc nhất định.
• Giả sử từ tổng thể N lập một mẫu ngẫu nhiên (mẫu cụ
thể) kích thước n: W = {(Xi ,Yi) ; i =1÷n}
21
Nếu hàm PRF có dạng: E(Y/Xi) = 1 + 2Xi
hàm SRF có dạng: Yî  ˆ1  ˆ2 X i
Trong đó:
ˆ1 , ˆ2 (Estimated regression coefficients) là các ước
lượng điểm của 1 ,  2 .
Yˆ (Fitted value) là ước lượng điểm của E(Y/Xi).
i
22
• Mẫu ngẫu nhiên  βˆ1 , βˆ2 là ngẫu nhiên
 Ước lượng ngẫu nhiên (estimates) của
tham số 1,2
• Với mẫu cụ thể, βˆ1 , là

βˆ2con số cụ thể
 Ước lượng cụ thể (estimators) của tham
số 1,2
23
• Tại một giá trị cá biệt của Y ta có
Yi  ˆ1  ˆ2 X i  ei (i  1  n)
gọi là mô hình hồi quy mẫu (Sample Regression
Model – SRM)
• Đặt e  Y gọi
Yˆ là phần dư (Residual)
i i i
• Phần dư ei là sai số ngẫu nhiên của mẫu, thực
chất chúng là các ước lượng điểm của các sai số
ngẫu nhiên Ui trong tổng thể.
• Bản chất của ei giống như các sai số ngẫu nhiên
Ui
24
Tổng thể Mẫu
(Population) (Sample)
PRF : E (Y / X i )  1   2 X i SRF : Yî  ˆ1  ˆ2 X i
PRM : Yi  1   2 X i  U i SRM : Yi  ˆ1  ˆ2 X i  ei

(i  1  N ) (i  1  n)
Sai số ngẫu nhiên Ui Phần dư ei
25
Các thuật ngữ cơ bản
Tiếng Anh Tiếng Việt
Regression analysis Phân tích hồi quy
Dependent variable Biến phụ thuộc
Explanatory variable/ Independent variable Biến giải thích/ biến độc lập
Time series data Số liệu theo thời gian
Cross section data Số liệu chéo
Pooled data Số liệu kết hợp
Panel data Số liệu bảng
Population Tổng thể
PRF – Population Regression Function Hàm hồi quy tổng thể
PRM - Population Regression Model Mô hình hồi quy tổng thể
26
Các thuật ngữ cơ bản
Tiếng Anh Tiếng Việt

Simple regression Hồi quy đơn
Multiple regression Hồi quy bội
Intercept coefficient Hệ số chặn hoặc hệ số tự do
Slope coefficient Hệ số góc
Random error Sai số ngẫu nhiên
SRF – Sample Regression Function Hàm hồi quy mẫu
SRM - Sample Regression Model Mô hình hồi quy mẫu
Estimated regression coefficients Các hệ số hồi quy ước lượng được
Residual Phần dư
27
2.1. Phương pháp bình phương nhỏ nhất - OLS
a. Nội dung của phương pháp OLS

• Nội dung của phương pháp OLS là tìm các
ước lượng điểm βˆ1 , βˆ2 sao cho tổng bình
phương các phần dư là nhỏ nhất. Tức là sao
cho Yî càng gần với giá trị thực của Y i có
thể được.
• Tìm βˆ1 , βˆ2 sao cho:
 
n n 2
 e   i i
Y2
 Yˆ  min
i
i 1 i 1
28
• Ta có
ei  Yi  Yî  Yi  ˆ1  ˆ2 X i
n n n
  i i  i 1 2 i
e 
i 1
(Y2
i Yˆ ) 
i 1
(Y  ˆ  ˆ X ) 2  f ( ˆ , ˆ )
 2
i 1
1 2
• Ta cần tìm βˆ , βˆ sao cho f ( ˆ1 , ˆ2 )  Min

1 2
• Các hệ số βˆ1 , βˆ2 là nghiệm của hệ phương trình sau
 f ( ˆ1 , ˆ2 )  n
 n n

  ˆ
1
0

 2 
i 1
(Yi  ˆ  ˆ X )  0
1 2 i 

1 2 i
ˆ n  ˆ X  Y

i 1

i 1
i
   n   n (I )
 f ( ˆ1 , ˆ2 )  0 2 X (Y  ˆ  ˆ X )  0  ˆ X  ˆ X 2  Y X
n n
 ˆ   i i 1 2 i
 1 i
 i1
2 i  i i
 2
i 1 i 1 i 1
29
• Ký hiệu
1 n
X   Xi
n i 1
1 n
Y   Yi
n i 1
• Khi đó  ˆ1  Y  ˆ2 X
 n n n

 n. Yi X i   X i  Yi
(I )  
ˆ  i 1 i 1 i 1
(?)
 2 n n
 n X i2  ( X i ) 2

 i 1 i 1
30
• Ký hiệu các sai lệch
xi  X i  X
yi  Yi  Y n
• Giải hệ I Khi đó x i yi
̂ 2  i 1
n
i 1
xi2
ˆ1  Y  ˆ 2 . X
• Các hệ số ˆ , ˆ là các ước lượng của  ,  được tính
1 2 1 2
bằng phương pháp OLS - gọi là các ước lượng OLS
31
b. Các tính chất của các ước lượng OLS
• Đối với ˆ1 , ˆ2

Tính chất 1: với mỗi tệp số liệu mẫu thì ˆ1 , ˆ2 xác
định một và duy nhất .
Tính chất 2: ˆ1 , ˆ2 là các ước lượng của 1 ,  2 và
là các đại lượng ngẫu nhiên, với mỗi mẫu khác
nhau thì chúng có giá trị khác nhau.
32
Ví dụ 1
Cho 10 cặp quan sát về chi tiêu Y(USD/tuần) và

thu nhập X(USD/tuần) trong 1 tuần
a. Bộ số liệu trên thuộc loại số liệu gì?
b. ước lượng của (mô hình: Y = β1+ β2 .Xi +ui )
33
• Ví dụ 2: Cho bộ số liệu như sau:
Xi 7 8 9 10 12 13 15 17 18 23
Yi 52 44 43 44 38 39 34 32 30 29
(ĐVT: $)
– a. Tìm SRF, PRF, PRM, SRM? Giải thích ý nghĩa
các hệ số tìm được?
34
• Các hệ số là các ước lượng điểm của 1 ,  2
ˆ1 , ˆ2
được tìm bằng phương
pháp OLS. Chất lượng của chúng phụ thuộc
vào các yếu tố sau:
- Dạng hàm của mô hình lựa chọn

- Kích thước mẫu
- Biến độc lập Xi và sai số ngẫu nhiên Ui
35
2.2. Các giả thiết cơ bản của phương pháp OLS
• GT 1: Biến độc lập là phi ngẫu nhiên

• GT 2: Kỳ vọng của các sai số ngẫu (SSNN) nhiên bằng 0
E(Ui) = 0  i
• GT 3: Phương sai của các SSNN bằng nhau
Var(Ui) = Var(Uj) = 2  i ≠ j
• GtT 4: Các SSNN không tuơng quan với nhau
Cov(Ui ,Uj) = 0  i ≠ j
• GT 5: Các SSNN và biến độc lập không tương quan với
nhau
Cov(Ui , Xi) = 0  i
36
Định lý Gauss – Markov
Với các giả thiết 1-5 của phương pháp OLS, các
ước lượng OLS là các ước lượng tuyến tính,
không chệch và có phương sai nhỏ nhất trong
lớp các ước lượng tuyến tính không chệch.
βˆ1 , βˆ2 là BLUE của 1 , 2

(Best Linear Unbiased Estimates)
37
2.3. Độ chính xác của các ước lượng OLS
• Đối với ̂1

- Phương sai (Var); Sai số tiêu chuẩn (Se)
 i
X 2
 
var ˆ1     
 2 ; se ˆ1  var ˆ1 ;
n xi2
 2  var(Ui )
38
- Do không xác định được  2 nên nó được thay thế bằng
một ước lượng điểm:
n n
e 2
i i
e 2
ˆ 2  i 1
 ˆ  i 1
(n  2) (n  2)
ˆ gọi là sai số chuẩn của đường hồi quy (Standard Error of Regression)
39
• Đối với ̂ 2
- Phương sai (Var); sai số tiêu chuẩn (Se)
2
var( ˆ2 )  ; se( ˆ2 )  var( ˆ2 )
i
x 2
- Chú ý:
Để đi tìm ước lượng điểm của  2 có thể sử dụng các
công thức sau:
40
• Ký hiệu
n n
TSS   yi2   (Yi  Y ) 2
i 1 i 1
n n n n
ESS   yˆ i2   (Yî  Yˆ ) 2   (Yî  Y )2  ˆ22  xi2
i 1 i 1 i 1 i 1
n n
RSS   ei2   (Yi  Yî ) 2
i 1 i 1
TSS = ESS + RSS => RSS = TSS - ESS
TSS = Total Sum of Squares
ESS = Explained Sum of Squares
RSS = Residual sum of squares
41
• Ví dụ 3: Tìm Var, và Se của các giá trị ước
lượng ở Ví dụ 1(bài 2.9)
42
2.4. Hệ số R2 đo độ phù hợp của SRF
• Ký hiệu
2 ESS RSS
R  1
TSS TSS
gọi là hệ số xác định của mô hình (Determination coeffcient - r-Squares)
• 0 <= R2 <= 1
• Ý nghĩa
R2 đo tỷ lệ % sự biến thiên của Y được giải thích thông
qua hàm hồi quy, tức là được giải thích thông qua biến
độc lập của mô hình. Nó được sử dụng để đặc trưng cho
mức độ thích hợp của hàm hồi quy.
43
• Ký hiệu
2 ESS RSS
R  1
TSS TSS
gọi là hệ số xác định của mô hình (Determination coeffcient - r-Squares)

• 0 <= R2 <= 1
• Ý nghĩa
R2 đo tỷ lệ % sự biến thiên của Y được giải thích thông
qua hàm hồi quy, tức là được giải thích thông qua biến
độc lập của mô hình. Nó được sử dụng để đặc trưng cho
mức độ thích hợp của hàm hồi quy.
44
• Ta có 2
 
  xi yi 
R2   
 2  2
  i   i 
x y
  
- Nếu R2 = 0: Hàm hồi quy hoàn toàn không giải thích sự
biến thiên của Y.=> Hàm ko phù hợp
- Nếu R2 = 1: Hàm hồi quy giải thích 100% sự biến thiên
của Y.
- Nếu R2 = 0,9: Hàm hồi quy giải thích 90% sự biến động
của Y, tức là sự biến động của biến giải thích trong hàm
hồi quy chi phối 90% sự biến động của Y.
45
• Ta có
r R 2
Gọi là hệ số tương quan của biến X và Y

• Ý nghĩa: hệ số tương quan đo mức độ phụ thuộc tuyến tính
giữa biến X và Y.
• Tính chất của hệ số tương quan: 1  r  1
46
VÍ DỤ 4.
TÌM HỆ SỐ R2 CỦA MÔ HÌNH HỒI QUY Ở VÍ DỤ 1(BÀI
2.9)? VÀ GiẢI THÍCH Ý NGHĨA CỦA HỆ SỐ ĐÓ?
47
2.5. Khoảng tin cậy và kiểm định giả thiết về các
hệ số hồi quy
48
Ước lượng khoảng tin cậy đối với  j ( j  1  2)
ˆ j   *j
• Ta có t  ~ T ( n  2) do đó với độ tin cậy (1 - ) ta có
Se( ˆ )j
- Khoảng tin cậy đối xứng

ˆ ˆ ˆ ˆ ( n 2) 
P   j  Se(  j )T   j   j  Se(  j )T   1  
( n  2)
 2 2 
-Với hệ số tin cậy (1 – α), khoảng tin cậy của βj là:
( ˆ j  t( n/22 ) .Se( ˆ j ); ˆ j  t( n/22 ) .Se( ˆ j ))
49
• Chú ý: Để tìm t(n-2)α/2 ta tra bảng ở phần phụ
lục hoặc dùng hàm trong excel. Vd: với số bậc
tự do là n – 2 = 8, α = 5% thì t0,025 =
TINV(0,05,8) = 2,306
50
• Ví dụ 5:
Tìm khoảng tin cậy của các hệ số của mô hình ở
ví dụ 1 biết α =0,05?
51
2.6.Kiểm định giả thiết đối với  j ( j  1  2)
• Kiểm định các cặp giả thiết

 H 0 :  j   *j  H 0 :  j   *j  H 0 :  j   *j
 (1), (2),  (3)
 H1 :  j   j  H1 :  j   j  H1 :  j   j
* * *
ˆ j   *j
• Tiêu chuẩn kiểm định t 
Se( ˆ j )
• Miền bác bỏ giả thiết H0 với mức ý nghĩa  cho trước
của các cặp giả thiết
- Với cặp giả thiết (1) W   t : t  t ( n2)
 /2  
- Với cặp giả thiết (2) W  t : t  t( n  2 )  
- Với cặp giả thiết (3) W  t : t  t ( n  2 )
   
52
• Trường hợp đặc biệt
 H 0 :  j  0  H 0 :  j  0  H 0 :  j  0
 (1),  (2),  (3)
 H1 :  j  0  H1 :  j  0  H1 :  j  0
53
• Ví dụ 6.( từ bài ví dụ 1 bài 2.9)
a. Kiểm định xem mô hình có ý nghĩa thống kê hay không?
b. Có ý kiến cho rằng khi thu nhập tăng lên 1 $ thì chi tiêu
tăng lên 2 $. Đúng hay sai? Tại sao?
c. Có ý kiến cho rằng khi thu nhập tăng lên 1$ thì chi tiêu
tăng nhiều hơn 1$? Đ/S? Tại sao
d. Có ý kiến cho rằng khi thu nhập tăng1 $ thì chi tiêu giảm ít
hơn 1$? Đ/S? Tại sao?
BTVN:
e. Thu nhập tăng 3 $ thì chi tiêu có thể tăng ít hơn 4 $ không?
Kiểm định giả thiết này?
f. Hệ số chặn có ý nghĩa thống kê hay không?
g. Thu nhập giảm thì chi tiêu sẽ giảm ít hơn so với mức giảm
của thu nhập? Kiểm định?
54
a ) kđđg:
H 0 :  2  0

 H1 :  2  0
ˆ2  0 0,955  0
t qs    4,046
Se( ˆ2 ) 0,236
n2
t /2 t 8
0 , 025  2,306
t  2,306
=> Bác bỏ Ho chấp nhận H1

=> Kết luận: Mô hình có ý nghĩa thống kê
55
b) kđđg:
H 0 :  2  2

 H1 :  2  2
ˆ2  2 0,955  2
t qs    4,43
Se( ˆ2 ) 0,236
n2
t
 /2 t 8
0 , 025  2,306
t  2,306
=> Bác bỏ Ho
=> Kết luận:
56
c ) kđđg
H 0 :  2  1

 H1 :  2  1
ˆ2  1 0,955  1
t qs    0,19
Se( ˆ2 ) 0,236
tn  2  t 08, 05  1,86
t  1,86
=> Chưa đủ cơ sở bác bỏ Ho
=> Kết luận: Thu nhập tăng 1$ thì chi tiêu
tăng nhiều hơn 1$ là sai
57
d ) kđđg
H 0 :  2  1

 H1 :  2  1
ˆ2  1 0,955  1
t qs    0,19
Se( ˆ2 ) 0,236
 tn  2  t 08, 05  1,86
t  1,86
=> Chưa đủ cơ sở bác bỏ Ho
=> Kết luận: Thu nhập tăng 1$ thì chi tiêu
giảm ít hơn 1$ là sai
58
CÁC BƯỚC KIỂM ĐỊNH t
• Bước 1: Xác định cặp giả thiết
Bước 2: Tính toán giá trị t quan sát
ˆ j   j
t
Se( ˆ j )
• Bước 3: So sánh t với giá trị tới hạn của t
Trong miền bác bỏ
• Bước 4: Kết luận
59
• Cặp giả thiết cơ bản (kiểm tra mô hình có ý nghĩa
thống kê hay không?)
H 0 :  2  0

 H1 :  2  0
• Nếu bác bỏ H0: hệ số hồi qui 2 có ý nghĩa thống
kê (statistically significal), mô hình có ý nghĩa;
ngược lại thì hệ số 2 gọi là không có ý nghĩa
thống kê, mô hình không có ý nghĩa thống kê.
60
2.7. Kiểm định sự phù hợp của hàm hồi quy
• R2tổng thể = 0 : hàm hồi qui không phù hợp
• Kiểm định cặp giả thiết
 H 0 :  2  0  H 0 : r  0
2
 
 H1 :  2  0  H1 : r  0
2
• Ta có
 
2
F
ˆ2  i
x 2

R 2 (n  2)
ˆ 2
1 R2
W  F : F  F (1, n  2)
61
• Cho F0,05 (k-1,n-k)=5,32
Ví dụ : Kiểm định sự phù hợp của hàm hồi quy ở Ví
dụ 1?
62
Kđ .gt

H 0 : R  0
2


 H1 : R  0
2
F0 , 05 (1,10  2)  5,32
R 2 ( n  2) 0,672.(10  2)
Fqs    16,39
1 R 2
1  0,672
 Fqs  5,32
=> Bác bỏ Ho => Mô hình phù hợp

63
2.8. Phân tích hồi quy và dự báo
• Vấn đề: sử dụng SRF ước lượng được để dự
báo về biến phụ thuộc.
- Dự báo giá trị trung bình của biến phụ

thuộc (biết X = X0 cần dự báo giá trị E(Y/X0)).
- Dự báo giá trị cá biệt của biến phụ thuộc

(biết X = X0 cần dự báo giá trị (Y0 = Y/X0))
64
a. Dự báo giá trị trung bình của biến phụ thuộc
• SRF cho ta một ước lượng điểm của E(Y/X0) trên mẫu
Yˆ0  ˆ1  ˆ2 X 0
• Để dự báo E(Y/X0) cho tổng thể ta ƯL khoảng tin cậy của nó.
ˆ  E (Y / X )
Y    
2
• Ta có T  0 0
~T ( n  2 ) 1
ˆ ) 2  
X  X
Var (Y
0

Se(Yˆ0 ) 0
n  xi 
2
 
1 ( X  X ) 2
Se(Yˆ0 )  ˆ.  0 2
n  xi
• Do đó với độ tin cậy (1-) cho trước
 Yˆ0  E (Y / X 0 ) 
 P  t / 2   t / 2   1  
se (Yˆ)
 0 
(Yˆ  t ( n  2 )
.Se (Y ˆ ); Yˆ  t ( n2) ˆ
• Dự báo giá trị TB: 0  /2 0 0  / 2 .Se(Y0 ))
65
b.Dự báo giá trị cá biệt của biến phụ thuộc
• SRF cho ta một ước lượng điểm của Y0 = (Y/X0) trên mẫu
Yˆ0  ˆ1  ˆ2 X 0
• Để dự báo Y0 của tổng thể ta ƯL khoảng tin cậy của nó.
   
2
• Ta có
ˆ
Y0  Y0 1 X  X
T ~T ( n2) Var (Y )   2
1   0


0 2
 n x 
Se(Yˆ0 )  i

1 ( X 0  X )2
Se(Y0 )   1  
n  i x 2
• Do đó với độ tin cậy (1-) cho trước , GT Cá biệt:
(Yˆ0  t( n/22 ) .Se(Y0 ); Yˆ0  t( n/22 ) .Se(Y0 ))
66
Phần 3. Mô hình hồi quy ba biến
3.1. Mô hình hồi quy ba biến
• Xét mô hình:
PRF : E (Y / X 2i , X 3i )  1   2 X 2i  3 X 3i
PRM :Yi  1   2 X 2i  3 X 3i  U i (i  1  N )
• Trong đó
Yi: là biến phụ thuộc
X2i, X3i : là hai biến độc lập
β1 là hệ số chặn
β2, β3 là các hệ số góc riêng phần (hệ số hồi quy riêng)
67
• Ý nghĩa:
Hệ số β1 = E(Y/X2i = X3i = 0) là giá trị trung bình của Y
khi X2i = X3i = 0.
E (Y / X 2 , X 3 )
2 
X 2
β2 cho biết khi X2 tăng một đơn vị thì trung bình của Y
thay đổi như thế nào trong điều kiện X3 không thay đổi.
E (Y / X 2 , X 3 )
3 
X 3
β3 cho biết khi X3 tăng một đơn vị thì trung bình của Y
thay đổi như thế nào trong điều kiện X 2 không thay đổi.
68
3.2. Các giả thiết của mô hình
• GT6: Các sai số ngẫu nhiên có phân phối chuẩn
~ N (0,  2 )
Ui 
• GT7: Các biến giải thích không có quan hệ tuyến tính
69
3.3. Ước lượng các tham số của mô hình hồi
quy ba biến
• Trong tổng thể
PRF : E (Y / X 2i , X 3i )  1   2 X 2i  3 X 3i
PRM :Yi  1   2 X 2i  3 X 3i  U i (i  1  N )
• Trong mẫu W  (Yi , X 2i , X 3i ) : i  1  n
SRF :Yî  ˆ1  ˆ2 X 2i  ˆ3 X 3i
SRM : Yi  ˆ1  ˆ2 X 2i  ˆ3 X 3i  ei (i  1  n)
ˆ , ˆ , ˆ là các ước lượng điểm của β1,β2,β3
1 2 3
Yî là ước lượng điểm của E(Y/X2i,X3i)

ei là ước lượng điểm của Ui
70
• Phương pháp ước lượng OLS
Tìm ˆ1 , ˆ2 , ˆ3 sao cho:
n n n
RSS   e   (Yi  Yî )   (Yi  ˆ1  ˆ2 X 2i  ˆ3 X 3i ) 2  f ( ˆ1 , ˆ2 , ˆ3 )  Min
2
i
2
i 1 i 1 i 1
• Các hệ số ˆ1 , ˆ2 , ˆ3 là nghiệm của hệ

 f ( ˆ1 , ˆ2 , ˆ3 ) n
  2 (Yi  ˆ1  ˆ2 X 2i  ˆ3 X 3i )  0

 ˆ1 i 1
 f ( ˆ , ˆ , ˆ )
 n

1 2 3
 2 X 2i (Yi  ˆ1  ˆ2 X 2i  ˆ3 X 3i )  0
 ˆ
 2 i 1
 ˆ , ˆ , ˆ )
f (  n
 1 2 3
 2 X 3i (Yi  ˆ1  ˆ2 X 2i  ˆ3 X 3i )  0
 ˆ3 i 1
71
• Ký hiệu
1 n
Y   Yi ; yi  Yi  Y
n i 1
1 n
X 2   X 2i ; x2i  X 2i  X 2
n i 1
1 n
X 3   X 3i ; x3i  X 3i  X 3
n i 1
72
• Ta có
ˆ1  Y  ˆ2 X 2  ˆ3 X 3

n n n n
( x2i yi )( x32i )  ( x3i yi )( x3i x2i )
ˆ2  i 1
n
i 1
n
i 1
n
i 1
( x )( x )  ( x3i x2i ) 2

2
2i
2
3i
i 1 i 1 i 1
n n n n
( x3i yi )( x22i )  ( x2i yi )( x3i x2i )
ˆ3  i 1
n
i 1
n
i 1
n
i 1
( x )( x )  ( x3i x2i )

2
2i
2
3i
2
i 1 i 1 i 1
73
3.4. Phương sai và độ lệch chuẩn của các ước lượng OLS
 n n n

 1 ( X 2  x3i )  ( X 3  x2i )  (2 X 2 X 3  x3i x2i ) 
2 2 2 2
Var ( ˆ1 )   2   i 1
n n
i 1
n
i 1
  Se ( ˆ )  Var ( ˆ )
 1 1
 n 
( x22i )( x32i )  ( x3i x2i ) 2
 i 1 i 1 i 1

n
 3i
x 2
 2
Var ( ˆ2 )  n n
i 1
n
 
2
n
 Se( ˆ2 )  Var ( ˆ2 )
( x22i )( x32i )  ( x3i x2i ) 2  2i 23 )
x 2
(1  r 2
i 1 i 1 i 1 i 1
n
 2i
x 2
2
Var ( ˆ3 )  n n
i 1
n
2  n
 Se( ˆ3 )  Var ( ˆ3 )
( x22i )( x32i )  ( x3i x2i ) 2  3i 23 )
x 2
(1  r 2
i 1 i 1 i 1 i 1 74
• Trong đó
Sai số tiêu chuẩn
n
của đường hồi quy
i
e 2
 
ˆ 2 i 1
n3
r23 là hệ số tương quan của biến X2 ,X3
n
( x2i x3i ) 2
r 
2
23 n
i 1
n
 2 i  3i
x 2
i 1
x 2
i 1
75
• Hệ số xác định bội của mô hình
n n
ˆ2  x2i yi  ˆ3  x3i yi
ESS RSS
R 
2
 1  i 1
n
i 1
TSS TSS
 i
y 2
i 1
n n
ESS  ˆ2  yi x2i ˆ3  yi x3i TSS   yi2 ; RSS   ei2
i 1 i 1
Hệ số xác định bội R2 cho biết tỷ lệ % sự biến

thiên của Y được giải thích thông qua hai biến
độc lập X2 và X3 của mô hình.
76
• Hệ số tương quan:
- Hệ số tương quan bội:
r   /  R 2
đo mức độ tương quan tuyến tính chung giữa Y, X2 và X3
- Hệ số tương quan cặp(Simple correlation coefficent)
n n n
( x2i yi ) 2
( x3i yi ) 2
( x2i x3i ) 2
r122  n
i 1
n
; r132  n
i 1
n
; r232  n
i 1
n

i 1
x y
i 1
2
2i 
2
i
i 1
x y
i 1
2
3i
2
i x
i 1
2
2i  3i
x 2
i 1
+ Hệ số r12 đo mức độ tương quan tuyến tính giữa Y và X2
+ Hệ số r13 đo mức độ tương quan tuyến tính giữa Y và X3
+ Hệ số r23 đo mức độ tương quan tuyến tính giữa X 2 và X3
-1 < = r <= 1
77
• Hệ số xác định bội đã hiệu chỉnh
RSS /(n  k ) 2 n 1
R  1
2
 1  (1  R )
TSS /(n  1) nk
- Mục đích của việc hiệu chỉnh là để xem xét
việc có nên đưa thêm biến giải thích vào mô
hình hay không.
- Một biến mới sẽ được đưa vào mô hình nếu hệ
số của biến mới đưa vào mô hình có ý nghĩa
thống kê và hệ số R 2 còn tăng.
78
3.5. Kiểm định giả thiết và khoảng tin cậy của các
hệ số hồi quy– kiểm định T
79
Ước lượng khoảng tin cậy đối với  j ( j  1 k)
ˆ j   j
• Ta có t  ~ T (n -k) do đó với độ tin cậy (1 - ) ta có
Se( ˆ ) j
- Khoảng tin cậy đối xứng với độ tin cậy (1 - )
P(t ( nk )
 /2 t t  /2 )  1
( nk )
P(  j  t / 2 .Se(  j )   j   j  t / 2 .Se( ˆ j ))  1  
ˆ ( nk ) ˆ ˆ ( nk )
- Khoảng tin cậy của βj với k=3
(  j  t / 2 .Se(  j );  j  t / 2 .Se( ˆ j ))
ˆ ( n 3) ˆ ˆ ( n 3)
80
Kiểm định giả thiết đối với  j ( j  1 k)
• Kiểm định các cặp giả thiết

 H 0 :  j   *j  H 0 :  j   *j  H 0 :  j   *j
 (1),  (2),  (3)
 H1 :  j   j  H1 :  j   j  H1 :  j   j
* * *
ˆ j   *j
• Tiêu chuẩn kiểm định T 
Se( ˆ j )
của các cặp giả thiết W  t : t  t / 2 ( n 3)
 
- Với cặp giả thiết (1)
- Với cặp giả thiết (2) W  t : t  t
( n 3)
 
- Với cặp giả thiết (3) W  t : t  t ( n 3)
   
81
• Trường hợp đặc biệt
 H 0 :  j  0  H 0 :  j  0  H 0 :  j  0
 (1),  (2),  (3)
 H1 :  j  0  H1 :  j  0  H1 :  j  0
• Cặp giả thiết: β2 = 0; β2 ≠ 0
ÞCho biết hệ số của biến X2i có ý nghĩa thống kê hay
không.
• Cặp giả thiết: β3 = 0; β3 ≠ 0
=> Cho biết hệ số của biến X3i có ý nghĩa thống kê hay
không.
82
BT1:Cho bảng số liệu của lượng cam bán Y (tạ) theo giá cam X2
(chục ngàn đồng/kg) và giá quýt X3 (chục ngàn đồng/kg)
Y 14 10 12 7 8 9 6 6 9 11
X2 2 2 3 4 5 5 5 6 4 3
X3 3 1 3 2 3 5 2 5 5 4
1. Ước lượng hàm hồi quy? Giải thích các hệ số?

2. Tính phương sai và sai số tiêu chuẩn của các hệ số ước lượng?
3. Tìm hệ số xác định và hệ số xác định bội sau khi hiệu chỉnh?
4. Tìm khoảng tin cậy của các hệ số hồi quy?
5. Kiểm định về mặt thống kê của các hệ số?
6. Kiểm định giá cam và giá quýt tác động thuận chiều lên lượng cam bán hay
không?
7. Sử dụng hệ số xác định bội sau khi hiệu chỉnh kiểm tra xem nên đưa biến giá
quýt vào mô hình hay không?
8. Kiểm định sự phù hợp của hàm 3 biến?
83
3.6. Kiểm định sự phù hợp của hàm hồi quy
• R2tổng thể = 0 : hàm hồi qui không phù hợp
• Kiểm định cặp giả thiết
 H 0 :  2   3  ...   k  0  H 0 : R 2  0
 
 H 1 : !  j  0  H
 1 : R 2
0
• Ta có
R /( k  1)
2
F ~ F(k - 1, n - k)
(1  R ) /( n  k )
2
• Miền bác bỏ của giả thiết H0 với mức ý nghĩa  cho trước\
W  F : F  F (k  1, n  k )
84
Phần 4. Biến giả
4.1. Bản chất của biến giả (Dummy variable)
• Biến định tính là biến số cho biết có hay không

có một thuộc tính nào đó. (biến chất lượng)
• Biến giả là biến số dùng để mô tả các biến định
tính, thường được ký hiệu là D.
• Ví dụ:
Biến giới tính: nam, nữ
Biến miền: bắc, trung, nam
• Chương này nghiên cứu mô hình hồi quy với
biến độc lập là biến định tính còn biến phụ thuộc
là biến định lượng. 85
4.2. Mô hình có một biến độc lập là biến định tính
• Để đặc trưng cho biến định tính có hai phạm

trù(hai thuộc tính) thì dùng một biến giả.
- Ví dụ: Hồi quy thu nhập của công chức (Y i)
phụ thuộc vào giới tính (D)
1 Nếu công chức là nam
Di  
0 Nếu công chức là nữ
- Mô hình hồi quy
Yi  1   2 Di  U i
86
- Phân tích
+ Thu nhập trung bình của công chức nữ
E (Yi / Di  0)  1
+ Thu nhập trung bình của công chức nam
E (Yi / Di  1)  1   2
- Để xem có sự phân biệt giới tính trong thu
nhập hay không ta kiểm định cặp giả thiết:
H 0 :  2  0

 H1 :  2  0
87
Quy tắc đặt biến giả
• Để đặc trưng cho biến định tính có n (n ≥ 2)
phạm trù thì dùng (n - 1) biến giả D.
• Biến giả D chỉ nhận 2 giá trị là 0 hoặc 1
• Thuộc tính ảnh hưởng không tốt đến biến
phụ thuộc Y là phạm trù cơ sở và thường gán
giá trị 0
88
- Ví dụ: Hồi quy thu nhập của công chức (Y) phụ thuộc
vào khu vực làm việc (D).
- Khu vực làm việc được chia thành: khu vực nông
thôn; khu vực thành thị và khu vực miền núi.
1 Nếu công chức làm việc ở nông thôn
D2i  
0 Nếu công chức làm việc ở khu vực khác
1 Nếu công chức làm việc ở thành thị
D3i   Nếu công chức làm việc ở khu vực khác
0
- Mô hình hồi quy
Yi  1   2 D2i  3 D3i  U i
89
- Phân tích
+ Thu nhập trung bình của công chức làm việc ở miền núi
E (Yi / D2i  D3i  0)  1
+ Thu nhập trung bình của công chức làm việc ở nông thôn
E (Yi / D2i  1, D3i  0)  1   2
+ Thu nhập trung bình của công chức làm việc ở thành thị
E (Yi / D2i  0, D3i  1)  1   3
+ Để xem có sự khác biệt về thu nhập giữa công chức làm
việc ở các khu vực khác nhau hay không ta kiểm định cặp
giả thiết:
 H 0 :  j  0
  j  2,3
 H1 :  j  0
90
4.3. Mô hình có hai biến độc lập là biến định tính
• Với mỗi biến độc lập là biến định tính tuỳ thuộc vào số
phạm trù của nó mà ta đưa số biến giả thích hợp vào
mô hình.
• Ví dụ: Hồi quy thu nhập của công chức (Y) phụ thuộc
vào giới tính và khu vực làm việc.
- Mô hình:
Yi  1   2 D2i  3 D3i   4 D4i  U i
- Trong đó:
+ D2i đặc trưng cho biến giới tính
+ D3i, D4i đặc trưng cho biến khu vực làm việc
91
Nhận xét
• Nếu mô hình có k biến độc lập là biến định tính với số
phạm trù tương ứng là n1, n2, …, nk thì tổng cộng số
biến giả phải dùng để tránh rơi vào hiện tượng đa công
tuyến hoàn hảo là (n1-1)+ (n2-1)+ …+ (nk-1).
• Phạm trù được lựa chọn để so sánh với các phạm trù
khác (phạm trù mà tất cả các biến giả đều nhận giá trị
bằng 0) gọi là phạm trù cơ sở.
• Các hệ số góc được gọi là hệ số chênh lệch vì nó phản
ánh mức độ chênh lệch của phạm trù đang xét với phạm
trù cơ sở.
92
4.4. Phân tích ảnh hưởng tương tác giữa các
biến định tính
• Trong các mô hình hồi quy có nhiều biến giả có thể xảy
ra sự tương tác giữa các biến giả với nhau.
• Ví dụ: hồi quy chi tiêu hàng năm về quần áo (Y) phụ
thuộc vào thu nhập (X), giới tính(nam, nữ) và thành
phần lao động(công chức, công nhân)
- Mô hình Yi  1   2 D2i   3 D3i   4 X i  U i
1 Nếu đối tượng là nam
D2i  
0 Nếu đối tượng là nữ
1 Nếu đối tượng là công chức
D3i  
0 Nếu đối tượng là công nhân
93
• Để phân tính sự ảnh hưởng tương tác giữa
các biến giả ta hồi quy mô hình:
Yi  1   2 D2i  3 D3i   4 ( D2i * D3i )   5 X i  U i
Trong đó D2i.D3i thể hiện sự tương tác giữa
hai biến giả
• Để xem có ảnh hưởng tương tác giữa hai biến
giả hay không ta kiểm định cặp giả thiết:
H 0 : 4  0
• Nếu chấp nhận giả thiết H1 thì
H có
: nghĩa
 0 là có
 1 4
sự khác nhau về chi tiêu cho quần áo giữa
“nam công chức” và các đối tượng khác (nữ
công chức, nữ công nhân, nam công nhân).
94
4.5. Sử dụng biến giả để phân tích biến động
mùa vụ
• Trong kinh tế có nhiều chỉ tiêu mà sự thay đổi của nó

mang tính chất mùa vụ.
• Mùa vụ là biến định tính nên để tách biệt ảnh hưởng
của yếu tố mùa vụ ta sử dụng kỹ thuật biến giả.
- Nếu yếu tố mùa vụ theo tháng (12 tháng/năm) ta sử
dụng 11 biến giả.
- Nếu yếu tố mùa vụ theo quí (4 quí/năm) ta sử dụng 3
biến giả.
95
• Ví dụ: hồi quy tiêu dùng về quần áo, dụng cụ gia đình
của hộ gia đình (Y) phụ thuộc vào thu nhập (X) và yếu
tố mùa vụ (các quí).
1 Nếu quan sát nằm ở quí 2
D2i  
0 Nếu quan sát nằm ở quí khác
D3i  
D4i  
• Để phân tích ảnh hưởng của yếu tố mùa vụ đến chi tiêu
ta sử dụng mô hình:
Yi  1   2 D2i  3 D3i   4 D4i  5 X i  Ui (1)
96
• Để phân tích ảnh hưởng tương tác giữa yếu tố
mùa vụ và thu nhập đến chi tiêu ta sử dụng mô
hình tổng quát:
Yi  1   2 D2i  3 D3i   4 D4i  5 X i
  6 ( D2i * X i )   7 ( D3i * X i )  8 ( D4i * X i )  U i (2)
• Việc thực hiện các kiểm định đối với các hệ số
của mô hình (1) và (2) sẽ cho ta các biết ảnh
hưởng của yếu tố mùa vụ cũng như ảnh hưởng
tương tác của yếu tố mùa vụ và thu nhập đến chi
tiêu.
97
4.6. So sánh hai hồi quy
• Giả sử có hai hàm hồi quy:
- Giai đoạn 1: Yt  1   2 X t  U t (*) với n1 quan sát
- Giai đoạn 2: Yt   1   2 X t  U t (**) với n2 quan sát
• Có 4 trường hợp có thể xảy ra:
- Hai hàm hồi quy trùng nhau (α1 = γ1, α2 = γ2)
- Hai hàm hồi quy song song (α1 ≠ γ1, α2 = γ2)
- Hai hàm hồi quy có cùng hệ số chặn (α1 = γ1, α2 ≠ γ2)
- Hai hàm hồi quy hoàn toàn khác nhau (α1 ≠ γ1, α2 ≠ γ2)
• Đồ thị
98
4.7. Hồi quy tuyến tính từng khúc
• Nhiều hiện tượng kinh tế có sự thay đổi cấu trúc theo
thời gian song vẫn phải đảm bảo tính liên tục theo thời
gian của hiện tượng. Khi đó ta sử dụng biến giả để thể
hiện cho sự thay đổi cấu trúc này.
• Ví dụ: Giả sử tiêu dùng của Việt Nam trong 2 thời kỳ
trước và sau chuyển đổi (1986) là khác nhau.
• Ký hiệu năm chuyến đổi cơ cấu kinh tế là t0.
1 Nếu t > t0
Dt  
0 Nếu t ≤ t0
99
• Xây dựng mô hình
Yt  1   2 X t   3 ( X t  X t ) Dt  U t
0
• Trong đó:
Yt là tiêu dùng
Xt là thu nhập
Xt0 là thu nhập trong năm bắt đầu chuyến đổi cơ cấu kinh tế.
Xt0 X
100
• Phân tích
- Tiêu dùng trung bình trong những năm trước khi
chuyển đổi cơ cấu kinh tế.
E (Yt / X t , Dt  0)  1   2 X t
- Tiêu dùng trung bình trong những năm sau khi
chuyển đổi cơ cấu kinh tế.
E (Yt / X t , Dt  1)  ( 1  3 X t0 )  (  2  3 ) X t
- Tại thời điểm t0 ta có
E (Yt0 )  ( 1   3 X t0 )  (  2   3 ) X t0  1   2 X t0
- Để xem mô hình có thay đổi cấu trúc hay không ta
kiểm định cặp giả thiết:
 H 0 : 3  0

 H1 :  3  0
101
• Khi mô hình có sự thay đổi cấu trúc trong
nhiều giai đoạn khác nhau của dãy số liệu
thì ta có thể sử dụng số biến giả và mô hình
phù hợp để phân tích.
• Chú ý: mô hình thay đổi cấu trúc n giai
đoạn thì sử dụng (n-1) biến giả
102
Lưu ý khi ước lượng mô hình có 1 biến
lượng và 1 biến định tính có 2 thuộc tính
PRF : Yi  1   2 . X i   3 .Di  U i
SRF : Yˆ  ˆ  ˆ . X  ˆ .D
i 1 2 i 3 i
Xem biến giả D như 1 biến độc lập và ước

lượng như mô hình hồi quy 3 biến
103
n n n n
( xi yi )(  d )  ( d i yi )( d i .xi )
i
2
ˆ2  i 1
n
i 1
n
i 1
n
i 1
 i i  ii
x 2
i 1
. d 2
 ( d x
i 1
) 2
i 1
n n n n
( d i yi )(  xi2 )  ( xi yi )( d i .xi )
ˆ3  i 1
n
i 1
n
i 1
n
i 1
 x . d
i 1
2
i
i 1
i
2
 ( d i xi )
i 1
2
(d i  Di  D )
ˆ1  Y  ˆ2 . X  ˆ3 .D
104

Chương 3. Các Mô Hình Hồi Quy

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Chương 3. Các Mô Hình Hồi Quy

Uploaded by

Copyright:

Available Formats

CHƯƠNG 3: MÔ HÌNH HỒI QUY

a. Bản chất của phân tích hồi quy

• Vấn đề: nghiên cứu mối liên hệ phụ thuộc

• Chi cho tiêu dùng cá nhân – thu nhập khả dụng

Phân tích hồi quy nghiên cứu quan hệ thống kê

- Trong quan hệ hàm số:

- Trong phân tích hồi quy

- Phân tích tương quan

- Trong phân tích hồi quy

- Quan hệ nhân quả là hệ hai chiều giữa hai đối

- Trong phân tích hồi quy biến giải thích không

a. Các loại số liệu

• Số liệu từ các nguồn được phát hành như:

• Số liệu từ các cuộc điều tra thực tế hoặc đi

• Phần lớn là các số liệu phi thực nghiệm,

Y1 P(Y1, X1) P(Y1, X2) … P(Y1, Xk)

Y2 P(Y2, X1) P(Y2, X2) …. P(Y2, Xk)

Yh P(Yh, X1) P(Yh, X2) … P(Yh, Xk)

• E(Y/Xi) là một hàm số và gọi là hàm hồi quy tổng

• Đặt Ui = Yi – E(Y/Xi) gọi là sai số ngẫu nhiên (random

• Với mẫu cụ thể, βˆ1 , là

PRF : E (Y / X i )  1   2 X i SRF : Yˆi  ˆ1  ˆ2 X i

PRM : Yi  1   2 X i  U i SRM : Yi  ˆ1  ˆ2 X i  ei

Sai số ngẫu nhiên Ui Phần dư ei

PRM - Population Regression Model Mô hình hồi quy tổng thể

Tiếng Anh Tiếng Việt

a. Nội dung của phương pháp OLS

• Ta cần tìm βˆ , βˆ sao cho f ( ˆ1 , ˆ2 )  Min

• Đối với ˆ1 , ˆ2

Cho 10 cặp quan sát về chi tiêu Y(USD/tuần) và

- Dạng hàm của mô hình lựa chọn

• GT 1: Biến độc lập là phi ngẫu nhiên

βˆ1 , βˆ2 là BLUE của 1 , 2

• Đối với ̂1

gọi là hệ số xác định của mô hình (Determination coeffcient - r-Squares)

Gọi là hệ số tương quan của biến X và Y

- Khoảng tin cậy đối xứng

( ˆ j  t( n/22 ) .Se( ˆ j ); ˆ j  t( n/22 ) .Se( ˆ j ))

• Kiểm định các cặp giả thiết

=> Bác bỏ Ho chấp nhận H1

=> Bác bỏ Ho => Mô hình phù hợp

- Dự báo giá trị trung bình của biến phụ

- Dự báo giá trị cá biệt của biến phụ thuộc

• Do đó với độ tin cậy (1-) cho trước , GT Cá biệt:

(Yˆ0  t( n/22 ) .Se(Y0 ); Yˆ0  t( n/22 ) .Se(Y0 ))

Yˆi là ước lượng điểm của E(Y/X2i,X3i)

• Các hệ số ˆ1 , ˆ2 , ˆ3 là nghiệm của hệ

  2 (Yi  ˆ1  ˆ2 X 2i  ˆ3 X 3i )  0

ˆ1  Y  ˆ2 X 2  ˆ3 X 3

( x )( x )  ( x3i x2i ) 2

( x )( x )  ( x3i x2i )

Hệ số xác định bội R2 cho biết tỷ lệ % sự biến

- Khoảng tin cậy đối xứng với độ tin cậy (1 - )

- Khoảng tin cậy của βj với k=3

• Kiểm định các cặp giả thiết

1. Ước lượng hàm hồi quy? Giải thích các hệ số?

• Biến định tính là biến số cho biết có hay không

• Để đặc trưng cho biến định tính có hai phạm

• Trong kinh tế có nhiều chỉ tiêu mà sự thay đổi của nó

Xem biến giả D như 1 biến độc lập và ước

You might also like