You are on page 1of 15

-Bước 2.

1: Xác định các biến số kinh tế cần khảo sát: biến phụ thuộc và độc lập

Giả sử X và Y có mối quan hệ tuyến tính

Đặt: Y: (biến phụ thuộc)

X: (biến độc lập)

 Mô hình toán: Y= α + βX
 Nếu không tồn tại α và β thì X=Y ( mô hình bất hợp lí )
 Với: α và β là các tham số hay còn gọi là hệ số ước lượng Bước 2. 2 Dự
đoán về dấu của các hệ số ước lượng (α và β)
α: đứng độc lập nên có thể là (-) hoặc (+) đều không ảnh hưởng đến mô hình toán
học
β: +Nếu X và Y có mối quan hệ đồng biến (X) ↗ thì (Y) ↗ ⟹ β > 0

+Do biến độc lập X không tăng nhiều như biến phụ thuộc Y nên => β<1

Vậy: 1> β >0

=> Nhận xét: Mô hình toán học Y = α + β X Không phản ánh được tình huống
trong thực tế
 Hay nói cách khác: Cùng giá trị X, nhưng có nhiều giá trị Y
 Mô hình KTL Y = α + βX + U (2) , với U là sai số ngẫu nhiên
Bước 3. Thu thập, xử lý số liệu

Bước 4: Tính toán các tham số (Hệ số ước lượng): α và β

-Dùng phương pháp bình phương nhỏ nhất thông thường (OLS - Ordinary Least
Squares) để tính toán.

Ta được mô hình như sau: E(Y/ X i )= α + β X i

Lưu ý: (Y i/ X i ¿Mô hình Y theo X


Ý nghĩa của mô hình

Ta có mô hình KTL: Y = α + βX + U (1.2), để đơn giản và dễ tính toán, thông


thường người ta loại bỏ (U), và dùng phương pháp OLS để tính toán các ước lượng
các hệ số (Tham số)
Ý nghĩa: Nếu loại trừ U thì tác động X ảnh hưởng đến Y
Bước 5: Mục tiêu kiểm định giả thuyết

Xác định mức độ phù hợp về mặt lý thuyết của mô hình, biểu điễn mô hình trên
bằng đồ thị

3. Phân tích hồi quy (Quy về giá trị trung bình)

Nghiên cứu mối liên hệ phụ thuộc của một biến (biến phụ thuộc, biến được giải
thích) với một hay nhiều biến khác (biến độc lập, biến giải thích
-Phân tích hồi quy nhằm:

+Ước lượng giá trị trung bình của biến phụ thuộc với giá trị đã biết của biến độc
lập
+Kiểm định giả thuyết về bản chất quan hệ phụ thuộc

+Dự đoán giá trị trung bình của biến phụ thuộc

+Kết hợp các vấn đề trên

Hàm hồi quy tổng thể PRF (Population Regression Function)

Được xây dựng dựa trên kết quả khảo sát tổng thể

Hàm tổng quát có dạng: E(Y/ X i )= Y i

Nhận xét 1:

Vì Y̅i chứa nhiều giá trị X, nên ta có thể xem E(Y i/ X i ¿ là 1 hàm số nào đó để giải
thích biến X

Đặt Y 𝒊 = f( X i )
Như vậy ta có được dạng hàm PRF – Hàm hồi quy tổng thể xác định:
E (Y/ X i ) = f( x i) (4)
Phân loại: +Hồi quy đơn (hồi quy hai biến): Y = α + βX + u (một biến độc lập.)
+Hồi quy bội (hồi quy đa biến): Y = α + β 1 X 1+ β 2 X 2+...+ β k X k + U
(hai biến độc lập trở lên)
Nhận xét 2:
Với U: độ sai lệch giữa giá trị quan sát thực tế Y i và E(Y/ X i ¿gọi là nhiễu hay còn
gọi là sai số ngẫu nhiên

 Y i = E(Y/ X i ¿ + Ui (5) , Gọi là hàm PRF ngẫu nhiên

Do trung bình biến phụ thuộc Y 𝒊 sẽ biến thiên theo biến độc lập X và có dạng
đường thẳng, nên ta sử dụng hàm tuyến tính như sau:

E(Y/ X i ¿= f( X i ) ⟹ E(Y/ X i ¿= f( X i ) = α + β X

Viết lại: ta có Hàm hồi quy dạng xác định như sau:

E(Y/ X i ¿= f( X i ) = α + β X (6)

Từ (5): Y i = E(Y/ X i ¿ + Ui ⟹Y i = α + β X i + Ui (7)

Viết lại: ta có Hàm hồi quy dạng ngẫu nhiên như sau:

Y i = α + β X i + Ui (7)

3.2 Hàm hồi quy mẫu (SRF – Sample Regression Function)

Trong thực tế, thường không có điều kiện để khảo sát toàn bộ tổng thể. Khi đó, ta
chỉ có thể ước lượng giá trị trung bình của biến phụ thuộc từ số liệu mẫu

Như vậy: Hàm hội quy mẫu được xây dựng trên cơ sở một mẫu gọi là Hàm hồi
quy mẫu SRF

Hàm hồi quy PRF xác định và ngẫu nhiên:

E(Y/ X i ) = f(X) = α + βX
Yi = α + β X i + U i

Hàm hồi quy SRF có dạng sau:

Y^i =α^ + ^β X i

Yi = α̂ + β̂Xi + Ûi

Y^ 𝑖 Là ước lượng của E(Y/ X i ), 𝛼̂ và ^β là ước lượng của 𝛼 và 𝛽 là ước lượng Ûi của
Ui

 Mô hình hồi quy tuyến tính hai biến (đơn biến)

PRF dạng:

+Xác định: E(Y/𝐗𝐢) = f(𝐗𝐢) = ^β 𝟏 + ^β 𝟐𝐗𝐢

+Ngẫu nhiên: Y i= E(Y/𝐗𝐢) +U i = ^β 𝟏 + ^β 𝟐𝐗𝐢 + Ui

SRF dạng:

+ Xác định: Y i=¿ Y^ 𝐢 = ^β 𝟏 + ^β 𝟐𝐗𝐢


+Ngẫu nhiên: Y^ 𝐢 +e i ¿ ^β 𝟏 + ^β 𝟐𝐗𝐢 +e i
*Y^ 𝐢 là ước lượng điểm của E(Y/𝐗𝐢)

^
β1, ^
β 2 : ước lượng cho 𝜷𝟏, 𝜷𝟐

𝒆𝒊 là ước lượng điểm cho U ivà được gọi là phần dư

Ý nghĩa:

• ^
β 1cho biết giá trị trung bình của biến phụ thuộc Y là bao nhiêu khi biến độc

lập X nhận giá trị 0

• ^
β 2 cho biết giá trị trung bình của Y sẽ thay đổi () bao nhiêu đơn vị khi

giá trị của X  1 đơn vị với điều kiện các yếu tố khác không đổi.

5.Phương pháp bình phương nhỏ nhất (OLS - Ordinary Least Squares ).
Giả sử có n cặp quan sát (Y i/ X i ¿. Tìm giá trị Y^ 𝐢 sao cho Y^ 𝐢 gần giá trị Y i nhất, tức e i=
|Y i - Y^ 𝐢 | càng nhỏ càng tốt.

∑ 𝑒𝑖 thường rất nhỏ và thậm chí bằng 0 vì chúng triệt tiêu lẫn nhau. Để tránh tình
trạng này, ta dùng PP bình phương nhỏ nhất

Viết mô hình ước lượng:Y^i= β^1 + ^


β 2 X i ta phải tìm các giá trị ^
β1, ^
β2

+ Xi =
∑ Xi ; Y i = ∑ Y i
n n
+ Độ lệch của biến so với giá trị trung bình: 𝒙𝒊 = 𝑿𝒊 − X i , 𝐲𝐢 = 𝐘𝐢 −Y i
n

∑ X i Y i−n . X i .Y i
^
β 2= i=1n ;^
β1 =Y i− ^
β2 . Xi
∑ X 2i −n. ( X 1 )2
i=1

=> 𝒙𝒊 và y𝒊 gọi là độ lệch giá trị của biến so với giá trị trung bình mẫu

6. Các Tổng bình phương độ lệch


TSS: Tổng bình phương các độ sai lệch giữa giá trị quan sát Yi và Giá trị trung
TSS= ∑ Y i −n . ( Y i )
2 2
bình ; Y icủa chúng:
ESS: Tổng bình phương các độ sai lệch giữa giá trị ước lượng

Y^ 𝐢 và Giá trị trung bình Y i của chúng: β 2 . (∑ X i −n . ( X i ) )


ESS = ^
2 2 2

RSS: Tổng bình phương các độ sai lệch giữa giá trị quan sát Y i và giá trị ước lượng
Y^ 𝐢

RSS=∑(𝒀𝒊−Y^ 𝐢 )𝟐

7.Hệ số xác định R2

TSS = ESS + RSS (4) , Chia 2 vế của cho TSS

TSS ESS RSS RSS ESS


= +
TSS TSS TSS
 1  ¿
TSS TSS
Nhận xét: ESS càng lớn hơn RSS ⟹ Y^ 𝐢 càng gần Y i ⟹ giá trị ước lượng Y^ 𝐢 càng
gần đúng với giá trị quan sát Y i ⟹ mô hình ước lượng có giá trị đúng rất cao (hoàn
hảo) và ngược lại.

-Đặt R2 là đại lượng đo mức độ phù hợp của SRF với các giá trị quan sát là X i và Y i :
Ta gọi đó là hệ số xác định
2 RSS ESS
R =1 =
TSS TSS

Hệ số xác định R2 có các tính chất sau: R2 ∈ (0;1).Thông thường 0 < R2≤1 Với:
R = 1: Mô hình hồi quy hoàn hảo
2

R = 0: Mô hình hồi quy không phù hợp


2

Thực tế: Ít khi R2= 1 hoặc R2 = 0 mà thường là gần 1 hoặc gần = 0

R2 ≥ 0.9: Mô hình có độ chính xác cao

R2 ≥ 0,7 – dưới 0,9: Khá cao

R2 > 0,5 – dưới 0,7: Khá

R2 = 0,5: Trung bình

R2 < 0,5: kém

8. Hệ số tương quan r

Để xác định X và Y có qua hệ chặt chẽ với nhau hay không. Ta dùng hệ số tương
quan r

Công thức xác định hệ số tương quan r như sau:

r = ± √R2

Điều kiện: r cùng dấu ^


β 2, Nếu:

• r nhận giá trị (+) ⟹ X và Y có quan hệ đồng biến;


• r nhận giá trị (-) ⟹ X và Y có quan hệ nghịch biến;

7. Các tính chất của hệ số hồi quy

Lập luận:+ ^
β 1 và ^
β 2là ước lượng của 𝛃𝟏và 𝛃𝟐, => giá trị của ^
β 1 và ^
β 2sau khi tìm được

bằng PP OLS mang ý nghĩa đại diện cho n cặp quan sát ( X i và Y i );

+^
β 1 và ^
β 2 là đại lượng ngẫu nhiên => Với mẫu khác nhau, chúng sẽ có giá trị khác

nhau => ^
β 1 và ^
β 2có sự biến động

+ Đánh giá mức độ biến ^


β 1 và ^
β 2Người ta dùng Phương sai (Var - Variance) và Sai

số chuẩn (Se Standard error)

Công thức tính Phương sai – Var cho ^


β 1 và ^
β2

Var ( ^
β 1 ¿=
∑ Xi . σ 2
2

n ∑ x2i
σ2
Var ( ^
β 2 ¿=
∑ x2i
2 RSS
Trong đó:𝜎2 là phương sai nhiễu của tổng thể σ^ = n−2

Do σ^ 2là ước lượng 𝜎2 nên khi thay σ^ 2 vào (1) và (2) ta được:

Var ( ^
β 1 ¿=
∑ X i . σ^ 2
2

n ∑ x2i

σ^
2
^
β ¿=
Var ( 2
∑ x2i
Công thức tính Sai số chuẩn – Se cho ^
β 1 và ^
β2
8. Khoảng tin cậy của hệ số hồi quy ^
β 1 và ^
β2

- Công thức tính Khoảng tin cậy của hệ số hồi quy ^


β1

^ n−2
β 1 ± t α . Se ( ^
β1¿
2

^ n−2
1. ^ β 1 ¿ ; β 1+ t α . Se ( ^
β 1 ∈ ¿ Se ( ^ β 1 ¿]
2

Công thức tính Khoảng tin cậy của hệ số hồi quy ^


β2

^ n−2
β 2 ± t α . Se ( ^
β2¿
2

^ n−2
β 2 ¿ ; β 2+ t α . Se ( ^
¿> β^2 ∈¿ Se ( ^ β 2 ¿]
2

n−2 α
Trong đó t α2 là giới trị tới hạn (critical value) mức 2 của phân phối Student với

n2 bậc tự do, tra bảng giá trị tới hạn của bảng phân phối Student

α : Tra bảng thông kê t – Student

n : Bậc tự do
9. Kiểm định giả thiết (Kiểm định giả thiết về hệ số hồi quy)

Phương pháp khoảng tin cậy:

Đặt: θđể chỉ β 1hoặc β 2

θ^ để chỉ ^
β 1hoặc ^
β2
Kiểm định 2 phía:

Giả thuyết thống kê: H 0 :θ=θ o và H 1 :θ ≠ θo (Với θ olà 1 giá trị cho trước)

Kiểm định phía phải:

Giả thuyết thống kê: H 0 :θ=θ o và H 1 :θ >θo

Kiểm định phía trái:

Giả thuyết thống kê: H 0 :θ=θ o và H 1 :θ <θo

Ý nghĩa:

H0 : ^
β i=0(Biến độc lập X i không ảnh hưởng đến biến phụ thuộc Y)

H1: ^
βi ≠ 0(Biến độc lập X i có ảnh hưởng đến biến phụ thuộc Y)

^ n −2
Ta biết khoảng tin cậy của β i: ^ β i ¿ ; β i+ t α . Se ( ^
β i ∈ ¿ Se ( ^ βi¿
2

Có 2 trường hợp xảy ra:

1 . β^i=0 => nằm ngoài khoảng tin cậy

^ n−2 ^ n −2
β i=0 ∉ [ β i−t α . Se ( ^
 ^ β i ¿ ; β i+ t α . Se ( ^
β i ¿ ] => Bác bỏ giả thuyết H 0
2 2

 Biến độc lập X i không ảnh hưởng đến biến phụ thuộc Y

2. ^
β i ≠ 0 => nằm trong khoảng tin cậy

^ n−2 ^ n −2
β i ≠ 0 ∈ [ β i−t α . Se ( ^
 ^ β i ¿ ; β i+ t α . Se ( ^
β i ¿ ] => Bác bỏ giả thuyết H 1
2 2

 Biến độc lập X i có ảnh hưởng đến biến phụ thuộc Y

10. Kiểm định sự phù hợp của mô hình ( Phương pháp trị tới hạn)

{
2
H 0 : R =0
Giả thiết: 2
H 1: R > 0
ESS 2
R (n−2)
Bước 1: Tính: F 0= RSS = 2
n−2 1−R
Bước 2: Tra bảng F với mức ý nghĩa α và 2 bậc tự do (1; n2) ta được giá trị tới
hạn F α (1; n 2)

Bước 3: So sánh F 0và F α (1; n 2)

Nguyên tắc quy định:

Nếu F 0> F α (1;n 2): Bác bỏ H 0

Nếu F 0≤ F α (1;n 2): Chấp nhận H 0

 Mô hình hồi quy 3 biến:

Ý nghĩa hệ số hồi quy riêng: cho biết ảnh hưởng của từng biến độc lập lên giá trị
trung bình của biến phụ thuộc khi các biến còn lại được giữ không đổi.

-Mô hình hồi quy tổng thể ngẫu nhiên:

- 𝐔𝟏: sai số ngẫu nhiên của tổng thể


+𝐘𝟏 = 𝛃𝟏 + 𝛃𝟐𝐗𝟐 + 𝛃𝟑𝐗𝟑 + 𝐔𝟏 →Y^i= β^1 + ^
β2 X2 + ^ ^i , SRF
β3 X 3 + U

*Có 1 số tài liệu ký hiệu U là e

^ =0 hàm hồi quy mẫu: Y^i= β^1 + ^


Giả thiết, U β2 X 2 + ^
β3 X3
i

Ý nghĩa: - Khi biến độc lập là X 2 ; X 3 = 0 ⟺ ước lượng Y^i= β^1

- Nếu X 2 không đổi ⟹ khi X 3 tăng lên 1 đơn vị thì ước Y^ităng lên 1 khoản
chính bằng ^
β3

-Nếu X 3 không đổi, khi X 2 tăng lên 1 đơn vị thì ước Y^i tăng lên 1 khoản
chính bằng ^
β2

1. Ước lượng các tham số


n n n

∑ x 2i y i . ∑ x 3 i−∑ x 3 i y i . ∑ x2 i x3 i
2

^
β 2=
i=1 i=1 i=1

( )
n 2

∑ x 2 i . ∑ x 3 i−
2 2
∑ x 2i x 3i
i=1
n n n

∑ x 3i y i . ∑ x −∑ x 2 i y i . ∑ x2 i x3 i
2
2i
^
β 3=
i=1 i=1 i=1

(∑ )
n 2

∑ x .∑ x2
2i
2
3i − x 2i x 3i
i=1

^
β 1=Y i− β^2 . X 2− ^
β3 . X 3

∑ x 22 i=∑ X 22 i−n . ¿ ¿

∑ x 23 i=∑ X 23 i−n . ¿ ¿

∑ y2i =∑ Y 2i −n . ¿ ¿

n n

∑ x 2 i yi =∑ X 2 Y i−n . X 2 .Y i
i=1 i=1

n n

∑ x 3 i y i=∑ X 3 Y i−n . X 3 . Y i
i=1 i=1

n n

∑ x 2 i x 3 i=¿ ∑ X 2 X 3i −n . X 2 . X 3 ¿
i=1 i=1

2.Tổng bình phương các độ lệch

TSS = ∑ Y 2i −n . ¿¿

ESS=∑(Y^ 𝐢 - Y i )𝟐 = ^
β2. ∑ x2 i yi + ^
β3 . ∑ x3i yi

RSS= TSS - ESS

3. Hệ số xác định R2

2 ESS ^ β2 . ∑ x 2i y i+ ^
β3 . ∑ x 3i y i
R= =
TSS ∑ Y i −n . ¿ ¿ ¿
2

4.Hệ số xác định hiệu chỉnh


R2 ≫ ⟹ Mô hình ⟶ hoàn hảo.

-Thực tế: Khi ước lượng mô hình 1 biến thường ít chính xác do còn quá nhiều biến
độc lập (X) khác tác động đến biến phụ thuộc (Y)
Do đó: người ta tìm cách tăng R2 càng nhiều càng tốt
⟹ Hiệu chỉnh R2 bằng R2
- Công thức tính Hệ số xác định hiệu chỉnh:

R =1−( 1−R )
2 2
[ ]
n−1
n−k
2
[ ]
2 1−k
= R + ( 1−R )
n−k
, k: tham số của mô hình,kể cả hệ số tự do.

- Hệ số xác định hiệu chỉnh R2 có các tính chất:

+ k càng lớn ↗ ↗ ⟹ R2càng nhỏ ↘↘ hơn R2;

+ Khi k >1 ⟺ R2≤ R2 ≤ 1;

+ R2có thể (-). Trường hợp này quy ước: R2= 0

Tóm lại:

- Dùng R2thay thế cho R2 để xét thêm biến độc lập (X) vào mô hình;

- Nếu thêm biến mà làm R2↗ và các tham số ≠ 0 ⟹ nên đưa thêm biến
5.Phương sai của các hệ số hồi quy

[ ]
1 X . ∑ x 3 i+ X 3 . ∑ x 2 i−2. X 2 . X 3 . ∑ x 2 i x 3 i ^ 2
2 2 2 2

Var ( ^
β 1 ¿= + 2 β 1)=√ Var ( ^
σ =¿ Se ( ^ β1 )
n ∑ x . ∑ x −(∑ x x )
2 2 2
2i 3i 2i 3i

∑ x 23 i
Var ( ^ β2 )=√ Var ( ^
2
β 2 ¿= 2
σ^ ¿> Se( ^ β 2)
∑ 2 i ∑ 3 i ∑ 2i 3 i
x2
. x2
− ( x x )
^ ∑ x 22 i
β3 )= √ Var ( ^
2
Var ( β 3 ¿= 2
σ^ ¿> Se( ^ β3)
∑ x 2i . ∑ x3 i−( ∑ x 2 i x 3 i)
2 2

6.Phương sai nhiễu của Tổng thể


σ^ 2=
∑ e2i = ( 1−R2 ) ∑ y 2i = RSS
n−3 n−3 n−3

7.Khoảng tin cậy của hệ số hồi quy ^


β 1, ^
β 2, ^
β3

- Công thức tính Khoảng tin cậy của hệ số hồi quy ^


β1

^ n−3
β 1 ± t α . Se ( ^
β1¿
2

^ n−3
β 1 ¿ ; β 1+ t α . Se ( ^
¿> β^1 ∈¿ Se ( ^ β 1 ¿]
2

Công thức tính Khoảng tin cậy của hệ số hồi quy ^


β2

^ n−3
β 2 ± t α . Se ( ^
β2¿
2

^ n−3
β 2 ¿ ; β 2+ t α . Se ( ^
¿> β^2 ∈¿ Se ( ^ β 2 ¿]
2

Công thức tính Khoảng tin cậy của hệ số hồi quy ^


β3

^ n−3
β 3 ± t α . Se ( ^
β3¿
2

^ n −3
β 3 ¿ ; β 3 +t α . Se ( ^
¿> β^3 ∈¿ Se ( ^ β 3 ¿]
2

n−3 α
Trong đó t α2 là giới trị tới hạn (critical value) mức 2 của phân phối Student với

n3 bậc tự do, tra bảng giá trị tới hạn của bảng phân phối Student

α : Tra bảng thông kê t – Student

n : Bậc tự do

8.Kiểm định giả thiết về tham số (hệ số hồi quy)

Trong thống kê “t” được xác định bằng công thức:

^
β 2−0
Y^i= β^1 + ^
β2 X2 + ^
β 3 X 3 => t =
Se ( ^
β 2)

Nguyên tắc quyết định:


n−3
Nếu |t i| >t α2 : Bác bỏ H 0

n−3
Nếu |t i| ≤ t α2 : Chấp nhận H 0

 Lý thuyết: ^
β i= 0 (Biến độc lập X i không ảnh hưởng đến biến phụ thuộc Y)

^
β i≠ 0 (Biến độc lập X i có ảnh hưởng đến biến phụ thuộc Y)

Dự báo điểm/cá biệt/ Trung bình (Point Prediction)

Hồi quy 1 biến: Giả sử biến độc lập X i nhận giá trị X 0 cho trước

⟹ dự báo cho E ¿)

Công thức đơn biến: Y^i= β^1 + ^


β 2 X i=¿ Y^i= β^1 + ^
β2 X 0

Công thức đa biến: Y^i= β^1 + ^


β2 X2 + ^
β 3 X 3=> Y^i= β^1 + ^
β 2 X 02 + ^
β 3 X 03

You might also like