Professional Documents
Culture Documents
1: Xác định các biến số kinh tế cần khảo sát: biến phụ thuộc và độc lập
Mô hình toán: Y= α + βX
Nếu không tồn tại α và β thì X=Y ( mô hình bất hợp lí )
Với: α và β là các tham số hay còn gọi là hệ số ước lượng Bước 2. 2 Dự
đoán về dấu của các hệ số ước lượng (α và β)
α: đứng độc lập nên có thể là (-) hoặc (+) đều không ảnh hưởng đến mô hình toán
học
β: +Nếu X và Y có mối quan hệ đồng biến (X) ↗ thì (Y) ↗ ⟹ β > 0
+Do biến độc lập X không tăng nhiều như biến phụ thuộc Y nên => β<1
=> Nhận xét: Mô hình toán học Y = α + β X Không phản ánh được tình huống
trong thực tế
Hay nói cách khác: Cùng giá trị X, nhưng có nhiều giá trị Y
Mô hình KTL Y = α + βX + U (2) , với U là sai số ngẫu nhiên
Bước 3. Thu thập, xử lý số liệu
-Dùng phương pháp bình phương nhỏ nhất thông thường (OLS - Ordinary Least
Squares) để tính toán.
Xác định mức độ phù hợp về mặt lý thuyết của mô hình, biểu điễn mô hình trên
bằng đồ thị
Nghiên cứu mối liên hệ phụ thuộc của một biến (biến phụ thuộc, biến được giải
thích) với một hay nhiều biến khác (biến độc lập, biến giải thích
-Phân tích hồi quy nhằm:
+Ước lượng giá trị trung bình của biến phụ thuộc với giá trị đã biết của biến độc
lập
+Kiểm định giả thuyết về bản chất quan hệ phụ thuộc
+Dự đoán giá trị trung bình của biến phụ thuộc
Được xây dựng dựa trên kết quả khảo sát tổng thể
Nhận xét 1:
Vì Y̅i chứa nhiều giá trị X, nên ta có thể xem E(Y i/ X i ¿ là 1 hàm số nào đó để giải
thích biến X
Đặt Y 𝒊 = f( X i )
Như vậy ta có được dạng hàm PRF – Hàm hồi quy tổng thể xác định:
E (Y/ X i ) = f( x i) (4)
Phân loại: +Hồi quy đơn (hồi quy hai biến): Y = α + βX + u (một biến độc lập.)
+Hồi quy bội (hồi quy đa biến): Y = α + β 1 X 1+ β 2 X 2+...+ β k X k + U
(hai biến độc lập trở lên)
Nhận xét 2:
Với U: độ sai lệch giữa giá trị quan sát thực tế Y i và E(Y/ X i ¿gọi là nhiễu hay còn
gọi là sai số ngẫu nhiên
Do trung bình biến phụ thuộc Y 𝒊 sẽ biến thiên theo biến độc lập X và có dạng
đường thẳng, nên ta sử dụng hàm tuyến tính như sau:
E(Y/ X i ¿= f( X i ) ⟹ E(Y/ X i ¿= f( X i ) = α + β X
Viết lại: ta có Hàm hồi quy dạng xác định như sau:
E(Y/ X i ¿= f( X i ) = α + β X (6)
Viết lại: ta có Hàm hồi quy dạng ngẫu nhiên như sau:
Y i = α + β X i + Ui (7)
Trong thực tế, thường không có điều kiện để khảo sát toàn bộ tổng thể. Khi đó, ta
chỉ có thể ước lượng giá trị trung bình của biến phụ thuộc từ số liệu mẫu
Như vậy: Hàm hội quy mẫu được xây dựng trên cơ sở một mẫu gọi là Hàm hồi
quy mẫu SRF
E(Y/ X i ) = f(X) = α + βX
Yi = α + β X i + U i
Y^i =α^ + ^β X i
Yi = α̂ + β̂Xi + Ûi
Y^ 𝑖 Là ước lượng của E(Y/ X i ), 𝛼̂ và ^β là ước lượng của 𝛼 và 𝛽 là ước lượng Ûi của
Ui
PRF dạng:
SRF dạng:
^
β1, ^
β 2 : ước lượng cho 𝜷𝟏, 𝜷𝟐
Ý nghĩa:
• ^
β 1cho biết giá trị trung bình của biến phụ thuộc Y là bao nhiêu khi biến độc
• ^
β 2 cho biết giá trị trung bình của Y sẽ thay đổi () bao nhiêu đơn vị khi
giá trị của X 1 đơn vị với điều kiện các yếu tố khác không đổi.
5.Phương pháp bình phương nhỏ nhất (OLS - Ordinary Least Squares ).
Giả sử có n cặp quan sát (Y i/ X i ¿. Tìm giá trị Y^ 𝐢 sao cho Y^ 𝐢 gần giá trị Y i nhất, tức e i=
|Y i - Y^ 𝐢 | càng nhỏ càng tốt.
∑ 𝑒𝑖 thường rất nhỏ và thậm chí bằng 0 vì chúng triệt tiêu lẫn nhau. Để tránh tình
trạng này, ta dùng PP bình phương nhỏ nhất
+ Xi =
∑ Xi ; Y i = ∑ Y i
n n
+ Độ lệch của biến so với giá trị trung bình: 𝒙𝒊 = 𝑿𝒊 − X i , 𝐲𝐢 = 𝐘𝐢 −Y i
n
∑ X i Y i−n . X i .Y i
^
β 2= i=1n ;^
β1 =Y i− ^
β2 . Xi
∑ X 2i −n. ( X 1 )2
i=1
=> 𝒙𝒊 và y𝒊 gọi là độ lệch giá trị của biến so với giá trị trung bình mẫu
RSS: Tổng bình phương các độ sai lệch giữa giá trị quan sát Y i và giá trị ước lượng
Y^ 𝐢
RSS=∑(𝒀𝒊−Y^ 𝐢 )𝟐
-Đặt R2 là đại lượng đo mức độ phù hợp của SRF với các giá trị quan sát là X i và Y i :
Ta gọi đó là hệ số xác định
2 RSS ESS
R =1 =
TSS TSS
Hệ số xác định R2 có các tính chất sau: R2 ∈ (0;1).Thông thường 0 < R2≤1 Với:
R = 1: Mô hình hồi quy hoàn hảo
2
8. Hệ số tương quan r
Để xác định X và Y có qua hệ chặt chẽ với nhau hay không. Ta dùng hệ số tương
quan r
r = ± √R2
Lập luận:+ ^
β 1 và ^
β 2là ước lượng của 𝛃𝟏và 𝛃𝟐, => giá trị của ^
β 1 và ^
β 2sau khi tìm được
bằng PP OLS mang ý nghĩa đại diện cho n cặp quan sát ( X i và Y i );
+^
β 1 và ^
β 2 là đại lượng ngẫu nhiên => Với mẫu khác nhau, chúng sẽ có giá trị khác
nhau => ^
β 1 và ^
β 2có sự biến động
Var ( ^
β 1 ¿=
∑ Xi . σ 2
2
n ∑ x2i
σ2
Var ( ^
β 2 ¿=
∑ x2i
2 RSS
Trong đó:𝜎2 là phương sai nhiễu của tổng thể σ^ = n−2
Do σ^ 2là ước lượng 𝜎2 nên khi thay σ^ 2 vào (1) và (2) ta được:
Var ( ^
β 1 ¿=
∑ X i . σ^ 2
2
n ∑ x2i
σ^
2
^
β ¿=
Var ( 2
∑ x2i
Công thức tính Sai số chuẩn – Se cho ^
β 1 và ^
β2
8. Khoảng tin cậy của hệ số hồi quy ^
β 1 và ^
β2
^ n−2
β 1 ± t α . Se ( ^
β1¿
2
^ n−2
1. ^ β 1 ¿ ; β 1+ t α . Se ( ^
β 1 ∈ ¿ Se ( ^ β 1 ¿]
2
^ n−2
β 2 ± t α . Se ( ^
β2¿
2
^ n−2
β 2 ¿ ; β 2+ t α . Se ( ^
¿> β^2 ∈¿ Se ( ^ β 2 ¿]
2
n−2 α
Trong đó t α2 là giới trị tới hạn (critical value) mức 2 của phân phối Student với
n2 bậc tự do, tra bảng giá trị tới hạn của bảng phân phối Student
n : Bậc tự do
9. Kiểm định giả thiết (Kiểm định giả thiết về hệ số hồi quy)
θ^ để chỉ ^
β 1hoặc ^
β2
Kiểm định 2 phía:
Giả thuyết thống kê: H 0 :θ=θ o và H 1 :θ ≠ θo (Với θ olà 1 giá trị cho trước)
Ý nghĩa:
H0 : ^
β i=0(Biến độc lập X i không ảnh hưởng đến biến phụ thuộc Y)
H1: ^
βi ≠ 0(Biến độc lập X i có ảnh hưởng đến biến phụ thuộc Y)
^ n −2
Ta biết khoảng tin cậy của β i: ^ β i ¿ ; β i+ t α . Se ( ^
β i ∈ ¿ Se ( ^ βi¿
2
^ n−2 ^ n −2
β i=0 ∉ [ β i−t α . Se ( ^
^ β i ¿ ; β i+ t α . Se ( ^
β i ¿ ] => Bác bỏ giả thuyết H 0
2 2
Biến độc lập X i không ảnh hưởng đến biến phụ thuộc Y
2. ^
β i ≠ 0 => nằm trong khoảng tin cậy
^ n−2 ^ n −2
β i ≠ 0 ∈ [ β i−t α . Se ( ^
^ β i ¿ ; β i+ t α . Se ( ^
β i ¿ ] => Bác bỏ giả thuyết H 1
2 2
10. Kiểm định sự phù hợp của mô hình ( Phương pháp trị tới hạn)
{
2
H 0 : R =0
Giả thiết: 2
H 1: R > 0
ESS 2
R (n−2)
Bước 1: Tính: F 0= RSS = 2
n−2 1−R
Bước 2: Tra bảng F với mức ý nghĩa α và 2 bậc tự do (1; n2) ta được giá trị tới
hạn F α (1; n 2)
Ý nghĩa hệ số hồi quy riêng: cho biết ảnh hưởng của từng biến độc lập lên giá trị
trung bình của biến phụ thuộc khi các biến còn lại được giữ không đổi.
- Nếu X 2 không đổi ⟹ khi X 3 tăng lên 1 đơn vị thì ước Y^ităng lên 1 khoản
chính bằng ^
β3
-Nếu X 3 không đổi, khi X 2 tăng lên 1 đơn vị thì ước Y^i tăng lên 1 khoản
chính bằng ^
β2
∑ x 2i y i . ∑ x 3 i−∑ x 3 i y i . ∑ x2 i x3 i
2
^
β 2=
i=1 i=1 i=1
( )
n 2
∑ x 2 i . ∑ x 3 i−
2 2
∑ x 2i x 3i
i=1
n n n
∑ x 3i y i . ∑ x −∑ x 2 i y i . ∑ x2 i x3 i
2
2i
^
β 3=
i=1 i=1 i=1
(∑ )
n 2
∑ x .∑ x2
2i
2
3i − x 2i x 3i
i=1
^
β 1=Y i− β^2 . X 2− ^
β3 . X 3
∑ x 22 i=∑ X 22 i−n . ¿ ¿
∑ x 23 i=∑ X 23 i−n . ¿ ¿
∑ y2i =∑ Y 2i −n . ¿ ¿
n n
∑ x 2 i yi =∑ X 2 Y i−n . X 2 .Y i
i=1 i=1
n n
∑ x 3 i y i=∑ X 3 Y i−n . X 3 . Y i
i=1 i=1
n n
∑ x 2 i x 3 i=¿ ∑ X 2 X 3i −n . X 2 . X 3 ¿
i=1 i=1
TSS = ∑ Y 2i −n . ¿¿
ESS=∑(Y^ 𝐢 - Y i )𝟐 = ^
β2. ∑ x2 i yi + ^
β3 . ∑ x3i yi
3. Hệ số xác định R2
2 ESS ^ β2 . ∑ x 2i y i+ ^
β3 . ∑ x 3i y i
R= =
TSS ∑ Y i −n . ¿ ¿ ¿
2
-Thực tế: Khi ước lượng mô hình 1 biến thường ít chính xác do còn quá nhiều biến
độc lập (X) khác tác động đến biến phụ thuộc (Y)
Do đó: người ta tìm cách tăng R2 càng nhiều càng tốt
⟹ Hiệu chỉnh R2 bằng R2
- Công thức tính Hệ số xác định hiệu chỉnh:
R =1−( 1−R )
2 2
[ ]
n−1
n−k
2
[ ]
2 1−k
= R + ( 1−R )
n−k
, k: tham số của mô hình,kể cả hệ số tự do.
Tóm lại:
- Dùng R2thay thế cho R2 để xét thêm biến độc lập (X) vào mô hình;
- Nếu thêm biến mà làm R2↗ và các tham số ≠ 0 ⟹ nên đưa thêm biến
5.Phương sai của các hệ số hồi quy
[ ]
1 X . ∑ x 3 i+ X 3 . ∑ x 2 i−2. X 2 . X 3 . ∑ x 2 i x 3 i ^ 2
2 2 2 2
Var ( ^
β 1 ¿= + 2 β 1)=√ Var ( ^
σ =¿ Se ( ^ β1 )
n ∑ x . ∑ x −(∑ x x )
2 2 2
2i 3i 2i 3i
∑ x 23 i
Var ( ^ β2 )=√ Var ( ^
2
β 2 ¿= 2
σ^ ¿> Se( ^ β 2)
∑ 2 i ∑ 3 i ∑ 2i 3 i
x2
. x2
− ( x x )
^ ∑ x 22 i
β3 )= √ Var ( ^
2
Var ( β 3 ¿= 2
σ^ ¿> Se( ^ β3)
∑ x 2i . ∑ x3 i−( ∑ x 2 i x 3 i)
2 2
^ n−3
β 1 ± t α . Se ( ^
β1¿
2
^ n−3
β 1 ¿ ; β 1+ t α . Se ( ^
¿> β^1 ∈¿ Se ( ^ β 1 ¿]
2
^ n−3
β 2 ± t α . Se ( ^
β2¿
2
^ n−3
β 2 ¿ ; β 2+ t α . Se ( ^
¿> β^2 ∈¿ Se ( ^ β 2 ¿]
2
^ n−3
β 3 ± t α . Se ( ^
β3¿
2
^ n −3
β 3 ¿ ; β 3 +t α . Se ( ^
¿> β^3 ∈¿ Se ( ^ β 3 ¿]
2
n−3 α
Trong đó t α2 là giới trị tới hạn (critical value) mức 2 của phân phối Student với
n3 bậc tự do, tra bảng giá trị tới hạn của bảng phân phối Student
n : Bậc tự do
^
β 2−0
Y^i= β^1 + ^
β2 X2 + ^
β 3 X 3 => t =
Se ( ^
β 2)
n−3
Nếu |t i| ≤ t α2 : Chấp nhận H 0
Lý thuyết: ^
β i= 0 (Biến độc lập X i không ảnh hưởng đến biến phụ thuộc Y)
^
β i≠ 0 (Biến độc lập X i có ảnh hưởng đến biến phụ thuộc Y)
Hồi quy 1 biến: Giả sử biến độc lập X i nhận giá trị X 0 cho trước
⟹ dự báo cho E ¿)