You are on page 1of 21

ÔN TẬP

(Ngày 28/11/2021 thi)

GIỚI THIỆU:
- Kinh tế lượng = Lý thuyết kinh tế + Thống kê toán + Số liệu thực tế
- Ứng dụng của Kinh tế lượng:
+ Ước lượng, đo lường các mối quan hệ kinh tế
+ Đối chiếu lý thuyết kinh tế với thực tế và kiểm định sự phù hợp của
các lý thuyết kinh tế.
+ Dự báo các biến số kinh tế
- Cách lựa chọn mô hình tốt:
+ Xác định số biến độc lập có trong mô hình
● Từ đơn giản đến tổng quát
● Từ tổng quát đến đơn giản
+ Kiểm tra các trường hợp khuyết tật của mô hình do vi phạm các giả
thiết OLS
● Kiểm tra các vấn đề: đa cộng tuyến, phương sai thay đổi, tự
tương quan
● Khắc phục các trường hợp vi phạm
+ Chọn dạng hàm
● Dựa vào cơ sở lý thuyết kinh tế
● Dựa vào kết quả thực nghiệm, so sánh các dạng hàm khác
nhau
+ Chọn mô hình dựa trên các tiêu chuẩn: R2, L, AIC, SIC.
- Có 3 loại số liệu chính trong Kinh tế lượng:
+ Số liệu thời gian: số liệu của một biến số kinh tế qua nhiều mốc thời
gian
+ Số liệu chéo: số liệu của một biến số kinh tế tại một mốc thời gian
+ Số liệu hỗn hợp: số liệu của nhiều biến số kinh tế qua nhiều mốc thời
gian

CHƯƠNG 1: MÔ HÌNH HỒI QUY HAI BIẾN

1. Hàm hồi quy tổng thể:


Yi = β1 + β2.Xi + Ui
Trong đó:
Yi: Giá trị biến phụ thuộc Xi: Giá trị biến độc lập
β1: hệ số chặn (tung độ gốc) β2: hệ số góc (độ dốc)
Ui: sai số

2. Hàm hồi quy mẫu:

Yi = β^1 + β^2.Xi + ei = Y^i + ei


β^1: ước lượng điểm của hệ số chặn (tung độ gốc)
β^2: ước lượng điểm của hệ số góc
ei: ước lượng điểm của sai số Ui

2.1. Ước lượng các tham số của mô hình

2.2. Các giả thiết của mô hình:


Giả thiết 1: Các giá trị Xi cho trước và không ngẫu nhiên
Giả thiết 2: Các sai số Ui là đại lượng ngẫu nhiên có giá trị trung bình bằng 0
Giả thiết 3: Các sai số Ui là đại lượng ngẫu nhiên có phương sai không thay đổi
Giả thiết 4: Không có sự tương quan giữa các Ui
Giả thiết 5: Không có sự tương quan giữa Ui và Xi
Khi các giả thiết này được đảm bảo thì các ước lượng tính được bằng phương
pháp OLS là các ước lượng tốt nhất và hiệu quả nhất của hàm hồi quy tổng thể
Ta nói, ước lượng OLS là ước lượng BLUE (Best Linear Unbias Estimator)

3. Hệ số xác định của phương trình hồi quy:


Tổng bình phương toàn phần:
Tổng bình phương hồi quy:
Tổng bình phương phần dư:

Hệ số xác định của mô hình là R2. Xác định sự phù hợp của mô hình.
Ý nghĩa: biến độc lập giải thích được R 2% của biến phụ thuộc → 0 ≤ R2 ≤ 1

Dữ liệu chéo: thường là 0,2 ≤ R2 ≤ 0,5


Dữ liệu thời gian: thường là 0,5 ≤ R2 ≤ 0,9

4. Hệ số tương quan r:

(chỉ áp dụng cho hồi quy hai biến)


- Ý nghĩa: Hệ số tương quan r thể hiện mối quan hệ tương quan giữa 2
biến bất kỳ trong mô hình.
- Hệ số r càng lớn → 2 biến có tương quan chặt chẽ với nhau → Biến độc lập
có tác động mạnh đến biến phụ thuộc.
- Tập giá trị: -1 ≤ r ≤ 1
- Chú ý: Trong mô hình hồi quy hai biến, r2 = R2 (Dấu của r phụ thuộc vào
dấu của hệ số góc β2, dương thì mang dấu dương, âm mang dấu âm)

5. Phương sai và sai số chuẩn:


5.1. Phương sai:
Phương sai mẫu:

5.2. Sai số chuẩn (độ lệch chuẩn):

Se(β^1) = √❑ Se(β^2) = √❑

6. Khoảng tin cậy:


ĐTC: 95% 𝞪 =5% (Mức ý nghĩa)
Khoảng tin cậy của β2

Ý nghĩa: Khi (biến độc lập) tăng 1tr đồng/năm, với ĐK các yếu tố khác không đổi,
(biến phụ thuộc) trung bình tăng lên trong khoảng (KTC β2) tr đồng/năm và
đúng được 95%.
Khoảng tin cậy của β1

Ý nghĩa: Khi (biến độc lập) bằng 0, (biến phụ thuộc) chi tiêu trung bình trong
khoảng (KTC β1) tr đồng/năm và đúng được 95%.

7. Kiểm định giả thuyết về hệ số hồi quy:


Đặt giả thuyết:
H0: β2 = β0
H1: β2 =/ β0
Cách 1: Dùng khoảng tin cậy
Nếu β0 thuộc khoảng tin cậy thì chấp nhận giả thuyết H0.
Ý nghĩa: (Biến độc lập) tăng 1tr đồng/năm thì (biến phụ thuộc) tăng β 0
đồng/năm với ĐTC 95%.
Nếu β0 không thuộc khoảng tin cậy thì bác bỏ giả thuyết H0.
Ý nghĩa: (Biến độc lập) thật sự tác động đến (biến phụ thuộc) với ĐTC 95%.
Cách 2: Dùng kiểm định t (pp giá trị tới hạn)
Tính t0 = (β2 - β0)/Se(β2) rồi tra bảng t-Student
→ Nếu t0 < -t𝛂/2(n-2) hoặc t0 > t𝛂/2(n-2) thì bác bỏ giả thuyết H0 với độ tin cậy…
→ Nếu -t𝛂/2(n-2) ≤ t0 ≤ t𝛂/2(n-2) thì chấp nhận giả thuyết H0 với độ tin cậy.
Cách 3: Dùng Pvalue-t(β2)
Nếu Pvalue ≤ alpha thì bác bỏ giả thuyết H0 với độ tin cậy… và ngược lại.

8. Kiểm định sự phù hợp của mô hình:


Đặt giả thuyết:
H0: R2 = 0 (biến độc lập không giải thích gì cho biến phụ thuộc)
H1: R2 =/0 (có ít nhất 1 biến tác động biến phụ thuộc)
Tính Fc = [R2.(n-k)]/[(1-R2).(k-1)]
Tra bảng tìm F(1,n-k), mức ý nghĩa 𝞪
→ Nếu Fc > Falpha(k-1;n-k) thì bác bỏ giả thuyết H0 với độ tin cậy… và ngược lại.

9. Dự báo
9.1. Dự báo điểm: Tính giá trị Y^i tại điểm Xi xác định với hệ số ước lượng β^1 và
β^2 ta có được dự báo điểm của Yi. Nói cách khác, dự báo điểm của Y i chính là giá
trị ước lượng Y^i
9.2. Dự báo giá trị trung bình của Y^i
Tính giá trị Y^i tại điểm Xi xác định với hệ số ước lượng β^1 và β^2
10. Đổi đơn vị
Yi= k1.Yi* / X2 = k2.X2* / …
Pt gốc: Yi = b1 + b2.X2 → Pt sau khi đổi: Yi* = k1.b1 + k1/k2.b2.Xi*

11. Mở rộng:
11.1. Mô hình hồi quy qua gốc tọa độ:

Phương trình hồi quy tổng thể: Yi = β2.Xi + Ui


Công thức tính:
Trong mô hình hồi quy qua gốc tọa độ, không dùng R 2 mà dùng R2thô, có công

thức là:
11.2. Hàm log - log:

Phương trình hồi quy tổng thể: lnYi = β1 + β2.lnXi + Ui


Đọc ý nghĩa: Khi X thay đổi 1 % thì Y thay đổi β2%.
11.3. Hàm log - lin:

Phương trình hồi quy tổng thể: lnYi = β1 + β2.Xi + Ui


Đọc ý nghĩa: Khi X thay đổi 1 đơn vị thì Y thay đổi 100β2%
Ứng dụng: NC tốc độ tăng trưởng các biến
11.4. Hàm lin - log:

Phương trình hồi quy tổng thể: Yi = β1 + β2.lnXi + Ui


Đọc ý nghĩa: Khi X thay đổi 1% thì Y thay đổi β2/100 đơn vị
Ứng dụng: NC khảo sát một số quan hệ

CHƯƠNG 2: MÔ HÌNH HỒI QUY BỘI


Khúc đầu giống với chương 1, không có gì mới
Khi hai biến độc lập thay đổi

Kiểm định quan hệ giữa các hệ số hồi quy


Biến X2 tăng a đơn vị và biến X3 tăng b đơn vị
Đặt giả thuyết:
H0: aβ2 + bβ3 = 0
H1: aβ2 + bβ3 =/ 0
Cách 1 - Dùng khoảng tin cậy
Tính Se(aβ2 + bβ3) = √ ❑
Tính khoảng tin cậy công thức bình thường
Cách 2 - Dùng kiểm định t
Tính t0 = (aβ2 + bβ3)/Se(aβ2 + bβ3) và đi tra bảng

CHƯƠNG 3: HỒI QUY VỚI BIẾN GIẢ


Dùng biến giả để gán giá trị cho các biến định tính (có ít lựa chọn về giá trị)
1. Kiểm định cấu trúc và tính ổn định của mô hình:
Khi hồi quy một mẫu số liệu theo chuỗi thời gian, giá trị tham số hồi quy có thể
bị biến động. Nguyên nhân:
- Tác động bởi môi trường bên ngoài
- Do chính sách của Nhà nước thay đổi
- Thay đổi từ môi trường nội bộ doanh nghiệp
- Giai đoạn trước và sau hôn nhân đối với thu nhập và chi tiêu của cá nhân
Đặt giả thiết:
H0: Cấu trúc không đổi
H1: Cấu trúc thay đổi
Cách 1 - Kiểm định Chow:
- Chạy 3 mô hình: n biến có RSSR bậc (n-k), n1 biến có RSS1 bậc (n1 - k), n2
biến có RSS2 bậc (n2 - k)
- So sánh hệ số hồi quy tương ứng:
+ Nếu chúng giống nhau thì cấu trúc không đổi
+ Nếu chúng khác nhau thì:
● Tính RSSU = RSS1 + RSS2 bậc tự do (n- 2k)
● Tính Fc:

○ Nếu Fc > Fanpha(k; n - 2k) → Bác bỏ giả thiết


○ Nếu Fc < Fanpha(k; n - 2k) → Chấp nhận giả thiết
*Với k là số tham số trong mô hình gốc (mô hình có RSS R á)*
Dấu hiệu nhận biết của kiểm định Chow là 3 cái bảng, một bảng mô hình
gốc và hai bảng còn lại có số lượng quan sát bằng một nửa.
Hạn chế của Kiểm định Chow:
- Khi có sự khác nhau giữa hai thời kỳ (hoặc something like that), chúng ta
không b iết chúng khác nhau ở hệ số góc, hệ số chặn hay cả hai
- Số quan sát phải đủ lớn để khi chia đôi không bị quá ít quan sát

Cách 2 - Dùng biến giả:


Giả thuyết: Ho: b3=b4=0 (cấu trúc không đổi)
H1: b3^2 + b4^2 =/ 0 (cấu trúc thay đổi)
Phương trình: Yi = β1 + β2.Xi + β3.Di + β4.Di.Xi + Ui
D = 1 với bộ dữ liệu có n1 giá trị (Ví dụ: bộ dữ liệu thời kỳ 1 hoặc bộ dữ liệu của
nữ,...)
D = 0 với bộ dữ liệu có n2 giá trị (Ví dụ: bộ dữ liệu thời kỳ 2 hoặc bộ dữ liệu của
nam,...)
- Ước lượng mô hình hồi quy với biến giả thu được RSS U
- Ước lượng mô hình hồi quy không có biến giả (gốc) thu được giá trị RSS R
- Tính FC:

+ Nếu Fc > Fanpha(k; n - 2k ) → Bác bỏ giả thiết


+ Nếu Fc < Fanpha(k; n - 2k) → Chấp nhận giả thiết
*Với k là số tham số trong mô hình gốc (mô hình có RSS R á)*

Dấu hiệu nhận biết là sẽ có 2 bảng, 1 bảng là mô hình gốc và một bảng có số
tham số gấp đôi.

2. Ý nghĩa của hệ số hồi quy gắn với biến giả:


Giả sử biến phụ thuộc là tiền lương
2.1. Mô hình bình thường:

Phương trình: Yi = β1 + β2.Xi + β3.Di + Ui (Di là biến giả

1:nam,0:nữ)
Đọc ý nghĩa β3: β3 là sự chênh lệch tiền lương giữa nhân viên nam và nhân viên
nữ
2.2. Mô hình log - lin:

Phương trình: lnYi = β1 + β2.Xi + β3.Di + Ui


Đọc ý nghĩa β3:
+ (eß3 -1) là phần trăm chênh lệch tiền lương giữa nhân viên nam và nhân
viên nữ (so với lương nữ)
+ eß1 là mức lương khởi điểm của nhân viên nữ
+ eß1 + ß3 là mức lương khởi điểm của nhân viên nam
2.3. Mô hình lin - log:

Phương trình: Yi = β1 + β2.lnXi + β3.Di + Ui


Đọc ý nghĩa β3:
+ β1 là mức lương khởi điểm của nhân viên nữ
+ β3 là mức chênh lệch tiền lương giữa hai nhân viên nam và nữ
+ β1 + β3 là mức lương khởi điểm của nhân viên nam

CHƯƠNG 4: ĐA CỘNG TUYẾN

1. Khái niệm:
“Đa cộng tuyến ”là hiện tượng các biến độc lập trong mô hình phụ thuộc lẫn
nhau và thể hiện được dưới dạng hàm số
- Đa cộng tuyến hoàn hảo: là hiện tượng các biến độc lập quan hệ với nhau
theo dạng a2.X2 + a3.X3 +...+ ak.Xk = 0. Trường hợp đa cộng tuyến hoàn hảo
thì không thể ước lượng được các hệ số trong mô hình mà chỉ có thể ước
lượng được một tổ hợp tuyến tính của các hệ số đó. r=1
- Đa cộng tuyến không hoàn hảo: là hiện tượng các biến độc lập quan hệ với
nhau theo dạng a2.X2 + a3.X3 +...+ ak.Xk + V = 0. Vẫn có thể ước lượng mô
hình HQ, hệ số của mô hình nhưng có tồn tại những hậu quả của đa cộng
tuyến không hoàn hảo. 0<r<1
2. Nguyên nhân đa cộng tuyến
- Do phương pháp thu thập dữ liệu:
+ Các giá trị của các biến độc lập phụ thuộc lẫn nhau trong mẫu,
nhưng không phụ thuộc lẫn nhau trong tổng thể
+ Các biến độc lập được chọn có quan hệ nhân quả hay có mối quan
hệ tương quan cao vì cùng phụ thuộc vào một điều kiện khác
- Kích cỡ mẫu quá nhỏ
- Sai dạng mô hình
- Các biến độc lập quan sát theo dữ liệu thời gian
3. Hậu quả của đa cộng tuyến
- Phương sai của các ước lượng theo OLS lớn
- Sai số chuẩn của các hệ số hồi quy sẽ lớn. Do đó:
+ Khoảng tin cậy lớn và việc kiểm định ít có ý nghĩa.
+ Giả thiết H0 luôn dễ dàng được chấp nhận
- Tỷ số t nhỏ → Tăng khả năng chấp nhận giả thiết
- Các ước lượng và sai số chuẩn của ước lượng rất nhạy cảm với sự thay đổi
của dữ liệu. Chỉ cần một sự thay đổi nhỏ trong mẫu dữ liệu sẽ kéo theo sự
thay đổi lớn các hệ số ước lượng
- Dấu của các ước lượng của các hệ số hồi quy có thể sai
- Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ
thay đổi về dấu hoặc thay đổi về độ lớn của các ước lượng
4. Nhận biết đa cộng tuyến: Có 4 cách cơ bản để nhận biết đa cộng tuyến
4.1. Hệ số xác định R2 cao (>90%) và t thấp (<2)
4.2. Hệ số tương quan giữa hai biến độc lập cao (>0,8)
4.3. Thực hiện hồi quy phụ giữa các biến độc lập
- Chọn 1 biến độc lập làm biến phụ thuộc và kiểm định R 2 mô hình
+ Nếu mô hình phù hợp (R2=/0) → Mô hình gốc có hiện tượng đa cộng
tuyến
+ Nếu mô hình không phù hợp (R2 =0) → Mô hình gốc không có hiện
tượng đa cộng tuyến.
4.4. Sử dụng hệ số phóng đại phương sai của 1 mô hình hồi quy phụ
- VIF = 1/1-R2 (với R2 là hệ số xác định của mô hình hồi quy phụ).
Nếu VIF >10 thì xảy ra đa cộng tuyến (càng lớn thì cộng tuyến càng cao)
5. Khắc phục đa cộng tuyến
5.1. Bỏ qua đa cộng tuyến: Chúng ta có thể bỏ qua đa cộng tuyến nếu như
- Các biến bị đa cộng tuyến vẫn đúng dấu và có ý nghĩa thống kê.
- Mô hình chỉ dùng để dự báo chứ không dùng để kiểm định
5.2. Thu thập thêm số liệu hoặc lấy thêm mẫu mới: để làm mẫu lớn hơn
5.3. Sử dụng thông tin tiền nghiệm: ví dụ như phương trình đặc trưng của năng
suất lao động theo quy mô
5.4. Sử dụng sai phân cấp 1

Dấu hiệu là một cái bảng có các biến độc lập là d. ở phía trước

5.5. Bỏ biến bị đa cộng tuyến: nếu như biến đó mất ý nghĩa thống kê
Dấu hiệu là một cái bảng thiếu mất biến bị đa cộng tuyến

CHƯƠNG 5: PHƯƠNG SAI THAY ĐỔI


1. Bản chất phương sai thay đổi:
1.1. Khái niệm PSSS thay đổi
- Là hiện tượng mà sai số của các giá trị ước lượng thay đổi
1.2. Lý do phương sai sai số thay đổi
- Do bản chất của mối quan hệ kinh tế: các mối quan hệ qua thời gian biểu
hiện khác nhau nên sai số khác nhau. Ví dụ mối quan hệ giữa thu nhập và
tiết kiệm thì thu nhập cao thì kỳ vọng tiết kiệm nhiều nhưng thực ra họ tiết
kiệm ít.
- Do hành vi của con người trong các hoạt động ngày càng hoàn thiện: ngày
càng hoàn thiện thì sai số càng giảm xuống
- Sai số tính toán có xu hướng giảm xuống, kéo theo phương sai giảm: do
công nghệ tính toán ngày càng chính xác (điện toán đám mây các thứ)
- Phương sai thay đổi đôi khi do ta xác định sai dạng mô hình
2. Hậu quả của phương sai thay đổi
- Các ước lượng OLS của các HSHQ vẫn là ước lượng không chệch
- Các ước lượng OLS không còn là ước lượng tốt nhất
- Các kết luận về kiểm định không còn giá trị vì mất độ tin cậy.
3. Nhận biết phương sai thay đổi: (nếu dùng stata thì chắc cô chỉ dùng White
hoặc BP thôi)
3.1. Kiểm định Park
- Ước lượng mô hình hồi quy gốc, lấy phần dư RESID (ei)
- Ước lượng mô hình với ln(RESID2) với từng biến độc lập
lnei2 = β1 + β2.lnXi + vi
- Kiểm định β2
+ Nếu β2 =/ 0 thì có hiện tượng phương sai thay đổi
+ Nếu β2 = 0 thì không có hiện tượng phương sai thay đổi

Dấu hiệu nhận biết là sẽ có 2 bảng, 1 bảng là mô hình gốc và một bảng có biến
phụ thuộc là ln(residual^2) và những thứ tương tự như z
*Hạn chế của kiểm định Park:
- Sai số ei phụ thuộc vào sai số v i. Nếu sai số vi bị phương sai thay đổi thì
những kiểm định xem như vô nghĩa.
- Mỗi lần chỉ kiểm định được 1 biến độc lập
3.2. Kiểm định Glejser
- Ước lượng mô hình hồi quy gốc, lấy phần dư RESID (ei)
- Ước lượng mô hình với ABS(RESID) với từng biến độc lập theo 6 mô hình.
- Kiểm định β2
+ Nếu β2 =/ 0 thì có hiện tượng phương sai thay đổi
+ Nếu β2 = 0 thì không có hiện tượng phương sai thay đổi

Dấu hiệu nhận biết là sẽ có 2 bảng, 1 bảng là mô hình gốc và một bảng có biến
phụ thuộc là abs(residual) và những thứ tương tự như z
*Hạn chế của kiểm định Glejser
- Sai số ei phụ thuộc vào sai số v i. Nếu sai số vi bị phương sai thay đổi thì
những kiểm định xem như vô nghĩa.
- Mỗi lần chỉ kiểm định được 1 biến độc lập
- Hai mô hình cuối không phải mô hình tuyến tính
- Bốn mô hình cuối đều có điều kiện toán học để Xi xác định.

3.3. Kiểm định White


- Ước lượng mô hình gốc lấy phần dư RESID (ei)
- Ước lượng mô hình hồi quy với biến phụ thuộc ei2 và biến độc lập là Xi,Xi2,
và Xi.Xj.
- Đặt giả thiết: H0: Phương sai không thay đổi H1: Phương sai thay đổi
- Kiểm định
Cách 1: So sánh LM=n.R2 với giá trị Chi-squarea(k) tra bảng. (với k là số
tham số trong mô hình hồi quy phụ không tính hệ số tự do).
Nếu n.R2 > Chi -squarea(k) thì bác bỏ H0 → Phương sai thay đổi
Cách 2: So sánh Prob Chi-square với giá trị alpha, bé hơn alpha thì bác bỏ
H0 và mô hình có phương sai thay đổi.

Dấu hiệu nhận biết là sẽ có 2 bảng, 1 bảng là mô hình gốc.


- TH1: Một bảng có biến phụ thuộc là residual^2 và những thứ tương tự
như z, list biến độc lập dài đăng đẳng.
- TH2: Một bảng có chữ là “White’s test for H0”

3.4. Kiểm định G-Q: ít xài lắm, nào rảnh thì học
3.5. Kiểm định BP:
- Ước lượng mô hình gốc lấy phần dư RESID (ei)
- Ước lượng mô hình hồi quy với biến phụ thuộc ei2 và các biến độc lập
- Đặt giả thiết: H0: Phương sai không thay đổi H1: Phương sai thay đổi
- Kiểm định
Cách 1: So sánh LM=n.R2 với giá trị Chi-squarea (k) tra bảng. (với k là số
tham số trong mô hình hồi quy phụ không tính hệ số tự do). Nếu n.R2 >
Chi -squarea (k) thì bác bỏ H0 → Phương sai thay đổi
Cách 2: So sánh Prob Chi-square với giá trị alpha, bé hơn alpha thì bác bỏ
H0 và mô hình có phương sai thay đổi.
Cách 3: Tính F0 = [R2.(n-k)]/[(k-1).(1-R2)]. So sánh F0 với F(k-1;n-k) (với k là
số tham số trong mô hình hồi quy phụ). Nếu F0 > F(k-1;n-k) thì bác bỏ H0
và mô hình có phương sai thay đổi.

Dấu hiệu nhận biết là sẽ có 2 bảng, 1 bảng là mô hình gốc


- TH1: Một bảng có biến phụ thuộc là residual^2 và những thứ tương tự
như z, các biến độc lập bình thường.
- TH2: Một bảng có chữ Breusch - Pagan

4. Khắc phục phương sai sai số thay đổi


4.1. Xem xét vấn đề thiếu biến hoặc chọn sai hàm
4.2. Sử dụng phép biến đổi logarit

Dấu hiệu nhận biết là sẽ có một bảng với các biến toàn là ln

4.3. Sử dụng trọng số


Chia 2 vế mô hình cho Xi, căn(Xi), Yi^, e

Dấu hiệu nhận biết chưa biết nên chưa ghi

4.4. Ước lượng lại sai số chuẩn:

Dấu hiệu nhận biết là hai bảng có chung biến phụ thuộc và biến độc lập những
khác nhau sai số chuẩn Se

CHƯƠNG 6: TỰ TƯƠNG QUAN

1. Bản chất và nguyên nhân của tự tương quan


1.1. Khái niệm: Là hiện tượng thường xảy ra với dữ liệu thời gian khi giá trị của
năm t + 1 phụ thuộc vào giá trị ở năm t.
- Ví dụ về tự tương quan bậc 1: Xi = q.Xi-1 + vi
+ q > 0: mô hình có tự tương quan bậc 1 dương
+ q < 0: mô hình có tự tương quan bậc 1 âm
+ q = 0: mô hình không có tự tương quan bậc 1
- Tự tương quan bậc p (nghĩa là giá trị một năm được biểu diễn bới p năm
trước nó): Xi = q1.Xi-1 + q2.Xi-2 +....+ qp.Xi-p + vi.
1.2. Nguyên nhân
- Nguyên nhân khách quan:
+ Chuỗi có tính chất quán tính theo thời gian: chuỗi tăng hoặc giảm
dần qua các năm do một lý do nào đó
+ Hiện tượng mạng nhện: biến phụ thuộc của năm nay phụ thuộc vào
giá trị của biến độc lập năm trước đó. Ví dụ: nghiên cứu ảnh hưởng
của giá gạo đến cung gạo. Tuy nhiên cái cung gạo năm nay cũng
phụ thuộc vào giá gạo năm trước.
+ Dữ liệu có tính chất trễ: biến phụ thuộc năm nay phụ thuộc vào
biến phụ thuộc năm trước. Tức là cùng một biến độc lập tác động
nhưng giá trị của biến phụ thuộc sẽ cao nếu năm trước nó cao sẽ
thấp nếu năm trước nó thấp. Ví dụ: tiêu dùng kỳ này phụ thuộc vào
thu nhập kỳ này và cả tiêu dùng kỳ trước.
- Nguyên nhân chủ quan:
+ Chọn sai dạng mô hình
+ Đưa thiếu biến vào mô hình
+ Thói quen xử lý số liệu. Ví dụ: có thu nhập cả năm muốn tìm một
quý thì đem chia 4.
2. Hậu quả của tự tương quan:
Nếu vẫn áp dụng OLS khi mô hình có hiện tượng tự tương quan thì sẽ có các hậu
quả sau:
- Các ước lượng không chệch nhưng không còn là các ước lượng hiệu quả
- Phương sai của các ước lượng là các ước lượng chệch vì vậy các kiểm định
t và F không còn hiệu quả.
- Có khả năng ước lượng quá cao R2
- Các dự báo về Y không chính xác
3. Kiểm định hiện tượng tự tương quan
3.1. Kiểm định tự tương quan bậc 1:
- Kiểm định t:
+ Ước lượng mô hình gốc và lấy phần dư ei
+ Biểu diễn phần dư ei theo ei-1: ei = q.ei-1 + vi
+ Kiểm định hệ số q bằng thống kê t hoặc Prob-t (giống các bài trên)
- Sử dụng hệ số Durbin Watson
+ Ước lượng mô hình gốc lấy phần dư
+ Có được số Durbin Watson
+ Tra bảng dL và dU mức ý nghĩa 5%, bậc k (số tham số trong mô hình
không tính hệ số chặn), n là số quan sát

Có ttq Ko kết Không Ko kết Có ttq


có ttq âm
dương luận luận

0 dL dU 4 - dU 4 - dL 4
3.2. Kiểm định tự tương quan bậc p: sử dụng kiểm định B-G hoặc dùng Durbin
watson.
3.3. Dùng trên STATA.
Đặt giả thuyết
H0: Mô hình không có hiện tượng tự tương quan
H1: Mô hình có hiện tượng tự tương quan

- Dùng hệ số Durbin watson:


+ Dùng câu lệnh estat dwatson → hệ số Durbin watson
+ Kiểm định bằng cách tra bảng như bình thường

- Dùng phương pháp kiểm định BG:

- Dùng Prob>Chi2 sau mỗi bậc để so sánh với mức ý nghĩa alpha.

4. Khắc phục tự tương quan:


4.1. Khắc phục tự tương quan bằng hồi quy OLS

Dấu hiệu nhận biết là một cái bảng như bình thường nhưng có hai cái dòng
Durbin-Watson ở phía dưới
4.2. Khắc phục tự tương quan bằng phần dư

Dấu hiệu nhận biết là một cái bảng như bình thường nhưng có hai cái dòng
Durbin-Watson ở phía dưới

4.3. Khắc phục tự tương quan bằng Durbin Watson

Dấu hiệu nhận biết là một cái bảng như bình thường nhưng có hai cái dòng
Durbin-Watson ở phía dưới

CHƯƠNG 7: CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH VIỆC CHỌN MÔ HÌNH

1. Các thuộc tính lựa chọn một mô hình tốt


- Đơn giản
- Tính đồng nhất
- Tính thích hợp (R2)
- Tính bền vững về mặt lý thuyết
- Khả năng dự báo cao
2. Cách lựa chọn mô hình tốt
- Bước 1: Xác định số biến độc lập có trong mô hình
+ Từ đơn giản đến tổng quát
+ Từ tổng quát đến đơn giản
- Bước 2: Kiểm tra các trường hợp khuyết tật của mô hình do vi phạm các
giả thiết OLS
+ Kiểm tra các vấn đề: đa cộng tuyến, phương sai thay đổi, tự tương
quan
+ Khắc phục các trường hợp vi phạm
- Bước 3: Chọn dạng hàm
+ Dựa vào cơ sở lý thuyết kinh tế
+ Dựa vào kết quả thực nghiệm, so sánh các dạng hàm khác nhau
- Bước 4: Dựa vào các chỉ tiêu như R2, R2hc, giá trị L, tiêu chuẩn AIC, SIC
3. Các sai lầm khi chọn mô hình
3.1. Bỏ sót biến thích hợp
*Hậu quả của việc bỏ sót biến
- Các ước lượng thu được là ước lượng chệch của các tham số trong mô
hình đúng.
- Các ước lượng thu được không phải là ước lượng vững.
- “Phương sai của các ước lượng trong mô hình sai” lớn hơn “phương sai
trong mô hình đúng”.
- Khoảng tin cậy rộng, các kiểm định không còn tin cậy nữa
3.2. Đưa những biến không thích hợp vào mô hình
*Hậu quả của việc đưa các biến không thích hợp vào mô hình
- Các ước lượng thu được từ mô hình sai là không hiệu quả vì:
+ Phương sai của các ước lượng trong mô hình sai lớn hơn trong mô
hình.
+ Khoảng tin cậy rộng, các kiểm định không còn tin cậy nữa
3.3. Lựa chọn sai dạng mô hình
*Hậu quả của việc lựa chọn sai dạng mô hình
- Ước lượng chệch các hệ số hồi quy, thậm chí có thể dẫn đến dấu của các
hệ số hồi quy có thể sai.
- Có thể có rất ít hệ số hồi quy có ý nghĩa thống kê.
- R2 biểu hiện cho mức độ phù hợp của mô hình hồi quy có thể không cao.
- Phần dư của các quan sát có thể lớn xét về giá trị tuyệt đối và biểu thị sự
biến thiên có tính chất hệ thống
4. Phương pháp phát hiện những sai lầm:
4.1. Kiểm định biến bị bỏ sót (có số liệu)
- Cách 1: Kiểm định hệ số của biến xem bằng 0 hay khác 0 (khoảng tin cậy,
kiểm định t, P Value)
- Cách 2: Kiểm định Wald
+ Xét mô hình U có tất cả các biến hiện có (k biến)
+ Bỏ bớt m biến được phương trình R
+ Tính Fc = [(RSSR - RSSU)/m]/[RSSU/(n-k)]
+ So sánh với Falpha(m;n-k) nếu lớn hơn thì thiếu biến còn nhỏ hơn thì
không thiếu biến.
- Cách 3: Sử dụng R2 và R2 hiệu chỉnh
+ So sánh độ hiệu quả của 2 mô hình cùng số biến thì sử dụng R 2
+ So sánh độ hiệu quả của 2 mô hình khác số biến thì sử dụng R 2hc.

CÂU LỆNH CHO STATA


Xóa dữ liệu clear

Xuất bảng hồi quy reg [biến phụ thuộc] [biến độc lập]

Xuất bảng hồi quy có điều kiện reg [biến phụ thuộc] [biến độc lập] if _n<11 (tức là lấy 10
quan sát)

Tính khoảng tin cậy 90% từ bảng reg [biến phụ thuộc] [biến độc lập], level(90)
hồi quy có sẵn

Kiểm định hệ số hồi quy test [biến độc lập] = beta0

Tạo biến gen [tên biến] = Công thức

Chạy hàm hồi quy không có tung reg [biến phụ thuộc] [biến độc lập], noconstant
độ

Tính Cov estat vce

Tính hệ số tương quan corr (tên các biến, không quan trọng thứ tự)

Chạy sai phân cấp 1 với dữ liệu thời reg d.[tên biến phụ thuộc] d.[tên biến độc lập]
gian

Chạy kiểm định White imtest, white (sau khi chạy hồi quy mô hình gốc)

Chạy kiểm định BP estat hettest (sau khi chạy hồi quy mô hình gốc)

Ước lượng vững của ma trận hiệp reg [tên biến phụ thuộc] [tên biến độc lập], robust
phương sai (khắc phục PSSS)

Tạo biến lấy phần dư predict [tên biến tự đặt], residuals

Chạy mô hình trọng số reg [tên biến phụ thuộc] [tên biến độc lập
[aweight=1/[tên biến chọn làm trọng số]

Xác định dữ liệu thời gian tsset [tên biến thời gian]

Tính giá trị durbin watson estat dwatson

Kiểm định P Value của Chi 2 để kết estat durbinalt


luận tự tương quan bậc 1

Kiểm tra tự tương quan bậc p estat bgodfrey, lags(1/p)

Khắc phục tự tương quan bằng GLS prais [tên biến phụ thuộc] [tên biến độc lập], options

Khắc phục tự tương quan bằng hồi prais [tên biến phụ thuộc] [tên biến độc lập],
rhotype(regress)
quy OLS

Khắc phục tự tương quan bằng prais [tên biến phụ thuộc] [tên biến độc lập],
rhotype(tscorr)
phần dư

Khắc phục tự tương quan bằng prais [tên biến phụ thuộc] [tên biến độc lập],
rhotype(dw)
Durbin Watson

Ma trận ước lượng hiệp phương sai newey [tên biến phụ thuộc] [tên biến độc lập], lag(p)

bậc p

You might also like