You are on page 1of 6

Bài tập kiểm tra các khuyết tật

Câu 1: Cho mô hình hồi quy: . Người ta thực hiện hồi quy bằng phương
pháp OLS.
a) Hãy nêu một số cách để kiểm tra hiện tượng đa cộng tuyến của mô hình.
b) Cho kết quả hồi quy phụ sau:
Dependent Variable: X2
Included observations: 24

Variable Coefficient Std. Error t-Statistic Prob.

C -597.0432 622.8575 -0.958555 0.3487


X3 24.76406 24.86943 0.995764 0.0005

R-squared 0.99406     F-statistic 1.636949


Durbin-Watson
stat 0.878599     Prob(F-statistic) 0.000000

Bảng kết quả trên cho biết điều gì về hiện tượng đa cộng tuyến của mô hình ban đầu?
Câu 2: Cho kết quả hồi quy với dữ liệu từ quý 1 năm 1990 đến quý 4 năm 1997.
- GDP: tổng thu nhập quốc dân. M2: cung tiền LP: Tỉ lệ lạm phát
Dependent Variable: GDP
Sample: 1990Q1 1997Q4
Included observations: 32

Variable Coefficient Std. Error t-Statistic Prob.

C -59176.78 4434.550 -13.34448 0.0000


M2 93.33549 54.68500 1.706784 0.0986
LP 983.3676 99.23159 9.909825 0.0000

R-squared 0.956275     Mean dependent var 49256.50


Adjusted R-squared 0.953260     S.D. dependent var 6378.279
Log likelihood -275.1616     F-statistic 317.1186
Durbin-Watson stat 0.447401     Prob(F-statistic) 0.0000
a) Cho kết quả hồi quy sau trên cùng bộ số liệu. Nêu nhận xét của bạn về hiện tượng đa cộng tuyến
của mô hình hồi quy ban đầu.
Dependent Variable: LP
Sample: 1990Q1 1997Q4
Included observations: 32

Variable Coefficient Std. Error t-Statistic Prob.

C 26.64506 6.550160 4.067849 0.0003


M2 0.490765 0.045769 10.72270 0.0000
R-squared 0.912034     Mean dependent var 96.71563
Log likelihood -74.16624     F-statistic 311.0409
Durbin-Watson stat 0.143833     Prob(F-statistic) 0.000000

b) Đề xuất hướng khắc phục hiện tượng đa cộng tuyến.


c) Nêu định nghĩa hiện tượng đa cộng tuyến.
Câu 3: Cho EX là tổng giá trị xuất khẩu, GAP là tổng sản phẩm nông nghiệp, GIP là tổng sản phẩm công
nghiệp của Việt Nam (đơn vị tính: triệu USD). Thực hiện hồi quy với số liệu trong giai đoạn 1986 – 2010
người ta thu được bảng kết quả:
Dependent Variable: EX
Included observations: 25

Variable Coefficient Std. Error t-Statistic Prob.

C 616.0880 1517.436
GAP -1.150342 0.610231
GIP 2.254334 0.272353

R-squared 0.986036

Người ta thực hiện tiếp kiểm định White và thu được kết quả như sau:
Heteroskedasticity Test: White

F-statistic 18.47257    Prob. F(1,30) 0.00006


Obs*R-squared 18.06602    Prob. Chi-Square(1) 0.00001
a) Hãy nêu kết luận từ kiểm định White với mức ý nghĩa 5%.
b) Hãy viết mô hình hồi quy phụ và nêu các bước thực hiện kiểm định White.

Câu 4: Kí hiệu CT, TN, TS lần lượt là chi tiêu, thu nhập và tài sản của người lao động; KV là biến giả đại
diện cho khu vực sống của người lao động, KV = 1 nếu người lao động ở trung tâm thành phố, KV = 0
nếu người lao động ở ngoại thành. Với số liệu điều tra từ 35 người lao động, người ta thực hiện hồi quy
theo 2 mô hình:

Mô hình 1: thu được hệ số xác định = 0,67

Mô hình 2: thu được hệ số xác định = 0,7


a) Với mức ý nghĩa 5%, theo kiểm định Wald ta có nên bỏ biến KV ở mô hình 2 không?
b) Hãy cho kết luận về các kiểm định dưới đây ở mô hình 2 với mức ý nghĩa 5%.

Heteroskedasticity Test: White

F-statistic 13.43013    Prob. F(1,31) 0.0009


Obs*R-squared 9.975085    Prob. Chi-Square(1) 0.0016
Scaled explained 6.472552    Prob. Chi-Square(1) 0.0110
SS

c) Hồi quy tuyến tính TS theo TN có hệ số chặn thu được ước lượng hệ số góc là 0,43 và sai số
chuẩn là 0,01. Hãy rút ra nhận xét về khuyết tật của mô hình ban đầu với mức ý nghĩa 5% và hậu
quả của nó.

Cho biết
Câu 5: Gọi NPL (đơn vị tính: %) là tỉ lệ nợ xấu trên tổng dư nợ, LTD (đơn vị tính: %) là tỉ lệ dư nợ tín
dụng trên vốn huy động, TR là tổng tài sản của các ngân hàng thương mại (đơn vị tính: tỷ đồng). Thu thập
dữ liệu của 40 ngân hàng, thực hiện hồi quy NPL theo LTD và ln(TR) thu được hàm hồi quy mẫu:

Với mức ý nghĩa 5%, hãy trả lời các câu hỏi sau:
a) Các kết quả sau đây thể hiện điều gì?
Ramsey RESET Test

Value df Probability
t-statistic  0.165484  37  0.8701
F-statistic  0.027385 (1, 37)  0.8701
Likelihood ratio  0.031277  1  0.8596

b) Với số liệu mẫu trên, tiếp tục thực hiện hồi quy bình phương phần dư e theo biến độc lập LTD
thu được kết quả sau:

Với kết quả trên, giả thiết nào của phương pháp OLS bị vi phạm?

Cho biết:
Câu 6: Gọi S là sản lượng của một cơ sở sản xuất, K là nguồn vốn, L là lao động, T là biến số công nghệ.
Khi hồi quy S theo K, L, T thu được kết quả sau:
Dependent Variable: S
Included observations: 34

Variable Coefficient Std. Error t-Statistic Prob.

C -20.6583 22.0029
K 10.7720 2.1599
L 17.2232 4.5279
T 5.8332 4.9235

R-squared 0.71699

a) Người ta nghi ngờ mô hình có hiện tượng đa cộng tuyến, hãy nêu một cách kiểm định hiện tượng
này.
b) Người ta thực hiện hồi quy T theo L, K có hệ số chặn thu được R 2 = 0,6213. Kết quả đó cho biết
điều gì với mức ý nghĩa 5%? Cho biết F0,05(3,30) = 8,62.
Câu 7: Kí hiệu LS là lợi suất cổ phiếu của công ty theo tháng (đơn vị tính: %), V là vốn chủ sở hữu của
công ty (đơn vị tính: trăm tỷ đồng). Có số liệu mẫu qua 33 tháng.
a) Hồi quy mô hình tuyến tính LS theo V có hệ số chặn. Hãy nêu kết quả của các kiểm định với mức
ý nghĩa 5%?
Heteroskedasticity Test: White

F-statistic 1.313742    Prob. F(1,31) 0.2605


Obs*R-squared 1.341642    Prob. Chi-Square(1) 0.2467
Scaled explained SS 1.078157    Prob. Chi-Square(1) 0.2991

b) Có ý kiến cho rằng lợi suất cổ phiếu của một công ty có hiệu ứng tháng giêng, tức là lợi suất cổ
phiếu vào tháng 1 thường cao hơn các tháng khác khi có cùng mức vốn. Hãy hiệu chỉnh mô hình
ở câu a và nêu ý tưởng để kiểm định ý kiến này với mức ý nghĩa ?
c) Gọi e là phần dư khi hồi quy LS theo V. Người ta tiếp tục thực hiện hồi quy e t theo et-1 thu được
ước lượng hệ số góc là 1,248 và sai số chuẩn là 0,025. Mục đích của việc làm này là gì? Cho kết
luận với mức ý nghĩa 5%.
Câu 8: Kí hiệu CT, TN, TS lần lượt là chi tiêu, thu nhập và tài sản của người lao động; KV là biến giả đại
diện cho khu vực sống của người lao động, KV = 1 nếu người lao động ở trung tâm thành phố, KV = 0
nếu người lao động ở ngoại thành.
Với số liệu điều tra từ 35 người lao động, người ta thực hiện hồi quy theo 2 mô hình:

Mô hình 1: thu được hệ số xác định = 0,67

Mô hình 2: thu được hệ số xác định = 0,7


d) Với mức ý nghĩa 5%, theo kiểm định Wald ta có nên bỏ biến KV ở mô hình 2 không?
e) Hãy cho kết luận về các kiểm định dưới đây ở mô hình 2 với mức ý nghĩa 5%.
Breusch-Godfrey Serial Correlation LM Test:

F-statistic 11.17674    Prob. F(2,29) 0.0003


Obs*R-squared 14.36446    Prob. Chi-Square(2) 0.0008

Heteroskedasticity Test: White

F-statistic 13.43013    Prob. F(1,31) 0.0009


Obs*R-squared 9.975085    Prob. Chi-Square(1) 0.0016
Scaled explained 6.472552    Prob. Chi-Square(1) 0.0110
SS

f) Hồi quy tuyến tính TS theo TN có hệ số chặn thu được ước lượng hệ số góc là 0,43 và sai số
chuẩn là 0,01. Hãy rút ra nhận xét về khuyết tật của mô hình ban đầu với mức ý nghĩa 5% và hậu
quả của nó.

Cho biết

Câu 9: Cho các kết quả kiểm định:


5
Series: Residuals
Sample 1 8
4 Observations 8

Mean 4.88e-15
3 Median 0.101207
Maximum 1.054688
Minimum -0.945312
2 Std. Dev. 0.653490
Skewness -0.004000
Kurtosis 2.190166
1
Jarque-Bera 0.218632
Probability 0.896447
0
-1.0 -0.5 0.0 0.5 1.0 1.5

Breusch-Godfrey Serial Correlation LM Test:

F-statistic 0.025066     Probability 0.975367


Obs*R-squared 0.099270     Probability 0.951577

a) Nêu các cách để kiểm định hiện tượng tự tương quan?


b) Nêu mục đích và kết quả của các kiểm định trên với mức ý nghĩa 5%.
Vai trò của giả thiết về phân phối chuẩn của sai số ngẫu nhiên trong phương pháp ước lượng OLS? Nếu
sai số ngẫu nhiên không tuân theo quy luật chuẩn thì tính tin cậy của suy diễn thống kê về các hệ số hồi
quy sẽ thế nào?

Câu 10: Dựa vào dữ liệu về tiền lương hàng tháng (WAGE, đơn vị tính: USD) và chỉ số thông minh (IQ,
đơn vị tính: điểm) của một mẫu lớn gồm các sinh viên đã tốt nghiệp trường Đại học X được 5 năm, người
ta thu được kết quả hồi quy:
Dependent Variable: WAGE
Method: Least Squares
Included observations: 901

Variable Coefficient Std. Error t-Statistic Prob.

C 1024.364 17.46236 58.66127 0.0000


IQ 1.651079 0.170861 9.663295 0.0000

R-squared 0.557254     Mean dependent var 1191.266


Durbin-Watson stat 0.415645     Prob(F-statistic) 0.0000

a) Dựa vào kết quả của các kiểm định sau đây, hãy cho biết mô hình vi phạm giả thiết nào của
phương pháp OLS với mức ý nghĩa 5%.
White Heteroskedasticity Test

F-statistic 6.393726 Probability 0.001749


Obs*R-squared 12.65004 Probability 0.001791

Breusch-Godfrey Serial Corelation LM Test AR(1)

F-statistic 2.446183     Probability 0.044996


Obs*R-squared 9.743802     Probability 0.044972

b) Có thể dùng kiểm định t để kiểm định giả thiết khác 0 của hệ số hồi quy ứng với biến IQ trong
mô hình trên hay không? Vì sao?
Nêu định nghĩa cho các hiện tượng ở câu a.

Hết.

You might also like