You are on page 1of 10

Chương 4.

Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê


Chương 4: SỰ VI PHẠM GIẢ THIẾT CỦA MÔ HÌNH
Bài tập 1. Theo file “Baitap_2_Chuong3.xlsx” tìm hiểu về mối liên hệ giữa

Wage : Tiền lương phụ thuộc vào

Educ: Số năm đi học

Age: Tuổi

Exper: Số năm kinh nghiệm

người ta tìm được mô hình sau:

Dependent Variable: WAGE


Method: Least Squares
Date: 04/07/15 Time: 09:12
Sample: 1 49
Included observations: 49

Variable Coefficient Std. Error t-Statistic Prob.

LOG(AGE) 31.83788 342.1990 0.093039 0.9263


EDUC -228.6184 170.0060 -1.344766 0.1856
EDUC^2 27.48793 12.34117 2.227337 0.0311
EXPER 43.54634 13.77332 3.161645 0.0028
C 1523.326 1296.496 1.174956 0.2463

R-squared 0.390506 Mean dependent var 1820.204


Adjusted R-squared 0.335097 S.D. dependent var 648.2687
S.E. of regression 528.6085 Akaike info criterion 15.47482
Sum squared resid 12294784 Schwarz criterion 15.66787
Log likelihood -374.1332 Hannan-Quinn criter. 15.54806
F-statistic 7.047754 Durbin-Watson stat 1.893713
Prob(F-statistic) 0.000178

a) Hãy giải thích ý nghĩa các hệ số đứng trước các biến giải thích ?
b) Theo bạn biến Age đưa vào có phù hợp không?
c) Kiểm định tính có ý nghĩa của mô hình
d) Trong điều kiện giống nhau về Age và Exper thì hãy cho biết Wage đạt cực đại khi Educ là bao
nhiêu?
Bài tập 2. Để nghiên cứu sản lượng của một giống cây trồng, người ta lấy 10 mẫu quan sát về các
nhân tố:
Y : sản lượng/ha; X2: phân hóa học/ha ; X3: thuốc trừ sâu/ha.
Kết quả hồi quy tìm được như sau:
  31,98  0, 65X  1,11X
Y 1 2

se (1, 632) (0, 25) (0, 267)


R  0,99163
2

Cho α = 5%

Mail: uongnd@uel.edu.vn Trang |1


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê
a) Giải thích ý nghĩa kinh tế của các hệ số nhận được? Kết quả ước lượng có phù hợp thực tế
không?
b) Phân bón có ảnh hưởng đến năng suất loại cây trồng trên không? Thuốc trừ sâu có ảnh hưởng
đến năng suất cây trồng trên không?
c) Tìm khoảng tin cậy cho hệ số hồi quy riêng?

d) Giải thích ý nghĩa của R nhận được? Tính R


2 2

e) Có phải cả 2 biến phân bón và thuốc trừ sâu đều không ảnh hưởng đến năng suất?
f) Bạn có thể bỏ biến X3 ra khỏi mô hình không? Vì sao? Biết rằng khi bỏ X 3 ra khỏi mô hình ta
được mô hình mới có R2 = 0.971
g) Có phải phân bón và thuốc trừ sâu đều ảnh hưởng như nhau đến năng suất cây trồng trên?
h) Dự báo sản lượng trung bình khi X2 = 20 và X3 = 15?
Bài tập 3. Dựa trên số liệu về doanh thu Y(triệu đồng/tháng), chi phí quảng cáo QC (triệu
đồng/tháng), Lương nhân viên tiếp thị trong một tháng (triệu đồng/tháng) của 12 công ty cùng
kinh doanh một loại hang hóa, ta có bảng kết quả sau:
Dependent Variable: Y
Method: Least Squares Sample: 1 12
Included observations: 12
Variable Coefficient Std. Error t-Statistic Prob.
C 29.66190 6.629492 ……………… ……………

QC ……………… 0.504466 0.004596 ……………

LUONG 8.484158 ……………………………… 11.24499 0.0000


R-squared 0.972294 Mean dependent var 140.0000
Adjusted R-squared 0.966137 S.D.dependent var 22.62340
S.E. of regression 4.163152 Akaike info criterion 5.902740
Sum squared resid 155.9865 Schwarz criterion 6.023966
Log likelihood -32.41644 F-statistic 157.9179
Durbin-Watson stat 1.737481 Prob(F-statistic) 0.000000
Cho α = 5%
1. Các hệ số của mô hình có ý nghĩa thống kê không ? Múc ý nghĩa 0,05
2. Tác động lên doanh thu của QC và lương có bằng nhau hay không khi cả 2 biến đều tăng 1
đơn vị? Cho biết ma trận hiệp phương sai là:

Mail: uongnd@uel.edu.vn Trang |2


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê

C QC LUONG
C 43.95017 -1.004550 -1.801492
QC -1.004550 0.254486 -0.294668
LUONG -1.801492 -0.294668 0.569245
3. Hãy cho biết khi tăng quảng cáo lên 1 triệu đồng thì doanh thu dao động trong khoảng nào?
4. Hãy cho biết khi tăng lương nhân viên lên 1 triệu đồng thì doanh thu dao động trong khoảng nào?
Bài tập 4. Dựa trên số liệu về nông nghiệp của một quốc gia SL sản lượng nông nghiệp (triệu đô la)
LD lao động (triệu công),K vốn (Triệu đô la ). Ta có kết quả sau:
Dependent Variable: LOG(SL)
Method: Least Squares Date: 05/16/13
Time: 10:01 Sample: 1 15
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
C -3.381935 2.420608 -1.397142 0.1877
LOG(K) 0.499968 0.100840 4.958051 0.0003
LOG(LD) 1.488713 0.533434 2.790812 0.0163

R-squared 0.893494 Mean dependent var 10.09837


Adjusted R-squared 0.875743 S.D.dependent var 0.209723
S.E. of regression 0.073927 Akaike info criterion -2.194612
Sum squared resid 0.065583 Schwarz criterion -2.053002
Log likelihood 19.45959 F-statistic 50.33498
Durbin-Watson stat 0.898720 Prob(F-statistic) 0.000001

1. Kiểm định xem các hệ số của mô hình có ý nghĩa thống kê không? Nêu ý nghĩa kinh tế của
các hệ số?
2. Hãy cho biêt khi tăng quy mô hiệu quâ có tăng không? Cho biết ma trận hiệp phương sai:

3. Nếu ước lượng mô hình SL theo K và LD có hệ số chặn , có thể căn cứ vào hệ số xác định của
này và mô hình trên để so sánh 2 mô hình với nhau không?
Bài tập 5. Sử dụng số liệu của 190 doanh nghiệp thương mại năm 2006 được kết quả ước lượng
sau:

Mail: uongnd@uel.edu.vn Trang |3


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê
NS  8, 47  0, 02K  l2, 40L  e
se (7,32) (0, 001) (1,96)
R  0,817, F  stastistic  425,5 ; n  190
2

Trong đó NS là năng suất lao động trung bình, K là tài sản vốn, L là số lao động của doanh
nghiệp.
1. Số lao động có tác động đến năng suất trung bình của doanh nghiệp không?
2. Khi số lao động tăng 1 đơn vị mà vốn không đổi thì năng suất trung bình của doanh nghiệp
thay đổi trong khoảng nào?
3. Khi vốn và lao động cùng tăng một đơn vị thì năng suất lao động giảm? Biết rằng hiệp
phương sai giũa các hệ số của K và L bằng - 0.003?
4. Hàm hồi quy có phù hợp không?
5. Cho rằng năng suất lao động còn phụ thuộc vào trình độ công nghệ của doanh nghiệp
(được đo bằng số máy tính , ký hiệu là PC) và hoạt động của doanh nghiệp (Age), người ta
ước lượng mô hình sau:
NS  0  1K  2 L  3C  4 Age  u
và thu được R 2 = 0,82.
Có thể cho rằng cả hai biến PC và Age đều cùng không tác động năng suất lao động của doanh
nghiệp hay không?
Bài tập 6. Sử dụng số liệu trong Bài tập 5 cho hàm hồi quy dạng log – log , ta có kết quả ước lượng
sau:
log(NS)  0,79  0, 77 log(K)  0,59log(L)  e
se (0,57) (0,07) (0,11)
R  0, 42, F  stastistic  65 ; n  190
2

1. Khi lao động tăng 1% và vốn không đổi thì năng suất lao động của doanh nghiệp thay đổi trong khoảng
nào ?
2. Có thể cho rằng K và L cùng tăng 1% thì năng suất lao động không đổi hay không? Biết rằng hiệp phương
sai giữa hai hệ số ước lượng bằng -0,005.
3. Hãy lý giải tại sao hệ số của biến log(L) lại mang dấu âm?
4. Có thể cho rằng mô hình này không tốt hơn mô hình trong Bài tập 5 không?

Mail: uongnd@uel.edu.vn Trang |4


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê
ĐÁP ÁN
Bài tập 1.
Giải:
a) Hãy giải thích ý nghĩa các hệ số đứng trước biến giải thích
Dạng hàm lin – log
31,83788
- Khi số tuổi (age) tăng thêm 1% thì tiền lương (wage) tăng thêm  0,3183788
100
- Khi học vấn (edu) tăng thêm 1 đơn vị thì tiền lương giảm đi -228,6184
- Khi kinh nghiệm (exp) tăng thêm 1 đơn vị thì tiền lương tăng 43,54634
 H 0 : 1  0
b)  mà ta có p  value  0, 9263  
 H1 : 1  0
 Chấp nhận H0 => β1=0
 Biến Age đưa vào không phù hợp
 H : R 2  0
c)  0 2
 H1 : R  0
Ta có p  value  0, 000178   => bác bỏ H0
 Mô hình phù hợp
d) WAGE = 31,83788.log(AGE) – 228,6184EDU + 27,48793EDU 2 + 43,54634.EXPER +
1523,326 (1)
Để WAGE đạt cực đại ta có đạo hàm (1):
Y’ = -228,6184 + 2*27,48793EDU
Y’=0  -228,6184 + 2*27,48793EDU = 0
EDU= 5,2499
Vậy WAGE đạt cực đại khi EDU = 5,2499
Bài tập 2.
a)

Y  31, 98  0, 65 X 1  1,11X 2
se (1, 632) (0, 25) (0, 267)
R  0,99163
2

- Trong điều kiện không có phân hóa học và thuốc trừ sâu tác động, sản lượng trung bình của
một giống cây trồng là 31,98 (SL/ha)
- Lượng phân hóa học bón cho cây tăng 1 (phân hóa học / ha) thì sản lượng trung bình của
cây trồng tăng 0,65
- Việc dùng thuốc trừ sâu đối với cây trồng tăng 1 (thuốc trừ sâu / ha) thì sản lượng trung bình
của cây trồng tăng 1,11

Mail: uongnd@uel.edu.vn Trang |5


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê
Kiểm định sự phù hợp:
 H 0 : R2  0

 H1 : R  0
2

R 2 / ( k  1) 0,99163 / (3  1)
F   414,66  F0,05;2;7  4, 74
(1  R ) / (n  k ) (1  0,99163(/(10  3)
2

Kết quả ước lượng có phù hợp thực tế


b)
 H 0 : 1  0  H 0 : 2  0
 
 H1 : 1  0  H1 :  2  0
1 2
   
Z0   2, 6 Z 0   4,1573
se 

1 se 2

Cả 2 giá trị kiểm định cho ta kết luận là bác bỏ H0 ở mức ý nghĩa 5%
Kết luận: Phân bón, Thuốc trừ sau có ảnh hưởng đến năng suất loại cây trồng
c) Ứng với độ tin cậy 95% ta có
tn /2k '  t0,025  2,3646

  
7

1  1  tn /2k ' * se 1   0, 0589;1, 2415 

     t
2 2
nk '
 /2 * se       0, 4787;1, 7413
2

d) Giải thích ý nghĩa của R2 nhận được? Tính R 2


R2 = 0,99163 cho biết có 99,163% năng suất của loại cây trồng được giải thích qua Phân bón và
Thuốc trừ sâu còn lại 0,84% được giải thích qua các yếu tố khác.

R2  1
n 1
n k'
1  R 2   0, 995

e) Có phải cả 2 biến phân bón và thuốc trừ sâu đều không ảnh hưởng đến năng suất?
 H 0 : 1   2  0  H : R2  0
  0
 H1 :  i  0  H1 : R  0
2

R 2 / ( k  1) 0,99163 / (3  1)
F   414,66  F0,05;2;7  4, 74
(1  R ) / (n  k ) (1  0,99163(/(10  3)
2

Bác bỏ H0 . Kết luận có ít nhất một trong 2 biến phân bón và thuốc trừ sâu có ảnh hưởng đến năng
suất
f) Bạn có thể bỏ biến X2 ra khỏi mô hình không? Vì sao? Biết rằng khi bỏ X2 ra khỏi mô hình ta
được mô hình mới có R2 = 0.971
Để loại bỏ biến X3 ra khỏi mô hình ta phải xét 2 một trong 2 trường hợp sau:
Th1: Mô hình mới không có biến X3
Tính giá trị kiểm định

Mail: uongnd@uel.edu.vn Trang |6


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê

 R    R    / m   0,99163  0, 971 /1  17, 253  F


1  R    /  n  k ' 1  0,99163 / 7
2 2

F   F0,05;1;7  5,59 ,
1 2
0 2  ;m ,n  k '
1

Nên ta chấp nhận H0.


Kết luận: Không thể bỏ biến X2 ra khỏi mô hình
Th2: Kiểm định tính có ý nghĩa của biến X2
Lưu ý: Th2 đơn giản chỉ là kiểm định hệ số đứng trước biến X2 đã làm ở câu b)
g) Có phải phân bón và thuốc trừ sâu đều ảnh hưởng như nhau đến năng suất cây trồng trên?
 H 0 : 1   2

 H1 : 1   2
1   2
 
Z0   ....
se  

         
1 2

se 

1
  Var   
2 1
  Var 
2
  Var   2Cov  , 
1 2 1

2

Lưu ý: Do se(…) chưa có nên bạn chỉ cần viết như trên là đạt yêu cầu

i) Dự báo sản lượng trung bình khi X1 = 20 và X2 = 15?

Y  31,98  0, 65* 20  1,11*15  61, 63


Bài tập 3.

Mail: uongnd@uel.edu.vn Trang |7


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê

Mail: uongnd@uel.edu.vn Trang |8


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê

Mail: uongnd@uel.edu.vn Trang |9


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê

Mail: uongnd@uel.edu.vn T r a n g | 10

You might also like