You are on page 1of 8

Chương 4.

Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê


Chương 4: SỰ VI PHẠM GIẢ THIẾT CỦA MÔ HÌNH
Bài tập 1. Theo file “Baitap_2_Chuong3.wf1” tìm hiểu về mối liên hệ giữa

Wage : Tiền lương phụ thuộc vào

Educ: Số năm đi học

Age: Tuổi

Exper: Số năm kinh nghiệm

người ta tìm được mô hình sau:

Dependent Variable: WAGE


Method: Least Squares
Date: 04/07/15 Time: 09:12
Sample: 1 49
Included observations: 49

Variable Coefficient Std. Error t-Statistic Prob.

LOG(AGE) 31.83788 342.1990 0.093039 0.9263


EDUC -228.6184 170.0060 -1.344766 0.1856
EDUC^2 27.48793 12.34117 2.227337 0.0311
EXPER 43.54634 13.77332 3.161645 0.0028
C 1523.326 1296.496 1.174956 0.2463

R-squared 0.390506 Mean dependent var 1820.204


Adjusted R-squared 0.335097 S.D. dependent var 648.2687
S.E. of regression 528.6085 Akaike info criterion 15.47482
Sum squared resid 12294784 Schwarz criterion 15.66787
Log likelihood -374.1332 Hannan-Quinn criter. 15.54806
F-statistic 7.047754 Durbin-Watson stat 1.893713
Prob(F-statistic) 0.000178

a) Hãy giải thích ý nghĩa các hệ số đứng trước các biến giải thích ?
b) Theo bạn biến Age đưa vào có phù hợp không?
c) Kiểm định tính có ý nghĩa của mô hình
d) Trong điều kiện giống nhau về Age và Exper thì hãy cho biết Wage đạt cực đại khi Educ là bao
nhiêu?
Giải:
a. Hãy giải thích ý nghĩa các hệ số đứng trước biến giải thích
Dạng hàm lin – log
31,83788
- Khi số tuổi (age) tăng thêm 1% thì tiền lương (wage) tăng thêm ≈ 0,3183788
100
- Khi học vấn (edu) tăng thêm 1 đơn vị thì tiền lương giảm đi -228,6184
- Khi kinh nghiệm (exp) tăng thêm 1 đơn vị thì tiền lương tăng 43,54634

Mail: uongnd@uel.edu.vn Trang |1


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê

 H 0 : β1 = 0
b.  mà ta có p − value = 0,9263 > α
 H 1 : β1 ≠ 0
 Chấp nhận H0 => β1=0
 Biến Age đưa vào không phù hợp

 H 0 : R 2 = 0
c. 
2
 H 1 : R ≠ 0
Ta có p − value = 0,000178 < α => bác bỏ H0
 Mô hình phù hợp
d. WAGE = 31,83788.log(AGE) – 228,6184EDU + 27,48793EDU2 + 43,54634.EXPER +
1523,326 (1)
Để WAGE đạt cực đại ta có đạo hàm (1):
Y’ = -228,6184 + 2*27,48793EDU
Y’=0  -228,6184 + 2*27,48793EDU = 0
EDU= 5,2499
Vậy WAGE đạt cực đại khi EDU = 5,2499

Bài tập 2. Để nghiên cứu sản lượng của một giống cây trồng, người ta lấy 10 mẫu quan sát về các
nhân tố:
Y : sản lượng/ha; X2: phân hóa học/ha ; X3: thuốc trừ sâu/ha.
Kết quả hồi quy tìm được như sau:
 = 31, 98 + 0, 65X + 1,11X
Y 2 3

se (1, 632) (0, 25) (0, 267)


2
R = 0,99163
Cho α = 5%
1. Giải thích ý nghĩa kinh tế của các hệ số nhận được? Kết quả ước lượng có phù hợp thực tế
không?
2. Phân bón có ảnh hưởng đến năng suất loại cây trồng trên không? Thuốc trừ sâu có ảnh
hưởng đến năng suất cây trồng trên không?
3. Tìm khoảng tin cậy cho hệ số hồi quy riêng với độ tin cậy 95%?
2 2
4. Giải thích ý nghĩa của R nhận được? Tính R
5. Có phải cả 2 biến phân bón và thuốc trừ sâu đều không ảnh hưởng đến năng suất?
6. Bạn có thể bỏ biến X3 ra khỏi mô hình không? Vì sao? Biết rằng khi bỏ X3 ra khỏi mô hình
ta được mô hình mới có R2 = 0.971
7. Có phải phân bón và thuốc trừ sâu đều ảnh hưởng như nhau đến năng suất cây trồng trên?

Mail: uongnd@uel.edu.vn Trang |2


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê
8. Dự báo sản lượng trung bình khi X3 = 20 và X3 = 15?

Giải:
1)
 = 31, 98 + 0, 65X + 1,11X
Y 2 3

se (1, 632) (0, 25) (0, 267)


R 2 = 0,99163
- Trong điều kiện không có phân hóa học và thuốc trừ sâu tác động, sản lượng trung bình của
một giống cây trồng là 31,98 (SL/ha)
- Lượng phân hóa học bón cho cây tăng 1 (phân hóa học / ha) thì sản lượng trung bình của
cây trồng tăng 0,65
- Việc dùng thuốc trừ sâu đối với cây trồng tăng 1 (thuốc trừ sâu / ha) thì sản lượng trung bình
của cây trồng tăng 1,11
Kiểm định sự phù hợp:
H0 : R 2 = 0
 2
 H1 : R ≠ 0
R2 / ( k − 1) 0,99163 / ( 3 − 1 )
F= 2
= = 414,66 > F0 ,05;2;7 = 4,74
( 1 − R ) / ( n − k ) ( 1 − 0,99163(/( 10 − 3 )
Kết quả ước lượng có phù hợp thực tế
2)

 H 0 : β1 = 0  H0 : β2 = 0
 
 H 1 : β1 ≠ 0  H1 : β2 ≠ 0

β1 
β2
Z0 = = 2,6 Z 0 = = 4,1573
se 
β ( )1 se 
β ( )
2

Cả 2 giá trị kiểm định cho ta kết luận là bác bỏ H0 ở mức ý nghĩa 5%
Kết luận: Phân bón, Thuốc trừ sau có ảnh hưởng đến năng suất loại cây trồng
3) Ứng với độ tin cậy 95% ta có
t αn −/2k = t 70,025 = 2, 3646

( ( )) = ( 0, 0589;1, 2415)
β1 ∈ β1 ± t αn −/2k *se β1

β ∈ ( β ± t
2 2
n −k
α /2 *se ( β ) ) = ( 0, 4787;1, 7413)
2

4)
Bài tập 3. Dựa trên số liệu về doanh thu Y(triệu đồng/tháng), chi phí quảng cáo QC (triệu
đồng/tháng), Lương nhân viên tiếp thị trong một tháng (triệu đồng/tháng) của 12 công ty cùng
kinh doanh một loại hang hóa, ta có bảng kết quả sau:

Mail: uongnd@uel.edu.vn Trang |3


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê
Dependent Variable: Y
Method: Least Squares Sample: 1 12
Included observations: 12
Variable Coefficient Std. Error t-Statistic Prob.
C 29.66190 6.629492 ……………… ……………

QC ……………… 0.504466 0.004596 ……………

LUONG 8.484158 ……………………………… 11.24499 0.0000


R-squared 0.972294 Mean dependent var 140.0000
Adjusted R-squared 0.966137 S.D.dependent var 22.62340
S.E. of regression 4.163152 Akaike info criterion 5.902740
Sum squared resid 155.9865 Schwarz criterion 6.023966
Log likelihood -32.41644 F-statistic 157.9179
Durbin-Watson stat 1.737481 Prob(F-statistic) 0.000000
Cho α = 5%
1. Các hệ số của mô hình có ý nghĩa thống kê không ? Múc ý nghĩa 0,05
2. Tác động lên doanh thu của QC và lương có bằng nhau hay không khi cả 2 biến đều tăng 1
đơn vị? Cho biết ma trận hiệp phương sai là:

Mail: uongnd@uel.edu.vn Trang |4


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê

C QC LUONG
C 43.95017 -1.004550 -1.801492
QC -1.004550 0.254486 -0.294668
LUONG -1.801492 -0.294668 0.569245
3. Hãy cho biết khi tăng quảng cáo lên 1 triệu đồng thì doanh thu dao động trong khoảng nào?
4. Hãy cho biết khi tăng lương nhân viên lên 1 triệu đồng thì doanh thu dao động trong khoảng nào?
Bài tập 4. Dựa trên số liệu về nông nghiệp của một quốc gia SL sản lượng nông nghiệp (triệu đô la)
LD lao động (triệu công),K vốn (Triệu đô la ). Ta có kết quả sau:
Dependent Variable: LOG(SL)
Method: Least Squares Date: 05/16/13
Time: 10:01 Sample: 1 15
Included observations: 15
Variable Coefficient Std. t-Statistic Prob.
C -3.381935 2.420608 -1.397142 0.1877
LOG(K) 0.499968 0.100840 4.958051 0.0003
LOG(LD) 1.488713 0.533434 2.790812 0.0163

R-squared 0.893494 Mean dependent var 10.09837


Adjusted R-squared 0.875743 S.D.dependent var 0.209723
S.E. of regression 0.073927 Akaike info criterion -2.194612
Sum squared resid 0.065583 Schwarz criterion -2.053002
Log likelihood 19.45959 F-statistic 50.33498
Durbin-Watson stat 0.898720 Prob(F-statistic) 0.000001

1. Kiểm định xem các hệ số của mô hình có ý nghĩa thống kê không? Nêu ý nghĩa kinh tế của
các hệ số?
2. Hãy cho biêt khi tăng quy mô hiệu quâ có tăng không? Cho biết ma trận hiệp phương sai:

3. Nếu ước lượng mô hình SL theo K và LD có hệ số chặn , có thể căn cứ vào hệ số xác định của
này và mô hình trên để so sánh 2 mô hình với nhau không?
Bài tập 5. Sử dụng số liệu của 190 doanh nghiệp thương mại năm 2006 được kết quả ước lượng
sau:

Mail: uongnd@uel.edu.vn Trang |5


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê
NS = 8, 47 + 0, 02K − l2, 40L + e
se (7,32) (0, 001) (1,96)
2
R = 0,817, F − stastistic = 425,5 ; n = 190
Trong đó NS là năng suất lao động trung bình, K là tài sản vốn, L là số lao động của doanh
nghiệp.
1. Số lao động có tác động đến năng suất trung bình của doanh nghiệp không?
2. Khi số lao động tăng 1 đơn vị mà vốn không đổi thì năng suất trung bình của doanh nghiệp
thay đổi trong khoảng nào?
3. Khi vốn và lao động cùng tăng một đơn vị thì năng suất lao động giảm? Biết rằng hiệp
phương sai giũa các hệ số của K và L bằng - 0.003?
4. Hàm hồi quy có phù hợp không?
5. Cho rằng năng suất lao động còn phụ thuộc vào trình độ công nghệ của doanh nghiệp
(được đo bằng số máy tính , ký hiệu là PC) và hoạt động của doanh nghiệp (Age), người ta
ước lượng mô hình sau:
NS = β0 + β1K + β2 L + β3C + β4 Age + u
và thu được R 2 = 0,82.
Có thể cho rằng cả hai biến PC và Age đều cùng không tác động năng suất lao động của doanh
nghiệp hay không?
Bài tập 6. Sử dụng số liệu trong Bài tập 5 cho hàm hồi quy dạng log – log , ta có kết quả ước lượng
sau:
log(NS) = 0,79 + 0, 77 log(K) − 0,59log(L) + e
se (0, 57) (0, 07) (0,11)
R 2 = 0, 42, F − stastistic = 65 ; n = 190

1. Khi lao động tăng 1% và vốn không đổi thì năng suất lao động của doanh nghiệp thay đổi trong

khoảng nào ?

2. Có thể cho rằng K và L cùng tăng 1% thì năng suất lao động không đổi hay không? Biết rằng

hiệp phương sai giữa hai hệ số ước lượng bằng -0,005.

3. Hãy lý giải tại sao hệ số của biến log(L) lại mang dấu âm?

4. Có thể cho rằng mô hình này không tốt hơn mô hình trong Bài tập 5 không?

Mail: uongnd@uel.edu.vn Trang |6


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê
Bài tập 7. Sức hấp dẫn của rạp Galaxy là đề tài bị cuốn hút bởi nhóm các bạn Phương Dung, Ngọc
Bảo (trưởng nhóm, K05 402 284), Quốc Hạnh, Đăng Khoa, và Phạm Tùng. Vốn là những người
yêu thích xem phim, đồng thời, cũng thấy đó là một thú vui khá đặc biệt của người dân Sài Gòn, các
bạn đã tìm hiểu các yếu tố tác động tới số lần một người đến xem ở rạp Galaxy trong một tháng. Sở
dĩ là Galaxy, mà không phải rạp khác, là do sự khác biệt của nó trong việc hình thành một tổ hợp
giải trí phức hợp, sang trọng, cảnh quan đẹp, phong cách phục vụ chuyên nghiệp, có cả bar-café,
shop văn hóa phẩm, beauty salon, vân vân. Vốn bị ảnh hưởng bởi quan điểm của trường phái
Societal Marketing, được khởi xướng bởi Phillip Kotler, các bạn phân loại các yếu tố ảnh hưởng tới
hành vi của những người đến Galaxy là như sau:

Nhóm biến điều kiện cá nhân, bao gồm:

• AGE (độ tuổi), kỳ vọng là mang dấu âm: trẻ hơn thì hay đi xem phim hơn.
• INC (thu nhập, triệu đồng), kỳ vọng là mang dấu dương: giàu hơn thì hay đi xem hơn.
• DIST (khoảng cách từ nhà tới rạp Galaxy, Km), kỳ vọng là mang dấu âm.
• FRIENDS (biến Dummy, rằng có hay đi với bạn hay thích đi một mình)
Nhóm biến tác động tới tâm lý khách hàng, bao gồm:

• PR (mức độ ưa thích sự giảm giá 50% vào ngày thứ 3, chia làm 3 cấp độ, tăng dần), kỳ vọng
là mang dấu dương
• SPACE (mức độ ưa thích cái thoáng đãng, sang trọng của Galaxy, chia làm 5 cấp độ, tăng
dần), kỳ vọng là mang dấu dương.
• CINEMA (biến Dummy, rằng Galaxy có phải là sự lựa chọn số 1 hay không), kỳ vọng là
mang dấu dương.
• DVD (thích đến rạp hơn là xem DVD tại nhà, chia làm 3 cấp độ tăng dần), kỳ vọng là mang
dấu dương.
Biến được giải thích là TIMES (số lần đi xem Galaxy trong một tháng).

Nhóm đã điều tra 120 mẫu. Kết quả ước lượng như sau:

TIMES = −0.1087 AGE *** + 0.002944 INC − 0.005425 DIST + 0.02166 FRIENDS

(0.023814) (0.013711) (0.031695) (0.088697)


0.4369 PR ** + 0.548 SPACE *** + 0.1504 CINEMA + 0.3659 DVD ** + 5.245 ***

(0.21) (0.1515) (0.2469) (0.1566) (1.16)


N=120, R 2 = 0.898 , AIC =2.363, SCHWARZ = 2.572, ESS U = 64.264 .

Mail: uongnd@uel.edu.vn Trang |7


Chương 4. Sự vi phạm giả thiết của mô hình Mr U- Giảng viên BM Toán – Thống kê
*** **
Ghi chú: số trong ngặc là standard error. là có ý nghĩa ở mức 0.01; là có ý nghĩa ở mức 0.05;
*
là có ý nghĩa ở mức 0.1.

1. Kiểm địmh tính có ý nghĩa ở mức 0.05 (hay 5%) của từng biến sau: INC, DIST, và CINEMA,
FRIENDS. Cho trước t 0.05 [120] = 2.626 . Trong các mệnh đề sau, đâu là mệnh đề đúng?

A. Chỉ có INC và DIST là không có ý nghĩa


B. Chỉ có INC và CINEMA là không có ý nghĩa
C. Chỉ có FRIENDS là không có ý nghĩa
D. Cả 4 biến INC, DIST, CINEMA, và FRIENDS là không có ý nghĩa.
2. Giả sử biến FRIENDS là không có ý nghĩa. Và biến CINEMA cũng nên bỏ đi, vì chỉ có những
người cực kỳ mê Galaxy thì mới đến đấy đốt tiền. Nên nhóm quyết định loại bỏ 2 biến đó. Nhưng
đối với các biến INC, DIST, khó mà có thể nói chúng không tác động đến hành vi của người tiêu
dùng. Các cô viện dẫn lý thuyết của Keynes, và nói rằng thu nhập (INC) là yếu tố chính quyết định
tới hành vi người tiêu dùng, nhất là ở rạp đắt tiền như Galaxy. Vì vậy, ta không được phép bác bỏ
Keynes vĩ đại, khi chưa thử nghiệm. Nhóm bèn quyết định tiến hành kiểm định giả thuyết đồng
thời:

H 0 : β INC = β DIST = β CINEMA = β FRIENDS = 0

Mô hình có ràng buộc [tức là đồng thời bỏ đi INC, DIST, CINEMA, và FRIENDS] có
RSS(2) = 64.53 . Cho trước F0.05 (4,111) = 2.4534 . Nếu là em, em sẽ chọn quyết định nào trong hai

quyết định sau đây?

(a) Chấp nhận giả thuyết ( DNRH 0 ), và quyết định loại DIST, CINEMA, FRIENDS, và nhất là

INC, ra khỏi mô hình.


Hay:

(b) Bác bỏ giả thuyết ( RH 0 ) và vẫn giữ lại cả 4 biến trên.

Mail: uongnd@uel.edu.vn Trang |8

You might also like