You are on page 1of 17

Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.

2019

Phân tích hồi quy bội


Phân tích hồi quy bội: Vấn đề suy diễn
Vấn đề suy diễn thống kê Suy diễn thống kê trong mô hình hồi quy
Kiểm định giả thuyết về tham số tổng thể
Xây dựng các khoảng tin cậy (đối xứng)
Chương 4 4.1 Phân phối mẫu của ước lượng OLS

Ước lượng OLS là các biến ngẫu nhiên

Wooldridge: Introductory Econometrics: Chúng ta đã biết về kỳ vọng và phương sai của các ước lượng này
A Modern Approach, 5e Tuy nhiên, chúng ta cần biết về phân phối của chúng để kiểm định giả
thuyết thống kê

Để suy luận về phân phối, chúng ta cần thêm giả thiết

Giả thiết về phân phối của sai số: sai số có phân phối chuẩn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội PHÂN TÍCH HỒI QUY BỘI
Vấn đề suy diễn VẤN ĐỀ SUY DIỄN
• Định lý giới hạn trung tâm (CLT)
Giả thiết MLR.6 (Phân phối chuẩn của sai số)

độc lập với các biến • Biến ngẫu nhiên tổng x = x1+…+xk
với x1,..., xk là các biến ngẫu nhiên
Giả sử rằng phần sai số của hồi quy tổng
thể có phân phối chuẩn. Nếu các điều kiện sau thỏa:
Dạng phân phối và phương sai không • Các xi là độc lập
phụ thuộc vào bất kỳ biến giải thích nào. • Các xi có cùng phân phối xác suất
Suy ra: • Các xi có cùng kỳ vọng và phương sai (hữu hạn)
• k lớn (thường k  30)
• thì x sẽ có phân phối xấp xỉ chuẩn

4
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 1
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

Phân tích hồi quy bội Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
Thảo luận về giả thiết phân phối chuẩn Thảo luận về giả thiết phân phối chuẩn (tt)

Phần sai số được xem là tổng của “nhiều“ yếu tố không quan sát được Ví dụ về trường hợp mà giả thiết về tính chuẩn không thể thỏa mãn:

Tổng của các yếu tố độc lập có phân phối xấp xỉ chuẩn (Định lý giới hạn • Tiền lương (không âm, thường phải lớn hơn tiền lương tối thiểu)
trung tâm - Central Limit Theorem - CLT) • Số lần bắt giữ (chỉ nhận một vài giá trị nguyên không âm)
Các vấn đề nảy sinh: • Thất nghiệp (xét trường hợp biến giả, chỉ nhận giá trị 0 và 1)
• Có bao nhiêu yếu tố không quan sát được? Có đủ lớn không? Trong một vài trường hợp, phân phối chuẩn có thể đạt được thông qua việc
• Có thể phân phối của từng yếu tố này sẽ không đồng nhất với nhau biến đổi dạng biến phụ thuộc (chẳng hạn như dùng log(wage) thay cho wage)
• Các yếu tố này độc lập với nhau ở mức nào? Dưới giả thiết về phân phối chuẩn, OLS là ước lượng không chệch tốt nhất (kể

Phân phối của sai số là một vấn đề thuộc về thực nghiệm cả ước lượng phi tuyến)

Ít nhất là phân phối của sai số “xấp xỉ “ với phân phối chuẩn Quan trong: Với mục đích là suy diễn thống kê, giả thiết về phân phối chuẩn
có thể thay thế bằng cỡ mẫu lớn (xem Chương 5)
Trong nhiều trường hợp, tính chuẩn này có thể không được đảm bảo
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN VẤN ĐỀ SUY DIỄN
Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6) Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6)
Tập tin gpa1.wf1 > # install.packages("fBasics")
> hoiquy1 <- lm(colGPA ~ hsGPA+ACT+skipped+age, data=gpa1)
> summary(hoiquy1) > library(fBasics)
Call: Loading required package: timeDate
lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = gpa1) Loading required package: timeSeries
> jarqueberaTest(phandu1)
Coefficients:
Estimate Std. Error t value Pr(>|t|) Title:
(Intercept) 0.90206 0.65037 1.387 0.16771 Jarque - Bera Normalality Test
hsGPA 0.43379 0.09709 4.468 1.65e-05 ***
ACT 0.01449 0.01058 1.370 0.17309 Test Results:
skipped -0.08066 0.02617 -3.082 0.00249 **
STATISTIC:
age 0.01990 0.02284 0.872 0.38498
--- X-squared: 1.5592
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 P VALUE:
Asymptotic p Value: 0.4586
Residual standard error: 0.3298 on 136 degrees of freedom
Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154 H0: phần dư có phân phối chuẩn
F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07 H1: phần dư không có phân phối chuẩn
> # Lay phan du
> phandu1=resid(hoiquy1) p-value = 0,4586 > 0,05 : chấp nhận H0
7 8

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 2
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

PHÂN TÍCH HỒI QUY BỘI Phân tích hồi quy bội
VẤN ĐỀ SUY DIỄN
Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6)
Vấn đề suy diễn
> shapiro.test(phandu1)
Shapiro-Wilk normality test Một số thuật ngữ
data: phandu1
W = 0.9893, p-value = 0.3537
“các giả thiết Gauss-Markov“ Các giả thiết của “mô hình hồi quy tuyến tính cổ
> require(nortest) điển (CLM - classical linear model )“
Loading required package: nortest
> # Kiem dinh Anderson-Darling Định lý 4.1 (Phân phối chuẩn trong mẫu)
> ad.test(phandu1)
Anderson-Darling normality test Dưới các giả thiết MLR.1 – MLR.6:
data: phandu1
A = 0.60863, p-value = 0.1116
4.1
> # Kiem dinh Kolmogorov-Smirnov
> lillie.test(phandu1) Các ước lượng OLS có phân phối mẫu với Ước lượng chuẩn hóa tuân theo phân phối
Lilliefors (Kolmogorov-Smirnov) normality test phương sai như đã thiết lập trong chương trước chuẩn tắc
data: phandu1
D = 0.071506, p-value = 0.07439
9
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
4.2 Kiểm định giả thuyết về từng tham số tổng thể Thống kê t (hay tỷ số t)
Thống kê t sẽ được sử dụng để kiểm định giả thuyết không
Định lý 4.2 (phân phối t cho các ước lượng chuẩn hóa) đã đề cập ở trên. Hệ số ước lượng càng xa giá trị 0 thì giả
4.5 thuyết không càng ít khả năng đúng. Nhưng khi nào thì
Dưới các giả thiết MLR.1 – MLR.6: được gọi là “xa“ giá trị 0?
Điều này phụ thuộc vào sự biến thiên của hệ số ước lượng được,
Nếu việc chuẩn hóa được thực hiện bằng dùng độ lệch
nghĩa là phụ thuộc vào độ lệch chuẩn của hệ số. Thống kê đo
chuẩn ước lượng (nghĩa là dùng sai số chuẩn), phân
lường xem liệu khoảng cách từ hệ số ước lượng đến giá trị 0 bằng
phối chuẩn tắc sẽ được thay thế bằng phân phối t
4.3 bao nhiêu lần độ lệch chuẩn.

Phân phối của thống kê t nếu giả thuyết không là đúng


Lưu ý: Phân phối t sẽ rất gần với phân phối chuẩn tắc khi bậc tự do n-k-1 lớn.

Giả thuyết không (trường hợp giả thuyết tổng quát sẽ đề cập sau)
Tham số tổng thể bằng 0, nghĩa là sau khi kiểm soát
các biến độc lập khác, xj không tác động đến y Mục tiêu: xác định một quy tắc bác bỏ sao cho nếu H0 là đúng thì
4.4 khả năng H0 bị bác bỏ là rất nhỏ (= mức ý nghĩa, ví dụ 5%)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 3
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

Phân tích hồi quy bội : Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
Kiểm định với giả thuyết đối một phía (lớn hơn 0 – phía phải) Ví dụ 4.1: Phương trình tiền lương
Kiểm định rằng liệu sau khi kiểm soát biến học vấn và thâm niên chức vụ, những công
Kiểm định với giả thuyết đối . 4.6 nhân nhiều kinh nghiệm làm việc hơn có nhận được tiền lương cao hơn hay không
t0,05(28)= 1,701

Bác bỏ giả thuyết không và ủng hộ giả thuyết đối


một phía này nếu hệ số hồi quy ước lượng được là
quá lớn (cụ thể là lớn hơn giá trị tới hạn t(n-k-1)).

Xây dựng giá trị tới hạn sao cho, nếu giả thuyết
không là đúng thì khả năng giả thuyết không bị
bác bỏ, chẳng hạn, là 5% trong tổng số các trường Sai số chuẩn
hợp.

Trong ví dụ đã cho, đây là giá trị của phân phối t Kiểm định với giả thuyết đối .
với 28 bậc tự do mà 5% số các trường hợp sẽ lớn
hơn giá trị này. Người ta có thể kỳ vọng một tác động dương của kinh nghiệm đến tiền lương (USD/giờ)
Bác bỏ H0 nếu thống kê t lớn hơn 1,701 hoặc không tác động gì cả.
t  t ( n  k  1) : bac bo H 0 4.7
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
Ví dụ 4.1: Phương trình tiền lương (tt) Kiểm định với giả thuyết đối một phía (nhỏ hơn 0 – phía trái)
Thống kê t

Bậc tự do; t0,05(18)= 1,734 Kiểm định với giả thuyết đối 4.8
Ở đây, sự xấp xỉ phân .
phối chuẩn tắc có thể Bác bỏ giả thuyết không với giả thuyết đối một
được áp dụng phía này nếu hệ số ước lượng được là “quá nhỏ“
(nghĩa là, nhỏ hơn so với giá trị tới hạn -t(n-k-1)).
t0,05 (522)  1, 645 Giá trị tới hạn ứng với mức ý nghĩa 5% và 1% - phân phối t xấp Xây dựng giá trị tới hạn sao cho nếu giả thuyết
xỉ chuẩn tắc (Đây là những mức ý nghĩa thường gặp). không là đúng thì giả thuyết này sẽ bị bác bỏ,
chẳng hạn, trong 5% tổng số các trường hợp.
t0,01 (522)  2,326 Giả thuyết không sẽ bị bác bỏ vì thống kê t lớn hơn giá trị tới
hạn t(n-k-1). texper= 2,41 > t0,05(522)= 1,645 : bác bỏ H0 Trong ví dụ đã cho, đây là điểm giá trị mà tại đó
phân phối t với 18 bậc tự do sẽ có 5% các trường
“Tác động của kinh nghiệm đến tiền lương theo giờ lớn hơn 0 có ý nghĩa hợp nhỏ hơn giá trị này.
thống kê ở mức 5% (thậm chí có ý nghĩa ở mức 1%).“
Bác bỏ H0 nếu thống kê t nhỏ hơn -1,734

t  t ( n  k  1) : bac bo H 0 4.9


© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 4
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

Phân tích hồi quy bội Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)
Kiểm định rằng liệu quy mô trường học nhỏ hơn có dẫn đến kết quả học tập
của sinh viên sẽ tốt hơn hay không Thống kê t

Phần trăm sinh viên vượt Thu nhập trung bình Tỷ lệ giáo viên trên Lượng sinh viên theo học Bậc tự do;
qua bài kiểm tra môn Toán hàng năm của giáo viên 1000 sinh viên (= quy mô trường học) Trường hợp này có thể áp
dụng xấp xỉ phân phối
chuẩn tắc

t0,05 (404)  1,645 Giá trị tới hạn với mức ý nghĩa 5% và 15%.

Giả thuyết không không bị bác bỏ vì thống kê t không nhỏ hơn


Bảng z: t0,15 (404)  1, 04 giá trị tới hạn. tenroll= -0,91 > -t0,05(404)= -1,645 : chấp nhận H0

Kiểm định với giả thuyết đối Chúng ta không thể bác bỏ giả thuyết về việc quy mô trường học không có tác động
. đến kết quả học tập của sinh viên (thâm chí là ở mức ý nghĩa 15%).
Trường học càng lớn càng làm giảm kết quả học tập sinh viên hoặc quy mô trường học
không hề có tác động đến kết quả học tập?

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)
Một dạng hàm khác: Thống kê t

t0,05 (404)  1, 645 Giá trị tới hạn ở mức ý nghĩa 5%, bác bỏ giả thuyết không

Giả thuyết cho rằng quy mô trường học không có tác động đến kết quả học tập của
sinh viên đã bị bác bỏ, và ủng hộ giả thuyết đối cho rằng sự tác động là ngược chiều

tlog(enroll)= -1,87 < -t0,05(404)= -1,645 : bác bỏ H0

Độ lớn của tác động ra sao? Nếu số sinh viên tăng lên 10 (%) thì số sinh viên vượt qua bài
R2 cao hơn một chút kiểm tra sẽ giảm một lượng là 0,0129*10 = 0,129 (%)
Ví dụ:
Kiểm định

với giả thuyết đối . (tác động rất nhỏ)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 5
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

Phân tích hồi quy bội Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
Kiểm định với giả thuyết đối hai phía Ví dụ 4.3: Các yếu tố tác động đến điểm GPA Số buổi cúp học

t0,025(25)= 2,06 Kiểm định với . 4.10


Bác bỏ giả thuyết không với giả thiết đối hai phía
nếu giá trị tuyệt đối của hệ số ước lượng quá lớn.

Xây dựng giá trị tới hạn sao cho nếu giả thuyết Dùng phân phối chuẩn tắc để tìm giá trị tới hạn
không là đúng, thì nó có thể bị bác bỏ, ví dụ, 5%
trong tổng số các trường hợp.
Tác động của hsGPA và số buổi cúp học
Trong ví dụ đã cho, những điểm ứng với 5% các | thsGPA | 4,38  t0,005 (137)  2,576 : bac bo H 0 khác 0 có ý nghĩa ở mức ý nghĩa 1%.
trường hợp này nằm ở hai phía đuôi của hàm
Tác động của ACT khác 0 không có ý
phân phối. | t ACT | 1,36  t0,05 (137)  1, 645 : chap nhan H 0 nghĩa thống kê, thậm chí ở mức ý nghĩa
10%.
Bác bỏ H0 nếu giá trị tuyệt đối của thống kê lớn
hơn 2,06 | tskipped | 3,19  t0,005 (137)  2,576 : bac bo H 0
| t | t / 2 (n  k  1) : bac bo H 0 4.11
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
Một số hướng dẫn về ý nghĩa kinh tế và ý nghĩa thống kê
Biến độc lập “có ý nghĩa thống kê“ trong hồi quy
Nếu một biến độc lập có ý nghĩa thống kê, thì hãy thảo luận về độ lớn của
Nếu một hệ số hồi quy khác 0 trong một kiểm định hai phía, biến độc lập
hệ số để đánh giá ý nghĩa kinh tế hoặc ý nghĩa thực tiễn của biến
tương ứng với hệ số hồi quy đó được gọi là “có ý nghĩa thống kê“
Một biến có ý nghĩa thống kê không nhất thiết phải có ý nghĩa kinh tế hoặc
Nếu số bậc tự do đủ lớn sao cho có thể áp dụng xấp xỉ phân phối chuẩn thì quy
ý nghĩa thực tiễn!
tắc sau đây có thể áp dụng:
Nếu một biến có ý nghĩa thống kê và ý nghĩa kinh tế nhưng bị “sai“ dấu,
mô hình hồi quy có thể bị định dạng sai
“có ý nghĩa thống kê ở mức 10% “
Nếu một biến không có ý nghĩa thống kê ở mức ý nghĩa thông thường
“có ý nghĩa thống kê ở mức 5%“ (10%, 5%, 1%), người ta có thể nghĩ đến việc bỏ biến đó ra khỏi hàm hồi
quy (cẩn thận bởi vấn đề chệch do bỏ sót biến có liên quan)
“có ý nghĩa thống kê ở mức 1%“
Nếu quy mô mẫu nhỏ, thì sự tác động có thể bị ước lượng “kém chính xác“
(imprecise) vì vậy bằng chứng để bỏ biến sẽ yếu hơn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 6
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

Phân tích hồi quy bội Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
Kiểm định các giả thuyết tổng quát về hệ số hồi quy Ví dụ 4.4: Vấn đề tội phạm trong trường học và số sinh viên theo học
Giả thuyết không Một giả thuyết được quan tâm là liệu số lượng phạm tội có tăng 1% khi số sinh

Giá trị cần kiểm định của các hệ số hồi quy viên theo học tăng 1%

4.12
Thống kê t
Giá trị ước lượng là khác 1
nhưng sự khác nhau có ý
nghĩa thống kê hay không?
4.13

Giả thuyết bị bác bỏ ở


Việc kiểm định được thực hiện giống hệt như trước, ngoại trừ việc 1, 27  1 mức ý nghĩa 5%
lấy giá trị ước lượng trừ cho giá trị cần kiểm định khi tính toán các | t |  2, 45  t0,025 (95)  1, 987 : bac bo H 0
0,11
thống kê kiểm định
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
Tính toán p-value cho các kiểm định t
Cách tính p-value (trường hợp kiểm định hai phía)
Nếu mức ý nghĩa càng nhỏ, sẽ có một điểm giá trị mà tại đó giả thuyết không không
thể bị bác bỏ
p-value= 4.15
Lý do là, bằng cách hạ thấp mức ý nghĩa, người ta muốn tránh sai lầm bác bỏ một
giả thuyết H0 đúng Những giá trị này là
giá trị tới hạn cho
Trong trường hợp kiểm định hai phía, p-value
Mức ý nghĩa nhỏ nhất mà tại đó giả thuyết H0 bị bác bỏ, được gọi là p-value của kiểm mức ý nghĩa 5% là xác suất sao cho các biến ngẫu nhiên có
phân phối t sẽ nhận giá trị tuyệt đối lớn hơn
định giả thuyết giá trị thực tế, nghĩa là:

Một giá trị p-value nhỏ là bằng chứng để chống lại giả thuyết H0 vì người ta sẽ bác
bỏ giả thuyết H0 thậm chí ở mức ý nghĩa rất nhỏ Khi đó, giả thuyết không sẽ bị bác bỏ nếu
p-value tương ứng nhỏ hơn mức ý nghĩa.
Một giá trị p-value lớn là bằng chứng để ủng hộ giả thuyết không

p-value giúp dễ dàng kết luận hơn so với các giá trị thống kê ở những mức ý nghĩa Giá trị thống kê kiểm định Ví dụ, với mức ý nghĩa 5%, thống kê t sẽ
không nằm trong miền bác bỏ.
cho trước
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 7
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

PHÂN TÍCH HỒI QUY BỘI PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN VẤN ĐỀ SUY DIỄN
Tóm tắt kiểm định t Trong EXCEL: Phaân phoái Student t
Mô hình y   0  1 x1  ...   k xk  u  Caùc phaân vò t/2, t ñöôïc xaùc ñònh theo coâng thöùc:
Phía phải Phía trái Hai phía
=TINV(xaùc suaát, baäc töï do).
H0: βj = aj H0: βj = aj H0: βj = aj Thí duï vôùi coâng thöùc =TINV(0.05,6) ta ñöôïc t0,025(6) = 2.4469
H1: βj > aj H0: βj < aj H0: βj ≠ aj
ˆ j  a j  Ñeå tính p–value cho kieåm ñònh hai phía vaø moät phía ta
t
se( ˆ j ) söû duïng coâng thöùc sau:
  t(n-k-1)   t(n-k-1)   t/2(n-k-1) =TDIST(|t|, baäc töï do, ñuoâi)
t > t(n-k-1) t < -t(n-k-1) |t| > t/2(n-k-1) Quy tắc bác bỏ H0
= 5%, n= 27, k+1= 7  t(n-k-1) = t0,05(20) = 1,725 Tra bảng thống kê
vôùi ñuoâi=1: moät phía, ñuoâi=2: hai phía.
t/2(n-k-1) = t0,025(20) = 2,086
= 5%, n= 207, k+1= 7  t0,05() = 1,645
t0,025() = 1,960
Vôùi thí duï n= 6, t= 2.4469 thì trong EXCEL ta goõ coâng thöùc sau:
p-value(1p) = P(T>|t|) p-value(2p) = P(|T|>|t|) Tính p-value =TDIST(2.4469,6,2) keát quaû ta ñöôïc p–value(2p) = 0.05
p-value(1p) <  (0,05) p-value(2p) <  (0,05) Quy tắc bác bỏ H0
p-value(1p) = p-value(2p)/2
=TDIST(2.4469,6,1) ta ñöôïc p–value(1p) = 0.025
29 30

Phân tích hồi quy bội Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
Giá trị tới hạn
4.3 Khoảng tin cậy (đối xứng) của kiểm định Các khoảng tin cậy ứng với các mức ý nghĩa thông thường
Định lý 4.2 giúp rút ra kết quả hàm ý rằng hai phía
P ˆ j  t0,005 (n  k  1).se( ˆ j )   j  ˆ j  t0,005 ( n  k  1).se( ˆ j )  0, 99
 
4.16
P ˆ j  t / 2 ( n  k  1).se( ˆ j )   j  ˆ j  t / 2 ( n  k  1).se( ˆ j )  1  
  P  ˆ  t
j 0,025 ( n  k  1).se( ˆ j )   j  ˆ j  t0,025 ( n  k  1).se( ˆ )   0,95
j

P  ˆ  t
j 0,05 ( n  k  1).se( ˆ j )   j  ˆ j  t0,05 (n  k  1).se( ˆ )   0, 90
j
Giới hạn dưới của Giới hạn trên của Độ tin cậy
khoảng tin cậy khoảng tin cậy
Quy tắc kinh nghiệm t0,005 ( )  2,576; t0,025 ()  1,96; t0,05 ()  1,645
 j  ˆ j  t / 2 (n  k  1).se( ˆ j )
Diễn giải ý nghĩa của khoảng tin cậy (1- = 0,95) Liên hệ giữa khoảng tin cậy và việc kiểm định giả thuyết 2 phía

Các giới hạn trên và dưới của khoảng tin cậy là ngẫu nhiên Nếu aj không thuộc khoảng tin cậy  bác bỏ H0: βj = aj ; ủng hộ H1: βj ≠ aj
Trong trường hợp lặp lại việc lấy mẫu, khoảng tin cậy như trên sẽ chứa hệ số
Nếu aj thuộc khoảng tin cậy  chấp nhận H0: βj = aj
hồi quy tổng thể trong 95% các trường hợp.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 8
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

Phân tích hồi quy bội PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Vấn đề suy diễn • Tập tin rdchem.wf1
> hoiquy1<-lm(log(rd) ~ log(sales)+profmarg, data=rdchem)
> summary(hoiquy1)
Ví dụ 4.8: Mô hình hồi quy về chi phí R&D của doanh nghiệp Call:
lm(formula = log(rd) ~ log(sales) + profmarg, data = rdchem)
Doanh thu
Chi tiêu cho R&D hàng năm Phần trăm lợi nhuận trên doanh thu Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -4.37827 0.46802 -9.355 2.93e-10 ***
log(sales) 1.08422 0.06020 18.012 < 2e-16 ***
profmarg 0.02166 0.01278 1.694 0.101
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
n  32; R 2  0,918; df  32  2  1  29; t0,025 (29)  2, 045
Residual standard error: 0.5136 on 29 degrees of freedom
> # Khoang tin cay 95%
> confint(hoiquy1,level = 0.95)
2.5 % 97.5 %
(Intercept) -5.335478450 -3.4210681
log(sales) 0.961107256 1.2073325
profmarg -0.004487722 0.0477991
Tác động của doanh thu đến chi phí R&D ước lượng được có Tác động ước lượng được của profmarg có Khoảng tin cậy 95% của β1: 1.08422  2.045*0.0602
khoảng tin cậy 95% khá hẹp. Ngoài ra, tác động này khác 0 khoảng tin cậy 95% rất rộng. Thậm chí tác Hay (0.9611 ; 1.2073)
có ý nghĩa thống kê vì số 0 nằm ngoài khoảng tin cậy. động này không có ý nghĩa thống kê vì số 0
nằm trong khoảng tin cậy.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 34

Phân tích hồi quy bội Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
4.4 Kiểm định giả thuyết về tổ hợp tuyến tính của các tham số Không thể tính toán với các kết quả hồi quy bình thường 4.23
Ví dụ: Suất sinh lợi giáo dục khi học cao đẳng (2 năm) và đại học
(4 năm) Số năm đi học khi Số năm đi học khi
học hệ 2 năm học hệ 4 năm
Cách làm khác Không có sẵn trong kết quả hồi quy thông thường

4.17
Tính và kiểm định với . 4.24
Kiểm định với giả thuyết đối
. 4.18 4.19
4.25
Một thống kê kiểm định có thể dùng là :
Chênh lệch giữa các ước lượng được chuẩn hóa bằng cách chia cho
độ lệch chuẩn của khoảng chênh lệch này. Giả thuyết H0 sẽ bị bác bỏ
4.20
nếu giá trị thống kê t mang giá trị âm quá lớn để tin rằng sự khác
nhau thực sự trong tổng thể giữa hai ước lượng là bằng 0. Thêm đại lượng này vào hàm Biến độc lập mới (= tổng số năm đi học ở cả
hồi quy ban đầu hai hệ)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 9
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

Phân tích hồi quy bội PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Vấn đề suy diễn • Tập tin twoyear.wf1
Tổng số năm đi học = jc+univ > hoiquy1<-lm(lwage ~ jc + univ + exper, data = twoyear)
Kết quả ước lượng > summary(hoiquy1)

Call:
lm(formula = lwage ~ jc + univ + exper, data = twoyear)
4.27
Coefficients:
Estimate Std. Error t value Pr(>|t|)
Giả thuyết bị bác bỏ tại mức ý nghĩa (Intercept) 1.4723256 0.0210602 69.910 <2e-16 ***
10%, nhưng không bị bác bỏ tại 5% jc 0.0666967 0.0068288 9.767 <2e-16 ***
univ 0.0768762 0.0023087 33.298 <2e-16 ***
exper 0.0049442 0.0001575 31.397 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
t= -1,48 < -t0,1()= - 1,282 hay p-value(1p)= 0,07 < 0,1 : bác bỏ H0
t= -1,48 > -t0,05()= - 1,645 hay p-value(1p)= 0,07 > 0,05 : chấp nhận H0 Residual standard error: 0.4301 on 6759 degrees of freedom
Multiple R-squared: 0.2224, Adjusted R-squared: 0.2221
Cách làm này luôn áp dụng được với các giả thuyết tuyến tính đơn F-statistic: 644.5 on 3 and 6759 DF, p-value: < 2.2e-16

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN VẤN ĐỀ SUY DIỄN
> # Ham cho kiem dinh t 2 phia
> kiemdinh_t <- function(reg, coefnum, val){ Ma trận hiệp phương sai của hệ số hồi quy
+ co <- coef(summary(reg))
+ tstat <- (co[coefnum,1]-val)/co[coefnum,2]
+ p_value_t <- 2 * pt(abs(tstat), reg$df.residual, > vcov(hoiquy1)
lower.tail = FALSE) (Intercept) jc univ exper
+ print("thong ke t") (Intercept) 4.435337e-04 -1.741432e-05 -1.573472e-05 -3.104756e-06
+ print(tstat) jc -1.741432e-05 4.663243e-05 1.927929e-06 -1.718296e-08
univ -1.573472e-05 1.927929e-06 5.330230e-06 3.933491e-08
+ print("p-value cua t")
exper -3.104756e-06 -1.718296e-08 3.933491e-08 2.479792e-08
+ print(p_value_t)
+ }
> # y = b0 + b1*x1 + b2*x2 + b3*x3
> # H0: b1 = 0.05 ; H1: b1 <> 0.05
var( ˆ1 )  4,66.105 ; var( ˆ2 )  5,33.106 ;cov( ˆ1 , ˆ2 )  1,93.106
> kiemdinh_t(hoiquy1, 2,0.05)
[1] "thong ke t"
[1] 2.445047
[1] "p-value cua t"
[1] 0.0145087
p-value(1p) = p-value(2p)/2 = 0,0145 /2 = 0,00725
39

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 10
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

PHÂN TÍCH HỒI QUY BỘI Phân tích hồi quy bội
VẤN ĐỀ SUY DIỄN Vấn đề suy diễn
> hoiquy2<-lm(lwage ~ jc + I(jc + univ) + exper, data = twoyear)
> summary(hoiquy2) 4.5 Kiểm định nhiều ràng buộc tuyến tính: Kiểm định F
Call:
lm(formula = lwage ~ jc + I(jc + univ) + exper, data = twoyear) Kiểm định các ràng buộc loại trừ
Tiền lương của các
Coefficients: cầu thủ bóng chày
Estimate Std. Error t value Pr(>|t|) Số năm thi đấu Số trận tham gia thi
ở giải nhà nghề chuyên nghiệp đấu trung bình mỗi
(Intercept) 1.4723256 0.0210602 69.910 <2e-16 ***
năm
jc -0.0101795 0.0069359 -1.468 0.142
I(jc + univ) 0.0768762 0.0023087 33.298 <2e-16 ***
exper 0.0049442 0.0001575 31.397 <2e-16 ***
---
4.28
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Điểm đánh Số lần đánh bóng Số lần đánh bóng ghi
Residual standard error: 0.4301 on 6759 degrees of freedom
bóng trung bình ghi điểm trực tiếp điểm mỗi năm
Multiple R-squared: 0.2224, Adjusted R-squared: 0.2221 trung bình mỗi năm

4.29 với H1: H0 là sai 4.30


• H0: beta1 = 0 ; H1: beta1 <> 0
Kiểm định việc các đại lượng đo lường hiệu quả thi đấu của cầu thủ không tác động
• p-value(2p) = 0,142  p-value(1p) = 0,071 đến tiền lương/ hoặc có thể loại bỏ khỏi phương trình hồi quy.
41
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
Ước lượng mô hình chưa gán ràng buộc (UR) Ước lượng mô hình đã gán ràng buộc (R)

4.33

4.31

RSS sẽ tăng lên, nhưng liệu sự gia tăng này có ý nghĩa thống kê hay không?
Không có biến nào trong số các biến này có ý nghĩa thống kê khi kiểm
định đơn lẻ. tbavg = 0,89 ; thrunsyr = 0,89 ; trbisyr = 1,50
Thống kê kiểm định Số các ràng buộc

Sự tăng lên tương đối của tổng bình


phương phần dư khi đi từ H1 đến H0
Gợi ý: Mức độ phù hợp của mô hình sẽ ra sao nếu các biến trên bị loại bỏ ra khỏi mô hình? tuân theo một phân phối F (nếu H0
là đúng )
4.37
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 11
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

Phân tích hồi quy bội Phân tích hồi quy bội
Vấn đề suy diễn Vấn đề suy diễn
Quy tắc bác bỏ (Hình 4.7) Số các ràng buộc cần kiểm định
Kiểm định vấn đề trong ví dụ
4.41 (0,6278  0,5971) / 3
F  9,55
(1  0,6278) / 347
Một biến ngẫu nhiên có phân phối F chỉ Bậc tự do của mô hình
có thể nhận giá trị dương. Điều này tương F ~ F3,347 ; = 1% F0,01(3,347)= 3,78 chưa gán ràng buộc (UR)
ứng với việc tổng bình phương phần dư chỉ
có thể tăng thêm khi đi từ H1 đến H0.
Bằng chứng bác bỏ giả thuyết
p-value= không là rất mạnh (thậm chí ở
mức ý nghĩa rất nhỏ).
Chọn giá trị tới hạn sao cho giả thuyết không sẽ
bị bác bỏ, ví dụ, trong 5% số trường hợp mặc dù Thảo luận
nó đúng.
F= 9,55 > F0,01(3,347)= 3,78
Ba biến được kiểm định là “có ý nghĩa đồng thời“
hay
Với mức ý nghĩa 5% ; q = 3 ; dfur = n-k-1 = 60 : Chúng không có ý nghĩa khi kiểm định riêng lẻ từng biến p-value= 0,000 < 0,01:
F0,05(3,60) = 2,76 bác bỏ H0
Có thể đã có đa cộng tuyến giữa chúng
F > F(q,n-k-1): bác bỏ H0 4.40 Nếu F > F0,05(3,60) : bác bỏ H0
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN VẤN ĐỀ SUY DIỄN
• Tập tin mlb1.wf1
> anova(hoiquy1)
> hoiquy1<-lm(log(salary) ~ years + gamesyr + bavg +
hrunsyr + rbisyr, data = mlb1) Analysis of Variance Table
> summary(hoiquy1)
Call: Response: log(salary)
lm(formula = log(salary) ~ years + gamesyr + bavg + hrunsyr Df Sum Sq Mean Sq F value Pr(>F)
+ rbisyr, data = mlb1) years 1 165.980 165.980 314.4067 < 2.2e-16 ***
Coefficients: gamesyr 1 127.884 127.884 242.2441 < 2.2e-16 ***
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.119e+01 2.888e-01 38.752 < 2e-16 ***
bavg 1 0.881 0.881 1.6695 0.1972
years 6.886e-02 1.211e-02 5.684 2.79e-08 *** hrunsyr 1 13.055 13.055 24.7299 1.039e-06 ***
gamesyr 1.255e-02 2.647e-03 4.742 3.09e-06 *** rbisyr 1 1.189 1.189 2.2514 0.1344
bavg 9.786e-04 1.104e-03 0.887 0.376 Residuals 347 183.186 0.528
hrunsyr 1.443e-02 1.606e-02 0.899 0.369 ---
rbisyr 1.077e-02 7.175e-03 1.500 0.134 Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’
---
0.1 ‘ ’ 1
Multiple R-squared: 0.6278, Adjusted R-squared: 0.6224
> nobs(hoiquy1)
[1] 353
SSR = 183.186
R2 = 0.6278 47 48

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 12
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

PHÂN TÍCH HỒI QUY BỘI PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN VẤN ĐỀ SUY DIỄN
> #Load package car
> library(car)
> # Kiem dinh F Phaân phoái Fisher F
> linearHypothesis(hoiquy1, c("bavg=0","hrunsyr=0", "rbisyr=0"))
Linear hypothesis test
 Trong EXCEL:
Hypothesis:
Ñeå tính F0,05(1,6) = 5.987
bavg = 0 goõ coâng thöùc sau: =FINV(0.05,1,6)
hrunsyr = 0
rbisyr = 0 p–value cuûa phaân phoái F ñöôïc tính theo coâng thöùc:
Model 1: restricted model p–value= P(F >F)
Model 2: log(salary) ~ years + gamesyr + bavg + hrunsyr + rbisyr
goõ coâng thöùc =FDIST(5.987,1,6) ta ñöôïc p–value = 0.05
Res.Df RSS Df Sum of Sq F Pr(>F)
1 350 198.31
2 347 183.19 3 15.125 9.5503 4.474e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

• p-value = 0,0000 < 0,05 : bác bỏ H0


49 50

Phân tích hồi quy bội PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN
Vấn đề suy diễn Tập tin mlb1.wf1
> hoiquy1<-lm(log(salary) ~ years + gamesyr + bavg
+ hrunsyr + rbisyr, data = mlb1)
Kiểm định ý nghĩa toàn bộ của mô hình hồi quy > summary(hoiquy1)
Call:
lm(formula = log(salary) ~ years + gamesyr + bavg + hrunsyr
4.34 + rbisyr, data = mlb1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
Giả thuyết không phát biểu rằng các biến (Intercept) 1.119e+01 2.888e-01 38.752 < 2e-16 ***
4.44 giải thích hoàn toàn không có tác dụng years 6.886e-02 1.211e-02 5.684 2.79e-08 ***
giải thích cho biến phụ thuộc gamesyr 1.255e-02 2.647e-03 4.742 3.09e-06 ***
bavg 9.786e-04 1.104e-03 0.887 0.376
4.45 Mô hình đã gán ràng buộc
hrunsyr 1.443e-02 1.606e-02 0.899 0.369
(hồi quy với hệ số chặn) rbisyr 1.077e-02 7.175e-03 1.500 0.134
4.46 ---
Multiple R-squared: 0.6278, Adjusted R-squared: 0.6224
F-statistic: 117.1 on 5 and 347 DF, p-value: < 2.2e-16

• H0: β1 = … = β5 = 0 ; H1: H0 sai


Kiểm định ý nghĩa toàn bộ của mô hình hồi quy được trình bày trong • F = 117.1
hầu hết các phần mềm hồi quy. Giả thuyết không thường bị bác bỏ
• p-value < 2.2e-16 : bác bỏ H0
H0: R2 = 0 (Hàm hồi quy mẫu SRF không phù hợp với mẫu khảo sát) 4.44
52
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 13
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

PHÂN TÍCH HỒI QUY BỘI Phân tích hồi quy bội
VẤN ĐỀ SUY DIỄN
Tập tin mlb1.wf1 Vấn đề suy diễn
> linearHypothesis(hoiquy1, c("years=0", "gamesyr=0",
"bavg=0","hrunsyr=0", "rbisyr=0"))
Linear hypothesis test
Kiểm định ràng buộc tuyến tính tổng quát với kiểm định F
Hypothesis:
years = 0 Ví dụ: Kiểm định sự hợp lý của việc định giá nhà
gamesyr = 0
bavg = 0 Giá dự kiến (giá được định ra Kích thước lô đất
hrunsyr = 0 Giá nhà thực tế
trước khi căn nhà được bán) (tính bằng feet)
rbisyr = 0

Model 1: restricted model


Model 2: log(salary) ~ years + gamesyr + bavg + hrunsyr + rbisy
r

Res.Df RSS Df Sum of Sq F Pr(>F)


4.47
1 352 492.18
2 347 183.19 5 308.99 117.06 < 2.2e-16 *** Diện tích bình phương Số phòng ngủ
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Hơn nữa, các yếu tố khác nhất thiết
4.48 không có tác động đến giá thực tế
• H0: β1 = … = β5 = 0 ; H1: H0 sai một khi đã kiểm soát giá dự kiến.
Nếu căn nhà được định giá hợp lý, thì 1% sự thay đổi trong
• F = 117.1 giá dự kiến sẽ tương ứng với 1% thay đổi trong giá thực tế.

• p-value < 2.2e-16 : bác bỏ H0 53


© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội PHÂN TÍCH HỒI QUY BỘI
Vấn đề suy diễn VẤN ĐỀ SUY DIỄN
• Tập tin hprice1.wf1
Mô hình chưa gán ràng buộc (UR) > hoiquy1<-lm(log(price) ~ log(assess) + log(lotsize)
+ log(sqrft) + bdrms, data = hprice1)
> summary(hoiquy1)
4.49
Call:
Mô hình đã gán ràng buộc thực lm(formula = log(price) ~ log(assess) + log(lotsize)
Mô hình đã gán ràng buộc (R) chất là mô hình hồi quy [y-x1] theo + log(sqrft) + bdrms, data = hprice1)
một hằng số Coefficients:
Estimate Std. Error t value Pr(>|t|)
4.50 (Intercept) 0.263743 0.569665 0.463 0.645
log(assess) 1.043066 0.151446 6.887 1.01e-09 ***
log(lotsize) 0.007438 0.038561 0.193 0.848
Thống kê kiểm định log(sqrft) -0.103239 0.138430 -0.746 0.458
bdrms 0.033839 0.022098 1.531 0.129
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Multiple R-squared: 0.7728, Adjusted R-squared: 0.7619
F-statistic: 70.58 on 4 and 83 DF, p-value: < 2.2e-16

F ~ F4,83 ; = 5% F0,05(4,83)= 2,50


F= 0,661 < F0,05(4,83)= 2,50 : chấp nhận H0 với mức ý nghĩa 5%
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 56

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 14
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

PHÂN TÍCH HỒI QUY BỘI Phân tích hồi quy bội
VẤN ĐỀ SUY DIỄN Vấn đề suy diễn
> linearHypothesis(hoiquy1, c("log(assess)=1", "log(lotsize)=0",
"log(sqrft)=0","bdrms=0"))
Linear hypothesis test Kết quả hồi quy của mô hình chưa gán ràng buộc (UR)
Hypothesis:
log(assess) = 1
log(lotsize) = 0
log(sqrft) = 0
bdrms = 0

Model 1: restricted model


Khi kiểm định riêng rẽ,
Model 2: log(price) ~ log(assess) + log(lotsize) + log(sqrft) + b không có bằng chứng
drms chống lại sự hợp lý của
việc định giá nhà
Res.Df RSS Df Sum of Sq F Pr(>F)
1 87 1.8801
2 83 1.8215 4 0.05862 0.6678 0.6162 Kiểm định F áp dụng được với dạng tổng quát của các giả thuyết bội và tuyến tính
Với tất cả các kiểm định và các khoảng tin cậy, các giả thiết MLR.1 – MLR.6 được
giả định là thỏa mãn; nếu không các kiểm định sẽ không còn đáng tin cậy.
• F = 0.6678
• p-value = 0,6162 > 0,05 : chấp nhận H0 57
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN VẤN ĐỀ SUY DIỄN
• Mối liên hệ giữa thống kê t và F:
Kiểm định ràng buộc tuyến tính tổng quát với kiểm định F
Kiểm định giả thiết đối 2 phía thì kết quả theo t và F là như nhau.
Lưu ý:
• Tập tin wage2.wf1
• Mô hình chưa gán ràng buộc (UR)
> hoiquy1<-lm(wage ~ educ + exper + tenure, data = wage2)
y = β0 + β1x1 + β2x2 + β3x3 + β4x4 + β5x5 + β6x6 + u > summary(hoiquy1)
Call:
• H0: β2 = 2, β4 = 0, β5 = -3 ; H1: H0 sai
lm(formula = wage ~ educ + exper + tenure, data = wage2)
• Mô hình đã gán ràng buộc (R) Coefficients:
Estimate Std. Error t value Pr(>|t|)
y = β0 + β1x1 + 2x2 + β3x3 -3x5 + β6x6 + u (không chạy được) (Intercept) -276.240 106.702 -2.589 0.009778 **
educ 74.415 6.287 11.836 < 2e-16 ***
 y - 2x2 + 3x5 = β0 + β1x1 + β3x3 + β6x6 + u (chạy được) exper 14.892 3.253 4.578 5.33e-06 ***
tenure 8.257 2.498 3.306 0.000983 ***
Chỉ dùng công thức (4.37), không dùng được công thức (4.41) ---
Multiple R-squared: 0.1459, Adjusted R-squared: 0.1431

59 60

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 15
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

PHÂN TÍCH HỒI QUY BỘI PHÂN TÍCH HỒI QUY BỘI
VẤN ĐỀ SUY DIỄN VẤN ĐỀ SUY DIỄN
• Mối liên hệ giữa thống kê t và F:
• Mối liên hệ giữa thống kê t và F:
1) H0: βeduc = 63 ; H0: βeduc ≠ 63 > #Load package car
> library(car)
74, 41486  63 > # Kiem dinh F
t  1,815631 ;  = 5% > linearHypothesis(hoiquy1, c("educ=63"))
6, 286993 Linear hypothesis test

|t| = 1,815631 < t0,025() = 1,96 : chấp nhận H0 Hypothesis:


educ = 63
Hay: p-value(2p) = P(|t| > 1,815631) = 0,0697 Model 1: restricted model
Model 2: wage ~ educ + exper + tenure
p-value(2p) > 0,05 : chấp nhận H0
Res.Df RSS Df Sum of Sq F Pr(>F)
2) H0: βeduc = 63 ; H0: βeduc > 63 1 932 130899834
2 931 130437974 1 461859 3.2965 0.06975 .
t = 1,815631 > t0,05() = 1,645 : bác bỏ H0 ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Hay: p-value(1p) = 0,0697/2 = 0,0349 < 0,05 : bác bỏ H0


61 62

PHÂN TÍCH HỒI QUY BỘI


PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN
VẤN ĐỀ SUY DIỄN
• 4.6 Trình bày kết quả hồi quy (bằng tay)
• Mối liên hệ giữa thống kê t và F: • Ví dụ 4.10 Sự đánh đổi Giữa tiền Lương và Phụ cấp của Giáo viên
> # Ham cho kiem dinh t 2 phia
> kiemdinh_t <- function(reg, coefnum, val){
+ co <- coef(summary(reg))
+ tstat <- (co[coefnum,1]-val)/co[coefnum,2]
+ p_value_t <- 2 * pt(abs(tstat), reg$df.residual, lower.tail = FALSE)
+ print("thong ke t")
+ print(tstat)
+ print("p-value cua t")
+ print(p_value_t)
+ }
> # y = b0 + b1*x1 + b2*x2 + b3*x3
> # H0: b1 = 63 ; H1: b1 <> 63
> kiemdinh_t(hoiquy1, 2,63)
[1] "thong ke t"
[1] 1.815632
[1] "p-value cua t"
[1] 0.06974848
> # t^2 = F
> 1.815632^2
[1] 3.29652

63 64

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 16
Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 15.01.2019

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN Môøi gheù thaêm trang web:

• Ví dụ 4.10 Sự đánh đổi Giữa tiền Lương và Phụ cấp của Giáo viên
https://sites.google.com/a/ueh.edu.vn/phamtricao/
• salary lương của giáo viên
• b/s là viết tắt của “tỷ lệ phụ cấp trên lương” https://sites.google.com/site/phamtricao/
• enroll quy mô của trường
• staff số giáo viên trên một nghìn học sinh
• droprate tỷ lệ học sinh bỏ học
• gradrate tỷ lệ học sinh tốt nghiệp
• totcomp tổng thu nhập hàng năm trung bình cho một giáo viên, bao gồm
lương và các phụ cấp (lương hưu, bảo hiểm y tế và các khoản khác)

65 66

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 17

You might also like