Professional Documents
Culture Documents
TuongNam R CH 04 Wooldridge 5e PPT TuanAnh
TuongNam R CH 04 Wooldridge 5e PPT TuanAnh
Chương 4
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Suy diễn thống kê trong mô hình hồi quy gồm 2 vấn đề:
Kiểm định giả thuyết về tham số tổng thể
Xây dựng các khoảng tin cậy
Chúng ta đã biết về kỳ vọng và phương sai của các ước lượng này
Tuy nhiên, chúng ta cần biết về phân phối của chúng để kiểm định giả
thuyết thống kê
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Giả thiết MLR.6 (Phân phối chuẩn của sai số)
Suy ra:
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Thảo luận về giả thiết phân phối chuẩn
Phần sai số được xem là tổng của „nhiều“ yếu tố không quan sát được
Tổng của các yếu tố độc lập có phân phối chuẩn(CLT)
Tuy nhiên, các vấn đề nảy sinh:
• Có bao nhiêu yếu tố không quan sát được? Có đủ lớn không?
• Có thể phân phối của từng yếu tố này sẽ không đồng nhất với
nhau
• Các yếu tố này độc lập với nhau ở mức nào?
Phân phối của sai số là một vấn đề thuộc về thực nghiệm
Trong nhiều trường hợp, tính chuẩn này có thể không được đảm bảo
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Thảo luận về giả thiết phân phối chuẩn (tt)
Ví dụ về trường hợp mà giả thiết về tính chuẩn không thể thỏa mãn:
• Tiền lương (không âm, thường phải lớn hơn tiền lương tối thiểu)
• Số lần bắt giữ (chỉ nhận một vài giá trị nguyên không âm)
• Thất nghiệp (xét trường hợp biến giả, chỉ nhận giá trị 0 và 1)
Trong một vài trường hợp, phân phối chuẩn có thể đạt được thông qua
việc biến đổi dạng biến phụ thuộc (chẳng hạn như dùng log(wage)
thay cho wage)
Dưới giả thiết về phân phối chuẩn, OLS là ước lượng không chệch tốt
nhất (kể cả ước lượng phi tuyến)
Quan trong: Với mục đích là suy diễn thống kê, giả thiết về phân phối
chuẩn có thể thay thế bằng cỡ mẫu lớn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Một số thuật ngữ
„các giả thiết Gauss-Markov“ Các giả thiết của „mô hình hồi quy tuyến tính cổ
điển (CLM) “
Các ước lượng OLS có phân phối mẫu với Ước lượng chuẩn hóa tuân theo phân phối
phương sai như đã thiết lập trong chương chuẩn tắc
trước
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Định lý 4.1 (phân phối t cho các ước lượng chuẩn hóa)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Thống kê t (hay tỷ số t)
Thống kê t sẽ được sử dụng để kiểm định giả thuyết không
đã đề cập ở trên. Hệ số ước lượng càng xa giá trị 0 thì giả
thuyết không càng ít khả năng đúng. Nhưng khi nào thì
được gọi là „xa“ giá trị 0?
Điều này phụ thuộc vào sự biến thiên của hệ số ước lượng được,
nghĩa là phụ thuộc vào độ lệch chuẩn của hệ số. Thống kê đo
lường xem liệu khoảng cách từ hệ số ước lượng đến giá trị 0
bằng bao nhiêu lần độ lệch chuẩn.
Phân phối của thống kê t nếu giả thuyết không là đúng
Mục tiêu: xác định một quy tắc bác bỏ sao cho nếu H0 là đúng thì
khả năng H0 bị bác bỏ là rất nhỏ (= mức ý nghĩa, ví dụ 5%)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội :
Vấn đề suy diễn
Kiểm định với giả thuyết đối một phía (lớn hơn 0)
Giải thích:
Bác bỏ giả thuyết không và ủng hộ giả thuyết đối
một phía này nếu hệ số hồi quy ước lượng được là
quá lớn (cụ thể là lớn hơn giá trị tới hạn).
Xây dựng giá trị tới hạn sao cho, nếu giả thuyết
không là đúng thì khả năng giả thuyết không bị
bác bỏ, chẳng hạn, là 5% trong tổng số các
trường hợp.
Sai số chuẩn
Người ta có thể kỳ vọng một tác động dương của kinh nghiệm đến tiền lượng giờ hoặc
không tác động gì cả.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ : Phương trình tiền lương (tt)
Thống kê t
Bậc tự do;
Ở đây, sự xấp xỉ phân
phối chuẩn tắc có thể
được áp dụng
tα(n-k-1) = t0.05(522) = 1.645 Giá trị tới hạn ứng với mức ý nghĩa
5% với bậc tự do (n-k-1) = 522
„Tác động của kinh nghiệm đến tiền lương theo giờ lớn hơn 0 có
nghĩa thống kê ở mức 5%.“
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Kiểm định với giả thuyết đối một phía (nhỏ hơn 0)
Giải thích:
Bác bỏ giả thuyết không với giả thuyết đối một
phía này nếu hệ số ước lượng được là „quá nhỏ“
(nghĩa là, nhỏ hơn so với giá trị tới hạn).
Xây dựng giá trị tới hạn sao cho nếu giả thuyết
không là đúng thì giả thuyết này sẽ bị bác bỏ,
chẳng hạn, trong 5% tổng số các trường hợp.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ: Kết quả học tập của sinh viên và quy mô trường học
Kiểm định rằng liệu quy mô trường học nhỏ hơn có dẫn đến kết quả
học tập của sinh viên sẽ tốt hơn hay không
Phần trăm sinh viên vượt Thu nhập trung bình Tỷ lệ giáo viên trên Lượng sinh viên theo học
qua bài kiểm tra môn toán hàng năm của giáo viên 1000 sinh viên (= quy mô trường học)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ: Kết quả học tập của sinh viên và quy mô trường học (tt)
Thống kê t
Bậc tự do;
Trường hợp này có thể áp
dụng xấp xỉ phân phối
chuẩn tắc
Vì tenroll > - t0.05 = - 1.645 nên Giả thuyết không không bị bác bỏ
Chúng ta không thể bác bỏ giả thuyết về việc quy mô trường học không có
tác động đến kết quả học tập của sinh viên (ở mức ý nghĩa 5%).
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ: Kết quả học tập của sinh viên và quy mô trường học (tt)
Một dạng hàm khác :
Kiểm định
Thống kê t
Giả thuyết cho rằng quy mô trường học không có tác động đến kết quả học
tập của sinh viên đã bị bác bỏ, và ủng hộ giả thuyết đối cho rằng sự tác
động là ngược chiều
Nếu số sinh viên tăng lên 10% thì số sinh viên
Độ lớn của tác động ra sao? vượt qua bài kiểm tra sẽ thay đổi một lượng là -
0.129 điểm phần trăm (tác động rất nhỏ)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Kiểm định với giả thuyết đối hai phía
Giải thích:
Bác bỏ giả thuyết không với giả thiết đối hai phía
nếu giá trị tuyệt đối của hệ số ước lượng quá lớn.
Xây dựng giá trị tới hạn sao cho nếu giả thuyết
không là đúng, thì nó có thể bị bác bỏ, ví dụ, 5%
trong tổng số các trường hợp.
Bác bỏ nếu giá trị tuyệt đối của thống kê nhỏ hơn -
2.06 hoặc lớn hơn 2.06
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ: Các yếu tố tác động đến điểm GPA Số buổi cúp học
Dùng phân phối chuẩn tắc để tìm giá trị tới hạn,
mức ý nghĩa α = 0.01 với kiểm định hai phía.
|thsGPA | = 0.412/0.094 Tác động của hsGPA và số buổi cúp học
= 4.38 > t0.01/2= 2.58 khác 0 có ý nghĩa ở mức 1%. Tác động
của ACT khác 0 không có ý nghĩa thống
|tACT | = 0.015/0.011 kê, thậm chí ở mức 10%.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Một số hướng dẫn về ý nghĩa kinh tế và ý nghĩa thống kê
Nếu một biến độc lập có ý nghĩa thống kê, thì hãy thảo luận về độ lớn
của hệ số để đánh giá ý nghĩa kinh tế hoặc ý nghĩa thực tiễn của biến
Một biến có ý nghĩa thống kê không nhất thiết phải có ý nghĩa kinh tế
hoặc ý nghĩa thực tiễn!
Nếu một biến có ý nghĩa thống kê và ý nghĩa kinh tế nhưng bị „sai“
dấu, mô hình hồi quy có thể bị định dạng sai
Nếu một biến không có ý nghĩa thống kê ở mức ý nghĩa thông thường
(10%, 5%, 1%), người ta có thể nghĩ đến việc bỏ biến đó ra khỏi hàm
hồi quy
Nếu quy mô mẫu nhỏ, thì sự tác động có thể bị ước lượng kém „chính
xác“ (imprecise) vì vậy bằng chứng của việc biến không ý nghĩa thống
kê không còn mạnh nữa
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
2.2. Kiểm định các giả thuyết tổng quát về hệ số hồi quy
Giả thuyết không
Giá trị cần kiểm định của các hệ số hồi quy
Thống kê t
Việc kiểm định được thực hiện giống hệt như trước, ngoại trừ việc
lấy giá trị ước lượng trừ cho giá trị cần kiểm định khi tính toán các
thống kê kiểm định
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ: Vấn đề tội phạm trong trường học và số sinh viên theo học
Một giả thuyết được quan tâm là liệu số lượng phạm tội có tăng 1% lhi
số sinh viên theo học tăng 1%
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Tính toán p-value cho các kiểm định t
Mức ý nghĩa nhỏ nhất mà tại đó giả thuyết H0 bị bác bỏ, được gọi là p-
value của kiểm định giả thuyết
Một giá trị p-value nhỏ là bằng chứng để chống lại giả thuyết H0 vì
người ta sẽ bác bỏ giả thuyết H0 thậm chí ở mức ý nghĩa rất nhỏ
Một giá trị p-value lớn là bằng chứng để ủng hộ giả thuyết không
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Cách tính p-value cho kiểm định t (trường hợp kiểm định hai phía)
ˆ j a j
p =P ( |T| > |t|) với t
se ( ˆ ) j
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Chú ý:
1. Vì phân phối t là đối xứng nên :
P(T> |t|) = P (T< -|t|) = P (|T|> |t|)/2
2. Trong các phần mềm, giá trị p-value hiển thị cho kiểm định t là ứng
với giả thuyết đối hai phía. Vì vậy tính p-value một phía bằng cách:
p-value (một phía)=p-value(hai phía)/2.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Call: lm(formula =log(wage)~ educ+ exper + tenure, data = wage1)
Residuals:
Min 1Q Median 3Q Max
-2.05802 -0.29645 -0.03265 0.28788 1.42809
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.284360 0.104190 2.729 0.00656 **
educ 0.092029 0.007330 12.555 < 2e-16 ***
exper 0.004121 0.001723 2.391 0.01714 *
tenure 0.022067 0.003094 7.133 3.29e-12 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.4409 on 522 degrees of freedom
Multiple R-squared: 0.316, Adjusted R-squared: 0.3121
F-statistic: 80.39 on 3 and 522 DF, p-value: < 2.2e-16
1. Dùng p-value xem các biến có ý nghĩa thống kê không ở mức 5%?
2. Biến educ có tác động dương lên wage với mức ý nghĩa 10% ?
3. Kđịnh giả thuyết cho rằng tenure tăng 1 năm thì wage tăng 3% với α = 5%.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Khoảng tin cậy Giá trị tới hạn của
kiểm định hai phía
Định lý 4.2 giúp rút ra kết quả hàm ý rằng
ở mức α %
P ˆ j t ( nk 1) .se ( ˆ j ) j ˆ j t ( nk 1) .se( ˆ j ) 1
/2
/2
Giới hạn dưới của Giới hạn trên của
Độ tin cậy
khoảng tin cậy khoảng tin cậy
Tác động của doanh thu đến chi phí R&D ước Tác động ước lượng được của profmarg có
lượng được có phương sai nhỏ nên khoảng tin cậy phương sai lớn nên khoảng tin cậy rất
khá hẹp. Ngoài ra, tác động này khác 0 có ý nghĩa rộng. Thậm chí tác động này không có ý
thống kê vì số 0 nằm ngoài khoảng tin cậy. nghĩa thống kê vì số 0 nằm ngoài khoảng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated,tin cậy. to a publicly accessible website, in whole or in part.
or posted
Phân tích hồi quy bội
Vấn đề suy diễn
Trong R, để tìm khoảng tin cậy:
- Lưu kết quả hồi quy vào một đối tượng, chẳng hạn là res: res<-lm( …)
- Dùng lệnh confint (res, level = 1- α)
Ví dụ:
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
2.3. Kiểm định giả thuyết về tổ hợp tuyến tính của các tham số
Ví dụ: Suất sinh lợi giáo dục khi học cao đẳng (2 năm) và đại học
(4 năm) Số năm đi học khi Số năm đi học khi
học hệ 2 năm học hệ 4 năm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Không thể tính toán với các kết quả hồi quy bình thường
Thêm đại lượng này vào hàm Biến độc lập mới (= tổng số năm đi học ở cả
hồi quy ban đầu hai hệ)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Tổng số năm đi học
Kết quả ước lượng
Cách làm này luôn áp dụng được với các giả thuyết tuyến tính đơn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
3. Kiểm định nhiều ràng buộc tuyến tính (ràng buộc tuyến tính
bội): Kiểm định F
3.1.Kiểm định các ràng buộc loại trừ
Số trận tham gia thi đấu
Tiền lương của các cầu thủ Số năm thi đấu trung bình mỗi năm
bóng chày ở giải nhà nghề chuyên nghiệp
Điểm đánh
bóng trung bình
Số lần đánh bóng ghi điểm Số lần đánh bóng ghi
trực tiếp trung bình mỗi năm điểm mỗi năm
Nếu H0 đúng thì mô hình được gán ràng buôc (r) là:
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ước lượng mô hình chưa gán ràng buộc (ur)
Không có biến nào trong số các biến này có ý nghĩa thống kê khi kiểm
định đơn lẻ
Gợi ý : Mức độ phù hợp của mô hình sẽ ra sao nếu các biến trên bị loại bỏ ra khỏi mô
hình?
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ước lượng mô hình đã gán ràng buộc (r)
RSS sẽ tăng lên, nhưng liệu sự gia tăng này có ý nghĩa thống kê hay không?
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Cách viết khác của F khi (ur)
F
R 2
ur
Rr2 / q
và (r) có cùng dạng biến phụ thuộc: 1 R / n k 1
2
ur
Chọn giá trị tới hạn sao cho giả thuyết không
sẽ bị bác bỏ, ví dụ, trong 5% số trường hợp
mặc dù nó đúng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Kiểm định vấn đề trong ví dụ
Số các ràng buộc cần kiểm định
Thảo luận
Ba biến được kiểm định là „có ý nghĩa đồng thời“
Chúng không có ý nghĩa khi kiểm định riêng lẻ từng biến
Có thể đã có đa cộng tuyến giữa chúng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
3.2. Kiểm định ý nghĩa (toàn cục) của mô hình hồi quy
Kiểm định ý nghĩa (toàn cục) của mô hình hồi quy được trình bày
trong hầu hết các phần mềm hồi quy. Giả thuyết không thường bị
bác bỏ
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
3.3 Kiểm định ràng buộc tuyến tính tổng quát với kiểm định F
Ví dụ: Kiểm định sự hợp lý của việc định giá nhà
Giá dự kiến (giá được định ra Kích thước lô đất
Giá nhà thực tế
trước khi căn nhà được bán) (in feet)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Mô hình chưa gán ràng buộc
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Kết quả hồi quy của mô hình chưa gán ràng buộc
Kiểm định F áp dụng được với dạng tổng quát của các giả thuyết
bội và tuyến tính
Với tất cả các kiểm định và các khoảng tin cậy, các giả thiết MLR.1
– MLR.6 được giả định là thoả mãn; nếu không các kiểm định sẽ
không
© 2013 Cengage Learning. còn đáng
All Rights Reserved.tin cậy.
May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
> res.ur<-lm(log(wage) ~ educ + exper+ tenure,data=wage1)
> library(car)
> # F test
> H0<- c("educ=0.1","exper=0") Đây là các câu lệnh để
> linearHypothesis(res.ur,H0) kiểm định nhiều ràng buộc
Linear hypothesis test đồng thời và kết quả kiểm
định. Cụ thể:
Hypothesis:
educ = 0.1
H0: βeudc = 0.01, βeuxper = 0
exper = 0
Theo kết quả trên trong R, ta có p- value nhỏ nên bác bỏ H0.
Vậy u không có phân phối chuẩn.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội: Tính
tiệm cận của OLS
Ngoài JB, còn có các cách kiểm định phân phối chuẩn khác trong R: