You are on page 1of 45

Phân tích hồi quy bội: Vấn đề

suy diễn thống kê

Chương 4

Wooldridge: Introductory Econometrics:


A Modern Approach, 5e

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Suy diễn thống kê trong mô hình hồi quy gồm 2 vấn đề:
Kiểm định giả thuyết về tham số tổng thể
Xây dựng các khoảng tin cậy

1. Phân phối mẫu của các ước lượng OLS

Ước lượng OLS là các biến ngẫu nhiên

Chúng ta đã biết về kỳ vọng và phương sai của các ước lượng này

Tuy nhiên, chúng ta cần biết về phân phối của chúng để kiểm định giả
thuyết thống kê

Để suy luận về phân phối, chúng ta cần thêm giả thiết

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Giả thiết MLR.6 (Phân phối chuẩn của sai số)

độc lập với các biến

Giả sử rằng phần sai số của hồi quy


tổng thể có phân phối chuẩn.

Dạng phân phối và phương sai không


phụ thuộc vào bất kỳ biến giải thích nào.

Suy ra:

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Thảo luận về giả thiết phân phối chuẩn
Phần sai số được xem là tổng của „nhiều“ yếu tố không quan sát được
Tổng của các yếu tố độc lập có phân phối chuẩn(CLT)
Tuy nhiên, các vấn đề nảy sinh:
• Có bao nhiêu yếu tố không quan sát được? Có đủ lớn không?
• Có thể phân phối của từng yếu tố này sẽ không đồng nhất với
nhau
• Các yếu tố này độc lập với nhau ở mức nào?
Phân phối của sai số là một vấn đề thuộc về thực nghiệm
Trong nhiều trường hợp, tính chuẩn này có thể không được đảm bảo

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Thảo luận về giả thiết phân phối chuẩn (tt)
Ví dụ về trường hợp mà giả thiết về tính chuẩn không thể thỏa mãn:
• Tiền lương (không âm, thường phải lớn hơn tiền lương tối thiểu)
• Số lần bắt giữ (chỉ nhận một vài giá trị nguyên không âm)
• Thất nghiệp (xét trường hợp biến giả, chỉ nhận giá trị 0 và 1)
Trong một vài trường hợp, phân phối chuẩn có thể đạt được thông qua
việc biến đổi dạng biến phụ thuộc (chẳng hạn như dùng log(wage)
thay cho wage)
Dưới giả thiết về phân phối chuẩn, OLS là ước lượng không chệch tốt
nhất (kể cả ước lượng phi tuyến)
Quan trong: Với mục đích là suy diễn thống kê, giả thiết về phân phối
chuẩn có thể thay thế bằng cỡ mẫu lớn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Một số thuật ngữ

„các giả thiết Gauss-Markov“ Các giả thiết của „mô hình hồi quy tuyến tính cổ
điển (CLM) “

Định lý 4.1 (Phân phối chuẩn của mẫu)

Dưới các giả thiết MLR.1 – MLR.6:

Các ước lượng OLS có phân phối mẫu với Ước lượng chuẩn hóa tuân theo phân phối
phương sai như đã thiết lập trong chương chuẩn tắc
trước

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Định lý 4.1 (phân phối t cho các ước lượng chuẩn hóa)

Dưới các giả thiết MLR.1 – MLR.6:


Nếu việc chuẩn hóa được thực hiện bằng dùng độ
lệch chuẩn ước lượng (nghĩa là dùng sai số
chuẩn), phân phối chuẩn tắc sẽ được thay thế
bằng phân phối t
Lưu ý: (k+1) là số tham số trong mô hình hồi quy
Phân phối t sẽ rất gần với phân phối chuẩn tắc khi bậc tự do n-k-1 lớn.

2. Kiểm định các giả thuyết về từng tham số tổng thể


2.1.Giả thuyết không có dạng

Tham số tổng thể bằng 0, nghĩa là sau khi kiểm soát


các biến độc lập khác, xj không tác động đến y

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Thống kê t (hay tỷ số t)
Thống kê t sẽ được sử dụng để kiểm định giả thuyết không
đã đề cập ở trên. Hệ số ước lượng càng xa giá trị 0 thì giả
thuyết không càng ít khả năng đúng. Nhưng khi nào thì
được gọi là „xa“ giá trị 0?

Điều này phụ thuộc vào sự biến thiên của hệ số ước lượng được,
nghĩa là phụ thuộc vào độ lệch chuẩn của hệ số. Thống kê đo
lường xem liệu khoảng cách từ hệ số ước lượng đến giá trị 0
bằng bao nhiêu lần độ lệch chuẩn.
Phân phối của thống kê t nếu giả thuyết không là đúng

Mục tiêu: xác định một quy tắc bác bỏ sao cho nếu H0 là đúng thì
khả năng H0 bị bác bỏ là rất nhỏ (= mức ý nghĩa, ví dụ 5%)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội :
Vấn đề suy diễn
Kiểm định với giả thuyết đối một phía (lớn hơn 0)

Kiểm định với giả thuyết đối

Nếu t ˆ  t( nk 1)


j
 bác bỏ H0

Giải thích:
Bác bỏ giả thuyết không và ủng hộ giả thuyết đối
một phía này nếu hệ số hồi quy ước lượng được là
quá lớn (cụ thể là lớn hơn giá trị tới hạn).

Xây dựng giá trị tới hạn sao cho, nếu giả thuyết
không là đúng thì khả năng giả thuyết không bị
bác bỏ, chẳng hạn, là 5% trong tổng số các
trường hợp.

Trong ví dụ đã cho, đây là giá trị của phân phối t


với 28 bậc tự do mà 5% số các trường hợp sẽ lớn
hơn giá trị này.

! Bác bỏ nếu thống kê t lớn hơn 1.701


© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ: Phương trình tiền lương
Kiểm định rằng liệu sau khi kiểm soát biến học vấn và thâm niên,
những công nhân nhiều kinh nghiệm làm việc hơn có nhận được tiền
lương cao hơn hay không

Sai số chuẩn

Kiểm định với giả thuyết đối .

Người ta có thể kỳ vọng một tác động dương của kinh nghiệm đến tiền lượng giờ hoặc
không tác động gì cả.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ : Phương trình tiền lương (tt)
Thống kê t

Bậc tự do;
Ở đây, sự xấp xỉ phân
phối chuẩn tắc có thể
được áp dụng

tα(n-k-1) = t0.05(522) = 1.645 Giá trị tới hạn ứng với mức ý nghĩa
5% với bậc tự do (n-k-1) = 522

Vì texper > t0.05 = 1.645 nên Giả thuyết không sẽ bị bác bỏ

„Tác động của kinh nghiệm đến tiền lương theo giờ lớn hơn 0 có
nghĩa thống kê ở mức 5%.“

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Kiểm định với giả thuyết đối một phía (nhỏ hơn 0)

Kiểm định với giả thuyết đối

Nếu t ˆ  t( nk 1)  bác bỏ H


j
0

Giải thích:
Bác bỏ giả thuyết không với giả thuyết đối một
phía này nếu hệ số ước lượng được là „quá nhỏ“
(nghĩa là, nhỏ hơn so với giá trị tới hạn).

Xây dựng giá trị tới hạn sao cho nếu giả thuyết
không là đúng thì giả thuyết này sẽ bị bác bỏ,
chẳng hạn, trong 5% tổng số các trường hợp.

Trong ví dụ đã cho, đây là điểm giá trị mà tại đó


phân phối t với 18 bậc tự do sẽ có 5% các
trường hợp nhỏ hơn giá trị này.

! Bác bỏ nếu thống kê t nhỏ hơn -1.734

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ: Kết quả học tập của sinh viên và quy mô trường học
Kiểm định rằng liệu quy mô trường học nhỏ hơn có dẫn đến kết quả
học tập của sinh viên sẽ tốt hơn hay không

Phần trăm sinh viên vượt Thu nhập trung bình Tỷ lệ giáo viên trên Lượng sinh viên theo học
qua bài kiểm tra môn toán hàng năm của giáo viên 1000 sinh viên (= quy mô trường học)

Kiểm định với giả thuyết đối


.
Trường học càng lớn càng làm giảm kết quả học tập sinh viên hoặc quy mô trường học
không hề có tác động đến kết quả học tập?

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ: Kết quả học tập của sinh viên và quy mô trường học (tt)
Thống kê t

Bậc tự do;
Trường hợp này có thể áp
dụng xấp xỉ phân phối
chuẩn tắc

t0.05 = 1.645 Giá trị tới hạn với mức ý nghĩa 5%

Vì tenroll > - t0.05 = - 1.645 nên Giả thuyết không không bị bác bỏ

Chúng ta không thể bác bỏ giả thuyết về việc quy mô trường học không có
tác động đến kết quả học tập của sinh viên (ở mức ý nghĩa 5%).

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ: Kết quả học tập của sinh viên và quy mô trường học (tt)
Một dạng hàm khác :

R2 cao hơn một chút

Kiểm định

với giả thuyết đối .


© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ: Kết quả học tập của sinh viên và quy mô trường học (tt)

Thống kê t

Giá trị tới hạn ở mức ý nghĩa 5%


t0.05 = 1.645 Vì tlog(enroll) < - t0.05 = - 1.645  bác bỏ giả thuyết không

Giả thuyết cho rằng quy mô trường học không có tác động đến kết quả học
tập của sinh viên đã bị bác bỏ, và ủng hộ giả thuyết đối cho rằng sự tác
động là ngược chiều
Nếu số sinh viên tăng lên 10% thì số sinh viên
Độ lớn của tác động ra sao? vượt qua bài kiểm tra sẽ thay đổi một lượng là -
0.129 điểm phần trăm (tác động rất nhỏ)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Kiểm định với giả thuyết đối hai phía

Kiểm định với


Nếu | t ˆ |  t
j
( n  k 1)
 /2  bác bỏ H0

Giải thích:
Bác bỏ giả thuyết không với giả thiết đối hai phía
nếu giá trị tuyệt đối của hệ số ước lượng quá lớn.

Xây dựng giá trị tới hạn sao cho nếu giả thuyết
không là đúng, thì nó có thể bị bác bỏ, ví dụ, 5%
trong tổng số các trường hợp.

Trong ví dụ đã cho, những điểm ứng với 5% các


trường hợp này nằm ở hai phía đuôi của hàm
phân phối.

Bác bỏ nếu giá trị tuyệt đối của thống kê nhỏ hơn -
2.06 hoặc lớn hơn 2.06
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ: Các yếu tố tác động đến điểm GPA Số buổi cúp học

Dùng phân phối chuẩn tắc để tìm giá trị tới hạn,
mức ý nghĩa α = 0.01 với kiểm định hai phía.
|thsGPA | = 0.412/0.094 Tác động của hsGPA và số buổi cúp học
= 4.38 > t0.01/2= 2.58 khác 0 có ý nghĩa ở mức 1%. Tác động
của ACT khác 0 không có ý nghĩa thống
|tACT | = 0.015/0.011 kê, thậm chí ở mức 10%.

= 1.36 < t0.1/2= 1.645

|tskipped |= |-0.083/0.026| =|-3.19| > t0.01/2= 2.58


© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Biến độc lập „có ý nghĩa thống kê“ trong hồi quy
Nếu một hệ số hồi quy khác 0 trong một kiểm định hai phía, biến độc
lập tương ứng với hệ số hồi quy đó được gọi là „có ý nghĩa thống kê“
Nếu số bậc tự do đủ lớn sao cho có thể áp dụng xấp xỉ phân phối
chuẩn thì quy tắc sau đây có thể áp dụng:

„có ý nghĩa thống kê ở mức 10% “

„có ý nghĩa thống kê ở mức 5%“

„có ý nghĩa thống kê ở mức 1%“

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Một số hướng dẫn về ý nghĩa kinh tế và ý nghĩa thống kê
Nếu một biến độc lập có ý nghĩa thống kê, thì hãy thảo luận về độ lớn
của hệ số để đánh giá ý nghĩa kinh tế hoặc ý nghĩa thực tiễn của biến
Một biến có ý nghĩa thống kê không nhất thiết phải có ý nghĩa kinh tế
hoặc ý nghĩa thực tiễn!
Nếu một biến có ý nghĩa thống kê và ý nghĩa kinh tế nhưng bị „sai“
dấu, mô hình hồi quy có thể bị định dạng sai
Nếu một biến không có ý nghĩa thống kê ở mức ý nghĩa thông thường
(10%, 5%, 1%), người ta có thể nghĩ đến việc bỏ biến đó ra khỏi hàm
hồi quy
Nếu quy mô mẫu nhỏ, thì sự tác động có thể bị ước lượng kém „chính
xác“ (imprecise) vì vậy bằng chứng của việc biến không ý nghĩa thống
kê không còn mạnh nữa
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
2.2. Kiểm định các giả thuyết tổng quát về hệ số hồi quy
Giả thuyết không
Giá trị cần kiểm định của các hệ số hồi quy

Thống kê t

Việc kiểm định được thực hiện giống hệt như trước, ngoại trừ việc
lấy giá trị ước lượng trừ cho giá trị cần kiểm định khi tính toán các
thống kê kiểm định
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ: Vấn đề tội phạm trong trường học và số sinh viên theo học
Một giả thuyết được quan tâm là liệu số lượng phạm tội có tăng 1% lhi
số sinh viên theo học tăng 1%

Giá trị ước lượng là khác


1 nhưng sự khác nhau có
ý nghĩa thống kê hay
không?

Giả thuyết bị bác bỏ ở


mức ý nghĩa 5%
|t| = |(1.27 – 1 )/0.11| = 2.45 > t0.05/2= 1.96

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Tính toán p-value cho các kiểm định t
Mức ý nghĩa nhỏ nhất mà tại đó giả thuyết H0 bị bác bỏ, được gọi là p-
value của kiểm định giả thuyết
Một giá trị p-value nhỏ là bằng chứng để chống lại giả thuyết H0 vì
người ta sẽ bác bỏ giả thuyết H0 thậm chí ở mức ý nghĩa rất nhỏ
Một giá trị p-value lớn là bằng chứng để ủng hộ giả thuyết không

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Cách tính p-value cho kiểm định t (trường hợp kiểm định hai phía)
ˆ j  a j
p =P ( |T| > |t|) với t 
se ( ˆ ) j

giả thuyết không sẽ bị bác bỏ


nếu p-value <=α
Những giá trị này là
giá trị tới hạn cho p-value là mức ý nghĩa mà tại đó không có sự
mức ý nghĩa 5% khác nhau giữa việc bác bỏ hoặc không bác
bỏ giả thuyết không.

Trong trường hợp kiểm định hai phía, p-value


là xác suất sao cho các biến ngẫu nhiên có
phân phối t sẽ nhận giá trị tuyệt đối lớn hơn
trị tuyệt đối của giá trị thực tế, nghĩa là:
p = P ( |T| > 1.85) = 2(0.0359) = 0.0718
Giá trị thống kê kiểm định
Ví dụ trên, với mức ý nghĩa 5%, thống kê t sẽ
không nằm trong miền bác bỏ.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Chú ý:
1. Vì phân phối t là đối xứng nên :
P(T> |t|) = P (T< -|t|) = P (|T|> |t|)/2
2. Trong các phần mềm, giá trị p-value hiển thị cho kiểm định t là ứng
với giả thuyết đối hai phía. Vì vậy tính p-value một phía bằng cách:
p-value (một phía)=p-value(hai phía)/2.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Call: lm(formula =log(wage)~ educ+ exper + tenure, data = wage1)

Residuals:
Min 1Q Median 3Q Max
-2.05802 -0.29645 -0.03265 0.28788 1.42809
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.284360 0.104190 2.729 0.00656 **
educ 0.092029 0.007330 12.555 < 2e-16 ***
exper 0.004121 0.001723 2.391 0.01714 *
tenure 0.022067 0.003094 7.133 3.29e-12 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.4409 on 522 degrees of freedom
Multiple R-squared: 0.316, Adjusted R-squared: 0.3121
F-statistic: 80.39 on 3 and 522 DF, p-value: < 2.2e-16

1. Dùng p-value xem các biến có ý nghĩa thống kê không ở mức 5%?
2. Biến educ có tác động dương lên wage với mức ý nghĩa 10% ?
3. Kđịnh giả thuyết cho rằng tenure tăng 1 năm thì wage tăng 3% với α = 5%.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Khoảng tin cậy Giá trị tới hạn của
kiểm định hai phía
Định lý 4.2 giúp rút ra kết quả hàm ý rằng
 ở mức α %
P  ˆ j  t ( nk 1) .se ( ˆ j )   j  ˆ j  t ( nk 1) .se( ˆ j )   1  
  /2
  /2

 
Giới hạn dưới của Giới hạn trên của
Độ tin cậy
khoảng tin cậy khoảng tin cậy

Diễn giải ý nghĩa của khoảng tin cậy


Các giới hạn trên và dưới của khoảng tin cậy là ngẫu nhiên
Trong mẫu lặp lại, khoảng tin cậy như trên sẽ chứa hệ số hồi quy
tổng thể trong 95% các trường hợp nếu mức ý nghĩa là 5%.
Liên hệ giữa khoảng tin cậy và việc kiểm định giả thuyết
bác bỏ ủng hộ H1 :  j  a j
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ví dụ: Mô hình hồi quy về chi phí R&D của doanh nghiệp
Doanh thu
Chi tiêu cho R&D Phần trăm lợi nhuận trên doanh thu
hàng năm

n = 32, R2 = .918, df = 32 – 2 – 1 = 29  t0.05/2=2.045


Khoảng tin cậy ở mức ý nghĩa 5% của các hệ số:

Tác động của doanh thu đến chi phí R&D ước Tác động ước lượng được của profmarg có
lượng được có phương sai nhỏ nên khoảng tin cậy phương sai lớn nên khoảng tin cậy rất
khá hẹp. Ngoài ra, tác động này khác 0 có ý nghĩa rộng. Thậm chí tác động này không có ý
thống kê vì số 0 nằm ngoài khoảng tin cậy. nghĩa thống kê vì số 0 nằm ngoài khoảng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated,tin cậy. to a publicly accessible website, in whole or in part.
or posted
Phân tích hồi quy bội
Vấn đề suy diễn
Trong R, để tìm khoảng tin cậy:
- Lưu kết quả hồi quy vào một đối tượng, chẳng hạn là res: res<-lm( …)
- Dùng lệnh confint (res, level = 1- α)
Ví dụ:

> # hồi quy OLS


> ketqua<-lm(log(wage) ~ educ + exper+ tenure,data=wage1)
> confint(ketqua) Khoảng tin cậy của
2.5 % 97.5 % hệ số của biến educ với
(Intercept) 0.0796755842 0.48904353 mức ý nghĩa 5%
educ 0.0776292137 0.10642876
exper 0.0007356983 0.00750652
tenure 0.0159896850 0.02814475
>

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
2.3. Kiểm định giả thuyết về tổ hợp tuyến tính của các tham số
Ví dụ: Suất sinh lợi giáo dục khi học cao đẳng (2 năm) và đại học
(4 năm) Số năm đi học khi Số năm đi học khi
học hệ 2 năm học hệ 4 năm

Kiểm định với giả thuyết đối


.
Một thống kê kiểm định có thể dùng là :
Chênh lệch giữa các ước lượng được chuẩn hoá bằng cách chia cho
độ lệch chuẩn của khoảng chênh lệch này. Giả thuyết H0 sẽ bị bác bỏ
nếu giá trị thống kê mang giá trị âm quá lớn để tin rằng sự khác nhau
thực sự trong tổng thể giữa hai ước lượng là bằng 0.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Không thể tính toán với các kết quả hồi quy bình thường

Không có sẵn trong kết quả hồi quy thông


Cách làm khác thường

Tính và kiểm định với .

Thêm đại lượng này vào hàm Biến độc lập mới (= tổng số năm đi học ở cả
hồi quy ban đầu hai hệ)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Tổng số năm đi học
Kết quả ước lượng

Giả thuyết bị bác bỏ tại mức ý


nghĩa 10% nhưng không bị
bác bỏ tại 5%

Cách làm này luôn áp dụng được với các giả thuyết tuyến tính đơn

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
3. Kiểm định nhiều ràng buộc tuyến tính (ràng buộc tuyến tính
bội): Kiểm định F
3.1.Kiểm định các ràng buộc loại trừ
Số trận tham gia thi đấu
Tiền lương của các cầu thủ Số năm thi đấu trung bình mỗi năm
bóng chày ở giải nhà nghề chuyên nghiệp

Điểm đánh
bóng trung bình
Số lần đánh bóng ghi điểm Số lần đánh bóng ghi
trực tiếp trung bình mỗi năm điểm mỗi năm

Kiểm định việc các đại lượng đo


lường hiệu quả thi đấu của cầu thủ
không tác động đến tiền lương

Nếu H0 đúng thì mô hình được gán ràng buôc (r) là:

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ước lượng mô hình chưa gán ràng buộc (ur)

Không có biến nào trong số các biến này có ý nghĩa thống kê khi kiểm
định đơn lẻ

Gợi ý : Mức độ phù hợp của mô hình sẽ ra sao nếu các biến trên bị loại bỏ ra khỏi mô
hình?

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Ước lượng mô hình đã gán ràng buộc (r)

RSS sẽ tăng lên, nhưng liệu sự gia tăng này có ý nghĩa thống kê hay không?

SSRr SSR của mô hình r


Thống kê kiểm định Số các ràng buộc
SSRur : SSR của mô hình ur
Sự tăng lên tương đối của tổng bình
phương phần dư khi đi từ
H1 đến H0 tuân theo một phân phối
F (nếu H0 là đúng )

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Cách viết khác của F khi (ur)
F
R 2
ur
 Rr2  / q
và (r) có cùng dạng biến phụ thuộc: 1  R  /  n  k  1
2
ur

SSRr : SSR của mô hình r


Quy tắc bác bỏ: SSRur : SSR của mô hình ur

F > Fα (q, n-k-1) hay P(F- stat > F) ≤ α  bác bỏ H0

Một biến ngẫu nhiên có phân phối F chỉ có


thể nhận giá trị dương. Điều này tương ứng
với việc tổng bình phương phần dư chỉ có thể
tăng thêm khi đi từ H1 đến H0.

Chọn giá trị tới hạn sao cho giả thuyết không
sẽ bị bác bỏ, ví dụ, trong 5% số trường hợp
mặc dù nó đúng

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Kiểm định vấn đề trong ví dụ
Số các ràng buộc cần kiểm định

Bậc tự do của mô hình


chưa gán ràng buộc

Ký hiệu : c0.01 là giá trị tới hạn ở mức 1%.


Bằng chứng bác bỏ giả thuyết
Ký hiệu khác : Fα Giá trị tới hạn ở mức α của không là rất mạnh (thậm chí ở
thống kê F với bậc tự do là 3 và 347. mức ý nghĩa rất nhỏ).

Thảo luận
Ba biến được kiểm định là „có ý nghĩa đồng thời“
Chúng không có ý nghĩa khi kiểm định riêng lẻ từng biến
Có thể đã có đa cộng tuyến giữa chúng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
3.2. Kiểm định ý nghĩa (toàn cục) của mô hình hồi quy

Giả thuyết không phát biểu rằng các biến giải


thích hoàn toàn không có tác dụng giải thích cho
biến phụ thuộc, tức mô hình không có ý nghĩa
Mô hình đã gán ràng
buộc (hồi quy với hệ số
chặn)

Kiểm định ý nghĩa (toàn cục) của mô hình hồi quy được trình bày
trong hầu hết các phần mềm hồi quy. Giả thuyết không thường bị
bác bỏ
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
3.3 Kiểm định ràng buộc tuyến tính tổng quát với kiểm định F
Ví dụ: Kiểm định sự hợp lý của việc định giá nhà
Giá dự kiến (giá được định ra Kích thước lô đất
Giá nhà thực tế
trước khi căn nhà được bán) (in feet)

Chiều dài Số phòng ngủ

Hơn nữa, các yếu tố khác nhất thiết


không có tác động đến giá thực tế một
khi đã kiểm soát giá dự kiến.
Nếu căn nhà được định giá hợp lý, thì 1% sự thay đổi trong
giá dự kiến sẽ tương ứng với 1% thay đổi trong giá thực tế.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Mô hình chưa gán ràng buộc

Mô hình đã gán ràng buộc thực


Mô hình đã gán ràng buộc chất là mô hình hồi quy [y-x1] theo
một hằng số

Thống kê kiểm định

Không thể bị bác bỏ

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
Kết quả hồi quy của mô hình chưa gán ràng buộc

When tested individually,


there is also no evidence
against the rationality of
house price assessments

Kiểm định F áp dụng được với dạng tổng quát của các giả thuyết
bội và tuyến tính
Với tất cả các kiểm định và các khoảng tin cậy, các giả thiết MLR.1
– MLR.6 được giả định là thoả mãn; nếu không các kiểm định sẽ
không
© 2013 Cengage Learning. còn đáng
All Rights Reserved.tin cậy.
May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội
Vấn đề suy diễn
> res.ur<-lm(log(wage) ~ educ + exper+ tenure,data=wage1)
> library(car)
> # F test
> H0<- c("educ=0.1","exper=0") Đây là các câu lệnh để
> linearHypothesis(res.ur,H0) kiểm định nhiều ràng buộc
Linear hypothesis test đồng thời và kết quả kiểm
định. Cụ thể:
Hypothesis:
educ = 0.1
H0: βeudc = 0.01, βeuxper = 0
exper = 0

Model 1: restricted model


Model 2: log(wage) ~ educ + exper + tenure

Res.Df RSS Df Sum of Sq F Pr(>F)


1 524 103.30
2 522 101.46
2 1.8399 4.7332 0.00918 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội: Tính
tiệm cận của OLS
4. Kiểm định phân phối chuẩn:
Có nhiều cách kiểm định phân phối chuẩn của một chuỗi dữ liệu, một
trong số đó là dùng thống kê kiểm định Jarque- Bera.
Để xem u phân phối chuẩn hay không, dùng dữ liệu của phần dư để
tiến hành kiểm định.
H0: u phân phối chuẩn
- Tính thống kê JB (các phần mềm tính sẵn)
- Nếu JB > χ2α(2) hay p(JB) ≤ α  bác bỏ H0
Chú ý: R có sẵn thủ tục kiểm định JB, nằm trong gói lệnh normtest.
Ví dụ: Cho mô hình log(wage) = β0 + β1 educ+ β2 exper + u
Dùng data trong file wage2 xem u có phân phối chuẩn hay không ?
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội: Tính
tiệm cận của OLS
> library(foreign)
> wage2<-read.dta("http://fmwww.bc.edu/ec-p/data/wooldridge/wage2.dta")
> ketqua<-lm(log(wage)~educ+exper, data = wage2)
# lấy phần dư ở ketqua luu vào biến phandu
> phandu<-resid(ketqua)
>library(normtest)
# lệnh kiểm định Jarque- Bera xem phần dư có phân phối chuẩn hay không
> jb.norm.test(phandu)
Jarque-Bera test for normality
data: phandu
JB = 38.593, p-value < 2.2e-16

Theo kết quả trên trong R, ta có p- value nhỏ nên bác bỏ H0.
Vậy u không có phân phối chuẩn.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích hồi quy bội: Tính
tiệm cận của OLS
Ngoài JB, còn có các cách kiểm định phân phối chuẩn khác trong R:

# Kiem dinh Shapiro-Wilk


>shapiro.test(phandu)
Shapiro-Wilk normality test
data: phandu
W = 0.99053, p-value = 1.015e-05
# Kiem dinh Anderson-Darling
>library(nortest)
> ad.test(phandu)
Anderson-Darling normality test
data: phandu
A = 2.2174, p-value = 1.257e-05
# Kiem dinh Kolmogorov-Smirnov
> lillie.test(phandu)
Lilliefors (Kolmogorov-Smirnov) normality test
data: phandu
= 0.040784, p-value = 0.0008911
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

You might also like