Professional Documents
Culture Documents
OLS - T NG H P Công TH C - Eureka Uni
OLS - T NG H P Công TH C - Eureka Uni
com)
HỎI ĐÁP
Mô hình hồi quy tổng thể - PRM 𝑌𝑌 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋 + 𝑢𝑢 𝑌𝑌 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑘𝑘 + 𝑢𝑢
(Population Regression Model) Dạng véc-tơ: 𝑌𝑌 = 𝑋𝑋𝑋𝑋 + 𝑢𝑢
Hàm hồi quy tổng thể - PRF 𝐸𝐸 (𝑌𝑌|𝑋𝑋) = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋 𝐸𝐸 (𝑌𝑌|𝑋𝑋2 , … , 𝑋𝑋𝑘𝑘 ) = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑘𝑘
(Population Regression Function) 𝐸𝐸 (𝑌𝑌|𝑋𝑋) = 𝑋𝑋𝑋𝑋
Mô hình hồi quy mẫu – SRM 𝑌𝑌𝑖𝑖 = 𝛽𝛽̂1 + 𝛽𝛽̂2 𝑋𝑋𝑖𝑖 + 𝑒𝑒𝑖𝑖 𝑌𝑌𝑖𝑖 = 𝛽𝛽̂1 + 𝛽𝛽̂2 𝑋𝑋2𝑖𝑖 + ⋯ + 𝛽𝛽̂𝑘𝑘 𝑋𝑋𝑘𝑘𝑘𝑘 + 𝑒𝑒𝑖𝑖
(Sample Regression Model) 𝑌𝑌 = 𝑋𝑋𝛽𝛽̂ + 𝑒𝑒
Hàm hồi quy mẫu – SRF 𝑌𝑌� = 𝛽𝛽̂1 + 𝛽𝛽̂2 𝑋𝑋𝑖𝑖 𝑌𝑌�𝑖𝑖 = 𝛽𝛽̂1 + 𝛽𝛽̂2 𝑋𝑋2𝑖𝑖 + ⋯ + 𝛽𝛽̂𝑘𝑘 𝑋𝑋𝑘𝑘𝑘𝑘
(Sample Regression Function) 𝑌𝑌� = 𝑋𝑋𝛽𝛽̂
Ước lượng điểm cho giá trị trung 𝑌𝑌�0 = 𝛽𝛽̂1 + 𝛽𝛽̂2 𝑋𝑋0 𝑌𝑌�0 = 𝑋𝑋0′ 𝛽𝛽̂
bình của biến phụ thuộc: 1
𝐸𝐸 (𝑌𝑌|𝑋𝑋0 ) 𝑋𝑋20
𝑋𝑋0 = � �
…
𝑋𝑋𝑘𝑘0
3. ĐỘ PHÙ HỢP
Thống kê T 𝛽𝛽̂𝑗𝑗
𝑇𝑇𝑗𝑗 =
(t-statistics) 𝑠𝑠𝑠𝑠�𝛽𝛽̂𝑗𝑗 �
𝑠𝑠𝑠𝑠�𝑎𝑎𝛽𝛽̂𝑗𝑗 + 𝑏𝑏𝛽𝛽̂𝑠𝑠 � = �𝑎𝑎2 𝑠𝑠𝑒𝑒 2 �𝛽𝛽̂𝑗𝑗 � + 𝑏𝑏 2 𝑠𝑠𝑒𝑒 2 �𝛽𝛽̂𝑠𝑠 � + 2𝑎𝑎𝑎𝑎. 𝑐𝑐𝑐𝑐𝑐𝑐�𝛽𝛽̂𝑗𝑗 ; 𝛽𝛽̂𝑠𝑠 �
6. CÁC DẠNG MÔ HÌNH Mô hình tổng thể dạng đơn giản Ý nghĩa quan hệ
Ý nghĩa hệ số
(*) Quy luật lợi suất cận biên giảm dần: 𝑌𝑌 không thể tăng mãi, không thể lên đỉnh.
(**) Quy luật lợi suất cận biên giảm dần: 𝑌𝑌 không thể tăng mãi, lên đỉnh sau đó giảm nhanh dần.
Dạng tuyến tính toàn phần 𝑌𝑌 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋 + 𝑢𝑢 Ảnh hưởng tuyệt đối (dạng đơn vị)
Lin-lin 𝛽𝛽2 : 𝑋𝑋 tăng 1 đơn vị ⇒ 𝑌𝑌 thay đổi |𝛽𝛽2 | đơn vị.
Dạng loga toàn phần ln 𝑌𝑌 = 𝛽𝛽1 + 𝛽𝛽2 ln 𝑋𝑋 + 𝑢𝑢 Ảnh hưởng tương đối (dạng %)
Log-log 𝛽𝛽2 : 𝑋𝑋 tăng 1% ⇒ 𝑌𝑌 thay đổi |𝛽𝛽2 |%.(*)
𝛽𝛽2 là hệ số co giãn của 𝑌𝑌 theo 𝑋𝑋.
Dạng bán loga ln 𝑌𝑌 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋 + 𝑢𝑢 Mô hình tăng trưởng
Log-lin 𝛽𝛽2 : 𝑋𝑋 tăng 1 đơn vị ⇒ 𝑌𝑌 thay đổi 100|𝛽𝛽2 |%.
Dạng bán loga 𝑌𝑌 = 𝛽𝛽1 + 𝛽𝛽2 ln 𝑋𝑋 + 𝑢𝑢 Ảnh hưởng tương đối của 𝑿𝑿
Lin-log 𝛽𝛽2 : 𝑋𝑋 tăng 1% ⇒ 𝑌𝑌 thay đổi |𝛽𝛽2 |/100 đơn vị.(*)
Dạng bậc 2 𝑌𝑌 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋 + 𝛽𝛽3 𝑋𝑋 2 + 𝑢𝑢 Tác động biên thay đổi
Δ𝑌𝑌 ≈ (𝛽𝛽2 + 2𝛽𝛽3 𝑋𝑋)Δ𝑋𝑋
𝛽𝛽2 > 0, 𝛽𝛽3 > 0: 𝑋𝑋 tăng ⇒ 𝑌𝑌 tăng nhanh dần.
𝛽𝛽2 > 0, 𝛽𝛽3 < 0: 𝑋𝑋 tăng ⇒ 𝑌𝑌 tăng chậm dần.(*)
𝛽𝛽2 < 0, 𝛽𝛽3 > 0: 𝑋𝑋 tăng ⇒ 𝑌𝑌 giảm chậm dần.
𝛽𝛽2 < 0, 𝛽𝛽3 < 0: 𝑋𝑋 tăng ⇒ 𝑌𝑌 giảm nhanh dần.
Hồi quy mùa vụ 𝑌𝑌𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 𝑄𝑄2𝑡𝑡 + 𝛽𝛽3 𝑄𝑄3𝑡𝑡 + 𝛽𝛽4 𝑄𝑄4𝑡𝑡 + 𝑢𝑢𝑡𝑡 Quý I làm cơ sở để so với các quý khác.
Mùa vụ phổ biến theo quý 𝛽𝛽2 > 0: 𝑌𝑌 ở quý II nhiều hơn ở quý I 𝛽𝛽2 đơn vị.
𝑄𝑄1 , 𝑄𝑄2 , 𝑄𝑄3 , 𝑄𝑄4 tương ứng là các biến 𝛽𝛽3 > 0: 𝑌𝑌 ở quý III nhiều hơn ở quý I 𝛽𝛽3 đơn vị.
giả mùa vụ mã hóa cho các quý I, II, 𝛽𝛽2 > 𝛽𝛽3 : 𝑌𝑌 ở quý II nhiều hơn ở quý III (𝛽𝛽2 − 𝛽𝛽3 )
III, IV. đơn vị.
7. KIỂM ĐỊNH LỖI Tên kiểm định và hồi quy phụ Cặp giả thuyết và quy tắc bác bỏ 𝑯𝑯𝟎𝟎
Mô hình với 3 biến giải thích 𝑌𝑌 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2 + 𝛽𝛽3 𝑋𝑋3 + 𝛽𝛽4 𝑋𝑋4 + 𝑢𝑢, 𝑅𝑅2 , 𝑌𝑌�, 𝑒𝑒
𝑒𝑒 2 = 𝛼𝛼1 + 𝛼𝛼2 𝑋𝑋2 + 𝛼𝛼3 𝑋𝑋3 + 𝛼𝛼4 𝑋𝑋4 + 𝛼𝛼5 𝑋𝑋22 𝐻𝐻0 : 𝛼𝛼2 = 𝛼𝛼3 = ⋯ = 𝛼𝛼10 = 0
+ 𝛼𝛼6 𝑋𝑋32 + 𝛼𝛼7 𝑋𝑋42 + 𝛼𝛼8 𝑋𝑋2 𝑋𝑋3
𝜒𝜒 2 = 𝑛𝑛𝑅𝑅𝑒𝑒2 > 𝜒𝜒𝛼𝛼2(9)
+ 𝛼𝛼9 𝑋𝑋2 𝑋𝑋4 + 𝛼𝛼10 𝑋𝑋3 𝑋𝑋4 + 𝑣𝑣,
𝑅𝑅𝑒𝑒2 𝑅𝑅𝑒𝑒2 /9 (9,𝑛𝑛−10)
𝐹𝐹 = 2
> 𝑓𝑓𝛼𝛼
(1 − 𝑅𝑅𝑒𝑒 )/(𝑛𝑛 − 10)
𝑝𝑝 − 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 < 𝛼𝛼
Vi phạm giả thiết Durbin-Watson 𝐻𝐻0 : Không có tự tương quan bậc 1
𝑪𝑪𝑪𝑪𝑪𝑪𝑪𝑪(𝒖𝒖𝒕𝒕 , 𝒖𝒖𝒔𝒔 ) = 𝟎𝟎 𝑒𝑒𝑡𝑡 = 𝜌𝜌𝑒𝑒𝑡𝑡−1 + 𝑣𝑣𝑡𝑡 𝑑𝑑 = 2 − 2𝜌𝜌�
𝐻𝐻0 : Không vi phạm giả thiết 𝑑𝑑 < 𝑑𝑑𝐿𝐿 ⇒ tự tương quan bậc 1 (+)
(Không có tự tương quan) 𝑑𝑑 > 4 − 𝑑𝑑𝐿𝐿 ⇒ tự tương quan bậc 1 (−)
𝑑𝑑𝑈𝑈 < 𝑑𝑑 < 4 − 𝑑𝑑𝑈𝑈 ⇒ không có tự tương quan
Còn lại ⇒ không kết luận.
Durbin-h 𝐻𝐻0 : Không có tự tương quan bậc 1
(khi có 𝑌𝑌𝑡𝑡−1 là biến giải thích) 𝑑𝑑 𝑛𝑛
ℎ = �1 − � �
𝑒𝑒𝑡𝑡 = 𝜌𝜌𝑒𝑒𝑡𝑡−1 + 𝑣𝑣𝑡𝑡 2 1 − 𝑛𝑛. 𝑠𝑠𝑒𝑒 2 �𝛽𝛽̂𝑌𝑌𝑡𝑡−1 �
Đánh giá mức độ đa cộng tuyến 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶�𝑋𝑋𝑗𝑗 , 𝑋𝑋𝑠𝑠≠𝑗𝑗 � Đa cộng tuyến cao khi:
𝑋𝑋2 = 𝛼𝛼1 + 𝛼𝛼2 𝑋𝑋3 + 𝛼𝛼3 𝑋𝑋4 + 𝑣𝑣2 , 𝑅𝑅22 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶�𝑋𝑋𝑗𝑗 , 𝑋𝑋𝑠𝑠≠𝑗𝑗 � > 0,8
⎡
𝑋𝑋3 = 𝜆𝜆1 + 𝜆𝜆2 𝑋𝑋2 + 𝜆𝜆3 𝑋𝑋4 + 𝑣𝑣3 , 𝑅𝑅32 ⎢∃ 𝑅𝑅𝑗𝑗2 > 0,9
⎢ 1
𝑋𝑋4 = 𝛾𝛾1 + 𝛾𝛾2 𝑋𝑋2 + 𝛾𝛾3 𝑋𝑋3 + 𝑣𝑣4 , 𝑅𝑅42 ⎢∃ 𝑉𝑉𝑉𝑉𝐹𝐹𝑗𝑗 = > 10 (một số đề xuất > 2)
⎣ 1 = 𝑅𝑅𝑗𝑗2
Một số giáo trình và tài liệu thực hiện Kiểm định sự tồn tại của đa cộng tuyến dựa trên kiểm
định F về sự phù hợp của 3 hồi quy phụ theo 3 biến độc lập kể trên.
Tuy nhiên, xét thấy kết luận từ các kiểm định F đó chỉ cho ta thông tin rằng Có/Không có đa
cộng tuyến. Trong khi vấn đề chúng ta cần quan tâm là Mức độ của hiện tượng thì kiểm định
trên không cung cấp thông tin hữu ích. Hơn nữa, các biến giải thích trong thực tế đều ít nhiều
có tương quan thống kê nên kết luận thu được trong hầu hết trường hợp đều là “Có đa cộng
tuyến”.
Vì những lý do trên, tôi cho rằng “kiểm định đa cộng tuyến” là thao tác không cần thiết và
không đưa vào phần tổng hợp này.
8. KHẮC PHỤC LỖI PHƯƠNG SAI SAI SỐ THAY ĐỔI TỰ TƯƠNG QUAN
Bình phương bé nhất tổng quát 𝑢𝑢 𝑢𝑢𝑡𝑡 = 𝜌𝜌𝑢𝑢𝑡𝑡−1 + 𝜖𝜖𝑡𝑡 ⇒ 𝑢𝑢𝑡𝑡∗ = 𝑢𝑢𝑡𝑡 − 𝜌𝜌𝑢𝑢𝑡𝑡−1 = 𝜖𝜖𝑡𝑡
𝑉𝑉𝑉𝑉𝑉𝑉(𝑢𝑢|𝑋𝑋𝑖𝑖 ) = 𝜎𝜎𝑖𝑖2 ⇒ 𝑉𝑉𝑉𝑉𝑉𝑉 � �𝑋𝑋𝑖𝑖 � = 1
𝜎𝜎𝑖𝑖
Generalized Least Squares (GLS) 𝑌𝑌𝑡𝑡∗ = 𝛽𝛽1∗ + 𝛽𝛽2 𝑋𝑋2𝑡𝑡
∗ ∗
+ 𝛽𝛽3 𝑋𝑋3𝑡𝑡 ∗
+ 𝛽𝛽4 𝑋𝑋4𝑡𝑡 + 𝑢𝑢𝑡𝑡∗
𝑌𝑌𝑖𝑖 1 𝑋𝑋2𝑖𝑖 𝑋𝑋3𝑖𝑖 𝑋𝑋4𝑖𝑖 𝑢𝑢𝑖𝑖
= 𝛽𝛽1 + 𝛽𝛽2 + 𝛽𝛽3 + 𝛽𝛽4 + 𝑍𝑍𝑡𝑡∗ = 𝑍𝑍𝑡𝑡 − 𝜌𝜌𝑍𝑍𝑡𝑡−1 , 𝑍𝑍 = �𝑌𝑌, 𝑋𝑋𝑗𝑗 , 𝑢𝑢�
𝜎𝜎𝑖𝑖 𝜎𝜎𝑖𝑖 𝜎𝜎𝑖𝑖 𝜎𝜎𝑖𝑖 𝜎𝜎𝑖𝑖 𝜎𝜎𝑖𝑖
𝛽𝛽1∗ = 𝛽𝛽1 (1 − 𝜌𝜌)