Professional Documents
Culture Documents
Hệ số tương quan mẫu 𝑟𝑋𝑌 = 0,922094 là rất lớn và gần với 1 nên 𝑋
và 𝑌 có phụ thuộc tương quan tuyến tính khá cao.
❖ Sử dụng Excel: Vẽ biểu đồ phân tán và đường xu hướng
80 BIỂU ĐỒ PHÂN TÁN
70
CÂN NẶNG 60
50
40
30
20
10
0
0 0,5 1 1,5 2
CHIỀU CAO
Nhận xét: Dựa vào đồ thị phân tán, ta thấy rằng các điểm dữ liệu
tập trung xung quanh một đường thẳng đồng biến. Như vậy ta
có thể dự đoán rằng: chiều cao và cân nặng có phụ thuộc tương
quan tuyến tính khá cao.
§ 2. Phân tích hồi quy tuyến tính đơn
𝑛𝛽ƶ1 + 𝛽ƶ2 𝑋𝑖 = 𝑌𝑖
⇔
𝛽ƶ1 𝑋𝑖 + 𝛽ƶ2 𝑋𝑖2 = 𝑋𝑖 𝑌𝑖
᪄ 𝑌᪄
σ 𝑋𝑖 𝑌𝑖 −𝑛⋅𝑋⋅
ƶ
𝛽2 = σ 2 ᪄ 2
𝑋𝑖 −𝑛⋅(𝑋)
⇔ቐ .
𝛽ƶ1 = 𝑌᪄ − 𝛽ƶ2 𝑋᪄
❖ Ví dụ
Cho số liệu về mức chi tiêu tiêu dùng 𝑌 (USD/tuần) và thu nhập
hàng tuần X(USD/tuần) của một mẫu gồm 10 gia đình. Giả sử 𝑌
và 𝑋 có mối quan hệ tương quan tuyến tính. Hãy tìm hàm hồi quy
mẫu của 𝑌 theo 𝑋 và nêu ý nghĩa kinh tế của các hệ số hồi quy.
𝑋𝑖 80 100 120 140 160 180 200 220 240 260
𝑌𝑖 70 65 90 95 110 115 120 140 155 150
Giải
Hàm hồi quy tổng thể: 𝐸 𝑌/𝑋 = 𝛽1 + 𝛽2 𝑋
Hàm hồi quy mẫu: 𝑌ƶ = 𝛽ƶ1 + 𝛽ƶ2 𝑋.
Ta có: 𝑛 = 10, 𝑋᪄ = 170; 𝑌᪄ = 111; σ 𝑋𝑖 𝑌𝑖 = 205500; σ 𝑋𝑖2 = 322000.
᪄ 𝑌᪄
σ 𝑋𝑖 𝑌𝑖 −𝑛⋅𝑋⋅ 205500−10×170×111
ƶ
𝛽2 = 2 = = 0,509091.
᪄ 2
σ 𝑋𝑖 −𝑛⋅(𝑋) 322000−10×1702
𝛽ƶ1 = 𝑌᪄ − 𝛽ƶ2 𝑋᪄ = 111 − 0,509091 × 170 = 24,4545.
Vậy hàm hồi quy mẫu cần tìm là: 𝑌ƶ = 24,4545 + 0,509091𝑋.
❖ Ý nghĩa kinh tế của các hệ số hồi quy:
• 𝐸(𝑌/𝑋 = 0) = 𝛽1 ≈ 𝛽ƶ1 = 24,4545: cho biết mức chi tiêu tiêu
dùng trung bình hàng tuần của một hộ gia đình không có
thu nhập (các yếu tố khác không đổi) là khoảng 24,455
USD/tuần.
• 𝐸(𝑌/𝑋 + 1) − 𝐸(𝑌/𝑋) = 𝛽2 ≈ 𝛽ƶ2 = 0,50909 : khi thu nhập
tăng 1 USD/tuần (trong điều kiện các yếu tố khác không
đổi) thì chi tiêu tiêu dùng bình quân của một hộ gia đình
tăng khoảng 0,509091 USD/tuần.
2.3. Ước lượng khoảng tin cậy và kiểm định các hệ số hồi quy
a) Độ chính xác của các ước lượng theo phương pháp OLS:
Theo phương pháp OLS, các ước lượng 𝛽ƶ1 , 𝛽ƶ2 là các đại lượng ngẫu
nhiên, với các mẫu khác nhau ta có ước lượng khác nhau. Vì phương
sai hay sai số chuẩn đặc trưng cho độ phân tán của biến ngẫu nhiên
nên ta dùng chúng để đo độ chính xác của các ước lượng.
σ𝑒𝑖2
• Phương sai phần dư: 𝜎ƶ 2 = 𝑣𝑎𝑟(𝑒) = .
𝑛−2
𝜎ƶ 2 ⋅σ 𝑋𝑖2
𝑣𝑎𝑟 𝛽ƶ1 =
𝑛⋅σ 𝑥𝑖2
• Phương sai của các ước lượng: .
𝜎ƶ 2
𝑣𝑎𝑟 𝛽ƶ2 = σ 𝑥𝑖2