You are on page 1of 19

CHƯƠNG VI.

TƯƠNG QUAN VÀ HỒI QUY

1. Tương quan giữa các đại lượng ngẫu nhiên

2. Mô hình hồi quy tuyến tính


◼ Trong kinh doanh, các quyết định quản trị thường dựa trên
việc xem xét mối quan hệ giữa hai hoặc nhiều yếu tố kinh tế
(biến thống kê).

◼ Ví dụ: Sau khi xem xét mối quan hệ giữa chi tiêu quảng cáo
và doanh thu bán hàng, trưởng bộ phận Marketing cố gắng dự
đoán doanh thu cho một mức chi tiêu quảng cáo nhất định.

◼ Đôi khi, một người quản lý sẽ dựa vào trực giác để đánh giá
hai biến có liên quan như thế nào một cách định tính.

◼ Tuy nhiên, nếu dữ liệu của các biến có thể thu được thì một
phương pháp trong thống kê gọi là phân tích hồi quy
(regression analysis) có thể được sử dụng để phát triển một
phương trình cho thấy các mối liên hệ giữa các biến có liên
quan.
1. Tương quan giữa các đại lượng ngẫu nhiên
◼ Giả sử hai đại lượng ngẫu nhiên X và Y là hai dấu hiệu
trên cùng một đối tượng nghiên cứu. Để đo mức độ tương
quan giữa X và Y người ta xét số:
𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌)
𝑅𝑋𝑌 =
𝜎(𝑋)𝜎(𝑌)
được gọi là hệ số tương quan giữa X và Y.
◼ Với mọi đại lượng ngẫu nhiên, ta có −1  𝑅𝑋𝑌  1.
◼ Trường hợp 𝑅𝑋𝑌 = 0 ta nói X và Y không tương quan với
nhau.
◼ Trường hợp 𝑅𝑋𝑌 =  1 ta nói X và Y có tương quan tuyến
tính.
Hệ số tương quan mẫu
𝑋𝑌−𝑋.𝑌
◼ Ta gọi 𝑟𝑋𝑌 = là hệ số tương quan mẫu giữa X và
𝑆𝑋 .𝑆𝑌
Y.

◼ Như vậy, hệ số tương quan mẫu là một ước lượng của hệ


số tương quan 𝑅𝑋𝑌.

◼ Ta cũng có −1  𝑟𝑋𝑌  1.
2. Mô hình hồi quy tuyến tính đơn
◼ Ví dụ về chuỗi nhà hàng thức ăn nhanh Armand’s Pizza
Parlors.

1. Mô hình
◼ Mô hình hồi quy tuyến tính đơn tổng thể có dạng:
𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝜀 (1)
Trong đó:
✓ 𝑌: biến phụ thuộc (dependent variable);

✓ 𝑋: biến độc lập (independent variable);

✓ 𝛽𝑖 : các tham số tổng thể của mô hình;

✓ 𝜀: sai số ngẫu nhiên của mô hình (các yếu tố khác ngoài 𝑋


tác động đến 𝑌).
◼ Các trường hợp của hệ số góc 𝛽1 :
◼ Phương trình hồi quy ước lượng tuyến tính mẫu có dạng:
𝑌 = 𝑏0 + 𝑏1 𝑋
Trong đó:
𝑆𝑌
𝑏1 = 𝑟𝑋𝑌 . ; 𝑏0 = 𝑌 − 𝑏1 𝑋.
𝑆𝑋

◼ Ý nghĩa kinh tế của b0 và b1:


- Nếu 𝑋 = 0 thì giá trị trung bình của 𝑌 = 𝑏0 (đơn vị);
- Trong điều kiện các yếu tố khác không thay đổi, nếu 𝑋 tăng 1
(đơn vị) thì giá trị trung bình của 𝑌 tăng (hoặc giảm) 𝑏1 (đơn
vị).
◼ Case study: Trong tình huống Armand’s Pizza Parlors, thu
thập dữ liệu ngẫu nhiên của 10 nhà hàng (𝑛 = 10), ta có tập dữ
liệu mẫu (data set) và đồ thị phân tán như sau:
Cách bấm máy tính 570ES PLUS
Shift mode ↓ 4 1
Mode 3 2
X Y nij
... ... ...

Bấm AC
Gọi kết quả:
Shift 1 4(Var): n, X SX
Y SY
Shift 1 5 : rXY, A(=b0), B(=b1)
◼ Case study: Trong tình huống Armand’s Pizza Parlors, thu
thập dữ liệu ngẫu nhiên của 10 nhà hàng (𝑛 = 10), ta có tập dữ
liệu mẫu (data set) và đồ thị phân tán như sau:
◼ Phương trình hồi quy tuyến tính và hệ số tương quan mẫu:
𝑌 = 60 + 5𝑋, 𝑟𝑋𝑌 = 0,9501
◼ Ý nghĩa kinh tế:

✓ 𝑏0 = 60: doanh số của nhà hàng khi không phục vụ sinh


viên (𝑋 = 0) là 60 nghìn USD mỗi quý;

✓ Hệ số góc của phương trình hồi quy ước lượng (𝑏1 = 5) là


dương, ngụ ý rằng khi số lượng sinh viên tăng lên thì doanh
thu tăng lên. Điều đó có nghĩa là, trong điều kiện các yếu tố
khác không thay đổi, nếu mỗi ngôi trường tuyển sinh tăng
thêm được 1000 SV thì doanh thu của cửa hàng sẽ tăng lên
5000 euro (lưu ý đổi đơn vị). Hay nói cách khác, mỗi sinh
viên học tại trường sẽ mang lại 5 euro doanh thu cho của
hàng.
Hệ số xác định R2 của mô hình

◼ Trong ví dụ trên, ta sử dụng đường thẳng liên tục để mô phỏng


cho dữ liệu điểm rời rạc.

◼ Câu hỏi đặt ra: Liệu mô hình đường thẳng có thực sự mô tả


tốt cho dữ liệu thực tế không? Làm thế nào để đánh giá được
khả năng dự báo tốt doanh thu khi chọn mô hình dạng đường
thẳng đó?

◼ Để trả lời cho câu hỏi này ta sử dụng hệ số xác định 𝑅2


(coefficient of determination) của mô hình. Đối với mô hình
hồi quy tuyến tính đơn (1), hệ số xác định của mô hình (1)
được cho bởi công thức:
𝑹𝟐 = 𝒓𝑿𝒀 𝟐
◼ Nhận xét: 0% ≤ 𝑅2 ≤ 100%. Hệ số xác định được sử dụng
để đánh giá % mức độ phù hợp của mô hình đang mô tả mối
quan hệ giữa biến phụ thuộc 𝑌 với biến độc lập 𝑋.
2
❖ 𝑅 = 0: Mô hình hoàn toàn không phù hợp;
2
❖ 𝑅 = 1: Mô hình hoàn hảo;
2
❖ 𝑅 → 1: Mô hình càng phù hợp với dữ liệu thực tế.
◼ Ví dụ: Hãy tính hệ số xác định của mô hình trong tình
huống Armand’s Pizza Parlors và giải thích ý nghĩa của
nó.

◼ Với dữ liệu trên ta tính được:


𝑹𝟐 = 𝒓𝑿𝒀 = 𝟎, 𝟗𝟓𝟎𝟏 𝟐 = 𝟎, 𝟗𝟎𝟐𝟕
Như vậy, nếu sử dụng mô hình này để dự báo doanh thu thì
mức độ chính xác lên đến 90,27%.

◼ Ngoài ra, điều này cũng có nghĩa: Sự thay đổi số lượng


SV giải thích 90,27% sự thay đổi của doanh thu, còn lại
9,73% là do yếu tố khác tác động.
HƯỚNG DẪN THỰC HÀNH EXCEL
House Price
in $1000s (Y) 245 312 279 308 199 219 405 324 319 255

Square feet (X) 1400 1600 1700 1875 1100 1550 2350 2450 1425 1700

a) Hãy viết phương trình hồi quy tuyến tính mẫu;


b) Giải thích ý nghĩa của hệ số góc và hệ số xác định.
Củng cố

1. Hệ số tương quan mẫu: 𝒓𝑿𝒀

2. Phương trình hồi quy tuyến tính mẫu 𝒀 = 𝒃𝟎 + 𝒃𝟏 𝑿

3. Hệ số xác định mô hình: 𝑹𝟐 = 𝒓𝑿𝒀 𝟐

4. Computer Solution

You might also like