You are on page 1of 65

PHÂN TÍCH

HỒI QUY TƯƠNG QUAN


Nội dung
Những vấn đề chung về phương pháp phân tích hồi quy tương quan
Hồi quy tương quan tuyến tính đơn
Dạng phương trình hồi quy tuyến tính đơn
Phương pháp bình phương nhỏ nhất
Ước lượng các hệ số (và ý nghĩa)
Hệ số xác định
Hệ số xác định hiệu chỉnh
Hệ số tương quan
Kiểm định hệ số hồi quy
Khoảng tin cậy của hệ số hồi quy
Kiểm định ý nghĩa của mô hình
Hồi quy tương quan bội
1. Một số vấn đề chung về HQ-TQ
1.1. Khái niệm HQ-TQ
1.2. Liên hệ hàm số và liên hệ tương quan
1.3. Một số dạng liên hệ
Y = ax + b: tuyến tính (đường thẳng)
Y = ax2 + bx + c: phi tuyến (parabol)
1.4. Nhiệm vụ của phương pháp HQ-TQ
1.5. Các bước tiến hành phân tích HQ-TQ
Bước 1: Phân tích bản chất mối liên hệ
Bước 2: Xây dựng mô hình
Bước 3: Ước lượng mô hình
Bước 4: Kiểm định
2. Hồi quy tuyến tính đơn

2.1. Phương trình hồi quy tuyến tính đơn


2.2. Phương pháp bình phương nhỏ nhất
2.3. Ước lượng các hệ số (và ý nghĩa)
2.4. Hệ số xác định
2.5. Hệ số tương quan
2.6. Hệ số xác định hiệu chỉnh
2.7. Kiểm định hệ số hồi quy
2.8. Khoảng tin cậy của hệ số hồi quy
2.9. Kiểm định ý nghĩa của mô hình
2.1. Phương trình hồi quy tuyến tính đơn

Phương trình hồi quy tổng thể chung:


Hệ số hồi Sai số
Hệ số tự do Biến độc lập ngẫu
quy
nhiên
Biến phụ thuộc
Phương trình hồi quy tổng thể chung
(tiếp
)

Y
Giá trị thực tế

εi Hệ số hồi


Giá trị lý thuyết quy= β1
Sai số ngẫu nhiên

Hệ số tự do =


β0

X X
i
Phương trình hồi quy mẫu
Phương trình hồi quy mẫu cung cấp một ước lượng cho
đường hồi quy tổng thể

Ước lượng Ước lượng hệ


(hoặc dự đoán) Ước lượng hệ số
số tự do hồi quy
giá trị y của
quan sát i
Giá trị x của
quan sát i

Trung bình của các sai số ngẫu nhiên ei có giá trị bằng 0
2.2. Phương pháp bình phương nhỏ nhất
(OLS)

b0 và b1 được tính bằng cách lấy giá trị b0 và b1


thỏa mãn tổng bình phương chênh lệch giữa y và
là nhỏ nhất:
Phương pháp bình phương nhỏ nhất
(OLS)

Tìm các tham số sao cho tổng bình phương các


chênh lệch giữa giá trị thực tế và giá trị lý thuyết
của tiêu thức kết quả là nhỏ nhất.
2.3. Ước lượng các hệ số

Từ đó, công thức tính các hệ số:

Hoặc:
Ý nghĩa của các hệ số trong phương trình hồi quy
mẫu

b0 là ƯỚC LƯỢNG hệ số tự do, thể hiện giá trị kì vọng
của y khi x = 0, là ảnh hưởng trung bình của tất cả các
tiêu thức nguyên nhân khác ngoài x tới y.

b1 là ƯỚC LƯỢNG hệ số hồi quy, nói lên ảnh hưởng
trực tiếp của x đến y. Khi x thay đổi 1 đơn vị thì y trung
bình (kì vọng) thay đổi b1 đơn vị.
Ví dụ
Một công ty mong muốn khảo sát mối quan hệ giữa giá bán
và doanh thu

Một mẫu ngẫu nhiên gồm 10 lần thay đổi giá bán được lựa
chọn
Biến phụ thuộc (Y) = doanh thu (Đơn vị tính: Triệu đồng)
Biến độc lập (X) = Giá bán (Đơn vị:
đồng)
Dữ liệu mẫu
Mô tả bằng đồ thị

Đồ thị điểm


Sử dụng SPSS

Analyze/Regression/Linear...
Bảng kết quả SPSS
(tiếp
)
The regression equation is:
Đồ thị kết quả
Đồ thị điểm và đường hồi quy

Hệ số hồi quy


= 0.10977

Hệ sô tự do
= 98.248
2.4. Hệ số tương quan (r)

Được sử dụng để đánh giá chiều hướng và cường độ của mối
liên hệ tương quan tuyến tính
Công thức tính:

Chú ý:  - (  )2
Tính chất:

Liên hệ hàm số Liên hệ hàm số


Liên hệ nghịch Không có mối liên Liên hệ thuận
hệ
-1 0 +1

Mối liên hệ nghịch càng chặt chẽ Mối liên hệ thuận càng chặt chẽ
2.5. Hệ số xác định, R2

Nhằm đánh giá sự phù hợp của mô hình: sự thay


đổi của biến độc lập giải thích được bao nhiêu
phần trăm sự thay đổi của biến phụ thuộc
Ký hiệu R2

Lưu ý:
Đồ thị minh họa
(tiếp
Y )
yi ∧
∧2 y
SSE = ∑(yi - yi )
_
SST = ∑(yi - y)2

y ∧ _2
_ SSR = ∑(yi - y) _
y y

xi X
Đo lường các biến thiên

Biến thiên của biến phụ thuộc:

Biến thiên của y Biến thiên của y được giải Biến thiên của
(biến phụ thuộc) thích bởi MH hồi quy phần dư

Trong đó:
= giá trị trung bình của biến phụ thuộc
yi = giá trị quan sát thực tế của biến phụ thuộc
i = giá trị dự đoán y với giá trị xi cho trước
2.6. Hệ số xác định hiệu chỉnh

Đọc giáo trình


Bảng kết quả SPSS

58.08% sự thay đổi trong doanh


thu được giải thích bằng sự thay
đổi trong giá bán
2.7. Kiểm định ý nghĩa của hệ số hồi
quy
Sử dụng thống kê t (Tiêu chuẩn kiểm định)
Có mối liên hệ tuyến tính giữa X and Y không?
Cặp giả thuyết:
H0: β1 = 0 (không có mối liên hê)
H1: β1 ≠ 0 (có mối liên hệ) 2 PHÍA
Tiêu chuẩn kiểm định
Trong đó:
b1 = hệ số hồi quy trong pt mẫu
β1 = hệ số hồi quy trong pt tổng
thể chung
sb1 = sai số chuẩn của hệ số hồi
quy
Sai số chuẩn của hệ số hồi quy

Công thức tính

với:
= sai số chuẩn của hệ số hồi quy
= sai số chuẩn của mô hình. Kết quả từ SPSS
Bảng kết quả SPSS
Bảng kết quả SPSS
Ví dụ
Phương trình hồi quy:

Hệ số hồi quy trong mô hình này =


0.1098
Liệu giá bán có thực sự ảnh hưởng
đến doanh thu?
Kết quả SPSS

H0: β1 = 0 Từ kết quả SPSS: b1


H1: β1 ≠ 0

t
Kết quả SPSS
(tiếp
)
Tiêu chuẩn kiểm định: t = 3.329
H0: β1 = 0 b1 t
H1: β1 ≠ 0

d.f. = 10-2 = 8
t8,.025 = 2.3060
Kết luận:
α/2=.025 α/2=.025 Bác bỏ H0

Giá bán có ảnh hưởng đến


-tn-2,α/2 0 tn-2,α/2 doanh thu
-2.3060 2.3060 3.329
Kiểm định dựa trên giá trị P-value
(tiếp
P-value = 0.01039 )

P-value
H0: β1 = 0 Từ bảng kết quả SPSS:
H1: β1 ≠ 0

Đây là kiểm định 2 phía, do Kết luận: P-value < α do đó
đó: Bác bỏ H0
P(t > 3.329)+P(t < -3.329) =
0.01039
PRICE có ảnh hưởng đến DT
(với bậc tự do = 8)
2.8. Khoảng tin cậy của hệ số hồi quy
Công thức:

d.f. = n - 2
Bảng kết quả SPSS:

Với mức ý nghĩa 5% khi giá bán tăng lên 1 đồng thì doanh thu
tăng trong khoảng (0.0337, 0.1858) (triệu đồng)
2.9. Kiểm định ý nghĩa của mô hình

Sử dụng thống kê F
Mô hình hồi quy có ý nghĩa thống kê hay không?

Cặp giả thuyết:


H0: R2 = 0 (MH không có ý nghĩa) H0: B1 = 0

H1: R2 ≠ 0 (Mô hình có ý nghĩa) H1: B1≠ 0


2.9. Kiểm định ý nghĩa của mô hình
(tiếp
)
Kiểm định F:

Với:

Trong đó: F tuân theo phân phối F với k là số biến độc lập trong
mô hình (đối với hồi quy đơn là 1) và (n – k - 1) là bậc tự do (đối
với hồi quy đơn là n-2)
Bảng kết quả SPSS

Bậc tự do Giá trị P-value của


kiểm định F

P(F > 11,0848) = 0,01039 (so giá trị này với a = 0,05)
Kiểm định F – Kiểm định ý nghĩa của mô
hình
(tiếp
)
H0: R2 = 0 Tiêu chuẩn kiểm định:
H1: R2 ≠ 0 Kết luận:
α = .05
df1= 1 df2 = 8

Bác bỏ H0 với α = 0.05


Fα = 5.32

Mô hình thực sự có ý nghĩa. Giá


α = .05
bán thực sự ảnh hưởng đến doanh
thu
0 Do not Reject H0
F
reject H0
F.05 = 5.32
Tra bảng phân phối Fisher

Copyright © 2010 Pearson Education, Inc. Publishing as Prentice Hall


4. Hồi quy tuyến tính bội

4.1. Phương trình hồi quy tuyến tính bội

4.2. Ước lượng các hệ số (và ý nghĩa)

4.3. Hệ số hồi quy chuẩn hóa

4.4. Hệ số xác định

4.5. Kiểm định hệ số hồi quy

4.6. Khoảng tin cậy của hệ số hồi quy

4.7. Kiểm định ý nghĩa của mô hình


4.1. Xây dựngphương trình hồi quy bội

Ý tưởng: Xác định xem có mối liên hệ tuyến tính giữa 1 biến
phụ thuộc (Y) và nhiều biến độc lập (Xi) hay không
Mô hình hồi quy bội với k biến độc lập:
Hệ số hồi quy
Hệ số tự do Sai số ngẫu nhiên
của tổng thể
Phương trình hồi quy bội

Sử dụng dữ liệu mẫu để ước lượng cho các hệ số của mô


hình hồi quy bội
Phương trình hồi quy bội với k biến độc lập:
Giá trị ước Ước lượng của Ước lượng của các hệ số hồi quy
lượng của y hệ số tự do

Hệ số hồi quy riêng


4.2. Ước lượnghệ số hồi quy riêng
Hai biến độc lập
y
Giá trị quan sát
y
i

yi <
ei = (yi – yi) <

x2
i x2
x1 Xác định các hệ số
i trong phương trình bằng phương
x1 pháp
bình phương nhỏ nhất
4.2. Ước lượnghệ số hồi quy riêng
4.3. Hệ số hồi quy chuẩn hóa

Hệ số hồi quy chuẩn hóa:


dùng để so sánh các hệ số hồi quy với nhau
Ví dụ: Hồi quy bội với 2 biến độc lập

Một nhà phân phối bánh ngọt muốn đánh giá ảnh
hưởng của các nhân tố tới nhu cầu thị trường

Biến phụ thuộc: y - Số lượng bánh bán ra (cái/tuần)


Biến độc lập: x1 - Giá bán ($)
x2 - Chi phí quảng cáo ($100)

Dữ liệu được tổng hợp trong 15 tuần


Ví dụ về lượng bánh bán ra
Phương trình hồi quy bội:

Lượng bánh = b0 + b1 x1
+ b2 x 2
12.2 Ước lượng phương trình hồi quy tuyến
tính bội
Sử dụng SPSS để xác định các hệ số và các chỉ tiêu đo
lường sự phù hợp của mô hình hồi quy bội.

Analyze/Regression/Linear...
Kết quả hồi quy bội
Ý nghĩa hệ số hồi quy

trong đó:
y: Lượng bánh bán ra (cái/tuần)
x1: Giá bánh ($)
x2: Chi phí quảng cáo ($100)
b1 = -24.975: Giá bán b2 = 74.131: Chi phí
tăng lên 1$ sẽ làm cho quảng cáo tăng lên
lượng bánh bán ra 100$ sẽ làm cho
giảm trung bình là lượng bánh bán ra tang
24.975 cái 1 tuần trong 74.131 cái 1 tuần trong
điều kiện chi phí điều kiện giá bán
quảng cáo không đổi. không đổi.
Hệ số hồi quy chuẩn hóa

Bảng kết quả SPSS chạy ra  phân tích


4.4. Kiểm định hệ số hồi quy

Sử dụng kiểm định t-Student đối với kiểm định hệ số


hồi quy riêng phần
Cho biết biến độc lập có thực sự có ý nghĩa không
Cặp giả thuyết:

H0: βi = 0 (không có liên hệ tuyến tính)


H1: βi ≠ 0 (tồn tại liên hệ tuyến tính giữa
biến xi and y)
Kiểm định hệ số hồi quy

Tiêu chuẩn kiểm định:

(df = n – k – 1)

Trong đó:
Kiểm định hệ số hồi quy
t-value của biến Giá là t = -2.306, với
p-value .0398
t-value của biến Chi phí quảng cáo là t
= 2.855, với p-value .0145
Ví dụ: Kiểm định các hệ số
hồi quy
Từ bảng kết quả SPSS:
H0: βj = 0
H1: βj ≠ 0

d.f. = 15-2-1 = 12
= .05
Thống kê t của mỗi biến đều nằm trong
t12, .025 = 2.1788
miền bác bỏ (p-values < .05)
Quyết định:
α/2=.025 α/2=.025 Bác bỏ H0 với từng biến
Kết luận:
Với mức ý nghĩa 5% và phương
trình hồi quy mẫu trên, cả Giá
-tα/2 tα/2 bán và Chi phí quảng cáo đều
0
-2.1788 2.1788 thực sự có ảnh hưởng tới lượng
bánh bán ra.
4.5. Khoảng tin cậy của hệ số hồi quy
Hai giới hạn đối với khoảng tin cậy của hệ số hồi quy βj
Trong đó:
(n – K – 1) d.f.

Trong ví dụ này, t có:


(15 – 2 – 1) = 12 d.f.

Ví dụ: Tìm khoảng tin cậy 95% cho hệ số hồi quy của giá bán (x1):
-24.975 ± (2.1788 x 10.832)
Vậy khoảng tin cậy là: -48.576 < β1 < -1.374
4.5. Khoảng tin cậy của hệ số hồi quy

Khoảng tin cậy đối với hệ số hồi quy βj

Ví dụ: Kết quả SPSS cho biết hai giới hạn của khoảng tin cậy:
Với khoảng tin cậy 95%, khi giá bán tăng lên 1$ thì lượng bánh
bán ra hàng tuần sẽ giảm trong khoảng 1.37 đến 48.58 cái.
4.6. Hệ số xác định R2

52.1% sự biến động của lượng bánh


bán ra được giải thích bởi giá bán và
chi phí quảng cáo

Copyright © 2010 Pearson Education, Inc. Publishing as Prentice Hall


4.7. Kiểm định ý nghĩa của mô hình

Kiểm định F ý nghĩa hay sự phù hợp của mô hình


Cho biết có mối liên hệ tuyến tính giữa tất cả biến
độc lập X và biến phụ thuộc Y hay không.
Sử dụng tiêu chuẩn kiểm định F
Cặp giả thuyết:
H0: β1 = β2 = … = βk = 0 (không có MLH tuyến tính)
H1: có ít nhất βi ≠ 0 (có ít nhất 1 biến độc lập
ảnh hưởng đến Y)
4.7. Kiểm định ý nghĩa của mô hình

Tiêu chuẩn kiểm định F:

Cơ sở ra quyết định là

 Bác bỏ H0
4.7. Kiểm định ý nghĩa của mô hình

Bậc tự do P-value của


kiểm định F

Copyright © 2010 Pearson Education, Inc. Publishing as Prentice Hall


Kiểm định sự phù hợp của mô hình

H0: β 1 = β 2 = 0 Thống kê F:
H1: β1 và β2 không cùng bằng 0 Quyết định:
α = .05 Kết luận:
df1= 2 df2 = 12

Giá trị tới hạn: Vì thống kê F nằm trong miền


bác bỏ (p-value < .05) nên bác
Fα = 3.885 bỏ H0
α = .05

0 F Với mức ý nghĩa 5%, có ít nhất một


Chưa đủ Bác bỏ
biến độc lập ảnh hưởng tới Y
cơ sở F.05 = 3.885
H0
bác bỏ H0
Bài tập ở nhà

Bài 1 (P456)

Copyright © 2010 Pearson Education, Inc. Publishing as Prentice Hall


DẠNG CÂU HỎI THI
DẠNG CÂU HỎI THI
DẠNG CÂU HỎI THI

III. Bài tập

Người quản lý của một đại lý xe ô tô đã sử dụng rất quan tâm đến
giá bán lại của chiếc xe đã qua sử dụng. Ông ta thấy rằng số năm sử
dụng của xe rất quan trọng trong việc xác định giá trị bán lại. Ông thu
thập dữ liệu về số năm sử dụng và giá trị bán lại của 15 chiếc xe và
chạy phân tích hồi quy với giá trị của chiếc xe (nghìn USD) là biến
phụ thuộc và số năm sử dụng của xe (theo năm) là biến độc lập. Ông
ta làm đổ cà phê vào bản in và mất một số kết quả, được ký hiệu từ
"A" đến "F". Phần kết quả còn lại được cho bên dưới.
DẠNG CÂU HỎI THI

You might also like