Professional Documents
Culture Documents
Chuong 8 - Tuong Quan, Hoi Quy Mau
Chuong 8 - Tuong Quan, Hoi Quy Mau
Khi quan sát 1 đối tượng ta thu được các cặp giá trị 𝑥𝑖 , 𝑦𝑖 .
Để có hình ảnh về sự phân tán của các cặp giá trị này, ta biểu diễn
các cặp giá trị này trên hệ trục tọa độ Oxy. Ví dụ:
Sˆ X SˆY n i 1
sˆX2 x 2 x 2 ; sˆY2 y 2 y 2
TS. Nguyễn Văn Quang
2/6/2022 2
Đại học Công nghệ - ĐHQGHN
Hệ số tương quan mẫu
Ý nghĩa của hệ số tương quan:
𝑟𝑋𝑌 ≤ 1: đo mức độ quan hệ tuyến tính giữa X và Y.
𝑟𝑋𝑌 : càng lớn thì mức độ quan hệ tuyến tính giữa X và Y càng
tăng lên.
𝑟𝑋𝑌 < 0: quan hệ tuyến tính giữa X và Y là nghịch biến.
𝑟𝑋𝑌 > 0: quan hệ tuyến tính giữa X và Y là đồng biến.
Định nghĩa: Hai biến ngẫu nhiên gọi là tương quan với nhau nếu
hệ số tương quan khác 0. Hai biến ngẫu nhiên gọi là không tương
quan với nhau nếu hệ số tương quan bằng 0.
Phân tích hồi quy: Nghiên cứu quan hệ giữa biến phụ thuộc Y
và biến độc lập. Biến độc lập không phải là ngẫu nhiên, biến phụ
thuộc có nhiều nhân tố tác động đến, do đó nó là biến ngẫu nhiên.
TS. Nguyễn Văn Quang
2/6/2022 3
Đại học Công nghệ - ĐHQGHN
Hồi quy mẫu
Định nghĩa: Mô hình hồi quy tuyến tính đơn
Y 0 1 x ; N 0, 2
E Y E 0 1 x 0 1 x E 0 1 x
D Y D 0 1 x D 0 1 x D 2
Y N 0 1 x, 2
E Y x 25 65 1.2 25 35
D Y x 20 D Y x 25 82
50 41
P Y 50 x 20 P U 0.5 0 1.125 0.13
8
50 35
P Y 50 x 25 P U 0.5 0 1.875 0.03
8
TS. Nguyễn Văn Quang
2/6/2022 6
Đại học Công nghệ - ĐHQGHN
Hồi quy mẫu
P Y 50 x 20 0.13
P Y 50 x 25 0.03
n
f b0 , b1 yi b0 b1 xi
2
i 1
f b0 , b1 min
Đường hồi quy ước lượng (thực nghiệm) của đường hồi quy
tuyến tính lý thuyết:
y b0 b1 x
xy x y
b1 , b0 y b1 x
sˆX
2
yi b0 b1 xi 0 nb0 xi b1 yi
i 1 i 1 i 1
n
y b b x x 0 n
n
n
i 0 i b1 xi yi
i 1 i i x b x 2
i 1
0
i 1 i 1 i 1
n n n
n xi yi xi yi
xy x y
Giải hệ này ta có: b1 i 1 i 1 i 1
n
n 2
sˆX2
n x xi
2
i
b0 y b1 x i 1 i 1
TS. Nguyễn Văn Quang
2/6/2022 11
Đại học Công nghệ - ĐHQGHN
Hồi quy mẫu
xy x y xy x y
y b0 b1 x y x x
sˆX
2
sˆX
2
xy x y sˆY
x x y rXY x x y
sˆX
2
sˆX
y y xx
Do đó: rXY
sˆY sˆX
Chú ý: Đường hồi quy ước lượng là đường thẳng xấp xỉ nội suy
từ bảng số liệu của x và Y theo phương pháp bình phương tối
tiểu. Nếu x và Y có tương quan xấp xỉ tuyến tính thì đường hồi
quy ước lượng cho ta một dự báo đơn giản (ngắn hạn):
• Dự báo cá biệt: x x0 Y y0 b0 b1 x0
Số vốn đầu tư X và lợi nhuận Y trong một đơn vị thời gian của
100 quan sát, được bảng số liệu:
Y
0.3 0.7 1.0
X
1 20 10 0
2 0 30 10
3 0 10 20
sX
X t /2 0.15259
n
x X X x X 1.85 X 2.15
sY
Y t /2 0.04781
n
y Y Y y Y 0.66 Y 0.76
H 0 : 0 0.6 ; H1 : 0.6
y 0 0.71 0.6
t n 100 4.51 t0.05 1.65
sY 0.2439
Bác bỏ 𝐻0 , chấp nhận 𝐻1 , do đó lợi nhuận trung bình đã tăng lên.
Cho X (%) và Y (g/mm) là 2 chỉ tiêu của 1 sản phẩm. Kiểm tra
một số sản phẩm ta có bảng số liệu sau:
X
0-5 5-10 10-15 15-20 20-25
Y
115-125 7 0 0 0 0
125-135 12 8 10 0 0
135-145 0 20 15 2 0
145-155 0 19 16 9 5
155-165 0 0 0 8 3
n
i
i 134
t
y 0 n
142.01 120 134
24.2 t0.01 2.33
s 10.53
Bác bỏ giả thiết H0, do đó tình hình sản xuất cao hơn tiêu chuẩn
đề ra.
TS. Nguyễn Văn Quang
2/6/2022 24
Đại học Công nghệ - ĐHQGHN
Hồi quy mẫu
b. Để ước lượng trung bình chỉ tiêu của Y với độ chính xác 0.6
g/mm thì đảm bảo độ tin cậy là bao nhiêu?
s
Sai số của ước lượng: t /2
n
n 0.6 134
Suy ra: t /2 0.66
s 10.53
1 1
Ta có: 0 t /2 0.245 1 0.49
2 2
19 8
Tỷ lệ sản phẩm loại A trên mẫu: f 0.2015
134
f 1 f
Sai số của ước lượng: t /2
n
0.2015 0.7985
2.57 0.09
134
Để nghiên cứu doanh số bán hàng (triệu đồng) trong một ngày ở
cửa hàng A, ta tiến hành khảo sát một số ngày và thu được số liệu
sau:
Doanh số 24 30 36 42 48 54 60 65 70
Số ngày 5 12 25 35 24 15 12 10 6
Giả sử doanh số bán hàng (triệu đồng/ngày) của cửa hàng A là
biến ngẫu nhiên có phân bố (xấp xỉ) chuẩn. Những ngày có
doanh số bán từ 60 triệu đồng trở lên được gọi là những ngày
“bán đắt hàng”.
Trái cây A có khối lượng (X) xấp xỉ phân bố chuẩn. Cân 68 quả,
ta có bảng số liệu sau:
X [80,85) [85,90) [90,95) [95,100) [100,105) [105,110) [110,115)
n 5 12 25 35 24 15 12
a. Trái cây có khối lượng trên 25 gam là loại I. Với độ tin cậy
95% hãy tìm khoảng tin cậy của ntỷ lệ trái cây loại I.
b. Sau khi kiểm tra, người ta nhập lô trái cây A nhưng giống khác
và khối lượng trung bình là 100.5 gam. Với mức ý nghĩa 5% hãy
cho biết khối lượng trung bình có tang lên hay không?
c. Muốn ước lượng tỷ lệ sản phẩm loại I với độ tin cậy 90% và
độ chính xác 0.01 thì cần điều tra thêm hay bớt đi bao nhiêu sản
phẩm?
TS. Nguyễn Văn Quang
2/6/2022 31
Đại học Công nghệ - ĐHQGHN