Professional Documents
Culture Documents
Mục tiêu của chương này là nghiên cứu sự liên hệ giữa biến Y và X bằng sự phân tích
t ng quan và h i qui.
Trong phân tích tương quan người ta đề cập đến cường độ của mối quan hệ giữa hai biến Y
và X, đánh giá xem hai biến Y và X có quan hệ với nhau hay không.
Trong phân tích hồi qui người ta lại xác định quan hệ giữa hai biến Y và X dưới dạng
phương trình toán học, từ đó ta có thể dự đoán được biến Y (biến phụ thuộc, dependent
variable) dựa vào biến X (biến độc lập, independent variable)
Trong chương này, chúng ta cũng giới hạn chỉ nghiên cứu t ng quan và h i qui đ n
bi n và tuy n tính, nghĩa là chỉ nghiên cứu trường hợp biến Y chỉ phụ thuộc vào 1 biến X
và dạng phương trình hồi qui là phương trình đường thẳng (khác với các tương quan và hồi
qui bội và phi tuyến).
X
X
∑ ( x i − µ x )( y i − µ y )
N
σ xy = Cov( X, Y) = i =1
N
ρ = Corr ( X, Y) =
Cov( X, Y)
σ xσ y
∑ (x − µx )2
N
σ xy σ x2 = i =1
1
ρ=
∑(y
σ xσ y
N
− µi ) 2
Với N
σ y2 = i =1
i
N
hay
E[( X − µ x )(Y − µ y )]
ρ=
E[( X − µ x ) 2 ] * E[(Y − µ y ) 2 ]
∑ ( x1 − µ x )( y i − µ y )
N
ρ= i −1
∑ (x i − µ x ) 2 *∑ (y i − µ y ) 2
N N
i =1 i =1
-1≤ρ≤1
∑ (x i − x )(y i − y )
n
∧
S X,Y = Cov( X, Y) = i =1
n −1
7.2.4.2. H s t ng quan của mẫu r (Sample Correlation Coefficient)
r=
S XY
SX − SY
∑ ( x i − x)( y i − y)
n
r= i =1
∑ ( x i − x) * ∑ ( y i − y ) 2
n n
2
i =1 i =1
hay
∑ x i y i − nx. y
n
r= i =1
⎛ n ⎞⎛ n ⎞
⎜ ∑ x i2 − nx ⎟ ⎜ ∑ y i2 − ny ⎟
2 2
⎜ ⎟⎜ ⎟
⎝ i =1 ⎠ ⎝ i =1 ⎠
Ghi Chú
-1 ≤ r ≤ 1
r được dùng để ước lượng hướng và độ mạnh của mối quan hệ giữa X,Y.
⏐r⏐ > 0,8 tương quan mạnh
⏐r⏐ = 0,4 - 0,8 tương quan trung bình
⏐r⏐ < 0,4 tương quan yếu
⏐r⏐ càng lớn thì tương quan giữa X và Y càng chặt
r > 0 hướng TN - ĐB, r < 0 hướng TB - ĐN
0 < r ≤ 1 : gọi là tương quan tuyến tính thuận (X↑, Y↑)
-1 ≤ r ≤ 0 : gọi là tương quan tuyến tính nghịch (X↑, Y↓)
r là ước lượng của ρ
Gi i
Số phần tử của mẫu n = 5
xi yi (xi - x ) (yi - y ) (xi - x )2 (yi - y )2 (xi - x )(yi- y )
0 6 -2 0 4 0 0
1 5 -1 -1 1 1 1
2 7 0 1 0 1 0
3 8 1 2 1 4 2
4 4 2 -2 4 4 -4
10 30 10 10 -1
x= =2 y= =6
10 30
n=5
5 5
∑ (x − x) ⋅ ( y i − y )
5
−1
r= i =1
= = −0,1
i
∑ (x − x) 2 × ∑ ( y i − y ) 2
5 5
10 × 10
i =1 i =1
i
t n −2 =
r
(1 − r 2 ) /(n − 2)
Với
Tr ờng hợp 2
H0 : ρ=0
H1 : ρ>0
R : bác bỏ H0 nếu tn-2 > - tn - 2, α
Tr ờng hợp 3
H0 : ρ=0
H1 : ρ<0
R : bác bỏ H0 nếu tn-2 < - tn - 2, α
Ví dụ
Lấy mẫu ngẫu nhiên 2 biến X và Y ta có các giá trị (xi, yi) cho bởi bảng sau:
X 13 18 9 25 36 19
Y 70 55 100 40 15 20
∑ xi
n 6
x= = = 20
120
( )
⎜ ∑ xi − n x ⎟ = 2856 − 6 * 20 2 = 456 / 5 = 91,2
n 6
1 ⎛ 6 2 2⎞
S X2 =
1
n − 1 ⎝ i =1 ⎠ 5
S y2 =
n − 1 ⎝ i =1
2⎞ 1
( )
⎜ ∑ y i − n y ⎟ = 20150 − 6 * 50 2 = 5150 / 5 = 1030
1 ⎛ 6 2
⎠ 5
tn -2 = - 3,03
5. Ra quyết định
tn - 2 = - 3,03 < - tn -2, α/2 = -2,776
=> Bác bỏ H0.
Giữa 2 biến Y và X có tương quan nghịch.
Trong đó:
∧
Y là ước lượng của giá trị trung bình của Y đối với biến X đã biết
a: là ước lượng của A
b là ước lượng của B
Ghi chú
Phương trình hồi qui của Y theo X khác phương trình hồi qui của X theo Y
Nếu X đổi mà Y không đổi => Y và X không có tương quan
Dựa vào phương trình hồi qui ta có thể tự đoán Y khi biết X
7.3.2. Xác định d c và tung độ g c của đ ờng h i qui tuy n tính
b
1
∧
Y i
∧
Yi êi = Y i - Y i
Xi X
Dựa vào số hiệu của mẫu ta có phương trình hồi qui của Y theo X có dạng:
∧
Y = a + bX
Trong thống kê, để xác định tung độ gốc a và độ dốc b người ta thường sử dụng phương
( )
pháp bình phương tối thiểu (least squared method)
∑e = ∑ (Yi − Yi ) = ∑ Y − a − bX i
n ∧2 n ∧ n 2
2
i =1 i i =1 i =1
∑
n ∧2
Min e i
i =1
∑ (Yi − a − bX i ) 2 = 0
∂ n
∂a i =1
∑
∂ n
(Yi − a − bX i ) 2 = 0
∂b i =1
Giải hệ phương trình ta có:
b= =
∑( )
i =1 i =1
i i
xi − x ∑ − nx
n 2 n 2
x ai
i =1 i =1
a = y − bx
Người ta chứng minh được rằng a, b là những ước lượng không chệch và vững của A,B.
∧
Đường thẳng Y = a + bX được gọi là đ ờng h i qui thực nghi m
∧
Đường thẳng Y = A + BX được gọi là đ ờng h i qui lý thuy t
Ví dụ
Tìm đường hồi qui thực nghiệm của y theo x cho bời bảng tương quan sau:
xi 1 2 3 4 5
yi 2 5 4 3 6
Gi i
Gọi phương trình đường hồi qui là y = a + bx => xác định a, b.
xi yi xì2 xiyi
1 2 1 2
2 5 4 10
3 4 9 12
4 3 16 12
5 6 25 30
Tổng 15 20 55 66
x= =3 y= =4
15 20
n= 2
5 5
∑x y − nx y
5
66 − 5 * 3 * 4 6
b= i =1
= = = 0,6
i i
∑x
55 − 5 * 3 2
− nx
n
2 2 10
i =1
i
a = y − b x = 4 − 0,6 * 3 = 2,2
Phương trình đường hồi qui thực nghiệm là
y = 0,6x + 2,2