Professional Documents
Culture Documents
• Phân tích hồi quy có thể được xem là một trong những công cụ phân
tích quan trọng nhất đối với các nhà nghiên cứu định lượng.
• Phân tích hồi quy được thực hiện nhằm mô tả và đánh giá mối quan hệ
giữa một biến số cho trước (thường được gọi biến phụ thuộc -
dependent variable) và một hay nhiều biến số khác (thường được gọi là
biến độc lập hay biến giải thích - independent variable(s)).
• Ký hiệu biến phụ thuộc bằng y và một hay nhiều biến độc lập bằng x1, x2, ... ,
xk với k là số biến độc lập
• Lưu ý rằng trong chương khởi đầu này này chúng ta sẽ chỉ đề cập đến phân
tích hồi quy tuyến tính cho trường hợp đơn giản với duy nhất một biến độc
lập x.
• Nếu chúng ta nói rằng y và x có tương quan với nhau thì điều này có nghĩa
rằng chúng ta đang xem xét hai biến này theo cả 2 chiều đối xứng nhau
(completely symmetrical way).
• Trong hồi quy, chúng ta xem xét biến phụ thuộc (dependent variable) (y) và
các biến độc lập (independent variables) (x’s) hoàn toàn khác:
Biến số y được giả định là thay đổi ngẫu nhiên “random” hoặc
“stochastic” theo một cách nào đó, chẳng hạn có phân phối xác suất
(probability distribution).
Tuy nhiên biến độc lập x lại được giả định không có những giá trị thay
đổi ngẫu nhiên “non-stochastic” hay “fixed” trong các mẫu quan sát
khác nhau.
• Để đơn giản hóa, mô hình hồi quy tuyến tính sẽ có số biến độc lập k=1 hay
biến y phụ thuộc vào duy nhất một biến giải thích x.
• Có dữ liệu sau về Excess Returns của một danh mục đầu tư XXX cùng
với excess returns của thị trường (market index):
• Kiểm định giá trị Beta của danh mục này sẽ có dấu + theo như kỳ vọng
của lý thuyết CAPM
45
40
Excess return on fund XXX
35
30
25
20
15
10
5
0
0 5 10 15 20 25
Excess return on market portfolio
• Chúng ta có thể sử dụng phương trình tuyến tính cho một đường thẳng (for
a straight line) như sau:
y=a+bx
để có được đường thẳng có mô phỏng phù hợp nhất “best “fits”với dữ liệu
quan sát
• Tuy nhiên, phương trình này (y=a+bx) chỉ thuần túy là lý thuyết.
• Thực tiễn? Không. Vì vậy cần phải bổ sung yếu tố sai số giữa ước lượng
và thực tế (a random disturbance term), u vào phương trình.
yt = + xt + ut
where t = 1,2,3,4,5,....
• Sai số ước lượng có thể giúp khắc phục được những khiếm khuyết sau
của mô hình:
- Bỏ sót biến giải thích hay bỏ sót những nhân tố khác cũng có tác động
đến yt
- Những ảnh hưởng từ bên ngoài mô hình đến biến yt một cách ngẫu nhiên
(Random outside influences) mà chúng ta không thể quan sát và đưa vào
mô hình.
yi
û i
ŷi
x xi x
• Phương pháp này được biến đến như là phương pháp OLS (ordinary least
squares).
• Chúng ta sẽ tính khoảng cách cho mỗi điểm quan sát và bình phương và
sau đó tối thiểu hóa tổng của các khoảng cách bình phương này (total sum
of the squares) và vì vậy phương pháp này còn có tên là bình phương bé
nhất (least squares).
• Nhớ rằng ût là khác biệt (sai số) giữa điểm quan sát thực tế (actual point)
và đường hồi quy .
t t tương đương uˆ
2
2
• Vì vậy tối thiểu hóa y ˆ
y tối thiểu hóa t
đối với $ và $
• Gọi L ( y t yˆ t ) 2 ( y t ˆ ˆxt ) 2
t i
• Để tối thiểu hóa L đối với $ và $ , ta lấy đạo hàm bậc nhất của L theo
$ và $ như sau:
L
2 ( yt ˆ ˆxt ) 0 (1)
ˆ t
L
2 xt ( yt ˆ ˆxt ) 0 (2)
ˆ t
• Biết rằng y t Ty và xt Tx .
Khoa Tài Chính - ĐHKT TPHCM 13
Ước lượng hệ số hồi quy (OLS Estimator), (cont’d)
t t t
x y y x ˆ
x t
x ˆ
t 0
x
2
t t
x y T y x ˆ
T x 2
ˆ
t 0
x
2
ˆ x y Txy
t t
x Tx 2
t
2
và
ˆ y ˆx
• Phương pháp xác định hệ số hồi quy tối ưu này được gọi là phương
pháp bình phương sai số bé nhất thông thường - OLS (Ordinary
Least Squares)
Khoa Tài Chính - ĐHKT TPHCM 15
Ý nghĩa của hệ số $ và $ ?
• Quay lại ví dụ về mô hình CAPM ở trên, từ số liệu của 5 quan sát và sử dụng
công thức hồi quy OLS, chúng ta có thể dễ dàng tính được:
$ = -1.74 và $ = 1.64.
Và như vậy đường hồi quy tuyến tính (fitted line) có phương trình sau:
yˆ t 1.74 1.64 x t
• Câu hỏi:
Nếu một nhà phân tích thị trường kỳ vọng TSSL của thị trường vượt trội so
với lãi suất phi rủi ro (risk-free rate) là 20% trong năm tới, như vậy từ phương
trình hồi quy có được, bạn có thể kỳ vọng TSSL từ danh mục XXX sẽ là bao
nhiêu?
• Trả lời:
Bạn có thể nói rằng giá trị “kỳ vọng” của y = 31.06
• Cần thận trọng khi thông đạt kết quả của hệ số chặn được ước lượng, đặc biệt
nếu không có hoặc chỉ có ít quan sát gần trục tung y:
y
0 x
• “Tổng Thể” (The population) là tập hợp tất cả các đối tượng đang được nghiên
cứu, ví dụ:
Nghiên cứu quan tâm Tổng Thể của đối tượng nghiên
cứu Population of interest
Đánh giá hành vi của các nhà đầu tư Toàn bộ các nhà đầu tư trên TTCK
• Như vậy “mẫu nghiên cứu” (sample) sẽ chỉ bao gồm một số “nhà đầu tư”
được rút ra từ tổng thể để tiến hành phỏng vấn.
• Mẫu nghiên cứu “ngẫu nhiên” (random sample) là mẫu tập hợp các quan sát
được rút ra từ tổng thể một cách ngẫu nhiên (xác suất được chọn là bằng
nhau)
• Hàm phân phối tổng thể (The population regression function - PRF) được sử
dụng để mô tả một mô hình mà có thể tái tạo các dữ liệu giống như quan sát
thực tế.
• Bao hàm trong mô hình là các mối quan hệ thực tế giữa các biến số, như bao
gồm các giá trị đúng (true value) của và .
• Hàm phân phối tổng thể còn được biết như là DGP (data generation process)
yt xt ut
• Hàm phân phối mẫu quan sát (The sample regression function – SRF) bao
hàm các mối quan hệ ước lượng giữa các biến sử dụng mẫu dữ liệu quan sát
được.
• Trên thực tế chúng ta sử dụng SRF để suy diễn các giá trị của PRF. Do vậy
sai số sẽ là:
uˆ t yt yˆ t
• Và như vậy chúng ta cần phải biết được các giá trị tham số và đã được
ước lượng “tốt “ như thế nào.
Yt e X t e ut lnYt ln X t ut
• Thực hiện chuyển đổi như sau: gọi yt=ln Yt và xt=ln Xt
yt xt ut
Khoa Tài Chính - ĐHKT TPHCM 21
3. Mô hình tuyến tính và mô hình phi tuyến
(Linear and Non-linear Models)
• Mô hình trên còn được gọi là mô hình hồi quy số mũ (exponential regression
model) vì các hệ số hồi quy có thể được diễn đạt như là “độ co dãn”
(elasticities).
• Tương tự nếu từ lý thuyết ta rút ra được một mô hình mà y có mối quan hệ
nghịch đảo với x:
yt ut
xt
khi đó mô hình vẫn là tuyến tính và có thể được ước lượng bởi OLS bằng
cách thay thế 1
zt
xt
• Mô hình được gọi là phi tuyến nội tại (intrinsically non-linear) khi chúng ta
không thể chuyển đổi sang dạng tuyến tính để sử dụng OLS nhưng vẫn có thể
sử dụng các phương pháp hồi quy phi tuyến. Ví dụ:
y t 1 2 x t 1 ut
Khoa Tài Chính - ĐHKT TPHCM 22
4. “Estimator” hay “Estimate”?
• Estimators là những công thức được sử dụng để tính toán các hệ số hồi quy
(formulae used to calculate the coefficients)
Ví dụ:
ˆ x y Txy
t t
x Tx 2
t
2
và
ˆ y ˆx
• Estimates là những giá trị bằng số thực tế (actual numerical values) của các
hệ số hồi quy (coeeficients)
• Giả định thứ 4 có thể được diễn đạt với ý nghĩa mạnh hơn là các biến
độc lập xt không thay đổi ngẫu nhiên (non-stochastic) hay có thuộc tính
không đổi trong các mẫu quan sát khác nhau (fixed in repeated
samples).
• Giả định thứ 5 là cần thiết nếu chúng ta muốn dùng mô hình để kiểm
định các thông số của “tổng thể” bao gồm và từ các thông số ước
lượng sử dụng mẫu quan sát $ và $
lim Pr ˆ 0 0
T
lim Pr V ( ˆ ) V ( ) 0 0
T
Do vậy giá trị được ước lượng tính bình quân sẽ bằng với giá trị “đúng” (true
values).
Để chứng minh điều này ta cần giả thiết E(ut)=0.
“Không thiên lệch” (Unbiasedness) là một điều kiện mạnh hơn “sự nhất quán”
(consistency).
• Chúng ta cần đo lường mức độ tin cậy hoặc sự chính xác của các hệ số ước
lượng $ và .$ để có thể thực hiện kiểm định giả thiết.
• Với giả định 1- 4 cho trước ở trên, khi đó sai số chuẩn (standard errors) có thể
được tính như sau:
t xt
2 2
x
SE (ˆ ) s s ,
T ( xt x ) 2
T x T x
2
t
2 2
1 1
SE ( ˆ ) s s
( xt x ) 2
t
x 2
T x 2
Với s là độ lệch chuẩn được ước lượng của sai số phần dư (estimated standard
deviation of the residuals).
Khoa Tài Chính - ĐHKT TPHCM 29
Sự chính xác của ước lượng (Precision) và sai số chuẩn
(Standard Errors)
• Chúng ta cần đo lường mức độ tin cậy hoặc sự chính xác của các hệ số ước
lượng $ và $ để có thể thực hiện kiểm định giả thiết.
• Với giả định A1- A4 cho trước ở trên, khi đó sai số chuẩn (standard errors) có
thể được tính như sau:
x x
2 2
SE (ˆ ) s t
s t
,
T (x x)t
2
T x T x
2
t
2 2
1 1
SE ( ˆ ) s s
( xt x ) 2
t
x 2
T x 2
Với s là độ lệch chuẩn của phần dư được ước lượng (estimated standard deviation
of the residuals).
Var(ut) = E[(ut)-E(ut)]2
hay
Var(ut) = E(ut2)
1
2
• Do vậy chúng ta cần tính giá trị bình quân của ut : s2 ut2
T
• Không may mắn là công thức trên không khả thi khi ut là không quan sát
được. Chúng ta có thể sử dụng giá trị ước lượng của ut, là û
t
1
s2
T
t
ˆ
u 2
Nhưng lưu ý là S2 vẫn là hệ số ước lượng bị chệch (biased estimator ) của 2.
Khoa Tài Chính - ĐHKT TPHCM 31
Ước lượng phương sai của phần dư (Variance of the
Disturbance Term) (cont’d)
• Do vậy hệ số ước lượng không chệch của sẽ được tính bằng công thức sau:
s
uˆ 2
t
T 2
với uˆt là tổng bình phương của phần dư (residual sum of squares -
2
2. Giá trị tổng bình2 phương (sum of the squares) của x và giá trị trung bình
của nó xt x có ảnh hưởng trực tiếp đến cả công thức SE( $) and SE( $)
Giá trị tổng bình phương (sum of squares) càng lớn, thì phương sai của hệ
số ước lượng (coefficient variances) càng bé.
32
Khoa Tài Chính - ĐHKT TPHCM
Một vài lưu ý đối với Standard Error Estimators
y
y
y y
x
0 x x 0 x
Mẫu quan sát, T, càng lớn thì phương sai của các hệ số ước lượng càng bé.
T xuất hiện trong công thức tính SE( $ ) nhưng ảnh hưởng ngầm trong
công thức tính SE( ) bởi vì t
$ x x 2
là ngầm được tính từ t = 1 đến
T.
4. Trong khi đó giá trị xt2chỉ ảnh hưởng đến SE của hệ số chặn SE($ ) và
và không ảnh hưởng đến SE của hệ số độ dốc SE($ )
vì xt đo lường khoảng cách từ điểm quan sát đến trục tung y
2
• Có dữ liệu sau được tính từ phương trình hồi quy bao gồm biến phụ thuộc y,
một biến độc lập x, và một hằng số, sử dụng 22 quan sát của :
• SE(regression), s uˆ t2
130.6
2.55
T 2 20
3919654
SE ( ) 2.55 * 3.35
22 3919654 22 416.5 2
1
SE ( ) 2.55 * 0.0079
3919654 22 416.5 2
• Chúng ta viết lại các kết quả như sau:
yˆ t 59.12 0.35 xt
(3.35) (0.0079)
• Các nhà nghiên cứu rất cần suy luận về các giá trị có thể có của tổng thể từ
các thông số ước lượng từ phương trình hồi quy.
Ví dụ: giả định chúng ta có kết quả hồi quy CLRM như sau:
yˆ t 20.3 0.5091xt
(14.38) (0.2561)
• $ 0.5091 là một ước lượng điểm (single point estimate) của thông số
“tổng thể” chưa biết (unknown population parameter) . Do vậy vấn đề là
mức độ tin cậy “reliable” của thông số ước lượng này như thế nào?
• Mức độ tin cậy của một điểm ước lượng (point) được đo lường bởi
Standard Errors của hệ số ước lượng (coefficient’s standard error).
• Chúng ta có thể sử dụng thông tin về mẫu (sample) để suy luận về “tổng thể”
(population).
• Chúng ta luôn có 2 giả thiết cùng đi với nhau: giả thiết 0 (the null hypothesis),
ký hiệu H0 và giả thiết thay thế (the alternative hypothesis ), ký hiệu H1.
• Giả thiết 0 là giả thiết thống kê (statistical hypothesis) về biến cố mà chúng ta
cần kiểm định.
• Giả thiết thay thế thể hiện phần biến cố còn lại nếu như giả thiết 0 bị loại.
• Ví dụ, sử dụng lại ví dụ bên trên, chúng ta sẽ kiểm định giá trị “đúng” của là
0.5. Ký hiệu sẽ được sử dụng như sau:
H0 : = 0.5
H1 : 0.5
và kiểm định này còn được gọi là kiểm định 2 bên (two sided test)
• Đôi khi chúng ta có một vài thông tin cho trước mà theo đó chúng ta có thể
kỳ vọng rằng > 0.5 thay vì < 0.5. trong trường hợp này chúng ta có thể
sử dụng kiểm định một bên (one-sided test) như sau:
H0 : = 0.5
H1 : > 0.5
Hoặc
H0 : = 0.5
H1 : < 0.5
• Bởi vì hệ số ước lượng từ phương pháp bình phương bé nhất là kết hợp
tuyến tính của các biến ngẫu nhiên ( the random variables), chẳng hạn:
$ wt yt
• Do vậy các hệ số ước lượng này cũng có phân phối chuẩn nếu yt cũng có
phân phối chuẩn:
• $ N(, Var())
$ N(, Var())
• Tuy nhiên điều gì sẽ xảy ra nếu phần dư không có sai số chuẩn? Các thông
số ước lượng vẫn có phân phối chuẩn nếu các giả định khác của mô hình
CLRM vẫn đúng và mẫu quan sát là đủ lớn.
• Các thay đổi của các giả trị tuân theo phân phối chuẩn , $ và $ có thể
được xác định như sau:
ˆ ˆ
~ N 0,1 và ~ N 0,1
var var
ˆ ˆ
~ tT 2 và ~ tT 2
SE (ˆ ) ˆ
SE ( )
Các bước liên quan đến kiểm định ý nghĩa thống kê là:
1. ước lượng hồi quy (Estimate) và xác định các giá trị sau :
$ $ SE($ ) SE( $ )
2. Tính toán các giá trị thống kê của kiểm định (test statistic) bằng công
thức sau:
$ *
test statistic
SE ( $ )
với * là giá trị của mà ta cần test (null hypothesis).
3. Chúng ta cần sử dụng bảng phân phối để so sánh số liệu thống kê của
các hệ số ước lượng vốn tuân theo phân phối student với các giá trị so
sánh (t- critical value) với T-2 bậc tự do. Khi số lượng bậc tự do tăng lên,
kết quả kiểm định sẽ càng trở nên vững mạnh với độ tin cậy cao hơn
(resuls are robust).
4. Chúng ta cũng cần lựa chọn “mức ý nghĩa thống kê “ (significance level)
thường được ký hiệu là . Thông thường mức ý nghĩa được lựa chọn
(significance level) là 5%.
Tuy nhiên các mức ý nghĩa 10% và 1% cũng được sử dụng phổ biến.
5. Với mức ý nghĩa thống kê cho trước, chúng ta có thể xác định vùng “bác
bỏ” (rejection region) và vùng “chấp nhận” (non-rejection region) giả thiết
đối với kiểm định 2 bên (2-sided test) như sau:
f(x)
f(x)
95% non-rejection
region 5% rejection region
f(x)
7. Thực hiện kiểm định ý nghĩa thông kê: nếu giá trị thống kê t (test
statistic) nằm trong vùng “bác bỏ” thì khi đó ta sẽ loại bỏ giả thiết null
hypothesis (H0) và chấp nhận giả thiết H1, ngược lại ta chấp nhận giả thiết
H0.
• Cần hiểu các đặc tính và hình dạng hình chuông (bell shape) của của phân
phối chuẩn.
• Chúng ta có thể tạo một biến số có phân phối chuẩn thành phân phối chuẩn
tắc với giá trị trung bình bằng 0 và phương sai bằng 1 (zero mean and unit
variance) bằng cách lấy giá trị ban đầu trừ đi giá trị bình quân của nó và
sau đó chia cho độ lệch chuẩn của chính nó.
• Tuy nhiên có một mối quan hệ đặc biệt giữa phân phối chuẩn và phân phối
t. Cả hai phân phối này đều có các giá trị đối xứng nhau và tập trung quanh
0.
• Tuy nhiên phân phối t có thông số khác và bậc tự do của riêng nó và trong
trường hợp phương trình hồi quy với 1 biến thì bậc tự do của phân phối t
sẽ bằng số quan sát trừ đi 2.
Khoa Tài Chính - ĐHKT TPHCM 49
Phân phối t (t-Distribution ) có hình dạng ra sao ?
normal distribution
t-distribution
• Khoảng tin cậy thông thường là có giá trị 2 bên (two-sided) tuy nhiên
về mặt lý thuyết chúng ta vẫn có thể xây dựng khoảng tin cậy 1 bên.
2. Chọn mức ý nghĩa thống kê, , (thường là 5%). Điều này tương đương với việc
chọn khoảng tin cậy (1-)100%, ví dụ:
5% significance level = 95% confidence interval
3. Sử dụng bảng phân phối t (t-tables) đề tìm ra các giá trị so sánh t thích hợp
(appropriate critical value), ứng với số bậc tự do là T-2 d.f. (degrees of freedom).
4. Khoảng tin cậy (confidence interval ) được cho bởi công thức:
( ˆ t crit SE ( ˆ ), ˆ t crit SE ( ˆ ))
5. Thực hiện việc kiểm định: nếu giá trị giả thiết “Null” của of (*) nằm ngoài
khoảng tin cậy, thì khi đó chúng ta sẽ loại bỏ giả thiết rằng = *, và ngược lại
chúng ta không thể loại bỏ giả thiết Null.
Khoa Tài Chính - ĐHKT TPHCM 53
“Confidence Intervals” so với “Tests of Significance”
• Với cách tiếp cận “test of significance”, chúng ta sẽ không loại bỏ giả thiết H0:
= * nếu test statistic nằm trong vùng “không bác bỏ” (non-rejection region):
• Sắp xếp lại bất đẳng thức trên, chúng ta sẽ không “bác bỏ” nếu:
t crit SE ( ˆ ) ˆ * t crit SE ( ˆ )
• Và đây cũng chính là nguyên tắc theo cách tiếp cận “khoảng tin cậy”
(confidence interval approach):
ˆ t crit SE( ˆ ) * ˆ t crit SE( ˆ )
Khoa Tài Chính - ĐHKT TPHCM 54
“Confidence Intervals” so với “Tests of Significance”: ví dụ
• Bước 1: xác địn giá trị kiểm định thống kê so sánh (critical value): tcrit
= t20;5%
f(x)
-2.086 +2.086
H0 : = 2
vs. H1 : 2
• Thông thường chúng ta sử dụng mức ý nghĩa 5% cho kiểm định giả thiết
(ví dụ H0 : = 1).
Trong trường hợp mức ý nghĩa tiệm cận mức giới hạn cận biên
(marginal cases) chúng ta có thể nhận được câu trả lời khác hẳn nếu sử
dụng các mức ý nghĩa thống kê khác nhau.
Và đây cũng là lý do tại sao phương pháp kiểm định thống kê “test of
significance approach” lại được ưa chuộng hơn phương pháp khoảng tin
cậy “confidence interval”.
• Ví dụ, nếu chúng ta sử dụng mức ý nghĩa thống kê là 10% , với phương
pháp “ý nghĩa thống kê” (test of significant) ta có:
$ *
test stat
SE ( $ )
05091
. 1
1917
.
0.2561
Điều duy nhất thay đổi là mức ý nghĩa thống kê so sánh (critical value)
Khoa Tài Chính - ĐHKT TPHCM 59
Thay đổi mức ý nghĩa thống kê của kiểm định:
Vùng “bác bỏ” mới
f(x)
-1.725 +1.725
• t20;10% = 1.725. Test statistic nằm trong vùng “bác bỏ” (rejection
region). Chúng ta sẽ bác bỏ giả thiết H0.
• Phương pháp “khoảng tin cậy” thì chúng ta phải tính toán lại cả 2 giá
trị trên và dưới của khoảng tin cậy vì critical t-value đã thay đổi.
• Trong trường hợp “marginal cases”, kết luận cần đưa ra thận trọng (i.e.
reject hay not reject).
• Nếu bác bỏ giả thiết Null tại mức ý nghĩa 5%, chúng ta nói rằng kết
quả kiểm định có ý nghĩa thống kê (statistically significant).
• Chúng ta thường loại bỏ H0 nếu “test statistic” có ý nghĩa thống kê tại mức
ý nghĩa cho trước is statistically significant at a chosen significance level.
• Có 02 loại sai lầm khi kiểm định thống kê thường mắc phải:
1. Bác bỏ H0 khi nó thật sự “đúng”. Trường hợp này gọi là sai lầm loại I
(type I error).
2. Không bác bỏ H0 trong khi nó thật sự là không đúng. Trường hợp này
được gọi là sai lầm loại II (type II error.)
Reality
H0 is true H0 is false
Significant Type I error
Result of (reject H0) =
Test Insignificant Type II error
( do not =
reject H0)
Khoa Tài Chính - ĐHKT TPHCM 62
Đánh đổi giữa sai lầm loại I và II (Type I and Type II Errors)
• Xác suất của sai lầm loại 1 chính là , mức ý nghĩa thống kê mà chúng ta đã
chọn.
• Lưu ý rằng luôn có sự đánh đổi giữa sai lầm loại I và sai lầm loại 2. Điều này có
nghĩa rằng nếu chúng ta giảm mức ý nghĩa thống kê (ví dụ từ 5% xuống còn 1%)?
Thì chúng ta đã giảm cơ hội của việc mắc sai lầm loại 1 nhưng đồng thời chúng
ta cũng giảm xác suất loại bỏ giả thiết Null hay tăng xác suất của mắc sai lầm
loại II:
less likely
to falsely reject
Reduce size more strict reject null
of test criterion for hypothesis more likely to
rejection less often incorrectly not
reject
• Như vậy luôn có sự đánh đổi giữa sai lầm loại I và sai lầm loại II khi chúng ta
chọn mức thống kê nào đó. Cách duy nhất để có thể giảm khả năng mắc sai lầm
của cả hai loại là gia tăng kích thước của mẫu quan sát.
Khoa Tài Chính - ĐHKT TPHCM 63
Kiểm định giả thiết sử dụng kết quả: The t-ratio
• Nhớ lại rằng công thức để tính t- test theo phương pháp kiểm định ý nghĩa
thống kê (test of significance approach) như sau:
$i i*
test statistic
SE $i
• H0 : i = 0
H1 : i 0
Chẳng hạn nếu chúng ta kiểm định hệ số của tổng thể (the population
coefficient) là 0 với kiểm định 2 bên (two-sided) thì điều này tương đương
với kiểm định sử dụng t-ratio :
$i
Vì i* = 0, test stat
SE ( $i )
• Giả dụ rằng chúng ta có các thông số ước lượng sau đây bao gồm sai số
chuẩn (standard errors) và t-ratios cho hệ số chặn (intercept) và hệ số độ
dốc tương ứng.
Coefficient 1.10 -4.40
SE 1.35 0.96
t-ratio 0.81 -4.63
• Nếu chúng ta bác bỏ H0, chúng ta nói rằng kết quả không có ý nghĩa.
• Nếu hệ số ước lượng không có ý nghĩa thì điều này có nghĩa rằng biến số x
có kiên quan không thể giải thích được các thay đổi trong biến số y.
• Các biến số mà kết quả kiểm định cho thấy không có ý nghĩa thống kê thường
được loại bỏ khỏi mô hình hồi quy.
• Trong thực hành, chúng ta thường giữ lại hệ số chặn (constant ) ngay cả khi
nó không có ý nghĩa thống kê. Điều gì sẽ xảy ra nếu mô hình không có hệ số
chặn (no intercept ):
yt
• Kiểm định cho sự hiện hữu và ý nghĩa của tỷ suất sinh lợi bất thường
(abnormal returns ) (“Jensen’s alpha” - Jensen, 1968).
• Mẫu dữ liệu: Tỷ suất sinh lợi hàng năm đối với các danh mục dầu tư của
115 mutual funds từ năm 1945-1964.
• Bây giờ chúng ta sẽ thực hiện một biến thể của Jensen’s test tại thị trường UK,
sử dụng tỷ suất sinh lợi hàng tháng của 76 quỹ đầu tư cổ phiếu. Số liệu từ
January 1979 – May 2000 (257 quan sát cho mỗi quỹ đầu tư). Thống kê mô tả
cho các quỹ đầu tư như sau:
Mean Minimum Maximum Median
TSSL hàng tháng, 1979-2000 1.0% 0.6% 1.4% 1.0%
S.D. TSSL (1979-2000) 5.1% 4.3% 6.9% 5.0%
• Mô hình hồi quy Jensen cho TSSL của các quỹ đầu tư UK, January 1979-May
2000
R jt R ft j j ( Rmt R ft ) jt
• Trong nghiên cứu thực tế sau khi tính trừ chi phí giao dịch gộp (gross of
transactions costs), kết quả cho thấy 9 quỹ đầu tư trong tổng số 76 quỹ đã
đạt TSSL vượt trội so với thị trường với hệ số alpha dương và có ý nghĩa
thống kê, trong khi đó có 7 quỹ có alpha âm và có ý nghĩa thống kê.
2. TTSL đổi chiều phản ánh yêu cầu điều chỉnh về trạng thái cân bằng của
TTSL
Ball & Kothari (1989) tìm thấy rằng CAPM beta của “losers” cao hơn beta
của “winners”.
• Một kiểm định về “anomaly” khác: Hiệu ứng tháng giêng (the January
effect).
– Zarowin (1990) tìm thấy rằng 80% trong TTSL vượt trội của “Loser”
xảy ra vào tháng Giêng.
• Tính toán TSSL vượt trội hàng tháng (monthly excess returns) cho tất cả
các cổ phiếu niêm yết trên thị trường chứng khoán trong 6, 12, 18 tháng
cho mỗi cổ phiếu i:,,
• Tính toán TSSL bình quân cho mỗi cổ phiếu i trong 6 tháng đầu tiên, 12
hoặc 18 tháng:
1 n
Ri U it
n t 1
• Phân vị các cổ phiếu với TSSL bình quân từ cao nhất đến thấp nhất. Tạo 5
danh mục với TSSL của danh mục là bình quân gia quyền của các TSSL
cổ phiếu có trong danh mục như sau:
• Sử dụng mẫu quan sát có cùng quãng thời gian n để theo dõi thành quả của
mỗi danh mục. Ví dụ sử dụng thời kỳ 1 năm đó để theo dõi thành quả của
danh mục được tạo lập từ 1 năm trước đó, tương tự cho danh mục ½ năm,
1 ½ năm.
• Như vậy chiều dài quãng thời gian n được sử dụng để theo dõi các danh
mục là:
n = ½ , 1, hoặc 1 ½ năm.
• Nếu n = 1 năm:
Ước lượng danh mục i (Loser/Winner) trong năm 1
Theo dõi danh mục i (Loser/Winner) trong năm 2
Ước lượng danh mục i (Loser/Winner) trong năm 3
Theo dõi danh mục i (Loser/Winner) trong năm 4
• Vì vậy với tổng thời gian nghiên cứu là 6 năm trên TTCK Việt Nam thì
nếu n = ½ , chúng ta có 6 quan sát độc lập (non-overlapping) hay 6 thời kỳ
theo dõi (tracking periods)
• Tương tự, n = 1 năm ta sẽ có 3 thời kỳ theo dõi độc lập và n = 1,5 năm ta có
2 thời kỳ theo dõi độc lập.
• Tính toán TSSL bình quân của danh mục cho từng thời kỳ trong 6, 3 và 2 thời
kỳ tạo lập và theo dõi. Sử dụng công thức bình quân gia quyền cho TSSL của
mỗi cổ phiếu trong danh mục.
• Ký hiệu TSSL trung bình đối với “Winners” và “Losers” cho mỗi thời kỳ
trong suốt 6, 3 hoặc 2 thời kỳ : RW RpL
p
• Giải pháp: đưa sự khác biệt trong rủi ro giữa 2 danh mục “Winners” và
“Losers” vào phương trình hồi quy :
với
Rmt TSSl của thị trường
Rft TSSl phi rủi ro (3 month government t-bill)
• Câu hỏi nghiên cứu là danh mục “losers” có tạo TSSL cao hơn hẳn danh
mục “winners” tại một thời điểm đặc biệt nào đó trong năm?
• Để kiểm tra giả thiết này, ta tính TSSl như phần trước và thực hiện hồi quy
với biến Dummy cho 12 tháng trong năm:
12
RDt i Mi t
i 1
• Nghiên cứu trước đây cho thấy có hiệu ứng “overreactions” đối với TTSL
của các cổ phiếu trên TTCK các nước phát triển như US hay UK.
• “Losers” thường là các công ty có quy mô nhỏ cho nên ta có thể nói rằng
hiệu ứng “overreaction” ở UK là do tác động của quy mô doanh nghiệp
(size effect).
• Thiếu vắng các kiểm định những vi phạm của mô hình hồi quy (diagnostic
tests)?