B2,3

Chương 2
Tổng quan về mô hình hồi quy tuyến tính cổ điển

(classical linear regression model – CLRM)
Khoa Tài Chính - ĐHKT TPHCM 1

Hồi quy (Regression)
• Phân tích hồi quy có thể được xem là một trong những công cụ phân
tích quan trọng nhất đối với các nhà nghiên cứu định lượng.
Phân tích hồi quy (regression analysis) là gì ?
• Phân tích hồi quy được thực hiện nhằm mô tả và đánh giá mối quan hệ
giữa một biến số cho trước (thường được gọi biến phụ thuộc -
dependent variable) và một hay nhiều biến số khác (thường được gọi là
biến độc lập hay biến giải thích - independent variable(s)).

Thuật ngữ và ký hiệu và trong phân tích hồi quy CLRM
• Ký hiệu biến phụ thuộc bằng y và một hay nhiều biến độc lập bằng x1, x2, ... ,
xk với k là số biến độc lập
• Một vài những tên gọi khác cho các biến số y và x:

y x
dependent variable independent variables
regressand regressors
effect variable causal variables
explained variable explanatory variable
• Lưu ý rằng trong chương khởi đầu này này chúng ta sẽ chỉ đề cập đến phân
tích hồi quy tuyến tính cho trường hợp đơn giản với duy nhất một biến độc
lập x.

Hồi quy (regression) so với mối tương quan (correlation)
• Nếu chúng ta nói rằng y và x có tương quan với nhau thì điều này có nghĩa
rằng chúng ta đang xem xét hai biến này theo cả 2 chiều đối xứng nhau
(completely symmetrical way).
• Trong hồi quy, chúng ta xem xét biến phụ thuộc (dependent variable) (y) và
các biến độc lập (independent variables) (x’s) hoàn toàn khác:
 Biến số y được giả định là thay đổi ngẫu nhiên “random” hoặc
“stochastic” theo một cách nào đó, chẳng hạn có phân phối xác suất
(probability distribution).
 Tuy nhiên biến độc lập x lại được giả định không có những giá trị thay
đổi ngẫu nhiên “non-stochastic” hay “fixed” trong các mẫu quan sát
khác nhau.

Mô hình hồi quy tuyến tính giản đơn
• Để đơn giản hóa, mô hình hồi quy tuyến tính sẽ có số biến độc lập k=1 hay
biến y phụ thuộc vào duy nhất một biến giải thích x.
• Một vài ví dụ về loại mô hình hồi quy đơn biến:

– Đánh giá TTSL của chứng khoán (asset returns) thay đổi như thế nào
theo mức độ rủi ro của thị trường.
– Đo lường mối quan hệ dài hạn giữa giá cổ phiếu và cổ tức.
– Xây dựng tỷ số phòng ngừa tối ưu (optimal hedge ratio).

Mô hình hồi quy đơn biến: một ví dụ
• Có dữ liệu sau về Excess Returns của một danh mục đầu tư XXX cùng
với excess returns của thị trường (market index):
Year, t Excess return Excess return on market index

= rXXX,t – rft = rmt - rft
1 17.8 13.7
2 39.0 23.2
3 12.8 6.9
4 24.2 16.8
5 17.2 12.3
• Kiểm định giá trị Beta của danh mục này sẽ có dấu + theo như kỳ vọng
của lý thuyết CAPM

Minh họa mối quan hệ bằng đồ thị (Scatter Diagram)
45
40
Excess return on fund XXX
35
30
25
20
15
10
5
0
0 5 10 15 20 25
Excess return on market portfolio

Tìm kiếm phương trình đường thẳng mô phỏng tốt nhất
mối quan hệ giữa các dữ liệu quan sát (Line of Best Fit)
• Chúng ta có thể sử dụng phương trình tuyến tính cho một đường thẳng (for
a straight line) như sau:
y=a+bx
để có được đường thẳng có mô phỏng phù hợp nhất “best “fits”với dữ liệu
quan sát
• Tuy nhiên, phương trình này (y=a+bx) chỉ thuần túy là lý thuyết.
• Thực tiễn? Không. Vì vậy cần phải bổ sung yếu tố sai số giữa ước lượng
và thực tế (a random disturbance term), u vào phương trình.
yt =  + xt + ut
where t = 1,2,3,4,5,....

Tại sao chúng ta lại cần bổ sung sai số ước lượng
(Disturbance term)?
• Sai số ước lượng có thể giúp khắc phục được những khiếm khuyết sau
của mô hình:
- Bỏ sót biến giải thích hay bỏ sót những nhân tố khác cũng có tác động
đến yt
- Có thể có sai sót trong đo lường (measurement errors ) biến yt mà những

sai sót này không được mô hình hóa.
- Những ảnh hưởng từ bên ngoài mô hình đến biến yt một cách ngẫu nhiên
(Random outside influences) mà chúng ta không thể quan sát và đưa vào
mô hình.

Xác định hệ số hồi quy (Regression Coefficients)
• Chúng ta sẽ xác định các hệ số  và  như thế nào?
• Nguyên tắc cơ bản: lựa chọn hệ số  và  sao cho khoảng cách (theo
chiều dọc) từ các điểm quan sát thực tế đến đường thẳng ước lượng (fitted
lines) là nhỏ nhất :
y
y
yi
û i
ŷi
x xi x

Phương pháp hồi quy bình phương bé nhất thông thường
(Ordinary Least Squares - OLS)
• Phương pháp phổ biến nhất để tìm ra phương trình đường thẳng mô tả mối
quan hệ giữa các biến với sai số ước lượng là nhỏ nhất (fit a line to the
data).
• Phương pháp này được biến đến như là phương pháp OLS (ordinary least
squares).
• Chúng ta sẽ tính khoảng cách cho mỗi điểm quan sát và bình phương và
sau đó tối thiểu hóa tổng của các khoảng cách bình phương này (total sum
of the squares) và vì vậy phương pháp này còn có tên là bình phương bé
nhất (least squares).
• Các ký hiệu như sau:

yt ký hiệu điểm dữ liệu thực tế t
ŷt ký hiệu giá trị ước lượng yt (fitted value ) từ phương trình hồi quy
ût ký hiệu phần dư (residual), yt - ŷt là chênh lệch giữa giá trị thực
tế (actual) và giá trị ước lượng (fitted Value)

Phương pháp OLS phát huy tác dụng trong việc xác
định hệ số hồi quy như thế nào?
5
• Min. uˆ  uˆ  uˆ  uˆ  uˆ
2
1
2
2
2
3
2
4
2
5 , hay minimise  uˆ
t 1
2
t ( Residual Sum of
Squares - RSS).
• Nhớ rằng ût là khác biệt (sai số) giữa điểm quan sát thực tế (actual point)
và đường hồi quy .
 
 t t tương đương  uˆ
2

2
• Vì vậy tối thiểu hóa y ˆ
y tối thiểu hóa t
đối với $ và $

Ước lượng hệ số hồi quy (OLS Estimator)
• Phương trình ước lượng ˆ t  ˆ  ˆxt

y
• Gọi L   ( y t  yˆ t ) 2   ( y t  ˆ  ˆxt ) 2
t i
• Để tối thiểu hóa L đối với $ và $ , ta lấy đạo hàm bậc nhất của L theo
$ và $ như sau:
L
 2 ( yt  ˆ  ˆxt )  0 (1)
ˆ t
L
 2 xt ( yt  ˆ  ˆxt )  0 (2)
ˆ t
• Từ (1), ta có:  ( y t  ˆ  ˆxt )  0  y t  Tˆ  ˆ  xt  0

t
• Biết rằng  y t  Ty và  xt  Tx .
Ước lượng hệ số hồi quy (OLS Estimator), (cont’d)
• Vì vậy ta có thể viết lại như sau:

Ty  Tˆ  Tˆx  0 hay y  ˆ  ˆx  0 (3)
• Từ (2),
 xt ( yt  ˆ  ˆxt )  0 (4)
t
• Từ (3), ˆ  y  ˆx (5)

• Thay thế $ từ (5) vào (4), ta có:
 xt ( yt  y  ˆx  ˆxt )  0
t
 t t  t
x y  y x  ˆ
x  t
x  ˆ
  t 0
x
2
 t t
x y  T y x  ˆ
T x 2
 ˆ
  t 0
x
2

Ước lượng hệ số hồi quy (OLS Estimator), (cont’d)
• Giải phương trình cho $ :
ˆ (Tx 2   xt2 )  Tyx   xt yt
ˆ   x y  Txy
t t
 x  Tx 2
t
2
và
ˆ  y  ˆx
• Phương pháp xác định hệ số hồi quy tối ưu này được gọi là phương
pháp bình phương sai số bé nhất thông thường - OLS (Ordinary
Least Squares)
Ý nghĩa của hệ số $ và $ ?
• Quay lại ví dụ về mô hình CAPM ở trên, từ số liệu của 5 quan sát và sử dụng
công thức hồi quy OLS, chúng ta có thể dễ dàng tính được:
$ = -1.74 và $ = 1.64.
Và như vậy đường hồi quy tuyến tính (fitted line) có phương trình sau:
yˆ t  1.74  1.64 x t
• Câu hỏi:
Nếu một nhà phân tích thị trường kỳ vọng TSSL của thị trường vượt trội so
với lãi suất phi rủi ro (risk-free rate) là 20% trong năm tới, như vậy từ phương
trình hồi quy có được, bạn có thể kỳ vọng TSSL từ danh mục XXX sẽ là bao
nhiêu?
• Trả lời:
Bạn có thể nói rằng giá trị “kỳ vọng” của y = 31.06

Mức độ chính xác của hệ số chặn (Intercept ) được ước lượng
• Cần thận trọng khi thông đạt kết quả của hệ số chặn được ước lượng, đặc biệt
nếu không có hoặc chỉ có ít quan sát gần trục tung y:
y
0 x

Một số thuật ngữ chuyên dụng khác:
1. Tổng Thể và Mẩu Quan Sát (The Population and the Sample)
• “Tổng Thể” (The population) là tập hợp tất cả các đối tượng đang được nghiên
cứu, ví dụ:
Nghiên cứu quan tâm Tổng Thể của đối tượng nghiên
cứu Population of interest
Đánh giá hành vi của các nhà đầu tư Toàn bộ các nhà đầu tư trên TTCK
• Như vậy “mẫu nghiên cứu” (sample) sẽ chỉ bao gồm một số “nhà đầu tư”
được rút ra từ tổng thể để tiến hành phỏng vấn.
• Mẫu nghiên cứu “ngẫu nhiên” (random sample) là mẫu tập hợp các quan sát
được rút ra từ tổng thể một cách ngẫu nhiên (xác suất được chọn là bằng
nhau)

2. DGP và Hàm Phân Phối Tổng Thể (PRF)
• Hàm phân phối tổng thể (The population regression function - PRF) được sử
dụng để mô tả một mô hình mà có thể tái tạo các dữ liệu giống như quan sát
thực tế.
• Bao hàm trong mô hình là các mối quan hệ thực tế giữa các biến số, như bao
gồm các giá trị đúng (true value) của  và .
• Hàm phân phối tổng thể còn được biết như là DGP (data generation process)
• Hàm phân phối tổng thể - PRF có dạng:
yt    xt  ut

2. DGP và Hàm Phân Phối Tổng Thể (PRF)
• Hàm phân phối mẫu quan sát (The sample regression function – SRF) bao
hàm các mối quan hệ ước lượng giữa các biến sử dụng mẫu dữ liệu quan sát
được.
• Hàm phân phối mẫu quan sát - SRF có dạng: yˆ t  ˆ  ˆxt
• Trên thực tế chúng ta sử dụng SRF để suy diễn các giá trị của PRF. Do vậy
sai số sẽ là:
uˆ t  yt  yˆ t
• Và như vậy chúng ta cần phải biết được các giá trị tham số  và  đã được
ước lượng “tốt “ như thế nào.

3. Mô hình tuyến tính và mô hình phi tuyến
(Linear and Non-linear Models)
• Để có thể sử dụng được phương pháp OLS, chúng ta cần đảm bảo rằng mô
hình hồi quy là tuyến tính đối với các tham số ước lượng  và  (linear
in the parameters) nhưng mô hình không nhất thiết phải là tuyến tính đối
với các biến phụ thuộc và biến giải thích y and x (linear in the variables).
• Tuyến tính trong các tham số (Linear in the parameters) có nghĩa rằng các
tham số không được nhân, chia với nhau hay được bình phương hoặc
lập phương v.v...
• Một số mô hình phi tuyến nhưng thật ra không có thuộc tính “phi tuyến” vì
có thể được chuyển đổi sang dạng tuyến tính bằng cách thay thế
(substitution) hay chuyển đổi (tranformation) các biến cho phù hợp.
• Ví dụ xem xét mô hình hồi quy số mũ sau: (exponential regression model)
Yt  e X t e ut lnYt     ln X t  ut
• Thực hiện chuyển đổi như sau: gọi yt=ln Yt và xt=ln Xt
yt    xt  ut
3. Mô hình tuyến tính và mô hình phi tuyến
(Linear and Non-linear Models)
• Mô hình trên còn được gọi là mô hình hồi quy số mũ (exponential regression
model) vì các hệ số hồi quy có thể được diễn đạt như là “độ co dãn”
(elasticities).
• Tương tự nếu từ lý thuyết ta rút ra được một mô hình mà y có mối quan hệ
nghịch đảo với x: 
yt     ut
xt
khi đó mô hình vẫn là tuyến tính và có thể được ước lượng bởi OLS bằng
cách thay thế 1
zt 
xt
• Mô hình được gọi là phi tuyến nội tại (intrinsically non-linear) khi chúng ta
không thể chuyển đổi sang dạng tuyến tính để sử dụng OLS nhưng vẫn có thể
sử dụng các phương pháp hồi quy phi tuyến. Ví dụ:
y t     1  2 x t   1  ut
4. “Estimator” hay “Estimate”?
• Estimators là những công thức được sử dụng để tính toán các hệ số hồi quy
(formulae used to calculate the coefficients)
Ví dụ:
ˆ   x y  Txy
t t
 x  Tx 2
t
2
và
ˆ  y  ˆx
• Estimates là những giá trị bằng số thực tế (actual numerical values) của các
hệ số hồi quy (coeeficients)

Những giả định nền tảng của mô hình hồi quy tuyến tính
giản đơn – CLRM (Classical Linear Regression Model)
• Mô hình hồi quy tuyến tính mà chúng ta đang thảo luận được gọi là mô hình
CLRM (the classical linear regression model).
• Trong mô hình này chúng ta sử dụng các dữ liệu quan sát xt, để hồi quy giá trị ước
lượng yt “mũ”. Trong khi đó giá trị yt thực tế phụ thuộc vào sai số ut, do vậy
chúng ta cần đánh giá các thuộc tính của phần dư ut và những giá trị sai số này
đã được tạo ra như thế nào.
• Những giả định quan trọng của phần dư ut (the unobservable error terms):
• Ký hiệu kỹ thuật Ý nghĩa kinh tế lượng
1. E(ut) = 0 Phần dư có giá trị kỳ vọng là zero
2. Var (ut) = 2 Phương sai của phần dư là xác định và không đổi
như nhau tất cả các các giá trị của xt
3. Cov (ui,uj)=0 Các phần dư là độc lập với nhau
4. Cov (ut,xt)=0 Không có mối quan hệ giữa phần dư và biến độc
lập x
• Giả định bổ sung:
5. ut ~N(0, 2) Nguyễn Thị Hồng Nhâm - Khoa Tài phần
cĐHKT dư có phân phối chuẩn
ChínhTPHCM 24
Những giả định nền tảng của mô hình hồi quy tuyến tính giản
đơn – CLRM (Classical Linear Regression Model) – tiếp theo
• Giả định thứ 4 có thể được diễn đạt với ý nghĩa mạnh hơn là các biến
độc lập xt không thay đổi ngẫu nhiên (non-stochastic) hay có thuộc tính
không đổi trong các mẫu quan sát khác nhau (fixed in repeated
samples).
• Giả định thứ 5 là cần thiết nếu chúng ta muốn dùng mô hình để kiểm
định các thông số của “tổng thể” bao gồm  và  từ các thông số ước
lượng sử dụng mẫu quan sát $ và $

Các thuộc tính của hệ số ước lượng OLS (OLS Estimator)
• Định đề Gauss-Markov (Gauss-Markov theorem): Nếu các giả định từ A1

đến A4 là đúng, khi đó các hệ số ước lượng $ và $ từ phương pháp hồi quy
OLS sẽ là các ước lượng không chệch tuyến tính tốt nhất - Best Linear
Unbiased Estimators (BLUE).
 “Estimator” $ - Hệ số ước lượng $ sẽ là giá trị “đúng” (true value)
của .
 “Linear” - là hệ số ước lượng tuyến tính (linear estimator)
 “Unbiased” - Tính bình quân, giá trị thực tế của $ và $ ’s sẽ
bằng với các giá trị “đúng (true values).
 “Best” - Có nghĩa rằng các hệ số ước lượng (OLS estimator) $ có
phương sai nhỏ nhất so với tất cả các hệ số ước lượng có thể có được từ
mô hình CLRM.
• Định đề Gauss-Markov đã chứng minh rằng các ước lượng OLS là tốt nhất.
Consistency/Unbiasedness/Efficiency
• Tính nhất quán (Consistent)

Các hệ số ước lượng $và $ là nhất quán khi và chỉ khi quá trình ước lượng hội
tụ về các giá trị “đúng” của những hệ số này (true values) khi kích thước của mẫu
quan sát tăng dần về vô cực. Do vậy chúng ta cần giả định E(xtut)=0 và
Var(ut)=2 <  đề chứng minh điều này.
• Tính nhất quán (Consistency) ngụ ý rằng:
 
lim Pr ˆ      0   0
T 
 
lim Pr V ( ˆ )  V (  )    0   0
T 

Consistency/Unbiasedness/Efficiency
• Không thiên lệch (unbiased)

Các ước lượng OLS $và $ là không thiên lệch khi và chỉ khi:
E($)= và E( $ )=
Do vậy giá trị được ước lượng tính bình quân sẽ bằng với giá trị “đúng” (true
values).
Để chứng minh điều này ta cần giả thiết E(ut)=0.
“Không thiên lệch” (Unbiasedness) là một điều kiện mạnh hơn “sự nhất quán”
(consistency).
• Tính hiệu quả (Efficiency)

Ước lượng $ của giá trị “đúng” được gọi là có tính hiệu quả nếu:
 (1) nó là ước lượng không chệch (unbiased) và
 (2) có giá trị phương sai nhỏ nhất trong số các hệ số ước không chệch khác.
=> Nếu một hệ số ước lượng là “hiệu quả”, thì chúng ta có thể nói rằng nó có
giá trị rất gần với giá trị “đúng” của .
Sự chính xác của ước lượng (Precision) và sai số chuẩn
(Standard Errors)
• Giá trị của ước lượng hồi quy $ và $là luôn gắn liền với mẫu quan sát đã được
lựa chọn và sử dụng để thực hiện hồi quy.
• Nhớ lại rằng ta cố gắng ước lượng  và  từ các thông số mẫu $and $ được tính
từ công thức:
ˆ   t 2 t
x y  Txy
và ˆ  y  ˆx
 xt  Tx 2
• Chúng ta cần đo lường mức độ tin cậy hoặc sự chính xác của các hệ số ước
lượng $ và .$ để có thể thực hiện kiểm định giả thiết.
• Với giả định 1- 4 cho trước ở trên, khi đó sai số chuẩn (standard errors) có thể
được tính như sau:
 t  xt
2 2
x
SE (ˆ )  s s ,
T  ( xt  x ) 2
T  x T x
2
t
2 2
1 1
SE ( ˆ )  s s
 ( xt  x ) 2
 t
x 2
 T x 2
Với s là độ lệch chuẩn được ước lượng của sai số phần dư (estimated standard
deviation of the residuals).
Sự chính xác của ước lượng (Precision) và sai số chuẩn
(Standard Errors)
• Chúng ta cần đo lường mức độ tin cậy hoặc sự chính xác của các hệ số ước
lượng $ và $ để có thể thực hiện kiểm định giả thiết.
• Với giả định A1- A4 cho trước ở trên, khi đó sai số chuẩn (standard errors) có
thể được tính như sau:
x x
2 2
SE (ˆ )  s t
s t
,
T  (x  x)t
2
T  x T x
2
t
2 2
1 1
SE ( ˆ )  s s
 ( xt  x ) 2
 t
x 2
 T x 2
Với s là độ lệch chuẩn của phần dư được ước lượng (estimated standard deviation
of the residuals).

Ước lượng phương sai của phần dư (Variance of the
Disturbance Term)
• Phương sai của phần dư ut được tính toán như sau:
Var(ut) = E[(ut)-E(ut)]2
hay
Var(ut) = E(ut2)
1

2
• Do vậy chúng ta cần tính giá trị bình quân của ut : s2  ut2
T
• Không may mắn là công thức trên không khả thi khi ut là không quan sát
được. Chúng ta có thể sử dụng giá trị ước lượng của ut, là û
t
1
s2 
T
t
ˆ
u 2
Nhưng lưu ý là S2 vẫn là hệ số ước lượng bị chệch (biased estimator ) của 2.
Ước lượng phương sai của phần dư (Variance of the
Disturbance Term) (cont’d)
• Do vậy hệ số ước lượng không chệch của  sẽ được tính bằng công thức sau:
s
 uˆ 2
t
T 2
với  uˆt là tổng bình phương của phần dư (residual sum of squares -
2
RSS) và T kích thước của mẫu quan sát (sample size).
Một vài lưu ý đối với Standard Error Estimators

1. Cả SE( $) and SE( $) đều tùy thuộc vào s2 (hay s). Nếu phương sai của s2
càng lớn thì khi đó mức độ phân tán của các phần dư quanh giá trị trung bình
của nó sẽ càng lớn và do đó các giá trị y sẽ càng bị phân tán quanh giá trị
trung bình của nó.
2. Giá trị tổng bình2 phương (sum of the squares) của x và giá trị trung bình
của nó  xt  x  có ảnh hưởng trực tiếp đến cả công thức SE( $) and SE( $)
Giá trị tổng bình phương (sum of squares) càng lớn, thì phương sai của hệ
số ước lượng (coefficient variances) càng bé.
32
Khoa Tài Chính - ĐHKT TPHCM
Đồ thị minh họa điều gì sẽ xảy ra nếu 

 tx  x 2
nhỏ hoặc lớn:
y
y
y y
x
0 x x 0 x

Mẫu quan sát, T, càng lớn thì phương sai của các hệ số ước lượng càng bé.
T xuất hiện trong công thức tính SE( $ ) nhưng ảnh hưởng ngầm trong
công thức tính SE( ) bởi vì  t
$  x  x 2
là ngầm được tính từ t = 1 đến
T.
4. Trong khi đó giá trị  xt2chỉ ảnh hưởng đến SE của hệ số chặn SE($ ) và
và không ảnh hưởng đến SE của hệ số độ dốc SE($ )
vì  xt đo lường khoảng cách từ điểm quan sát đến trục tung y
2

Ví dụ: Tính toán các hệ số ước lượng (Parameters) và sai số
chuẩn của các hệ số ước lượng (Standard Errors)
• Có dữ liệu sau được tính từ phương trình hồi quy bao gồm biến phụ thuộc y,
một biến độc lập x, và một hằng số, sử dụng 22 quan sát của :
 x y  830102, T  22, x  416.5, y  86.65,

t t
 x  3919654, RSS  130.6

2
t
• Kết quả tính toán:
$ 830102  (22 * 416.5 * 86.65)
  2  0.35
3919654  22 *(416.5)
$  86.65  035 .  5912

. * 4165 .
• Phương trình hồi quy sẽ là
yˆ t  ˆ  ˆxt
yˆt  59.12  0.35xt

Ví dụ: Tính toán các thông số ước lượng (Parameters) và sai
số chuẩn của các thông số ước lượng này (Standard Errors)
• SE(regression), s   uˆ t2

130.6
 2.55
T 2 20
3919654
SE ( )  2.55 *  3.35

22  3919654  22  416.5 2

1
SE (  )  2.55 *  0.0079

3919654  22  416.5 2

• Chúng ta viết lại các kết quả như sau:
yˆ t   59.12  0.35 xt
(3.35) (0.0079)

Giới thiệu về suy luận thống kê (Statistical Inference)
• Các nhà nghiên cứu rất cần suy luận về các giá trị có thể có của tổng thể từ
các thông số ước lượng từ phương trình hồi quy.
Ví dụ: giả định chúng ta có kết quả hồi quy CLRM như sau:
yˆ t  20.3  0.5091xt
(14.38) (0.2561)
• $  0.5091 là một ước lượng điểm (single point estimate) của thông số
“tổng thể” chưa biết (unknown population parameter) . Do vậy vấn đề là
mức độ tin cậy “reliable” của thông số ước lượng này như thế nào?
• Mức độ tin cậy của một điểm ước lượng (point) được đo lường bởi
Standard Errors của hệ số ước lượng (coefficient’s standard error).

Kiểm định giả thuyết (Hypothesis Testing): các khái niệm
• Chúng ta có thể sử dụng thông tin về mẫu (sample) để suy luận về “tổng thể”
(population).
• Chúng ta luôn có 2 giả thiết cùng đi với nhau: giả thiết 0 (the null hypothesis),
ký hiệu H0 và giả thiết thay thế (the alternative hypothesis ), ký hiệu H1.
• Giả thiết 0 là giả thiết thống kê (statistical hypothesis) về biến cố mà chúng ta
cần kiểm định.
• Giả thiết thay thế thể hiện phần biến cố còn lại nếu như giả thiết 0 bị loại.
• Ví dụ, sử dụng lại ví dụ bên trên, chúng ta sẽ kiểm định giá trị “đúng” của  là
0.5. Ký hiệu sẽ được sử dụng như sau:
H0 :  = 0.5
H1 :   0.5
và kiểm định này còn được gọi là kiểm định 2 bên (two sided test)

Kiểm định một bên (One-Sided Hypothesis Tests)
• Đôi khi chúng ta có một vài thông tin cho trước mà theo đó chúng ta có thể
kỳ vọng rằng  > 0.5 thay vì  < 0.5. trong trường hợp này chúng ta có thể
sử dụng kiểm định một bên (one-sided test) như sau:
H0 :  = 0.5
H1 :  > 0.5
Hoặc
H0 :  = 0.5
H1 :  < 0.5
• Có 02 cách để thực hiện kiểm định giả thiết:

(1) theo cách tiếp cận “mức ý nghĩa thống kê” (test of significance
approach) hoặc
(2) theo cách tiếp cận “khoảng tin cậy” (the confidence interval
approach).

Phân phối xác suất của các hệ số ước lượng từ phương
pháp bình phương bé nhất (The Probability Distribution of
the Least Squares Estimators)
• Chúng ta giả định rằng ut  N(0,2)
• Bởi vì hệ số ước lượng từ phương pháp bình phương bé nhất là kết hợp
tuyến tính của các biến ngẫu nhiên ( the random variables), chẳng hạn:
$   wt yt
• Do vậy các hệ số ước lượng này cũng có phân phối chuẩn nếu yt cũng có
phân phối chuẩn:
• $  N(, Var())
$  N(, Var())
• Tuy nhiên điều gì sẽ xảy ra nếu phần dư không có sai số chuẩn? Các thông
số ước lượng vẫn có phân phối chuẩn nếu các giả định khác của mô hình
CLRM vẫn đúng và mẫu quan sát là đủ lớn.

Phân phối xác suất của các hệ số ước lượng từ phương pháp
bình phương bé nhất (cont’d)
• Các thay đổi của các giả trị tuân theo phân phối chuẩn , $ và $ có thể
được xác định như sau:
ˆ   ˆ  
~ N 0,1 và ~ N 0,1
var   var  
• Tuy nhiên var() và var() là chưa biết, do vậy
ˆ   ˆ  
~ tT 2 và ~ tT  2
SE (ˆ ) ˆ
SE (  )

Kiểm định giả thiết:
Phương pháp tiếp cận theo ý nghĩa thống kê (The Test of
Significance Approach)
• Giả định có một phương trình hồi quy như sau:
y    x  u với t=1,2,...,T
t t t
Các bước liên quan đến kiểm định ý nghĩa thống kê là:
1. ước lượng hồi quy (Estimate) và xác định các giá trị sau :
$ $ SE($ ) SE( $ )
2. Tính toán các giá trị thống kê của kiểm định (test statistic) bằng công
thức sau:
$   *
test statistic 
SE ( $ )
với  * là giá trị của  mà ta cần test (null hypothesis).

Kiểm định giả thiết:
Phương pháp tiếp cận theo ý nghĩa thống kê (cont’d)
3. Chúng ta cần sử dụng bảng phân phối để so sánh số liệu thống kê của
các hệ số ước lượng vốn tuân theo phân phối student với các giá trị so
sánh (t- critical value) với T-2 bậc tự do. Khi số lượng bậc tự do tăng lên,
kết quả kiểm định sẽ càng trở nên vững mạnh với độ tin cậy cao hơn
(resuls are robust).
4. Chúng ta cũng cần lựa chọn “mức ý nghĩa thống kê “ (significance level)
thường được ký hiệu là . Thông thường mức ý nghĩa được lựa chọn
(significance level) là 5%.
Tuy nhiên các mức ý nghĩa 10% và 1% cũng được sử dụng phổ biến.

Kiểm định giả thiết theo ý nghĩa thống kê: xác định vùng
“bác bỏ” (Rejection Region for a Test of Significance)
5. Với mức ý nghĩa thống kê cho trước, chúng ta có thể xác định vùng “bác
bỏ” (rejection region) và vùng “chấp nhận” (non-rejection region) giả thiết
đối với kiểm định 2 bên (2-sided test) như sau:
f(x)
2.5% 95% non-rejection 2.5%

rejection region region rejection region

Vùng “bác bỏ” giả thiết (rejection Region) đối với kiểm
định một bên (1-Sided Test / Upper Tail)
f(x)
95% non-rejection
region 5% rejection region

Vùng “bác bỏ” giả thiết (rejection Region) đối với kiểm
định một bên (1-Sided Test / (Lower Tail)
f(x)
95% non-rejection region

5% rejection region

Kiểm định giả thiết theo ý nghĩa thống kê : rút ra kết luận
(drawing conclusions)
6. Sử dụng bảng thống kê t (t-tables) để có được giá trị so sánh (critical

value) với giá trị thông kê tính toán được (the test statistic).
7. Thực hiện kiểm định ý nghĩa thông kê: nếu giá trị thống kê t (test
statistic) nằm trong vùng “bác bỏ” thì khi đó ta sẽ loại bỏ giả thiết null
hypothesis (H0) và chấp nhận giả thiết H1, ngược lại ta chấp nhận giả thiết
H0.

Lưu ý đối với phân phối t và phân phối chuẩn (Normal
Distribution)
• Cần hiểu các đặc tính và hình dạng hình chuông (bell shape) của của phân
phối chuẩn.
• Chúng ta có thể tạo một biến số có phân phối chuẩn thành phân phối chuẩn
tắc với giá trị trung bình bằng 0 và phương sai bằng 1 (zero mean and unit
variance) bằng cách lấy giá trị ban đầu trừ đi giá trị bình quân của nó và
sau đó chia cho độ lệch chuẩn của chính nó.
• Tuy nhiên có một mối quan hệ đặc biệt giữa phân phối chuẩn và phân phối
t. Cả hai phân phối này đều có các giá trị đối xứng nhau và tập trung quanh
0.
• Tuy nhiên phân phối t có thông số khác và bậc tự do của riêng nó và trong
trường hợp phương trình hồi quy với 1 biến thì bậc tự do của phân phối t
sẽ bằng số quan sát trừ đi 2.
Phân phối t (t-Distribution ) có hình dạng ra sao ?
normal distribution
t-distribution

So sánh phân phối t phân phối chuẩn (Normal
Distribution)
• Phân phối t (t-distribution) với số bậc tự do tiến về vô hạn sẽ trở thành phân
phối chuẩn (standard normal) hay t ()  N (01 ,)
• Các ví dụ so sánh từ bảng thống kê:

Mức ý nghĩa N(0,1) t(40) t(4)
50% 0 0 0
5% 1.64 1.68 2.13
2.5% 1.96 2.02 2.78
0.5% 2.57 2.70 4.60
• Lý do để sử dụng t-distribution thay vì phân phối chuẩn là vì chúng ta phải

ước lượng phương sai của phần dư (the variance of the disturbances),  2

Kiểm định thống kê theo phương pháp tiếp cận “khoảng
tin cậy” (The Confidence Interval Approach)
• Ví dụ chúng ta đã ước lượng được hệ số hồi quy là 0.93, với khoảng

tin cậy “95% confidence interval” hay (0.77,1.09). Điều này có nghĩa
rằng chúng ta tự tin 95% rằng giá trị đúng (nhưng chưa biết) của hệ số
ước lượng  sẽ nằm trong khoảng tin cậy này.
• Khoảng tin cậy thông thường là có giá trị 2 bên (two-sided) tuy nhiên
về mặt lý thuyết chúng ta vẫn có thể xây dựng khoảng tin cậy 1 bên.

Kiểm định giả thiết sử dụng “khoảng tin cậy”
(Confidence Intervals)
1. Tính toán $ , $ and SE($ ) , SE( $ ) như trong ví dụ trước.
2. Chọn mức ý nghĩa thống kê, , (thường là 5%). Điều này tương đương với việc
chọn khoảng tin cậy (1-)100%, ví dụ:
5% significance level = 95% confidence interval
3. Sử dụng bảng phân phối t (t-tables) đề tìm ra các giá trị so sánh t thích hợp
(appropriate critical value), ứng với số bậc tự do là T-2 d.f. (degrees of freedom).
4. Khoảng tin cậy (confidence interval ) được cho bởi công thức:
( ˆ  t crit  SE ( ˆ ), ˆ  t crit  SE ( ˆ ))
5. Thực hiện việc kiểm định: nếu giá trị giả thiết “Null” của of  (*) nằm ngoài
khoảng tin cậy, thì khi đó chúng ta sẽ loại bỏ giả thiết rằng  = *, và ngược lại
chúng ta không thể loại bỏ giả thiết Null.
“Confidence Intervals” so với “Tests of Significance”
• Cần lưu ý rằng Test of Significance và Confidence Interval approaches luôn

luôn cho ra cùng một kết quả.
• Với cách tiếp cận “test of significance”, chúng ta sẽ không loại bỏ giả thiết H0:
 = * nếu test statistic nằm trong vùng “không bác bỏ” (non-rejection region):
• Sắp xếp lại bất đẳng thức trên, chúng ta sẽ không “bác bỏ” nếu:
 t crit  SE ( ˆ )  ˆ   *  t crit  SE ( ˆ )
• Và đây cũng chính là nguyên tắc theo cách tiếp cận “khoảng tin cậy”
(confidence interval approach):
ˆ  t crit  SE( ˆ )   *  ˆ  t crit  SE( ˆ )
“Confidence Intervals” so với “Tests of Significance”: ví dụ
• Sử dụng lại kết quả hồi quy ở phần trước , T=22

yˆ t  20.3  0.5091xt
(14.38) (0.2561)
• Sử dụng cả 2 phương pháp kiểm định thống kê “test of significance”

và “confidence interval approaches” để kiểm định giả thiết  =1 (2
bên)
• Bước 1: xác địn giá trị kiểm định thống kê so sánh (critical value): tcrit
= t20;5%

Xác định vùng “bác bỏ” (Rejection Region)
f(x)
2.5% rejection region 2.5% rejection region
-2.086 +2.086

Thực hiện kiểm định
• Các giả thiết sẽ là:

H0 :  = 1
H1 :   1
Test of significance Confidence interval

approach approach
test stat 
$   * ˆ  t crit  SE ( ˆ )
SE ( $ )
05091
. 1  0.5091  2.086  0.2561
  1917
.
0.2561  (0.0251,1.0433)
Không bác bỏ H0 vì Vì giá trị “1” nằm trong vùng

test stat nằm trong vùng confidence interval,
“non-rejection” => không bác bỏ H0
Kiểm định các giả thiết khác
• Sử dụng cả 2 phương pháp tiếp cận: “test of significant “và “confidence

interval approach” cho các giả thiết sau:
H0 :  = 0
vs. H1 :   0
H0 :  = 2
vs. H1 :   2

Thay đổi mức ý nghĩa thống kê của kiểm định
• Thông thường chúng ta sử dụng mức ý nghĩa 5% cho kiểm định giả thiết
(ví dụ H0 :  = 1).
 Trong trường hợp mức ý nghĩa tiệm cận mức giới hạn cận biên
(marginal cases) chúng ta có thể nhận được câu trả lời khác hẳn nếu sử
dụng các mức ý nghĩa thống kê khác nhau.
 Và đây cũng là lý do tại sao phương pháp kiểm định thống kê “test of
significance approach” lại được ưa chuộng hơn phương pháp khoảng tin
cậy “confidence interval”.
• Ví dụ, nếu chúng ta sử dụng mức ý nghĩa thống kê là 10% , với phương
pháp “ý nghĩa thống kê” (test of significant) ta có:
$   *
test stat 
SE ( $ )
05091
. 1
  1917
.
0.2561
Điều duy nhất thay đổi là mức ý nghĩa thống kê so sánh (critical value)
Thay đổi mức ý nghĩa thống kê của kiểm định:
Vùng “bác bỏ” mới
f(x)
5% rejection region 5% rejection region
-1.725 +1.725

Thay đổi mức ý nghĩa thống kê của kiểm định: Kết luận
• t20;10% = 1.725. Test statistic nằm trong vùng “bác bỏ” (rejection
region). Chúng ta sẽ bác bỏ giả thiết H0.
• Phương pháp “khoảng tin cậy” thì chúng ta phải tính toán lại cả 2 giá
trị trên và dưới của khoảng tin cậy vì critical t-value đã thay đổi.
• Trong trường hợp “marginal cases”, kết luận cần đưa ra thận trọng (i.e.
reject hay not reject).
• Nếu bác bỏ giả thiết Null tại mức ý nghĩa 5%, chúng ta nói rằng kết
quả kiểm định có ý nghĩa thống kê (statistically significant).

Các sai lầm có thể mắc phải khi sử dụng kiểm định giả thiết
• Chúng ta thường loại bỏ H0 nếu “test statistic” có ý nghĩa thống kê tại mức
ý nghĩa cho trước is statistically significant at a chosen significance level.
• Có 02 loại sai lầm khi kiểm định thống kê thường mắc phải:
1. Bác bỏ H0 khi nó thật sự “đúng”. Trường hợp này gọi là sai lầm loại I
(type I error).
2. Không bác bỏ H0 trong khi nó thật sự là không đúng. Trường hợp này
được gọi là sai lầm loại II (type II error.)
Reality
H0 is true H0 is false
Significant Type I error 
Result of (reject H0) =
Test Insignificant Type II error
( do not  =
reject H0)
Đánh đổi giữa sai lầm loại I và II (Type I and Type II Errors)
• Xác suất của sai lầm loại 1 chính là , mức ý nghĩa thống kê mà chúng ta đã
chọn.
• Lưu ý rằng luôn có sự đánh đổi giữa sai lầm loại I và sai lầm loại 2. Điều này có
nghĩa rằng nếu chúng ta giảm mức ý nghĩa thống kê (ví dụ từ 5% xuống còn 1%)?
Thì chúng ta đã giảm cơ hội của việc mắc sai lầm loại 1 nhưng đồng thời chúng
ta cũng giảm xác suất loại bỏ giả thiết Null hay tăng xác suất của mắc sai lầm
loại II:
less likely
to falsely reject
Reduce size  more strict  reject null
of test criterion for hypothesis more likely to
rejection less often incorrectly not
reject
• Như vậy luôn có sự đánh đổi giữa sai lầm loại I và sai lầm loại II khi chúng ta
chọn mức thống kê nào đó. Cách duy nhất để có thể giảm khả năng mắc sai lầm
của cả hai loại là gia tăng kích thước của mẫu quan sát.
Kiểm định giả thiết sử dụng kết quả: The t-ratio
• Nhớ lại rằng công thức để tính t- test theo phương pháp kiểm định ý nghĩa
thống kê (test of significance approach) như sau:
$i   i*
test statistic 
SE $i 
• H0 : i = 0
H1 : i  0
Chẳng hạn nếu chúng ta kiểm định hệ số của tổng thể (the population
coefficient) là 0 với kiểm định 2 bên (two-sided) thì điều này tương đương
với kiểm định sử dụng t-ratio :
$i
Vì  i* = 0, test stat 
SE ( $i )
• Tỷ số của hệ số  với SE của chính nó được gọi là t-ratio hay t-statistic.

t-ratio: Ví dụ
• Giả dụ rằng chúng ta có các thông số ước lượng sau đây bao gồm sai số
chuẩn (standard errors) và t-ratios cho hệ số chặn (intercept) và hệ số độ
dốc tương ứng.
Coefficient 1.10 -4.40
SE 1.35 0.96
t-ratio 0.81 -4.63
So sánh kết quả t-ratio với tcrit với 15-3 = 12 d.f.

(2½% cho mỗi bên của 5% test) = 2.179 5%
= 3.055 1%
• Loại bỏ H0: 1 = 0? (No)

H0: 2 = 0? (Yes)

Kiểm định sử dụng t-ratio cho chúng ta biết điều gì?
• Nếu chúng ta bác bỏ H0, chúng ta nói rằng kết quả không có ý nghĩa.
• Nếu hệ số ước lượng không có ý nghĩa thì điều này có nghĩa rằng biến số x
có kiên quan không thể giải thích được các thay đổi trong biến số y.
• Các biến số mà kết quả kiểm định cho thấy không có ý nghĩa thống kê thường
được loại bỏ khỏi mô hình hồi quy.
• Trong thực hành, chúng ta thường giữ lại hệ số chặn (constant ) ngay cả khi
nó không có ý nghĩa thống kê. Điều gì sẽ xảy ra nếu mô hình không có hệ số
chặn (no intercept ):
yt

xt
Một ví dụ của việc sử dụng t-test để kiểm định các lý thuyết
trong tài chính
• Kiểm định cho sự hiện hữu và ý nghĩa của tỷ suất sinh lợi bất thường
(abnormal returns ) (“Jensen’s alpha” - Jensen, 1968).
• Mẫu dữ liệu: Tỷ suất sinh lợi hàng năm đối với các danh mục dầu tư của
115 mutual funds từ năm 1945-1964.
• Mô hình hồi quy: R jt  R ft   j   j ( Rmt  R ft )  u jt

với j = 1, …, 115
• Chúng ta sẽ kiểm định sự ý nghĩa của j.
• Giả thiết Null sẽ là H0: j = 0 .

Phân phối tần suất của t-ratios của Mutual Fund Alphas
(gross of transactions costs)
Source Jensen (1968). Reprinted with the permission of Blackwell publishers.

Frequency Distribution of t-ratios of Mutual Fund
Alphas (net of transactions costs)
Source Jensen (1968). Reprinted with the permission of Blackwell publishers.

Các Quỹ đầu tư có thể đánh bại được thị trường “Beat
the Market” hay không?
• Bây giờ chúng ta sẽ thực hiện một biến thể của Jensen’s test tại thị trường UK,
sử dụng tỷ suất sinh lợi hàng tháng của 76 quỹ đầu tư cổ phiếu. Số liệu từ
January 1979 – May 2000 (257 quan sát cho mỗi quỹ đầu tư). Thống kê mô tả
cho các quỹ đầu tư như sau:
Mean Minimum Maximum Median
TSSL hàng tháng, 1979-2000 1.0% 0.6% 1.4% 1.0%
S.D. TSSL (1979-2000) 5.1% 4.3% 6.9% 5.0%
• Mô hình hồi quy Jensen cho TSSL của các quỹ đầu tư UK, January 1979-May
2000
R jt  R ft   j   j ( Rmt  R ft )   jt

Các Quỹ đầu tư có thể đánh bại được thị trường “Beat the
Market” hay không? Kết quả hồi quy
Ước lượng Mean Minimum Maximum Median

 -0.02% -0.54% 0.33% -0.03%
 0.91 0.56 1.09 0.91
t-ratio on  -0.07 -2.44 3.11 -0.25
• Trong nghiên cứu thực tế sau khi tính trừ chi phí giao dịch gộp (gross of
transactions costs), kết quả cho thấy 9 quỹ đầu tư trong tổng số 76 quỹ đã
đạt TSSL vượt trội so với thị trường với hệ số alpha dương và có ý nghĩa
thống kê, trong khi đó có 7 quỹ có alpha âm và có ý nghĩa thống kê.

Kiểm định “Phản ứng thái quá” (The Overreaction
Hypothesis) và thị trường chứng khoán Hoa Kỳ
• Động lực nghiên cứu (Motivation)
DeBondt and Thaler (1985, 1987) đã cho thấy rằng những cổ phiếu có kết
quả tồi trong 3 đến 5 năm gần nhất có xu hướng đạt được thành quả vượt trội
so với những cổ phiếu có thành quả tốt trong cùng khoảng thời gian so sánh.
• Điều này đã được giải thích như thế nào?
1. Ảnh hưởng do quy mô của công ty (size effect)

DeBondt & Thaler không cho rằng đây là lời giải thích không đầy đủ, nhưng
Zarowin (1990) đã đưa biến Quy Mô (Size) vào mô hình và kết quả TTSl
vượt trội của “losers” đã giảm đáng kể.
2. TTSL đổi chiều phản ánh yêu cầu điều chỉnh về trạng thái cân bằng của
TTSL
Ball & Kothari (1989) tìm thấy rằng CAPM beta của “losers” cao hơn beta
của “winners”.

Kiểm định “Phản ứng thái quá” (The Overreaction Hypothesis)
và thị trường chứng khoán Hoa Kỳ
• Một kiểm định về “anomaly” khác: Hiệu ứng tháng giêng (the January
effect).
– Zarowin (1990) tìm thấy rằng 80% trong TTSL vượt trội của “Loser”
xảy ra vào tháng Giêng.

Kiểm định “Phản ứng thái quá” (The Overreaction
Hypothesis) và thị trường chứng khoán Việt Nam
• Tính toán TSSL vượt trội hàng tháng (monthly excess returns) cho tất cả
các cổ phiếu niêm yết trên thị trường chứng khoán trong 6, 12, 18 tháng
cho mỗi cổ phiếu i:,,
Uit = Rit - Rmt n = 6, 12 hay 18 tháng
• Tính toán TSSL bình quân cho mỗi cổ phiếu i trong 6 tháng đầu tiên, 12
hoặc 18 tháng:
1 n
Ri   U it
n t 1

Tạo lập danh mục (Portfolio Formation)
• Phân vị các cổ phiếu với TSSL bình quân từ cao nhất đến thấp nhất. Tạo 5
danh mục với TSSL của danh mục là bình quân gia quyền của các TSSL
cổ phiếu có trong danh mục như sau:
Portfolio 1: 20% của các công ty có TSSL cao nhất

Portfolio 2: 20% kế tiếp
Portfolio 5: 20% của các công ty có TSSL thấp nhất
• Sử dụng mẫu quan sát có cùng quãng thời gian n để theo dõi thành quả của
mỗi danh mục. Ví dụ sử dụng thời kỳ 1 năm đó để theo dõi thành quả của
danh mục được tạo lập từ 1 năm trước đó, tương tự cho danh mục ½ năm,
1 ½ năm.

Tạo lập danh mục (Portfolio Formation) và các thời kỳ theo dõi
thành quả danh mục (Portfolio Tracking Periods)
• Như vậy chiều dài quãng thời gian n được sử dụng để theo dõi các danh
mục là:
n = ½ , 1, hoặc 1 ½ năm.
• Nếu n = 1 năm:
Ước lượng danh mục i (Loser/Winner) trong năm 1
Theo dõi danh mục i (Loser/Winner) trong năm 2
Ước lượng danh mục i (Loser/Winner) trong năm 3
Theo dõi danh mục i (Loser/Winner) trong năm 4
• Vì vậy với tổng thời gian nghiên cứu là 6 năm trên TTCK Việt Nam thì
nếu n = ½ , chúng ta có 6 quan sát độc lập (non-overlapping) hay 6 thời kỳ
theo dõi (tracking periods)

Tính toán “Winner” và “Loser” Returns
• Tương tự, n = 1 năm ta sẽ có 3 thời kỳ theo dõi độc lập và n = 1,5 năm ta có
2 thời kỳ theo dõi độc lập.
• Tính toán TSSL bình quân của danh mục cho từng thời kỳ trong 6, 3 và 2 thời
kỳ tạo lập và theo dõi. Sử dụng công thức bình quân gia quyền cho TSSL của
mỗi cổ phiếu trong danh mục.
• Ký hiệu TSSL trung bình đối với “Winners” và “Losers” cho mỗi thời kỳ
trong suốt 6, 3 hoặc 2 thời kỳ : RW RpL
p
• Tính toán sự khác biệt trong TSSL giữa “Winners” và “Losers”

RDt = RpL - R pW
• Sau đó thực hiện hồi quy RDt = 1 + t (Test 1)
• Đánh giá mức độ ý nghĩa của  .

Cân nhắc bổ sung yếu tố rủi ro khác biệt giữa danh mục
“Winner” và danh mục “Loser”
• Vấn đề : mức ý nghĩa và dấu + của hằng số 1 có thể là do cổ phiếu

“loser” có khuynh hướng có TSSL cao hơn do có rủi ro cao hơn.
• Giải pháp: đưa sự khác biệt trong rủi ro giữa 2 danh mục “Winners” và
“Losers” vào phương trình hồi quy :
RDt = 2 + (Rmt-Rft) + t (Test 2)
với
Rmt TSSl của thị trường
Rft TSSl phi rủi ro (3 month government t-bill)

“Phản ứng thái quá” (Overreaction Effect) trên TTCK? Kết
quả hồi quy tương tự từ một nghiên cứu ở Anh
Example study: Clare and Thomas (1995)
Data: Monthly UK stock returns from January 1955 to 1990 on all firms
traded on the London Stock exchange.
Nguyễn Thị Hồng Nhâm - Khoa Tài Chính - ĐHKT 79

TPHCM
Kiểm định “hiệu ứng mùa vụ” đối với “phản ứng thái
quá” Testing for Seasonal Effects in Overreactions
• Câu hỏi nghiên cứu là danh mục “losers” có tạo TSSL cao hơn hẳn danh
mục “winners” tại một thời điểm đặc biệt nào đó trong năm?
• Để kiểm tra giả thiết này, ta tính TSSl như phần trước và thực hiện hồi quy
với biến Dummy cho 12 tháng trong năm:
12
RDt   i Mi  t
i 1

Kết luận
• Nghiên cứu trước đây cho thấy có hiệu ứng “overreactions” đối với TTSL
của các cổ phiếu trên TTCK các nước phát triển như US hay UK.
• “Losers” thường là các công ty có quy mô nhỏ cho nên ta có thể nói rằng
hiệu ứng “overreaction” ở UK là do tác động của quy mô doanh nghiệp
(size effect).
• Thiếu vắng các kiểm định những vi phạm của mô hình hồi quy (diagnostic
tests)?

THỰC HÀNH KIỂM ĐỊNH PHƯƠNG TRÌNH HỒI
QUY TUYẾN TÍNH ĐƠN BIẾN TRÊN EVIEWS 6.0
• NHẬP DỮ LIỆU VÀO EVIEWS

• KIỂM ĐỊNH HỒI QUY BẰNG EVIEWS

The Exact Significance Level or p-value


B2,3

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

B2,3

Uploaded by

Copyright:

Available Formats

Chương 2

Tổng quan về mô hình hồi quy tuyến tính cổ điển

Khoa Tài Chính - ĐHKT TPHCM 1

Phân tích hồi quy (regression analysis) là gì ?

Khoa Tài Chính - ĐHKT TPHCM 2

• Một vài những tên gọi khác cho các biến số y và x:

Khoa Tài Chính - ĐHKT TPHCM 3

Khoa Tài Chính - ĐHKT TPHCM 4

• Một vài ví dụ về loại mô hình hồi quy đơn biến:

– Đo lường mối quan hệ dài hạn giữa giá cổ phiếu và cổ tức.

– Xây dựng tỷ số phòng ngừa tối ưu (optimal hedge ratio).

Khoa Tài Chính - ĐHKT TPHCM 5

Year, t Excess return Excess return on market index

Khoa Tài Chính - ĐHKT TPHCM 6

Khoa Tài Chính - ĐHKT TPHCM 7

Khoa Tài Chính - ĐHKT TPHCM 8

- Có thể có sai sót trong đo lường (measurement errors ) biến yt mà những

Khoa Tài Chính - ĐHKT TPHCM 9

Khoa Tài Chính - ĐHKT TPHCM 10

• Các ký hiệu như sau:

Khoa Tài Chính - ĐHKT TPHCM 11

Khoa Tài Chính - ĐHKT TPHCM 12

• Phương trình ước lượng ˆ t  ˆ  ˆxt

• Từ (1), ta có:  ( y t  ˆ  ˆxt )  0  y t  Tˆ  ˆ  xt  0

• Vì vậy ta có thể viết lại như sau:

• Từ (3), ˆ  y  ˆx (5)

Khoa Tài Chính - ĐHKT TPHCM 14

• Giải phương trình cho $ :

ˆ (Tx 2   xt2 )  Tyx   xt yt

Khoa Tài Chính - ĐHKT TPHCM 16

Khoa Tài Chính - ĐHKT TPHCM 17

Khoa Tài Chính - ĐHKT TPHCM 18

• Hàm phân phối tổng thể - PRF có dạng:

Khoa Tài Chính - ĐHKT TPHCM 19

• Hàm phân phối mẫu quan sát - SRF có dạng: yˆ t  ˆ  ˆxt

Khoa Tài Chính - ĐHKT TPHCM 20

Khoa Tài Chính - ĐHKT TPHCM 23

Khoa Tài Chính - ĐHKT TPHCM 25

• Định đề Gauss-Markov (Gauss-Markov theorem): Nếu các giả định từ A1

• Tính nhất quán (Consistent)

• Tính nhất quán (Consistency) ngụ ý rằng:

Khoa Tài Chính - ĐHKT TPHCM 27

• Không thiên lệch (unbiased)

• Tính hiệu quả (Efficiency)

Khoa Tài Chính - ĐHKT TPHCM 30

• Phương sai của phần dư ut được tính toán như sau:

RSS) và T kích thước của mẫu quan sát (sample size).

Một vài lưu ý đối với Standard Error Estimators

Đồ thị minh họa điều gì sẽ xảy ra nếu 

Khoa Tài Chính - ĐHKT TPHCM 33

Khoa Tài Chính - ĐHKT TPHCM 34

 x y  830102, T  22, x  416.5, y  86.65,

 x  3919654, RSS  130.6

$  86.65  035 .  5912

Khoa Tài Chính - ĐHKT TPHCM 35

Khoa Tài Chính - ĐHKT TPHCM 36

Khoa Tài Chính - ĐHKT TPHCM 37

Khoa Tài Chính - ĐHKT TPHCM 38

• Có 02 cách để thực hiện kiểm định giả thiết:

Khoa Tài Chính - ĐHKT TPHCM 39

• Chúng ta giả định rằng ut  N(0,2)

Khoa Tài Chính - ĐHKT TPHCM 40

• Tuy nhiên var() và var() là chưa biết, do vậy

Khoa Tài Chính - ĐHKT TPHCM 41