You are on page 1of 16

基于中国市场实现五因素模型

经济与管理学院

金融工程一班

胡杨璘(2016302010242)

鲁梦洁(2016302010191)
基于中国市场实现五因素模型

摘要:以 2015 年 Fama 和 French 提出的五因素模型为基础,本文以 2008 年 10 月至 2018


年 9 月上证 180 指数作为市场组合,其中个股作为样本,探究五因素模型对上证指数 180 的
解释能力,检验五因素模型在中国股票市场的表现。发现(1)观测样本中规模效应、价值
效应显著,盈利能力及投资风格效应部分显著;(2)五因素模型在中国市场下拟合效果非
常好,不具有多重共线性,比三因素模型效果更好;(3)截距显著不为 0,投资组合超额收
益率不能完全归因于五个因子。
关键词:五因素模型;构造因子;回归分析

一、概述

1、三因素模型

1993 年,Fama 和 French 在研究股票超额收益率时发现,小公司股票、以

及具有较高账面市值比的股票的历史平均收益率一般会高于 CAPM 模型所预测

的收益率。在原来 CAPM 模型上保留了市场因子 RMRF,加入了规模效应因子

SMB 和价值效应因子 HML。

2、五因素模型

2015 年,Fama 和 French 基于股利贴现模型(DDM),在三因子模型的基础上

加入了盈利因子 RMW 和投资因子 CMA,构成五因子模型,用于更好地描述横

截面上股票组合的期望收益率。如果一只公司股票拥有较低的总市值 M 或者较

高的账面市值比 B/M,那么其期望收益率 r 就会较高。

3、方法

通过月度横截面数据,控制单一变量,构造受到因子差别影响的资产组

合,计算出每个因子在 t 时期的数值。通过样本点,对不同的资产组合的市值

加权超额收益率进行回归,进行描述性统计与数据分析,观测每个因子对资产

组合超额收益率的贡献程度,分析建立模型的拟合优度。
4、数据

以上证指数 180 成分股及市场指数本身月度数据为样本研究对象,以 2008

年 10 月至 2018 年 9 月共 120 个月作为样本区间。使用同业拆借一月期利率作

为无风险利率 rf。从 wind 数据库以及 CSMAR 数据库获取个股的财务分析数

据:总市值、投资收益率、账面市值比、个股收益率等。

二、方法

1、建立回归模型

rit  rft  ai  bi(rMt  rft )  siSMBt  hi HMLt  ri RMWt  ciCMAt  eit

其中 rit 是投资组合 i 在第 t 期的收益率,rft 是无风险利率,rMt 是市值加权平

均的市场组合收益率,rMt-rft 反映市场风险溢价。SMBt 是规模因子,计算流通市

值为指标在 t 期小市值与大市值股票组合的收益率之差。HMLt 是价值因子,账

面市值比为指标计算高账面市值比与低账面市值比股票组合的收益率之差。

RMWt 是盈利因子,以权益报酬率为指标计算权益报酬率高与权益报酬率低的

股票组合收益率之差。CMAt 是投资因子,以总资产变化率为指标计算投资风格

保守与投资风格激进的股票组合收益率之差。eit 是残差。

2、构建因子组合

本文对月度数据数值进行排列,通过分位点进行分组组合。具体组合思路

如下:

参照 2015 年 Fama 和 French 五因子模型分组中的 2×3 的方法。

① 按股票市值的中位数把全体股票分成小规模(S)和大规模(B)两组;

② 其次,按账面市值比的 30%和 70%分位点把所有成分股分成高(H)、中

(M)、低(L)三组;
③ 将两个指标交叉,可把全体股票分成 SH、SM、SL、BH、BM、BL 六

个组合;

④ 分别以权益报酬率和总资产变动率代替账面市值比,重复上述步骤。

其中 R 表示盈利能力稳健,M 表示居中的盈利能力,W 表示盈利能力

较弱,C 表示投资风格保守,M 表示居中的投资风格,A 表示投资风

格激进。

⑤ 结果把 180 只股票分成 SH、SM、SL、BH、BM、BL、SR、SM、SW、

BR、BM、BW、SC、SM、SA、BC、BM、BA,18 个投资组合。

构造十八个资产组合,2*3*3:

规模(总市值) S B

价值(B/M) H M L

盈利(OP) W M R

投资(INV) C M A

接下来以每只股票流通市值占所在组合总流通市值的比例为个股权重,计

算上述各组合市值加权月收益率,利用不同组合收益率之差构造四个因子。R

表示组合市值加权平均收益率,每一期因子计算如下:

R SH  R SM  R SL R BH  R BM  R BL
R SMB ,P / B  
3 3
R SR  R SM  R SW R BR  R BM  R BW
R SMB ,OP  
3 3
R SC  R SM  R SA R BC  R BM  R BA
R SMB ,INV  
3 3
R SMB ,P / B  R SMB ,OP  R SMB ,INV
R SMB 
3
R HS  R HB R LS  R LB
R HML  
2 2

R RS  R RB RWS  RWB
R RMW  
2 2

RCS  RCB R AS  R AB
RCMA  
2 2

3、线性回归实证检验

(1)建立线性回归模型,利用十八组每组共 12*10 个数据样本分别对十八

个不同类型的投资组合进行回归。

(2)分析思路:我们假设五因素模型揭示了所有风险因子,那么截距项 a

对于股票投资组合 i 来说应该为零,根据系数估计以及 t 检验可以分析每一个因

子对资产组合超额收益率的解释程度,决定是否拒绝零假设。如果回归模型中

截距项为 0,则说明五因素模型在中国证券市场是有效的,投资组合的超额收

益率能被市场因子、规模因子、价值因子、盈利因子、投资因子全部解释,进

一步说明市场上存在着规模效应、价值效应、盈利效应、投资效应。

(3)数据分析:通过统计软件 R 进行数据处理,将十八组回归结果汇

总,横向比较每一组因子系数显著性以及纵向比较十八组不同类型的被解释变

量,在相同因子作用下的表现。同时,在十八个组合中纵向比较规模因子的表

现,横向比较另外三个因子的表现。另外,我们需要判断模型是否具有共线

性,利用 R 语言中 vif()、step()函数,查找是否存在冗余因子,若存在,去除冗

余因子,模型应当仍然能够很好地解释被解释变量。
三、数据

1、样本数据选取

(1)数据来源

本文使用的数据库是 wind 数据库以及 CSMAR 数据库。我们从 wind 数据库

中股票栏中的财务报表的子栏目下载 Excel 格式获取总资产同比增长率、ROE

季度数据。从 CSMAR 中自定义查询中股票栏中的行情栏目以 EXCEL 形式下载

指数月回报率,个股月度收益率以及总市值,从财务分析栏目中下载账面市值

比。无风险利率参考 SHIBOR 利率:(http://www.shibor.org/shibor/web/html/)。

(2)研究对象

市场组合:SSE180(000010)

个股:SSE180 中的成分股

市场组合因子:RMRF 因子代表着市场超额收益率,用所有样本股票的以

流通市值为权重的加权收益率减去无风险收益率计算得到,直接采用数据库获

得的数据。

规模效应因子:用各公司流通市值 MV 描述。

价值效应因子:用公司资产负债表账面价值与流通市值比率 P/B 描述。

盈利效应:用盈利指标总利润与所有者权益比率 ROE 描述。

投资效应:用资产负债表中总资产的变动描述。

(3)样本区间

对 2008.10-2018.09,10 年,120 个月的数据进行描述统计和回归分析。

(4)数据选择说明

本文的无风险利率以一月期 Shibor 上海银行间同业拆借利率为参照基准,


而月度个股收益率采用数据库中的考虑现金红利再投资的月度收益率,个股市

值选取的是月度流通市值。选取判断上市公司盈利能力的一项重要指标,净资

产收益率,作为盈利因子。另外,所有上市公司的财务数据来自合并后报表。

2、数据处理

时间统一:我们所需要用到的账面市值比、总资产等在上市公司财务报表

的季度报中选取,我们的研究对象是月度数据,直接使用每季度最后一个月数

据进行月度填充。

单位统一:数据主要涉及到比率以及数额,数额统一以元为单位。比率统

一去除百分号以小数表示。这样可以避免在检验中截距项的值偏离零值较大。

异常数据:预先去除异常零值数据。为消除新上市股票价格异常行为对结

果的影响,构造投资组合时,剔除了 ST 股票,即那些财务状况或者其他状况出

现异常的上市公司股票,单日涨跌幅被限制在 5%的范围内。

本文数据处理主要采用的软件为 R、EXCEL 等统计软件。

四、结果展示

1、系数估计及拟合优度

(1)三因素模型:

表 1-1
表 1-1 表示三因素模型拟合中,SL\SM\SH\BL\BM\BH 六个投资组合的截

距以及市场因子、规模因子、价值因子的系数估计。

(2)五因素模型:

表 1-2

表 1-2 表示五因素模型拟合中十八个资产组合的截距以及市场因子、规模

因子、价值因子、盈利因子以及投资因子的系数估计。

(3)拟合优度对比(R^2)

表 1-3

组合 SL SM1 SH SW SM2 SR SC SM3 SA


五因素 0.944696 0.945876 0.946986 0.960541 0.944424 0.933763 0.955264 0.964045 0.922589
三因素 0.94871 0.938572 0.927004
组合 BL BM1 BH BW BM2 BR BC BM3 BA
五因素 0.928186 0.94945 0.941568 0.910108 0.941536 0.938862 0.909905 0.947019 0.967004
三因素 0.915251 0.948496 0.94172
表 1-3 显示每一组投资组合的拟合优度,发现三因素模型与五因素模型中

相同类型的投资组合 SL\SM\SH\BL\BM\BH 的拟合,五因素模型的拟合优度

比三因素模型拟合优度略高,解释性更强。而其余的投资组合,五因素模型的

解释程度仍然高达 90%。综合来看,五因素模型的拟合效果较好。

2、五因素模型系数估计描述性统计

表 2-1

表 2-1 显示的是十八组投资组合的截距以及系数的 t 值,将其绝对值与 1.96

进行比较,判断系数是否显著。结合表 1-2 比较系数的正负及大小。在技术上,

将表 1-2 生成图 1-1,观察比较更为直观。


图 1-1

图 1-1 描述的是五因素模型截距及五个因子的系数在不同投资组合的表现。

组合间进行系数正负及大小对比,并分析如下:

(1)截距项

截距项 a 在十八组中四组不显著,无法拒绝原假设的情况下,说明模型比

较好的解释了投资组合的超额收益率。而大部分组合表现显著,拒绝原假设截

距为零。说明五因素模型不能完全解释中国股票市场上证 180 指数的收益率,

还存在我们没有考虑到的其他因素影响。

(2)市场因子

市场因子 RMRF 的回归系数在所有投资组合中显著,全部为正,且几乎都

接近于 1,作为市场指数组合的成分股投资组合,系数表现符合预期。与市场

组合受到的波动保持正向一致。

(3)规模因子

规模因子 SMB 的回归系数几乎在所有投资组合中都在 5%的概率水平下显


著,拒绝为零的原假设,说明在我国的上证指数 180 中,规模因子 SMB 是显著

的;规模因子 SMB 的回归系数在后 50%大规模投资组合中,全部为负,在前

50%小规模投资组合中,全部为正。

(4)价值因子

不显著典型解释:价值因子 HML 的回归系数在 18 个投资组合中有 8 个投

资组合 SM1\SM3\SA\BM1\BH\BC\BM3 不显著,典型地在中间 30%-70%账面

市值比的投资组合中不显著,价值因子 HML 对其超额收益率的影响不显著。

以 SL 组合为例,小规模低账面市值比组合的 HML 系数( - 0.562 , t =

- 10.046 )。对于高账面市值比的投资组合系数显著的为正,低账面市值比的投

资组合系数显著的为负,符合我们的预期。价值因子在前 30%低账面市值比投

资组合中与投资组合的超额收益率的系数显著为比较大的负值,说明它们之间

有较强的负相关关系。在 30%-70%账面市值比投资组合中与投资组合的超额收

益率的系数不显著,说明它们之间的相关关系较弱。在后 30%高账面市值比投

资组合中与投资组合的超额收益率的系数显著为正,说明它们之间有较强的相

关关系。

观察投资风格保守、激进的投资组合的价值因子都为不显著或接近零值,

我们无法确定投资风格保守、高账面市值比的成熟型企业组合的收益率表现。

(5)盈利因子

不显著典型解释:盈利因子 RMW 的回归系数在 18 个投资组合中有 7 个投

资组合不显著,在中间 30%-70%账面市值比以及中等 30%-70%投资偏好程度的

投资组合中不显著,盈利因子 RMW 对它们的超额收益率的影响不显著。

以 SL 组合为例,小规模低账面市值比组合的 RMW 系数( 0.128 ,t =


1.83 )。对于高盈利水平的投资组合系数显著的为正,低盈利水平的投资组合系

数显著的为负,符合我们的预期。在 30%-70%中等盈利水平的投资组合中与投

资组合的超额收益率的系数显著为负但都接近 0,说明它们之间的相关关系较

弱,呈负相关。

(6)投资因子

不显著典型解释:投资因子 CMA 的回归系数在 18 个投资组合中有 8 个投

资组合不显著,在小规模组合中,中间 30%-70%账面市值比、中等 30%-70%盈

利水平以及中等 30%-70%投资偏好程度的投资组合中不显著,投资因子 CMA

对盈利水平低的投资组合影响不显著。

以 SL 组合为例,小规模低账面市值比组合的 CMA 系数( 0.018 , t = 0.31 )。

对于投资保守型的投资组合系数显著的为正,投资激进型的投资组合系数显著

的为负,符合我们的预期。

观察高账面市值比的投资组合的投资因子的系数显著为负或接近零值,我

们认为高账面市值比、投资风格保守对于成熟型企业的收益率贡献程度有一定

的相关性。

3、对各组平均超额收益率进行比较

表 3-1

SL SM1 SH SW SM2 SR SC SM3 SA


收益率 -0.006661629 -0.022328737 -0.02833069 -0.021855942 -0.023331174 -0.013889693 -0.023185352 -0.021903247 -0.013047123
BL BM1 BH BW BM2 BR BC BM3 BA
收益率 -0.005265486 -0.023282383 -0.026633643 -0.024171075 -0.024746124 -0.016079448 -0.025953636 -0.023905019 -0.012862172

表 3-1 显示 2*3*3 个分组,以流通市值为权重的投资组合超额加权平均收益

率。通过观察可以看出,18 个投资组合的平均月超额收益率都是负值,最大值

为- 0.66%(BR 组合),最小值为- 2.8%(SH 组合)。


(1)纵向比较:

在九组纵向比较中,七组同一效应类别,小规模公司的平均月超额收益率

比规模更大的公司平均月超额收益率更大。较为明显的是,在相同高账面市值

比类别中,小规模公司的平均月超额收益率比规模更大的公司平均月超额收益

率更大,差别很大。与我们所认为的小规模公司组合收益率更高保持一致。

(2)横向比较,控制相同规模类别。

①在前 50%小规模公司股票中,随着账面市值比的升高,超额收益率下

降;随着盈利水平的增强,超额收益率增加,存在一定盈利效应;随着投资的

增加,超额加权平均月收益率基本上呈现递增趋势,存在一定的投资效应。

②在后 50%大规模公司股票中,随着账面市值比的升高,超额收益率下

降;盈利水平的作用无法判断;随着投资的递增,超额加权平均月收益率基本

上呈现递增趋势。一定程度上与小规模呈现的变化趋势是一致的。

保守型投资组合的单位风险所带来的超额收益与激进型投资组合的单位风

险所带来的超额收益之间的大小不确定。

4、回归分析

因为回归结果篇幅较长,此处将着重给出 BL\BA 两个因变量股票组合的回

归结果,其他组合的结果在文章最后以附件形式展示。
BL:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.005534 0.002692 2.056 0.0421 *
y[, 19] 0.905011 0.030114 30.053 < 2e-16 ***
y[, 20] -0.284759 0.053578 -5.315 5.36e-07 ***
y[, 21] -0.576477 0.059551 -9.680 < 2e-16 ***
y[, 22] -0.320798 0.074370 -4.314 3.43e-05 ***
y[, 23] -0.282910 0.062607 -4.519 1.53e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.02421 on 114 degrees of freedom


Multiple R-squared: 0.9282, Adjusted R-squared: 0.925
F-statistic: 294.7 on 5 and 114 DF, p-value: < 2.2e-16

BA:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.010206 0.002042 4.999 2.10e-06 ***
y[, 19] 1.042826 0.022840 45.658 < 2e-16 ***
y[, 20] -0.319351 0.040636 -7.859 2.38e-12 ***
y[, 21] -0.022490 0.045166 -0.498 0.619484
y[, 22] -0.209823 0.056405 -3.720 0.000311 ***
y[, 23] -0.619159 0.047484 -13.039 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.01836 on 114 degrees of freedom


Multiple R-squared: 0.967, Adjusted R-squared: 0.9656
F-statistic: 668.2 on 5 and 114 DF, p-value: < 2.2e-16

从结果第十组来看,对于组合 BL,大规模低账面市值比的资产组合,模型

的拟合优度达到了 92.82%,拟合效果非常好,系数全都显著不为零,但截距也

拒绝了零假设,模型存在一定的偏差和其他因素,但我们认为被解释变量投资

组合的超额收益率能够较好地被五因素模型解释。

从结果第十八组来看,对于组合 BA,大规模投资激进的资产组合,模型的

拟合优度达到了 96.7%,拟合优度非常高,系数显著不为零,其中第三个因子

价值因子不显著。截距显著不为零,虽然模型不能完全很好地解释组合的超额

收益率,但五因素模型的表现比三因素模型的表现要好很多。

4、多重共线性的检验

经典线性回归模型的一个假设是自变量之间不存在线性关系。如果自变量

之间存在一个或者更多这样的关系,就称之为多重共线性。方差膨胀因子 VIF
是指回归系数的估计量由于自变量共线性使得方差增加的一个相对度量。一般

建议,如 VIF>10,表明模型中有很强的共线性问题。

我们通过方差膨胀因子进行多重共线性的判断发现各系数 VIF 值均在 1 左

右,模型不具有明显的共线性。

(附件说明:压缩包中含有数据整理及回归分析代码,代码最后输出十八组

投资组合回归结果以及各组系数比较结果。)

五、总结

五因素模型比三因素模型拟合效果更好,大部分投资组合类型的拟合程度

达到 90%以上。

根据回归结果,投资组合超额收益率受到市场因子正向影响,且敏感性程

度接近于 1;规模因子系数都显著,说明了规模效应的存在;账面市值比因子显

著性较强,而盈利能力和投资风格因子在特定类型的投资组合中不能拒绝均值

为 0 的原假设。

经检验,大部分回归模型中截距项零假设无法拒绝,无法说明投资组合的

超额收益率能被市场因子、规模因子、价值因子、盈利因子、投资因子全部解

释。但模型拟合优度非常好且不具有多重共线性,我们认为五因素模型在中国

证券市场是有效的,进一步说明市场上存在着规模效应、价值效应、盈利效

应、投资效应。

通过不同的投资组合类型的超额收益率比较,验证了小规模、账面市值比

较高、盈利能力强、投资偏好保守组合的公司收益率更高。对于我们要检验的

因子,相应的前 30%以及后 30%的组合表现显著,且影响方向符合我们的预

期。
参考文献

[1] 李志冰、杨光艺、冯永昌、景亮 (北京大学光华管理学院,北京 100871; 北

京量邦信息科技股份有限公司,北京 100086),2017,
《Fama-French 五因

子模型在中国股票市场的实证检验》,《金融研究》第 6 期。

[2] 张青 (内蒙古大学),2017,
《沪深 A 股主板市场 Fama-French 五因子模型

实证研究》,金融学硕士学位论文。

[3] Fama, E. F., & French, K. R. (1993). Common Risk Factors in the Returns on

Stocks and Bonds》,JF.

[4] Fama, E. F., & French, K. R. (2015). A five-factor asset pricing model. Journal of

Financial Economics, 116(1), 1–22.

You might also like