Professional Documents
Culture Documents
基于LVQ对股指期货交易信息分析的股票指数走势识别研究 PDF
基于LVQ对股指期货交易信息分析的股票指数走势识别研究 PDF
专 业 学 位 研 究 生 学 位 论 文
基于 LVQ 对股指期货交易信息分析的
论 文题目( 中文 ) 股票指数走势识别研究
The Research on Analysis of Stock Index Futures
论文题目(外文) Transaction Information to Identify Stock Index
Trend on LVQ Neural Network
研 究 生 姓 名 徐 虹
学 位 类 别 应用统计
专 业 学 位 领 域
学 位 级 别 硕 士
校外导师单位、姓名
论 文 提 交 日 期 2016 年 5 月
论 文 答 辩 日 期 2016 年 5 月
学 位 授 予 日 期
校址:甘肃省兰州市
原 创 性 声 明
本人郑重声明:本人所呈交的学位论文,是在导师的指导下独立进行研究所
取得的成果。学位论文中凡引用他人已经发表或未发表的成果、数据、观点等,
均已明确注明出处。除文中已经注明引用的内容外,不包含任何其他个人或集体
已经发表或撰写过的科研成果。对本文的研究成果做出重要贡献的个人和集体,
均已在文中以明确方式标明。
本声明的法律责任由本人承担。
论文作者签名: 日 期:
关于学位论文使用授权的声明
本人在导师指导下所完成的论文及相关的职务作品,知识产权归属兰州大学。
本人完全了解兰州大学有关保存、使用学位论文的规定,同意学校保存或向国家
有关部门或机构送交论文的纸质版和电子版,允许论文被查阅和借阅;本人授权
兰州大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采
用任何复制手段保存和汇编本学位论文。本人离校后发表、使用学位论文或与该
论文直接相关的学术论文或成果时,第一署名单位仍然为兰州大学。
本学位论文研究内容:
□可以公开
□不宜公开,已在学位办公室办理保密申请,解密后适用本授权书。
(请在以上选项内选择其中一项打“√”)
论文作者签名: 导师签名:
日 期: 日 期:
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
摘 要
随着股指期货市场投资者增多,交易量持续放大,它对股票市场的影响
日益加深。本文旨在运用期货市场的技术分析方法,根据 LVQ 神经网络的
分类模式,将沪深 300 指数期货(IF)和中证 500 股指期货(IC)的日行情
信息作为输入向量,股票指数未来趋势作为输出向量,以技术分析的角度筛
选股指期货日行情信息中对股票指数走势造成影响的变量。通过对输入向量
以价格类别或成交量、交易量类别等形式组合,选择不同时间上市交易的股
指期货合约,研究期货市场交易信息中会对股票指数未来走势产生重要影响
的因素,并且发现期货市场的量、价类别因素交互影响的关系。总体上,由
于上市时间、交割到期日的差别,不同种类合约对价和量类别因素的敏感程
度是不同的。具体而言,IC 期货合约的各个连续指数和 IF 个别季月合约的
量类别变量识别股指上升正确率高,IF 当月连续和下季连续的量类别因素对
股指下降识别正确率高;IF 下月连续的价类别和量类别因素能分别识别股指
上升和下降;但是 IF 隔季连续合约的价、量类别因素均对股指敏感性低。
投资者可以根据当前期货市场交易信息的具体情况,依据研究结果,对股票市
场走势的进行判断,以辅助投资决策。
I
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
Abstract
With the stock index futures market investors increasing and trading volume enlarging, its
impact on the stock market becomes more deepen. In this thesis, according to the technical
analys is method of futures market and classification model of LVQ neural network, we select the
Shanghai and Shenzhen 300 Index Futures (IF) and the CSI 500 Stock Index Futures (IC) day
market information as input vector and the stock index future trend as the output vector. In the
view of technical analysis, the variables that affect the trend of stock index in stock index futures
day market information are selected. Then the stock index futures contract is classified by "time",
the thesis studies the influence of the "price", "quantity" and "time" of the futures market on the
future trend of the stock index. Through the input vectors are in the form of price category or
volume, trading volume and other forms of combination, then we choose stock index futures
contracts with different time of listing, which could help study the influence of the "price",
"quantity" and "time" of the futures market on the future trend of the stock index. We will discover
the trend of the stock index by the interaction of the quantity and price category of the futures
market. Overall the sensitivity of the price and quantity category is different. Specifically, IC
futures contracts for the various continuous index and IF quarter month futures contract quantity
category variable identify index rosing correct rate high, IF continuous and continuous next season,
the amount of categories of factors on the stock index fail to identify the correct rate of high, IF
next month for the continuous price category and the amount of categories of factors that can
identify the stock index rose or fell. However, the price and quantity category of IF futures
continuous contracts are no sensitive to the trend of stock index. The above results can help
investors to judge the trend of the stock market.
Keywords:LVQ, Price and Volume Analysis, IF, IC, Classification and recognition
II
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
目 录
摘 要 ................................................................................................. I
Abstract .............................................................................................. II
绪 论 .................................................................................................. 1
第一章 股票价格指数期货基本概论................................................ 4
1.1 股指期货概述 .................................................. 4
第三章 实证分析...............................................................................10
3.1 期指市场现状 ................................................. 10
第四章 结论及展望...........................................................................47
参考文献............................................................................................48
致 谢............................................................................................49
IV
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
绪 论
回顾金融市场发展的历史,风险和利益总是相生相伴。投资者贪图利益的时
候,情绪过度亢奋导致市场的非理性上涨。极端的上涨过后,随之而来的便是不
可控制的下跌。因此,人们在追逐利益的同时,也要设立交易规范,创造多种避
险工具,以防范金融风暴所带来的损失。市场风险又称系统性风险,会给市场上
所有的公司、企业造成经营受创,股价下跌。市场风险是不能依靠分散投资而抵
消的,但是,金融衍生品的出现,使投资者可以通过交易远期合约、期货合约、
互换合约、期权合约等一系列衍生品来抵消的市场风险。
衍生品本质特征--以某种资产为标的,因此经常会出现期货价格和现货价格
在两个市场背离的现象,此外衍生品交易会带来的巨大杠杆效应和双向买卖机制,
在为套保者,套利者和投机者带来巨大经济利益的同时,也给他们乃至整个金融
市场交易系统带来了巨大的风险隐患。从 20 世纪 90 年代的巴林银行倒闭事件,
到 2008 年的由美国次贷危机而引发的全球金融海啸,使人们对金融创新和衍生
品忧心忡忡。
2015 年中国股市上演的过山车行情仍然历历在目,上证综指在 17 个交易日
内就暴跌 32%,千股跌停和千股停牌潮频频出现,历经 7 年熊市的中国股市终于
迎来快速上涨行情后,又在不到一年的时间重回低谷。尽管存在市场估值要求修
复的内在原因,但是股市本身的上涨速度过快,使得很多投资者在面对突如其来
的下跌时措手不及。获利盘跌回上涨前的价格,各类杠杆资金被叫停或是加速离
场,市场流动性几近枯竭。尤其此阶段期现货市场出现了交互下跌的现象,期货
市场平缓现货市场价格波动的作用也未得到体现。因此,有人便将 2015 年股市
异常波动的元凶指向了股指期货市场。这种观点是不合理的,股票市场的运行不
会被期货市场所左右,理论上讲,期货价格围绕现货价格上下波动,因此可将股
指市场看作股票市场的外延,股票市场仍然起主导作用。对于股市出现崩盘式下
跌,股指期货的作用只能是减缓而非阻止,投资者必须认清这一点。
流动性充裕、改革红利预期、居民资产配置调整是造成非理性行情的合理原
因。但决不能忽视我国股市市场交易者不成熟,市场监管制度不完善等问题。股
指期货被投资者当作是对冲风险和获取价外利润的工具,同时股指期货市场的名
义成交额大幅领先股票市场,因此期货市场上交易价格和成交量的变化也会影响
投资者对股票市场走势的判断。
1987 年美国股市暴跌,股灾过后,莫顿·米勒(Merton Miller)带领工作小
1
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
组,进行了细致地考察,参考了大量的数据,证明造成股市“黑色星期一”的原因
与股指期货无根本联系[1]。虽然日经 225 股指期货是全球金融衍生品市场重要的
交易产品之一,但是日经 225 股指期货前期发展阶段也同样饱受质疑。上市初期,
由于 90 年代经济泡沫破裂,日本股市大萧条,股价急速下跌,人们将日经 225
股指期货视作股市暴跌的元凶。一时间所有的言论矛头直指日经 225 股指期货,
迫于舆论的压力和国内立足的需要,大阪交易所只好控制期货交易,但仍然没有
改变股票市场指数大幅下跌的情形,而且错失了参与全球金融衍生品竞争的良好
契机,使其在相当长的时间内处于不利地位,期货市场的正常交易和运行受到了
不该有的限制,不仅妨碍了股指期货交易的扩展和繁荣,也阻碍了日本金融市场
的长远发展[2]。我国与日本同属亚洲国家,在竞争中寻求发展和合作,作为新兴
发展国家,我国应借鉴日经 225 股指期货的经验和教训。
此次股灾中,普通交易者的心理风险表现的非常明显。普通的交易者往往不
具备全面的专业知识,股指期货是对未来股价水平的理性预期,股指期货通过价
格发现机制形成远期价格,在一定程度上可以为普通投资者对未来股票市场的走
势提供一定的判断依据,当对市场走势有了明确的判断后,投资者的才不会进行
盲目交易,市场恐慌情绪得到减轻,因此股指期货对稳定市场情绪具有一定的作
用。复杂的技术分析和预测模型是普通投资者的软肋,如何用简单迅捷的方式获
得当前市场信息的隐含内容,发现股指期货交易中隐含的股票市场走势趋向,是
本文的研究目的。
“价、量、时、空”是做技术分析的重要因素。价格、成交量、时间、价
格变化空间等因素交互作用,造成股票价格的波动起伏和股市走势的变幻莫测。
由此及彼,股指期货交易的信息数据同样包含了大量的“价、量、时、空”信息,
股指期货合约的开盘价、最高价、最低价、收盘价、成交量、成交额、成交笔数、
持仓量、价差都是可供交易者分析的重要依据。理论上,股指期货市场上的价格、
成交量、合约时间等类似于“价、量、时、空”的信息也可作为分析技术分析的
依据。本文以学习向量化(LVQ)神经网络模型为识别工具,将股指期货合约的
开盘、最高、最低、收盘等价格,成交量、成交额、成交笔数、持仓量及其均线、
价差及其均线作为输入向量,股票市场指数的涨跌作为输出向量,通过对输入向
量的组合和增减,找到对股票市场走势影响突出的“价”因素、“量”因素、“时”
因素、“空”因素,使其实现通过期货市场的技术分析,可以获得对股票市场走
势的辅助判断依据。
本文的创新之处共有三点:第一、模型的选择。将 LVQ 神经网络分类模型
应用于股指期货对股票市场的走势影响,是鲜少有人涉足的研究领域。利用 LVQ
2
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
神经网络不需要对输入向量过多处理的条件,使输入的数据保持了原有的特征,
更容易发现输入向量间的相互作用关系。第二、数据的分类比较方式。一方面,
在时间上分类比较,股指期货合约由于其到期交割的特征,使其交易数据信息并
非连续存在。而同时上市的 4 类合约也会对现货市场的走势造成交互影响。因此,
本文在选择数据分类的方式不仅考虑到期货合约指数的连续性,也对已经交割的
合约按月份进行了整理,观察季月合约随时间的流逝,从隔季转变成下季,下月,
当月期间,对当时现货市场走势的影响。另一方面,在合约种类选择上,既有上
市时间长,交易成熟稳定的沪深 300 指数期货,也有新近上市,处于逐步探索中
的中证 500 指数期货。两种合约全面覆盖了大、中、小市值的企业和公司。第三、
技术分析的演化。以往的研究中,技术分析只应用在股票市场走势的分析中,但
同样具备“价、量、时、空”因素的股指期货也有使用技术分析的条件。本文通
过对输入向量的筛选,发现不同时间段期货市场影响股票市场的主导条件,为期
货市场进一步的技术分析奠定了基础。
3
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
第一章 股票价格指数期货基本概论
1.1 股指期货概述
股票价格指数的编制是依据一定的标准选取有代表性的样本股票,并赋予这
组股票不同的权重,将其价格进行加权平均,最后进行修正而得到的价格指数。
随着编制方法和成分股调整规则的日趋完善,股票价格指数基本上能代表整个股
票市场所有股票价格变动的趋势和幅度。将股票价格指数作为期货合约的标的物,
通过交易这种类型的期货,便可间接的对股票指数进行买卖,实现对整个股票市
场的价格或趋势的把握。具有代表性的股票指数的样本股通常包含众多的行业和
公司股票,投资者若想通过完全复制投资组合的方式进行指数投资,难度较大。
通过交易股指期货,使买卖股票指数成为了可能。截止 2016 年,股指期货
已上市交易了 35 年,而其成交量也大大超过了股票市场。期指的套期保值和价
格发现机制是期货市场“减震”功能的基础。股票指数的涨跌对股指期货价格的
变动,具有基础性作用。股票指数在受到国内外经济宏观因素、微观企业影响的
同时,也会受到期指市场走势的影响。
1.2 股指期货研究现状
对于股指期货的研究可从两方面着手:一是股指期货的价格与现货价格的关
系,以建立期货市场对现货市场的风险预警机制;二是期货价格的预测。在第一
个方面,刘文井认为:在理论上讲,研究股指期货以发现二者价格之间的联系为
主要目的。期货市场的发现功能和信息传播效率在现货市场上的应用,以已解决
现货市场信息含量低的问题是研究的重点[3]。如何运用期货价格相对现货价格具
有领先--滞后关系,是解决沪深 300 指数期货的发展的重中之重,同时也会对提
升现货市场的信息传播效率。在第二个方面,王海军认为:期货价格预测方法难
点是内部结构复杂,标的物影响因素多变,参考 BP 神经网络的优点高度的非线
性系统可以克服上述难点问题,同时,为了克服神经网络初值、训练速度,局部
极小值反复循环等问题,引入了智能计算方法[4]。
关于我国股指期货的上市对股票市场的具体影响,黄添勇发现沪深 300 股指
期货对股票市场信息收益率方差的影响显著[5]。尽管我国股票市场仍属于弱信息
有效市场,但是沪深 300 股指期货的推出无疑使其信息传播效率更快,市场有效
性更高;不可忽视的是,新型期货品种的推出,会对有限的市场资金进行分流,
4
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
但长期来看,股票市场的流动性将会受益于期货市场的发展。套期保值比例影响
资产的风险,不同的模型对套保比例的要求也不同,复杂计量的模型在我国市场
的表现不一定优于简单模型。周明生认为理论上,股指期货可以做空,为市场增
加流动性,平缓市场价格的波动,使其形成合理的市场价格,从而为投资者提供
了对冲现货市场系统性风险的工具[6]。沪深 300 指数期货对现货市场指数的领先
效应明显,而且日渐稳定。由于我国现在的金融衍生品交易市场发展时间短暂,
在尚未形成成熟的市场机制的条件下,股指期货的价格发现作用没有获得充分发
挥,到期日效应仍然影响明显。李成武,陈蕾把市场趋势作为着眼点,分析在不
同市场趋势的作用下,股指期货的价格发现功能如何作用,股票信息份额的变化
程度[7]。
股票市场是技术分析的起源地,但是后来期货市场的价格分析也用到了技术
方法。尽管两个市场的用法存在区别,但是基本原理是相通的。技术分析的依据
是:一、价格反映市场一切;二、价格一趋势方式演变;三、历史会重演。股指
期货技术分析主要预测短期内价格涨跌的趋势,技术分析的基本要素是价、量、
时、空。技术分析在股票市场和股指期货市场中运用是有差别的,是否可以将两
个市场的行情结合判断,运用期货市场中技术分析的基本要素,判断其对股票市
场的影响情况。由于股市技术分析研究的是长期指标,但期货投资更注重短期指
标。因此,本文在依据技术分析三个假设的基础上,重点研究的期货市场的“量、
价、时、空”交易指标因素中,哪些因素对股票市场的走势敏感性强,能够有效
识别未来股票指数的上涨或下跌。但是会对股票市场走势造成影响的因素中不仅
仅是期货市场因素,因此,研究中可能会出现期货市场的“量、价、时、空”因
素并不是完全决定股票指数走势的情形。总而言之,使用各类期货交易信息指标
判断股票市场的趋势是本文的研究目的。
5
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
2.1 神经网络原理
人工神经网络法是通过模拟人类学习模式,利用计算机程序设计类人化思维
网络,以解决在不确定性、不精确性和不完全信息下的预先决策问题。通常被简
称为神经网络。大量节点(神经元)是其运算模型的组成部分。由以相互联接的
方式构成。输出函数是指每个节点或神经元,权重是指每两个节点或神经元间连
接信号的加权值,可类比于神经网络的记忆。网络连接方式的不同决定了输出的
不同,而连接方式的构成因素就是权重和输出函数;通常将人工神经网络运行看
作是无限趋近于某种非线性函数,或是符合逻辑的自然表述。正因为它的非线性
逼近特征,使其适合研究股指期货交易信息。
Kohonen
隐含层
输出层
输入层
输入向量
参考向量
图 2.1 神经网络构成图
6
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
图 2.2 学习向量化网络图
注释:
输入模式: R 维的 p ; 竞争层神经元个数: S 1 ;
输入层和竞争层间的权重系数矩阵 : IW 1 ;
竞争层的神经元输入: n1 ;竞争层神经元的输出: a1 ;
竞争层和输出层间的权重系数矩阵: LW 2 ;
输出层的神经元输入: n 2 ;输出层神经元输出: a 2 ;
其中, S 1 也称为子分类结果,对应竞争层学习输出; S 2 则是 S 1 中的目标分
类结果。
如图 2.2 所示的学习向量化网络图,LVQ 神经网络的学习算法有两种,分别
是 LVQ1 和 LVQ2 算法。本文研究所选用的算法是 LVQ1 算法。LVQ1 网络进行
训练时,对每一个输入向量 p,先以函数 ndist 计算它与输入权重系数矩阵 IW1
每一行元素的距离,使隐含层神经元进行竞争[9]。若 n1 的第个元素值最大,则第
i 个神经元获得竞争胜利,而后竞争层输出 a1 的第 i 个元素值为 1,其余是 0[10]。
当 a1 与权重系数矩阵 LW2 相乘时,a1 输出值为 1 的元素是对应输入向量对应的
第 k 个分类模式,所以网络认为 p 是第 k 个分类模式,则 a2 的第 k 个元素输出
是 1。
7
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
当 p 的分类正确时: ak tk 1
2
IW 1 的第 i 行可以按(2-1)式进行订正:
i IW 1 q i IW 1 q 1 a p q i IW 1 q 1 (2-1)
当 p 的分类错误时:𝑎2𝑘 =1, tk 0 , ak
2
tk
IW 1 的第 i 行可以按(2-2)式进行订正:
i IW 1 q i IW 1 q 1 a p q i IW 1 q 1 (2-2)
8
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
别和剔除,以期找到“价、量、时、空”因素中能够作为期货市场技术分析的敏
感因素。由于 LVQ 神经网络结构简单,易于普通投资者操作,对输入数据不需
归一化或正交化的处理,分类效果稳定,优于 BP 神经网络,而且本文希望能够
从直观取得的原始交易数据中获得有效信息,因此本文研究的重点并非模型结合
与算法优化。
9
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
第三章 实证分析
3.1 期指市场现状
普通投资者、具有期货交易咨询资格的机构、中金所、监管机构等相关组织,
共同构成了我国的股指期货市场。投资者不仅是在市场中交易的主体,而且是各
种组织机构服务的对象,所以,本文希望所提供的研究方式易于操作且准确率高,
能够为普通投资者服务。目前市场中的股指期货主要有三种,分别是沪深 300 指
数期货(IF),上证 50 股指期货(IH),中证 500 股指期货(IC)。
沪深 300 指数的样本股选取的是 300 只沪深市场的代表性 A 股[16]。能反映
上海和深圳证券市场 60%的市值。使用这一指标可以对市场走势进行预估,判断
市场行情,同时为衍生品市场与股票市场提供了可以参考和联系的依据。中证
500 指数的样本股选取的是沪深市场 500 家代表性中小市值公司的股票。上海和
深圳证券市场内中小市值公司的综合特征可以被中证 500 指数反映。并且中证
500 的样本股选取范围扣除了纳入沪深 300 指数的成份股,使其表现的中小市值
公司情况更具独立性和真实性。
沪深 300 指数期货上市时间长,运行制度相对完善,它的标的物沪深 300 指
数能够较为完整的代表沪深两地市场的交易市场走势,如图 3.1 所示,对沪深 300
分时和日线走势可以全面的拟合上证指数和深证成指。分析交易日数据可知,沪
深 300 与上证指数和深证成指的走势基本一致,沪深 300 指数可以很好地代表我
国股票市场的整体走势,没有明显背离的情况出现。图 3.1 以 2015 年 2 月 25 日
至 4 月 25 日数据例进行拟合。
10
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
沪深 300 指数期货合约表
合约标的 沪深 300 指数
合约乘数 每点 300 元
报价单位 指数点
最小变动单位 0.2 点
合约月份 当月、下月及随后两个季月
交易时间 9:30-11:30,13:00-15:00
每日价格最大波动限制 上一交易日结算价的±10%
最低交易保证金 合约价值的 8%
最后交易日 合约到期月份的第三个周五
交割日期 同最后交易日
交割方式 现金交割
交易代码 IF
11
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
中证 500 指数期货合约表
合约标的 中证 500 指数
合约乘数 每点 200 元
报价单位 指数点
最小变动单位 0.2 点
合约月份 当月、下月及随后两个季月
交易时间 9:30-11:30,13:00-15:00
每日价格最大波动限制 上一交易日结算价的±10%
最低交易保证金 合约价值的 8%
最后交易日 合约到期月份的第三个周五
交割日期 同最后交易日
交割方式 现金交割
交易代码 IC
中国金融期货交易所提供股指期货合约的交易信息,整理发现月份合约从上
市到退市的时间有所不同,如下表 3.3 所示,季月合约的上市交易时间约为 160
天左右,时间跨度约为 9 个月,特别地,3 月和 6 月合约是跨年度合约;非季月
合约的上市时间约为 60 天左右,时间跨度约为 3 个月,特别地,1 月和 2 月合
约为跨年合约。
截至 2016 年 3 月 2 日,沪深 300 指数期货已运行 1426 个交易日。
截至 2016 年 3 月 4 日,上证 50 股指期货和中证 500 股指期货已运行 217 个交易
日。
12
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
表 3.3 月份合约上市时间表
各合约交易时间安排表
上市时间交错,上市品种更迭,加大了市场观察的难度。大智慧软件提供的
期货合约连续指数能自动对合约更替的交易信息进行更新。例如:当前上市的合
约分别是 IF1605,IF1606,IF1609,IF1612。那么 IF 当月连续指数对应的是 IF1605,
IF 下月连续指数对应的是 IF1606,IF 当季连续对应的是 IF1609,IF 下季连续对
应的是 IF1612。若 IF1105 合约到期(5 月第三个星期五),则 IF1105 合约进入平
仓交割,下一交易日可供交易的合约变为 IF1606,IF1607,IF1609,IF1612,依
次对应当月连续,下月连续,当季连续,下季连续。
学习向量化(LVQ)神经网络系统通常用于数据分类[17],本文要研究的是股
指期货市场的交易数据会对股票市场的走势产生何种影响,其实质便是依据当日
13
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
的股指期货市场的各项交易数据和下一日的股票市场的上涨和下跌进行分类,通
俗来讲即是“今天股指期货市场的各项指标所预示的是明天股票市场的涨和
跌”,以下图 3.4 作为例子展示。研究发现,分类模型在风险预测中的使用也能
够取得较好的效果[18]。进一步剔除或者增减若干输入向量,将得到的结果进行比
较,研究基于 LVQ 神经网络的分析,哪些向量会对股票市场的走势产生主导影
响,哪些向量又是次要影响因素[19]。
根据上文对股指期货合约的分析,为了涵盖沪深两市指数整体走势且不存在
样本重叠,选择沪深 300 指数期货(IF)和中证 500 股指期货(IC)作为研究对象。
大智慧软件提供的期货合约四组连续指数日线(当月连续、下月连续、当季连续、
下季连续)分别作为为 LVQ 神经网络分析的样本数据。每组日线单独为一个样
本数据集,IF 的样本共有四组,每组包含自 2010 年 4 月 16 日至 2016 年 3 月 2
日的 1426 个交易日数据,IC 每组样本共有四组,每组包含自 2015 年 4 月 16 日
至 2016 年 3 月 4 日的 217 个交易日数据。为保持数据的原始性,样本数据均未
剔除在交割日成交量笔数、持仓量、持仓量均线为零的数据。
期货合约连续指数作为输入向量;输出向量则是股票指数与前一天指数比较
是上涨,以 1 表示;股票市场与前一天指数比较是下跌,以 2 表示。训练数据进
行 LVQ 神经网络的训练,对测试结果的分析则选用测试测试集数据。识别模式
步骤如图 3.5 所示:
图 3.5 识别模式步骤图
次“价”输入向量(开盘价、最高价、最低价、收盘价、价差及其均线),第三
次“量”输入向量(成交量、成交额、成交笔数、持仓量及其均线)
。价差是指
当日沪深 300 指数期货的升贴水。
此外,根据中金所提供的月份合约日行情数据,中证 500 指数合约由于上市
时间较短,
IC 各月份合约可供分析的样本数据过少,例如截止 2016 年 3 月 4 日,
IC1603 上市交易时间是 152 天,IC1609 上市交易时间是 30 天,因此仅在 3.3.9
对 IF 的部分月份合约进行训练和测试,选择中金所提供的日行情交易数据作为
样本,以期发现月份期货合约的交易信息对股票指数走势的影响。以上是 LVQ
神经网络对期货交易数据训练和测试的整体规划。
3.3.1 IF 当月连续日线的训练和测试
IF 当月连续全部向量输出结果表
15
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
图 3.8 混淆矩阵图
图 3.8 是 IF 当月连续全部向量的训练集混淆矩阵和所有数据的混淆矩阵。
如图 3.8 所示类别 1 即对指数上升的分类识别正确率低,656 个指数上升的数据
有 82 个识别正确;类别 2 即对沪深 300 指数下降的分类识别正确率高,644 个
指数下降的数据有 585 个识别正确。
根据上述分析,可以推测股指期货当月连续交易信息对股票指数下降的情况
更敏感,远超于对股票指数上升的情况的敏感度。普通投资者更适合使用期货数
据对未来股票市场的下降趋势进行辅助判别。
(2)第 2 次 LVQ 数据处理。剔除输入向量中有关“量”的输入向量,仅保
16
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
IF 当月连续“价”向量输出结果表
IF 样本总数 1426 指数上升 722 指数下降 704
训练集 1300 指数上升 657 指数下降 643
测试集 126 指数上升 65 指数下降 61
指数上升确认 20 上升错判 45 正确率 30.7692%
指数下降确认 40 下降错判 21 正确率 65.5738%
17
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
表 3.6 IF 当月连续“量”向量结果表
IF 当月连续“量”向量输出结果表
图 3.13 混淆矩阵图
18
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
图 3.13 为 IF 当月连续“量”向量训练集混淆矩阵和所有数据的混淆矩阵。
如图所示,类别 1 即对指数上升分类识别正确率低,类别 1 中 653 个数据有 550
个分类错误,类别 2 即对指数下降的分类识别正确率类高,类别 2 中 657 个数据
有 73 个分类错误。
本次 LVQ 神经网络的输入向量包括成交量、成交额、成交笔数、持仓量及
其均线的交易数据,通过上表可知,在剔除相关的“价”输入向量后,“量”输
入向量的效果等同于全部输入向量应用于 LVQ 神经网络的效果,由此可见,IF
当月连续的“量”输入向量对股票指数的下跌的敏感度很大,超于“价”输入向
量。但是“量”输入向量对股票指数的上升却敏感度低。
3.3.2 IF 下季连续日线的训练和测试
IF 下季连续全部向量输出结果表
图 3.16 混淆矩阵图
图 3.16 是 IF 下季连续全部向量训练集混淆矩阵和所有数据的混淆矩阵。由
如图所示:类别 1 即对指数上升分类识别正确率低,类别 1 中 656 个数据有 587
个分类错误,类别 2 即对指数下降的分类识别正确率类高,类别 2 中 644 个数据
有 36 个分类错误。本次输出结果类似于 IF 当月连续全部向量输出结果,整体向
量对股票指数下降趋势的敏感度优于上升趋势。
(2)第 2 次 LVQ 数据处理。剔除输入向量中有关“量”的输入向量,仅保
留有关“价”的输入向量。再进行 LVQ 神经网络训练测试和测试,输出结果如
表 3.8 所示:
表 3.8 IF 下季连续“价”向量结果表
IF 下季连续“价”向量输出结果表
本次输出结果类似于 IF 当月“价”向量输出结果,在剔除“量”向量后,
LVQ 神经网络对上升趋势判断的准确率获得提升,同时对下降趋势判断的准确
20
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
率有所下降,由此可见,在 IF 下季连续交易数据中,“价”输入向量对股票指
数的走势的涨跌均有一定的识别力,但是其准确率都低于 80%,因此不是具有主
导作用的自向量。
(3)第三次 LVQ 数据处理。剔除与“价”相关的输入向量,仅保留成交量、
成交额、成交笔数、持仓量及其均线与“量”相关的输入向量。再进行神经网络
训练和测试,输出结果如表 3.9 所示:
表 3.9 IF 下季连续“量”向量结果表
IF 下季连续“量”向量输出结果表
21
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
3.3.3 IF 下月连续日线的训练和测试
IF 下月连续全部向量输出结果表
淆矩阵和所有数据的混淆矩阵。如图所示,类别 1 即对指数上升分类识别正确率
低,类别 1 中 648 个数据有 561 个分类错误,类别 2 即对指数下降的分类识别正
确率类高,类别 2 中 652 个数据有 61 个分类错误。
本次输出结果显示 IF 下月连续合约的全部输入变量适合对沪深 300 指数的
下降分类,其正确率可达 90%以上,对沪深 300 指数的上升识别能力弱,正确率
仅有 10%左右。
(2)第 2 次 LVQ 数据处理。剔除输入向量中有关“量”的输入向量,仅保
留有关“价”的输入向量。再进行 LVQ 神经网络训练测试和测试,输出结果如
表 3.11 所示:
表 3.11 IF 下月连续“价”向量结果表
IF 下月连续“价”向量输出结果表
23
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
IF 下月连续“量”向量输出结果表
24
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
收盘 成交量
6000
3000000
4000
2000000
2000 1000000
0 0
1
221
441
771
991
111
331
551
661
881
1211
1321
1101
1
103
205
613
1021
1123
307
409
511
715
817
919
1225
1327
图 3.25 IF 下月连续收盘价统计图 图 3.26 IF 下月连续成交量统计图
3.3.4 IF 隔季连续日线的训练和测试
IF 隔季连续全部向量输出结果表
25
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
图 3.29 混淆矩阵图
图 3.29 是 IF 隔季连续全部向量训练集混淆矩阵和所有数据的混淆矩阵。如
图 3.29 所示类别 1 即对指数上升分类识别正确率低,类别 1 中 656 个数据有 368
个分类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 644 个数据
有 249 个分类错误。
(2)第 2 次 LVQ 数据处理。剔除输入向量中有关“量”的输入向量,仅保
留有关“价”的输入向量。进行 LVQ 神经网络训练测试和测试,输出结果如表
3.14 所示:
表 3.14 IF 隔季连续“价”向量结果表
IF 隔季连续“价”向量输出结果表
IF 样本总数 1426 指数上升 722 指数下降 704
训练集 1300 指数上升 664 指数下降 636
测试集 126 指数上升 58 指数下降 68
指数上升确认 31 上升错判 27 正确率 53.4483%
指数下降确认 36 下降错判 32 正确率 52.9412%
26
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
IF 隔季连续“量”向量输出结果表
图 3.34 混淆矩阵图
图 3.34 是 IF 隔季连续“量”向量训练集混淆矩阵和所有数据的混淆矩阵。
如图所示即对指数上升分类识别正确率低,类别 1 中 657 个数据有 393 个分类错
误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 643 个数据有 226 个
分类错误。
小结:综合 IF 隔季连续合约的三次测试结果,无论是否剔除“价”向量或
者“量”向量,LVQ 神经网络对沪深 300 指数走势上涨和下跌的识别正确率均
没有显著的变化,识别沪深 300 指数下降的正确率维持在 50%至 60%之间,识
别上升的正确率在剔除“量”变量后略微下降。IF 隔季连续合约的交割时间与当月
时间相距 6 个月左右,短期套期保值、套利、投机等投资者会较少选择隔季连续
合约作为工具和投资对象,因此 IF 隔季连续合约各项交易信息,对当下沪深 300
指数的影响不显著,但是进行长期投资则不可忽略。
3.3.5 IC 当月连续日线的训练和测试
IC 当月连续全部向量输出结果表
图 3.37 混淆矩阵图
图 3.37 是 IC 当月连续全部向量训练集混淆矩阵和所有数据的混淆矩阵。如
图所示类别 1 即对指数上升分类识别正确率高,类别 1 中 103 个数据有 13 个分
类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 77 个数据有 59
个分类错误。
中证 500 股指期货上市时间不足一年,运行机制并不完全成熟,可供训练和
测试的数据较少,但上市初期的市场影响可以为后来的交易规则调整提供分析基
础。结果显示 IC 股指期货交易信息对中证 500 指数敏感性强,对上涨正确识别
的概率达到 85%,而其对下降的敏感性低,仅有 6%左右的正确率。
(2)第二次 LVQ 数据处理。将训练集 180、测试集 37 个数据输入网络,
得到相应的输出结果。输出结果如表 3.17 所示:
29
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
表 3.17 IC 当月连续“价”向量结果表
IC 当月连续“价”向量输出结果表
图 3.40 混淆矩阵图
图 3.40 是 IC 当月连续“价”向量训练集混淆矩阵和所有数据的混淆矩阵。
30
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
IC 当月连续“量”向量输出结果表
31
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
图 3.43 混淆矩阵图
图 3.43 是 IC 当月连续“量”向量训练集混淆矩阵和所有数据的混淆矩阵。
如图所示类别 1 即对指数上升分类识别正确率高,类别 1 中 101 个数据有 17 个
分类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 79 个数据有
20 个分类错误。剔除“价”变量后,仅有的“量”变量输入 LVQ 神经网络,对
于中证 500 指数走势的识别结果与以上两次测试大体一致,“量”向量对指数上
升的敏感度大于下降。
小结:IC 股指期货当月连续交易信息数据对中证 500 指数上升走势更为敏
感,无论是“价”向量、“量”向量或是“价”、“量”结合,都可以对上身走
势进行高正确率的判断,可作为投资者判断的辅助。但是对下降走势识别的正确
率过低,造成该种结果的原因有多种。中金所对上市初期的 IC 股指期货的价格
变动幅度和成交量、持仓量均有严格控制。影响中证 500 指数变化的因素繁多,
股指期货的市场表现只是一方面的原因。
3.3.6 IC 下月连续日线的训练和测试
IC 下月连续全部向量输出结果表
IC 样本总数 217 指数上升 123 指数下降 94
训练集 180 指数上升 98 指数下降 82
测试集 37 指数上升 25 指数下降 12
指数上升确认 24 上升错判 1 正确率 96%
指数下降确认 1 下降错判 11 正确率 8.3333%
32
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
IC 下月连续“价”向量输出结果表
33
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
图 3.48 混淆矩阵图
34
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
表 3.21 IC 下月连续“量”向量结果表
IC 下月连续“量”向量输出结果表
IC 样本总数 217 指数上升 123 指数下降 94
训练集 180 指数上升 102 指数下降 78
测试集 37 指数上升 21 指数下降 16
指数上升确认 19 上升错判 2 正确率 90.4762%
指数下降确认 1 下降错判 15 正确率 6.25%
3.3.7 IC 下季连续日线的训练和测试
35
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
表 3.22 IC 下季连续全部向量结果表
IC 下季连续全部向量输出结果表
图 3.53 混淆矩阵图
图 3.53 是 IC 下季连续全部向量训练集混淆矩阵和所有数据的混淆矩阵。由
如图所示类别 1 即对指数上升分类识别正确率高,类别 1 中 102 个数据有 4 个分
类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 78 个数据有 64
36
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
个分类错误。
(2)第二次 LVQ 数据处理。将训练集 180 个股指期货的交易数据输入网络,
对网络进行训练。结束训练后,将测试集 37 个数据输入网络,得到相应的输出
结果。输出结果如表 3.23 所示:
表 3.23 IC 下季连续“价”向量结果表
IC 下季连续“价”向量输出结果表
图 3.56 混淆矩阵图
37
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
图 3.56 是 IC 下季连续“价”向量训练集混淆矩阵和所有数据的混淆矩阵。
类别 1 即对指数上升分类识别正确率高,类别 1 中 108 个数据有 18 个分类错误。
(3)第三次 LVQ 数据处理。将训练集 180 个股指期货的交易数据输入网络,
对网络进行训练。结束训练后,将测试集 37 个数据输入网络,得到相应的输出
结果。输出结果如表 3.24 所示:
表 3.24 IC 下季连续“量”向量结果表
IC 下季连续“量”向量输出结果表
IC 样本总数 217 指数上升 123 指数下降 94
训练集 180 指数上升 101 指数下降 79
测试集 37 指数上升 22 指数下降 15
指数上升确认 18 上升错判 4 正确率 81.8182%
指数下降确认 1 下降错判 14 正确率 6.6667%
38
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
图 3.59 混淆矩阵图
图 3.59 为 IC 下季连续“量”向量训练集混淆矩阵和所有数据的混淆矩阵。
如图所示类别 1 即对指数上升分类识别正确率高,类别 1 中 101 个数据有 8 个分
类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 79 个数据有 65
个分类错误。
小结:IC 下季连续合约对中证 500 指数走势的预测效果大体一致,三次训
练和测试,分别输入全部向量,“价”向量,“量”向量后,发现对指数上升走
势的识别始终保持较高的正确率,但是三种输入向量对指数下跌走势均不敏感,
没有一类可以对其的识别分类达到 30%以上的正确率。
3.3.8 IC 隔季连续日线的训练和测试
IC 隔季连续全部向量输出结果表
39
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
图 3.62 混淆误差图
图 3.62 是 IC 隔季连续全部向量训练集混淆矩阵和所有数据的混淆矩阵。由
如图所示类别 1 即对指数上升分类识别正确率高,类别 1 中 106 个数据有 6 个分
类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 78 个数据有 62
个分类错误。
(2)第二次 LVQ 数据处理。训练集 180 个交易数据、测试集 37 个交易数
据输入网络,进行训练、测试。输出结果如表 3.26 所示:
40
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
表 3.26 IC 隔季连续“价”向量结果表
IC 隔季连续“价”向量输出结果表
图 3.65 混淆矩阵图
图 3.65 是 IC 隔季连续“价”向量训练集混淆矩阵和所有数据的混淆矩阵。类
别 1 即对指数上升分类识别正确率低,类别 1 中 101 个数据有 26 个分类错误,
类别 2 即对指数下降的分类识别正确率类低。
41
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
IC 隔季连续“量”向量输出结果表
图 3.68 混淆矩阵图
42
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
3.3.9 IF 月份合约的训练和测试举例
一年中的每个月份均有旧合约到期和新合约上市,回顾上文分析可知季月合
约上市交易时间比其他普通月份合约长,而且 3 月合约上市时间是跨年度的,9
月合约非跨年度的。2014 年和 2015 年是 IF 股指期货合约上市的第五年和第六
年,同时在这两年中,我国股市大起大落的现象引人深思。因此,下面分别选取
跨年度的 IF1403 与 IF1503 合约组合,非跨年度 IF1409 与 IF1409 合约组合,进
行 LVQ 训练和测试,以发现单月合约“价”向量和“量”向量对现货市场走势
的影响。
根据中国金融期货交易所的日行情数据样本,IF1403 合约上市时间是 2013
年 7 月 22 日至 2014 年 3 月 21 日,共 162 个交易日;
IF1503 合约上市时间是 2014
年 7 月 21 日至 2015 年 3 月 20 日,共 162 个交易日;IF1409 合约上市时间是 2014
年 1 月 20 日至 2014 年 9 月 19 日,共 165 个交易日,
IF1509 合约上市时间是 2014
年 1 月 19 日至 2014 年 9 月 18 日,共 165 个交易日。“价“输入向量分别是开盘
价、最高价、最低价、收盘价、结算价、涨跌 1(今收盘价-前结算价)、涨跌 2
(今结算价-前结算价)
,“量”输入向量分别是成交量、成交金额、持仓量。输出
向量则是股票指数与前一天指数比较是上涨,以 1 表示;股票市场与前一天指数
比较是下跌,以 2 表示。
43
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
表 3.28-1 IF1409+IF1509“量”向量结果表
IF1409+IF1509“量”向量输出结果表
IF1409+IF1509“价”向量输出结果表
IF 样本总数 330 指数上升 177 指数下降 153
训练集 290 指数上升 155 指数下降 135
测试集 40 指数上升 22 指数下降 18
44
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
IF1403+IF1503“量”向量输出结果表
45
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
表 3.29-2 IF1403+IF1503“价”向量结果表
IF1403+IF1503“价”向量输出结果表
46
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
第四章 结论及展望
参考文献
48
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究
致 谢
时光匆匆,三年的硕士研究生生活马上就要结束了。毕业将至,在此毕业论
文完成之际,我在此由衷的感谢所有帮助过我的人,希望在今后的生活中,当你
们需要帮助的时候也会得到温暖的援手。
感谢我的父母给予我生命,哺育我成长,人生的道路上充满困难和挑战,正
是因为父母的爱护和支持,才能不断前行。
感谢我的导师严定琪副教授,严老师循序渐进的指引我完成课题的研究。他
对待学术严谨负责,平时为人平易近人,其超凡的人格魅力,不仅在学业上给予
我指导,也会在将来的生活中予以我启迪。在这里,我谨向严老师表示我诚挚的
感谢与祝福!谢谢您的宽容与指导,让我除却浮躁,经历思考和启示,更加深切
地体会到学习的精髓和意义。
感谢我的同学杜艳芳、高承泽,谢谢你们在我完成论文期间无私的帮助和暖
心的鼓励,一起陪我度过了艰辛的论文写作过程,这将是我一生珍藏的记忆。感
谢我的朋友陈雯吉,黎红英,我们能够理解彼此,敞开胸怀,一起度过了很多美
好的时光。生活上,室友张曼,白秀总是帮我排忧解难,谢谢你们。感谢师门的
同学们,因为海内知己,所以天涯比邻。
三年的时光中失去很多,但得到的更多,感谢兰大三年的校园生活,不忘初
心,方得始终。
最后,向参加论文评审和答辩的专家们致以我深深的谢意。
49