You are on page 1of 55

分类号: 密级:

专 业 学 位 研 究 生 学 位 论 文

基于 LVQ 对股指期货交易信息分析的
论 文题目( 中文 ) 股票指数走势识别研究
The Research on Analysis of Stock Index Futures
论文题目(外文) Transaction Information to Identify Stock Index
Trend on LVQ Neural Network
研 究 生 姓 名 徐 虹

学 位 类 别 应用统计

专 业 学 位 领 域

学 位 级 别 硕 士

校内导师姓名、职称 严定琪 副教授

校外导师单位、姓名

论 文工作起 止年 月 2015 年 3 月至 2016 年 4 月

论 文 提 交 日 期 2016 年 5 月

论 文 答 辩 日 期 2016 年 5 月

学 位 授 予 日 期

校址:甘肃省兰州市
原 创 性 声 明
本人郑重声明:本人所呈交的学位论文,是在导师的指导下独立进行研究所
取得的成果。学位论文中凡引用他人已经发表或未发表的成果、数据、观点等,
均已明确注明出处。除文中已经注明引用的内容外,不包含任何其他个人或集体

已经发表或撰写过的科研成果。对本文的研究成果做出重要贡献的个人和集体,
均已在文中以明确方式标明。
本声明的法律责任由本人承担。

论文作者签名: 日 期:

关于学位论文使用授权的声明
本人在导师指导下所完成的论文及相关的职务作品,知识产权归属兰州大学。
本人完全了解兰州大学有关保存、使用学位论文的规定,同意学校保存或向国家
有关部门或机构送交论文的纸质版和电子版,允许论文被查阅和借阅;本人授权
兰州大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采
用任何复制手段保存和汇编本学位论文。本人离校后发表、使用学位论文或与该

论文直接相关的学术论文或成果时,第一署名单位仍然为兰州大学。
本学位论文研究内容:
□可以公开
□不宜公开,已在学位办公室办理保密申请,解密后适用本授权书。
(请在以上选项内选择其中一项打“√”)

论文作者签名: 导师签名:

日 期: 日 期:
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

摘 要

随着股指期货市场投资者增多,交易量持续放大,它对股票市场的影响
日益加深。本文旨在运用期货市场的技术分析方法,根据 LVQ 神经网络的
分类模式,将沪深 300 指数期货(IF)和中证 500 股指期货(IC)的日行情
信息作为输入向量,股票指数未来趋势作为输出向量,以技术分析的角度筛
选股指期货日行情信息中对股票指数走势造成影响的变量。通过对输入向量
以价格类别或成交量、交易量类别等形式组合,选择不同时间上市交易的股
指期货合约,研究期货市场交易信息中会对股票指数未来走势产生重要影响
的因素,并且发现期货市场的量、价类别因素交互影响的关系。总体上,由
于上市时间、交割到期日的差别,不同种类合约对价和量类别因素的敏感程
度是不同的。具体而言,IC 期货合约的各个连续指数和 IF 个别季月合约的
量类别变量识别股指上升正确率高,IF 当月连续和下季连续的量类别因素对
股指下降识别正确率高;IF 下月连续的价类别和量类别因素能分别识别股指
上升和下降;但是 IF 隔季连续合约的价、量类别因素均对股指敏感性低。
投资者可以根据当前期货市场交易信息的具体情况,依据研究结果,对股票市
场走势的进行判断,以辅助投资决策。

关键词: LVQ,价量分析,沪深 300 期指,中证 500 期指,分类识别

I
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

THE RESEARCH ON ANALYSIS OF STOCK INDEX


FUTURES TRANSACTION INFORMATION TO
IDENTIFY STOCK INDEX TREND ON LVQ NEURAL
NETWORK

Abstract

With the stock index futures market investors increasing and trading volume enlarging, its
impact on the stock market becomes more deepen. In this thesis, according to the technical
analys is method of futures market and classification model of LVQ neural network, we select the
Shanghai and Shenzhen 300 Index Futures (IF) and the CSI 500 Stock Index Futures (IC) day
market information as input vector and the stock index future trend as the output vector. In the
view of technical analysis, the variables that affect the trend of stock index in stock index futures
day market information are selected. Then the stock index futures contract is classified by "time",
the thesis studies the influence of the "price", "quantity" and "time" of the futures market on the
future trend of the stock index. Through the input vectors are in the form of price category or
volume, trading volume and other forms of combination, then we choose stock index futures
contracts with different time of listing, which could help study the influence of the "price",
"quantity" and "time" of the futures market on the future trend of the stock index. We will discover
the trend of the stock index by the interaction of the quantity and price category of the futures
market. Overall the sensitivity of the price and quantity category is different. Specifically, IC
futures contracts for the various continuous index and IF quarter month futures contract quantity
category variable identify index rosing correct rate high, IF continuous and continuous next season,
the amount of categories of factors on the stock index fail to identify the correct rate of high, IF
next month for the continuous price category and the amount of categories of factors that can
identify the stock index rose or fell. However, the price and quantity category of IF futures
continuous contracts are no sensitive to the trend of stock index. The above results can help
investors to judge the trend of the stock market.

Keywords:LVQ, Price and Volume Analysis, IF, IC, Classification and recognition

II
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

目 录

摘 要 ................................................................................................. I
Abstract .............................................................................................. II
绪 论 .................................................................................................. 1
第一章 股票价格指数期货基本概论................................................ 4
1.1 股指期货概述 .................................................. 4

1.2 股指期货研究现状 .............................................. 4

第二章 LVQ 神经网络基本概论 ........................................................ 6


2.1 神经网络原理 ................................................... 6

2.2 LVQ 神经网络概述 .............................................. 6

2.3 LVQ 神经网络研究现状 .......................................... 8

第三章 实证分析...............................................................................10
3.1 期指市场现状 ................................................. 10

3.2 LVQ 神经网络识别模式规划 ..................................... 13

3.2.1 LVQ 识别模式设计 .................................................................................... 13

3.2.2 LVQ 识别模式构建 .................................................................................... 14

3.3 LVQ 神经网络的训练和测试 ..................................... 15

3.3.1 IF 当月连续日线的训练和测试 ................................................................. 15

3.3.2 IF 下季连续日线的训练和测试 ................................................................. 19

3.3.3 IF 下月连续日线的训练和测试 ................................................................. 22

3.3.4 IF 隔季连续日线的训练和测试 ................................................................. 25

3.3.5 IC 当月连续日线的训练和测试 ................................................................ 28

3.3.6 IC 下月连续日线的训练和测试 ................................................................ 32

3.3.7 IC 下季连续日线的训练和测试 ................................................................ 35

3.3.8 IC 隔季连续日线的训练和测试 ................................................................ 39


III
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

3.3.9 IF 月份合约的训练和测试举例 ................................................................. 43

第四章 结论及展望...........................................................................47
参考文献............................................................................................48
致 谢............................................................................................49

IV
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

绪 论

回顾金融市场发展的历史,风险和利益总是相生相伴。投资者贪图利益的时
候,情绪过度亢奋导致市场的非理性上涨。极端的上涨过后,随之而来的便是不
可控制的下跌。因此,人们在追逐利益的同时,也要设立交易规范,创造多种避
险工具,以防范金融风暴所带来的损失。市场风险又称系统性风险,会给市场上
所有的公司、企业造成经营受创,股价下跌。市场风险是不能依靠分散投资而抵
消的,但是,金融衍生品的出现,使投资者可以通过交易远期合约、期货合约、
互换合约、期权合约等一系列衍生品来抵消的市场风险。
衍生品本质特征--以某种资产为标的,因此经常会出现期货价格和现货价格
在两个市场背离的现象,此外衍生品交易会带来的巨大杠杆效应和双向买卖机制,
在为套保者,套利者和投机者带来巨大经济利益的同时,也给他们乃至整个金融
市场交易系统带来了巨大的风险隐患。从 20 世纪 90 年代的巴林银行倒闭事件,
到 2008 年的由美国次贷危机而引发的全球金融海啸,使人们对金融创新和衍生
品忧心忡忡。
2015 年中国股市上演的过山车行情仍然历历在目,上证综指在 17 个交易日
内就暴跌 32%,千股跌停和千股停牌潮频频出现,历经 7 年熊市的中国股市终于
迎来快速上涨行情后,又在不到一年的时间重回低谷。尽管存在市场估值要求修
复的内在原因,但是股市本身的上涨速度过快,使得很多投资者在面对突如其来
的下跌时措手不及。获利盘跌回上涨前的价格,各类杠杆资金被叫停或是加速离
场,市场流动性几近枯竭。尤其此阶段期现货市场出现了交互下跌的现象,期货
市场平缓现货市场价格波动的作用也未得到体现。因此,有人便将 2015 年股市
异常波动的元凶指向了股指期货市场。这种观点是不合理的,股票市场的运行不
会被期货市场所左右,理论上讲,期货价格围绕现货价格上下波动,因此可将股
指市场看作股票市场的外延,股票市场仍然起主导作用。对于股市出现崩盘式下
跌,股指期货的作用只能是减缓而非阻止,投资者必须认清这一点。
流动性充裕、改革红利预期、居民资产配置调整是造成非理性行情的合理原
因。但决不能忽视我国股市市场交易者不成熟,市场监管制度不完善等问题。股
指期货被投资者当作是对冲风险和获取价外利润的工具,同时股指期货市场的名
义成交额大幅领先股票市场,因此期货市场上交易价格和成交量的变化也会影响
投资者对股票市场走势的判断。
1987 年美国股市暴跌,股灾过后,莫顿·米勒(Merton Miller)带领工作小
1
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

组,进行了细致地考察,参考了大量的数据,证明造成股市“黑色星期一”的原因
与股指期货无根本联系[1]。虽然日经 225 股指期货是全球金融衍生品市场重要的
交易产品之一,但是日经 225 股指期货前期发展阶段也同样饱受质疑。上市初期,
由于 90 年代经济泡沫破裂,日本股市大萧条,股价急速下跌,人们将日经 225
股指期货视作股市暴跌的元凶。一时间所有的言论矛头直指日经 225 股指期货,
迫于舆论的压力和国内立足的需要,大阪交易所只好控制期货交易,但仍然没有
改变股票市场指数大幅下跌的情形,而且错失了参与全球金融衍生品竞争的良好
契机,使其在相当长的时间内处于不利地位,期货市场的正常交易和运行受到了
不该有的限制,不仅妨碍了股指期货交易的扩展和繁荣,也阻碍了日本金融市场
的长远发展[2]。我国与日本同属亚洲国家,在竞争中寻求发展和合作,作为新兴
发展国家,我国应借鉴日经 225 股指期货的经验和教训。
此次股灾中,普通交易者的心理风险表现的非常明显。普通的交易者往往不
具备全面的专业知识,股指期货是对未来股价水平的理性预期,股指期货通过价
格发现机制形成远期价格,在一定程度上可以为普通投资者对未来股票市场的走
势提供一定的判断依据,当对市场走势有了明确的判断后,投资者的才不会进行
盲目交易,市场恐慌情绪得到减轻,因此股指期货对稳定市场情绪具有一定的作
用。复杂的技术分析和预测模型是普通投资者的软肋,如何用简单迅捷的方式获
得当前市场信息的隐含内容,发现股指期货交易中隐含的股票市场走势趋向,是
本文的研究目的。
“价、量、时、空”是做技术分析的重要因素。价格、成交量、时间、价
格变化空间等因素交互作用,造成股票价格的波动起伏和股市走势的变幻莫测。
由此及彼,股指期货交易的信息数据同样包含了大量的“价、量、时、空”信息,
股指期货合约的开盘价、最高价、最低价、收盘价、成交量、成交额、成交笔数、
持仓量、价差都是可供交易者分析的重要依据。理论上,股指期货市场上的价格、
成交量、合约时间等类似于“价、量、时、空”的信息也可作为分析技术分析的
依据。本文以学习向量化(LVQ)神经网络模型为识别工具,将股指期货合约的
开盘、最高、最低、收盘等价格,成交量、成交额、成交笔数、持仓量及其均线、
价差及其均线作为输入向量,股票市场指数的涨跌作为输出向量,通过对输入向
量的组合和增减,找到对股票市场走势影响突出的“价”因素、“量”因素、“时”
因素、“空”因素,使其实现通过期货市场的技术分析,可以获得对股票市场走
势的辅助判断依据。
本文的创新之处共有三点:第一、模型的选择。将 LVQ 神经网络分类模型
应用于股指期货对股票市场的走势影响,是鲜少有人涉足的研究领域。利用 LVQ

2
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

神经网络不需要对输入向量过多处理的条件,使输入的数据保持了原有的特征,
更容易发现输入向量间的相互作用关系。第二、数据的分类比较方式。一方面,
在时间上分类比较,股指期货合约由于其到期交割的特征,使其交易数据信息并
非连续存在。而同时上市的 4 类合约也会对现货市场的走势造成交互影响。因此,
本文在选择数据分类的方式不仅考虑到期货合约指数的连续性,也对已经交割的
合约按月份进行了整理,观察季月合约随时间的流逝,从隔季转变成下季,下月,
当月期间,对当时现货市场走势的影响。另一方面,在合约种类选择上,既有上
市时间长,交易成熟稳定的沪深 300 指数期货,也有新近上市,处于逐步探索中
的中证 500 指数期货。两种合约全面覆盖了大、中、小市值的企业和公司。第三、
技术分析的演化。以往的研究中,技术分析只应用在股票市场走势的分析中,但
同样具备“价、量、时、空”因素的股指期货也有使用技术分析的条件。本文通
过对输入向量的筛选,发现不同时间段期货市场影响股票市场的主导条件,为期
货市场进一步的技术分析奠定了基础。

3
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

第一章 股票价格指数期货基本概论

1.1 股指期货概述

股票价格指数的编制是依据一定的标准选取有代表性的样本股票,并赋予这
组股票不同的权重,将其价格进行加权平均,最后进行修正而得到的价格指数。
随着编制方法和成分股调整规则的日趋完善,股票价格指数基本上能代表整个股
票市场所有股票价格变动的趋势和幅度。将股票价格指数作为期货合约的标的物,
通过交易这种类型的期货,便可间接的对股票指数进行买卖,实现对整个股票市
场的价格或趋势的把握。具有代表性的股票指数的样本股通常包含众多的行业和
公司股票,投资者若想通过完全复制投资组合的方式进行指数投资,难度较大。
通过交易股指期货,使买卖股票指数成为了可能。截止 2016 年,股指期货
已上市交易了 35 年,而其成交量也大大超过了股票市场。期指的套期保值和价
格发现机制是期货市场“减震”功能的基础。股票指数的涨跌对股指期货价格的
变动,具有基础性作用。股票指数在受到国内外经济宏观因素、微观企业影响的
同时,也会受到期指市场走势的影响。

1.2 股指期货研究现状

对于股指期货的研究可从两方面着手:一是股指期货的价格与现货价格的关
系,以建立期货市场对现货市场的风险预警机制;二是期货价格的预测。在第一
个方面,刘文井认为:在理论上讲,研究股指期货以发现二者价格之间的联系为
主要目的。期货市场的发现功能和信息传播效率在现货市场上的应用,以已解决
现货市场信息含量低的问题是研究的重点[3]。如何运用期货价格相对现货价格具
有领先--滞后关系,是解决沪深 300 指数期货的发展的重中之重,同时也会对提
升现货市场的信息传播效率。在第二个方面,王海军认为:期货价格预测方法难
点是内部结构复杂,标的物影响因素多变,参考 BP 神经网络的优点高度的非线
性系统可以克服上述难点问题,同时,为了克服神经网络初值、训练速度,局部
极小值反复循环等问题,引入了智能计算方法[4]。
关于我国股指期货的上市对股票市场的具体影响,黄添勇发现沪深 300 股指
期货对股票市场信息收益率方差的影响显著[5]。尽管我国股票市场仍属于弱信息
有效市场,但是沪深 300 股指期货的推出无疑使其信息传播效率更快,市场有效
性更高;不可忽视的是,新型期货品种的推出,会对有限的市场资金进行分流,
4
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

但长期来看,股票市场的流动性将会受益于期货市场的发展。套期保值比例影响
资产的风险,不同的模型对套保比例的要求也不同,复杂计量的模型在我国市场
的表现不一定优于简单模型。周明生认为理论上,股指期货可以做空,为市场增
加流动性,平缓市场价格的波动,使其形成合理的市场价格,从而为投资者提供
了对冲现货市场系统性风险的工具[6]。沪深 300 指数期货对现货市场指数的领先
效应明显,而且日渐稳定。由于我国现在的金融衍生品交易市场发展时间短暂,
在尚未形成成熟的市场机制的条件下,股指期货的价格发现作用没有获得充分发
挥,到期日效应仍然影响明显。李成武,陈蕾把市场趋势作为着眼点,分析在不
同市场趋势的作用下,股指期货的价格发现功能如何作用,股票信息份额的变化
程度[7]。
股票市场是技术分析的起源地,但是后来期货市场的价格分析也用到了技术
方法。尽管两个市场的用法存在区别,但是基本原理是相通的。技术分析的依据
是:一、价格反映市场一切;二、价格一趋势方式演变;三、历史会重演。股指
期货技术分析主要预测短期内价格涨跌的趋势,技术分析的基本要素是价、量、
时、空。技术分析在股票市场和股指期货市场中运用是有差别的,是否可以将两
个市场的行情结合判断,运用期货市场中技术分析的基本要素,判断其对股票市
场的影响情况。由于股市技术分析研究的是长期指标,但期货投资更注重短期指
标。因此,本文在依据技术分析三个假设的基础上,重点研究的期货市场的“量、
价、时、空”交易指标因素中,哪些因素对股票市场的走势敏感性强,能够有效
识别未来股票指数的上涨或下跌。但是会对股票市场走势造成影响的因素中不仅
仅是期货市场因素,因此,研究中可能会出现期货市场的“量、价、时、空”因
素并不是完全决定股票指数走势的情形。总而言之,使用各类期货交易信息指标
判断股票市场的趋势是本文的研究目的。

5
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

第二章 LVQ 神经网络基本概论

2.1 神经网络原理

人工神经网络法是通过模拟人类学习模式,利用计算机程序设计类人化思维
网络,以解决在不确定性、不精确性和不完全信息下的预先决策问题。通常被简
称为神经网络。大量节点(神经元)是其运算模型的组成部分。由以相互联接的
方式构成。输出函数是指每个节点或神经元,权重是指每两个节点或神经元间连
接信号的加权值,可类比于神经网络的记忆。网络连接方式的不同决定了输出的
不同,而连接方式的构成因素就是权重和输出函数;通常将人工神经网络运行看
作是无限趋近于某种非线性函数,或是符合逻辑的自然表述。正因为它的非线性
逼近特征,使其适合研究股指期货交易信息。

2.2 LVQ 神经网络概述

根据神经网络的原理,LVQ 神经网络整体构成如图 2.1 所示:

Kohonen
隐含层
输出层

输入层

输入向量

参考向量

图 2.1 神经网络构成图
6
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

因为 LVQ 属于前向神经网络的类别,所以,LVQ 使用有监督学习输入法来


训练竞争层,Kohonen 竞争算法是其算法基础[8]。LVQ 神经网络由输入层、隐含
层和输出层组成,输入层和隐含层是完全连接,隐含层和输出层是部分连接,每
个输出层与隐含层的神经元间的不同组相连接。在网络训练过程中,输入层和隐
含层神经元间的权值会被修改。当输入某些向量进入网络时,最接近隐含神经元
的获得竞争胜利,会产生一个“1”,其余产生“0”。此时,与获胜神经元相连
的输出神经元也发出“1”,其余输出是“0”,产生“1”的输出神经元给出输
入向量的类,每个输出神经元都代表不同的类别。LVQ 神经网络能够对输入数
据进行分类识别。

图 2.2 学习向量化网络图

注释:
输入模式: R 维的 p ; 竞争层神经元个数: S 1 ;
输入层和竞争层间的权重系数矩阵 : IW 1 ;
竞争层的神经元输入: n1 ;竞争层神经元的输出: a1 ;
竞争层和输出层间的权重系数矩阵: LW 2 ;
输出层的神经元输入: n 2 ;输出层神经元输出: a 2 ;
其中, S 1 也称为子分类结果,对应竞争层学习输出; S 2 则是 S 1 中的目标分
类结果。
如图 2.2 所示的学习向量化网络图,LVQ 神经网络的学习算法有两种,分别
是 LVQ1 和 LVQ2 算法。本文研究所选用的算法是 LVQ1 算法。LVQ1 网络进行
训练时,对每一个输入向量 p,先以函数 ndist 计算它与输入权重系数矩阵 IW1
每一行元素的距离,使隐含层神经元进行竞争[9]。若 n1 的第个元素值最大,则第
i 个神经元获得竞争胜利,而后竞争层输出 a1 的第 i 个元素值为 1,其余是 0[10]。
当 a1 与权重系数矩阵 LW2 相乘时,a1 输出值为 1 的元素是对应输入向量对应的
第 k 个分类模式,所以网络认为 p 是第 k 个分类模式,则 a2 的第 k 个元素输出
是 1。
7
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

当 p 的分类正确时: ak  tk  1
2

IW 1 的第 i 行可以按(2-1)式进行订正:

i IW 1  q   i IW 1  q  1  a  p  q   i IW 1  q  1 (2-1)

当 p 的分类错误时:𝑎2𝑘 =1, tk  0 , ak
2
 tk
IW 1 的第 i 行可以按(2-2)式进行订正:

i IW 1  q   i IW 1  q  1  a  p  q   i IW 1  q  1 (2-2)

由于只有 IW1 的第 i 行进行订正,不会对剩余行造成影响,第一网络层会接


受输出误差的反向传播,对 IW1 的剩余行没有影响。这样的做法可以使神经元就
近落入对应的输入向量,构成其子分类。本文研究中使用的是 MATLAB 神经网
络工具箱中的学习函数 learnlv1,learnlv1 功能是调整第 1 网络层权值。

2.3 LVQ 神经网络研究现状

目前,LVQ 神经网络研究主要集中在三方面:一、直接运用 LVQ 神经网络


进行分类研究。在电测和仪表方面,律方成、张波通过放电波形的 7 个特征参数,
将 LVQ 神经网络应用于电力设备的放电类型识别,辨识率高于 S_Kohonen 神经
网络[10],丁硕、常晓恒、巫庆辉、魏洪峰、杨友林利用 LVQ 神经网络对风电机
组齿轮箱故障进行排查,其结果的准确率高于 BP 神经网络[11];刘文轩、严凤、
田霖、代明在配电网故障定位中使用了 LVQ 神经网络,证明 LVQ 的分类能力优
于 BP 神经网络[12];二、将 LVQ 神经网络与其他模型相结合。在网络智能防御
方面,贾铁军、刘泓漫将 MA 与 LVQ 神经网络引入 NIPS 模型,使防御的正确
率有所提高。新的智能 NIPS 系统,在受到未知规则攻击时,能够报警阻断[13];
三、使用新的算法改善 LVQ 神经网络的初始权重和分类准确率,降低误差。张
超、魏三强、胡建秀、梁西陈利用 PSO-LVQ 算法,使乳腺癌的诊断准确率得到
提升,由此可见,粒子算法能够优化 LVQ 神经网络的初始值,使其收敛性和准
确率获得提高[14];在化工故障诊断方面,张晓丹利用免疫克隆算法优化 LVQ 神
经网络的竞争过程,提高分类正确率[15]。
综合以上研究可知,LVQ 神经网络能够广泛应用于电网故障判断,分类结
果准确率高,优于 BP 神经网络的分类判别结果,具有一定的实践意义。同时,
LVQ 神经网络可以与其它网络和算法结合,优化初始值和随机权重,有利于提
高分类结果的准确率。本文直接采用 LVQ 神经网络进行期货交易数据分析,因
为影响股票市场走势的因素种类繁多,所以,本文研究的重点在于输入向量的甄

8
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

别和剔除,以期找到“价、量、时、空”因素中能够作为期货市场技术分析的敏
感因素。由于 LVQ 神经网络结构简单,易于普通投资者操作,对输入数据不需
归一化或正交化的处理,分类效果稳定,优于 BP 神经网络,而且本文希望能够
从直观取得的原始交易数据中获得有效信息,因此本文研究的重点并非模型结合
与算法优化。

9
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

第三章 实证分析

3.1 期指市场现状

普通投资者、具有期货交易咨询资格的机构、中金所、监管机构等相关组织,
共同构成了我国的股指期货市场。投资者不仅是在市场中交易的主体,而且是各
种组织机构服务的对象,所以,本文希望所提供的研究方式易于操作且准确率高,
能够为普通投资者服务。目前市场中的股指期货主要有三种,分别是沪深 300 指
数期货(IF),上证 50 股指期货(IH),中证 500 股指期货(IC)。
沪深 300 指数的样本股选取的是 300 只沪深市场的代表性 A 股[16]。能反映
上海和深圳证券市场 60%的市值。使用这一指标可以对市场走势进行预估,判断
市场行情,同时为衍生品市场与股票市场提供了可以参考和联系的依据。中证
500 指数的样本股选取的是沪深市场 500 家代表性中小市值公司的股票。上海和
深圳证券市场内中小市值公司的综合特征可以被中证 500 指数反映。并且中证
500 的样本股选取范围扣除了纳入沪深 300 指数的成份股,使其表现的中小市值
公司情况更具独立性和真实性。
沪深 300 指数期货上市时间长,运行制度相对完善,它的标的物沪深 300 指
数能够较为完整的代表沪深两地市场的交易市场走势,如图 3.1 所示,对沪深 300
分时和日线走势可以全面的拟合上证指数和深证成指。分析交易日数据可知,沪
深 300 与上证指数和深证成指的走势基本一致,沪深 300 指数可以很好地代表我
国股票市场的整体走势,没有明显背离的情况出现。图 3.1 以 2015 年 2 月 25 日
至 4 月 25 日数据例进行拟合。

图 3.1 沪深 300 与上证指数、深证成指分时、日线拟合图

10
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

图 3.2 沪深 300、上证 50 拟合图 图 3.3 沪深 300、中证 500 拟合图

图 3.2 是沪深 300、上证指数、上证 50 指数的日线叠加拟合图,上证 50 的


走势、上下波动变化与沪深 300 和上证指数大体一致。上证 50 指数的样本股组
成与沪深 300 指数有重叠。图 3.3 是中证 500 指数与沪深 300 指数的日线叠加拟
合图,中证 500 指数与沪深 300 指数的走势并不完全一致。
沪深 300 指数期货合约内容如表 3.1 所示:
表 3.1 沪深 300 指数期货合约表

沪深 300 指数期货合约表

合约标的 沪深 300 指数

合约乘数 每点 300 元

报价单位 指数点

最小变动单位 0.2 点

合约月份 当月、下月及随后两个季月

交易时间 9:30-11:30,13:00-15:00

每日价格最大波动限制 上一交易日结算价的±10%

最低交易保证金 合约价值的 8%

最后交易日 合约到期月份的第三个周五

交割日期 同最后交易日

交割方式 现金交割

交易代码 IF

中证 500 股指期货(IC)的合约内容如表 3.2 所示:

11
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

表 3.2 中证 500 指数期货合约表

中证 500 指数期货合约表

合约标的 中证 500 指数

合约乘数 每点 200 元

报价单位 指数点

最小变动单位 0.2 点

合约月份 当月、下月及随后两个季月

交易时间 9:30-11:30,13:00-15:00

每日价格最大波动限制 上一交易日结算价的±10%

最低交易保证金 合约价值的 8%

最后交易日 合约到期月份的第三个周五

交割日期 同最后交易日

交割方式 现金交割

交易代码 IC

中国金融期货交易所提供股指期货合约的交易信息,整理发现月份合约从上
市到退市的时间有所不同,如下表 3.3 所示,季月合约的上市交易时间约为 160
天左右,时间跨度约为 9 个月,特别地,3 月和 6 月合约是跨年度合约;非季月
合约的上市时间约为 60 天左右,时间跨度约为 3 个月,特别地,1 月和 2 月合
约为跨年合约。
截至 2016 年 3 月 2 日,沪深 300 指数期货已运行 1426 个交易日。
截至 2016 年 3 月 4 日,上证 50 股指期货和中证 500 股指期货已运行 217 个交易
日。

12
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

表 3.3 月份合约上市时间表

各合约交易时间安排表

1 月合约 上一年 11 月中旬至本年 1 月下旬

2 月合约 上一年 12 月中旬至本年 2 月下旬

3 月合约 上一年 7 月中旬至本年 3 月下旬

4 月合约 本年 2 月下旬至 4 月下旬

5 月合约 本年 3 月下旬至 5 月下旬

6 月合约 上一年 10 月中旬至本年 6 月下旬

7 月合约 本年 5 月下旬至 7 月下旬

8 月合约 本年 6 月下旬至 8 月下旬

9 月合约 本年 1 月下旬至 9 月下旬

10 月合约 本年 8 月下旬至 10 月下旬

11 月合约 本年 9 月下旬至 11 月下旬

12 月合约 本年 4 月下旬至 12 月下旬

上市时间交错,上市品种更迭,加大了市场观察的难度。大智慧软件提供的
期货合约连续指数能自动对合约更替的交易信息进行更新。例如:当前上市的合
约分别是 IF1605,IF1606,IF1609,IF1612。那么 IF 当月连续指数对应的是 IF1605,
IF 下月连续指数对应的是 IF1606,IF 当季连续对应的是 IF1609,IF 下季连续对
应的是 IF1612。若 IF1105 合约到期(5 月第三个星期五),则 IF1105 合约进入平
仓交割,下一交易日可供交易的合约变为 IF1606,IF1607,IF1609,IF1612,依
次对应当月连续,下月连续,当季连续,下季连续。

3.2 LVQ 神经网络识别模式规划

3.2.1 LVQ 识别模式设计

学习向量化(LVQ)神经网络系统通常用于数据分类[17],本文要研究的是股
指期货市场的交易数据会对股票市场的走势产生何种影响,其实质便是依据当日
13
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

的股指期货市场的各项交易数据和下一日的股票市场的上涨和下跌进行分类,通
俗来讲即是“今天股指期货市场的各项指标所预示的是明天股票市场的涨和
跌”,以下图 3.4 作为例子展示。研究发现,分类模型在风险预测中的使用也能
够取得较好的效果[18]。进一步剔除或者增减若干输入向量,将得到的结果进行比
较,研究基于 LVQ 神经网络的分析,哪些向量会对股票市场的走势产生主导影
响,哪些向量又是次要影响因素[19]。

6 月 6 日期货 6 月 7 日股票 6 月 6 日股票


市场日行情 市场涨跌趋势 市场日行情

图 3.4

3.2.2 LVQ 识别模式构建

根据上文对股指期货合约的分析,为了涵盖沪深两市指数整体走势且不存在
样本重叠,选择沪深 300 指数期货(IF)和中证 500 股指期货(IC)作为研究对象。
大智慧软件提供的期货合约四组连续指数日线(当月连续、下月连续、当季连续、
下季连续)分别作为为 LVQ 神经网络分析的样本数据。每组日线单独为一个样
本数据集,IF 的样本共有四组,每组包含自 2010 年 4 月 16 日至 2016 年 3 月 2
日的 1426 个交易日数据,IC 每组样本共有四组,每组包含自 2015 年 4 月 16 日
至 2016 年 3 月 4 日的 217 个交易日数据。为保持数据的原始性,样本数据均未
剔除在交割日成交量笔数、持仓量、持仓量均线为零的数据。
期货合约连续指数作为输入向量;输出向量则是股票指数与前一天指数比较
是上涨,以 1 表示;股票市场与前一天指数比较是下跌,以 2 表示。训练数据进
行 LVQ 神经网络的训练,对测试结果的分析则选用测试测试集数据。识别模式
步骤如图 3.5 所示:

图 3.5 识别模式步骤图

每组样本数据经 LVQ 神经网络训练和测试三次。三次输入向量均不同,输


出向量相同,即 1 或 2。IF 股指期货合约的输出向量是沪深 300 指数的上升或下
跌,IC 股指期货合约对应的输出向量是中证 500 指数的上升或下跌。三次输入
向量的组合分别是:第一次全部输入向量,依次分别为开盘价、最高价、最低价、
收盘价、成交量、成交额、成交笔数、持仓量及其均线、价差及其均线[20],第二
14
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

次“价”输入向量(开盘价、最高价、最低价、收盘价、价差及其均线),第三
次“量”输入向量(成交量、成交额、成交笔数、持仓量及其均线)
。价差是指
当日沪深 300 指数期货的升贴水。
此外,根据中金所提供的月份合约日行情数据,中证 500 指数合约由于上市
时间较短,
IC 各月份合约可供分析的样本数据过少,例如截止 2016 年 3 月 4 日,
IC1603 上市交易时间是 152 天,IC1609 上市交易时间是 30 天,因此仅在 3.3.9
对 IF 的部分月份合约进行训练和测试,选择中金所提供的日行情交易数据作为
样本,以期发现月份期货合约的交易信息对股票指数走势的影响。以上是 LVQ
神经网络对期货交易数据训练和测试的整体规划。

3.3 LVQ 神经网络的训练和测试

3.3.1 IF 当月连续日线的训练和测试

(1)第一次 LVQ 数据处理。将训练集 1300 个股指期货的交易数据输入网


络,对网络进行训练。结束训练后,将测试集 126 个数据输入网络,得到相应的
输出结果。
表 3.4 IF 当月连续全部向量结果表

IF 当月连续全部向量输出结果表

IF 样本总数 1426 指数上升 722 指数下降 704

训练集 1300 指数上升 656 指数下降 644

测试集 126 指数上升 66 指数下降 60

指数上升确认 7 上升错判 59 正确率 10.6061%


指数下降确认 55 下降错判 5 正确率 91.6667%
输出结果如表 3.4 所示:对于沪深 300 下降的情况,能够分类识别正确的概
率是 91.6667%,远高于识别沪深 300 指数上升的情况。

15
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

图 3.6 训练误差图 图 3.7 ROC 图

图 3.6 是 IF 当月连续全部向量训练误差图,表示在迭代 46 次时训练误差达


到最低值 0.47538,由于期货数据分类股票指数走势时,只有下降方向的准确率
高于 90%,所以训练的误差没能达到 0.1。图 3.7 是 IF 当月连续全部向量训练数
据和所有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,只有下降方
向的准确率高于 90%,上升方向识别准确率低,所以,组 1 和组 2 ROC 曲线下
的面积只有 0.2 左右。

图 3.8 混淆矩阵图

图 3.8 是 IF 当月连续全部向量的训练集混淆矩阵和所有数据的混淆矩阵。
如图 3.8 所示类别 1 即对指数上升的分类识别正确率低,656 个指数上升的数据
有 82 个识别正确;类别 2 即对沪深 300 指数下降的分类识别正确率高,644 个
指数下降的数据有 585 个识别正确。
根据上述分析,可以推测股指期货当月连续交易信息对股票指数下降的情况
更敏感,远超于对股票指数上升的情况的敏感度。普通投资者更适合使用期货数
据对未来股票市场的下降趋势进行辅助判别。
(2)第 2 次 LVQ 数据处理。剔除输入向量中有关“量”的输入向量,仅保
16
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

留有关“价”的输入向量。再进行 LVQ 神经网络训练测试和测试,输出结果如


表 3.5 所示,在剔除相关的“量”输入向量后,“价”输入向量作用于 LVQ 神经网
络的效果有所改变,对沪深 300 指数上升类的识别正确率提高至 30.7692%,但
是沪深 300 指数下降类的识别正确率却降低至 65.5738%。
表 3.5 IF 当月连续“价”向量结果表

IF 当月连续“价”向量输出结果表
IF 样本总数 1426 指数上升 722 指数下降 704
训练集 1300 指数上升 657 指数下降 643
测试集 126 指数上升 65 指数下降 61
指数上升确认 20 上升错判 45 正确率 30.7692%
指数下降确认 40 下降错判 21 正确率 65.5738%

图 3.9 训练误差图 图 3.10 混淆矩阵图

图 3.9 是 IF 当月连续“价”向量训练误差图,表示在迭代 414 次时训练误


差达到最低值 0.47,由于期货数据分类股票指数走势时,指数上升和下降识别正
确率均低,所以训练的误差没能达到 0.1。图 3.10 是 IF 当月连续“价”向量训
练集混淆矩阵和所有数据的混淆矩阵。如图 3.10 所示,类别 1 即对指数上升和
类别 2 即对指数下降的分类识别正确率低,类别 1 中 657 个数据有 428 个分类错
误,类别 2 中 643 个数据有 202 个分类错误。
结果表明:“价”输入向量对股票指数上升的敏感度高于“量”输入向量,
但是仍不足以作为判别的依据,而其对股票指数下降敏感度低于“量”输入向量,
不可单独脱离“量”进行判别分析。
(3)第三次 LVQ 数据处理。剔除开盘价、最高价、最低价、收盘价、价差
及其均线与“价”相关的输入向量,仅保留日期、成交量、成交额、成交笔数、
持仓量及其均线与“量”相关的输入向量。再进行神经网络训练和测试,输出结
果如表 3.6 所示:

17
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

表 3.6 IF 当月连续“量”向量结果表

IF 当月连续“量”向量输出结果表

IF 样本总数 1426 指数上升 722 指数下降 704

训练集 1300 指数上升 659 指数下降 641

测试集 126 指数上升 63 指数下降 63

指数上升确认 4 上升错判 59 正确率 6.3492%

指数下降确认 58 下降错判 5 正确率 92.0635%

图 3.11 训练误差图 图 3.12 ROC 图

图 3.11 为 IF 当月连续“量”向量训练误差图,表示在迭代 497 次时训练误


差达到最低值 0.46923,由于期货数据分类股票指数走势时,仅有指数下降识别
正确率高,所以训练的误差没能达到 0.1。图 3.12 为 IF 当月连续“量”向量训
练数据和所有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,只有下
降方向的准确率高于 90%,上升方向识别准确率低,所以,组 1 和组 2 ROC 曲
线下的面积只有 0.2 左右。

图 3.13 混淆矩阵图

18
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

图 3.13 为 IF 当月连续“量”向量训练集混淆矩阵和所有数据的混淆矩阵。
如图所示,类别 1 即对指数上升分类识别正确率低,类别 1 中 653 个数据有 550
个分类错误,类别 2 即对指数下降的分类识别正确率类高,类别 2 中 657 个数据
有 73 个分类错误。
本次 LVQ 神经网络的输入向量包括成交量、成交额、成交笔数、持仓量及
其均线的交易数据,通过上表可知,在剔除相关的“价”输入向量后,“量”输
入向量的效果等同于全部输入向量应用于 LVQ 神经网络的效果,由此可见,IF
当月连续的“量”输入向量对股票指数的下跌的敏感度很大,超于“价”输入向
量。但是“量”输入向量对股票指数的上升却敏感度低。

3.3.2 IF 下季连续日线的训练和测试

(1)第一次 LVQ 数据处理。将训练集 1300 个股指期货的交易数据输入网


络,对网络进行训练。结束训练后,将测试集 126 个数据输入网络。输出结果如
表 3.7 所示:
表 3.7 IF 下季连续全部向量结果表

IF 下季连续全部向量输出结果表

IF 样本总数 1426 指数上升 722 指数下降 704

训练集 1300 指数上升 656 指数下降 644

测试集 126 指数上升 66 指数下降 60

指数上升确认 5 上升错判 61 正确率 7.5758%

指数下降确认 55 下降错判 5 正确率 91.6667%

图 3.14 训练误差图 图 3.15 ROC 图

图 3.14 是 IF 下季连续全部向量训练误差图,表示在迭代 89 次时训练误差


达到最低值 0.47462,由于期货数据分类股票指数走势时,仅有指数下降识别正
19
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

确率高,所以训练的误差没能达到 0.1。图 3.15 是 IF 下季连续全部向量为训练


数据和所有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,只有下降
方向的准确率高于 90%,上升方向识别准确率低,因此,组 1 和组 2 ROC 曲线
下的面积只有 0.2 左右。

图 3.16 混淆矩阵图

图 3.16 是 IF 下季连续全部向量训练集混淆矩阵和所有数据的混淆矩阵。由
如图所示:类别 1 即对指数上升分类识别正确率低,类别 1 中 656 个数据有 587
个分类错误,类别 2 即对指数下降的分类识别正确率类高,类别 2 中 644 个数据
有 36 个分类错误。本次输出结果类似于 IF 当月连续全部向量输出结果,整体向
量对股票指数下降趋势的敏感度优于上升趋势。
(2)第 2 次 LVQ 数据处理。剔除输入向量中有关“量”的输入向量,仅保
留有关“价”的输入向量。再进行 LVQ 神经网络训练测试和测试,输出结果如
表 3.8 所示:
表 3.8 IF 下季连续“价”向量结果表

IF 下季连续“价”向量输出结果表

IF 样本总数 1426 指数上升 722 指数下降 704

训练集 1300 指数上升 656 指数下降 644

测试集 126 指数上升 66 指数下降 60

指数上升确认 23 上升错判 43 正确率 34.8485%

指数下降确认 36 下降错判 24 正确率 60%

本次输出结果类似于 IF 当月“价”向量输出结果,在剔除“量”向量后,
LVQ 神经网络对上升趋势判断的准确率获得提升,同时对下降趋势判断的准确
20
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

率有所下降,由此可见,在 IF 下季连续交易数据中,“价”输入向量对股票指
数的走势的涨跌均有一定的识别力,但是其准确率都低于 80%,因此不是具有主
导作用的自向量。
(3)第三次 LVQ 数据处理。剔除与“价”相关的输入向量,仅保留成交量、
成交额、成交笔数、持仓量及其均线与“量”相关的输入向量。再进行神经网络
训练和测试,输出结果如表 3.9 所示:
表 3.9 IF 下季连续“量”向量结果表

IF 下季连续“量”向量输出结果表

IF 样本总数 1426 指数上升 722 指数下降 704

训练集 1300 指数上升 656 指数下降 644

测试集 126 指数上升 66 指数下降 60

指数上升确认 7 上升错判 59 正确率 10.6061%

指数下降确认 54 下降错判 6 正确率 90%

图 3.17 训练误差图 图 3.18 混淆矩阵图

图 3.17 是 IF 下季连续“量”向量为训练误差图,表示在迭代 313 次时训练


误差达到最低值 0.47385,由于期货数据分类股票指数走势时,指数上升识别正
确率均低,所以训练的误差没能达到 0.1。图 3.18 是 IF 下季连续“量”向量训
练集混淆矩阵和所有数据的混淆矩阵。如图所示:类别 1 即对指数上升分类识别
正确率低,类别 1 中 656 个数据有 593 个分类错误,类别 2 即对指数下降的分类
识别正确率类高,类别 2 中 644 个数据有 32 个分类错误。
本次输出结果类似于 IF 当月连续“量”向量输出结果,经过多次验证,“量”
向量对于股票指数走低的分类识别结果的正确率维持在 90%左右,而对股票指数
上升的判别正确率过低,仅仅在 10%左右。
小结:综合以上的两组数据的神经网络训练,可以发现 IF 当月连续和 IF 下

21
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

季连续交易数据具有共同的特征,它们的“量”输入向量对沪深 300 指数走低的


识别率高,可作为判别和预测股票市场未来走势的主要依据,也可作为对股票市
场风险预警机制的重要期货市场指标。但是“价”向量在股票市场走势的识别无
特别明显的优势,而且在与“量”向量神经元竞争中处于劣势。而且,不可忽视
的是两组数据所代表的时间范围分别是“当月”和“下季”,当月合约正处于交
割月份,合约价格会逐渐收敛于标的物(沪深 300 指数)的价格,所以此时的成
交量和持仓量都会有较大的变化;下季合约距其交割月份的时间较充足,因此,
常常会被中短期套保或套利者选择作为投资工具,因此,下季合约的持仓量和成
交量处于波动状态。但是,造成上述现象的现实原因仍需进一步讨论。

3.3.3 IF 下月连续日线的训练和测试

(1)第一次 LVQ 数据处理。将训练集 1300 个股指期货的交易数据输入网


络,对网络进行训练。结束训练后,将测试集 126 个数据输入网络,得到相应的
输出结果。输出结果如表 3.10 所示:
表 3.10 IF 下月连续全部向量结果表

IF 下月连续全部向量输出结果表

IF 样本总数 1426 指数上升 722 指数下降 704

训练集 1300 指数上升 648 指数下降 652

测试集 126 指数上升 74 指数下降 52

指数上升确认 8 上升错判 66 正确率 10.8108%

指数下降确认 55 下降错判 5 正确率 91.6667%

图 3.19 训练误差图 图 3.20 混淆矩阵图

图 3.19 是 IF 下月连续全部向量训练误差图,表示在迭代 277 次时训练误差


达到最低值 0.47615,由于期货数据分类股票指数走势时,指数上升识别正确率
均低,所以训练的误差没能达到 0.1。图 3.20 是 IF 下月连续全部向量训练集混
22
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

淆矩阵和所有数据的混淆矩阵。如图所示,类别 1 即对指数上升分类识别正确率
低,类别 1 中 648 个数据有 561 个分类错误,类别 2 即对指数下降的分类识别正
确率类高,类别 2 中 652 个数据有 61 个分类错误。
本次输出结果显示 IF 下月连续合约的全部输入变量适合对沪深 300 指数的
下降分类,其正确率可达 90%以上,对沪深 300 指数的上升识别能力弱,正确率
仅有 10%左右。
(2)第 2 次 LVQ 数据处理。剔除输入向量中有关“量”的输入向量,仅保
留有关“价”的输入向量。再进行 LVQ 神经网络训练测试和测试,输出结果如
表 3.11 所示:
表 3.11 IF 下月连续“价”向量结果表

IF 下月连续“价”向量输出结果表

IF 样本总数 1426 指数上升 722 指数下降 704

训练集 1300 指数上升 657 指数下降 643

测试集 126 指数上升 65 指数下降 61

指数上升确认 33 上升错判 32 正确率 50.7692%

指数下降确认 37 下降错判 24 正确率 60.6557%

图 3.21 训练误差图 图 3.22 混淆矩阵图

图 3.21 是 IF 下月连续“价”向量训练误差图,表示在迭代 114 次时训练误


差达到最低值 0.46769,由于期货数据分类股票指数走势时,指数上升、下降识
别正确率均低,所以训练的误差没能达到 0.1。图 3.22 是 IF 下月连续“价”向
量训练集混淆矩阵和所有数据的混淆矩阵。如图所示:类别 1 即对指数上升分类
识别正确率低,类别 1 中 657 个数据有 355 个分类错误,类别 2 即对指数下降的
分类识别正确率类高,类别 2 中 643 个数据有 323 个分类错误。
在剔除“量”向量后, LVQ 神经网络在“价”向量输入后,对沪深 300 指

23
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

数上升的分类正确率显著提高,由 10%提升至 50%,但是对下降的分类正确率


由 90%下降至 60%。
(3)第三次 LVQ 数据处理。剔除与“价”相关的输入向量,仅保留与“量”
相关的输入向量。再进行神经网络训练和测试,输出结果如表 3.12 所示:
表 3.12 IF 下月连续“量”向量结果表

IF 下月连续“量”向量输出结果表

IF 样本总数 1426 指数上升 722 指数下降 704

训练集 1300 指数上升 657 指数下降 643

测试集 126 指数上升 65 指数下降 61

指数上升确认 64 上升错判 1 正确率 98.4615%

指数下降确认 3 下降错判 58 正确率 4.918%

图 3.23 训练误差图 图 3.24 混淆矩阵图

图 3.23 是 IF 下月连续“量”向量训练误差图,表示在迭代 5 次时训练误差


达到最低值 0.49308,由于期货数据分类股票指数走势时,指数下降识别正确率
均低,所以训练的误差没能达到 0.1。图 3.24 是 IF 下月连续“量”向量训练集
混淆矩阵和所有数据的混淆矩阵。如图所示:类别 1 即对指数上升分类识别正确
率高,类别 1 中 657 个数据有 4 个分类错误,类别 2 即对指数下降的分类识别正
确率类低,类别 2 中 643 个数据有 639 个分类错误。
小结:剔除“价”向量后,LVQ 神经网络在“量”向量输入后,输出的结
果与前面 8 次测验均不同,第一次出现了分类沪深 300 指数上升的正确率达到
98%的情况,而识别下降的正确率仅有 5%左右。
IF 下月连续合约的交割时间为下个月,其价格变化反应了期货市场对短期
内股票市场股票指数的预期,同时这一时段了也集中了大量的套期保值者,套利
者,投机者,股指期货的价格和成交量、持仓量起伏波动大,相比收盘价的波动
变化,若出现了巨大的成交量交易,间接体现了人们对短期走势的信心,现货市

24
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

场的走势将受其影响,因此出现了只有“量”向量输入 LVQ 神经网络的输出结


果,分类沪深 300 指数上升的正确率达到了 95%以上。此种情况下并不能单方面
证明股指期货合约中“量”类交易数据对上升敏感,而是当出现巨大成交量的情
况下,极具提升投资者信心的作用,可以推动股票市场上涨。如下图 3.25 和 3.26
所示:下月连续合约所对应的收盘价和成交量的波动幅度不同,高收盘价与高成
交量并不一一对应。

收盘 成交量
6000
3000000
4000
2000000
2000 1000000
0 0
1

221

441

771

991
111

331

551
661

881

1211
1321
1101

1
103
205

613

1021
1123
307
409
511

715
817
919

1225
1327
图 3.25 IF 下月连续收盘价统计图 图 3.26 IF 下月连续成交量统计图

3.3.4 IF 隔季连续日线的训练和测试

(1)第一次 LVQ 数据处理。将训练集 1300 个股指期货的交易数据输入网


络,对网络进行训练。结束训练后,将测试集 126 个数据输入网络,得到相应的
输出结果。输出结果如表 3.13 所示:
表 3.13 IF 隔季连续全部向量结果表

IF 隔季连续全部向量输出结果表

IF 样本总数 1426 指数上升 722 指数下降 704


训练集 1300 指数上升 656 指数下降 644
测试集 126 指数上升 66 指数下降 60
指数上升确认 30 上升错判 36 正确率 45.4545%
指数下降确认 30 下降错判 30 正确率 50%

图 3.27 训练误差图 图 3.28 ROC 图

25
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

图 3.27 是 IF 隔季连续全部向量训练误差图,表示在迭代 309 次时训练误差


达到最低值 0.46462,由于期货数据分类股票指数走势时,指数上升、下降识别
正确率均低,所以训练的误差没能达到 0.1。图 3.28 是 IF 隔季连续全部向量训
练数据和所有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,下降方
向和上升方向识别准确率低,因此,组 1 和组 2 ROC 曲线下的面积只有 0.2 左右。

图 3.29 混淆矩阵图

图 3.29 是 IF 隔季连续全部向量训练集混淆矩阵和所有数据的混淆矩阵。如
图 3.29 所示类别 1 即对指数上升分类识别正确率低,类别 1 中 656 个数据有 368
个分类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 644 个数据
有 249 个分类错误。
(2)第 2 次 LVQ 数据处理。剔除输入向量中有关“量”的输入向量,仅保
留有关“价”的输入向量。进行 LVQ 神经网络训练测试和测试,输出结果如表
3.14 所示:
表 3.14 IF 隔季连续“价”向量结果表

IF 隔季连续“价”向量输出结果表
IF 样本总数 1426 指数上升 722 指数下降 704
训练集 1300 指数上升 664 指数下降 636
测试集 126 指数上升 58 指数下降 68
指数上升确认 31 上升错判 27 正确率 53.4483%
指数下降确认 36 下降错判 32 正确率 52.9412%

26
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

图 3.30 训练误差图 图 3.31 ROC 图


图 3.30 是 IF 隔季连续“价”向量训练数据和所有数据的 ROC 曲线图,由
于期货数据分类股票指数走势时,下降方向和上升方向识别准确率低,所以,组
1 和组 2 ROC 曲线下的面积只有 0.2 左右。图 3.31 是 IF 隔季连续“价”向量训
练误差图,表示在迭代 49 次时训练误差达到最低值 0.46846,由于期货数据分类
股票指数走势时,指数上升、下降识别正确率均低,所以训练的误差没能达到
0.1。
(3)第三次 LVQ 数据处理。剔除与“价”相关的输入向量,仅保留与“量”
相关的输入向量。再进行神经网络训练和测试,输出结果如表 3.15 所示:
表 3.15 IF 隔季连续“量”向量结果表

IF 隔季连续“量”向量输出结果表

IF 样本总数 1426 指数上升 722 指数下降 704


训练集 1300 指数上升 657 指数下降 643
测试集 126 指数上升 65 指数下降 61
指数上升确认 25 上升错判 40 正确率 38.4615%
指数下降确认 35 下降错判 26 正确率 57.377%

图 3.32 训练误差图 图 3.33 ROC 图

图 3.32 是 IF 隔季连续“量”向量训练误差图,表示在迭代 256 次时训练误


差达到最低值 0.47385,由于期货数据分类股票指数走势时,指数上升、下降识
别正确率均低,所以训练的误差没能达到 0.1。图 3.33 是 IF 隔季连续“量”向
27
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

量训练数据和所有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,下


降方向和上升方向识别准确率低,组 1 和组 2 ROC 曲线下的面积只 0.2 左右。

图 3.34 混淆矩阵图

图 3.34 是 IF 隔季连续“量”向量训练集混淆矩阵和所有数据的混淆矩阵。
如图所示即对指数上升分类识别正确率低,类别 1 中 657 个数据有 393 个分类错
误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 643 个数据有 226 个
分类错误。
小结:综合 IF 隔季连续合约的三次测试结果,无论是否剔除“价”向量或
者“量”向量,LVQ 神经网络对沪深 300 指数走势上涨和下跌的识别正确率均
没有显著的变化,识别沪深 300 指数下降的正确率维持在 50%至 60%之间,识
别上升的正确率在剔除“量”变量后略微下降。IF 隔季连续合约的交割时间与当月
时间相距 6 个月左右,短期套期保值、套利、投机等投资者会较少选择隔季连续
合约作为工具和投资对象,因此 IF 隔季连续合约各项交易信息,对当下沪深 300
指数的影响不显著,但是进行长期投资则不可忽略。

3.3.5 IC 当月连续日线的训练和测试

(1)第一次 LVQ 数据处理。将训练集 180 个股指期货的交易数据输入网络,


对网络进行训练。结束训练后,将测试集 37 个数据输入网络,得到相应的输出
结果。输出结果如表 3.16 所示:
表 3.16 IC 当月连续全部向量结果表

IC 当月连续全部向量输出结果表

IC 样本总数 217 指数上升 123 指数下降 94

训练集 180 指数上升 103 指数下降 77

测试集 37 指数上升 20 指数下降 17

指数上升确认 17 上升错判 3 正确率 85%

指数下降确认 1 下降错判 16 正确率 5.8824%


28
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

图 3.35 训练误差图 图 3.36 ROC 图

图 3.35 是 IC 当月连续全部向量训练误差图,表示在迭代 291 次时训练误差


达到最低值 0.39444,由于期货数据分类股票指数走势时,指数下降识别正确率
低,所以训练的误差没能达到 0.1。图 3.36 是 IC 当月连续全部向量训练数据和
所有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,下降方向识别准
确率低,所以,组 1 和组 2 ROC 曲线下的面积在 0.2-0.4 之间。

图 3.37 混淆矩阵图

图 3.37 是 IC 当月连续全部向量训练集混淆矩阵和所有数据的混淆矩阵。如
图所示类别 1 即对指数上升分类识别正确率高,类别 1 中 103 个数据有 13 个分
类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 77 个数据有 59
个分类错误。
中证 500 股指期货上市时间不足一年,运行机制并不完全成熟,可供训练和
测试的数据较少,但上市初期的市场影响可以为后来的交易规则调整提供分析基
础。结果显示 IC 股指期货交易信息对中证 500 指数敏感性强,对上涨正确识别
的概率达到 85%,而其对下降的敏感性低,仅有 6%左右的正确率。
(2)第二次 LVQ 数据处理。将训练集 180、测试集 37 个数据输入网络,
得到相应的输出结果。输出结果如表 3.17 所示:

29
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

表 3.17 IC 当月连续“价”向量结果表

IC 当月连续“价”向量输出结果表

IC 样本总数 217 指数上升 123 指数下降 94

训练集 180 指数上升 101 指数下降 79

测试集 37 指数上升 22 指数下降 15

指数上升确认 11 上升错判 11 正确率 50%

指数下降确认 3 下降错判 12 正确率 20%

图 3.38 训练误差图 图 3.39 ROC 图

图 3.38 是 IC 当月连续“价”向量训练误差图,表示在迭代 64 次时训练误


差达到最低值 0.36667,由于期货数据分类股票指数走势时,指数下降、上升识
别正确率低,所以训练的误差没能达到 0.1。图 3.39 是 I C 当月连续“价”向量
训练数据和所有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,下降
方向识别准确率低,因此,组 1 和组 2ROC 曲线下的面积在 0.6 左右。

图 3.40 混淆矩阵图

图 3.40 是 IC 当月连续“价”向量训练集混淆矩阵和所有数据的混淆矩阵。

30
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

如图所示看出类别 1 即对指数上升分类识别正确率低,类别 1 中 101 个数据有


41 个分类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 79 个数
据有 34 个分类错误。
剔除“量”向量后,仅有“价”向量输入 LVQ 神经网络后得到分类结果如
上表 3.17 所示,虽然仍是对中证 500 指数上升的识别正确率较高 50%,但低于
全部向量输入时的识别正确率。“价”向量对指数下降的识别正确率高于全部向
量,但是仍不足以单独作为判断下降的依据。
(3)第三次 LVQ 数据处理。将训练集 180 个股指期货的交易数据输入网络,
对网络进行训练。结束训练后,将测试集 37 个数据输入网络,得到相应的输出
结果。输出结果如表 3.18 所示:
表 3.18 IC 当月连续“量”向量结果表

IC 当月连续“量”向量输出结果表

IC 样本总数 217 指数上升 123 指数下降 94


训练集 180 指数上升 101 指数下降 79
测试集 37 指数上升 22 指数下降 15
指数上升确认 16 上升错判 6 正确率 72.7273%
指数下降确认 2 下降错判 13 正确率 13.3333%

图 3.41 训练误差图 图 3.42 ROC 图

图 3.41 是 IC 当月连续“量”向量训练误差图,表示在迭代 8 次时训练误差


达到最低值 0.41667,由于期货数据分类股票指数走势时,指数下降、上升识别
正确率低,所以训练的误差没能达到 0.1。图 3.42 是 IC 当月连续“量”向量训练
数据和所有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,下降方向
识别准确率低,组 1 和组 2 ROC 曲线下的面积在 0.3 左右。

31
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

图 3.43 混淆矩阵图

图 3.43 是 IC 当月连续“量”向量训练集混淆矩阵和所有数据的混淆矩阵。
如图所示类别 1 即对指数上升分类识别正确率高,类别 1 中 101 个数据有 17 个
分类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 79 个数据有
20 个分类错误。剔除“价”变量后,仅有的“量”变量输入 LVQ 神经网络,对
于中证 500 指数走势的识别结果与以上两次测试大体一致,“量”向量对指数上
升的敏感度大于下降。
小结:IC 股指期货当月连续交易信息数据对中证 500 指数上升走势更为敏
感,无论是“价”向量、“量”向量或是“价”、“量”结合,都可以对上身走
势进行高正确率的判断,可作为投资者判断的辅助。但是对下降走势识别的正确
率过低,造成该种结果的原因有多种。中金所对上市初期的 IC 股指期货的价格
变动幅度和成交量、持仓量均有严格控制。影响中证 500 指数变化的因素繁多,
股指期货的市场表现只是一方面的原因。

3.3.6 IC 下月连续日线的训练和测试

(1)第一次 LVQ 数据处理。将训练集 180 个股指期货的交易数据输入网络,


对网络进行训练。结束训练后,将测试集 37 个数据输入网络,得到相应的输出
结果。输出结果如下表 3.19 所示:
表 3.19 IC 下月连续全部向量结果表

IC 下月连续全部向量输出结果表
IC 样本总数 217 指数上升 123 指数下降 94
训练集 180 指数上升 98 指数下降 82
测试集 37 指数上升 25 指数下降 12
指数上升确认 24 上升错判 1 正确率 96%
指数下降确认 1 下降错判 11 正确率 8.3333%

32
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

图 3.44 训练误差图 图 3.45 混淆矩阵图

图 3.44 是 IC 下月连续全部向量训练误差图,表示在迭代 162 次时训练误差


达到最低值 0.44444,由于期货数据分类股票指数走势时,指数下降识别正确率
低,所以训练的误差没能达到 0.1。图 3.45 是 IC 下月连续全部向量训练集混淆
矩阵和所有数据的混淆矩阵。如图所示类别 1 即对指数上升分类识别正确率高,
类别 1 中 98 个数据有 2 个分类错误,类别 2 即对指数下降的分类识别正确率类
低,类别 2 中 82 个数据有 78 个分类错误。
结果显示:
IC 股指期货交易数据对中证 500 指数走势上涨识别的正确率高,
但是对指数下降的识别正确率很低。IC 下月连续合约交易数据仍然显示了对指
数上涨的高度敏感性。
(2)第二次 LVQ 数据处理。将训练集 180 个股指期货的交易数据输入网络,
对网络进行训练。结束训练后,将测试集 37 个数据输入网络,得到相应的输出
结果。输出结果如表 3.20 所示:
表 3.20 IC 下月连续“价”向量结果表

IC 下月连续“价”向量输出结果表

IC 样本总数 217 指数上升 123 指数下降 94

训练集 180 指数上升 100 指数下降 80

测试集 37 指数上升 23 指数下降 14

指数上升确认 11 上升错判 12 正确率 47.8261%

指数下降确认 8 下降错判 6 正确率 57.1429%

33
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

图 3.46 训练误差图 图 3.47 ROC 图

图 3.46 是 IC 下月连续“价”向量训练误差图,表示在迭代 9 次时训练误差达


到最低值 0.38333,由于期货数据分类股票指数走势时,指数下降、上升识别正
确率低,所以训练的误差没能达到 0.1。图 3.47 是 IC 下月连续“价”向量训练数据
和所有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,上升、下降方
向识别准确率较低,所以,组 1 和组 2ROC 曲线下的面积在 0.5 左右。
图 3.48 是 IC 下月连续“价”向量训练集混淆矩阵和所有数据的混淆矩阵。由
如图所示类别 1 即对指数上升分类识别正确率低,类别 1 中 100 个数据有 29 个
分类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 80 个数据有
43 个分类错误。剔除“量”向量后,保留的“价”向量在对指数走势的分类识别方
面保持了相似的正确率,但是正确率均不足 60%。使其在判断中证 500 指数未来
走势仍有不足,需要改进。

图 3.48 混淆矩阵图

(3)第三次 LVQ 数据处理。将训练集 180,测试集 37 个数据输入网络,


得到相应的输出结果。输出结果如表 3.21 所示:

34
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

表 3.21 IC 下月连续“量”向量结果表

IC 下月连续“量”向量输出结果表
IC 样本总数 217 指数上升 123 指数下降 94
训练集 180 指数上升 102 指数下降 78
测试集 37 指数上升 21 指数下降 16
指数上升确认 19 上升错判 2 正确率 90.4762%
指数下降确认 1 下降错判 15 正确率 6.25%

图 3.49 训练误差图 图 3.50 混淆矩阵图

图 3.49 是 IC 下月连续“量”向量训练误差图,表示在迭代 12 次时训练误差


达到最低值 0.41667,由于期货数据分类股票指数走势时,指数下降识别正确率
低,所以训练的误差没能达到 0.1。图 3.50 是训练集混淆矩阵和所有数据的混淆
矩阵。如图所示类别 1 即对指数上升分类识别正确率高,类别 1 中 102 个数据有
2 个分类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 78 个数
据有 74 个分类错误。剔除“价”向量,只保留“量”向量的输出结果如上表 3.20
所示:分类识别中证 500 指数上涨的正确率回升,与全部向量共同识别上升的正
确率持平,达到 90%,但识别下降的正确率明显比仅有价格时的正确率低,可见,
IC 股指期货的“量”向量对指数下降的敏感度过低。
小结:三次测试结果均显示了输入向量对指数下降识别分类的强敏感性,尤
其是“量”输入向量,但是“量”向量对指数上涨的反应不强,甚至覆盖了“价”
向量对指数下降正确识别,同时也显示了“价”因素对市场走势反应弱于“量”因
素。

3.3.7 IC 下季连续日线的训练和测试

(1)第一次 LVQ 数据处理。将训练集 180 个股指期货的交易数据输入网络,


对网络进行训练。结束训练后,将测试集 37 个数据输入网络,得到相应的输出
结果。输出结果如表 3.22 所示:

35
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

表 3.22 IC 下季连续全部向量结果表

IC 下季连续全部向量输出结果表

IC 样本总数 217 指数上升 123 指数下降 94


训练集 180 指数上升 102 指数下降 78
测试集 37 指数上升 21 指数下降 16
指数上升确认 18 上升错判 3 正确率 85.7143%
指数下降确认 1 下降错判 15 正确率 6.25%

图 3.51 训练误差图 图 3.52 ROC 图

图 3.51 是 IC 下季连续全部向量训练误差图,表示在迭代 99 次时训练误差


达到最低值 0.37222,由于期货数据分类股票指数走势时,指数下降识别正确率
低,所以训练的误差没能达到 0.1。图 3.52 是 IC 下季连续全部向量训练数据和
所有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,下降方向识别准
确率较低,因此,组 1 和组 2 ROC 曲线下的面积在 0.2 左右。

图 3.53 混淆矩阵图

图 3.53 是 IC 下季连续全部向量训练集混淆矩阵和所有数据的混淆矩阵。由
如图所示类别 1 即对指数上升分类识别正确率高,类别 1 中 102 个数据有 4 个分
类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 78 个数据有 64
36
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

个分类错误。
(2)第二次 LVQ 数据处理。将训练集 180 个股指期货的交易数据输入网络,
对网络进行训练。结束训练后,将测试集 37 个数据输入网络,得到相应的输出
结果。输出结果如表 3.23 所示:
表 3.23 IC 下季连续“价”向量结果表

IC 下季连续“价”向量输出结果表

IC 样本总数 217 指数上升 123 指数下降 94


训练集 180 指数上升 108 指数下降 72
测试集 37 指数上升 15 指数下降 22
指数上升确认 13 上升错判 2 正确率 86.6667%
指数下降确认 6 下降错判 16 正确率 27.2727%

图 3.54 训练误差图 图 3.55 ROC 图

图 3.54 是 IC 下季连续“价”向量训练误差图,表示在迭代 41 次时训练误


差达到最低值 0.35,由于期货数据分类股票指数走势时,指数下降识别正确率低,
所以训练的误差没能达到 0.1。图 3.55 是 IC 下季连续“价”向量训练数据和所
有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,下降方向识别准确
率较低,所以,组 1 和组 2 ROC 曲线下的面积在 0.3 左右。

图 3.56 混淆矩阵图
37
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

图 3.56 是 IC 下季连续“价”向量训练集混淆矩阵和所有数据的混淆矩阵。
类别 1 即对指数上升分类识别正确率高,类别 1 中 108 个数据有 18 个分类错误。
(3)第三次 LVQ 数据处理。将训练集 180 个股指期货的交易数据输入网络,
对网络进行训练。结束训练后,将测试集 37 个数据输入网络,得到相应的输出
结果。输出结果如表 3.24 所示:
表 3.24 IC 下季连续“量”向量结果表

IC 下季连续“量”向量输出结果表
IC 样本总数 217 指数上升 123 指数下降 94
训练集 180 指数上升 101 指数下降 79
测试集 37 指数上升 22 指数下降 15
指数上升确认 18 上升错判 4 正确率 81.8182%
指数下降确认 1 下降错判 14 正确率 6.6667%

图 3.57 训练误差图 图 3.58 ROC 图

图 3.57 是 IC 下季连续“量”向量训练误差图,表示在迭代 11 次时训练误


差达到最低值 0.39444,由于期货数据分类股票指数走势时,指数下降识别正确
率低,所以训练的误差没能达到 0.1。图 3.58 是 IC 下季连续“量”向量训练数据
和所有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,下降方向识别
准确率较低,所以,组 1 和组 2 ROC 曲线下的面积在 0.2 左右。

38
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

图 3.59 混淆矩阵图

图 3.59 为 IC 下季连续“量”向量训练集混淆矩阵和所有数据的混淆矩阵。
如图所示类别 1 即对指数上升分类识别正确率高,类别 1 中 101 个数据有 8 个分
类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 79 个数据有 65
个分类错误。
小结:IC 下季连续合约对中证 500 指数走势的预测效果大体一致,三次训
练和测试,分别输入全部向量,“价”向量,“量”向量后,发现对指数上升走
势的识别始终保持较高的正确率,但是三种输入向量对指数下跌走势均不敏感,
没有一类可以对其的识别分类达到 30%以上的正确率。

3.3.8 IC 隔季连续日线的训练和测试

(1)第一次 LVQ 数据处理。将训练集 180 个交易数据,训练集 37 个数据


输入网络,得到相应的输出结果。输出结果如表 3.25 所示:
表 3.25 IC 隔季连续全部向量结果表

IC 隔季连续全部向量输出结果表

IC 样本总数 217 指数上升 123 指数下降 94


训练集 180 指数上升 106 指数下降 74

测试集 37 指数上升 17 指数下降 20


指数上升确认 14 上升错判 3 正确率 82.3529%
指数下降确认 3 下降错判 17 正确率 15%

39
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

图 3.60 训练误差图 图 3.61 ROC 图

图 3.60 是 IC 隔季连续全部向量训练误差图,表示在迭代 10 次时训练误差


达到最低值 0.37778,由于期货数据分类股票指数走势时,指数下降识别正确率
低,所以训练的误差没能达到 0.1。图 3.61 是 IC 隔季连续全部向量训练数据和
所有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,下降方向识别准
确率较低,所以,组 1 和组 2 ROC 曲线下的面积在 0.2 左右。

图 3.62 混淆误差图

图 3.62 是 IC 隔季连续全部向量训练集混淆矩阵和所有数据的混淆矩阵。由
如图所示类别 1 即对指数上升分类识别正确率高,类别 1 中 106 个数据有 6 个分
类错误,类别 2 即对指数下降的分类识别正确率类低,类别 2 中 78 个数据有 62
个分类错误。
(2)第二次 LVQ 数据处理。训练集 180 个交易数据、测试集 37 个交易数
据输入网络,进行训练、测试。输出结果如表 3.26 所示:

40
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

表 3.26 IC 隔季连续“价”向量结果表

IC 隔季连续“价”向量输出结果表

IC 样本总数 217 指数上升 123 指数下降 94


训练集 180 指数上升 101 指数下降 79
测试集 37 指数上升 22 指数下降 15
指数上升确认 15 上升错判 7 正确率 68.1818%
指数下降确认 6 下降错判 9 正确率 40%

图 3.63 训练误差图 图 3.64 ROC 图

图 3.63 是 IC 隔季连续“价”向量训练误差图,表示在迭代 12 次时训练误差


达到最低值 0.36667,由于期货数据分类股票指数走势时,指数下降、上升识别
正确率低,所以训练的误差没能达到 0.1。图 3.64 是 IC 隔季连续“价”向量训练
数据和所有数据的 ROC 曲线图,由于期货数据分类股票指数走势时,下降、上
升方向识别准确率较低,因此,组 1 和组 2 ROC 曲线下的面积在 0.4 左右。

图 3.65 混淆矩阵图

图 3.65 是 IC 隔季连续“价”向量训练集混淆矩阵和所有数据的混淆矩阵。类
别 1 即对指数上升分类识别正确率低,类别 1 中 101 个数据有 26 个分类错误,
类别 2 即对指数下降的分类识别正确率类低。
41
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

(3)第三次 LVQ 数据处理。训练集 180 个交易数据、测试集 37 个交易数


据输入网络,进行训练、测试。将输出结果如表 3.27 所示:
表 3.27 IC 隔季连续“量”向量结果表

IC 隔季连续“量”向量输出结果表

IC 样本总数 217 指数上升 123 指数下降 94


训练集 180 指数上升 101 指数下降 79
测试集 37 指数上升 22 指数下降 15
指数上升确认 21 上升错判 1 正确率 95.4545%
指数下降确认 4 下降错判 11 正确率 26.6667%

图 3.66 训练误差图 图 3.67 ROC 图

图 3.66 是 IC 隔季连续“量”向量训练误差图,表示在迭代 207 次时训练误差


达到最低值 0.41667。图 3.67 是 IC 隔季连续“量”向量训练数据和所有数据的 ROC
曲线图,由于期货数据分类股票指数走势时,下降方向识别准确率较低,所以,
组 1 和组 2 ROC 曲线下的面积在 0.2 以下。

图 3.68 混淆矩阵图

如图 3.68 所示,类别 1 即对指数上升分类识别正确率高,类别 2 即对指数


下降的分类识别正确率类低。

42
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

小结:IC 隔季连续合约交易数据对中证 500 指数走势的预测整体一致,类


似于 IC 下季连续合约。但区别在于,IC 隔季连续合约“价”向量对指数走势下降
的识别分类正确率是 40%,优于 IC 下季连续合约。IC 下季连续合约的“量”,
“价”交易数据仍然具备对指数下降的敏感度,对指数上升的识别力不足。“量”
因素在整个 LVQ 神经网络的作用下,其主导作用强于“价”因素。综合 2015 年
夏季股指期货市场表现,中证 500 股指期货在小盘股、创业板出现上涨的时候,
反而被做空砸盘,引发了投资者的恐慌。我国投资者在心理上并未完全接受做空
机制,因此对股指期货市场的交易信息反应极端。通过以上分析,即从另一面验
证对于股指期货市场而言,量能的变化更利于股市的上涨,反而对股市下降敏感
度低。

3.3.9 IF 月份合约的训练和测试举例

一年中的每个月份均有旧合约到期和新合约上市,回顾上文分析可知季月合
约上市交易时间比其他普通月份合约长,而且 3 月合约上市时间是跨年度的,9
月合约非跨年度的。2014 年和 2015 年是 IF 股指期货合约上市的第五年和第六
年,同时在这两年中,我国股市大起大落的现象引人深思。因此,下面分别选取
跨年度的 IF1403 与 IF1503 合约组合,非跨年度 IF1409 与 IF1409 合约组合,进
行 LVQ 训练和测试,以发现单月合约“价”向量和“量”向量对现货市场走势
的影响。
根据中国金融期货交易所的日行情数据样本,IF1403 合约上市时间是 2013
年 7 月 22 日至 2014 年 3 月 21 日,共 162 个交易日;
IF1503 合约上市时间是 2014
年 7 月 21 日至 2015 年 3 月 20 日,共 162 个交易日;IF1409 合约上市时间是 2014
年 1 月 20 日至 2014 年 9 月 19 日,共 165 个交易日,
IF1509 合约上市时间是 2014
年 1 月 19 日至 2014 年 9 月 18 日,共 165 个交易日。“价“输入向量分别是开盘
价、最高价、最低价、收盘价、结算价、涨跌 1(今收盘价-前结算价)、涨跌 2
(今结算价-前结算价)
,“量”输入向量分别是成交量、成交金额、持仓量。输出
向量则是股票指数与前一天指数比较是上涨,以 1 表示;股票市场与前一天指数
比较是下跌,以 2 表示。

43
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

表 3.28-1 IF1409+IF1509“量”向量结果表

IF1409+IF1509“量”向量输出结果表

IF 样本总数 330 指数上升 177 指数下降 153


训练集 290 指数上升 155 指数下降 135
测试集 40 指数上升 22 指数下降 18
指数上升确认 21 上升错判 1 正确率 95.4545%
指数下降确认 2 下降错判 16 正确率 11.1111%

图 3.69 训练误差图 图 3.70 混淆矩阵图

图 3.69 是 IF1409+IF1509“量”向量训练误差图,表示在迭代 55 次时训练


误差达到最低值 0.45826,由于期货数据分类股票指数走势时,指数下降识别正
确率低,所以训练的误差没能达到 0.1。图 3.70 是 IF1409+IF1509“量”向量训
练集混淆矩阵和所有数据的混淆矩阵。如图所示类别 1 即对指数上升分类识别正
确率高,类别 1 中 155 个数据有 1 个分类错误,类别 2 即对指数下降的分类识别
正确率类低,类别 2 中 135 个数据有 132 个分类错误。
表 3.28-2 IF1409+IF1509“价”向量结果表

IF1409+IF1509“价”向量输出结果表
IF 样本总数 330 指数上升 177 指数下降 153
训练集 290 指数上升 155 指数下降 135
测试集 40 指数上升 22 指数下降 18

指数上升确认 8 上升错判 14 正确率 36.3636%


指数下降确认 7 下降错判 11 正确率 38.8889%

44
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

图 3.71 训练误差图 图 3.72 混淆矩阵图

图 3.71 是 IF1409+IF1509“价”向量训练误差图,表示在迭代 459 次时训练


误差达到最低值 0.43103,由于期货数据分类股票指数走势时,指数下降、上升
识别正确率低,所以训练的误差没能达到 0.1。图 3.72 是 IF1409+IF1509“价”向
量混淆矩阵图。类别 1 即对指数上升识别正确率低,类别 1 中 155 个数据有 84
个分类错误,类别 2 即对指数下降的识别正确率类低,类别 2 中 135 个数据有
44 个分类错误。如表 3.28-1 和表 3.28-2 所示 IF 股指期货 9 月合约的“量”因素在
识别沪深 300 指数走势上升方面,具有很高的正确率,而“价”向量对指数的走势
的识别能力弱。但由于“量”向量输入 LVQ 网络后在下降方面识别的正确率低,
所以单纯依据“量”因素判断股票指数走势,容易陷入误区,不能及时发现股指下
降的迹象。
表 3.29-1 IF1403+IF1503“量”向量结果表

IF1403+IF1503“量”向量输出结果表

IF 样本总数 324 指数上升 176 指数下降 148


训练集 290 指数上升 154 指数下降 136

测试集 34 指数上升 22 指数下降 12

指数上升确认 20 上升错判 2 正确率 90.9091%

指数下降确认 2 下降错判 10 正确率 16.6667%

45
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

表 3.29-2 IF1403+IF1503“价”向量结果表

IF1403+IF1503“价”向量输出结果表

IF 样本总数 324 指数上升 176 指数下降 148


训练集 290 指数上升 153 指数下降 137

测试集 34 指数上升 23 指数下降 11

指数上升确认 13 上升错判 10 正确率 56.5217%


指数下降确认 5 下降错判 6 正确率 45.4545%

通过表 3.29-1 和 3.29-2 的比较,可以发现 IF 股指期货 3 月合约的“量”因


素仍然在分类识别指数上升的方面起主导作用,虽然“价”因素对沪深 300 指数
的走势方向的分类识别具备正确率高于 IF 股指期货 9 月合约,但是还没达到主
要判别的标准。“量”因素在分类识别指数下降的正确率过低,因此,股指期货
市场的“量”行情容易对投资者造成误导,使其无法过于关注上涨而忽略下降趋
势。

46
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

第四章 结论及展望

本文通过对沪深 300 指数合约和中证 500 股指期货的日交易行情连续指数,


以及沪深 300 指数合约部分季月合约的日行情数据进行 LVQ 神经网络训练和测
试,经过研究分析,可以得到如下结论:
第一,通过综合比较股指期货合约的四种连续系数(当月连续、下月连续、
下季连续及隔季连续)和季月合约,发现“量”因素—成交量、成交额、成交笔
数、持仓量对股票市场指数走势影响很大,能够大概率正确预测股票指数单方向
下降或是上升趋势。
第二,在应用 LVQ 神经网络的前提下,“价”因素—开盘价、最高价、最
低价、收盘价、价差等因素对现货市场走势识别并不显著,因此投资者在根据股
指期货分析股票市场走势时,不可过分依赖“价”因素。股指期货市场的双向交易
机制和到期交割规则,使其“量”因素在技术分析中具有举足轻重的作用。
第三,本文分别对 IF、IC 股指期货合约的连续指数、季月合约的“量、价”
因素进行了判别比较,发现时间远近也影响“量”、“价”的交互作用。不同类
型的股指期货“量”因素识别股指走势上涨或下跌方向也不同。例如:IC 期货合
约的各个连续指数和 IF 季月合约的量类别变量识别股指上升正确率高,IF 当月
连续和下季连续的量类别因素对股指下降识别正确率高;IF 下月连续的价类别
和量类别因素能分别识别股指上升和下降。
不仅股指期货的市场表现会影响股票市场价格指数,从短、中、长期来看,
股票市场受到多重因素的共同作用。本文仅以股指期货市场为考衡量标准,未能
概括全部影响股票市场变化的因素。所以,本文的不足及对后续研究的展望如下:
第一、本文仅选用了 LVQ 神经网络对股指期货的交易数据进行分析,虽然
LVQ 简单易行,不需对原始数据进行预处理,但股指期货日行情数据间仍存在
较大的差距,需要用更多的算法改进神经网路的初始值和权值。原始 LVQ 神经
网络仅能分类识别股票指数走势的单方向,应对神经网络进行改进,使其在识别
股指走势双方向上均有良好效果。第二、中证 500 和上证 50 股指期货上市交易
时间较短,其交易规模和价格波动仍受到严格把控,可供训练和测试的数据较少,
随着市场的发展,应加强对其交易信息的收集、训练和测试。第三、本文对股指
期货技术分析仅停留在量、价、时的选择和剔除上,对于三者间的交互作用探讨
较少,识别的输出向量仅有股指的上涨和下跌,而有关上涨和下跌的空间则没有
进行研究,在后续研究中应对空的变化幅度予以重视,增加输出变量的种类。
47
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

参考文献

[1] 王朱莹. 正确认识套期保值制度[J]. 中国证券报, 2015, 07.


[2] 徐颢华, 顾海峰. 股指期货短期价格预测模型研究--基于差分 BP 神经网络模型[J].金融
教学与研究,2014, 3: 27-33.
[3] 刘文井. 沪深 300 股指期货基本功能实证研究[D].硕士学位论文, 长沙理工大学, 2011,
5:18-32.
[4] 王海军. 基于神经网络的期货价格预测方法研究[D]. 硕士学位论文, 首都师范大学,
2009,5:30-49.
[5] 黄添勇. 股指期货的推出对我国股市波动性和流动性的变动影响及对策研[D]. 博士学
位论文, 厦门大学, 2011, 5: 51-66.
[6] 周明生. 股指期货是股市长期稳定器[J]. 中国金融, 2011, 8:36-37.
[7] 李 成 武, 陈蕾 . 不 同 趋势 下 股指 期 货价 格 发现 贡 献度 研究 [J]. 经 济与 研 究, 2014,
28(5):46-50.
[8] 史峰, 王小川, 郁磊. MATLAB 神经网络 30 个案例分析[M]. 北京航空航天大学出版社,
2010, 4: 189-190.
[9] 周开利, 康耀红. 神经网络模型及其 MATLAB 仿真程序设计[M]. 清华大学出版社,
2005, 7: 120-125.
[10] 律方成, 张波. LVQ 神经网络在 GIS 局部放电类型识别中的应用[J].电测与仪表, 2014,
51(18): 112-115.
[11] 丁硕, 常晓恒, 巫庆辉, 魏洪峰, 杨友林. 基于 LVQ 神经网络风电机组齿轮箱故障诊
断研究[J]. 现代电子技术, 201, 37(10) : 150-152.
[12] 刘文轩, 严凤, 田霖, 代明. 基于 LVQ 神经网络的配电网故障定位方法[J]. 电力系统
保护与控制, 2012, 40(5) : 90-95.
[13] 贾铁军, 刘泓漫. 基于 MA 及 LVQ 神经网络的智能 NIPS 模型与实现[J]. 小型微型计算
机系统, 2012, 33(8): 1837-1840.
[14] 张超, 魏三强, 胡建秀, 梁西陈. 基于粒子群算法优化 LVQ 神经网络的应用研究[J]. 贵
州大学学报, 2013, 30(5) : 95-98.
[15] 张晓丹. 基于免疫克隆算法的 LVQ 神经网络研究及其在化工工业故障诊断过程中的应
用[D]. 硕士学位论文, 东华理工大学, 2013, 5:18-26.
[16] 伍南林, 钟晓兵. 沪深 300 股指期货风险的预警研究[J]. 统计与决策, 2012, 19 :170-173.
[17] Ayse DemirhanInan Guler, Combining stationary wavelet transforms and self-organizing
maps for brain MR image segmentationg [J]. Engineering Applications of Artificial
Intelligence, 2011, 24(2): 24-29.
[18] Kohonen T. Self-organizing Maps, 3rd Edition. Berlin: Springer Verlag, 2001: 88-101.
[19] Gonzalez A I, Grana M, Anjou A D. An analysis of the GLVQ algorithm [J]. IEEE
Transactions on Neural Networks, 1995, 6(5): 1013-1015.
[20] 邓泽林,谭冠政,叶吉祥等.一种用于乳腺癌诊断的免疫分类算法[J].中南大学学报:自然
科学版, 2010, 41(4): 1485-1490.

48
兰州大学硕士学位论文 基于 LVQ 对股指期货交易信息分析的股票指数走势识别研究

致 谢

时光匆匆,三年的硕士研究生生活马上就要结束了。毕业将至,在此毕业论
文完成之际,我在此由衷的感谢所有帮助过我的人,希望在今后的生活中,当你
们需要帮助的时候也会得到温暖的援手。
感谢我的父母给予我生命,哺育我成长,人生的道路上充满困难和挑战,正
是因为父母的爱护和支持,才能不断前行。
感谢我的导师严定琪副教授,严老师循序渐进的指引我完成课题的研究。他
对待学术严谨负责,平时为人平易近人,其超凡的人格魅力,不仅在学业上给予
我指导,也会在将来的生活中予以我启迪。在这里,我谨向严老师表示我诚挚的
感谢与祝福!谢谢您的宽容与指导,让我除却浮躁,经历思考和启示,更加深切
地体会到学习的精髓和意义。
感谢我的同学杜艳芳、高承泽,谢谢你们在我完成论文期间无私的帮助和暖
心的鼓励,一起陪我度过了艰辛的论文写作过程,这将是我一生珍藏的记忆。感
谢我的朋友陈雯吉,黎红英,我们能够理解彼此,敞开胸怀,一起度过了很多美
好的时光。生活上,室友张曼,白秀总是帮我排忧解难,谢谢你们。感谢师门的
同学们,因为海内知己,所以天涯比邻。
三年的时光中失去很多,但得到的更多,感谢兰大三年的校园生活,不忘初
心,方得始终。
最后,向参加论文评审和答辩的专家们致以我深深的谢意。

49

You might also like