Professional Documents
Culture Documents
词语之间的关系。ChatGPT 能够进行连续对话,综合上下文内容进行交流,能完成翻译、撰写邮件、代码等任务。该
模型相较于传统 LSTM 模型的改进之处在于其引用了 Transformer 模型,对输入数据的不同部分给予不同权重。
ChatGPT 之所以能够获得如此高的智能水平,参数数量提升所带来的涌现现象(Scaling Law)和加入 RLHF(人类反
馈的强化学习)所带来的对于人类偏好理解的提升起到了重要作用。RLHF 训练共分为 3 步,首先聘请 40 名标注员对
指令进行标注,对模型进行微调。然后对模型的不同输出结果进行排序,使其更符合人类预期,并利用排序结果训练
一个打分模型(Reward Model)。最终采样新的指令作为输入数据,根据打分模型进一步优化模型的输出结果。结合
打分模型训练,得到最终的 ChatGPT 模型。
ChatGPT 在量化研究领域同样拥有广泛的使用前景,我们以最常见的因子挖掘作为测试场景,考察模型经过一定的提
示后,能否给出符合需求的结果。在中低频领域,ChatGPT 给出了价和量的变异系数因子,我们利用 5 日滚动数据构
建因子并进行周度调仓测试。发现因子 IC 指标表现较好,但多头组超额收益较低,难以成功构建投资策略。
另外,我们令 ChatGPT 模型尝试利用高频数据构建出独特因子,并限定其数据使用范围为委托价和委托量。模型经过
一定指导后给出了买卖盘力量因子,经过测试发现买卖盘力量差异因子在日频上表现优异,多头年化超额收益率达到
17.29%,但因子衰减速度较快。为符合交易实际,我们针对买盘和卖盘力量因子分别降至周频进行测试,发现虽然因
子整体多空单调性一般,但多头组合表现尚可,多头年化超额收益率分别为 9.77%和 10.20%。最终,我们利用相对表
现较好的卖盘力量因子构建中证 1000 指数增强策略。发现在单边千分之二的手续费率下,策略的年化超额收益率为
7.17%,信息比率为 0.57。
此外我们对于 ChatGPT 代码能力进行测试,发现针对常用的量化研究所需框架、函数等能较准确的给出结果,但使用
时需要注意代码细节,确保其符合实际需求。对模型所给代码进行微调可以大幅提升研究效率。
1、 ChatGPT 模型具有一定的随机性,在部分情况下可能回答错误,不符合用户需求与认知,并影响到用户判断。
2、 以上因子测试结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在失效的风险。
3、 策略依据一定的假设通过历史数据回测得到,当交易成本提高或其他条件改变时,可能导致策略收益下降甚至出
现亏损。
敬请参阅最后一页特别声明 1
金融工程专题报告
内容目录
一、ChatGPT 模型介绍及原理解析 ................................................................. 4
1.1 大语言模型与模型演进历程 ............................................................... 4
1.2 ChatGPT 模型表现优异背后的逻辑 ......................................................... 5
二、ChatGPT 提示工程介绍及使用指南 ............................................................. 5
2.1 Prompt 提示公式 ........................................................................ 6
2.2 提示工程分类 ........................................................................... 7
2.3 思维链提示(Chain-of-Thought Prompting) ............................................... 8
三、ChatGPT 因子挖掘实战 ...................................................................... 10
3.1 周频变异系数因子构建与测试结果 ........................................................ 10
3.2 高频买卖盘力量因子构建与测试结果 ...................................................... 12
3.3 ChatGPT 代码输出测试:因子测试与组合优化 .............................................. 15
四、总结 ...................................................................................... 17
风险提示 ...................................................................................... 18
图表目录
图表 1: ChatGPT 模型演进历程 ................................................................... 4
图表 2: RLHF(人类反馈的强化学习)过程示意图 .................................................. 5
图表 3: ChatGPT 生成因子示例 1 ................................................................. 6
图表 4: ChatGPT 生成因子示例 2 ................................................................. 7
图表 5: ChatGPT 生成因子示例 3 ................................................................. 7
图表 6: 提示工程分类示例及说明 ................................................................ 7
图表 7: ChatGPT 情感分析示例 1 ................................................................. 8
图表 8: ChatGPT 情感分析示例 2 ................................................................. 8
图表 9: A 因子 IC 指标示例 1 .................................................................... 8
图表 10: B 因子 IC 指标示例 2 ................................................................... 8
图表 11: ChatGPT 思维链提示示例 1 .............................................................. 9
图表 12: ChatGPT 思维链提示示例 2 .............................................................. 9
图表 13: ChatGPT 思维链提示示例 3 .............................................................. 9
图表 14: ChatGPT 思维链提示示例 4 ............................................................. 10
图表 15: ChatGPT 思维链提示示例 5 ............................................................. 10
图表 16: ChatGPT 生成因子示例 4 ............................................................... 10
敬请参阅最后一页特别声明 2
金融工程专题报告
敬请参阅最后一页特别声明 3
金融工程专题报告
来源:
《On the Comparability of Pre-trained Language Models》
(Matthias,2020)
,《Evaluating Large Language Models Trained on Code》
(Mark Chen,2021)
,
OpenAI,BFT 智能机器人研究公众号,国金证券研究所
敬请参阅最后一页特别声明 4
金融工程专题报告
来源:https://openai.com/blog/chatgpt,国金证券研究所
大语言模型能够处理的任务极其广泛,人类与其交流的灵活度和自由度也达到了空前的高度。然而如何正确与其对话、
进行合适的提示对于获取最终需要的结果至关重要。提示工程(Prompt Engineering)作为一门新兴学科,主要用于
开发和优化语言模型中的提示,有效地将 ChatGPT 用于各种应用和研究主题。掌握并应用好提示工程的技能,不仅能
够提高使用人工智能系统的准确性和效率,也能够降低成本并提升使用体验。对于研究人员而言,也有助于更好地理
敬请参阅最后一页特别声明 5
金融工程专题报告
来源:ChatGPT,国金证券研究所
以此为基础,我们可以进一步限定因子类别、构建方式和使用数据,最终得到一个符合我们基本需要的因子。在下图
示例中,我们将提示的【指令部分】进行拓展,针对其回答中可能存在的偏差进行限制,从而大大提升了因子的有效
性。
敬请参阅最后一页特别声明 6
金融工程专题报告
来源:ChatGPT,国金证券研究所 来源:ChatGPT,国金证券研究所
可以看出,经过详细的、严格的限制后,模型已经能给出一些基本符合要求的因子。在示例 2 中,模型不仅正确使用
了逐笔成交数据中的字段,且根据提示中的限制条件,给出了使用计算均值的方法将因子进行降频的操作。示例 3 中,
因子的构建方式可以明显看出模型参考了一些现有文献和研究结果,在其已有知识的基础上进行一定变形、组合得到
了新的选股因子。
2.2 提示工程分类
除标准化的提示工程之外,我们可以使用多种类型的提示方式,使模型完成不同类型任务,满足用户的各类需求。
图表6:提示工程分类示例及说明
提示类型 提示示例 提示类型说明
将一些【新信息】与关于【特定主题】的现有知识
知识生成提示 使用模型里预先存在的知识,生成新的信息或回答问题。
结合,生成新的知识。
请对以下产品评论进行情感分析,并将其分类为积
情感分析提示 让模型判断一段输入文本的情感色彩或态度。
极、消极或中立【插入评论】
。
使用强化学习将以下文本【文本】从【插入语言】 通过向模型提供一组输入和奖励,并允许其根据所接受的
强化学习提示
翻译为【插入语言】
。 奖励调整行为,从而让模型从过去的行为中学习。
对抗性提示 生成难以被分类为具有【插入情感】情感的文本。 让模型生成的文本难以生成与所需一致的文本。
来源:国金证券研究所
针对其中情感分析类型,我们截取了两段不同的新闻热点,以供模型识别。发现由于神经网络模型本身具有一定的随
机性,当输入文本没有特别明确的情感词时,模型给出的结果会有出一定的不确定性。但整体而言,仍能保证一定的
准确率。
敬请参阅最后一页特别声明 7
金融工程专题报告
来源:国金证券研究所 来源:国金证券研究所
敬请参阅最后一页特别声明 8
金融工程专题报告
图表11:ChatGPT 思维链提示示例 1
来源:ChatGPT,国金证券研究所
来源:ChatGPT,国金证券研究所 来源:ChatGPT,国金证券研究所
敬请参阅最后一页特别声明 9
金融工程专题报告
来源:ChatGPT,国金证券研究所 来源:ChatGPT,国金证券研究所
由以上案例可以说明,ChatGPT 在量化研究领域展现出了一定的实用价值。我们此处以常见的因子挖掘作为研究方向,
考察经过一定程度的提示(prompt) ,模型是否能给出符合需求的结果。
3.1 周频变异系数因子构建与测试结果
首先我们在中低频上维度上对 ChatGPT 的因子挖掘能力进行测试。此处考虑基于量价数据让 ChatGPT 模型给出一些独
特、原创的因子。
图表16:ChatGPT 生成因子示例 4
来源:ChatGPT,国金证券研究所
该因子在收盘价和成交量两个领域分别计算其变异系数,并相乘得到一个综合的选股因子。用来衡量股票的波动性和
敬请参阅最后一页特别声明 10
金融工程专题报告
流动性。此外,我们考虑对因子进行适当变形,将两者变异系数相除,得到新的变异系数因子(LI2VLI)。利用日频
的量价数据,取过去 5 天的价格和成交量变异系数进行计算,对该因子进行构建:
𝜎𝑝𝑟𝑖𝑐𝑒
𝐿𝐼 =
𝜇𝑝𝑟𝑖𝑐𝑒
𝜎𝑣𝑜𝑙
𝑉𝐿𝐼 =
𝜇𝑣𝑜𝑙
𝐿𝐼𝑥𝑉𝐿𝐼 = LI ∗ VLI
𝐿𝐼2𝑉𝐿𝐼 = LI/VLI
我们同样在 2016 年至 2022 年 8 月的区间范围内,中证 1000 指数成份股上进行测试。以周度频率进行调仓,每周初
开盘价作为买入价格,每周最后一个交易日收盘价作为卖出价格,因子的 IC 指标如下。初步来看,四个因子 IC 的 T
值均大于 2,IC 均值从 2.79%至 5.36%不等。可以说明价格和成交量的波动率均为越低越好,基本符合低波动异象的
情况。
图表17:ChatGPT 变异系数因子 IC 指标(周频)
因子 平均值 标准差 最小值 最大值 风险调整后 IC T 统计量
LI -5.36% 12.25% -47.76% 43.04% -0.44 -8.07
VLI -2.79% 6.83% -34.60% 18.19% -0.41 -7.53
LIxVLI -5.29% 9.09% -33.49% 33.76% -0.58 -10.74
LI2VLI -3.11% 12.24% -35.95% 49.06% -0.25 -4.69
来源:ChatGPT,Wind,国金证券研究所
我们根据十分位组合构建出了因子的多空组合净值,此处展示了多空净值曲线和几个关键指标。
图表18:ChatGPT 变异系数因子多空组合净值(周频)
2
1.8
1.6
1.4
1.2
0.8
0.6
0.4
0.2
0
2016/1/4 2017/1/4 2018/1/4 2019/1/4 2020/1/4 2021/1/4 2022/1/4
来源:ChatGPT,Wind,国金证券研究所
图表19:ChatGPT 变异系数因子多空组合指标(周频)
因子 年化收益率 波动率 夏普比率 最大回撤 多头组合年化超额收益率
LI 8.35% 16.42% 0.51 31.43% -1.09%
VLI 8.40% 9.75% 0.86 20.04% 2.75%
LIxVLI 8.89% 12.46% 0.71 27.58% 0.74%
敬请参阅最后一页特别声明 11
金融工程专题报告
来源:ChatGPT,国金证券研究所 来源:ChatGPT,国金证券研究所
敬请参阅最后一页特别声明 12
金融工程专题报告
𝐵𝐹𝑜𝑟𝑐𝑒 − 𝑆𝐹𝑜𝑟𝑐𝑒
𝐵𝑆𝐹𝑜𝑟𝑐𝑒 =
𝐵𝐹𝑜𝑟𝑐𝑒 + 𝑆𝐹𝑜𝑟𝑐𝑒
我们首先对因子进行了日频调仓的测试,测试时间范围为 2016 年 1 月-2022 年 8 月,股票范围为所有中证 1000 指数
成份股。以次日开盘价作为买入价格,测试结果如下:
图表22:ChatGPT 买卖盘力量因子 IC 指标(日频)
因子 平均值 标准差 最小值 最大值 风险调整后 IC T 统计量
BForce -0.24% 15.51% -52.36% 44.69% -0.02 -0.61
SForce -1.02% 14.39% -52.61% 42.27% -0.07 -2.87
BSForce 1.13% 6.49% -21.02% 26.37% 0.17 7.00
来源:ChatGPT,上交所,深交所,Wind,国金证券研究所
可以看出,在日频的调仓频率下,表现相对较好的是卖盘力量因子(SForce)和买卖盘力量差异因子(BSForce),两
者的 T 统计量均大于 2,IC 均值也在 1%以上。我们根据十分位组合构建出了因子的多空净值,此处展示了多空净值曲
线和一些关键指标。
图表23:ChatGPT 买卖盘力量因子多空组合净值(日频)
9
0
2016/1/4 2017/1/4 2018/1/4 2019/1/4 2020/1/4 2021/1/4 2022/1/4
来源:ChatGPT,上交所,深交所,Wind,国金证券研究所
图表24:ChatGPT 买卖盘力量因子多空组合指标(日频)
因子 年化收益率 波动率 夏普比率 最大回撤 多头组合年化超额收益率
BForce 18.74% 19.47% 0.96 35.25% 11.17%
SForce 4.06% 18.88% 0.22 38.71% 6.57%
BSForce 37.00% 8.21% 4.51 4.88% 17.29%
来源:ChatGPT,上交所,深交所,Wind,国金证券研究所
敬请参阅最后一页特别声明 13
金融工程专题报告
图表25:ChatGPT 买卖盘力量因子多头组合净值(周频)
3
2.5
1.5
0.5
0
2016/1/4 2017/1/4 2018/1/4 2019/1/4 2020/1/4 2021/1/4 2022/1/4
市场 BForce Sforce
来源:ChatGPT,上交所,深交所,Wind,国金证券研究所
图表26:ChatGPT 买卖盘力量因子多空组合指标(周频)
因子 年化收益率 波动率 夏普比率 最大回撤 多头组合年化超额收益率
BForce 6.52% 20.78% 0.31 38.81% 9.77%
SForce 8.27% 20.66% 0.40 37.18% 10.20%
来源:ChatGPT,上交所,深交所,Wind,国金证券研究所
敬请参阅最后一页特别声明 14
金融工程专题报告
1.6
1.4
1.2
0.8
0.6
0.4
0.2
0
2016/1/10 2017/1/10 2018/1/10 2019/1/10 2020/1/10 2021/1/10 2022/1/10
来源:ChatGPT,上交所,深交所,Wind,国金证券研究所
敬请参阅最后一页特别声明 15
金融工程专题报告
来源:ChatGPT,国金证券研究所 来源:ChatGPT,国金证券研究所
由上图可以看出,由于经过大量数据、文献、代码等海量知识的训练,ChatGPT 模型已经能较完整的写出一个因子测
试框架,包括了我们所需要的基本功能,如 IC 值指标计算、十分组测试等。然而,细究发现,我们推测由于其所接
受到的训练大部分来自于海外文献和海外代码,在因子测试的常用操作中与国内业界常用做法并不相符。在经过指导
纠正后,模型也未能准确地将我们的提示理解,可能已经陷入了其“知识盲区” ,最终的 IC 和年化收益率计算方式未
能正确提供相应代码。
因此,若需使用 ChatGPT 实现代码输出以提升效率,需格外注意其细节处理方式是否符合我们预期。在个别情况下可
能会出现一些 bug 仍需我们手动处理。同时,由于代码能否正常运行与我们的数据源格式有很大关系,我们仍需将数
据源调整为 ChatGPT 代码所默认的格式,或者修改相关数据处理代码以获得正常结果。
综上,我们更建议,对于一些并不熟悉的函数和模型,可以快速使用 ChatGPT 帮助我们了解其基本用法和思路。在
敬请参阅最后一页特别声明 16
金融工程专题报告
来源:ChatGPT,国金证券研究所 来源:ChatGPT,国金证券研究所
敬请参阅最后一页特别声明 17
金融工程专题报告
1、 ChatGPT 模型具有一定的随机性,在部分情况下可能回答错误,不符合用户需求与认知,并影响到用户判断。
2、 以上因子测试结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在失效的风险。
3、 策略依据一定的假设通过历史数据回测得到,当交易成本提高或其他条件改变时,可能导致策略收益下降甚至出
现亏损 。
敬请参阅最后一页特别声明 18
金融工程专题报告
特别声明:
国金证券股份有限公司经中国证券监督管理委员会批准,已具备证券投资咨询业务资格。
形式的复制、转发、转载、引用、修改、仿制、刊发,或以任何侵犯本公司版权的其他方式使用。经过书面授权的引用、刊发,需注明出处为“国金证券股份有限
公司”,且不得对本报告进行任何有悖原意的删节和修改。
本报告的产生基于国金证券及其研究人员认为可信的公开资料或实地调研资料,但国金证券及其研究人员对这些信息的准确性和完整性不作任何保证。本报告
反映撰写研究人员的不同设想、见解及分析方法,故本报告所载观点可能与其他类似研究报告的观点及市场实际情况不一致,国金证券不对使用本报告所包含的材
料产生的任何直接或间接损失或与此有关的其他任何损失承担任何责任。且本报告中的资料、意见、预测均反映报告初次公开发布时的判断,在不作事先通知的情
况下,可能会随时调整,亦可因使用不同假设和标准、采用不同观点和分析方法而与国金证券其它业务部门、单位或附属机构在制作类似的其他材料时所给出的意
见不同或者相反。
本报告仅为参考之用,在任何地区均不应被视为买卖任何证券、金融工具的要约或要约邀请。本报告提及的任何证券或金融工具均可能含有重大的风险,可能
不易变卖以及不适合所有投资者。本报告所提及的证券或金融工具的价格、价值及收益可能会受汇率影响而波动。过往的业绩并不能代表未来的表现。
客户应当考虑到国金证券存在可能影响本报告客观性的利益冲突,而不应视本报告为作出投资决策的唯一因素。证券研究报告是用于服务具备专业知识的投资
者和投资顾问的专业产品,使用时必须经专业人士进行解读。国金证券建议获取报告人员应考虑本报告的任何意见或建议是否符合其特定状况,以及(若有必要)
咨询独立投资顾问。报告本身、报告中的信息或所表达意见也不构成投资、法律、会计或税务的最终操作建议,国金证券不就报告中的内容对最终操作建议做出任
何担保,在任何时候均不构成对任何人的个人推荐。
在法律允许的情况下,国金证券的关联机构可能会持有报告中涉及的公司所发行的证券并进行交易,并可能为这些公司正在提供或争取提供多种金融服务。
本报告并非意图发送、发布给在当地法律或监管规则下不允许向其发送、发布该研究报告的人员。国金证券并不因收件人收到本报告而视其为国金证券的客户。
本报告对于收件人而言属高度机密,只有符合条件的收件人才能使用。根据《证券期货投资者适当性管理办法》,本报告仅供国金证券股份有限公司客户中风险评级
高于 C3 级(含 C3 级)的投资者使用;本报告所包含的观点及建议并未考虑个别客户的特殊状况、目标或需要,不应被视为对特定客户关于特定证券或金融工具的建
议或策略。对于本报告中提及的任何证券或金融工具,本报告的收件人须保持自身的独立判断。使用国金证券研究报告进行投资,遭受任何损失,国金证券不承担
相关法律责任。
若国金证券以外的任何机构或个人发送本报告,则由该机构或个人为此发送行为承担全部责任。本报告不构成国金证券向发送本报告机构或个人的收件人提供
投资建议,国金证券不为此承担任何责任。
此报告仅限于中国境内使用。国金证券版权所有,保留一切权利。
上海 北京 深圳
敬请参阅最后一页特别声明 19