**小时级情绪指数:**
**日内高频交易初试**
![飞书20220719-174906.jpg](https://dev-media.amazoncloud.cn/5bc3a51cc8994f0c98f7c3d4404ca618_%E9%A3%9E%E4%B9%A620220719-174906.jpg "飞书20220719-174906.jpg")
**目前,一些国外比较流行的高频日内交易做市策略无法有效地在国内市场实施,除了A股的T+1交易规则,撤单率的限制,印花税偏高等,还有一个重要的原因是:由于预测收益周期很短,所以可用到的数据基本就只限于高频的价量数据和少部分实时的另类数据。整体而言,数据的维度相较于低频策略而言要少很多。而基于这部分数据挖掘出有预测能力的因子大多数时候也很有限,因此,不同机构的策略底层因子构成的相似度其实很高。那么当我们的情绪因子已经能够达到小时或分钟级的颗粒度,我们也希望能为高频市场带来一种创新型的因子来应对策略的同质化。**
**由于日内交易具有高频的特点,所以交易成本是一个不容忽视的因素,降低交易成本的方案有很多,包括:提前构造底仓,通过融券,ETF,券商返佣等,但这都属于量化操作层面的手段,所以在本文所有策略中只提供交易频次等数据,并不考虑交易成本等细节。我们意在不同策略回测的过程,发掘数据的特点,构造成熟的因子,为策略构造提供参考意见。**
## **1.雪球**
每一种因子都可以构造相应的最简单的单因子策略,本文展示了一个我们通用的将因子转化为策略最终收益的流程,同时这种流程也可以运用于因子测试中,相比于RankIC更加具有现实性。
##### **1.1策略复现**
以雪球小时级情绪指数因子为例,我们首先采用top10选股策略,并选择一个颗粒度周期,在此一个小时为计算窗口期和调仓周期(按照帖子创建时间拆分进入计算窗口期),进行一轮策略测试,结果如下。
图 1:雪球top10策略累计收益线
![image.png](https://dev-media.amazoncloud.cn/7c48c8713a6f495d921f8c423d8d0622_image.png "image.png")
表 1:雪球小时级 & 天级指标对比
![image.png](https://dev-media.amazoncloud.cn/f462a48453ed447da897981a4aa6a21c_image.png "image.png")
相比于天级,小时级的收益率和最大回撤表现有极大的提高,不排除是由于交易频率上升和持仓周期变短所导致的,且胜率有轻微下降,我们还是期望进一步提高收益,在高频交易条件下为交易成本留出充足的空间。
具体观察样本后,通过时间序列选股分布我们发现早期会出现总样本量小于10的情况,结合现实因素——评论不可能在所有时间段对上市公司实现广泛覆盖,在这种情况下采用top策略,在一些时间点会将情绪指小于0.5的投资者看空股票纳入选股样本,具有忽视情绪指数绝对值的缺陷。
图 2:top10情绪策略选股分布
![image.png](https://dev-media.amazoncloud.cn/b8d568eaa4e742cc97501c4c1147fefa_image.png "image.png")
##### **1.2预处理**
所以在因子和策略颗粒度变细同时也要求有更多的预处理,我们在top选股前先筛选出大于0.5的积极情绪,观察数据特点后加入相应预处理重复第一步进行二轮策略测试,结果如下。
图 3:雪球优化top10策略累计收益线
![image.png](https://dev-media.amazoncloud.cn/5b21acdf4f8f41249dcf1bb3820c74e2_image.png "image.png")
表 2:雪球优化前后指标对比
![image.png](https://dev-media.amazoncloud.cn/43a1b02635da404b9c3a31494c9909d1_image.png "image.png")
预处理使收益,最大回撤,胜率得到进一步的提高了,同时降低了交易频率,意味着交易费用对收益的削减效应更小,这也为我们后期后期优化策略带来思路:如何提高选股效率,同时降低交易频率,双向提高实际收益。由此确认了两个事实:1.在策略程序中加入相应的预处理是有效的,前提是抓住数据特征。2.情绪指数的方向性是具有一定准确性和价值的,即以0.5为分界线的正负情绪与多空在截面上极具对照性。
###
##### **1.3因子测试流程**
图 4:完整因子测试流程
![image.png](https://dev-media.amazoncloud.cn/0d32c6c7e5424e1aa525733975323543_image.png "image.png")
## 2.构建新因子
基于上期报告《指数情绪因子:情绪如何通过策略运用在股指期货投资中》所观察到的现象:“当情绪指数跃迁进另一个波动区间,或是说突破了之前的波动箱体,那么说明巨大的市场转换即将来临”,我们以雪球小时级数据为样本,期望构建出一种以情绪变化为多空信号的因子,以提高因子的选股效率。
###
##### **2.1构建**
可以对情绪指数进行两种加工方法以体现情绪的变化:相较于上一个周期的情绪变化值(本周期情绪指数-上周期情绪指数)和情绪变化率((本周期情绪指数-上周期情绪指数)/上周期情绪指),我们对两种方法都进行了尝试并用top10选股策略选取每一截面上变化前10的股票进行了回测,周期同样为一小时,结果如下。
图 5:多空因子变化值(Chg) & 变化率(pct) 累计收益线
![image.png](https://dev-media.amazoncloud.cn/3d34f028e352434abc864ade8d23ab6b_image.png "image.png")
表 3:两因子指标对比
![image.png](https://dev-media.amazoncloud.cn/e83ca3544ded463789471c3116ab32e4_image.png "image.png")
两种新因子都并不是很有效,但我们注意到他们的最大回撤数值并不在正常范围内,于是我们排列出每个截面收益乘数,发现不管是变化值还是变化率因子,例如变化率因子,其最大回撤的-829.73%只出现了一次,继而回撤率就跳跃到-20%至-10%,且仅出现四次,所以策略的整体风险性并非那么高,而高回撤只是偶然事件,且都出现在策略早期,但这样的偶然性高回撤确实会影响后面的收益累积以及策略的整体评估,我们猜测新因子是否也发生了和情绪指数一样截面样本量不足混入无效选股的情况。
图 6:策略收益乘数升序排列
![image.png](https://dev-media.amazoncloud.cn/386b73f6a1894bb2aaf85f65aa39b4d6_image.png "image.png")
### **2.2阀值筛选**
按照因子测试流程,在策略复现后对新因子进行预处理以期消除这种偶然性高回撤交易,我们在此做的预处理是阀值筛选出所有正向情绪变化的股票,即变化值,变化率大于0,以消除无效选股。
图 7:旧因子(情绪指数) & 预处理后新因子(多空因子)累计收益线
![image.png](https://dev-media.amazoncloud.cn/26e256cbf64d46fcb6fa3136bf636e80_image.png "image.png")
表 4:三因子指标对比
![image.png](https://dev-media.amazoncloud.cn/a3d273062c164a1fa04fefcb262b668f_image.png "image.png")
在预处理后,新因子明显有效了,变化值因子对基础情绪指数因子在各项指标上实现了进一步的提升,证实了我们之前的研究,但变化率因子依旧没有显著效果,我们分析选股样本,发现变化率指标本身具有一定的统计性缺陷,表现为两个方面:1.多空标准不统一,如上所述,受基数影响看多情绪甚至可以多倍扩张,最大值理论上为∞,但受情绪指数区间下限值0的影响,情绪负向变化率绝对值上限为100%,正负方向变化率区间是不统一的,第一,如果应用在多空策略制定统一标准有一定难度;第二,在目前单向做多策略中由于是加权分配仓位,我们不得不把正向∞筛除,而从逻辑上讲这些往往情绪上升最大,更有可能获得alpha的股票,也就意味该因子还没有被我们充分利用,收益还有提高空间。2.受基数也就是上一个周期情绪指数影响巨大,例如情绪值由0.1变化至0.2和由0.7变化至0.8,变化率分别为:100%和14.3%,rank过程中例一的优先级远高于例二,但数据实则以0.5为界,例一保持看空情绪的,例二保持看多情绪的。
###
##### **2.3新因子增强**
按照因子测试流程,在预处理后需结合效果和数据特点进行策略优化,我们已经分析了变化率因子的数据特征,所以,我们对变化率因子,在预处理上加入一道阀值筛选(筛出本期情绪>0.5)作为策略优化,效果如下。
图 8:变化率因子增强累计收益线
![image.png](https://dev-media.amazoncloud.cn/567c7bef9e2c4ac9b7a12aed45a691ba_image.png "image.png")
表 5:变化率因子增强前后指标对比
![image.png](https://dev-media.amazoncloud.cn/4bd43eb7e4ff4285ae34b90318b3a5f9_image.png "image.png")
增强后收益率实现两倍增长,变化率因子和变化值因子变得一样有效。事实证明我们把握住的数据逻辑特点是正确的,对变化后的情绪进行筛选能保证我们的选股一定是情绪由空转多或是多头情绪高涨,这也更近一步证明我们的情绪指数细微的数值差以及以0.5为界的方向性都非常的准确,是一种十分精细的情绪涨落量化结构。
## **3.股吧**
###
##### **3.1全量数据**
股吧数据18年至22年2月表现中规中矩。
图 9:股吧top10策略累计收益线
![image.png](https://dev-media.amazoncloud.cn/073c4d576f9b464aab70b2db54f1156e_image.png "image.png")
表 6:股吧top10策略指标(超对称完整评价体系)
![image.png](https://dev-media.amazoncloud.cn/ea94f420732443b889a69fc8052be7ab_image.png "image.png")
![image.png](https://dev-media.amazoncloud.cn/3e9d8d03514241e8ac2fc355421bedae_image.png "image.png")
##### 3.2新因子
表 7:股吧不同策略收益表
![image.png](https://dev-media.amazoncloud.cn/3a4ffd4f9aa041f7a6c43e4637252aaa_image.png "image.png")
时间跨度同为18年至22年2月,将新因子运用在股吧数据上,其表现出一样的特征,单纯变化率因子无效,但经过正向情绪筛选增强以后,效果大大提升。但整体新因子针对股吧效果都不强,不管是变化值因子还是变化率因子,相同top选股,收益甚至不及简单的top10情绪策略,我们分析原因可能是:新因子选股剔除了一些样本中的高收益资产,可能对于股吧,数据特征和新因子以及筛选机制可能在逻辑上互相排斥,对整体收益产生反作用。