量化|量化新闻情绪把握投资先机

来源: 未知 作者:admin 编辑:admin 2020-06-03 20:18

  新闻数据蕴含大量的信息,对投资具有极高的价值,但由于其非结构化的特征,且缺乏较好的技术手段,利用程度一直有限。本篇报告采用2018年Google团队在“BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding”中提出的 BERT模型实现了对新闻信息的度量与提炼,继而构建了情绪指标,并尝试应用于短期风险防范、杠杆增强策略和行业热点发现等领域。

  伴随互联网的快速发展,信息传播效率大幅提升,而新闻作为信息传播网络中一个关键节点,对于引导和反映社会的作用显著增加。把握住了新闻舆情,即可监测社会思想和情绪的变迁,有助于掌握投资的先机。本文采用自然语言技术处理新闻数据,可实现对信息的准确度量与提炼,同时大幅提升处理效率。

  1)国际咨询事务所格林威治联营公司2018年的调查表明,为另类数据每年花费在10万美金到100万美金的机构占41%,高于100万美金的占比为22%。

  2)2015年,欧洲央行的一份研究报告指出,通过检索Twitter和 Google 中“牛市”和“熊市”两个词出现的频数作为投资者的情绪指标,能够有效预测道琼斯标普500等指数的未来收益率。

  传统的情绪模型依赖于情绪词库的建立,不但工程量巨大,而且容易断章取义,而本文使用的BERT模型能够有效解决这些问题。BERT模型的构建主要包含大数据集预训练和目标数据集微调参数两个步骤。前者的主要原理是通过预测句子中被遮掩的字来学习语言的规律;对于后者,我们根据股票本身的收益率来构建情绪标签。训练完成后,BERT模型可以输出每条新闻的情绪分数,然后对当天所有股票的情绪分数取算术均值来构建当天的情绪指标。

  从情绪指标和中证全指的历史走势来看,情绪指标具有一定的领先作用。经测算,情绪指标相对5日均值的变化值与指数未来1日、3日的在测试数据上的相关系数分别达到0.07和0.09,且正线%的置信概率。

  1)短期风险防范:情绪指标在历史中风险极大的一些时点,例如2015年牛熊转换拐点和2020年1月23日都呈现明显的悲观情绪。

  2)基于情绪指标的杠杆增强策略:在情绪指标相对5日均值变化高于上阈值时做多,低于下阈值时做空。今年以来(截至4月30日),杠杆增强策略相对沪深300指数实现了10.35%的超额收益;

  3)科技板块热点发现:将行业内成分股的情绪分数加总,能够得到行业级别的情绪热度指数,对于科技板块有良好的热点发现功能。例如在电子行业,从2019年5月开启了一段小牛市,以情绪指标作为观察窗口,可以发现在启动阶段,稀土、5G等相关板块的新闻层出不穷且表现出强烈的正面情绪。

关于北方网 | 广告服务 | 诚聘英才 | 联系我们 | 网站律师 | 设为首页 | 关于小狼
| 违法和不良信息举报电话:| 举报邮箱:jubao@staff.enorth.cn | 举报平台

Power by DedeCms
本网站由灵通资讯网-运城灵通资讯版权所有