欢迎光临散文网 会员登陆 & 注册

第九课 另类数据简介 -- 零基础量化投资小课堂

2023-05-06 18:10 作者:量化的韭菜  | 我要投稿

本章没有代码环节,全靠我这些年的积累分享一些经验。

随着这几年国内量化投资的兴起,纯价量的因子表现已经越来越差,如果你能看到国内顶级量化私募这几年的产品年报,你会发现他们现在的收益率不如从前,而且很多产品的规模控制的比较死,不愿意募更多钱。

比如下图,收益斜率没有以前大了,而且波动也在变大。

市场不好是一方面原因,另一方面就是行业已经不是最开始那样很容易就能找到赚钱的因子的时代了。最开始吃到螃蟹的一批基金带动了更多人入行,算力的提升导致挖掘因子的速度越来越快,模型迭代也需要越来越快,

之前可能一个简单的动量因子或者反转因子就很容易赚钱,随着挖掘到这个因子的人越来越多,交易也越来越拥挤,因子就会慢慢失效,也可以称这个市场正在被慢慢变成熟。

为了维持高收益,接下来就有三条主要线路可以选择: 
1.使用更强的算力,大规模挖掘更多的因子 
2.使用更多的数据,不局限于传统价量数据 
3.交易的比别人更快,更好

其实这里的前两条更多的时候是交叉进行的,可以相辅相成并不冲突。第三种算是另辟蹊径,使用高频交易的方法挖掘超额收益或者套利,这种收益一般非常稳定,但是规模较小。

一般来说,数据应该是这里面最便宜的东西了,而且来源广泛,现在国内的另类数据提供商也越来越多,并且越来越成体系。

另类数据的定义多种多样,我这里认为不是价量和普通财务数据的都可以叫做另类数据,比如产品销量,港口船运数量,或者社交媒体和市场情绪等。

一个经典的例子就是美国的另类数据公司Thasos在特斯拉工厂周围检测手机信号的数量,用以判断工厂工人的工作时间,从而推测特斯拉的销量数据。最终取得非常好的收益。

很多朋友是因为我是用gpt训练研报而关注我,这个也是一个另类数据的例子,我使用研报的数量、质量和情感来判断股票价格预期,尝试发掘和价量因子相关性较小的因子补充我的模型。

虽然一般来说获取高质量的另类数据需要花费一些钱,但是这应该是最适合个人玩,或者小基金的一条路了。使用强算力大规模的挖掘和结合因子需要大量的GPU服务器,非常烧钱。构建高频交易系统需要高速的通道,并且监管合规要求很多,个人基本不可能实现。而一些境外资产,在国内做高频就是纯纯扯淡,光互联网的延迟就够人家交易无数个来回了。

而且之前也听说过一些网上的大神,通过长期努力的统计某公司在各个平台产品的销量趋势,最后赚了一些钱的。这也算是另类数据的一个使用的全流程了:收集数据->分析数据->使用分析结果投资-> 获利了结。

现在国内外关于另类数据的研究也比较多,下面这张图是境外的一些另类数据的供应商,国内的起步晚一点,但也有一些公司这几年发展的非常快,可以说另类数据这一块在国内还是蓝海,也许是一个创业的方向。



第九课 另类数据简介 -- 零基础量化投资小课堂的评论 (共 条)

分享到微博请遵守国家法律