[量化]基于OpenFE的因子挖掘框架实践

一  本文简介

本文介绍了一种基于OpenFE的基本面因子挖掘方法,基于财务报表的数据以及基础算子之间按照一定的结构进行排列组合,利用OpenFE框架筛选出不同风格类型下表现最好的合成因子。利用构造的合成因子以及基础因子,训练月频的选股模型,模型在回测区间(2020年1月31日至2022年12月31日)内,全市场内选股的年化超额为21%,夏普比率为1.19。

二  背景知识

OpenFE是一套自动化的特征生成工具,可以将机器学习专家从繁重的手工特征生成任务中解放出来,能自动生成与专家手动生成相媲美的特征。OpenFE通过两个组件实现自动特征生成:(1)提出了一种新的特征提升方法,用于精确估计候选特征的增量性能。(2)特征评分框架,用于通过连续的特征二等分和特征重要性归属从大量候选中检索有效特征。实验表明,OpenFE优于现有的基准方法,在一项Kaggle竞赛中,OpenFE使用简单的基线模型生成的功能可以击败99.3%的专业参赛者。OpenFE生成的特征所带来的性能提升与竞赛优胜者相当,甚至更高,这首次证明了自动化特征生成与机器学习专家的竞争力。

因子挖掘是金融工程的一个重要方向,它试图从海量的金融数据中提取有价值的信息,并将其应用于投资组合的管理。通过对因子的定义、评估和组合,因子投资策略试图实现长期的超额收益。常见的因子挖掘方法有基于深度学习模型 DeepLOB, 基于进化算法的 AlphaZero和上述的OpenFE框架。下表对比了几种方法的特点:
图片

三 本文工作

本本文采用三大财务报表(资产负债表,损益表,现金流量表)中的数据作为基础特征,在此基础上构建合成因子,通过OpenFE进行特征筛选,保留最终特征重要性最高的因子。整个过程可以分为以下几步:

第1步:基础特征构建

财务报表中资产负债表为时点数据,损益表和现金流量表为时期数据,将损益表和现金流量表中的数据均转为季频数据。三大报表中的字段共计有100多,大部分字段缺失值较多,对于缺失值大于10%的字段,予以剔除。利用剩下的所有字段训练一个LGBM模型,保留每张报表内重要性排名前15的因子。在这些因子的基础上,再加入市值,行业,动量(过去一个月收益率)三个对股票收益解释度非常高的因子。共计45个基础特征和3个额外添加的特征。

第2步:特征生成算子

为使得因子具有较好的可解释性,采用一些较为简单的算子,包括四则运算(+,-,*,/)、同比算子(YOY)、环比算子(QOQ)、以及横截面排序算子(CSRank)。

第3步:因子筛选

OpenFE采用两步的筛选方法,极大的提高了筛选效率。在第一步筛选中,采用了successivehalving(连续二分法)进行单因子检验。具体做法是首先采用部分小样本,对每一类风格的所有因子进行单因子模型LGBM的训练,计算特征的模型表现。下一轮增加样本数量,保留第一次训练中表现较好的部分因子,再此进行训练,以此类推,不断增加样本数量,减少因子数量,直至用全样本训练。

第4步:合成因子

通过 OpenFE 的两步筛选,保留各风格重要性最高的 10 个因子。部分生成的因子展示如下:
图片
各类风格因子的平均重要性如下图所示,可以看出,价值因子的重要性最高,其次为成长因子,质量因子的平均重要性最低。
图片

第5步:因子回测

除了合成因子外,同样在原始的48个因子中,筛选出表现最好的10个基础因子。其中动量,市值以及行业是表现最好的三个因子。利用以上10个基础因子以及50个合成因子,构建选股模型。具体做法是从2020年1月31日至2022年12月31日,每月滚动训练LGBM模型,模型的输入为过去10年的月频因子,预测目标为未来一个月收益率。训练集长度为9年,测试集为1年,按照时间先后进行切分。股票池为全A股票,剔除其中的次新股,ST股,涨跌停股票以及流动性过低的股票(日成交金额<500万或者换手率<0.02%)。每次调仓等权买入得分最高的400只股票。回测结果如下:
图片
图片
图片

四  总结展望

本文展示了如何使用OpenFE框架进行因子挖掘,因子回测的结果也证明了挖掘出的因子的有效性。本文也存在一些不足,例如没有说明因子挖掘使用的数据范围,存在过拟合的风险。
后续可以拓展的方向:

  1. OpenFE提供的默认算子库比较简单,可以结合金融任务增加更合适的算子;
  2. 探究OpenFE在量价因子挖掘的有效性;
  3. 算子组合的量级仍然较高(本文生成了70万的因子进行筛选),是否有更好的方法进行因子组合筛选。

发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/110946
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 3分钟前
下一篇 2分钟前

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注