Style Miner:发现显著且稳定解释能力的时间序列因子

·
论文 | Meta contrastive label correction for financial time series
·
·

一  本文概要

在高维时间序列分析中,拥有一组关键因子(即风格因子)来解释观察变量的变化至关重要。例如,在金融领域中,波动率建模依赖于一组风险因子;在气候学中,气候变化研究依赖于一组因果因子。理想的低维风格因子应该在显著性(具有高解释能力)和稳定性(一致性,没有显著波动)之间取得平衡。然而,先前的监督和非监督特征提取方法很难解决这种权衡问题。

为了解决这个问题,本文提出了一种名为Style Miner的强化学习方法来生成风格因子。首先,将问题形式化为一个约束马尔可夫决策过程,其中解释能力作为回报,稳定性作为约束。然后,设计了细粒度的即时奖励和成本,并使用Lagrangian启发式方法自适应地平衡它们。实验证明,Style Miner在实际金融数据集上的表现优于现有的基于学习的方法,并相对于人工专家提出的业界知名因子,提高了约10%的R平方解释能力。

二  背景介绍

专家设计的风格因子方法是一种在投资组合理论中使用的方法,用于衡量股票的风险和回报。最早的方法是均值方差模型,它认为在考虑回报时应同时考虑风险。风险是通过股票回报的波动性来衡量的,波动性较高的股票通常具有较高的风险。这种方法将统计学概念引入了金融领域,为现代金融奠定了基础。
随后,出现了资本资产定价模型(CAPM),它将风险分为系统风险和非系统风险。非系统风险是可以通过分散投资来降低的,因此不应该通过高回报来补偿。CAPM只使用一个因子来衡量系统风险,但单一因子的解释能力有限,因此发展出了多因子模型的方法。

多因子模型将股票回报归因于几个不同的风格因子,并使用这些因子来估计协方差矩阵。这种方法的优点在于将高维股票特征提取为低维因子,从而降低了问题的复杂性。其中,Fama-French模型是最经典的多因子模型之一,它在CAPM的基础上增加了价值因子和规模因子,并通过时间序列回归来测试模型的性能。

除了专家设计的方法外,还有无监督特征提取和监督特征提取两种方法:

  1. 无监督特征提取方法使用主成分分析(PCA)等技术将高维股票数据压缩为低维因子载荷。然而,这些方法生成的因子载荷在时间上是不变的,而股票市场是动态变化的,因此可能不够准确。
  2. 监督特征提取方法则通过使用监督学习算法来提取复杂的非线性特征。这些方法可以更好地适应股票市场的动态变化,并可以根据预期的目标进行优化。

总的来说,风格因子方法是一种用于衡量股票风险和回报的方法,包括专家设计的方法、无监督特征提取和监督特征提取两种方法。每种方法都有其优缺点,可以根据具体情况选择适合的方法。

三  本文贡献

本文介绍了一种名为Style Miner的方法,用于从数据中提取风格因子。风格因子是一组关键因素,可以解释观察变量的变化,如金融市场中的波动率或气候学中的气候变化。这些因子在数据分析和机器学习中非常重要。传统的特征提取方法很难平衡解释能力和稳定性之间的权衡。这篇论文提出了一种新的方法,使用了强化学习来生成风格因子。这个方法将问题形式化为一个决策过程,其中代理根据观测数据生成连续的风格因子。为了平衡解释能力和稳定性,代理根据因子的长期解释能力作为奖励,同时将因子序列的自相关性作为成本。代理的目标是在满足自相关性约束的同时最大化解释能力。
为了提高训练效率,论文还提出了一些实用的技巧,并使用启发式方法来平衡奖励和约束。通过在真实的金融市场数据上进行实验,研究人员发现Style Miner相对于现有的基于学习的方法表现更好,并且相对于由专家设计的因子,提高了约10%的解释能力。

四  本文方法

4.1 问题目标

图片
本文研究的目标是通过风格因子来解释时间序列数据,并且这些风格因子需要具有较强的解释能力和稳定性。为了评估风格因子的质量,引入了两个评估指标。

  1. 首先是解释能力。在每个时间步骤上,通过拟合一个解释模型,将风格因子与目标标签进行关联。解释模型的拟合程度可以通过解释方差的比例来衡量,本文使用平均逐步 R2 作为指标。具体而言,该指标计算了每个时间步骤下的解释方差比例,并对其进行平均。
  2. 其次是稳定性。风格因子本身作为时间序列应该是相对稳定的,不应该出现剧烈波动。稳定性通过风格因子序列的自相关性来评估,本文使用滞后1的自相关系数作为指标。如果风格因子的自相关系数高于0.9,则认为其稳定性较好。

为了解决这个问题,将其形式化为一个约束马尔可夫决策过程(CMDP)。CMDP是在给定约束条件下寻找最优策略的问题。在这个问题中,状态空间包含历史观测值,行动空间是选择风格因子,转移函数描述了状态和行动之间的演化关系,奖励函数使用解释能力作为奖励,成本函数使用稳定性的衡量指标。问题的目标是找到一个最优策略,最大化解释能力的期望收益,并且在约束条件下保持稳定性。

通过解决这个CMDP问题,可以找到一组优秀的风格因子,它们能够很好地解释时间序列数据的目标标签,并且在时间上保持相对稳定。这对于许多领域都有应用,比如量化金融中,可以用来解释股票的未来回报或波动性。

4.2 算法设计

这个问题的算法设计主要面临两个主要挑战:

  • 如何简化问题,因为问题很复杂但反馈很少。
  • 如何设计算法在显著性和稳定性之间找到平衡点。

为了简化问题,我们采用了以下三种技术:

  1. 隐藏状态技术:将高维的序列输入转换为一种密集的隐藏表示,这样可以减少观测的复杂性。
  2. 序列表示:将整体状态分解为多个序列,并为每个序列建立表示。这样可以将问题拆解为处理多个较小的序列,从而降低问题的复杂度。
  3. 即时奖励和成本:为了解决稀疏奖励问题,我们引入即时奖励和成本。即时奖励是对每个序列在每个时间步的细粒度奖励,而成本则是综合考虑整个序列的评价指标。

为了解决CMDP问题,我们使用了Proximal Policy Optimization(PPO)算法进行策略优化。PPO是一种在线策略优化算法,适用于连续决策问题,并且具有稳定性约束。该算法通过限制策略更新的幅度来确保稳定性。在优化过程中,我们计算了代理目标函数,并进行剪切操作以限制策略更新的幅度。目标函数的计算基于旧策略和估计的优势值。优势值是通过估计序列的奖励和状态值的差异来得到的。通过引入一个折扣因子来平衡对未来估计误差的考虑。我们还可以使用Lagrange松弛技术。该技术通过添加惩罚项将CMDP转化为一个无约束问题,从而使得优化过程更加可行。

在Style Miner中的训练过程中,并不需要始终满足约束条件,只需确保最终结果满足约束即可。因此,我们采用了一种简单的启发式方法来处理约束。我们将约束条件转化为一个带有自适应乘子β的正则化项。乘子β以线性增加的方式逐步增加,直到满足约束条件为止。这种方法保证了在优化目标的同时最终满足约束条件。

在Style Miner中,还使用了Critic网络来评估模型的性能。Critic网络的损失函数是Critic网络输出与实际观测到的累积未来奖励之间的差异。整个Style Miner框架包括Actor和Critic网络。Actor网络使用GRU来获取时间上的隐藏信息。Actor和Critic网络共享一些参数,以提高效率和性能。在训练过程中,我们使用PPO算法来更新策略。策略根据动作分布来选择行动,并且在每个回合结束后对策略进行多次更新。我们将整个回合划分为数据块,以便并行训练并保持数据的原始顺序。

在更新策略后,我们计算新策略在验证数据集上的自相关性。为了减少计算时间,我们对样本进行采样并估计自相关性。一旦自相关性满足约束条件,就停止增加约束乘子β。通过这种简单的启发式方法,Style Miner在优化目标的同时最终满足约束条件。

下面是Style Miner的算法框架和伪代码实现:
图片
图片

五  实验分析

本文的实验设置展示了Style Miner相对于其他基线模型的优越性。实验结果显示,Style Miner在三个主要指标(R2、所有因子的平均T值和AutoCorr)上表现出更好的性能。使用原始数据作为输入时,Style Miner相对于专家因子在R2上实现了10.4%的相对增益,其AutoCorr超过0.92。Style Miner的指数移动平均版本在AutoCorr更高的情况下,仍然超过专家因子的R2值6.4%。Style Miner在解释能力和稳定性方面也优于监督学习方法Deep Risk Model(DRM)。此外,与其他强化学习方法相比,Style Miner实现了更高的解释能力和稳定性。使用额外的输入特征可以进一步提高Style Miner的性能。不同数据集上的结果表明,即使股票规模减小,Style Miner仍能保持稳定性和高解释能力。消融研究证实了Style Miner的每个技术部分在实现高性能方面的重要性。
图片
图片
图片
图片

六  总结展望

本文提出了一种名为Style Miner的新型强化学习算法,用于提取风格因子。风格因子提取是一个具有挑战性的任务,我们将其建模为一种CMDP(组合马尔可夫决策过程),并设计了细粒度的奖励和成本函数,通过Lagrangian启发式方法来平衡它们之间的关系。实验结果表明,Style Miner在性能上明显优于其他基准算法。

这项研究的意义在于,通过引入强化学习的方法,我们能够更好地从市场数据中提取出有解释力和稳定性的风格因子。风格因子对于理解和预测股票市场的行为和趋势非常重要。Style Miner的优势在于它能够通过自适应平衡奖励和成本来生成更准确、有效的风格因子。

发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/111002
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 1天前
下一篇 1天前

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注