BAR讲堂如何优雅地在BAR中实现因子合成

在现代投资方法中,因子一直扮演着非常重要的作用,无论出于风险管理还是收益拆解的目的,也无论处于股票筛选还是标的跟踪的阶段,因子都是其中不可或缺的部分乃至直接的研究对象。我们在之前的连载中,也介绍了许多在既有研究和实践中被证实十分有效的因子,这也为我们进一步地通过倍发科技投资研究系统(Betalpha BAR)挖掘因子背后的信息奠定了基础。

对于因子来说,无论我们是用它们寻找Alpha还是解释收益,实际上都是在利用因子蕴含的信息,为我们的投资行为进行服务。但在实践过程中,由于市场信息的混乱庞杂,如何更有效地提取有价值的信号,剔除那些无效或者重复的含义,对于投资者而言都有着非常重要的意义。

通常来说,由于金融学含义、分析机制背后潜在的关联性,不同的因子之间总是存在着相关关系,这给我们带来了一个好消息和一个坏消息,好消息是我们可以利用这样的相关性更全面地分析这类因子之间的关系,这也是大类因子分析的来源,坏消息则是不同因子之间的信息重叠,可能会干扰我们的判断,比如PE和PB虽然在财务上有着不同的含义,但是两个因子都会反映市场对价格的估计水平,如果我们同时使用这两个信息选股,虽然能更完善地对低价或者高价股进行判断,但两个指标的高重合度也会让我们损失不少独立的分析维度。

而这恰好是因子合成分析所关心和致力于解决的问题。我们试图用合成的方法,更有效地提取因子背后共同的信息,这样无疑降低了我们分析的难度和维度,也避免了无效信息的干扰,所以人们也形象地称之为因子的精炼或者提纯,许多时候我们进行风格因子分析的目标也正是在于此。

毕竟连超级赛亚人都是要通过合体来变强的,嗯。

比较严格的因子合成方式,是利用统计学中的主成分分析(PCA),把多指标转化为较少的指标(实际上是找方差的贡献度),我们往往会发现,原数据的总方差总是高度集中在几个成分中,此时这几个通过统计合成的高贡献度因子就承载了许多共同的信息。比如在BAR中,我们就可以直接使用倍发统计模型,利用主成分分析的方法来对组合进行分析,比如下面这个图中,就可以很清楚地发现,投资组合的风险主要由两个统计因子解释,我们针对这两个因子,就可以很好地优化投资策略。

BAR讲堂如何优雅地在BAR中实现因子合成

但是主成分分析方法提取的信息在经济意义上的欠缺,会给许多投资者带来理念上的困扰,一些批评者甚至怀疑这样的方法只会有回测上的良好效果,因为这些信号可能更多地出于数据挖掘,而非金融分析。因此,人们在实践中就提出了一系列因子合成的方法,试图在保证因子可解释性的同时,也能进一步地提纯因子信息。

首先我们选出了市值、流通市值、分析师数目和30日换手率四个因子,这四个因子从具体财务含义上来说,考虑了不同的侧面,有的偏重考量规模,有的偏重分析交易情况,但总体来说它们都可以衡量股票在市场中的交易流动性,在倍发指标体系中,我们也能看到它们都分类为流动性因子。我们在BAR中对中证800中的这四个因子进行2013年以来的等权重回测(月度换仓),可以发现,总体来说,因子值较高分组的股票也有较高的收益率,我们使用F1-F5多空对冲的方法计算了四个因子年化收益率,具体表现如表。需要强调的是,由于小市值和低流动性效应的存在,我们将市值和流动性市值因子对数化后求倒数,换手率因子也取倒数处理,而分析师数目因子也进行了对数化处理,回测时使用的业绩基准为沪深300指数:

BAR讲堂如何优雅地在BAR中实现因子合成

△因子表现情况

那么我们如果想从整体上评估流动性因子的选股能力,应该怎么办呢?方法当然不是把因子简单相加,我们需要对因子进行处理,下面我们介绍两种常见的处理方法。

第一种方法是因子加权合成。这种方法需要两个步骤,第一个步骤是因子的标准化,第二个步骤则是赋权。首先我们在BAR中,用zscore函数,将上述四个因子进行标准化,使其评价标准统一,也避免极端值的过度干扰,然后赋予不同的权重再相加。

而这里的主要问题在于,权重的设置。最为简单的方法当然是直接让四个因子等权重,但是这样做无疑默认了四个因子在信息中的贡献度是相等的,显然这不太符合情理,因此人们还会选取另外两个方法,一个是IC加权,另一个是IC_IR加权,即分别使用IC均值、IC均值与标准差的比来作为权数,如果因子对未来预测的能力极其稳定度更高,那么显然因子在组合时应该被赋予的权重也越高。

基于这样的思路,我们在BAR中进行了三种加权方式的尝试(各因子权数之和保证为1),结果如下:

BAR讲堂如何优雅地在BAR中实现因子合成

△加权合成方法下的因子表现

从结果来看,三种加权方式都有不错的表现,对冲年化虽然低于30日换手率因子,但是年信息比和最大回撤水平都有非常显著的改善,IC均值而言,依然也对未来收益有不错的预测能力,从这个层面来说,我们用四个因子合成的流动性因子,对于基于流动性的选股而言有着不错的指导意义。

而另一种方法则需要用到中性化的思路。这里我们进行如下处理:对于总市值和总流通市值两个因子,我们直接计算这两个因子在各自行业的标准化值,而对分析师数目和30日换手率两个因子,我们采取下面的回归方式进行中性化:

BAR讲堂如何优雅地在BAR中实现因子合成

公式中的industry是行业哑变量,最后一项为残差,我们将市值和行业部分对原始因子的影响剔除,将残差值作为新的30日换手率和分析师数目因子来进行研究,这样就实现了中性化。当然我们依然需要将因子进行zscore的标准化处理。接下来我们依然需要将四个因子进行加权相加,构造大类因子,加权方法如方法一所示,我们将三种加权方法的结果展示如下:

BAR讲堂如何优雅地在BAR中实现因子合成

△中性化合成方法下的因子表现

从结果来看,中性化的合成方式对于提高流动性因子的预测能力有更大的帮助(IC均值显著提升)。而从两种方法来看,IC_IR的权重设置方法对于提高收益、控制回撤和提高预测能力来说,都表现得更好。

通过同类型的因子合成,我们可以分析投资组合偏重的风格,而如果我们不拘泥于因子类型,而只考虑因子绩效的话,理论上也可以用上述两种方法对无数个因子进行合成。一些投资者在使用这个方法时,往往首先通过单因子模型选出对收益解释能力较好的因子,再利用这些因子进行合成,这对降低投研的分析维度,有着很积极的意义。

本文所用到的BAR语句

1/ln(Market_Value_All),总市值对数化后的倒数,即小市值因子,并命名为marketvalue;

1/ln(Market_Value_Floated_All),总流通市值对数化后的倒数,即小流通市值因子,并命名为floating

1/Turnover_30D,过去30日换手率的倒数,即低换手率因子,并命名为turn_low;

ln(EPS_Coverage),对分析师关注数因子进行对数化,并命名为lncover;

zscore_s(Market_Value,csi800)+zscore_s(floating,csi800)+zscore_s(turn_low,csi800)+zscore_s(lncover,csi800),等权构造下因子合成,zscore_s表示对数据进行标准化,csi800为所选股池;

0.47*zscore_s(Market_Value,csi800)+0.34*zscore_s(floating,csi800)+0.14*zscore_s(turn_low,csi800)+0.05*zscore_s(lncover,csi800),IC加权构造下因子合成,其中权数IC来自因子单独回归的结果,权数之和为1;

0.4*zscore_s(Market_Value,csi800)+0.3*zscore_s(floating,csi800)+0.23*zscore_s(turn_low,csi800)+0.07*zscore_s(lncover,csi800),IC_IR加权构造下因子合成,其中权数IC_IR来自因子单独回归的结果,权数之和为1;

zscore_s_by(marketvalue,csi800,sw_sector),按行业对小市值因子进行标准化,命名为zscoremarket;

zscore_s_by(floating,csi800,sw_sector),按行业对小流通市值因子进行标准化,命名为zscofloating;

residual_s_by(lncover,ln(Market_Value_All),csi800,sw_sector),令市值对分析师关注数进行行业中性回归的残差,即剔除市值和行业影响后的分析师关注数信息,命名为resi_cover;

residual_s_by(turn_low,marketvalue,csi800,sw_sector),令市值对低换手率进行行业中性回归的残差,即剔除市值和行业影响后的换手率信息,命名为resi_turn;

zscoremarket+zscorefloating+zscore_s(resi_cover,csi800)+zscore_s(resi_turn,csi800),等权构造下的中性化因子;

0.33*zscoremarket+0.22*zscorefloating+0.21*zscore_s(resi_cover,csi800)+0.24*zscore_s(resi_turn,csi800),IC权重构造下的中性化因子,其中IC权重来自因子单独回归的结果,权数之和为1;

0.18*zscoremarket+0.13*zscorefloating+0.44*zscore_s(resi_cover,csi800)+0.25*zscore_s(resi_turn,csi800),IC_IR加权构造下中性化因子,其中权数IC_IR来自因子单独回归的结果,权数之和为1

发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/305983
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 1小时前
下一篇 1小时前

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注