今天这篇篇主要介绍因子IC,一起往下看吧~

多因子模型是一种常用的选股模型,其构建方法一般分为回归法和打分法两类。
打分法是指选用若干能够对股票收益产生预测作用的因子,之后根据股票的每个因子值在截面上的相对位置给出股票在该因子上的得分,然后按照一定的权重将每个股票的各个因子得分相加从而得到该股票的最终得分并按照该得分对股票进行排序,筛选,构造投资组合。
在打分法的模型构建中,各因子上的权重比例设定非常关键,若干好的因子在不好的权重配置下很可能会有不好的结果。

举个例子来说明确定因子权重的重要性:
下面是四只股票在两类因子上的当期得分和下期收益率:
lizi = pd.DataFrame()
lizi[‘因子A’] = [9,3,8,5]
lizi[‘因子B’] = [6,7,9,2]
lizi[‘下期收益率’] = [0.01,0.009,0.008,0.006]
lizi.index = [‘股票a’,’股票b’,’股票c’,’股票d’]
r1,_ = st.pearsonr(lizi[‘因子A’],lizi[‘下期收益率’])
r2,_ = st.pearsonr(lizi[‘因子B’],lizi[‘下期收益率’])
print lizi.to_html()
print ‘因子A得分与下期收益率的相关系数为:’+str(r1)
print ‘因子B得分与下期收益率的相关系数为:’+str(r2)

若按分组收益来看,因子A得分较高的两只股票(a,c)相对得分较低的两只股票(b,d)有0.003的超额收益,因子B得分较高的b,c相对得分较低的a,d有0.001的超额收益。A与B均有很好的收益预测能力,然而若是以因子A,B得分的平均分作为股票的最终得分,则最终得分最高的是股票c,收益为0.008,低于四只股票的平均收益0.00825。

因子IC(Information Coefficient)简单来说,因子在某一期的IC指的是该期因子对股票的下期收益的预测值和股票下期的实际回报值在横截面上的相关系数,即ICA=correlation(fA→,r⃗ )。
其中,ICA代表因子A在该期的IC值,fA→为该期因子A对股票下期收益率的预测向量,r⃗ 为股票下期实际收益率向量
因子对股票下期收益率的预测是怎么算的呢?最先在脑海里浮现的就是用回归的方法来做预测嘛,不过这个预测选取的模型不一样,岂不是结果就不一样了。然后我又去找了下资料,发现有一种叫做原始IC或者传统IC的计算方法:

传统IC:
直接用该期因子的值,和股票下期收益率算相关系数,就是因子IC值,即把上面的fA→换为该期因子值向量
这样也很好理解,直接反映了因子的预测能力.IC越高,就表明该因子在该期对股票收益的预测能力越强。
定义IC:
就是用该期的股票收益率对上期因子值作回归,并用该期因子值预测下期股票收益率,取下期预测的收益率和下期实际收益率的相关系数。

研报IC:
1、对因子进行标准化,去极值处理(横截面上);
2、调整行业和市值影响:因子在大小盘,不同行业的股票上的值会有明显的差异,比如市盈率因子较低的股票会集中于银行等板块.调整的方法就是,把每个因子对市值和行业哑变量做回归,取残差作为因子的一个替代;
3、残差正交化调整:因子间存在较强同质性时,使用施密特正交化方法对上一步得到的残差做正交化处理,用得到的正交化残差作为因子对股票收益率的一个预测。
发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/76693
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!