金母鸡量化教学场基于因子IC的多因子模型

今天这篇篇主要介绍因子IC，一起往下看吧~

多因子模型是一种常用的选股模型，其构建方法一般分为回归法和打分法两类。

打分法是指选用若干能够对股票收益产生预测作用的因子，之后根据股票的每个因子值在截面上的相对位置给出股票在该因子上的得分，然后按照一定的权重将每个股票的各个因子得分相加从而得到该股票的最终得分并按照该得分对股票进行排序，筛选，构造投资组合。

在打分法的模型构建中，各因子上的权重比例设定非常关键，若干好的因子在不好的权重配置下很可能会有不好的结果。

举个例子来说明确定因子权重的重要性：

下面是四只股票在两类因子上的当期得分和下期收益率：

lizi = pd.DataFrame()

lizi[‘因子A’] = [9,3,8,5]

lizi[‘因子B’] = [6,7,9,2]

lizi[‘下期收益率’] = [0.01,0.009,0.008,0.006]

lizi.index = [‘股票a’,’股票b’,’股票c’,’股票d’]

r1,_ = st.pearsonr(lizi[‘因子A’],lizi[‘下期收益率’])

r2,_ = st.pearsonr(lizi[‘因子B’],lizi[‘下期收益率’])

print lizi.to_html()

print ‘因子A得分与下期收益率的相关系数为：’+str(r1)

print ‘因子B得分与下期收益率的相关系数为：’+str(r2)

若按分组收益来看，因子A得分较高的两只股票(a,c)相对得分较低的两只股票(b,d)有0.003的超额收益，因子B得分较高的b，c相对得分较低的a，d有0.001的超额收益。A与B均有很好的收益预测能力，然而若是以因子A，B得分的平均分作为股票的最终得分，则最终得分最高的是股票c，收益为0.008，低于四只股票的平均收益0.00825。