今天的一些主要工作成果:
1、按5天(周调参)对因子ic进行排序。
2、对多个因子进行回测比较。
3、alphalens-reloaded比较 波动率与量价背离等因子的 ic分析细节。
4、pycaret机器学习模型应用于量化(vs autogluon 高精度调参)。
昨天对于因子进行了异常值、因子归一化等,计算量增加不少,但结果并没有特别大的变化。之前我们是综合计算了多个周期,比如1,5,10,20天,今天我们就按照5天(按周调仓)的模式来对比下。
ic值排在前面的仍然提“量化背离”的CORD30,60。
下面我们直接来回测比较一下:
CORR20是IC比CORD30和CORD60都小一些。但从实际回测的结果看,CORR20效果最好,CORD60效果最差。而IC值倒数的STD60呢,结果也还不错。
————这里需要仔细分析,也间接证明IC分析容易出错的地方。
同一个因子,比如CORR20,取前10%与后10%,这个分层测试基本是单调的,说明这个因子是可以把好坏股票区分出来。
而IC是相关性的均值,这个均值可能存在波动性。横向对比的单调性就不好说了。因此我们需要进一步仔细分析std60的因子情况。
使用alphalens-reloaded这样库来分析:
STD60的收益率分析很高,但ic很小。这个说明什么问题呢,这就是IC分析与收益率分析结果不一样如何决策的问题了。
设𝑋,𝑌为两个向量,则 ,其中 为线性回归 或线性回归 的可决系数(其中𝑎,𝑏是待回归系数)。
也就是说IC值是可决系数。IC越大,则收益预测越有效。
reg_fit = OLS(y, x).fit() try: alpha, beta = reg_fit.params except ValueError: alpha_beta.loc['Ann. alpha', period] = np.nan alpha_beta.loc['beta', period] = np.nan
因此,IC值代表因子收益的稳定性,如果IC值高,且预测收益也高,这就是好因子。STD60明显就是回测收益很好,实盘可能很有问题的逻辑。
这是CORR20:
CORD30:
CORD60:
STD60:
吾日三省吾身
关于焦虑或者其他烦心之事,我自己当前的一个观感,时间是最好的解药。
事缓则圆,说的就是这个道理。我们担心的事情,99%并不会发生,剩下那1%,就算真的发生了,也并没有我们想象中的严重,我们都能从容应对。
反而,一些黑天鹅事件,比如蔡磊的渐冻症,这种是没有办法,没有理由,那么他只能从容面对。
另外,就是长远的目标,要令人兴奋,但要可努力,通过努力基本可达的目标。你能专注自己想做的事情,且能看到进步,那么很多焦虑就会自动消散。
代码均已同步至星球:
发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/103957
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!