知识星球与开源项目:万物之中,希望至美

今天的一些主要工作成果:

1、按5天(周调参)对因子ic进行排序。

2、对多个因子进行回测比较。

3、alphalens-reloaded比较 波动率与量价背离等因子的 ic分析细节。

4、pycaret机器学习模型应用于量化(vs autogluon 高精度调参)。

昨天对于因子进行了异常值、因子归一化等,计算量增加不少,但结果并没有特别大的变化。之前我们是综合计算了多个周期,比如1,5,10,20天,今天我们就按照5天(按周调仓)的模式来对比下。

ic值排在前面的仍然提“量化背离”的CORD30,60。

图片

下面我们直接来回测比较一下:

CORR20是IC比CORD30和CORD60都小一些。但从实际回测的结果看,CORR20效果最好,CORD60效果最差。而IC值倒数的STD60呢,结果也还不错。

————这里需要仔细分析,也间接证明IC分析容易出错的地方。

同一个因子,比如CORR20,取前10%与后10%,这个分层测试基本是单调的,说明这个因子是可以把好坏股票区分出来。

而IC是相关性的均值,这个均值可能存在波动性。横向对比的单调性就不好说了。因此我们需要进一步仔细分析std60的因子情况。

图片

使用alphalens-reloaded这样库来分析:

STD60的收益率分析很高,但ic很小。这个说明什么问题呢,这就是IC分析与收益率分析结果不一样如何决策的问题了。

设𝑋,𝑌为两个向量,则  ,其中  为线性回归  或线性回归  的可决系数(其中𝑎,𝑏是待回归系数)。 

也就是说IC值是可决系数。IC越大,则收益预测越有效。

reg_fit = OLS(y, x).fit()
try:
    alpha, beta = reg_fit.params
except ValueError:
    alpha_beta.loc['Ann. alpha', period] = np.nan
    alpha_beta.loc['beta', period] = np.nan

因此,IC值代表因子收益的稳定性,如果IC值高,且预测收益也高,这就是好因子。STD60明显就是回测收益很好,实盘可能很有问题的逻辑。

这是CORR20:

图片

CORD30:

图片

CORD60:

图片

STD60:

图片

吾日三省吾身

关于焦虑或者其他烦心之事,我自己当前的一个观感,时间是最好的解药

事缓则圆,说的就是这个道理。我们担心的事情,99%并不会发生,剩下那1%,就算真的发生了,也并没有我们想象中的严重,我们都能从容应对。

反而,一些黑天鹅事件,比如蔡磊的渐冻症,这种是没有办法,没有理由,那么他只能从容面对。

另外,就是长远的目标,要令人兴奋,但要可努力,通过努力基本可达的目标。你能专注自己想做的事情,且能看到进步,那么很多焦虑就会自动消散。

代码均已同步至星球:

图片

发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/103957
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 2024 年 7 月 29 日
下一篇 2024 年 7 月 29 日

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注