高IC值因子收益分析以及pycaret自动机器学习对因子集建模(代码+数据下载)

专注“个人成长与财富自由、世界运作的逻辑与投资“。

1、选择IC在0.02 以上,按预期收益率排序,因子相关性分析,选择低相关的。等权,加权组合,回测。

2、pycaret(lightgbm)及调参。

3、autogluon精调lightgbm。

IC绝对值排序,alpha158因子集,大于0.03的19个,大于0.02的55个。

我们选择大于0.02这55个因子进行分析。

下面来计算预期收益。

图片

import alphalens
import duckdb
import pandas as pd

# 文件包,放在ailabx/data下的hist_hs300_20230813下,使用duckdb直接访问
from config import DATA_DIR

HS300 = DATA_DIR.joinpath('hist_hs300_20230813')

from datafeed.dataloader import Duckdbloader
from factor import alpha

a = alpha.Alpha158()

factors_names = ['CORD60']
fields = [a.get_field_by_name(n) for n in factors_names]

loader = Duckdbloader(path=DATA_DIR.joinpath('hist_hs300_20230813').resolve(), symbols=None,
                      columns=['close', 'open', 'high', 'low', 'volume'],
                      start_date="20100101")

df = loader.load(fields=fields, names=factors_names)
prices = df.pivot_table(columns='symbol', index='date', values='close')
df.set_index([df.index, 'symbol'], inplace=True)
# 因子值
factor = df[[factors_names[0]]]
data = alphalens.utils.get_clean_factor_and_forward_returns(factor, prices, quantiles=5, periods=(1, 5, 10, 20))
print(data)
res = alphalens.performance.factor_alpha_beta(data)
print(res)

图片

我们就取5D这个周期即,对55个高ic的因子进行收益分析:

from config import DATA_DIR
import pandas as pd

csv = DATA_DIR.joinpath('ic_sorted.csv')
df_factors = pd.read_csv(csv.resolve(), index_col=0)
df_factors = df_factors[df_factors['abs_ic'] > 0.02]
print('大于0.02的因子一共{}'.format(len(df_factors)))

# 下面进行收益分析
factor_names = list(df_factors['name'])

from factor.alphalens_lit import calc_alpha
results = calc_alpha(factor_names)
pd.DataFrame(results).sort_values(by='abs_alpha', ascending=False).to_csv('factor_alpha.csv')

从alpha来排序,动量和价量背离,但价量背离的ic更高,也就是更加稳定。

QTLD5的年化收益达到“惊人”的程度。

图片

图片

图片

pycaret自动机器学习:

图片

数据自动预处理,划分数据集:

图片

内置多数的机器学习模型:

图片

使用lightgbm:

图片

一次运行多个模型:

图片

代码在examples下:已经同步至星球:

明天使用autogluon来高精度调参。

图片

吾日三省吾身

 聊聊ABCZ,人生计划之”ABCZ”

网上看到一个观点,它是ABZ计划:

A计划是事业主要组成部分、收入主要来源,求稳,重在精进。这个受很多因素影响,你的职业惯性,你的职场机遇等。A计划求稳,尽管创业公司像当年的字节,有股权之类的大机会,但其概率不大,A计划还是要求稳为主。

B计划是事业后备组成部分、收入次要来源,求变,重在替代。这个就是现在很多人的副业,你自己喜欢且擅长的事情,如果有价值,那么也可以获得回报,甚至有人把它做成主业,实现跃迁。——是不是要替代倒不一定。我觉得可以是多一个支柱,更加稳健和有底气。而且最好能建成“自动化”的管道最初樊登做读书会完全是兼职,当读书会发展了两年以后,他才辞掉大学老师的工作,全职去做这项事业,现在做为了知识付费的独角兽。这个相当于演化成我们说的C计划了,做成了一件大事。

重点说说C计划,Crazy,还是要有点大的梦想,万一实现了呢。A与B两个计划里,可以再寻找C之可能性。你说这不是又开启一个新的B计划,区别在于B计划还是更具体加务实。

可能的方向: 股权,创业(大模型),高赔率的投资(比如加密货币)。可以从A计划延伸,也是B计划的扩展,毕竟,不能凭空产生。当然多增加对外的触点,对环境变化敏感。可以小范围参与一些“不那么熟悉”的机会

Z计划是人生风险控制部分、收入应急来源,求保,重在风控。Z计划与我说的类似,资产计划,比如500万,10%这样的长线投资理财组合。这个兜底方案,是自动化运行的,是被动收入,即便ABC都没有达预期,仍然可以过得不错的人生状态。A计划与B计划都可为Z计划注入本金,投资能力等。

发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/103952
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 2024 年 7 月 29 日
下一篇 2024 年 7 月 29 日

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注