今天没有代码更新,说说后续计划

好多星球的同学问及文档,框架使用等。原本希望把整体框架细节到一定程度再做这件事,现在看来还需要提前。

说下星球里开源项目的后续计划:

1、以股票市场的数据为主,我会把技术面+财务面的历史数据给大家准备好——更多人关注的应该是这个。

2、提供wxpython,GUI,这样大家选股,因子分析不必写代码,提供软件的方式,这样对更多人而言,门槛更低。

当然,这就做不到日更了,这里的工作量比较大,但应该是以周为维度更新,大家先看Engine的代码和examples里的策略,先了解咱们引擎工作的原理。当然后续视频教程也在构画中,要做的事情太多,大家别着急——我们的目标是星辰大海,不必急于一时。

星球里越来越多同学,当然也有一些没有python代码基础的东西。也有同学就是希望实盘。

给我一种感觉就是当时我在北大读研时,教授台上讲期权定价公式,讲得起劲的时候,总有调皮的同学问,“这个期末考不考”。——那是我为数不多的看到教授生气了——教你的是思路,是本事,而你只关心考不考。

投资哪有圣杯,历史上可以实盘的策略一堆一堆,然后呢?

每个人的风险、收益要求不同,投资讲的是概率。做正概率的事情,承担可以承受的风险,如此而已。我们做的事情,就是提升概率,让成本更低,如此而已。

当然我还是会坚持自己的主线往前走。

因子挖掘——看看一个新的autoML的包:openfe。

为了用好gplearn,我们还是要了解它的工作原理,之前我们分享过它的tutorial。gplearn筛选高ic值因子,单因子回测(代码下载)gplearn之因子挖掘,与我们的数据集整合(代码)

gplearn其实本身并不是为量化而生的,它是一个构建于scikit-learn之上的,api也类似的框架。用表达式的方式拟合应变量与自变量之间的“符合表达式”的关系,因此很适合我们生成新的因子。

除gplearn之外,还可以考虑openfe这个新的autoML的方向。从AI量化的角度,autoML一定是能够给到助力的,这个方向我们会持续关注。当然我们更多的精力还是回归金融投资本身。

OpenFE是自动化的特征生成工具,可以将机器学习专家从繁重的手工特征生成任务中解放出来,能自动生成与专家手动生成相媲美的特征。

OpenFE通过两个组件实现自动特征生成:

(1)提出了一种新的特征提升方法,用于精确估计候选特征的增量性能。

(2)特征评分框架,用于通过连续的特征二等分和特征重要性归属从大量候选中检索有效特征。

实验表明,OpenFE优于现有的基准方法,在一项Kaggle竞赛中,OpenFE使用简单的基线模型生成的功能可以击败99.3%的专业参赛者。OpenFE生成的特征所带来的性能提升与竞赛优胜者相当,甚至更高,这首次证明了自动化特征生成与机器学习专家的竞争力。

因子挖掘方法有基于深度学习模型 DeepLOB, 基于进化算法的 AlphaZero和上述的OpenFE框架。openFE 生成的因子结构较为简单,可解释性较好,因此非常适合用于基本面因子挖掘。OpenFE 是一个基于枚举法的Expand-And-Reduce 框架,首先通过基础特征以及算子的排列组合构建所有可能的因子。而后通过一个两步的筛选步骤,对因子进行筛选。

图片

发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/104030
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 2024 年 7 月 29 日
下一篇 2024 年 7 月 29 日

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注