关于投资,从容量还是稳定性、扩展性而言,多因子模型当仁不让。
主动型交易,本质也是一个多因子的过程。而对不确定性,大家的决策过程都是一个概率模型。——就是如何让成功的可能性提升一点点。那就选择更多“有利”的因子。无论是从上往下,先看宏观、行业,还是从下往上,先看ROE,或者净利润增长率等等。只是有些可以量化,而有些不能罢了。
之前我们直接往策略而去,策略的核心就是因子,准确地说是因子集。没有什么因子可以永远有效,因子其实是标识投资标的的状态。不同的因子组合在不同的市场环境下,表现不同。
智能投研其实就是这个“因子工厂”,或者“因子流水线”。
智能金融行业的一个痛点是,智能投资、投顾和投研,被证明并不能直接提高交易的“回报率”,即不能直接帮客户挣更多钱。
大数据领域兴起后,其核心想法是,与其去发现因果性,不如把数据积累起来,寻找事件和资产之间的相关性,以及事件对价格、特别是价格长期趋势的影响,这就是 Kensho 提供的主要服务。
首先, Kensho 的底层是一个很大的数据库。两年前,它是9万个数据集的数据库,在此基础上有各种事件、价格和基本面。
可能不考虑做一个大而全的引擎,而是针对可转债、ETF或者场外基金的评估呢?至少在信息增值,金融数据增值这个方向上会有价值。
底层的数据库,中间的知识库(图谱),上层的知识问答引擎。
类似理杏仁的场景,理杏仁在金融数据库的基金上,做了一些图表化,可视化的加工,提供了数据、信息增值服务。
目前的思考来看,数据服务太重,价值低。面向交易端不确定强——并没有什么圣杯的策略。对标的进行“多因子”,“多维”评分,模向比较。——当然多因子回测作为基础功能也没有问题。
关于自然语言处理:
传统的NLP开发包, jieba, gensim等。
深度模型崛起后,基本一统NLP江湖。
今天我们来体验一下fastNLP,这个复旦大学开源的一个轻量级的NLP开发包,支持torch和paddle。
项目在gitee上,github上的版本是旧的。
https://gitee.com/fastnlp/fastNLP
pip install fastNLP>=1.0.0alpha
根据使用的深度框架,还需要自行安装:
我的CUDA的版本是10.2,python的3.11版本太高,找不到对应的torch,只能降回3.9。
pip install torch==1.10.0+cu102 torchvision==0.11.0+cu102 torchaudio==0.10.0 -f https://download.pytorch.org/whl/torch_stable.html
个人电脑要跑深度模型有比较有难度的,我本机有2G的独立GPU,一本来就溢出,带不动。
传统的sklearn、后来集成学习这样的模型,相对都比较高,对于表格型数据拟合效果不错。
总结:
1、搞一个“轻型”的kensho这样的认知引擎,帮助散户提升投资决策的概率。
2、认知引擎:数据层,知识层与问答引擎层。
3、深度模型需要更专业的算力设备。
发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/104177
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!