“轻型”的类似kensho的认知引擎

关于投资，从容量还是稳定性、扩展性而言，多因子模型当仁不让。

主动型交易，本质也是一个多因子的过程。而对不确定性，大家的决策过程都是一个概率模型。——就是如何让成功的可能性提升一点点。那就选择更多“有利”的因子。无论是从上往下，先看宏观、行业，还是从下往上，先看ROE，或者净利润增长率等等。只是有些可以量化，而有些不能罢了。

之前我们直接往策略而去，策略的核心就是因子，准确地说是因子集。没有什么因子可以永远有效，因子其实是标识投资标的的状态。不同的因子组合在不同的市场环境下，表现不同。

智能投研其实就是这个“因子工厂”，或者“因子流水线”。

智能金融行业的一个痛点是，智能投资、投顾和投研，被证明并不能直接提高交易的“回报率”，即不能直接帮客户挣更多钱。

大数据领域兴起后，其核心想法是，与其去发现因果性，不如把数据积累起来，寻找事件和资产之间的相关性，以及事件对价格、特别是价格长期趋势的影响，这就是 Kensho 提供的主要服务。

首先， Kensho 的底层是一个很大的数据库。两年前，它是9万个数据集的数据库，在此基础上有各种事件、价格和基本面。

可能不考虑做一个大而全的引擎，而是针对可转债、ETF或者场外基金的评估呢？至少在信息增值，金融数据增值这个方向上会有价值。

底层的数据库，中间的知识库（图谱），上层的知识问答引擎。

类似理杏仁的场景，理杏仁在金融数据库的基金上，做了一些图表化，可视化的加工，提供了数据、信息增值服务。

目前的思考来看，数据服务太重，价值低。面向交易端不确定强——并没有什么圣杯的策略。对标的进行“多因子”，“多维”评分，模向比较。——当然多因子回测作为基础功能也没有问题。

关于自然语言处理：

传统的NLP开发包， jieba, gensim等。

深度模型崛起后，基本一统NLP江湖。

今天我们来体验一下fastNLP，这个复旦大学开源的一个轻量级的NLP开发包，支持torch和paddle。
项目在gitee上，github上的版本是旧的。

https://gitee.com/fastnlp/fastNLP

pip install fastNLP>=1.0.0alpha

根据使用的深度框架，还需要自行安装：

我的CUDA的版本是10.2，python的3.11版本太高，找不到对应的torch，只能降回3.9。

pip install torch==1.10.0+cu102 torchvision==0.11.0+cu102 torchaudio==0.10.0 -f https://download.pytorch.org/whl/torch_stable.html

个人电脑要跑深度模型有比较有难度的，我本机有2G的独立GPU，一本来就溢出，带不动。

传统的sklearn、后来集成学习这样的模型，相对都比较高，对于表格型数据拟合效果不错。

总结：

1、搞一个“轻型”的kensho这样的认知引擎，帮助散户提升投资决策的概率。

2、认知引擎：数据层，知识层与问答引擎层。

3、深度模型需要更专业的算力设备。

发布者：股市刺客，转载请注明出处：https://www.95sca.cn/archives/104177
站内所有文章皆来自网络转载或读者投稿，请勿用于商业用途。如有侵权、不妥之处，请联系站长并出示版权证明以便删除。敬请谅解！