”单列“因子存储设计方案:在mongo的实现

不确定性的时代,人生是不可规划的,但还是需要计划,这并不矛盾

有些目标就像路标,尽管你不知道怎么走,但这些目标就像灯塔一,指引我们慢慢去靠近。

01 关于”知足常乐“

刚毕业的时候,没有人能设想三年、五年后会怎么样。但“自由”这个词,一直在心底,这是一种追求的生活状态。90%的不确定性可能都与财富有关。进入社会,所谓技能、职场、社交、同事关系、中年危机等等。

很多人说知足常乐,欲望是无止境的。你达到了现在的目标,还会有更大的目标。——这个观点我有一些看法。

人向上追求更高的东西没有错,只要不是走火入魔,比如葛兰台这种,把过程直接当结果,为做而做。每个层次的渴求是不一样的。如果一个人生存面临威胁这种不安全感是渗入骨髓的。等你吃饭穿䁔,想过更有品质一点的生活,这也无可厚非。物质层面的东西满足后,会有一些精神追求,社交、尊重与自我实现。——这是马斯洛的分类。关于“知足常乐”,分界线在于,你能不能精神自由,基础在于”经济独立,财务自由“。你不能随便找一个状态,就知足常乐,这叫”随遇而安“,”随波逐流“。

看抖音说2000万是男人底气,评论有人说200万即可,还有人说20万也行。当然可能来不同地区,不可对比。我设定的入门门槛是500万。——无负债,可长期投资的本金超过500万,是一个门槛。在此之上,让你可以安心做一些不功利的事情,西方思想史还是宇宙起源。再往上你当然可以继续奔跑,但就不需要那么着急”得之所幸,不得认命“,这叫知足常乐。

复习一下年初计划:挥别2022年,迎接2023年。——人生的三大杠杆。

一、主动投资能力。目前进展是可转债多因子。

二、CTO的技术体系。围绕企业级应用开发与算法展开,技术格局与技术视野。

三、社群建设,目前在收集直播主题。以主动投资能力为驱动,当前主题是多因子模型。

四、阅读。海量电子书的主题式阅读。

02 多因子的存储设计

多因子存储在业内有两种设计:

传统宽表模式:

图片

这类设计就是传统数据库,写入比较快,占硬盘会小一些。缺点就是新增/删除、更改一列因子会非常麻烦。

单值模型一般有4列:时间戳、股票代码、因子编号以及因子值,如下图所示;单值模型的数据在需要面板数据的场景,需要将数据转换成面板模式。

图片

之前我考虑过引入”列存“数据库,或者时序数据库,但引入新技术栈会带来更高的学习与维护成本,所以,考虑在mongo上实施”单列“因子存储。

def build_factor(code, factor_name):
    # 拉取数据
    df = pro.cb_daily(**{
        "ts_code": code,
        "trade_date": "",
        "start_date": "",
        "end_date": "",
        "limit": "",
        "offset": ""
    }, fields=[
        "ts_code",
        "trade_date",
        factor_name,
    ])
    df.rename(columns={'ts_code': 'code', 'trade_date': 'date', factor_name: 'value'}, inplace=True)
    df['_id'] = df['code'] + '_' + df['date'] + '_' + factor_name
    df['factor'] = factor_name
    return df

在mongo的存储格式如下:

图片

在数据库里的状态如下:

图片

我们把对应的正股价也入库:

正邦转债对应的正股代码是: 002157.SZ

图片

转股价是不同的因子:

图片

有了这三个基本数据,我们就可以开始计算双低值。

 

 

发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/104179
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 2024 年 7 月 29 日
下一篇 2024 年 7 月 29 日

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注