多因子轮动模型与lightGBM L2R排序学习（思路篇）

之于AI量化，我的目标是“做出系列可以实战的策略”。

关键词：实战。市场可以是ETF，转债，股票，期货还是加密货币。

而且要主动甚至进攻性的在二级市场赚到钱的逻辑。

在ETF、转债和股票领域，目前看，可以统一为“多因子轮动模型”。就是通过多因子选标的，选综合排序得分高的持有，外加择时模型控回撤。当然如果是ETF，还可以引入战略大类资产配置的逻辑——构建一个绝对收益型投资组合。

先考虑ETF候选标的，行业轮动是比较合适的。按市值粒度粗了一点。行业的粒度刚好，而且市场风险变幻的时候，行业确实在分化。

我使用华泰研报里的行业分类：

选择出的ETF候选列表：

一共29支行业ETF。

我们使用akshare获取它们的后复权数据，保存在csv里备用。

29支，使用akshare直接获得数据。

etfs = [
    '159870.SZ',
    '512400.SH',
    '515220.SH',
    '515210.SH',
    '516950.SH',
    '562800.SH',

    '515170.SH',
    '512690.SH',
    '159996.SZ',
    '159865.SZ',
    '159766.SZ',

    '515950.SH',
    '159992.SZ',
    '159839.SZ',
    '512170.SH',
    '159883.SZ',

    '512980.SH',
    '159869.SZ',
    '515050.SH',
    '515000.SH',
    '515880.SH',
    '512480.SH',
    '515230.SH',

    '512670.SH',
    '515790.SH',
    '159757.SZ',
    '516110.SH',

    '512800.SH',
    '512200.SH',
]
print(len(etfs))

import akshare as ak

for symbol in etfs:
    print(symbol)
    code = symbol[:6]
    df = ak.fund_etf_hist_em(symbol=code, period="daily", adjust="hfq") \
        .rename(columns={"日期": "date", "收盘": "close", '开盘': 'open', '最高': 'high', '最低': 'low', '成交量': 'volume'})

    df = df[['open', 'high', 'close', 'low', 'volume', 'date']]
    df['symbol'] = symbol
    df.to_csv('data/{}.csv'.format(symbol), index=False)