pybroker：兼容传统规则和机器学习的高性能量化回测框架（附源码）

打算再造一次轮子——写一个自研的AI回测平台。

这里不叫框架，叫平台，希望是结果导向，能够写出可用，可迭代的策略。

传统的框架已经很多，python生态里就有很多，pyalgotrade， backtrader, vectorBt, qlib等等。

感觉都没有特别合适。

backtrader是传统的回测框架，网上资料比较多，代码很难懂。适合传统规则型的量化回测，因子个数很有限。vectorBt主打速度和向量化，事件驱动做不了，代码也一般。qlib是机器学习导向的平台，传统规则型量化不友好，需要先整理数据集等等。

我想要一种轻量型的引擎，兼容传统规则与机器模型，速度要快，可以搜索参数空间。

目前看，pybroker比较合适，看起来还非常年轻，但理念与我很相近，而且上述几个点，基本都有，代码也比较容易读懂。

pybroker的官方文档：

https://www.pybroker.com/en/latest/index.html

github的源码地址：

https://github.com/edtechre/pybroker

目前看还是比较活跃的。

从源代码上看，不到15个文件：

安装比较简单，直接pip即可：pip install -U lib-pybroker

但要特别注意，要求python版本在3.9以上。文档示例使用YFinance，雅虎财经，国内访问不了。

好在实现自己的DataSource比较容易。

我自己实现了一个csv的数据加载器：

1、继承pybroker的DataSource

2、实现一个私有函数：_fetch_data，返回一个时间范围内的datafame。

包括字段：open, high, low, close, volume，symbol即可。

也就是说，它内部的数据结构也是基于numpy, dataframe以及使用numba的njit加速(与vectorBT的理念类似)。

import pandas as pd
import pybroker
from pybroker.data import DataSource


class CSVDataSource(DataSource):

    def __init__(self):
        super().__init__()

    def _fetch_data(self, symbols, start_date, end_date, _timeframe):
        dfs = []
        for s in symbols:
            df = pd.read_csv('data/{}.csv'.format(s), dtype={'date':str})
            dfs.append(df)
        df = pd.concat(dfs)
        df['date'] = pd.to_datetime(df['date'])
        df.sort_values(by='date', ascending=True, inplace=True)
        return df[(df['date'] >= start_date) & (df['date'] <= end_date)]