量化交易经典论文BenchmarkDatasetforMidPriceForecasting

最近,本狐计划对一批量化交易算法的经典论文进行阅读学习。大家有什么感兴趣的论文,欢迎评论、私信。

今天开始第一篇论文:Benchmark Dataset for Mid-Price Forecasting of Limit Order Book Data with Machine Learning Methods。论文提供的FI 2010 Dataset是第一个公开的基准数据集,用于高频金融市场中的中间价格预测。该数据集是目前为止使用最广泛的评测数据集,在多篇预测算法的论文中被使用,并用于算法优劣的对比。数据集使用了Nasdaq的5只股票连续10天的,归一化后的时间序列数据,提供了近400万个交易事件和标注,用于五个分类问题的时间序列表示。标签表示中间价格的方向,包括上升、下降和静止。

量化交易经典论文BenchmarkDatasetforMidPriceForecasting

数据是做量化交易评测的基石

  1. 目标:该论文的目标是提供一个用于限价委托簿(Limit Order Book)数据的中间价格预测的基准数据集,并使用机器学习方法进行预测。LOB(Limit Order Book)指的是交易的报价簿,类比A股,即Level 2行情的10档买入、卖出报价。
  2. 数据集构建:作者通过收集实际交易所的限价委托簿数据,包括买卖委托、成交量和价格等信息,构建了一个大规模的数据集。数据集包含了多个交易日的数据,涵盖了不同的市场条件和交易活动。
  3. 中间价格预测:论文关注的是对限价委托簿数据中的中间价格进行预测。中间价格是买卖委托价格之间的平均值,是市场交易的重要指标。
  4. 特征提取:作者提取了一系列特征来描述限价委托簿数据,包括价格、成交量、买卖委托的数量和差异等。这些特征被用作机器学习算法的输入。
  5. 机器学习方法:作者使用了多种机器学习方法来进行中间价格的预测,包括支持向量机(SVM)、随机森林(Random Forest)和深度神经网络(Deep Neural Network)等。通过比较不同方法的预测性能,评估其适用性和效果。
  6. 结果和评估:论文对各种机器学习方法在数据集上的预测性能进行了详细评估。通过比较不同算法的预测准确度、均方根误差和平均绝对误差等指标,评估它们在中间价格预测任务上的表现。
  7. 提供基准数据集:论文最终提供了一个基准数据集,供研究人员在中间价格预测领域进行进一步研究和算法比较时使用。这个数据集可促进对机器学习方法在限价委托簿数据分析中的应用和改进。

基准数据集具有以下优点:

  1. 大规模数据集:数据集包含了多个交易日的限价委托簿数据,涵盖了不同市场条件和交易活动。这使得数据集具有较大的样本量,可以更好地代表真实市场情况。
  2. 多维度信息:数据集中包含了丰富的限价委托簿信息,如买卖委托、成交量和价格等。这些多维度的信息可以提供更全面和详细的特征,有助于进行中间价格预测的研究和分析。
  3. 真实性和准确性:数据集是从实际交易所获取的真实数据,具有较高的真实性和准确性。这使得使用该数据集进行的预测和分析结果更具可信度。

这篇论文的重点是构建了一个用于中间价格预测的限价委托簿数据的基准数据集,并使用多种机器学习方法对其进行了评估。通过这项工作,为进一步研究和改进中间价格预测提供了基础和参考。

算法评测对比,主要使用了指标:Accuracy, Precision, Recall, F1。论文使用了几种基础的算法: Ridge Regression (基准算法)、SLFN Network-based Nonlinear Regression。在数据处理中,使用了几种数据归一化方式:Z-score, Min-max, Decimal等。

从实验结果看,算法的预测准确率随时间窗口增大而下降。基础算法的在数据集上的预测准确率都较低,在45%-60%之间。不同的算法在不同的标签情况下表现不同。例如,在上升和下降的标签情况下,支持向量机和随机森林的表现最好,而在静止的标签情况下,神经网络的表现最好。此外,数据规范化的实验结果,表明数据规范化可以显著提高模型的性能。

这篇论文的主要贡献在为量化交易预测算法提供了测试数据集,而不是在算法的优化改进。在后续的论文学习中,我们将看到一些优秀的算法,将预测的准确率对比基础算法有显著的提升!

发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/289032
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 3小时前
下一篇 3小时前

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注