拒绝运气, 更科学的评估投资策略

·
论文 | Meta contrastive label correction for financial time series
·
·

投资者通常使用夏普比率来评估投资组合的优势,因为夏普比率可以衡量投资组合在承担风险的情况下所获得的回报。夏普比率的目标是通过将投资组合的回报与无风险波动率相比较,来衡量其绩效的稳定性。

然而,仅仅看投资组合的总回报是不够的。这是因为只关注总回报可能会掩盖投资组合在某些时期表现平平的情况。即使投资组合在长期内偶尔获得高回报,也不能保证它将来会持续表现出色。因此,当投资组合经理公布投资组合的历史绩效时,他们通常会加上免责声明,指出过去的绩效并不能预示未来的回报。

作为投资者,您需要确保投资组合绩效的一致性有基本的原因,并且有足够的统计证据来排除这种绩效仅仅是运气或与市场趋势高度相关的可能性。除了夏普比率,还有其他行业标准可以衡量投资组合的绩效。其中包括索蒂诺比率、信息比率和 R 平方。这些指标被广泛使用,并提供了一些关于策略或投资组合稳健性的信息。然而,它们缺乏对运气与实质因素之间差异的科学衡量。
图片
因此,在评估投资组合绩效时,了解P值也非常重要。P-Value是一种用于评估统计假设的指标,它衡量了观察到的数据与假设之间的一致性。在投资中,P-Value可以用来评估投资策略或模型的统计显著性。如果P-Value非常低(通常低于5%),那么我们可以有信心地说,观察到的结果不太可能是由于偶然发生或运气所致,而是有一个真正的效应存在。简而言之,P 值越低,结果由运气造成的可能性就越小。

测量P值

假设我们扔了一枚硬币,我们认为它是一枚公平的硬币(有正面和反面),但也可能是一枚双面都是正面的硬币。我们想知道,连续翻转多少次只得到正面的结果足以让我们相信这个硬币实际上是特殊硬币(两面都是正面)。

为了进行科学实验,我们首先假设硬币是公平的。这意味着,如果我们多次抛掷硬币,我们预期正面和反面出现的次数应该大致相等,约为50%的正面和50%的反面。
图片
我们可以用一个正态分布图来表示一些不太可能或非常不可能发生的结果。在这个图上,中间部分是最可能发生的结果,而两侧的长尾则表示在统计上不太可能发生的情况。

现在,我们考虑一个实验,我们抛硬币多次,并记录正面出现的次数。假设我们的硬币是公平的,每次抛掷正面和反面出现的概率都是相等的,即50%。但是,如果我们连续抛硬币多次,每次都得到正面,我们可能会开始怀疑这个硬币是否真的是公平的,而可能是特殊硬币,两面都是正面的。

为了确定我们的怀疑是否有统计学依据,我们可以计算概率值(P值)。P值告诉我们,在假设硬币是公平的情况下,我们观察到连续正面出现的概率有多大。如果P值很低(通常低于5%),那么我们可以认为观察到的结果非常不太可能是由于公平硬币导致的,而更有可能是由于特殊硬币导致的。

现在,假设我们抛硬币一次,得到了正面,这并不奇怪,因为即使是公平硬币,也有一半的机会出现正面。但是,如果我们连续抛硬币多次,比如五次,每次都得到正面,我们可以计算出每次连续出现正面的概率。

  1. 第一次抛硬币得到正面的概率是0.5或50%。
  2. 第二次抛硬币得到正面的概率是0.5乘以0.5,等于0.25或25%。
  3. 第三次抛硬币得到正面的概率是0.5乘以0.5乘以0.5,等于0.125或12.5%。
  4. 依此类推,第四次抛硬币得到正面的概率是0.5乘以0.5乘以0.5乘以0.5,等于0.0625或6.25%。
  5. 最后,第五次抛硬币得到正面的概率是0.5的五次方,等于0.03125或3.125%。

图片
在科学实验中,使用大样本数据时,如果观察到的结果的概率低于5%(或0.05),我们通常认为这足以拒绝原假设,并采纳备择假设。因此,当我们连续观察到五次或更多正面的结果时,概率值较低,意味着这样的结果在公平硬币的情况下非常不太可能发生,我们可以开始相信硬币可能是特殊硬币。这种方法有助于我们做出更明智的决策和判断。

使用P值确定交易信号的统计显着性

当我们在评估交易信号时,我们可以应用相同的统计显着性方法。假设我们正在进行股票交易的机器学习实验,训练一个股票预测模型。我们可以使用验证精度来评估模型的性能,例如,如果模型给出的买入信号的准确度为59%,那么在这些信号中,有59%的情况下我们的交易会盈利。然而,仅仅凭借这个准确度结果并不能确定这个模型是否稳健可靠。因为如果我们只是在市场整体上涨的时候进行交易,那么预测买入成功的概率就会很高。我们需要在一个统计上显著的背景下来评估模型的表现。

我们需要定义一个基准来衡量成功,而不仅仅是选择那些上涨的股票,而是选择那些相对于整个市场或预期表现更好的股票。我们可以设定训练模型的参数,例如,每天选择一周内最有可能相对于市场上涨的股票。我们可以用标准普尔指数中所有股票的平均回报率作为市场回报率(RPG)的衡量标准。

在实验中,我们将假设随机选择的股票相对于RPG上涨的概率为50%,类似于抛硬币的正面或反面的概率。然后,我们可以确定连续成功选择的数量,从而判断我们的模型是否统计上稳健。如果计算得出的P值等于或小于0.05(5%),那么我们可以拒绝原假设,并采纳备择假设。我们的假设是,如果我们连续获得5个或更多成功的选择,那么这足以拒绝原假设,并且我们可以认为我们的模型足够稳健,不仅仅是随机幸运选择的结果。
图片
通过这种定义实验并隔离预期的随机结果的方法,我们可以测量模型结果的P值。P值越低,意味着我们的模型越有可能导致异常观察结果。这样的方法可以帮助我们更科学地评估机器学习模型在交易中的应用。

发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/111009
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 8小时前
下一篇 8小时前

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注