python深度学习实现自编码器Autoencoder神经网络异常检测心电图ECG时间序列

异常心跳检测

如果提供了足够的类似于某种底层模式的训练数据,我们可以训练网络来学习数据中的模式。异常测试点是与典型数据模式不匹配的点。自编码器在重建这些数据时可能会有很高的错误率,这表明存在异常。

该框架用于使用深度自编码器开发异常检测演示。该数据集是心电图ECG 时间序列查看文末了解数据获取方式,目标是确定哪些心跳是异常值。训练数据(20 个“好”心跳)和测试数据(为简单起见附加了 3 个“坏”心跳的训练数据),如下所示。每行代表一个心跳。

init()
PATH = os.path.expanduser("~/")
import_file(PATH + "train.csv")
import_file(PATH + "test.csv")

图片

探索数据集。

tra.shape
# 将框架转置,将时间序列作为一个单独的列来绘制。
plot(legend=False); # 不显示图例

图片

图片

在训练数据中,我们有 20 个时间序列,每个序列有 210 个数据点。请注意,所有线条都很紧凑并且形状相似。重要的是要记住,在使用自编码器进行训练时,您只想使用 VALID 数据。应删除所有异常。

现在让我们训练我们的神经网络

Estimator( 
        activation="Tanh"
        hidden=\[50\], 
       
)

model.train
model

图片

图片

我们的神经网络现在能够对 时间序列进行 _编码_。

现在我们尝试使用异常检测功能计算重建误差。这是输出层和输入层之间的均方误差。低误差意味着神经网络能够很好地对输入进行编码,这意味着是“已知”情况。高误差意味着神经网络以前没有见过该示例,因此是异常情况。

anomaly(test )

现在的问题是:哪个 test 时间序列最有可能是异常?

我们可以选择错误率最高的前 N 个

df\['Rank'\] = df\['MSE'\].rank
sorted

图片

图片

dfsorted\[MSE'\] > 1.0

图片

datT.plot

图片

daT\[anindex\].plot(color='red');

图片

带监督微调的无监督预训练

有时,未标记的数据比标记的数据多得多。在这种情况下,在未标记数据上训练自编码器模型,然后使用可用标签微调学习模型是有意义的。

结论

在本教程中,您学习了如何使用自编码器快速检测时间序列异常。


发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/109253
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 1小时前
下一篇 1小时前

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注