【2015/IE】Variational Autoencoder based Anomaly Detection using Reconstruction Probability

2023-05-16

原文首发于个人站点：基于变分自编码器重构概率的异常检测模型
个人公众号：「DreamHub」

文章链接：Variational Autoencoder based Anomaly Detection using Reconstruction Probability
源码链接: https://github.com/Michedev/VAE_anomaly_detection

论文总体结构
Abstract 提出了一种基于重构概率的异常检测方法可变自动编码器。

Introduction
Backgroud
2.1 Anomaly detection：介绍异常检常用几个方法。
2.2 Autoencoder and anomaly detection: 介绍自编码器(autoencoder) 如何进行异常检测。
2.3 Variational Autoencoder：介绍 VAE 的核心内容、VAE 与 AE 的区别以及 VAE 训练算法。
Proposed method
3.1 Algorithm：总体介绍基于 VAE 模型的异常检测算法。
3.2 Reconstruction Probability：介绍上述算法中用的 reconstruction probability。
3.3 Difference from an autoencoder based anomaly detection：介绍两种算法的区别。
Experimental Results
实验部分用到了两个数据集 KDD cup 1999 与 MNIST，并与其他算法进行的比较。

1. Introduction

内容包括：

三两句介绍异常的定义、异常检测的意义。
从光谱异常检测技术中引出基于重构误差的检测方法，并指出基于 PCA 的方法属于这种方法。
从降维的角度引出自编码器(Autoencoder)，并说明这样的好处：更好提取特征、更高的隐藏层能够获取一些抽象特征。
提出基于 VAE 的异常检测算法，并说明其优点：与自动编码器和PCA相比，VAE的优势在于它提供了一个概率度量，而不是作为异常分数的重建误差，我们称之为重建概率。概率比重建误差更具原则性和客观性，不需要模型特定的阈值来判断异常。

2 Background

2.1 Anomaly detection

异常检测方法总的分类：

统计异常检测假设数据是从指定的概率分布建模的。参数模型（如高斯混合模型）或非参数模型（如核密度估计）可用于定义概率分布。如果从模型中生成数据点的概率低于某个阈值，则将其定义为异常。这种模型的优点是给出了概率作为判断异常的决策规则，具有客观和理论上的合理性。
基于邻近度的异常检测假设异常数据与大多数数据隔离。用这种方法对异常进行建模有三种方法，即基于聚类的、基于密度的和基于距离的。对于基于聚类的异常检测，将聚类算法应用于数据，以识别数据中存在的密集区域或簇。对每一个异常点的关系进行评估，形成每一个异常点的关系。这些标准包括到星团质心的距离和最近的星团的大小。如果到簇质心的距离高于阈值或最近的簇的大小低于阈值，则数据点被定义为异常。基于密度的异常检测将异常定义为位于数据稀疏区域的数据点。例如，如果数据点的局部区域内的数据点数量低于阈值，则将其定义为异常。基于距离的异常检测使用与给定数据点的相邻数据点相关的测量。K近邻距离可用于这样一种情况，即具有较大K近邻距离的数据点被定义为异常。
基于偏差的异常检测主要基于光谱异常检测，以重建误差作为异常分数。第一步是使用降维方法（如主成分分析或自动编码器）重建数据。利用k-最显著主成分对输入进行重构，并测量其原始数据点与重构数据点的差值，从而产生重构误差，作为异常评分。将重建误差较大的数据点定义为异常。

2.2 Autoencoder and anomaly detection

Autoencoder 是通过无监督训练得到的网络，包括编码 (encoder) 和解码(decoder) 两部分。encoder 过程对应公式 (1) ，decoder 过程对应公式 (2)，而公式 (3) 用于结算编码与解码过程对应原始数据造成的误差。称为重构误差(reconstruction error)，训练的目的就是最小化重构误差。
h = σ ( W x h x + b x h )         ( 1 ) h = \sigma ( W_{xh} x + b_{x h}) ~~~~~~~ (1) h=σ(Wxhx+bxh)       (1)

z = σ ( W h x h + b h x )          ( 2 ) z = σ ( W_{h x} h + b_{h x} ) ~~~~~~~~ ( 2 ) z=σ(Whxh+bhx)        (2)

∣ ∣ x − z ∣ ∣           ( 3 ) ∣∣x−z∣∣ ~~~~~~~~~ (3) ∣∣x−z∣∣         (3)
其中的 h h h 称为隐藏层，隐藏层的维度比输入层低，decoder 过程需要根据 h h h 重现输入数据 x x x 。这使得自动编码器对具有白噪声的数据具有鲁棒性，并且只捕获数据的有意义的模式。
自编码器的训练算法大致如下：
基于 AE 的异常检测是一种基于偏差的半监督学习算法，把重构误差 (reconstruction error) 作为异常值（anomaly score）。只把正常数据投入训练，完成训练后再对数据进行编码和解码操作，如果解码后数据与原始数据相近的数据是正常数据；当某数据的重构误差值高，我们认为是异常数据。
基于 AE 的异常检测算法如下：

2.3 Variational Autoencoder

VAE 模型参考自编码器变形和变分自编码器理论介绍及其 PyTorch 实现

变分自动编码器（VAE）是一种有向概率图形模型（DPGM），其后验由神经网络逼近，结构类似于自动编码器。如图一所示
编码与解码过程如图二所示：编码与解码过程分别交给两个神经网络完成，VAE 的整体结构如图三所示：
VAE和自动编码器之间的主要区别是，VAE是一个随机生成模型，可以提供校准的概率，而自动编码器是一个确定性的判别模型，没有概率基础。这一点很明显，因为VAE对上述分布的参数进行了建模。
VAE 模型的训练算法如图所示

3 Proposed method

3.1 Algorithm

请务必结合上图理解下面的算法步骤：

使用正常数据进行训练，训练过程中 decoder 和 encoder 共同确定隐变量的参数（即多个正态分布的 σ \sigma σ 和 μ \mu μ）。
对于 N N N 个测试数据循环遍历，对于每个测试数据 x i x_i xi 操作如下：
- 对于每个测试数据 x i x_i xi，通过训练好的 VAE 模型得到 μ z ( i ) \mu_z(i) μz(i) 和 σ ( i ) \sigma(i) σ(i)。
- 根据 μ z ( i ) \mu_z(i) μz(i) 和 σ ( i ) \sigma(i) σ(i) 得到关于 z z z 的正态分布 N ( μ z ( i ) , σ z ( i ) ) N(\mu_z(i),\sigma_z(i)) N(μz(i),σz(i))，从中抽取样本 L L L。
- 对于抽取样本 L L L 中的每一个数据 z ( i , l ) z^{(i, l)} z(i,l)，关于 l l l 的循环：
  - 进行 decode 操作，得到 x ^ \hat x x^，这里可能是为了表示 μ ( l ) \mu (l) μ(l)、 σ ( l ) \sigma(l) σ(l) 与 x ^ ( i ) \hat x(i) x^(i) 的关系，记作 μ x ^ ( i , l ) \mu_{\hat x}{(i,l)} μx^(i,l)和 σ x ^ ( i , l ) \sigma_{\hat x}{(i,l)} σx^(i,l)
  - 循环结束后得到多个 μ x ^ ( i , l ) \mu_{\hat x}{(i,l)} μx^(i,l) 和 σ x ^ ( i , l ) \sigma_{\hat x}{(i,l)} σx^(i,l). 其实就是多个 x ^ \hat x x^;
- 通过多个 x ^ i \hat x_i x^i 与训练好的 VAE 模型生成原来的测试数据 x i x_i xi，并计算重构概率（reconstruction probability）。这里计算的重构概率是对 E q φ ( z ∣ x ) [ l o g p θ ( x ∣ z ) ] E_{q_φ(z|x)}[log p_\theta(x|z)] Eqφ(z∣x)[logpθ(x∣z)] 的蒙特卡罗估计(Monte Carloe stimate)，当数据的重构概率很低时被归类为异常。
- 重构概率(reconstruction probability) 由随机隐变量计算，这些隐变量可以输出原始输入变量分布的参数，而不是输入数据本身。从本质上讲，这是从后验分布中提取的确定的隐变量生成数据的概率。由于从隐变量分布中提取了大量样本，这使得重构概率能够考虑隐变量空间的可变性，这是该方法与基于自动编码器的异常检测方法的主要区别之一。可以使用适合数据的输入变量空间的其他分布。对于连续数据，正态分布可以用在算法4中。对于二进制数据，可以使用伯努利分布。在隐变量空间分布的情况下，一个简单的连续分布，如各向同性正态分布是首选。这可以通过谱异常检测的假设来证明，隐变量空间比输入变量空间简单得多。

3 Difference from an autoencoder based anomaly detection

VAE的重构概率与自动编码器的重构误差不同之处包括：

隐变量是随机变量。AE的隐变量由确定性映射定义，但 VAE 使用概率编码器来模拟隐变量的分布，而不是隐变量本身，因此可以从采样过程中考虑隐变量空间的可变性。VAE 相对 AE 而言扩展了表达能力，因为即使正常数据和异常数据可能共享相同的平均值，可变性也可能不同。据推测，异常数据的方差较大，重构概率较低。由于 AE 的确定性映射可以看作是到 δ \delta δ 分布平均值的映射，所以 AE 缺乏处理变化的能力。（通俗来说讲，AE 太实诚了，不懂得变通）
重构的是随机变量。重构概率不仅考虑了重构与原始输入的差异，而且考虑了分布函数的方差参数对重构结果的影响。这一特性使得对根据变量方差重构的选择性敏感。方差较大的变量可以容忍重构过程中与原始数据之间的较大差异，而方差较小的变量将显著降低重构概率。这也是 AE 由于其确定性映射关系缺少的特性。
重构是概率度量。基于 AE 的异常检测使用重构误差作为异常值，如果输入变量是异构的，则很难计算出异常值。为了总结异构数据的差异，需要加权求和。但没有一种通用的客观方法来确定合适的权重，因为权重会因数据而异。而且，即使在权值确定之后，确定重构误差的阈值也很麻烦。没有明确的客观门槛。相比之下，重构概率的计算不需要对异构数据的重建误差进行加权，因为每个变量的概率分布允许它们根据自身的可变性分别计算。对于任何数据，1% 的概率总是 1%。因此，与重构误差阈值的确定相比，重构误差阈值的确定更为客观、合理、易于理解。

参考源码

PyTorch: https://github.com/cross32768/VAE_anomaly/blob/master/VAE.ipynb

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

2015

Variational

autoencoder

Based

ANOMALY

【2015/IE】Variational Autoencoder based Anomaly Detection using Reconstruction Probability 的相关文章

Shared-memory Based Ring Buffer

This post explains how to implement a ring buffer that can be shared between multiple processes For the simplicity and e
百度2015校园招聘软件开发笔试题及答案

简单题 xff08 本题共30分 xff09 请简述Tcp ip的3次握手以及4次挥手过程 xff1f 并解释为何关闭连接需要4次挥手 10分详细答案参见TCP IP协议三次握手与四次握手流程解析 TCP三次握手四次挥手过程如下通常情
Visual Studio 2015/2017/2019 之通道清单未通过测试签名验证，以及正确安装证书详细过程

Visual Studio 2015 2017 2019 之通道清单未通过测试签名验证 xff0c 以及正确安装证书详细过程在安装之前都要进行证书安装 xff0c 否则会出现各种各样的错误并且每个版本的证书都不一致年份企业版社区版
Dependable Horizontal Scaling Based On Probabilistic Model Checking 阅读笔记

一介绍本文提出的方法分为基于马尔科夫决策过程 Markov Decision Processes 构建弹性动作的模型利用模型制定具体的弹性策略使用马尔科夫决策过程的原因 MDPs 可以捕捉问题的转移概率和不确定性在当前状态下不
Windows驱动开发环境搭建（Visual Studio 2015 + WDK）

在Win10环境下开发Windows驱动程序需要依赖WDK xff0c 微软在 WDK7600 以后就不再提供独立的内核驱动开发包了 xff0c 而是必须首先安装微软集成开发环境VisualStudio 本文将介绍如何在Win10环境下配置
Codeforces Round #844 (Div. 1 + Div. 2, based on VK Cup 2022 - Elimination Round) D

1781D Many Perfect Squares 分析对于每组 xff0c 若和均为完全平方数 xff0c 则存在 xff1a 所以枚举所有 xff0c 对于每个 xff0c 枚举其所有双因子对 xff0c 若两个因子之差为偶数 x
【恶软检测】【防】Deep neural network based malware detection using two dimensional binary program features

使用二维二进制程序特征的基于深度神经网络的恶意软件检测作者是Saxe J xff0c Berlin K 2015 年发表在10th International Conference on Malicious and Unwanted So
2019论文阅读：SIMCO: SIMILARITY-BASED OBJECT COUNTING

发表于CVPR2019 文章目录文章贡献1 绪论2 SIMCO的两个阶段2 1 SIMCO detectionInShape数据集网络结构 xff1a 2 2 SIMCO clustering 3 实验及结果4 总结文章贡献提出了SI
vSLAM重读(4): OKVIS--KeyFrame-based Visual-Inertial SLAM

1 摘要视觉传感器与IMU传感器互补 61 61 gt VIO系统 xff1b 由最初的以滤波为主题 xff0c 现在逐渐转换为非线性优化来实现SLAM xff1b 提出一种方法将视觉信息与IMU测量数据紧密结合 xff0c 将IMU的误
【2015-2016，我在路上】

前言 xff1a 每天 xff0c 每时 xff0c 每分 xff0c 时光的步伐永远不会停止 xff0c 当我提起笔 xff0c 写下的这一瞬间 xff0c 时间又是一年 xff0c 一年的时光 xff0c 在没逝去时 xff0c 感觉很
GAUSSIAN MIXTURE VAE: LESSONS IN VARIATIONAL INFERENCE, GENERATIVE MODELS, AND DEEP NETS

Not too long ago I came across this paper on unsupervised clustering with Gaussian Mixture VAEs I was quite surprised es
再见2015，一个小白领的格调

当我一直沉默着做事情的时候时间就像一条脱缰的野狗一样肆意狂奔快到让我忘记了买回老家过冬的衣服便放春节了以至于现在我还满脑子的考虑穿什么过冬而不是感叹15年已经过完 2015年1月1日六个小伙伴在吃烤肉依次诉说各自的新年计划我
如何使用 LSTM 自动编码器在多特征序列中正确忽略解码时填充或丢失的时间步

我正在尝试通过使用自动编码器进行重建来学习文本序列的潜在表示多个特征 3 由于某些序列比最大 pad 长度或我正在考虑的时间步长 seq length 15 短我不确定重建是否会学会忽略时间步长或不计算损失或准确性我遵循了来自的建议这
Keras - 用于文本分析的自动编码器

因此我正在尝试创建一个自动编码器它将接受文本评论并找到较低维度的表示我正在使用 keras 我希望我的损失函数能够将 AE 的输出与嵌入层的输出进行比较不幸的是它给了我以下错误我很确定问题出在我的损失函数上但我似乎无法解决这个
LSTM/GRU 自动编码器收敛

Goal 尝试在多元时间序列数据集上运行 LSTM 自动编码器 X train 200 23 178 X val 100 23 178 X 测试 100 23 178 现在的情况普通的自动编码器比简单的 LSTM AE 架构可以获得更好的
带有嵌入层的 Keras LSTM 自动编码器

我正在尝试在 Keras 中构建一个文本 LSTM 自动编码器我想使用嵌入层但我不确定如何实现代码如下所示 inputs Input shape timesteps input dim embedding layer Embeddin
Keras fit_generator 产生异常：生成器的输出应该是元组（x，y，sample_weight）或（x，y）。发现：[[[[ 0.86666673

我正在尝试为非 MNIST 非 Imagenet 数据构建一个自动编码器使用https blog keras io building autoencoders in keras html https blog keras io build
模型输入必须来自“tf.keras.Input”...，它们不能是先前非输入层的输出

我正在使用Python 3 7 7 和张量流 2 1 0 我有一个预先训练过的 U Net 网络我想要得到它的编码器 and 它的解码器如下图所示您可以看到卷积编码器解码器架构我想要获取编码器部分即出现在图像左侧的图层以及解码
Keras 中的 add_loss 函数的用途是什么？

目前我偶然发现了变分自动编码器并尝试使用 keras 让它们在 MNIST 上工作我找到了一个教程github https github com keras team keras blob master examples variat
如何将值注入 TensorFlow 图的中间？

考虑以下代码 x tf placeholder tf float32 name x z x tf constant 5 0 y tf mul z tf constant 0 5 with tf Session as sess print s

随机推荐

无限想象空间，用Python玩转3D人体姿态估计

前言姿态估计 xff0c 一直是近几年的研究热点它就是根据画面 xff0c 捕捉人体的运动姿态 xff0c 比如 2D 姿态估计 xff1a 再比如 3D 姿态估计 xff1a 看着好玩 xff0c 那这玩应有啥用呢 xff1f 自动驾
如何成为一名合格的算法工程师？我们做了一次技能拆分…

文张相於成为一名合格的开发工程师不是一件简单的事情 xff0c 需要掌握从开发到调试到优化等一系列能力 xff0c 这些能力中的每一项掌握起来都需要足够的努力和经验而要成为一名合格的机器学习算法工程师 xff08 以下简称算法工程师
马上 2018 年了，该不该下定决心转型AI呢？

本文授权转自知乎如此火爆的AI xff0c 会不会像Android和iOS一样 xff0c 五年后归于平淡 xff1f 转型AI真的有必要吗 xff1f 2017年 xff0c AI就像一个点石成金的神器 xff0c 所有的行业 xff0
一文看懂深度学习发展史和常见26个模型

参加 2019 Python开发者日 xff0c 请扫码咨询来源 AI部落联盟 xff08 ID xff1a AI Tribe xff09 作者简介 xff1a 沧笙踏歌 xff0c 硕士毕业于北京大学 xff0c 目前计算机科学与技术博
QT的QMessageBox

QMessageBox是弹出的消息框 xff0c 分为 xff1a 错误消息问题警告 span class token comment 具体参数如下 xff1a span span class token function criti
我在旷视研究院做检测 | 技术头条

作者俞刚 xff0c 旷视研究院Detection组负责人 2014年博士毕业于新加坡南洋理工大学 xff0c 加入旷视主要负责检测 xff0c 分割 xff0c 跟踪 xff0c 骨架 xff0c 动作行为等方面的研究以及算法落地工作
63万张！旷视发布最大物体检测数据集Objects365 | 技术头条

编辑琥珀来源 AI科技大本营 xff08 id xff1a rgznai100 xff09 昨日 xff0c 在旷视科技联合北京智源人工智能研究院举办的发布会上 xff0c 旷视研究院发布了物体检测数据集 Objects365 xff0
C语言中跨文件的全局变量

声明 xff1a 突然看到这篇文章 xff0c 发现了c语言中使用全局变量的错误 xff0c 特转之首先看一段代码 xff08 https gist github com 3760736 xff09 func c 1 2 3 4 5 6
debian/ubuntu增加自定义启动服务

1 创建启动服务文件 vi lib systemd system sdvn service Unit Description 61 sdvn After 61 network target Service Type 61 forking E
ROS环境下Pixhawk+XPlane半实物仿真

使用pixhawk作为飞控开发固定翼飞机的相关应用时 xff0c 半实物的仿真环境可以很好的模拟真实的飞行环境本文介绍了借助Mavros软件包实现ROS环境下机载处理的半实物仿真环境搭建实验所需软硬件 xff1a pixhawk xff
天猫精灵家居对接第三方设备（详细版）

提示 xff1a 文章写完后 xff0c 目录可以自动生成 xff0c 如何生成可参考右边的帮助文档文章目录前言补充准备阶段 xff08 内网映射到外网 xff09 一天猫精灵官网配置准备二天猫精灵部分实现代码三天猫精灵配置技能广
网吧管理系统 java SpringBoot vue 前后端

前言介绍随着信息技术和网络技术的飞速发展 xff0c 人类已进入全新信息化时代 xff0c 传统管理技术已无法高效 xff0c 便捷地管理信息为了迎合时代需求 xff0c 优化管理效率 xff0c 各种各样的管理系统应运而生 xff0c
海康ISAPI透传ftp

GET ISAPI System Network ftp security 61 0 xff0c security 61 0或者不设置 xff0c 否则用户名加密获取不到密码password PUT ISAPI System Networ
[CMake笔记] CMake向解决方案添加源文件兼头文件(转)

回顾在上一篇笔记里总结的时候说到 xff0c aux source directory这个函数在添加源码文件时 xff0c 是不会把头文件添加进去的 xff0c 这里就介经一下另外一个方法 xff0c 也是我一直使用的添加文件 cpp与
CmakeList语法介绍引入Vcpkg与使用Vcpkg导入Opencv

简单CmakeList txt内容欢迎使用Markdown编辑器 cmake minimum required VERSION 3 11 引入vcpkg set CMAKE TOOLCHAIN FILE 34 CMAKE SOURCE D
vim 中批量添加注释（块选择模式）

批量注释 xff1a Ctrl 43 v 进入块选择模式 xff0c 然后移动光标选中你要注释的行 xff0c 再按大写的 I 进入行首插入模式输入注释符号如或 xff0c 输入完毕之后 xff0c 按两下 ESC xff0c Vim 会
在github找到指定版本代码并下载

以MPC HC代码为例子记下过程备忘具体版本为nightly 1 7 0 154 1 通过官网http mpc hc org downloads 找到github地址https github com mpc hc mpc hc 2 通
光盘自动运行程序的秘密

光盘自动运行程序的秘密光盘一放入光驱就会自动被执行 xff0c 主要依靠两个文件 xff0c 一是光盘上的 Cdvsd vxd 会随时侦测光驱中是否有放入光盘的动作 xff0c 如果有的话 xff0c 便开始寻找光盘根目录下的AutoRu
mysql生成不重复随机数(unique number generation)

问题来源业务中有时会遇到要生成不重复随机数的情况 xff0c 例如 xff0c 新生成一个商品编号房间编号或者其他物品编号等不愿意采用表的自增索引 id xff0c 同时又希望新生成的编号是不重复的这就需要考验mysql的随机数功
【2015/IE】Variational Autoencoder based Anomaly Detection using Reconstruction Probability

原文首发于个人站点 xff1a 基于变分自编码器重构概率的异常检测模型个人公众号 xff1a DreamHub 文章链接 xff1a Variational Autoencoder based Anomaly Detection usin