【计算机视觉】VAE 讲解

2023-11-04

VAE

1. 模型概述

变分自编码器(Variational AutoEncoder,VAE)属于生成模型。从概率图的角度看,VAE 是带隐变量的有向概率图模型;从神经网络的角度看,VAE 是以自编码器(AutoEncoder,AE)为框架的生成模型。VAE 通过在由编码器确定的分布中采样的结果作为解码器的输入以对输入图像进行重建,其关键之处在于编码器直接输出的不是潜在空间(编码空间)的具体特征,而是特征分布,这使得 VAE 成为与朴素自编码器不同的生成模型。

具体来说,将模型的解码器结构剥离出来,只有当输入为非常接近模型遇见过的潜在特征时,朴素自编码器模型的解码器才能输出具有合理语义的图像,对于变化比较大的潜在特征,编码器生成的图像不符合人们的预期,甚至无法被人们理解,因此不认为朴素自编码器具备生成能力;而 VAE 通过向潜在特征加入噪音,使得编码器能够对于潜在特征发生变化的输入也具有一定的处理能力,从而保证了其生成图像的合理性。

2. 模型结构

在这里插入图片描述

图 1    VAE 模型

变分自编码器的结构如图 1

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【计算机视觉】VAE 讲解 的相关文章

随机推荐

  • Rancher应用商店的questions.yml接收数组参数

    背景 制作FlinkCluster的Chart包 要求应用商店界面输入接受数组参数 questions yml 是不支持这种形式的 解决方案 questions yml中的参数最终是以 set name value 的形式拼接到命令中的 h
  • m3u8 videojs 倍速播放属性

    var myVideo videojs myVideo bigPlayButton true textTrackDisplay false posterImage false errorDisplay false playbackRates
  • Elasticsearch-拼音分词/排序

    1 拼音分词器安装 1 1下载拼音分词插件 要和安装的es版本保持一致 我的版本是6 6 0 下载地址 https github com medcl elasticsearch analysis pinyin tree v6 4 0 1 2
  • C++学习难点1

    数据类型与表达式 1 运算符 1 1 自增自减运算符 int i 0 j j i 后置 i的值自增变为1 表达式i 的值为i自增之前的值 即j得值为0 j i 前置 i的值自增变为1 表达式i 的值为i自增之后的值 即j得值为1 注意 自增
  • UnityShader 模型空间转剪裁空间

    模型空间转剪裁空间 1 引入UnityCG cginc库 include Lighting cginc 2 使用UnityObjectToClipPos 方法 v2f vert a2v v v2f f f svPos UnityObject
  • IO流

    过滤器字节流 FilterInputStream 过滤器字节输入流 FilterOutputStream 过滤器字节输出流 它们的主要用于封装其他的输入输出流 为它们提供一些额外的功能 具有以下实现类 以下以FilterInputStrea
  • 【完全开源】小安派-KVM 三进一出切换器

    目录 一 概述 二 使用方法 2 1 连接 2 2 切换 2 3 掉电储存 三 控制原理 3 1 HIDMI控制 3 2 USB切换控制 3 3按键读取 四 资料 一 概述 AiPi KVM 是一款三进一出的HDMI USB的切换器 可以让
  • angular2单元测试学习

    单元测试简介 https segmentfault com a 1190000009737186 单元测试 Jasmine https segmentfault com a 1190000009737204 angular2单元测试 htt
  • What are you looking for on top of the world? English readings.

    Hillary and Tenzing are famous around the world for being the first people to climb Mount Everest in 1953 But few people
  • Windows server 2016——SQL server T-SQL查询语句

    作者简介 一名云计算网络运维人员 每天分享网络与运维的技术与干货 公众号 网络豆 座右铭 低头赶路 敬事如仪 个人主页 网络豆的主页 目录 写在前面 介绍 一 SQL简介 1 SQL和T SQL 2 T SQL的组成 二 使用T SQL语句
  • 1. PyTorch是什么?

    这篇博客将介绍PyTorch深度学习库 包括 PyTorch是什么 如何安装PyTorch 重要的PyTorch功能 包括张量和自动标记 PyTorch如何支持GPU 为什么PyTorch在研究人员中如此受欢迎 PyTorch是否优于Ker
  • OpenGL系列教程之五:OpenGL矩阵类

    转自 https blog csdn net u012501459 article details 12945149 creation 相关主题 OpenGL变换 OpenGL投影矩阵 四元数 下载 matrix zip matrix ro
  • (已解决)网卡驱动Intel(R) Wi-Fi 6 AX200 160MHz,设备无法启动(代码10)

    电脑由于重装系统后双显示屏无法正常工作 于是卸载了原先驱动 重启后发现无法连接wifi了 win键 X打开设备管理器查看网络适配器 发现Intel R Wi Fi 6 AX200 160MHz前有黄标 无法启动 现已修复 解决方法 重置网络
  • oracle怎么查询表空间信息,查询Oracle表空间信息

    查询Oracle表空间信息 查看当前用户每个表占用空间的大小 查询出系统表空间的大小 并按大小进行降序排列 需要SYSDBA的权限 1 查看当前用户每个表占用空间的大小 Select Segment Name Sum bytes 1024
  • 两个ssh客户端同时都以root用户登录linux,这两个root不会冲突吗?

    不会冲突 解释 用户登录linux的本质是开启一个shell进程 例如bash进程 每个bash进程的ID随机分配 例如 root登录 开启bash进程 进程ID为3600 root再次登录 开启bash进程 进程ID为3900进程ID不冲
  • 基于Matlab实现硬币计数

    目录 一 对图像进行灰度处理 二 降噪处理 三 二值化处理 四 填充洞 五 创建结构元素并进行腐蚀运算 六 检测二值图像中连通域的个数 完整代码 和前面一样 本文介绍了使用matlab软件对图像进行基本处理 包括读取目标图像文件 将RGB图
  • Git 仓库目录 .git 详解

    目录 一 实例环境 二 目录结构 2 1 branches 目录 2 2 COMMIT EDITMSG 文件 2 3 config 文件 2 4 description 文件 2 5 HEAD文件 2 6 hooks 目录 2 7 inde
  • vue实现input高亮

    methods中添加 highlight text const highlightStr span class active this searchText span 正则表达式 中间的内容都会被当作匹配字符串来使用 而不是数据变量 如果需
  • 已安装的nginx,添加新模块fastdfs-nginx-module

    1 先看nginx的安装位置和运行目录 不清楚的可以使用命令查看 find name nginx 2 确定安装目录和运行目录后 查看当前nginx的安装路径及已安装的模块等信息 usr local nginx sbin nginx V 3
  • 【计算机视觉】VAE 讲解

    VAE 1 模型概述 变分自编码器 Variational AutoEncoder VAE 属于生成模型 从概率图的角度看 VAE 是带隐变量的有向概率图模型 从神经网络的角度看 VAE 是以自编码器 AutoEncoder AE 为框架的