AutoEncoder (自编码/非监督学习)

2023-11-18

神经网络也能进行非监督学习, 只需要训练数据, 不需要标签数据. 自编码就是这样一种形式. 自编码能自动分类数据, 而且也能嵌套在半监督学习的上面, 用少量的有标签样本和大量的无标签样本学习.

这次我们还用 MNIST 手写数字数据来压缩再解压图片.

然后用压缩的特征进行非监督分类.

训练数据

自编码只用训练集就好了, 而且只需要训练 training data 的 image, 不用训练 labels.

import torch
import torch.nn as nn
from torch.autograd import Variable
import torch.utils.data as Data
import torchvision

# 超参数
EPOCH = 10
BATCH_SIZE = 64
LR = 0.005
DOWNLOAD_MNIST = True   # 下过数据的话, 就可以设置成 False
N_TEST_IMG = 5          # 到时候显示 5张图片看效果, 如上图一

# Mnist digits dataset
train_data = torchvision.datasets.MNIST(
    root=\'./mnist/\',
    train=True,                                     # this is training data
    transform=torchvision.transforms.ToTensor(),    # Converts a PIL.Image or numpy.ndarray to
                                                    # torch.FloatTensor of shape (C x H x W) and normalize in the range [0.0, 1.0]
    download=DOWNLOAD_MNIST,                        # download it if you don\'t have it
)

这就是一张我们要训练的手写数字 4.

AutoEncoder

AutoEncoder 形式很简单, 分别是 encoder 和 decoder , 压缩和解压, 压缩后得到压缩的特征值, 再从压缩的特征值解压成原图片.

class AutoEncoder(nn.Module):
    def __init__(self):
        super(AutoEncoder, self).__init__()

        # 压缩
        self.encoder = nn.Sequential(
            nn.Linear(28*28, 128),
            nn.Tanh(),
            nn.Linear(128, 64),
            nn.Tanh(),
            nn.Linear(64, 12),
            nn.Tanh(),
            nn.Linear(12, 3),   # 压缩成3个特征, 进行 3D 图像可视化
        )
        # 解压
        self.decoder = nn.Sequential(
            nn.Linear(3, 12),
            nn.Tanh(),
            nn.Linear(12, 64),
            nn.Tanh(),
            nn.Linear(64, 128),
            nn.Tanh(),
            nn.Linear(128, 28*28),
            nn.Sigmoid(),       # 激励函数让输出值在 (0, 1)
        )

    def forward(self, x):
        encoded = self.encoder(x)
        decoded = self.decoder(encoded)
        return encoded, decoded

autoencoder = AutoEncoder()

训练

训练, 并可视化训练的过程. 我们可以有效的利用 encoder 和 decoder 来做很多事, 比如这里我们用 decoder 的信息输出看和原图片的对比, 还能用 encoder 来看经过压缩后, 神经网络对原图片的理解. encoder 能将不同图片数据大概的分离开来. 这样就是一个无监督学习的过程.

optimizer = torch.optim.Adam(autoencoder.parameters(), lr=LR)
loss_func = nn.MSELoss()

for epoch in range(EPOCH):
    for step, (x, y) in enumerate(train_loader):
        b_x = Variable(x.view(-1, 28*28))   # batch x, shape (batch, 28*28)
        b_y = Variable(x.view(-1, 28*28))   # batch y, shape (batch, 28*28)
        b_label = Variable(y)               # batch label

        encoded, decoded = autoencoder(b_x)

        loss = loss_func(decoded, b_y)      # mean square error
        optimizer.zero_grad()               # clear gradients for this training step
        loss.backward()                     # backpropagation, compute gradients
        optimizer.step()                    # apply gradients

画3D图

3D 的可视化图挺有趣的, 还能挪动观看, 更加直观, 好理解.

# 要观看的数据
view_data = Variable(train_data.train_data[:200].view(-1, 28*28).type(torch.FloatTensor)/255.)
encoded_data, _ = autoencoder(view_data)    # 提取压缩的特征值
fig = plt.figure(2)
ax = Axes3D(fig)    # 3D 图
# x, y, z 的数据值
X = encoded_data.data[:, 0].numpy()
Y = encoded_data.data[:, 1].numpy()
Z = encoded_data.data[:, 2].numpy()
values = train_data.train_labels[:200].numpy()  # 标签值
for x, y, z, s in zip(X, Y, Z, values):
    c = cm.rainbow(int(255*s/9))    # 上色
    ax.text(x, y, z, s, backgroundcolor=c)  # 标位子
ax.set_xlim(X.min(), X.max())
ax.set_ylim(Y.min(), Y.max())
ax.set_zlim(Z.min(), Z.max())
plt.show()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能（AI）

深度学习（DL）

学习

深度学习

python

AutoEncoder (自编码/非监督学习) 的相关文章

从 SHAP 值中获取特征重要性

我想要获得重要功能的数据框通过下面的代码我得到了 shap values 但我不确定这些值的含义是什么在我的 df 中有 142 个特征和 67 个实验但得到了一个带有 ca 的数组 2500 个值 explainer shap T
如何在 Jupyter Notebook 中运行 Python 异步代码？

我有一些 asyncio 代码在 Python 解释器 CPython 3 6 2 中运行良好我现在想在具有 IPython 内核的 Jupyter 笔记本中运行它我可以运行它 import asyncio asyncio get ev
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
如何在VIM中设置文件的正确路径？

每当我击中 pwd在 vim 中命令总是返回路径C Windows system32 即使我在桌面上的 Python 文件中所以每当我跑步时 python 命令返回 python can t open file Users myname
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
如何使用 javascript/jquery/AJAX 调用 Django REST API？

我想使用 Javascript jQuery AJAX 在前端调用 Django Rest API 请求方法是 POST 但当我看到 API 调用它的调用 OPTIONS 方法时所以我开始了解access control allow o
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
设置 verify_certs=False 但 elasticsearch.Elasticsearch 因证书验证失败而引发 SSL 错误

self host KibanaProxy 自我端口 443 self user 测试 self password 测试我需要禁止证书验证使用选项时它与curl一起使用 k在命令行上但是在使用 Elasticsearch pytho
如何使用 Bokeh 动态隐藏字形和图例项

我正在尝试在散景中实现复选框其中每个复选框应显示隐藏与其关联的行我知道可以通过图例来实现这一点但我希望这种效果同时在两个图中发生此外图例也应该更新在下面的示例中出现了复选框但不执行任何操作我显然不明白如何更新用作源的数据
如何在 Django 中使用基于类的视图创建注册视图？

当我开始使用 Django 时我几乎使用 FBV 基于函数的视图来处理所有事情包括注册新用户但当我更深入地研究项目时我意识到基于类的视图通常更适合大型项目因为它们更干净且可维护但这并不是说 FBV 不是无论如何我将整个项目
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
Python：我不明白 sum() 的完整用法

当然我明白你使用 sum 与几个数字然后它总结所有但我正在查看它的文档我发现了这一点 sum iterable start 第二个参数 start 的作用是什么这太尴尬了但我似乎无法通过谷歌找到任何示例并且对于尝试学习该语言的
Django - 提交具有同一字段多个输入的表单

预警我对 Django 以及一般的 Web 开发非常陌生我使用 Django 托管一个基于 Web 的 UI 该 UI 将从简短的调查中获取用户输入通过我用 Python 开发的一些分析来提供输入然后在 UI 中呈现这些分析的可视
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
bs4 `next_sibling` VS `find_next_sibling`

我在使用时遇到困难next sibling 并且类似地与next element 如果用作属性我不会得到任何返回但如果用作find next sibling or find next 然后就可以了来自doc https www cru
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j
python 日志记录会刷新每个日志吗？

当我使用标准模块将日志写入文件时logging 每个日志会分别刷新到磁盘吗例如下面的代码会将日志刷新 10 次吗 logging basicConfig level logging DEBUG filename debug log fo
使用 Python 将对象列表转为 JSON

我在转换时遇到问题Object实例到 JSON ob Object list name scaping myObj base url u number page for ob in list name json string json du

随机推荐

PMSM学习笔记1——永磁同步电机的工作原理与数学模型

文章目录一 PMSM工作原理 1 同步电机工作原理来源电机学李发海 2 永磁同步电机数学模型及坐标变换来源现代电机控制技术王成元 2 1旋转磁场 2 2三相PMSM的基本数学模型 2 3三相PMSM的坐标变换 2 3 1 Cl
【Unity 3D】学习笔记 - 粒子系统制作

这次的任务是制作一个简单的粒子系统并用代码控制使之在不同的场景下呈现出不同的效果我想要制作出颜色渐变的烟花效果关于粒子系统可以参考 Unity 3D 学习笔记粒子系统初探粒子系统基本设置如下其中Simulation Rotat
学生用计算机怎么恢复出厂设置,电脑怎么恢复出厂设置

关机或重启时按住电脑键盘的 Del 键进入BIOS 使用Enter回车键选中 Load Optimized Defaults 选项使用方向键选中 Y 确认点击 Save Exit Step 或者按 F10 退出即可以下是详细介绍电
Go语言实现Onvif客户端：2、获取设备信息

Go语言实现Onvif客户端 2 获取设备信息文章目录 Go语言实现Onvif客户端 2 获取设备信息 1 思路 2 代码 1 思路搜索设备获取设备能力通过设备能力的设备接口读取设备信息我们上节说了主要是通过设备信息中的内容来区
线性代数【基础1】

文章目录行列式方阵的行列式公式矩阵矩阵的逆矩阵的秩伴随矩阵初等变换与初等矩阵分块矩阵向量正交矩阵正交化线性表示线性无关与线性相关极大无关组与向量组的秩线性方程组解的性质与判定齐次线性方程组非齐次线性方程组
大型网站在架构上应当考虑哪些问题？

分层分层是处理任何复杂系统最常见的手段之一将系统横向切分成若干个层面每个层面只承担单一的职责然后通过下层为上层提供的基础设施和服务以及上层对下层的调用来形成一个完整的复杂的系统计算机网络的开放系统互联参考模型 OSI RM 和In
Java8 CompletableFuture处理多个异步任务

CompletableFuture Java5引入了Future和 FutureTask 用于异步处理 Future可以通过get 方法获取异步的返回值在Java8引入了CompletableFuture CompletableFutur
设置GPU及显存大小

20210128 引言之前搜索过设置GPU和显存大小的方式但是升级了新的版本的keras以及tensorflow 导致之前的代码失效了这里记录一下本质上就是版本更换的原因很多api可能被取消或者改了别的原始代码 import
计算机网络ip尽最大努力交付,计算机网络知识(IP、TCP、UDP)--持续更新

互联网的两个重要的基本特点连通性和共享计算机网络由若干结点和连接这些结点的链路组成互联网的组成边缘部分核心部分网络边缘的端系统之间的通信可分为两大类客户服务器方式 C S方式和对等方式 P2P方式互联网的核心部分许多网
原始传奇手游服务器不显示,原始传奇手游为什么进不去无法登录游戏解决方法...

近日有一款由古力娜扎代言的手游原始传奇上线了不少玩家也很想体验一番可是却发现原始传奇手游进不去不知道是为什么下面悠小悠就为大家详细介绍下无法登录游戏的原因和解决方法一起探讨下吧原始传奇手游进不去原因及解决方法 1 如果是登录
tomcat没有日志输出--解决办法

程序没有问题只是控制台信息卡感觉像程序休眠了一样然后在控制台点backspace或是enter 程序恢复正常控制台日志正常输出静态文件访问可以解决办法转载于 https blog 51cto com 13693838 2398
BIND9的架构与机制笔记1

BIND9采用的是事件驱动的机制来工作而事件的源头则是IO IO在linux使用的EPOLL的边缘触发模式本篇说的是epoll BIND9如果创建了watcher线程宏USE WATCHER THREAD控制这里就讨论有线程的情况
Redis第五讲 Redis内存淘汰策略之LRU与LFU算法详细介绍

前面介绍了Redis的一些内存淘汰策略一般比较常用的两种淘汰策略为LRU LFU 而且他们的算法考察的也比较多 LRU 最近最久未使用标准LRU算法是这样的它把数据存放在链表中按照最近访问的顺序排列当某个key被访问时就将此ke
机器学习——无监督学习

机器学习的分类一般分为下面几种类别监督学习 supervised Learning 无监督学习 Unsupervised Learning 强化学习 Reinforcement Learning 增强学习半监督学习 Semi supe
Vue 中实现 excel文件上传功能

Duang 最近搭建了一个自己的博客小破站欢迎各位小伙伴来访吖 ares coder blog portalhttps www ares stack cn blog service game 场景上传excel表并将excel表中的数
Django实现前后端分离开发

前后端分离开发在传统的Web应用开发中大多数的程序员会将浏览器作为前后端的分界线将浏览器中为用户进行页面展示的部分称之为前端而将运行在服务器为前端提供业务逻辑和数据准备的所有代码统称为后端所谓前后端分离的开发就是前后端工程师约
Hadoop 之上的数据建模 - Data Vault 2.0

对比传统的基于 RDBMS 之上的数据仓库和商业智能项目尝试着说说 Hadoop 之上的数据仓库从ETL 数据存储到分析展现重点围绕数据建模方面做分析因为这是本文的重点介绍一份新的数据建模方式 Data Vault 2 0 ET
HTML框架构建

HTML框架构建 1 划分框架 A 使用标签决定如何划分框架必须要有标签设定每个小窗口的网页该标签中有src属性为每个URL值指定一个HTML文件这个文件必须事先做好 B 标签常用的属性属性描述 cols 用像素数或分个左右
Android-PullToRefresh下拉刷新库基本用法

PullToRefresh是一套实现非常好的下拉刷新库它支持 ListView ExpandableListView GridView WebView ScrollView HorizontalScrollView ViewPager 等
AutoEncoder (自编码/非监督学习)

神经网络也能进行非监督学习只需要训练数据不需要标签数据自编码就是这样一种形式自编码能自动分类数据而且也能嵌套在半监督学习的上面用少量的有标签样本和大量的无标签样本学习这次我们还用 MNIST 手写数字数据来压缩再解压图片然后

AutoEncoder (自编码/非监督学习)

AutoEncoder (自编码/非监督学习) 的相关文章

随机推荐

热门标签