基于pytorch实现的Auto-encoder模型

2023-11-13

最近因为在自己论文当中可能要用到Auto-encoder 这个东西，学了点皮毛之后想着先按照别人的解释实现一下，然后在MNIST数据集上跑了下测试看看效果。
话不多说直接贴代码。

"""
Author:Media
2020-10-23
"""
import torch
import torch.nn as nn
import torch.utils.data as Data
from matplotlib import pyplot as plt
import numpy as np
import pandas as pd


class MyDataset(torch.utils.data.Dataset):
    def __init__(self, data_root):
        self.data = data_root
        # self.label = data_label

    def __getitem__(self, index):
        data = self.data[index]
        # labels = self.label[index]
        return data  # , labels

    def __len__(self):
        return len(self.data)


# 超参数
# DATA_DIM = 10
EPOCH = 10
BATCH_SIZE = 64
LR = 0.005
BIAS = 0.05
EPOCHS = 10
SAMPLE_SIZE = 10
FILEPATH = ""

def read_csv_file_data(file_path):  # read .csv file
    data = pd.read_csv(file_path)
    train_data = np.array(data, dtype=np.float32)  # np.ndarray()
    train_x_list = torch.from_numpy(train_data)  # list
    return train_x_list


def read_txt_file_data(filepath):  # read .txt file
    data = list()
    for line in open(filepath, 'r'):
        temp = torch.zeros(784)
        tt = line.split(' ')[:-1]
        for item in tt:
            content = item.split(':')
            temp[int(content[0])] = float(content[1])
        data.append(temp)
    return data[10:len(data)-10]


DATA_DIM = 784
HIDE_DIM = 64
traindata = read_txt_file_data(FILEPATH)
train_data = MyDataset(traindata)
trainLoader = Data.DataLoader(dataset=train_data, batch_size=BATCH_SIZE, shuffle=True, drop_last=False)


class Auto_Encoder(nn.Module):
    def __init__(self, _input_dim, _hide_dim):
        super(Auto_Encoder, self).__init__()
        self.input_dim = _input_dim
        self.hide_dim = _hide_dim
        self.encoder = Encoder(_input_dim=self.input_dim, _hide_dim=self.hide_dim)
        self.decoder = Decoder(_input_dim=self.input_dim, _hide_dim=self.hide_dim)

    def forward(self, x):
        encoded = self.encoder(x)
        decoded = self.decoder(encoded)
        return encoded, decoded

    def output(self, x):
        return self.encoder(x)


class Encoder(nn.Module):
    def __init__(self, _input_dim, _hide_dim):
        super(Encoder, self).__init__()
        self.input_dim = _input_dim
        self.hide_dim = _hide_dim
        self.linear1 = nn.Linear(_input_dim, 512)
        self.linear2 = nn.Linear(512, 256)
        self.linear3 = nn.Linear(256, 128)
        self.linear4 = nn.Linear(128, self.hide_dim)

    def forward(self, x):
        x = torch.tanh(self.linear1(x))
        x = torch.tanh(self.linear2(x))
        x = torch.tanh(self.linear3(x))
        x = self.linear4(x)
        return x


class Decoder(nn.Module):
    def __init__(self, _input_dim, _hide_dim):
        super(Decoder, self).__init__()
        self.input_dim = _input_dim
        self.hide_dim = _hide_dim
        self.linear1 = nn.Linear(_hide_dim, 128)
        self.linear2 = nn.Linear(128, 256)
        self.linear3 = nn.Linear(256, 512)
        self.linear4 = nn.Linear(512, self.input_dim)

    def forward(self, x):
        x = torch.tanh(self.linear1(x))
        x = torch.tanh(self.linear2(x))
        x = torch.tanh(self.linear3(x))
        x = torch.sigmoid(self.linear4(x))
        return x


def draw_mnist(data, title="raw data"):
    data = np.array(data)
    img = data.reshape(28, 28)
    plt.title(title)
    plt.imshow(img, cmap='gray')
    plt.show()


autoencoder = Auto_Encoder(_input_dim=DATA_DIM, _hide_dim=HIDE_DIM)
optimizer = torch.optim.Adam(autoencoder.parameters(), lr=LR)
loss_func = nn.MSELoss()


def learn_by_epoch(epochs):
    epoch = 0
    while epoch < epochs:
        for _, x in enumerate(trainLoader):
            x = torch.tensor(x)
            # y = x
            encoded, decoded = autoencoder(x)
            loss = loss_func(decoded, x)
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
        if epoch % 100 == 0:
            print('epoch:' + str(epoch) + ' = ' + str(loss.data.item()))
        epoch += 1


def learn_by_bias(bias):
    epochs = 0
    count = 0
    while count < 5:
        for _, x in enumerate(trainLoader):
            x = torch.tensor(x)
            y = x
            encoded, decoded = autoencoder(x)
            loss = loss_func(decoded, y)
            if loss < bias:
                count += 1
            else:
                count = 0
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
        # if epochs % 100 == 0:
        print('epoch:' + str(epochs) + ' = ' + str(loss.data.item()))
        epochs += 1
    print("train time:= "+str(epochs))


learn_by_epoch(epochs=EPOCHS)
# learn_by_bias(bias=BIAS)
result = []
indices = np.random.choice(len(traindata), SAMPLE_SIZE)
for item in indices:
    # print("input:= "+str(item))
    item = traindata[item].unsqueeze(0)
    _, tt,  = autoencoder(item)
    tt = tt.detach()
    tt = torch.squeeze(tt)
    result.append(tt.numpy())

index = 0
for item in indices:
    draw_mnist(traindata[item])
    draw_mnist(result[index], "auto encoder out")
    index += 1
print(index)

代码中使用的数据集是稀疏存储版的MNIST数据。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python编程

python

基于pytorch实现的Auto-encoder模型的相关文章

为什么应用程序会在 sys.exit 命令之后显示？

我正在关注这个教程 http zetcode com tutorials pyqt4 firstprograms http zetcode com tutorials pyqt4 firstprograms 在第一个示例中我不明白为什么应
使用 Marshmallow 中的数据更新行 (SQLAlchemy)

我正在使用 Flask Flask SQLAlchemy Flask Marshmallow marshmallow sqlalchemy 尝试实现 REST api PUT 方法我还没有找到任何使用 SQLA 和 Marshmallow
使用 python 通过搜索端点从 Spotify API 获取曲目

因此我尝试使用 API 的搜索端点进行搜索从而从 Spotify API 获取曲目请参阅文档 https developer spotify com documentation web api reference search sea
Keras，如何获取每一层的输出？

我已经用 CNN 训练了一个二元分类模型这是我的代码 model Sequential model add Convolution2D nb filters kernel size 0 kernel size 1 border mode
在一张图中同时绘制两个截面强度

我有一个形状数组 512 512 看起来像行 x 列 y 密度 z 数组的数量 0 012825 0 020408 0 022976 0 015938 0 02165 0 024357 0 036332 0 031904 0 025462
如何编写高效的配对算法？

我需要一种算法的帮助该算法可以有效地将人们分组并确保以前的配对不会重复例如假设我们有 10 位候选人 candidates 0 1 2 3 4 5 6 7 8 9 并假设我们有一个先前匹配的字典这样每个键值对即candidate
01 无效令牌[重复]

这个问题在这里已经有答案了嘿学习 python3有一段时间了遇到字典和dictionary name get 方法并尝试获取随机键值问题 data data get key 1 它有效并且返回 1 但如果我使用data get ke
Python：如何重构循环导入

我有件事可以帮你做engine setState
使用 Pandas 查找自滚动高点以来的周期数

我在 Pandas 中使用rolling max函数 http pandas pydata org pandas docs stable computation html moving rolling statistics moments
python 语言环境奇怪的错误。这究竟是怎么回事？

所以今天我升级到了 bazaar 2 0 2 我开始收到这条消息顺便说一句我在雪豹上 bzr warning unknown locale UTF 8 Could not determine what text encoding to
Docker：通过 Gunicorn 运行 Flask 应用程序 - Worker 超时？表现不佳？

我正在尝试创建一个用Python Flask编写的新应用程序由gunicorn运行然后进行dockerized 我遇到的问题是 docker 容器内的性能非常差不一致我最终得到了响应但我不明白为什么性能会下降有时我会在日志中看到
Python/Flask：应用程序在关闭后正在运行

我正在开发一个简单的 Flask Web 应用程序我使用 Eclipse Pydev 当我开发该应用程序时由于代码更改我必须经常重新启动该应用程序这就是问题所在当我运行该应用程序时我可以在本地主机上看到该框架这很好但是当我想
出现意外的关键字参数“timeout”（Python 中的 google-cloud-storage）

使用 google cloud storage 的 Python 项目在本地运行良好但是当它从 App Engine 运行时会显示错误 Traceback most recent call last File opt python3 7
如何在Python中获取绝对文件路径

给定一条路径例如 mydir myfile txt 如何在Python中找到文件的绝对路径例如在 Windows 上我最终可能会得到 C example cwd mydir myfile txt gt gt gt import os
从文档字符串生成 sphinx 文档不起作用

我有一个具有以下结构的项目我想保留 my project build here is where sphinx should dump into requirements txt make bat Makefile more config
散景中的时间序列流

我想在散景中绘制实时时间序列我只想在每次更新时绘制新的数据点我怎样才能做到这一点散景网站上有一个动画情节的示例但它每次都需要重新绘制整个图片另外我正在寻找一个简单的示例我可以在其中逐点绘制时间序列的实时绘图散景效果0 11
将 ASCII 字符转换为“”unicode 表示法的脚本

我正在对 Linux 区域设置文件进行一些更改 usr share i18n locales like pt BR 并且需要格式化字符串例如 d m Y H M 必须以 Unicode 指定其中每个在本例中为 ASCII 字符表示为
如何使用 python-gnupg 加密大型数据集而不占用所有内存？

我的磁盘上有一个非常大的文本文件假设它是 1 GB 或更多还假设该文件中的数据有 n每 120 个字符一个字符我在用python gnupg https pythonhosted org python gnupg 对此文件进行加密由
对 pandas 数据框中的每一列应用函数

我如何以更多的熊猫方式编写以下函数 def calculate df columns mean self df means for column in df columns columns tolist cleaned data self
提供节点名或服务名，或未知

我收到这个 Python 错误 File Library Frameworks Python framework Versions 2 7 lib python2 7 urllib2 py line 1184 in do open rais

随机推荐

[MATLAB]Jacobi迭代

MATLAB代码关于使用雅可比迭代法求线性方程组的数值解 jacobi m 定义Jacobi迭代函数 function x n jacobi A b x0 eps 计算迭代矩阵 D diag diag A L tril A 1 U tri
Docker入门到实践 (六) docker网络模式详解以及容器间的网络通信

文章目录一前言二 docker网络模式介绍 1 默认网络 1 1 bridge网络模式 1 2 host网络模式 1 3 none网络模式 1 4 container网络模式 2 自定义网络 2 1 创建网络 2 2 连接网络 2 3
微软收购暴雪的野心：与索尼争雄重金布局元宇宙

1月18日微软发布声明称将以全现金方式斥资687亿美元收购游戏巨头动视暴雪这将成为微软有史以来规模最大的一笔收购同时也将改写游戏行业的收购纪录完成这笔收购之后使命召唤魔兽世界糖果传奇暗黑破坏神守望先锋等脍炙人口的作品将
element-ui el-cascader 级联选择器联动默认值

在使用 element ui 的 el cascader 组件根据后台返回的数据需要展示一个默认值官网给出的例子https element eleme cn 2 0 zh CN component cascader 借鉴了一下话不多说
hexo博客搭建-背景知识（二）

yum与rpm的区别 rpm适用于所有环境而yum要搭建本地yum源才可以使用 yum是上层管理工具自动解决依赖性而rpm是底层管理工具 gcc cc c g 命令行详解 gcc包含的c c 编译器 gcc cc c g gcc和cc
JDK8 网络Net包研究（一）

网络基础 1 国际标准化组织的OSI 开放式系统互联模型七层模型 2 TCP IP协议组四层模型 3 TCP IP协议组一组包括TCP协议和IP协议 UDP协议 ICMP协议和其他一些协议的协议组网络层 IP协议 gt 网络互连协
sqlserver存储过程基本语法

转载自 sqlserver存储过程的基本语法 1 定义变量简单赋值 declare a int set a 5 print a 使用select语句赋值 declare user1 nvarchar 50 select user1 张三
ElasticSearch——全文检索

ElasticSearch 全文检索来源尚硅谷谷粒商城高级篇一简介官网 https www elastic co cn what is elasticsearch 全文搜索属于最常见的需求开源的 Elasticsearch 是
TypeScript学习（一）：快速入门

文章目录一 TypeScript 简介 1 TypeScript 是什么 2 TypeScript 与 JavaScript 的区别 3 JavaScript 的缺点 4 为什么使用 TypeScript 二 TypeScript 开发环
软件设计命名规范

1 命名约定 Pascal和Camel命名约定编程的命名方式主要有Pascal和Camel两种 Pascal 每个单词的首字母大写例如ProductType Camel 首个单词的首字母小写其余单词的首字母大写例如productTy
IDA使用之旅（一）用IDA查看最简单的sys文件

转载请标明是引用于 http blog csdn net chenyujing1234 欢迎大家拍砖本系列内容是我根据知其所以然论坛博主录制的学习视频做的笔记使用的IDA软件版本 IDA pro 5 5 参考下载地址 http w
使用Maven插件整合protocol buffer

本来自己在网上找如何使protocol buffer在IDE 我用的是IDEA 上使用的结果搜索出来的都不尽人意因为都太粗略了没有重点的去阐述所以最后还是决定自己搜索相关的Maven插件再慢慢地摸索费了我好多的时间啊本人小白
gojs 流程图框架-节点装饰器模板(二)

上一章我们了解了如何使用 gojs 完成基本的节点和连接线的绘制 gojs 中还可以对节点或边进行自由拖动编辑等功能本章将基于上一章编写的流程图代码为这些节点设置装饰器模板完成后的效果图建议下载源码对照本文进行学习源码地址 g
【11月比赛合集】13场可报名的创新应用、数据分析和程序设计大奖赛，任君挑选！

CompHub 实时聚合多平台的数据类 Kaggle 天池和OJ类 Leetcode 牛客比赛本账号同时会推送最新的比赛消息欢迎关注更多比赛信息见 CompHub主页或点击文末阅读原文以下信息仅供参考以比赛官网为准目录
性能优化：虚拟列表，如何渲染10万条数据的dom，页面同时不卡顿

最近做的一个需求当列表大概有2万条数据又不让做成分页如果页面直接渲染2万条数据在一些低配电脑上可能会照成页面卡死基于这个需求我们来手写一个虚拟列表思路列表中固定只显示少量的数据比如60条在列表滚动的时候不断的去插入删除d
GMP初探

G Goroutine 协程用户级的轻量级线程 M 对内核线程的封装 P 为G和M的调度对象主要用途是用来执行goroutine 维护了一个goroutine队列即runqueue 由来单进程时代这个时代不需要调度器早起的操作系
PMS-adb install安装应用流程（Android L）

第一次画流程图画的不好通过adb install安装应用时对framework来说会首先调用Pm java的runInstall 方法 private int runInstall int installFlags 0 int userI
mesa调试技巧

技术关键字 mesa log系统环境变量目录前言一 gdb或vscode的断点调试二 mesa log 系统的使用总结前言软件调试技术是要求软件开发人员必备的一项技能不同的问题具有不同的调试手段和方法本文从mesa库的实
xcode报错：Cycle inside *******

xcode报错 Cycle inside building could produce unreliable results This usually can be resolved by moving the target s Heade
基于pytorch实现的Auto-encoder模型

最近因为在自己论文当中可能要用到Auto encoder 这个东西学了点皮毛之后想着先按照别人的解释实现一下然后在MNIST数据集上跑了下测试看看效果话不多说直接贴代码 Author Media 2020 10 23 import t

基于pytorch实现的Auto-encoder模型

基于pytorch实现的Auto-encoder模型 的相关文章

随机推荐

热门标签

基于pytorch实现的Auto-encoder模型的相关文章