在 PyTorch 中使用 module.to() 移动成员张量

2024-01-03

我正在 PyTorch 中构建变分自动编码器 (VAE)，但在编写与设备无关的代码时遇到问题。自动编码器是nn.Module具有编码器和解码器网络，它们也是。网络的所有权重都可以通过调用从一台设备移动到另一台设备net.to(device).

我遇到的问题是重新参数化技巧：

encoding = mu + noise * sigma

噪声是一个与以下大小相同的张量mu and sigma并保存为自动编码器模块的成员变量。它在构造函数中初始化，并在每个训练步骤中就地重新采样。我这样做是为了避免每一步构建一个新的噪声张量并将其推送到所需的设备。此外，我想修复评估中的噪音。这是代码：

class VariationalGenerator(nn.Module):
    def __init__(self, input_nc, output_nc):
        super(VariationalGenerator, self).__init__()

        self.input_nc = input_nc
        self.output_nc = output_nc
        embedding_size = 128

        self._train_noise = torch.randn(batch_size, embedding_size)
        self._eval_noise = torch.randn(1, embedding_size)
        self.noise = self._train_noise

        # Create encoder
        self.encoder = Encoder(input_nc, embedding_size)
        # Create decoder
        self.decoder = Decoder(output_nc, embedding_size)

    def train(self, mode=True):
        super(VariationalGenerator, self).train(mode)
        self.noise = self._train_noise

    def eval(self):
        super(VariationalGenerator, self).eval()
        self.noise = self._eval_noise

    def forward(self, inputs):
        # Calculate parameters of embedding space
        mu, log_sigma = self.encoder.forward(inputs)
        # Resample noise if training
        if self.training:
            self.noise.normal_()
        # Reparametrize noise to embedding space
        inputs = mu + self.noise * torch.exp(0.5 * log_sigma)
        # Decode to image
        inputs = self.decoder(inputs)

        return inputs, mu, log_sigma

当我现在将自动编码器移动到 GPU 时net.to('cuda:0')我在转发时遇到错误，因为噪声张量没有移动。

我不想向构造函数添加设备参数，因为这样以后仍然无法将其移动到另一个设备。我也尝试将噪音包裹起来nn.Parameter从而使其受到影响net.to()，但这会给优化器带来错误，因为噪声被标记为requires_grad=False.

任何人都有一个解决方案来移动所有模块net.to()?

更好的版本tilman151的第二种方法 https://stackoverflow.com/a/54768936/344821可能是覆盖_apply，而不是to。那样net.cuda(), net.float()等都可以工作，因为它们都调用_apply而不是to（可以看出来源 https://github.com/pytorch/pytorch/blob/master/torch/nn/modules/module.py，这比你想象的要简单）：

def _apply(self, fn):
    super(VariationalGenerator, self)._apply(fn)
    self._train_noise = fn(self._train_noise)
    self._eval_noise = fn(self._eval_noise)
    return self

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 PyTorch 中使用 module.to() 移动成员张量的相关文章

从数据框中按索引删除行

我有一个数组wrong indexes train其中包含我想从数据框中删除的索引列表 0 63 151 469 1008 要删除这些索引我正在尝试这样做 df train drop wrong indexes train 但是代码失败
我怎样才能更多地了解Python的内部原理？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我使用Python编程已经有半年多了我对Python内部更感兴趣而不是使用Python开发应用程序
如何在序列化器创建方法中获取 URL Id？

我有以下网址 url r member P
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
如何使用 imaplib 获取“消息 ID”

我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好所以我认为 Message ID 是正确的但我不知道如何获取它我只知道 imap fetch uid XXXX 有人有解决方案吗来自 IMAP 文档本身 IMAP4消息号
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
如何通过在 Python 3.x 上按键来启动和中断循环

我有这段代码当按下 P 键时会中断循环但除非我按下非 P 键否则循环不会工作 def main openGame while True purchase imageGrab if a sum gt 1200 fleaButton ti
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
如何从Python中的字符串中提取变量名称和值

我有一根绳子 data var1 id 12345 name John White python中有没有办法将var1提取为python变量更具体地说我对字典变量感兴趣这样我就可以获得变量的值 id和name python 这是由提供
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
奇怪的 MySQL Python mod_wsgi 无法连接到 'localhost' (49) 上的 MySQL 服务器问题

StackOverflow上也有类似的问题但我还没有发现完全相同的情况这是在使用 MySQL 的 OS X Leopard 机器上一些起始信息 MySQL Server version 5 1 30 Apache 2 2 13 Uni
将 JSON 对象传递给带有请求的 url

所以我想利用 Kenneth 的优秀请求模块 https github com kennethreitz requests 在尝试使用时偶然发现了这个问题自由库API http wiki freebase com wiki API 基本上
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
检查字典键是否有空值

我有以下字典 dict1 city name yass region zipcode phone address tehsil planet mars 我正在尝试创建一个基于 dict1 的新字典但是它不会包含带有空字符串的键它不会包
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在

随机推荐

ILASM 未设置文件版本

我有一个 il 文件可以毫无问题地编译它我可以很清楚地命名它所以没有任何问题但我无法按照我的预期通过属性设置文件版本使用 ilasm 时如何设置程序集的文件版本如果我进行往返我总是会得到一个 res 文件该文件仅包含不可读的
在 Celery 链中使用分组结果

我陷入了相对复杂的芹菜链配置试图实现以下目标假设有如下一系列任务 chain1 chain DownloadFile s http someserver file gz downloads file returns temp file
Angular 4 - 如何显示继承类组件的模板

我正在尝试根据项目组件的类型显示项目列表我有一系列组件全部继承自基类数组类型被定义为基类的类型我想显示数组比如说作为项目列表每个数组都有自己的模板而不是基本模板我已经尝试过在app component html中
调用 `this.setState()` 会中断对 componentWillReceiveProps 中 prop 的流类型检查

当我调用时我在知道是字符串的 prop 上遇到流错误this setState 就在它之前如果我移动setState 在使用 prop 的行之后调用错误就会消失我收到的错误是 null 此类型与预期的字符串参数类型不兼容不明确的
在 contenteditable 元素中，在 HTML 标签之间移动光标

http jsfiddle net Y7tgx 2 http jsfiddle net Y7tgx 2 Firefox 比 Chrome 处理得更好但都不完全是我想要的方式它们都将所有相邻的 HTML 标签集中在一起并将它们视为一个我
在 C++11 中禁用复制类的最简洁方法

当存在用户定义的析构函数时我在处理自 C 11 默认生成的复制构造函数和复制赋值运算符以来已弃用的问题对于大多数足够简单的类默认生成的构造函数运算符和析构函数都可以考虑以下声明析构函数的原因在基类中将普通析构函数设为虚拟 hea
Ember 的 registerBoundHelper 和车把块

所以我已经从here https github com danharper Handlebars Helpers并修改它以便它使用 registerBoundHelper 通过 Ember 注册它的助手我这样做的原因是因为我基本上需要一
*** _pickle.UnpicklingError：pickle 数据被截断

我有一个包含一千个 pickle 文件的目录我将它们一一加载如下所示我正在使用 python3 import pickle for data in directory with open data rb as handle pickl
过度使用泛型[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 当没有明显的实际好处时人们对泛型的
从 CSV 中删除行

我有一个包含多个标题的 csv 文档例如 Date RQ PM SME Activity Status code 2 2 12 6886 D WV John Smith Recent 2004 以及一个文本文档它只是状态代码的列表每行
将对象传递给网络工作者

我正在尝试通过 postMessage 函数将对象传递给网络工作者这个对象是一个正方形有几个功能可以在画布上和其他东西上绘制自己 Web Worker 必须返回此对象的数组问题是当我使用该对象调用 postMessage 函数时出
将 SendGrid 与 appharbor 一起使用时出现问题

我正在使用 appharbor 添加 SendGrid 作为插件他们为我提供了 smtp 主机 smtp sendgrid com 端口 587 用户 32adf793 2cbf 492c 9bb9 apphb com 当我使用这些详细信
Collectors#toList 的运行时复杂性

在Java库源代码中 Collectors toList方法定义如下 public static
Mailchimp 注册表单与 angular2 [重复]

这个问题在这里已经有答案了我正在尝试将 mailchimp 注册表单嵌入到我的 angular2 应用程序中 http kb mailchimp com lists signup forms add a signup form to yo
取消部署出现错误：应用程序未注册（Glassfish）

我使用 Glassfish 的 Web GUI 取消部署了我的应用程序但是如果我按取消部署我的实际应用程序则什么也不会发生在我的日志文件中出现新错误应用程序未注册严重我现在如何正确取消部署我的APP 我找到了一个简单的答案从
SWT：单显示器与多显示器

SWT 旨在支持多种Display实例每个实例都有自己的事件循环这对于什么目的是有用的或需要的不是一个Display实例例如Display getDefault 充足的 Display 类的文档说使用 SWT 构建的应用程序几乎总
无法在 Safari 或 UIWebView 中通过 HTTPS 查看 Quicktime 影片

我试图让我的 iPhone 应用程序除了 HTTP 之外还可以使用 HTTPS 但使用 UIWebView 或 MPMoviePlayerController 查看 Quicktime MOV 文件似乎无法通过 HTTPS 工作我得到这
Android 中 OOM（内存不足异常）是如何发生的？

我正在尝试显示来自画廊的图像或从相机捕获的图像ImageView 我开始得到OOM正在处理中所以我决定找出它是如何工作的所以我尝试使用不同尺寸的图像这是观察结果我尝试将 19KB 的图像加载到ImageView并收到以下错误消息无
Flutter：在“bottomNavigationBar”上显示“showBottomSheet”

我如何在 bottomNavigationBar 顶部显示 showBottomSheet 说明性示例当用户单击图钉屏幕1 时结果是屏幕2 但我想得到屏幕3 return Scaffold appBar AppBar title
在 PyTorch 中使用 module.to() 移动成员张量

我正在 PyTorch 中构建变分自动编码器 VAE 但在编写与设备无关的代码时遇到问题自动编码器是nn Module具有编码器和解码器网络它们也是网络的所有权重都可以通过调用从一台设备移动到另一台设备net to device 我遇

在 PyTorch 中使用 module.to() 移动成员张量

在 PyTorch 中使用 module.to() 移动成员张量 的相关文章

随机推荐

热门标签

在 PyTorch 中使用 module.to() 移动成员张量的相关文章