样本（）和r样本（）有什么区别？

2024-05-14

当我从 PyTorch 中的发行版中采样时，两者sample and rsample似乎给出了类似的结果：

import torch, seaborn as sns

x = torch.distributions.Normal(torch.tensor([0.0]), torch.tensor([1.0]))


`sns.distplot(x.sample((100000,)))`	`sns.distplot(x.rsample((100000,)))`

我应该什么时候使用sample()，我应该什么时候使用rsample()?

sample()：从概率分布中随机抽样。所以，我们cannot反向传播，因为它是随机的！（计算图为cut off).

查看源代码sample in torch.distributions.normal.Normal:

def sample(self, sample_shape=torch.Size()):
    shape = self._extended_shape(sample_shape)
    with torch.no_grad():
        return torch.normal(self.loc.expand(shape), self.scale.expand(shape))

torch.normal返回一个张量random数字。还，torch.no_grad()上下文阻止计算图进一步增长。

你看，我们不能反向传播。返回的张量为sample()仅包含一些数字，而不是整个计算图。

那么，什么是`rsample()`?

通过使用rsample, we can反向传播，因为它保留计算图 alive.

如何？通过将随机性放在单独的参数中。这称为“重新参数化技巧”。

r样本：使用抽样r重新参数化技巧。

有eps在源代码中：

def rsample(self, sample_shape=torch.Size()):
    shape = self._extended_shape(sample_shape)
    eps = _standard_normal(shape, dtype=self.loc.dtype, device=self.loc.device)
    return self.loc + eps * self.scale

    # `self.loc` is the mean and `self.scale` is the standard deviation.

eps是负责采样随机性的单独参数。

看返回值：平均值+eps* 标准差

eps does not取决于您想要区分的参数。

所以，现在你可以自由地反向传播（=微分），因为eps当参数改变时不改变。

（如果我们改变参数，重新参数化样本的分布does改变因为self.loc and self.scale变化，但分布eps does not改变。）

请注意，抽样的随机性来自于随机抽样eps。有no计算图本身的随机性。一次eps被选择了，就被固定了。（元素的分布eps在采样后是固定的。）

例如，在强化学习中SAC（Soft Actor-Critic）算法的实现中，eps可能由对应于单个小批量操作的元素组成（并且一个操作可能由许多元素组成）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Random

Pytorch

样本（）和r样本（）有什么区别？的相关文章

漂亮的地图打印机会抛出类型错误

我已经使用配置了漂亮的打印机http wiki eclipse org CDT User FAQ How can I inspect the contents of STL containers 3F http wiki eclipse o
在Python中不断寻找用户输入

我将如何编写一个始终寻找用户输入的 Python 程序我想我希望有一个等于输入的变量然后根据该变量的等于值会发生不同的情况因此如果变量是 w 那么它将执行某个命令并继续执行直到收到另一个输入例如 d 然后会发生不同的情况但直到
Seaborn regplot 中点和线的不同颜色

中列出的所有示例西伯恩的regplot文档 https seaborn pydata org generated seaborn regplot html点和回归线显示相同的颜色改变color争论改变了两者如何为点设置与线不同的颜色你
从 Django 基于类的视图的 form_valid 方法调用特殊（非 HTTP）URL

如果你这样做的话有一个 HTML 技巧 a href New SMS Message a 点击新短信打开手机的本机短信应用程序并预先填写To包含所提供号码的字段在本例中为 1 408 555 1212 以及body与提供的消息 Hel
从 Python 将分层 JSON 数据写入 Excel xls？

我想将一些数据从 python 写入 xlsx 我目前将其存储为 JSON 但它从 Python 中输出什么并不重要单个文章的 JSON 如下所示 Word Count 50 Key Words Blah blah blah Foo Fr
如何计算查询集中每个项目的两个字段的总和

假设我有以下模型结构 class SomeModel Model base price DecimalField commision DecimalField 我不想存储total price在我的数据库中为了数据一致性并希望将其计算为ba
Django 说“id 可能不为 NULL”，但为什么会这样呢？

我今天要疯了我只是尝试插入一条新记录但它返回了 post blogpost id 可能不为 NULL 错误这是我的模型 class BlogPost models Model title models CharField max le
如何使用 ipywidgets 创建动态依赖下拉菜单？

我创建了一个带有两个下拉菜单的表单我的目标是使一个下拉列表依赖于另一个下拉列表这张图说明了我的目标和目前的情况 https i stack imgur com o9k5G png 下面的示例代码可以在 Google Colab 或 Ju
多个列表和大小的所有可能排列

在 python 中使用以下命令很容易计算简单的排列itertools permutations https docs python org 3 library itertools html itertools permutations 你
python lxml 使用iterparse编辑并输出xml

我已经在 lxml 库上摆弄了一段时间了也许我没有正确理解它或者我错过了一些东西但我似乎无法弄清楚在捕获某个 xpath 后如何编辑文件并且然后能够在逐个元素解析时将其写回到 xml 中假设我们有这个 xml 作为示例
使用 os.forkpty() 创建一个伪终端以 ssh 到远程服务器并与其通信

我正在尝试编写一个 python 脚本它可以 ssh 到远程服务器并可以从 python 客户端执行 ls cd 等简单命令但是在成功 ssh 到服务器后我无法读取伪终端的输出任何人都可以在这里帮助我以便我可以在服务器上执行一
使用 Python 导入包含文本和数字数据的文件

I have a txt file which has text data and numerical data The first two rows of the file have essential information in te
如何在python中访问矩阵每个元素的相邻单元格？

这里如果两个单元共享边界则它们被认为是相邻的例如 A 5 6 4 2 1 3 7 9 8 这里索引 0 0 的相邻元素位于索引 0 1 和 1 0 处索引 1 1 的相邻元素位于索引 0 1 1 0 2 1 处和 1 2 假设你
安塞布尔 + 10.11.6

我在非常干净地安装 10 11 6 时遇到了 Ansible 的奇怪问题我已经安装了brew zsh oh my zsh Lil snitch 和1password 实际上没有安装其他任何东西我安装了ansible brew ins
在 Python 中将嵌套字典位置作为参数传递

如果我有一个嵌套字典我可以通过索引来获取键如下所示 gt gt gt d a b c gt gt gt d a b c 我可以将该索引作为函数参数传递吗 def get nested value d path a b return d
获取 python 模块的 2 个独立实例

我正在与以非 OO 方式编写的 python 2 x API 进行交互它使用模块全局范围来处理一些内部状态驱动的东西在它不再是单例的情况下需要它并且修改原始代码不是我们的不是一个选择如果不使用单独解释器的子进程运行有什么方法可
Matplotlib：检查空图

我有一个循环加载并绘制一些数据如下所示 import os import numpy as np import matplotlib pyplot as plt for filename in filenames plt figure i
scikit-learn kmeans 聚类的初始质心

如果我已经有一个可以作为初始质心的 numpy 数组我该如何正确初始化 kmeans 算法我正在使用 scikit learn Kmeans 类这个帖子具有选定初始中心的 k 均值 https stackoverflow com q
具有重复值的 Sqlite 列

就说专栏吧aSQLite 数据库的非常重复始终有相同的 4 个值其他值可能稍后出现但不同值的数量将少于 1000 个 VALUES hello world it s a shame to store this str many tim
使用 python/scipy 进行 voronoi 和 lloyd 松弛

如何使用 Qhull 确定哪些 voronoi 单元按索引是正确的由现有顶点组成我正在尝试使用 LLoyds 算法和 scipy spatial Voronoi 它是 Qhull 的包装器生成的输入来执行约束松弛就代码而言

随机推荐

C# 如何单击 IList 中的 IWebelement？

所以我尝试单击 YouTube 上的按钮但我无法通过 Xpath 找到该按钮因为按钮太多所以我尝试将它们保存在 IList 中现在我想单击列表中的特定按钮 ChromeDriver chrome new ChromeDriver L
从基础创建 Uri，不带尾部斜杠和相关部分

我的 Uri 构造函数有问题基本路径是否以斜杠结尾的结果会有所不同 var baseWithSlash new Uri c Temp var baseNoSlash new Uri c Temp var relative MyApp va
ExpandableLabel iOS 中的“少看”

我正在使用第三方库可扩展标签 https github com apploft ExpandableLabel实施一个see more特征我正在寻找仅快速的解决方案其中包含标签中的文本而不是按钮中的文本因此这可以完美地工作添加库并更
如何在 numpy 数组中查找并保存重复的行？

我有一个数组例如 Array 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 1 1 1 2 2 2 我想要输出以下内容的东西 Repeated 1 1 1 2 2 2 保留重复行的数量也可以例如 Repeated 1 1
如何清除Android剪贴板？

我发现的方法都不起作用这是我尝试过的 1 使用clearPrimaryClip 的方法ClipboardManager class ClipboardManager clipboard ClipboardManager getSystem
将错误保存到 MySQL 数据库

我有一个 php 查询来更新 MySQL 数据库请参见下文 sql update hr payroll set payroll number payroll number tax code tax bacs ref bacs ref pa
将多索引转换为行式多维 NumPy 数组。

假设我有一个类似于以下示例的 MultiIndex DataFrame多索引文档 http pandas pydata org pandas docs stable advanced html gt gt gt df 0 1 2 3 fir
无法识别的选择器调用静态 iOS 库中的类别方法

我正在使用一些第三方软件来帮助使用 Xcode 4 3 2 编写 iPad 应用程序该软件是开源的通常经过设置因此其代码将与开发人员为应用程序编写的任何代码一起编译因为我在很多地方使用该软件所以我决定将其构建为 iOS 模拟器的静
垂直对齐两个弹性项目[重复]

这个问题在这里已经有答案了我有一个弹性容器 container和两个弹性项目 item one and item two 我想将第一个项目垂直居中并将第二个项目粘在底部我不知道如何在这种情况下垂直对齐第一项 HTML div class
ListView 和快照 - 错误 - 错误状态：DocumentSnapshotPlatform 中不存在字段[重复]

这个问题在这里已经有答案了我对快照和 ListView 有一个小问题到目前为止它运行得很好但自从我更新了 flutter 和 Dart 后我收到了一个错误构建 StreamBuilder gt 时抛出以下 StateError
Drupal 视图 - 自定义/修改 SQL

我遇到了配置文件复选框模块的问题该模块存储以逗号分隔的自定义配置文件字段问题是我是否创建一个视图来按值过滤 SQL 结果最终是这样的 AND profile values profile interests value in Bus
对不存在的资源进行 GET 的 REST 标准

资源 user 12345 不存在假设消费者随机尝试不同的 id 没有授权任何用户都可以查看任何用户从更广泛的意义上来说我的问题是如果对不存在的资源执行 GET 操作您应该返回什么我应该为不存在的 id 返回空用户还是应该返
如何在 gridview 控件的项目模板内显示列表视图。

如何在 gridview 控件的项目模板内显示列表视图 gridview 将列出 table bill 中的所有 bill id 列表视图将绑定 table bill details 中具有特定 item bill id 的所有 item
如何在映射中将字符串转换为 Seq[String]

我有一个Map String String 以及需要的第三方功能Map String Seq String 有没有一种简单的方法来转换它以便我可以将地图传递给函数 original mapValues Seq 注意mapValues返回地
如何将事件对象传递给 JavaScript 中的函数？
将 SQL Server 日期时间转换为较短的日期格式

我有一个datetimeSQL Server 中的列为我提供了这样的数据10 27 2010 12 57 49 pm我想查询此列但只需让 SQL Server 返回年月日例如 2010 10 27或类似的东西我应该研究哪些功能我应该
烧瓶 - 404 未找到

我是烧瓶开发的新手这是我在烧瓶中的第一个程序但它向我显示了这个错误在服务器上找不到请求的 URL 如果您输入了网址请手动检查拼写并重试这是我的代码 from flask import Flask app Flask name ap
在 C++ 中通过引用传递 std 算法谓词

我正在尝试从 a 中删除元素std list并保留已删除元素的一些统计信息为此我使用列表中的remove if 函数并且我有一个谓词我想使用这个谓词来收集统计数据这是谓词的代码 class TestPredicate privat
使用 Jquery 附加链接

我正在尝试根据您所在的页面添加指向我的页面的链接我使用 Squarespace 来构建这个网站因此对我来说最简单的方法是使用 Javascript 或 Jquery 我认为我缺少的这个语法有问题我已经尝试用来打破引号但这不起作用
样本（）和r样本（）有什么区别？

当我从 PyTorch 中的发行版中采样时两者sample and rsample似乎给出了类似的结果 import torch seaborn as sns x torch distributions Normal torch tens

样本（）和r样本（）有什么区别？

那么，什么是rsample()?

样本（）和r样本（）有什么区别？ 的相关文章

随机推荐

热门标签

那么，什么是`rsample()`?

样本（）和r样本（）有什么区别？的相关文章