从任意多元函数中有效采样

2024-04-20

我想从 Python 中的任意函数中采样。

In 快速任意分布随机抽样 https://stackoverflow.com/questions/21100716/fast-arbitrary-distribution-random-sampling据说可以使用逆变换采样以不同概率选择列表元素的 Pythonic 方法 https://stackoverflow.com/questions/4113307/pythonic-way-to-select-list-elements-with-different-probability有人提到应该使用逆累积分布函数。据我了解，这些方法仅适用于单变量情况。我的函数是多变量的，而且太复杂，因此中的任何建议https://stackoverflow.com/a/48676209/4533188 https://stackoverflow.com/a/48676209/4533188会适用。

原理：我的函数是基于Rosenbrock的香蕉函数，我们可以用它的值得到函数的值

import scipy.optimize
scipy.optimize.rosen([1.1,1.2])

(here [1.1,1.2]是来自 scipy 的输入向量，请参阅https://docs.scipy.org/doc/scipy-0.15.1/reference/ generated/scipy.optimize.rosen.html https://docs.scipy.org/doc/scipy-0.15.1/reference/generated/scipy.optimize.rosen.html.

这就是我的想法：我在感兴趣的区域上绘制了一个网格，并计算每个点的函数值。然后，我按值对结果数据框进行排序并进行累积和。这样我们就得到了具有不同大小的“槽”——具有大函数值的点比具有小函数值的点具有更大的槽。现在我们生成随机值并查看随机值落入哪个槽。数据框的行是我们的最终样本。

这是代码：

import scipy.optimize
from itertools import product
from dfply import *

nb_of_samples = 50
nb_of_grid_points = 30

rosen_data = pd.DataFrame(array([item for item in product(*[linspace(fm[0], fm[1], nb_of_grid_points) for fm in zip([-2,-2], [2,2])])]), columns=['x','y'])
rosen_data['z'] = [np.exp(-scipy.optimize.rosen(row)**2/500) for index, row in rosen_data.iterrows()]
rosen_data = rosen_data >> \
    arrange(X.z) >> \
    mutate(z_upperbound=cumsum(X.z)) >> \
    mutate(z_upperbound=X.z_upperbound/np.max(X.z_upperbound))
value = np.random.sample(1)[0]

def get_rosen_sample(value):
    return (rosen_data >> mask(X.z_upperbound >= value) >> select(X.x, X.y)).iloc[0,]

values = pd.DataFrame([get_rosen_sample(s) for s in np.random.sample(nb_of_samples)])

这很有效，但我认为效率不是很高。对于我的问题，什么是更有效的解决方案？

我读到马尔可夫链蒙特卡罗可能会有所帮助，但现在我对如何在 Python 中做到这一点感到困惑。

我遇到了类似的情况，因此，我实现了 Metropolis-Hastings 的基本版本（这是一种 MCMC 方法）来从二元分布中进行采样。下面是一个例子。

比如说，我们想从以下密度中采样：

def density1(z):
    z = np.reshape(z, [z.shape[0], 2])
    z1, z2 = z[:, 0], z[:, 1]
    norm = np.sqrt(z1 ** 2 + z2 ** 2)
    exp1 = np.exp(-0.5 * ((z1 - 2) / 0.8) ** 2)
    exp2 = np.exp(-0.5 * ((z1 + 2) / 0.8) ** 2)
    u = 0.5 * ((norm - 4) / 0.4) ** 2 - np.log(exp1 + exp2)
    return np.exp(-u)

看起来像这样

以下函数以多元正态作为提案实现 MH

def metropolis_hastings(target_density, size=500000):
    burnin_size = 10000
    size += burnin_size
    x0 = np.array([[0, 0]])
    xt = x0
    samples = []
    for i in range(size):
        xt_candidate = np.array([np.random.multivariate_normal(xt[0], np.eye(2))])
        accept_prob = (target_density(xt_candidate))/(target_density(xt))
        if np.random.uniform(0, 1) < accept_prob:
            xt = xt_candidate
        samples.append(xt)
    samples = np.array(samples[burnin_size:])
    samples = np.reshape(samples, [samples.shape[0], 2])
    return samples

运行 MH 并绘制样本

samples = metropolis_hastings(density1)
plt.hexbin(samples[:,0], samples[:,1], cmap='rainbow')
plt.gca().set_aspect('equal', adjustable='box')
plt.xlim([-3, 3])
plt.ylim([-3, 3])
plt.show()

查看这个仓库 https://github.com/abdulfatir/sampling-methods-numpy/我的详细信息。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从任意多元函数中有效采样的相关文章

from __future__ importabsolute_import 实际上做了什么？

I have answered https stackoverflow com a 22679558 2588818一个关于Python中绝对导入的问题我认为我通过阅读理解了这个问题Python 2 5 变更日志 https docs p
Python：我可以修改元组吗？

我有一个 2 D 元组实际上我以为它是一个列表但错误说它是一个元组但无论如何该元组的形式为浮点数 val prod id 现在我有一个字典其中包含 key gt prod id 和 value prod name 现在我想将
将 python scikit learn 模型导出到 pmml

我想将 python scikit learn 模型导出到 PMML 中什么 python 包最适合我读到Augustus https github com opendatagroup augustus 但我找不到任何使用 scikit
在 Windows 上使用 Python 打开设备句柄

我正在尝试使用 Giveio sys 驱动程序该驱动程序需要先打开一个文件然后才能访问受保护的内存我正在查看 WinAVR AVRdude 中的 C 示例它使用以下语法 define DRIVERNAME giveio HANDL
不要在异常堆栈中显示 Python raise-line

当我在 Python 库中引发自己的异常时异常堆栈将引发行本身显示为堆栈的最后一项这显然不是一个错误在概念上是正确的但是当您在外部使用代码例如作为模块时它会将重点放在对调试无用的东西上有没有办法避免这种情况并强制 Pytho
如何在 for 循环中跳过一些迭代

在 python 中我通常简单地循环遍历范围 for i in range 100 do something 但现在我想跳过循环中的几个步骤更具体地说我想要类似的东西continue 10 这样它就会跳过整个循环并将计数器增加 10
使用 Python 连接从 FTP 检索文件

我构建了这个简单的工具来暴力破解并连接到 ftp 服务器 import socket import ftplib from ftplib import FTP port 21 ip 192 168 1 108 file1 passwords
在 python 中返回 self [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个代表对象的类我有很多方法可以修改这个对象状态没有明显的返回或显然没有任何返回在 C 中我会将所有这些方法声明为void
AWS Lambda - 在区域之间自动复制 EC2 快照？

我想创建一个 Lambda 函数 python 它将自动将已创建的快照复制到另一个区域我已联系 AWS Support 他们只向我发送了用于 RDS 数据库的 GitHub 脚本没有 EC2 快照复制脚本任何帮助都会很棒谢谢是的
使用自定义元素类在 Python 中解析 xml

我想使用 Python 的 xml etree ElementTree 模块解析 xml 文档但是我希望生成的树对象中的所有元素都具有我定义的一些类方法这建议创建我自己的 Python 元素类的子类但我无法告诉解析器在解析时使用我自
为什么我在 Python 中收到“连接被拒绝”错误？（插座）

我是套接字新手请原谅我完全缺乏理解我有一个服务器脚本 server py usr bin python import socket import the socket module s socket socket Create a so
在 AWS Elastic Beanstalk 中部署 Flask 应用程序

当我部署 Flask 应用程序时它显示成功但是当我检索日志时我看到错误找不到 Flask 我的需求文件中有烧瓶任何帮助 Sat Jan 11 06 51 50 503908 2020 error pid 3393 remote 1
如何将当前日期分配给 odoo v8 中的日期字段？

我想将当前日期分配给以下代码中的日期字段 start date calendar obj create cr uid name rec res act ion user id rec res asgnd to id start date l
在用户提交的正则表达式中查找捕获组

我有一个 python 应用程序需要处理用户提交的正则表达式出于性能考虑我想禁止捕获组和反向引用我的想法是使用另一个正则表达式来验证用户提交的正则表达式不包含任何命名或未命名的组捕获如下所示 def validate user r
有没有更快的方法将数字转换为名称？

以下代码定义了映射到数字的名称序列它的设计目的是获取一个号码并检索一个特定的名称该类通过确保名称存在于其缓存中来进行操作然后通过索引到其缓存中来返回名称问题在这如何在不存储缓存的情况下根据数字计算出名称该名称可以被认为是一个以
为什么删除 DataFrame 的列或部分会增加内存使用量，以及如何确保对未使用的 DataFrame 切片进行垃圾回收

处理大型 DataFrame 时您需要小心内存使用情况例如您可能想要分块下载大数据处理这些块然后从内存中删除所有不必要的部分我找不到任何有关处理垃圾收集的最佳程序的资源pandas 但我尝试了以下方法并得到了令人惊讶的结果 im
numpy.polyfit 没有关键字“cov”

我试图使用 polyfit 来找到一组数据的最佳拟合直线但我还需要知道参数的不确定性所以我也想要协方差矩阵在线文档建议我写 polyfit x y 2 cov True 但这给出了错误类型错误 polyfit 得到了意外的关键字参数
python字符串包含双引号字符

我的输入字符串由字符组成包括双引号和单引号和 B SS JU PQ AD DDSFD ABD E J 但是当我从文本文件打开上述输入并打印它时第三行中的双引号被打印为 xe2 x80 x9d 我的目标是进行简单的字符计数 B 2
如何在Python中检查元组是否包含元素？

我试图找到可用的方法但找不到没有contains 我应该使用index 我只想知道该项目是否存在不需要它的索引 You use in if element in thetuple whatever you want to do
在大型文本文件中查找重复记录

我在一台 Linux 机器 Redhat 上并且有一个 11GB 的文本文件文本文件中的每一行包含单个记录的数据并且该行的前 n 个字符包含该记录的唯一标识符该文件包含略多于 2700 万条记录我需要验证文件中不存在具有相同唯一标

随机推荐

在 Elastic beanstalk 上配置 apache

我正在 elastic beanstalk 上使用 django 进行开发我想对 apache 配置进行两处更改 1 将 www domain com 重定向到 domain com 2 重定向http domain com http d
捕获/监听函数的执行

我想添加到模块记录器中的所有功能我想记录函数的开始时间和结束时间这样我就可以获得每个函数同步函数的执行时间但我不知道如何让它发挥作用我不想以某种动态方式重写函数我想在将来调试它们所以需要保留原始代码我需要找到某种方
同时运行多个 Python 脚本，然后依次运行

我可以像这样从 bash 脚本同时运行多个 Python 脚本 bin bash python pr1 py python pr2 py python aop py python loader py 但是如果我希望一批同时触发并在运行后
如何调试 GIMP 插件？输出在哪里？

我正在用 Python 为 Windows 上的 GIMP 制作一个插件这一页 http gimpbook com scripting notes html建议从 shell 运行它或查看 xsession errors 都不起作用我可
Jenkinsfile：在 Docker 容器中运行 sh 步骤时权限被拒绝

我在运行简单的程序时遇到问题Jenkinsfile e g pipeline agent label ssh slave stages stage Shell Test steps sh echo Hello World master 上的
如何在Python中写入整数，特别是字节数（文件写入）

假设我必须在文件中存储一些整数如 1024 或 512 或 10240 或 900000 但条件是我只能消耗 4 个字节不少于或最大值但是在使用 write 方法编写 python 文件时它存储为 1024 或 512 或 1024
由于 URI 无效而导致安装失败？仅在调试模式下安装？

安卓安装失败的可能原因有哪些无效的 URI this 指的是什么 URI 在什么情况下它是无效的它在调试模式下工作正常但我无法在调试模式之外安装它 Thanks 此错误可能指向许多不同的问题并且有许多不同的修复方法总结一下我收集到
将具有相同 ID 的多行（具有一些非字符串值）合并到 pandas 中的一个分隔行中

我有一个这样的数据集 ID Name 1 a 1 b 1 2 1 3 2 er 2 get 2 better 3 123 3 cold 3 warm 3 sweet 3 heat 我想将这些数据分组在一起以便使用分隔符将具有相同 id 的
将 URI 映射到 LINQ-to-SQL 中的字符串字段

我正在尝试使用 LINQ 将 URI 作为字符串存储在数据库中 Column Name Url DbType nvarchar 255 public Uri Url get return new Uri url set url value
如何从图片中获取经纬度信息

如何从设备或SD卡中的图片存储中获取经纬度信息我找到了这个问题的非常简单的解决方案所以我将其发布在这里以帮助像我一样有问题的朋友从图片中获取地理位置 Bundle bundle getIntent getExtras if null b
异常处理在 ASP.NET 中运行的应用程序块异常处理程序无法调用 Response.End()

使用 NET 3 5 ASP NET Enterprise Library 4 1 异常处理和日志记录块我编写了一个自定义异常处理程序来显示标准错误页面如下所示 ConfigurationElementType typeof Custo
根据最近的关键条件连接 Spark DataFrame

在 PySpark 中执行模糊连接的高效方法是什么我正在寻找社区对在最近的关键条件下加入大型 Spark DataFrame 的可扩展方法的看法请允许我通过一个有代表性的例子来说明这个问题假设我们有以下 Spark DataFrame
Capybara::ElementNotFound 的所有规格仅在 Travis 上

我正在使用 selenium capybara 和 rspec 进行测试我注意到所有测试都在本地通过但在 travis 上所有测试都失败并在每个规范上出现此错误 Capybara ElementNotFound 我不确定这里出了什么
Nhibernate - 使用没有关系的连接表进行查询

我想知道是否有人尝试在 NHibernate 中这样做我有下表简化版本城市城市 varchar2 PK 省份 varchar2 PK 城市 TL 城市 varchar2 PK 省份 varchar2 PK 郎字符 2 PK 地点
显式禁用 REST 服务的缓存

我要申请Cache Control must revalidate no cache no store来自后端 REST 服务的所有响应我对此有两个问题这样做常见吗出于某种原因我的印象是没有必要但我还没有任何消息来源支持这一说法
如何使用 PyArg_ParseTupleAndKeywords 来解析具有可选参数和关键字的元组？

我到处都找过但找不到例子PyArg ParseTupleAndKeywords 与元组一起使用包含可选参数 and关键词我发现的最接近的是这个问题 https stackoverflow com questions 10625865
SQL Server 中使用另一个表的内容进行字符串替换（例如 update table1 set value = Replace(table1.value, table2.val1, table2.val2)）

我有一个包含邮政地址的 SQL Server 表在准备邮寄时我需要进行多次字符串替换以符合 USPS 偏好例如 Avenue 变为 Ave 为了省去枚举所有替换的麻烦我将标签缩写对保存在两列表中是否有一种优雅的方法可以将每个参数
类的operator()或将函数绑定为函子？

有两种方法可以创建函子保存状态的函数绑定一个函数并定义一个状态 bind f 1 state 双g 双x 双状态返回x 状态函数 f 绑定 g 1 状态 use 运算符和类 struct f double state f doubl
在node.js中使用mssql关闭MSSQL连接

我正在尝试在 node js 中编写一个脚本来查询 MSSQL 数据库我是 javascript 新手 node js 新手 VSCode 新手但我了解一些有关 SQL 的知识我有工作代码但连接似乎永远不会关闭并且我无法获取函数的
从任意多元函数中有效采样

我想从 Python 中的任意函数中采样 In 快速任意分布随机抽样 https stackoverflow com questions 21100716 fast arbitrary distribution random samplin

从任意多元函数中有效采样

从任意多元函数中有效采样 的相关文章

随机推荐

热门标签

从任意多元函数中有效采样的相关文章