通过对 3D 数组进行采样和分桶来创建热图

2024-02-07

我有一些实验数据，如下所示：

x = array([1, 1.12, 1.109, 2.1, 3, 4.104, 3.1, ...])
y = array([-9, -0.1, -9.2, -8.7, -5, -4, -8.75, ...])
z = array([10, 4, 1, 4, 5, 0, 1, ...])

如果方便的话，我们可以假设数据以 3D 数组甚至 pandas 的形式存在DataFrame:

df = pd.DataFrame({'x': x, 'y': y, 'z': z})

解释是，对于每个位置x[i], y[i]，某个变量的值为z[i]。这些都是采样不均匀，因此会有一些部分被“密集采样”（例如，在 1 到 1.2 之间）x）和其他非常稀疏的（例如 2 到 3 之间）x）。因此，我不能只是将这些放入pcolormesh or contourf.

我想做的是重新采样x and y以某个固定间隔均匀分布，然后汇总z。为了我的需要，z可以求和或平均以获得有意义的值，所以这不是问题。我天真的尝试是这样的：

X = np.arange(min(x), max(x), 0.1)  
Y = np.arange(min(y), max(y), 0.1)
x_g, y_g = np.meshgrid(X, Y)
nx, ny = x_g.shape
z_g = np.full(x_g.shape, np.nan)

for ix in range(nx - 1):
    for jx in range(ny - 1):
        x_min = x_g[ix, jx]
        x_max = x_g[ix + 1, jx + 1]
        y_min = y_g[ix, jx]
        y_max = y_g[ix + 1, jx + 1]
        vals = df[(df.x >= x_min) & (df.x < x_max) & 
                  (df.y >= y_min) & (df.y < y_max)].z.values
        if vals.any():
            z_g[ix, jx] = sum(vals)

这有效，我得到了我想要的输出plt.contourf(x_g, y_g, z_g)但它很慢！我有大约 20k 样本，然后将其子采样为 x 中的大约 800 个样本和 y 中的大约 500 个样本，这意味着 for 循环有 400k 长。

有什么方法可以矢量化/优化这个吗？如果有一些函数已经可以做到这一点就更好了！

（还将其标记为 MATLAB，因为 numpy/MATLAB 之间的语法非常相似，而且我可以访问这两个软件。）

这是一个向量化的 Python 解决方案，使用NumPy broadcasting https://docs.scipy.org/doc/numpy/user/basics.broadcasting.html and matrix multiplication with np.dot https://docs.scipy.org/doc/numpy/reference/generated/numpy.dot.html对于求和部分 -

x_mask = ((x >= X[:-1,None]) & (x < X[1:,None]))
y_mask = ((y >= Y[:-1,None]) & (y < Y[1:,None]))

z_g_out = np.dot(y_mask*z[None].astype(np.float32), x_mask.T)

# If needed to fill invalid places with NaNs
z_g_out[y_mask.dot(x_mask.T.astype(np.float32))==0] = np.nan

请注意，我们避免使用meshgrid那里。因此，在使用创建的网格体时可以节省内存meshgrid将是巨大的，并希望在此过程中获得性能改进。

标杆管理

# Original app
def org_app(x,y,z):    
    X = np.arange(min(x), max(x), 0.1)  
    Y = np.arange(min(y), max(y), 0.1)
    x_g, y_g = np.meshgrid(X, Y)
    nx, ny = x_g.shape
    z_g = np.full(np.asarray(x_g.shape)-1, np.nan)

    for ix in range(nx - 1):
        for jx in range(ny - 1):
            x_min = x_g[ix, jx]
            x_max = x_g[ix + 1, jx + 1]
            y_min = y_g[ix, jx]
            y_max = y_g[ix + 1, jx + 1]
            vals = z[(x >= x_min) & (x < x_max) & 
                      (y >= y_min) & (y < y_max)]
            if vals.any():
                z_g[ix, jx] = sum(vals)
    return z_g

# Proposed app
def app1(x,y,z):
    X = np.arange(min(x), max(x), 0.1)  
    Y = np.arange(min(y), max(y), 0.1)
    x_mask = ((x >= X[:-1,None]) & (x < X[1:,None]))
    y_mask = ((y >= Y[:-1,None]) & (y < Y[1:,None]))

    z_g_out = np.dot(y_mask*z[None].astype(np.float32), x_mask.T)

    # If needed to fill invalid places with NaNs
    z_g_out[y_mask.dot(x_mask.T.astype(np.float32))==0] = np.nan
    return z_g_out

如所见，为了公平的基准测试，我使用原始方法的数组值，因为从数据帧中获取值可能会减慢速度。

时间安排和验证 -

In [143]: x = np.array([1, 1.12, 1.109, 2.1, 3, 4.104, 3.1])
     ...: y = np.array([-9, -0.1, -9.2, -8.7, -5, -4, -8.75])
     ...: z = np.array([10, 4, 1, 4, 5, 0, 1])
     ...: 

# Verify outputs
In [150]: np.nansum(np.abs(org_app(x,y,z) - app1(x,y,z)))
Out[150]: 0.0

In [145]: %timeit org_app(x,y,z)
10 loops, best of 3: 19.9 ms per loop

In [146]: %timeit app1(x,y,z)
10000 loops, best of 3: 39.1 µs per loop

In [147]: 19900/39.1  # Speedup figure
Out[147]: 508.95140664961633

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

通过对 3D 数组进行采样和分桶来创建热图的相关文章

python的_random是什么？

如果你打开random py看看它是如何工作的它的类Random子类 random Random import random class Random random Random Random number generator base
从终端调用时 uvicorn 不工作

我尝试通过 pip3 在系统上安装 uvicorn 这有效但是我无法从命令行运行相同的命令有关如何解决此问题的任何指示 Requirement already satisfied uvicorn in home vhawk19 loca
Python 可以使用单独的媒体播放器打开 mp3 文件吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案是否可以开一个mp3Python 中的文件可以使用Popen 我并不是要在程序中运行它我的意思是作为媒体播放器中的一个单独窗口或其
Weasyprint 在调用 write_pdf 时获得未定义的属性：“AttributeError：‘PosixPath’对象没有属性‘read_text’”

我正在 ubuntu 18 04 上运行 weasyprint 项目并尝试创建一个 pdf 当我尝试设置页脚图像时问题就开始了我正在 python 3 6 7 上运行这是我调用 weasyprint 的代码 import sys i
Python MySQL 模块

我正在开发一个需要与 MySQL 数据库交互的 Web 应用程序但我似乎找不到任何真正适合 Python 的模块我特别寻找快速模块能够处理数十万个连接和查询所有这些都在短时间内完成而不会对速度产生重大影响我想我的答案将是游戏领
在 Windows 上将 NumPy 与 BLAS 链接

我正在尝试在 Windows 系统上安装 Theano 并且需要安装 BLAS 和 LAPACK 我的 System32 文件夹中有这些的 dll 文件当我运行 numpy config来自 Anaconda 的 show 库的路径正确显
字母表中的加密和解密 - Python GCSE

我目前正在尝试为学校编写一个程序以便加密和解密输入的消息我需要加密或解密的消息仅在字母表中没有其他符号或密钥例如使用消息车加密输入的偏移量为 5 我希望它输出 afs 有人可以帮忙吗这是我目前的代码 def find offse
PyPI 项目页面中的“Py 版本”是什么意思？这有关系吗？

我注意到大多数在 PyPI 上发布的项目在其项目页面中都包含 Py 版本元数据但它们的值各不相同如果包不是通用包或不是纯 python 包那么它们的值是不同的这是可以理解的以便表示它们的目标平台例如鼻页 https pypi
图像堆栈的最大强度投影

我正在尝试重新创建该功能 max array 3 来自 MatLab 它可以获取 N 个图像的 300x300px 图像堆栈我在这里说图像因为我正在处理图像实际上这只是一个大的双数组 300x300xN 并创建一个 300x300
如何抑制 pyinstaller 生成的可执行文件窗口中的所有警告

我已经使用 pyinstaller 从 python 文件生成了可执行文件该程序按其应有的方式工作但在我想隐藏的窗口中出现了一条警告消息当 python 文件在 IDE 中运行时以下行会抑制所有警告消息 warnings filte
Cython：为什么 size_t 比 int 快？

更改某些 Cython 变量的类型int输入size t可以显着减少某些功能的时间 30 但我不明白为什么例如 cimport numpy as cnp import numpy as np def sum int cnp int64 t
将数据框列打包到 pandas 中列出

我需要将 pandas DataFrame 列打包到包含列表的一列中例子 For gt gt gt df a b c 0 81 88 1 1 42 7 23 2 8 37 63 3 18 22 20 制作列表栏 list col 0 81
不重复的Python组合

我有一个数字列表我想从中进行组合如果我有清单 t 2 2 2 2 4 c list itertools combinations t 4 结果是 2 2 2 2 2 2 2 4 2 2 2 4 2 2 2 4 2 2 2 4 但我想得到
在 (i)python 脚本中从 jupyter 内核获取输出

我想从单个 ipython 会话中打开多个内核在这些内核上运行代码然后收集结果但我不知道如何收集结果甚至不知道如何查看 stdout stderr 我怎样才能做这些事情呢到目前为止我所得到的我已经使用如下代码管理了前两个步骤打
为什么全新安装后会有pip和conda包？

All Windows 10 64 位 d l Anaconda 2 5 0 与 Python3 64 位并安装全新安装后我输入conda list 并且在软件包中我看到重复像 jupyter 1 0 0 py35 1 jupyte
监控单个文件

我需要监控使用watchdog http pythonhosted org watchdog index html 单个文件而不是整个目录避免监视整个目录的最佳方法是什么我想this http pythonhosted org wa
多线程写入文件

前几天刚开始使用 python 对多线程的整个概念还很陌生我在多线程时写入文件时遇到问题如果我按照常规方式执行此操作它会不断覆盖正在写入的内容使用 5 个线程写入文件的正确方法是什么不降低性能的最佳方法是在所有线程之间使用队列每
Tornado websocket handler ， self.close() 正在关闭连接而不触发 on_close() 方法

我是 python stackoverflow tornado 的新手所以请耐心等待纠正我我正在使用龙卷风开发实时应用程序当我在 Websocket 处理程序类中调用 self close 时 on close 方法不会启动这次我
python 函数返回 javascript date.getTime()

我正在尝试创建一个简单的 python 函数它将返回与 javascript 相同的值new Date getTime 方法如所写here http www w3schools com js js dates asp javascrip
使用 Pandas 和 Group By 绘制堆叠直方图

我正在使用如下所示的数据集 Gender Height Width Male 23 4 4 4 Female 45 4 4 5 我想可视化高度和宽度的堆叠直方图我希望每个图有两个堆叠的直方图每个性别一个这是文档中的堆叠直方图如果存在

随机推荐

避免 R 中的两个 for 循环

我有一个 R 代码可以对两个函数进行卷积 convolveSlow lt function x y nx lt length x ny lt length y xy lt numeric nx ny 1 for i in seq lengt
使用雄辩的一对多时如何在第二个表上“order_by”

当然我可以将 order by 与第一个表中的列一起使用但不能与第二个表中的列一起使用因为结果是部分的如果我使用加入一切都会完美但我需要以雄辩的方式实现这一点难道我做错了什么这是一个例子 with join data DB
仅当使用单击时做出选择时才需要选项

使用时click http click pocoo org 5 我知道如何定义多项选择选项 http click pocoo org 5 options choice options 我也知道如何将选项设置为required一但是我怎样
WordPress 多站点：子站点 wp-admin“err_too_many_redirects”

我安装了新的 WordPress 4 1 多站点我可以导航 Front 并访问主站点仪表板 http blog urlcorrect com wp admin 我创建了一个子网站但无法访问子网站仪表板 http blog urlcorr
UISearchController searchBar 显示取消按钮不被尊重

我已将 UISearchController 添加到我的应用程序中并将其 searchBar 设置为titleView of my navigationItem 这有效但我看到取消按钮尽管已经设置showsCancelButton t
Automapper - 忽略有条件的映射

我正在使用自动映射器我想知道当字段为空时是否可以忽略字段的映射这是我的代码 ForMember dest gt dest BusinessGroup Id opt gt opt MapFrom src gt int src Busine
读取文件时不转换换行符

我正在读取一个文本文件 f open data txt data f read 然而换行符data当文件包含 CRLF r n 时变量被标准化为 LF n 如何指示 Python 按原样读取文件在 Python 2 x 中 f open
背面剔除的法线变换

从本课开始 WebGL 3D 透视 https webglfundamentals org webgl lessons webgl 3d perspective html我正在尝试实现没有魔法的背面剔除我正在动态计算对象空间中的面法线之
等待数千个任务

我有一个应用程序可以转换一些数据通常有 1 000 30 000 个文件我需要做3步复制文件替换其中的一些文本使用 WebClient 发出 Web 请求来下载文件我将复制的文件发送到 WebServer WebServer 将
如何避免超出 Visual Studio 中的内部 ILK 大小限制？

在 Visual Studio 2005 中构建一个大型项目时我在增量链接中遇到错误 LINK 致命错误 LNK1210 超出内部 ILK 大小限制与 INCRMENTAL NO 链接除了避免增量链接之外您还知道其他选择吗特别是
flutter 中任务 ':app:transformDexArchiveWithExternalLibsDexMergerForDebug' 执行失败

我正在尝试使用 firebase 并且按照确切的说明进行操作但是当我运行我的应用程序时出现此错误 What went wrong Execution failed for task app transformDexArchiveWith
状态 EndRootElement 中的令牌 StartElement 将导致无效的 XML 文档

我正在开发一个项目其中我从 C 创建一个 Power Point 文档一切进展顺利但由于某种原因我的一种方法出现了此错误状态 EndRootElement 中的令牌 StartElement 将导致无效的 XML 文档这是我的方
numpy - 从带有间距的数组中选择元素

我有一个 numpy 数组其中包含一堆单调递增的值说 a 1 2 3 4 6 10 10 11 14 a arr np array a Also say thresh 4 我想创建一个包含子集索引的数组a arr它逐步遍历数组选择元素
如何为Python打包的libcrypto和libssl启用FIPS模式？

我有一个 python 应用程序它与 Python 和 Libcrypto 以及 LibSSL 共享对象一起打包该应用程序是使用 Openssl Fips Module 2 0 构建的这些共享对象由 Python 的 request
从应用程序运行 shell 命令 [Rooted]

在我的应用程序中我想运行一些 shell 命令并解释输出这些命令本质上是在 root 手机上运行的命令我该怎么做首先确保您需要的 shell 命令在 Android 中确实可用我假设您可以执行诸如重定向输出之类的操作从而遇到了问
从 Smalltalk 中的集合生成所有组合

我已经看到这个问题在 C 和其他语言中得到解决但在 Smalltalk 中却没有得到解决我有3个集合例如 a 3 4 5 b 4 1 2 c 5 2 3 我需要做出所有可能的组合 i 即 3 4 5 3 4 2 3 4 3 3 1 5
检查我的 Linux 是 32 位还是 64 位的最佳方法是什么？

如果我有 32 位或 64 位 Linux 我必须检查 CMake 脚本才能知道如何构建 C 程序哪个命令是最佳选择 getconf LONG BIT arch uname m 使用 CMake 一种可能的方法是检查CMAKE SIZEO
运行 AppEngine 应用程序时出现“87% EXECUTING”消息

Issue When 使用开发服务器测试 AppEngine 应用程序 https cloud google com appengine docs standard java tools gradle testing your applic
为什么我的 Unicode 字符串从 Java Applet 传递到 Java 脚本时会损坏？

我是新人所以不要太严厉问题 tl 博士我在传递 unicode 时遇到问题String从嵌入式javax swing JApplet在网页中的 JavaScript 部分我不确定这是否是一个错误或对所涉及技术的误解 Problem
通过对 3D 数组进行采样和分桶来创建热图

我有一些实验数据如下所示 x array 1 1 12 1 109 2 1 3 4 104 3 1 y array 9 0 1 9 2 8 7 5 4 8 75 z array 10 4 1 4 5 0 1 如果方便的话我们可以假设数据

通过对 3D 数组进行采样和分桶来创建热图

标杆管理

通过对 3D 数组进行采样和分桶来创建热图 的相关文章

随机推荐

热门标签

通过对 3D 数组进行采样和分桶来创建热图的相关文章