Python 3D 插值加速

2024-04-30

我有以下用于插入 3D 体积数据的代码。

Y, X, Z = np.shape(volume)
xs = np.arange(0, X)
ys = np.arange(0, Y)
zs = np.arange(0, Z)

points = list(zip(np.ravel(result[:, :, :, 1]), np.ravel(result[:, :, :, 0]), np.ravel(result[:, :, :, 2])))
interp = interpolate.RegularGridInterpolator((ys, xs, zs), volume,
                                             bounds_error=False, fill_value=0, method='linear')
new_volume = interp(points)
new_volume = np.reshape(new_volume, (Y, X, Z))

此代码在 512x512x110 卷（约 2900 万个点）上执行大约需要 37 秒，这导致每个体素超过一微秒（这对我来说是不可接受的时间 - 而且它使用 4 个核心）。称呼new_volume=interp(points)大约需要 80% 的过程时间，而列表创建几乎占用整个剩余时间。

有没有任何简单（甚至更复杂）的方法可以使计算更快？或者有什么好的Python库可以提供更快的插值吗？每次调用此程序时，我的音量和点数都会发生变化。

这是您的稍作修改的版本cython解决方案：

import numpy as np
cimport numpy as np
from libc.math cimport floor
from cython cimport boundscheck, wraparound, nonecheck, cdivision

DTYPE = np.float
ctypedef np.float_t DTYPE_t

@boundscheck(False)
@wraparound(False)
@nonecheck(False)
def interp3D(DTYPE_t[:,:,::1] v, DTYPE_t[:,:,::1] xs, DTYPE_t[:,:,::1] ys, DTYPE_t[:,:,::1] zs):

    cdef int X, Y, Z
    X,Y,Z = v.shape[0], v.shape[1], v.shape[2]
    cdef np.ndarray[DTYPE_t, ndim=3] interpolated = np.zeros((X, Y, Z), dtype=DTYPE)

    _interp3D(&v[0,0,0], &xs[0,0,0], &ys[0,0,0], &zs[0,0,0], &interpolated[0,0,0], X, Y, Z)
    return interpolated


@cdivision(True)
cdef inline void _interp3D(DTYPE_t *v, DTYPE_t *x_points, DTYPE_t *y_points, DTYPE_t *z_points, 
               DTYPE_t *result, int X, int Y, int Z):

    cdef:
        int i, x0, x1, y0, y1, z0, z1, dim
        DTYPE_t x, y, z, xd, yd, zd, c00, c01, c10, c11, c0, c1, c

    dim = X*Y*Z

    for i in range(dim):
        x = x_points[i]
        y = y_points[i]
        z = z_points[i]

        x0 = <int>floor(x)
        x1 = x0 + 1
        y0 = <int>floor(y)
        y1 = y0 + 1
        z0 = <int>floor(z)
        z1 = z0 + 1

        xd = (x-x0)/(x1-x0)
        yd = (y-y0)/(y1-y0)
        zd = (z-z0)/(z1-z0)

        if x0 >= 0 and y0 >= 0 and z0 >= 0:
            c00 = v[Y*Z*x0+Z*y0+z0]*(1-xd) + v[Y*Z*x1+Z*y0+z0]*xd
            c01 = v[Y*Z*x0+Z*y0+z1]*(1-xd) + v[Y*Z*x1+Z*y0+z1]*xd
            c10 = v[Y*Z*x0+Z*y1+z0]*(1-xd) + v[Y*Z*x1+Z*y1+z0]*xd
            c11 = v[Y*Z*x0+Z*y1+z1]*(1-xd) + v[Y*Z*x1+Z*y1+z1]*xd

            c0 = c00*(1-yd) + c10*yd
            c1 = c01*(1-yd) + c11*yd

            c = c0*(1-zd) + c1*zd

        else:
            c = 0

        result[i] = c

结果仍然和你的一样。随机网格数据为60x60x60我得到以下时间：

SciPy's solution:                982ms
Your cython solution:            24.7ms
Above modified cython solution:  8.17ms

所以它比你的快了近 4 倍cython解决方案。注意

Cython 默认对数组执行边界检查，如果您需要该功能，请打开边界检查删除@boundscheck(False).
在上面的解决方案中，数组需要是 C 连续的
如果您想要上述代码的并行变体，请替换range代替prange在你的for loop.

希望这可以帮助。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

performance

NumPy

interpolation

Cython

Python 3D 插值加速的相关文章

ctypes 错误：libdc1394 错误：无法初始化 libdc1394

我正在尝试将程序编译为共享库我可以使用 ctypes 在 Python 代码中使用该库使用以下命令该库可以正常编译 g shared Wl soname mylib O3 o mylib so fPIC files pkg config
Pandas dataframe：每批行的操作

我有一个熊猫数据框df我想计算每批行的一些统计信息例如假设我有一个batch size 200000 对于每批batch sizerows 我想要一列的唯一值的数量ID我的数据框我怎样才能做这样的事情呢这是我想要的一个例子 prin
“一旦获取切片就无法更新查询”。最佳实践？

由于我的项目的性质我发现自己不断地从查询集中取出切片如下所示 Thread objects filter board requested board id order by updatedate 10 但这给我带来了实际对我选择的元素进
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
将二维数组放入 Pandas 系列中

我有一个 2D Numpy 数组我想将其放入 pandas 系列而不是 DataFrame 中 gt gt gt import pandas as pd gt gt gt import numpy as np gt gt gt a np
Python tkinter.filedialog Askfolder 干扰 clr

我主要在 Spyder 中工作构建需要弹出文件夹或文件浏览窗口的脚本下面的代码在spyder中完美运行在 Pycharm 中 askopenfilename工作良好同时askdirectory什么都不做卡住了但是如果在调试模式
如何在Python中高效地添加稀疏矩阵

我想知道如何在Python中有效地添加稀疏矩阵我有一个程序可以将大任务分解为子任务并将它们分配到多个 CPU 上每个子任务都会产生一个结果一个 scipy 稀疏矩阵格式为 lil matrix 稀疏矩阵尺寸为 100000x50
ValueError：不支持连续[重复]

这个问题在这里已经有答案了我正在使用 GridSearchCV 进行线性回归的交叉验证不是分类器也不是逻辑回归我还使用 StandardScaler 对 X 进行标准化我的数据框有 17 个特征 X 和 5 个目标 y 观察约11
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim
Python：我不明白 sum() 的完整用法

当然我明白你使用 sum 与几个数字然后它总结所有但我正在查看它的文档我发现了这一点 sum iterable start 第二个参数 start 的作用是什么这太尴尬了但我似乎无法通过谷歌找到任何示例并且对于尝试学习该语言的
红宝石接球和效率

catch在 Ruby 中意味着跳出深度嵌套的代码在 Java 中例如用Java也可以达到同样的效果try catch用于处理异常但它被认为是糟糕的解决方案而且效率非常低在 Ruby 中我们有处理异常的方法begin raise
为什么 Web Worker 性能在 30 秒后急剧下降？

我正在尝试提高在网络工作人员中执行时脚本的性能它旨在解析浏览器中的大型文本文件而不会崩溃一切都运行得很好但我注意到使用网络工作者时大文件的性能存在严重差异于是我做了一个简单的实验我在同一输入上运行脚本两次第一次运行在页面的主线程
Django - 提交具有同一字段多个输入的表单

预警我对 Django 以及一般的 Web 开发非常陌生我使用 Django 托管一个基于 Web 的 UI 该 UI 将从简短的调查中获取用户输入通过我用 Python 开发的一些分析来提供输入然后在 UI 中呈现这些分析的可视
sqlite3从打印数据中删除括号

我创建了一个脚本用于查找数据库第一行中的最后一个值 import sqlite3 global SerialNum conn sqlite3 connect MyFirstDB db conn text factory str c con
PIL - 需要抖动，但限制调色板会导致问题

我是 Python 新手正在尝试使用 PIL 来执行 Arduino 项目所需的解析任务这个问题涉及到Image convert 方法以及调色板抖动等选项我有一些硬件能够一次仅显示 16 种颜色的图像但它们可以指定为 RGB 三元
字符串列表，获取n个元素的公共子串，Python

我的问题可能类似于this https stackoverflow com questions 37514193 count the number of occurrences of n length not given string in
导入错误：无法导入名称“时间戳”

我使用以下代码在 python 3 6 3 中成功安装了 ggplot conda install c conda forge ggplot 但是当我使用下面的代码将其导入笔记本时出现错误 from ggplot import Impor
bs4 `next_sibling` VS `find_next_sibling`

我在使用时遇到困难next sibling 并且类似地与next element 如果用作属性我不会得到任何返回但如果用作find next sibling or find next 然后就可以了来自doc https www cru
[cocos2d-x]当我尝试在 Windows 10 中运行“python android-build.py -p 19 cpp-tests”时出现错误

当我尝试运行命令时python android build p cpp tests 我收到如图所示的错误在此之前我收到了另一条关于 Android SDK Tools 版本兼容性的错误消息所以我只是将 sdk 版本从 26 0 0
使用Multiprocessing和Pool时如何访问全局变量？

我试图避免将变量冗余地传递到dataList e g 1 globalDict 2 globalDict 3 globalDict 并在全球范围内使用它们 global globalDict然而在下面的代码中并不是这样做的解决方案是否有

随机推荐

如何使用Java泛型来避免强制转换？

对于查询提出于link https stackoverflow com questions 26192111 how to compare objects with different types 建议使用 Java 泛型以避免难以评估项
Angular 2 根据角色/声明显示/隐藏组件/零件

我试图了解有关角度应用程序安全方面的最佳实践可以说我有一个包含模型详细信息屏幕的视图根据给定用户的角色权限例如从 jwt 声明中获得我希望能够做的是根据用户是否具有特定角色的事实启用禁用某些输入字段因此实际上有些角色可以
如何在 Swift 中使用 UILocalNotification

我正在尝试弄清楚如何快速设置 UILocalNotification 但我运气不佳我正在尝试这个 var notification UILocalNotification notification timeZone NSTimeZone
本地化 html 文档（事后看来）

我正在用 PHP 构建一个 Web 应用程序我已经决定在整个过程中以不同的语言提供该应用程序我的问题是这样的我不想费力地浏览模板文件中的所有 HTMl 代码来查找需要用动态生成的 lang 变量替换的单词有没有一个工具可以突出
我可以在 Azure Pipelines 中对变量进行子字符串化吗？

我正在寻找一种方法来定义我的变量azure pipelines yml我可以在其中子串的文件 Build SourceVersion gt 仅使用前 7 个字符文档中似乎没有可以执行此类字符串操作的内置函数我有什么遗漏的吗我的另一种方
具有 OpenGL ES 3.1 上下文的 GLSurfaceView

我正在使用 OpenGL 开发 Android 我知道如何使用GLSurfaceView及其自定义派生类使用以下方法创建 OpenGL ES 2 0 上下文GLSurfaceView setEGLContextClientVersion
AngularJS - 将外部 html 文件包含到模态中

我正在使用 AngularJS 并且有一个 html 页面其中包含多个引导模式这个 html 文件由于包含了所有这些模态而变得有点繁重是否可以在不失去范围的情况下将外部 html 文件包含到这些模态中如果您使用 Angular UI
TYPO3：如何将页面内容插入模板

我有一些内容想要出现在 TYPO3 网站的多个页面上我可以将其插入模板中但我还希望该内容可以在富文本编辑器中编辑所以我有了创建隐藏页面的想法但我不知道如何将此内容插入到模板中是否需要select打字稿声明另外作为后续问题我可
使用 System.Diagnostics 进行简单调试和日志记录

我希望能够将条目写入控制台应用程序该应用程序将描述操作何时完成可能会在某一时刻将它们写入 txt 文件我希望它与同时运行的单独 GUI 应用程序一起使用这样我就可以使用该应用程序并同时监视日志我只假设诊断类是正确的工具但是我以前
Parsley 自定义验证器不适用于 JavaScript 安装

我有最简单的形式和最简单的自定义验证器但它不起作用请参阅http jsfiddle net M55M4 http jsfiddle net M55M4 怎么了
Joda Time 持续时间或间隔中的分钟数

我有这个简单的代码 DateTime date new DateTime dateValue DateTime currentDate new DateTime System currentTimeMillis System out pri
在Vim中，如何删除单词的后缀？

在vim中在正常模式下如果光标位于单词中而不是最后一个字母 de从光标位置删除单词的后缀如果光标位于最后一个字母上 x也这样做同时de会跳到下一个单词的末尾您将使用什么命令在这两种情况下都有效无论最后一个字母与否目的是将命令
如何设置带有选项卡的多个滑动视图的默认选项卡？

我真的被困住了我在主要活动中使用选项卡进行了四个滑动视图但我想要的是当用户打开应用程序时它会自动显示第二个选项卡而不是第一个选项卡这是我的 MainActivity java public class MainActivity ex
Three.js 光线投射器可以与组相交吗？

我想知道我的光线投射器是否正在查看我已加载的 OBJ 由于从 Cinema4D 导出的方式我相信 OBJ 是一个具有 3 个子级的 THREE Group 而不是 THREE Object 我可以更改我的 raycaster 代码行来查找
发送同一条短信两次

我正在尝试制作一个短信Android应用程序但我收到了一个我以前从未见过的错误即使在谷歌中我也没有找到类似的东西所以如果你能帮助我我会很高兴由于某种原因程序同时发送两条消息同一条短信但这只是发生在生产中当我使用模拟器时
Android Studio 无法下载并附加某些库的源代码

就我而言是这样的源代码是这样的 https i stack imgur com Xuo0X png 然后我单击下载源但看到此错误 error https i stack imgur com 26R68 png java util N
当 max-height 固定时 CSS 自动列计数

我希望实现一个布局其中一个元素在我的例子中是一个 ul 当高度达到一定限制时扩展到 2 或更多列例如如果高度仅够容纳 3 个项目而我有 5 个项目则第 4 和第 5 个项目将转到第二列该列仅在需要时创建我尝试通过设置来做到
VS Code Python autopep8 不支持 2 个空格悬挂缩进

我正在尝试让 autopep8 正常工作以 2 个空格而不是 4 个空格正确缩进 Python 代码我正在使用带有 Python 扩展的 VS Code 该扩展使用 autopep8 进行格式化我发现here https stacko
如何在 Laravel 中基于迁移文件制作模型

我已经创建了一个迁移我想根据迁移文件制作一个模型这可能吗如果是这样该怎么办这是不可能的到目前为止您最多可以通过运行以下命令同时创建迁移和模型 php artisan make model ModelName m
Python 3D 插值加速

我有以下用于插入 3D 体积数据的代码 Y X Z np shape volume xs np arange 0 X ys np arange 0 Y zs np arange 0 Z points list zip np ravel re

Python 3D 插值加速

Python 3D 插值加速 的相关文章

随机推荐

热门标签

Python 3D 插值加速的相关文章