更有效的循环方式？

2024-04-21

我有来自一个更大脚本的一小段代码。我发现当函数t_area被调用时，它负责大部分运行时间。我自己测试了这个函数，它并不慢，我相信它需要运行很多次，所以需要花费很多时间。这是调用该函数的代码：

tri_area = np.zeros((numx,numy),dtype=float)
for jj in range(0,numy-1):
    for ii in range(0,numx-1):
      xp = x[ii,jj]
      yp = y[ii,jj]
      zp = surface[ii,jj]
      ap = np.array((xp,yp,zp))

      xp = xp+dx
      zp = surface[ii+1,jj]
      bp = np.array((xp,yp,zp))

      yp = yp+dx
      zp = surface[ii+1,jj+1]
      dp = np.array((xp,yp,zp))

      xp = xp-dx
      zp = surface[ii,jj+1]
      cp = np.array((xp,yp,zp))

      tri_area[ii,jj] = t_area(ap,bp,cp,dp)

这里使用的数组的大小是216 x 217，值也是如此x and y。我对 python 编码很陌生，我过去使用过 MATLAB。所以我的问题是，有没有办法绕过这两个 for 循环，或者有没有一种更有效的方法来运行这段代码？寻求任何帮助来加快速度！谢谢！

EDIT:

感谢大家的帮助，这已经解决了很多困惑。我被问到循环中使用的功能区域，下面是代码：

def t_area(a,b,c,d):
ab=b-a
ac=c-a
tri_area_a = 0.5*linalg.norm(np.cross(ab,ac))

db=b-d
dc=c-d
tri_area_d = 0.5*linalg.norm(np.cross(db,dc))

ba=a-b
bd=d-b
tri_area_b = 0.5*linalg.norm(np.cross(ba,bd))

ca=a-c
cd=d-c
tri_area_c = 0.5*linalg.norm(np.cross(ca,cd))

av_area = (tri_area_a + tri_area_b + tri_area_c + tri_area_d)*0.5
return(av_area)

抱歉，令人困惑的符号，当时它是有道理的，现在回想起来我可能会改变它。谢谢！

在我们开始之前需要注意一下。range(0, numy-1)，等于range(numy-1)，生成从 0 到 numy-2 的数字，不包括 numy-1。那是因为你有从 0 到 numy-2 的 numy-1 值。虽然 MATLAB 具有基于 1 的索引，但 Python 具有基于 0 的索引，因此在转换中的索引时要小心一些。考虑到你有tri_area = np.zeros((numx, numy), dtype=float), tri_area[ii,jj]永远不会以您设置循环的方式访问最后一行或最后一列。因此，我怀疑正确的意图是写range(numy).

由于函数t_area()是可矢量化的，您可以完全消除循环。矢量化意味着 numpy 通过处理底层循环，同时对整个数组应用一些操作，这样它们会更快。

首先，我们将所有的aps 表示 (m, n, 3) 数组中的每个 (i, j) 元素，其中 (m, n) 是x。如果我们计算两个 (m, n, 3) 数组的叉积，则默认情况下该运算将应用于最后一个轴。这意味着np.cross(a, b)会做对于每个元素 (i, j) 取 3 个数字的叉积a[i,j] and b[i,j]。相似地，np.linalg.norm(a, axis=2)会做对于每个元素 (i, j) 计算 3 个数字的范数a[i,j]。这也将有效地将我们的数组大小减小到 (m, n)。不过这里要小心一点，因为我们需要明确声明我们希望在第二个轴上完成此操作。

请注意，在以下示例中，我的索引关系可能与您的不对应。完成这项工作的最低要求是surface多出一行和一列x and y.

import numpy as np

def _t_area(a, b, c):
    ab = b - a
    ac = c - a
    return 0.5 * np.linalg.norm(np.cross(ab, ac), axis=2)

def t_area(x, y, surface, dx):
    a = np.zeros((x.shape[0], y.shape[0], 3), dtype=float)
    b = np.zeros_like(a)
    c = np.zeros_like(a)
    d = np.zeros_like(a)

    a[...,0] = x
    a[...,1] = y
    a[...,2] = surface[:-1,:-1]

    b[...,0] = x + dx
    b[...,1] = y
    b[...,2] = surface[1:,:-1]

    c[...,0] = x
    c[...,1] = y + dx
    c[...,2] = surface[:-1,1:]

    d[...,0] = bp[...,0]
    d[...,1] = cp[...,1]
    d[...,2] = surface[1:,1:]

    # are you sure you didn't mean 0.25???
    return 0.5 * (_t_area(a, b, c) + _t_area(d, b, c) + _t_area(b, a, d) + _t_area(c, a, d))

nx, ny = 250, 250

dx = np.random.random()
x = np.random.random((nx, ny))
y = np.random.random((nx, ny))
surface = np.random.random((nx+1, ny+1))

tri_area = t_area(x, y, surface, dx)

x在此示例中支持索引 0-249，而surface 0-250. surface[:-1]，简写为surface[0:-1]，将返回从 0 开始到最后一行的所有行，但不包括它。-1具有相同的功能并且end在 MATLAB 中。所以，surface[:-1]将返回索引 0-249 的行。相似地，surface[1:]将返回索引 1-250 的行，这与您的效果相同surface[ii+1].

Note：我在知道这一点之前就写了这一部分t_area()可以完全矢量化。因此，虽然这里的内容对于这个答案来说已经过时了，但我将把它作为遗产保留下来，以展示如果函数不可矢量化，可以进行哪些优化。

您应该传递它，而不是为每个元素调用昂贵的函数x, y,, surface and dx并进行内部迭代。这意味着只需一次函数调用并且开销更少。

此外，您不应该为以下内容创建数组ap, bp, cp and dp每个循环，这又增加了开销。在循环外分配它们一次，然后更新它们的值。

最后一项更改应该是循环的顺序。 Numpy 数组默认是行优先（而 MATLAB 是列优先），所以ii作为外循环表现更好。您不会注意到您大小的数组的差异，但是嘿，为什么不呢？

总的来说，修改后的函数应该是这样的。

def t_area(x, y, surface, dx):
    # I assume numx == x.shape[0]. If not, pass it as an extra argument.
    tri_area = np.zeros(x.shape, dtype=float)

    ap = np.zeros((3,), dtype=float)
    bp = np.zeros_like(ap)
    cp = np.zeros_like(ap)
    dp = np.zeros_like(ap)

    for ii in range(x.shape[0]-1): # do you really want range(numx-1) or just range(numx)?
        for jj in range(x.shape[1]-1):
            xp = x[ii,jj]
            yp = y[ii,jj]
            zp = surface[ii,jj]
            ap[:] = (xp, yp, zp)

            # get `bp`, `cp` and `dp` in a similar manner and compute `tri_area[ii,jj]`

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

更有效的循环方式？的相关文章

为什么方法无法访问类变量？

我试图理解Python中的变量作用域除了我不明白为什么类变量不能从其方法访问的部分之外大多数事情对我来说都很清楚在下面的例子中mydef1 无法访问a 但如果a可以在全局范围类定义之外声明 class MyClass1 a 25
Pytest：如何使用从夹具返回的列表来参数化测试？

我想使用由固定装置动态创建的列表来参数化测试如下所示 pytest fixture def my list returning fixture depends on other fixtures return a dynamically
无法将较大的 blob 上传到 Azure：azure.core.exceptions.ServiceRequestError：操作未完成（写入）(_ssl.c:2317)

我正在尝试使用 Python SDK 将一些较大的 blob gt 50MB 上传到我的 Azure 存储容器 connect str os environ AZURE STORAGE CONNECTION STRING blob serv
pandas 两个数据框交叉连接[重复]

这个问题在这里已经有答案了我找不到有关交叉联接的任何内容包括合并联接或其他一些内容我需要使用 my function 作为 myfunc 处理两个数据帧相当于 for itemA in df1 iterrows for itemB
以编程方式将列名称添加到 numpy ndarray

我正在尝试将列名称添加到 numpy ndarray 然后按名称选择列但这不起作用我无法判断问题是在添加名称时出现还是在稍后尝试调用它们时出现这是我的代码 data np genfromtxt csv file delimiter
在 Windows 上将 Word2vec 与 Tensorflow 结合使用

In 本教程文件 https github com tensorflow models blob master tutorials embedding word2vec py L45通过 Tensorflow 找到以下行第 45 行来加
Python 相当于 Bit Twiddling Hacks 中的 C 代码？

我有一个位计数方法我正在尝试尽可能快地实现我想尝试下面的算法位摆弄黑客 http graphics stanford edu seander bithacks html CountBitsSetParallel 但我不知道 C 什么是
如何检查包含 NaN 的列表 [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案在我的 for 循环中我的代码生成一个如下所示的列表 list 0 0 0 0 sum 0 0 0 0 该循环生成所有其他数字向量但它也
将具有不同大小的行的数据加载到 Numpy 数组中

假设我有一个包含如下数据的文本文件 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 如何将它加载到 numpy 数组中使其看起来像这样 1 2 3 4 5 0 6 7 8 0 0 0 9 1
如何将reportlab与Google应用程序引擎一起使用

我无法在谷歌应用程序引擎下正确导入reportlab 根据以下guide http blog notdot net 2010 04 Generating PDFs on App Engine Python and introducing M
如何消除 jQuery Mobile 中的悬停延迟？

我正在使用 jQuery Mobile 制作一个网站当我将鼠标悬停在按钮上时它会更改其类并扩展其颜色但感觉需要半秒左右才能完成有没有办法减少这种延迟您可以覆盖hoverDelay无需修改 jQuery Mobile js 库要
PermanentTaskFailure：“模块”对象没有属性“迁移”

我在 google appengine 上使用 Nick Johnson 的批量更新库 http blog notdot net 2010 03 Announcing a robust datastore bulk update utili
Windows 与 Linux 文本文件读取

问题是我最近从 Windows 切换到 Ubuntu 我的一些用于分析数据文件的 python 脚本给了我错误我不确定如何正确解决我当前仪器的数据文件输出如下 Header 有关仪器等的各种信息 Data 状态代码温度字段等 0
在 python 查询参数中使用 %20 而不是 + 作为空格

我使用 python requests 编写了以下 python 脚本 http requests readthedocs org en latest http requests readthedocs org en latest impo
Melt() 函数复制数据集

我有一个这样的表 id name doggo floofer puppo pupper 1 rowa NaN NaN NaN NaN 2 ray NaN NaN NaN NaN 3 emma NaN NaN NaN pupper 4 sop
如何缓存 ASP.NET 网站以获得更好的性能

我是一名网页设计师通常设计不需要更新的企业网站所以我想将输出缓存一天我怎样才能做到这一点此外任何有关在慢速服务器上提高 ASP NET 性能的建议都被接受请注意 ASP NET 缓存有一个bug http connect mic
如何使用 FastAPI 在 HTMX 前端中使用 HX-Redirect？

我试图在登录后在前端重定向我像这样从我的 htmx 前端发出请求
bool() 和operator.truth() 有什么区别？

bool https docs python org 3 library functions html bool and operator truth https docs python org 3 library operator htm
如何将 Pandas Dataframe 中的字符串转换为字符列表或数组？

我有一个名为的数据框data 其中一列包含字符串我想从字符串中提取字符因为我的目标是对它们进行一次性编码并使之可用于分类包含字符串的列存储在预测因子如下 predictors pd DataFrame data columns Seq
如何抑制 Pandas Future 警告？

当我运行该程序时 Pandas 每次都会给出如下所示的未来警告 D Python lib site packages pandas core frame py 3581 FutureWarning rename with inplace

随机推荐

HTML 表单动作搜索，1 个文本框，2 个按钮，2 个可能的结果

这些天我正在尝试做一个搜索表单该表单发送到两个不同的页面其中有两个不同的按钮和一个文本框到目前为止我正在这样做
如何在SceneKit中实现逼真的景深效果？

我正在尝试渲染具有真实景深效果的帧我已经尝试过景深属性camera节点但它不会产生可用的结果是否可以切换到景深效果的最大渲染质量性能不是一个因素我只需要渲染一帧用户可以等待它 SceneKit 中逼真的景深效果在SceneKi
如何在 WordPress 短代码中使用 AJAX？

我有一个代码来显示随机报价有人编写了一个函数来实现这一切但由于某种原因通过AJAX更新数据不起作用当您按下新报价按钮时什么也没有发生也许有人知道为什么以下代码中需要修复什么以便当您单击新报价时加载新报价 The PHP
如何实施IDEA？

我必须制作一个可以使用 Java 或 C 中的 IDEA 国际数据加密算法加密和解密文本文件的应用程序我知道Java中有一个内置的JCE Java加密扩展但是我该如何进一步进行有人能给我一些建议吗由于某种原因无法发表评论所以我将
将先前的提交分解为多个提交

如果不创建分支并在新分支上做一堆时髦的工作是否可以在将单个提交提交到本地存储库后将其分解为几个不同的提交 git rebase i http git scm com book en v2 Git Tools Rewriting Histo
如何在 EF 4.1 RC 中的 DbContext 级别关闭更改跟踪？

我遇到了一个似乎很常见的问题我正在更新数据库中的值但 EF 正在使用对象的原始内存副本并且这些更改的值不会反映在显示的数据中我明白这是为什么但我无法找到解决方法最常见的解决方案似乎是设置MergeOptions NoTracki
OpenCV SURF功能未实现

当我尝试运行示例时find obj cpp或任何 OpenCV SURF 程序在执行代码时我在命令提示符中收到以下错误该项目构建时没有错误和警告我使用的是 VS2011 beta OpenCV 2 4 和 windows7 错误信息
附加搜索词时如何重用 jquery-ui-autocomplete 缓存结果？

我有以下 JS 方法将 jQuery UI 自动完成小部件绑定到搜索文本框一切工作正常包括缓存但在附加搜索词时我进行了不必要的服务器调用因为我不重用刚刚检索的结果例如搜索 ab 会从服务器获取一些结果在搜索框中的 ab 后面键
从网络下载已使用 wavesurfer.js 修改的音频

我使用wavesurfer js 创建了一个多轨网络播放器它可以调整不同轨道的级别和平移我想要做的是将具有新级别的混合曲目导出并将平移作为单个 wav 文件我对此做了一些研究很多人都指出https github com mattdi
如何使用 Oracle 清理死连接？

现在我正在针对 Oracle 数据库开发一些新应用程序有时它们会崩溃或无法正确结束等等无论如何问题是它们有时似乎保持连接打开我需要在它们之后进行清理我的问题是是否有一种方法可以从数据库端确定死连接并清理它们这是一个页面涉
C# 3.5 ASP.net 文件 IO 问题，网络共享上的文件出现 UnauthorizedAccessException

每次我尝试访问时都会收到 UnauthorizedAccessException 只是read 网络共享上的文件服务器文件夹1 文件夹2 文件 pdf 我正在模拟对上述文件夹具有读写访问权限的域 aspnet 用户该文件不是只读的我
TextInputLayout.passwordVisibilityToggleRequested 上的 NullPointerException

我在 Firebase 崩溃报告中收到有关以下内容的错误Password toggle button在某些真实设备中处于发布模式的应用程序上问题是堆栈跟踪错误的全部内容android support design您将在从 Firebase
livereload 不提供地址选择

更新node js后我发现了这个问题当我运行 ionic cordova run android livereload 时它在本地主机中运行我该如何解决这个问题请帮我离子信息 Ionic CLI 5 2 1 Ionic Fram
如何有条件地实例化不同的子类？

例如在main函数中我想获取用户的输入根据输入我将创建一个Rectangle or a Circle 它们是子类Object 如果没有输入或未知那么我将只创建一个通用对象 class Object public Object v
Eclipse 指标插件建议[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个工具来为我提供一些代码指标 LOC 总数 LOC 类外部引用类的数量等有谁知道一个
哪个 XML 解析器可以处理不完整的 XML 文件？

我正在尝试使用 SAX 解析器解析 XML 但不断出现XML document structures must start and end within the same entity 这是预料之中的因为我从其他来源获得的 XML 文档不
尝试上传到 aws s3 存储桶时收到 400 错误请求

我在服务器上签署 URL 并将其发送回客户端效果很好这就是该函数的样子 const aws require aws sdk config require config crypto require crypto module expor
安卓。谷歌 API 翻译

我在集成 Google API Translate 时遇到一些问题添加到 gradle 配置此依赖项 compile com google apis google api services translate v2 rev41 1 20
使用 Google Oauth2 客户端访问 API 时 Rails 3.2.3 中出现 SSL 错误

我对 OAuth2 相当陌生我正在尝试使用 Omniauth 和 Google API 客户端通过 Google API 访问用户的 Blogger 帐户我正在使用以下内容轨道3 2 3 红宝石 1 9 3 oauth2 0 8 0
更有效的循环方式？

我有来自一个更大脚本的一小段代码我发现当函数t area被调用时它负责大部分运行时间我自己测试了这个函数它并不慢我相信它需要运行很多次所以需要花费很多时间这是调用该函数的代码 tri area np zeros numx nu

更有效的循环方式？

更有效的循环方式？ 的相关文章

随机推荐

热门标签

更有效的循环方式？的相关文章