将重复参数传递给 Numpy 向量化函数的最佳方法

2023-12-11

所以，继续我和 @TheBlackCat 的讨论这个答案，我想知道将参数传递给 Numpy 向量化函数的最佳方法。所讨论的函数定义如下：

vect_dist_funct = np.vectorize(lambda p1, p2: vincenty(p1, p2).meters)

where, vincenty来自地质学包.

我目前打电话vect_dist_funct以这种方式：

def pointer(point, centroid, tree_idx):
    intersect = list(tree_idx.intersection(point))
    if len(intersect) > 0:
        points = pd.Series([point]*len(intersect)).values
        polygons = centroid.loc[intersect].values
        dist = vect_dist_funct(points, polygons)
        return pd.Series(dist, index=intercept, name='Dist').sort_values()
    else:
        return pd.Series(np.nan, index=[0], name='Dist')

points['geometry'].apply(lambda x: pointer(point=x.coords[0], centroid=line['centroid'], tree_idx=tree_idx))

（请参考这里的问题：带标签的数据类型 Python)

我的问题与函数内部发生的情况有关pointer。我转变的原因points to a pandas.Series然后获取值（在第四行，就在if声明）是使其形状与多边形相同。如果我只是将点称为points = [point]*len(intersect) or as points = itertools.repeat(point, len(intersect))，Numpy 抱怨它“不能一起广播大小为 (n,2) 和大小 (n,) 的数组”（n 是intersect).

如果我打电话vect_dist_funct像这样：dist = vect_dist_funct(itertools.repeat(points, len(intersect)), polygons), vincenty抱怨我给它传递了太多的参数。我完全不明白两者之间的区别。

请注意，这些是坐标，因此总是成对的。以下是如何操作的示例point and polygons看起来像：

point = (-104.950752   39.854744) # Passed directly to the function like this.
polygons = array([(-104.21750802451864, 37.84052458697633),
                  (-105.01017084789603, 39.82012158954065),
                  (-105.03965315742742, 40.669867471420886),
                  (-104.90353460825702, 39.837631505433706),
                  (-104.8650601872832, 39.870796282334744)], dtype=object)
           # As returned by statement centroid.loc[intersect].values

最好的通话方式是什么vect_dist_funct在这种情况下，这样我就可以进行矢量化调用，并且 Numpy 和 vincenty 都不会抱怨我传递了错误的参数？此外，还寻求能够最小化存储器消耗并提高速度的技术。目标是计算点到每个多边形质心之间的距离。

np.vectorize在这里并不能真正帮助你。根据文档:

提供矢量化函数主要是为了方便，而不是为了性能。该实现本质上是一个 for 循环。

实际上，vectorize主动伤害你，因为它将输入转换为 numpy 数组，进行不必要且昂贵的类型转换并产生你所看到的错误。使用具有以下功能的函数会更好for loop.

最好使用函数而不是lambda对于一个 to-level 函数，因为它可以让你拥有一个文档字符串。

这就是我将如何实现你正在做的事情：

def vect_dist_funct(p1, p2):
    """Apply `vincenty` to `p1` and each element of `p2`.

    Iterate over `p2`, returning `vincenty` with the first argument
    as `p1` and the second as the current element of `p2`.  Returns
    a numpy array where each row is the result of the `vincenty` function
    call for the corresponding element of `p2`.
    """
    return [vincenty(p1, p2i).meters for p2i in p2]

如果你真的想使用vectorize，您可以使用excluded不向量化的论点p1争论，或者更好的是建立一个lambda包裹着vincenty并且仅向量化第二个参数：

def vect_dist_funct(p1, p2):
    """Apply `vincenty` to `p1` and each element of `p2`.

    Iterate over `p2`, returning `vincenty` with the first argument
    as `p1` and the second as the current element of `p2`.  Returns
    a list where each value is the result of the `vincenty` function
    call for the corresponding element of `p2`.
    """
    vinc_p = lambda x: vincenty(p1, x)
    return np.vectorize(vinc_p)(p2)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将重复参数传递给 Numpy 向量化函数的最佳方法的相关文章

on_delete=models.PROTECT 和 on_delete=models.CASCADE 在 Django 模型上有什么作用？

我对 Django 很熟悉但最近注意到有一个on delete models CASCADE and on delete models PROTECT模型的选项 on delete models CASCADE and on delete
Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法
python - 是否可以扩展 xml-rpc 可以序列化的事物集？

我看到几个问题询问如何发送numpy ndarray通过 xml rpc 调用这不能开箱即用因为正如 xml rpc 中所述docs https docs python org 2 library xmlrpclib html 有一组固
从字符串到类型的词法转换

最近我尝试用Python存储和读取文件中的信息遇到了一个小问题我想从文本文件中读取类型信息从 string 到 int 或 float 的类型转换非常有效但从 string 到 type 的类型转换似乎是另一个问题当然我尝试了
Python 3 __getattribute__ 与点访问行为

我读了一些关于 python 的对象属性查找的内容这里 https blog ionelmc ro 2015 02 09 understanding python metaclasses object attribute lookup h
如何从 PyCharm 项目中获取我的“exe”[重复]

这个问题在这里已经有答案了通过 PyCharm 在 Python 上编写一些项目我想从中获取一个exe文件我尝试过另存为 gt XXX exe 但是当我尝试执行它时出现错误此类操作系统不支持该文件附注我有win7 x64 它
Python - 用逗号分割，跳过括号内的内容

我需要用逗号分隔字符串但我对这种情况有一个问题 TEXT EXAMPLE THIS IS A EXAMPLE BUT NOT WORKS FOR ME SECOND THIRD 我想拆分并得到 var 0 TEXT EXAMPLE THI
Pandas重置索引未生效[重复]

这个问题在这里已经有答案了我不确定我在哪里误入歧途但我似乎无法重置数据帧上的索引当我跑步时test head 我得到以下输出正如您所看到的数据帧是一个切片因此索引超出范围我想做的是重置该数据帧的索引所以我跑test rese
如何通过双击在浏览器中打开 ipynb 文件

以前我安装了 Canopy 当时我只需双击 ipynb 文件并在浏览器中打开它们即可但是后来我需要Anaconda 一旦我安装了它这个功能就没有了现在我只希望能够简单地双击 ipynb 文件然后该文件就会在 Firefox 中
具有多个元素的数组的真值是二义性错误吗？ Python

from numpy import from pylab import from math import def TentMap a x if x gt 0 and x lt 0 5 return 2 a x elif x gt 0 5 a
在可编辑的QSqlQueryModel中实现setEditStrategy

这是后续这个问题 https stackoverflow com questions 49752388 editable qtableview of complex sql query 在那里我们创建了 QSqlQueryModel 的可
为什么我用 beautifulSoup 刮的时候有桌子，但没有 pandas

尝试抓取条目页面转换为制表符分隔格式主要拉出序列和 UniProt 登录号当我跑步时 url www signalpeptide de index php sess m listspdb bacteria s details id 10
将 Pandas 列中的列表拆分为单独的列

这是我在 pandas 数据框中的特征列 Feature Cricket 82379 Kabaddi 255 Reality 4751 Cricket 15640 Wildlife 730 LiveTV 13 Football 4129
如何列出 python PDB 中的当前行？

在 perl 调试器中如果重复列出离开当前行的代码段可以通过输入命令返回到当前行点我无法使用 python PDB 模块找到任何类似的东西如果我list如果我自己离开当前行并想再次查看它似乎我必须记住当前正在执行的行号对我来说
将一个列表的元素除以另一个列表的元素

我有两个清单比如说 a 10 20 30 40 50 60 b 30 70 110 正如你所看到的列表 b 由一个列表的元素总和组成其中 window 2 b 0 a 0 a 1 10 20 30 etc 如何获得另一个列表该列表由
如何有效地从 loadmat 函数生成的嵌套 numpy 数组中提取值？

python中是否有更有效的方法从嵌套的python列表中提取数据例如A array array 12000000 dtype object 我一直在使用A 0 0 0 0 当你有很多像 A 这样的数据时这似乎不是一个有效的方法我也用
查找给定节点的最高权重边

我在 NetworkX 中有一个有向图边缘的权重从 0 到 1 表示它们发生的概率网络连通性非常高所以我想修剪每个节点的边缘只保留最高概率的节点我不确定如何迭代每个节点并仅保留最高权重in edges在图中有没有一个networ
Scipy 稀疏 Cumsum

假设我有一个scipy sparse csr matrix代表下面的值 0 0 1 2 0 3 0 4 1 0 0 2 0 3 4 0 我想就地计算非零值的累积和这会将数组更改为 0 0 1 3 0 6 0 10 1 0 0 3 0 6
检查字符串是否只有字母和空格 - Python

试图让 python 返回一个字符串仅包含字母和空格 string input Enter a string if all x isalpha and x isspace for x in string print Only alphabe
Django South - 将 null=True 字段转换为 null=False 字段

我的问题是转变的最佳做法是什么null True场变成null False使用 Django South 的字段具体来说我正在与ForeignKey 你应该先写一个数据迁移 http south aeracode org docs t

随机推荐

手机锁定时如何显示弹出活动或对话框？

我试图在手机锁定时显示活动或对话框我尝试过使用 WakeLock 但它不起作用并且只有在手机解锁后我才能看到活动执行此操作的正确方法是什么要在不关闭键盘保护的情况下显示活动请尝试以下操作 getWindow addFlags Wi
设置 ProGuard 来混淆局部变量和参数

我似乎找不到在被混淆的类的方法内部混淆局部变量的设置这是我反编译的一个类的摘录其中有一些明显缺失的部分理想情况下方法的参数和局部变量也将被混淆 public class eA extends gu private final gt
SKAction playSoundFileNamed 来自 Singleton

我有几个级别都使用相同的音效我没有在每个级别都使用相同的代码而是将所有声音合并到一个单例类中但是当我从其他类运行该方法时将其放在单例中不会播放声音我没有任何错误或警告当我在每个类中都有相同的代码时我播放声音没有问题问题 D
Mac 上的 Java 类路径是如何设置的？

Mac 上的 Java 类路径是如何设置的既然您用以下标签标记了问题tomcat 我假设您正在运行 Java Servlet Web 应用程序在这种情况下类路径覆盖了 JAR 文件 WEB INF libwebapp 的文件夹和所有类
Python：“NoneType”对象不可下标“错误[重复]

这个问题在这里已经有答案了我是 Python 数据库的新手因此为了练习一些关键技能我正在构建一个登录屏幕将用户名和散列密码写入数据库然后根据数据库中的内容检查用户的输入但是当尝试从数据库中提取用户名和密码并将其存储在变量中时
css 上的 Margin-Right 不起作用

我在学校期间一直在搞编码因为它是我在学校最感兴趣的事情并且在学年的大部分时间里我一直在自学 Html Css 和 Js 我一直在重新创建学校的网站但遇到了一些问题我的 CSS Margin Right 命令不起作用我一直在尝试集中
iOS：SDWebImageManager 不缓存图像

我正在使用创建幻灯片UIImageView 并且图像链接位于数组中所以当我这样做时我了解到SDWebImageManager让我们只点击 URL 一次然后它就会缓存图像以供以后使用但我在应用程序中监视的是我相信第一个图像已被缓存
获取变量或参数的名称[重复]

这个问题在这里已经有答案了我想获取变量或参数的名称例如如果我有 var myInput input var nameOfVar GETNAME myInput gt nameOfVar should be myInput void t
Sqlldr 接受 1 种日期格式

我有一个动态生成控制文件的sql脚本文件它接受日期格式为 mm dd yyyy 的日期字段 sqlldr 正在从 csv 文件加载日期但它也接受日期格式例如 mm dd yyyy 或 mm dd yyyy 我如何让它只接受 MM DD
为什么我的 Java try...catch 出现错误？

我开始自学更多有关 Java 错误处理的知识这是我的第一个程序我尝试查看特定错误而不是使用catch Exception e 作为一个通用的包罗万象的catch 我正在删除一个文件并返回一条消息表明该文件已成功删除或删除失败如果删除
大端和小端值是否可移植？

你好我在小端和大端有一个小问题我知道这个问题已经问过n次了但我无法弄清楚以下几点让我们取 int i 10 它以二进制存储为00000000 00000000 00000000 00001010在堆栈部分如下 00000000 00
GBoard 键盘 GIF 贴纸集成

我正在努力支持GBoard在我的应用程序中我希望用户能够从 GBoard 中选择 GIF 我的onCommitContent看起来像这样 Override public void onCommitContent InputContentI
raphael.js - 将饼图转换为圆环图

我正在尝试使用位于此处的 raphael js 示例 http raphaeljs com pie html 但我想将饼图转换为甜甜圈图所有切片中间有一个洞目前每个切片都是使用以下代码创建的 function sector cx cy
knitr：块中的代码意外地被包装

在使用 knit2pdf 和 LaTeX 的投影仪演示中我有时发现块中的代码被包装即使我已经设置了tidy FALSE全球例如这个块 item Fit this using func glm lt
保存到 CSV 时日期信息消失

我试图从互联网上提取一些数据然后将其导出到 CSV 文件但我丢失了 CSV 文件中的日期信息我不明白为什么我是 R 新手所以请保持简单的回答这是我的代码 Library quantmod getSymbols SPY from
PHPUnit 测试双打

我开始使用 PHPUnit 来测试我的代码但我在理解双重测试方面遇到一些问题我尝试存根类方法 b 以在从另一个方法调用时返回 true 而不是通常的行为 false 我有这样的代码 class MyClass function a re
创建后数组大小发生变化

谁能解释一下这里发生了什么我的印象是数组的大小一旦创建和声明就无法更改 public class ArrayManipulation public static void main String args int a 1 2 3 new
解析 TO 标头中符合 RFC 822 的地址

我想使用 preg match all 解析电子邮件地址列表如 TO 标头中的列表以获取用户名如果存在和电子邮件与 Pear 中的 mailparse rfc822 parse addresses 或 Mail RFC822 pa
返回 python 中最常出现的前 n 个字符及其各自的计数

如何返回前 n 个最常出现的字符及其各自的计数例如 aaaaaabbbbcccc 2应该返回 a 6 b 4 在Python中我试过这个 def top chars input n list1 list input list3 list
将重复参数传递给 Numpy 向量化函数的最佳方法

所以继续我和 TheBlackCat 的讨论这个答案我想知道将参数传递给 Numpy 向量化函数的最佳方法所讨论的函数定义如下 vect dist funct np vectorize lambda p1 p2 vincenty p1

将重复参数传递给 Numpy 向量化函数的最佳方法

将重复参数传递给 Numpy 向量化函数的最佳方法 的相关文章

随机推荐

热门标签

将重复参数传递给 Numpy 向量化函数的最佳方法的相关文章