两点层之间的距离矩阵

2024-04-22

我有两个数组，其中包含不同大小的点坐标 shapely.geometry.Point 。

Eg:

[Point(X Y), Point(X Y)...]
[Point(X Y), Point(X Y)...]

我想用距离函数创建这两个数组的“叉积”。距离函数来自shapely.geometry，它是一个简单的几何向量距离计算。我正在尝试创建 M:N 点之间的距离矩阵：

现在我有这个功能：

    source = gpd.read_file(source)
    near = gpd.read_file(near)

    source_list = source.geometry.values.tolist()
    near_list = near.geometry.values.tolist()

    array = np.empty((len(source.ID_SOURCE), len(near.ID_NEAR)))

    for index_source, item_source in enumerate(source_list):
        for index_near, item_near in enumerate(near_list):
            array[index_source, index_near] = item_source.distance(item_near)

    df_matrix = pd.DataFrame(array, index=source.ID_SOURCE, columns = near.ID_NEAR)

这可以很好地完成工作，但速度很慢。 4000 x 4000 点大约需要 100 秒（我的数据集更大，所以速度是主要问题）。如果可能的话，我想避免这种双重循环。我尝试在 pandas 数据框中执行如下操作（速度很慢）：

for index_source, item_source in source.iterrows():
         for index_near, item_near in near.iterrows():
             df_matrix.at[index_source, index_near] = item_source.geometry.distance(item_near.geometry)

更快一点的是（但仍然比 numpy 慢 4 倍）：

    for index_source, item_source in enumerate(source_list):
        for index_near, item_near in enumerate(near_list):
             df_matrix.at[index_source, index_near] = item_source.distance(item_near)

有没有更快的方法来做到这一点？我想有，但我不知道如何继续。我也许能够将数据帧分成更小的块，并将块发送到不同的核心并连接结果 - 这是最后的手段。如果以某种方式我们可以仅使用 numpy 和一些仅索引魔法，我可以将它发送到 GPU 并立即完成它。但现在双重 for 循环是不行的。另外我不想使用除 Pandas/Numpy 之外的任何其他库。我可以使用 SAGA 处理及其点距离模块（http://www.saga-gis.org/saga_tool_doc/2.2.2/shapes_points_3.html http://www.saga-gis.org/saga_tool_doc/2.2.2/shapes_points_3.html），这非常快，但我正在寻找仅 Python 的解决方案。

如果您可以获取单独向量中的坐标，我会尝试以下操作：

import numpy as np

x = np.asarray([5.6, 2.1, 6.9, 3.1]) # Replace with data
y = np.asarray([7.2, 8.3, 0.5, 4.5]) # Replace with data

x_i = x[:, np.newaxis]
x_j = x[np.newaxis, :]

y_i = y[:, np.newaxis]
y_j = y[np.newaxis, :]

d = (x_i-x_j)**2+(y_i-y_j)**2

np.sqrt(d, out=d)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

两点层之间的距离矩阵的相关文章

表单输入框不显示

我正在尝试使用 Django 显示一个简单的表单输入文本框我正在亚马逊 AWS 上部署该网站在不同的服务器 pythonanywhere 上运行良好但在 AWS 上存在主要问题具体来说输入框没有被显示我使用的模板如下首页 ht
使用 python 将 bibtex 文件转换为 html （也许是 pybtex？）

您好我想解析 bibtex 出版物文件并对特定字段例如年份进行排序并过滤某些内容然后将其放在网站上我遇到了 pybtex 它可以读取和解析 bibtex 文件但它基本上没有记录我不知道如何对条目进行排序 pybtex 是可行的
AttributeError：模块“tensorflow.python.summary.summary”没有属性“FileWriter”

我收到此错误尽管我到处都看过file writer tf summary FileWriter path to logs sess graph 被提到为正确的实施this https github com tensorflow tenso
Jupyter Notebook 找不到 IQSharp

我一直在尝试为 Quantum Katas 运行 Q 但在找到 Q 内核方面遇到了一些困难唯一显示的内核是用于 Jupyter Notebook 的 Python 3 内核奇怪的是当我执行 jupyter kernalspec lis
PyQt5 - 无法使用 QVideoWidget 播放视频

from PyQt5 QtWidgets import from PyQt5 QtMultimedia import from PyQt5 QtMultimediaWidgets import from PyQt5 QtCore impor
是否可以使用 csv.DictReader 保持列顺序？

例如我的 csv 有如下列 ID ID2 Date Job No Code 我需要以相同的顺序写回各列这dict立即打乱了顺序所以我相信这更多是读者的问题蟒蛇的dicts 在 3 6 之前不维持顺序但是无论如何在该版本中csv
Python：像石英一样的事件调度程序[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Dataframe unstack 性能 - pandas

我正在尝试拆开数据框它工作正常但问题是我正在处理 CSV 文件中的巨大数据集约 10 亿这是示例数据集 236539 48512569874 Name Danny 236539 48512569874 Class 12 236539
与 GridSearchCV 的并行错误，与其他方法一起工作正常

我使用 GridSearchCV 时遇到以下问题它在使用时给我一个并行错误n jobs gt 1 同时n jobs gt 1与 RadonmForestClassifier 等单一模型配合良好下面是一个显示错误的简单工作示例 train
创建 Pyomo 约束的性能

我正在用 pyomo 设置一个更大的能量优化问题正如其他中提到的设置花费了不合理的时间问题 https stackoverflow com questions 43413067 performance of pyomo to gener
使用 selenium 和 firefox 保存图像

我正在尝试使用 selenium 服务器和 python 客户端从网站保存图像我知道图像的 URL 但我无法找到保存它的代码无论是当它是文档本身还是当它嵌入到当前浏览器会话中时到目前为止我找到的解决方法是保存页面的屏幕截图有两种硒方
如何使用httplib2进行相互证书认证

我正在使用 httplib2 从我的服务器向另一个 Web 服务发出请求我们想要使用相互证书身份验证我了解如何使用证书进行传出连接 h set certificate 但是如何检查应答服务器使用的证书这张票 http code goo
如何让 IPython 按类别组织制表符补全的可能性？

当一个对象有数百个方法时制表符补全很难使用通常有趣的方法是由被检查对象的类而不是其基类定义或重写的方法如何让 IPython 对其制表符完成可能性进行分组以便首先检查对象的类中定义的方法和属性然后是基类中的方法和属性看起来像是
Python UPnP/IGD 客户端实现？

我正在寻找一个开源实现UPnP http elinux org UPnPPython 中的客户端更具体地说是它的互联网网关设备 http en wikipedia org wiki Internet Gateway Device Prot
Numpy 重新排列二维数组

我正在寻找一种快速公式来对 2D numpy 数组进行数值分箱通过分箱我的意思是计算子矩阵平均值或累积值对于前 x numpy arange 16 reshape 4 4 将被分割成 4 个 2x2 的子矩阵并给出 numpy ar
如何从 Django 中的链接设置预定义的表单值？

我的项目是这样布局的 1 page has many categories 2 category belongs to page has many items 3 item belongs to category 当我进入一个页面时我想修
加入语音频道（discord.py）

当我尝试让我的机器人加入我的语音频道时出现以下错误 await client join voice channel voice channel 产生错误的行 Traceback most recent call last File usr
pandas - 组合行的字符串

我有一个像这样的数据框 id text 1 DM HTN Enlarged prostate 2 hypertensive and on regular treatment 2 LBP 3 DM HTN Enlarged prostate
python 根据日期创建目录结构

我使用以下函数根据今天的日期创建目录 usr bin python import time datetime os today datetime date today todaystr today isoformat os mkdir to
加载腌制字典对象或加载 JSON 文件哪个更快？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案什么更快 A Unpickling 加载一个 pickled 字典对象使用pickle load or B 使用以下命令将 JSON

随机推荐

提醒用户对应用程序进行评分的警报

正如您可能在某些应用程序中看到的那样会弹出一个警报要求用户在 iTunes 中对应用程序进行评分通常您可以选择的选项如下当然这将打开应用程序的评分页面第二个选项是不谢谢它会关闭警报第三个选项通常是稍后它会稍后显示警报
与 INADDR_ANY 绑定

如果我将套接字绑定到 INADDR ANY 我知道它将接受服务器上配置的任何 IP 上的传入连接假设我在进行 bind 调用时配置了 1 个 IP 然后配置了一个新的 IP bind 是否也会接受向新配置的 IP 发起的连接还是仅适用于
Aurelia 自定义属性中的双向绑定

UPDATE 看起来这是一个已知的错误 https github com aurelia templated issues 253 https github com aurelia templating issues 253我将其留在这里是
在项目 .d.ts 定义文件中使用 @types 定义

我正在尝试为我的项目编写一个 d ts 文件来定义一些全局接口但是我在该定义文件中使用非全局库类型时遇到问题特别是我试图引用的 RxJs 对我来说不起作用我认为最有效的方法是使用三斜杠引用标签来导入 RxJ 的类型但这不起作用
Masonry 插件：调整 div 大小不会导致重新洗牌

将 Masonry 项目包裹在 1000px 宽的 div 中我有一个按钮可以使用 jQuery 将 div 大小调整为 2000xaddClass 问题是 Masonry 不会重新排列项目来填充额外的 1000px 空间我知道调整大小
PageViewController - 将变量传递给子视图

我拥有的我有一个 ViewController TutorialViewController 和一个 UIPageViewController TutorialPageViewController 故事板上还有 3 个带有 StoryBo
Paramiko 和伪 tty 分配

我正在尝试使用 Paramiko 连接到远程主机并执行许多文本文件替换 i o e client exec command perl p i e s initial replaced g conf 其中一些命令需要作为 sudo 运行这会
用于创建工作项模板的 TFS 客户端 API？

当然很可能在 TFS 中创建工作项获取工作项列表等除此之外我们还需要具有允许用户为各种文件类型创建自己的工作项模板的功能 TFS 客户端 API 是否能够将工作项模板上传到 TFS 服务器有一种方法可以获取 XML 定义 Micr
在函数内调用 div

我正在尝试使用 jQuery mobile 1 4 3 创建一个类似于 iOS 警报视图的弹出窗口我需要从 javascript 事件触发警告消息例如带有确定按钮的确认消息显示对 Web 服务的 ajax 响应调用我的第一个问题
# jquery移动页面url中的字符

为什么当我访问我的 jQuery 移动页面时假设 page php 显示正常但当我访问同一页面 page php someDetailsHere 时它只显示一个白色页面我该如何解决这个问题我使用第三方应用程序重定向到我的网页添
通过 Kafka 消费者重试维持订单保证

我正在为基于 Kafka 的数据处理管道中的消费者重试设计一个架构我们正在使用 Kafka 生产者和消费者并且正在考虑重试主题如果消费出错将在这些主题上发送消息将会有消费者以一定的节奏运行这些重试主题我读了很多参考架构但没有一
渲染图表后，从图表对象更改 Highcharts 工具提示格式化程序

我发现我可以使用 setData 更改系列并且我知道我可以使用 setExtremes 修改最大值但我无法弄清楚如何从图表对象设置工具提示格式化程序我如何更新该字段如果我有一个图表对象如何更新其工具提示格式化程序属性以及plot
如何让我的收据不再重复

这是一个程序要求用户输入条形码然后我的程序找到指定的产品询问用户他们想要购买多少产品如果他们想继续计算总价然后假设打印出收据但是我的问题是收据重复其值并且没有四舍五入到小数点后两位 press 0 to stop shoppi
如何在postgreSQL命令中指示在哪个数据库中执行脚本？（类似于SQL Server“use”命令）

我有以下问题我需要放入一个在新版本推出之前运行的脚本该脚本在 PostgreSQL 中启用 pgAgent 的 SQL 代码但是此代码应该在维护数据库 postgres 上运行而我们运行脚本文件的数据库是另一个数据库我记得在 S
如何检测视频标签上播放的视频的帧速率？

有什么方法可以通过 javascript 检测视频 html5 标签中引用的视频的帧速率是多少我还在寻找比特率和编解码器信息因为 html5 视频播放器与编解码器无关 thanks FPS 存储在video文件的标题这是您正在寻找的实
使用 Swift array.count 和 arc4random()

为了让这段代码正常工作我缺少什么 NodesLeft 是一个 Int let x nodesLeft count let r Int arc4random uniform x 我收到错误 Playground 执行失败错误 136 40
Javascript：在数组末尾重新启动一次循环

我最近遇到了这个问题但在任何地方都找不到好的答案因此有这个问题我想在到达终点后重新启动循环但只循环有限的次数在这个特定的上下文中我一周中有一系列天我想使用以下命令显示从今天开始的接下来 7 天的日期名称Date getDay
为什么 C++ 编译器对许多大括号的处理方式不同？

在下面的 C 20 程序中我错误地添加了一对额外的弯曲大括号 in B A include
如何在样式组件中访问 Material-ui 的主题

我将 CRA 与 Material ui 和 Styled Components 类型的样式一起使用在构建 CSS 时我想访问 Material ui 的默认主题 package json 的一部分 dependencies react
两点层之间的距离矩阵

我有两个数组其中包含不同大小的点坐标 shapely geometry Point Eg Point X Y Point X Y Point X Y Point X Y 我想用距离函数创建这两个数组的叉积距离函数来自shapely g

两点层之间的距离矩阵

两点层之间的距离矩阵 的相关文章

随机推荐

热门标签

两点层之间的距离矩阵的相关文章