在 1-NN 图中查找连通分量的快速方法？

2024-01-07

首先，我得到了一个 N*N 距离矩阵，对于每个点，我计算了它的最近邻，所以我们有一个 N*2 矩阵，看起来像this:

0 -> 1  
1 -> 2  
2 -> 3  
3 -> 2  
4 -> 2  
5 -> 6  
6 -> 7  
7 -> 6  
8 -> 6  
9 -> 8

第二列是最近邻居的索引。所以这是一种特殊的导演图，每个顶点都有且只有一个出度。

当然，我们可以先将N*2矩阵转换为标准的图表示，然后进行BFS/DFS以获得连通分量。

但是，考虑到这个特殊图的特点，还有其他快速的方法来完成这项工作吗？

我将非常感激。

Update:

我为此实现了一个简单的算法case here https://gist.github.com/4002163.

看，我没有使用并查找算法，因为数据结构可能会让事情变得不那么容易，我怀疑这是否是我的情况下最快的方法（我的意思是实际上）。

你可能会说 _merge 过程可能很耗时，但如果我们在分配新标签时将边交换到连续位置，合并的成本可能很小，但需要另外 N 个空间来跟踪原始索引。

在给定边列表的情况下查找连通分量的最快算法是联合查找 http://en.wikipedia.org/wiki/Disjoint-set_data_structure算法：对于每个节点，持有指向同一集合中的节点的指针，所有边都收敛到同一个节点，如果找到长度至少为2的路径，则向上重新连接底部节点。

这肯定会在线性时间内运行：

- push all edges into a union-find structure: O(n)
- store each node in its set (the union-find root)
    and update the set of non-empty sets: O(n)
- return the set of non-empty sets (graph components).

由于边列表几乎已经形成并查找树，因此可以跳过第一步：

for each node
- if the node is not marked as collected
-- walk along the edges until you find an order-1 or order-2 loop, 
   collecting nodes en-route
-- reconnect all nodes to the end of the path and consider it a root for the set.
-- store all nodes in the set for the root.
-- update the set of non-empty sets.
-- mark all nodes as collected.
return the set of non-empty sets

第二种算法也是线性的，但只有基准测试才能判断它是否实际上更快。并查算法的优势在于其优化。这将优化延迟到第二步，但完全删除了第一步。

如果您将并集步骤与最近邻计算结合起来，然后在第二遍中收集集合，您可能会获得更多的性能。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Algorithm

graphtheory

directedgraph

在 1-NN 图中查找连通分量的快速方法？的相关文章

快速求解子集和

考虑这种解决子集和问题的方法 def subset summing to zero activities subsets 0 for activity cost in activities iteritems old subsets sub
通过分布式数据库聚合作业优化网络带宽

我有一个分布式联合数据库结构如下数据库分布在三个地理位置节点每个节点集群有多个数据库关系数据库是 PostgreSQL MySQL Oracle 和 MS SQL Server 的混合体非关系数据库是 MongoDB 或 Ca
检索受“rowspan”影响的行的列索引的最有效方法是什么？

考虑下表 table thead tr th th th A th th B th th C th tr thead tbody tr th 1 th td Apples td td Oranges td td Pears td tr tb
固定大小集以包含给定集的最大数量

我有大约 1000 组尺寸 1 4 1 3 3 5 6 4 5 6 7 5 25 42 67 100 是否有可能找到包含最大数量的给定集合的大小为 20 的集合检查每一个100 80 20 集效率低下我不太确定这是 NP 完全的考虑
快速搜索压缩文本文件

我需要能够在大量压缩文件 txt 中搜索文本压缩可能会改变为其他东西甚至成为专有的我想避免解压所有文件并压缩编码搜索字符串并在压缩文件中搜索这应该可以通过对所有文件使用相同的码本使用霍夫曼压缩来实现我不想重新发明轮子所以任
点集子集的最小周长凸包

给定平面上的 n 个点没有 3 个共线给定数字 k 找到 k 个点的子集使得 k 个点的凸包在 k 个点的子集的任何凸包中具有最小周长我可以想到一个简单的方法运行时间为 O n k k log k 找到大小为 k 的每个子集的凸包
由周期表元素形成的最大单词的算法

我想为以下问题场景编写一个算法根据元素周期表元素的名称找到可以组成的最大单词符号如Na Ne等应被视为单个元素这是在一家知名公司的求职面试中被问到的有人可以帮我解决这个问题吗我认为更好的方法是检查字典中的每个单词看看是否可以从
0-1背包算法

以下 0 1 背包问题是否可解浮动正值和浮动权重可以是正数或负数背包的浮动容量 gt 0 我平均有这是一个相对简单的二进制程序我建议用蛮力进行修剪如果任何时候你超过了允许的重量你不需要尝试其他物品的组合你可以丢弃整
C 埃及分数

古埃及人仅使用以下形式的分数1 n因此任何其他分数都必须表示为这些单位分数的总和而且所有单位分数都是不同的在C或Java中使任何分数成为埃及分数总和越少越好的好方法是什么可以使用什么算法分支定界 a 例如 3 4 1 2 1
带路径压缩算法的加权 Quick-Union

有一种带路径压缩的加权快速联合算法代码 public class WeightedQU private int id private int iz public WeightedQU int N id new int N iz new
异或交换可以扩展到两个以上的变量吗？

我一直在尝试将异或交换扩展到两个以上的变量例如n变量但我没有得到比这更好的地方3 n 1 对于两个整型变量x1 and x2你可以像这样交换它们 swap x1 x2 x1 x1 x2 x2 x1 x2 x1 x1 x2 所以假设你有
找到一条穿过任意节点序列的最短路径？

In 这个先前的问题 https stackoverflow com questions 7314333 find shortest path from vertex u to v passing through a vertex wOP询
大数据使用什么数据结构

我有一个包含一百万行的 Excel 工作表每行有 100 列每行代表一个具有 100 个属性的类的实例列值是这些属性的值哪种数据结构最适合在这里使用来存储数百万个数据实例 Thanks 这实际上取决于您需要如何访问这些数据以及您想要
二维滑动窗口最小值/最大值

假设我们得到一个大小为 NxN 的像素整数矩阵和一个整数 k 窗口大小我们需要使用滑动窗口找到矩阵中的所有局部最大值或最小值这意味着如果某个像素与其周围窗口中的所有像素相比具有最小最大值则应将其标记为最小最大有一种著名的滑
照片马赛克算法。如何在给定基本图像和瓷砖列表的情况下创建马赛克照片？

Hy 我要做的是创建一个程序使用 C 或 C 它将 24 位像素位图和图像集合作为输入我必须创建一个马赛克图像类似于使用库的输入图像给定的图像创建与输入类似的马赛克照片到目前为止我可以访问输入的图像像素及其颜色但我有点卡住了
有没有时间复杂度为O(N)的排序算法？

大多数排序算法的复杂度为 O NN 或 O NlogN 来实现结果但是对于特定的输入集有些算法的复杂度为 O N 我想知道是否有一种排序算法在所有情况下都具有 O N 的复杂度如果您只能比较检查两个项目是否为正在排序的值那么您
平铺单纯形噪声？

我作为业余爱好者对伪随机噪声生成很感兴趣特别是 Perlin 和 Simplex 算法 Simplex 的优点是速度尤其是在更高的维度上但 Perlin 可以相对容易地平铺我想知道是否有人知道平铺单纯形算法固定维度就好泛型更
动态规划 (DP) 中的重叠子问题是什么？

为了使动态规划适用问题必须具有两个关键属性最优子结构 and 重叠子问题 1 https en wikipedia org wiki Dynamic programming 对于这个问题我们只关注后一个属性有各种不同的定义重叠子问题
归并排序中的递归：两次递归调用

private void mergesort int low int high line 1 if low lt high line 2 int middle low high 2 line 3 mergesort low middle l
高效列出目录中的所有子目录

请参阅迄今为止所采取的建议的编辑我正在尝试使用 WinAPI 和 C 列出给定目录中的所有目录文件夹现在我的算法又慢又低效使用 FindFirstFileEx 打开我正在搜索的文件夹然后我查看目录中的每个文件使用 FindNex

随机推荐

自定义 UIAlertView 上的按钮

这是我自定义按钮的当前方式 UIAlertView av UIAlertView alloc init av addButtonWithTitle UIButton yesButton av subviews lastObject av s
使用 htaccess 将网站重定向到移动版网站

您好我使用以下代码重定向到移动网站从移动到移动网站移动中的domain com到m domain com 它工作正常但网址末尾的 id 9 即将到来如何删除 id 9 从 url 以及如何将移动网站 m domain com 从桌
Android 视图转换是否在光栅化后应用？

下面代码中的行 A 和行 B 应生成相同的图像然而行 A 却生成了图像怎么了光栅化后是否应用视图画布转换 import android content Context import android graphics Canvas
express.js - 单行中多个路由的单个路由处理程序

有没有办法在单个函数调用中做到这一点 var todo function req res app get todo app get blabla todo app get blablablabla todo 就像是 app get blab
Google 联系 gdata (Java) 因内容类型没有解析器而失败：application-xml[application/xml]

最近两天前当我们尝试访问联系人时我们开始在 Java 中的 google gdata 客户端中遇到异常提要 m8 feeds contacts default full 例外的是 com google gdata util Pars
如何使用 Gmail Api 获取邮件列表？

我想访问消息列表 Object 2 0 0 p481 008 gt g gmail api users messages list gt lt Google APIClient Method 0x41c948c ID gmail users
SQLite多进程访问

我们在多进程和多线程应用程序中使用 SQLite SQLite 数据库文件使用嵌入式 SQLite 加密进行加密这FAQ http sqlite org faq html q5指出 SQLite 应该能够使用锁机制来管理多进程访问我们遇
WPF - 在系统帐户下执行进程时性能低下

问题描述我有一个 WPF 应用程序通常在具有管理员权限的本地用户帐户下运行但是在某些情况下该进程是由运行在下面的服务或脚本启动的SYSTEM帐户因此该进程也在SYSTEM帐户问题是当进程运行时SYSTEM帐户时存在一些明显的
编写一个程序来计算级数的项之和

编写一个程序来计算级数项的总和 4 8 12 16 20 24 28 32 n 其中 n 是输入考虑 n 始终有效其中意味着它遵循系列模式 n int input Enter n sum 0 for i in range 4 n 4
如何使用新的 SVN 合并跟踪？

在我现有的 SVN 1 5 之前合并策略中我们在创建分支时创建主干的副本称为 BasePoint 以便稍后在合并过程中引用当我们需要将分支合并回主干时我们执行 2 个操作从 BasePoint 合并到 LatestTrunk 主
mysql 与 php 计算行数的最佳实践

1 计数记录 Connect to mysql server link mysql connect HOST USER PASSWORD if link die Could not connect to server mysql error
docker-compose 可以在具有离散端口的服务之间共享 IP 吗？

目前我们拥有使用 Supervisord 进行复杂构建的 docker 容器以便我们可以将服务分组在一起例如 nginx 和 ssh 我正在尝试使用由共享卷链接的更多服务驱动的隔离来重建这些然而无需将 IP 映射到主机我似乎找不
OrientDB ETL 在加载 CSV 文件时抛出异常

我试图将一个简单的 CSV 文件加载到 OrientDB 但它总是抛出此异常 CSV 文件内容 id name role 1 Sarath Architect 2 Anoop Project Manager 3 Nazeem Lead De
第一次更新和启动应用程序时是否会调用 applicationDidFinishLaunching: ？

Is applicationDidFinishLaunching保证在应用程序更新后调用当用户首次启动更新版本时换句话说如果旧版本在更新过程中以后台模式运行它会被杀死吗是的如果您的应用程序处于后台更新程序将在升级之前终止您的应
从 Linux 内核发送 UDP 数据包

即使类似的主题已经存在我注意到它可以追溯到两年前因此我想开一个新的主题更合适我试图弄清楚如何从 Linux 内核 3 3 4 发送 UDP 数据包以便监视随机数生成器 drivers char random c 的行为到目前为止
我们如何通过 sdk 将文件添加到用户的 files.list 中？

我们遇到的问题是有时当用户发出请求时不会返回用户可以访问的文件 files list 这可以通过多种方式发生例如 Google 群组的新成员将看不到以前共享的文件如中所述这个问题 https stackoverflow com qu
预期具体生命周期，在结构中存储 fn 时发现绑定生命周期参数

我正在尝试将函数存储在结构中 trait T lt a gt struct A struct B lt a gt a a A impl lt a gt T lt a gt for B lt a gt fn f1 lt a E T lt a
如何使用http库捕获SocketException？

这个问题已经被其他人指出过比如here https stackoverflow com questions 32810051 cannot catch socketexception 虽然我可能已经明白了原因但是在使用更高级别的时候仍然
如何比较 2 个 .csv 文件并创建一个包含两个 csv 文件中的部件的新 .csv？

我正在尝试比较 CSV 文件的两个特定部分 JobStart csv test1 test2 test3 test4 Val2Compare2 test5 test6 test7 Datafile csv line 1 Val2Compar
在 1-NN 图中查找连通分量的快速方法？

首先我得到了一个 N N 距离矩阵对于每个点我计算了它的最近邻所以我们有一个 N 2 矩阵看起来像this 0 gt 1 1 gt 2 2 gt 3 3 gt 2 4 gt 2 5 gt 6 6 gt 7 7 gt 6 8 gt

在 1-NN 图中查找连通分量的快速方法？

在 1-NN 图中查找连通分量的快速方法？ 的相关文章

随机推荐

热门标签

在 1-NN 图中查找连通分量的快速方法？的相关文章