通过应用传递闭包创建唯一数字的列表

2024-01-08

我有一个元组列表（每个元组由 2 个数字组成），例如：

array = [(1, 2), (1, 3), (2, 4), (5, 8), (8, 10)]

可以说，这些数字是一些数据库对象（记录）的 id，并且在元组内部，有重复对象的 id。这意味着 1 和 2 是重复的。 1 和 3 是重复的，这意味着 2 和 3 也是重复的。

如果 a == b 且 b == c 则 a == c

现在我想将所有这些重复的对象 id 合并到一个元组中，如下所示：

output = [(1, 2, 3, 4), (5, 8, 10)]

我知道我可以使用循环和冗余匹配来做到这一点。我只是想要一些处理/计算量较低的更好的解决方案（如果有的话）。

您可以使用数据结构来更有效地执行合并。在这里，您创建了某种相反的树。因此，在您的示例中，您首先将创建列出的数字：

1  2  3  4  5  8  10

现在如果你迭代(1,2)元组，你抬头看1 and 2在某种字典中。你搜索他们的祖先（这里没有），然后你创建某种合并节点:

1  2  3  4  5  8  10
 \/
 12

接下来我们合并(1,3)所以我们查找祖先1 (12) and 3 (3) 并执行另一次合并：

1  2  3  4  5  8  10
 \/   |
 12  /
   \/
  123

接下来我们合并(2,4) and (5,8) and (8,10):

1  2  3  4  5  8  10
 \/   |  |   \/   |
 12  /   |   58  /
   \/   /      \/
  123  /      5810
     \/
    1234

您还可以保留“合并头”列表，以便可以轻松返回元素。

是时候动手了

现在我们知道如何构建这样的数据结构，让我们来实现一个。首先我们定义一个节点：

class Merge:

    def __init__(self,value=None,parent=None,subs=()):
        self.value = value
        self.parent = parent
        self.subs = subs

    def get_ancestor(self):
        cur = self
        while cur.parent is not None:
            cur = cur.parent
        return cur

    def __iter__(self):
        if self.value is not None:
            yield self.value
        elif self.subs:
            for sub in self.subs:
                for val in sub:
                    yield val

现在我们首先为列表中的每个元素初始化一个字典：

vals = set(x for tup in array for x in tup)

并为每个元素创建一个字典vals映射到一个Merge:

dic = {val:Merge(val) for val in vals}

and the merge_heads:

merge_heads = set(dic.values())

现在对于数组中的每个元组，我们查找相应的Merge对象是祖先，我们创建一个新的Merge最重要的是，从上面取下两个旧头merge_head设置并添加新的merge to it:

for frm,to in array:
    mra = dic[frm].get_ancestor()
    mrb = dic[to].get_ancestor()
    mr = Merge(subs=(mra,mrb))
    mra.parent = mr
    mrb.parent = mr
    merge_heads.remove(mra)
    merge_heads.remove(mrb)
    merge_heads.add(mr)

最后，完成后我们可以简单地构造一个set对于每个Merge in merge_heads:

resulting_sets = [set(merge) for merge in merge_heads]

and resulting_sets将是（顺序可能会有所不同）：

[{1, 2, 3, 4}, {8, 10, 5}]

把它们放在一起（没有class定义）：

vals = set(x for tup in array for x in tup)
dic = {val:Merge(val) for val in vals}
merge_heads = set(dic.values())
for frm,to in array:
    mra = dic[frm].get_ancestor()
    mrb = dic[to].get_ancestor()
    mr = Merge(subs=(mra,mrb))
    mra.parent = mr
    mrb.parent = mr
    merge_heads.remove(mra)
    merge_heads.remove(mrb)
    merge_heads.add(mr)
resulting_sets = [set(merge) for merge in merge_heads]

This will worst case run in O(n²), but you can balance the tree such that the ancestor is found in O(log n) instead, making it O(n log n). Furthermore you can short-circuit the list of ancestors, making it even faster.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

list

loops

transitiveclosure

通过应用传递闭包创建唯一数字的列表的相关文章

只使用 Django 的某些部分？

我喜欢 Django 但对于一个特定的应用程序我只想使用它的一部分但我对 Django 的内部工作原理还不够熟悉所以也许有人可以指出我必须做什么的正确方向查看具体来说我想使用模型和数据库抽象 The 缓存API http doc
如何使用 lxml 解析包含前缀但没有名称空间声明的 XML？

我有一堆使用前缀但没有相应名称空间声明的 XML 文件像这样的东西
Python sqlite3参数化删除表

我在 python 中删除 sqlite3 表时遇到问题我正在使用标准sqlite3模块 self conn sqlite3 connect sql drop table self conn execute sql u table nam
Python 按照层次结构按多个分隔符分割字符串

我只想根据多个分隔符例如 and 和按顺序分割字符串一次例子 121 34 adsfd gt 121 34 adsfd dsfsd and adfd gt dsfsd adfd dsfsd adfd gt dsfsd adfd dsf
在 Python 中绘制分类数据的三个维度

我的数据包含三个我试图可视化的分类变量城市五个之一职业四种之一血型四种之一到目前为止我已经成功地以一种我认为易于使用的方式对数据进行了分组 import numpy as np pandas as pd Make data
Django 未在 404 页面上应用应用程序中的 CSS 文件

姜戈3 0 8 Python 3 7 x 我有一个包含一些应用程序的 Django 项目我正在尝试为 400 403 404 500 错误制作一些默认错误页面我已经这样做了并显示了适当的模板但没有任何样式或 JS 在 404 错
python 脚本中 os.system 的 256 和 512 响应代码是什么

当我在 python 中使用 os system ping 服务器时我得到多个响应代码使用的命令 os system ping q c 30 s SERVERANME 0 在线 256 离线 512 512 是什么意思 Per the
使用 boto3 从 s3 下载时使用 filename 作为文件名

我正在使用 boto3 上传文件如下所示 client boto3 client s3 aws access key id id aws secret access key key client upload file tmp test
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
是否有更矢量化的方法来沿轴执行 numpy.outer ？

gt gt gt x np array a0 a1 b0 b1 gt gt gt y np array x0 x1 y0 y1 gt gt gt iterable np outer x i y i for i in xrange x sha
如何在 Pytorch 中将一维 IntTensor 转换为 int

如何将一维 IntTensor 转换为整数这 IntTensor int 给出错误 KeyError Variable containing 423 torch IntTensor of size 1 我所知道的最简单最干净的方法 In
PyCharm - 如何挂起所有线程

我们使用 PyCharm 5 0 1 进行多线程调试当它在断点处停止时只有特定线程停止而所有其他线程继续这使得冻结时刻和检查参数值以及其他线程的当前状态变得困难当其中一个线程在断点处停止时是否可以挂起所有线程这在最新的 P
检查多个 pd.DataFrame 是否相等

是否有一种 Pythonic 方式无循环或递归来检查是否超过两个pd DataFrames 例如 pd DataFrames 列表彼此相等吗就像是 all x equals dfs 0 for x in dfs with dfs数据
如何加速 pandas 字符串函数？

我正在使用 pandas 矢量化 str split 方法来提取从上的拆分返回的第一个元素我还尝试使用 df apply 与 lambda 和 str split 来产生等效的结果使用 timeit 时我发现 df apply 的
Qcut Pandas：ValueError：Bin 边缘必须是唯一的

我使用 Pandas 中的 Qcut 将数据离散化为大小相等的存储桶我想要有价格桶这是我的数据框 productId sell prix categ popularity 11997 16758760 0 28 75 50 524137
Python：帮助（numpy）在退出时导致段错误

我遇到了一个奇怪的现象在 python 解释器中我执行以下操作 gt gt gt import numpy gt gt gt help numpy 帮助显示正确但一旦我按 q 返回解释器 Segmentation fault core
如何使用 pygame.mixer 重复音乐？

我创建了以下使用 pygame mixer 播放 mp3 音乐的代码然而音乐不会重复有什么想法可以让音乐重复播放吗这是代码 playlist list playlist append put music here mp3 playl
如何将 fields 参数传递到 Google Drive Python API 调用中

I have results drive service files list body execute where body q query string maxResults 1 为了提高性能我想限制返回的字段如下所述 https
Scrapy 抓取并跟踪 href 中的链接

我对 scrapy 很陌生我需要从 url 的主页跟踪 href 到多个深度再次在 href 链接内我有多个 href 我需要遵循这些href 直到到达我想要抓取的页面我的页面的示例 html 是初始页 div class page
Flask 扩展未在 app.extensions 中注册

我想访问在我的 Flask 应用程序上注册的一些扩展我尝试使用app extensions 但我初始化的一些扩展不在字典中 from flask import current app current app extensions get

随机推荐

Spring Social - Facebook 登录出现 404 错误

我的应用程序中有 spring 3 1 和 spring security 登录我正在尝试使用 Spring Social 添加 facebook 登录它会转到 facebook 登录页面但登录后会抛出 404 错误我在网址中有这个
如何禁用 DataTables/TableTools 按钮

我正在使用 DataTable 1 10 和 TableTools 2 2 1 鉴于以下内容我想禁用启用编辑按钮 var myTable myTable DataTable tableTools aButtons sExtends te
“$container.imagesLoaded 不是函数”错误

所以我得到 container imagesLoaded is not a function error 这是位于标题中的代码 function root undefined function use strict var contain
使用WELL512获取一定范围内的随机实数

我正在使用中描述的 WELL512 伪随机数生成器函数这张纸 http www lomont org Math Papers 2008 Lomont PRNG 2008 pdf 该函数返回一个随机数unsigned long value 如
Rails 迁移：消除约束

我在 Rails 应用程序中有一个表在 schema rb 中如下所示 create table users force gt true do t t string name null gt false t string address
如何在ffmpeg中连接具有不同属性的视频？

我正在尝试合并一些视频但出现时间戳错误我试图使它们具有相同的尺寸帧速率采样率并且在没有音轨时添加音轨 ffmpeg i input1 mp4 y i audio1 mp3 c v copy c a aac shortest out
用户玩快游戏时如何确定谁是第一个玩家？

我正在使用以下代码onRoomConnected int statusCode Room room 用于决定谁是第一名玩家但有时我会为两名球员获得相同的第一第二如何解决此错误 if quickGame myTurn room getP
使用 jquery 设置所有 css3 背景图像

嗨我想设置background image对于所有带有 jquery 的浏览器 background image linear gradient green blue Norme W3C background image moz linea
如何在 Rails 中使用 gem 'acts-as-taggable-on' 时获取所有标签的列表（而不是计数）

我已经设置了acts as taggable on我的模型中的宝石是这样的 acts as taggable on deshanatags 它使用上下文deshanatags 现在我需要获取此上下文中所有标签的列表不仅仅是分配给一项的标签
如何在 Nuxt 中导入和使用自定义 Chart.js 插件？ (Chartjs-vuejs v2.9.4)

我正在尝试将自定义插件导入到我的图表中从我之前的问题中得到了这个插件 Question https stackoverflow com questions 69642298 how to add an extra tick on top
Unnest 和totals.timeOnSite（BigQuery 和Google Analytics 数据）

我想计算网站所有访问者的总 OnSite 时间并将其除以 3600 因为它在原始数据中以秒形式存储然后我想将其分解为 content group 和一个名为 content level 的自定义变量出现问题的原因是 content g
在 NSIS 脚本中安装驱动程序

我正在尝试创建一个安装 inf 文件的 NSIS 安装程序 inf 文件从安装程序中提取到正确的位置然后我使用 nsExec ExecToLog SYSDIR PnPutil exe a INSTDIR driver xser inf 然
GKE 中的 HPA 扩展时出错：apiserver 无法写入 JSON 响应：http2：流已关闭

遵循 google 为在 Google Kubernetes Engine 中部署 HPA 制定的指南 https cloud google com kubernetes engine docs tutorials autoscaling
python中用户输入的多维数组

我使用 Jupyter 笔记本我是 Python 新手我尝试从多维数组中的用户获取值我该怎么做我写了一些代码在输入第一个值后出现我不明白的错误 Error Traceback most recent call last
如何从列表中选取连续的数字[重复]

这个问题在这里已经有答案了我有一个列表实际上包含另一个列表的索引因此我想从这个列表中选出连续的数字 index list 3 4 8 9 35 36 37 我希望输出为 3 4 8 9 35 37 动机我还有另一个单词主表其中有
如何在 Google 电子表格中使用 ImportXML 返回多列数据？

我在用着ImportXML在 Google 电子表格中访问user timelineTwitter API 中的方法 http apiwiki twitter com Twitter REST API Method statuses use
如何在 Xcode 中将某些内容打印到控制台？

如何将某些内容打印到控制台Xcode 是否可以查看Xcode来自应用程序本身的控制台 Thanks 如何打印 NSLog Something To Print Or NSString someString Something To Prin
WebView 线程永远不会停止（WebViewCoreThread、CookieSyncManager、http[0-3]）

我使用 WebView 在我们的应用程序之一上显示一些互联网内容活动问题是当用户退出此活动时 WebView 的线程继续运行有问题的线程是 Thread lt 17 gt WebViewCoreThread Running Threa
如何使用 xquery 从文本中删除表情符号

我有一个 text 你好我想使用以下命令从文本中删除表情符号xquery 我怎样才能做到这一点预期结果 Hello 我尝试使用 replace text x00 xFFFF 但没有用提前致谢要替换表情符号您可以利用 XPath 的
通过应用传递闭包创建唯一数字的列表

我有一个元组列表每个元组由 2 个数字组成例如 array 1 2 1 3 2 4 5 8 8 10 可以说这些数字是一些数据库对象记录的 id 并且在元组内部有重复对象的 id 这意味着 1 和 2 是重复的 1 和 3 是重

通过应用传递闭包创建唯一数字的列表

是时候动手了

通过应用传递闭包创建唯一数字的列表 的相关文章

随机推荐

热门标签

通过应用传递闭包创建唯一数字的列表的相关文章