Python 中的成对集交集

2023-12-26

如果我有可变数量的集合（让我们称这个数字为n），最多有m每个元素，计算所有集合对的成对交集的最有效方法是什么？请注意，这与所有的交集不同n sets.

例如，如果我有以下集合：

A={"a","b","c"}
B={"c","d","e"}
C={"a","c","e"}

我希望能够找到：

intersect_AB={"c"}
intersect_BC={"c", "e"}
intersect_AC={"a", "c"}

另一种可接受的格式（如果它使事情变得更容易）是给定集合中的项目到包含相同项目的集合的映射。例如：

intersections_C={"a": {"A", "C"},
                 "c": {"A", "B", "C"}
                 "e": {"B", "C"}}

我知道这样做的一种方法是创建一个字典，映射所有值的并集中的每个值n设置为它出现的集合的列表，然后迭代所有这些值以创建列表，例如intersections_C上面，但我不确定它是如何缩放的n增加并且集合的大小变得太大。

一些额外的背景信息：

每个集合的长度大致相同，但也非常大（足够大，以至于将它们全部存储在内存中是一个现实的问题，并且避免这种情况的算法将是首选，但不是必需的）
与集合本身的大小相比，任何两个集合之间的交集的大小非常小
如果有帮助的话，我们可以假设有关输入集排序所需的任何内容。

这应该做你想做的

import random as RND
import string
import itertools as IT

模拟一些数据

fnx = lambda: set(RND.sample(string.ascii_uppercase, 7))
S = [fnx() for c in range(5)]

生成 S 中集合的索引列表，以便下面可以更简洁地引用这些集合

idx = range(len(S))

获取 S 中所有可能的唯一项目对；然而，由于集合交集是可交换的，我们想要组合而不是排列

pairs = IT.combinations(idx, 2)

编写一个函数执行集合交集

nt = lambda a, b: S[a].intersection(S[b])

将此函数折叠在对上并将每个函数调用的结果键入其参数

res = dict([ (t, nt(*t)) for t in pairs ])

下面的结果按照OP中引用的第一个选项进行格式化，是一个字典，其中values是两个序列的交集；每个值keyed到由这些序列的两个索引组成的元组

这个解决方案，真的只是two代码行：（i）计算排列； (ii) 然后对每个排列应用一些函数，将返回值存储在结构化容器（键值）容器中

该解决方案的内存占用量很小，但您可以通过在最后一步中返回生成器表达式来做得更好，即

res = ( (t, nt(*t)) for t in pairs )

请注意，使用这种方法，对的序列和相应的交集都没有被写在内存中——即，pairs and res是迭代器。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

set

setintersection

Python 中的成对集交集的相关文章

从文件中读取行，处理它，然后将其删除

我有一个 22mb 的文本文件其中包含数字列表每行 1 个数字我试图让 python 读取数字处理数字并将结果写入另一个文件中所有这些都有效但如果我必须停止该程序它就会从头开始我一开始尝试使用mysql数据库但它太慢了我
添加图例到散点图

这个问题已经被问到了但我想找到一个更清晰的解决方案给定 X 是 100x2 数据标签是标签向量从 1 到 9 我绘制散点图如下 pl scatter X 0 X 1 c labels pl show 如何仅用一行代码添加图例来解释颜
异常处理的范围规则是什么？ [复制]

这个问题在这里已经有答案了我偶然发现了一个有趣的场景这个问题 https stackoverflow com q 69464430 6045800 考虑以下简单示例 try 1 0 error error except Exception
Python daysBetweenDate

我想我可能有一个无限循环因为每当我运行代码时我都会收到一条错误消息它说程序因使用 13 CPU 秒而关闭整个代码应该以日期作为输入并输出第二天此代码假设所有月份都是 30 天除了daysBetweenDates功能正常其他
在 Linux 上创建线程与进程的开销

我试图回答在 python 中创建线程与进程有多少开销的问题我修改了类似问题的代码该问题基本上运行一个带有两个线程的函数然后运行带有两个进程的相同函数并报告时间 import time sys NUM RANGE 100000000
Pandas 将 NULL 读取为 NaN 浮点数而不是 str [重复]

这个问题在这里已经有答案了给定文件 cat test csv a b c NULL d e f g h i j k l m n 其中第三列被视为str 当我对列执行字符串函数时 pandas已阅读NULLstr 作为一个NaN float
如何将字符串列表转换为正确的 Python 类型？

给定一个 python 字符串列表如何自动将它们转换为正确的类型意思是如果我有 hello 3 3 64 1 我希望将其转换为列表 hello 3 3 64 1 其中第一个元素是字符串第二个元素是 int 第三个元素是 float
使用 pybind11 修改 std::array 的默认值

我的目标是修改在中声明的数组C struct并赋予默认值我读过了this https pybind11 readthedocs io en stable advanced cast stl html making opaque types
QFileDialog 作为 TableView 的编辑器：如何获取结果？

我正在使用一个QFileDialog作为某些专栏的编辑QTableView 这基本上有效对一些焦点问题取模请参阅here https stackoverflow com questions 22854242 qfiledialog as
Python OO程序结构规划

我是 OOP 的初学者我想创建一个包含三个类 A B 和 C 的程序该类的每个实例都由一组特征 Achar1 Achar2 等定义该程序应该创建uses由 A 元素 B 元素和 C 元素以及开始日期和结束日期组成 A 和 B 都有子类
如何使用Python从Excel复制图表并将其作为图表粘贴到powerpoint（而不是图像）中

我有一个excel文件它根据可用数据生成图表图表名称是thisChart 我想复制thisChart从 excel 文件到 ppt 文件现在我知道有两种方法可以做到这一点即VBA和python 使用win32com client V
如何在Python中将字符串转换为包含一个元素的列表[重复]

这个问题在这里已经有答案了我有一个字符串我想将其转换为其中只有一个元素的列表 a abc print list a output a b c Expected o p abc 正确的做法是什么只需使用 a abc b a print
在 pandas 中展开列表列时，是否有一种Python式的方法来添加枚举列？

考虑以下DataFrame gt gt gt df pd DataFrame A 1 2 3 B abc def ghi apply A int B list gt gt gt df A B 0 1 a b c 1 2 d e f 2 3
将误差线添加到 3D 绘图

我找不到在 matplotlib 的 3D 散点图中绘制误差条的方法基本上对于以下代码段 from mpl toolkits mplot3d import axes3d import matplotlib pyplot as plt f
使用 South 更改 Django 模型列默认值

我在 Django 项目中使用 South 和 Postgresql DB 我想更改一个模型字段的默认值以供继续使用我不需要以前的记录刚刚新记录我是否需要为此进行迁移或者只是更改模型旧场详细信息 background style
哪些 2to3 修复程序输出有效的 Python 2 代码？

2to3 是一个 Python 程序它读取 Python 2 x 源代码并应用一系列修复程序将其转换为有效的 Python 3 x 代码考虑一下列出的四十个修复者https docs python org 3 library 2to3
在硬件级别模拟按键 - Windows

我正在寻找一种语言或库使我能够在最大可能的水平上模拟击键而无需实际按下按键我对击键级别的具体衡量标准是当我的计算机已经运行按键侦听器例如鼠标键和粘滞键时它是否会产生与物理按键相同的输出我尝试过很多击键模拟的方法 java A
在 django 视图中执行阻塞请求

在我的 django 应用程序的一个视图中我需要执行相对较长的网络 IO 操作问题是其他请求必须等待该请求完成即使它们与该请求无关我做了一些研究并偶然发现了 Celery 但据我了解它用于执行独立于请求的后台任务所以我不能使用任
如何使用 google.oauth2 python 库？

我试图对谷歌机器学习项目的安全预测端点进行简单的休息调用但它找不到 google oauth2 模块这是我的代码 import urllib2 from google oauth2 import service account Cons
Pandas - 过滤器和正则表达式搜索 DataFrame 的索引

我有一个 DataFrame 其中列是 MultiIndex 索引是名称列表即index Andrew Bob Calvin 我想创建一个函数来返回数据帧中使用名称 Bob 或以字母 A 开头或以小写字母开头的所有行如何才能做到这一点

随机推荐

使用动态而不是反射来按名称调用方法

使用 NET 4 0 我将如何使用 Dynamic 来完成以下任务而不使用反射 public void InvokeMethod string methodName Type t typeof GCS WebService GCS WebS
如何从为结果启动的活动返回字符串

我已经启动了结果活动但如何从该活动返回类似参数的字符串只需使用以下代码块 Intent intent new Intent intent putExtra RESULT STRING string setResult RESULT OK
通过点击图像（jquery 或 javascript）动态生成地图区域坐标

我想知道是否有一种方法可以通过单击图像的某些部分来动态生成地图区域坐标这是为了生成完整的图像图举个例子我有这张图片单击此处查看图像 http mauricio lairet es otr plano jpg 通过单击它我想为每个定
切片类型的切片

我目前正在努力通过优秀的围棋之旅 https tour golang org 我使用以下解决方案完成了其中一项练习 45 func Pic dx dy int uint8 pic make uint8 dy type declaration
使用带有大 int 的 cython 时出现 OverflowError

python 3 4 Windows 10 cython 0 21 1 我正在用 cython 将此函数编译为 c def weakchecksum data Generates a weak checksum from an iterab
将字体大小转换为英寸

我需要在之间进行转换Drawing Font Size 浮动和 WPFFontSize 双精度 WPF 像素最后我决定将字体大小以英寸为单位存储在数据库中如何将 GDI FontSize 转换为英寸将 WPF FontSize
展平相同类型的嵌套列表

假设我想展平相同类型的嵌套列表例如 ListA Element A Element B ListA Element C Element D ListB Element E Element F ListA包含相同类型的嵌套列表 ListA
在 YAML 中构建字典项数组？

基本上尝试在 yaml 中执行一些可以使用此 json 完成的操作 models model a type x bunch of properties model b type y bunch of properties 到目前为止这就是
XD 代理 Facebook

我正在使用 facebook connect 登录我的网站在我的 html 页面中我编写代码 div div
Jenkins 和 Artifactory 的 Nuget 登录错误

遇到问题Nuget Jenkins and 人工工厂似乎无法获取Jenkins管道来识别Nuget配置什么在起作用使用我正在尝试阅读的帐户登录神器查看我尝试访问的存储库和工件使用 nuget 命令行访问存储库并在出现提示时输入用户
返回新的 LINQ 对象

我想编写 LINQ 它返回新对象 string int 包含字符串位置名称 int 位置计数 Output PositionA 8 PostionB 12 PostionC 13 这是我到目前为止所拥有的 public List
Android Studio 2022.2.1：网络检查器数据不可用

我正在使用最新最好的 Android Studio 版本 Android Studio Flamingo 2022 2 1 Build AI 222 4459 24 2221 9862592 built on March 31 2023 R
按索引合并两个数据帧

我有以下数据框 gt df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0 0 1 1 421 18 false 0 0 1 gt df2 conce
如何在 webView 中启用 javascript

在android中如果我在webView中使用javascript 它会强制关闭是否有可能在 webView 中使用 java 脚本请帮忙 01 10 10 08 51 513 W dalvikvm 5994 JNI WARNING
连续 WebJobs 和 CancellationToken

我不明白取消令牌和网络作业背后的机制我知道我可以使用Microsoft Azure WebJobs WebJobsShutdownWatcher Token获取令牌并做出反应token IsCancellationRequested例如
获取C# WinForms App的应用程序图标

我已使用项目属性选项卡为 C WinForms 应用程序分配了一个图标该图标在构建时与程序清单一起提供有没有办法获得System Drawing Icon在运行时获取此图标的对象而无需再次将其嵌入资源中我已经做了我的研究有一种
Laravel Echo Server、Redis、Socket.IO：似乎无法使它们工作

我正在使用 Laravel 开发实时应用程序由于我不想使用 Pusher 所以我尝试使用 websockets 来工作Laravel 回声服务器 https github com tlaverdure laravel echo serve
firebase规则：如何根据用户角色限制访问

我是 Firebase 新手正在尝试了解安全规则为此我正在实现项目团队成员任务的典型功能每个项目都会有一个团队负责人多个成员和多个任务这是我试图实现的结构和规则也称为要求 Members each member has d
Rcpp 函数比 Rf_eval 慢

我一直在开发一个包它使用 Rcpp 在一组大型医学成像文件上应用任意 R 代码我注意到我的 Rcpp 实现比原始的纯 C 版本慢得多我追踪了通过 Function 调用函数与原始 Rf eval 的区别我的问题是为什么性能会下降近
Python 中的成对集交集

如果我有可变数量的集合让我们称这个数字为n 最多有m每个元素计算所有集合对的成对交集的最有效方法是什么请注意这与所有的交集不同n sets 例如如果我有以下集合 A a b c B c d e C a c e 我希望能够找到 in

Python 中的成对集交集

Python 中的成对集交集 的相关文章

随机推荐

热门标签

Python 中的成对集交集的相关文章