根据公共 ID 对元组列表中的项目进行分组

2023-12-23

我有一个大型同义词数据集（10000+）作为元组列表，如下所示：

data = [
    (435347,'cat'),
    (435347,'feline'),
    (435347,'lion'),
    (6765756,'dog'),
    (6765756,'hound'),
    (6765756,'puppy'),
    (435347,'kitten'),
    (987977,'frog')
]

其中每个同义词由任意共享 ID 标识，在本例中435347, 6765756, and 987977.

我想编写一个使数据看起来像这样的函数：

processed_data = [
    (435347,'cat','feline','lion','kitten'),
    (6765756,'dog','hound','puppy'),
    (987977,'frog')
]

任何建议将不胜感激！

尝试这个：

groups = {}

for x, y in data:
    group = groups.get(x, [])
    group.append(y)
    groups[x] = group

print(groups)

Output:

{987977: ['frog'], 435347: ['cat', 'feline', 'lion', 'kitten'], 6765756: ['dog', 'hound', 'puppy']}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

根据公共 ID 对元组列表中的项目进行分组的相关文章

并行 dask for 循环比常规循环慢？

如果我尝试使用 dask 并行化 for 循环它最终会比常规版本执行得慢基本上我只是按照 dask 教程中的介绍性示例进行操作但由于某种原因它在我这边失败了我究竟做错了什么 In 1 import numpy as np from
获取 .wav 文件长度或持续时间

我正在寻找一种方法来找出 python 中音频文件 wav 的持续时间到目前为止我已经了解了 pythonwave图书馆 mutagen pymedia pymad我无法获取 wav 文件的持续时间 Pymad给了我持续时间但它不一致
将非常大的Python列表输出保存到mysql表中

我想将 python 生成的列表的输出保存在 mysql 数据库的表中该表如下所示 mysql 中的 myapc8 表 https i stack imgur com 4B4Hz png这是Python代码在此输入图像描述 https
多处理中的动态池大小？

有没有办法动态调整multiprocessing Pool尺寸我正在编写一个简单的服务器进程它会产生工作人员来处理新任务使用multiprocessing Process对于这种情况可能更适合因为工作人员的数量不应该是固定的但我需
Series.sort() 和 Series.order() 有什么区别？

s pd Series nr randint 0 10 5 index nr randint 0 10 5 s Output 1 3 7 6 2 0 9 7 1 6 order 按值排序并返回一个新系列 s order Output 2 0
类型错误：需要二进制或 unicode 字符串，得到 618.0

I ve been trying to implement this ML Linear Model into my dataset https www tensorflow org tutorials estimator linear L
Arcpy 模数在 Pycharm 中不显示

如何将 Arcpy 集成到 Pycharm 中我尝试通过导入模块但它没有显示我确实知道该模块仅适用于 2 x python arcpy 在 PyPi Python 包索引上不可用因此无法通过 pip 安装要使用 arcpy 您需要
AttributeError：“模块”对象没有属性[重复]

这个问题在这里已经有答案了我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
Python Anaconda：如何测试更新的库是否与我现有的代码兼容？

我在 Windows 7 机器上使用 Python 2 7 Anaconda 安装进行数据分析和科学计算当新的库发布时例如新版本的 pandas patsy 等您建议我如何测试新版本与现有代码的兼容性是否可以在同一台机器上安装两个
Python将文本文件解析为嵌套字典

考虑以下数据结构 HEADER1 key value key value HEADER2 key value key value HEADER3 key value HEADER4 key value key value 原始数据中没有缩进
根据其他单元格值更改多个单元格值

我想更改包含的单元格moving to movingToOpenor movingToClose基于下一个单元格中给出的状态有时循环会被中断并且不会从open to close or close to open 这是我当前的数据框 Dat
查找 Pandas DF 行中的最短日期并创建新列

我有一个包含多个日期的表有些日期将为 NaN 我需要找到最旧的日期所以一行可能有 DATE MODIFIED WITHDRAWN DATE SOLD DATE STATUS DATE 等因此对于每一行一个或多个字段中都会有一个日期
给定一个排序数组，就地删除重复项，使每个元素仅出现一次并返回新长度

完整的问题我开始在线学习 python 但对这个标记为简单的问题有疑问给定一个排序数组就地删除重复项使得每个元素只出现一次并返回新的长度不分配另一个数组的额外空间您必须通过修改输入来完成此操作数组就地具有 O 1 额外内
在骨架图像中查找线 OpenCV python

我有以下图片我想找到一些线来进行一些计算平均长度等我尝试使用HoughLinesP 但它找不到线我能怎么做这是我的代码 sk skeleton mask rows cols sk shape imgOut np zeros row
在Raspberry pi上升级skimage版本

我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
minizinc python 安装

我通过 anaconda 提示符在 python 上安装了 minizinc 就像其他软件包一样 pip install minizinc 该软件包表示已成功安装我可以导入该模块但是我正在遵循基本示例https minizinc py
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome

随机推荐

Container BoxShadow 不适用于 InkWell 材质

我想为这个容器使用 Inkwell Splash 没有 Inkwell 小部件 Expanded child Container padding EdgeInsets all 12 0 decoration BoxDecoration bo
ajax 调用的 JSON 输入意外结束

我一直在我的项目中研究删除帖子功能这一切在 PHP 中运行良好但现在我想在 Ajax 中执行此操作以防止刷新等无论如何当我执行 ajax 调用时我收到错误 SyntaxError Unexpected end of JSON i
如何使用 .NET 打开文件以进行非独占写入访问

是否可以使用非独占写访问权限在 NET 中打开文件如果是这样怎么办我的希望是让两个或更多进程同时写入同一个文件 Edit 这是这个问题的上下文我正在为 IIS 编写一个简单的日志记录 HTTPModule 由于在不同应用程序池中运行
是否可以使用engine="bash"在knitr块之间共享变量？

像这样的东西但它不起作用 r examples engine bash export EXAMPLES example path r example1 engine bash echo EXAMPLES 然而这有效 r examples
来自 Hibernate 的同步类加载器调用

我们的项目中存在一个性能问题该问题似乎源于至少部分来自 Hibernate 使用类加载器的方式这是在我们内部环境的高负载测试期间进行的 Java 线程转储中发现的转储的 JVM 是运行应用程序的 Weblogic 托管服务器的 J
在 knockout.js 中的 ko.applyBindings 之后向模型添加可观察属性

例如 function Model var model new Model ko applyBinding model model name ko observable john 我知道该代码无法工作但是可以使其工作吗我能够通过使用 c
XMLRPC Zend_Http_Client_Adapter_Exception' 并显示消息 '10 秒后读取超时

我到处搜索但没有人发布解决方案他们都说在配置中设置超时但你如何做到这一点如何从 XMLRPC 客户端或服务器重置覆盖此设置这是我正在尝试的 server new Zend XmlRpc Client http 127 0 0 1
如何检查Android“移动数据”是否开启

我希望我的应用程序检查数据网络模式或移动数据是否已启用即使它当前未处于活动状态换句话说我需要检查应用程序是否可能产生移动数据费用即使手机当前通过 WiFi 连接通过谷歌搜索我找到了以下代码该代码检查移动数据是否为
如何在 netbeans 中添加图像文件？

我是 netbeans 新手我只想将本地计算机中的 png 和 gif 文件添加到我的项目中但我找不到执行此操作的选项我在 MacOSX 上运行 Netbeans 7 0 当我右键单击一个目录并选择新建 gt 其他时我在向导中找
如何使用 Google Drive API v3 搜索**not**sharedWithMe？

根据API文档 https developers google com drive v3 web search parameters您可以使用与 trashed 相同的方式搜索 sharedWithMe trashed boolean Wh
Silverlight 5 和 Ria 服务故障排除 [Web-Services-AuthenticationService.svc 不存在]

我有两个不同版本的使用 Ria 服务的 Silverlight 5 项目两者都在本地工作旧版本 A 在部署到 ISS7 时可以工作新版本 B 没有版本 B 的用户密码身份验证失败并出现错误 Load operation fail
具有可变引用的递归结构的生命周期

我试图定义一个类似于树遍历的链表的递归结构节点拥有一些数据并可以访问其父节点子节点应该可变地借用其父节点以确保独占访问并在其被删除后释放它我可以使用不可变引用定义此结构但当我使父引用可变时则不行当使父引用可变时我对编译器错误感
coinbase oauth2 有时无法更新访问令牌（使用刷新令牌）

我正在将 coinbase 集成到 iOS 应用程序中并使用 Oauth2 进行身份验证经过通常的工作流程后我能够获得访问令牌每当任何请求遇到 401 过期时时我都会通过调用以下命令来尝试刷新我的访问令牌 POST https
如何以及在何处在主干视图中初始化 jquery 数据表

我的 html 模板如下所示
如何等待@Scheduled 直到上一个任务未完成？

我想让我的调度程序直到我的任务完成如果有时间执行第二个调度程序它必须等到上一个任务未完成我在 java Boot 应用程序中使用 Schedule 我想每 5 分钟将数据插入数据库但我想保留我的计划直到插入数据不完整但仍有时间进
PHP ZMQ 扩展：无法加载动态库

我正在 Windows 10 上开发 Wampserver 我正在使用名为 ZMQ 的扩展我从以下位置下载了 DLLS https pecl php net package zmq 1 1 3 windows https pecl php
node.js - 如何获取操作系统平台用户数据文件夹

我正在寻找一种使用 Node js 获取 userdata 文件夹的方法该方法适用于 Windows 和 macOS Node js 实例将在用户的计算机上运行我需要返回以下内容的东西 C Documents and Settings
程序权限

我正在 vb net 中创建一个应用程序该应用程序访问其他学生无权访问的驱动器上的数据库如果程序在这些学生帐户之一下运行则该程序将无法正确运行我怎样才能让程序在任何帐户下访问数据库他们需要访问该驱动器或者他们有权访问的驱动器上的
Python：从文本文件读取的打印行之间的空间太大[重复]

这个问题在这里已经有答案了我有这个小问题如果我根据 txt 文件的内容创建一个列表并逐行打印它这些输出之间会存在巨大的空格 Like Name Name Street 这就是我想要的样式 Name Name Street 这是代码 i
根据公共 ID 对元组列表中的项目进行分组

我有一个大型同义词数据集 10000 作为元组列表如下所示 data 435347 cat 435347 feline 435347 lion 6765756 dog 6765756 hound 6765756 puppy 435347

根据公共 ID 对元组列表中的项目进行分组

根据公共 ID 对元组列表中的项目进行分组 的相关文章

随机推荐

热门标签

根据公共 ID 对元组列表中的项目进行分组的相关文章