Python 集合上的迭代顺序

2024-04-27

我正在解析两个大文件（GB 大小顺序），每个文件包含keys以及对应的values. Some keys在两个文件之间共享，但对应的不同values。对于每个文件，我想写入一个新文件keys*以及对应的values, with keys*代表 file1 和 file2 中都存在的键。我不在乎key输出中的顺序，但两个文件中的顺序绝对应该相同。

File 1:

key1
value1-1
key2
value1-2
key3
value1-3

File2:

key1
value2-1
key5
value2-5
key2
value2-2

有效的输出将是：

解析文件1：

key1
value1-1
key2
value1-2

解析文件2：

key1
value2-1
key2
value2-2

另一个有效的输出：

解析文件1：

key2
value1-2
key1
value1-1

解析文件2：

key2
value2-2
key1
value2-1

An invalid输出（文件 1 和文件 2 中的键顺序不同）：

解析文件1：

key2
value1-2
key1
value1-1

解析文件2：

key1
value2-1
key2
value2-2

最后一个精度是值的大小远远大于键的大小。

我想做的是：

对于每个输入文件，解析并返回一个dict（我们称之为file_index），其中的键对应于文件中的键，值对应于在输入文件中找到该键的偏移量。

计算交集

good_keys = file1_index.viewkeys() & file2_index.viewkeys()

做类似（伪代码）的事情：

for each file:
    for good_key in good_keys:
        offset = file_index[good_key]
        go to offset in input_file
        get corresponding value
        write (key, value) to output file

迭代同一个集合是否能保证我具有完全相同的顺序（前提是它is相同的集合：我不会在两次迭代之间修改它），或者我应该先将集合转换为列表，然后迭代列表？

Python 的字典和集合是稳定的，也就是说，如果你迭代它们而不改变它们，它们保证给你相同的顺序。这是来自字典文档 https://docs.python.org/2/library/stdtypes.html#mapping-types-dict:

键和值以任意顺序迭代，该顺序不是随机的，在不同的 Python 实现中有所不同，并且取决于字典的插入和删除历史记录。如果对键、值和项目视图进行迭代而不对字典进行任何修改，则项目的顺序将直接对应。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 集合上的迭代顺序的相关文章

Pyenv 无法在 Cygwin 上安装 python: ModuleNotFoundError: No module named '_ctypes'

我正在尝试设置 Cygwin 环境以使用 pyenv 来管理 python 版本我没有管理员权限所以我使用以下命令运行设置 no admin flag 我使用 Cygwin 包管理器应用程序解决了一些依赖关系但我被困在了这一点上 Mo
带括号的上下文管理器

我试图了解新的新内容带括号的上下文管理器Python 3 10 中的功能新功能中的顶部项目here https docs python org 3 10 whatsnew 3 10 html 我的测试示例是尝试编写 with open f
静态文件配置不正确

我已经在 Heroku 上部署了简单的博客应用程序它运行在Django 1 8 4 我在静态文件方面遇到了一些问题当打开我的应用程序时我看到Application Error页面所以我尝试调试它并发现当我提交到 Heroku 时它无
Pip install 导致此错误“ cl.exe' failed with exit code 2 ”

我已经阅读了有关此错误的所有其他问题但令人沮丧的是没有一个给出有效的解决方案如果我跑pip install sentencepiece在命令行中它给出了以下输出 src sentencepiece sentencepiece wra
将打开关闭的 Google Chrome 浏览器添加到 Selenium linkedin_scraper 代码中

我正在尝试抓取一些知名人士的 LinkedIn 个人资料该代码获取一堆 LinkedIn 个人资料 URL 然后使用Selenium and scrape linkedin收集信息并将其作为 json 文件保存到文件夹中我遇到的问题是
创建圆形图像 PIL Tkinter

Currently I have a zoom feature in my application that works very well however I d like the actual zoom box to be a circ
在 Python 3 中动态导入模块的问题

我遇到的情况是在我的 Python 3 项目中在运行时必须包含某些模块我在用着importlib import module为了这第二次更新我确实找到了一种方法来做一些接近我想要的事情一些额外的代码可能会使我的一些链接稍微偏离一
Django 如何从 ManyToManyField 序列化并列出全部

我正在使用 Django 1 9 1 开发移动应用程序后端我实现了关注者模型现在我想列出用户的所有关注者但目前我不得不这样做我还使用 Django Rest 框架这是我的 UserProfile 模型 class UserProf
将 matplotlib png 转换为 base64 以在 html 模板中查看

背景你好我正在尝试制作一个简单的网络应用程序按照教程计算阻尼振动方程并将结果的 png 返回到 html 页面然后将其转换为 Base64 字符串 Problem 该应用程序运行正常只是在计算结果时返回损坏的图像图标可能是因为
可移植的非关系数据库

我想尝试尝试非关系数据库最好的解决方案是便携式这意味着它不需要安装理想情况下只需将目录复制粘贴到某个地方即可使其工作我不介意第一次使用时是否需要编辑一些配置文件或运行配置工具可从 python 访问适用于 Windows
Pandas Pivot_Table ：非数字值的行计算百分比

这是我在数据框 df 中的数据 Document Name Time SPS2315511 A 1 HOUR SPS2315512 B 1 2 HOUR SPS2315513 C 2 3 HOUR SPS2315514 C 1 HOUR S
属性错误：类型对象“图像”没有属性“打开”

Exception in Tkinter callback Traceback most recent call last File C Python34 lib tkinter init py line 1482 in call retu
如何使用 jira-python 设置 fixVersions 字段

我正在尝试使用 jira python 模块 http jira python readthedocs org en latest 更新现有的 JIRA 具体来说我正在尝试设置问题的fixesVersion 列表我已经尝试了一段时间但没
提交表格并上传带有请求的文件

我正在努力提交特定的表格蟒蛇请求 http www python requests org 我想使用它的网站上的其他表单工作正常我可以提交登录表单等这只是我遇到问题的文件上传显然提交表单效果很好因为我从网站收到一条消息说请返回
管理文件字段当前 url 不正确

在 Django 管理中只要有 FileField 编辑页面上就会有一个当前框其中包含指向当前文件的超链接但是此链接会附加到当前页面 url 因此会导致 404 因为不存在这样的页面例如 http 127 0 0 1 8000
如何在 Python 中仅列出 zip 存档中的文件夹？

如何仅列出 zip 存档中的文件夹这将列出存档中的每个文件夹和文件 import zipfile file zipfile ZipFile samples sample zip r for name in file namelist pr
使用 Flask-SQLAlchemy 进行多对多多数据库连接

我正在尝试使这个多对多联接与 Flask SQLAlchemy 和两个 MySQL 数据库一起工作并且它非常接近只是它为联接表使用了错误的数据库这是基础知识我有main db and vendor db 表格设置为main db u
网页抓取 - 如何识别网页上的主要内容

给定一个新闻文章网页来自任何主要新闻来源例如时报或彭博社我想识别该页面上的主要文章内容并丢弃其他杂项元素例如广告菜单侧边栏用户评论在大多数主要新闻网站上都可以使用的通用方法是什么有哪些好的数据挖掘工具或库最好是基于Py
Python - 如何将列表保存为图像？

我生成一个常规列表是否可以将此列表保存为 JPEG 图像或 PNG 或其他格式以便我可以打开图像并查看它我目前正在尝试使用 python 成像库 PIL 来解决这个问题这是可能的解决方案之一使用以下方法创建一个空图像对象 Imag
在Python中从列表中获取n个项目组的惯用方法？ [复制]

这个问题在这里已经有答案了给定一个列表 A 1 2 3 4 5 6 是否有任何惯用的 Pythonic 方式来迭代它就好像它是 B 1 2 3 4 5 6 除了索引之外这感觉像是 C 的遗留物 for a1 a2 in A i A i

随机推荐

如何以编程方式配置 Jersey 以使用 Jackson 进行 JSON（反）序列化？

我将 Jersey 与 Grizzly 一起使用来创建 JSON Web 服务我将其初始化如下 final ResourceConfig rc new PackagesResourceConfig amplify api resource
Phing，调用命令将其输出放入属性中

我有一个脚本可以查找并输出或将我当前的版本写入文本文件现在唯一的问题是如何将此版本号放入 PHING 属性中现在我的 PHING 目标构建 build zip 和built tar 我希望它构建 build 1 0 0 zip 或版本
Android：ViewFlipper动画

我添加了一个 ViewFlipper 其中有 2 个线性布局并且我制作了一个动画 xml left in xml
可以分配给一个 Heroku 应用程序的最大域名数量？

我正在与一位客户讨论一个项目该客户希望他的用户可以通过自己的域名访问该应用程序如果他们选择的话可以分配给一个 Heroku 应用程序的自定义域数量是否有限制 The Heroku 文档 https devcenter heroku c
使用故事板视图控制器创建编程选项卡栏？

我有一个以编程方式创建的选项卡栏并且在初始化与视图关联的故事板时遇到困难我能够在没有故事板的情况下在选项卡栏中成功加载视图请参阅下面的代码但视图仅部分显示因为某些 UI 组件位于故事板中我的故事板的名称是 Main Storyb
matplotlib 中的自定义对数轴缩放

我正在尝试使用 math log 1 x 来缩放绘图的 x 轴而不是通常的 log 缩放选项并且我已经查看了一些自定义缩放示例但我无法得到我的上班这是我的 MWE import matplotlib pyplot as plt im
升级到 NHibernate 3.1 时 NHibernate 映射中断

我最近刚刚升级到 FluentNHibernate 1 2 它使用 NHibernate 3 1 升级后我的一些旧映射无法正常工作我一直很难弄清楚为什么我想也许这里有人可以提供帮助我有 3 个课程练习练习和练习练习一个练习可以
Java用Rhino调用JS（未定义Uint8Array）

我正在尝试使用 Rhino 库从 java 代码调用一些 javascript 但它似乎对类型化数组感到窒息这是我的简单js文件 function decrypt version iv encryptedBuffer var output
如何将png二进制数据放入img标签中并将其显示为图像？

我正在用这个 ajax type GET url template bump1 purse png datatype image png success function data var reader new FileReader rea
使用 bitbake 为 BBB 构建 .dtbo 覆盖

我使用内核 linux ti staging 4 14 和自定义设备树为我的 BBB 构建了 yocto 发行版 rocko 由于我需要将一个旧项目从 Debian 移植到 Yocto 因此我还需要在内核中启用 UIO 功能这也可以正常工
Eclipse XSD 编辑器

如何启动或安装 Eclipse XSD 编辑器根据this http wiki eclipse org index php Introduction to the XSD Editor看来它应该开箱即用我创建了XMLExamples项目
Python Mysql 连接器未获取新内容

我制作了一个简单的 python 脚本它每 x 秒检查一次 mysql 表并将结果打印到控制台我使用 MySQL 连接器驱动程序但是运行脚本仅打印初始值我的意思是如果我在脚本运行时更改数据库中的值脚本不会注册它并且它会继续写
Google Cloud SQL：SQLSTATE [HY000] [2013]在“读取初始通信数据包”时丢失与 MySQL 服务器的连接，系统错误：0

自从我的 Google Cloud SQL 实例宕机后我感到绝望我昨天可以毫无问题地连接到它但从今天早上开始我无法以任何方式连接到它它会产生以下错误数据库服务器返回此错误 SQLSTATE HY000 2013 在读取初始通信数
Pygame 让对象追逐光标

过去几个小时一直在做这个试图制作一个小程序其中图像追逐光标到目前为止我已经设法使图像直接位于光标上方并沿着该方向移动然而我需要的是图像真正追逐光标因此它需要最初远离光标然后在它后面运行直到它位于鼠标之上基本上我遇到
Applescript：修剪空格和回车线

我编写了一个 AppleScript 它从用逗号分隔的文本文件中返回一个随机字符串 set some file to Macintosh HD Users Zade Library Application Support Notationa
如何禁用 yii2 ActiveFrom dropDownList 中的一项？

Yii2 活跃形式我想禁用选项2 gt 2 有办法做到吗您可以使用选项键为下拉列表中的所有项目添加属性假设您想禁用第二项在文档中 http www yiiframework com doc 2 0 yii helpers bas
“没有为 JavaScript 文件指定有效规则”是什么意思？

我有一个使用以下命令创建的 React Typescript create react app my app scripts version react scripts ts 它编译得很好但每次我看到此消息或警告时 No valid ru
如何通过单击 Android 中的 ImageView 从一个片段移动到另一个片段？

我有一个图像视图我想通过单击 Imageview 从一个片段移动到另一个片段就像我们可以使用从一个活动移动到另一个活动一样 Intent i new Intent MainActivity this SecondActivity cla
使用 CoreMotion 在后台获取加速度计数据

尽管这个问题的解决方案看似正确但我无法在后台接收加速度计数据iPhone 上的 Nike GPS 如何在后台接收加速度计更新 https stackoverflow com questions 8716466 how nike gps o
Python 集合上的迭代顺序

我正在解析两个大文件 GB 大小顺序每个文件包含keys以及对应的values Some keys在两个文件之间共享但对应的不同values 对于每个文件我想写入一个新文件keys 以及对应的values with keys 代表 f

Python 集合上的迭代顺序

Python 集合上的迭代顺序 的相关文章

随机推荐

热门标签

Python 集合上的迭代顺序的相关文章