计算两个表中等效行的交集

2024-05-05

我有两个 FITS 文件。让我们考虑一下例如第一个文件有 100 行和 2 列。第二个文件有 1000 行和 2 列。

    FITS FILE 1      FITS FILE 2

    A        B        C        D
    1        2        1        2
    1        3        1        2  
    2        4        1        2

我需要采取第一个文件的第一行，即 1 和 2，并检查第二个文件中有多少行有 1 和 2。在我们的例子中，第二个文件中有 3 行，其中包含 1 和 2。我需要对第二行（第一个文件）（即 1 和 3）执行相同的操作，并找出第二个文件中有多少行有 1 和 3，依此类推。

第一个文件没有重复项（所有行都有不同的对，没有一个是相同的，只有文件 2 有许多我需要找到的相同对）。

我最终需要第二个文件中与第一个 FITS 文件的行具有相似值的行数。

所以最终会是：

A    B    Number
1    2      3   # 1 and 2 occurs 3 times
1    3      5   # 1 and 3 occurs 5 times

等等。

我知道我需要以某种方式遍历列表并得到答案。我知道zip将为我提供第一个文件的行，但我没有找到迭代这些值的方法。

到目前为止我一直在尝试做的是以某种方式实现它zip:

for i,j in zip(A,B):
    for m,n in zip(C,D):

通过使用for i,j in zip(A,B): I get i,j成为我的第一个文件的第一行，依此类推。这样我就可以将它与第二个文件进行比较。

你已经快到了。您所需要的只是一个Counter计算第二个文件中每行出现的次数。

from collections import Counter
# Create frequency table of (C,D) column pairs
file2freq = Counter(zip(C,D))
# Look up frequency value for each row of file 1
for a,b in zip(A,B):
    # and print out the row and frequency data.
    print a,b,file2freq[a,b]

就是这样！只有四行非常简单的代码。

如果你没有collections.Counter，你可以使用defaultdict模拟它：

from collections import defaultdict
file2freq = defaultdict(int)
for c,d in zip(C,D):
    file2freq[c,d] += 1
for a,b in zip(A,B):
    print a,b,file2freq[a,b]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

计算两个表中等效行的交集的相关文章

是否有解决方法可以通过 CoinGecko API 安全检查？

我在工作中运行我的代码一切都很顺利但在不同的网络家庭 WiFi 上我不断收到403访问时出错CoinGecko V3 API https www coingecko com api documentations v3 可以观察到在
保存为 HDF5 的图像未着色

我目前正在开发一个将文本文件和 jpg 图像转换为 HDF5 格式的程序用HDFView 3 0打开似乎图像仅以灰度保存 hdf h5py File Sample h5 img Image open Image jpg data np
Python 中的舍入浮点问题

我遇到了 np round np around 的问题它没有正确舍入我无法包含代码因为当我手动设置值而不是使用我的数据时返回有效但这是输出 In 177 a Out 177 0 0099999998 In 178 np rou
Pandas/Google BigQuery：架构不匹配导致上传失败

我的谷歌表中的架构如下所示 price datetime DATETIME symbol STRING bid open FLOAT bid high FLOAT bid low FLOAT bid close FLOAT ask open
跟踪 pypi 依赖项 - 谁在使用我的包

无论如何是否可以通过 pip 或 PyPi 来识别哪些项目在 Pypi 上发布可能正在使用我的包也在 PyPi 上发布我想确定每个包的用户群以及可能尝试积极与他们互动预先感谢您的任何答案即使我想做的事情是不可能的这实际上是不
删除flask中的一对一关系

我目前正在使用 Flask 开发一个应用程序并且在删除一对一关系中的项目时遇到了一个大问题我的模型中有以下结构 class User db Model tablename user user id db Column db String
Pandas 日期时间格式

是否可以用零后缀表示 pd to datetime 似乎零被删除了 print pd to datetime 2000 07 26 14 21 00 00000 format Y m d H M S f 结果是 2000 07 26 14
使用Python请求登录Google帐户

在多个登录页面上需要谷歌登录才能继续我想用requestspython 中的库以便让我自己登录通常这很容易使用requests库但是我无法让它工作我不确定这是否是由于 Google 做出的一些限制也许我需要使用他们的 API 或
为什么 PyYAML 花费这么多时间来解析 YAML 文件？

我正在解析一个大约 6500 行的 YAML 文件格式如下 foo1 bar1 blah name john age 123 metadata whatever1 whatever whatever2 whatever stuff thi
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
加快网络抓取速度

我正在使用一个非常简单的网络抓取工具抓取 23770 个网页scrapy 我对 scrapy 甚至 python 都很陌生但设法编写了一个可以完成这项工作的蜘蛛然而它确实很慢爬行 23770 个页面大约需要 28 小时我看过scr
Jupyter Notebook 找不到 Python 模块

不知道发生了什么但每当我使用 ipython 氢原子或 jupyter 笔记本时都找不到任何已安装的模块我知道我安装了 pandas 但笔记本说找不到我应该补充一点当我正常运行脚本时 python script py 它确实导入
仅第一个加载的 Django 站点有效

我最近向 stackoverflow 提交了一个问题标题为使用mod wsgi在apache上多次请求后Django无限加载 https stackoverflow com questions 71705909 django infini
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
如何在 Windows 命令行中使用参数运行 Python 脚本

这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
将 Python 中的日期与日期时间进行比较

所以我有一个日期列表 datetime date 2013 7 9 datetime date 2013 7 12 datetime date 2013 7 15 datetime date 2013 7 18 datetime date
Pandas 每周计算重复值

我有一个Dataframe包含按周分组的日期和 ID df date id 2022 02 07 1 3 5 4 2022 02 14 2 1 3 2022 02 21 9 10 1 2022 05 16 我想计算每周有多少 id 与上周重
更改 Tk 标签小部件中单个单词的颜色

我想更改 Tkinter 标签小部件中单个单词的字体颜色我知道可以使用文本小部件来实现与我想要完成的类似的事情例如使单词 YELLOW 显示为黄色 self text tag config tag yel fg clr yellow s

随机推荐

在 Rails 5 控制器集成测试中设置 cookie.signed

想象一下这样的场景有一个控制器集成测试调用一个控制器方法其中cookie signed用于一些完整性检查控制器 app controllers foo controller rb def index entity FooEntity
如果我不保留 IBOutlet 会怎样？

如果我这样做 interface RegisterController UIViewController
Chrome 的萤火虫

谁能推荐一个类似于 Firebug 的不错的 Google Chrome 扩展程序我确实看到这里有几个类似的问题但答案似乎非常过时 Thanks It s built in Press Ctrl Shift I Or Tools gt
EntityFramework：“参数值超出范围。”

我在 EntityFramework 模型优先中保存小数时遇到问题在我的 EDMX 中我声明我的属性为 Decimal 30 10 然后我尝试保存该数字 1215867935736100000 结果是 Parameter value
视频流上的 TCP 与 UDP

我刚从网络编程考试回来他们问我们的问题之一是如果您要传输视频您会使用 TCP 还是 UDP 请解释一下存储视频和实时视频流对于这个问题他们只是希望得到一个简短的答案 TCP 用于存储视频 UDP 用于实时视频但我在回家的路上想到
“上下文模式”的这种实现看起来不错吗？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我有多个处理单元可能存在于一个数组中每个处理单元都有自己的参数我想使用以下方式传达每个处理单元的参数上下文模式在它被建议作为另一个问题的解答 ht
Apache2 mod_wsgi 403 禁止错误

我已经正确配置了它但后来我决定重新安装我的 Debian 顺便从 wheezy 切换到 jessie 版本问题是这样的我有一个 python mod wsgi 应用程序 mnt doc Python www index py ls l
将十六进制字节数组解码为特定代码页在随后编码时会产生错误结果

我创建了一个简单的应用程序如下所示 String stringValue new String new byte 0x00 0x00 0x00 0x25 273 byte valueEncoded Arrays copyOfRange s
如何使用环回设置 OAuth 2.0 服务器

我想使用名为 Loopback component oauth2 的包使用 Loopback 设置 OAuth 2 0 服务器文档在这里 https docs strongloop com display public LB OAuth
使用工作表作为数据源的 VSTO Excel 的简单示例

我想我遇到了最简单的答案是最难找到的答案的情况而且我还没有遇到过任何搜索能够以直接的方式给我这个答案这是为了Excel 2010 and VS 2010在现有 VSTO C 项目中我有一个 Excel 工作表其中包含 4 列数据
Azure 应用服务 VS WebJob

我对单独使用应用程序服务和将应用程序服务与网络作业结合使用之间的差异感到困惑我有一个计算密集型任务 2 20 分钟必须手动触发用户不时要求它现在一切都发生在一个应用程序服务中我正在考虑将这个繁重的过程提取到另一个应用程序服务中的网
返回 ObjectResult 会导致 406 Not Acceptable

在学习 Scott Allen 的 Pluralsight 课程 Asp net Core 1 0 基础知识时在 MVC 框架中的控制器模块和操作结果部分中我在 Index 操作方法上遇到了 406 Not Acceptable
PHP 一次只能看到 20 个上传文件

当我尝试一次上传超过 20 个文件时网络服务器只能看到前 20 个文件任何其他文件都会被忽略问题是什么简单的代码可以尝试
将类添加到 link_to 会破坏链接

我在 RoR 3 中使用 link to 当我像这样使用它时它工作得很好但我也想通过一门课但是这对我不起作用该类有效但它破坏了链接有任何想法吗
Haskell：Where 与 Let

我是 Haskell 的新手我很困惑Where vs Let 它们似乎都提供了相似的目的我读过一些比较Where vs Let但我很难辨别何时使用它们有人可以提供一些背景信息或者一些示例来说明何时使用其中一种而不是另一种吗哪里与让
在 Android 谷歌地图中绘制 4K 折线

我现在正在开发一个适用于 Android 设备的应用程序主要功能是在地图上绘制折线以显示城市中每条街道的交通情况不幸的是当我绘制大约 3K 折线时数量会根据屏幕尺寸和缩放级别而减少我的地图变得非常慢我没有提及绘制所有线条的时间
如何从 UNC 中提取服务器名称

谁能告诉我如何从 UNC 中提取服务器名称 ex 服务器名称目录目录编辑我很抱歉但看起来我需要澄清一个错误路径实际上更像是服务器名 d 目录我知道这可能会改变一些事情怎么样Uri Uri uri new Uri serve
通知另一个线程数据可用的最快方法是什么？有什么替代旋转的方法吗？

我的一个线程将数据写入循环缓冲区另一个线程需要尽快处理该数据我本来想写这么简单的spin 伪代码 while true while a i do nothing just keep checking over and over proc
如何测试 PARTIAL 视图在 C# ASP .NET MVC 中呈现

我有一个视图它内部有部分视图渲染 div class partialViewDiv Html RenderPartial partial Model SomeModelProperty div 和一个返回此视图的控制器 public Ac
计算两个表中等效行的交集

我有两个 FITS 文件让我们考虑一下例如第一个文件有 100 行和 2 列第二个文件有 1000 行和 2 列 FITS FILE 1 FITS FILE 2 A B C D 1 2 1 2 1 3 1 2 2 4 1 2 我需要采取

计算两个表中等效行的交集

计算两个表中等效行的交集 的相关文章

随机推荐

热门标签

计算两个表中等效行的交集的相关文章