将 df1 列 1 与 df2 中的所有列进行比较，返回 df2 的索引

2024-01-21

我是熊猫新手，所以很可能忽略了一些东西，但我一直在搜索，但还没有发现任何有用的东西。

我想做的就是这个。我有 2 个数据框。df1只有 1 列和未知的行数。df2每个索引的行数和列数也未知。

Example:
df1:
0     1117454
1     1147637
2     1148945
3     1149662
4     1151543
5     1151545
6     1236268
7     1236671
8     1236673
...
300   1366962

df2:
                1        2        3        4        5        6        7  
8302813476  1375294  1375297  1375313  1375318  1375325  1375330  1375331   
8302813477  1317422  1363270  1363288  1363262     None     None     None   
8302813478  1187269  1187276  1149662  1147843  1147639  1236650  1236656

所以我想要的是检查所有df1价值观反对df2第 1 - n 列，如果与中的任何值匹配df1标记索引df2为 True，否则为 False。

我想你可以使用isin http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.isin.html用于测试匹配Series创建自df2 by stack http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.stack.html with Series从一列创建df1 by squeeze http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.squeeze.html。最后一次重塑unstack http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.unstack.html:

df3 = df2.stack().isin(df1.squeeze()).unstack()
print (df3)
                1      2      3      4      5      6      7
8302813476  False  False  False  False  False  False  False
8302813477  False  False  False  False  False  False  False
8302813478  False  False   True  False  False  False  False

然后找到所有至少有一个的值True by any http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.any.html:

a = df3.any(axis=1)
print (a)
8302813476    False
8302813477    False
8302813478     True
dtype: bool

最后boolean indexing http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-indexing:

print (a[a].index)
Int64Index([8302813478], dtype='int64')

另一种解决方案是squeeze use df1['col'].unique()，谢谢特德·彼得鲁 https://stackoverflow.com/questions/41178415/compare-df1-column-1-to-all-columns-in-df2-returning-the-index-of-df2/41179004#comment69558023_41179004:

df3 = df2.stack().isin(df1['col'].unique()).unstack()
print (df3)
                1      2      3      4      5      6      7
8302813476  False  False  False  False  False  False  False
8302813477  False  False  False  False  False  False  False
8302813478  False  False   True  False  False  False  False

---

I like squeeze更多，但相同的输出很简单，选择列df1:

df3 = df2.stack().isin(df1['col']).unstack()
print (df3)
                1      2      3      4      5      6      7
8302813476  False  False  False  False  False  False  False
8302813477  False  False  False  False  False  False  False
8302813478  False  False   True  False  False  False  False

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将 df1 列 1 与 df2 中的所有列进行比较，返回 df2 的索引的相关文章

如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
Django 模型在模板中不可迭代

我试图迭代模型以获取列表中的第一个图像但它给了我错误即模型不可迭代以下是我的模型和模板的代码我只需要获取与单个产品相关的列表中的第一个图像模型 py class Product models Model title models
if 语句未命中中的 continue 断点

在下面的代码中两者a and b是生成器函数的输出并且可以评估为None或者有一个值 def testBehaviour self a None b 5 while True if not a or not b continue pri
Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
对图像块进行多重处理

我有一个函数必须循环遍历图像的各个像素并计算一些几何形状此函数需要很长时间才能运行在 24 兆像素图像上大约需要 5 小时但似乎应该很容易在多个内核上并行运行然而我一生都找不到一个有据可查解释充分的例子来使用 Multiproc
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
在 pytube3 中获取 youtube 视频的标题？

我正在尝试构建一个应用程序来使用 python 下载 YouTube 视频pytube3 但我无法检索视频的标题这是我的代码 from pytube import YouTube yt YouTube link print yt titl
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
如何在 OSX 上安装 numpy 和 scipy？

我是 Mac 新手请耐心等待我现在使用的是雪豹 10 6 4 我想安装numpy和scipy 所以我从他们的官方网站下载了python2 6 numpy和scipy dmg文件但是我在导入 numpy 时遇到问题 Library F
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
从 Twitter API 2.0 获取 user.fields 时出现问题

我想从 Twitter API 2 0 端点加载推文并尝试获取标准字段作者文本和一些扩展字段尤其是用户字段端点和参数的定义工作没有错误在生成的 json 中我只找到标准字段但没有找到所需的 user fields 用户
迭代 pandas 数据框的最快方法？

如何运行数据框并仅返回满足特定条件的行必须在之前的行和列上测试此条件例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1

随机推荐

我可以安全地删除对 .pdb 文件的引用吗？

我正在使用 ASP NET Core 5 0 因为它刚刚发布不久今天我注意到一些奇怪的事情我为我的软件制作了一个安装程序它会自动过滤掉进入我的发布版本的每个 pdb 文件一种永远不会引起问题的机制但是新的 NET 5 0运行时似乎
Sharepoint 工作流首次运行时失败，但手动运行时成功

我们正在使用一个 infopath 表单提交后应该会触发自定义 NET 工作流程基本上表单中的信息用于创建新的共享点站点我看到发生的情况是工作流程第一次运行提交表单后自动运行工作流程出错当我在工作流程失败后立即手动运行该工作
c/c++ 如何获取.exe运行进程的基地址？

我正在寻找一个可以用来获取基地址的方法函数 program exe 03262C08 gt B4895A0 该地址来自作弊引擎基地址已通过指针扫描器找到在指针扫描仪中我可以按show module list并且有地址program e
在 Laravel 5 中创建嵌套的类别列表

我对 Laravel 相当陌生正在尝试为我的应用程序创建一个树状类别结构这是我用过很长时间但仍然无法实现我想要的代码我的控制器 public function index categories Category with childr
如何在 Mac OSX 上安装 ffmpeg 的 libx265

我尝试过多种指南here https hexeract wordpress com 2009 04 12 how to compile ffmpegmplayer for macosx 搜索构建 libx265 和here http si
从我的 war 目录提供图像？

我有一个 servlet 它提供存储在 blob 中的图像文件如果找不到请求的图像我想提供一个包含在我的 war 目录中的静态图像我们如何做到这一点这就是我从数据存储区提供 blob 图像的方式 public class Servl
Highcharts：使用jspdf导出多个图表

当我尝试使用导出多个 Highcharts 图表时jsPdf我没有以正确的方式获取图表你能帮我解决这个问题吗 JavaScript 代码 Highcharts chart container title text Solar Employ
在 Java 中断言异常，如何？ [复制]

这个问题在这里已经有答案了这可能是一个概念上愚蠢的问题但也可能不是因为我仍然是一名学生我想我应该没有问题问想象一下您有一个方法如果给定某些条件它将抛出 NumberFormatException 我想编写一个单元测试来查看异
为什么 ++[[]][+[]]+[+[]] 返回字符串“10”？

这是有效的并返回字符串 10 在 JavaScript 中更多例子在这里 http sla ckers org forum read php 24 33349 33405 console log 为什么这里发生了什么如果我们把它分开
Powerpoint VBA - 将 RGB 颜色作为变量传递

我希望允许用户通过文本框输入 RGB 颜色并传递该变量来更改所有形状的颜色我编写了一个循环该循环将查看形状名称的最后 2 个字符以确定是否应将其更改为主要颜色或次要颜色这是最新的 Office 365 的 Powerpoint 我已
Eclipse：获取当前文件的位置？

如果我在 Eclipse 中打开了一个文件我怎样才能知道它在文件系统上的位置例如在 Vim 中我会使用 pwd 使用 Eclipse 菜单文件 gt 属性或快捷方式 Alt Enter 您应该能够看到与资源关联的位置
谁在创建文件“/private/var/tmp/Untitled-*.uicatalog”？

我正在调查 TeamCity 构建代理磁盘不足的原因并在其中发现了超过 11 000 个文件 private var tmp 全部按照以下方式命名Untitled
cx_Oracle 错误。 DPI-1047：无法找到 64 位 Oracle 客户端库

我安装了该库当尝试使用我的凭据访问 jupyter 笔记本中的 SQL 时出现以下错误数据库错误 DPI 1047 无法找到 64 位 Oracle 客户端库找不到指定的模块请参阅 https oracle github io o
如何将 tf.data.Dataset.padded_batch 与嵌套形状一起使用？

我正在为每个元素构建一个具有两个形状 batch width height 3 和 batch class 的张量的数据集为了简单起见我们假设 class 5 你吃什么形状的dataset padded batch 1000 shape
我可以将 Recharts 轴域最大值设置为低于 dataMax 吗？

我在用户希望看到以不同比例绘制的相同数据的设置中使用图表特别是我需要能够将轴域最大值设置为lower比最大数据值 dataMax e g 我想设置domain 0 10 when dataMax是 20 我还没有找到在 Recharts
Google FastButton 在 iOS 上点击两次

使用时MrMaksimize 和 Alex Blacks 实施 https github com alexblack google fastbutton of 谷歌快捷按钮 https developers google com mobil
用 Expand.grid 替换嵌套循环并使用多个参数调用内部函数

我想用rollapply具有各种组合的功能width by and FUN参数 width and by应具有相同的值我受到启发here https stackoverflow com questions 15059076 call ap
使用复选框 s1 和 s2 以及不同功能的交互式堆栈

我正在尝试制作堆栈的工作模型其中用户可以选择堆栈 s1 或 s2 并可以执行诸如推送和弹出之类的操作 div p stack p div
Android LocationServices.FusedLocationApi 已弃用

我不明白为什么LocationServices FusedLocationApi requestLocationUpdates mGoogleApiClient mLocationRequest this FusedLocationApi
将 df1 列 1 与 df2 中的所有列进行比较，返回 df2 的索引

我是熊猫新手所以很可能忽略了一些东西但我一直在搜索但还没有发现任何有用的东西我想做的就是这个我有 2 个数据框 df1只有 1 列和未知的行数 df2每个索引的行数和列数也未知 Example df1 0 1117454 1 11

将 df1 列 1 与 df2 中的所有列进行比较，返回 df2 的索引

---

将 df1 列 1 与 df2 中的所有列进行比较，返回 df2 的索引 的相关文章

随机推荐

热门标签

将 df1 列 1 与 df2 中的所有列进行比较，返回 df2 的索引的相关文章