如何在两个 Pandas DataFrame 对象上执行 SQL 样式不相交或设置差异？

2024-01-13

我正在尝试使用 Pandas 来解决一个白痴 DBA 没有对现已崩溃的数据集进行备份的问题，因此我正在尝试查找两列之间的差异。由于我不会详细说明的原因，我使用的是 Pandas 而不是数据库。

我想做的是，考虑到：

Dataset A = [A, B, C, D, E]  
Dataset B = [C, D, E, F]

我想找到不相交的值。

Dataset A!=B = [A, B, F]

在 SQL 中，这是标准的集合逻辑，根据方言的不同以不同的方式完成，但这是一个标准函数。我如何在 Pandas 中优雅地应用它？我很想输入一些代码，但我所拥有的都不是正确的。这是一种我不知道我不知道的情况...... Pandas 为交集和并集设置了逻辑，但没有为不相交/集合差异设置逻辑。

谢谢！

您可以使用set.symmetric_difference功能：

In [1]: df1 = DataFrame(list('ABCDE'), columns=['x'])

In [2]: df1
Out[2]:
   x
0  A
1  B
2  C
3  D
4  E

In [3]: df2 = DataFrame(list('CDEF'), columns=['y'])

In [4]: df2
Out[4]:
   y
0  C
1  D
2  E
3  F

In [5]: set(df1.x).symmetric_difference(df2.y)
Out[5]: set(['A', 'B', 'F'])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

如何在两个 Pandas DataFrame 对象上执行 SQL 样式不相交或设置差异？的相关文章

如何获取Python对象父级？

所以我试图获取自定义对象内部的对象这是一个例子假设 o 是一个对象无论是什么类型它都可以存储变量 o Object class Test def init self self parent o This is where I
反转 Python 整数的位

给定一个十进制整数例如 65 如何反转 Python 中的底层位即以下操作 65 01000001 10000010 130 看来这个任务可以分为三步将十进制整数转换为二进制表示形式反转位转换回十进制第 2 步和第 3 步看起来
使用 LSTM 进行时间序列模式识别(python)

我的应用场景和上一个类似时间序列中的模式识别 https stackoverflow com questions 11752727 pattern recognition in time series By processing a tim
字符串在内部存储为单独的字符，内存中的每个字符都由其他类似的字符串共享吗？

例如是字符串var1 ROB 存储为 3 个内存位置 R O 和 B 每个位置都有自己的地址和变量var1指向内存位置R 那它怎么指向O和B呢并执行其他字符串例如 var2 BOB 指向内存中相同的 B 和 Ovar1指的是字符串如
扭曲的日志记录到屏幕（标准输出）不起作用

我有这个小程序取自这里 https twistedmatrix com documents 16 3 0 core howto logger html usage for emitting applications from twisted
我应该使用 Pylons 还是 Pyramid？

我本来打算从 Django 迁移到 Pylons 但后来我遇到了 Pyramid 塔架和金字塔有什么区别我读了一些文字塔书 http pylonsbook com 目前涵盖 Pylons 0 9 7 并且想知道它是否是 Pylons 和
Django 视图集没有属性“get_extra_actions”

我第一次使用 Django 我正在尝试构建一个 API 我正在遵循一些教程和示例它工作正常但在安装所有要求和项目后我现在正在 Raspberry Pi 中运行该项目失败并出现以下错误 Performing system checks
将 Python 字典中的键替换为唯一值

a 0 PtpMotion 1 PtpMotion 2 LinMotion 3 LinMotion 4 LinMotion 5 LinMotion 6 LinMotion 7 LinMotion 8 LinMotion 9 PtpMotio
代码终止后保持 matplotlib / pyplot 窗口打开

我希望 python 绘制一个图在不阻塞控制流的情况下显示它并在代码退出后使图保持打开状态这可能吗这个以及相关的主题存在于许多其他线程中见下文但我无法让情节保持开放且非阻塞例如如果我使用pyplot ion before p
xlwt 可以在单元格中创建一个包含标题和链接变量的超链接吗？

例如如何更改以下行使 test 为变量 T 且 http google com http google com 是变量L ws write 0 0 xlwt Formula test HYPERLINK http google com
XGBoostLibraryNotFound：在候选路径中找不到 XGBoost 库，您是否安装了编译器并在根路径中运行了 build.sh？

我在移动 XGBoost 的 python package 目录时遇到这个问题 Traceback most recent call last File setup py line 19 in LIB PATH libpath find l
在 Windows 上使用 pycrypto 时如何修复“ImportError：无法从 Crypto.Cipher 导入名称 _AES”？

我在 Crypto 的 Cipher 模块中有 AES Python27 Lib Crypto Cipher AES 当我尝试做的时候 from Crypto Cipher import AES 我收到以下错误 Traceback most
谷歌colab录音，如何实现更精确的方式告诉用户开始对着麦克风说话

我正在尝试创建一个为机器学习项目录制音频的程序我想使用 google colab 这样人们就不必在他们的系统上安装或运行任何东西我在网上找到了这个录制和播放音频的示例单元格 1 包含用于录制音频的 js 代码和用于将其转换为字节对象的
Django 模板：输出带有所有小数位的浮点数

我如何在 django 模板中输出这个数字小数位数是可变的我事先不知道 x 0 000015 1 x 输出是 1 5e 05 2 x stringformat f 输出是 0 000015 这不是本地化的应该有逗号我需要对输出进行本
禁用或限制 /o/applications（django rest 框架、oauth2）

我目前正在使用 Django Rest 框架编写 REST API 并使用 oauth2 进行身份验证使用 django oauth toolkit 我对他们俩都很满意他们做的正是我想要的然而我有一个担忧我正在将我的应用程序传递到
2D 矩阵上的 Numpy where()

我有一个像这样的矩阵 t np array 1 2 3 foo 2 3 4 bar 5 6 7 hello 8 9 1 bar 我想获取行包含字符串 bar 的索引在一维数组中 rows np where t bar 应该给我索引 0 3
如何将 bisect.insort_left 与键一起使用？

文档缺少示例你如何使用bisect insort left 基于密钥尝试根据键插入 bisect insort left data brown 7 将插入放在data 0 从文档 bisect insort left a x lo 0
在Python中设置Windows命令行终端标题

我在 Windows 计算机上运行某个 Python 脚本的多个实例每个实例都来自不同的目录并使用单独的 shell 窗口不幸的是 Windows 为每个 shell 窗口提供了相同的名称
对象对于所需数组来说太深 - scipy.integrate.odeint

我昨天刚开始使用Python 使用时遇到错误scipy integrate odeint 我定义了一个函数 def SIR x t beta gamma mu M 这需要numpy array物体x t and M 标量浮动beta gam
子进程调用，它们是并行完成的吗？

我一直在谷歌搜索这个问题的答案但似乎没有一个答案谁能告诉我如果subprocess模块是否并行调用 Python 文档建议它可用于生成新进程但没有提及它们是否并行如果它们可以并行完成您能否给我举一个例子或将我链接到一个例子这取决

随机推荐

记录源文件和行号

使用 Rust 的log and env loggercrates 如何让输出包含调用日志调用的源文件和行号在下面的例子中logger example是我的二进制文件的名称Cargo toml e g bin name logger ex
如何在 onNext 调用中从上下文/范围中获取变量？ (java/grpc)

我正在与contexts https grpc io grpc java javadoc io grpc Contexts html within grpc java https github com grpc grpc java 我最终试
GLFW 切换窗口全屏模式

我正在使用 GLFW 我想知道如何切换全屏窗口模式不改变分辨率而是将窗口设置在顶部并且没有装饰如果 GLFW 无法做到这一点那么您建议使用什么跨平台库来实现这一目标您可以告诉 glfw 全屏打开窗口 glfwOpenWindow
为什么 tlstest.paypal.com 可以在浏览器中运行，但不能在我的 PHP 代码中运行（对于 Paypal IPN 有用）？

2018年6月30日之后 Paypal不会接受非 TLS 1 2 HTTP 1 1 请求 https www paypal notice com en TLS 1 2 and HTTP1 1 Upgrade 不再了他们创建了 URLhtt
如何更改现有应用程序的配置文件？

我从来没有为 iPhone 开发过应用程序但我们的客户有一个应用程序是由他以前的供应商开发的现在该供应商已经结束了他在我们国家的业务所以现在我们有了该应用程序的源代码以供进一步开发我们需要立即采取的行动是该应用程序未在 iOS 1
Moq.Mock.Verify() 是否使用identity 或.Equals() 比较参数？

在类似的命令中 var mockObj new Mock
Twig 在包含之前检查部分存在

我正在开发一个相当复杂的多语言网站它将根据 html 语言环境呈现不同的部分我有一个部分结构它将使用附加到文件名的区域设置来选择正确的区域例如 include BundleName Layout Text partial name
Azure databricks 存储库：如何通过 API 拉取

我正在使用 Azure DevOps 存储库将 Azure databricks 连接到我在 DevOps 中的存储库我需要从 Azure DevOps 管道自动拉取为此我尝试使用 databricks API 来拉取但参考这个链接
let forms ：如何访问宏中的解构符号？

我正在尝试编写一个宏它通过解构扩展为 let 形式我的问题是我想要获得在 let 形式中定义的符号列表包括通过解构获得的符号 Use case 我正在尝试排除这种行为例如进行验证 let a foo bar x x y y u u
PHP PDO 与 foreach 和 fetch

以下代码
UnicodeDecodeError：“utf8”编解码器无法解码字节 0x9c

我有一个套接字服务器应该从客户端接收 UTF 8 有效字符问题是一些客户端主要是黑客通过它发送了所有错误类型的数据我可以轻松区分真正的客户端但我将发送的所有数据记录到文件中以便稍后进行分析有时我会遇到这样的角色导致Unic
如何在mysql中进一步过滤GROUP BY记录？

请检查我想要查询id 43 的完整行以及另一个nic id最大query id行的图像但它只给我最大query id 我尝试了不同的查询例如 SELECT Query id nic id date subject followup
Python-将Excel文件的不同工作表保存为单独的Excel文件

新手我有一个 Excel 文件其中有 100 多个不同的工作表每张纸包含多个表格和图表我希望将每张工作表另存为新的 Excel 文件我尝试了很多Python代码但没有一个起作用请在这方面提供帮助谢谢编辑1 为了回应评论这
检查字符串是否包含子字符串。另外，获取索引和匹配数（Raku）

常见问题解答在 Raku 中如何检查String https docs perl6 org type Str包含子字符串在哪里以及多少次我想要 3 个功能例如 xxx bool az and az and az again az
GNU、GCC 和 MinGW 之间有什么区别？

我得知 GCC 不仅是一个编译器c questions tagged c但也适用于许多其他语言这是真的吗如果是这样那么它是如何完成的呢 GNU 不是编译器它是一个操作系统和一组自由软件旨在类 Unix 而不使用 Unix GNU
64位函数返回32位指针

这个函数被埋在一个复杂的嵌套中所以实际上找到原因可能超出了我所能要求的范围但我想知道是否有人能够提供一些关于我如何调试它的提示这是我遇到问题的代码的要点 func1 c somestruct func1 somestruct myst
iOS - 如何判断本地通知是否导致我的应用程序进入前台？

我的应用程序委托中有代码 application didReceiveLocalNotification 方法来显示UI警报视图对于本地通知每当我的应用程序位于前台时如果本地通知到达时我的应用程序在后台运行则用户会收到该通知并且能够
如何仅使用 HTML 在 mozilla firefox 中打开本地文件？

我正在尝试在 ubuntu 机器上使用 html 打开 Firefox 本地磁盘上的文件但是我面临文件未找到错误我的代码如下 a href home abc workspace logfile log LOG FILE a 我尝试使用
无法从包含库的应用程序启动意图

您好我想启动一项位于连接的图书馆项目中的服务所有相关课程都在图书馆该服务是从位于库中的活动调用的 Intent serviceIntent new Intent serviceIntent setAction org example
如何在两个 Pandas DataFrame 对象上执行 SQL 样式不相交或设置差异？

我正在尝试使用 Pandas 来解决一个白痴 DBA 没有对现已崩溃的数据集进行备份的问题因此我正在尝试查找两列之间的差异由于我不会详细说明的原因我使用的是 Pandas 而不是数据库我想做的是考虑到 Dataset A A B

如何在两个 Pandas DataFrame 对象上执行 SQL 样式不相交或设置差异？

如何在两个 Pandas DataFrame 对象上执行 SQL 样式不相交或设置差异？ 的相关文章

随机推荐

热门标签

如何在两个 Pandas DataFrame 对象上执行 SQL 样式不相交或设置差异？的相关文章