根据另一个数据框中的数据量删除一个数据框中的行

2024-05-06

我有两个 pandas 数据框A and B. B是 A 的子集。

我想删除 A 中的所有数字（如果 B 中存在该数字）。But，如果一个数字在 A 中出现两次，在 B 中出现 1 次，那么它只会从 A 中删除该数字的 1 次出现。

这是我的示例数据集：

df_A                df_B
[Test]              [Test]
1                   1
2                   2         
3                   5 
2                   5 
4
5
5

操作后我想要新的数据框 c 作为

df_C
[Test]
3
2
4

您能建议如何做到这一点吗？

The 建议重复 https://stackoverflow.com/questions/39880627/in-pandas-how-to-delete-rows-from-a-data-frame-based-on-another-data-frame删除所有出现的位置A如果存在于B，而不仅仅是前 N 次出现。

我可能会做一些事情（窃取 SR 的设置）：

dfA = pd.DataFrame({'A': [1, 2, 3, 2, 4, 5, 5]})
dfB = pd.DataFrame({'B': [1, 2, 5, 5]})

counts = dfA.groupby('A').cumcount()
limits = dfB['B'].value_counts().reindex(dfA.A).fillna(0).values
dfC = dfA.loc[counts >= limits]

这给了我

In [121]: dfC
Out[121]: 
   A
2  3
3  2
4  4

这是通过使用 groupby 来获取 A 中给定值之前出现的次数来实现的：

In [124]: dfA.groupby('A').cumcount()
Out[124]: 
0    0
1    0
2    0
3    1
4    0
5    0
6    1
dtype: int64

并使用value_counts获得限制，然后我们重新索引以匹配计数：

In [139]: dfB['B'].value_counts()
Out[139]: 
5    2
2    1
1    1
Name: B, dtype: int64

In [140]: dfB['B'].value_counts().reindex(dfA.A)
Out[140]: 
A
1    1.0
2    1.0
3    NaN
2    1.0
4    NaN
5    2.0
5    2.0
Name: B, dtype: float64

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

根据另一个数据框中的数据量删除一个数据框中的行的相关文章

如何在Python中找到低精度浮点值的原始文本表示？

我遇到了显示问题floatPython 中的值从外部数据源加载它们是 32 位浮点数但这也适用于较低精度的浮点数以防万一这些值是由人类在 C C 中输入的因此与任意计算值不同与round数字很可能not预期的但不能被忽略
Flask - 如何从 JSON GET 请求获取参数

我有一个发出以下 GET 请求的客户端 api GET tasks 5fe7eabd 842e 40d2 849e 409655e0891d 22task 22 22hello 22 22url 22 22 tasks 5fe7eabd 8
如何在模型 Django 中创建必需：布尔字段

我有一个模型其中有一个名为的字段is student and is teacher Student and Teacher forms is teacher models BooleanField teacher status defau
tkinter 上的“NoneType”对象没有属性“get”错误[重复]

这个问题在这里已经有答案了我最近开始使用 python 3 6 进行编码tkinter并尝试创建我自己的项目repl it 该项目是一个简单的交互式待办事项列表但是我陷入困境并且无法使该功能正常工作该函数只是简单地获取条目并将其添加到
python 打开相对文件夹中所有以.txt结尾的文件

我需要打开并解析文件夹中的所有文件但我必须使用相对路径类似于 input files 我知道在 JavaScript 中你可以使用 path 库来解决这个问题我怎样才能在Python中做到这一点这样您就可以获得路径中的文件列表作为列
Pyjnius导入jar文件

Pyjnius 允许您为 java 类创建 python 包装器例如 Hardware autoclass org myapp Hardware 有没有办法像这样导入现有的 jar 文件语法是什么样的您可以将 jar 添加到 CLAS
使用 OpenCV 进行图像模糊检测

我正在研究图像的模糊检测我已经用过拉普拉斯方法的方差在 OpenCV 中 img cv2 imread imgPath gray cv2 cvtColor img cv2 COLOR BGR2GRAY value cv2 Laplacia
在 Pyinstaller、语音识别和 Pyttsx3 中使用“-w”时，PySimpleGUI 中出现“OSError：[WinError 6] 句柄无效”

所以我用 PySimpleGUI 创建了一个程序然后用 Pyinstaller 从它创建了 exe 文件这是我的命令 pyinstaller hidden import pyttsx3 drivers hidden import pyt
UTF-8 解码如何知道字节边界？

我一直在阅读大量有关 unicode 编码的文章尤其是有关 Python 的文章我想我现在对此已经有了相当深入的了解但仍有一个小细节我有点不确定解码如何知道字节边界例如假设我有一个带有两个 unicode 字符的 unicode
Tensorflow：Cuda 计算能力 3.0。所需的最低 Cuda 能力为 3.5

我正在从源安装tensorflow 文档 https www tensorflow org versions r0 10 get started os setup html installing from sources Cuda驱动版本
即使使用标头和 Session 对象，Python requests.get 也会失败并出现 403 禁止

我正在发出 GET 请求来获取 JSON 它在任何设备上的任何浏览器中都可以正常工作但不能通过 python 请求 url https angel co autocomplete new tags params query sci tag
Python：使用Excel CSV文件仅读取某些列和行

虽然我可以读取 csv 文件而不是读取整个文件但如何仅打印某些行和列想象一下这是 Excel A B C D E State Heart Disease Rate Stroke Death Rate HIV Diagnosis Rate
使用 django-profiles 以配置文件形式编辑相关模型

我在用着Django 配置文件 http bitbucket org ubernostrum django profiles wiki Home在我的应用程序中因为它为我提供了一些简单的视图可以帮助我更快地到达我想去的地方但是我有一
pygame.image.load 不工作

我正在尝试为游戏创建世界地图但是当我尝试将世界地图加载到屏幕上时命令行告诉我无法执行此操作这是代码 import sys import pygame from pygame locals import pygame init Surf
Python 柯里化任意数量的变量

我正在尝试使用柯里化在 Python 中进行简单的函数添加我找到了这个咖喱装饰器here https gist github com JulienPalard 021f1c7332507d6a494b def curry func def
无法从源 pylance 解析导入烧瓶

我正在学习 Python 课程的一部分是使用 Flask 设置网络服务器我按照 Flask 安装文档执行了步骤由于某种原因 flask 模块带有下划线如下所示当我将鼠标悬停时我会得到如下附加信息无法从源 pylance 解析导入
打包布尔数组需要通过 int (numpy 1.8.2)

我正在寻找更紧凑的方式来存储布尔值 numpy 内部需要 8 位来存储一个布尔值但是np packbits允许打包他们这真是太酷了问题是要打包在4e6字节数组a32e6字节我们需要首先使用的布尔值数组256e6字节将布尔数组转换为
如何在Python中仅列出顶级目录？

我希望能够仅列出某个文件夹内的目录这意味着我不需要列出文件名也不需要其他子文件夹让我们看看一个例子是否有帮助在当前目录中我们有 gt gt gt os listdir os getcwd cx Oracle doc DLLs Doc
PyQt 和 QSignalMapper/lambdas - 多个信号，单槽

我在 PyQt 的菜单上有一个操作列表每个操作对应我想要显示的每个不同的提要所以我有一个 Y 将活动源设置为 Y Z 将其设置为 Z 等等对于网络漫画阅读程序我的菜单上都有并且觉得自动化方法可能更好而不是每次都打字类似于将其添
Pandas 将时间序列数据重新采样为 15 分钟和 45 分钟 - 使用多索引或列

我有一些时间序列数据作为 Pandas 数据框它从每小时过去 15 分钟和过去 45 分钟时间间隔为 30 分钟的观察开始然后将频率更改为每分钟我想对数据进行重新采样以便整个数据帧的频率为每 30 分钟一次 15 点和 45 点

随机推荐

Clojure 宏：从地图创建本地变量 [重复]

这个问题在这里已经有答案了我有这个示例代码我通过迭代映射的键值对来创建变量 defmacro block bindings body let mapcat fn k v if symbol k k symbol name k v bin
我们可以将 WORD 加载项发布到 Windows 10 应用商店吗？

The WORD Add in是使用开发的VSTO在 Visual Studio 2015 中它有一个自定义功能区其中包含一些按钮可以对 WORD 文档执行某些内容操作这可以转换为UWP app https msdn microso
在中止部署期间，某些实例可能已部署新的应用程序版本

我正在尝试将 ASP NET 应用程序部署到 AWS 当我按下部署按钮时出现错误在中止部署期间某些实例可能已部署新的应用程序版本为确保所有实例运行相同版本请重新部署适当的应用程序版本我不知道我在哪里犯了错误以及出了什么问题任何意
如何在 ColdFusion 中获取字符串的内容减去扩展名？

例如我只想要字段中文件的文件名假设我有 myimage jpg 我只想显示 myimage 我怎样才能得到它使用列表功能对您有利
限制用户角色仅更改 Woocommerce 中的某些订单状态 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我想限制按角色访问 woocommerce 下拉列表中的某些订单状态我已经在functions php子主题中尝试过代码按角色限制
$lookup mongodb 中的 $project

我有一个查询使用 lookup https docs mongodb com manual reference operator aggregation lookup 加入两个模型之后我使用 project https docs mo
带 cookie 身份验证的 Gorilla websocket

这是我的设置我正在构建一个带有用户登录的服务使用 Negroni 和 Gorilla 登录后用户会获得一个会话 cookie 服务器使用该会话 cookie 来授权受保护的端点受保护的端点之一允许用户客户端与服务器打开 Webso
从 Datastax 6.0 到 Cassandra 3 的迁移路径

我正在尝试找到从 Datastax Enterprise DSE 6 0 14 到 Cassandra Community OSS 3 的迁移路径到目前为止我无法找到有效的迁移路径所有键空间复制均已更新为NetworkTopology
比较 TCP 校验和与 Scapy？

我试图在使用 Scapy 作为嗅探器时识别校验和不正确的数据包我可以通过访问获得原始校验和 packet TCP chksum 然后我使用删除它 del packet TCP chksum 我想做类似的事情 if originalChec
OpenSSL的EVP是什么意思？

OpenSSL的EVP是什么意思我知道它是 OpenSSL 中的一个更高级别的加密接口库但是字母 E V P 代表什么谢谢陈兹有趣的问题我不确定但是 ifndefevp h 顶部是 ifndef HEADER ENVELOPE
PHP/HTML 添加删除按钮

我有下面的代码来从数据库中检索行其中用户名列与基本目录名称匹配 username basename dirname FILE username mysql real escape string username result mysql
Android 添加新日历

我已经检查了所有从 Android 应用程序中创建新日历的方法我见过的唯一方法是在最新的 api 版本中使用新的 Calendar API 但这似乎只有在您使用时才有效CalendarContract ACCOUNT TYPE LOCAL
Java中如何做系统捷径跨平台集成？

您可能知道 Mac OS X 中保存的快捷键是Cmd S在 Windows 上是Ctrl S 关闭应用程序的捷径是Cmd QWindows 是Alt F4 但问题是如何在 java 应用程序中执行这些操作我是否需要找到我在应用程序中使用的
将 Swift 类添加到具有多个目标的 Objective-C 项目

我有一个现有的 Obj C 项目其中包含许多共享相同 AppDelegate 的目标我想桥接一个由选定目标使用的快速类当我有一个目标时我可以轻松地做到这一点当我向项目添加 swift 文件时我选择所需的目标并生成必要的 brid
警告：mysqli_real_escape_string() 需要 2 个参数，其中 1 个给定...我做错了什么？ [复制]

这个问题在这里已经有答案了我尝试使用 php 登录但收到此错误 Warning mysqli real escape string expects exactly 2 parameters 1 given 我做错了什么注册 php
如何生成接口的swagger文档？

我已经用谷歌搜索过它但是 swagger 文档的所有示例都使用类我想包括接口因为读者对 API 而不是实现感兴趣这是我的代码包含所需的 Maven 依赖项
如何在 Laravel 中存储非 php 文件的模板？

我们可以存储PHP模板文件使用bladeLaravel 中的模板引擎但是我想在远程服务器上创建一个配置文件每个文件包含 20 30 行以上到目前为止我一直在使用Perl 我曾经执行 Perl 文件该文件用于将内容转储到一个文件中
使用 UICollectionViewFlowLayout 重新排列 UICollectionView 的不同大小的项目

假设我有一个带有 UICollectionViewFlowLayout 的 UICollectionView 并且我的项目大小不同所以我已经实施了collectionView layout sizeForItemAt 现在假设我允许用户重
了解 Beautiful Soup 中的 Find() 函数

我知道我想做的事情很简单但这让我感到悲伤我想使用 BeautifulSoup 从 HTML 中提取数据为此我需要正确使用 find 功能这是我正在使用的 HTML div class audit div class profile
根据另一个数据框中的数据量删除一个数据框中的行

我有两个 pandas 数据框A and B B是 A 的子集我想删除 A 中的所有数字如果 B 中存在该数字 But 如果一个数字在 A 中出现两次在 B 中出现 1 次那么它只会从 A 中删除该数字的 1 次出现这是我的示例数

根据另一个数据框中的数据量删除一个数据框中的行

根据另一个数据框中的数据量删除一个数据框中的行 的相关文章

随机推荐

热门标签

根据另一个数据框中的数据量删除一个数据框中的行的相关文章