根据 Python pandas 中索引的补集挑选元素

2024-03-15

我有一个数据框，我从中选择两个子集 dfs，df_a and df_b。例如在iris数据集：

df_a = iris[iris.Name == "Iris-setosa"]
df_b = iris[iris.Name == "Iris-virginica"]

获得所有元素的最佳方式是什么iris既不在df_a nor in df_b？我不想提及定义的原始条件df_a and df_b。我只是假设df_a and df_b是的子集iris，所以我想从中提取元素iris基于以下指标df_a and df_b。基本上，假设：

df_a = get_a_subset(iris)
df_b = get_b_subset(iris)
# retrieve the subset of iris that 
# has all elements not in df_a or in df_b
# ...

EDIT:这是一个看起来效率低下且不优雅的解决方案，我确信 pandas 有更好的方法：

# get subset of iris that is not in a nor in b
df_rest = iris[map(lambda x: (x not in df_a.index) & (x not in df_b.index), iris.index)]

还有第二个：

df_rest = iris.ix[iris.index - df_a.index - df_b.index]

如何在 pandas 中最有效/优雅地完成此操作？谢谢。

这似乎比你的第二个解决方案快一点。索引时会有更多的开销.ix:

df[~df.index.isin(df_a.index+df_b.index)]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

pandas

根据 Python pandas 中索引的补集挑选元素的相关文章

以矢量化方式在另一个 DataFrame 中查找包含值子集的行

如何匹配此 DataFrame 中的值source car id lat lon 0 100 10 0 15 0 1 100 12 0 10 0 2 100 09 0 08 0 3 110 23 0 12 0 4 110 18 0 32 0
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
Python 的 mysqldb 晦涩文档

Python 模块 mysqldb 中有许多转义函数我不理解它们的文档而且我努力查找它们也没有发现任何结果 gt gt gt print mysql escape doc escape obj dict escape any speci
将一维数组转换为下三角矩阵

我想将一维数组转换为较低的零对角矩阵同时保留所有数字我知道numpy tril函数但它用零替换了一些元素我需要扩展矩阵以包含所有原始数字例如 10 20 40 46 33 14 12 46 52 30 59 18 11 22 30
numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
如何使用 i18n 切换器将“LANGUAGE_CODE”保存到数据库，以便在 Django 中的不同浏览器中语言不会更改？

有什么办法可以改变它的值LANGUAGE CODE单击按钮发送请求时 settings py 中的变量会动态变化吗我希望用户设置自己的默认语言他们的帐户现在用户可以使用下拉列表选择他们的首选语言并且网站会得到完美的翻译并且
通用详细视图 ProfileView 必须使用对象 pk 或 slug 调用

我是 Django 2 0 的新手在访问我的个人资料页面视图时收到此错误它适用于像这样的网址path users
Django 不会以奇怪的错误“AttributeError: 'module' object has no attribute 'getargspec'”启动

我对 Django 的内部结构有点缺乏经验所以我现在完全陷入困境它昨天起作用了但我不记得我改变过任何重要的东西当我转身时DEBUG True任何恰好位于列表中第一个的模块上都有堆栈跟踪 Traceback most recent c
Django 模型字段默认基于另一个模型字段

我使用 Django Admin 构建一个管理站点有两张表一张是ModelA其中有数据另一个是ModelB里面什么也没有如果一个模型字段b b in ModelB为None 可以显示在网页上值为ModelA的场a b 我不知道该怎
如何使用 PyMongo 在重复键错误后继续插入

如果我需要在 MongoDB 中插入尚不存在的文档 db stock update one document set document upsert True 将完成这项工作如果我错了请随时纠正我但是如果我有一个文档列表并想将它们全
返回上个月的日期时间对象

如果 timedelta 在它的构造函数中有一个月份参数就好了那么最简单的方法是什么 EDIT 正如下面指出的那样我并没有认真考虑这一点我真正想要的是上个月的任何一天因为最终我只会获取年份和月份因此给定一个日期时间对象返回的最
如何将类添加到 LinkML 中的 SchemaDefinition？

中的图表https linkml io linkml model docs SchemaDefinition https linkml io linkml model docs SchemaDefinition and https link
pandas 中连续数据的平行坐标图

pandas 的 parallel coordinates 函数非常有用 import pandas import matplotlib pyplot as plt from pandas tools plotting import par
将列表中的 None 替换为最左边的非 none 值

Given a None 1 2 3 None 4 None None I d like a None 1 2 3 3 4 4 4 目前我已经用以下方法强制它 def replaceNoneWithLeftmost val last Non
如何正确导入主代码和模块中同时使用的模块？

假设我有一个主脚本 main py 它导入另一个 python 文件import coolfunctions另一个 import chores 现在假设 Coolfunctions 也使用家务活中的东西因此我声明import chore
Python 导入非常慢 - Anaconda python 2.7

我的 python import 语句变得非常慢我使用 Anaconda 包在本地运行 python 2 7 导入模块后我编写的代码运行得非常快似乎只是导入需要很长时间例如我使用以下代码运行了一个 tester py 文件 imp
ValueError：使用火炬张量时需要解压的值太多

对于神经网络项目我使用 Pytorch 并使用 EMNIST 数据集已经给出的代码加载到数据集中 train dataset dsets MNIST root data train True transform transforms T
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
如何更改matplotlib中双头注释的头大小？

Below figure shows the plot of which arrow head is very small 我尝试了下面的代码但它不起作用它说引发 AttributeError 未知属性 s k 属性错误未知属性头宽
在父类中访问子类变量

我有一个父类和一个继承的子类我想知道如何访问我的父类中的子类变量我尝试了这个但失败了 class Parent object def init self print x class Child Parent x 1 x Child Er

随机推荐

从 azure 搜索返回仅与确切搜索词匹配的记录

所以我是 Azure 搜索的新手我才刚刚开始了解它我有一个搜索索引用于查询一个非常简单的 sql 视图以查找匹配的记录我在获得与我搜索的单词完全匹配时遇到了很大的困难每当我搜索时我都会得到仅包含确切单词的记录但是我也会得到包含
如何让R使用更多的CPU和内存？ [复制]

这个问题在这里已经有答案了无论 R 计算多么密集它使用的 CPU 都不会超过 25 我尝试过设置优先级rsession exe to High乃至Realtime但用法保持不变有什么方法可以增加 R 的 CPU 使用率以充分利用我的系
语音转文本 - 将说话者标签映射到 JSON 响应中相应的文字记录

每隔一段时间就会出现一段 JSON 数据这会带来挑战可能需要数小时才能从中提取所需的信息我有以下由 Speech To Text API 引擎生成的 JSON 响应它显示了文字记录每个单词的发音以及每个说话者的时间戳和说话者标签s
如何使用Eclipse + CDT + MinGW更改优化级别？

我正在使用 Eclipse CDT MinGW 编写一些 C 代码编译输出始终显示 Info Internal Builder is used for build gcc O0 g3 Wall c fmessage length 0 o
文件对象中的 rb 和 r+b 模式有什么区别[重复]

这个问题在这里已经有答案了我在 Python 中使用 pickle 模块并尝试不同的文件 IO 模式 works on windows rb with open pickle f rb as fhand obj pickle load f
如何在 ASP.NET 全球化中配置不变文化？

我需要将 CurrentCulture 修复为 ASP NET 应用程序中的不变区域性我怎样才能做到这一点
Solidity 中的状态变量是什么？

我读过一些关于storage memory and view pure 但我并不完全理解它们我有以下代码 contract struct Random uint32 state uint8 i function main pure int
我可以结束asp.net mvc中视图的渲染吗

所以我试图找出一种方法如果我的模型为空则可以呈现错误消息并且在该错误消息之后视图应该停止渲染这可能吗我的第一个想法是 response end 方法但主视图将无法完成渲染这是框架的一部分我们确实需要自己构建它吗仅使用 re
float 无法转换为 'MirrorDisposition' Swift 什么是mirrordisposition？

我得到以下代码 let floatValue Float 1 let intValue Int 1 if floatValue intValue println Types and value are equal else println
使用 django 实现一个对请求进行计数的计数器

我只是想和姜戈一起尝试我如何实现一个计数器来存储数据库上服务的请求计数我想统计 GET 请求的数量我该怎么做才能让它工作我的模板
如何用hadoop实现自连接/叉积？

对成对的项目进行评估是常见的任务示例重复数据删除协同过滤相似项目等这基本上是具有相同数据源的自连接或叉积要进行自连接您可以遵循减少端连接模式映射器将连接外键作为键发出将记录作为值发出因此假设我们想要对以下数据的
可以在 AS3 中保存 XML 文件

var xml XML
VBA 公式内变量

我有以下代码 ActiveCell FormulaR1C1 COUNTIF R 54 C 14 R 54 C 90 RC 4 我想用变量 total 替换 90 我尝试了这个但没有成功 Dim total as Integer total
找不到程序集

我将 ArrayList 序列化为二进制文件以便通过 TCP IP 发送它序列化文件是由服务器创建的我希望能够使用我现在正在编写的客户端对其进行反序列化但是当客户端尝试反序列化时它会抛出 SerializationExcepti
如果没有响应则继续发送请求

在循环中没有得到响应的情况下如何继续获取网页 for el of NodeList const url el getAttribute href const res await fetch url if no response below
html2canvas 不从外部 css 文件获取 css 样式

我正在使用 html2canvas 将包含 svg 对象图像和 html 内容的 div 转换为图像但它不会从外部 css 文件获取 css 样式我已将这些 css 类 target 和 Circle 放入外部 css 文件中有人请
如何在 Jetpack Compose 中实现列表的“对齐中心”功能？

在具有水平 LinearLayout 的 EpoxyRecyclerView 中有一个对齐中心功能其工作原理如下如果我以良好的速度滚动列表它会继续滚动直到速度减慢并以项目位于中心为止如果我缓慢滚动并抬起手指那么下一个项目就
材质UI下一个对话框文本字段下划线颜色

如何使用辅助调色板颜色更改对话框内文本字段的下划线颜色我无法做到这一点因为文档非常混乱假设您使用的是material ui next 您可以使用覆盖 in 创建Mui主题 import MuiThemeProvider createM
Rails 模型中的实例变量

我想在 Rails 模型中初始化一个实例变量该变量将保存一个数组并且我想在模型中的其他方法中访问该变量我试过这个 class Participant lt ActiveRecord Base possible statuses exi
根据 Python pandas 中索引的补集挑选元素

我有一个数据框我从中选择两个子集 dfs df a and df b 例如在iris数据集 df a iris iris Name Iris setosa df b iris iris Name Iris virginica 获得所有元素

根据 Python pandas 中索引的补集挑选元素

根据 Python pandas 中索引的补集挑选元素 的相关文章

随机推荐

热门标签

根据 Python pandas 中索引的补集挑选元素的相关文章