Pandas 无法计算具有重复轴的 isin

2023-12-13

我的数据框是这样的：

             userid           codeassigned         timestamp
15           553938              M1           1499371200000
15390        527638              M2           1599731200000
15389        521638              M2           1399901200000
15388        521638              M3           1439841200000
15387        553938              M4           1499521200000

我通过执行以下操作获取了该数据帧的子集（具有最新时间戳的用户）：

df = df.sort_values('timestamp', ascending=False)
mask = df.duplicated('userid')
subset_df = df[~mask]

现在，我想要主数据帧中的所有行（用户ID，时间戳）都在subset_df中（可以有多行具有相同的[用户ID，时间戳]但分配了不同的代码）；我正在做的事情：

subset_df[['userid', 'timestamp']].isin(df)

但是，我收到此错误：

ValueError: cannot compute isin with a duplicate axis.

知道我做错了什么吗？

你需要merge对于带有过滤子集的内连接：

subset_df = df.loc[~mask, ['userid', 'timestamp']]

df = subset_df.merge(df)

Or:

df = subset_df[['userid', 'timestamp']].merge(df)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pandas

DataFrame

Pandas 无法计算具有重复轴的 isin 的相关文章

Python dict 到 DataFrame Pandas - 级别

几个月前 Romain X 在这个问题上帮了我很多忙 Python 字典到 DataFrame Pandas https stackoverflow com questions 32770359 python dict to datafra
通过另一个指标数据框评估一个数据框

我有一个源数据框input df PatientID KPI Key1 KPI Key2 KPI Key3 0 1 C602 C603 C601 NaN 1 2 C605 C606 C602 NaN 2 3 75 L239 C602 NaN
如何对预测值进行反向移动平均（在 pandas 中，rolling().mean）操作？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我有一个像这样的 df import numpy as np import pandas as pd import matplotlib
pandas DataFrame：获取上个月缺少交易且无法移位（）的值

有没有办法在不生成虚拟行的情况下实现这一点这是我的数据源 Group Store Month Revenue Group1 A 201611 10 Group1 A 201612 20 Group1 A 201701 30 Group1
在 pandas eval 中调用 round()、ceiling()、floor()、min()、max()

正如标题所说有没有办法在 pandas eval 中支持 round ceiling min max floor 函数数据框 import pandas as pd import numexpr as ne op d ID 1 2 3
R：动态创建变量名

我正在寻找使用 for 循环创建多个数据帧然后将它们缝合在一起merge 我可以使用创建我的数据框assign paste blah 但是在同一个 for 循环中我需要删除每个数据帧的第一列这是我的代码的相关部分 for j in
Python、Oracle DB、列中的 XML 数据，获取 cx_Oracle.Object

我正在使用 python 从 Oracle DB 获取数据所有行都有一个包含 XML 数据的列当我使用 python 打印从 Oracle DB 获取的数据时包含 XML 数据的列将打印为 0x7fffe373b960 处的 cx O
Pandas 按名称和最近日期合并

我正在尝试合并名称和最接近日期的两个数据框 WRT 左侧数据框在我的研究中我发现了一个类似的问题here https stackoverflow com questions 21201618 pandas merge match the
计算 pandas 数据框中的相同日期[重复]

这个问题在这里已经有答案了我有一个带有日期列的数据框我想创建一个新列来告诉我数据集包含多少个相同的日期这是原始数据集的一个最小示例 df1 date 2017 01 03 2017 01 03 2017 01 04 2017 01 0
从 pandas 数据框单元格中的混乱字符串中删除换行符？

我使用了多种方法来分割和剥离 pandas 数据框中的字符串来删除所有 n 字符但由于某种原因它只是不想删除附加到其他单词的字符即使我把他们分开我有一个 pandas 数据框其中有一列使用 Beautifulsoup 从网页捕获文
Pandas 在 groupby 之后获取行

假设我有以下数据集 uid iid val 1 1 2 1 2 3 1 3 4 1 4 4 5 1 5 5 5 2 1 3 2 2 3 2 3 4 3 4 4 5 3 5 5 5 根据这些数据我想首先按 uid 进行分组然后从每个 ui
根据第二个数据帧中的日期范围对一个数据帧中的值求和

我有两个数据框下面的简化示例一个包含一系列日期和值 df1 第二个包含日期范围 df2 我想识别选择屏蔽 df1 中 df2 的日期范围对关联的 df1 值求和并将它们添加到 df2 中的新列我是一个新手我尝试过的所有技术都不
Python 3 基于列名相似度的匹配值

我有以下形式的数据框 Year 1 Grade Year 2 Grade Year 3 Grade Year 4 Grade Year 1 Students Year 2 Students Year 3 Students Year 4 St
如何根据时间戳列制作时间跨度列？

我有一个数据表其中第 1 列中包含时间戳第 2 列中包含事件时间戳的格式为Y m d H M OS3 e g 2019 09 26 07 29 22 778 我想添加一个新列其中包含时间戳 2 到时间戳 1 之间的差异的时间跨度值
将 pandas DataFrame 转换为 dict 并保留重复索引

vagrant ubuntu xenial lb f5 v12 python Python 2 7 12 default Nov 12 2018 14 36 49 GCC 5 4 0 20160609 on linux2 Type help
Pandas 将对象转换为 timedelta

我有以下数据 Duration 0 00 00 00 1 00 00 00 2 00 00 57 3 00 03 16 4 00 00 00 And Duration被存储为一个对象我想将其转换为具有秒数的整数例如 00 03 16 被
按列名合并 3 个 data.frames

我有3个独立的data frames 他们三个data frames具有相同的列数和相同的行数此外它们具有相同的列名称我正在尝试根据列名称合并三个 data frames 我使用下面的代码来合并两个 data frames 并返回匹配
将 pandas Dataframe 的列乘以不同的标量

我有一个熊猫数据框df有柱子col 1 col 2 col n 我想将 pandas Dataframe 的每一列乘以基于该列的不同标量例如将中的每个元素相乘col 1 by n 1 中的每个元素col 2 by n 2 etc 做到这
尽管格式正确，熊猫仍无法推断时间序列频率？

我有以下数据框 1 df index 1 DatetimeIndex 1981 01 01 1981 01 02 1981 01 03 1981 01 04 1981 01 05 1981 01 06 1981 01 07 1981 01
如何绘制日期和月份

我有一张随时间变化的每日趋势图表年份与此处无关我只想显示日期和月份我知道你可以显示年份和月份但事实并非如此我尝试创建一个名为 Day Month 的新变量 import datetime as dt df Day df date

随机推荐

Javascript：将数组转换为对象

这是转换的最简单方法 src websrv1 dst websrv2 dstport 80 to this src websrv1 dst websrv2 dstport 80 为了将其传递给 AJAX 数据我在用着视觉搜索它返回一个 F
LocalReport方法渲染的线程文化

我正在 asp net 应用程序中使用 localreport 对象该报告由一组对象提供因此在呈现报表时会调用该类的一些属性 Class ClassForReport string Date get return aDate Tos
将 css 类添加到 wtform 中的字段

我正在使用 wtforms 和 Flask 生成动态表单我想向我生成的字段添加一些自定义 css 类但到目前为止我还无法这样做使用我找到的答案here 我尝试使用自定义小部件来添加此功能它的实现方式几乎与该问题的答案完全相同 cla
VueJS 上传带有附加数据的图像

我正在尝试将图像上传到服务器同时使用以下方法传递一些附加数据在同一发布请求中 VueJS 2 CLI 3 axios multer sharp 我在后端有 NodeJS 和 MongoDB 前端
Facebook api 在 openActiveSession 期间挂在“正在打开”状态

我第一次可以正常登录我有一个选项用户可以在 Android 应用程序中禁用 facebook 选择此选项后 Facebook 状态将变为关闭当我再次使用该选项时重新登录 API 会在回调函数中的 OPENING 处挂起根据我发现
使用 VideoWriter 从 OpenCV 打开 GStreamer 管道

我正在使用 OpenCV 捕获和处理视频帧我想将它们写入 h265 视频文件我正在努力从 OpenCV 获得合适的 Gstreamer 管道 Gstreamer 本身工作得很好特别是我能够运行此命令它可以非常快速地对视频进行编码
matplotlib：重绘前清除散点数据

我在 imshow 地图上有一个散点图我想要一个点击事件来添加一个新的散点这是我通过 scater newx newy 完成的问题是然后我想添加使用选择事件删除点的功能由于没有删除 pickX PickY 函数我必须获取选定的
AWS Redshift 数据透视表所有维度

我正在遵循在 redshift 中旋转大表的方法使用 Amazon RedShift PostgreSQL 透视表然而我有大量的组需要旋转即m1 m2 如何循环遍历所有不同的值并对每个值应用相同的逻辑并为结果列名称指定别名如果您希
如果我向 application.properties 添加任何值，Spring Boot 项目就会崩溃

我只是想将环境变量添加到我的项目中无论我添加什么到我的application properties文件程序崩溃并且pom xml突然变得无效并在我的 IDE 中突出显示为红色例如如果我将其添加到我的application prope
什么时候允许调用“BarcodeScanner.GetDefaultAsync()”？

我正在尝试使用新的Windows 8 1 服务点 API对于条形码扫描仪如果我打电话GetDefaultAsync 从以下任何位置它返回null App OnLaunched 第一页 Loaded 第一页OnNavigatedTo 第一
直接在默认浏览器中打开Shiny App

通常闪亮的应用程序通过 R Studio 中的内置浏览器打开是否可以直接在网络浏览器例如 Google Chrome 中打开应用程序而无需通过 R Studio 在我的 Rstudio 版本 0 98 1103 中我可以更改运行应
正则表达式匹配 JavaScript 中字符串的全部或初始部分

我正在尝试找出一个正则表达式它将与以下条件匹配我要匹配的字符串 var txt This is Regex 用户可以输入如下内容这个有效 Th 有效这是有效这是Reg 有效这是正则表达式有效 Tis 无效是无效的 Reg
CountDownLatch 与信号量

使用有什么好处吗 java util concurrent CountdownLatch 代替 java util concurrent Semaphore 据我所知以下片段几乎是等效的 1 信号量 final Semaphore sem
使用包含图表 5.5.0 的 JRViewer 报告和 jasper 报告打印

当我使用 JasperReports 创建报告而不使用图表形式 Java 应用程序时我从 jbutton 调用它我在 JRViewer 上收到报告这意味着当我没有在此报告中放入任何图表时我的应用程序会生成报告但一旦我修改此报告并添
当软件包已安装时，Conda 需要 20 多分钟来解决环境问题

当我输入时尝试运行conda update n base conda conda 在解决环境上挂了大约 20 分钟然后返回了一个不包含 conda 更新版本的软件包计划下面提供了退回的包裹计划 NOTE conda update a
使用 C# 以编程方式检测 Windows 登录尝试

我想开发一个 Windows 窗体应用程序来监视我的网络计算机登录注销和登录尝试详细信息并根据检测执行某些操作例如向管理员发送一些通知我尝试过的我读到了有关 Windows 服务 Windows 任务计划程序和使用任务计划程序进行
如何在 Java 中打开 equals 语句以接受多个参数？

我有一个梦想在这个梦中我可以替换这样的结构 if aLongVariableName equals classInstance aPropertyOfThatInstance aLongVariableName equals class
如何使用 swift 4 在 iOS 11 上播放声音？我把 mp3 文件放在哪里？

我看了很多教程但是当我单击按钮激活功能播放声音时声音不播放我看到了 stackoverflow 推荐的代码但什么也没有我把mp3文件信息asset xcasset 这是正确的 SWIFT 4 Xcode 9 1 import
自动将 Excel 文件转换为 Google Sheets

我有一个使用保存电子邮件和附件插件的谷歌帐户 https chrome google com webstore detail save emails and attachmen nflmnfjphdbeagnilbihcodcopheceb
Pandas 无法计算具有重复轴的 isin

我的数据框是这样的 userid codeassigned timestamp 15 553938 M1 1499371200000 15390 527638 M2 1599731200000 15389 521638 M2 1399901

Pandas 无法计算具有重复轴的 isin

Pandas 无法计算具有重复轴的 isin 的相关文章

随机推荐

热门标签