Pandas - 根据条件重复行

2023-11-23

如果该行满足条件，我试图创建一个重复的行。在下表中，我根据 groupby 创建了累积计数，然后对 groupby 的 MAX 进行了另一个计算。

df['PathID'] = df.groupby(DateCompleted).cumcount() + 1
df['MaxPathID'] = df.groupby(DateCompleted)['PathID'].transform(max)

Date Completed    PathID    MaxPathID
1/31/17           1         3
1/31/17           2         3
1/31/17           3         3
2/1/17            1         1
2/2/17            1         2
2/2/17            2         2

在本例中，我只想复制 2017 年 2 月 1 日的记录，因为该日期只有一个实例（即 MaxPathID == 1）。

期望的输出：

Date Completed    PathID    MaxPathID
1/31/17           1         3
1/31/17           2         3
1/31/17           3         3
2/1/17            1         1
2/1/17            1         1
2/2/17            1         2
2/2/17            2         2

提前致谢！

我想你需要得到unique行按Date Completed进而concat原始行：

df1 = df.loc[~df['Date Completed'].duplicated(keep=False), ['Date Completed']]
print (df1)
  Date Completed
3         2/1/17

df = pd.concat([df,df1], ignore_index=True).sort_values('Date Completed')
df['PathID'] = df.groupby('Date Completed').cumcount() + 1
df['MaxPathID'] = df.groupby('Date Completed')['PathID'].transform(max)
print (df)
  Date Completed  PathID  MaxPathID
0        1/31/17       1          3
1        1/31/17       2          3
2        1/31/17       3          3
3         2/1/17       1          2
6         2/1/17       2          2
4         2/2/17       1          2
5         2/2/17       2          2

EDIT:

print (df)
  Date Completed  a  b
0        1/31/17  4  5
1        1/31/17  3  5
2        1/31/17  6  3
3         2/1/17  7  9
4         2/2/17  2  0
5         2/2/17  6  7

df1 = df[~df['Date Completed'].duplicated(keep=False)]
#alternative - boolean indexing by numpy array
#df1 = df[~df['Date Completed'].duplicated(keep=False).values]
print (df1)
  Date Completed  a  b
3         2/1/17  7  9

df = pd.concat([df,df1], ignore_index=True).sort_values('Date Completed')
print (df)
  Date Completed  a  b
0        1/31/17  4  5
1        1/31/17  3  5
2        1/31/17  6  3
3         2/1/17  7  9
6         2/1/17  7  9
4         2/2/17  2  0
5         2/2/17  6  7

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

groupby

duplicates

Pandas - 根据条件重复行的相关文章

我应该为 MySQL 使用什么 python 3 库？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案据我所知 MySQLdb 仍然没有移植到 Python 3 pypy 上似乎有另一个名为 PyMySQL
如何使用 HTTP 标头发送非英语 unicode 字符串？

我是 HTTP 相关问题的新手我的问题是在 iOS 开发中我想使用 HTTP 标头发送一个字符串所以我使用 httpRequest setValue nonEnglishString forHTTPHeaderField custom
Django 未在 404 页面上应用应用程序中的 CSS 文件

姜戈3 0 8 Python 3 7 x 我有一个包含一些应用程序的 Django 项目我正在尝试为 400 403 404 500 错误制作一些默认错误页面我已经这样做了并显示了适当的模板但没有任何样式或 JS 在 404 错
turtle.Screen().screensize() 未输出正确的屏幕尺寸[重复]

这个问题在这里已经有答案了我编写了一些代码来在屏幕周围随机放置点但是它并没有覆盖整个屏幕 import turtle import random t turtle Turtle color red green blue pink ye
检测/删除 Python 2 + GTK 中不成对的代理字符

在Python 2 7中我可以成功转换Unicode字符串 abc udc34xyz 转换为 UTF 8 结果是 abc xed xb0 xb4xyz 但是当我将 UTF 8 字符串传递给例如时 pango parse markup or
如何使用 xlrd 将新列和行添加到 .xls 文件

如何向 xlrd 中的工作表添加新列和或行我有一个使用 open workbook 读取的 xls 文件我需要在第一张表中添加一个新列 bouncebacks 然后在该表中添加新行但我在 xlrd 文档中找不到任何显示如何添加新行和
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
如何绘制多类分类器的精度和召回率？

我正在使用 scikit learn 我想绘制精度和召回曲线我正在使用的分类器是RandomForestClassifier scikit learn 文档中的所有资源都使用二元分类另外我可以绘制多类的 ROC 曲线吗另外我只找到
如何测试列表中多个值的成员资格

我想测试两个或多个值是否在列表中具有成员资格但我得到了意外的结果 gt gt gt a b in b a foo bar a True 那么 Python 可以同时测试列表中多个值的成员资格吗这个结果意味着什么 See also How
如何修改 contenteditable 元素的innerHTML

我使用 Selenium 与 Chrome driver 和 python3 6 来测试网站我在网页中有代码片段如下 div class 3F6QL 2WovP div class 39LWd Type a message div div
Python：帮助（numpy）在退出时导致段错误

我遇到了一个奇怪的现象在 python 解释器中我执行以下操作 gt gt gt import numpy gt gt gt help numpy 帮助显示正确但一旦我按 q 返回解释器 Segmentation fault core
Scrapy的redirect_urls异常.KeyError

我是 Scrapy 和 Python 的新手最近推出了我的第一个蜘蛛有一个功能似乎以前有效但现在它只适用于我试图废弃的一些网站代码行是 item url direct response request meta redirect u
如何使用 pygame.mixer 重复音乐？

我创建了以下使用 pygame mixer 播放 mp3 音乐的代码然而音乐不会重复有什么想法可以让音乐重复播放吗这是代码 playlist list playlist append put music here mp3 playl
当价格低于阈值时使用 pandas DataFrame 实施矢量化止损

给出这个示例数据框 date close signal positions 2017 01 02 27 90 0 0 0 0 2017 01 03 27 76 0 0 0 0 2017 01 04 28 65 1 0 1 0 2017 01
Scrapy 抓取并跟踪 href 中的链接

我对 scrapy 很陌生我需要从 url 的主页跟踪 href 到多个深度再次在 href 链接内我有多个 href 我需要遵循这些href 直到到达我想要抓取的页面我的页面的示例 html 是初始页 div class page
如何保持 python 3 脚本 (Bot) 运行

不是母语英语抱歉英语可能很蹩脚我也是编程新手您好我正在尝试使用 QueryServer 连接到 TeamSpeak 服务器来创建机器人经过几天的努力它有效只有 1 个问题而我却被这个问题困扰了如果您需要检查这是我正在使
Pip 突然使用了错误版本的 Python

在 os x 上使用 pip 时遇到一个奇怪的问题据我所知快速查看我的 bash history 似乎可以确认我最近没有对我的配置进行任何更改唉 pip 命令似乎突然使用了与以前不同的 python 版本到目前为止我使用命令 p
如何配置 Eclipse 在使用 Pydev 插件选择“运行”或“调试”时启动浏览器

我正在使用 Eclipse Pydev 插件学习 Python 和 Django 当我按运行或调试时我希望内部或外部浏览器使用 URL http 127 0 0 1 启动或刷新我见过用 PHP 插件完成的但没有用 Pydev
VSCode无法切换matplotlib后端：ImportError：无法加载需要“qt5”交互框架的后端“Qt5Agg”

我只想通过在 VSCode 中运行 Python 来进行绘图但结果失败了我无法将后端从 agg 切换到 Qt5Agg 但是我可以在 VSCode 的终端中轻松执行此操作 VSCode集成终端中的问题如下所示我尝试了各种解决方案但失败

随机推荐

Linux 中的“find -exec”shell 函数

有没有办法得到find执行我在 shell 中定义的函数例如 dosomething echo Doing something with 1 find exec dosomething 其结果是 find dosomething No s
在android中实现徒手裁剪

我正在尝试使用画布在 Android 中实现徒手裁剪我用drawPath并将其存储在列表中并将其绘制在画布路径绘图中像这样但现在我想用这段代码使该路径中的所有像素都位于侧面区域但我不知道该怎么做 public Bitmap getB
文件上传作为带有其他字段的表单的一部分

我有一个 ASP NET MVC 网站我需要一个页面用户必须在其中输入多个字段包括图像文件我可以找到很多很多使用 MVC 上传文件的参考资料但他们不会将文件作为包含其他字段的表单的一部分上传理想情况下字段和文件将发送到单个控制
单击启动器图标时恢复上次活动

正如我所看到的当单击启动器图标时大多数应用程序都会恢复上次活动然而这似乎不是默认行为在我的应用程序启动器活动中单击启动器图标时总是启动当单击启动器图标并且应用程序已经运行时如何配置我的应用程序以恢复上次活动 Problem
python 检查序列中的位是真还是假

我想知道序列中的某个位是 1 还是 0 真或假如果我有 11010011 的一些子序列我如何检查第四个位置是 True 还是 False example 10010101 4th bit gt False 10010101 3rd bi
为派生类提供模板专业化的最简单方法

我有以下场景 class my base class my derived public my base template
Collections.binarySearch() 与 List indexOf()

我有超过 37K 项的列表并且我已经实施了hashCode equals 所以我想知道Collections binarySearch 可以帮助提高性能并且比indexOf method 如果您的收藏已排序 binarySearch 将是
JavaScript 中的双感叹号运算符和 Boolean() 有什么区别？ [复制]

这个问题在这里已经有答案了我知道 variable将变量转换为布尔值和函数Boolean 根据 ecma262 规范还将通过调用执行类型转换ToBoolean value 我的问题是有什么区别是性能比 Boolean 更好它们是
我是否必须在每个页面添加“<%@ Register assembly=”？

我升级了 DevExpress 组件但在我的应用程序中我必须更改每个组件是的看http we
C# 中的静态类

在回答这个问题时 https stackoverflow com questions 352317 c coding question 352327 这让我想知道将静态类视为等同于实现单例模式的非静态类实例是否存在任何危险对我来说唯一显
控件的自定义设计器

我有一个派生自 SplitContainer 的自定义类 namespace Builder Components public partial class ProjectSidebar SplitContainer public Proj
获取画布中的鼠标位置[重复]

这个问题在这里已经有答案了有没有办法获得鼠标的位置
C 中的完美数

我需要编写一个 C 程序来找到完美数 main int n 1000 sum 0 for int num 1 num lt n num sum 0 for int i 1 i lt num i if num i sum i if sum n
如何在 Windows 中的 git-bash 中执行位于带空格的文件夹（即“Program Files”）中的命令？

当我使用 git bash 时我有时想调用我的命令 PATH 实际上在我的 PATH 但如果该命令位于包含空格的文件夹中的某个位置则它将无法运行例如如果程序打开C Program Files whatever aCmd exe我输
动态增加java堆空间

我编写了一个 java 程序用于测试具有不同数量处理器的不同机器上的几个多线程算法的速度在某些机器上合并排序会失败因为它需要相当大的堆空间才能处理非常大的数组我可以在运行程序之前轻松地自己更改 java 堆空间但我觉得更健壮且
泛型类的类对象（java）

java中有没有一种方法可以获取类似的实例Class
如何在 Java Swing 中创建窗口关闭处理程序

我试图在我的窗口使用 Java Swing 创建的关闭时调用一个函数来进行清理在我的初始化代码中我这样做 public class FormLogin extends JFrame private void initComponent
为什么@RequestMapping注解在java中接受String参数，但在scala中不接受？

阅读 RequestMapping文档 http static springsource org spring docs 2 5 x api org springframework web bind annotation RequestMa
Eclipse 内容辅助错误

最近我在 Eclipse 中的内容辅助方面遇到了越来越多的问题在我的一些项目中我没有从内容协助中得到任何建议而在其他项目中我得到了部分或全部预期的建议通常 Eclipse 中不会出现错误但下面是我收到错误时的一个示例内容辅
Pandas - 根据条件重复行

如果该行满足条件我试图创建一个重复的行在下表中我根据 groupby 创建了累积计数然后对 groupby 的 MAX 进行了另一个计算 df PathID df groupby DateCompleted cumcount 1 d

Pandas - 根据条件重复行

Pandas - 根据条件重复行 的相关文章

随机推荐

热门标签

Pandas - 根据条件重复行的相关文章