如何删除pandas中每组的第一行

2024-03-05

我有一个像这样的数据框：

   id  values
0   1       3
1   1       6
2   1       3
3   2       7
4   2       6
5   2       3
6   2       9

我想根据删除每组的第一行id，结果应该是这样的：

   id  values
1   1       6
2   1       3
4   2       6
5   2       3
6   2       9

我尝试通过以下方式完成：df = df.groupby('id').agg(lambda x:x[1:])，但它不起作用。

有人可以帮助我吗？提前致谢

Use apply http://pandas.pydata.org/pandas-docs/stable/generated/pandas.core.groupby.GroupBy.apply.html with iloc:

df = df.groupby('id', group_keys=False).apply(lambda x:x.iloc[1:])
#also working, not sure if generally
#df = df.groupby('id', group_keys=False).apply(lambda x:x[1:])
print (df)
   id  values
1   1       6
2   1       3
4   2       6
5   2       3
6   2       9

Or duplicated http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.duplicated.html with boolean indexing http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-indexing:

df = df[df['id'].duplicated()]
print (df)
   id  values
1   1       6
2   1       3
4   2       6
5   2       3
6   2       9

Detail:

print (df['id'].duplicated())
0    False
1     True
2     True
3    False
4     True
5     True
6     True
Name: id, dtype: bool

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

如何删除pandas中每组的第一行的相关文章

numpy python 中的“AttributeError：'matrix'对象没有属性'strftime'”错误

我有一个维度为 72000 1 的矩阵该矩阵涉及时间戳我想使用 strftime 如下所示 strftime d m y 为了得到像这样的输出 11 03 02 我有这样一个矩阵 M np matrix timestamps 我使用了
在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
从sklearn PCA获取特征值和向量

如何获取 PCA 应用程序的特征值和特征向量 from sklearn decomposition import PCA clf PCA 0 98 whiten True converse 98 variance X train clf f
Python tkinter.filedialog Askfolder 干扰 clr

我主要在 Spyder 中工作构建需要弹出文件夹或文件浏览窗口的脚本下面的代码在spyder中完美运行在 Pycharm 中 askopenfilename工作良好同时askdirectory什么都不做卡住了但是如果在调试模式
根据 Pandas 中的列表对多列进行排序

感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
更改 x 轴比例

我使用 Matlab 创建了这个图使用 matplotlib x 轴绘制大数字例如 100000 200000 300000 我想要 1 2 3 和 10 5 之类的值来指示它实际上是 100000 200000 300000 有没有一
如何使用 javascript/jquery/AJAX 调用 Django REST API？

我想使用 Javascript jQuery AJAX 在前端调用 Django Rest API 请求方法是 POST 但当我看到 API 调用它的调用 OPTIONS 方法时所以我开始了解access control allow o
Pandas：如何将数据框插入 Clickhouse

我正在尝试将 Pandas 数据框插入 Clickhouse 这是我的代码 import pandas import sqlalchemy as sa uri clickhouse default localhost default ch
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
揭秘sharedctypes性能

在 python 中可以在多个进程之间共享 ctypes 对象然而我注意到分配这些对象似乎非常昂贵考虑以下代码 from multiprocessing import sharedctypes as sct import ctypes
对使用 importlib.util 导入的对象进行酸洗

我在使用Python的pickle时遇到了一个问题我需要通过将文件路径提供给 importlib util 来加载一些 Python 模块如下所示 import importlib util spec importlib util sp
Pandas 堆积条形图中元素的排序

我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息我使用 groupby 按地区对数据框中的信息进行排序 df df orig groupby District Portion of income value co
Django - 提交具有同一字段多个输入的表单

预警我对 Django 以及一般的 Web 开发非常陌生我使用 Django 托管一个基于 Web 的 UI 该 UI 将从简短的调查中获取用户输入通过我用 Python 开发的一些分析来提供输入然后在 UI 中呈现这些分析的可视
在 Windows 上使用带有对数刻度的 matplotlib 时出现 Unicode 错误

我正在使用 python 2 6 和 matplotlib 如果我运行 matplotlib 库页面中提供的示例 histogram demo py 它工作正常我已经大大简化了这个脚本 import numpy as np import
以编程方式使用 Sphinx 特定指令解析 .rst 文件

我希望能够在 Python 中解析基于 sphinx 的 rst 以便进一步处理和检查就像是 import sphinx p sphinx parse path to file rst do something with p 似乎在 do
Python对象初始化性能

我只是做了一些快速的性能测试我注意到一般情况下初始化列表比显式初始化列表慢大约四到六倍这些可能是错误的术语我不确定这里的行话例如 gt gt gt import timeit gt gt gt print timeit timeit
PIL - 需要抖动，但限制调色板会导致问题

我是 Python 新手正在尝试使用 PIL 来执行 Arduino 项目所需的解析任务这个问题涉及到Image convert 方法以及调色板抖动等选项我有一些硬件能够一次仅显示 16 种颜色的图像但它们可以指定为 RGB 三元
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
python 中的 after() 与 update()

我是 python 新手开始使用 tkinter 作为画布到目前为止我使用 update 来更新我的画布但还有一个 after 方法谁能给我解释一下这个函数请举个例子两者之间有什么区别 root after integer c

随机推荐

在 JavaScript 中插入连字符

在 JavaScript 中插入连字符的最简单方法是什么我有一个电话号码例如 1234567890 在前端显示时我必须将其显示为123 456 7890使用 JavaScript 实现这一目标的最简单方法是什么最快的方法是使用一些正
沿着多线以匀称的方式插值每个 X 距离

如果我有一个形状优美的多线对象其中包含许多线每条线的总长度为 50km 从原点追踪时并且我想沿着多线每 X 米假设 100m 进行插值每 100m 返回形状优美的点对象如何我能实现这个目标吗这是我到目前为止所得到的但它只返回
将 MSTest 与 F# 结合使用

是否可以在 VS2010 中将 MSTest 与 F 一起使用人们已经多次问过这个问题但我似乎无法在答案中找到解决方案有人能够使用 MSTest 进行 F 单元测试吗还是我应该坚持使用 NUnit 是的您可以在 VS2010 中将
使用文件名参数批量插入[重复]

这个问题在这里已经有答案了我需要将数千个数据文件加载到 SQL Server 表中因此我编写了一个只接收一个参数文件名的存储过程但是以下内容不起作用编译器抱怨 FileName参数它只需要纯字符串如 file txt 提
jasmine angularjs 测试 - 参数“PhoneListCtrl”不是函数，未定义

When running an angularjs Jasmine Karma test I got following error 我的测试脚本是 describe PhoneCat controllers function descri
嵌入可执行文件中的 Qt 图标

我的选项卡小部件上有一些按钮这些按钮顶部需要有一些图标我知道 QPixmap 允许我将图像放在按钮顶部但我看到这些构造函数将文件路径作为参数我想避免在构建后在文件中拖动图标我想以某种方式将这些图标嵌入到可执行文件中以减少为了使其
JavaDocs 抛出 IllegalArgumentException

我正在使用 Intellij Idea 当我生成 JavaDocs 通过工具 gt 生成 JavaDoc 时我会抛出一个 IllegealArgumentException 异常但没有任何有关发生问题的信息即使没有 JavaDoc
pytest：无法模拟我的班级的 __init__

我有一个习惯Db类具有基本操作我正在尝试围绕它编写测试在 init 在我的班级中我正在连接到我想避免的实际数据库因为我只是编写单元测试不需要连接到实际数据库这是我的代码 mock patch mydb Db pytest ma
调试服务

我编写了一个带有远程接口的服务并将其安装在我的 PC 的 Eclipse AVD 上我有一个客户端测试工具它启动并调用服务中的方法最初我通过控制类和活动安装了该服务现在我已将其删除因此该服务的清单如下所示
请求中的 URL 超出最大重试次数

我正在尝试获取以下内容应用商店 gt 商业 https itunes apple com in genre ios business id6000 mt 8 import requests from lxml import html pag
Crystal Reports 文本截断详细信息部分中的最后一行

我有一个 Crystal Report 11 文件它是一封信第一个详细信息部分包含一个大文本框其中包含打印日期地址块和称呼行每隔一段时间文本框的最后一行就会被切断这样就看不到称呼了这是非常不一致的因为有时我为系统中的一个
BlackBerry 中的图像按钮

如何在 BlackBerry 中实现图像按钮在这里完整的代码 import net rim device api system Bitmap import net rim device api ui Graphics import ne
Python 将 args 转换为 kwargs

我正在编写一个装饰器它需要在调用它正在装饰的函数之前调用其他函数装饰函数可以具有位置参数但装饰器将调用的函数只能接受关键字参数有人有一种将位置参数转换为关键字参数的便捷方法吗我知道我可以获得修饰函数的变量名列表 gt gt gt
正确的 javascript 继承

我读了很多关于 javascript 中继承的文章其中一些使用new当其他人推荐时Object Create 我读得越多就越感到困惑因为似乎存在无数的变体来解决继承问题有人可以向我展示最受接受的方式或者事实上的标准如果有的话
为什么动态更新 DOM 时 html 源不会改变

我之前发过一个问题jQuery 在 IE 8 和 FF 3 5 8 中设置只读属性不一致 https stackoverflow com questions 2381621 jquery inconsistency in setting r
@error 指令不在 Laravel 视图中显示错误

我正在研究自定义 Laravel 登录实现我已从控制器返回错误如下所示 credentials request gt only email password if Auth attempt credentials Authenticat
如何在android上获取处理器编号

大家好我想获取android上的处理器编号我可以这样做吗 int processporNum sysconf SC NPROCESSORS CONF 但每次在我的某些手机上返回值都是1 所以我不确定这个方法是否正确是否有其他API可以
matplotlib 绘图沿绘图线的标签

matplotlib 社区的一份假设我有一条直线 plot 37 45 0 67778 0 67778 k lw 1 2 我可以沿着线而不是在图例中向该线添加标签吗即类似于以下内容但不是等高线图只是普通的线图下面是一个例子只是
OpenSSl + PHP如何实现[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我需要在项目中使用 openSSL
如何删除pandas中每组的第一行

我有一个像这样的数据框 id values 0 1 3 1 1 6 2 1 3 3 2 7 4 2 6 5 2 3 6 2 9 我想根据删除每组的第一行id 结果应该是这样的 id values 1 1 6 2 1 3 4 2 6 5 2

如何删除pandas中每组的第一行

如何删除pandas中每组的第一行 的相关文章

随机推荐

热门标签

如何删除pandas中每组的第一行的相关文章