Python数据框根据其他id列创建索引列

2024-01-05

我有一个像这样的数据框：

ID                  Price
000afb96ded6677c    1514.5
000afb96ded6677c    13.0
000afb96ded6677c    611.0
000afb96ded6677c    723.0
000afb96ded6677c    2065.0
ffea14e87a4e1269    2286.0
ffea14e87a4e1269    1150.0
ffea14e87a4e1269    80.0
fff455057ad492da    650.0
fff5fc66c1fd66c2    450.0

我需要一个从 1 迭代到任意多行的 ID 列，但我需要它像下面的代码一样：

ID                  Price    ID 2
000afb96ded6677c    1514.5   1
000afb96ded6677c    13.0     1
000afb96ded6677c    611.0    1
000afb96ded6677c    723.0    1
000afb96ded6677c    2065.0   1
ffea14e87a4e1269    2286.0   2
ffea14e87a4e1269    1150.0   2
ffea14e87a4e1269    80.0     2
fff455057ad492da    650.0    3
fff5fc66c1fd66c2    450.0    4

Try groupby ngroup https://pandas.pydata.org/docs/reference/api/pandas.core.groupby.GroupBy.ngroup.html#pandas-core-groupby-groupby-ngroup + 1 :

df['ID_2'] = df.groupby('ID').ngroup() + 1

Or with Rank https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.rank.html#pandas-series-rank:

df['ID_2'] = df['ID'].rank(method='dense').astype(int)

Or with pd.factorize https://pandas.pydata.org/pandas-docs/dev/reference/api/pandas.factorize.html:

df['ID_2'] = pd.factorize(df['ID'])[0] + 1

df:

                 ID   Price  ID_2
0  000afb96ded6677c  1514.5     1
1  000afb96ded6677c    13.0     1
2  000afb96ded6677c   611.0     1
3  000afb96ded6677c   723.0     1
4  000afb96ded6677c  2065.0     1
5  ffea14e87a4e1269  2286.0     2
6  ffea14e87a4e1269  1150.0     2
7  ffea14e87a4e1269    80.0     2
8  fff455057ad492da   650.0     3
9  fff5fc66c1fd66c2   450.0     4

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

NumPy

Indexing

Python数据框根据其他id列创建索引列的相关文章

Matplotlib 图例，跨列添加项目而不是向下添加项目

对于下面的简单绘图有没有办法让 matplotlib 填充图例以便它从左到右填充行而不是第一列然后第二列 gt gt gt from pylab import gt gt gt x arange 2 pi 2 pi 0 1 gt gt
类型错误：“datetime.datetime”和“str”的实例之间不支持“>”

我是 python 日期和时间类型的新手我有一个日期值 date 2018 11 10 10 55 31 00 00 我需要检查该日期值是否超过 90 天我试过 from datetime import datetime from da
无法在 virtualenv 中安装 libxml2

我有一个问题libxml2蟒蛇模块我正在尝试将其安装在python3 虚拟环境使用以下命令 pip install libxml2 python3 但它显示以下错误 Collecting libxml2 python3 Using cac
用 Python 绘制直方图

我有两个列表 x 和 y x 包含字母表 A Z Y 包含它们在文件中的频率我尝试研究如何在直方图中绘制这些值但在理解如何绘制它方面没有成功 n bins patches plt hist x 26 normed 1 facecolor
在 Linux 上使用多处理时，TKinter 窗口不会出现

我想生成另一个进程来异步显示错误消息同时应用程序的其余部分继续我正在使用multiprocessingPython 2 6 中的模块来创建进程我试图用以下命令显示窗口TKinter 这段代码在Windows上运行良好但在Linux上
将 window.location 传递给 Flask url_for

我正在使用 python 在我的页面上当匿名用户转到登录页面时我想将一个变量传递到后端以便它指示用户来自哪里发送 URL 因此当用户单击此锚链接时 a href Sign in a 我想发送用户当前所在页面的当前 URL
通过 Python 循环浏览网络上的目录并显示其内容（文件和其他目录）

同样的道理在Python中处理从源目录到目标目录的一组文件 https stackoverflow com questions 2593399 process a set of files from a source directory t
SQL Server 中离线索引重建和在线索引重建有什么区别？

重建索引时有一个选项ONLINE OFF and ONLINE ON 我知道当ONLINE模式打开时它会复制索引切换新查询以利用它然后重建原始索引使用版本控制跟踪两者的更改如果我错了请纠正我但是 SQL 在离线模式下会做什么
Python-验证我的文档 xls 中是否存在工作表

我正在尝试在空闲时间设计一个小程序加载 xls 文件然后在要扫描的文档中选择一张纸步骤1 用户导入 xls文件导入程序后检查文件是否存在我能做到的第 2 步我要求用户提供要分析的文档表 xls 的名称这就是它停止的地方该程
使用 if 语句的网格网格和用户定义函数的真值不明确

假设我有一个函数f x y 足够光滑然而有些值仅在有限的意义上存在以sin x x的价值x 0只存在于极限 x gt 0 中在一般情况下我用一个来处理这个问题if陈述如果我在情节中使用它meshgrid我收到一条错误消息 Val
Python 属性和 Swig

我正在尝试使用 swig 为一些 C 代码创建 python 绑定我似乎遇到了一个问题试图从我拥有的一些访问器函数创建 python 属性方法如下 class Player public void entity Entity enti
是否可以在Python中将日+月（不是年）与当前日+月进行比较？

我正在获取 5 月 10 日格式的数据我试图弄清楚它是今年还是明年该日期仅一年因此 5 月 10 日表示 2015 年 5 月 10 日而 5 月 20 日表示 2014 年 5 月 20 日为此我想将字符串转换为日期格式并进
如何按 pandas 中的值对系列进行分组？

我现在有一只熊猫Series与数据类型Timestamp 我想按日期对其进行分组并且每组中有许多行具有不同的时间看似显而易见的方法类似于 grouped s groupby lambda x x date 然而熊猫的groupby按索
如何通过 Python Requests 库使用基本 HTTP 身份验证？

我正在尝试在 Python 中使用基本的 HTTP 身份验证我正在使用Requests https docs python requests org 图书馆 auth requests post http hostname auth HT
从迭代器外部将 StopIteration 发送到 for 循环

有几种方法可以打破一些嵌套循环他们是 1 使用中断继续 for x in xrange 10 for y in xrange 10 print x y if x y gt 50 break else continue only exec
是否可以使用 Anaconda 包作为 Google Cloud Functions 的依赖项？

我正在使用 Python 运行时编写 Google Cloud Function 我需要包含一些无法使用的依赖项pip 如文档中所述here https cloud google com functions docs writing spe
Python：如何在不先创建整个列表的情况下计算列表的总和？

通常我们必须 1 声明一个列表 2 使用以下方法计算该列表的总和sum 但现在我希望指定一个以 1 开头间隔为 4 100 个元素的列表如下所示 1 5 9 13 17 21 25 29 33 37 我不想涉及数学公式所以 1 如何在
MoviePY 无法在 Windows 上检测 ImageMagick 二进制文件

我刚买了一台新笔记本电脑想要设置MoviePY在那新的Windows 64x Python3 7 0 机器我对所有内容都进行了三次检查但是当涉及到我的代码的文本部分时它向我抛出了这个错误 OSError MoviePy Error
如何同时接受int和float类型的输入？

我正在制作一个货币转换器如何让 python 同时接受整数和浮点数我就是这样做的 def aud brl amount From to ER 0 42108 if amount int if From strip aud and to
基于值的 matplotlib 条形图颜色

有没有一种方法可以根据条形图的值对条形图的条形进行着色例如 values below 0 5 red values between 0 5 to 0 green values between 0 to 08 blue etc 我找到了一些

随机推荐

地图的联合迭代器？

Preface 关联 C 容器例如std map有点像只有一个键列的微型数据库升压的bimap将其提升为一个两列表在两列中都进行查找但这就是类比没有 polymap 来概括这个想法无论如何我想继续将地图视为数据库现在我想知道
普通 es6 类和扩展 React.Component 有什么区别

我在用着反应全栈 https github com kriasoft react starter kit作为开始我的项目的脚手架我发现它的示例代码与官方的 React 文档有很大不同示例代码是这样的 withStyles styles
当我有 UTC 偏移时如何创建 tzinfo？

我有一个时区与 UTC 的偏移量以秒为单位 19800 并且也有字符串格式 0530 我如何使用它们来创建一个tzinfo实例我调查了pytz 但在那里我只能找到以时区名称作为输入的 API 对于 Python 3 2 或更高版本您可
如何使用 powershell 脚本替换文本文件中的值

我的文件包含以下数据无标题 DEPOSIT ADD 123456789 VALUE VARIABLE NNNN VALUEVARIABLE DEPOSIT ADD 234567890 VALUE P75 NNNN VALUEVARIABL
关闭汞分支机构

使用时hg branch FeatureBranchName并将其发布到开发人员之间共享的中央存储库有没有办法最终关闭FeatureBranchName它的开发何时正式与默认分支合并如果FeatureBranchName执行时不可见hg
使用名称jquery通过索引获取id值

html
TFS 回滚与“获取此版本”

回滚和获取此版本有什么区别它们都让我返回到特定版本并从那里进行更改和签入两者兼备有什么额外好处 Get specific version Get this version 仅影响您的本地工作区它将所有本地更改恢复为旧版本当您尝
在我的 rspec 中找不到访问方法

我的 java web 应用程序运行在 tomcat 上http localhost 8080 com http localhost 8080 编写我的第一个规范 home spec require spec helper describe
Paypal使用POST方式返回

我正在尝试使用沙盒帐户测试 Paypal 第三方购物车按钮该按钮如下所示
tr1::mem_fn 和具有默认参数的成员

我的类有一个带有默认参数的成员函数 struct Class void member int n 0 通过 std tr1 mem fn 我可以调用它 Class object std tr1 mem fn Class member obj
如何在具有 URL 外观的 TextView 中呈现文本

请问如何渲染文本TextView具有类似于 URL 的外观带下划线的蓝色文本它可以与常规文本混合显示为纯文本吗当我点击它时它就会启动WebView加载该网址 Check autoLink http developer andro
dyld：未加载库：@rpath/libswiftCore.dylib。问题仍然存在

我知道这个问题已经被回答过好几次了但是当我为 IOS 8 1 编写 Swift 应用程序时我一直无法找到此错误的正确解决方案 dyld 未加载库 rpath libswiftCore dylib 引用自 private var mobi
在SAS中运行程序的热键？

我知道在 R 中我可以使用 control r 来运行我的程序代码我想知道 SAS 中是否有等效的热键如果没有有没有办法将其编程到 SAS 中运行提交程序的默认热键是 F8 键如果您使用的是 Base SAS 不是 EG
Maven exec:java run可执行插件依赖jar导致NPE

我正在制作一个使用 sparql 端点服务的 Maven 应用程序我想要一个 Maven 目标来下载 sparql 端点并启动服务但似乎 Maven 在配置类路径方面存在一些问题我正在使用 blazegraph 及其工件https m
java.lang.ArrayIndexOutOfBoundsException：RSA 块的数据过多

我正在使用 RSA 加密文本和解密文本公钥和私钥是使用openssl工具生成的解密数据时遇到 java lang ArrayIndexOutOfBoundsException too much data for RSA block 异常
IIS 将 MVC 中的静态文件理解为动态内容

通过使用 httpCompression 我意识到 IIS 将 MVC 中的静态文件理解为动态内容因此即使您勾选了启用静态内容压缩但不要勾选启用动态内容压缩 IIS 将返回 css and js未压缩的文件 GET MVCX Con
以非 root 用户身份以编程方式删除 Linux 缓存

出于测试目的我可以通过写入 Linux 中 procfs 下的 drop caches 文件来删除缓存内存我只能以 root 身份执行此操作这是在嵌入式 Linux 上所以没有 sudo sync echo 3 gt proc sy
Razor 视图引擎 - 如何添加部分视图

我想知道如果可能的话使用新的剃刀视图引擎渲染局部的最佳方法是什么我知道这件事当时还没有完全完成现在我正在使用 RenderPage 来呈现用户控件 RenderPage Views Shared LocaleUserControl c
什么是？ ... ： ... 做？ [复制]

这个问题在这里已经有答案了 items isset POST items POST items array 我不明白这段代码的最后一个片段 POST items array 该代码组合到底有什么作用我用它从 html 文本框中获取一堆值并
Python数据框根据其他id列创建索引列

我有一个像这样的数据框 ID Price 000afb96ded6677c 1514 5 000afb96ded6677c 13 0 000afb96ded6677c 611 0 000afb96ded6677c 723 0 000afb9

Python数据框根据其他id列创建索引列

Python数据框根据其他id列创建索引列 的相关文章

随机推荐

热门标签

Python数据框根据其他id列创建索引列的相关文章