创建一个新列，将相同的索引分配给 Pandas DataFrame 中的重复值[关闭]

2023-11-23

如何生成列出重复值的新列？例如，我的数据框是：

id    color

123   white
123   white
123   white
345   blue
345   blue
678   red

这是所需的输出：

#    id   color

1   123   white
1   123   white
1   123   white 
2   345   blue
2   345   blue
3   678   red

检查与factorize

df['#']=df.id.factorize()[0]+1
df
    id  color  #
0  123  white  1
1  123  white  1
2  123  white  1
3  345   blue  2
4  345   blue  2
5  678    red  3

另一种方法

df.groupby('id').ngroup()+1
0    1
1    1
2    1
3    2
4    2
5    3
dtype: int64

要将其添加到第一个位置：

df.insert(loc=0, column='#', value=df.id.factorize()[0]+1)
df
   #   id  color 
0  1  123  white  
1  1  123  white  
2  1  123  white  
3  2  345   blue  
4  2  345   blue  
5  3  678    red

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Indexing

创建一个新列，将相同的索引分配给 Pandas DataFrame 中的重复值[关闭] 的相关文章

测试交互式Python程序

我想知道python的哪些测试工具支持交互式程序的测试例如我有一个由以下人员启动的应用程序 python dummy program py gt gt Hi whats your name Joseph 我想要仪器Joseph所以我可以
如何在python中确定过去的时区特定日期是否是夏令时？

有没有办法检查特定时区在我指定的日期是否处于夏令时 test dt datetime year 2015 month 2 day 1 pst pytz timezone America Los Angeles test dt pst loc
如何使用 Twython 将 oauth_callback 值传递给 oauth/request_token

Twitter 最近刚刚强制执行以下规定 1 您必须通过oauth callbackoauth request token 的值这不是可选的即使您已经在 dev twitter com 上设置了一个如果您正在执行带外 OAuth 请通
如何复制具有 MySQL 中保留的键和其他结构特征的表？

如何复制保留键和其他结构特征的表包括主键外键和索引这可以通过单个 MySQL 查询来完成吗我正在使用 create table newtable as select 但此方法会使所有键和索引丢失无法使用单个查询来从另一个表复制一个
Colab 的使用限制持续多久？

当我对同一帐户的两个笔记本同时使用两个 GPU 约半小时后 Colab 已 12 小时未运行此消息不断弹出由于 Colab 中的使用限制您当前无法连接到 GPU 自从我上次使用 colab 以来已经过去了大约两个小时但该消息仍然弹出
如何计算查询集中每个项目的两个字段的总和

假设我有以下模型结构 class SomeModel Model base price DecimalField commision DecimalField 我不想存储total price在我的数据库中为了数据一致性并希望将其计算为ba
如何使用 ipywidgets 创建动态依赖下拉菜单？

我创建了一个带有两个下拉菜单的表单我的目标是使一个下拉列表依赖于另一个下拉列表这张图说明了我的目标和目前的情况 https i stack imgur com o9k5G png 下面的示例代码可以在 Google Colab 或 Ju
如何解决CDK CLI版本不匹配的问题

我收到以下错误此 CDK CLI 与您的应用程序使用的 CDK 库不兼容请将CLI升级到最新版本云程序集架构版本不匹配支持的最大架构版本为 8 0 0 但发现为 9 0 0 发出后cdk diff命令我确实跑了npm instal
如何在python mechanize中设置cookie

向服务器发送请求后 br open http xxxx br select form nr 0 br form MESSAGE 1 2 3 4 5 br submit 我得到了响应标题其中包含 set cookie Set Cookie
如何在每次运行 python 程序时添加新列

我希望我的表的第一列作为卷号第二列作为名称每当我运行 python 程序时我想在表中添加一列日期在这个新列中我想填充从 user list 获得的列表将包含值 P A P P 等如何处理我尝试首先通过 alter 命令添加一列
如何不断地将 STDOUT 发送到我的 python TCP 服务器？

我有简单的 python echo 服务器它使用套接字并向客户端回显随机数我有另一个程序每 2 秒将值打印到标准输出如果它只是一个脚本我可以像这样重定向 stdout python script py 并像这样在脚本中获取它da
Python：绘制甘特图的模块

有没有一个好的Python绘图模块甘特图 http en wikipedia org wiki Gantt chart 我试过了开罗情节 http linil wordpress com 2008 09 16 cairoplot 11 但它
Python 中使用 globals() 的原因？

Python 中有 globals 函数的原因是什么它只返回全局变量的字典这些变量已经是全局的所以它们可以在任何地方使用我只是出于好奇而问试图学习Python def F global x x 1 def G print glob
telethon 库：如何通过电话号码添加用户

我正在研究 Telegram 的 Telethon 库它可以使用 Telegram API 充当 Telegram 客户端重要提示这是电报客户端 API https core telegram org telegram api 而不是
Django - 使 ModelForm（ImageField 的）仅接受某些类型的图像

我将 Pillow 2 3 0 与 Django 一起使用并且在 models py 中有一个 ImageField 如下所示 class UserImages models Model user models ForeignKey Us
使用 os.forkpty() 创建一个伪终端以 ssh 到远程服务器并与其通信

我正在尝试编写一个 python 脚本它可以 ssh 到远程服务器并可以从 python 客户端执行 ls cd 等简单命令但是在成功 ssh 到服务器后我无法读取伪终端的输出任何人都可以在这里帮助我以便我可以在服务器上执行一
安塞布尔 + 10.11.6

我在非常干净地安装 10 11 6 时遇到了 Ansible 的奇怪问题我已经安装了brew zsh oh my zsh Lil snitch 和1password 实际上没有安装其他任何东西我安装了ansible brew ins
如何使用 Python 实现并行 gzip 压缩？

使用python压缩大文件 https stackoverflow com questions 9518705 big file compression with python给出了一个很好的例子来说明如何使用例如bz2 纯粹用 Pytho
获取 python 模块的 2 个独立实例

我正在与以非 OO 方式编写的 python 2 x API 进行交互它使用模块全局范围来处理一些内部状态驱动的东西在它不再是单例的情况下需要它并且修改原始代码不是我们的不是一个选择如果不使用单独解释器的子进程运行有什么方法可
Django：显示管理员验证错误的自定义错误消息

我正在使用 Django 1 2 4 我有一个模型其中有一个需要验证的字段当验证失败时我想向用户显示自定义错误消息模型编辑是在管理界面中完成的这就是我目前正在做的事情 def clean fields self exclude N

随机推荐

如何在 Node.js 上使用 Sequelize 进行连接查询

我正在使用sequelize ORM 一切都很棒而且干净但是当我使用它时遇到了问题join查询我有两个模型用户和帖子 var User db seq define User username type db Sequelize STR
为什么不允许 auto 作为函数参数？

From 这个问题很清楚auto不能用作函数参数我的问题是为什么返回类型被允许为auto但函数参数不是 auto function auto data DOES something Since there有很多好处auto进来c 1z
使用 Next js 时在 CSS/SASS 模块中使用 kebab-case CSS 类名

我在 React Next js 中使用 SCSS 模块作为我的组件但我不知道如何导入 kebab case 类目前我只是用驼峰命名法编写所有 SCSS 类但这并不理想因为这意味着我无法使用 SCSS 级联我还在学习 React
超过 Google Directions API 上每个请求 23 个航点的限制（商务/工作级别）

我想使用 Google Directions API 为一家处理冬季扫雪机和夏季景观美化的公司开发路线规划软件客户的要求之一是他能够计算具有至少 30 个最好更多航点的路线根据文档下面引用即使 Google Maps API f
DB2：从表中清除大量记录

我使用 DB2 9 7 FP5 作为 LUW 我有一个包含 250 万行的表我想删除大约 100 万行并且此删除操作分布在整个表中我正在用 5 个删除语句删除数据 delete from tablename where tableky
Figure.show、Figure.canvas.draw 和Figure.canvas.draw_idle 之间有什么区别

在 Matplotlib 中我可以通过调用来更新图中绘图的视觉效果Figure对象说fig并调用该方法show fig show 但我也可以通过致电来做到这一点canvas图中的对象然后调用方法draw fig canvas draw
iOS 如何实现下拉列表以及如何关闭它？

我需要一些关于如何在 iOS 中实现下拉列表类型功能的输入我想到了一些解决方案例如使用UITableView用于显示文本项列表在我的例子中列表可以是静态的也可以是动态的所以UITableView对于我的情况来说似乎是一个不错的选择
在 C++ 中重载比较运算符会导致“无效运算符<”

目前正在尝试在 C 中对对象向量进行排序每个对象都包含一个字符串字符串可以包含字母或数字由于设计限制这是必要的因为比较器可以更改目前该对象的类已重载因此当比较两个对象时将比较它们包含的字符串这在一定程度上是有效的但是
使用 using 指令进行不明确的名称查找

不允许将名称空间和同名的类放入一个声明区域即 namespace A class A 格式不正确参见第 3 3 1 4 节但是可以通过 using 指令引入任一名称 namespace N namespace A int i str
Flutter：应用程序在后台时使用路径提供程序

我目前正在尝试将 FCM 和本地通知实现到我的 Flutter 应用程序中我已成功配置 FCM 和普通通知的本地通知但我还有一种不同类型的通知我想用图像显示当我的应用程序位于前台时通知显示没有错误但是当我终止时应用程序将其移动
使用 AFNetworking 2.0 加载图像

我正在尝试使用 AFNetworking 2 0 将照片添加到 POST 这个 iOS 应用程序将帖子和照片发送到博客我无法弄清楚为什么图像无法加载这是我到目前为止得到的 publish text and image void publ
强制Linux只使用4G以上的内存？

我有一个 Linux 设备驱动程序它连接到一个理论上可以使用 64 位地址执行 DMA 的设备我想测试一下这是否真的有效有没有一种简单的方法可以强制 Linux 机器不使用物理地址 4G 以下的任何内存如果内核映像内存不足也没关系
我可以将显式游标传递给函数/过程以在 FOR 循环中使用吗？

我有一个过程对游标返回的所有记录执行一些计算它看起来有点像这样 PROCEDURE do calc id table id column TYPE IS CURSOR c IS SELECT col1 col2 col3 FROM tab
为什么 ASP.NET MVC 项目的 Content 文件夹中不包含 Scripts 文件夹？

出于好奇我想知道在 ASP NET MVC 项目中是否有合理的理由将 Scripts 文件夹设置为 Contents 文件夹的子文件夹 Contents 文件夹通常包含样式表和图像出于某种原因我认为在其中也包含 Scripts 文件夹
Excel VBA - 解释“N/A”值

我正在遍历一个电子表格其中包含一列价格其形式为double类型我试图找到电子表格中显示的缺失值 n a 但这并不让我将其解释为string type 该细胞含有 n a 似乎是一个integer类型我怎样才能读到这个如果您只想检查
Boost.Thread 3.0.0 中的重大变化

在 Boost 库 1 50 0 版本的发行说明中我注意到两个重大更改 see here 6266 重大更改如果可连接线程析构函数应调用终止 6269 重大更改如果可连接线程移动分配应调用终止这对于我当前使用 Boost 1 4
动态更改@ManagedResource objectName

我正在以编程动态方式创建原型 bean 我希望启动后这些 bean 位于 jmx 控制台中我如何区分它们我正在使用注释来将我的 bean 添加到 jmx 中并且我有 ManagedResource objectName bean n
IsValid() 是否可以防止 XSS？

是否使用已验证验证电子邮件地址或 URL 格式以防止 XSS 当指定其他格式时它会否定 XSS 吗有效的 URL 仍然可以包含攻击向量
是否有免费的 Xml 差异/合并工具可用？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心以获得指导我的 net 应用程序中有
创建一个新列，将相同的索引分配给 Pandas DataFrame 中的重复值[关闭]

Closed 这个问题需要细节或清晰度目前不接受答案如何生成列出重复值的新列例如我的数据框是 id color 123 white 123 white 123 white 345 blue 345 blue 678 red 这是所需

创建一个新列，将相同的索引分配给 Pandas DataFrame 中的重复值[关闭]

创建一个新列，将相同的索引分配给 Pandas DataFrame 中的重复值[关闭] 的相关文章

随机推荐

热门标签