创建一个新列,将相同的索引分配给 Pandas DataFrame 中的重复值[关闭]

2023-11-23

如何生成列出重复值的新列?例如,我的数据框是:

id    color

123   white
123   white
123   white
345   blue
345   blue
678   red

这是所需的输出:

#    id   color

1   123   white
1   123   white
1   123   white 
2   345   blue
2   345   blue
3   678   red

检查与factorize

df['#']=df.id.factorize()[0]+1
df
    id  color  #
0  123  white  1
1  123  white  1
2  123  white  1
3  345   blue  2
4  345   blue  2
5  678    red  3

另一种方法

df.groupby('id').ngroup()+1
0    1
1    1
2    1
3    2
4    2
5    3
dtype: int64

要将其添加到第一个位置:

df.insert(loc=0, column='#', value=df.id.factorize()[0]+1)
df
   #   id  color 
0  1  123  white  
1  1  123  white  
2  1  123  white  
3  2  345   blue  
4  2  345   blue  
5  3  678    red  
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

创建一个新列,将相同的索引分配给 Pandas DataFrame 中的重复值[关闭] 的相关文章

  • 测试交互式Python程序

    我想知道python的哪些测试工具支持交互式程序的测试 例如 我有一个由以下人员启动的应用程序 python dummy program py gt gt Hi whats your name Joseph 我想要仪器Joseph所以我可以
  • 如何在python中确定过去的时区特定日期是否是夏令时?

    有没有办法检查特定时区在我指定的日期是否处于夏令时 test dt datetime year 2015 month 2 day 1 pst pytz timezone America Los Angeles test dt pst loc
  • 如何使用 Twython 将 oauth_callback 值传递给 oauth/request_token

    Twitter 最近刚刚强制执行以下规定 1 您必须通过oauth callbackoauth request token 的值 这不是可选的 即使您已经在 dev twitter com 上设置了一个 如果您正在执行带外 OAuth 请通
  • 如何复制具有 MySQL 中保留的键和其他结构特征的表?

    如何复制保留键和其他结构特征的表 包括主键 外键和索引 这可以通过单个 MySQL 查询来完成吗 我正在使用 create table newtable as select 但此方法会使所有键和索引丢失 无法使用单个查询来从另一个表复制一个
  • Colab 的使用限制持续多久?

    当我对同一帐户的两个笔记本同时使用两个 GPU 约半小时后 Colab 已 12 小时未运行 此消息不断弹出 由于 Colab 中的使用限制 您当前无法连接到 GPU 自从我上次使用 colab 以来已经过去了大约两个小时 但该消息仍然弹出
  • 如何计算查询集中每个项目的两个字段的总和

    假设我有以下模型结构 class SomeModel Model base price DecimalField commision DecimalField 我不想存储total price在我的数据库中为了数据一致性并希望将其计算为ba
  • 如何使用 ipywidgets 创建动态依赖下拉菜单?

    我创建了一个带有两个下拉菜单的表单 我的目标是使一个下拉列表依赖于另一个下拉列表 这张图说明了我的目标和目前的情况 https i stack imgur com o9k5G png 下面的示例代码可以在 Google Colab 或 Ju
  • 如何解决CDK CLI版本不匹配的问题

    我收到以下错误 此 CDK CLI 与您的应用程序使用的 CDK 库不兼容 请将CLI升级到最新版本 云程序集架构版本不匹配 支持的最大架构版本为 8 0 0 但发现为 9 0 0 发出后cdk diff命令 我确实跑了npm instal
  • 如何在python mechanize中设置cookie

    向服务器发送请求后 br open http xxxx br select form nr 0 br form MESSAGE 1 2 3 4 5 br submit 我得到了响应标题 其中包含 set cookie Set Cookie
  • 如何在每次运行 python 程序时添加新列

    我希望我的表的第一列作为卷号 第二列作为名称 每当我运行 python 程序时 我想在表中添加一列日期 在这个新列中 我想填充从 user list 获得的列表将包含值 P A P P 等 如何处理 我尝试首先通过 alter 命令添加一列
  • 如何不断地将 STDOUT 发送到我的 python TCP 服务器?

    我有简单的 python echo 服务器 它使用套接字 并向客户端回显随机数 我有另一个程序 每 2 秒将值打印到标准输出 如果它只是一个脚本 我可以像这样重定向 stdout python script py 并像这样在脚本中获取它da
  • Python:绘制甘特图的模块

    有没有一个好的Python绘图模块甘特图 http en wikipedia org wiki Gantt chart 我试过了开罗情节 http linil wordpress com 2008 09 16 cairoplot 11 但它
  • Python 中使用 globals() 的原因?

    Python 中有 globals 函数的原因是什么 它只返回全局变量的字典 这些变量已经是全局的 所以它们可以在任何地方使用 我只是出于好奇而问 试图学习Python def F global x x 1 def G print glob
  • telethon 库:如何通过电话号码添加用户

    我正在研究 Telegram 的 Telethon 库 它可以使用 Telegram API 充当 Telegram 客户端 重要提示 这是电报客户端 API https core telegram org telegram api 而不是
  • Django - 使 ModelForm(ImageField 的)仅接受某些类型的图像

    我将 Pillow 2 3 0 与 Django 一起使用 并且在 models py 中有一个 ImageField 如下所示 class UserImages models Model user models ForeignKey Us
  • 使用 os.forkpty() 创建一个伪终端以 ssh 到远程服务器并与其通信

    我正在尝试编写一个 python 脚本 它可以 ssh 到远程服务器 并可以从 python 客户端执行 ls cd 等简单命令 但是 在成功 ssh 到服务器后 我无法读取伪终端的输出 任何人都可以在这里帮助我 以便我可以在服务器上执行一
  • 安塞布尔 + 10.11.6

    我在 非常 干净地安装 10 11 6 时遇到了 Ansible 的奇怪问题 我已经安装了brew zsh oh my zsh Lil snitch 和1password 实际上没有安装其他任何东西 我安装了ansible brew ins
  • 如何使用 Python 实现并行 gzip 压缩?

    使用python压缩大文件 https stackoverflow com questions 9518705 big file compression with python给出了一个很好的例子来说明如何使用例如bz2 纯粹用 Pytho
  • 获取 python 模块的 2 个独立实例

    我正在与以非 OO 方式编写的 python 2 x API 进行交互 它使用模块全局范围来处理一些内部状态驱动的东西 在它不再是单例的情况下需要它 并且修改原始代码 不是我们的 不是一个选择 如果不使用单独解释器的子进程运行 有什么方法可
  • Django:显示管理员验证错误的自定义错误消息

    我正在使用 Django 1 2 4 我有一个模型 其中有一个需要验证的字段 当验证失败时 我想向用户显示自定义错误消息 模型编辑是在管理界面中完成的 这就是我目前正在做的事情 def clean fields self exclude N

随机推荐

  • 如何在 Node.js 上使用 Sequelize 进行连接查询

    我正在使用sequelize ORM 一切都很棒而且干净 但是当我使用它时遇到了问题join查询 我有两个模型 用户和帖子 var User db seq define User username type db Sequelize STR
  • 为什么不允许 auto 作为函数参数?

    From 这个问题 很清楚auto不能用作函数参数 我的问题是为什么返回类型被允许为auto但函数参数不是 auto function auto data DOES something Since there有很多好处auto进来c 1z
  • 使用 Next js 时在 CSS/SASS 模块中使用 kebab-case CSS 类名

    我在 React Next js 中使用 SCSS 模块作为我的组件 但我不知道如何导入 kebab case 类 目前 我只是用驼峰命名法编写所有 SCSS 类 但这并不理想 因为这意味着我无法使用 SCSS 级联 我还在学习 React
  • 超过 Google Directions API 上每个请求 23 个航点的限制(商务/工作级别)

    我想使用 Google Directions API 为一家处理冬季扫雪机和夏季景观美化的公司开发路线规划软件 客户的要求之一是他能够计算具有至少 30 个 最好更多 航点的路线 根据文档 下面引用 即使 Google Maps API f
  • DB2:从表中清除大量记录

    我使用 DB2 9 7 FP5 作为 LUW 我有一个包含 250 万行的表 我想删除大约 100 万行 并且此删除操作分布在整个表中 我正在用 5 个删除语句删除数据 delete from tablename where tableky
  • Figure.show、Figure.canvas.draw 和Figure.canvas.draw_idle 之间有什么区别

    在 Matplotlib 中 我可以通过调用来更新图中绘图的视觉效果Figure对象 说fig并调用该方法show fig show 但我也可以通过致电来做到这一点canvas图中的对象 然后调用方法draw fig canvas draw
  • iOS 如何实现下拉列表以及如何关闭它?

    我需要一些关于如何在 iOS 中实现下拉列表类型功能的输入 我想到了一些解决方案 例如使用UITableView用于显示文本项列表 在我的例子中 列表可以是静态的也可以是动态的 所以UITableView对于我的情况来说似乎是一个不错的选择
  • 在 C++ 中重载比较运算符会导致“无效运算符<”

    目前正在尝试在 C 中对对象向量进行排序 每个对象都包含一个字符串 字符串可以包含字母或数字 由于设计限制 这是必要的 因为比较器可以更改 目前 该对象的类已重载 因此当比较两个对象时 将比较它们包含的字符串 这在一定程度上是有效的 但是
  • 使用 using 指令进行不明确的名称查找

    不允许将名称空间和同名的类放入一个声明区域 即 namespace A class A 格式不正确 参见第 3 3 1 4 节 但是 可以通过 using 指令引入任一名称 namespace N namespace A int i str
  • Flutter:应用程序在后台时使用路径提供程序

    我目前正在尝试将 FCM 和本地通知实现到我的 Flutter 应用程序中 我已成功配置 FCM 和普通通知的本地通知 但我还有一种不同类型的通知 我想用图像显示 当我的应用程序位于前台时 通知显示没有错误 但是当我终止时应用程序 将其移动
  • 使用 AFNetworking 2.0 加载图像

    我正在尝试使用 AFNetworking 2 0 将照片添加到 POST 这个 iOS 应用程序将帖子和照片发送到博客 我无法弄清楚为什么图像无法加载 这是我到目前为止得到的 publish text and image void publ
  • 强制Linux只使用4G以上的内存?

    我有一个 Linux 设备驱动程序 它连接到一个理论上可以使用 64 位地址执行 DMA 的设备 我想测试一下这是否真的有效 有没有一种简单的方法可以强制 Linux 机器不使用物理地址 4G 以下的任何内存 如果内核映像内存不足也没关系
  • 我可以将显式游标传递给函数/过程以在 FOR 循环中使用吗?

    我有一个过程对游标返回的所有记录执行一些计算 它看起来有点像这样 PROCEDURE do calc id table id column TYPE IS CURSOR c IS SELECT col1 col2 col3 FROM tab
  • 为什么 ASP.NET MVC 项目的 Content 文件夹中不包含 Scripts 文件夹?

    出于好奇 我想知道在 ASP NET MVC 项目中是否有合理的理由将 Scripts 文件夹设置为 Contents 文件夹的子文件夹 Contents 文件夹通常包含样式表和图像 出于某种原因 我认为在其中也包含 Scripts 文件夹
  • Excel VBA - 解释“N/A”值

    我正在遍历一个电子表格 其中包含一列价格 其形式为double类型 我试图找到电子表格中显示的缺失值 n a 但这并不让我将其解释为string type 该细胞含有 n a 似乎是一个integer类型 我怎样才能读到这个 如果您只想检查
  • Boost.Thread 3.0.0 中的重大变化

    在 Boost 库 1 50 0 版本的发行说明中 我注意到两个重大更改 see here 6266 重大更改 如果可连接 线程析构函数应调用终止 6269 重大更改 如果可连接 线程移动分配应调用终止 这对于我当前使用 Boost 1 4
  • 动态更改@ManagedResource objectName

    我正在以编程 动态方式创建原型 bean 我希望启动后这些 bean 位于 jmx 控制台中 我如何区分它们 我正在使用注释来将我的 bean 添加到 jmx 中 并且我有 ManagedResource objectName bean n
  • IsValid() 是否可以防止 XSS?

    是否使用已验证 验证电子邮件地址或 URL 格式以防止 XSS 当指定其他格式时它会否定 XSS 吗 有效的 URL 仍然可以包含攻击向量
  • 是否有免费的 Xml 差异/合并工具可用? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心以获得指导 我的 net 应用程序中有
  • 创建一个新列,将相同的索引分配给 Pandas DataFrame 中的重复值[关闭]

    Closed 这个问题需要细节或清晰度 目前不接受答案 如何生成列出重复值的新列 例如 我的数据框是 id color 123 white 123 white 123 white 345 blue 345 blue 678 red 这是所需