替换 Pandas 中各列的重复值

2024-06-19

我有一个简单的数据框：

df = [    {'col1' : 'A', 'col2': 'B', 'col3':   'C', 'col4':'0'},
          {'col1' : 'M', 'col2':   '0', 'col3': 'M', 'col4':'0'},
          {'col1' : 'B', 'col2':  'B', 'col3':  '0', 'col4':'B'},
          {'col1' : 'X', 'col2':  '0', 'col3':  'Y', 'col4':'0'}
          ]
df = pd.DataFrame(df)
df = df[['col1', 'col2', 'col3', 'col4']]
df

看起来像这样：

| col1 | col2 | col3 | col4 |
|------|------|------|------|
| A    | B    | C    | 0    |
| M    | 0    | M    | 0    |
| B    | B    | 0    | B    |
| X    | 0    | Y    | 0    |

我只想将行中重复的字符替换为字符“0”。归根结底就是保留我们遇到的第一个重复值，如下所示：

| col1 | col2 | col3 | col4 |
|------|------|------|------|
| A    | B    | C    | 0    |
| M    | 0    | 0    | 0    |
| B    | 0    | 0    | 0    |
| X    | 0    | Y    | 0    |

这看起来很简单，但我被困住了。任何朝着正确方向的推动都将非常感激。

您可以使用duplicated方法返回元素是否重复的布尔索引器：

In [214]: pd.Series(['M', '0', 'M', '0']).duplicated()
Out[214]:
0    False
1    False
2     True
3     True
dtype: bool

然后，您可以通过将其映射到数据帧的行上并使用来创建掩码where执行替换：

is_duplicate = df.apply(pd.Series.duplicated, axis=1)
df.where(~is_duplicate, 0)

  col1 col2 col3 col4
0    A    B    C    0
1    M    0    0    0
2    B    0    0    0
3    X    0    Y    0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

替换 Pandas 中各列的重复值的相关文章

ModuleNotFoundError：没有名为“pwd”的模块——airflow python [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我想使用以下方式安装气流的 Web UI airflow webserver port 1080 但我收到这个错误 Mo
整数 numpy 数组乘以浮点数

我有一个包含整数值的 numpy 数组如果我将整个矩阵乘以一个浮点数结果是一个浮点矩阵但如果我通过 for 循环逐列相乘它只给出整数部分 import numpy as np A np array 1 2 3 4 5 6 7 8 9
在 Pycharm 中使用 scikit-learn 未解析的属性引用“predict()”

当使用 scikit learn 中的决策树分类器时 docs http scikit learn org stable modules tree html展示您将存储分类器的变量重新分配给其自身的输出调用fit method clf t
python中的多服务器监控/自动重启

我有 2 个服务器程序必须使用 GNU Screen 启动我想使用基于 Python 的程序来强化这些服务器防止崩溃该程序启动每个屏幕会话然后监视服务器进程如果服务器进程崩溃我需要 python 代码来终止无关的屏幕会话并再次
我可以使用 Python 访问 ImageMagick API 吗？

我需要使用图像魔术师 http www imagemagick org script index php因为 PIL 没有我正在寻找的可用图像功能量但是我想使用Python python 绑定 PythonMagick 自 2009 年
没有实例的 Django Formset

In this http docs djangoproject com en dev topics forms modelforms inline formsetsDjango Doc 解释了如何创建一个表单集该表单集允许您编辑属于特定作
在 Python 中使用带有 asyncio 的信号量

我试图限制使用信号量同时运行的异步函数的数量但我无法让它工作我的代码归结为 import asyncio async def send i print f starting i await asyncio sleep 4 print f
Python 字符串格式 - 类型错误 - 格式字符串参数不足

那么这个字符串有什么问题呢我无法弄清楚为什么它说格式字符串没有足够的参数我是 Python 新手只是想弄清楚编辑这与建议的其他问题不同另一个正在尝试做一些我什至没有涉及的疯狂数组事情我只需要了解元组的基本概念以及字符串格式化的
Python Turtle 未按照文档示例填充

我试图向我女儿展示一些代码并认为海龟会很有趣我更喜欢数字但这对孩子们来说并不有趣我在重现文档示例时遇到问题这更让我烦恼因为我无法弄清楚我们还有很多其他事情可以做 The documentation example copied
Python 中定义了黄金比例吗？

有没有办法得到黄金比例phi 在标准Python模块中我知道e and pi in the math模块但我可能错过了phi某处定义 scipy constants http docs scipy org doc scipy refer
Pandas 中的 Vlookup 具有近似匹配

我需要对两个 pandas 数据框进行 vlookup 样式操作 Excel 中的 Vlookup 函数有一个额外的参数是否应查找近似匹配或精确匹配为了精确匹配我知道我可以使用 join 函数但是我该如何进行近似匹配以找到下一个更大
如何计算 pandas 系列中到前一个零的距离？

我有以下 pandas 系列以列表形式表示 7 2 0 3 4 2 5 0 3 4 我想定义一个新的系列返回到最后一个零的距离这意味着我想要以下输出 1 2 0 1 2 3 4 0 1 2 如何以最有效的方式在 pandas 中做到这
如何在不重复代码的情况下定义 randint 元组？

我经常使用 randint 元组来表示颜色值等 a b c randint 0 255 randint 0 255 randint 0 255 当我认为必须有更好的方法时有吗使用numpy 1 import numpy as np tu
django 返回记录的最近日期

我正在尝试从用户的多个记录中返回最近的日期当用户创建文档时创建日期存储在 CreatedDocumentDetails 模型中我无法返回用户最近创建的文档的日期我问这个关于SO的问题 https stackoverflow com
Python 子进程在发出 HTTP 请求时无提示崩溃

我在组合多处理请求或 urllib2 和 nltk 时遇到问题这是一个非常简单的代码 gt gt gt from multiprocessing import Process gt gt gt import requests gt g
Python：装饰器可以确定函数是否在类中定义吗？

我正在编写一个装饰器出于各种烦人的原因 0 检查它所包装的函数是独立定义还是作为类的一部分定义以及新类是哪些类的子类是很方便的例如 def my decorator f defined in class print r s f de
Flask 从线程中删除会话变量

我尝试实施投票系统它的工作原理是这样的如果用户对帖子进行投票我会在会话变量中记录其临时状态已投票已加星标等如果当前用户在我将结果保存到临时表之前尚未投票用户可以在 5 分钟内更改投票 5 分钟后结果将使用线程永久写入数据库
显示进度的脚本？

当我的 python 脚本处理大文件时我想向用户显示进度我见过脚本印刷在 shell 中的同一光标位置显示进度我怎样才能在Python中做到这一点你应该使用python 进度条 http code google com p pyt
编写适用于 ndarray 和 MaskedArray 的通用数值函数的最佳实践

有没有比以下更漂亮的方式 import numpy as np from numpy import ma def foo x pkg ma if isinstance x ma MaskedArray else np return pkg
Django 类视图未返回 HttpResponse 对象。它返回 None 相反

urls py from housepost views import ListingPost url r house post ListingPost as view name post house views py from djang

随机推荐

“ghs.google.com”域的机制是什么？

如果我想给我的应用程序绑定一个域名GAE Google App Engine 我应该添加一条 CNAME 记录ghs google com 我想了解这个域名是如何运作的例如我有这样的 CNAME blog goace com ghs g
* foreach 里面的 foreach codeigniter 2？

在 codeigniter 2 1 中我尝试按类别显示频道因此如果我有一个名为电影的类别我应该会看到电影中的频道列表我尝试使用嵌套的 foreach 循环来完成此任务但似乎无法使其工作我的表结构是这样的但更复杂我的型号
strings.xml 中的 Android 变量

我在某处读到如何在 XML 文档中使用变量他们说这很简单我想也是如此我在 Android strings xml 文件中成功地使用了它我一整天都这样使用它直到突然 android 停止解析它并停止将它视为变量我这样使用它
一对一映射不适用于二级缓存

我已经声明了 Hibernate 3 的以下映射使用 FluentNHibernate public class ActivityMap ClassMap
用渐变画线

我在不同的位置画了多条线例如 canvas drawLine startXLine1 stopXLine1 startYLine1 stopYLine1 paint canvas drawLine startXLine2 stopXLin
为什么 fopen("any_path_name",'r') 不给出 NULL 作为返回值？

在调试一些代码时我得到如下内容 include
HTML表可选择行Javascript包[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 Is there a Javascript package out there that makes table rows selecta
在横向模式下向 UIScrollView 添加子视图

我有一个以横向模式启动的视图控制器其中有一个 UIScrollView 我尝试创建子视图并将它们添加到 UIScrollView 但视图的框架大小都是纵向大小这是我的代码 void viewDidLoad super viewDidLo
Chrome 扩展：插入固定 div 作为 UI

我想使用 chrome 扩展将 div 插入固定位置它将覆盖您当前正在查看的页面我担心的是我希望它可以在任何页面上工作而不改变它除了插入我的固定 div 之外但我不知道我这样做的方式是否可行目前该按钮不会显示并且我在让 di
Emoji 字符无法编码为 JSON

我有一个UITextView我称之为messageField 其中的数据messageField is POST ed 以 JSON 格式发送到服务器当用户输入表情符号字符时我无法将数据编码为JSON 我认为 Emoji 使用 Unic
顺序没有属性“validation_data”

我从下面的链接下载并运行该文件https github com keunwoochoi keras callbacks example https github com keunwoochoi keras callbacks example
确定虚拟内存的页表大小

考虑一个具有 38 位虚拟字节地址 1KB 页和 512 MB 物理内存的虚拟内存系统假设有效位保护位脏位和使用位总共占 4 位并且所有虚拟页都在使用中则本机上每个进程的页表总大小是多少假设磁盘地址未存储在页表中好吧如果问题
在 Python 3.8.0 中使用 pip 安装 numpy 时如何修复“错误：命令错误，退出状态 1”

将Python升级到3 8 0后我在使用pip安装与numpy相关的包时遇到问题包括numpy matplotlib和sklearn 错误信息如下我应该怎么做才能解决这个问题 C WINDOWS System32 gt pip ins
全面的 html5 音频 API

对于我的一生我找不到所有 html5 的完整列表
如何将两个图像放置在一个div的对角

如你所见我不是 CSS 专家我需要一些帮助来了解如何使用两个图像制作这个 div 如下图所示托马斯是对的但还有更好的解决方案 div img class align left src alt description of your
*.hlsl 文件有什么作用，该文件和 *.fx 文件之间有什么关系？

我正在阅读 DirectX 项目的示例我看到 fx and hlsl files I know fx是DirectX读取的效果文件但是它的用途是什么hlsl文件这些文件有用吗历史上fx包含使用效果系统语法的着色器 technique
如何使用单独的线程部分重绘自定义 SurfaceView 而不会丢失以前的编辑？

我目前在按照自定义绘图时遇到问题SurfaceView来自不在我的主 UI 上的线程这SurfaceView占据整个屏幕 Galaxy S3 全屏并且必须从多个来源进行更新问题是习惯SurfaceView不会保存 UI 更新之间的更改
特定时间的 iPhone 本地通知

我想每周晚上 10 点无论哪个国家地区发出通知我需要使用时区吗目前我使用下面的代码每周触发通知但如何在晚上 10 点准确触发通知 NSDate date NSDate date NSDate myNewDate date da
如何使用 next.js 将动态 html 元素注入到页面？

如何使用next js动态注入html元素到页面这些元素未知类型例如输入复选框 img 使用返回 json 类型的 api 指定此元素如下所示 id rooms title Rooms order 1 type string wi
替换 Pandas 中各列的重复值

我有一个简单的数据框 df col1 A col2 B col3 C col4 0 col1 M col2 0 col3 M col4 0 col1 B col2 B col3 0 col4 B col1 X col2 0 col3 Y c

替换 Pandas 中各列的重复值

替换 Pandas 中各列的重复值 的相关文章

随机推荐

热门标签

替换 Pandas 中各列的重复值的相关文章