python replace 用法

2023-11-01

在处理数据的时候,很多时候会遇到批量替换的情况,如果一个一个去修改效率过低,也容易出错。replace()是很好的方法。

源数据

1、替换全部或者某一行

replace的基本结构是:df.replace(to_replace, value) 前面是需要替换的值,后面是替换后的值。

例如我们要将南岸改为城区:

将南岸改为城区

这样Python就会搜索整个DataFrame并将文档中所有的南岸替换成了城区(要注意这样的操作并没有改变文档的源数据,要改变源数据需要使用inplace = True)。

使用inplace = True更改源数据

由于南岸只有城市一列具有相同值,使用起来比较方便。

但是如果我们要改变表1Lon里的某个数据,而不改变Longitude的数据要怎么做呢?

改变指定的列的数据

所以只想替换部分数据的时候并且要写入源数据就需要指定inplace。

在上面的操作只改变了表1Lon的数据,其它列的数据并没有被替换,而且在替换后的结果不需要我们再和源数据进行合并操作,可以直接体现在源数据中。

2、替换指定的某个或指定的多个数值(用字典的形式)

只改变指定的值

这个很好理解,就是字典里的建作为原值,字典里的值作为替换的新值。

当然,我们也可是使用列表的形式进行替换:df.replace(['A','29.54'],['B',100])

用列表的形式进行替换

还有如果想要替换的新值是一样的话,我们还可以这样做:

替换的新值一样时

部分替换和替换某个值结合使用的话就可以替换单个列的数值:

替换单个列的数值

3、使用正则表达式替换

正则表达式很强大,能够让我们实现一次替换很多很多个不同的值:

源数据

正则表达式没有指定regex =True

正则表达式指定regex =True

使用正则表达式的时候记得后面加 regex=True参数。

有图中我们可以看到只要包含有大写的英文字母的数据都被替换了,如果我们要写入源数据还需要指定inpla = True。

指定列替换数据

当需要将缺失值替换掉的时候,我们可以考虑直接只用fillna(),功能更强大,这个前面已经有说过了。

在某些情况下,如果我们只需要某个数据的部分内容,我们该怎么操作呢?

比如要把变电站都改为transformer_substation,或者是把Latitude列的前面的ab改为AB:

指定列更改替换部分字符

指定列更改替换部分字符

需要注意的时更好指定列的时候,使用str.replace时不能使用inplace = True参数,因此需要改成赋值,赋值的时候不要忘了是列的赋值而不是整个表格的赋值。


 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python replace 用法 的相关文章

  • numba 函数何时编译?

    我正在研究这个例子 http numba pydata org numba doc 0 15 1 examples html multi threading http numba pydata org numba doc 0 15 1 ex
  • 使用 python 进行串行数据记录

    Intro 我需要编写一个小程序来实时读取串行数据并将其写入文本文件 我在读取数据方面取得了一些进展 但尚未成功地将这些信息存储在新文件中 这是我的代码 from future import print function import se
  • 如何迭代按值排序的 Python 字典?

    我有一本字典 比如 a 6 b 1 c 2 我想迭代一下by value 不是通过键 换句话说 b 1 c 2 a 6 最直接的方法是什么 sorted dictionary items key lambda x x 1 对于那些讨厌 la
  • 如何使用 imaplib 获取“消息 ID”

    我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好 所以我认为 Message ID 是正确的 但我不知道如何获取它 我只知道 imap fetch uid XXXX 有人有解决方案吗 来自 IMAP 文档本身 IMAP4消息号
  • 将数据帧行转换为字典

    我有像下面的示例数据这样的数据帧 我正在尝试将数据帧中的一行转换为类似于下面所需输出的字典 但是当我使用 to dict 时 我得到了索引和列值 有谁知道如何将行转换为像所需输出那样的字典 任何提示都非常感激 Sample data pri
  • Pandas 中允许重复列

    我将一个大的 CSV 包含股票财务数据 文件分割成更小的块 CSV 文件的格式不同 像 Excel 数据透视表之类的东西 第一列的前几行包含一些标题 公司名称 ID 等在以下列中重复 因为一家公司有多个属性 而不是一家公司只有一栏 在前几行
  • 如何创建一个语句来打印以特定单词开头的单词? [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 如何在 python 中打印从特定字母开始的单词 而不使用函数 而是使用方法或循环 1 我有一个字符串 想要打印以 m 开头的单词 S
  • Pandas 数据帧到 numpy 数组 [重复]

    这个问题在这里已经有答案了 我对 Python 很陌生 经验也很少 我已经设法通过复制 粘贴和替换我拥有的数据来使一些代码正常工作 但是我一直在寻找如何从数据框中选择数据 但无法理解这些示例并替换我自己的数据 总体目标 如果有人真的可以帮助
  • 在Python中调整图像大小

    我有一张尺寸为 288 352 的图像 我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
  • 更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

    theano base compiledir指编译后的文件存放的目录 有没有办法可以永久设置theano base compiledir到不同的位置 也许通过修改一些内部 Theano 文件的内容 http deeplearning net
  • python suds SOAP 请求中的名称空间前缀错误

    我使用 python suds 来实现客户端 并且在发送的 SOAP 标头中得到了错误的命名空间前缀 用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件 请参见下文 问题出在函数上GetRecord
  • TensorFlow的./configure在哪里以及如何启用GPU支持?

    在我的 Ubuntu 上安装 TensorFlow 时 我想将 GPU 与 CUDA 结合使用 但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
  • 使用鼻子获取设置中当前测试的名称

    我目前正在使用鼻子编写一些功能测试 我正在测试的库操作目录结构 为了获得可重现的结果 我存储了一个测试目录结构的模板 并在执行测试之前创建该模板的副本 我在测试中执行此操作 setup功能 这确保了我在测试开始时始终具有明确定义的状态 现在
  • 如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题?

    在尝试从 S3 重新分区数据帧时 我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
  • 如何从Python中的字符串中提取变量名称和值

    我有一根绳子 data var1 id 12345 name John White python中有没有办法将var1提取为python变量 更具体地说 我对字典变量感兴趣 这样我就可以获得变量的值 id和name python 这是由提供
  • Tkinter - 浮动窗口 - 调整大小

    灵感来自this https stackoverflow com a 22424245 13629335问题 我想为我的根窗口编写自己的调整大小函数 但我刚刚注意到我的代码显示了一些性能问题 如果你快速调整它的大小 你会发现窗口没有像我希望
  • 如何为每个屏幕添加自己的 .py 和 .kv 文件?

    我想为每个屏幕都有一个单独的 py 和 kv 文件 应通过 main py main kv 中的 ScreenManager 选择屏幕 设计应从文件 screen X kv 加载 类等应从文件 screen X py 加载 Screens
  • Ubuntu 上的 Python 2.7

    我是 Python 新手 正在 Linux 机器 Ubuntu 10 10 上工作 它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能 有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是 如
  • Elastic Beanstalk 中的 enum34 问题

    我正在尝试在 Elastic Beanstalk 中设置 django 环境 当我尝试通过requirements txt 文件安装时 我遇到了python3 6 问题 File opt python run venv bin pip li
  • 您可以使用关键字参数而不提供默认值吗?

    我习惯于在 Python 中使用这样的函数 方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default

随机推荐

  • 华为OD真题2023新题库(机试通知上写着--A卷2022Q4)

    华为od最近又开始招人了 对于目前市场上行情来看 虽然去od加班可能多 但工资还是可以的 大环境不好都开始卷了 od对于目标院校机试成绩比较低150分 2023年好像又涨了 其他非目标院校350 wx外包300 当你收到邮件 试卷名称 A卷
  • 移动端UI兼容性测试利器-Hydra

    导读 尽管自动化测试技术日新月异 但是自动化case构建成本 执行稳定性等问题的存在 使手工测试依然移动端质量保证的重要手段 传统手工测试必须通过人工操作的方式执行测试用例 效率提升依赖测试人员的操作熟练度 本文从介绍百度内UI兼容性测试现
  • linux系统下nginx的安装

    文章目录 一 安装nginx依赖 二 下载并解压nginx安装包 三 安装nginx 四 配置环境变量 五 启动 六 浏览器访问 七 停止重启nginx 八 设置开机自启动nginx 九 防火墙设置 十 卸载nginx 一 安装nginx依
  • Quartz的12张数据库表说明

    参考地址 https www e learn cn en share 3471635 https blog csdn net xiaoniu 888 article details 83181078 表说明 1 1 qrtz blob tr
  • YOLOv5的介绍

    YOLOv5 You Only Look Once version 5 是一种目标检测模型 用于在视频或图像中识别和定位物体 它是YOLO You Only Look Once 算法的最新版本 在YOLOv4的基础上进行了改进 YOLOv5
  • java的几种基本数据类型及其大小

    Java中的四类八种基本数据类型 第一类 整数类型 byte short int long 第二类 浮点型 float double 第三类 逻辑型 boolean 它只有两个值可取true false 第四类 字符型 char 按照字节排
  • 《Python入门到精通》time模块详解,Python time标准库,time库函数大全

    作者主页 士别三日wyx 作者简介 CSDN top100 阿里云博客专家 华为云享专家 网络安全领域优质创作者 推荐专栏 小白零基础 Python入门到精通 time模块详解 1 获取操作 time time 获取时间戳 float ti
  • ionic android app打包和发布

    1 项目信息 angular 10 0 14 ionic 5 4 3 gradel 6 5 cordova 10 0 0 node 12 14 0 visual studio code 1 68 1 项目代码 http 192 168 1
  • Unity2D Mesh水

    学生一枚 买不起pro 也懒得破解 不能用unity自带的water组件做水 所以用LineRenderer Mesh Sin函数苟了一个 为什么不用shader做 因为用Mesh的方法更容易添加碰撞 浮力组件 表面效应组件的效果 用sha
  • Spring-全面详解(学习总结)

    Spring 1 简介 1 1 简介 简介 Spring 春天 gt 给软件行业带来了春天 2002年 Rod Jahnson首次推出了Spring框架雏形interface21框架 2004年3月24日 Spring框架以interfac
  • 2022FPGA创新设计竞赛选题分析与建议——写给大一大二学弟学妹

    0 写在最前 老师新带了几个大一大二的同学准备参加FPGA创新设计竞赛 他们不具备太多的参赛经验 往往专业知识也没有学太多 有一颗想参赛的心 却又茫然不知所措 因此 此文希望对于大一大二的科创萌新有所帮助 1 关于选题 1 1 选题分析 2
  • [网络工程师]-网络规划与设计-网络测试运行和维护(二)

    4 局域网测试 局域网测试主要是检验网络是否为应用系统提供了稳定 高效的网络平台 如果网络系统不够稳定 网络应用就不可能快速稳定 对于常规的以太网进行系统测试 主要包括系统连通性 链路传输速率 吞吐率 传输时延 丢包率及链路层健康状况测试等
  • 摸了好久,终于把linux中i2c的ioctl,write,read函数的使用弄懂了

    ioctl函数的使用 原型 struct ioctl struct file file unsigned int cmd unsigned long arg cmd有I2C SLAVE I2C SLAVE FORCE I2C TENBIT
  • 计算机毕业设计/计算机课程设计代码生成器

    计算机毕业设计 计算机课程设计代码生成器 生成器都能生成什么 C语言管理系统 c 管理系统 C 窗体各种管理系统 Javawing窗体各种管理系统 Javaweb servle jsp管理系统 Javaweb springboot html
  • xss-labs

    一 测试过滤的代码 1 引号 2 标签 3 属性 4 实体编号
  • Caused by SSLError("Can’t connect to HTTPS URL because the SSL module is not available)解决方式

    Caused by SSLError Can t connect to HTTPS URL because the SSL module is not available 原因是anaconda没有安装好 环境变量没有配置成功 需要添加三条
  • 游戏开发unity插件Entities:如何在2020版本及以上使用

    参考 https blog csdn net zhenghongzhi6 article details 107895535 https forum unity com threads visibility changes for prev
  • AANAP代码学习

    Code YaqiLYU AANAP Paper Adaptive As Natural As Possible Image Stitching 1 加载并显示图片 加载两幅图片 img1 img2 把img2大小resize为img1大小
  • 通过修改请求头的User-Agent发送请求

    1 抓包工具 Fiddler Charles Charles可以监控浏览器发送和接收的所有数据 2 get的参数 参数1 url 填网址 参数2 params 网址后需要添加的参数 参数3 kwargs 不定长键值对参数 一般 key va
  • python replace 用法

    在处理数据的时候 很多时候会遇到批量替换的情况 如果一个一个去修改效率过低 也容易出错 replace 是很好的方法 源数据 1 替换全部或者某一行 replace的基本结构是 df replace to replace value 前面是