Python Pandas 替换特殊字符

2023-11-25

由于某种原因,我无法让这个简单的语句适用于ñ。它似乎对其他任何事情都有效,但不喜欢那个角色。有任何想法吗?

DF['NAME']=DF['NAME'].str.replace("ñ","n")

Thanks


我假设您在这里使用 Python 2.x,这可能是 Unicode 问题。别担心,你并不孤单——unicode 一般来说非常困难,尤其是在 Python 2 中,这就是为什么它在 Python 3 中成为标准。

如果您所关心的只是ñ,你应该用UTF-8解码,然后只替换一个字符。

看起来像下面这样:

DF['name'] = DF['name'].str.decode('utf-8').replace(u'\xf1', 'n')

举个例子:

>>> "sureño".decode("utf-8").replace(u"\xf1", "n")
u'sureno'

如果您的字符串已经是 Unicode,那么您可以(并且实际上必须)跳过decode step:

>>> u"sureño".replace(u"\xf1", "n")
u'sureno'

这里请注意u'\xf1'使用十六进制转义对于有问题的角色。

Update

我在评论中得知<>.str.replace是 pandas 系列方法,我没有意识到。这个问题的答案可能如下:

DF['name'] = map(lambda x: x.decode('utf-8').replace(u'\xf1', 'n'), DF['name'].str)

或者类似的东西,如果 pandas 对象是可迭代的。

另一个更新

实际上我只是想到您的问题可能很简单,如下所示:

DF['NAME']=DF['NAME'].str.replace(u"ñ","n")

请注意我是如何添加的u在字符串前面,使其成为 unicode。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python Pandas 替换特殊字符 的相关文章

  • Django 的内联管理:一个“预填充”字段

    我正在开发我的第一个 Django 项目 我希望用户能够在管理中创建自定义表单 并向其中添加字段当他或她需要它们时 为此 我在我的项目中添加了一个可重用的应用程序 可在 github 上找到 https github com stephen
  • 如何用python脚本控制TP LINK路由器

    我想知道是否有一个工具可以让我连接到路由器并关闭它 然后从 python 脚本重新启动它 我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器 但是
  • 使用 Python 从文本中删除非英语单词

    我正在 python 上进行数据清理练习 我正在清理的文本包含我想删除的意大利语单词 我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作 例如给出一些文本 Io andiamo to the beach w
  • Pandas 日期时间格式

    是否可以用零后缀表示 pd to datetime 似乎零被删除了 print pd to datetime 2000 07 26 14 21 00 00000 format Y m d H M S f 结果是 2000 07 26 14
  • 使用Python请求登录Google帐户

    在多个登录页面上 需要谷歌登录才能继续 我想用requestspython 中的库以便让我自己登录 通常这很容易使用requests库 但是我无法让它工作 我不确定这是否是由于 Google 做出的一些限制 也许我需要使用他们的 API 或
  • 您可以格式化 pandas 整数以进行显示,例如浮点数的“pd.options.display.float_format”?

    我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
  • 立体太阳图 matplotlib 极坐标图 python

    我正在尝试创建一个与以下类似的简单的立体太阳路径图 http wiki naturalfrequent com wiki Sun Path Diagram http wiki naturalfrequency com wiki Sun Pa
  • “隐藏”内置类对象、函数、代码等的名称和性质[关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我很好奇模块中存在的类builtins无法直接访问的 例如 type lambda 0 name function of module
  • 如何使用python在一个文件中写入多行

    如果我知道要写多少行 我就知道如何将多行写入一个文件 但是 当我想写多行时 问题就出现了 但是 我不知道它们会是多少 我正在开发一个应用程序 它从网站上抓取并将结果的链接存储在文本文件中 但是 我们不知道它会回复多少行 我的代码现在如下 r
  • 如何通过索引列表从 dask 数据框中选择数据?

    我想根据索引列表从 dask 数据框中选择行 我怎样才能做到这一点 Example 假设我有以下 dask 数据框 dict A 1 2 3 4 5 6 7 B 2 3 4 5 6 7 8 index x1 a2 x3 c4 x5 y6 x
  • pyspark 将 twitter json 流式传输到 DF

    我正在从事集成工作spark streaming with twitter using pythonAPI 我看到的大多数示例或代码片段和博客是他们从Twitter JSON文件进行最终处理 但根据我的用例 我需要所有字段twitter J
  • 不同编程语言中的浮点数学

    我知道浮点数学充其量可能是丑陋的 但我想知道是否有人可以解释以下怪癖 在大多数编程语言中 我测试了 0 4 到 0 2 的加法会产生轻微的错误 而 0 4 0 1 0 1 则不会产生错误 两者计算不平等的原因是什么 在各自的编程语言中可以采
  • 使用特定颜色和抖动在箱形图上绘制数据点

    我有一个plotly graph objects Box图 我显示了箱形 图中的所有点 我需要根据数据的属性为标记着色 如下所示 我还想抖动这些点 下面未显示 Using Box我可以绘制点并抖动它们 但我不认为我可以给它们着色 fig a
  • 如何断言 Unittest 上的可迭代对象不为空?

    向服务提交查询后 我会收到一本字典或一个列表 我想确保它不为空 我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例 现有的替代方案看起来并不正确 self assertTrue
  • python import inside函数隐藏现有变量

    我在我正在处理的多子模块项目中遇到了一个奇怪的 UnboundLocalError 分配之前引用的局部变量 问题 并将其精简为这个片段 使用标准库中的日志记录模块 import logging def foo logging info fo
  • Python ImportError:无法导入名称 __init__.py

    我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem
  • 如何应用一个函数 n 次? [关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 假设我有一个函数 它接受一个参数并返回相同类型的结果 def increment x return x 1 如何制作高阶函数repeat可以
  • 在 JavaScript 函数的 Django 模板中转义字符串参数

    我有一个 JavaScript 函数 它返回一组对象 return Func id name 例如 我在传递包含引号的字符串时遇到问题 Dr Seuss ABC BOOk 是无效语法 I tried name safe 但无济于事 有什么解
  • cv2.VideoWriter:请求一个元组作为 Size 参数,然后拒绝它

    我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频 构造 VideoWriter 对象时 文档表示 Size 参数应该是一个元组 当我给它一个元组时 它拒绝它 当我尝试用其他东西替换它时 它不会接受它 因为它说参数不是
  • Kivy - 单击按钮时编辑标签

    我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作 你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo

随机推荐

  • 对多线程应用程序进行单元测试

    有人对多线程应用程序的单元测试有任何建议或了解任何框架吗 Do not unit测试多线程应用程序 重构代码以消除不同线程中完成的工作之间的耦合 然后分别进行测试
  • 清除 R / RStudio 中的启动屏幕

    我想更改我第一次打开 R 或实际 Rstudio 时看到的启动 登录屏幕 我想要的只是 gt 提示 仅此而已 我知道我以前在网上见过这个 但不记得搜索短语是什么 我应该补充说我正在使用乌班图Linux 有什么建议么 其他人给你建议如何停止这
  • 将选项值设置为选定的

    我想加载一个选择框 其中用户选择的值将自动出现 我正在从服务器接收带有用户信息的 Json 数据 数据样本是 color red 在我的 html 代码中 我有这样的选择选项
  • Sencha Touch MVC——通过控制器传递数据的推荐方式?

    我正在使用 Sencha Touch 作为移动应用程序 并使用其中的 MVC 功能 我非常喜欢 Sencha 但在使用控制器将数据从一个 屏幕 传递到下一个 屏幕 时遇到了一些麻烦 有一个与许多 Sencha 小部件关联的 记录 属性 例如
  • UnicodeDecodeError:“charmap”编解码器无法解码位置 XXX 中的字节 0x8f:char

    我正在尝试从 python 脚本读取一个日志文件 我的程序在 Linux 中运行良好 但在 Windows 中遇到错误 在读取特定行号的某些行后 我收到以下错误 File C Python lib encodings cp1252 py l
  • 如何在Xamarin中查找当前的UIViewController

    我正在使用Facebook 身份验证 SDK 使用 Xamarin Forms C example 然而 Facebook SDK 已经弃用了该方法 并将其替换为添加了fromViewController变量到构造函数中 我对 Xamari
  • Fluent Wait 和 WebDriver Wait - 差异

    我都看过FluentWait and WebDriverWait在使用 Selenium 的代码中 FluentWait使用轮询技术 即它将在每个固定间隔轮询特定的WebElement 我想知道有什么作用WebDriverWait做与Exp
  • python websocket 握手(RFC 6455)

    我正在尝试使用 RFC 6455 协议在 python 上实现一个简单的 websocket 服务器 我采用了握手格式here and here 我使用 Chromium 17 和 Firefox 11 作为客户端 并收到此错误 Uncau
  • Android AdMob - 请求欧洲用户同意

    我实施了欧盟用户同意政策 with Android AdMob根据本文 问题 UserMessagingPlatform总是失败onConsentInfoUpdateFailure在真实设备 带有 HashedId 或模拟器上 错误 服务器
  • Flask-SQLalchemy 更新一行信息

    如何更新行的信息 例如 我想更改 id 为 5 的行的名称列 使用检索对象Flask SQLAlchemy 文档中显示的教程 获得要更改的实体后 请更改实体本身 然后 db session commit 例如 admin User quer
  • 如何从 SQL Server 发送电子邮件?

    如何使用 T SQL 发送电子邮件 但电子邮件地址存储在表中 我想遍历表格并能够发送电子邮件 到目前为止 我找不到这样做的好例子 步骤 1 创建个人资料和帐户 您需要使用配置数据库邮件向导创建配置文件和帐户 可以从管理节点中数据库邮件节点的
  • ADB 在 Eclipse 中崩溃

    这个问题涉及到这个线程 但是该线程没有答案 因此从技术上讲这不是重复的 我已经在 Windows 7 x64 和 Eclipse SDK 3 6 2 上运行 ADB 1 0 26 并使用 ADT 10 0 1 SDK 工具 r10 并且已经
  • 如何在 Kotlin 中基于/比较多个值进行排序?

    说我有一个class Foo val a String val b Int val c Date 我想对列表进行排序Foos 基于所有三个属性 我该怎么办呢 Kotlin 的 stdlib 为此提供了许多有用的辅助方法 首先 您可以使用以下
  • 将 .html 文件转换为图像 [关闭]

    Closed 这个问题是无关 目前不接受答案 我正在寻找任何能够忠实地将 html 文件转换为图像格式的实用程序 最好是 png 或 jpeg 我在谷歌上搜索了几个小时 下载了十几个免费试用版 但似乎没有任何效果 Adobe Acrobat
  • npm install -g less 不起作用:EACCES:权限被拒绝

    我正在尝试在 phpstorm 上设置 less 以便我可以在保存时将 less 文件编译为 css 我已经安装了node js和下一步 根据这个https www jetbrains com webstorm help transpili
  • Android ListView 具有多个选择和自定义适配器

    我有一个ListView使用自定义适配器 这ListView允许多项选择 但不知何故它无法识别何时选择了某个项目 我已经使适配器项目扩展为 Checkable 但仍然getCheckedItemPositions 返回一个包含 false
  • 使用控制台让 python 在 Windows XP 上以 UTF8 打印

    我想在 Windows XP 上配置我的控制台以支持 UTF8 并让 python 检测到它并使用它 到目前为止 我的尝试 C Documents and Settings Philippe gt C Python25 python exe
  • Parallel.ForEach 与 BlockingCollection 集成时停止

    我根据中的代码采用了并行 消费者的实现这个问题 class ParallelConsumer
  • Bundle.setup 和 Bundle.require 有什么区别

    From gemfile 手册页 我了解到有两种方法import您在中指定的宝石Gemfile The bundle setup将 安装程序将 gems 添加到 Ruby 的加载路径 同时bundle require将需要所有宝石 这两种方
  • Python Pandas 替换特殊字符

    由于某种原因 我无法让这个简单的语句适用于 它似乎对其他任何事情都有效 但不喜欢那个角色 有任何想法吗 DF NAME DF NAME str replace n Thanks 我假设您在这里使用 Python 2 x 这可能是 Unico