Python Pandas 替换特殊字符

2023-11-25

由于某种原因，我无法让这个简单的语句适用于ñ。它似乎对其他任何事情都有效，但不喜欢那个角色。有任何想法吗？

DF['NAME']=DF['NAME'].str.replace("ñ","n")

Thanks

我假设您在这里使用 Python 2.x，这可能是 Unicode 问题。别担心，你并不孤单——unicode 一般来说非常困难，尤其是在 Python 2 中，这就是为什么它在 Python 3 中成为标准。

如果您所关心的只是ñ，你应该用UTF-8解码，然后只替换一个字符。

看起来像下面这样：

DF['name'] = DF['name'].str.decode('utf-8').replace(u'\xf1', 'n')

举个例子：

>>> "sureño".decode("utf-8").replace(u"\xf1", "n")
u'sureno'

如果您的字符串已经是 Unicode，那么您可以（并且实际上必须）跳过decode step:

>>> u"sureño".replace(u"\xf1", "n")
u'sureno'

这里请注意u'\xf1'使用十六进制转义对于有问题的角色。

Update

我在评论中得知<>.str.replace是 pandas 系列方法，我没有意识到。这个问题的答案可能如下：

DF['name'] = map(lambda x: x.decode('utf-8').replace(u'\xf1', 'n'), DF['name'].str)

或者类似的东西，如果 pandas 对象是可迭代的。

另一个更新

实际上我只是想到您的问题可能很简单，如下所示：

DF['NAME']=DF['NAME'].str.replace(u"ñ","n")

请注意我是如何添加的u在字符串前面，使其成为 unicode。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

tilde

Python Pandas 替换特殊字符的相关文章

Django 的内联管理：一个“预填充”字段

我正在开发我的第一个 Django 项目我希望用户能够在管理中创建自定义表单并向其中添加字段当他或她需要它们时为此我在我的项目中添加了一个可重用的应用程序可在 github 上找到 https github com stephen
如何用python脚本控制TP LINK路由器

我想知道是否有一个工具可以让我连接到路由器并关闭它然后从 python 脚本重新启动它我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器但是
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
Pandas 日期时间格式

是否可以用零后缀表示 pd to datetime 似乎零被删除了 print pd to datetime 2000 07 26 14 21 00 00000 format Y m d H M S f 结果是 2000 07 26 14
使用Python请求登录Google帐户

在多个登录页面上需要谷歌登录才能继续我想用requestspython 中的库以便让我自己登录通常这很容易使用requests库但是我无法让它工作我不确定这是否是由于 Google 做出的一些限制也许我需要使用他们的 API 或
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
立体太阳图 matplotlib 极坐标图 python

我正在尝试创建一个与以下类似的简单的立体太阳路径图 http wiki naturalfrequent com wiki Sun Path Diagram http wiki naturalfrequency com wiki Sun Pa
“隐藏”内置类对象、函数、代码等的名称和性质[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我很好奇模块中存在的类builtins无法直接访问的例如 type lambda 0 name function of module
如何使用python在一个文件中写入多行

如果我知道要写多少行我就知道如何将多行写入一个文件但是当我想写多行时问题就出现了但是我不知道它们会是多少我正在开发一个应用程序它从网站上抓取并将结果的链接存储在文本文件中但是我们不知道它会回复多少行我的代码现在如下 r
如何通过索引列表从 dask 数据框中选择数据？

我想根据索引列表从 dask 数据框中选择行我怎样才能做到这一点 Example 假设我有以下 dask 数据框 dict A 1 2 3 4 5 6 7 B 2 3 4 5 6 7 8 index x1 a2 x3 c4 x5 y6 x
pyspark 将 twitter json 流式传输到 DF

我正在从事集成工作spark streaming with twitter using pythonAPI 我看到的大多数示例或代码片段和博客是他们从Twitter JSON文件进行最终处理但根据我的用例我需要所有字段twitter J
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
使用特定颜色和抖动在箱形图上绘制数据点

我有一个plotly graph objects Box图我显示了箱形图中的所有点我需要根据数据的属性为标记着色如下所示我还想抖动这些点下面未显示 Using Box我可以绘制点并抖动它们但我不认为我可以给它们着色 fig a
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
python import inside函数隐藏现有变量

我在我正在处理的多子模块项目中遇到了一个奇怪的 UnboundLocalError 分配之前引用的局部变量问题并将其精简为这个片段使用标准库中的日志记录模块 import logging def foo logging info fo
Python ImportError：无法导入名称 __init__.py

我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem
如何应用一个函数 n 次？ [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案假设我有一个函数它接受一个参数并返回相同类型的结果 def increment x return x 1 如何制作高阶函数repeat可以
在 JavaScript 函数的 Django 模板中转义字符串参数

我有一个 JavaScript 函数它返回一组对象 return Func id name 例如我在传递包含引号的字符串时遇到问题 Dr Seuss ABC BOOk 是无效语法 I tried name safe 但无济于事有什么解
cv2.VideoWriter：请求一个元组作为 Size 参数，然后拒绝它

我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频构造 VideoWriter 对象时文档表示 Size 参数应该是一个元组当我给它一个元组时它拒绝它当我尝试用其他东西替换它时它不会接受它因为它说参数不是
Kivy - 单击按钮时编辑标签

我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo

随机推荐

对多线程应用程序进行单元测试

有人对多线程应用程序的单元测试有任何建议或了解任何框架吗 Do not unit测试多线程应用程序重构代码以消除不同线程中完成的工作之间的耦合然后分别进行测试
清除 R / RStudio 中的启动屏幕

我想更改我第一次打开 R 或实际 Rstudio 时看到的启动登录屏幕我想要的只是 gt 提示仅此而已我知道我以前在网上见过这个但不记得搜索短语是什么我应该补充说我正在使用乌班图Linux 有什么建议么其他人给你建议如何停止这
将选项值设置为选定的

我想加载一个选择框其中用户选择的值将自动出现我正在从服务器接收带有用户信息的 Json 数据数据样本是 color red 在我的 html 代码中我有这样的选择选项
Sencha Touch MVC——通过控制器传递数据的推荐方式？

我正在使用 Sencha Touch 作为移动应用程序并使用其中的 MVC 功能我非常喜欢 Sencha 但在使用控制器将数据从一个屏幕传递到下一个屏幕时遇到了一些麻烦有一个与许多 Sencha 小部件关联的记录属性例如
UnicodeDecodeError：“charmap”编解码器无法解码位置 XXX 中的字节 0x8f：char

我正在尝试从 python 脚本读取一个日志文件我的程序在 Linux 中运行良好但在 Windows 中遇到错误在读取特定行号的某些行后我收到以下错误 File C Python lib encodings cp1252 py l
如何在Xamarin中查找当前的UIViewController

我正在使用Facebook 身份验证 SDK 使用 Xamarin Forms C example 然而 Facebook SDK 已经弃用了该方法并将其替换为添加了fromViewController变量到构造函数中我对 Xamari
Fluent Wait 和 WebDriver Wait - 差异

我都看过FluentWait and WebDriverWait在使用 Selenium 的代码中 FluentWait使用轮询技术即它将在每个固定间隔轮询特定的WebElement 我想知道有什么作用WebDriverWait做与Exp
python websocket 握手（RFC 6455）

我正在尝试使用 RFC 6455 协议在 python 上实现一个简单的 websocket 服务器我采用了握手格式here and here 我使用 Chromium 17 和 Firefox 11 作为客户端并收到此错误 Uncau
Android AdMob - 请求欧洲用户同意

我实施了欧盟用户同意政策 with Android AdMob根据本文问题 UserMessagingPlatform总是失败onConsentInfoUpdateFailure在真实设备带有 HashedId 或模拟器上错误服务器
Flask-SQLalchemy 更新一行信息

如何更新行的信息例如我想更改 id 为 5 的行的名称列使用检索对象Flask SQLAlchemy 文档中显示的教程获得要更改的实体后请更改实体本身然后 db session commit 例如 admin User quer
如何从 SQL Server 发送电子邮件？

如何使用 T SQL 发送电子邮件但电子邮件地址存储在表中我想遍历表格并能够发送电子邮件到目前为止我找不到这样做的好例子步骤 1 创建个人资料和帐户您需要使用配置数据库邮件向导创建配置文件和帐户可以从管理节点中数据库邮件节点的
ADB 在 Eclipse 中崩溃

这个问题涉及到这个线程但是该线程没有答案因此从技术上讲这不是重复的我已经在 Windows 7 x64 和 Eclipse SDK 3 6 2 上运行 ADB 1 0 26 并使用 ADT 10 0 1 SDK 工具 r10 并且已经
如何在 Kotlin 中基于/比较多个值进行排序？

说我有一个class Foo val a String val b Int val c Date 我想对列表进行排序Foos 基于所有三个属性我该怎么办呢 Kotlin 的 stdlib 为此提供了许多有用的辅助方法首先您可以使用以下
将 .html 文件转换为图像 [关闭]

Closed 这个问题是无关目前不接受答案我正在寻找任何能够忠实地将 html 文件转换为图像格式的实用程序最好是 png 或 jpeg 我在谷歌上搜索了几个小时下载了十几个免费试用版但似乎没有任何效果 Adobe Acrobat
npm install -g less 不起作用：EACCES：权限被拒绝

我正在尝试在 phpstorm 上设置 less 以便我可以在保存时将 less 文件编译为 css 我已经安装了node js和下一步根据这个https www jetbrains com webstorm help transpili
Android ListView 具有多个选择和自定义适配器

我有一个ListView使用自定义适配器这ListView允许多项选择但不知何故它无法识别何时选择了某个项目我已经使适配器项目扩展为 Checkable 但仍然getCheckedItemPositions 返回一个包含 false
使用控制台让 python 在 Windows XP 上以 UTF8 打印

我想在 Windows XP 上配置我的控制台以支持 UTF8 并让 python 检测到它并使用它到目前为止我的尝试 C Documents and Settings Philippe gt C Python25 python exe
Parallel.ForEach 与 BlockingCollection 集成时停止

我根据中的代码采用了并行消费者的实现这个问题 class ParallelConsumer
Bundle.setup 和 Bundle.require 有什么区别

From gemfile 手册页我了解到有两种方法import您在中指定的宝石Gemfile The bundle setup将安装程序将 gems 添加到 Ruby 的加载路径同时bundle require将需要所有宝石这两种方
Python Pandas 替换特殊字符

由于某种原因我无法让这个简单的语句适用于它似乎对其他任何事情都有效但不喜欢那个角色有任何想法吗 DF NAME DF NAME str replace n Thanks 我假设您在这里使用 Python 2 x 这可能是 Unico

热门标签