从字符串中删除重音字符 - Python

2023-12-19

我从网页获取一些数据并在 python 中像这样读取它

origional_doc = urllib2.urlopen(url).read()

有时此网址包含以下字符é and ä and ect.，我怎样才能从字符串中删除这些字符，现在这就是我正在尝试的，

import unicodedata
origional_doc = ''.join((c for c in unicodedata.normalize('NFD', origional_doc) if unicodedata.category(c) != 'Mn'))

但我收到一个错误

TypeError: must be unicode, not str

这应该有效。它将消除所有非 ASCII 字符。

    original_doc = (original_doc.decode('unicode_escape').encode('ascii','ignore'))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Unicode

从字符串中删除重音字符 - Python 的相关文章

tensorflow Protobuf编译问题

我想为 google 对象检测 API 编译 protobuf 库我按照官方教程输入protoc object detection protos proto python out 然后我得到的是 object detection prot
Django：将博客条目查看次数增加一。这有效率吗？

我的索引视图中有以下代码 latest entry list Entry objects filter is published True order by date published 10 for entry in latest ent
优化完美平方问题，类似于Python中的硬币找零

我这里有一个硬币兑换的解决方案 python 中的 leetcode 硬币兑换 https stackoverflow com questions 69517078 coin change leetcode in python 因为完全平方
Pandas 字符串提取所有匹配项

我正在学习 pandas 系列字符串方法中的正则表达式操作我能够从字符串中提取第一个数字但我的正则表达式与第二个数字不匹配如何捕获这两个数字注意第二行第二个元素在这里是 NAN CODE import pandas as pd d
如何为 Intellij/PyCharm 设置 PYTHONSTARTUP 脚本

我尝试添加PYTHONSTARTUP环境变量我还尝试了自定义启动脚本但更令人惊讶的是这also没有工作 npa别名无法识别出于一点绝望我什至尝试添加到interpreter options 那什么也没做实际上是什么Interpr
scipy.misc.imshow RuntimeError('无法执行图像视图')

我正在测试scipy misc imshow https docs scipy org doc scipy 0 15 1 reference generated scipy misc imshow html我得到了运行时错误无法执行图像查
如何使用 HTTP 标头发送非英语 unicode 字符串？

我是 HTTP 相关问题的新手我的问题是在 iOS 开发中我想使用 HTTP 标头发送一个字符串所以我使用 httpRequest setValue nonEnglishString forHTTPHeaderField custom
如何从 Lua 调用 Python 函数？

我想从我的 lua 文件运行 python 脚本我怎样才能实现这个目标 Example Python代码 sum py file def sum from python a b return a b Lua code main lua f
OpenCV - 我需要将彩色图像插入黑白图像并且

我用以下代码将黑白图像插入彩色图像没问题 face grey cv cvtColor face cv COLOR RGB2GRAY for row in range 0 face grey shape 0 for column in ra
检测/删除 Python 2 + GTK 中不成对的代理字符

在Python 2 7中我可以成功转换Unicode字符串 abc udc34xyz 转换为 UTF 8 结果是 abc xed xb0 xb4xyz 但是当我将 UTF 8 字符串传递给例如时 pango parse markup or
在 vim 折叠线中语法高亮 Python

我发现代码折叠 http en wikipedia org wiki Code folding帮助我更好地组织我的文件因此在我的底部 vimrc 我启用vim代码折叠 http vimdoc sourceforge net htmldo
Flask 中的 import 和 extends 有什么区别？

我正在阅读 Flask Web 开发在例4 3中 extends base html import bootstrap wtf html as wtf 我想知道 extends 和 import 有什么区别我认为它们在用法上很相似在什
使用 python 只读取 Excel 中的可见行

我想只读取 python 中 Excel 工作表中的可见行输入 Excel表所以当我过滤时作为 python 中的输出在本例中我将仅获得可见数据 1 行这是我的代码 from openpyxl import load workbo
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
如何删除 pandas 数据框中的唯一行？

我遇到了一个看似简单的问题在 pandas 数据框中删除唯一的行基本上相反drop duplicates https pandas pydata org pandas docs stable generated pandas Data
如何在 Pytorch 中将一维 IntTensor 转换为 int

如何将一维 IntTensor 转换为整数这 IntTensor int 给出错误 KeyError Variable containing 423 torch IntTensor of size 1 我所知道的最简单最干净的方法 In
如何绘制多类分类器的精度和召回率？

我正在使用 scikit learn 我想绘制精度和召回曲线我正在使用的分类器是RandomForestClassifier scikit learn 文档中的所有资源都使用二元分类另外我可以绘制多类的 ROC 曲线吗另外我只找到
PyCharm - 如何挂起所有线程

我们使用 PyCharm 5 0 1 进行多线程调试当它在断点处停止时只有特定线程停止而所有其他线程继续这使得冻结时刻和检查参数值以及其他线程的当前状态变得困难当其中一个线程在断点处停止时是否可以挂起所有线程这在最新的 P
Celery：每个工作人员的 task_acks_late 的不同设置/向 celery 添加自定义选项

这个问题是后续问题django celery 禁用一个工作者的预取有错误吗 https stackoverflow com questions 58290045 django celery disable prefetch for one
如何使用 pygame.mixer 重复音乐？

我创建了以下使用 pygame mixer 播放 mp3 音乐的代码然而音乐不会重复有什么想法可以让音乐重复播放吗这是代码 playlist list playlist append put music here mp3 playl

随机推荐

如何使用实体框架检索插入实体的 ID？

我在 ASP NET 中的实体框架方面遇到问题每当我向数据库添加对象时我都想获取 Id 值我怎样才能做到这一点根据实体框架 https entityframework net 解决办法是 using var context new
使用 plyr、doMC 和 summarise() 处理非常大的数据集？

我有一个相当大的数据集约 140 万行我正在对其进行一些拆分和总结整个事情需要一段时间才能运行而我的最终应用程序依赖于频繁运行所以我的想法是使用doMC和 parallel TRUE像这样使用 plyr 进行标记稍微简化一下
在序言中的特定元素之前和之后拆分列表（不使用“split”谓词？）

我试图将列表拆分为特定元素特别是停止一词之前的项目以及该元素之后的项目我知道你可以使用 split 来做到这一点但我是序言新手所以我正在尝试在当前不使用这些函数的情况下操作事物所以我真的很想知道这是否可能也许还有一些正确方
设计键盘快捷键的最佳实践

I am a big fan of keyboard shortcuts If some function or operation doesn t have shortcut I tend to write a little progra
如何动态创建类

我需要动态创建一个类对象我尝试使用动态关键字 dynamic dataTransferObject new dtoClass dataTransferObject Property1 someValue dataTransferObjec
Python - IndexError：列表索引超出范围 - 不起作用

这是我的 scrap py 代码 from bs4 import BeautifulSoup as soup from urllib request import urlopen as uReq website https houston
圆圈的边框样式为刻度线

我有一个带有虚线边框的圆圈然而边框应该更像垂直的破折号而不是点有没有办法用css使边框与设计完全相同垂直虚线而不是粗实线我想更改此类 OtherCaptionBorder My css caption circle positi
使用 JsonConverter 的 Json.NET 自定义序列化 - 如何获得“默认”行为

我的类 DataType 有一个 JsonConverter 当 Json 中使用纯字符串作为 DataType 类型的属性值时我想进行一些特殊处理在该值是完整对象的情况下我想进行正常反序列化这是我的尝试 public ov
print() 函数打印列表中每个元素的内容

基本上我正在尝试编写一个打印语句该语句允许我在运行 driver java 时将每行的元素作为 println 打印为输出我一生都不知道该怎么做任何帮助将不胜感激这是driver java public class Driver
如何将 ANSEL 文本转换为 UTF-8

如何在 C 中将 ANSEL 编码的文本更改为 UTF 8 这是一个重要的转换因为 Windows NET Framework 没有 ANSEL 代码页看here http www heiner eichmann de gedcom c
实体框架登录失败错误

我已经在 IIS 中托管了我的 WCF 应用程序并设置了一个集成了 4 0 的应用程序池我将池标识配置为网络服务我已经检查了与此问题相关的其他帖子但无法解决它我得到以下异常 System Data Entity Core Enti
混合地图类型图块的 Google 地图图块 URL？

我找到了常规地图图块的基本 URL 结构 https mts1 google com vt lyrs m 186112443 hl x local src app x 1325 y 3143 z 13 s Galile 从 Google 获
SetProcessDpiAwareness 没有效果

我一直在尝试禁用 ClickOnce 应用程序上的 DPI 感知我很快发现不可能在清单中指定它因为 ClickOnce 不支持清单文件中的 asm v3 我发现的下一个选项是调用新的 Windows 函数设置进程Dpi感知 https
为什么建议的 Swift 单例实现使用结构体？

The 普遍接受的 Swift 单例模式 https stackoverflow com a 24024762 998117在类变量类型属性中使用 Struct 代替 class MySingleton class var sharedI
如何在opencart中自动选择结账选项？

在我正在开发的商店中用户只有创建帐户才能查看价格并将产品添加到购物车之后他们可以将产品添加到购物车帐单详细信息和交付详细信息选项将自动填写用户的地址送货方式免费付款方式为货到付款我如何自动选择这些选项并隐藏它们这样剩下的唯
如何在 Keras 中使用 categorical_hinge？

也许是一个非常愚蠢的问题但我找不到如何在 Keras 中使用 categorical hinge 的示例我进行分类我的目标是shape 1 值为 1 0 1 所以我有 3 个类别使用函数式 API 我设置了输出层如下所示输出密
C# FluentScheduler 作业不重复

我有一个简单的任务我试图使用 FluentScheduler 重复执行但我似乎无法让它正常运行我对工作和行动完全陌生所以我确信这是我没有考虑到的愚蠢的事情我正在修改我原来的问题因为提供的解决方案适用于控制台应用程序但不
matlab中循环与矢量化的比较

让我们考虑以下脉冲函数代码 function y impulse function n y 0 if n 0 y 1 end end 这段代码 gt gt n 2 2 gt gt i 1 length n gt gt f i impulse
每次我打开对话框时，Microsoft Visual Studio 2019“服务器繁忙”。 Devenv.exe 与 textservice.dll 发生错误

每次我打开对话框时 Microsoft Visual Studio 2019 都会显示服务器繁忙对话框 Procmon 搜索 devenv exe 发现以下文件至少有 100 个 NO SUCH FILE 条目 C Users jlav
从字符串中删除重音字符 - Python

我从网页获取一些数据并在 python 中像这样读取它 origional doc urllib2 urlopen url read 有时此网址包含以下字符 and and ect 我怎样才能从字符串中删除这些字符现在这就是我正在尝试的

从字符串中删除重音字符 - Python

从字符串中删除重音字符 - Python 的相关文章

随机推荐

热门标签