UnicodeEncodeError：“ascii”编解码器无法对位置 20 中的字符 u'\xa0' 进行编码：序号不在范围内（128）

2024-02-26

我在处理从不同网页（在不同站点上）获取的文本中的 unicode 字符时遇到问题。我正在使用美丽汤。

问题是错误并不总是可重现的；它有时可以处理某些页面，有时，它会通过抛出一个UnicodeEncodeError。我已经尝试了几乎所有我能想到的方法，但我还没有找到任何可以一致工作且不会引发某种 Unicode 相关错误的方法。

导致问题的代码部分之一如下所示：

agent_telno = agent.find('div', 'agent_contact_number')
agent_telno = '' if agent_telno is None else agent_telno.contents[0]
p.agent_info = str(agent_contact + ' ' + agent_telno).strip()

以下是运行上面的代码片段时在某些字符串上生成的堆栈跟踪：

Traceback (most recent call last):
  File "foobar.py", line 792, in <module>
    p.agent_info = str(agent_contact + ' ' + agent_telno).strip()
UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position 20: ordinal not in range(128)

我怀疑这是因为某些页面（或更具体地说，某些站点的页面）可能已编码，而其他页面可能未编码。所有网站均位于英国，并提供供英国消费的数据 - 因此不存在与内化或处理非英语文本相关的问题。

有谁知道如何解决这个问题，以便我能够始终如一地解决这个问题？

阅读Python统一码指南 https://docs.python.org/2.7/howto/unicode.html。这个错误是第一个例子 https://docs.python.org/2.7/howto/unicode.html#the-unicode-type.

不使用str()从 unicode 转换为编码文本/字节。

相反，使用.encode() http://docs.python.org/library/stdtypes.html#str.encode对字符串进行编码：

p.agent_info = u' '.join((agent_contact, agent_telno)).encode('utf-8').strip()

或者完全使用 unicode 工作。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Unicode

beautifulsoup

python2x

pythonunicode

UnicodeEncodeError：“ascii”编解码器无法对位置 20 中的字符 u'\xa0' 进行编码：序号不在范围内（128）的相关文章

我怎样才能更多地了解Python的内部原理？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我使用Python编程已经有半年多了我对Python内部更感兴趣而不是使用Python开发应用程序
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
创建嵌套字典单行

您好我有三个列表我想使用一行创建一个三级嵌套字典 i e l1 a b l2 1 2 3 l3 d e 我想创建以下嵌套字典 nd a 1 d 0 e 0 2 d 0 e 0 3 d 0 e 0 b a 1 d 0 e 0 2 d 0
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
使用 NumPy 将非均匀数据从文件读取到数组中

假设我有一个如下所示的文本文件 33 346 1223 10 23 11 23 12 23 13 23 14 23 15 23 16 24 10 24 11 24 12 24 13 24 14 24 15 24 16 25 14 25 15
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
字典和数组作为类变量与实例变量

这是赚取积分的简单方法请解释以下内容 class C a b 0 c def init self self x def d self k v self x k v self a k v self b v self c append v d
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在

随机推荐

创建共现矩阵

我正在尝试解决共现矩阵的问题我有一个交易和项目的数据文件我想查看项目一起出现的交易数量的矩阵我是 R 编程的新手我很高兴发现 R 拥有的所有快捷方式而不是创建特定的循环我几年前曾经使用 C 现在只坚持使用 Excel 宏和 SP
H264解析-切片头检测

我知道在 h264 中我们可以通过位模式检测 NAL 单元0x000001 是否有等效的方法来检测 NAL 单元中的切片标头如何处理多切片 NAL 单元目前我正在使用 h264 的解析代码并获取相应结构中的切片标头切片头语法在第 36
模式匹配 - Prolog 与 Haskell

这不是一个家庭作业问题而是一个考试学习指导问题 Prolog 与 Haskell 中的模式匹配有什么区别我做了一些研究并阅读了它们背后的理论并没有真正让我对两者有一个坚实的理解我在Prolog中读到模式匹配是不同的因为它具有统一变
需要更好的算法来查找 2 组具有最小距离的点之间的映射

Problem 我有两个重叠的 2D 形状 A 和 B 每个形状具有相同数量的像素但形状不同形状的某些部分是重叠的而每个形状的某些部分是不重叠的我的目标是将形状 A 中的所有不重叠像素移动到形状 B 中的不重叠像素由于每个形状中的
网站图像文件是否应该包含在 GIT 存储库中？

我有一个网站文件文件夹结构模板可以开始使用git 它包含一个空的 gitignore文件内的images文件夹这引出了我的两部分问题 1 这个是空的吗 gitignore文件忽略所有位于的图像inside the images文件夹或
Pandas 就地操作 DataFrame 与非就地操作 DataFrame (inplace=True vs False) [重复]

这个问题在这里已经有答案了我想知道当我们选择就地操作数据帧时与没到位我在 Stack Overflow 上做了一些搜索发现了这个post https stackoverflow com questions 43893457 pyth
将 Objective-C 对象作为 void * 指针传递给函数

我有一个功能 myFunction MyProc callback void ref 该函数是从 Objective C 类中调用的该函数传递一个指向回调类中的函数的指针和一个引用该引用是必要的因为回调是静态调用的因此没有上下文
哪个 C/C++ 头文件定义了 BYTE 数据类型？

我正在使用此声明移植标头 struct tMaterialInfo char strName 255 the texture name char strFile 255 the texture BYTE color 3 the color
观看模板文件并将其复制到 dist/ 文件夹

我在我的项目中使用打字稿我可以成功观看编译 ts 文件并将它们输出到dist folder 这里是scripts我的一部分package json start npm run build npm run watch build npm
如何提取这个多态递归函数？

我正在使用 GHC 7 8 做一些相当有趣的事情但遇到了一些问题我有以下内容 mkResultF Eq k gt Query kvs KV k v gt k gt ResultF Reverse kvs Maybe v mkResult
通过重复元素分割数组的最 Pythonic 方法

我有一个要根据分隔符拆分的项目列表我希望删除所有分隔符并在出现时拆分列表分隔符出现两次例如如果分隔符是 X 然后是以下列表 a b X X c d X X f X g 会变成 a b c d f g 请注意最后一组没有拆分我已经编
插入数据库 php 后表情符号显示为问号

我使用utf8mb4作为编码 character set connection和character set database已设置为utf8mb4 我的网页的字符集设置为utf8 我使用了 PDO 当我打开数据库连接时我使用 utf8mb
仅使用 javascript 生成并保存/下载文件 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
冒号运算符在 MATLAB 中如何工作？

如中所述山姆罗伯茨的回答 https stackoverflow com a 26297279 7328782 and gnovice 的另一个答案 https stackoverflow com a 5779438 7328782 MA
从函数返回范围

我试图让 VBA 中的子函数调用另一个函数该函数返回一个范围并设置为一个变量当我尝试运行 GetInputs 方法时出现语法错误 Function GetDataRange str As String As Range This pro
使用 shell 脚本启动远程 (SSH) Java 应用程序将不会返回本地提示符

我见过类似的问题所有解决的问题都已解决不适用我在远程计算机中有一个启动 Java 应用程序的 bash 脚本相关行是 usr bin env bash java cp full path to my jar com whatever
Flood Fill算法导致StackOverFlowError

我正在使用 Java 编写一个简单的绘图应用程序我正在尝试使用洪水填充算法的递归实现作为我的桶填充工具然而这always给我一个StackOverFlowError 无论我使用桶填充工具的区域有多小编辑更改了代码以使其更加
以编程方式将文件检入 TFS 的结果超出预期

因此我有一个 NET 应用程序它会生成一系列文件将它们输出到本地目录然后确定是否需要更新现有文件或将新文件添加到 TFS Team Foundation Server 项目中我的本地计算机上有一个工作区并且有 10 个不同的工作
注释随情节表达而变化？

假设我想制作一个像这样的子图其中每个方面都有自己的 y 尺度 import plotly express as px fig px scatter px data iris x sepal length y sepal width fac
UnicodeEncodeError：“ascii”编解码器无法对位置 20 中的字符 u'\xa0' 进行编码：序号不在范围内（128）

我在处理从不同网页在不同站点上获取的文本中的 unicode 字符时遇到问题我正在使用美丽汤问题是错误并不总是可重现的它有时可以处理某些页面有时它会通过抛出一个UnicodeEncodeError 我已经尝试了几乎所有我能想到

UnicodeEncodeError：“ascii”编解码器无法对位置 20 中的字符 u'\xa0' 进行编码：序号不在范围内（128）

UnicodeEncodeError：“ascii”编解码器无法对位置 20 中的字符 u'\xa0' 进行编码：序号不在范围内（128） 的相关文章

随机推荐

热门标签

UnicodeEncodeError：“ascii”编解码器无法对位置 20 中的字符 u'\xa0' 进行编码：序号不在范围内（128）的相关文章