处理UnicodeDecodeError: ‘XXX' codec can't decode bytes in position...的问题

2023-05-16

错误信息:

UnicodeDecodeError: ‘XXX' codec can't decode bytes in position 2-5: illegal multibyte sequence 

这是因为遇到了非法字符,例如:全角空格往往有多种不同的实现方式,比如\xa3\xa0,或者\xa4\x57,
这些字符,看起来都是全角空格,但它们并不是“合法”的全角空格
真正的全角空格是\xa1\xa1,因此在转码的过程中出现了异常。 
而之前在处理新浪微博数据时,遇到了非法空格问题导致无法正确解析数据。

[解决办法]

#将获取的字符串strTxt做decode时,指明ignore,会忽略非法字符,

#当然对于gbk等编码,处理同样问题的方法是类似的

strTest = strTxt.decode('utf-8', 'ignore')

return strTest

[补充]

默认的参数就是strict,代表遇到非法字符时抛出异常; 
如果设置为ignore,则会忽略非法字符; 
如果设置为replace,则会用?号取代非法字符; 
如果设置为xmlcharrefreplace,则使用XML的字符引用。 
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

处理UnicodeDecodeError: ‘XXX' codec can't decode bytes in position...的问题 的相关文章

  • HTML5 视频 MEDIA_ERR_DECODE 随机发生

    我正在开发一个包含 6 个音频和视频元素的项目 这些元素依次播放 发出前的代码顺序是这样的 预加载所有媒体资源直到 canplaythrough 播放视频 1 停止 video 1 并播放 audio 1 停止音频 1 并再次播放视频 1
  • Swift:将不受约束的泛型类型转换为确认可解码的泛型类型

    情况 我有两个通用类 它们将从 api 和数据库获取数据 分别说 APIDataSource 和 DBDataSource 创建视图模型时 我将在视图模型中注入两个类中的任何一个 视图模型将使用该类来获取所需的数据 我希望视图模型与这两个类
  • android mediacodec:实时解码h264 nals

    我正在尝试使用 android 低级媒体 api 实时解码 h264 nals 每个 nal 包含一个完整的帧 所以我希望在用我的 nal 提供输入并调用之后dequeueOutputBuffer它会 立即 当然有一点延迟 显示我的框架 但
  • 无损 ffmpeg 转换/编码

    我在转换视频时寻找最好的质量 我只想使用无损音频和视频编码器以及一个好的容器 如何为 ffmpeg 启用无损 x264 vcodec 我目前使用ffmpeg i inputvideo s 1280x720 ar 48000 threads
  • Swift 3 base64 解码返回 nil

    尽管我在互联网上找到了所有方法 但它可以通过在线翻译器发挥作用 比如我尝试过的一个方法 if let decodedData NSData base64Encoded parts 1 as String options NSData Bas
  • Android 上的 MP3 解码

    我们正在为 Android 手机实现一个程序 用于播放来自互联网的音频流 我们所做的大约如下 下载自定义加密格式 解密以获取常规 MP3 数据块 将 MP3 数据解码为内存缓冲区中的原始 PCM 数据 将原始 PCM 数据传送到 Audio
  • Python JSONDecoder 自定义转译null类型

    在 python 中 JSONDecoder 默认将 null 转换为 None 如下所示 我怎样才能将 null gt None 的翻译更改为不同的内容 即 null gt 猫 class json JSONDecoder encodin
  • 向 JavaFX 2.2 添加其他视频编解码器/DVD 支持

    更新 由于 JFX 的媒体端已经开源 我自己对此进行了研究 这确实是可能的 但需要更改和重建 JFX 源 Java 和 C 部分 描述了该过程here http berry120 blogspot co uk 2014 03 expandi
  • PHP 中 /Filter /FlateDecode PDF 流中的数据提取

    我无法解密流中的数据 例如 56 0 obj lt lt Length 1242 Filter FlateDecode gt gt stream x n b Kq whole binary is omitted endstream endo
  • 尝试解码流时膨胀类时出错

    我累坏了 我一整天都在做这件事 在我的应用程序中 我有 100 个 ImageView 但出现 java outofmemory 错误 因此我决定解码并调整文件大小 但我无法管理它工作 有人可以看一下代码并给我建议吗 主要活动代码 公共类
  • UnicodeEncodeError:“ascii”编解码器无法对位置 0-5 中的字符进行编码:序号不在范围(128)[重复]

    这个问题在这里已经有答案了 我只是想解码类似 uXXXX uXXXX uXXXX 的字符串 但我收到一个错误 python Python 2 7 6 default Sep 9 2014 15 04 36 GCC 4 2 1 Compati
  • UnicodeDecodeError:“charmap”编解码器无法解码位置 7240 中的字节 0x8d:字符映射到 <未定义>

    我是一名学生 正在做硕士论文 作为我论文的一部分 我正在与python 我正在阅读日志文件 csv格式化并将提取的数据写入另一个 csv格式良好的文件 但是 当读取文件时 我收到此错误 回溯 最近一次调用最后一次 文件 C Users SG
  • 使用 jQuery / AJAX 解码 JSON

    我正在尝试使用 jQuery 解码 JSON 这是我得到的结果 例如一个班级 这里有一个学生 Students Name John Grade 17 TotalClass 17 TotalCount 1 这就是我所做的 j ajax typ
  • 重写和url解码

    似乎有一个网站以错误的方式链接到我的网站 从谷歌网站管理员工具我看到一些 404 错误 domain com file php id 1 404 Not found Date 这个 url 工作正常 但由于浏览器页面解码 真实的 404 u
  • 如何从 MediaCodec 解码器的输出中提取 PCM 样本

    我正在尝试从解码的 mp4 缓冲区获取 PCM 样本以进行进一步处理 我首先从使用手机相机应用程序录制的视频文件中提取音轨 并且确保当我获得 audio mp4 mime 键时已选择音轨 MediaExtractor extractor n
  • jQuery 1.4.1 中缺少 JSON stringify?

    显然 jQuery 能够将给定的对象或字符串解码为 JSON 对象 但是 我有一个 JS 对象 需要将其 POST 回服务器 并且我在 jQuery 中找不到包装 JSON stringify 函数的实用程序 Chrome Safari 4
  • 我如何检查 base64 字符串是否是文件(什么类型?)?

    我参加了 Spentalkux 挑战https 2020 ractf co uk https 2020 ractf co uk 这是我第一次参加CTF挑战 所以我解决了https github com W3rni0 RACTF 2020 b
  • ffmpeg流rc缓冲区下溢

    目前我正在使用开源工具 ffmpeg ffserver 建立一个屏幕共享平台 分享之初一切都很好 大约 1 1 2 分钟后 我在输出中得到以下异常 flv 0x3a47aa0 rc buffer underflow flv 0x3a47aa
  • IllegalArgumentException Base64到图像解码android

    我想将 Base64 格式的 Web 服务中的图像解码为位图 并在我的 Android 应用程序中使用它 这是我的方法 public Bitmap getCaptcha throws IOException List
  • Swift 4 使用随机密钥解码嵌套 JSON [重复]

    这个问题在这里已经有答案了 我是 Swift 4 的新手 正在尝试从 Wikipedia API 解码此 JSON 我正在努力定义一个结构 因为我发现的所有示例 教程都仅嵌套 1 2 层深度 除此之外 当其中一个密钥是随机的时 如何解码数据

随机推荐