Python读取txt文本出现“ ‘gbk‘ codec can‘t decode byte 0xbf in position 2: illegal multibyte sequence”

2023-11-08

1、通过python读取temp.txt时

出现如下错误:

错误的意思是:

Unicode的解码(Decode)出现错误(Error)了,以gbk编码的方式去解码(该字符串变成

Unicode),但是此处通过gbk的方式,却无法解码(can’t decode )。“illegal multibyte

sequence”意思是非法的多字节序列,即没法(解码)了。

     此种错误,可能是要处理的字符串本身不是gbk编码,但是却以gbk编码去解码 。

     比如,字符串本身是utf-8的,但是却用gbk去解码utf-8的字符串,所以结果不用说,则必然出错。

     通过查阅资料,有提出在读取文本的时候加入参数‘b’,不会提示错误,通过输出读取的数据显

示。

    针对以上的这个问题,查阅网上资料,可以按照如下的步骤进行尝试:

(1)在打开文本时候,可以指明打开方式:

file = open(path, encoding='gbk')

(2)如果上一步还不能解决

可能是文本中出现的一些特殊符号超出了gbk的编码范围,可以选

择编码范围更广的‘gb18030’,如:

 file = open(path, encoding='gb18030'

(3)如果上一步还不能解决

说明文中出现了连‘gb18030’也无法编码的字符,可以使用‘ignore’属性忽略非法字符,如:

file = open(path, encoding='gb18030', errors='ignore')

或者

file=open(path).read().decode(‘gb18030’,’ignore’)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python读取txt文本出现“ ‘gbk‘ codec can‘t decode byte 0xbf in position 2: illegal multibyte sequence” 的相关文章

随机推荐

  • Media Player播放视频只有声音没有图像

    今天在播放学生信息管理系统的时候发现视频播放后只有声音 却没有图像 这是什么原因呢 一 什么是media player播放器 Windows Media Player 是微软公司出品的一款播放器 通常简称 WMP 通常在Windows操作系
  • 系统架构设计专业技能 · 软件工程之软件测试与维护

    系列文章目录 系统架构设计专业技能 网络规划与设计 三 系统架构设计师 系统架构设计专业技能 系统安全分析与设计 四 系统架构设计师 系统架构设计高级技能 软件架构设计 一 系统架构设计师 系统架构设计高级技能 系统质量属性与架构评估 二
  • PostGreSQL数据库有的为啥找不到数据类型(比如Double)

    今天用NavCate建立PostGreSql建标 使用Double发现居然没有这个类型 百度各种博客都表示有Double类型 但是我测试就没了 后来发现 这里面居然有别名 名字 别名 描述 bigint int8 有符号 8 字节整数 bi
  • 蓝牙PHY6222添加OTA升级功能

    主要步骤 1 代码添加 ota app service 2 keil软件添加ota app代码 3 烧录软件添加ota设置 4 手机ota app升级 准备 奉加微电子官网下载6222的代码SDK V3 0以上 下载官网的PhyPlusKi
  • 谷歌浏览器打开时为桔梗网

    右击 gt 打开文件所在位置 然后将桌面的快捷方式删除 重新创建快捷方式
  • MySQL Server最佳实践

    备份 backups 监控 moitoring 配置 configuration 模式和查询 schema and queries 系统 system 其他 other Backups 备份 做数据库备份 在系统改变时做数据库备份例如升级前
  • 跨域问题详解及解决方案

    文章目录 一 前言 二 什么是跨域问题 三 为什么会出现跨域问题 四 什么情况下会出现跨域 五 如何解决跨域问题 5 1 使用 CrossOrigin注解 5 2 使用WebMvcConfigurer 5 3 使用Filter 六 代码示例
  • Java连接Oracle数据库开发银行管理系统【三、实现篇】

    说明 里面的主要代码都加的有注释部分 所以代码显得很长 如果有错误的地方 谢谢指出 注意需要导入数据库jar包 1 com ll test包下面类 1 1 test类 package com ll test import com ll se
  • pygame的动图实现方法

    最近在完善一个飞机大战的小游戏 一比一按照书上做出来的有些简陋 所以自己往里面加了不少元素 其中一项便是子弹的动态效果 但是pygame不支持gif的动图 可以导入 但不会动 那么该怎么办呢 我们知道 动图的原理其实就是把一组图片快速播放
  • 【测试开发】阿里十年总结之软件测试的价值

    阿里十年总结之软件测试的价值 1 前言 2 质量是什么 2 1 质量是一种奢侈品 2 2 质量是产品的特性 2 3 质量的重要性取决于业务 3 测试能给业务带来什么 3 1 为什么需要测试 3 2 从质量保障到研发效能 4 测试团队如何去突
  • ElementUI2.0组件库el-table表格组件如何自定义表头?

    问题概述 鼠标移动到el table表格组件的表头显示提示信息 也算是自定义表头的一种吧 效果图 宝宝不会做动图 宝宝心里苦 1 ElementUI2 0组件库el table表格组件常规用法 先贴上ElementUI2 0组件库的官网地址
  • 计算机组成原理——期末复习题

    113 计算机系统如何进行多级划分 这种分级观点对计算机设计会产生什么影响 答案 计算机系统通常由五个以上不用的级组成 具体如下 第1级是微程序设计级或逻辑电路级 该级由硬件直接执行 第2级是一般机器级 也称为机器语言级 它由微程序解释机器
  • ACE编程遇到的问题

    1 配置 在项目的属性页里 添加附加包含目录 附加目录库和附加依赖项 不然容易报缺失头文件的错误 1 2 3 2 项目 error PRJ0002 错误的结果 31 从 C Program Files MicrosoftSDKs Windo
  • 雷电模拟器桥接模式不显示网卡,4版本不能设置代理

    版本3 121 0 点击安装驱动之后 提示成功 但是这时候 桥接网卡 还是不能选中任何东西的 如果这时候直接点保存设置 再运行模拟器 会出现崩溃 点击一键修复 修复完成 提示重启电脑 然而并无卵用 开启模拟器时仍然会崩溃 再提示修复 再提示
  • 信息安全密码学:DES算法的核心 E盒、S盒、P盒

    加密密钥等于脱密密钥 或者由一个可以轻易的计算出另一个的密码体制 称为单密钥密码体制 亦或称为对称密码体制或传统密码体制 其最具代表意义的当然属于DES密码体制了 1 DES的设计背景 1973年5月 NBS 美国国家标准局 发布通告 征集
  • 关于layui的css,js文件的引入问题

    关于layui的css js文件的引入问题 最近在自己搭建写一个SpringBoot的项目 在引入静态资源文件后静态资源文件虽然可以进行访问 但是我点击相关按钮后却发现点击事件却一直无法正常实现 这是第一反应就是我jq和layui是否引入问
  • 安装MySQL失败,Apply Configuration出现Initializing database

    之前安装过启动不了 卸载后重新安装 还是不行 Beginning configuration step Initializing database may take a long time Attempting to run MySQL S
  • HttpStatus状态码详解

    HttpStatus Informational 1xx 信息 100 Continue 继续 101 Switching Protocols 交换协议 Successful 2xx 成功 200 OK OK 201 Created 创建
  • 什么是网站服务器VPS,如何选购最适合自己的一款?

    随着互联网的快速发展 越来越多的人需要建立自己的网站 这就需要有一个可靠的服务器来托管网站 而VPS服务器就是一种非常流行的托管网站的选择 本文将介绍什么是VPS服务器 以及如何选购最适合自己的一款 什么是VPS服务器 VPS服务器是Vir
  • Python读取txt文本出现“ ‘gbk‘ codec can‘t decode byte 0xbf in position 2: illegal multibyte sequence”

    1 通过python读取temp txt时 出现如下错误 错误的意思是 Unicode的解码 Decode 出现错误 Error 了 以gbk编码的方式去解码 该字符串变成 Unicode 但是此处通过gbk的方式 却无法解码 can t