编码报错:‘gbk‘ codec can‘t decode byte 0xb5

2023-11-01

编解码问题:'gbk' codec can't decode byte 0xb5

 今天抓取数据时,对抓取的数据进行处理时发现是乱码,如图所示:

 使用gbk和utf-8对其进行编解码,发现还是有问题,后来去查阅了相关资料,发现是编解码的问题,gbk对有些汉字的字符无法识别所以就会报错:

原因:

网页的原数据中有法语等特殊语法字符,Gbk和utf-8无法识别

解决方法:

使用unicode_escape进行编码

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

编码报错:‘gbk‘ codec can‘t decode byte 0xb5 的相关文章

  • C++:替换string中的字符

    1 按照位置进行替换 string的成员函数replace可以满足这种需求 其变体有很多种 请参考官方文档 以下列举常用的两种 include

随机推荐

  • Jmeter性能测试——1.设置代理

    Jmeter设置代理 1 添加http代理服务器 2 添加线程组 3 设置要录制的服务器IP地址或者域名 4 在线程组中添加 录制控制器 5 设置代理服务器 HTTP Proxy Server 1 gt 配置端口号 默认为8080 2 gt
  • 《The Tao Of Programming》——编程之道

    这本书居然可以结合老子的 南华经 庄子的 庄子 以及 论文 来谈论编程 编程似乎成为了如此文艺的东西 深不可测 后来作者还写了 编程之禅 计算机寓言 信息时代的启示 如此有逼格的东西 下面摘录几句 有点儿意思 The Silent Void
  • 【Games101 作业6 + 附加题】渲染兔子 BVH SAH 代码

    基础题部分 根据教程PDF 首先需要引用如下函数 在作业5的基础上稍作修改 renderer in Renderer cpp 解说见注释 The main render function This where we iterate over
  • python学习之星号三角形

    描述 读入一个整数N N是奇数 输出由星号字符组成的等边三角形 要求 第1行1个星号 第2行3个星号 第3行5个星号 依次类推 最后一行共N的星号
  • 【送书活动】畅销书《Kali Linux高级渗透测试》更新版速速查收~

    文章目录 每日一句正能量 前言 本书概况 读者对象 赠书活动 目录 每日一句正能量 其实 人生很多东西无所谓最好的 只要你认为值得就是最好 前言 对于企业网络安全建设工作的质量保障 业界普遍遵循PDCA 计划 Plan 实施 Do 检查 C
  • CM金丝雀Canary报错

    CM金丝雀Canary报错 1 HDFS 金丝雀 Canary 测试无法为 tmp cloudera health monitoring canary files 创建父目录 2 Hive Metastore Canary Hive Met
  • python利用pyhive 连接hive

    1 下载需求包 pip install sasl pip install thrift pip install thrift sasl pip install PyHive 2 连接hive 注意端口默认为10000 from pyhive
  • Python 单分配泛函数

    单分配泛函数 通俗一点的说法就是 根据函数传入的第一个参数的数据类型的不同 而执行不同的方法 单分派 根据一个参数的类型 以不同方式执行相同的操作的行为 多分派 可根据多个参数的类型选择专门的函数的行为 泛函数 多个函数绑在一起组合成一个泛
  • 融合注意力机制和Bi-LSTM的旅游评价情感分析模型

    摘要 旅游评价情感分析对了解游客偏好具有重要意义 然而现有的旅游评价情感分析模型较少突出游客情感描述的核心内容 为了更加精确地分析游客评价的情感倾向 提出一种结合词性注意力机制和双向长短期记忆神经网络 Bi directional Long
  • pd.MultiIndex() 报错 TypeError: __new__() got an unexpected keyword argument ‘labels‘

    pd MultiIndex 报错 TypeError new got an unexpected keyword argument labels coefficients list coeff labels lr l1 l2 coeff m
  • angularJS+requireJS实现controller及directive的按需加载

    最近因为项目的比较大 需要加载的js文件较多 为了提高首屏页面的加载速度 需要对js文件进行按需加载 然后网上参考了一些资料 自己也深入研究一番之后 实现了按需加载控制器js文件及指令js文件的效果 思路如下 1 借助ui router里面
  • 删除服务器上的日志文件,服务器删除文件日志

    服务器删除文件日志 内容精选 换一换 Manager的审计日志默认保存在数据库中 如果长期保留可能引起数据目录的磁盘空间不足问题 管理员如果需要将审计日志保存到其他归档服务器 可以在FusionInsight Manager设置转储参数及时
  • 脑电EEG的几种蒙太奇

    EEG设备电极使用的几种蒙太奇 顺序蒙太奇 Sequential Montage 每个通道测量的是两个电极之间的差分电压 即差分输入 参考蒙太奇 Referential Montage 每个通道测量的是一个电极与一个指定参考电极之间的电压差
  • JSP out.write()方法具有什么功能呢?

    转自 JSP out write 方法具有什么功能呢 下文讲述out对象中write 方法的功能简介说明 如下所示 out write 方法的功能 用于输出字符串 注意事项 out write 方法只能输出字符 当放入的信息是数字时 会转换
  • jwt的基本使用

    文章目录 介绍 用途 解决跨域访问的问题 原理 JWT 的数据结构 JWT基本使用 介绍 JWT是json web token缩写 它将用户信息加密到token里 服务器不保存任何用户信息 服务器通过使用保存的密钥验证token的正确性 只
  • 什么?居然有人把图片从 1M 优化到 1024kb

    前两天刷知乎热搜看到一篇帖子 某省会城市健康码连续两次崩溃 相关公司在之前的报道中还声称 用两天两夜 将 1M 图片优化到 100kb 报道中提到 为了确保系统运行更高效 他们将一张图片从 1MB 压缩到 500 KB 再从 500KB 优
  • springboot html vue.js 前后分离代码示例

    1 html table class table table hover thead tr th style width 50px div class checkbox d inline div th tr thead table
  • 揭晓eval(function(p,a,c,k,e,r)js代码解密加密程序

    最近大雄搜集站 在弄改一个wp网站侧边栏的小工具就发现了 JS的代码脚本很乱 不是常规写法 后来查阅发现是由于JS加密造成的 我对这种事情很不理解 有一些既然是选择开源了 为啥JS还加密 走你 那就一起一波骚操作解密它 首先如果你发现你的J
  • 解决:Java source1.5不支持diamond运算符

    diamond运算符 指的是JDK1 7的一个新特性而Maven默认用的是JDK1 5去编译 对于这个问题 这里提供以下两种方案 1 在项目的pom xml中加入以下的配置 这种方法只只对当前的模块或者项目
  • 编码报错:‘gbk‘ codec can‘t decode byte 0xb5

    编解码问题 gbk codec can t decode byte 0xb5 今天抓取数据时 对抓取的数据进行处理时发现是乱码 如图所示 使用gbk和utf 8对其进行编解码 发现还是有问题 后来去查阅了相关资料 发现是编解码的问题 gbk