UnicodeDecodeError：“utf8”编解码器无法解码字节 0x9c

2024-01-13

我有一个套接字服务器，应该从客户端接收 UTF-8 有效字符。

问题是一些客户端（主要是黑客）通过它发送了所有错误类型的数据。

我可以轻松区分真正的客户端，但我将发送的所有数据记录到文件中，以便稍后进行分析。

有时我会遇到这样的角色œ导致UnicodeDecodeError error.

我需要能够将带有或不带有这些字符的字符串设置为 UTF-8。

Update:

对于我的特殊情况，套接字服务是 MTA，因此我只希望接收 ASCII 命令，例如：

EHLO example.com
MAIL FROM: <[email protected] /cdn-cgi/l/email-protection>
...

我将所有这些都记录在 JSON 中。

然后一些不怀好意的人决定发送各种垃圾。

这就是为什么对于我的具体情况，完全可以删除非 ASCII 字符。

http://docs.python.org/howto/unicode.html#the-unicode-type http://docs.python.org/howto/unicode.html#the-unicode-type

str = unicode(str, errors='replace')

str = unicode(str, errors='ignore')

Note: 这将删除（忽略）有问题的字符，返回没有它们的字符串。

对我来说这是理想的情况，因为我使用它来防止我的应用程序不允许的非 ASCII 输入。

或者：使用 open 方法codecs https://docs.python.org/2/library/codecs.html#codecs.open模块读取文件：

import codecs
with codecs.open(file_name, 'r', encoding='utf-8',
                 errors='ignore') as fdata:

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Linux

pythonunicode

UnicodeDecodeError：“utf8”编解码器无法解码字节 0x9c 的相关文章

Python 转换矩阵

我有一个如下所示的列表 2 1 3 1 2 3 1 2 2 2 我想要的是一个转换矩阵它向我显示如下序列 1 后跟 1 的频率是多少 1 后面跟着 2 的频率是多少 1 后跟 3 的频率是多少 2 后跟 1 的频率是多少 2 后跟 2 的
键入的完整命令行

我想获得输入时的完整命令行 This join sys argv 在这里不起作用删除双引号另外我不想重新加入已解析和拆分的内容有任何想法吗你太迟了当键入的命令到达 Python 时您的 shell 已经发挥了它的魔力例如引
使用 NumPy 编写一个函数来计算具有特定公差的积分

我想编写一个自定义函数来以特定容差对表达式 python 或 lambda 函数进行数字积分我知道与scipy integrate quad人们可以简单地改变epsabs但我想使用 numpy 自己编写该函数 From 这篇博文 htt
查找正在导入哪些 python 模块

从应用程序中使用的特定包中查找所有 python 模块的简单方法是什么 sys modules是将模块名称映射到模块的字典您可以检查其键以查看导入的模块 See http docs python org library sys html
使用pathlib获取主目录

翻看新的pathlib在 Python 3 4 中我注意到没有任何简单的方法来获取用户的主目录我能想到的获取用户主目录的唯一方法是使用旧的os path像这样的库 import pathlib from os import path p
ValueError：数据必须为正（boxcox scipy）

我正在尝试将我的数据集转换为正态分布 0 8 298511e 03 1 3 055319e 01 2 6 938647e 02 3 2 904091e 02 4 7 422441e 02 5 6 074046e 02 6 9 265747e
正在使用 PIL 保存损坏的图像

我遇到一个问题操作图像像素导致保存损坏的图像因此我使用 PIL 打开图像然后将其转换为 NumPy 数组 image Image open myimage png np image np asarray image 然后我转置图像
高级描述熊猫

有没有像 pandas 那样更高级的功能通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结就像这样 A count 1000 000
如何用正则表达式替换多个匹配/组？

通常我们会编写以下内容来替换一场比赛 namesRegex re compile r is life re I replaced namesRegex sub r butter There is no life in the void pr
无法使用 python rasterio、gdal 打开 jp2 （来自哨兵）

我试图在 python 中将 jp2 栅格产品作为栅格打开但当我们使用 raterio 和 gdal 包时没有成功我收到此错误 RasterioIOError b4 jp2 not recognized as a supported f
Seaborn 中没有线性拟合的散点图

我想知道是否有办法关闭seaborn中的线性拟合lmplot或者是否有一个等效函数可以生成散点图当然我也可以使用 matplotlib 但是我发现 seaborn 中的语法和美学非常吸引人例如我想绘制以下情节 import sea
如何在matplotlib中调整x轴

I have a graph like this x轴上的数据表示小时所以我希望x轴设置为0 24 48 72 而不是现在的值很难看到 0 100 之间的数据 fig1 plt figure ax fig1 add subplot 11
无法导入QUERY_TERMS

我正在运行一个网站Python and Django Django filters 2 1 installed Django 2 1 installed 当我运行时我收到以下错误 importError Could not import
如何通过 Python Requests 库使用基本 HTTP 身份验证？

我正在尝试在 Python 中使用基本的 HTTP 身份验证我正在使用Requests https docs python requests org 图书馆 auth requests post http hostname auth HT
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
jpegtran 优化而不更改文件名

我需要优化一些图像但不更改它们的名称 jpegtran copy none optimize image jpg gt image jpg 但是这似乎创建了 0 的文件大小当我对不同的文件名执行此操作时大小仍然完全相同怎么样 jp
UnicodeDecodeError：部署到 Heroku 时，“utf-8”编解码器无法解码位置 0 中的字节 0xff

我尝试在heroku上部署我的简单django项目但我不明白如何解决这个问题这是git push heroku master remote Traceback most recent call last remote File tmp
Python 读取未格式化的直接访问 Fortran 90 给出不正确的输出

这是数据的写入方式它是一个二维浮点矩阵我不确定大小 open unit 51 file rmsd nn output form unformatted access direct status replace recl Npoints
没有名为“turtle”的模块

我正在学习并尝试用Python3制作贪吃蛇游戏我正在进口海龟我正在使用 Linux mint 19 PyCharm python37 python3 tk Traceback most recent call last File hom
Biopython 可以执行 Seq.find() 来解释歧义代码吗

我希望能够在 Seq 对象中搜索考虑歧义代码的子序列 Seq 对象例如以下内容应该是正确的 from Bio Seq import Seq from Bio Alphabet IUPAC import IUPACAmbiguousDNA

随机推荐

TypeScript 和 Socket.io

我想在我的 Typescript 项目中使用 socket io 但我只找到了服务器端 Typescript 的 d ts 文件这是一个很好的例子 https github com soywiz typescript node defin
在 Liquibase 中， split 语句上可以有一个空行吗？

在 Liquibase 中 split 语句上可以有一个空行吗下面我想执行两条语句 changeset me 1 runAlways false runOnChange false failOnError true splitStatem
Winsock教程错误

刚接触C Express 在遵循winsock教程后出现了无数错误已将 Windows SDK 7 1 链接到属性我缺少什么 include
Python setuptools 正在从 Windows 上的路径参数中删除斜杠

我正在尝试安装一个软件包setuptools包括console scripts在 Windows 7 上我正在尝试更改我的值PYTHONUSERBASE安装到自定义目录中 user旗帜如果我在值中使用反斜杠PYTHONUSERBASE
如何在表中插入外键为自身的行？

I have table https picasaweb google com TheAteist ERD authkey Gv1sRgCMapkN6EzLa6Mg 5609625343557306466它自己有外键柱子parentid是
CSS / Javascript - fadeIn 效果在 Safari 上不起作用

我正在将一个前端站点加载到 Wordpress 上并加载了一些 javascript 文件其中之一用于主页上各部分的淡入效果它在 Firefox 和 Chrome 上运行良好但在 Safari 中不起作用我不知道为什么基本上 o
SQL - LEFT OUTER JOIN 和 WHERE 子句

我对 SQL 很糟糕我不知道我想做的事情是否可行但是由于我们的数据结构我需要以这种方式解决这个问题或进行大规模的架构更改我正在尝试计算一个国家的省又名州的数量然而只有少数省份需要在计数中忽略因此我正在尝试检索国家地
如何创建 Python 命名空间（argparse.parse_args 值）？

为了以交互方式测试我的 python 脚本我想创建一个Namespace对象类似于返回的内容argparse parse args 显而易见的方式 gt gt gt import argparse gt gt gt parser arg
SetConsoleScreenBufferInfoEx ...错误？

每次我运行此代码在 Win7 上时控制台都会在两个方向上缩小 1 个字符 int wmain INT argc WCHAR argv CONSOLE SCREEN BUFFER INFOEX csbi csbi cbSize size
记录源文件和行号

使用 Rust 的log and env loggercrates 如何让输出包含调用日志调用的源文件和行号在下面的例子中logger example是我的二进制文件的名称Cargo toml e g bin name logger ex
如何在 onNext 调用中从上下文/范围中获取变量？ (java/grpc)

我正在与contexts https grpc io grpc java javadoc io grpc Contexts html within grpc java https github com grpc grpc java 我最终试
GLFW 切换窗口全屏模式

我正在使用 GLFW 我想知道如何切换全屏窗口模式不改变分辨率而是将窗口设置在顶部并且没有装饰如果 GLFW 无法做到这一点那么您建议使用什么跨平台库来实现这一目标您可以告诉 glfw 全屏打开窗口 glfwOpenWindow
为什么 tlstest.paypal.com 可以在浏览器中运行，但不能在我的 PHP 代码中运行（对于 Paypal IPN 有用）？

2018年6月30日之后 Paypal不会接受非 TLS 1 2 HTTP 1 1 请求 https www paypal notice com en TLS 1 2 and HTTP1 1 Upgrade 不再了他们创建了 URLhtt
如何更改现有应用程序的配置文件？

我从来没有为 iPhone 开发过应用程序但我们的客户有一个应用程序是由他以前的供应商开发的现在该供应商已经结束了他在我们国家的业务所以现在我们有了该应用程序的源代码以供进一步开发我们需要立即采取的行动是该应用程序未在 iOS 1
Moq.Mock.Verify() 是否使用identity 或.Equals() 比较参数？

在类似的命令中 var mockObj new Mock
Twig 在包含之前检查部分存在

我正在开发一个相当复杂的多语言网站它将根据 html 语言环境呈现不同的部分我有一个部分结构它将使用附加到文件名的区域设置来选择正确的区域例如 include BundleName Layout Text partial name
Azure databricks 存储库：如何通过 API 拉取

我正在使用 Azure DevOps 存储库将 Azure databricks 连接到我在 DevOps 中的存储库我需要从 Azure DevOps 管道自动拉取为此我尝试使用 databricks API 来拉取但参考这个链接
let forms ：如何访问宏中的解构符号？

我正在尝试编写一个宏它通过解构扩展为 let 形式我的问题是我想要获得在 let 形式中定义的符号列表包括通过解构获得的符号 Use case 我正在尝试排除这种行为例如进行验证 let a foo bar x x y y u u
PHP PDO 与 foreach 和 fetch

以下代码
UnicodeDecodeError：“utf8”编解码器无法解码字节 0x9c

我有一个套接字服务器应该从客户端接收 UTF 8 有效字符问题是一些客户端主要是黑客通过它发送了所有错误类型的数据我可以轻松区分真正的客户端但我将发送的所有数据记录到文件中以便稍后进行分析有时我会遇到这样的角色导致Unic

UnicodeDecodeError：“utf8”编解码器无法解码字节 0x9c

UnicodeDecodeError：“utf8”编解码器无法解码字节 0x9c 的相关文章

随机推荐

热门标签