Python 中奇怪的前导字符 utf-8/utf-16 编码

2023-12-10

我写了一个简化版本来演示这个问题。我正在以 utf-8 和 UTF-16 格式对特殊字符进行编码。

使用 utf-8 编码没有问题，当我使用 UTF-16 编码时，我得到一些奇怪的前导字符。

我尝试删除所有尾随和前导字符，但错误仍然存在。

代码示例：

#!/usr/bin/env python2
# -*- coding: utf-8 -*-

import chardet


def myEncode(s, pattern):
try:
    s.strip()
    u = unicode(s, pattern)
    print chardet.detect(u.encode(pattern, 'strict'))
    return u.encode(pattern, 'strict')
except UnicodeDecodeError as err:
    return "UnicodeDecodeError: ", err
except Exception as err:
    return "ExceptionError: ", err

print myEncode(r"""Test !"#$%&'()*+-,./:;<=>?@[\]?_{@}~& € ÄÖÜ äöüß £¥§""",
               'utf-8')
print myEncode(r"""Test !"#$%&'()*+-,./:;<=>?@[\]?_{@}~& € ÄÖÜ äöüß £¥§""",
               'utf-16')

输出示例：

{'confidence': 0.99, 'language': '', 'encoding': 'utf-8'}
Test !"#$%&'()*+-,./:;<=>?@[\]?_{@}~& € ÄÖÜ äöüß £¥§
{'confidence': 1.0, 'language': '', 'encoding': 'UTF-16'}
��Test !"#$%&'()*+-,./:;<=>?@[\]?_{@}~& € ÄÖÜ äöüß £¥§

我哪里出错了我不明白。我不想将 UTF-16 转换回 utf-8，保留 UTF-16 格式对我来说很重要。

Update:感谢@tripleee，我的问题的解决方案是定义编码 UTF-16le 或 UTF-16be。再次感谢您的时间和努力。

预先感谢大家的时间和精力。

@tripleee 给出了该问题的答案。

通过定义 utf-16le 或 utf-16be 而不是 utf-16 解决了该问题。

解决方案示例：

#!/usr/bin/env python2
# -*- coding: utf-8 -*-

import chardet


def myEncode(s, pattern):
    try:
        s.strip()
        u = unicode(s, pattern)
        print chardet.detect(u.encode(pattern, 'strict'))
        return u.encode(pattern, 'strict')
    except UnicodeDecodeError as err:
        return "UnicodeDecodeError: ", err
    except Exception as err:
        return "ExceptionError: ", err

print myEncode(r"""Test !"#$%&'()*+-,./:;<=>?@[\]?_{@}~& € ÄÖÜ äöüß £¥§""",
               'utf-8')
print myEncode(r"""Test !"#$%&'()*+-,./:;<=>?@[\]?_{@}~& € ÄÖÜ äöüß £¥§""",
               'utf-16be')

输出示例：

{'confidence': 0.99, 'language': '', 'encoding': 'utf-8'}
Test !"#$%&'()*+-,./:;<=>?@[\]?_{@}~& € ÄÖÜ äöüß £¥§
{'confidence': 0.99, 'language': '', 'encoding': 'utf-8'}
Test !"#$%&'()*+-,./:;<=>?@[\]?_{@}~& € ÄÖÜ äöüß £¥§

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Unicode

encoding

characterencoding

Python 中奇怪的前导字符 utf-8/utf-16 编码的相关文章

如何覆盖 Django 的默认管理模板和布局

我正在尝试覆盖 Django 的默认模板现在只有base site html 我正在尝试更改 django 管理文本我做了以下事情我在我的应用程序目录中创建了一个文件夹 opt mydjangoapp templates admin
检测到通过 ChromeDriver 启动的 Chrome 浏览器

我正在尝试在 python 中使用 selenium chromedriver 来访问 www mouser co uk 网站然而从第一次拍摄开始它就被检测为机器人有人对此有解释吗此后我使用的代码 options Options
如何在 Jupyter Notebook 中运行 Python 异步代码？

我有一些 asyncio 代码在 Python 解释器 CPython 3 6 2 中运行良好我现在想在具有 IPython 内核的 Jupyter 笔记本中运行它我可以运行它 import asyncio asyncio get ev
使用 Python 创建 MIDI

本质上我正在尝试从头开始创建 MIDI 并将它们放到网上我对不同的语言持开放态度但更喜欢使用Python 两种语言之一如果这有什么区别的话并且想知道我应该使用哪个库提前致谢看起来这就是您正在寻找的适用于 Python 的简单
如何使用 colorchecker 在 opencv 中进行颜色校准？

我有数码相机获取的色彩检查器图像我如何使用它来使用 opencv 校准图像按照以下颜色检查器图像操作您是想问如何进行颜色校准或如何使用 OpenCV 进行校准为了进行颜色校准您可以使用校准板的最后一行灰色调以下是您应该逐步进行
从 Python 下载/安装 Windows 更新

我正在编写一个脚本来自动安装 Windows 更新我可以将其部署在多台计算机上这样我就不必担心手动更新它们我想用 Python 编写这个但找不到任何关于如何完成此操作的信息我需要知道如何搜索更新下载更新并从 python 脚本安
在Python中如何获取字典的部分视图？

是否有可能获得部分视图dict在Python中类似于pandasdf tail df head 说你有很长一段时间dict 而您只想检查某些元素开头结尾等 dict 就像是 dict head 3 To see the first 3
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
字符串中的注释和注释中的字符串

我正在尝试使用 Python 和 Regex 计算 C 代码中包含的注释中的字符数但没有成功我可以先删除字符串以删除字符串中的注释但这也会删除注释中的字符串结果会很糟糕是否有机会通过使用正则表达式来询问不匹配注释中的字符串反之亦
Pandas：如何将数据框插入 Clickhouse

我正在尝试将 Pandas 数据框插入 Clickhouse 这是我的代码 import pandas import sqlalchemy as sa uri clickhouse default localhost default ch
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
如何在Python中按AaB而不是ABa顺序对字符串进行排序

我正在尝试对字符串进行排序为 punnetsquare 制作基因型我目前的实现是 unsorted genotype ABaB sorted genotype sorted list unsorted genotype sorted s
Python Pandas：如何对组中的所有项目进行分组并为其分配 id？

我有 df domain orgid csyunshu com 108299 dshu com 108299 bbbdshu com 108299 cwakwakmrg com 121303 ckonkatsunet com 121303
从 python 检测 macOS 中的暗模式

我正在编写一个 PyQt 应用程序我必须添加一个补丁以便在启用暗模式的 Macos 上可以读取字体 app QApplication Fix for the font colours on macos when running dark
Flask 应用程序的测试覆盖率不起作用

您好想在终端的 Flask 应用程序中测试删除路由我可以看到测试已经过去它说 test user delete test app LayoutTestCase ok 但是当我打开封面时它仍然是红色的这意味着没有覆盖它请有人向我
PIL - 需要抖动，但限制调色板会导致问题

我是 Python 新手正在尝试使用 PIL 来执行 Arduino 项目所需的解析任务这个问题涉及到Image convert 方法以及调色板抖动等选项我有一些硬件能够一次仅显示 16 种颜色的图像但它们可以指定为 RGB 三元
字符串列表，获取n个元素的公共子串，Python

我的问题可能类似于this https stackoverflow com questions 37514193 count the number of occurrences of n length not given string in
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
如何使用Python保存“完整的网页”而不仅仅是基本的html

我正在使用以下代码来使用 Python 保存网页 import urllib import sys from bs4 import BeautifulSoup url http www vodafone de privat tarife r

随机推荐

这个错误是编码错误吗？我该如何解决？

我正在做网络抓取下面是我使用的代码我在评论上写了一些评论 library httr library rvest library stringr Bulletin board url List of questions url lt ht
有没有办法从子元素中转义 Clip-path: ？ I.E 相对于剪切背景定位的图像也会被剪切

我试图将 SVG 图像放置在与另一个背景有视差的剪裁背景上我希望 SVG 一半在背景上一半在前景上但它会使用剪辑路径与背景一起被剪辑我是否可以使用另一种方法来实现无需裁剪 SVG 的效果或者是否有方法可以禁用继承的效果请记住我
model.frame.default 中的错误：变量长度不同

在使用 mgcv 包运行 gam 模型时我遇到了一条我无法理解的奇怪错误消息 model frame default formula Death pm10 Lag resid1 1 中的错误变量长度不同发现 Lag resid1 1
PictureBox 可以在 Windows 应用程序中显示动画 GIF 吗？

我想在 Net Winform 中显示动画 gif 这个怎么做我以前用过VB 6 0 Put a PictureBox在表单上然后指定带有 Gif 扩展名的图片文件或者以编程方式制作 gif 图像动画将帧加载到PictureBox
Angular UI Router 嵌套状态在子状态中解析

在我正在开发的一个角度应用程序中我希望有一个抽象的父状态它必须解决其所有子状态的某些依赖关系具体来说我希望所有需要经过身份验证的用户的状态都从某个 authroot 状态继承该依赖关系我遇到了父依赖项并不总是被重新解决的问题理想
WKWebView 在设备上显示空白，在模拟器上工作

我的应用程序的模块之一是网站该网站主要包含 SVG 绘图并带有自定义形状的按钮使用 Raphael js 库来访问其他绘图包含 svg 绘图的其他 html 页面如果设备运行在 iOS 7 上我使用 UIWebView 并且一
在httptrigger中获取Keyvault Secret并使用它来获取Function-Python输出的信息

我有以下代码用于获取秘密使用秘密登录门户并下载 csv 表这在函数之外工作正常 import pandas as pd import pandas as pd from arcgis gis import GIS from azure
将 Curl 转换为 Java 等效项

我正在与New Relic REST API我第一次有一个curl命令 curl X GET https api newrelic com v2 applications appid metrics data json H X Api Ke
什么定义了显式网格？

MDN 定义了一个显式网格下列的而显式网格由使用 grid template columns 或 grid template rows 定义的任何行和列组成所以显式网格可以有single grid template columns gr
如何在 Visual Studio 设计器中取消固定和移动表单？

在 Visual Studio 中表单粘在 IDE 工作区域的左上角就像固定在那里一样你如何取消它们它们不是固定的它们实际上是由设计师绘制在那个位置的这只是模拟图该表单实际上在设计器中的功能与在运行时的功能不同您不能以任
对于已经在进行中的 NSUrlConnection 应该如何处理 beginbackgroundtaskwithexpirationhandler: ？

如果应用程序在前台时使用 NSURLConnection 开始下载但随后应用程序在数据下载完成之前移动到后台那么应用程序应该如何使用 beginbackgroundtaskwithexpirationhandler 对于这个已经存在的连
Python 中的“命名元组”是什么？

什么是命名元组以及如何使用它们我什么时候应该使用命名元组而不是普通元组反之亦然也有名单吗即可变的命名元组 For the last question specifically see also Existence of muta
XCode：为什么我的活动没有添加到日历中？

我已将以下代码添加到我的应用程序中 NSDate selected DatePicker date NSString date selected description NSDateComponents components NSCalen
Flash 使视图变为全屏

我需要一个链接来调用 Flash 影片使用 JavaScript 该影片将视图全屏显示并显示页面内容就像用户按下了 F11 一样有这样的flash电影吗 Edit这与 YouTube 和其他视频网站上的 Flash 播放器的不同之处在
安装和导入后，colaboratory 将不会承认 arviz

在Google的合作实验室中安装了arviz然后导入arviz没有错误但在代码单元中 pm plot posterior samples 得到错误 arviz未安装尝试绘制贝叶斯代码 pm plot posterior samples
“模块是用不兼容的 Kotlin 版本编译的。其元数据的二进制版本是 1.5.1，预期版本是 1.1.16”

当我尝试构建应用程序时出现以下错误 C Users Lenovo gradle caches transforms 2 files 2 1 32f0bb3e96b47cf79ece6482359b6ad2 jetified kotlin s
python networkx - 通过着色来标记边缘以进行图形绘制

我正在使用 networkx 来研究图论实现我想知道是否有一种方法可以标记给定图中的某些边例如假设我有一个图 G 并且我找到了从节点 x 到节点 y 的最短路径我如何标记该路径以便在绘制图时它将以不同的颜色绘制标记边缘可以通过设
关闭 BufferedReader 和 System.in

Reader rdr new InputStreamReader System in BufferedReader br new BufferedReader rdr String s s br readLine br close Scan
选择可变参数模板最后一个参数的有效方法

我知道如何选择可变参数模板的第一个参数 template lt class Args gt struct select first template lt class A class Args gt struct select first
Python 中奇怪的前导字符 utf-8/utf-16 编码

我写了一个简化版本来演示这个问题我正在以 utf 8 和 UTF 16 格式对特殊字符进行编码使用 utf 8 编码没有问题当我使用 UTF 16 编码时我得到一些奇怪的前导字符我尝试删除所有尾随和前导字符但错误仍然存在代码

Python 中奇怪的前导字符 utf-8/utf-16 编码

Python 中奇怪的前导字符 utf-8/utf-16 编码 的相关文章

随机推荐

热门标签

Python 中奇怪的前导字符 utf-8/utf-16 编码的相关文章