同一个字符可以有 2 种不同的 UTF-8 编码吗？

2024-04-27

我正在编写一个应用程序，需要将其输入从 UTF-8 转码为 ISO-8859-1 (Latin 1)。

一切正常，除了有时我会得到一些变音字符的奇怪编码。例如，带有 2 个点的拉丁语 1 E (0xEB) 通常为 UTF-8 0xC3 0xAB，但有时也为 0xC3 0x83 0xC2 0xAB。

这种情况从不同的来源发生过多次，并注意到第一个和最后一个字符与我的预期相符，是否存在我的库不知道的编码规则？

某些 Unicode 字符可以表示为composed and 分解的形式。例如，德语变音符号-uü可以用单个字符表示ü or by u其次是¨，然后文本渲染器会将其组合。

请参阅维基百科文章Unicode 等效项 http://en.wikipedia.org/wiki/Unicode_equivalence血淋淋的细节。

因此，Unicode 库通常提供方法或函数将字符串规范化为一种或另一种形式，以便您可以比较它们。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

perl

UTF8

characterencoding

同一个字符可以有 2 种不同的 UTF-8 编码吗？的相关文章

指定 iframe 中加载的页面的字符集

我想知道是否可以为加载的 iframe 提供自定义字符集例如如果我有一个名为www example com带有源代码 Test 现在我有一个名为 www example2 com 我想做的是加载www example com in a
在python 2.7中打印阿拉伯/波斯字母[重复]

这个问题在这里已经有答案了在下面的代码中 Python 似乎不支持阿拉伯字母有任何想法吗 usr bin python coding utf 8 import nltk sentence tokens nltk word tokeniz
阿拉伯语的 tcpdf 将字符显示为问号 '?????? ???'

我想创建一个阿拉伯语 pdf 与我的 ms Execl 格式的文件相同在 php 中使用 tcpdf 创建 pdf 时阿拉伯字符显示为分数这些字符是从我的 Excel 文件中复制的 htmlcontent2 span color 0
Perl 使用什么哈希函数/算法？

有人能解释一下 Perl 用于将字符串映射到索引的哈希函数算法吗有相关读物吗这个答案早于 5 28 中进行的哈希函数更改请参阅默认哈希函数更改 perldelta 为 5 28 http perldoc perl org perl
DBI：在 eval 中引发错误

这个问题参考了池上的评论 But if you re going to put an eval around every statement just use RaiseError gt 0 in this thread https sta
当与不需要虚拟机的编译程序一起使用时，CGI 是否仍然很慢？

当我学习 CGI 时我了解到任何编程语言都可以用来将其输出挂钩到 http 响应消息而它的输入是 http 请求消息我读过的很多文章都在 Perl 的背景下讨论 CGI 这是因为 Perl 是与 CGI 结合使用的最常见的语言吗我想
如何在经典 ASP 中将 Windows-1255 转换为 UTF-8？

如何将 windows 1255 字符串转换为 utf 8classic应用服务提供商我的数据库是 windows 1255 我想将我的网站转移到 utf 8 代码是否在这个答案 https stackoverflow com quest
Perl：通过一次 MySQL 调用更新多行

似乎这不可能但嘿我不妨问一下我可能是错的想知道 perl 是否可以使用一个 MySQL 调用来更新多行我正在使用 DBI 任何帮助或反馈将不胜感激这可以通过 ASP 和 ASP net 在 MSSQL 中实现所以想知道是否也可以
UTF-8 和 Unicode，0xC0 和 0x80 是什么意思？

在过去的几天里我一直在阅读有关 Unicode 和 UTF 8 的内容并且经常遇到与此类似的按位比较 int strlen utf8 char s int i 0 j 0 while s i if s i 0xc0 0x80 j i r
PHP mysql 土耳其语字符编码及比较

我正在尝试通过 AJAX POST 从 MySql 数据库中过滤土耳其语姓名英文字母单词列出一切正常但是如果我发送这是带点的字母 O 结果不仅是还包括 O 和另外我注意到 AJAX 帖子被发送作为 C3 96 有人可以帮忙吗请
STDOUT->autoflush(1) 在 Perl 中做什么？

我找到了有关 Perl 中自动刷新的各种信息但找不到任何提及格式完全相同的行 STDOUT gt autoflush 1 这包含在我正在分析的程序中我想更好地了解它的作用程序开头还有这样一段话 use IO Handle 我认为这可能
是否可以让 SQL Server 将排序规则转换为 UTF-8 / UTF-16

在我正在处理的一个项目中我的数据存储在 SQL Server 中并具有排序规则Danish Norwegian CI AS 数据通过 FreeTDS 和 ODBC 输出到将数据作为 UTF 8 处理的 python 一些字符如和编
Windows 上的本机窄字符串编码是什么？

Subversion API 有一个功能数量 http subversion apache org docs api latest svn utf 8h html用于从本机编码字符串转换为以 UTF 8 编码的字符串我的问题是 Win
从 Perl 脚本 DBI 关闭 MSSQL 服务器

我正在写一个 perl 脚本其中我必须关闭我的 mssql 服务器做一些操作然后我必须重新启动它我知道一种方法是使用 netstat 来停止服务但我不能使用它所以我尝试安装 DBI 和 DBD ODBC 模块我可以通过以下代码
使用 DOMDocument 进行 PHP 编码
如何在 Perl 中取消导入函数？

我正在尝试删除导入的符号以便它们不能用作对象中的方法但是no似乎不起作用也许我不明白不或者还有其他方法 use 5 014 use warnings use Test More still has carp after no car
jsoup 的奇怪编码行为

我用jsoup从不同页面的html源代码中提取一些信息大多数都是UTF 8编码的其中一个是用 ISO 8859 1 编码的这会导致一个奇怪的错误在我看来包含错误的页面是 http www gudi ch armbanduhr me
Perl - HTTP::代理捕获 XHR/JSON 通信

网站http openbook etoro com main http openbook etoro com main 有一个实时提要由 javascript 通过 XHR keep alive 请求生成并以 gzip 压缩 JSON
如何修复 Python 中损坏的 utf-8 编码？

我的字符串是Ni m B T t Thi n s Nh t H nh 我想将其解码为Ni m B T t Thi n s Nh t H nh 我在那个网站上看到可以做到这一点http www enderminh com minh utf8
为什么 Java BufferedReader() 不能正确读取阿拉伯文和中文字符？

我正在尝试读取一个每行包含英文和阿拉伯字符的文件以及另一个每行包含英文和中文字符的文件然而阿拉伯文和中文的字符无法正确显示它们只是显示为问号知道我该如何解决这个问题吗这是我用于阅读的代码 try String sCurrentLi

随机推荐

SQL部署自动化

我正在尝试使用 Jenkins 自动化现有的 sql server 数据库部署自动化自动化的方法之一是使用 Visual Studio 将 SQL 脚本存储过程视图表创建包含在 SQL Server 数据库项目中使用 MSBui
使用 Github for Windows 通过 SSH 处理自己的私有 Git

现在我正在使用 msysgit 来使用 SSH 来处理存储在 ec2 Amazon 云服务器上的我自己的私有存储库到目前为止我已经能够通过 Git Bash 成功连接到这些存储库使用 ssh keygen 创建 ssh rsa 公钥
当对象创建或修改 JavaScript 中的键/值时，有没有办法触发回调？ [复制]

这个问题在这里已经有答案了我试图弄清楚如何在 JavaScript 中创建一个对象该对象将在创建和更改任意键值时触发事件这是一些伪代码 var User function var user function keyAdded tri
DT::datatable 的背景颜色闪亮

如何在闪亮的应用程序中更改数据表中选定行的背景颜色我的 ui R 有以下代码 library shinydashboard header lt dashboardHeader title title sidebar lt dashboar
如何使用 Twitter Bootstrap API 检测您正在使用哪个设备视图？

我刚刚开始为我即将开展的项目使用 Twitter Bootstrap API 主导航包含 3 个主要元素 site nav 社交链接导航搜索网站表格在移动设备上查看网站时我使用折叠插件折叠网站导航和搜索表单移动视图有 2 个按钮单
静态、非成员或静态非成员函数？

每当我有一些实用方向的功能时我最终都会想知道哪个选项是最好的例如在我正在工作的上下文中打印消息结构自己的或外部的一些编码解码代码或一些有用的转换函数我想到的选项是 1 辅助类结构中的静态函数 struct helper
在 Google Play 中更新 APK 而不更改扩展文件

我的 Google Play 控制台中有一个草稿 APK 它已连接到 APK 扩展文件版本号为9 扩展文件为 main 9 com something something obb 现在我正在尝试在发布之前更新 APK 我增加了版本代码
Kubernetes 仪表板 - ServiceUnavailable（503 错误）

我是 Kubernetes 新手我正在尝试使用 kops 在 AWS 上设置 Kubernetes 集群我成功地设置了集群但是我无法访问仪表板 UI https kubernetes io docs tasks access app
如何低延迟地使用 Android 音频

Problem 您可能听说过 Android 不提供低延迟音频 API 我所说的低延迟音频是指您应该能够从麦克风获取音频信号并播放声音中间没有太多时间间隔例如 5 7 毫秒我尝试过旧的java 带有AudioRecord和AudioT
颤动|如何知道小部件是否位于导航堆栈顶部（可见）

在我的 Flutter 应用程序中如果将新页面推送到导航堆栈我希望暂停动画问题从小部件的角度来看有什么方法可以知道小部件是否位于导航堆栈的顶部 Example while isTopOfNavigationStack Do the
将容器推送到 Azure 容器注册表时资源访问被拒绝

使用 Docker Compose 将容器推送到私有 Azure 容器注册表时 Azure DevOps 管道返回以下错误正在推送容器注册表应用程序最新推送引用存储库 docker io registry container 被
lxml：编写增量漂亮的打印 xml

我正在处理非常大的 XML 文件 gt 1GB 并且需要一种方法来增量写入它们有一个顶级元素和数千个大型第二级元素每个元素都有自己的多级层次结构我试过这个 from lxml import etree with etree xmlfi
如果用户沿负方向平移 x 和 y，UIPanGestureRecognizer 不会切换到状态“结束”或“取消”

我的 UIPanGestureRecognizer 有一点问题识别器不报告 UIGestureRecognizerStateEnded 状态如果用户平移到左上角意味着负 x 和 y 方向如果有任何方向状态将更改为 UIGesture
将 ActiveRecord 对象的所有属性（除了 id、created_at、updated_at）设置为 nil 的最简单方法是什么？

将 ActiveRecord 对象的所有属性除了 id created at updated at 设置为 nil 的最简单方法是什么有一个数组叫attribute names在模型上它确实包含所有属性因此使用reject来过滤属性
Snap.svg 如何获取我们拖动的元素

我正在使用 Snap svg 库并进行一些拖放操作我的问题是如何获取我拖动的元素的 id 我正在尝试实现拖放并且只有选定的区域才是有效的放置目标我不知道如何检查拖拽下方的元素是什么这是来自文档 Element drag onmove
在 Grails 中，域类中有像 onLoad() 这样的东西吗？

Guys 我有以下域类 class Product String name String productRecord static transients productRecord ProductRecord 是根据 Product 实例的
如何将字符串列更改为 bigint？

在轨道迁移中如何将字符串类型列更改为 bigint I have t change ip number from integer limit gt 8 I get PG Error ERROR column ip number from
获取 QComboBox 的所有项目 - PyQt4 (Python)

我有很多QComboBoxes 在某个时刻我需要获取特定的每个项目QComboBox迭代虽然我只能有一个与中的项目相对应的项目列表QComboBox 我宁愿直接从小部件本身获取它们有大量的QComboBoxes每个都有很多项目有没有
防止 git 在签署提交期间询问 GnuPG 密码

Git 总是要求我在使用签名提交时输入密码来解锁我的密钥 git commit S m message 如何将密码存储在缓存中以便我不必在签署提交时每次都输入密码 Git 永远不会掌握 GnuPG 密码您必须依赖 GnuPG 的缓存密码
同一个字符可以有 2 种不同的 UTF-8 编码吗？

我正在编写一个应用程序需要将其输入从 UTF 8 转码为 ISO 8859 1 Latin 1 一切正常除了有时我会得到一些变音字符的奇怪编码例如带有 2 个点的拉丁语 1 E 0xEB 通常为 UTF 8 0xC3 0xAB 但有

同一个字符可以有 2 种不同的 UTF-8 编码吗？

同一个字符可以有 2 种不同的 UTF-8 编码吗？ 的相关文章

随机推荐

热门标签

同一个字符可以有 2 种不同的 UTF-8 编码吗？的相关文章