我有一个 ANSI 编码的文本文件,该文件不应该被编码为 ANSI,因为有重音符号
ANSI 不支持的字符。我宁愿使用 UTF-8。
数据能否正确解码或者在转码过程中丢失?
我可以使用什么工具?
这是我所拥有的示例:
ç é
我可以从上下文(咖啡馆应该是咖啡馆)看出,这应该是这两个字符:
ç é
使用 Notepad++ 按照以下步骤操作
1-复制原文
2- 在 Notepad++ 中,打开新文件,更改编码 -> 选择您认为原始文本遵循的编码。也尝试编码“ANSI”,因为有时 Unicode 文件会被某些程序读取为 ANSI
3- Paste
4-然后通过再次进入同一菜单来转换为 Unicode:编码 ->“以 UTF-8 编码”(不是“转换为 UTF-8”),希望它将变得可读
上述步骤适用于大多数语言。您只需在粘贴到记事本++之前猜测原始编码,然后通过同一菜单转换为替代的基于 Unicode 的编码,看看内容是否变得可读。
大多数语言都以 2 种编码形式存在: 1- 大多数计算机最初使用旧的 ANSI (ASCII) 形式,只有 8 位。 8 位仅允许 256 种可能性,其中 128 种是常规拉丁字符和控制字符,最后 128 位的读取方式不同,具体取决于 PC 语言设置 2- 新的 Unicode 标准(最多 32 位)为每个字符提供唯一的代码以所有当前已知的语言以及未来更多的语言。如果文件是 unicode,则任何安装了该语言字体的 PC 都应该可以理解该文件。请注意,即使 UTF-8 也高达 32 位,并且与 UTF-16 和 UTF-32 一样广泛,只是它尝试保留带有拉丁字符的 8 位,只是为了节省磁盘空间
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)