我从我无法控制的第三方程序中获取了一个字符串。我的代码以 HTML 格式输出。这在英语中效果很好,但在其他语言中它会以一种有趣的方式显示。例如,西班牙语的口音看起来很有趣,而东方语言(即韩语)的字符看起来很有趣。我很确定我需要做一些编码工作以便所有语言都能正确显示。
我对编码的理解有点差,所以在发布真正的问题之前,我直观地认为它是:“如何在 C# 中将其编码为 UTF-8”,我想通过发布更简单的内容来获得对此事的更多理解问题。
我的问题是:我如何知道我的输入字符串采用哪种编码类型?在西班牙语中,当我听到口音时,它看起来像这样:“Acción”,而不是“Acción”。这是 ANSI 还是我正在处理的问题?
预先非常感谢!
我听到一个口音:“Acción”
à 字符的存在是一个致命的泄露。重音大写 A 字符的字符代码为 0xC0 及以上。这通常是两字节 utf-8 编码字符中的第一个字节。 ó 字形是代码点 U+00F3,它的 utf-8 编码是 0xC3 + 0xB3。 à 和 ³ 的代码点是哪些
字符串以 utf-8 编码,但您正在使用 Encoding.Default 等 8 位编码读取它
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)