我正在尝试用 Java 解码一些 UTF-8 字符串。
这些字符串包含一些组合 unicode 字符,例如 CC 88(组合分音符)。
根据,字符顺序似乎没问题http://www.fileformat.info/info/unicode/char/0308/index.htm http://www.fileformat.info/info/unicode/char/0308/index.htm
但转换为String后的输出无效。
任何想法 ?
byte[] utf8 = { 105, -52, -120 };
System.out.print("{{");
for(int i = 0; i < utf8.length; ++i)
{
int value = utf8[i] & 0xFF;
System.out.print(Integer.toHexString(value));
}
System.out.println("}}");
System.out.println(">" + new String(utf8, "UTF-8"));
Output:
{{69cc88}}
>i?
您输出到的控制台(例如 Windows)可能不支持 unicode,并且可能会破坏字符。控制台输出不能很好地表示数据。
尝试将输出写入文件,确保 FileWriter 上的编码正确,然后在 unicode 友好的编辑器中打开文件。
或者,使用调试器来确保字符符合您的预期。只是不要相信控制台。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)