Java 统一编码

2024-05-08

A Java char is 2 bytes http://java.sun.com/docs/books/tutorial/java/nutsandbolts/datatypes.html(最大大小为 65,536)但有95,221 http://www.i18nguy.com/unicode/char-count.html统一码字符。这是否意味着您无法在 Java 应用程序中处理某些 Unicode 字符?

这是否归结为您使用的字符编码?


如果你足够小心的话,你可以处理所有这些。

Java's char is a UTF-16 编码单元 http://java.sun.com/javase/technologies/core/basic/intl/faq.jsp#text-representation。对于代码点 > 0xFFFF 的字符,将使用 2 进行编码chars(代理对)。

See http://www.oracle.com/us/technologies/java/supplementary-142654.html http://www.oracle.com/us/technologies/java/supplementary-142654.html了解如何在 Java 中处理这些字符。

(顺便说一句,在 Unicode 5.2 中,1,114,112 个槽位中分配了 107,154 个字符。)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Java 统一编码 的相关文章

随机推荐