Java Unicode编码

Java

char是2个字节(最大大小为65,536),但是有95,221个 Unicode字符。这是否意味着您不能在Java应用程序中处理某些Unicode字符?

这是否归结为您使用的是什么字符编码?

回答:

如果足够小心,则可以处理所有这些问题。

Java

char是UTF-16代码单元。对于代码点> 0xFFFF的字符,将使用2 chars(替代对)进行编码。

有关如何在Java中处理这些字符,请参见http://www.oracle.com/us/technologies/java/supplementary-142654.html。

(顺便说一句,在Unicode 5.2中,在1,114,112个插槽中分配了107,154个字符。)

以上是 Java Unicode编码 的全部内容, 来源链接: utcz.com/qa/416930.html

回到顶部