Java Unicode编码
Java
char
是2个字节(最大大小为65,536),但是有95,221个 Unicode字符。这是否意味着您不能在Java应用程序中处理某些Unicode字符?
这是否归结为您使用的是什么字符编码?
回答:
如果足够小心,则可以处理所有这些问题。
Java
char
是UTF-16代码单元。对于代码点> 0xFFFF的字符,将使用2 char
s(替代对)进行编码。
有关如何在Java中处理这些字符,请参见http://www.oracle.com/us/technologies/java/supplementary-142654.html。
(顺便说一句,在Unicode 5.2中,在1,114,112个插槽中分配了107,154个字符。)
以上是 Java Unicode编码 的全部内容, 来源链接: utcz.com/qa/416930.html