检查字符串是否是用Java编码的有效UTF-8

如何检查字符串是否为有效的UTF-8格式?

回答:

只能检查字节数据。如果您构造了一个String,则其内部已经存在于UTF-16中。

同样, 字节数组可以使用UTF-8编码。

这是UTF-8转换的常见情况。

String myString = "\u0048\u0065\u006C\u006C\u006F World";

System.out.println(myString);

byte[] myBytes = null;

try

{

myBytes = myString.getBytes("UTF-8");

}

catch (UnsupportedEncodingException e)

{

e.printStackTrace();

System.exit(-1);

}

for (int i=0; i < myBytes.length; i++) {

System.out.println(myBytes[i]);

}

如果您不知道字节数组的编码,那么juniversalchardet是一个可以帮助您检测它的库。

以上是 检查字符串是否是用Java编码的有效UTF-8 的全部内容, 来源链接: utcz.com/qa/419102.html

回到顶部