在Java中过滤非法XML字符

XML规范定义了XML文档中允许的Unicode字符的子集:http :

//www.w3.org/TR/REC-xml/#charsets。

如何从Java中的字符串中过滤掉这些字符?

简单的测试用例:

  Assert.equals("", filterIllegalXML(""+Character.valueOf((char) 2)))

回答:

找出XML的所有无效字符并非易事。您需要从Xerces调用或重新实现XMLChar.isInvalid(),

http://kickjava.com/src/org/apache/xerces/util/XMLChar.java.htm

以上是 在Java中过滤非法XML字符 的全部内容, 来源链接: utcz.com/qa/398445.html

回到顶部