使用jsoup解析XML-防止jsoup“清除” 标签
在大多数情况下,使用jsoup解析XML都没有问题。但是,如果有<link>
XML文档中的标签,jsoup将改变<link>some text
here</link>到<link />some text here
。这样就无法<link>
使用CSS选择器提取标签内的文本。
那么如何防止jsoup“清除” <link>
标签呢?
回答:
在jsoup
1.6.2中,我添加了XML解析器模式,该模式可以按原样解析输入,而无需应用HTML5解析规则(元素内容,文档结构等)。此模式将文本保留在<link>
标签中,并允许其倍数等。
这是一个例子:
String xml = "<link>One</link><link>Two</link>";Document xmlDoc = Jsoup.parse(xml, "", Parser.xmlParser());
Elements links = xmlDoc.select("link");
System.out.println("Link text 1: " + links.get(0).text());
System.out.println("Link text 2: " + links.get(1).text());
返回值:
Link text 1: OneLink text 2: Two
以上是 使用jsoup解析XML-防止jsoup“清除” 标签 的全部内容, 来源链接: utcz.com/qa/418219.html