使用jsoup解析XML-防止jsoup“清除” 标签

在大多数情况下,使用jsoup解析XML都没有问题。但是,如果有<link>XML文档中的标签,jsoup将改变<link>some text

here</link><link />some text here。这样就无法<link>使用CSS选择器提取标签内的文本。

那么如何防止jsoup“清除” <link>标签呢?

回答:

在jsoup

1.6.2中,我添加了XML解析器模式,该模式可以按原样解析输入,而无需应用HTML5解析规则(元素内容,文档结构等)。此模式将文本保留在<link>标签中,并允许其倍数等。

这是一个例子:

String xml = "<link>One</link><link>Two</link>";

Document xmlDoc = Jsoup.parse(xml, "", Parser.xmlParser());

Elements links = xmlDoc.select("link");

System.out.println("Link text 1: " + links.get(0).text());

System.out.println("Link text 2: " + links.get(1).text());

返回值:

Link text 1: One

Link text 2: Two

以上是 使用jsoup解析XML-防止jsoup“清除” 标签 的全部内容, 来源链接: utcz.com/qa/418219.html

回到顶部