使用jsoup解析XML-防止jsoup“清除” 标签

Z时代
2024-01-10
分类：问答

在大多数情况下，使用jsoup解析XML都没有问题。但是，如果有<link>XML文档中的标签，jsoup将改变<link>some text

here</link>到<link />some text here。这样就无法<link>使用CSS选择器提取标签内的文本。

那么如何防止jsoup“清除” <link>标签呢？

回答：

在jsoup

1.6.2中，我添加了XML解析器模式，该模式可以按原样解析输入，而无需应用HTML5解析规则（元素内容，文档结构等）。此模式将文本保留在<link>标签中，并允许其倍数等。

这是一个例子：

String xml = "<link>One</link><link>Two</link>";
Document xmlDoc = Jsoup.parse(xml, "", Parser.xmlParser());
Elements links = xmlDoc.select("link");
System.out.println("Link text 1: " + links.get(0).text());
System.out.println("Link text 2: " + links.get(1).text());

返回值：

Link text 1: One Link text 2: Two

以上是使用jsoup解析XML-防止jsoup“清除” 标签的全部内容，来源链接： utcz.com/qa/418219.html

使用jsoup解析XML-防止jsoup“清除” 标签

回答：

其他人也看了：