使用Java将HTML文件读取到DOM树

是否有解析器/库可以使用Java将HTML文档读取到DOM树中?我想使用DOM/XpathJava提供的标准API。

大多数库似乎都具有自定义API来解决此任务。此外,大多数可用的解析器似乎都不支持将HTML转换为XML-DOM。

有一个好的HTML DOM解析器有什么想法或经验吗?

回答:

JTidy,方法是将流处理为XHTML,然后使用您喜欢的DOM实现重新解析,或者如果可以提供足够的DOM限制就使用parseDOM。

或者Neko。

以上是 使用Java将HTML文件读取到DOM树 的全部内容, 来源链接: utcz.com/qa/427304.html

回到顶部