使用Java将HTML文件读取到DOM树
是否有解析器/库可以使用Java将HTML文档读取到DOM树中?我想使用DOM/Xpath
Java提供的标准API。
大多数库似乎都具有自定义API来解决此任务。此外,大多数可用的解析器似乎都不支持将HTML转换为XML-DOM。
有一个好的HTML DOM解析器有什么想法或经验吗?
回答:
JTidy,方法是将流处理为XHTML,然后使用您喜欢的DOM实现重新解析,或者如果可以提供足够的DOM限制就使用parseDOM。
或者Neko。
以上是 使用Java将HTML文件读取到DOM树 的全部内容, 来源链接: utcz.com/qa/427304.html