如何从Java验证HTML?

Java验证HTML的快速简便的方法是什么?我正在寻找一个开放源代码/ PD类(或类集),该类描述了100多种HTML标签的各种属性,例如:

  1. 标签是可选的吗?空吗 省略结束标签是否合法?
  2. 此标签可以包含哪些其他标签(如果有)?
  3. 哪些属性适用于此标签,它们的类型是什么?(不是必需的,但是很高兴)

谢谢!

我希望对HTML文档进行逐标签分析,因此我对文档整体是否有效不感兴趣,而对每种标签的具体要求不感兴趣。我可以根据W3C规范对规则进行编码,但希望先了解哪些现成的解决方案可用。

回答:

如果要验证某些标记是否遵循某些规范,则基于Java的HTML解析器似乎没有止境:

Java中的开源HTML解析器

换句话说,您可以解析HTML,然后在结果文档中查找所需的标签,并确定它们是否符合所需的规范。如果他们不这样做,那么您就可以抛出一个错误。

我认为您不会找到一个完全根据您的需求编写的HTML分析工具,主要是因为这些需求尚未表达出来并且可能有点含糊。

如果解析器无法立即执行您想要的操作,则该列表至少是开源的,因此只要发布更改,您就可以破解解析器。

以上是 如何从Java验证HTML? 的全部内容, 来源链接: utcz.com/qa/409299.html

回到顶部