SAX解析器跳过一些不被解析的元素?
所以,我有一个像
<root> <transaction ts="1">
<abc><def></def></abc>
</transaction>
<transaction ts="2">
<abc><def></def></abc>
</transaction>
</root>
所以,我有一个条件说如果ts =“ 2”然后做某事…现在的问题是,当它找到ts =“ 1”时,它仍然扫描标签
当条件与解析中断不匹配并直接寻找下一个事务标记时,是否有办法?
回答:
SAX解析器必须扫描所有子树(例如“
abc>”)以知道下一个元素的起始位置。无法解决它,这也是为什么您不能为单个XML文档并行化XML Parser的原因。
在您的情况下,我可以想到的仅有两种调优方法:
1)如果您要解析许多XML文档,则可以在其自己的线程中为每个文档运行一个解析器。这样至少可以使整体工作并行化,并利用所有可用的CPU和Core。
2)如果您只需要阅读特定条件(例如您提到的 2”>),则可以在达到该条件后立即跳过解析。如果跳过解析器会有所帮助,则方法是抛出Exception。
startElement
在中的实现ContentHandler
将如下所示:
public void startElement(String uri, String localName, String qName, Attributes atts) throws SAXException { if(atts == null) return;
if(localName.equals("transaction") && "2".equals(atts.getValue("ts"))) {
// TODO: Whatever should happen when condition is reached
throw new SAXException("Condition reached. Just skip rest of parsing");
}
}
以上是 SAX解析器跳过一些不被解析的元素? 的全部内容, 来源链接: utcz.com/qa/404808.html