Java-使用Jsoup获取脚本标签内的文本

我正在使用Jsoup库读取URL。该网址的一些<script>标记中包含文本。我可以在每个<script>标签中获取文本吗?请注意,我不要求解析Javascript文件,因为我已经知道JSoup不允许这样做。URL的实际源代码在script标签中包含文本,我需要这样做。

doc = Jsoup.connect("http://www.example.com").timeout(10000).get();

Element div = doc.select("script").first();

for (Element element : div.children()) {

System.out.println(element.toString());

}

这是源代码中的脚本标签之一:

<script type="text/javascript">

(function() {

...

})();

</script>

回答:

是。您可以使用Element#getElementsByTag()获得所有script标签。每个脚本标签将由DataNode表示。

 Document doc =Jsoup.connect("http://stackoverflow.com/questions/16780517/java-obtain-text-within-script-tag-using-jsoup").timeout(10000).get();

Elements scriptElements = doc.getElementsByTag("script");

for (Element element :scriptElements ){

for (DataNode node : element.dataNodes()) {

System.out.println(node.getWholeData());

}

System.out.println("-------------------");

}

以上是 Java-使用Jsoup获取脚本标签内的文本 的全部内容, 来源链接: utcz.com/qa/420189.html

回到顶部