Java-使用Jsoup获取脚本标签内的文本
我正在使用Jsoup库读取URL。该网址的一些<script>
标记中包含文本。我可以在每个<script>
标签中获取文本吗?请注意,我不要求解析Javascript文件,因为我已经知道JSoup不允许这样做。URL的实际源代码在script标签中包含文本,我需要这样做。
doc = Jsoup.connect("http://www.example.com").timeout(10000).get();Element div = doc.select("script").first();
for (Element element : div.children()) {
System.out.println(element.toString());
}
这是源代码中的脚本标签之一:
<script type="text/javascript">(function() {
...
})();
</script>
回答:
是。您可以使用Element#getElementsByTag()获得所有script
标签。每个脚本标签将由DataNode表示。
Document doc =Jsoup.connect("http://stackoverflow.com/questions/16780517/java-obtain-text-within-script-tag-using-jsoup").timeout(10000).get(); Elements scriptElements = doc.getElementsByTag("script");
for (Element element :scriptElements ){
for (DataNode node : element.dataNodes()) {
System.out.println(node.getWholeData());
}
System.out.println("-------------------");
}
以上是 Java-使用Jsoup获取脚本标签内的文本 的全部内容, 来源链接: utcz.com/qa/420189.html