
jsoup关键词搜索元素
我能够使用Jsoup在Java中查询我需要的所有数据并将其存储为元素并将其命名为“链接”。我想扫描州,例如加利福尼亚州,内华达州和德克萨斯州,并在计数数据中列出其中一个时,将计数增加1。我知道我希望为每个状态创建一个int,然后将它放在带有+ =的while语句中,并创建50个这样的语句来扫描每...
2024-01-10
jsoup获得div元素的类
我是Jsoup解析的新手,我想要获得本页面上所有公司的列表: 现在,一种方法是使用div标签检查页面与我需要的相关。 然而,当我打电话的方法:jsoup获得div元素的类Document doc = Jsoup.connect("https://angel.co/companies?company_types[]=Startup").get(); System.out.println(doc.html()); 首先,我甚至不能找到我的康索尔HTML输...
2024-01-10
Jsoup得到状态代码
我需要检查与Jsoup的请求的状态代码,如果200去解析HTML。Jsoup得到状态代码如果我用这个:dom = jSoupClass.connect("http://www.google.it") .userAgent("Mozilla/5.0 (Windows; U; WindowsNT 5.1; en-US; rv1.8.1.6) Gecko/20070725 Firefox/2.0.0.6") .execute(); status = dom.statusCode(); 我会得到响应...
2024-01-10
Jsoup重定向到URL
我正在尝试从网址缩短器提供的网址中获取实际(重定向)网址。让我们以Twitter网址缩短程序为例。我能够获取响应对象,并将其解析为文档。Response response = Jsoup.connect("http://t.co/i5dE1K4vSs") .followRedirects(true) //to follow redirects .execute();现在,考虑单个重定向,从哪里获得最终的U...
2024-01-10
使用jsoup确定HTML元素位置
我正在使用jsoup解析HTML页面。有没有办法使用jsoup来确定每个元素页面上相对于页面顶部的位置?使用jsoup确定HTML元素位置回答:不,因为Jsoup只解析HTML。你需要一些东西去考虑CSS & JavaScript - 根据你在做什么,看看Selenium,Cobra或PhantomJS。...
2024-01-10
如何在jsoup中获取元素的一级子级
在jsoup中,Element.children()返回Element的所有子代(后代)。但是,我想要Element的一级子级(直系子级)。我可以使用哪种方法?回答:Element.children()仅返回直接子代。由于您将它们绑定到树上,因此它们也有孩子。如果需要直接子元素而没有底层树结构,则需要按以下方式创建它们public static void ma...
2024-01-10
防止Jsoup丢弃多余的空格
我正在使用Jsoup清理来自表单的用户输入。有问题的表单包含一个<textarea>要求纯文本的表单。提交表单后,我使用Jsoup.clean(textareaContents);清除输入。但是,由于html会忽略多余的空格,Jsoup.clean()因此将从输入中删除有价值的空格字符。例如,如果有人在中输入了一些文本行textarea:hellotest之后Jsoup.cl...
2024-01-10
具有基本访问身份验证的Jsoup连接
Jsoup中是否可以通过基本访问身份验证从网站加载文档?回答:使用HTTP基本访问身份验证时,您需要发送Authorization标头以及一个值"Basic" + base64encode("username:password")。例如(在Apache Commons CodecBase64的帮助下):String username = "foo";String password = "bar";String login = username + ":" + password;String base64lo...
2024-01-10
如何使Jsoup白名单接受某些属性内容
我正在将Jsoup与轻松的白名单一起使用。看起来很完美,但我想保留嵌入的图像标签,例如<img alt="" src="data:;base64。有没有办法修改白名单以接受这些img? :如果使用,Whitelist.relaxed().addProtocols("img","src","data")则不会删除那些img标签。但是它接受“data:”之后的任何内容,如果src内容以“ data:; base64...
2024-01-10
JSOUP中的UserAgent?
我在JSOUP代码中到处都有。Useragent 设置为Mozilla。如果我要将其设置为 Jsoup.connect(url) .userAgent("Mozilla");我怎样才能做到这一点?提前致谢。回答:去那里 :http://www.useragentstring.com/pages/Opera/或http://www.useragentstring.com/pages/Chrome/并获得您喜欢的一个。例如:Jsoup.connect(url).userAgent("Opera/9.8...
2024-01-10
