提交表单后,爬虫怎样能获得真正的下载链接?
需要在网站点击保存,完成弹出的表单来定制下载:
点击后,出现这两个:
然而并没有一个链接是直接打开就能下载的那种,之前只爬过静态网页,非常小白,网上介绍的案例往往是用正则匹配到文件的下载链接直接写入就可以,不清楚这种需要提交表单,并且下载的文档内容由表单决定的情况需要怎么处理。求指教,非常感谢。
回答:
应先分析提交表单的请求header及提交参数信息、返回的header信息,然后再利用python模拟提交,最终解决问题,大体就是这个思路
以上是 提交表单后,爬虫怎样能获得真正的下载链接? 的全部内容, 来源链接: utcz.com/a/157076.html