为什么这个爬虫一直412
https://www.12309.gov.cn/gj/s...
就是这个网址
cookie ,header 代理 ,selenium 能用的方法全都用了,全都是 412 ,有没有大佬点拨一下
回答
先给你个思路。
首先你要想着,HTTP就是基于TCP的文本协议。既然浏览器可以请求成功,那么代码肯定能模拟。
如图,多请求几次,然后对比一下请求头,看看有啥差别。
以上是 为什么这个爬虫一直412 的全部内容, 来源链接: utcz.com/a/44602.html
https://www.12309.gov.cn/gj/s...
就是这个网址
cookie ,header 代理 ,selenium 能用的方法全都用了,全都是 412 ,有没有大佬点拨一下
先给你个思路。
首先你要想着,HTTP就是基于TCP的文本协议。既然浏览器可以请求成功,那么代码肯定能模拟。
如图,多请求几次,然后对比一下请求头,看看有啥差别。
以上是 为什么这个爬虫一直412 的全部内容, 来源链接: utcz.com/a/44602.html