python爬虫ip代理池是什么?怎么做?

python

照例经常去网上浏览关于python的内容,希望可以搜索不同的内容,让大家充分了解关于python的一些应用,比如今日,要跟大家聊聊的IP代理池是什么?如果有小伙伴知道的话,也请在看下,因为这边涉及的内容比较广,可以拓展丰富我们的认知哦~好啦,话不多说,跟随者小编一起来看下吧~

定义代理IP

proxie = {

        'http' : 'http://xx.xxx.xxx.xxx:xxxx',

        'http' : 'http://xxx.xx.xx.xxx:xxx',

        ....

}

使用代理

response = requests.get(url,proxies=proxies)

如何使用呢

首先使用 git clone 将源代码拉到你本地

接着在你 clone 下来的文件目录中

安装相关所需的 python 模块:

pip3 install -r requirements.txt

接着就可以运行 run.py 了:

代理池开始运行

 * Running on http://0.0.0.0:5555/ (Press CTRL+C to quit)

开始抓取代理

获取器开始执行

Crawling http://www.66ip.cn/1.html

正在抓取 http://www.66ip.cn/1.html

抓取成功 http://www.66ip.cn/1.html 200

成功获取到代理 201.69.7.108:9000

成功获取到代理 111.67.97.58:36251

成功获取到代理 187.32.159.61:51936

成功获取到代理 60.13.42.154:9999

成功获取到代理 106.14.5.129:80

成功获取到代理 222.92.112.66:8080

成功获取到代理 125.26.99.84:60493

...

运行 run.py 你就可以访问你的代理池了比如随机获取一个代理 ip 地址:

这样访问之后就会获取到一个代理 ip。

好啦,大家如果想了解设置代理池的,可以跟着小编的这篇内容学习了解下哦~基本上每一个代码都是我们只做代理池需要用到的,所以大家如果自己编写的话,可以对比学习看下哦~

以上是 python爬虫ip代理池是什么?怎么做? 的全部内容, 来源链接: utcz.com/z/529638.html

回到顶部