Python3爬虫利器：Scrapyrt的安装（Scrapy分布式）[python爬虫利器]

Z时代
2024-01-10
分类：综合

python

Scrapyrt为Scrapy提供了一个调度的HTTP接口，有了它，我们就不需要再执行Scrapy命令而是通过请求一个HTTP接口来调度Scrapy任务了。Scrapyrt比Scrapyd更轻量，如果不需要分布式多任务的话，可以简单使用Scrapyrt实现远程Scrapy任务的调度。

1. 相关链接

GitHub：https://github.com/scrapinghub/scrapyrt

官方文档：http://scrapyrt.readthedocs.io

2. pip安装

这里推荐使用pip安装，命令如下：

pip3 install scrapyrt

接下来，在任意一个Scrapy项目中运行如下命令来启动HTTP服务：

scrapyrt

运行之后，会默认在9080端口上启动服务，类似的输出结果如下：

scrapyrt
2017-07-12 22:31:03+0800 [-] Log opened.
2017-07-12 22:31:03+0800 [-] Site starting on 9080
2017-07-12 22:31:03+0800 [-] Starting factory <twisted.web.server.Site object at 0x10294b160>

如果想更换运行端口，可以使用-p参数，如：

scrapyrt -p 9081

这样就会在9081端口上运行了。

3. Docker安装

另外，Scrapyrt也支持Docker。比如，要想在9080端口上运行，且本地Scrapy项目的路径为/home/quotesbot，可以使用如下命令运行：

docker run -p 9080:9080 -tid -v /home/user/quotesbot:/scrapyrt/project scrapinghub/scrapyrt

这样同样可以在9080端口上监听指定的Scrapy项目。

网，免费的在线学习python平台，欢迎关注！

本文转自：https://cuiqingcai.com/5456.html

以上是 Python3爬虫利器：Scrapyrt的安装（Scrapy分布式）[python爬虫利器] 的全部内容，来源链接： utcz.com/z/521864.html

Python3爬虫利器：Scrapyrt的安装（Scrapy分布式）[python爬虫利器]

其他人也看了：