Skip to content

Scrapy部署

会写爬虫只是第一步。
真正工作里,你还要让爬虫稳定地在服务器上跑起来。

为什么要部署

因为很多爬虫不是“手动点一下就结束”的短任务,而是:

  • 长期运行
  • 定时执行
  • 多次重复抓取

scrapyd 是什么

scrapyd 是专门为 Scrapy 项目提供部署和管理能力的工具。

它能帮助你:

  • 上传项目
  • 启动任务
  • 停止任务
  • 远程查看运行情况

安装 scrapyd

bash
pip install scrapyd

项目上传部署

部署的核心思路是:

  1. 本地打包项目
  2. 上传到服务器
  3. 通过 scrapyd 管理运行

远程控制项目

部署之后,你会开始关心:

  • 任务是否成功启动
  • 任务是否执行结束
  • 任务失败时怎么排查

学部署时最重要的目标

  • 知道本地代码如何变成服务器任务
  • 知道如何远程管理爬虫

Built with VitePress.