Scrapy框架

当爬虫逻辑变复杂后，只写 requests + 解析器 会越来越乱。
这时 Scrapy 的价值就体现出来了。

Scrapy 是什么

Scrapy 是一个爬虫框架。
它帮你把爬虫拆成更清晰的结构，例如：

因为当项目稍微复杂一点时，你很快会碰到这些问题：

Scrapy 就是解决这些问题的。

bash

pip install scrapy

bash

scrapy startproject myspider

生成后的目录结构大致会包括：

你可以先粗略理解成这条链路：

Spider 就是你真正写抓取逻辑的地方。

一个最基础的 Spider 会包含：

抓到的数据可以：