Scrapy框架之Crawlspider的使用

2023-11-13

Scrapy存在多种爬虫类,最常用的有两种:第一种是基于basic模版创建的普通爬虫类Scrapy.spider。另一种是基于crawl的规则性爬虫类scrapy.spider.crawlspider。

一,crawlspider:经常用于数据在同一个页面上进行采集的情况下。

二,spider:适用于多个页面的采集。

crawlspider原理图如下:

创建crawlspider爬虫项目:crawlspider爬虫和普通爬虫创建项目大致相同,只是在创建爬虫时不同,普通爬虫使用Scrapy   genspider   爬虫名   域名,crawlspider爬虫使用Scrapy  genspider   -t crawl   爬虫名   域名

创建项目如下:

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Scrapy框架之Crawlspider的使用 的相关文章

随机推荐