Scrapy可以为每个start_url设置不同的解析函数吗?
这是一段伪代码:
start_urls = [
"http://111sssssssss.com",
"http://222sssssssssssss.com",
"http://333sssssssssss.com",
"http://444sssssssss.com",
]
def parse_1():
'''some code, this function will crawl http://111sssssssss.com'''
def parse_2():
'''some code, this function will crawl http://222sssssssssssss.com'''
有什么办法可以做到这一点吗?
您可以覆盖/实现parse_start_url
函数并在那里调用parse_1
or parse_2
当。。。的时候response.url
符合您的标准(在本例中是正确的 URL)。
def parse_start_url(response):
if response.url == 'http://111sssssssss.com':
parse_1(response)
if response.url == 'http://222sssssssssssss.com':
parse_2(response)
欲了解更多信息parse_start_url()
read 文档 http://doc.scrapy.org/en/latest/topics/spiders.html#scrapy.spiders.CrawlSpider.parse_start_url.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)