自定制命令(让scrapy在pycharm下跑起来)

2023-11-08

pytcharm运行单个爬虫

# -*- coding: utf-8 -*-
# @Time    : 2019/7/19 下午 5:19
# @Author  : lh
# @Email   : xx@lh.com
# @File    : manage.py
# @Software: PyCharm

import sys
from scrapy.cmdline import execute

"""
单个爬虫自定义命令。可以不用在cmd跑了
"""
if __name__ == '__main__':
	# scrapy crawl douban --nolog 与这个命令是等同的
    execute(['scrapy', 'crawl', 'douban', '--nolog'])

在这里插入图片描述
上面是运行单个爬虫的命令:但是我总不能一个个的写然后再运行,这时还有一种自定制的方法可以使用(一次跑起来所以的爬虫):
1.在spider同级目录下创建任意名字的目录,我这边是custom_command
在这里插入图片描述
2.在custom_command下创建一个crawl_all(这个文件名就是自定义的命令),

# -*- coding: utf-8 -*-
# @Time    : 2019/7/19 下午 5:33
# @Author  : lh
# @Email   : xx@lh.com
# @File    : crawl_all.py
# @Software: PyCharm


from scrapy.commands import ScrapyCommand
from scrapy.utils.project import get_project_settings


class Command(ScrapyCommand):

    requires_project = True

    def syntax(self):
        return '[options]'

    def short_desc(self):
        return 'Runs all of the spiders'

    def run(self, args, opts):
        spider_list = self.crawler_process.spiders.list()
        for name in spider_list:
            self.crawler_process.crawl(name, **opts.__dict__)
        self.crawler_process.start()

3.在settings.py 中添加配置 COMMANDS_MODULE = ‘项目名称.目录名称’
我这边是:

# 自定义命令
COMMANDS_MODULE = 'scrapy_tesy.custom_command'

然后你可以在cmd下运行scrapy crawl_all 命令了:
在这里插入图片描述
也可以使其在pycharm下跑起来。原理是和单个爬虫跑起来是一样的:

import sys
from scrapy.cmdline import execute

"""
单个爬虫自定义命令。可以不用在cmd跑了
"""
if __name__ == '__main__':
    # execute(['scrapy', 'crawl', 'douban', '--nolog'])

    # 自定义命令的运行
    execute(['scrapy', 'crawl_all', '--nolog'])

有关解析:
在这里插入图片描述
如:
在这里插入图片描述
还有:
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

自定制命令(让scrapy在pycharm下跑起来) 的相关文章

随机推荐

  • 054-机械臂编程

  • JavaScript 数组(数组的增删和数组排序)

    一 数组方法 1 数组操作 push 向数组末尾添加元素 返回新数组长度 添加单个元素 let arr JS Java C let newArrLength arr push PHP console log arr JS Java C PH
  • 基于量子粒子群算法(QPSO)优化LSTM的风电、负荷等时间序列预测算法(Matlab代码实现)

    欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现 1 概述 本文基于QPSO LSTM算法进行负荷 光
  • 功能测试和非功能测试有什么区别?

    转载 https dzone com articles whats the difference between functional and nonfun fromrel true 功能测试验证功能是否按照要求工作 而非功能测试则对更广泛
  • 通信加密与解密

    一 通信加密和解密技术概述 1 1 Bob和Alice的爱情故事 早些年间 恋人们之间的交往以书信沟通较为频繁 在那个年代 这种恋爱的人叫笔友 假设Bob和Alice正是处于这一时代 Bob和Alice恋爱了 他们两个好不容易走到一起 可是
  • 顺序表的简单操作代码(c++实现)

    include
  • HDU 4731 Minimum Palindrome

    hdu 4731 Minimum palindrome 题意 前n个字母形成一个m长的字符串 要求如下 1 最长回文串最小 2 字典序最小 思路 1 n 1 aaaa 2 n 2 打表找规律 1 a 2 ab 3 aab 4 aabb 5
  • 深度优先与宽度优先搜索(python)

    算法原理 1 宽度优先搜索 宽度优先搜索算法 Breadth First Search BSF 思想是 从图中某顶点v出发 首先访问顶点v 在访问了v之后依次从左往右访问v的各个未曾访问过的邻接点 然后分别从这些邻接点出发依次从左往右访问它
  • 引用文档-软件测试分类及测试中三个主要概念

    软件测试分类及测试中三个主要概念 原文链接 https blog csdn net qq 35867537 article details 77477775 1 软件测试分类 按测试技术分 按测试技术 软件测试可分为 黑盒测试 白盒测试 灰
  • 手撕八大排序(上)

    排序的概念及其引用 排序的概念 排序 所谓排序 就是使一串记录 按照其中的某个或某些关键字的大小 递增或递减的排列起来的操作 稳定性 假定在待排序的记录序列中 存在多个具有相同的关键字的记录 若经过排序 这些记录的相对次序保持不变 即在原序
  • vue富文本编辑器中上传图片

    啊 好久没更新了 最近粉丝和访问量见长 正好有童鞋的项目遇到点问题 故出此文 今天超哥给小伙伴带来的是vue中富文本编辑器上传的问题 曾经写过一个文档管理的项目 用到最多的就是富文本编辑器 说说遇到的坑吧 最终的提交结果 后端不要文档流 后
  • jmap命令(Java Memory Map)

    JDK内置工具使用 一 javah命令 C Header and Stub File Generator 二 jps命令 Java Virtual Machine Process Status Tool 三 jstack命令 Java St
  • 华为机试-python

    HJ97 首先输入要输入的整数个数n 然后输入n个整数 输出为n个整数中负数的个数 和所有正整数的平均值 结果保留一位小数 while True try n int input count1 0 count2 0 sum 0 0 for i
  • 小白spss学习笔记(二)

    SPSS初学笔记 二 1 单因素方差分析 对三组或三组以上独立样本的均数差异性的比较用单因素方差分析 所谓方差分析就是对多个平均数进行比较的一种统计方法 又称变异数分析 其主要功能在于分析实验数据中不同来源的变异对总变异的贡献大小 从而确定
  • TCP详解之三次握手、四次挥手

    在互联网很多岗位的面试中TCP的三次握手 四次挥手都是不可绕过的话题 有很高的热点度 今天我就带大家来看看什么是三次握手 四次挥手 在讲之前 我们先来了解下TCP协议是什么 1 TCP协议 TCP协议全称 传输控制协议 顾名思义 就是要对数
  • “伶荔(Linly)”项目团队全新发布中文Falcon基础模型

    引言 近期 阿联酋阿布扎比的技术创新研究所 TII 开源了 Falcon 系列模型 使用经过筛选的 1 万亿 tokens 进行预训练 并以 Apache 2 0 协议开源 可能是目前效果最好且许可协议最宽松 允许商用 的开源模型 然而 F
  • 【QT开发笔记-基础篇】

    本节对应的视频讲解 B 站 链 接 https www bilibili com video BV1mN4y137H6 信号和槽要建立连接 本质上是通过 connect 函数来连接实现的 但是从写法或者操作上来说 有多种方式 以下总结了 5
  • qsort用法

    轉自 http www cnblogs com ForeverJoker archive 2013 05 25 qsort sort html qsort函数 sort函数 精心整理篇 qsort函数 sort函数 精心整理篇 先说明一下q
  • JaCoCo助您毁灭线上僵尸代码

    一 现状 问题 随着需求不断迭代 业务系统的业务代码突飞猛进 在你自豪于自己的代码量产出很高时 有没有回头看看线上真正的客户使用量又有多少呢 费事费力耗费大量人力 成本上线的功能 可能一年没人使用 如果不进行适当的下线 就会增加系统维护成本
  • 自定制命令(让scrapy在pycharm下跑起来)

    pytcharm运行单个爬虫 coding utf 8 Time 2019 7 19 下午 5 19 Author lh Email xx lh com File manage py Software PyCharm import sys