如何使用PyCharm调试Scrapy项目

2024-04-13

我正在使用 Python 2.7 开发 Scrapy 0.20。我发现 PyCharm 有一个很好的 Python 调试器。我想用它来测试我的 Scrapy 蜘蛛。有人知道该怎么做吗?

我尝试过的

Actually I tried to run the spider as a script. As a result, I built that script. Then, I tried to add my Scrapy project to PyCharm as a model like this:
File->Setting->Project structure->Add content root.

但我不知道我还需要做什么


The scrapy命令是一个 python 脚本,这意味着您可以从 PyCharm 内部启动它。

当您检查 scrapy 二进制文件时(which scrapy)你会注意到这实际上是一个Python脚本:

#!/usr/bin/python

from scrapy.cmdline import execute
execute()

这意味着像这样的命令scrapy crawl IcecatCrawler也可以这样执行:python /Library/Python/2.7/site-packages/scrapy/cmdline.py crawl IcecatCrawler

尝试找到 scrapy.cmdline 包。 就我而言,位置在这里:/Library/Python/2.7/site-packages/scrapy/cmdline.py

使用该脚本作为脚本在 PyCharm 内创建运行/调试配置。使用scrapy命令和spider填充脚本参数。在这种情况下crawl IcecatCrawler.

Like this: PyCharm Run/Debug Configuration

将断点放在爬行代码中的任何位置,它应该可以工作™。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用PyCharm调试Scrapy项目 的相关文章

  • 调试 Android 库中的本机代码

    我的工作空间布局是 ApplicationLibrary AndroidManifest xml jni libs src Application AndroidManifest xml ant properties 如何在 Eclipse
  • Python:数百万个小文件的读写速度缓慢

    结论 看来 HDF5 是适合我的目的的方法 基本上 HDF5 是一种用于存储和管理数据的数据模型 库和文件格式 并且旨在处理令人难以置信的大量数据 它有一个名为 python tables 的 Python 模块 链接在下面的答案中 HDF
  • 嵌套列表递归python的序列

    给定一些数字 n 我想生成一个大小为 n 的列表 其中以下示例显示列表中的第 n 个元素应该如何 对于 n 0 返回 对于 n 1 返回 对于 n 2 返回 对于 n 3 返回 基本上 它采用先前的列表并将它们附加到新列表中 我尝试过以下方
  • 如何使用 python 将 .docx 文件转换为 html?

    import mammoth f open D filename docx rb document mammoth convert to html f 当我运行此代码时 我无法获取 html 文件 请帮助我获取它 当我转换为 html 文件
  • django自定义模板标签中的访问请求

    我在 myapp extras py 中的代码 from django import template register template Library register inclusion tag new userinfo html d
  • 使用 NumPy 数组执行分组平均值和标准差

    我有一组数据 X Y 我的自变量值 X 不是唯一的 因此有多个重复值 我想输出一个新数组 其中包含 X unique 它是 X 的唯一值的列表 Y mean 与 X unique 对应的所有 Y 值的平均值 Y std X unique对应
  • Pandas 随机样本删除

    我知道DataFrame sample 但是我怎样才能做到这一点并从数据集中删除样本呢 注意 据我所知 这与替换采样无关 例如这里是精华我想要实现的目标 这实际上不起作用 len df 1000 df subset df sample 30
  • 在散景中隐藏轴

    如何在散景图中隐藏 x 轴和 y 轴 我已经根据此进行了检查和尝试 p1 figure visible None p1 select type Axis visible 0 xaxis Axis plot p1 visible 0 和喜欢h
  • Python 请求:使用 Multipart/form-data 在 Facebook 上发布图像

    我正在使用 facebook API 在页面上发布图像 我可以使用以下命令从网络发布图像 import requests data url url caption caption access token token status requ
  • 将 python 代码写入 python 文件的最佳方法是什么?

    我想编写一个脚本 generate script py 生成另一个python脚本 file generated py 到目前为止我已经创建了generate script py import os filepath os getcwd d
  • Python 类:通过传递值实现单例还是非单例?

    我有一个 Python 3 类 目前是使用 a 定义的单例 singleton装饰器 但有时需要not成为单身人士 问题 是否可以在从类实例化对象时执行类似于传递参数的操作 并且该参数确定该类是否是单例 我试图找到一种替代方法来复制类并使其
  • 如何在给定目标大小的情况下在 python 中调整图像大小,同时保留纵横比?

    首先 我觉得这是一个愚蠢的问题 对此感到抱歉 目前 我发现计算最佳缩放因子 目标像素数的最佳宽度和高度 同时保留纵横比 的最准确方法是迭代并选择最佳缩放因子 但是必须有更好的方法来做到这一点 一个例子 import cv2 numpy as
  • Python从更高级别的包导入模块

    这是我的包层次结构 app init py Empty file server py global vars py handlers init py Empty file url1 init py Empty file app1 py ap
  • Python:定义多个相同类型的变量?

    可能是重复的 但至少我无法通过搜索这些术语找到答案 在Python中有没有更快的方法来做到这一点 level1 level2 level3 我试过了 level1 level2 level3 但这似乎创建了该对象的副本 这不是我想要的 和
  • 从values() 或values_list() 中排除字段

    有没有一种有效的方法从函数中排除字段values or values list e g Videos objects filter id 1 get values 我想从此查询集中排除该字段duration 我知道我可以指定我想要在结果中包
  • 在 Python 中使用列表理解来执行类似于 zip() 的操作?

    我是一名 Python 新手 我想做的事情之一就是围绕列表理解进行思考 我可以看到这是一个非常强大的功能 值得学习 cities Chicago Detroit Atlanta airports ORD DTW ATL print zip
  • 按权重分组

    给定以下数据框 import pandas as pd d pd DataFrame Age 18 20 20 56 56 Race A A A B B Response 3 2 5 6 2 Weight 0 5 0 5 0 5 1 2 1
  • AttributeError:“MainRouter”对象没有属性“_disabled_count”

    我正在创建一个 kivy 应用程序 其中我使用了显示此错误的路由器 AttributeError MainRouter 对象没有属性 disabled count 有什么解决办法吗 我也得到了这个 但使用 super 修复了它 使用以下命令
  • Pandas dataframe ,使用 iloc 替换最后一行

    我正在尝试使用 iloc 替换 Pandas 数据帧的最后一行 但是我无法让它工作 有很多解决方案 但最简单 最慢 的是这里 如何在 Python 中对 Pandas 数据帧上的行进行 FIFO 推送操作 https stackoverfl
  • 使用 PyDrive 将图像上传到 Google Drive

    我有一个关于 PyDrive 的愚蠢问题 我尝试使用 FastAPI 制作一个 REST API 它将使用 PyDrive 将图像上传到 Google Drive 这是我的代码 from fastapi import FastAPI Fil

随机推荐

  • 在 C# 中获取两个时间之间的时间跨度?

    我有两个文本框 一种用于准时打卡 另一种用于打卡下班 时间将采用以下格式 Hours Minutes 假设我早上 7 00 打卡上班 下午 2 00 打卡下班 使用我当前的代码 我得到了 2 小时的差异 但实际上应该是 7 小时 我将如何在
  • 使用 Photoshop 脚本显示/隐藏图层的功能 (JSX)

    我正在编写一个脚本 它将循环遍历图层 修剪它们并导出 到目前为止 我已经拥有完成此脚本所需的大部分元素 我唯一找不到的是如何显示 隐藏单个图层 我找到了显示 隐藏所有图层的功能 但没有找到单个图层的功能 selectAllLayers se
  • Delphi 中的 Web 服务超时错误

    我有一个发出 SOAP 请求的客户端应用程序 我已将超时设置为 20 分钟 但是 有时我会看到 10 秒后发生超时错误 我的代码中有以下内容 RIO HTTPWebNode ReceiveTimeout 1200000 我需要设置Conne
  • 使用 android espresso 访问自定义可扩展列表中的子项

    我正在尝试访问自定义可扩展列表中的子项 该列表如下所示 自定义可扩展列表 http foodaversions com aversions cropped png 我可以通过以下方式成功访问组 Espresso onView allOf w
  • beautifulsoup:导入错误:没有名为 html.entities 的模块

    我试图让这个模块在服务器上工作 但我在标题中收到错误 我的脚本 from bs4 import BeautifulSoup 当我运行它时 aclark tycho python test py Traceback most recent c
  • 将项目附加到 WPF 中的数据绑定 ItemsControl

    我有一个组合框 它与项目的 ObservableCollection 进行数据绑定 我想要一个默认选定的项目 无 它将我绑定到 SelectedValue 的属性的值设置为 null 我认为应该有一种方法可以通过 Style DataTem
  • 如何在 Hibernate 中创建/调用 sql 视图

    这是在中创建的视图document hbm xml
  • 从 DateTime 系列中的多个 CSV 文件设置 MultiIndex DataFrame

    我有一个 CSV 格式的时间序列价格数据列表 其读法如下 asxList ANZ NAB WBC for asxCode in asxList ohlcData pd DataFrame from csv asxCode CSV heade
  • Elixir GenServer 并行handle_call

    Phoenix框架上有一个应用程序 需要 GenServer 它将检查一些值 这些值的验证从控制器开始 来自客户端的请求 GenServer 值检查 客户端接收响应 一旦handle call是同步的 那么当10个客户端同时调用10个han
  • 在 shUnit2 中重定向文件输出的单元测试 bash 脚本

    我正在使用 shUnit2 在 Bash shell 脚本中进行单元测试 我有这样的代码 cat gt etc somefile lt
  • 图像未从 Firebase 存储下载

    我正在尝试将图像从新的 Firebase 存储下载到本地文件 为此 我使用 Firebase 提供的示例here https firebase google com docs storage ios download files downl
  • Django:查询抽象基类

    我遇到过这样的情况 我正在对一场足球比赛进行建模 每场比赛都有一组与之相关的事件 这些事件与比赛期间发生的事情有关 所以有点像这样 class Event models Model time models IntegerField clas
  • 从图像中获取主色并丢弃背景

    从图像中获取主色的最佳 结果 而不是性能 算法是什么 该算法应该丢弃图像的背景 我知道我可以构建一个颜色数组以及它们在图像中出现的数量 但我需要一种方法来确定什么是背景 什么是前景 并且在读取主色时只记住第二个 前景 这个问题非常困难 特别
  • Pythoncurses不显示颜色,而Cncurses工作正常

    我似乎无法让 Pythoncurses 模块显示颜色 而 ncurses C 库工作正常 这是一个应该可以工作的简单脚本 import curses def main stdscr if not curses has colors rais
  • 更新嵌入数据,例如 sysdata.rda

    我最近向 CRAN 提交的内容被退回了 因为我有一份关于全球环境的作业 但现在这已引起人们的不满 我有一个嵌入式数据集 sysdata rda 其中包含基于用户所在州 如美国 的配置参数 我希望当新用户使用该程序时可以更新此嵌入数据集 我之
  • 将提交从一个子树应用到同一存储库中的另一个子树

    我一直在使用 git p4 将 Perforce 存储库的部分内容克隆到 git 存储库中 我检查的树具有以下 Perforce 分支 结构 回购 发布回购 发布B仓库 功能仓库 功能B 我的本地 git 存储库中有一堆 git 提交到 f
  • 如何在搜索 api 中排除转发和回复?

    如何在搜索 api 中排除转发和回复 我正在尝试使用搜索 api 从 Twitter 获取提要 结果我也收到了回复和转发 所以我想排除回复和转发 怎么办谁帮帮我 这是我的网址 我认为上面的内容是不正确的 您可以在搜索 API 中使用过滤器
  • Flutter硬件音量键检测?

    迄今为止所有的挖掘都表明https github com flutter moum flutter hardware buttons https github com flutter moum flutter hardware button
  • 如何实时更新 NetworkX 图?

    我正在尝试在画布中使用 matplotlib 更新 networkx 图 但它每次都会向图表添加一个新图表 而不是更新下面的图表 我必须将调用添加到nx draw networkx 函数让它更新 我不确定这是否是问题的一部分 示例代码 im
  • 如何使用PyCharm调试Scrapy项目

    我正在使用 Python 2 7 开发 Scrapy 0 20 我发现 PyCharm 有一个很好的 Python 调试器 我想用它来测试我的 Scrapy 蜘蛛 有人知道该怎么做吗 我尝试过的 Actually I tried to ru