从 Django 调用 Scrapy Spider

2024-04-16

我有一个项目，在同一工作区中包含 django 和 scrapy 文件夹：

my_project/
    django_project/
        django_project/
            settings.py
        app1/
        app2/
        manage.py
        ...
    scrapy_project/
        scrapy_project/
            settings.py
        scrapy.cfg
        ...

我已经将 scrapy 与我的 django app1 模型连接起来，因此每次运行蜘蛛时，它都会将收集的数据存储在我的 postgresql 数据库中。这就是我的scrapy项目访问django模型的方式

#in my_project/scrapy_project/scrapy_project/settings.py
import sys
import os
import django

sys.path.append('/../../django_project')
os.environ['DJANGO_SETTINGS_MODULE'] = 'django_project.settings'
django.setup()

当我从命令行调用蜘蛛时，一切都很好，但是当我想从 django 视图或 django 中的 Celery 任务将蜘蛛作为脚本调用时，例如：

from scrapy.crawler import CrawlerProcess
from scrapy.utils.project import get_project_settings
process = CrawlerProcess(get_project_settings())
process.crawl('spider_name')
process.start()

我收到错误：

KeyError: 'Spider not found: spider_name'

我想我应该告诉 Django Scrapy 位于哪里（就像我在 scrapy 设置中所做的那样），但我不知道如何做。老实说，我什至不确定我为这个项目设计文件夹结构的方式是否正确。

遵循示例scrapy文档 https://docs.scrapy.org/en/latest/topics/practices.html#run-scrapy-from-a-script:

from my_projec.scrapy_project.spiders import MySpider
...
process.crawl(MySpider)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

django

Scrapy

从 Django 调用 Scrapy Spider 的相关文章

使用 Python 3 动态插入到 sqlite

我想使用 sqlite 写入多个表但我不想提前手动指定查询有数十种可能的排列例如 def insert sqlite tablename data list global dbc dbc execute insert into tab
python array(10,1) 和 array(10,) 之间的区别

我正在尝试将 MNIST 数据集加载到数组中当我使用 X train y train X test y test mnist load data 我得到一个数组 y test 10000 但我希望它的形状为 10000 1 数组 1000
Python MySQL 操作错误：1045，“用户 root@'localhost' 的访问被拒绝

我试图通过以下方式从我的 python 程序访问数据库 db mysql connect host localhost user Max passwd maxkim db TESTDB cursor db cursor 但是我在第一行代码
在 Mac OSX 上从 Python 3.6 运行 wine 命令

我正在尝试用 Python 编写一个打开的脚本wine然后发送代码到wine终端打开一个 exe程序这 exe程序也是命令驱动的我可以打开wine 但我无法进一步 import shlex subprocess line usr bin
更改QLineEdit的ClearButton图标

我想在Windows 10 1909 64位上的Python 3 8和PyQt5 5 15 0 上更改我的QLineEdit的ClearButton图标稍后我想在Linux上运行代码我尝试应用此处找到的代码如何在 QLineEdit
Python“非规范化”unicode 组合字符

我正在寻找标准化 python 中的一些 unicode 文本我想知道是否有一种简单的方法可以在 python 中获得组合 unicode 字符的非规范化形式例如如果我有序列u o xaf i e latin small lette
使用标签或 href 传递 Django 数据

我有一个包含链接的表当单击该链接进行更多操作时我想将一些数据传递给我的函数 my html table tbody for query in queries tr td value a href internal my func que
为什么在Python解释器中输入_会返回True？ [复制]

这个问题在这里已经有答案了我的翻译行为非常奇怪 gt gt gt True gt gt gt type True
numpy：如何连接数组？（获得多个范围的并集）

我使用Pythonnumpy 我有一个 numpy 索引数组a gt gt gt a array 5 7 12 18 20 29 gt gt gt type a
为什么这个 if 语句会导致语法错误

我正在尝试设置一个 elif 语句如果用户按下 Enter 键代码将继续但是我不断遇到语法错误 GTIN 0 while True try GTIN int input input your gtin 8 number if len
Flask 应用程序路由中的多个参数

烧瓶怎么写app route如果我在 URL 调用中有多个参数这是我从 AJax 调用的 URL http 0 0 0 0 8888 createcm summary VVV change Feauure 我试图写我的烧瓶app rout
pygame：使用 sprite.RenderPlain 绘制精灵组的顺序

我有一个精灵组需要按一定的顺序绘制以便其精灵按应有的方式重叠然而即使使用运算符模块函数 sorted self sprites key attrgetter y x 对组进行排序顺序也是错误的我该如何解决这个问题直截了当地说
如何在 Seaborn 中的热图轴上表达类

我使用 Seaborn 创建了一个非常简单的热图显示相似性方阵这是我使用的一行代码 sns heatmap sim mat linewidths 0 square True robust True sns plt show 这是我得到的
基于值而不是类型的单次调度

我在 Django 上构建 SPA 并且有一个庞大的功能其中包含许多功能if用于检查我的对象字段的状态名称的语句像这样 if self state new do some logic if self state archive do s
无法创建超级用户 Django

我假设这是因为我的超级用户依赖于还没有现有数据的 UserProfile 我的模型看起来像 from django db import models from django contrib auth models import User f
“从表中选择不同的字段名称”Django使用原始sql

我怎样才能跑SELECT DISTINCT field name from table Django 中的 SQL 查询为raw sql 当我尝试使用时Table objects raw SELECT DISTINCT field name
如何使用基于类的视图处理表单（通过 get 或 post）？

我正在尝试学习基于类的视图因为详细信息或列表视图并不那么复杂我有一个搜索表单我只想看看是否发送查询来显示结果这是函数代码不是我的来自 django 书籍 def search page request form SearchFo
非法指令：MacOS High Sierra 上有 4 条指令

我正在尝试在 pygame 3 6 中制作一个看起来像聊天的窗口我刚刚将我的 MacBook 更新到版本 10 13 6 在我这样做之前它工作得很好但在我收到消息之后非法指令 4 Code import pygame from pyg
Heroku 与 django 通道的正确 procfile/要求是什么？

tl dr django 频道应用程序在本地使用 manage py runserver 运行但不在 heroku 上运行我是 django 通道的新手尝试使用 heroku 通道部署一个非常基本的 django 应用程序我最初使用
如何通过点击复制 folium 地图上的标记位置？

I am able to print the location of a given marker on the map using folium plugins MousePosition class GeoMap def update

随机推荐

Cassandra：EC2 多区域的正确配置是什么？

EC2 实例中多区域设置的正确配置是什么 listen address broadcast address rpc address 和种子 ip addresses 应该如何工作什么时候使用公共IP地址什么时候使用私有IP地址根据 b
如何使用 2 个字符串参数从 sqlite 数据库检索特定字符串数据？

这是我用来制作方法的代码 String item item1 getText toString item item toLowerCase String date getDate edited new Datahelper this edi
在 log4j.properties 文件 SMTP Appender 中隐藏或加密密码

我正在使用自定义 gmail smtp 附加程序从我的 gmail 帐户发送错误日志按照说明操作 http www tgerm com 2010 05 log4j smtpappender gmail custom html http w
将 gprof 与套接字一起使用

我有一个程序想用 gprof 进行分析问题看起来是它使用套接字所以我得到这样的事情 select Interrupted system call 我不久前遇到了这个问题放弃了然后继续前进但我真的希望能够分析我的代码如果可能的
获取小数点

如何获得一个数字的小数点例如如果我有 1 5 如何获得 5 号 int result static cast
如何使用更改侦听器 JavaFX 在两个 ListView 之间移动项目

我有两个ListViews allStudentsList其中已经填充了项目 currentStudentList没有我的目标是当用户选择一个项目时allStudentList是为了将该项目移入currentStudentList 我通过
ANTLR 实现类似Python的缩进相关语法的最简单方法是什么？

我正在尝试实现类似Python的缩进相关语法来源示例 ABC QWE CDE EFG EFG CDE ABC QWE ZXC 正如我所看到的我需要的是实现两个标记 INDENT 和 DEDENT 所以我可以编写如下内容 grammar
如何在 GNU Prolog 中使用“long int”？

所以基本上看来 GNU Prolog 在我的 32 位 x86 Linux 上使用 28 位整数下面的代码无法编译 foo A A0 is 0xdeadbeef A1 is A0 gt gt 8 A2 is A0 gt gt 16 A3
在界面中强制执行“等于”

我有一个接口我希望实现该接口的每个人都实现一个重写的等于方法有没有办法确保这种情况发生我猜想发生这种情况的方式是实现我的接口的类将自动从 Object 获取 equals 从而使接口满意不你只能创建一个抽象类而不是像这样的
使用服务器端脚本 (PHP) 创建 SVG 图形

有没有办法使用 PHP 脚本生成 HTML 文件该脚本嵌入了 SVG 其中 SVG 本身是由 PHP 脚本动态生成的基本上我想向客户端显示动态生成的 SVG 图像但是也仅引用外部源而 PHP 仅生成当前 HTML 页面而不是外
Rails：语法错误，意外的keyword_ensure，期望$end

我正在创建一个非常基本的 Rails 应用程序学习教程但无法理解为什么会出现此错误我已尝试排除故障但无济于事 My code ul class nav pull right li li li li li li ul
如何将操作栏与 Xamarin 和 MvvmCross 一起使用

我看到 Xamarin 最近作为组件发布http components xamarin com view xamandroidsupportv7appcompat http components xamarin com view xaman
如何更新 C# 和 SQL Server 中的值？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这是我的程序应该更新包含 3 列的表中的分数 id nickname scor Otherform id1 is the id需要更新的
Docker for ARM64 (Raspberry Pi 4) 上的 Android SDK 用于构建 APK

我正在尝试创建一个ARM64 Docker 镜像它能够构建我的 React Native 应用程序的 apk 文件背景为了练习目的我使用 5 个 Raspberry Pi 4 板构建了一个 Kubernetes 集群一切工作正常 J
按数组类型查询 - MongoDB

我必须按类型查询我的 mongoDB 集合假设我有这两个文件hello收藏 id ObjectId 56684ee0f597654b99d0d636 name Scrooge surname McDuck address road Mon
如何在 Python 中发送包含一些非 ASCII 字符的电子邮件？

我正在使用 Python 3 7 并尝试使用 smtplib 发送电子邮件只要消息不包含任何土耳其字符例如我的脚本就可以完美运行到目前为止我发现的唯一可行的解决方案是使用 string string encode ascii ig
设置 UIPopOverController 大小

我有一个view里面有一堆按钮UIScrollView 当用户按下按钮时我希望显示一个 UIPopOverController 指向所选按钮它有点工作但是弹出窗口的大小错误并且指向视图中的随机点这是我的代码 void detail
如何将 Maven 存储库 jar 添加到 Eclipse 构建路径？

从 Eclipse 中我可以在 Maven 存储库视图中看到所有必需的 jar 但我有大约 100 个缺少 jar 文件的错误所以我设置了 M2 REPO 环境变量我已经从命令行运行了 mvn eclipse eclipse 命令当
WINAPI 带有自定义边框的编辑控件

在纯 WinAPI 无 MFC 中实现编辑控件的自定义圆形边框的正确方法是什么我需要像这样的边框编辑我应该子类化编辑控件并在 WM NCPAINT 或类似的东西中进行自定义绘画吗我想你有两个选择正如你所说你可以子类化并覆盖WM N
从 Django 调用 Scrapy Spider

我有一个项目在同一工作区中包含 django 和 scrapy 文件夹 my project django project django project settings py app1 app2 manage py scrapy pro

从 Django 调用 Scrapy Spider

从 Django 调用 Scrapy Spider 的相关文章

随机推荐

热门标签