Scrapy：测试内联请求的有效方法

2024-04-12

我使用 scrapy-inline-requests 库编写了一个蜘蛛。所以我的蜘蛛中的解析方法看起来像这样：

@inline_requests
def parse(self, response1):
    item = MyItem()
    loader = ItemLoader(item=item, response=response1)

    #extracting some data from the response1

    try:
        response 2 = yield Request(some_url)
        #extracting some other data from response2
    except Exception:
            self.logger.warning("Failed request to: %s", some_url)

    yield loader.load_item()

我想有效地测试这个方法。我可以轻松编写一个测试，其中创建一个假模拟响应1并将其传递给函数。但是，我不知道如何模拟 response2 并使用两个虚假响应中的数据获取完整的项目。你有什么建议吗？

可能有点晚了，但请查看 scrapy-inline-requests 的 github 存储库中的测试：https://github.com/rmax/scrapy-inline-requests/blob/master/tests/test_inline_requests.py https://github.com/rmax/scrapy-inline-requests/blob/master/tests/test_inline_requests.py.

基本上，按照回调将产生这些响应的请求的顺序向回调提供响应对象列表。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

unittesting

Scrapy

Scrapy：测试内联请求的有效方法的相关文章

在 pandas 中单独打印一列的原始值？

我有一个数据框 df pd DataFrame name george age 23 name anna age 26 现在我想检索乔治的年龄 df df name george age 但这会输出一些额外的信息以及原始值 0 23 Nam
如何在 Google App Engine 的 Python 中获取 StringProperty 的值？

如何获取 nbd Model 的值我想返回由多个字段组成的描述但我无法让它工作这是我的班级代码 class User ndb Model name ndb StringProperty email ndb StringProperty
如何让python优雅地失败？

我只是想知道如何让 python 在所有可能的错误中以用户定义的方式失败例如我正在编写一个处理大项目列表的程序并且某些项目可能不符合我定义的格式如果 python 检测到错误它目前只会输出一条丑陋的错误消息并停止整个过程但是
以矢量化方式在另一个 DataFrame 中查找包含值子集的行

如何匹配此 DataFrame 中的值source car id lat lon 0 100 10 0 15 0 1 100 12 0 10 0 2 100 09 0 08 0 3 110 23 0 12 0 4 110 18 0 32 0
Paramiko SSHException 通道已关闭

我一直在使用 Paramiko 在 Linux Windows 机器上发送命令它可以很好地在 Ubuntu 机器上远程执行测试但是它不适用于 Windows 7 主机以下是我收到的错误 def unit for event self
在Python中以交互方式执行多行语句

我是 Python 世界的新手这是我用 Python 编写的第一个程序我来自 R 世界所以这对我来说有点不直观当我执行时 In 15 import math import random random random math sqrt
对于相同的查询，MySQL Workbench 比 Python 快得多

MySQL Workbench 中的以下查询需要 0 156 秒才能完成 SELECT date time minute price id FROM minute prices WHERE contract id 673 AND TIMES
NumPy 和 SciPy - .todense() 和 .toarray() 之间的区别

我想知道使用是否有什么区别优点缺点 toarray vs todense 在稀疏 NumPy 数组上例如 import scipy as sp import numpy as np sparse m sp sparse bsr mat
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
Django 模型字段默认基于另一个模型字段

我使用 Django Admin 构建一个管理站点有两张表一张是ModelA其中有数据另一个是ModelB里面什么也没有如果一个模型字段b b in ModelB为None 可以显示在网页上值为ModelA的场a b 我不知道该怎
pandas 中连续数据的平行坐标图

pandas 的 parallel coordinates 函数非常有用 import pandas import matplotlib pyplot as plt from pandas tools plotting import par
根据第三个变量更改散点图中的标记样式

我正在处理多列字典我想绘制两列然后根据第三列和第四列更改标记的颜色和样式我很难改变 pylab 散点图中的标记样式我的方法适用于颜色不幸的是不适用于标记样式 x 1 2 3 4 5 6 y 1 3 4 5 6 7 m k l l
为什么 __instancecheck__ 没有被调用？

我有以下 python3 代码 class BaseTypeClass type def new cls name bases namespace kwd result type new cls name bases namespace p
线性同余生成器 - 如何选择种子和统计检验

我需要做一个线性同余生成器它将成功通过所选的统计测试我的问题是如何正确选择发电机的数字以及我应该选择哪些统计检验我想均匀性的卡方频率测试每代收集10 000个号码的方法将 0 1 细分为10个相等的细分柯尔莫哥洛夫斯米尔
更换壳牌管道[重复]

这个问题在这里已经有答案了在 subprocess 模块的 Python 2 7 文档中我找到了以下片段 p1 Popen dmesg stdout PIPE p2 Popen grep hda stdin p1 stdout stdo
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
在 scipy 中创建新的发行版

我试图根据我拥有的一些数据创建一个分布然后从该分布中随机抽取这是我所拥有的 from scipy import stats import numpy def getDistribution data kernel stats gauss
Python：无法使用 os.system() 打开文件

我正在编写一个使用该应用程序的 Python 脚本pdftk http www pdflabs com tools pdftk the pdf toolkit 几次来执行某些操作例如我可以在 Windows 命令行 shell 中使用
如何从 nltk 下载器中删除数据/模型？

我在 python3 NLTK 中安装了一些 NLTK 包通过nltk download 尝试过它们但不需要它们现在想删除它们我怎样才能删除例如包large grammars来自我的 NLTK 安装我不想删除完整的 NLTK 安装
Python 中的字符串slugification

我正在寻找 slugify 字符串的最佳方法蛞蝓是什么 https stackoverflow com questions 427102 in django what is a slug 我当前的解决方案基于这个食谱 http code

随机推荐

MLlib MatrixFactorizationModel suggestProducts(user, num) 在某些用户上失败

我训练了一个MatrixFactorizationModel https spark apache org docs 1 3 0 api java org apache spark mllib recommendation MatrixFa
在 JPA 查询中转义冒号字符“:”

我正在尝试通过使用字符的 JPA 运行本机查询特定实例在查询中使用 MySQL 用户变量 SELECT foo bar baz rownum if id foo rownum 1 1 as rownum id foo as rep id
在 View AngularJS 中使用服务

我对 angularJS 服务有疑问我有简单的服务 angular module mainApp services factory AuthService function http var currentUser null var au
删除过多的 try-catch 块

我正在重构一个由其他开发人员编写的中型 WinForms 应用程序几乎每个类的每个方法都被一个try catch堵塞 99 的情况下这些 catch 块仅记录异常或清理资源并返回错误状态我认为很明显这个应用程序缺乏适当的异常处理机制
以逗号分隔的标签输入字段

我正在开发一个网络应用程序允许用户通过标签发布内容但问题是如果标签被comma并且文本字段值仍然相同只是用户的视图会有所不同一个例子是 YouTube 或 StackOverflow 目前我不需要它来检查数据库或任何东西 Than
Java 8 从 Map 中的匹配值中提取所有键

我对 Java8 比较陌生我有一个场景我需要从 Map 中检索与对象匹配的所有键想知道是否有一种方法可以获取所有键而无需再次从列表中迭代它们 Person java private String firstName private S
如何在 Android 上使用 GraphQL 和 Retrofit？

我是 GraphQL 的新手但我已经使用 Retrofit 一段时间了它易于使用且快速 GraphQL 在传递数据的方式方面与 REST API 有很大不同关于在 Android 上使用 GraphQL 的教程确实不多我只能找到这个
使用 numpy.genfromtxt 填充缺失值

尽管前面的问题提出了建议 9999 作为 numpy genfromtxt 的缺失值 https stackoverflow com questions 12274709 9999 as missing value with numpy g
将默认值传递给表值参数 - SQL Server

我在我们的一个存储过程中使用表值参数这是我使用的语法 districtlist NumericList readonly NumericList是用户定义的表类型但是根据要求我需要将默认值传递给该表值参数 districtlist
Boost 单元测试链接错误——abi 不匹配？

我正在尝试使用 boost 构建一个单元测试但链接器抱怨缺少函数拿这个骨架代码 define BOOST TEST DYN LINK define BOOST TEST MAIN include
无法使用如此大的 URL 生成 XML 文件

我想使用下面的代码生成 XML 但是当我包含大 URL 时它会出错甚至 cdata 也不起作用 xml new SimpleXMLElement
数据框操作 - 捕获值的变化

我目前有一个数据框如下所示它显示位置变化添加 1 个单位减去 1 个单位或不执行任何操作 0 我正在寻找带有净头寸的第二个数据框该数据框可以是多头 1 或持平 0 假设不可能有净空头 1 头寸因此逻辑是从 0 开始当第一个 1
Android AudioTrack 缓冲问题

好的我有一个频率发生器它使用 AudioTrack 将 PCM 数据发送到硬件这是我使用的代码 private class playSoundTask extends AsyncTask
readOGR (rgdal) 无法从 XML 获取多边形名称

我正在尝试导入英格兰 CCG 边界的 KML 地图此处提供 200Kb http geoportal statistics gov uk datasets 1bc1e6a77cdd4b3a9a0458b64af1ade4 4 kml 进入
“cv::VideoCapture::open VIDEOIO(CV_IMAGES)：引发 OpenCV 异常”

当我使用 VsCode 调试器运行代码时我根本没有收到任何错误并且一切正常但是当我尝试在没有调试器的情况下运行代码时我收到此错误 ERROR 0 global C projects opencv python opencv modu
如何在 Powershell 中执行相当于 $PROGPATH/program 的 bash 操作？

在 GNU Linux 中我会这样做 PROGPATH long and complicated path to some bin PROGPATH program args 但在 Powershell 中如果我尝试这样做 PROGPATH
我需要一个非常简单的 PHP 数据库前端管理面板；指定表的简单记录编辑器[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我希望为我们的公司网站添加一些动态这是次要角色所以我不想花太多时间在上面此时我所需要的只是一个简单的 PHP 脚本非技术用户可以
输出到字符串的 cout 相当于什么？

我早该知道这一点但是 printf is to sprintf as cout is to 请举个例子听起来您正在寻找std ostringstream http en cppreference com w cpp io basic o
我可以使用 iOS 推送通知来进行应用程序实时内容更新吗？

我想使用没有徽章消息或声音的推送通知消息仅使用与应用程序相关的 JSON 以便实时更新应用程序的内容当应用程序未运行时这些通知毫无用处因此当应用程序进入后台或用户空闲时向我的服务器发送取消订阅我不会发送它们并在应用程序进入前
Scrapy：测试内联请求的有效方法

我使用 scrapy inline requests 库编写了一个蜘蛛所以我的蜘蛛中的解析方法看起来像这样 inline requests def parse self response1 item MyItem loader ItemL

Scrapy：测试内联请求的有效方法

Scrapy：测试内联请求的有效方法 的相关文章

随机推荐

热门标签

Scrapy：测试内联请求的有效方法的相关文章