如何从 scrapy 蜘蛛回调中收集统计信息？

2024-02-25

如何从蜘蛛回调中收集统计数据？

Example

class MySpider(Spider):
     name = "myspider"
     start_urls = ["http://example.com"]

def parse(self, response):
    stats.set_value('foo', 'bar')

不知道该做什么import或如何制作stats一般情况下可用。

查看scrapy 文档中的统计页面 http://doc.scrapy.org/en/latest/topics/stats.html。文档指出了统计收集器，但可能需要添加from scrapy.stats import stats到你的蜘蛛代码，以便能够用它做一些事情。

编辑：冒着吹嘘自己的风险，如果你想要一个具体的例子，我发布了一个回答关于如何收集失败的网址 https://stackoverflow.com/questions/13724730/how-to-get-the-scrapy-failure-urls/13799984#13799984.

编辑2：经过大量谷歌搜索后，显然不需要导入。只需使用self.crawler.stats.set_value()!

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Scrapy

如何从 scrapy 蜘蛛回调中收集统计信息？的相关文章

Python中Decimal类型的澄清

每个人都知道或者至少每个程序员都应该知道 http docs oracle com cd E19957 01 806 3568 ncg goldberg html 即使用float类型可能会导致精度错误然而在某些情况下精确的解决方
Python Popen 与 psexec 挂起 - 不良结果

我对 subprocess Popen 和我认为是管道的问题有疑问我有以下代码块从 cli 运行时 100 都不会出现问题 p subprocess Popen psexec serverName get cmd c ver echo
Python - 将宽字符字符串从二进制文件转换为 Python unicode 字符串

这是漫长的一天我有点困惑我正在读取一个包含大量宽字符字符串的二进制文件我想将它们转储为 Python unicode 字符串为了解压非字符串数据我使用 struct 模块但我不知道如何对字符串执行相同的操作例如阅读系列一
python 中的代表

我实现了这个简短的示例来尝试演示一个简单的委托模式我的问题是这看起来我已经理解了委托吗 class Handler def init self parent None self parent parent def Handle self
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
按元组分隔符拆分列表

我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
Pandas 根据 diff 列形成簇

我正在尝试使用 Pandas 根据表示时间以秒为单位的列中的差异来消除数据框中的一些接近重复项例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
创建嵌套字典单行

您好我有三个列表我想使用一行创建一个三级嵌套字典 i e l1 a b l2 1 2 3 l3 d e 我想创建以下嵌套字典 nd a 1 d 0 e 0 2 d 0 e 0 3 d 0 e 0 b a 1 d 0 e 0 2 d 0
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在

随机推荐

对 UIView 的 CoreGraphics/drawRect 内容进行动画处理

是否可以制作动画UIView的 CoreGraphics 内容说我有一个UIView子类称为MyView实现了drawRect 像这样的方法 void drawRect CGRect rect CGContextRef c UIGraph
如何将 Google 图表集成为 AngularJs 指令？

有一些将 Google 图表集成为 AngularJs 指令的示例像这个 http plnkr co edit YzwjuU p preview http plnkr co edit YzwjuU p preview Update 我想避
为什么我的代码没有向标准输出打印任何内容？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我正在尝试计算学生的平均分 impo
如何获取角度形式数组中更改项目的索引

我正在使用带有反应形式的 Angular 4 我有一个表单数组我试图将其绑定到我在组件中跟踪的数组我使用反应式表单这样我就可以进行验证所以我不想使用模板表单方法我将项目添加到表单数组中如下所示 createFormWithMod
有没有办法用静态 OpenSSL 构建静态 Qt？

原始问题略有不同但属于更主要问题的一部分我正在尝试在 Windows 上使用静态 OpenSSL 将 Qt 5 2 构建为静态我的最终目标是发送单个二进制文件无需提供 libeay32 dll 和 ssleay32 dll 然而在我
角度异步等待中的单元测试位置

我使用 Angular 9 与 karma 测试运行器和 jasmine 测试框架进行单元测试我只想进行单元测试app component其中有一个依赖注入 app component ts import Component Embedd
HTML5 Canvas - 用图像填充圆圈

如何在圆内绘制图像如果我做 context beginPath context arc e pageX e pageY 161 0 Math PI 2 true context closePath 然后我如何使用 fill 用我绘制的图像
为组合 ggplots 添加通用图例

我有两个水平对齐的 ggplotsgrid arrange 我浏览了很多论坛帖子但我尝试的所有命令似乎现在都已更新并命名为其他名称我的数据如下所示 Data plot 1 axis1 axis2 group1 0 212201 0 35
Django：找出菜单中已选择的项目

我确信我以前在 Stack Overflow 上见过这个问题但我找不到它所以这里什么也没有我有一个普通的 Django 菜单它使用 url 菜单项的标签和静态名称现在我想为已选择的菜单项设置不同的样式但是菜单是在基本模板中渲染的
Objective-C HashMap 等效项

我正在尝试转换一段使用 HashMap 的 Java 代码其中包含一个对象作为键一个对象包含一个值 private static HashMap
zfcuser 注册后添加用户角色

我使用 Zend Framework 2 以及 ZfcUser BjyAuthorize 和 Doctrine 作为数据库到目前为止注册等工作进展顺利我的问题是注册用户没有分配角色所以我想在注册过程中向用户添加角色用户我想我可
如何在 Windows 上禁用调试断言对话框？

我有一堆以批处理模式运行的单元测试有时 Visual C 库发出的调试断言会导致崩溃这会弹出一个对话框并且单元测试停止运行直到我单击确定关闭对话框如何让 C 程序在遇到断言时崩溃就像在 Linux 上一样而不是弹出烦人的对
Angular Elements - 未捕获类型错误：无法构造“HTMLElement”

我一直在尝试让 Angular 元素组件正常工作因为我正在考虑在即将到来的项目中使用它们我已经遵循了许多教程都非常相似但无法让它们工作其中一个教程是this one https www techiediaries com angu
tomcat后台线程

我有一个正在运行的 tomcat 6 20 实例并且想通过后台线程发送电子邮件以防止电子邮件发送功能阻止请求有什么方法可以在后台执行线程同时仍然允许正常的页面流发生该应用程序是用 ICEfaces 编写的 Thanks 创建一个Ex
Maven Mojo 映射复杂对象

我正在尝试编写一个 Maven 插件包括 mvn 配置参数中自定义类的映射有谁知道等效的 Person 类会是什么样子 http maven apache org guides mini guide configuring plugin
ld：未找到架构 x86_64 的符号

并感谢您提前提供的所有帮助我是 C C 新手正在通过深入学习来自学我正在尝试编写一个共享静态不确定区别库并编写一个简单的程序来使用该库我可能没有以最有效的方式做这件事如果是Python 我一周前就完成了这个项目但我更关心的
嵌入式编程中的zalloc是什么？

我正在研究对 ESP8266 串行 WiFi 芯片进行编程在其 SDK 示例中它广泛使用了一个名为os zalloc我期望的地方malloc 不过偶尔 os malloc也被使用因此它们在功能上似乎并不相同不幸的是没有文档任何人都
应用 UIView 变换后查找帧坐标 (CGAffineTransform)

我旋转我的视图CGAffineTransform view setTransform newTransform 应用变换后帧值保持不变但如何找到该帧的旋转或变换值 source informit com http www infor
需要一个例程来检测相似但不相同的字符串

我有一个字符串列表其中一些自我之前的版本以来已被修改有些更改是微不足道的间距相差一个单词等我想检测只有微小差异的字符串以便如果可能的话我可以尝试使用旧的翻译细微差别是什么意思在我开始使用数据库之前我不会知道您是否知道
如何从 scrapy 蜘蛛回调中收集统计信息？

如何从蜘蛛回调中收集统计数据 Example class MySpider Spider name myspider start urls http example com def parse self response stats set

如何从 scrapy 蜘蛛回调中收集统计信息？

如何从 scrapy 蜘蛛回调中收集统计信息？ 的相关文章

随机推荐

热门标签

如何从 scrapy 蜘蛛回调中收集统计信息？的相关文章