如何将 scrapy.log 模块与自定义日志处理程序一起使用？

2023-11-22

我一直在研究一个Scrapy项目，到目前为止一切都进展顺利。然而，我对 Scrapy 的日志配置可能性并不满意。此刻，我已设定LOG_FILE = 'my_spider.log' in the settings.py我的项目。当我执行时scrapy crawl my_spider在命令行上，它会为整个爬行过程创建一个大日志文件。这对于我的目的来说是不可行的。

如何将 Python 的自定义日志处理程序与scrapy.log模块？特别是，我想利用Pythonlogging.handlers.RotatingFileHandler这样我就可以将日志数据分成几个小文件，而不必处理一个大文件。不幸的是，Scrapy 日志记录工具的文档不是很广泛。提前谢谢了！

您可以通过首先在 scrapy.utils.log.configure_logging 中禁用根句柄，然后添加您自己的日志处理程序，将所有 scrapy 日志记录到文件中。

在scrapy项目的settings.py文件中添加以下代码：

import logging
from logging.handlers import RotatingFileHandler

from scrapy.utils.log import configure_logging

LOG_ENABLED = False
# Disable default Scrapy log settings.
configure_logging(install_root_handler=False)

# Define your logging settings.
log_file = '/tmp/logs/CRAWLER_logs.log'

root_logger = logging.getLogger()
root_logger.setLevel(logging.DEBUG)
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
rotating_file_log = RotatingFileHandler(log_file, maxBytes=10485760, backupCount=1)
rotating_file_log.setLevel(logging.DEBUG)
rotating_file_log.setFormatter(formatter)
root_logger.addHandler(rotating_file_log)

我们还根据需要自定义日志级别（DEBUG 到 INFO）和格式化程序。要在蜘蛛、管道中添加自定义日志，我们可以像普通的 python 日志记录一样轻松地执行此操作，如下所示：

pipelines.py 内部

import logging
logger = logging.getLogger()
logger.info('processing item')

希望这可以帮助！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何将 scrapy.log 模块与自定义日志处理程序一起使用？的相关文章

如何屏蔽 PyTorch 权重参数中的权重？

我正在尝试在 PyTorch 中屏蔽强制为零特定权重值我试图掩盖的权重是这样定义的def init class LSTM MASK nn Module def init self options inp dim super LSTM
如何更改充当按钮的范围的文本

我正在为自定义 Web 应用程序编写自动化测试我遇到了无法更改跨度文本的问题我尝试过使用 driver execute script 但没有运气如果我更好地了解 javascript 这确实会有帮助据我所知您无法单击跨度并且列表
无法使用基于日志的指标显示数据（指标类型：“计数器”）

我正在努力创建一个带有 stackdriver 监控和基于日志的指标的图表我的指标是一个计数器默认情况下没有单位日志可用于我的基于日志的指标但是当我使用我的指标创建图表时它说no data is available for the
用 Python 编写一个无操作或虚拟类

假设我有这样的代码 foo fooFactory create 由于种种原因 fooFactory create 可能无法创建实例Foo 如果可以的话我想要fooFactory create 返回一个虚拟无操作对象这个对象应该是完全惰性
在 Python 中使用 sec 函数的反函数

我正在创建一个程序用于计算从一定高度范围和设定初始速度发射射弹的最佳角度在我需要使用的最终方程中存在一个反 sec 函数它导致了一些麻烦我已经导入了数学并尝试使用 asec 无论如何但是数学似乎无法计算反秒函数我也明白 sec
无法包含外部 pandas 文档 Pycharm v--2018.1.2

我无法包含外部 pandas 文档Pycharm v 2018 1 2 例如 numpy gt http docs scipy org doc numpy reference generated module name element na
Python3 查找 2 个列表中有多少个差异才能相等

假设我们有 2 个列表 always具有相同的长度和always包含字符串 list1 sot sot ts gg gg gg list2 gg gg gg gg gg sot 我们需要找到其中有多少项list2应该改变以便它等于lis
将一个时间序列插入到 pandas 中的另一个时间序列中

我有一组定期测量的值说 import pandas as pd import numpy as np rng pd date range 2013 01 01 periods 12 freq H data pd Series np ran
当x轴不连续时如何删除冗余日期时间 pandas DatetimeIndex

我想绘制一个 pandas 系列其索引是无数的 DatatimeIndex 我的代码如下 import matplotlib dates as mdates index pd DatetimeIndex 2000 01 01 00 00
如何在 Windows 上使用 Python 3.6 来安装 Python 2.7

我想问一下如何使用pip install对于 Python 2 7 当我之前安装并使用 Python 3 6 时我现在必须使用 Windows 上的 Python 版本 pip install 继续安装 Python 3 6 我需要使用以
Python：随时接受用户输入

我正在创建一个可以做很多事情的单元其中之一是计算机器的周期虽然我将把它转移到梯形逻辑 CoDeSys 但我首先将我的想法放入 Python 中我将进行计数只需一个简单的操作 counter 1 print counter 跟踪我处于
如何为多组精灵创建随机位置？

我尝试使用 blit 和 draw 方法进行 for 循环并为 PlayerSprite 和 Treegroup 使用不同的变量 for PlayerSprite in Treegroup surface blit PlayerSprit
使用Python将图像转换为十六进制格式

我的下面有一个jpg文件tmp folder upload path tmp resized test jpg 我一直在使用下面的代码 Method 1 with open upload path rb as image file enco
Python unicode 字符代码？

有没有办法将 Unicode 字符插入 Python 3 中的字符串例如 gt gt gt import unicode gt gt gt string This is a full block s unicode charcode U
字典中列表中仅有的几个索引的总和

如果我有这种类型的字典 a dictionary dog white 3 5 black 6 7 Brown 23 1 cat gray 5 6 brown 4 9 bird blue 3 5 green 1 2 yellow 4 9 mo
在 pip.conf 中指定多个可信主机

这是我尝试在我的中设置的 etc pip conf global trusted host pypi org files pythonhosted org 但是它无法正常工作参考 https pip pypa io en stable
ValueError：无法插入 ID，已存在

我有这个数据 ID TIME 1 2 1 4 1 2 2 3 我想按以下方式对数据进行分组ID并计算每组的平均时间和规模 ID MEAN TIME COUNT 1 2 67 3 2 3 00 1 如果我运行此代码则会收到错误 ValueE
Python Flask 是否定义了路由顺序？

在我看来我的设置类似于以下内容 app route test def test app route
Google App Engine 中的自定义身份验证

有谁知道或知道我可以在哪里学习如何使用 Python 和 Google App Engine 创建自定义身份验证流程我不想使用 Google 帐户进行身份验证并且希望能够创建自己的用户如果不是专门针对 Google App Engin
如何对字符串列表进行排序？

在 Python 中创建按字母顺序排序的列表的最佳方法是什么基本回答 mylist b C A mylist sort 这会修改您的原始列表即就地排序要获取列表的排序副本而不更改原始列表请使用sorted http docs pyt

随机推荐

GAWK：strftime() 的逆 - 使用格式模式将日期字符串转换为自纪元时间戳以来的秒数

Gnu AWK 提供内置函数 strftime 它可以转换时间戳1359210984 into Sat 26 Jan 15 36 24 CET 2013 我找不到可以执行此操作的函数 seconds timefromdate Sat 26
如何在 iOS 9.0 Beta 中实现新的 Core Data 模型构建器“唯一”属性

在 WWDC15 视频会议中核心数据的新变化在 10 45 分钟演示开始时 Apple 工程师描述了模型构建器的一项新功能该功能允许您指定独特的属性一旦设置了这些唯一属性 Core Data 将不会创建具有该属性的重复对象这是为
根据两列分配唯一ID [重复]

这个问题在这里已经有答案了我有一个数据框 df 如下所示 School Student Year A 10 1999 A 10 2000 A 20 1999 A 20 2000 A 20 2001 B 10 1999 B 10 2000
MediaPlayer 在 Android 4.4 上随机停止 (19)

我的应用程序在除 Nexus 5 之外的所有设备上都可以正常传输音频在 Nexus 5 上 MediaPlayer 随机停止播放不确定响度是否发生变化 http developer android com about versions
Boost Spirit可以用来解析字节流数据吗？

Spirit Boost C 库的一部分可以用来解析来自流的二进制数据吗例如它可以用来将来自套接字的数据解析为结构字节和单独的位标志吗谢谢 Boost Spirit 允许使用定义解析器扩展巴科斯诺尔范式 EBNF 语法与模板元编
DataFrame 到列表的列表，不更改值的数据类型

df values to list or list df values 将数据帧转换为列表列表但整数值转换为浮点值数据框是 HSCode value year 0 2 0 18 2018 1 3 0 00 2018 2 4 12 48
Django：查询使用包含列表中的每个值

我需要执行 django 查询来检查字段是否包含列表中的所有值该列表的长度会有所不同 Example User objects filter first name contains x y z import operator from d
在 GCC 中动态创建 va_list - 可以做到吗？

我的问题是vsprintf是我无法直接获取输入参数我必须先逐一获取输入并将它们保存在void 然后通过这个void to vsprintf 对于windows来说一切都很好但是当我来到64位linux时 gcc无法编译因为它不允许从v
如何使用 FB FQL 多重查询的结果？

我对 Facebook 的 fql multiquery 方法感到困惑我正在尝试检索一篇文章的所有评论然后检索每个评论的用户信息我可以毫无问题地获得评论但我很难获得用户目前我正在使用以下内容 FB api method fql m
Flask-OIDC redirect_uri 值在某处被覆盖？

我已经安装了 Flask OIDC 并尝试使用我公司的服务对用户进行身份验证我正在使用 client secrets json 文件该文件正在正确读取解析和发送 client id client secret 和其他值我将redir
Meteor Up Docker 和 Graphicsmagick

我正在寻找如何在 Meteor Up Docker 上安装 Graphicsmagick 我找到了这个解决方案访问 docker 内的二进制文件但我无法工作我该把这些线放在哪里start sh meteorDockerId docke
VB / C#：平均调整两个控件的大小

我创建了一个窗口其中有两个组面板以及它们之间的一些按钮我想以一种方式对调整大小行为进行编码当窗口扩展时两个面板会增加宽度同时保持它们之间的距离不变请看这个模型正如您在上面看到的我希望调整本地和服务器面板的大小同时
如何查看Lucene索引

我正在尝试学习和理解 lucene 是如何工作的 lucene 索引里面有什么基本上我想看看数据在 lucene 索引中是如何表示的我在用lucene core 8 6 0作为依赖下面是我非常基本的 Lucene 代码 private
Spinner OnItemSelectedListener

我找不到如何在单声道中执行此操作的示例有什么帮助吗编辑添加代码 foreach equip item in list tr new TableRow this sp new Spinner this sp LayoutParamete
使用 R 的日历时间序列

如何制作日历时间序列图表this与ggplot2 我找不到任何东西所以我继续写下来 Makes calendar time series plot The version rendered on the screen might look
使用 mysqldump 备份具有 GEOMETRY 列的表？

我最近创建了一个 MySQL 表其中包含 GEOMETRY 类型的列当我使用 mysqldump 备份表时它将几何列输出为带引号的字符串其中包含一些转义字符例如 0 以及一些看起来像上位 ASCII 范围中的原始二进制字节的字符
带有特殊字符的 NSURL

如何编码此 url 以显示在 UIWebview 中 http de wikipedia org search Bev lkerungsentwicklung I tried stringByAddingPercentEscapesUsin
在水平分割或垂直分割中打开窗口

我希望同时打开 NERDTree 和 TagList 但我不需要它们具有屏幕的整个高度相反我想让它们在单个垂直分割中水平分割更具体地说我希望能够打开一个 NERDTree 并让它占据屏幕的整个高度然后当我打开 TagList 时
Python编程：仅在命令提示符下获取“名称'Tk'未定义”，在IDLE中有效[重复]

这个问题在这里已经有答案了刚开始使用 Tkinter 的初学者的问题我下载了并写了教程Hello World程序并且在 IDLE 下运行良好但是当我保存程序并使用命令提示符运行它时它们都返回NameError name tk i
如何将 scrapy.log 模块与自定义日志处理程序一起使用？

我一直在研究一个Scrapy项目到目前为止一切都进展顺利然而我对 Scrapy 的日志配置可能性并不满意此刻我已设定LOG FILE my spider log in the settings py我的项目当我执行时scrapy

如何将 scrapy.log 模块与自定义日志处理程序一起使用？

如何将 scrapy.log 模块与自定义日志处理程序一起使用？ 的相关文章

随机推荐

热门标签

如何将 scrapy.log 模块与自定义日志处理程序一起使用？的相关文章