无法通过管道以自定义方式重命名下载的图像

2024-02-29

我使用 python 的 scrapy 模块创建了一个脚本，从 torrent 站点下载并重命名电影图像，并将它们存储在 scrapy 项目内的文件夹中。当我按原样运行脚本时，我发现它正确地下载了该文件夹中的图像。

此时，脚本正在使用 request.url 中的方便部分重命名这些图像pipelines.py.

如何通过以下方式重命名下载的图像pipelines.py

覆盖get_media_requests()并将您需要的数据添加到请求中。然后从请求中获取该数据file_path().

例如：

class YifySpiderPipeline(ImagesPipeline):

    def get_media_requests(self, item, info):
        # Here we add the whole item, but you can add only a single field too.
        return [Request(x, meta={'item': item) for x in item.get(self.images_urls_field, [])]

    def file_path(self, request, response=None, info=None):
        item = request.meta.get('item')
        movie = item['movie']
        # Construct the filename.
        return image_name

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

webscraping

Scrapy

无法通过管道以自定义方式重命名下载的图像的相关文章

我怎样才能更多地了解Python的内部原理？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我使用Python编程已经有半年多了我对Python内部更感兴趣而不是使用Python开发应用程序
在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
if 语句未命中中的 continue 断点

在下面的代码中两者a and b是生成器函数的输出并且可以评估为None或者有一个值 def testBehaviour self a None b 5 while True if not a or not b continue pri
Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
按元组分隔符拆分列表

我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
创建嵌套字典单行

您好我有三个列表我想使用一行创建一个三级嵌套字典 i e l1 a b l2 1 2 3 l3 d e 我想创建以下嵌套字典 nd a 1 d 0 e 0 2 d 0 e 0 3 d 0 e 0 b a 1 d 0 e 0 2 d 0
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
无法在前端使用 JavaScript Fetch API 将文件上传到 FastAPI 后端

我正在尝试弄清楚如何将图像发送到我的 API 并验证生成的token那是在header的请求到目前为止这就是我所处的位置 app post endreProfilbilde async def endreProfilbilde requ
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
具有自定义值的 Django 管理外键下拉列表

我有 3 个 Django 模型 class Test models Model pass class Page models Model test models ForeignKey Test class Question model M
如何读取Python字节码？

我很难理解 Python 的字节码及其dis module import dis def func x 1 dis dis func 上述代码在解释器中输入时会产生以下输出 0 LOAD CONST 1 1 3 STORE FAST 0 x

随机推荐

在顶部添加新项目后，回收器视图不会滚动到顶部，因为列表适配器的更改尚未发生

我在实时数据的开头获取包含新项目的新列表然后使用其数据更新适配器 viewModel myLiveData observe this Observer myList gt adapter submitList myList recycle
Python/Numpy 中包含 NAN 的数组的线性回归

我有两个数组比如说varx and vary 两者在不同位置都包含 NaN 值但是我想对两者进行线性回归以显示两个数组的相关程度 This http glowingpython blogspot de 2012 03 linear r
如何使用 jQuery 触发组合键

我已经编码了一些东西 http fincha com kunden schmitt http fincha com kunden schmitt I zoom in with css zoom but I need the buttons
AVCaptureVideoDataOutput 和设置 kCVPixelBufferWidthKey & kCVPixelBufferHeightKey

我正在尝试捕获特定尺寸的帧AVCaptureVideoDataOutput通过设置kCVPixelBufferWidthKey kCVPixelBufferHeightKey 问题是缓冲区的宽度和高度永远不会改变它们总是会回来852x64
如何修复 Google-cloud-sdk 156.0.0“您的应用程序中的文件太多，无法监控所有文件的更改。”？

我刚刚在 osX 上安装了 Go 1 6 4 和 google cloud sdk 1 56 0 0 当我尝试运行本地 dev server 时我收到以下警告 Users Bryan go src google cloud sdk pla
使用 lxml 解析包含默认命名空间的 xml 以获取元素值

我有一个像这样的 xml 字符串 str1
是否存在具有低级前置操作的文件系统？

在最低级别大多数操作系统文件操作包括打开关闭读取写入删除以及查找和追加操作但没有前置操作出现这个问题是因为我的一位同事正在处理他生成的大型数千兆字节数据日志他意识到他没有将文件头写入日志文件尽管他只需要在文件的前面添加
WPF - 从 StackPanel 中删除“用户控件”子项

我正在尝试制作一个 WPF UI 用户可以在其中编辑查询来搜索数据库查询是根据消费者从组合框中选择的内容创建的像这样 https i stack imgur com 5ih0p png他可以创建任意数量的过滤器只要他点击添加新条件按钮
在 C 中匹配（一些）字符串的最有效方法？

我们的系统需要接受来自终端的用户输入并与一些已知的关键字字符串可能是 10 个进行匹配我们没有空间计算机来执行正则表达式等代码需要小而快现在最糟糕的方法是 str is null terminated assume we k
如何在 Ruby 中访问原始命令行参数字符串？

我正在尝试访问 Ruby 中的原始命令行参数字符串即不使用预分割分隔的 ARGV 数组有谁知道如何做到这一点例如 gt ruby test rb command line arguments 我希望能够判断 line 周围是否有引
oauth2Client.getToken 缺少刷新令牌

我有一个小型快递服务器有两条路线然后它将 json 令牌写入文件我知道非常不安全由于某种原因没有refresh token 在文档中有一条评论offline for access type gets refresh token 已经
在 Maven 构建期间将文件添加到 jar

我试图在执行 Maven 构建时将许可证文件添加到我的所有 jar 中我有每个类文件的许可证但我希望将 License txt 添加到每个 jar 中的每个 META INF 文件夹我的项目有一个主 pom 其中有六个模块然后这些模
发送相机意图后立即调用 onActivityResult

我正在使用相机意图在我的应用程序中启动相机但是一旦意图被触发onActivityResult被解雇了我什至还没有拍照当我拍照时选择它并返回到我的活动onActivityResult根本没有被叫到这是我启动相机的方法 Package
使用 Visual Studio 构建伪语言 (qps-ploc) 附属程序集

我已经生成了应用程序资源文件的伪本地化版本例如Order Summary and Payment本地化为 O r d e r S u m m a r y a n d P a y m e n t 以便我们可以在获得实际翻译之前测试本地化错误
如何在Reactjs中点击按钮重定向到另一个页面

我想使用 React 创建一个基本的 Web 应用程序我已经实现了创建按钮我想在单击按钮时重定向到另一个页面下面是我的 App js 代码 import React from react import logo from logo s
在Python中使用PIL压缩PNG图像

我有一个用 Selenium Builder 记录的 python 脚本它使用以下命令获取网页的完整浏览器屏幕截图 fileName Screenshot1 png webDriverInstance save screenshot fi
如何将 WooComerceAPI 集成到 React 中？

我想通过 API 在 React 上接收数据到我的网站我按照文档中所述执行了所有操作执行了安装npm install save woocommerce api 使用文档中的参数创建对象http woocommerce github io
无法验证包：727047181.itmsp

我在存档文件后在应用程序商店中上传了构建版本它将在我收到此错误时上传构建版本 1 Apple的Web服务操作不成功 2 无法验证包 727047181 itmsp 3 错误 ITMS 9000 无法更改捆绑包标识符的当前值 ue com
使用 PHP 从 Google Chrome 书签导出中提取数据

我想将我的 google chrome 书签放入数据库所以我的第一步是使用 PHP 从 chrome 导出 html 文件并将数据放入变量中我希望获得一些能够运行的 PHP 代码下面的数据它会将 URL ADD DATE ICON 和
无法通过管道以自定义方式重命名下载的图像

我使用 python 的 scrapy 模块创建了一个脚本从 torrent 站点下载并重命名电影图像并将它们存储在 scrapy 项目内的文件夹中当我按原样运行脚本时我发现它正确地下载了该文件夹中的图像此时脚本正在使用 req

无法通过管道以自定义方式重命名下载的图像

无法通过管道以自定义方式重命名下载的图像 的相关文章

随机推荐

热门标签

无法通过管道以自定义方式重命名下载的图像的相关文章