如何在Scrapy中迭代div？

2024-04-16

这可能是一个非常微不足道的问题，但我是 Scrapy 的新手。我试图找到问题的解决方案，但我只是看不出这段代码有什么问题。

我的目标是废弃给定网站上的所有歌剧节目。每个节目的数据都位于一个具有“row-fluid row-performance”类的 div 中。我试图迭代它们以检索它，但它不起作用。它为我提供了每次迭代中第一个 div 的内容（我得到了 19 倍相同的节目，而不是不同的项目）。

import scrapy
from ..items import ShowItem

class OperaSpider(scrapy.Spider):
    name = "opera"
    allowed_domains = ["http://www.opera.krakow.pl"]
    start_urls = [
        "http://www.opera.krakow.pl/pl/repertuar/na-afiszu/listopad"

    ]


    def parse(self, response):
        divs = response.xpath('//div[@class="row-fluid row-performance    "]')
        for div in divs:
            item= ShowItem()
            item['title'] = div.xpath('//h2[@class="item-title"]/a/text()').extract()
            item['time'] = div.xpath('//div[@class="item-time vertical-center"]/div[@class="vcentered"]/text()').extract()
            item['date'] = div.xpath('//div[@class="item-date vertical-center"]/div[@class="vcentered"]/text()').extract()
            yield item

尝试更改 for 循环内的 xpaths.//。也就是说，只需在双反斜杠前面加一个点即可。您也可以尝试使用extract_first()代替extract()看看这是否会给你带来更好的结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在Scrapy中迭代div？的相关文章

LibreOffice 并行将 .docx 转换为 .pdf 效果不佳

我有很多 docx 文件需要转换为 pdf 将它们一一转换需要很长时间所以我编写了一个 python 脚本来并行转换它们 from subprocess import Popen import time import os os chdi
为什么我的混淆矩阵只返回一个数字？

我正在做二元分类每当我的预测等于事实时我发现sklearn metrics confusion matrix返回单个值难道没有问题吗 from sklearn metrics import confusion matrix print
如何删除 PyCharm 中的项目？

如果我关闭一个项目然后删除该项目文件夹则在 PyCharm 重新启动后会再次创建一个空的项目文件夹只需按顺序执行以下步骤即可他们假设您当前在 PyCharm 窗口中打开了该项目单击文件 gt 关闭项目关闭项目在 PyCha
定义Python源代码编码的正确方法

PEP 263 http www python org dev peps pep 0263 定义如何声明Python源代码编码通常 Python 文件的前两行应以以下内容开头 usr bin python coding
如何为未捕获的异常处理程序编写单元测试

我有一个函数可以捕获uncaught例外情况如下有没有办法编写一个单元测试来执行uncaught exception handler 功能正常但测试正常退出 import logging def config logger logge
如何调整 matplotlib 单选按钮的大小和纵横比？

我已经尝试了几个小时来使简单的单选按钮列表的大小和纵横比正确但没有成功首先导入模块 import matplotlib pyplot as plt from matplotlib widgets import RadioButtons
将 C++ 指针作为参数传递给 Cython 函数

cdef extern from Foo h cdef cppclass Bar pass cdef class PyClass cdef Bar bar def cinit self Bar b bar b 这总是会给我类似的东西 Can
使用 Python 3 动态插入到 sqlite

我想使用 sqlite 写入多个表但我不想提前手动指定查询有数十种可能的排列例如 def insert sqlite tablename data list global dbc dbc execute insert into tab
python array(10,1) 和 array(10,) 之间的区别

我正在尝试将 MNIST 数据集加载到数组中当我使用 X train y train X test y test mnist load data 我得到一个数组 y test 10000 但我希望它的形状为 10000 1 数组 1000
如何在 Python 中的函数入口、内部和退出处进行日志记录

我希望能够使用 Python 日志记录工具在我的代码中进行简单且一致的日志记录我能够执行以下操作我希望所有现有未来的模块和函数都有输入和完成日志消息我不想添加相同的代码片段来定义日志记录参数如下所示don t want t
Python 2 的 `exceptions` 模块在 Python3 中丢失了，它的内容到哪里去了？

一位朋友提到对于 Python 2 假设您在命令行上的路径环境变量中有它 pydoc exceptions 非常有用知道它应该可以为他每周节省几分钟的网络查找时间我自己每周都会用谷歌搜索一次例外层次结构所以这对我来说也是一个有用的提
为什么这个 if 语句会导致语法错误

我正在尝试设置一个 elif 语句如果用户按下 Enter 键代码将继续但是我不断遇到语法错误 GTIN 0 while True try GTIN int input input your gtin 8 number if len
无法在 PyCharm 版本 9.3.3 中安装 NumPy。 Python版本3.8.2

在 PyCharm 中安装 NumPy 时出错尝试安装 Microsoft Visual C 14 0 还是行不通 NumPy 正在通过命令安装pip3 install numpy在 cmd 终端中但是当尝试将其安装在 PyCharm
numpy polyfit 中使用的权重值是多少以及拟合误差是多少

我正在尝试对 numpy 中的某些数据进行线性拟合 Ex 其中 w 是该值的样本数即对于点 x 0 y 0 我只有 1 个测量值该测量值是2 2 但对于这一点 1 1 我有 2 个测量值值为3 5 x np array 0 1 2 3
仅允许正小数

在我的 Django 模型中我创建了一个如下所示的小数字段 price models DecimalField u Price decimal places 2 max digits 12 显然价格为负或零是没有意义的有没有办法将小数
寻找完美的正方形

我有这个Python代码 def sqrt x ans 0 if x gt 0 while ans ans lt x ans ans 1 if ans ans x print x is not a perfect square return
django jet 中的自定义徽标

我目前正在尝试对 django 管理面板的皮肤进行一些定制以使其更符合我们的品牌目前我们使用 django jet 来美化管理面板 django jet 可以自定义 css html 吗所有评论都说我应该更改一些 html 文件但我
如何绘制更大的边界框和仅裁剪边界框文本 Python Opencv

我正在使用 easyocr 来检测图像中的文本该方法给出输出边界框输入图像如下所示 Image 1 Image 2 使用下面的代码获得输出图像 But I want to draw a Single Bigger bounding bo
如何使用xlwt设置文本颜色

我无法找到有关如何设置文本颜色的文档在 xlwt 中如何完成以下操作 style xlwt XFStyle bold font xlwt Font font bold True style font font background col
描述符“join”需要“unicode”对象，但收到“str”

代码改编自here http wiki geany org howtos convert camelcase from foo bar to Foo Bar def lower case underscore to camel case s

随机推荐

在界面中强制执行“等于”

我有一个接口我希望实现该接口的每个人都实现一个重写的等于方法有没有办法确保这种情况发生我猜想发生这种情况的方式是实现我的接口的类将自动从 Object 获取 equals 从而使接口满意不你只能创建一个抽象类而不是像这样的
使用服务器端脚本 (PHP) 创建 SVG 图形

有没有办法使用 PHP 脚本生成 HTML 文件该脚本嵌入了 SVG 其中 SVG 本身是由 PHP 脚本动态生成的基本上我想向客户端显示动态生成的 SVG 图像但是也仅引用外部源而 PHP 仅生成当前 HTML 页面而不是外
Rails：语法错误，意外的keyword_ensure，期望$end

我正在创建一个非常基本的 Rails 应用程序学习教程但无法理解为什么会出现此错误我已尝试排除故障但无济于事 My code ul class nav pull right li li li li li li ul
如何将操作栏与 Xamarin 和 MvvmCross 一起使用

我看到 Xamarin 最近作为组件发布http components xamarin com view xamandroidsupportv7appcompat http components xamarin com view xaman
如何更新 C# 和 SQL Server 中的值？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这是我的程序应该更新包含 3 列的表中的分数 id nickname scor Otherform id1 is the id需要更新的
Docker for ARM64 (Raspberry Pi 4) 上的 Android SDK 用于构建 APK

我正在尝试创建一个ARM64 Docker 镜像它能够构建我的 React Native 应用程序的 apk 文件背景为了练习目的我使用 5 个 Raspberry Pi 4 板构建了一个 Kubernetes 集群一切工作正常 J
按数组类型查询 - MongoDB

我必须按类型查询我的 mongoDB 集合假设我有这两个文件hello收藏 id ObjectId 56684ee0f597654b99d0d636 name Scrooge surname McDuck address road Mon
如何在 Python 中发送包含一些非 ASCII 字符的电子邮件？

我正在使用 Python 3 7 并尝试使用 smtplib 发送电子邮件只要消息不包含任何土耳其字符例如我的脚本就可以完美运行到目前为止我发现的唯一可行的解决方案是使用 string string encode ascii ig
设置 UIPopOverController 大小

我有一个view里面有一堆按钮UIScrollView 当用户按下按钮时我希望显示一个 UIPopOverController 指向所选按钮它有点工作但是弹出窗口的大小错误并且指向视图中的随机点这是我的代码 void detail
如何将 Maven 存储库 jar 添加到 Eclipse 构建路径？

从 Eclipse 中我可以在 Maven 存储库视图中看到所有必需的 jar 但我有大约 100 个缺少 jar 文件的错误所以我设置了 M2 REPO 环境变量我已经从命令行运行了 mvn eclipse eclipse 命令当
WINAPI 带有自定义边框的编辑控件

在纯 WinAPI 无 MFC 中实现编辑控件的自定义圆形边框的正确方法是什么我需要像这样的边框编辑我应该子类化编辑控件并在 WM NCPAINT 或类似的东西中进行自定义绘画吗我想你有两个选择正如你所说你可以子类化并覆盖WM N
从 Django 调用 Scrapy Spider

我有一个项目在同一工作区中包含 django 和 scrapy 文件夹 my project django project django project settings py app1 app2 manage py scrapy pro
循环日期范围

在Python3中我可以像这样循环遍历一系列日期 import datetime dt0 datetime datetime 2017 1 1 0 0 0 dt1 datetime datetime 2017 1 5 0 0 0 dt d
Spring @Async 限制线程数

我的问题与这个非常相似 Async 阻止一个线程继续执行直到其他线程完成 https stackoverflow com questions 4324212 async prevent a thread to continue until
Discord 机器人添加对消息的反应discord.py（无自定义表情符号）

我一直在尝试使用discord py创建一个机器人在阅读后使用discord py添加对消息的反应this https stackoverflow com questions 48982061 how do you have a bot
xamarin.forms 中的导航如何工作？

由于我在 android 中的应用程序中使用 xamarin forms 因此我必须从一个页面导航到另一个页面我的问题是从一个页面导航到另一页面是否会将其添加到导航堆栈中例如如果我的应用程序有导航例如第1页 gt 第2页 gt 第
if (static_cast(x)) 与 if (x)

我有一位同事经常在条件语句中对 bool 进行显式强制转换如下所示 SomeType ptr some value if static cast
如何在aspx页面中的javascript中读取web.config中的值

我在 aspx 文件中有一段 javascript 代码在我的脚本函数中我尝试从 web config 读取 SiteRootURL 值如下所示 var k alert k 这是行不通的当我添加上面的代码时我的 aspx 页面顶部
.NET 3.5 处置注册表项

我有以下代码 RegistryKey installKey Registry LocalMachine OpenSubKey installKey 我正在我的代码上运行静态分析工具它给了我一个缺陷说我从方法中返回而没有处理安装密钥我知
如何在Scrapy中迭代div？

这可能是一个非常微不足道的问题但我是 Scrapy 的新手我试图找到问题的解决方案但我只是看不出这段代码有什么问题我的目标是废弃给定网站上的所有歌剧节目每个节目的数据都位于一个具有 row fluid row performanc

如何在Scrapy中迭代div？

如何在Scrapy中迭代div？ 的相关文章

随机推荐

热门标签

如何在Scrapy中迭代div？的相关文章