我收到 AttributeError: 'HtmlResponse' object has no attribute 'xpath' in scrapy

2024-02-23

我是 scrapy 的新手，我正在使用Scrapy 0.14.4。我只想按照以下示例打印标题和链接。

这是我的蜘蛛：

from scrapy.spider import BaseSpider

class XxxSpider(BaseSpider):
    name = "xxx"
    allow_domains = ["xxx.xxx.xxx"]
    start_urls = ["http://xxx.xxx.com/jobs/"]


    def parse(self, response):
        for sel in response.xpath("//div[@id='job_listings']/a"):
            title = sel.xpath('./text()').extract()
            link = sel.xpath('./@href').extract()
            print title, link

这其中缺少什么？

问题是您使用的是旧版本的 Scrapy，其中选择器未包含在响应对象中。要验证这一点，请查看相关文档：http://doc.scrapy.org/en/0.14/topics/request-response.html http://doc.scrapy.org/en/0.14/topics/request-response.html

要解决您的问题，请将响应包装到选择器中，然后您可以使用xpath选择器上的函数：

from scrapy.selector import HtmlXPathSelector 
def parse(self, response):
    hxs = HtmlXPathSelector(response)
    for sel in hxs.select("//div[@id='job_listings']/a"):

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

xpath

Scrapy

我收到 AttributeError: 'HtmlResponse' object has no attribute 'xpath' in scrapy 的相关文章

通过 add_subplot 添加子图后如何共享轴？

我有一个像这样的数据框 df pd DataFrame A 0 3 0 2 0 5 0 2 B 0 1 0 0 0 3 0 1 C 0 2 0 5 0 0 0 7 D 0 6 0 3 0 4 0 6 index list abcd A B
使用 Python Multiprocessing Pool.map() 的问题在 Python 3.7.2 中变得棘手，但在 3.6.2 中很快完成

我刚刚将Python从3 6 2 gt 3 7 2并且遇到了问题multiprocessing图书馆我在 Django 应用程序中使用它该应用程序在工作函数中使用 Django 特定的函数见下文在我的代码中我有以下内容 impor
在Python中，如何将矩阵逆时针旋转90度？

gt gt gt def rotate matrix k List List int For example if I have m 1 2 3 2 3 3 5 4 3 rotate matrix m should give me 3 3
str.translate 与 str.replace - 何时使用哪一个？

何时以及为什么使用前者而不是后者反之亦然目前尚不完全清楚为什么有些人使用前者以及为什么有些人使用后者它们有不同的目的 translate只能用任意字符串替换单个字符但一次调用可以执行多次替换它的参数是一个特殊的表它将单个字符映射
如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th
键入的完整命令行

我想获得输入时的完整命令行 This join sys argv 在这里不起作用删除双引号另外我不想重新加入已解析和拆分的内容有任何想法吗你太迟了当键入的命令到达 Python 时您的 shell 已经发挥了它的魔力例如引
来自 pandas 数据帧的烛台图，用日期替换索引

此代码给出了带有移动平均线的烛台图但 x 轴位于索引中我需要 x 轴位于日期中需要做什么改变 import numpy as np import pandas as pd import matplotlib pyplot as plt
Flask 失败并显示“错误：导入‘X’时，引发了 ImportError”，但不显示错误。如何找到错误的根源？

当使用以下命令启动 Flask 应用程序时 flask run 我收到错误 Error While importing wsgi an ImportError was raised Usage flask OPTIONS COMMAND A
Python - Unicode 到 ASCII 的转换

我无法在不丢失数据的情况下将以下 Unicode 转换为 ASCII u ABRA xc3O JOS xc9 I tried encode and decode他们不会这么做有人有建议吗 Unicode 字符u xce0 and u xc
如何用正则表达式替换多个匹配/组？

通常我们会编写以下内容来替换一场比赛 namesRegex re compile r is life re I replaced namesRegex sub r butter There is no life in the void pr
更改 Matplotlib 投影轴的背景颜色

我正在尝试使用 Cartopy 创建一个图形该图形需要在未投影的轴上绘制投影轴这是一个尽可能简单的代码版本它将轴上的内容替换为背景颜色 import matplotlib pyplot as plt import cartopy cr
Python-验证我的文档 xls 中是否存在工作表

我正在尝试在空闲时间设计一个小程序加载 xls 文件然后在要扫描的文档中选择一张纸步骤1 用户导入 xls文件导入程序后检查文件是否存在我能做到的第 2 步我要求用户提供要分析的文档表 xls 的名称这就是它停止的地方该程
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
如何按 pandas 中的值对系列进行分组？

我现在有一只熊猫Series与数据类型Timestamp 我想按日期对其进行分组并且每组中有许多行具有不同的时间看似显而易见的方法类似于 grouped s groupby lambda x x date 然而熊猫的groupby按索
如何通过 Python Requests 库使用基本 HTTP 身份验证？

我正在尝试在 Python 中使用基本的 HTTP 身份验证我正在使用Requests https docs python requests org 图书馆 auth requests post http hostname auth HT
从迭代器外部将 StopIteration 发送到 for 循环

有几种方法可以打破一些嵌套循环他们是 1 使用中断继续 for x in xrange 10 for y in xrange 10 print x y if x y gt 50 break else continue only exec
如何创建用于霍夫曼编码和解码的树？

对于我的作业我将对霍夫曼树进行编码和解码我在创建树时遇到问题并且陷入困境不要介意打印语句它们只是让我测试并查看函数运行时的输出是什么对于第一个 for 循环我从主块中用于测试的文本文件中获取了所有值和索引在第二个 for 循
是否可以使用 Anaconda 包作为 Google Cloud Functions 的依赖项？

我正在使用 Python 运行时编写 Google Cloud Function 我需要包含一些无法使用的依赖项pip 如文档中所述here https cloud google com functions docs writing spe
Python 相当于 Scala 案例类

Python 中是否有与 Scala 的 Case Class 等效的东西就像自动生成分配给字段而无需编写样板的构造函数一样当前执行此操作的现代方法从 Python 3 7 开始是使用数据类 https www python org
为boost python编译的.so找不到模块

我正在尝试将 C 代码包装到 python 中只需一个类即可导出两个函数我编译为map so 当我尝试时import map得到像噪音一样的错误 Traceback most recent call last File

随机推荐

在 Ruby 中，术语“元类”、“特征类”和“单例类”完全是同义且可替换的吗？

的文档Class http www ruby doc org core 2 1 2 Class html类有一个涉及元类的令人难以置信的混乱图我试图揭开这里到底发生了什么的神秘面纱这三个词都是元类特征类单例类同义 in Ru
什么是snakemake元数据文件？我什么时候可以删除那些？

我注意到我的备份 rsync 脚本花费了相当多的时间从以下位置复制具有随机名称的内容 snakemake metadata文件夹这些文件有什么用在 Snakemake 运行完成后我可以安全地删除它们吗或者它们对于 Snakemake
从 jar 文件加载图像

我有一个可以在 Netbeans IDE 中完美运行的应用程序但是当从 dist 目录中的 jar 文件运行时不会加载必要的图像我花了 1 1 2 天阅读这个论坛和其他论坛试图找到答案但我无法让 jar 图像工作这是我的代码的摘
C# 和 SQL Server 中的 DateTimeOffset 解析

文档指出 NET 和 SQL Server 中的分辨率均为 100 纳秒 DateTimeOffset 值的时间部分以 100 纳秒为单位称为刻度进行测量 C 精度 100 纳秒 SQL服务器然而 SQL 似乎删除了最后一位数字例如
循环内导入模块

我有一个文件我们称之为 foo py 它执行一些操作包括通过串行端口发送一些数据并通过电子邮件发送返回的响应我有另一个文件看起来像这样 iteration 0 while True iteration 1 do some stuff
在不使用外部 gem 的情况下将文件上传到 db Rails 3

我有一个任务我需要在 Rails 3 2 中上传一个文件 txt 而不使用任何外部 gem 来完成腿部工作恐怕是不可协商的该文件还需要保存到数据库中我有以下代码但是当我尝试使用表单上传创建新附件时它会返回错误 No route
使用 --depth 1 进行浅层克隆、创建提交并再次拉取更新是否安全？

The depth 1选项中git clone http git scm com docs git clone 创建一个shallow克隆历史记录被截断为指定数量的修订版浅存储库有许多限制您不能从中克隆或获取也不能从其中推入或推入其中
无法使用 JSF 2.0 重复标记的 varStatus 的“end”属性

我正在使用repeatJSF 2 0 的标签用于循环对象列表并显示它们的一些属性我想使用varStatus的属性repeat这样我就可以访问循环索引最后一个列表项的编号并判断是否已到达列表末尾因此不会显示间隔符我认为这会起作用
安全的客户端脚本

我有一个特殊的要求其中一些关键算法必须在客户端脚本中处理并且必须得到保护使用 javascript 只会公开算法我目前正在评估保护客户端脚本上的算法的方法感谢任何建议和替代方法我正在考虑的一个选择是将一个小小程序下载到本地 PC
使用温莎城堡配置文件是否可以委托给另一个项目声明？

使用 Castle Windsor 是否可以声明一个类型一次并将此声明用于多个 Id 而不是每次都完整地写出来例如我们有实现 IFoo 的 Widget 类并且我们需要键 IFoo A 和 IFoo B 从 Castle 获取 Wid
CSS 优先级和针对特定元素

我的问题应该很简单出于某种原因我今天无法理解它我正在制作一个结构如下的菜单 div class wrapper ul li class menu item a href Menu Item a div class inner a hr
如何实现index-core风格的索引状态monad？

我试图理解中的索引单子index core http hackage haskell org package index core风格我陷入了一个悖论即在构建一些示例之前我无法理解原理而在理解原理之前我无法构建示例我正在尝试构建一个
如何使 TAB 键关闭 TComboBox 而不丢失当前位置？

我的表单上有一个 TComboBox 其 Style 属性设置为 csDropDownList 如果我打开下拉列表并使用鼠标或键盘选择一个选项并按 Enter 键则下拉框将关闭并且在触发 KeyPress 事件处理程序之前更改 Item
使用 rmarkdown 在 pdf 中插入 GIF

我正在使用 rmarkdown 生成 HTML 和 pdf 文件在我的 Rmd 文件中我包含了一个如下所示的 GIF www script gif 当我将其编织为 HTML 时它工作正常 rmarkdown render docume
Xcode 10.3 中缺少模拟器[重复]

这个问题在这里已经有答案了更新到 Xcode 10 3 后我发现我的一些模拟器丢失了尝试从窗口 gt 设备和模拟器手动添加一个会产生错误重新启动计算机对我有用
媒体查询分组而不是多个分散的匹配媒体查询

我正在尝试 LESS 不喜欢 SASS 语法并一直试图找出用它进行媒体查询的最佳方法是什么我通读了this http alwaystwisted com post php s 2012 05 05 everyday im bubblin
LD_LIBRARY_PATH：无法打开共享对象文件[重复]

这个问题在这里已经有答案了我的环境变量有问题LD LIBRARY PATH 当我运行我的垃圾箱时我收到以下错误消息 bignum 加载共享库时出错 liballjoyn so 无法打开共享对象文件没有这样的文件或目录我将我的图书馆添
在 flutter_local_notifications 中添加 mp3 声音

如何在flutter local notification中添加自定义mp3声音有添加自定义铃声的功能但遗憾的是没有文档或示例在android项目中添加raw文件夹 android gt app gt src gt main gt r
MSSQL 链接服务器错误：链接服务器的 OLE DB 提供程序“OraOLEDB.Oracle”为列提供了不一致的元数据

我试图将数据从 Oracle 提取到MSSqlserver使用链接服务器的数据库 select from LINK NAME SCHEMA TABLE 但它失败并出现以下错误链接服务器 LINK NAME 的 OLE DB 提供程序 Or
我收到 AttributeError: 'HtmlResponse' object has no attribute 'xpath' in scrapy

我是 scrapy 的新手我正在使用Scrapy 0 14 4 我只想按照以下示例打印标题和链接这是我的蜘蛛 from scrapy spider import BaseSpider class XxxSpider BaseSpider

我收到 AttributeError: 'HtmlResponse' object has no attribute 'xpath' in scrapy

我收到 AttributeError: 'HtmlResponse' object has no attribute 'xpath' in scrapy 的相关文章

随机推荐

热门标签