Scrapy 抓取 div 具有多个类?

2024-03-05

我正在尝试使用“产品”类来获取 div。问题是,一些具有“product”类的 div 也具有“product-small”类。所以当我使用xpath('//div[@class='product']'),它仅捕获具有一个类的 div,而不捕获多个类的 div。我怎样才能用 scrapy 做到这一点?

Example:

  • 渔获:<div class='product'>
  • 没有抓住:<div class='product product-small'>

这也可以解决xpath。你只需要使用contains() https://developer.mozilla.org/en-US/docs/Web/XPath/Functions/contains:

//div[contains(concat(' ', normalize-space(@class), ' '), ' product ')]

虽然,是的,CSS selector选项更加紧凑和可读。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Scrapy 抓取 div 具有多个类? 的相关文章