无法获取 div 元素内的所有 span 标签 beautifulsoup

2024-07-04

我正在刮这个我需要从中获取工资值,如下所示image https://i.stack.imgur.com/ozPGs.png

我试图做到以下几点:

import requests
from bs4 import BeautifulSoup
result = requests.get("https://wuzzuf.net/jobs/p/xGYIYbJlYhsC-Senior-Python-Developer-Cairo- Egypt?o=1&l=sp&t=sj&a=python|search-v3|hpb")
page = result.content
soup = BeautifulSoup(page, "lxml")
salaries_div = soup.find_all("div",{"class":"css-rcl8e5"})
for span in salaries_div[3].select("span"):
    print (span)

但我只得到这个跨度

<span class="css-wn0avc">Salary<!-- -->:</span>

我的问题是为什么我无法获得 div 内的所有跨度? 在这种情况下我应该怎么做才能获得工资值?


由于 Beautiful Soup 只是一个解析器,用于处理您提供的内容,因此它与页面检索或渲染无关。

我在我的案例中找到的解决方案是使用 selenium 来获取 JS 渲染页面。

工作代码:

from bs4 import BeautifulSoup
from webdriver_manager import driver
from webdriver_manager.chrome import ChromeDriver, ChromeDriverManager
from selenium import webdriver

driver = webdriver.Chrome(ChromeDriverManager().install())
driver.get("https://wuzzuf.net/jobs/p/xGYIYbJlYhsC-Senior-Python-Developer-Cairo-Egypt?o=1&l=sp&t=sj&a=python|search-v3|hpb")

page = driver.page_source
soup = BeautifulSoup(page, "lxml")
salaries_div = soup.find_all("div",{"class":"css-rcl8e5"})
for span in salaries_div[3].select("span"):
    print (span)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

无法获取 div 元素内的所有 span 标签 beautifulsoup 的相关文章

  • 如何在Mandlebrot张量流程序中显示图像。当前输出是

    导入模拟库 import tensorflow as tf import numpy as np 导入可视化 from PIL Image from io import BytesIO from IPython display import
  • Flask:如何从模板目录下提供静态文件?

    我使用 Flask 并想要更改我的资产文件夹目录 这是我的文件夹结构 python static js img font css templates default css js img venv app py 我想移动静态文件夹下的所有文
  • python 中的神经网络:决策/分类总是给出 0.5

    首先我想说我是一个Python初学者 对神经网络也是完全陌生的 当我读到它时 我非常兴奋 并认为我从头开始设置了一些代码 参见下面的代码 但不知怎的 我的代码无法正常工作 我猜想存在一些重大错误 在算法和编程中 但我现在找不到他们 所以 在
  • ipython:如何设置终端宽度

    当我使用ipython terminal并想要打印一个numpy ndarray它有很多列 行会在大约 80 个字符处自动断行 即行的宽度为 cca 80 个字符 z zeros 2 20 print z 据推测 ipython 预计我的终
  • Kivy:如何在树视图中使用 on_key_down 和 on_key_up 键盘事件?

    我在用python 2 7 and kivy 1 10 0 当我点击nameTextInput 然后树视图显示 我希望选择标签up and down键 并且当enter按下键 文本被复制 所选文本被复制到初始表单 就像您单击该项目时当前完成
  • ModuleNotFoundError:没有名为“binance.client”的模块; “binance”不是一个包

    嘿 我是 Stack Over Flow 和 Python 的新手 但想学习并希望有人可以帮助我 我正在尝试在 python 中开发一个币安交易机器人 请参阅下面我的脚本 from binance client import Client
  • 了解 Python 2.7 中 io.open() 方法的缓冲参数

    我试图理解的缓冲参数io open https docs python org 2 library functions html openPython 2 7 中的方法 我在Python解释器中执行 import utils buffer
  • django value_list 外键中所有字段

    我有一个类 它有另一个类的外键 class MyEvent models Model msg models ForeignKey MyMessage event type models IntegerField choices EVENTS
  • BeautifulSoup 3.1 解析器太容易崩溃

    我在使用 BeautifulSoup 解析一些不可靠的 HTML 时遇到了麻烦 事实证明 新版本中使用的 HTMLParser 的容忍度低于以前使用的 SGMLParser BeautifulSoup 有某种调试模式吗 我正在尝试找出如何阻
  • 添加 prefix_with 子句以插入特定类

    我怎样才能定制prefix withSQLAlchemy 中的每个模型类 以便每个模型类都可以有不同的插入语句 我其实想要OR IGNORE子句添加到某些类中 PS 我对 SQLAlchemy 比较陌生 ORM 没有挂钩它的生成方式inse
  • 如何对不同类型的列表进行排序?

    我需要使用 python 3 对列表进行排序 可能有strings integers floats or tuples etc 我目前正在尝试正确使用sort函数使用key参数如下 data sort key gen key def gen
  • id 是 python 中的关键字吗?

    我的编辑器 TextMate 显示id使用与我常用的变量名称不同的颜色 当用作变量名称时 是关键字吗 我不想遮蔽任何关键字 id不是一个keyword在Python中 但它是一个的名字内置功能 http docs python org li
  • 数据集继续使用线性回归而不是决策树模型

    我想在我的数据集上使用决策树模型 但无论我做什么 它都会继续使用线性回归 数据不同 但图表仍然相同 基本上 我编写了线性回归的代码 from sklearn linear model import LinearRegression linr
  • 如何在 setup.py 中运行 Makefile?

    我需要编译ICU http icu project org使用它自己的构建机制 因此问题是 我怎样才能运行一个Makefilesetup py 显然 我只希望它在构建过程中运行 而不是在安装时运行 我通常使用的方法是覆盖有问题的命令 fro
  • 如何让机器人加入语音频道discord.py

    我正在使用 Discord py 创建音乐机器人 但我在将该机器人连接到语音通道时遇到问题 我使用 Cog 将音乐功能与其他功能分开 commands command async def join voice self ctx channe
  • 无法在 Debian lenny 上安装 python 模块“pycrypto”

    我尝试通过下载源代码并执行以下命令来安装 pycrypto 模块python setup py install 然后出现错误 running install running build running build py running bu
  • 在 Python 中访问 Firefox 3 cookie

    我正在尝试制作一个 python 脚本 该脚本将在 Firefox 中使用 cookie 访问网站 如果 cookielib MozillaCookieJar 支持 Firefox 3 它就会工作 有没有办法在 python 中访问 Fir
  • Python 与 Hive 的连接

    我安装了 Hortonworks Hive ODBC 驱动程序并在数据源中创建了连接 我测试了它并且成功了 我安装了PyODBC并编写了以下代码 import os sys pyodbc con pyodbc connect DSN MyC
  • Python Selenium Webdriver - 代理身份验证

    我想将 Selenium Webdriver 与需要用户身份验证的代理一起使用 这可能吗 这就是我到目前为止所拥有的 但我不知道在哪里放置凭据 user pass proxy port from selenium import webdri
  • 您使用哪种 IDE(如果有)构建 python GUI 项目?

    是否有任何 IDE 如 VS 支持拖放来构建 python GUI 连接到数据库等 尽管我是一个 emacs 爱好者 但我发现使用 VS 创建 GUI 更容易 仅对于 GUI 我发现 VisualWx http visualwx alter

随机推荐

  • Windows 上的 Xvfb

    我正在使用 pyvirtualdisplay 使用无头 Firefox 浏览器运行测试 这是我正在使用的代码 from selenium import webdriver from selenium webdriver support ui
  • VB6 的线程模型是什么?

    我正在将一个古老的 VB6 程序移植到 C Net 我不太了解VB6 我问这个是为了更好地理解它 旧的VB6程序有一个程序执行的主过程 但是它also有许多用于套接字事件或计时器事件的事件处理程序 以及这些经常操纵的共享资源 例如 公共全局
  • 如何在CSS中搜索某些内容时隐藏搜索图标

    我想隐藏search当用户搜索某些内容时的图标 连我都想躲起来 保留图标和清除图标x就这样 问题如下图所示 NOTE 我想保持相同的差距search icon and Search text input type search width
  • React:将组件存储在对象中

    我的用户配置文件中有几十个字段 我正在尝试构建一种有效的方法来在适当的输入表单组件中显示它们 例如 配置文件可能如下所示 profile1 name Cornelius Talmadge phone 1 如果我可以像这样堆叠组件 expor
  • 处理本地存储库中的旧快照的最佳方法?

    我们有一个 Nexus 本地存储库管理器 用于处理我们所有的内部项目 以及外部存储库的镜像 对于我们的内部项目 我们只保留最新版本的快照构建 例如 如果我们有 ProjectX 1 0 1 1 和 1 2 SNAPSHOT 那么一旦 1 2
  • 如何使用 OpenID Connect WebFinger 端点?

    正在阅读描述在这里 https connect2id com learn openid connect optional endpoints它说 WebFinger 允许根据给定用户的电子邮件地址或其他一些信息动态发现 OpenID Con
  • 在 Fortran 中分配字符数组

    我必须编写一个可以由 C 和 Fortran 调用的子例程 该子例程将文件名作为其参数之一 我知道为了与 C 良好地互操作 ISO C 绑定建议使用字符数组进行互操作 我的问题是 是否存在易于编写的字符数组文字之类的东西 我有一个这样的子程
  • 使用 Powershell 脚本开始调试 Visual Studio 项目

    我曾经在 Visual Studio 中打开解决方案文件 右键单击项目 选择 调试 gt 启动新实例 来启动调试会话 我可以编写一个 powershell 脚本来自动执行此操作吗 为了让事情变得更简单 自动化不必重建和项目 脚本只需要在 V
  • Grails:未刷新的会话和回滚的事务之间有什么区别?

    我对会话和交易感到非常困惑 我基本上不明白两者都有什么意义 而且我很困惑何时使用其中之一 未刷新的会话和未提交的事务有什么区别 我什至不知道如何询问我不知道的事情 是否有资源可以提供常见会话和事务情况的良好示例 以便我可以看到差异 一般来说
  • Docker 容器中 GUI 应用程序的 X11 转发

    我目前正在尝试在 docker 容器中运行一些 GUI 应用程序 我一直在尝试那些杰西 弗雷泽尔 https github com jessfraz at github https github com jessfraz dockerfil
  • 通过 ref 传递的引用类型和不通过 ref 传递的引用类型

    以不同方式调用 4 种方法时得到不同的结果 static void Main string args var emp new Employee Name ABC ChangeName1 emp Console WriteLine emp N
  • 如何在 Mongoid 中引用嵌入文档?

    使用 Mongoid 假设我有以下类 class Map include Mongoid Document embeds many locations end class Location include Mongoid Document
  • Bootstrap 导航栏覆盖缩放内容

    我正在为导航栏构建一个带有 navbar fixed top 类的网站 它在所有方面都工作正常 除了放大时 当我在移动设备上放大时 导航栏开始换行并在折叠后转到下一行 但是 我不希望导航栏在放大时受到影响 但同时保持对不同设备的响应能力 这
  • Spreadsheet.getNamedRanges() 不返回 DELETED 工作表中定义的 NamedRanges

    我有一个复杂的电子表格 其中每个选项卡都有许多在不同工作集中定义的命名范围 例如 Tab A Tab B Tab X 我试图将此电子表格分解为较小的独立电子表格 假设独立电子表格 1 只有 Tab A Tab B 方法是首先复制原始大型电子
  • 在另一种形式的成功回调中使用 AngularJS 和 bluimp 上传文件

    我已遵循下列的 http code like a poem blogspot co il 2013 05 angularjs tutorial 4 file upload using html教程 以便将臭名昭著的 bluimp jQuer
  • java.lang.VerifyError:需要堆栈图框架

    有没有办法将自定义 HttpServlet 加载到 GAE 我上传了一个项目 其中包含 server 包中的 HttpServlet 并将其添加到 web xml 中
  • 如何在 razor 中创建 JavaScript 字符串

    我看过一些关于这个主题的帖子和一些博客 但似乎没有提到我得到的输出 我想要的是生成一个带有信息的谷歌地图 手动输入信息会产生正确的信息 所以这部分有效 当我要使用包含我想要在地图上显示的信息的字符串动态创建 JavaScript 数组时 我
  • 在 PL/SQL 过程中,如何将表名作为参数传递?

    CREATE PROCEDURE A tab IN table AS BEGIN INSERT INTO tab VALUES 123 END A 我怎样才能指定参数tab是表名吗 你不能 相反 您需要将其作为 VARCHAR2 字符串传递
  • Bash 脚本:Gzip 整个文件夹并保持文件扩展名相同[关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 我想递归地对文件夹中的每个文件进行 gzip 压缩 并在压缩后保留原始名称和扩展名 我尝试过 sudogzip 9 r folder但是现在每个文件都
  • 无法获取 div 元素内的所有 span 标签 beautifulsoup

    我正在刮这个我需要从中获取工资值 如下所示image https i stack imgur com ozPGs png 我试图做到以下几点 import requests from bs4 import BeautifulSoup res