如何提取div标签中的强元素

2024-02-28

我是网络抓取新手。我正在使用 Python 来抓取数据。 有人可以帮助我如何从以下位置提取数据:

<div class="dept"><strong>LENGTH:</strong> 15 credits</div>

我的输出应该是 LENGTH:15 credits

这是我的代码:

from urllib.request import urlopen
from bs4 import BeautifulSoup 

length=bsObj.findAll("strong")
for leng in length:
    print(leng.text,leng.next_sibling)

Output:

DELIVERY:  Campus
LENGTH:  2 years
OFFERED BY:  Olin Business School

但我只想有长度。

网站:http://www.mastersindatascience.org/specialties/business-analytics/ http://www.mastersindatascience.org/specialties/business-analytics/


您应该稍微改进您的代码以找到strong元素by text:

soup.find("strong", text="LENGTH:").next_sibling

或者,对于多个长度:

for length in soup.find_all("strong", text="LENGTH:"):
    print(length.next_sibling.strip())

Demo:

>>> import requests
>>> from bs4 import BeautifulSoup
>>>
>>> url = "http://www.mastersindatascience.org/specialties/business-analytics/"
>>> response = requests.get(url)
>>> soup = BeautifulSoup(response.content, "html.parser")
>>> for length in soup.find_all("strong", text="LENGTH:"):
...     print(length.next_sibling.strip())
... 
33 credit hours
15 months
48 Credits
...
12 months
1 year
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何提取div标签中的强元素 的相关文章

随机推荐

  • VBA/VB6 中的 NaN 测试

    我使用 VBA 将字节数组中的 8 字节浮点数加载到 Double 中 有些数字将为 IEEE 754 NaN 即 如果您尝试使用 Debug Print 打印它 您将看到 1 QNAN 我的问题是 如何测试 Double 中包含的数据是否
  • Python pandas 将带时区的 unix 时间戳转换为日期时间

    我有一个数据框 df pd DataFrame unix utc ts 1503007204222 1503007210206 1503007215121 1503007220475 tz 0000 0100 CEST EEST 我想将 u
  • multipart/form-data,字段的默认字符集是什么?

    如果没有给出字符集 应该使用什么默认编码来解码多部分 表单数据 RFC2388 规定 4 5 表单数据中文本的字符集 多部分 表单数据的每个部分都应该有一个内容 类型 如果字段元素是文本 则字符集 文本参数表示使用的字符编码 例如 带有一个
  • 如何在 Angular2 中对复选框进行单元测试

    我有一个用 Angular2 编写的复选框示例代码
  • 运行时:无法创建新的操作系统线程

    在54核机器上 我使用os Exec 生成数百个客户端进程 并使用大量的 goroutine 来管理它们 有时 但并非总是 我会得到这样的信息 runtime failed to create new OS thread have 1306
  • 给定一个不带空格的短语,添加空格以构成正确的句子

    这就是我的想法 但它是 O n 2 例如 输入是 Thisisawesome 我们需要检查添加当前字符是否会使旧的搜索结果变得更长且有意义 但为了看到我们需要备份的地方 我们必须一直遍历到起点 例如 awe 和 some 是合适的词 但 a
  • ReferenceError:WScript 未定义

    我希望使用 Javascript 执行以下操作 这是我的完整 JS 文件 test js var xo WScript CreateObject Msxml2 XMLHTTP var xa WScript CreateObject ADOD
  • 我如何根据键值将 python dict 排序到嵌套列表

    我有一个嵌套字典 d records name abhi age 23 dept cse name anu age 20 dept ece name ammu age 25 dept cse name anju age 26 dept ec
  • MySQL 对索引 TIMESTAMP 列使用文件排序

    我有一个拒绝使用索引的表 它总是使用文件排序 该表是 CREATE TABLE article ID int 11 NOT NULL AUTO INCREMENT Category ID int 11 DEFAULT NULL Subcat
  • Node.js:req.params 与 req.body

    我一直在将几个不同教程中的代码拼凑在一起 使用 Node express Angular 和 mongodb 使用 MEAN 堆栈构建一个基本的待办事项应用程序 一篇教程介绍了为 GET POST 和 DELETE 操作创建 api 但忽略
  • 如何使用 PhpWord 读取 Doc 文件?

    最近我下载了从github下载的php word 但我不知道如何通过这个读取word文件 该库中没有任何帮助 我看到一个与 php excel b 相同的文件 但不知道如何使用 以下文件 simple01 example php
  • Keras:具有多个参数的 Lambda 层函数

    我正在尝试写一个LambdaKeras 中调用函数的层connection 运行一个循环for i in range 0 k where k作为函数的输入 connection x k 现在 当我尝试调用功能 API 中的函数时 我尝试使用
  • 在 javascript 中创建可调整大小/可拖动/旋转视图

    我一直在尝试用 Javascript 创建这样的东西 正如您所看到的 容器可以被拖动 旋转和调整大小 大多数事情都工作正常 但是旋转容器时调整容器大小会产生奇怪的输出 我预计这会发生 相反 我得到这个 这是完整的代码 https jsfid
  • Swift 3 错误:“另请参阅”标注未显示

    我刚刚将我的项目迁移到 Swift 3 发现快速帮助中的 另请参阅 标注没有显示 在 Swift 的早期版本中 一切都运行得很好 下面是我的代码 Adds a See also callout in the Quick Help for a
  • 无表单方法的 POST (PHP)

    有没有什么方法可以使用 POST 方法而不使用表单将内容从一个页面传递到另一个页面 就像在 get 中一样 你可以只附加一个 与您想发送的任何内容一起 你能为帖子做点什么吗 我还阅读了另一篇文章 其中提到要使用会话 但会话会以 cookie
  • UITableView 使用 UIRefreshControl 拖动距离

    我在 UITableView 上实现 UIRefreshControl 时遇到一些麻烦 一切工作正常 除了我必须滚动屏幕的 80 之类的内容才能触发 UIRefreshControl 有时我什至无法触发它 因为屏幕底部有一个选项卡栏 当手指
  • window.location.assign(“链接”),不起作用

    这是 JavaScript 代码
  • 如何使用 htaccess 分割 URL

    例如 google com en game game1 html应该google com index php p1 en p2 game p3 game1 html 我怎样才能分割URL并发送index php 部分 仅当查询参数具有固定长
  • :host-context 在 Lit-Element Web 组件中未按预期工作

    我有两个 Lit element Web 组件 一个是units list 其中包含许多units list item元素 这units list item元素有两种不同的显示模式 紧凑和详细 由于列表元素支持无限滚动 因此可能包含数千个单
  • 如何提取div标签中的强元素

    我是网络抓取新手 我正在使用 Python 来抓取数据 有人可以帮助我如何从以下位置提取数据 div class dept strong LENGTH strong 15 credits div 我的输出应该是 LENGTH 15 cred