如何通过匹配 BeautifulSoup 中元素属性中的文本来获取元素

2023-12-01

我有这个代码

<a title="Next Page - Results 1 to 60 " href="bla bla" class="smallfont" rel="next">&gt;</a>

我想抓住a元素并获取 href 。

我怎样才能匹配title属性与Next Page

我想部分匹配标题属性中的文本a元素。

有许多a页面上的标签与其类似，但唯一的区别是title属性包含"Next Page或者文本是>.

您必须使用正则表达式来完成您想要的事情。

首先将整个标记作为字符串并制作BeautifulSoup反对它。

然后使用.findAll的方法BeautifulSoup对象如下

import BeautifulSoup
import re

soup = BeautifulSoup('<a title="Next Page - Results 1 to 60 " href="bla bla" class="smallfont" rel="next">&gt;</a>')

elements = soup.findAll('a', {'title':re.compile('Next Page.')}) 
# get all 'a' elements with 'title' attribute as 'Next Page something' into a list

for e in elements:
    if str(e.string) == '>' or e.string == '&gt;': # check if string inside 'a' tag is '>'
        print e['href']

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

beautifulsoup

如何通过匹配 BeautifulSoup 中元素属性中的文本来获取元素的相关文章

如何使用 pyinstaller 包含文件？

我也使用 tkinter 使用 python 3 7 编写了一个程序由于我使用的是外部图片因此当我将所有内容编译为一个 exe 时我需要包含它们我试过做 add data bg png files 但我仍然收到此错误 tkinter
Python有条件求解时滞微分方程

我在用dde23 of pydelay包来求解延迟微分方程我的问题如何有条件地编写方程例如目标方程有两个选项 when x gt 1 dx dt 0 25 x t tau 1 0 pow x t tau 10 0 0 1 x othe
Python 2.7 将比特币私钥转换为 WIF 私钥

作为一名编码新手我刚刚完成了教程教程是这样的 https www youtube com watch v tX XokHf nI https www youtube com watch v tX XokHf nI 我想用 1 个易于阅读
Python从int到string的快速转换

我正在用 python 求解大量阶乘并发现当我完成计算阶乘时需要相同的时间才能转换为字符串以保存到文件中我试图找到一种将 int 转换为字符串的快速方法我将举一个计算和 int 转换时间的例子我正在使用通用的 a str a 但感
如何使用显式引用转储 YAML？

递归引用非常适合ruamel yaml or pyyaml ruamel yaml dump ruamel yaml load A A id001 id001 然而它显然不适用于普通引用 ruamel yaml dump ruamel
了解 Python 中的酸洗

我最近接到一项作业需要以腌制形式放置一本字典其中每个键引用一个列表唯一的问题是我不知道腌制形式是什么谁能给我指出一些好的资源的正确方向来帮助我学习这个概念 pickle 模块实现了一个基本但强大的算法用于序列化和反序列化 Pyth
更新 Sqlalchemy 中的多个列

我有一个在 Flask 上运行的应用程序并使用 sqlalchemy 与数据库交互我想用用户指定的值更新表的列我正在使用的查询是 def update table value1 value2 value3 query update T
更改 python tkinter canvas 中的线坐标

我画了一条线tkinter Canvas现在我想移动一端这可能吗例如和itemconfig import tkinter tk tkinter Tk canvas tkinter Canvas tk canvas pack line c
WindowsError：[错误 126] 使用 ctypes 加载操作系统时

python代码无法在Windows 7平台上运行 def libSO lib ctypes cdll LoadLibrary ConsoleApplication2 so lib cfoo2 1 3 当我尝试运行它时得到来自python
Python Fabric - 未找到主机。请指定用于连接的（单个）主机字符串：

如何获取找不到主机请指定用于连接的单个主机字符串面料如何解决 def bootstrap host ec2 54 xxx xxx xxx compute 1 amazonaws com env hosts host env use
python是带有字符串的运算符行为[重复]

这个问题在这里已经有答案了我无法理解以下行为我正在创建 2 个字符串并使用 is 运算符来比较它对于第一种情况它的工作方式有所不同对于第二种情况它按预期工作当我使用逗号或空格时它显示是什么原因False与比较is当没有使用
与 while 循环一样，如何跳过 for 循环中的步骤？

我尝试像 while 循环一样跳过 for 循环中的几个步骤在 while 循环中步骤根据特定条件进行调整如下面的代码所示 i 0 while i lt 10 if i 3 i 5 else print i i i 1 result
Python 惰性迭代器

我试图了解迭代器表达式如何以及何时被求值以下似乎是一个懒惰的表达 g i for i in range 1000 if i 3 i 2 然而这个在构造上失败了 g line strip for line in open xxx r if
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
是否可以将 pd.Series 分配给无序 pd.DataFrame 中的列而不映射到索引（即不重新排序值）？

在 Pandas 中创建或分配新列时我发现了一些意外的行为当我对 pd DataFrame 进行过滤或排序从而混合索引然后从 pd Series 创建新列时 Pandas 会重新排序该系列以映射到 DataFrame 索引例如 d
检测 IDLE 的存在/如何判断 __file__ 是否未设置

我有一个脚本需要使用 file 所以我了解到 IDLE 没有设置这个有没有办法从我的脚本中检测到 IDLE 的存在 if file not in globals file is not set 如果你想做一些特别的事情 file 未设置
为什么 smtplib.SMTP().sendmail 不发送 DKIM 签名邮件

我已经在服务器上设置了 postfix 以及 openDKIM 当我跑步时 echo Testing setup mail s Postfix test my email address 我收到电子邮件邮件标题中有一个DKIM Signa
如何循环遍历字典列表并打印特定键的值？

我是 Python 新手有一个问题我知道这是一个非常简单的问题运行Python 3 4 我有一个需要迭代并提取特定信息的列表以下是列表称为部分的示例已截断数千个项目 state DEAD id phwl type name
python sklearn中的fit方法

我问自己关于 sklearn 中拟合方法的各种问题问题1 当我这样做时 from sklearn decomposition import TruncatedSVD model TruncatedSVD svd 1 model fit X

随机推荐

隐藏/显示的 AsyncFileUpload 控件不会触发服务器端 UploadedComplete 事件

我最近在最新版本 3 0 40412 的 ASP Net Ajax Control Toolkit 中发现了 AsyncFileUpload 控件在稍后显示的隐藏控件中使用它时似乎存在问题例如 div 标记为visible false
如何在JSF中创建h:commandButton来打开新页面

我想在 JSF 页面中创建命令按钮当我按下它时我想打开一个新页面并使用 http 发送一个值我测试了这个h commnadButton但它不起作用
如何“压缩”或“旋转”可变数量的列表？

如果我有一个包含任意数量列表的列表如下所示 var myList new List
HikariCP 与 PostgreSQL：setQueryTimeout(int) 尚未实现

我尝试将 HikariCP 与 PostgreSQL 一起使用但它不起作用它抛出一个异常 WARN 2014 10 24 14 38 54 195 com zaxxer hikari pool HikariPool Exception
为什么使用 python selenium 执行_script("return document.body.scrollHeight") 返回0

在此输入图像描述下面是我的Python代码 get 运作良好但表演完之后execute script return document body scrollHeight lastHeight回报0 chromedriver 网页上没有任
Android - 打开跟踪文件时出错：没有这样的文件或目录(2)

我正在开发一个android应用程序其中一部分是检查手机的wifi是否启用我直接在手机上运行该应用程序这些是一些错误 error opening trace file No such file or directory 2 Refus
“使用操作码 153；此模拟器仅支持最多 152”

我是二郎和牛仔的新手我正在尝试一个非常简单的例子https ninenines eu docs en cowboy 2 0 guide getting started 但我已经陷入困境了完成 make run 后我得到 mess ser
从破折号的下拉列表中过滤行后显示数据表

我是达世币新手我想制作一个应用程序我可以在其中从下拉过滤器中选择值过滤数据集并显示数据表我正在使用 dash table 我的示例应用程序代码如下没有显示数据表有谁知道我做错了什么如何在仪表板应用程序中渲染仪表板 import
片段中的选项卡视图

我一直在尝试在片段内使用选项卡视图但是通过导航栏访问它时出现了一些错误第一次访问它时我可以自由地从选项卡移动到选项卡但是当再次访问此页面时从另一个片段选项卡不再移动我只卡在单个选项卡中默认情况下仅显示第一个选项卡请帮忙这是
R 中截距回归模型的 abline 线不正确

给出了可重现的示例在下面我得到一条 y 截距约为 30 的 abline 线但回归表明 y 截距应该是 37 2851 我哪里错了 mtcars mpg 21 0 21 0 22 8 21 4 32 obs mtcars wt 2 6
如何将参数从一个 Perl 脚本传递到另一个？

我有一个运行的脚本运行后它有一些信息需要传递给下一个要运行的脚本 Unix DOS 命令如下 perl x s param send pl perl x s param receive pl param send pl 是 Send pa
Java 9：什么是集合工厂方法？ [关闭]

Closed 这个问题需要多问focused 目前不接受答案 Java 9 的到来为 Java 的 Collections API 带来了许多新功能其中之一就是集合工厂方法它们是什么以及我如何正确实施它们 Note 1 To preve
仅使用C语言的分布式系统设计

我的工作是实现一个分布式节点系统如 p2p 节点每个节点比如 A B C 和 D 执行某些功能并且需要彼此交互以进行各种操作例如同步操作和其他操作例如 15 个 A 节点与一组 5 个 B 节点交互进入负载最少的节点队列并获取令
检测图像中的字体

我有一个非常奇怪的要求即应该检测 JPG 图像中文本的字体如何做呢我想知道有什么办法可以做到这一点提前致谢您可以尝试这些服务什么字体我认为这是识别图像中字体的最准确的服务不是完全自动化的并且有限制它只会匹配 MyFonts
如何在 GitHub 上进行快进合并？

因此我的一位同事尝试使用 GitHub 的 Web 界面中的通过快进合并选项来合并分支以保持历史记录免受虚假合并提交的影响 master自要合并的功能分支启动以来它们合并到的分支尚未取得进展有趣的是这并没有按预期工作所有提交
为什么我不能将 C# 方法声明为虚拟方法和静态方法？

我有一个辅助类它只是一堆静态方法并且想对辅助类进行子类化有些行为是唯一的具体取决于子类因此我想从基类调用虚拟方法但由于所有方法都是静态的我无法创建普通的虚拟方法需要对象引用才能访问虚拟方法有没有办法解决我想我可以使用单例
从 JsRender 中的嵌套块访问父变量

我怎样才能访问props s key来自嵌套的for props object items key for prop other items key here I want to print the key from props 我试过了
配置 Eclipse 以在工作区外部添加 buildpath 文件夹

我正在 Mac 上开发 PHP 根据其他建议我已将工作区设置在 MAMP 的 HTDOCS 文件夹中不幸的是这意味着我不能像在生产中那样使用的链接有什么建议么相关地工作区似乎阻止引用工作区外部的构建路径但我想将敏感文件保留在
jQuery：我可以自动将插件应用到动态添加的元素吗？

我正在将我的 Web 应用程序转换为完全 AJAX 架构我有一个最初加载的母版页和一个加载动态内容的 div 容器我创建了一些 jQuery 插件将它们应用于某些元素以扩展它们的功能我通常会在每个页面加载期间按如下方式调用这些函数
如何通过匹配 BeautifulSoup 中元素属性中的文本来获取元素

我有这个代码 a title Next Page Results 1 to 60 href class smallfont gt a 我想抓住a元素并获取 href 我怎样才能匹配title属性与Next Page 我想部分匹配标题属性中的

如何通过匹配 BeautifulSoup 中元素属性中的文本来获取元素

如何通过匹配 BeautifulSoup 中元素属性中的文本来获取元素 的相关文章

随机推荐

热门标签

如何通过匹配 BeautifulSoup 中元素属性中的文本来获取元素的相关文章