使用 BeautifulSoup 仅获取 URL 列表的第一个链接

2023-12-14

我解析了整个 HTML 文件,使用 Python 中的 Beautifulsoup 模块提取了一些 URL,代码如下:

for link in soup.find_all('a'):
    for line in link :
        if "condition" in line :

           print link.get("href")

我在 shell 中获得了一系列观察 if 循环中的条件的链接:

  • http://..link1
  • http://..link2
  • .
  • .
  • http://..linkn

我怎样才能仅将这个列表的第一个链接放入变量“输出”?

EDIT:

网页是:http://download.cyanogenmod.com/?device=p970,脚本必须返回 HTML 页面中的第一个短 URL (http://get.cm/...)。


你可以用 oneliner 来做到这一点:

import re

soup.find('a', href=re.compile('^http://get.cm/get'))['href']

将其分配给变量即可:

variable=soup.find('a', href=re.compile('^http://get.cm/get'))['href']

我不知道你到底在做什么,所以我将从头开始发布完整的代码: 注意!如果您使用 bs4 更改导入

import urllib2
from BeautifulSoup import BeautifulSoup
import re

request = urllib2.Request("http://download.cyanogenmod.com/?device=p970")
response = urllib2.urlopen(request)
soup = BeautifulSoup(response)
variable=soup.find('a', href=re.compile('^http://get.cm/get'))['href']
print variable

>>> 
http://get.cm/get/4jj
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 BeautifulSoup 仅获取 URL 列表的第一个链接 的相关文章

随机推荐

  • 如何为工作表制作下拉列表

    我的工作簿中共有五张工作表 我的任务是在第一个工作表中创建一个组合列表按钮 该按钮将能够指向其他四个工作表 如果用户选择工作表名称之一 则该按钮将自动激活所选工作表 尽管可能会添加工作表 但不太可能删除工作表 我什至不确定如何让工作表名称显
  • 在 Selenium Android Webdriver 测试中使用 Xpath 和 CSS 查找元素有困难

    我想使用 Selenium WebDriver 自动化 Android Web 应用程序 并且我运行了一个简单的程序来打开 google 页面并搜索术语 当找到具有名称和 ID 的元素时 它运行完美 但是 尝试使用 Xpath 和 Css
  • AVPlayer 播放 m3u8 流时如何捕获图像?

    I use AVPlayer玩一个m3u8文件 我想在这些代码中捕获图像 AVAssetImageGenerator gen AVAssetImageGenerator alloc initWithAsset self player cur
  • Powershell 脚本输出到变量 - 捕获 Write-Host 输出

    使用这个脚本 https github com byterogues powershell bittrex api我从另一个脚本中调用它 e g order bittrex api ps1 action buylimit market BT
  • 使用 forcat::fct_reorder 对 facet_wrap 中的图进行排序

    我有一段时间内国家 地区级别的统计数据 我用facet wrap 按国家 地区绘制 但我想仅根据最新值 2015 按降序排列图 我尝试过使用transform 但这仅对第一个值 2005 进行排序 我认为forcats fct reorde
  • Firebase:removeUser()但需要删除存储在该uid下的数据

    我在用着Firebase并且需要添加一个删除用户 函数可以删除用户帐户 但是数据库中该 uid 下还存储有数据 是否有可能删除用户 函数也可以删除该数据 或者是运行另一个数据的唯一方法Firebase函数 remove 作为回调 谢谢 J
  • 验证具有空属性的 XML 架构

    我在验证 xml 架构时遇到问题 我在架构上遇到这些错误 113 18 s4s elt invalid content 1 AnonType user 的内容是 无效的 164 17 s4s elt invalid content 1 An
  • Excel VBA - 双击时将列中所有选定的单元格大写

    我有一个非常简单的 VBA 脚本 它将所选单元格大写 Private Sub Worksheet BeforeDoubleClick ByVal Target As Range Cancel As Boolean ActiveCell Va
  • 在 iOS 8 上捕获音量增大/减小按钮按下的最简洁方法

    捕获音量增大 减小按钮按下的最佳 最干净的方法是什么iOS 8 理想情况下 我想捕获按键并防止系统音量发生变化 或者至少防止 HUD 显示音量变化 有一些旧的答案使用已弃用的方法 并且似乎在 iOS 8 上根本不起作用 iOS 8 具体一也
  • 在自定义域中部署 Google Endpoint

    使用具有自定义域的 Google Cloud Endpoints 是否存在任何问题 然后我使用了它几个星期 部署后它停止工作 我看这里 我发现这个问题这说明目前还不允许 但这对我有用http www customdomain com ah
  • UML 用例图中是否存在泛化?

    我正在尝试对一些需求进行建模 并且在网上看到了一些带有用例概括的示例 但是UML 2 5 标准审查没有提到用例图中的泛化 或者我找不到它 那么 泛化有标准支持吗 由于用例是一个分类器 因此它们可以被泛化 UML 2 5 规范包含一个示例 如
  • 如何在 Swift 中表示质量大小?

    SI units enum Magnitude Measurement case Milli Measurement 3 ml case Centi Measurement 2 cl case Desi Measurement 1 dl c
  • 在 Javascript 中查找复选框是否获得焦点

    在 Javascript 中 我如何判断复选框是否具有焦点 我认为会有一个名为 isfocused 的方法或属性 但显然不是 我所说的焦点是指他们已经使用键盘切换到它 此时按空格键会选中该框 创建一个连接到 onfocus 事件的事件处理程
  • 按线程排序

    我有一项任务 需要工作代码 在开始之前我想了解这个问题 但我不知道如何写它 我有一组数据 以此为例 var arr new byte 5 3 1 7 8 5 3 2 6 7 9 3 2 4 2 1 我需要将此数组分成两半 将其放入线程池中并
  • xml 资源中的警告

    昨天我再次安装了 ADT 插件 因为我已经拥有的版本遇到了问题 间歇性 问题是 我没有在所有 xml 资源中收到警告 我非常确定我以前没有见过他们 其中一些很烦人 因为我对此无能为力 Nested weights are bad for p
  • Django 如何从给定模型实例的自定义字段调用方法?

    我有以下模型 class CustomField models CharField def foo self return foo class Test models Model col1 models CharField max leng
  • 请帮助我理解这段 JavaScript 代码片段中的“while”循环

    我见过这样的代码片段 用于使用条件注释在 JavaScript 中检测 IE var ie function var undef v 3 div document createElement div the while loop is us
  • 数组中的匿名函数

    我已声明 func array a gt array b gt function echo hello 我尝试以这种方式调用但它不起作用 call func a b call 我收到一个错误致命错误 函数名称必须是字符串 如何调用匿名函数
  • 在 api.ai 中处理范围的最佳方法?

    我有一个房地产机器人 我需要处理以下情况 我正在寻找 1200 平方英尺的房子 我正在寻找 1200 1500 平方英尺的房子 我正在寻找面积在 1200 平方英尺到 1500 平方英尺之间的房子 另一种情况是我的机器人询问 您要找多少平方
  • 使用 BeautifulSoup 仅获取 URL 列表的第一个链接

    我解析了整个 HTML 文件 使用 Python 中的 Beautifulsoup 模块提取了一些 URL 代码如下 for link in soup find all a for line in link if condition in