从 html 文件解析图像 url

2023-12-13

我想搜索 html 文件,然后获取该页面上图像的 url。然后这个 url 应该被保存为一个字符串——仅此而已。问题是我真的不知道如何开始。

我的应用程序当然知道图像所在页面的 url。 我们以这个 url 为例:


在此页面上,我需要大图像的 url 作为字符串。当我查看源代码时,我可以找到 url,但我不知道如何编码 - 这是我需要的 url:


(仅限引号内的文本)。


Use JSoup。它是一个 HTML 解析器,允许您使用 css 选择器(如 jQuery)访问 DOM 元素。

// Parse your HTML:
// 1. From string:
Document doc = JSoup.parse(htmlAsString);

// 2. Or from an URL:
Document doc = JSoup.connect("http://my.awesome.site.com/").get();

// Then select images inside it:
Elements images = doc.select("img");

// Then iterate
for (Element el : images) {
    String imageUrl = el.attr("src");

    // TODO: Do something with the URL
}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

从 html 文件解析图像 url 的相关文章

随机推荐

  • 通过以太网端口或主机 USB 的 SSH Beaglebone

    我对 Beagle Bone black 还很陌生 一直玩得很开心 直到我用来 SSH 的 USB 设备插孔意外地从 Beagle Bone black 上脱落 我很难将 USB 设备插孔 USB 迷你 A B 型 焊回原位 这迫使我寻找下
  • 在 Windows 10 或 7 中的 Apache Zeppelin 中运行 Spark 程序时出现错误

    我是 Apache Zeppelin 的新手 安装0 8 0并使用7000端口访问Zeppelin 配置了一些路径 如下所述 JAVA HOME C Program Files Java jdk1 8 0 144 HADOOP HOME C
  • 广义相加模型 data.frame.default 错误:尝试应用非函数

    我正在尝试使用 mgcv 包运行一般的附加模型 但我不断收到 model frame default 错误 Error in model frame default formula Presence Sex wind speed baro
  • Scikit Learn - ValueError:数组包含 NaN 或无穷大

    我的数据集中没有 NaN 我已经彻底检查过 为什么我在尝试拟合分类器时不断收到此错误 数据集中的一些数字相当大 一些小数位超出了 10 位小数 但我不认为这会导致错误 我在下面包含了一些 pandas DataFrame 信息以及错误本身
  • Python-两个数字之和程序错误[重复]

    这个问题在这里已经有答案了 我刚刚开始学习 Python 编程 我编写了一个简单的程序来计算两个用户输入数字的总和 a b input enter first number input enter second number print s
  • Prometheus 和 Grafana - 有没有办法让用户使用机器?

    我一直在与 Prometheus 和 Grafana 合作 获取几个计算机实验室的状态和统计数据 有没有一种方法可以让我通过 Prometheus 登录计算机的用户并将其放到 Grafana 上 我会列出2个选项 第一个将 Pushgate
  • 从 3 个视图中创建 3D 对象

    I d like to calculate an 3D object out of the 3 views The principle is shown in following figure 每个视图都存储在二维矩阵中 其中二进制值表示对
  • 用 sum group by 计算平均成绩

    我必须显示每个用户的名字和姓氏 学习年份 年龄 平均成绩以及一般平均成绩 平均成绩 I 需要这样计算 Sum AverageGrade total number of grades userID FirstName LastName Bir
  • Rails 3:通过关联使用 has_many 进行多重选择

    我希望能够通过多项选择为一篇帖子选择多个类别 我有下一个模型 Post Category 和 PostCategory class Post lt ActiveRecord Base has many post categories has
  • 虚假外键约束失败

    我收到此错误消息 第 40 行出现错误 1217 23000 无法 删除或更新父行 a 外键约束失败 当我尝试删除表格时 DROP TABLE IF EXISTS area 定义如下 CREATE TABLE area area id ch
  • 如何通过匹配另一个数组来过滤R中的矩阵

    现在我在 R 中有一个矩阵 a matrix c A B B C 61 25 23 28 43 74 67 11 nrow 4 和另一个数组 b c B C D 如何过滤矩阵 a 以便它仅返回匹配项 即 matrix c B B C 25
  • Tomcat JDBC 连接在 Eclipse 中工作但不能独立运行

    我们正在经历升级数据库软件以及从 Tomcat 5 5 到 Tomcat 7 的过程 因此 我使用新的 JDBC 驱动程序 在本例中是推荐的 SQL Anywhere JDBC 4 0 驱动程序 它需要 ODBC 服务 我已经成功地让这一切
  • 如何获取每个应用程序的权限?如何在Android上以编程方式做到这一点?

    如何获取每个应用程序的权限详细信息 如何以编程方式做到这一点 我要显示 每个应用程序的应用程序权限详细信息 在文本视图上 但我尝试了但不行 你好 java import android app Activity import android
  • 在 Android 文件资源管理器中按文件类型过滤

    在我的应用程序中 我想让用户从文件资源管理器应用程序中选择文件 我已经能够通过使用以下代码 在 C Xamarin 中 来做到这一点 private void AddFile if IsFileExplorerAppInstalled To
  • 如何使用ajax在Django管理表格内联中读取/写入输入字段?

    我正在寻找使用 ajax 动态更新内联条目的方法 即 当用户从下拉框中选择一个项目时 可以用数据填充关联的输入字段 ajax 的views py 部分应该很简单 但对我来说有一个问题是如何在js中获取下拉框的名称 这些名称可以动态添加 以下
  • 如何在不同的 Spring 上下文之间共享 Spring bean?

    我们有一个使用 Spring BlazeDS 集成的应用程序 到目前为止 我们刚刚使用了 Spring 和 Flex 并且运行良好 我们现在还需要添加一些 Spring MVC 控制器 Spring BlazeDS 文档指出 执行此操作的方
  • 使用 C# 包装器从任务栏中删除应用程序?

    有没有办法为现有应用程序构建 C 包装器 以便我将其从任务栏中删除 更多信息 我有一个计时器应用程序 我想使用它 但没有使用 因为它很好 很糟糕 看https superuser com questions 92774 quickbooks
  • CSS 中的尾随行装饰标题

    我正在尝试创建带有一些精美装饰的标题标签 最终 我想达到这个目的 不过 我在文本后添加尾随线装饰时遇到问题 我最初的想法是有一个容器 然后在该容器中包含 h1 和包含该行的 span 标签 但我似乎不太能让该行与位于其上方的文本居中 我试过
  • 带底边框的文本框

    我希望有TextBox有底部边框 但绘制的图形为TextBox调整大小时会扭曲 损坏 因为Color Transparent 使用我找到的代码 我能够创建一个带下划线的文本框 具有透明顶部 左侧 右侧的绘制矩形 问题是当我调整表单 窗口的大
  • 从 html 文件解析图像 url

    我想搜索 html 文件 然后获取该页面上图像的 url 然后这个 url 应该被保存为一个字符串 仅此而已 问题是我真的不知道如何开始 我的应用程序当然知道图像所在页面的 url 我们以这个 url 为例 在此页面上 我需要大图像的 ur