Selenium 2：检测链接目标的内容类型

2023-12-08

我正在使用 Selenium 2 Java API 与网页交互。我的问题是：如何检测链接目标的内容类型？

基本上，这是背景：在单击链接之前，我想确保响应是 HTML 文件。如果没有，我需要以其他方式处理。假设有一个 PDF 文件的下载链接。应用程序应直接读取该 URL 的内容，而不是在浏览器中打开它。

目标是让应用程序自动知道当前位置是 HTML、PDF、XML 还是其他内容，以便使用适当的解析器从文档中提取有用的信息。

Update

添加赏金：将奖励给允许我获取给定 URL 的内容类型的最佳解决方案。

正如 Jochen 所建议的，在不下载内容的情况下获取内容类型的方法是HTTP HEAD，并且 selenium webdrivers 似乎没有提供这样的功能。您必须找到另一个库来帮助您获取网址的内容类型。

可以执行此操作的 Java 库是Apache HttpComponents，尤其Http客户端.

（以下代码未经测试）

HttpClient httpclient = new DefaultHttpClient();
HttpHead httphead = new HttpHead("http://foo/bar");
HttpResponse response = httpclient.execute(httphead);
BasicHeader contenttypeheader = response.getFirstHeader("Content-Type");

System.out.println(contenttypeheader);

该项目发布HttpClient 的 JavaDoc，文档HttpClient接口包含一个很好的例子。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

selenium

ContentType

seleniumwebdriver

Selenium 2：检测链接目标的内容类型的相关文章

如何在spring mvc中从控制器名称+操作名称获取映射的URL？

是否有现有的解决方案可以从 Spring MVC3 中的控制器名称操作名称获取映射的 URL 例如 asp net mvc 或 Rails 中的 UrlHelper 我觉得非常有用 thx 也许你想要这样的东西 in your Co
Grails 2.3.0 自动重新加载不起作用

我最近将我们的项目升级到 grails 2 3 0 一切工作正常除了每当我更改代码时自动重新加载都无法工作的问题这包括所有项目工件控制器域服务 gsps css 和 javascript 文件我的旧版本 grails 可以正常工
eclipse中导入项目文件夹图标

我在 Eclipse 工作区中新导入的 Maven 项目有J and M项目文件夹顶部的图标项目和包资源管理器而其他导入的 Maven 项目只有一个J icon 有人可以解释其中的区别吗该项目有J装饰器被称为 Java 项目和具有M装
Condition 接口中的 signalAll 与对象中的 notificationAll

1 昨天我才问过这个问题条件与等待通知机制 https stackoverflow com questions 10395571 condition vs wait notify mechanism 2 我想编辑相同的内容并在我的问题中添加
Java套接字：在连接被拒绝异常时重试的最佳方法？

现在我正在这样做 while true try SocketAddress sockaddr new InetSocketAddress ivDestIP ivDestPort downloadSock new Socket downloa
在 HTTP 标头中发送 UTF-8 值会导致 Mojibake

我想使用 servlet 发送阿拉伯语数据HTTPServletResponse给客户我正在尝试这个 response setCharacterEncoding UTF 8 response setHeader Info arabicWo
Firestore - RecycleView - 图像持有者

我不知道如何编写图像的支架我已经设置了 2 个文本但我不知道图像的支架应该是什么样子你能帮我告诉我图像的文字应该是什么样子才能正确显示吗 holder artistImage setImageResource model getArt
主线程如何在该线程之前运行？

我有以下代码 public class Derived implements Runnable private int num public synchronized void setA int num try Thread sleep 1
如何让spring为JdbcMetadataStore创建相应的schema？

我想使用此处描述的 jdbc 元数据存储 https docs spring io spring integration docs 5 2 0 BUILD SNAPSHOT reference html jdbc html jdbc met
在java中实现你自己的阻塞队列

我知道这个问题之前已经被问过并回答过很多次了但我只是无法根据互联网上找到的示例找出窍门例如this http tutorials jenkov com java concurrency blocking queues html or t
如何获取 WebElement 的父级[重复]

这个问题在这里已经有答案了我试过了 private WebElement getParent final WebElement webElement return webElement findElement By xpath 但我得到
Java 8 中函数式接口的使用

这是来自的后续问题Java 8 中的双冒号运算符 https stackoverflow com questions 20001427 double colon operator in java 8其中 Java 允许您使用以下方式引用
无法加载或查找主类，可以在命令行中使用，但不能在 IDE 中使用[重复]

这个问题在这里已经有答案了在将其标记为重复之前请先听我说完我正在尝试使用 gradle 导入一个 java 项目功能齐全适用于所有其他笔记本电脑没有问题我的项目 100 正常运行适用于所有其他笔记本电脑当我的笔记本电脑被重
获取给定类文件的目录路径

我遇到的代码尝试从类本身的 class 文件所在的同一目录中读取一些配置文件 File configFiles new File this getClass getResource getPath listFiles new Filenam
Android Studio 将音乐文件读取为文本文件，如何恢复它？

gameAlert mp3是我的声音文件运行应用程序时它询问我该文件不与任何文件类型关联请定义关联我选择TextFile错误地现在我的音乐文件被读取为文本文件我如何将其转换回music file protected void o
Espresso 和 Proguard 的 Java.lang.NoClassDefFoundError

我对 Espresso 不太有经验但我终于成功地运行了它我有一个应用程序需要通过 Proguard 缩小才能处于 56K 方法之下该应用程序以 3 秒的动画开始因此我需要等到该动画结束才能继续这就是我尝试用该方法做的事情waitF
如何在 Quartz 调度程序中每 25 秒运行一次？

我正在使用 Java 的 Quartz Scheduling API 你能帮我使用 cron 表达式每 25 秒运行一次吗这只是一个延迟它不必总是从第 0 秒开始例如序列如下 0 00 0 25 0 50 1 15 1 40 2 0
在android中跟踪FTP上传数据？

我有一个运行 Android 的 FTP 系统但我希望能够在上传时跟踪字节这样我就可以在上传过程中更新进度条安卓可以实现这个功能吗现在我正在使用org apache common net ftp我正在使用的代码如下另外我在 A
嵌入式 Jetty - 以编程方式添加基于表单的身份验证

有没有一种方法可以按如下方式以编程方式添加基于表单的身份验证我用的是我自己的LdapLoginModule 最初我使用基本身份验证并且工作正常但现在我想在登录页面上进行更多控制例如显示徽标等有没有好的样品我正在使用嵌入式 jett
Android 和 Java 中绘制椭圆的区别

在Java中由于某种原因Ellipse2D Double使用参数 height width x y 当我创建一个RectF在Android中参数是 left top right bottom 所以我对适应差异有点困惑如果在 Java 中创

随机推荐

跨类变量在 PyQt GUI 中缩放绘图

我正在制作一个 GUI 它有几个用户输入框和一个绘图它将使用输入框中的因子来缩放数据 GUI 将需要一个应用按钮和一个导出按钮我使用 PyQt5 作为 GUI 使用 Matplotlib 进行绘图我的方法是为绘图和输入框创建单独的 Q
R 中矩阵到长格式数据帧的最快转换

我有兴趣找到最快的方法来转换matrix转换为长格式data frame 我在这里比较了实现此目的的三种解决方案但我想知道是否有更快的方法例如使用data table exist 这是我比较的三种方法的可重现代码 Generate ma
如何检查一个单词是否在 cocoa-touch 的英语词典中定义？

我正在尝试为 IOS 制作一个填字游戏应用程序但我不知道如何检查字符串是否是有效的英语单词我怎样才能检查它有没有API或在线工具可以检查它提前致谢在 iOS5 中使用以下命令很容易做到UIReferenceLibraryViewC
如何包含引号字符作为路由参数？收到“路径中的非法字符”消息

我有一个存在于所有页面上的搜索框用户可以输入文本然后单击搜索最终会出现在搜索页面上并显示结果单击搜索时包含文本框的表单将发送到以下路由 http localhost 2010 search my 20search 20term
如何使用 app.telemetry 页面速度监视器捕获 Selenium-IDE 中的页面加载时间

我正在尝试使用 Selenium IDE 并使用名为 app telemetry 页面速度监视器的插件进行快速而脏的页面加载测试该工具在 Firefox 的工具栏中提供了显示 0 36 为红色但我不确定如何通过 Selenium IDE
如何重用另一个 bash 文件中定义的函数？

我有一个经常使用的实用函数 assertReturnStatus 我想在实用程序文件中定义它 utility sh 并在其他 bash 脚本中重用它如何重用另一个 bash 脚本文件中的函数谢谢您需要将第一个文件导入第二个文件请
Android - 从 EditText inputType="time" 获取时间

I have EditText在我的 XML 文件中
复制文件太晚了

我需要在单击 MSI 后立即复制文件我目前正在使用 CopyFiles 函数但它的速度不够快我是否需要自己的自定义操作或者有没有办法在显示任何 UI 之前移动它 Thanks 使用 reg 文件和 ini 文件完成的任何操作通常都可
蓝牙文件夹，不同手机路径不同

我发现不同版本的android将接收到的蓝牙文件放在不同的文件夹中例如我的一部测试手机正在运行android 2 2将文件保存到此路径 mnt sdcard Downloads Bluetooth 我的第二部测试手机正在运行androi
更新到 Java 6 Update 14 后出现 JVM 错误

在更新了一些服务器以在 Java 6 update 14 上运行后我遇到了一些奇怪的错误可能每天一次错误类似于 A fatal error has been detected by the Java Runtime Environme
为什么 cout.setf(ios::fixed) 将我的浮点数更改为十六进制？

我最近遇到了这个与 cout setf ios fixed 有关的奇怪问题我花了很长时间才找到原因并想在这里询问以了解更多信息问题是这样的使用 cout setf ios fixed 时所有浮点数都被打印为十六进制数字为什么会出
sys.exit(0) 和 os._exit(0) 有什么区别

请帮助我澄清这两个 python 语句在功能差异方面的概念 sys exit 0 os exit 0 根据文档 os exit 以状态 n 退出进程不调用清理处理程序刷新 stdio 缓冲区等 Note标准的退出方式是sys exit
从 Sys.time() 中减去时间

Using format Sys time Y m dT H M 00 returns 2016 07 05T11 15 00 如何从该值中减去两个小时我试图达到的最终结果如下 2016 07 05T09 15 00 任何帮助深表感谢谢
使内容可编辑div中的一些关键字不可编辑[关闭]

Closed 这个问题需要多问focused 目前不接受答案我添加了一些content for div in html 我把它做成了contenteditable true 内容有一些关键字例如 FIRSTNAME 我想让关键字不可编辑
是否可以将“繁琐”的模块浏览器化，以便nodejs程序可以在浏览器中运行？

我是 Node js 的初学者目前正在构建一个 Node js 程序该程序使用繁琐模块请参阅下面的代码访问和查询 Microsoft Azure SQL 数据库并将数据放到 html 网页上我想在浏览器中运行此代码因此我使
压平 JavaScript 树，尝试了一些解决方案

给定这棵树是否有一种简单的方法可以将其转换为具有以下条件的平面数组 JS ES5 也使用了 jQuery 尊重演示顺序添加一个 level 属性显示缩进级别从 0 开始 root 0 id 1 name Frutta status
使用xamarin studio进行Windows 7桌面应用程序开发

是否可以使用 Xamarin Studio 不是 Visual Studio 来开发 Windows 7 桌面应用程序我问的原因是我想将它用于 IOS OS x Android 开发但我还需要该应用程序在 Windows 7 上运行是
在Python Flask中显示数据库结果：ValueError：字典更新序列元素#0的长度为6；需要 2 个

如何使用 python Flask 在 CocoaRestClient 中显示数据库查询的结果这是代码 import json import sys import datetime import MySQLdb as mdb from f
本地 Jekyll 服务/实时站点差异

我正在使用主题创建一个 jekyll 博客来托管在我的 github io 帐户上问题很简单当我运行 jekyllserve 时该网站会在本地生成没有任何问题但是当我将其推送到 my profile github io 存储库时
Selenium 2：检测链接目标的内容类型

我正在使用 Selenium 2 Java API 与网页交互我的问题是如何检测链接目标的内容类型基本上这是背景在单击链接之前我想确保响应是 HTML 文件如果没有我需要以其他方式处理假设有一个 PDF 文件的下载链接应

Selenium 2：检测链接目标的内容类型

Selenium 2：检测链接目标的内容类型 的相关文章

随机推荐

热门标签

Selenium 2：检测链接目标的内容类型的相关文章