Selenium - 在检查 HTML 之前找不到可见元素？

2024-04-16

我目前正在使用 Selenium 进行网络爬虫应用程序，在几个成功的模块之后，以下情况让我陷入困境：我试图找到“菜单”类的一个元素，其文本“报告”位于名为的框架内“框架_应用”。

很简单，对吧？应该很简单：

browser = webdriver.Chrome()
#Do the necessary crawling to get to this specific menu...

browser.switch_to_frame('frame_applic')
for obj in browser.find_elements_by_class_name('menu'):
    if obj.text == 'Reports':
      bt_reports = obj    
      break

#The variable bt_reports should be the one requested.

这就是有趣的地方：虽然当我尝试切换到所需的框架时没有引发错误，但没有找到类名“menu”的元素。我肯定拼错了框架或类名，对吧？因此，在决定检查 HTML 并且不进行任何其他更改后，元素就在那里，就好像仅查看网页源代码的行为就改变了结果。这里可能发生什么？

我不允许发布完整的 HTML，但以下结构包含了该问题：

<html>
<head>
    <TITLE>Page</TITLE>
</head>
<frameset ...>
    <frame name="frame_menu" src="https:..." >
    <frame name="frame_applic" src="menu.asp?...">
    #document
        <table width="100%" border="0" cellpadding="5" cellspacing="0">

            <tr>
                <td colspan="2" align="right">
                    <table width="95%" border="0" cellpadding="5" cellspacing="0">

                        <tr><td><a href="https:..." class="menu">Reports</a></td></tr>
                        <tr><td><a href="https:..." class="menu">Change Password</a></td></tr>
                        <tr><td><a href="https:..." class="menu">Change Secret Phrase</a></td></tr>
                    </table>
                </td>
            </tr>
        </table>
        </body>

    <frame name="frame_bottom" src="https:...">
</frameset> 
</html>

经过仔细检查，我发现根本问题是所需框架的源信息位于 Active Server Page (asp) 中，如下所示：

<frame name="frame_applic" src="menu.asp?...">

而且无法从我所在的页面直接访问它。检查浏览器上的元素的行为显然会强制这些元素在 webdriver 实例中共存，从而允许我获取框架内的元素，而它们以前是无法访问的。

我能够通过首先找到请求的帧，然后将网络驱动程序指向它的源来解决这个问题，方法是：

browser.get(browser.find_element_by_xpath("//frame[@name='frame_applic']")\
.get_attribute('src'))

然后像我之前所做的那样简单地获取元素：

menu_list = browser.find_elements_by_class_name('menu')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

html

selenium

Selenium - 在检查 HTML 之前找不到可见元素？的相关文章

pyspark 数据框中的自定义排序

是否有推荐的方法在 pyspark 中实现分类数据的自定义排序我理想地寻找 pandas 分类数据类型提供的功能因此给定一个数据集Speed列可能的选项是 Super Fast Fast Medium Slow 我想实现适合上下文的
如果未引发异常，则通过 Python 单元测试

在Python中unittest框架是否有一种方法可以在未引发异常的情况下通过单元测试否则会因 AssertRaise 而失败如果我正确理解你的问题你could做这样的事情 def test does not raise on va
Pandas：如果单元格包含特定文本则删除行

pandas 中的这段代码不起作用如果该列包含提供的任何文本数字我希望它删除该行目前我只能在单元格与我的代码中传递的确切文本匹配时才能使其工作因为它只删除显示 Fin 的单元格不是金融或金融 df2 df df Team Fin
在没有模型的情况下将自定义页面添加到 django admin

我正在尝试在没有模型关联的情况下向管理员添加自定义页面这就是我迄今为止所取得的成就 class MyCustomAdmin AdminSite def get urls self from django conf urls import
搜索多个字段

我想我没有正确理解 django haystack 我有一个包含多个字段的数据模型我希望搜索其中两个字段 class UserProfile models Model user models ForeignKey User unique
默认情况下，JSF 生成不可用的 ID，这些 ID 与 Web 标准的 CSS 部分不兼容

活跃的 JSF 或 Primefaces 用户能否解释一下为什么默认情况下会发生这种情况为什么没有人对此采取任何措施
使水平滚动条始终可见，即使底部不在视图中

我将用一个片段来开始这个问题该片段几乎显示了我想要完成的任务 wrapper overflow hidden display flex sidebar min width 200px background 333 color FFF co
Jython 和 SAX 解析器：允许的实体不超过 64000 个？

我做了一个简单的测试xml saxJython 中的解析器在处理大型 XML 文件 800 MB 时遇到以下错误 Traceback most recent call last File src project xmltools py li
Python：IndexError：修改代码后列表索引超出范围

我的代码应该提供以下格式的输出我尝试修改代码但我破坏了它 import pandas as pd from bs4 import BeautifulSoup as bs from selenium import webdriver im
ANTLR 获取并拆分词法分析器内容

首先对我的英语感到抱歉我还在学习我为我的框架编写 Python 模块用于解析 CSS 文件我尝试了 regex ply python 词法分析器和解析器但我发现自己在 ANTLR 中第一次尝试我需要解析 CSS 文件中的注释
使用“默认”环境变量启动新的子进程

我正在编写一个构建脚本来解析依赖的共享库及其共享库等这些共享库在正常情况下是不存在的PATH环境变量为了使构建过程正常工作让编译器找到这些库 PATH已更改为包含这些库的目录构建过程是这样的加载器脚本更改 PATH gt 基于
使用 html5 分块上传文件

我正在尝试使用 html5 的文件 API 分块上传文件然后在服务器端用 php 重新组装它我正在上传视频但是当我在服务器端合并文件时大小增加了并且它变成了无效文件请注意以下 html5 代码仅适用于 chrome 浏览器在
在 keras 中保存和加载权重

我试图从我训练过的模型中保存和加载权重我用来保存模型的代码是 TensorBoard log dir output model fit generator image a b gen batch size steps per epoch
电话号码上未拾取结构化数据

我在网站上有以下代码片段当我通过 Google 结构化数据测试工具运行此程序时它不会获取电话号码我不确定我哪里错了 div class telephone number p Call Us a href 07749 918 143 a
从 NumPy 数组到 Mat 的 C++ 转换 (OpenCV)

我正在围绕 ArUco 增强现实库基于 OpenCV 编写一个薄包装器我试图构建的界面非常简单 Python 将图像传递给 C 代码 C 代码检测标记并将其位置和其他信息作为字典元组返回给 Python 但是我不知道如何在 Pytho
Python SSL X509：KEY_VALUES_MISMATCH

Python HTTPS server from http server import HTTPServer SimpleHTTPRequestHandler import ssl https stackoverflow com a 408
双击打开 ipython 笔记本

相关文章通过双击 osx 打开 ipython 笔记本 https stackoverflow com questions 16158893 open an ipython notebook via double click on osx
python 线程安全可变对象复制

Is 蟒蛇的copy http docs python org 2 library copy html模块线程安全吗如果不是我应该如何在 python 中以线程安全的方式复制 deepcopy 可变对象蟒蛇的GIL http en w
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此
Apache Beam Pipeline 写表后查询表

我有一个 Apache Beam Dataflow 管道它将结果写入 BigQuery 表然后我想查询该表以获取管道的单独部分但是我似乎无法弄清楚如何正确设置此管道依赖性我编写的新表然后想要查询与一个单独的表连接以进行某些过滤

随机推荐

如何在shell中为for循环添加前导零？ [复制]

这个问题在这里已经有答案了我有一个基本的 for 循环数字它在每次迭代中将变量 num 加 1 for num 1 num lt 5 num do echo num done 哪个输出 1 2 3 4 5 我试图让它产生输出在 num
C++ 动态返回类型

我不确定这是否是一件事说实话我想说不是但我想知道是否有一种方法可以编写 c 函数以便它可以选择返回哪种类型的对象例如我有一个基类 A 有 3 个子类 Aa Ab Ac 在工厂 F 类我有一个std map
为什么“int”和“sbyte”GetHashCode 函数生成不同的值？

我们有以下代码 int i 1 Console WriteLine i GetHashCode outputs gt 1 这是有道理的并且 C 中除 sbyte 和 Short 之外的所有整型类型都会发生同样的情况那是 sbyte i
如何以编程方式检测浏览器如何处理 window.close()？

不同的网络浏览器以不同的方式处理 window close 函数 IE 会提示用户进行确认而 Firefox 和 Safari 则无法接受它除非窗口最初是用 Javascript 打开的并在控制台中显示一条消息说明同样的内容我支持的
powershell批处理管道

以下行在 powershell 2 0 中运行良好 servermanagercmd exe query Select String Application Server Context 0 13 但是当我将它合并到我的批处理文件中时它只
如何在可能是简单字符串或字符串对象的字符串对象上安全地使用 JSON.parse？

我需要能够解析对象格式或纯字符串格式的字符串最安全的方法是什么我尝试了 JSON parse data 但如果数据是纯字符串它就不起作用编辑所选的解决方案谢谢你这就是我解决问题的方法 try dataObj JSON pars
如何设置常量十进制值

我正在使用 C 在我的配置类中设置十进制值的默认值 public class ConfigSection ConfigurationSection ConfigurationProperty paymentInAdvanceAmount D
如何在 iOS 11 中使用 scenekit - ARKit 动态创建 3D 对象的注释？

我正在努力使用创建注释overlaySKScene与此类似的东西 https sketchfab com models 1144d7be20434e8387a2f0e311eca9b1 https sketchfab com models
Angular：每次需要更新时，我应该 subscribe() 到 http.get() 吗？

我想知道我是否使用 Observable subscribe 次数太多在我的组件类中我有一个函数 loadData 它调用另一个函数 this service getData 该函数使用 HttpClient get 向服务器执行 HT
我无法正确配置 jest 来导入模块 (setupFilesAfterEnv)

我在用 angular builders jest为了在测试 Angular 项目时用玩笑代替 karma 我喜欢使用 2 个库来为笑话获取额外的匹配器 jest extended and testing library jest dom
如何调试Python导入失败

我有一个目录结构 network init py network model py network transformer init py network transformer t model py both init py文件有适当的
Spring Batch - 提交间隔的后期绑定不适用于跳过策略

我正在尝试对块的提交间隔属性使用后期绑定当块不包含跳过策略或重试策略时它可以正常工作但是一旦添加了跳过策略甚至是重试策略就不会考虑提交间隔并且批处理就像提交间隔设置为 1 一样工作奇怪的是当提交间隔被硬编码时它工作得很好所
枚举上忽略 JSON 绑定 @JsonbTypeDeserializer 注释？

我正在将 JAXB 应用程序转换为JSON B http json b net docs user guide html我在尝试使用自定义反序列化 Java 枚举时遇到了问题JsonbDeserializer在我的一项测试中我需要反序列化
克隆后如何删除原始元素？

HTML div p class test1 test 1 p p class test2 test 2 p p class test3 test 3 p p class test4 test 4 p div div class click
ActionMailer 不在开发 Rails 4 中发送邮件

为什么这个邮件程序不发送任何邮件或者有什么调试的想法吗在 my app config environments development rb 中我有以下代码 config action mailer delivery method s
如何获取 Oid 的名称（#Snmp）？

好的按照建议Lex Li https stackoverflow com users 11182 lex li我尝试使用其他库获取 Oid 名称 SnmpLib http sharpsnmplib codeplex com 这里是示例 p
网络响应超时错误 (create-react-native-app) (expo)

我正在尝试在 android 中的 expo 应用程序上运行 create react native app 首先我通过编写命令创建了项目创建反应本机应用程序测试然后我执行了 npm 启动然后从expo应用程序扫描二维码但扫描二维
Spring Boot Mongodb 按 ID 搜索返回 null

我用 mongodb 创建了一个 Spring Boot 项目当我将数据插入集合时它会被插入但是当我尝试从中获取数据时findOne by id基于 id 的插入值总是返回 null 我在下面给出了我的模型类和插入方法请告诉我出了什
如何在 DLL 上使用 app.config 而不是 exe

这是一个姐妹问题以及我的第一个问题允许使用 NET 2 0 构建的 C 应用程序在 NET 4 0 4 5 上运行 https stackoverflow com questions 13461185 allow c sharp appli
Selenium - 在检查 HTML 之前找不到可见元素？

我目前正在使用 Selenium 进行网络爬虫应用程序在几个成功的模块之后以下情况让我陷入困境我试图找到菜单类的一个元素其文本报告位于名为的框架内框架应用很简单对吧应该很简单 browser webdriver C

Selenium - 在检查 HTML 之前找不到可见元素？

Selenium - 在检查 HTML 之前找不到可见元素？ 的相关文章

随机推荐

热门标签

Selenium - 在检查 HTML 之前找不到可见元素？的相关文章