SELENIUM：element.text 很慢，我不知道为什么

2024-01-02

driver.get('https://nameberry.com/popular_names/US')
boys_names = driver.find_elements_by_css_selector("""tr.even>.boys""")
girls_names = driver.find_elements_by_css_selector("""tr.even>.girls""")
# so this goes quickly

def list_gen(ls): 
    hugo = []
    for i in ls:
        hugo.append(i.text)
    return hugo


i = time()
boys_names = list_gen(boys_names) # takes each <a> tag found before contained in boys_names and creates a list
# of names by taking everything CONTAINED (NOT attributes) between the opening and closing tag <a>
e = time()
print(e-i) # gives ~ 50 sec

i = time()
girls_names = list_gen(girls_names) # same thing but with girl names
e = time()
print(e-i) # gives ~ 80 sec 
# those timings are consistent even though no. of boys and girls is the same
# which is also weird
# no. is 1000 btw so that quite alot

所以基本上我很困惑为什么需要这么长时间。我得出的结论是，由于某种原因，element.text 花费了最多的时间。有没有办法在不导入其他模块的情况下加快速度？

我认为你的代码花费这么长时间的原因是因为循环list_gen在循环时向网页发送一堆请求。如果您在循环中设置断点，并在开发工具运行时查看浏览器的网络页面，您将看到大量请求从循环开始。我认为这是因为当硒向下滚动时页面正在加载新元素。据我所知，如果你想让它更快，你应该使用其他东西。我的建议是使用美丽的汤。

from selenium import webdriver  
from time import time  
from bs4 import BeautifulSoup  

driver = webdriver.Chrome()  

i = time()  
driver.get('https://nameberry.com/popular_names/US')  
soup = BeautifulSoup(driver.page_source, 'html5lib')  

boys_names = [x.getText() for x in soup.find_all("td", {"class", "boys"})]  
girls_names = [x.getText() for x in soup.find_all("td", {"class", "girls"})]  

e = time()  
print(e - i) # gives ~ 14 sec for me

这会立即获取网页的整个源代码并对其进行解析，而不必使用 css 选择器返回的 webdriver 对象列表。

如果您不使用 selenium 浏览器执行其他任何操作而只想获取名称，则可以使用 requests 更快地获取页面源，因为您不需要加载 selenium 浏览器。

import requests  

i = time()  

response = requests.get('https://nameberry.com/popular_names/US')  
soup = BeautifulSoup(response.content, 'html5lib')  
boys_names = [x.getText() for x in soup.find_all("td", {"class", "boys"})]  
girls_names = [x.getText() for x in soup.find_all("td", {"class", "girls"})]  

e = time()  
print(e - i) # gives ~ 3.2 sec

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

selenium

SELENIUM：element.text 很慢，我不知道为什么的相关文章

生成二叉树的所有从根到叶的分支

抱歉如果这是一个常见问题但我还没有找到适合我的特定问题的答案我正在尝试实施一个walk方法将二叉树从根节点遍历到每个叶节点每当到达叶节点时都会生成根到叶路径例如遍历表示为的二叉树 a b d c 会产生 a b c a d 我的
如何找到Selenium WebDriver的XPath？ [复制]

这个问题在这里已经有答案了我想知道是否可以获取Web元素的XPATH test driver find elements by css selector div menu listes ul menu menu horizontal me
使用 Selenium 处理验证码

我正在尝试自动化一个表单在表单提交过程中我会得到重新验证码我陷入困境并弄清楚我们如何使用 selenium webdriver 处理验证码文本虽然这个验证码正在实时进行图灵测试实施但是我仍然在寻找某种方法来处理这种情况所以你不能真
如何在PIL中从ImageDraw中获取图像？

我在我的项目中使用 PIL 并且有 ImageDraw 对象我想获取在 ImageDraw 对象上绘制的图像我如何获取图像这是你想要的 from PIL import Image ImageDraw im Image new RGBA
父子进程之间的通信

我正在尝试创建一个具有一个或多个子进程的 Python 3 程序父进程生成子进程然后继续处理自己的业务有时我想向特定的子进程发送一条消息由其捕获该消息并采取行动此外子进程在等待消息时需要处于非锁定状态它将运行自己的循环来维护服
带表格格式的 Matplotlib 条形图

我在图的底部添加了一个表格但它存在许多问题右边的内边距太多了左边的填充太少底部没有填充物单元格对于其中的文本来说太小该表距离图的底部太近属于行名称的单元格的颜色未与条形图的颜色相匹配我要发疯了去摆弄这个有人可以帮我解决这
如何使用 Selenium WebDriver 设置浏览器客户端区域大小？

我找到了如何在 Selenium 问题管理系统中设置浏览器窗口大小请参阅浏览器窗口控件 174 https github com seleniumhq selenium google code issue archive issues 1
Jupyter Notebook 找不到 Python 模块

不知道发生了什么但每当我使用 ipython 氢原子或 jupyter 笔记本时都找不到任何已安装的模块我知道我安装了 pandas 但笔记本说找不到我应该补充一点当我正常运行脚本时 python script py 它确实导入
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
使用 TestNG 运行并行测试时捕获 WebDriver 屏幕截图

我目前正在通过分别重写 TestListenerAdapter 方法 onTestFailure 和 onTestSuccess 来捕获 TestNG 中失败和成功的屏幕截图为此您需要指定要截取屏幕截图的驱动程序我的问题在方法级别并
使用 Selenium 完成 Internet Explorer 身份验证对话框

我正在使用 Selenium 来模拟用户来自动化一些遗留软件该软件仅适用于 IE6 我在兼容模式下使用 IE11 并且有点糟糕软件中有一个点会出现 Windows 安全对话框在用户模拟器可以继续操作之前这需要凭据我在用着IAl
无法通过 python3 启动 Selenium Safari WebDriver

我想使用 Safari 作为 python 的浏览器代码相当简单 from selenium import webdriver driver webdriver Safari url https www gmail com driver
使用 Selenium webdriver 和 Python 获取完全渲染的 HTML

我正在尝试使用 Selenium webdriver 在 Python 中构建一个网络抓取工具但是当我从 webdriver 检索网站源代码时我无法访问所需的信息我认为问题在于一旦页面最初从服务器下载内容就会通过 JavaScri
文件“PyInstaller/loader/pyimod03_importers.py”，第 546 行，在 exec_module 中，ModuleNotFoundError：没有名为“x”的模块

EDIT 我正在尝试导入algosec models在一个文件里面algobot包裹我尝试添加 hidden import algosec 我还尝试在导入之前添加路径使用sys path append algosec 这是我尝试运行该程
类型错误：描述符“__weakref__”不适用于父级 __str__ 方法中的对象

我有一个父类我们称之为A还有一堆儿童班 B C D等等我想定义一个 str 父类及其内部的方法我想通过访问子类的成员dir self 它有效但是当我检查该名称是否可调用时callable getattr self attr I get
如何使用 selenium 和 Mocha 获取 xPath() 选择的锚标记的文本

我已经成功选择了 a 标签我想显示锚标记的文本但无法这样做我正在使用 selenium mocha javascript 和 phantomJS 这是我的脚本详细 var assert require assert var test
我怎样才能更多地了解Python的内部原理？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我使用Python编程已经有半年多了我对Python内部更感兴趣而不是使用Python开发应用程序
如何在 Ubuntu 16.04 上的 Python 3 / Matplotlib 2 中安装底图？

I tried pip3 install basemap but Basemap https sourceforge net projects matplotlib files matplotlib toolkits 好像不在 PyPI 上
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设

随机推荐

在 Outlook 2016 中添加上下文菜单项

在 Outlook 2007 中当用户右键单击邮件项目时以下代码将菜单项添加到上下文菜单中然而在 Outlook 2016 中这不起作用这段代码根本没有被执行 Sub Application ItemContextMenuDispl
Android，我看到堆在增长，但我希望它停止

我看到我的堆不断增长并且我知道它最终会在任何设备上崩溃因为它一直在增长 Grow heap frag case 在整个日志中都可以看到在我的手机上当使用 32mb 时应用程序就会崩溃其他手机当然是 16mb 如果有那么少的资源运
单击按钮即可更新 asp.net 表

我是 ASP NET 的新手遇到了一个非常愚蠢的问题但我无法弄清楚我有一个表单由 page load 上的数据库数据填充用户更新表单的输入文本并单击更新按钮它会更新但会使用旧数据进行更新为什么要用旧数据更新它这是asp
轨道 HAML 表格

我目前正在尝试将 ERB 布局转换为 HAML 这是我不断收到的错误 index html haml 18 syntax error unexpected n hamlout format 这是 HAML 页面 row fluid span
如何配置log4j只保留最近7天的日志文件？

我在使用多个 Java 应用程序时遇到以下日志记录问题log4j用于记录我希望日志文件每天轮换例如 log 2010 09 10 log 2010 09 09 log 2010 09 08 log 2010 09 07 log 2010
将单元测试添加到遗留代码[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案您是否曾经在事后向遗留代码中添加过单元测试代码有多复杂存根和模拟所有内容有多困难最终的结果值得吗我发现最好的方法是逐步添加单元测试而不
如何在 Windows 上的 Perl 中将具有 UTF-8 文件名的文件复制到另一个 UTF-8 文件名？

例如给定一个空文件 txt 我该如何制作一个名为 txt copy 我第一次破解它设法访问该文件并创建新文件名但生成的副本 txt copy 这是我的第一次尝试 usr bin env perl use strict use warni
d3 onclick 获取具体路径/栏参考

如果我有 d3 dc 图表并且我设置了一个单击事件处理程序如下所示 var data city New York neighborhood N A hits 200 city New York neighborhood Brooklyn
通过键合并数据框中的行

如果我有一个带有关键列和数据列的数据框就像这样 df lt cbind key c Jane Jane Sam Sam Mary var1 c a NA a a c var2 c NA b NA b d key var1 var2 Jan
添加 IIS UrlRewrite 似乎会破坏本地 IIS 服务器上的调试

这个问题让我发疯我正在开发一个最近创建的项目突然我无法调试该特定项目我使用带有 IIS UrlRewrite 2 模块的本地 IIS 7 5 我的开发机器是 Windows 7 x64 带有 Visual Studio 2010 Pr
Visual Studio 2010 中 applicationhost.config 的 IIS Express 路径

有没有办法告诉 Visual Studio 2010 在启动 IIS Express 时对 config 参数使用什么值使用 Process Explorer 我可以看到 iisexpress exe 进程由 Visual Studio
CUDA中x方向的索贝尔滤波器

我正在尝试在每个像素的 x 方向上对灰度图像应用索贝尔滤波器并显示结果 X 方向索贝尔滤波器为 1 0 1 2 0 2 1 0 1 我没有得到所需的结果有人可以指出我的错误吗我正在尝试使用纹理但我不太确定我是否正确使用了它 inclu
如何以树形视图显示消息回复？ Java 和休眠

我有消息需要显示十个例如第一个根回复以及对其自身的所有回复并且它应该看起来像一棵树标准消息和树状回复视图你知道所以问题是如何从数据库获取它我正在使用休眠据我所知它将需要很多时间递归地检索整个集合本身以及所有子树
Emacs - 如何避免或替换错误的字符编码？

假设我收到用 MS Word 编写并保存为纯文本 txt 的西班牙语文本不幸的是所有的西班牙口音都是这样显示的 Un 372ltimo an 341lisis 谁能告诉我如何避免这种情况或者至少如何替换这些字符替换正则表达式函数根本
PHP - 验证函数返回 true | false，如果 false 则返回一条消息

我有一个验证函数它返回true or false 但是我希望它提供以下信息问题是什么当有一个时假设这个函数是这样的 function is valid val result true if rule 1 not met result
在 Visual Studio 中运行多个 NUnit 项目

我有一个包含多个项目的解决方案包括 NUnit 测试项目所以解决方案看起来像这样使用通用名称这些不是实际名称 Solution Project1 Project1 Test Project2 Project2 Test Projec
用于在 MySQL 中执行非常大 (20 GB) .sql 文件的更高速度选项

为了响应政府的数据请求我的公司收到了一个 20 GB 的 sql 文件我没有太多选择来获取不同格式的数据因此我需要选择如何在合理的时间内导入数据我使用 Navicat 的批处理执行工具在高端服务器 Win 2008 64 位 MyS
“#define STR(a) #a”有什么作用？

我正在阅读phoneME的源代码它是一个 FOSS JavaME 实现它是用 C 编写的我偶然发现了这一点 Makes a string of the argument which is not macro expanded defi
在 Swift 中，你能找到模块中遵守特定协议的所有类型吗？

在 Swift 4 中是否可以找到当前模块中遵守特定协议的所有类型例如假设我定义了这个协议和这些类 protocol Animal protocol Vehicle protocol Favorite class Dog Animal
SELENIUM：element.text 很慢，我不知道为什么

driver get https nameberry com popular names US boys names driver find elements by css selector tr even gt boys girls na

SELENIUM：element.text 很慢，我不知道为什么

SELENIUM：element.text 很慢，我不知道为什么 的相关文章

随机推荐

热门标签

SELENIUM：element.text 很慢，我不知道为什么的相关文章