如何访问所有 URL 的 Selenium Python

2024-03-22

我试图访问所有显示的网址，但它首先访问而不是所有

谷歌搜索网址

    browser.get('https://www.google.co.uk/search?q=Rashmi&oq=Rashmi&aqs=chrome..69i57j69i60l3.6857j0j1&sourceid=chrome&ie=UTF-8#q=Rashmi+Custom+Tailors')
    time.sleep(5)

    try:        
        p_links = browser.find_elements_by_css_selector(' div > h3 > a')
        url_list = []
        for urls in p_links:
            if "Rashmi Custom Tailors" in urls.text:

                url = urls.get_attribute("href")
                url_list.append(url)
                for url in url_list:
                    browser.get(url)
                    time.sleep(4)

    except:
        pass

你的问题是你的结果不好的做法通过使用：

try:
   do something
except:
    pass

通过这行代码块，您无法捕获有关程序为何按预期运行的任何信息。它抛出的异常可以帮助您改进代码，不要像这样忽略它。

现在，回到你的问题。在您的代码中，存在一些逻辑错误，例如@穆罕默德·拉基布·阿明的回答 https://stackoverflow.com/a/43400417/6597344。因此，对您的代码进行一些更改，您会得到以下结果：

from selenium import webdriver
browser = selenium.Chrome()
browser.get('https://www.google.co.uk/search?q=Rashmi&oq=Rashmi&aqs=chrome..69i57j69i60l3.6857j0j1&sourceid=chrome&ie=UTF-8#q=Rashmi+Custom+Tailors')
time.sleep(5)
p_links = browser.find_elements_by_css_selector(' div > h3 > a')
for urls in p_links:
    if "Rashmi Custom Tailors" in urls.text:
        url = urls.get_attribute("href")
        browser.get(url)
        time.sleep(4)

但这并没有解决你的问题，你的浏览器只会访问第一个网址就像您所描述的那样并引发异常：

StaleElementReferenceException: Message: stale element reference: element is not attached to the page document

抛出此异常是因为在第二次循环期间，您正在使用的元素不再附加到浏览器的当前页面。

解决方案就像您所做的那样，找到所有元素并将所有 url 添加到列表中。你像这样迭代列表，它在我的计算机上运行良好。尝试一下：

from selenium import webdriver

browser = webdriver.Chrome()
query_url = "https://www.google.co.uk/search?q=Rashmi&oq=Rashmi&aqs=chrome..69i57j69i60l3.6857j0j1&sourceid=chrome&ie=UTF-8#q=Rashmi+Custom+Tailors"
browser.get(query_url)
p_links = browser.find_elements_by_css_selector("div > h3 > a")
urls = []
for elem in p_links:
    text = elem.text
    url = elem.get_property('href')
    if "Rashmi Custom Tailors" in elem.text:
        urls.append(url)

for url in urls:
    browser.get(url)

也许你做了一些indent error在你的第二个循环中。

P.S：您的问题应该包含所需的所有代码，这样其他人可以更轻松地帮助您。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

selenium

如何访问所有 URL 的 Selenium Python 的相关文章

Django 中的 Rpy2 错误 - 未为“”类型的对象定义转换“py2rpy”

我以前从未使用过 R 并且正在尝试使用 rpy2 从 python 调用 R 函数它可以在独立的 python 终端上运行但不能在 Django 中运行但rpy2似乎无法将python字符串转换为r对象我正在使用同事提供的自定义库
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
类型错误：float() 参数必须是字符串或数字，而不是“列表”python

我的 Python 有问题这是我的代码 def calcola a input b float a 0 split c float a 0 split d float a 0 split e float a 0 split j float
使用 pandas 将字符串对象转换为 int/float

import pandas as pd path1 home supertramp Desktop 100 life 180 data csv mydf pd read csv path1 numcigar Never 0 1 5 Ciga
Perl 是否有相当于 Python 的 `if __name__ == '__main__'` 的功能？

有没有一种方法可以确定当前文件是否是 Perl 源中正在执行的文件在 Python 中我们使用以下结构来做到这一点 if name main This file is being executed raise NotImplemente
如何在Python代码中查找列号

简短问题当按上述方式调用函数时我可以找到行号here https stackoverflow com questions 3056048 filename and line number of python script 同样如何找到
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
返回上个月的日期时间对象

如果 timedelta 在它的构造函数中有一个月份参数就好了那么最简单的方法是什么 EDIT 正如下面指出的那样我并没有认真考虑这一点我真正想要的是上个月的任何一天因为最终我只会获取年份和月份因此给定一个日期时间对象返回的最
如何将类添加到 LinkML 中的 SchemaDefinition？

中的图表https linkml io linkml model docs SchemaDefinition https linkml io linkml model docs SchemaDefinition and https link
Python 3在for循环中更改字典键的值不起作用

我的 python 3 代码没有按预期工作 def addFunc x y print x y def subABC x y z print x y z def doublePower base exp print 2 base exp d
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
在seaborn中对箱线图x轴进行排序

我的数据框round data看起来像这样 error username task path 0 0 02 n49vq14uhvy93i5uw33tf7s1ei07vngozrzlsr6q6cnh8w 39 png 1 0 10 n49vq
Selenium 不会在新选项卡中打开新 URL（Python 和 Chrome）

我想使用 Selenium WebDriver 和 Python 在不同的选项卡中打开相当多的 URL 我不确定出了什么问题 driver webdriver Chrome driver get url1 time sleep 5 driv
如何分析组合的 python 和 c 代码

我有一个由多个 python 脚本组成的应用程序其中一些脚本正在调用 C 代码该应用程序现在的运行速度比以前慢得多因此我想对其进行分析以查看问题所在是否有工具软件包或只是一种分析此类应用程序的方法有一个工具可以将 python
计算 pyspark df 列中子字符串列表的出现次数

我想计算子字符串列表的出现次数并根据 pyspark df 中包含长字符串的列创建一个列 Input ID History 1 USA UK IND DEN MAL SWE AUS 2 USA UK PAK NOR 3 NOR NZE 4
在Python中连续解析文件

我正在编写一个脚本该脚本使用 HTTP 流量行解析文件并取出域目前仅将它们打印到屏幕上我正在使用 httpry 将流量连续写入文件这是我用来删除域名的脚本 usr bin python import re input open r
python dicttoxml 多次使用相同的键

我正在尝试做如下所示的 xml
沿轴 0 重复 scipy csr 稀疏矩阵

我想重复 scipy csr 稀疏矩阵的行但是当我尝试调用 numpy 的重复方法时它只是将稀疏矩阵视为对象并且只会将其作为 ndarray 中的对象重复我浏览了文档但找不到任何实用程序来重复 scipy csr 稀疏矩阵的行我
Pip 无法在 Windows 上安装 Twisted

我正在尝试在 Windows 8 计算机上安装 Twisted 在 Twisted 官方网站上只有一个 Windows 版的 Wheel 文件 https twistedmatrix com trac wiki Downloads htt
在python中对列表列表执行行总和和列总和

我想用python计算矩阵的行和和列和但是由于信息安全要求我无法使用任何外部库因此为了创建矩阵我使用了列表列表如下所示 matrix 0 for x in range 5 for y in range 5 for pos in

随机推荐

Excel VBA：运行时错误（对象“范围”的方法“值”失败），但仅限于连续运行

我目前正在处理的 VBA 项目遇到问题特别是一段代码的运行时错误该代码查找表格底部的下一个空单元格并将存储的字符串写入该范围现在该项目的快速解释我在 Excel 工作表中有一个表格记录了我工作的公司可能即将出现的每项预期工作为
使用 apache poi 超链接到同一工作簿中的不同工作表

我正在使用 Apache POI 生成包含多个工作表的 Excel 工作簿我想创建从一张纸到另一张纸的超链接如何做到这一点我找到了一些解决方案可以建立指向网站的超链接甚至可以建立其他 Excel 文件的超链接但不能建立指向同一工
C3/D3 饼图图例格式/标签重叠

我有一个使用 C3 的饼图我现在通过添加值和百分比更改了默认图例名称我正在寻找一种方法来很好地格式化这个图例以便值和百分比像列一样定位有没有办法防止标签重叠这是我到目前为止所取得的进展 var columns data11 dat
如何在没有函数的情况下通过引用传递数组？迅速

我有这门课 class MainView UIView var categories Category 我想设置类别参数但我需要通过引用而不是值传递它因为它更高效更好所以如果我这样做 let mainView MainView ma
在 iOS 上组合相交的 CGPath

我正在开发的应用程序遇到问题假设我有两个相当复杂的 CGPath 我将它们都添加到 CGMutablePath 从而将它们组合起来好吧两条路径相交的地方就会有彼此内部的点我想消除那些内部点并基本上绘制路径的外部或轮廓我很难弄清楚我
如何将 Android Activity 转换为界面？

在 Android 文档中 http developer android com guide components fragments html http developer android com guide components fra
MVC-Mini-Profiler 错误地显示重复查询

我一直在尝试 MVC Mini Profiler 发现它非常有用但是在我跟踪的所有页面上我都会收到重复查询的报告如下所示但是我在 SQL Server Profiler 中跟踪了查询毫无疑问它只访问数据库一次我在这里错过了一
Admob - 横幅显示黑色背景且无广告

我在用着离子框架 http ionicframework com 以及这个插件 https github com floatinghotpot cordova plugin admob https github com floatingho
使用 Ordnance Survey/Openlayers api 拖动标记

我创建了一个网站使用 Ordnance Survey 我认为这称为 OpenSpace 生成的基于 OpenLayers 的 api 我已经有了它因此您可以单击地图来添加标记然后我希望能够单击标记并将其拖动到地图周围有没有一种简单的方
有没有办法通过 EntityKey 删除实体而不加载它？

有没有办法通过 EntityKey 删除实体而不加载它 Tamir 的链接有效但它使用了实体框架团队不再推荐的方法查看this tip http blogs msdn com alexj archive 2009 03 27 tip 9
Android 分页库不会触发 loadAfter()

我正在使用新的 Android Paging 库来获取具有无限滚动功能的 RecyclerView 我无法理解为什么当我像这样设置 PagedList 时库不触发 loadAfter 方法 val config PagedList Conf
尝试运行 Grails 应用程序时出错

我是 Grails 新手我使用 GVM 工具安装了它并且尝试从终端运行默认应用程序只需尝试以下命令 grails create app demo 然后 grails run app 我得到了巨大错误 Running Grails ap
将文件列表过滤为存在的文件

如何将文件列表过滤为存在的文件例如 echo a txt does not exist b txt
可观察到的混乱

我在用Ionic2 with AngularFire2 我也在利用rxjs Observable 我有以下代码 findChatsForUid uid string Observable
动态地将 BoxView 添加到网格 [Xamarin.Forms]

我正在尝试使用 3 列和多行以网格格式添加 BoxView 我已经使用 xaml 和行为定义了网格在 c 文件中应该发生的是应该为相同数量的图像创建 BoxView 每列 3 个图像 Thanks XAML
如果禁用第 3 方 cookie，facebook javascript/php SDK 可以相互“对话”吗？ facebook->getUser() 返回 0

我正在构建一个与 facebook javascript php SDK 一起工作的网站它通常运行良好但是我发现对于一台使用 chrome 的测试机当我从客户端 javascript 端执行 FB 登录时 PHP sdk后端无法识别
Google 表格脚本错误“无法访问服务：镜像”

我在 Google Sheets 中有一个脚本实际上我无法执行任何操作例如 function onOpen e var ui SpreadsheetApp getUi Or SpreadsheetApp or FormApp ui cr
从封闭泛型中提取泛型类型

我想要这样的东西 class Foo
DOM VBA IE11 自动在网站上下订单 - OnChange 和图片上传出现问题

我们有一个虚拟助手在此网站上下了数百个球标订单 https www golfballs com Golf Misc Tools Classic Photo Poker Chips 3 Pack htm https www golfballs
如何访问所有 URL 的 Selenium Python

我试图访问所有显示的网址但它首先访问而不是所有谷歌搜索网址 browser get https www google co uk search q Rashmi oq Rashmi aqs chrome 69i57j69i60l3 68

如何访问所有 URL 的 Selenium Python

如何访问所有 URL 的 Selenium Python 的相关文章

随机推荐

热门标签