Python Selenium“WebDriver”对象没有属性错误

2023-11-23

我正在尝试从中文网站上抓取一些由 javascript 生成的内容。我正在使用 Selenium （和 Python），因为我无法直接抓取 javascript 内容。

# -*- coding: utf-8 -*-
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.selenium import selenium 

import time
import urllib2
import httplib
import urllib
import re
import base64

browser = webdriver.Firefox() # Get local session of firefox
browser.get("http://www...") # Load page (redacted here, but any works)
browser.get_body_text() #Attempt to scrape body text

我收到以下错误：

'WebDriver' object has no attribute 'get_body_text'

事实上，我似乎无法调用 selenium.selenium 类中的任何命令。毫无疑问，我忽略了一些非常明显的事情。提前致谢。

你只需要from selenium import webdriver.
Execute html= browser.find_element_by_xpath(".//html")获取页面上的html元素，最大的元素。（您可以通过多种方式执行此操作，并选择任意数量的元素。）
Execute html.text返回页面的文本。

.text是一种方法element目的。步骤2是分配element到名字html.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

selenium

attributes

webscraping

AttributeError

Python Selenium“WebDriver”对象没有属性错误的相关文章

如何在 Heroku 中安装 NLTK 模块

嘿我想在我的 Heroku 服务器上安装 NLTK pos tag 我该怎么办呢请给我一些步骤因为我是 Heroku 服务器系统的新手我刚刚添加了官方nltk支持构建包只需添加一个nltk txt文件包含要安装的语料库列表一切都
在 GUI 中显示 DHT11 的温度 - 自动刷新？

Python 新手开始接触 DHT11 温度湿度传感器 Raspberry Pi 3 和 Python 3 我正在使用标准Adafruit DHT11 库 https github com adafruit Adafruit Pytho
在 cherokee 和 uwsgi 上部署 Flask [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我正在尝试部署一个使用 cherokee 和 uwsgi 开发的 Flask Web 应用程序我安装了 cherokee 和 uwsgi 并正在工作
给定一个正整数 n，如何打印高度为 n-1 的数字三角形？

HackerRank 三角任务 https www hackerrank com challenges python quest 1 problem 仅使用算术运算单个for loop 和一个单一的print陈述不允许进行字符串操作约
倒计时：01:05

如何在 Python 中创建一个看起来像 00 00 分钟和秒的倒计时时钟它独立成一行每次减少一actual秒则应将旧计时器替换为低一秒的新计时器 01 00变成00 59它实际上击中了00 00 这是我开始使用但想要改造的基本计时
如何在Python中拟合阶跃函数

我有一个关于使用 curve fit 等 scipy 例程拟合阶跃函数的问题我很难将其矢量化例如 import numpy as np from scipy optimize import curve fit import matplo
Python 中的参数命名约定

对于形式参数密切相关的函数例如 def add two numbers n1 n2 return n1 n2 def multiply two numbers n1 n2 return n1 n2 如上所示为两个函数中的参数指定相同的名
Python 删除额外的特殊 unicode 字符

我正在 python 中处理一些文本它内部已经采用 unicode 格式但我想删除一些特殊字符并用更标准的版本替换它们我目前有一条看起来像这样的线路但它变得越来越复杂我发现它最终会带来更多麻烦 tmp infile lower r
Python NameError，变量“未定义”

它返回的错误是 NameError name lives is not defined 我知道代码并不是尽可能高效这是我的第一个项目但是无论我尝试做什么都会弹出这个错误我尝试为其创建一个全局变量但这没有帮助我真的很感激一些帮助
优化 Django Queryset for 循环

如何优化以下查询集 link goal for link in self child links all 我想摆脱 for 循环并只访问数据库一次我有以下代码 class Goal models Model name models Cha
如何在 conda 中从一个文件安装多个包而不创建新环境？

我从当前环境缺少的包的 yml 文件中获取了这些我如何在当前环境中安装这些 channels defaults dependencies appdirs 1 4 3 py36h28b3542 0 asn1crypto 0 24 0 py3
在 NLTK Python 的朴素贝叶斯分类器中使用文档长度

我正在使用 Python 中的 NLTK 构建垃圾邮件过滤器现在我检查单词的出现情况并使用 NaiveBayesClassifier 其准确度为 0 98 垃圾邮件的 F 测量值为 0 92 非垃圾邮件的 F 测量值为 0 98 然而
在包含缺失值的 Pandas 数据框列上使用 apply 和 lambda 函数

这是这个问题的后续如何根据 pandas 数据框中其他列中的子字符串创建新列 https stackoverflow com questions 70086559 how to create new column based on sub
替换 Python 列表/字典中的值？

好的我正在尝试过滤传递给我的列表字典并稍微清理它因为其中有某些值我需要删除所以如果它看起来像这样 records key1 AAA key2 BBB key3 CCC key4 AAA 我如何快速轻松地运行所有内容并将 AAA
如何将当前登录的用户指定为模型字段的默认值？

我想做这样的事情 class Task models Model created by models ForeignKey User default LoggedInUser blank True null True related nam
根据产品变体术语将收件人添加到 Woocommerce 电子邮件通知

我创建了一个 Woocommerce 插件并要求它做两件事根据购物车中的产品变体向特定电子邮件地址发送通知消息电子邮件必须仅包含相关产品不得包含其他属性的产品例如产品 A 具有名为 Chef 的属性其中 Chef one 和
在Python中将字符串转换为变量？ [复制]

这个问题在这里已经有答案了我对 python 和编程都很陌生并且已经尝试弄清楚如何做到这一点有一段时间了这是我需要帮助的内容 y 0 x 2 p01 hello p02 bye print p str y str x 输出当然是 p0
需要帮助编写扭曲的代理

我想编写一个简单的代理可以对请求页面正文中的文本进行打乱我已经阅读了 stackoverflow 上的部分扭曲文档和其他一些类似的问题但我有点菜鸟所以我仍然不明白我现在就是这样不知道如何访问和修改页面 from twisted
Python - 使用 BeautifulSoup 从 URL 列表中抓取文本的最简单方法

使用 BeautifulSoup 从几个网页使用 URL 列表中抓取文本的最简单方法是什么有可能吗最好的乔治娜 import urllib2 import BeautifulSoup import re Newlines re c
使用和不使用 SciPy 计算 k 组合的数量

我对这个函数感到困惑combSciPy 的 http docs scipy org doc scipy 0 14 0 reference generated scipy misc comb html看起来比简单的 Python 实现要慢这

随机推荐

linux中有类似COM0COM这样的程序吗？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我在Windows中使用com0com进行程序测试 linux下有没有类似com0com的程序我知道有 pts ptmx 但我想要的是一个独立的程
Google 地球与 Google 地图 API v3 集成了吗？

我正在尝试将 Google 地球集成到 Google 地图中我发现它是possible在 v2 中但我找不到任何关于如何使用 v3 执行此操作的文档不幸的是这尚未在 Google Maps API v3 中实现请参阅相应的tick
groupByKey 是否比 reduceByKey 更受青睐

我总是用reduceByKey当我需要对 RDD 中的数据进行分组时因为它在打乱数据之前执行映射端缩减这通常意味着更少的数据被打乱从而获得更好的性能即使当map端reduce函数收集了所有值并且没有实际减少数据量时我仍然使用red
在（据称）高性能代码中使用 GetCurrentMethod

出于记录目的我们应用程序中的一些方法包括以下行 Dim Log As ILog GetLog Reflection MethodBase GetCurrentMethod DeclaringType 我对反思有一种可以说是非理性的恐惧我
如何从java调用C#函数[重复]

这个问题在这里已经有答案了我需要从 java 调用 C 函数为此我创建了以下内容我创建了一个java头文件Authenticator h 代码如下 include
循环遍历数组并成对输出（每个第二个元素的分隔符）

我有一个包含匿名元素的数组元素通过 php 添加到数组中如下所示 playlist array while databaseloop playlist a title playlist a length echo json encode
通用集合中的记录相等性

假设您有一条带有重载相等运算符的记录 TSomeRecord record Value String class operator Equal Left Right TSomeRecord Boolean end 实现比较字符串值如果根据
Linux中每个进程的最大线程数

我编写了一个简单的程序来计算Linux Centos 5 中一个进程可以拥有的最大线程数这是代码 int main pthread t thrd 400 for int i 0 i lt 400 i int err pthread cre
NuGet 包引用复制 dll 本地

我需要将 NuGet dll 的 Copy Local 设置为 false 在此之前我使用了包配置格式一切正常迁移到后封装参考格式我找不到如何做到这一点的方法有人可以帮助我吗您可以使用私有资产从文档复制
使用 Hibernate API 进行 Java 字符串日期验证

我正在尝试验证字符串日期 using javax validation 休眠验证我需要检查给定的字符串日期应该是过去的并且它应该是正确的yyyyMMdd具有所有限制的格式例如闰年 30th 31st day public class U
如何捕获鼠标移动事件

我想在我的主窗体中捕获鼠标移动事件虽然我能够连接MouseEventHandler对于主窗体当光标位于 UserControl 或任何其他控件上时该事件不再触发如何确保我始终掌握鼠标位置您可以使用低级鼠标钩看this示例并检查
使用 ctypes 传递数组

我有一个C函数 void read FIFO AI0 int16 t input size t size NiFpga Session session NiFpga Status status input int16 t malloc si
如何使用 SWIG 扩展 python 中的模板化 C++ 类以允许 [] 运算符

我有一个模板化的 C 数组类它使用标准向量类 include
向量点积计算的时间和空间复杂度

计算两个长度为 n 的向量之间的点积的算法的时间和空间复杂度是多少如果这 2 个向量是a a1 a2 an and b b1 b2 bn then 点积由下式给出a b a1 b1 a2 b2 an bn 为了计算这个我们必须执行n乘法
设置 tk.Frame 宽度和高度

所以我正在创建一个 GUI 并尝试使其一切都适合屏幕我已经画出了我希望 GUI 的每个部分的外观及其大小的粗略草图因此我知道所有内容的粗略尺寸然而我遇到的第一个问题是设置屏幕的左半部分所以左半部分由一个框架组成我们称之为Main
如何替换已弃用的 ggplot2 函数 aes_string：接受任意数量的命名字符串来指定美学映射？

aes string我在使用 ggplot2 编程时使用了一些方便的行为但aes string已被弃用我相信是从 ggplot2 版本 3 4 0 开始我正在努力思考如何很好地替换它具体来说我之前创建了通过省略号接受任意字符串参数
错误 403：scrapy 中未处理或不允许 HTTP 状态代码

这是我为抓取 justdial 网站而编写的代码 import scrapy from scrapy http request import Request class JustdialSpider scrapy Spider name j
WebRTC - 在通信过程中更改视频流

我的目标是使用 webrtc Web 应用程序在视频或音频通话中启用屏幕共享好吧我发现我可以使用MediaStreamTrack applyConstraints 更改视频属性但是否可以更改视频源进一步说明如何将视频添加到现有音频流
从 C++ 调用 C# 方法而不使用 COM

有没有办法创建 C 对象并从非托管 C 调用方法但不使用 COM Iterop 我正在寻找类似 JNI 但适用于 Net 的东西您可以在其中手动创建 VM 创建对象等如果您使用 C CLI 那么您可以直接与托管世界和非托管代码交互因
Python Selenium“WebDriver”对象没有属性错误

我正在尝试从中文网站上抓取一些由 javascript 生成的内容我正在使用 Selenium 和 Python 因为我无法直接抓取 javascript 内容 coding utf 8 from selenium import webd

Python Selenium“WebDriver”对象没有属性错误

Python Selenium“WebDriver”对象没有属性错误 的相关文章

随机推荐

热门标签

Python Selenium“WebDriver”对象没有属性错误的相关文章