在 Python 中使用 Selenium Webdriver 下载图像

2023-12-23

我正在尝试使用 Python 中的 Selenium Webdriver 从 URL 下载图像。该站点受登录页面保护，因此不能仅使用请求保存 URL 内容。登录后我可以从网站获取文本，但我不知道如何保存图像。

登录该网站后，我可以执行以下操作browser.save_screenshot(filename + '.png')但该图像的尺寸与原始图像不正确。

我现在的代码是这样的：

browser = webdriver.Chrome('../chromedriver')
browser.get('www.example.com/login')
# send username and password, click submit

browser.get('www.example.com/123')
html = browser.page_source
printData(html)

# this url is an image file
browser.get('www.example.com/get_photo.php?id=123')
browser.save_screenshot(filename + '.png')

理想情况下我想更换save_screenshot()与类似的东西

with open(filename + '.jpeg', 'w') as img:
    img.write(browser.download_current_image())

甚至类似的东西，与弹出菜单交互

browser.right_click()
browser.down_arrow_key()
browser.return_key()

或模拟按键

browser.command_key()
browser.s_key()

This https://stackoverflow.com/questions/6813704/how-to-download-an-image-using-selenium-any-version问题给出了我想要的答案，但不适用于Python。如果有一种方法可以在 Python 中执行该问题中建议的任何操作（除了截图之外），那将是一个很好的解决方案。

以下是我用来从登录页面后面的 URL 下载图像的方法，方法是使用 Selenium Webdriver 登录，然后将 cookie 传递给保存图像的请求：

headers = {
"User-Agent":
    "Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36"
}
s = requests.session()
s.headers.update(headers)

for cookie in browser.get_cookies():
    c = {cookie['name']: cookie['value']}
    s.cookies.update(c)

r = s.get(imgurl, allow_redirects=True)
open(filename + '.jpeg', 'wb').write(r.content)

谢谢阿尔多·苏万迪 https://stackoverflow.com/users/2335360/aldo-suwandi向我展示如何做到这一点this https://stackoverflow.com/questions/32639014/is-it-possible-to-transfer-a-session-between-selenium-webdriver-and-requests-s邮政。我也用过this https://www.codementor.io/aviaryan/downloading-files-from-urls-in-python-77q3bs0un网站帮助我弄清楚如何使用请求下载图像。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Python 中使用 Selenium Webdriver 下载图像的相关文章

django_openid_auth TypeError openid.yadis.manager.YadisServiceManager 对象不是 JSON 可序列化

I used django openid auth在我的项目上一段时间以来它运行得很好但今天我测试了该应用程序并遇到了这个异常 Environment Request Method GET Request URL http local
使用 python 进行串行数据记录

Intro 我需要编写一个小程序来实时读取串行数据并将其写入文本文件我在读取数据方面取得了一些进展但尚未成功地将这些信息存储在新文件中这是我的代码 from future import print function import se
我怎样才能更多地了解Python的内部原理？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我使用Python编程已经有半年多了我对Python内部更感兴趣而不是使用Python开发应用程序
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
如何使用 imaplib 获取“消息 ID”

我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好所以我认为 Message ID 是正确的但我不知道如何获取它我只知道 imap fetch uid XXXX 有人有解决方案吗来自 IMAP 文档本身 IMAP4消息号
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
将 2D NumPy 数组按元素相乘并求和

我想知道是否有一种更快的方法专用 NumPy 函数来执行 2D NumPy 数组的元素乘法然后对所有元素求和我目前使用np sum np multiply A B 其中 A B 是相同维度的 NumPy 数组m x n 您可以使用np
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
创建嵌套字典单行

您好我有三个列表我想使用一行创建一个三级嵌套字典 i e l1 a b l2 1 2 3 l3 d e 我想创建以下嵌套字典 nd a 1 d 0 e 0 2 d 0 e 0 3 d 0 e 0 b a 1 d 0 e 0 2 d 0
mac osx 10.8 上的初学者 python

我正在学习编程并且一直在使用 Ruby 和 ROR 但我觉得我更喜欢 Python 语言来学习编程虽然我看到了 Ruby 和 Rails 的优点但我觉得我需要一种更容易学习编程概念的语言因此是 Python 但是我似乎找不到适用于
无法在前端使用 JavaScript Fetch API 将文件上传到 FastAPI 后端

我正在尝试弄清楚如何将图像发送到我的 API 并验证生成的token那是在header的请求到目前为止这就是我所处的位置 app post endreProfilbilde async def endreProfilbilde requ
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
Selenium 是否可以单独用于自动化 Intranet Web 门户的测试，其中门户上的链接定向到 SAP 应用程序

是否可以单独使用 Selenium 来自动测试 Intranet Web 门户其中门户上的链接定向到 SAP 应用程序 Portal 仅适用于 IE 和 Windows 操作系统上的 SAP 应用程序用最简单的话来说 Selenium

随机推荐

使用 libgdx 在运行时用文本生成纹理

我正在开发一个电话文字游戏昨天我决定使用 libgdx 切换到 OpenGL 以尝试提高图形性能和电池使用率瞄准更多平台字母图块在 2D 画布上绘图的方式是每个字母图块都会为自己创建一个位图我会从背景位图创建一个新的可变位图在
在不实际打开大写锁定的情况下打开键盘大写锁定指示灯的方法

我正在编写一个程序使用大写锁定 https en wikipedia org wiki Caps Lock作为拨动开关如果能设置按键的 LED 来显示我的程序打开或关闭就像 Caps Lock 键自然所做的那样那就太好了我知道我可
使用 NSAttributedString 将 UILabel 中的文本居中

对我正在开发的应用程序进行一些基本改进对于 iOS 快速开发场景来说还是个新手我认为代码中的文本行会自动居中因为我将标签设置为居中经过一番研究后我发现事实并非如此我如何将这样的代码对齐到中心 let atrString try
如何抓取需要身份验证的 ASPX 页面

使用 python 的库 Requests 我试图抓取一个 ASPX 网站 https cei bmfbovespa com br CEI Responsivo home aspx https cei bmfbovespa com br C
如何在 Recharts 中为 YAxis 创建自定义垂直标签，该标签将缩放以适应标签太长的情况？

我正在使用 Recharts 库和一些垂直标签构建一些组合图表YAxis太长并且被切断我的标签被剪掉的照片 https i stack imgur com FUwrl png 我尝试使用自定义标签
“分支与起源是最新的”但实际上不是

该消息是否有点误导当结帐分支时例如 b535 git 这样做并说您的分支已更新为 origin b535 这听起来就像我当地分行的情况b535已是最新 git checkout b535 Previous HEAD position
日期选择器的多个实例

我如何能够使用日期选择器的多个实例一个日期选择器正在工作但日期选择器的下一个实例正在调用相同的弹出窗口如何继续任何人都可以给我您的电子邮件 ID 我会将整个代码邮寄给您然后您将能够以更好的方式了解整个想法 http jsfiddl
Sequelize '自 v4.0.0 起需要显式提供方言'

我需要在 node js 环境中运行第三方应用程序但 Sequelize 抛出自 v4 0 0 起需要显式提供方言我在这里找到了类似的主题自 v4 0 0 起需要显式提供方言 https stackoverflow com quest
打开活动而不显示 UIActivityViewController

我希望能够在滚动视图中包含社交图标当单击该图标时其功能与我在呈现 UIActivityViewController 后单击它们时的功能相同我不想呈现 UIActivityViewController 我知道这是不可能的但是一个名为
CATransaction：图层更改但不动画

我正在尝试在用户点击按钮时为 iPad 应用程序中的部分 UI 制作动画我的操作方法中有这段代码它的工作原理是用户界面按照我的预期进行更改但不会以动画方式进行更改它只是立即改变我肯定错过了什么 IBAction someActi
可以从 (a,b) 移动到 (c,d)

问题是输出是否可以从给定点移动 a b 达到目标 c d 我们仅限于正坐标可以进行以下两种动作 a b gt a b b a b gt a b a 例如 1 1 to 5 4 is True您可以执行以下操作使用第 2 步 3 次 1
如何清空 JS 对象？

我有一个像 var person id null name John Doe 将对象值插入数据库后我将从服务器获取另一个对象 var personInDB id 1234 name John Doe 我用过angular merge使用更
如何远程访问私有 docker-registry？

我正在尝试使用来自以下位置的图像设置一个私有 docker 注册表 https github com docker docker registry https github com docker docker registry 只需运行 d
使用 iTextSharp 将图像添加到 PDF 并正确缩放

这是我的代码它正确添加了我想要的图片并且一切正常except图像使用其原始分辨率因此如果图像很大则会被裁剪以适合页面有没有什么方法可以让图片像缩放功能一样拉伸以适合但又保持纵横比那里一定有我想念的东西 P Here s a pi
R中的数据帧累积游程长度编码

我有一个数据帧其中包含与观察值 1 或 0 相关的值我想计算 1 的连续出现次数重置为 0 游程长度编码函数 rle 看起来它可以完成工作但我无法将数据转换为所需的格式我想尝试在不编写自定义函数的情况下执行此操作在下面的数据中
如何计算多边形的圆角？

我正在寻找一种允许我从多边形创建圆角的算法我有一个代表多边形的点数组以红色轮廓并且在输出时我想要一个代表带圆角的多边形以黑色轮廓的点数组我还希望有一种方法来控制每个角的半径我尝试使用贝塞尔曲线和细分但这不是我想要的贝塞尔曲
从 avro 文件复制时导入 SUPER 列失败

是否可以从 avro 文件复制到 SUPER 列我正在使用以下查询来导入 copy small table from s3 xxxx redshift chunk 1782431332154490799 avro access key i
Ajax 控制台错误：ReferenceError：$ 未定义

我的 html 页面上的一个小脚本有问题它只是一个应该由 a 标记中的 onclick 方法调用的函数它不起作用每次我单击浏览器中的链接时控制台都会显示 ReferenceError 未定义并指向下面代码的第三行您需要
如何在 Elastic High Level Rest Client 中使用 search_after 进行分页

我正在使用弹性 RestHighLevelClient 与 ES 对话我能够查询基本查询尽管我正在尝试使用 search after api 从我的前端查询中设计分页 api 尽管 query after 在 RestLowLevelC
在 Python 中使用 Selenium Webdriver 下载图像

我正在尝试使用 Python 中的 Selenium Webdriver 从 URL 下载图像该站点受登录页面保护因此不能仅使用请求保存 URL 内容登录后我可以从网站获取文本但我不知道如何保存图像登录该网站后我可以执行以下操作

在 Python 中使用 Selenium Webdriver 下载图像

在 Python 中使用 Selenium Webdriver 下载图像 的相关文章

随机推荐

热门标签

在 Python 中使用 Selenium Webdriver 下载图像的相关文章