使用 python 定义 chromedriver selenium 的下载目录

2023-11-27

一切都在标题中！

有没有办法定义与 python 一起使用的 selenium-chromedriver 的下载目录？

尽管进行了很多研究，但我还没有找到结论性的东西...... 作为一个新手，我已经看到了很多关于 Chromedriver 的“所需功能”或“选项”的内容，但没有任何东西可以解决我的问题......（而且我仍然不知道它是否会！）

进一步解释一下我的问题：我有很多要扫描的网址（200 000），并且对于每个网址都有一个要下载的文件。我必须创建一个表，其中包含网址、我在其上废弃的信息以及我刚刚为每个网页下载的文件的名称。对于我必须处理的卷，我创建了打开多个 chromedriver 实例的线程以加快处理速度。问题是每个下载的文件都到达相同的默认目录，并且我无法再将文件链接到网址... 所以，想法是为每个线程创建一个下载目录来一一管理它们。

如果有人在标题中找到了我的问题的答案，或者找到了识别下载的文件并将其与当前网址链接的解决方法，我将不胜感激！

为 chromedriver1 创建一个新的配置文件，并在该配置文件集中download.default_directory到所需的位置，并使用 chrome 设置此配置文件chrome.profile. The selenium-chromedriver包应该有一些创建新配置文件的方法（至少对于 ruby 来说是这样），因为它们需要一些特殊的处理。

Chromedriver2 不支持设置配置文件。您可以用它设置首选项。如果您想设置下载目录，请按以下步骤操作：

prefs: { download: { default_directory: "/tmp" } }

ruby selenium-webdriver 尚不支持此功能，但 python 变体可能支持。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 python 定义 chromedriver selenium 的下载目录的相关文章

只使用 Django 的某些部分？

我喜欢 Django 但对于一个特定的应用程序我只想使用它的一部分但我对 Django 的内部工作原理还不够熟悉所以也许有人可以指出我必须做什么的正确方向查看具体来说我想使用模型和数据库抽象 The 缓存API http doc
量角器：向下滚动

我的页面上有一个按钮当用户向下滚动时可见因此量角器测试给了我一个错误 UnknownError 未知错误元素在点 94 188 处不可单击我尝试使用 browser executeScript window scrollTo 0
Pandas 字符串提取所有匹配项

我正在学习 pandas 系列字符串方法中的正则表达式操作我能够从字符串中提取第一个数字但我的正则表达式与第二个数字不匹配如何捕获这两个数字注意第二行第二个元素在这里是 NAN CODE import pandas as pd d
如何忽略传递给函数的意外关键字参数？

假设我有一些功能 f def f a None print a 现在如果我有一本字典比如dct a Foo 我可以打电话f dct 并得到结果Foo打印但是假设我有一本字典dct2 a Foo b Bar 如果我打电话f dct2
如何使用 django (python) 和 s3 上传文件？

我正在寻找一种将文件上传到 s3 的方法我正在使用 django 我目前正在使用亚马逊的 python 库进行上传以及以下代码 View def submitpicture request fuser request session lo
pip 安装失败，SSL 证书验证失败 (_ssl.c:833)

我无法通过 pip install 安装任何外部 python 模块我已经正确安装了 python 但如果我使用 pip install 它会显示此错误这是我运行后的代码pip install pytesseract C Users 1
Spyder 导入模块出错

我正在尝试在 Spyder 中使用 sklearn 一开始当我尝试导入它时我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的更新模
Django 未在 404 页面上应用应用程序中的 CSS 文件

姜戈3 0 8 Python 3 7 x 我有一个包含一些应用程序的 Django 项目我正在尝试为 400 403 404 500 错误制作一些默认错误页面我已经这样做了并显示了适当的模板但没有任何样式或 JS 在 404 错
Windows Defender 检测 Python EXE 为木马

我制作了一个 Python 脚本将 Windows 目录以 zip 形式邮寄给我我使用 sched 模块添加了一个调度程序每小时重复一次我试图制作一个简单的同步应用程序供个人使用在 Windows 启动时启动我使用将其转换为 e
检测/删除 Python 2 + GTK 中不成对的代理字符

在Python 2 7中我可以成功转换Unicode字符串 abc udc34xyz 转换为 UTF 8 结果是 abc xed xb0 xb4xyz 但是当我将 UTF 8 字符串传递给例如时 pango parse markup or
如何在Python中求和

我想知道如何在 python 中表示总和而不需要像这样的循环here http docs scipy org doc scipy reference tutorial optimize html 我们有 def rosen x The Ro
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
使用 3d 对象作为 3d 散点图中的标记 - Python

使用下面的代码我尝试模拟一个用罐头制成的碗我希望每个标记都是一个罐头最好的方法是什么我真的很感激任何建议谢谢 import pylab import numpy as np from math import pi sin cos
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
PyCharm - 如何挂起所有线程

我们使用 PyCharm 5 0 1 进行多线程调试当它在断点处停止时只有特定线程停止而所有其他线程继续这使得冻结时刻和检查参数值以及其他线程的当前状态变得困难当其中一个线程在断点处停止时是否可以挂起所有线程这在最新的 P
使用 Python 脚本打开特定文件类型？

如何使 Python 脚本成为特定文件类型例如 foo 的默认应用程序例如当我双击 Finder Explorer 中的文件时我希望该文件在 Python 脚本中打开这可以在 Win 和或 OS X 中实现吗如果重要的话该应
如何加速 pandas 字符串函数？

我正在使用 pandas 矢量化 str split 方法来提取从上的拆分返回的第一个元素我还尝试使用 df apply 与 lambda 和 str split 来产生等效的结果使用 timeit 时我发现 df apply 的
如何可视化多维数据上的 kmeans 聚类

我在 mnist 数据集上使用 kmeans 聚类算法并希望可视化聚类后的图到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
如何限制scrapy请求对象？

所以我有一个蜘蛛我认为它正在泄漏内存结果当我检查 telnet 控制台 gt gt gt prefs 时它只是从链接丰富的页面中抓取了太多链接有时它会超过 100 000 个现在我已经一遍又一遍地浏览文档和谷歌但我找不到一种方法
在至少 7 天内连续三天登录该产品的用户

我有一个用于用户参与的数据框 df 如下所示 time stamp user id 2013 01 01 10 05 23 1 2013 01 03 16 35 23 1 2013 01 06 11 06 35 1 2013 01 10 1

随机推荐

iOS 9 Facebook SDK 登录/分享

我在 iOS 9 上使用最新的 Facebook SDK 4 6 时遇到了问题为了授权用户我使用 FBSDKLoginManager 我尝试过这样设置 loginManager loginBehavior FBSDKLoginBehav
使用 python 将分隔字符串列表转换为树/嵌套字典

我正在尝试转换点分隔字符串的列表例如 one two three four one six seven eight five nine ten twelve zero 进入一棵树嵌套列表或字典任何易于遍历的东西真实数据恰好有1到4个
powershell 过滤 csv

由于我是 Powershell 新手因此寻求有关最佳实践的帮助我有一个 csv 文件我想过滤掉 csv 中的每一行但包含未安装的行除外然后我想根据包含计算机列表的单独 csv 文件过滤这些结果并排除包含匹配项的任何行任何
关闭浏览器窗口后是否有可能如何发送 AJAX？ [复制]

这个问题在这里已经有答案了关闭浏览器窗口后是否有可能如何发送AJAX 我有一个使用 JavaScript jQuery 进行移动的浏览器游戏如果我在每次移动后发送 Ajax 这对服务器来说会很困难所以我想在用户关闭窗口或书签时发送
在 C# 中获取重叠的正则表达式匹配

我有正则表达式1 0 1和测试字符串1000010001 我想要 2 场比赛但我发现只找到 1 场 var regex new Regex 1 0 1 var values regex Matches intBinaryString va
用于虚拟机映像的二进制差异和补丁实用程序[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我需要经常发布一些软件并且该软件包含为VMWare磁盘文件即 vmdk文件我想要的是某种二进制差异和补丁实用程序以使生成的增量尽可能小让我
R 中的轮廓图

我有一组数据其中包含项目关联簇轮廓系数如有必要我可以使用更多信息进一步扩充该数据集我想在 R 中生成轮廓图我在这方面遇到了麻烦因为我遇到的示例使用内置的 kmeans 或相关聚类函数并绘制结果我想绕过此步骤并为我自己的
如何在 php.ini 中启用 oci8 (Oracle) 扩展 - PHP 警告：PHP 启动：第 0 行未知

我有 Windows XP 最近安装了 wamp apache mysql php 32 位我测试了安装使用 php 和 apache 连接到 mysql 数据库一切正常现在我需要连接到 Oracle 数据库因此我尝试启用一些扩展
jquery on 带/不带选择器参数和 jquery delegate 有什么区别？

我正在使用jquery 1 10 我想知道这三个函数有什么区别哪个功能更好为什么委托功能的目的是什么 dropdown menu on click show opt menu function alert hello dropdown
毕加索图像缓存

我想下载以下带有毕加索图像缓存的图像下载代码 DownloadImage downloadImage new DownloadImage downloadImage execute advert getImgUrl private clas
在 SwiftUI 中使用时间间隔的 DatePicker

我想在 SwiftUI 中使用 DatePicker 它工作正常并且符合预期我想添加一个时间间隔如所解释的 UIDatePicker 15 分钟增量 Swift DatePicker Please enter a time select
2 个不同的小查询与 1 个带子查询的查询

我有这样的桌子 name personal number Jon 222 Alex 555 Jon 222 Jimmy 999 我需要获取每个名字其中个人号码在表中重复超过 1 个即结果必须是 Jon Jon 因此变体 1 SELEC
Django：覆盖 get_FOO_display()

一般来说我不熟悉 python 重写方法和使用 super 的方式问题是我可以覆盖get FOO display class A models Model unit models IntegerField choices someth
render_to_string 和 response.content.decode() 不匹配

我正在写我的第一个Django跟随本书一起学习应用程序 http chimera labs oreilly com books 1234000000754 ch05 html passing python variables to be r
.htaccess 拒绝所有人不起作用

我的问题是我想拒绝对文件夹的访问但我不能我已经放了一个 htaccess此文件夹中的文件仅包含以下几行 order deny allow deny from all 知道会发生什么吗我得到它这是由于 apache 配置造成的在我的
解决日期时间许可证问题的最佳方法[关闭]

Closed 这个问题需要多问focused 目前不接受答案目前我们正在开发一个基于 Windows 的小型应用程序我们曾经提供为期30天的试用版许可证 30天到期后该产品将无法使用现在这是我的问题想象一下客户于 1 月 1 日
Codeigniter - 会话过期和“记住我”功能

我正在 Codeigniter 中构建记住我功能通常我会看到库项目使用令牌在用户上设置 cookie 该令牌会保存在数据库中并在用户每次访问网站时进行比较在 Codeigniter 中我们可以设置会话过期时间这导致我尝试不同
为什么 System.arraycopy 是 Java 原生的？

我很惊讶地在 Java 源代码中看到 System arraycopy 是一个本机方法当然原因是因为它更快但是代码能够使用哪些本地技巧来使其速度更快呢为什么不直接循环原始数组并将每个指针复制到新数组当然这不是那么慢和麻烦在本机代码
Firebase 管理多个身份验证提供商

我正在开发 Android 应用程序该应用程序在 Facebook Google 和电子邮件密码等 Firebase 的帮助下使用多重身份验证每个身份验证都以不同的方式运作良好但是当我使用 google 登录然后注销时以及稍后当
使用 python 定义 chromedriver selenium 的下载目录

一切都在标题中有没有办法定义与 python 一起使用的 selenium chromedriver 的下载目录尽管进行了很多研究但我还没有找到结论性的东西作为一个新手我已经看到了很多关于 Chromedriver 的所需功能

使用 python 定义 chromedriver selenium 的下载目录

使用 python 定义 chromedriver selenium 的下载目录 的相关文章

随机推荐

热门标签

使用 python 定义 chromedriver selenium 的下载目录的相关文章