一切都在标题中!
有没有办法定义与 python 一起使用的 selenium-chromedriver 的下载目录?
尽管进行了很多研究,但我还没有找到结论性的东西......
作为一个新手,我已经看到了很多关于 Chromedriver 的“所需功能”或“选项”的内容,但没有任何东西可以解决我的问题......(而且我仍然不知道它是否会!)
进一步解释一下我的问题:
我有很多要扫描的网址(200 000),并且对于每个网址都有一个要下载的文件。
我必须创建一个表,其中包含网址、我在其上废弃的信息以及我刚刚为每个网页下载的文件的名称。
对于我必须处理的卷,我创建了打开多个 chromedriver 实例的线程以加快处理速度。
问题是每个下载的文件都到达相同的默认目录,并且我无法再将文件链接到网址...
所以,想法是为每个线程创建一个下载目录来一一管理它们。
如果有人在标题中找到了我的问题的答案,或者找到了识别下载的文件并将其与当前网址链接的解决方法,我将不胜感激!
为 chromedriver1 创建一个新的配置文件,并在该配置文件集中download.default_directory
到所需的位置,并使用 chrome 设置此配置文件chrome.profile
. The selenium-chromedriver
包应该有一些创建新配置文件的方法(至少对于 ruby 来说是这样),因为它们需要一些特殊的处理。
Chromedriver2 不支持设置配置文件。您可以用它设置首选项。如果您想设置下载目录,请按以下步骤操作:
prefs: { download: { default_directory: "/tmp" } }
ruby selenium-webdriver 尚不支持此功能,但 python 变体可能支持。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)