如何创建 python selenium 应用程序及其驱动程序？

2023-12-27

我刚刚开始使用 python 和爬行。我使用selenium和beautifulsoup来解析和抓取页面。我的问题是我是否必须用它制作一个应用程序或将其部署在某些iis服务器上（或我不知道的任何其他方式，比如它是如何工作的）我不知道即使确定它是否以这种方式工作，就像我从移动应用程序方法中用文字表达的那样:)除了我安装的软件包之外，我还需要两个外部东西。 Chrome 驱动程序和 Chrome 二进制文件。 Chrome 驱动程序可用，但 chrome 二进制文件是我安装 chrome 后才获得的。在我用谷歌搜索的少数内容中，我发现我需要使用 docker 来运送它。那么是不是服务器上必须安装chrome才能让这个爬虫工作？如何随应用程序发送该二进制文件？同样，我使用的是linux，所以要部署的服务器必须是linux的？或者我如何实现它。有人可以帮助我创建此爬虫的应用程序并将其提供给其他人吗？谢谢：）

好吧，我自己尝试了一下，结果成功了。那么服务器只不过是虚拟机，对吗？
因此，您可以做的是将脚本转换为可执行文件，或者不打包而保留它。另外，将 chrome 驱动程序保存在同一目录中，然后运行它python.
另外，如果您使用的是新的虚拟机，那么只需在那里安装 chrome 即可。如果您的虚拟机在 Ubuntu 上运行，那么您可以键入以下命令来安装 chrome。

wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
sudo dpkg -i google-chrome-stable_current_amd64.deb

您可以发表评论以获取进一步的说明。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

selenium

如何创建 python selenium 应用程序及其驱动程序？的相关文章

如何通过xpath检索下拉列表中的文本

我想指定我的网页元素的 xpath
如何避免使用 python 处理空的标准输入？

The sys stdin readline 返回之前等待 EOF 或新行所以如果我有控制台输入 readline 等待用户输入相反我想打印帮助并在没有需要处理的情况下退出并显示错误而不是等待用户输入原因我正在寻找一个Pytho
使用python查找txt文件中字母出现的次数

我需要从 txt 文件中读取该字母并打印 txt 文件中出现的次数到目前为止我已经能够在一行中打印内容但计数有问题有人可以指导吗 infile open grades txt content infile read for char
Virtualenv 在 OS X Yosemite 上失败并出现 OSError

我最近更新到 OSX Yosemite 现在无法使用virtualenv pip 每当我执行 virtualenv env 它抛出一个 OSError Command Users administrator ux env bin pytho
将 numpy 数组合并为单个 int

numpy 数组怎么可以这样 10 22 37 45 转换为单个 int32 数字如下所示 10223745 这可以工作 gt gt gt int join map str 10 22 37 45 10223745 基本上你使用map s
Mypy 无法从文字列表推断项目的类型

我有一个变量x和一个文字列表例如 0 1 2 我想转换x这些文字之一如果x在列表中我将其退回否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
从 Azure ML 实验中访问 Azure Blob 存储

Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块但是我需要将 JSON 文件写入 blob 存储由于没有模块可以执行此操作因此我尝试在Ex
如何通过 python 多处理利用所有核心

我一直在摆弄Python的multiprocessing现在已经使用了一个多小时的功能尝试使用并行化相当复杂的图形遍历函数multiprocessing Process and multiprocessing Manager import
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
在 python pandas 中，如何保存“网格图”？

我对 pandas 绘图工具很陌生在文档中以下命令非常方便 myplot rts ret hist bins 50 by rts primary mic 然而当我尝试从图中获取图形参考并保存它时问题就出现了 myfigure myp
使用 for 循环创建一系列元组

我已经搜索过但找不到答案尽管我确信它已经存在了我对 python 很陌生但我以前用其他语言做过这种事情我正在以行形式读取数据文件我想将每行数据存储在它自己的元组中以便在 for 循环之外访问 tup i inLine wher
从 Flask 运行 NPM 构建

我有一个 React 前端我想在与我的 python 后端 API 相同的源上提供服务我正在尝试使用 Flask 来实现此目的但我遇到了 Flask 找不到我的静态文件的问题我的前端构建是用生成的npm run build in s
如何查找或安装适用于 Python 的主题 tkinter ttk

过去 3 个月我一直在制作一个机器人仅用代码就可以完美运行现在我的下一个目标是为它制作一个 GUI 但是我发现了一些障碍主要的一个是能够看起来不像一个 30 年前的程序我使用的是 Windows 7 我仅使用 Python 3 3
Ubuntu systemd 自定义服务因 python 脚本而失败

希望获得有关 Ubuntu 中的 systemd 守护进程服务的一些帮助我写了一个 python 脚本来禁用 Dell XPS 上的触摸屏这更像是一个问题而不是一个有用的功能该脚本可以工作但我不想一直启动它这就是为什么我想到编写
在Raspberry pi上升级skimage版本

我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
Python bug - 或者我的愚蠢 - 扫描字符串文字时 EOL

我看不出以下两行之间有显着差异然而第一个解析而后者则不解析 In 5 n Axis of Awesome In 6 n Axis of Awesome File
AWS Lambda 不读取环境变量

我正在编写一个 python 脚本来查询 Qualys API 中的漏洞元数据我在 AWS 中将其作为 lambda 函数执行我已经在控制台中设置了环境变量但是当我执行函数时出现以下错误 module initialization
如何编写一个接受 int 或 float 的 C 函数？

我想用 C 语言创建一个扩展 Python 的函数该函数可以接受 float 或 int 类型的输入所以基本上我想要f 5 and f 5 5 成为可接受的输入我认为我不能使用if PyArg ParseTuple args i v
pandas 中数据帧中的随机/洗牌行

我目前正在尝试找到一种方法来按行随机化数据框中的项目我在 pandas 中按列洗牌排列找到了这个线程在 pandas 中对 DataFrame 进行改组排列 https stackoverflow com questions 157

随机推荐

Python - 从串行端口数据逐行读取到可用的列表中

我的目标是编写一个代码该代码将无限期地监听和读取串行端口每隔几秒就会产生此输出串口输出 aaaa abcd 0 0 0 printf d n data 0 2387 printf d n data 1 14 9 244 44 108
Mongoose 按日期查询

我想用这样的文档结构查询 mongoDB var ExampleSchema mongoose Schema createdAt type Date default Date now validUntil Date name String
具有自定义高度的自定义 UINavigationBar 会导致 UIBarButtonItem 的位置错误

我创建了自己的 UINavigationBar 子类以便启用高于 44 像素的自定义背景我通过重写这两种方法来做到这一点 void drawRect CGRect rect self backgroundImage drawInRect
使用java对整数进行加密

我正在尝试使用 java security 和 javax crypto 加密 java 中的一些整数问题似乎是 Cipher 类仅加密字节数组我无法直接将整数转换为字节字符串或者可以吗做这个的最好方式是什么我应该将整数转换为字符
Angular Fire - 没有 InjectionToken 的提供者（angularfire2.app.options）

Context 我正在与Ionic 和 Angular Angularfire 和 Firebase 我已经做了一个连接成功 to the Firestore数据库我能够操纵数据规格 Ionic CLI 6 18 1 Ionic Fram
Three.js 不拉伸网格纹理（图像） - 使其覆盖其容器

我有一个容器我使用 Three js 和网格应用图像这就是我将网格应用到场景的方式 this els el el image el querySelector ch image lt size of container image is
Keras - 如何使用 KerasRegressor 执行预测？

我是机器学习新手我正在尝试处理 Keras 来执行回归任务我已经实现了这段代码基于this http machinelearningmastery com regression tutorial keras deep learning
如何执行缺失值的 RMSE？

我有一个巨大的数据集有 679 行和 16 列其中有 30 的缺失值因此我决定使用 impute 包中的函数 impute knn 来估算缺失值并得到一个包含 679 行和 16 列但没有缺失值的数据集但现在我想使用 RMSE
未为子资源调用 JAX-RS DynamicFilter

根据文档应该可以使用DynamicFeature https docs oracle com javaee 7 api javax ws rs container DynamicFeature html对于资源和子资源作为效果我希望每
从关闭的 NetworkStream 读取不会导致任何异常

我正在尝试创建一个相当简单的客户端服务器应用程序但为了进行通信我想使用二进制序列化对象通信本身看起来相当不错但是当我关闭客户端的流时服务器并没有真正注意到它并继续尝试读取流服务器端 Server 类在单独的线程中执行监听连接
_AppStart.cshtml、PackageManager、WebMatrix

我认为将 SimpleMembersihp 添加到 MVC4 Web 是一件简单的事情并非如此模板化代码例如 C 非常适合支持它但 web config 大多是不可知的缺乏配置任何特定安全机制的元素我正在关注 Scott All
在 XSL 翻译中更改 XML 文件的命名空间

所以我有一个输入文件它在默认命名空间中使用我公司的命名空间 xmlns companyURL 但我希望我的输出文件使用默认命名空间以外的其他内容 xmlns cmp companyURL 所以我使用以下方法构建我的文件cmp命名空间但我
numpy 数组到文件，np.savetxt

当我使用 np savetxt file txt arr1 arr2 arr3 时将多个 numpy 数组保存到文件的最佳方法是什么数组按列保存而不是按行保存因此很难导入到 Excel 中如何以更标准的方式保存数组 Thanks
如何屏蔽文本中的信用卡号掩码？

我的网站上有一个表格我的客户用此表格向我发送消息有时他们会在消息上写下信用卡号码所以这非常关键我想屏蔽这些信用卡号码但卡号当然不会定期出现示例1 1111222233334444 示例2 4444 3333 2222 1111
更改传单中标记的大小

我在传单的地图上有一个标记 var centerMarker L marker centerPoint title unselected bindLabel schools i 0 centerMarker on click selectM
为什么应该在 Android 中使用自定义内容提供程序？

使用自定义内容提供商有哪些优势为什么这样的内容提供者优于包装 SQL 查询的普通类内容提供程序可以从其他进程中使用并且是 Android 上的某些机制例如全局搜索所需要的还有一些可用的类可以帮助您处理内容提供者从而节省您管理
.NET 6：如何在控制台应用程序启动中使用方法重载？

NET 6 在控制台应用程序 Startup 类中提供了样板删除功能我尝试运行这个简单的测试代码 Console WriteLine Hello World static void Test int a int b static void
对数时间并行减少

Given n部分和可以在 log2 并行步骤中对所有部分和进行求和例如假设有八个线程有八个部分和 s0 s1 s2 s3 s4 s5 s6 s7 这可以减少log2 8 3像这样的连续步骤 thread0 thread1 thre
我可以让 html.HiddenFor / Html.Hidden 创建一个 id 还是应该手动创建它？

我这样做它创建了一个隐藏的输入但没有id just name 我需要id 我可以让它创建一个id also atm 我这样做一种更干净的方法是但除此之外你现有的方法就可以了如果您确实想要一个简单的语法您可以创建一个调用 Hid
如何创建 python selenium 应用程序及其驱动程序？

我刚刚开始使用 python 和爬行我使用selenium和beautifulsoup来解析和抓取页面我的问题是我是否必须用它制作一个应用程序或将其部署在某些iis服务器上或我不知道的任何其他方式比如它是如何工作的我不知道即使确定

如何创建 python selenium 应用程序及其驱动程序？

如何创建 python selenium 应用程序及其驱动程序？ 的相关文章

随机推荐

热门标签

如何创建 python selenium 应用程序及其驱动程序？的相关文章