如何创建 python selenium 应用程序及其驱动程序?

2023-12-27

我刚刚开始使用 python 和爬行。我使用selenium和beautifulsoup来解析和抓取页面。我的问题是我是否必须用它制作一个应用程序或将其部署在某些iis服务器上(或我不知道的任何其他方式,比如它是如何工作的)我不知道即使确定它是否以这种方式工作,就像我从移动应用程序方法中用文字表达的那样:)除了我安装的软件包之外,我还需要两个外部东西。 Chrome 驱动程序和 Chrome 二进制文件。 Chrome 驱动程序可用,但 chrome 二进制文件是我安装 chrome 后才获得的。在我用谷歌搜索的少数内容中,我发现我需要使用 docker 来运送它。那么是不是服务器上必须安装chrome才能让这个爬虫工作?如何随应用程序发送该二进制文件?同样,我使用的是linux,所以要部署的服务器必须是linux的?或者我如何实现它。有人可以帮助我创建此爬虫的应用程序并将其提供给其他人吗?谢谢 :)


好吧,我自己尝试了一下,结果成功了。那么服务器只不过是虚拟机,对吗?
因此,您可以做的是将脚本转换为可执行文件,或者不打包而保留它。另外,将 chrome 驱动程序保存在同一目录中,然后运行它python.
另外,如果您使用的是新的虚拟机,那么只需在那里安装 chrome 即可。如果您的虚拟机在 Ubuntu 上运行,那么您可以键入以下命令来安装 chrome。

wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
sudo dpkg -i google-chrome-stable_current_amd64.deb

您可以发表评论以获取进一步的说明。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何创建 python selenium 应用程序及其驱动程序? 的相关文章

  • 如何通过xpath检索下拉列表中的文本

    我想指定我的网页元素的 xpath
  • 如何避免使用 python 处理空的标准输入?

    The sys stdin readline 返回之前等待 EOF 或新行 所以如果我有控制台输入 readline 等待用户输入 相反 我想打印帮助并在没有需要处理的情况下退出并显示错误 而不是等待用户输入 原因 我正在寻找一个Pytho
  • 使用python查找txt文件中字母出现的次数

    我需要从 txt 文件中读取该字母并打印 txt 文件中出现的次数 到目前为止 我已经能够在一行中打印内容 但计数有问题 有人可以指导吗 infile open grades txt content infile read for char
  • Virtualenv 在 OS X Yosemite 上失败并出现 OSError

    我最近更新到 OSX Yosemite 现在无法使用virtualenv pip 每当我执行 virtualenv env 它抛出一个 OSError Command Users administrator ux env bin pytho
  • 将 numpy 数组合并为单个 int

    numpy 数组怎么可以这样 10 22 37 45 转换为单个 int32 数字 如下所示 10223745 这可以工作 gt gt gt int join map str 10 22 37 45 10223745 基本上你使用map s
  • Mypy 无法从文字列表推断项目的类型

    我有一个变量x和一个文字列表 例如 0 1 2 我想转换x这些文字之一 如果x在列表中 我将其退回 否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
  • 从 Azure ML 实验中访问 Azure Blob 存储

    Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块 但是 我需要将 JSON 文件写入 blob 存储 由于没有模块可以执行此操作 因此我尝试在Ex
  • 如何通过 python 多处理利用所有核心

    我一直在摆弄Python的multiprocessing现在已经使用了一个多小时的功能 尝试使用并行化相当复杂的图形遍历函数multiprocessing Process and multiprocessing Manager import
  • 使用python从gst管道抓取帧到opencv

    我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好 以下命
  • 在 python pandas 中,如何保存“网格图”?

    我对 pandas 绘图工具很陌生 在文档中 以下命令非常方便 myplot rts ret hist bins 50 by rts primary mic 然而 当我尝试从图中获取图形参考并保存它时 问题就出现了 myfigure myp
  • 使用 for 循环创建一系列元组

    我已经搜索过 但找不到答案 尽管我确信它已经存在了 我对 python 很陌生 但我以前用其他语言做过这种事情 我正在以行形式读取数据文件 我想将每行数据存储在它自己的元组中 以便在 for 循环之外访问 tup i inLine wher
  • 从 Flask 运行 NPM 构建

    我有一个 React 前端 我想在与我的 python 后端 API 相同的源上提供服务 我正在尝试使用 Flask 来实现此目的 但我遇到了 Flask 找不到我的静态文件的问题 我的前端构建是用生成的npm run build in s
  • 如何查找或安装适用于 Python 的主题 tkinter ttk

    过去 3 个月我一直在制作一个机器人 仅用代码就可以完美运行 现在我的下一个目标是为它制作一个 GUI 但是我发现了一些障碍 主要的一个是能够看起来不像一个 30 年前的程序 我使用的是 Windows 7 我仅使用 Python 3 3
  • Ubuntu systemd 自定义服务因 python 脚本而失败

    希望获得有关 Ubuntu 中的 systemd 守护进程服务的一些帮助 我写了一个 python 脚本来禁用 Dell XPS 上的触摸屏 这更像是一个问题 而不是一个有用的功能 该脚本可以工作 但我不想一直启动它 这就是为什么我想到编写
  • 在Raspberry pi上升级skimage版本

    我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包 然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本 有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
  • 为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义?

    类创建似乎从来没有re 定义 dict and weakref class属性 即 如果它们已经存在于超类的字典中 则它们不会添加到其子类的字典中 但始终re 定义 doc and module class属性 为什么 gt gt gt c
  • Python bug - 或者我的愚蠢 - 扫描字符串文字时 EOL

    我看不出以下两行之间有显着差异 然而第一个解析 而后者则不解析 In 5 n Axis of Awesome In 6 n Axis of Awesome File
  • AWS Lambda 不读取环境变量

    我正在编写一个 python 脚本来查询 Qualys API 中的漏洞元数据 我在 AWS 中将其作为 lambda 函数执行 我已经在控制台中设置了环境变量 但是当我执行函数时 出现以下错误 module initialization
  • 如何编写一个接受 int 或 float 的 C 函数?

    我想用 C 语言创建一个扩展 Python 的函数 该函数可以接受 float 或 int 类型的输入 所以基本上 我想要f 5 and f 5 5 成为可接受的输入 我认为我不能使用if PyArg ParseTuple args i v
  • pandas 中数据帧中的随机/洗牌行

    我目前正在尝试找到一种方法来按行随机化数据框中的项目 我在 pandas 中按列洗牌 排列找到了这个线程 在 pandas 中对 DataFrame 进行改组 排列 https stackoverflow com questions 157

随机推荐

  • Python - 从串行端口数据逐行读取到可用的列表中

    我的目标是编写一个代码 该代码将无限期地监听和读取串行端口 每隔几秒就会产生此输出 串口输出 aaaa abcd 0 0 0 printf d n data 0 2387 printf d n data 1 14 9 244 44 108
  • Mongoose 按日期查询

    我想用这样的文档结构查询 mongoDB var ExampleSchema mongoose Schema createdAt type Date default Date now validUntil Date name String
  • 具有自定义高度的自定义 UINavigationBar 会导致 UIBarButtonItem 的位置错误

    我创建了自己的 UINavigationBar 子类 以便启用高于 44 像素的自定义背景 我通过重写这两种方法来做到这一点 void drawRect CGRect rect self backgroundImage drawInRect
  • 使用java对整数进行加密

    我正在尝试使用 java security 和 javax crypto 加密 java 中的一些整数 问题似乎是 Cipher 类仅加密字节数组 我无法直接将整数转换为字节字符串 或者可以吗 做这个的最好方式是什么 我应该将整数转换为字符
  • Angular Fire - 没有 InjectionToken 的提供者(angularfire2.app.options)

    Context 我正在与Ionic 和 Angular Angularfire 和 Firebase 我已经做了一个连接成功 to the Firestore数据库我能够操纵数据 规格 Ionic CLI 6 18 1 Ionic Fram
  • Three.js 不拉伸网格纹理(图像) - 使其覆盖其容器

    我有一个容器 我使用 Three js 和网格应用图像 这就是我将网格应用到场景的方式 this els el el image el querySelector ch image lt size of container image is
  • Keras - 如何使用 KerasRegressor 执行预测?

    我是机器学习新手 我正在尝试处理 Keras 来执行回归任务 我已经实现了这段代码 基于this http machinelearningmastery com regression tutorial keras deep learning
  • 如何执行缺失值的 RMSE?

    我有一个巨大的数据集 有 679 行和 16 列 其中有 30 的缺失值 因此 我决定使用 impute 包中的函数 impute knn 来估算缺失值 并得到一个包含 679 行和 16 列但没有缺失值的数据集 但现在我想使用 RMSE
  • 未为子资源调用 JAX-RS DynamicFilter

    根据文档 应该可以使用DynamicFeature https docs oracle com javaee 7 api javax ws rs container DynamicFeature html对于资源和子资源 作为效果 我希望每
  • 从关闭的 NetworkStream 读取不会导致任何异常

    我正在尝试创建一个相当简单的客户端服务器应用程序 但为了进行通信 我想使用二进制序列化对象 通信本身看起来相当不错 但是当我关闭客户端的流时 服务器并没有真正注意到它并继续尝试读取流 服务器端 Server 类 在单独的线程中执行 监听连接
  • _AppStart.cshtml、PackageManager、WebMatrix

    我认为将 SimpleMembersihp 添加到 MVC4 Web 是一件简单的事情 并非如此 模板化代码 例如 C 非常适合支持它 但 web config 大多是不可知的 缺乏配置任何特定安全机制的元素 我正在关注 Scott All
  • 在 XSL 翻译中更改 XML 文件的命名空间

    所以我有一个输入文件 它在默认命名空间中使用我公司的命名空间 xmlns companyURL 但我希望我的输出文件使用默认命名空间以外的其他内容 xmlns cmp companyURL 所以我使用以下方法构建我的文件cmp命名空间 但我
  • numpy 数组到文件,np.savetxt

    当我使用 np savetxt file txt arr1 arr2 arr3 时 将多个 numpy 数组保存到文件的最佳方法是什么 数组按列保存 而不是按行保存 因此很难导入到 Excel 中 如何以更标准的方式保存数组 Thanks
  • 如何屏蔽文本中的信用卡号掩码?

    我的网站上有一个表格 我的客户用此表格向我发送消息 有时他们会在消息上写下信用卡号码 所以这非常关键 我想屏蔽这些信用卡号码 但卡号当然不会定期出现 示例1 1111222233334444 示例2 4444 3333 2222 1111
  • 更改传单中标记的大小

    我在传单的地图上有一个标记 var centerMarker L marker centerPoint title unselected bindLabel schools i 0 centerMarker on click selectM
  • 为什么应该在 Android 中使用自定义内容提供程序?

    使用自定义内容提供商有哪些优势 为什么这样的内容提供者优于包装 SQL 查询的普通类 内容提供程序可以从其他进程中使用 并且是 Android 上的某些机制 例如全局搜索 所需要的 还有一些可用的类可以帮助您处理内容提供 者 从而节省您管理
  • .NET 6:如何在控制台应用程序启动中使用方法重载?

    NET 6 在控制台应用程序 Startup 类中提供了样板删除功能 我尝试运行这个简单的测试代码 Console WriteLine Hello World static void Test int a int b static void
  • 对数时间并行减少

    Given n部分和 可以在 log2 并行步骤中对所有部分和进行求和 例如 假设有八个线程 有八个部分和 s0 s1 s2 s3 s4 s5 s6 s7 这可以减少log2 8 3像这样的连续步骤 thread0 thread1 thre
  • 我可以让 html.HiddenFor / Html.Hidden 创建一个 id 还是应该手动创建它?

    我这样做 它创建了一个隐藏的输入 但没有id just name 我需要id 我可以让它创建一个id also atm 我这样做 一种更干净的方法是 但除此之外 你现有的方法就可以了 如果您确实想要一个简单的语法 您可以创建一个调用 Hid
  • 如何创建 python selenium 应用程序及其驱动程序?

    我刚刚开始使用 python 和爬行 我使用selenium和beautifulsoup来解析和抓取页面 我的问题是我是否必须用它制作一个应用程序或将其部署在某些iis服务器上 或我不知道的任何其他方式 比如它是如何工作的 我不知道即使确定