我可以使用 Scrapy 填写网页表单吗?

2024-07-03

现在我正在使用 iMacros 从网络中提取数据并填写提交数据的表单。

但 iMacros 是一个昂贵的工具。我需要一个免费的库,并且我已经阅读了有关用于数据挖掘的 Scrapy 的信息。我用它编程有点复杂,但金钱是规则。

问题是我是否可以用Scrapy填写html表单并提交到网页。我不想使用 Javascript,我只想使用 Python 脚本。

我搜索了http://doc.scrapy.org/ http://doc.scrapy.org/但我没有发现任何有关表单提交的信息。


Use the scrapy.http.FormRequest class.

FormRequest 类通过处理 HTML 表单的功能扩展了基本 Request

http://doc.scrapy.org/en/latest/topics/request-response.html#formrequest-objects http://doc.scrapy.org/en/latest/topics/request-response.html#formrequest-objects

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

我可以使用 Scrapy 填写网页表单吗? 的相关文章

随机推荐

  • 如何获取德尔福不同时区的当前时间?

    如何获取德尔福不同时区的当前时间 如果我使用 TidSNTP 它只会提供我所在区域的时区 您可以轻松地将当地时间转换为不同的时区delphi tzdb Delphi 时区数据库 https github com pavkam tzdb 以下
  • 钩住第三个 X 鼠标按钮吗?

    我用 C 编写了一个低级鼠标钩子 它应该捕获 XBUTTON 事件 对于第一个和第二个 xButton 它工作得很好 但我的鼠标上没有关于第三个 xButton 的消息 似乎没有可能的方法来捕获该按钮的事件 我有一个游戏鼠标 在前两 个 x
  • 读取 iso-8859-1 rss feed C# WP7

    我正在尝试读取使用 iso 8859 1 编码的 rss feed 我可以很好地获取所有元素 问题是当我将其放入文本块时 它不会显示所有字符 我不确定我做错了什么 我尝试了在谷歌上找到的一些解决方案 但这对我不起作用 我一定错过了一些东西
  • 读取 iso-8859-1 rss feed C# WP7

    我正在尝试读取使用 iso 8859 1 编码的 rss feed 我可以很好地获取所有元素 问题是当我将其放入文本块时 它不会显示所有字符 我不确定我做错了什么 我尝试了在谷歌上找到的一些解决方案 但这对我不起作用 我一定错过了一些东西
  • 使用 CSS 和 HTML 为不同的段落设置不同的样式

    我有一个关于在段落标签上使用类标签的问题 我希望外部 Css 文件以某种方式设置段落样式 同时将所有其他段落保留为默认样式 我做了一些谷歌搜索和阅读 发现如果我添加 p class somename 然后在 css 文件中我可以使用更改该段
  • 使用 CSS 和 HTML 为不同的段落设置不同的样式

    我有一个关于在段落标签上使用类标签的问题 我希望外部 Css 文件以某种方式设置段落样式 同时将所有其他段落保留为默认样式 我做了一些谷歌搜索和阅读 发现如果我添加 p class somename 然后在 css 文件中我可以使用更改该段
  • 在 docker 容器内挂载 cgroup

    我对一个遵循流程模型的组件进行了 Docker 化 主进程多次分叉自身 我想在 docker 容器内建立一个 cgroup 层次结构 以根据每个进程改变 CPU 和内存限制 有没有一种方法可以在不使用 privileged 或 CAP SY
  • 在 docker 容器内挂载 cgroup

    我对一个遵循流程模型的组件进行了 Docker 化 主进程多次分叉自身 我想在 docker 容器内建立一个 cgroup 层次结构 以根据每个进程改变 CPU 和内存限制 有没有一种方法可以在不使用 privileged 或 CAP SY
  • Visual Studio 项目的预构建任务在 GitLab Runner 中失败

    我编写了一个 Python3 脚本来创建一些 Qt 资源 rcc 和头文件 h 因为该脚本将在 Windows 和 macOS 上执行 所以我将 Qt 工具路径基于一个环境变量 称为QTBIN它指向 Qt 安装文件夹中的二进制文件夹 到目前
  • Visual Studio 项目的预构建任务在 GitLab Runner 中失败

    我编写了一个 Python3 脚本来创建一些 Qt 资源 rcc 和头文件 h 因为该脚本将在 Windows 和 macOS 上执行 所以我将 Qt 工具路径基于一个环境变量 称为QTBIN它指向 Qt 安装文件夹中的二进制文件夹 到目前
  • 使用动态层次结构 SQL Server

    我在 SQL Server 中有以下数据集 层次结构表 Report Immediate Parent Child1 Parent1 Child2 Parent1 Child3 Parent2 Parent1 Grandparent1 Pa
  • 使用动态层次结构 SQL Server

    我在 SQL Server 中有以下数据集 层次结构表 Report Immediate Parent Child1 Parent1 Child2 Parent1 Child3 Parent2 Parent1 Grandparent1 Pa
  • 使用 XDebug 和 PHPStorm 进行远程调试

    首先要做的事情是 服务器是在 Debian 上的 VMPlayer 中运行的 Apache 主机是Windows 7 调试服务器是 XDebug 可通过共享文件夹直接访问文件 重要的 XDebug 在 Apache 和我的 Win7 防火墙
  • 使用 XDebug 和 PHPStorm 进行远程调试

    首先要做的事情是 服务器是在 Debian 上的 VMPlayer 中运行的 Apache 主机是Windows 7 调试服务器是 XDebug 可通过共享文件夹直接访问文件 重要的 XDebug 在 Apache 和我的 Win7 防火墙
  • 如何正确定义 v7 appcompat 依赖项?

    我正在尝试构建一个 继承的 Android 项目 我在用着Ant 和命令行工具 http developer android com tools building building cmdline html 和想法 在 styles xml
  • 如何正确定义 v7 appcompat 依赖项?

    我正在尝试构建一个 继承的 Android 项目 我在用着Ant 和命令行工具 http developer android com tools building building cmdline html 和想法 在 styles xml
  • 我可以在没有 ExecutorService 的情况下使用 Callable 线程吗?

    我可以在没有 ExecutorService 的情况下使用 Callable 线程吗 我们可以在没有 ExecutorService 的情况下使用 Runnable 的实例和 Thread 的子类 并且此代码可以正常工作 但这段代码始终有效
  • 我可以在没有 ExecutorService 的情况下使用 Callable 线程吗?

    我可以在没有 ExecutorService 的情况下使用 Callable 线程吗 我们可以在没有 ExecutorService 的情况下使用 Runnable 的实例和 Thread 的子类 并且此代码可以正常工作 但这段代码始终有效
  • 如何使用 Amazon Web Services (AWS) 同步会话?

    我们使用 Amazon Web Services AWS 并且拥有多个 Web 服务器和一个负载均衡器 Web 服务器的问题是 每个服务器的 SESSION 都是唯一的 我在 SESSION 中保留有关用户的一些信息 同步此信息的正确方法是
  • 我可以使用 Scrapy 填写网页表单吗?

    现在我正在使用 iMacros 从网络中提取数据并填写提交数据的表单 但 iMacros 是一个昂贵的工具 我需要一个免费的库 并且我已经阅读了有关用于数据挖掘的 Scrapy 的信息 我用它编程有点复杂 但金钱是规则 问题是我是否可以用S