Python 中的机械化 - 提交后重定向不起作用

2024-03-17

我刚刚开始在 Python 中使用 mechanize，但已经遇到了一些问题。我在 StackOverflow 和 Google 上查看过，我看到人们说文档很棒，并且应该很容易让它工作，但我想我不知道如何查找该文档，因为我所有的可以找到的代码示例并没有真正教我如何做我想做的特定事情。如果有人可以向我指出此类文档，我很乐意自己阅读并解决我的问题。

对于实际问题，我尝试通过以表单发送用户名和密码信息来登录网站。当信息正确时，我通常会被重定向，但它在机械化中不起作用。

这是我没有得到的部分，因为如果我在调用提交后立即打印页面的html内容，页面会显示一个变量，表明身份验证有效。如果我将密码更改为不正确的密码，则 html 会显示一条消息“无效凭据”，就像我正常浏览该网站时一样。

这是我如何做到这一点的代码示例。请记住，这可能是完全错误的，因为我只是尝试应用我在示例中发现的内容：

import mechanize
import cookielib

# Start Browser
br = mechanize.Browser()
cj = cookielib.LWPCookieJar()

br.set_cookiejar(cj)

br.set_handle_equiv(True)
br.set_handle_redirect(True)
br.set_handle_referer(True)
br.set_handle_robots(False)

br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)

br.open('http://www.complexejuliequilles.com/')


for l in br.links(url_regex='secure'):
    br.follow_link(l)

br.select_form('form1')

br.form['fldUsername'] = 'myUsername'
br.form['fldPassword'] = 'myPassword'
br.submit()

在这个特定的例子中，我打开http://www.complexejuliequilles.com http://www.complexejuliequilles.com，然后我点击底部带有“管理”文本的链接，在表单中输入我的凭据，然后提交。通常情况下，我会被重定向到我所在的第一页，但有更多按钮只能由管理员使用。我想单击其中一个链接来填写另一个表单，以添加用户列表，其中我有他们的电子邮件地址、姓名等。

我缺少什么简单的东西吗？我想我已经掌握了基础知识，但我对库的了解不够，无法找出重定向出了什么问题。

http://wwwsearch.sourceforge.net/mechanize/documentation.html http://wwwsearch.sourceforge.net/mechanize/documentation.html

避免直接使用“_http”。名称中的第一个下划线告诉我们，开发人员将其视为私有的东西，您可能不需要它。

In [20]: mechanize.HTTPRefreshProcessor is mechanize._http.HTTPRefreshProcessor
Out[20]: True

在打开 URL 之前放置了一些您并不真正需要的内容。例如： mechanize.Browser() 不是 urllib，它已经为您管理 cookie。您不应该回避 robots.txt。您可以通过查看哪些处理程序是默认的来遵循更多“约定优于配置”：

mechanize.Browser().handlers

您可能在该列表中有 mechanize.HTTPRedirectHandler （我有），如果没有：

br.set_handle_redirect(mechanize.HTTPRedirectHandler)

for 循环很奇怪，看起来您正在循环内更改其迭代器（打开的 URL 内的链接）（浏览器打开另一个 URL）。我首先认为您想要在存在“安全”URL 匹配时递归单击。错误取决于 links() 生成器的实现方式（可能它遵循固定的 br.response() 实例），但我认为您只想遵循第一个匹配的链接：

In [50]: br.follow_link(url_regex="secure") # No loops

我不知道您需要什么样的重定向/刷新。 JavaScript 改变 window.location.href？如果是这样，mechanize 不会这样做，除非你自己解析 JavaScript。

您可以通过以下方式获取有关上次打开 URL 的“原始”信息：

last_response = br.response() # This is returned by br.open(...) too
http_header_dict = last_response.info().dict
html_string_list = last_response.readlines()
html_data = "".join(html_string_list)

即使它是 JavaScript，您也可以通过在 html_data 中定位它、使用 html_data.find()、正则表达式、BeautifulSoup 等来获取重定向 URL。

PEP8 注意：避免使用孤立的“l”（下方的“L”）作为变量，根据使用的字体和上下文，它可能会被错误地视为“one”或“I”（上方的“i”）。您应该使用“L”或其他名称。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 中的机械化 - 提交后重定向不起作用的相关文章

如何删除 PyCharm 中的项目？

如果我关闭一个项目然后删除该项目文件夹则在 PyCharm 重新启动后会再次创建一个空的项目文件夹只需按顺序执行以下步骤即可他们假设您当前在 PyCharm 窗口中打开了该项目单击文件 gt 关闭项目关闭项目在 PyCha
从字典的元素创建 Pandas 数据框

我正在尝试从字典创建一个 pandas 数据框字典设置为 nvalues y1 1 2 3 4 y2 5 6 7 8 y3 a b c d 我希望数据框仅包含 y1 and y2 到目前为止我可以使用 df pd DataFrame fr
如何使用 python 的 http.client 准确读取一个响应块？

Using http client在 Python 3 3 或任何其他内置 python HTTP 客户端库中如何一次读取一个分块 HTTP 响应一个 HTTP 块我正在扩展现有的测试装置使用 python 编写 http clie
尝试从网页Python和BeautifulSoup获取编码

我试图从网页检索字符集这会一直改变目前我使用 beautifulSoup 来解析页面然后从标题中提取字符集这工作正常直到我遇到一个网站到目前为止我的代码以及与其他页面一起使用的代码是 def get encoding soup
为什么第二个 request.session cookies 返回空？

我想使用 requests Session post 登录网站但是当我已经登录主页然后进入帐户页面时看来cookies还没有保存因为cookies是空的而且我无法进入正确的帐户页面 import requests from bs4
使用 Pytest 的参数化添加测试功能的描述

当其中一个测试失败时可以在测试正在测试的内容的参数化中添加描述快速了解测试失败的原因有时您不知道测试失败的原因您必须查看代码通过每个测试的描述您就可以知道例如 pytest mark parametrize num1 num2
以类型化内存视图作为成员的结构定义

目前我正在尝试让一个具有类型化内存视图的结构能够工作例如 ctypedef struct node unsigned int inds 如果 inds 不是内存视图据我所知它可以完美地工作然而通过内存视图并使用类似的东西 def
numpy：高效执行数组的复杂重塑

我正在将供应商提供的大型二进制数组读入 2D numpy 数组 tempfid M N load data data numpy fromfile file dirname fid dtype numpy dtype i4 convert
将 pandas 剪切操作转换为常规字符串

我明白了 pandas cut 操作的输出 0 0 20 1 0 20 2 0 20 3 0 20 4 0 20 5 0 20 6 0 20 7 0 20 8 0 20 9 0 20 如何将 0 20 转换为 0 20 我正在这样做 str
如何使用 Homebrew 在 Mac 上安装 Python 2 和 3？

我需要能够在 Python 2 和 3 之间来回切换我如何使用 Homebrew 来做到这一点因为我不想弄乱路径并陷入麻烦现在我已经通过 Homebrew 安装了 2 7 我会用pyenv https github com yyuu
如何在 Python 中的函数入口、内部和退出处进行日志记录

我希望能够使用 Python 日志记录工具在我的代码中进行简单且一致的日志记录我能够执行以下操作我希望所有现有未来的模块和函数都有输入和完成日志消息我不想添加相同的代码片段来定义日志记录参数如下所示don t want t
将字符串中的随机字符转换为大写

我尝试随机附加文本字符串这样就不只是有像这样的输出 gt gt gt david 我最终会得到类似的东西 gt gt gt DaViD gt gt gt dAviD 我现在的代码是这样的 import random import stri
Python守护进程：保持日志记录

我有一个将一些数据记录到磁盘的脚本 logging basicConfig filename davis debug log level logging DEBUG logging basicConfig filename davis er
基于值而不是类型的单次调度

我在 Django 上构建 SPA 并且有一个庞大的功能其中包含许多功能if用于检查我的对象字段的状态名称的语句像这样 if self state new do some logic if self state archive do s
如何通过函数注释指示函数需要函数作为参数，或返回函数？

您可以使用函数注释 http www python org dev peps pep 3107 在python 3中指示参数和返回值的类型如下所示 def myfunction name str age int gt str return
高效创建抗锯齿圆形蒙版

我正在尝试创建抗锯齿加权而不是布尔圆形掩模以制作用于卷积的圆形内核 radius 3 no of pixels to be 1 on either side of the center pixel shall be decimal a
将时间添加到日期时间

我有一个像这样的日期字符串然后使用strptime 所以就像这样 my time datetime datetime strptime 07 05 15 m d Y 现在我想添加 23 小时 59 分钟my time 我努力了 timed
在matlab中，如何读取python pickle文件？

在 python 中我生成了一个 p 数据文件 pickle dump allData open myallData p wb 现在我想在Matlab中读取myallData p 我的Matlab安装在Windows 8下其中没有Pyt
如何在 scikit 中加载 CSV 数据并将其用于朴素贝叶斯分类

尝试加载自定义数据以在 Scikit 中执行 NB 分类需要帮助将示例数据加载到 Scikit 中然后执行 NB 如何加载目标的分类值使用相同的数据进行训练和测试或使用完整的数据集进行测试 Sl No Member ID Membe
如何使用xlwt设置文本颜色

我无法找到有关如何设置文本颜色的文档在 xlwt 中如何完成以下操作 style xlwt XFStyle bold font xlwt Font font bold True style font font background col

随机推荐

PyGObject 中的 TreeView 拖放：未调用拖拽数据删除？

我正在研究如何在 PyGObject 的 TreeView 中进行拖放的示例我有一些不明白的事情为什么是drag data delete函数从未被调用这是独立的示例 from gi repository import Gtk Gdk
Google 应用程序脚本在 Google 表单提交后触发两次

我的脚本在 Google 表单和链接的表格中运行两次时遇到问题我有一个表单提交触发器如果我删除此触发器则脚本根本不会在表单提交上运行如果我重新添加触发器它将触发两次但工作表响应中只有一个表单提交我想也许我点击了表单提交两次但
使用对数标度在 R 中实现随机游走 Metropolis Hastings

Context 我几乎到处寻找但找不到使用对数尺度的随机游走 Metropolis Hastings 算法的完整实现通过对数尺度我的意思是我们正在使用目标分布的对数通常是后验为了简单起见我在这里有一个最小的工作示例R但我也会很高
在选择器列表中使用 @at-root 和 &

我有一个 CSS 我尝试将其迁移到 SASS 其中包含许多结构例如 btn primary hover btn primary focus btn primary active btn primary active open dropdo
如何在executeBatch()之前检查Prepared Statement是否有批次？

我对Java中的Prepared Statement有疑问因为我对此了解不多我有一个必须使用PreparedStatement 的用例但我在编写代码之前只是想 while if preparedStatement setString
如何标记 Perl 源代码？

我有一些合理的未混淆的 Perl 源文件我需要一个标记生成器它将其分割为标记并返回每个标记的标记类型例如对于脚本 print Hello World n 它会返回这样的内容关键字5字节空白 1 字节双引号字符串 17 字节
集成测试中的 MVC 策略覆盖

我正在为 MVC 应用程序添加集成测试我们的许多端点都应用了策略例如 namespace WorkProject Route A Route public class WorkController Controller HttpPost
根据另一个 DataFrame 选择一个 DataFrame 的列

我试图根据另一个 DataFrame 的列选择 DataFrame 的子集数据框看起来像这样 a b c d 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11 3 12 13 14 15 a b 0 0 1 1 2 3 2
在 Android 上同时与多个 BLE 设备进行稳健通信

尽管没有记录但使用 Android BLE api 的传统观点是某些操作例如读写特性和描述符应该一次完成一个尽管某些设备比其他设备更宽松但是我不清楚此策略是否应仅适用于单个连接还是适用于所有活动连接我听说最好一次启动与一
Cython 和 Python 项目测试驱动开发和 .pyx 文件结构建议

构建一个的最佳方式是什么python cython项目以便我可以对驻留在其中的代码进行单元测试 pyx文件是否可以就地对该代码进行单元测试或者重构可以让我以另一种方式实现这一目标我是新来的cython但有 Python TDD mo
EnableAutoConfiguration spring 注解如何工作？

I am no fan of gross over abstractions And i think Spring has committed a major felony 但如果有人可以解释自动配置背后的算法我这次愿意忽略它看看s
检查Python中每行的运行时间

我已经编写了一个 Python 脚本但运行它所花费的时间比我预期的要长得多并且我在脚本中没有明显的候选行占用运行时间我可以在代码中添加任何内容来检查运行每一行需要多长时间吗非常感谢您尝试过通过分析运行 python 吗 pytho
无法在 M1 Macbook 上启动 Cloud Run 容器

我还没有在我的 M1 Macbook 上安装 Rosetta 安装了 Docker 和所有 deps 这甚至工作了几次但不确定是什么突然导致了这个错误 Starting to run the app using configuration
反应原生动画：滚动减慢时屏幕抖动

我在用Animated View更改标题高度它在 ios 中运行良好但在 android 中当我缓慢滚动时整个视图都在晃动 1 首先我设置状态 this state scrollY new Animated Value 0 2 内部
无需用户交互即可从服务器驱动 API 文档上传

我正在 Django 中制作应用程序该应用程序从表单上传文件并将其发送到谷歌驱动器所以基本上我不知道需要用户的信息或让他们在谷歌上进行身份验证从我们使用的快速入门指南authorize url to get code但我不需要oaut
用 Java 洗牌

我还有另一项练习要做我确实需要帮助我什至不知道我的 isFlush 方法是否有效因为出于某种原因我的套牌没有洗牌和发牌我完全陷入困境有人可以帮助我或指出我正确的方向或其他什么吗这是练习练习 12 5 本练习的目标是编写一个程
Express 中使用 cookie 会话保持登录选项

我想要一个保持登录状态选项例如 Gmail 提供的选项这样用户可以决定如果他们想在之前关闭浏览器会话后打开新的浏览器会话时保持会话打开查看我看到的 github 问题cookie session 组件不提供更新的方法maxAge
需要asp.net中的作业调度程序

我们有一个网站需要一个调度程序来在特定时间接收通知电子邮件例如如果有人在下午 5 点设置提醒参加下午 4 45 的会议则大约会在下午 4 45 收到电子邮件由于此站点托管在共享服务器上因此我们无法控制服务器来运行任何 SQL
将 pdf 直接发送到打印机对话框的链接

我尝试过以下2种方法 a class print a a Print file a 又一次尝试
Python 中的机械化 - 提交后重定向不起作用

我刚刚开始在 Python 中使用 mechanize 但已经遇到了一些问题我在 StackOverflow 和 Google 上查看过我看到人们说文档很棒并且应该很容易让它工作但我想我不知道如何查找该文档因为我所有的可以找到的代

Python 中的机械化 - 提交后重定向不起作用

Python 中的机械化 - 提交后重定向不起作用 的相关文章

随机推荐

热门标签

Python 中的机械化 - 提交后重定向不起作用的相关文章