如何使机械化不会因该页面上的表单而失败？

2024-01-09

import mechanize

url = 'http://steamcommunity.com'

br=mechanize.Browser(factory=mechanize.RobustFactory())

br.open(url)
print br.request
print br.form
for each in br.forms():
    print each
    print

上述代码的结果是：

Traceback (most recent call last):
  File "./mech_test.py", line 12, in <module>
    for each in br.forms():
  File "build/bdist.linux-i686/egg/mechanize/_mechanize.py", line 426, in forms
  File "build/bdist.linux-i686/egg/mechanize/_html.py", line 559, in forms
  File "build/bdist.linux-i686/egg/mechanize/_html.py", line 228, in forms
mechanize._html.ParseError

我的具体目标是使用登录表单，但我什至无法让 mechanize 识别出有任何表单。甚至用我认为最基本的选择方法any form, br.select_form(nr=0)，导致相同的回溯。如果有区别的话，表单的 enctype 是 multipart/form-data 。

我想这一切都归结为一个由两部分组成的问题：我怎样才能让机械化处理这个页面，或者如果不可能，那么在维护 cookie 的同时还有什么其他方法？

编辑：如下所述，这将重定向到“https://steamcommunity.com https://steamcommunity.com'.

Mechanize 可以成功检索 HTML，如以下代码所示：

url = 'https://steamcommunity.com'

hh = mechanize.HTTPSHandler()  # you might want HTTPSHandler, too
hh.set_http_debuglevel(1)
opener = mechanize.build_opener(hh)
response = opener.open(url)
contents = response.readlines()

print contents

您是否提到该网站正在重定向到 https (ssl) 服务器？

好吧，尝试设置一个新的 HTTPS 处理程序，如下所示：

mechanize.HTTPSHandler()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Automation

screenscraping

mechanize

如何使机械化不会因该页面上的表单而失败？的相关文章

更改随机森林分类器的阈值

我需要开发一个没有或接近没有假阴性值的模型为此我绘制了召回率精度曲线并确定阈值应设置为 0 11 我的问题是如何定义模型训练时的阈值稍后在评估时定义它是没有意义的因为它不会反映新数据 X train X test y tr
漂亮的地图打印机会抛出类型错误

我已经使用配置了漂亮的打印机http wiki eclipse org CDT User FAQ How can I inspect the contents of STL containers 3F http wiki eclipse o
matplotlib：调整图形窗口大小而不缩放图形内容

当您调整图形大小时 Matplotlib 会自动缩放图形窗口中的所有内容通常这是用户想要的但我经常想增加窗口的大小为其他东西腾出更多空间在这种情况下我希望在更改窗口大小时预先存在的内容保持相同的大小有谁知道一个干净的方法来做到这
测试交互式Python程序

我想知道python的哪些测试工具支持交互式程序的测试例如我有一个由以下人员启动的应用程序 python dummy program py gt gt Hi whats your name Joseph 我想要仪器Joseph所以我可以
如何生成大型网站的图形站点地图[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我想为我的网站生成图形站点地图据我所知有两个阶段抓取网站并分析链接关系提取树形结构生成视觉上
Django 说“id 可能不为 NULL”，但为什么会这样呢？

我今天要疯了我只是尝试插入一条新记录但它返回了 post blogpost id 可能不为 NULL 错误这是我的模型 class BlogPost models Model title models CharField max le
Python ElementTree 获取带有命名空间的属性

我试图访问 XML 中的 def 所以在这个例子中我会得到Evolus Common PlainTextV2作为输出我似乎无法弄清楚如何获取具有名称空间的属性如果我想得到id它工作得很好 Python for content ns in
从 Spark 数据帧中过滤大量 ID

我有一个大型数据框其格式类似于 ID Cat date 12 A 201602 14 B 201601 19 A 201608 12 F 201605 11 G 201603 我需要根据大约 500 万个 Is 的列表来过滤行最直接的方
如何在python mechanize中设置cookie

向服务器发送请求后 br open http xxxx br select form nr 0 br form MESSAGE 1 2 3 4 5 br submit 我得到了响应标题其中包含 set cookie Set Cookie
多个列表和大小的所有可能排列

在 python 中使用以下命令很容易计算简单的排列itertools permutations https docs python org 3 library itertools html itertools permutations 你
如何不断地将 STDOUT 发送到我的 python TCP 服务器？

我有简单的 python echo 服务器它使用套接字并向客户端回显随机数我有另一个程序每 2 秒将值打印到标准输出如果它只是一个脚本我可以像这样重定向 stdout python script py 并像这样在脚本中获取它da
telethon 库：如何通过电话号码添加用户

我正在研究 Telegram 的 Telethon 库它可以使用 Telegram API 充当 Telegram 客户端重要提示这是电报客户端 API https core telegram org telegram api 而不是
Python Tkinter 网格复选框

我想知道是否有一种简单的方法可以使用 Tkinter 创建复选框网格我正在尝试制作一个由 10 行和 10 列即 100 个复选框组成的网格以便每行只能选择两个复选框编辑我正在使用带有spyder的python 2 7 到目前为
安塞布尔 + 10.11.6

我在非常干净地安装 10 11 6 时遇到了 Ansible 的奇怪问题我已经安装了brew zsh oh my zsh Lil snitch 和1password 实际上没有安装其他任何东西我安装了ansible brew ins
如何删除 pip 安装的所有软件包？

如何从当前激活的虚拟环境中卸载 pip 安装的所有软件包我发现这个片段作为替代解决方案与重新创建 virtualenv 相比删除库更加优雅 pip freeze xargs pip uninstall y 如果您通过 VCS 安装了软
如何输入可变的默认参数

Python 中处理可变默认参数的方法是将它们设置为无 https stackoverflow com a 366430 5049813 例如 def foo bar None bar if bar is None else bar ret
给定一个字符串，如何删除所有重复的连续字母？

如何从字符串中删除两个连续的字母例如 a str hii thherre 应该成为 hi there 我尝试这样做 a str join sorted set a str key a str index 但是我得到 hi ter 是的
如何正确将 tflite_graph.pb 转换为 detector.tflite

我正在使用tensorflow对象检测API使用tensorflow中的ssdlite mobilenet v2 coco 2018 05 09来训练自定义模型模型动物园 https github com tensorflow models
如何从 python 中的字符串中删除 ANSI 转义序列

这是包含我的字符串的片段 ls r n x1b 00m x1b 01 31mexamplefile zip x1b 00m r n x1b 01 31m 该字符串是从我执行的 SSH 命令返回的我无法使用当前状态下的字符串因为它包含 A
使用 python/scipy 进行 voronoi 和 lloyd 松弛

如何使用 Qhull 确定哪些 voronoi 单元按索引是正确的由现有顶点组成我正在尝试使用 LLoyds 算法和 scipy spatial Voronoi 它是 Qhull 的包装器生成的输入来执行约束松弛就代码而言

随机推荐

从 Google Cloud Function 设置 Firebase Storage 的位置路径？

我正在努力从 Google Text to Speech 获取音频文件然后将该文件写入 Firebase Storage 我不明白在哪里指定存储中位置的路径我试过 const bucket storage bucket myProjec
如何根据字符串匹配选择 R 数据框中的列

我不认为这个exact问题已经被问过无论如何对于R 我想保留数据集中包含特定字符串的任何列实际上有数百列并删除其余的列我发现了很多字符串搜索列的例子names 但对列本身的内容没有任何影响举个例子假设我有这个数据集 df da
mysql命令行返回执行时间？

我正在使用 mysql 命令在 Linux 主机上工作我有一个运行批处理 mysql 命令的脚本例如mysql e select 并且我希望总结每个命令的执行时间有没有办法从命令行获取 mysql 执行时间例如在mysql交互模式
用kivy按下按钮时如何更改空格？

我正在尝试通过实现以下模板来创建一个 GUI漫画创作者图形用户界面 https www packtpub com packtlib book Application Development 9781785286926 1 ch01lvl1s
如何使用直骨架计算多边形的斜接偏移

我有一个用 Python 实现的 Straight Skeleton 算法想用它来偏移多边形的边缘我看过几篇提出这种抵消方法的论文遗憾的是它们都没有提供有关如何实现它的具体信息他们之中带孔简单二维多边形直骨架的 CGAL 实现 h
如何计算给定数据结构中列的平均值？

我有以下数据结构ds AD TYPE B TYPE D array 84 0 85 0 115 0 dtype object array 31 0 23 0 599 0 dtype object array 75 0 21 0 nan dt
高度为 1fr 的单行网格未填充 Chrome 中的高度

我在 Flexbox 列内有一个 CSS 网格并且该网格具有flex grow 1 在 Chrome 中网格会扩展以填充可用空间但其内容不会扩展即使使用align content stretch在网格上在 Firefox 和 Ed
DrawToBitmap - System.ArgumentException：参数无效

我正在创建一个Label有时我使用 DrawToBitmap 我不知道为什么但是在我运行我的程序一段时间后并调用 DrawToBitmap 经常我得到例外 System ArgumentException Parameter is n
nginx：[emerg]此处不允许“服务器”指令

我已经重新配置了 nginx 但无法使用以下配置重新启动它 server listen 80 server name www example com return 301 scheme example com request uri ser
Laravel 连接数据库时超时

我正在将应用程序从我的开发计算机移动到测试服务器当连接到我的本地开发 mysql 数据库时一切都按预期进行当尝试连接到我们的测试服务器时请求在 45 秒后超时并返回 500 错误我测试了服务器可以通信并且php可以使用基本的my
通过 API 确定是否为用户启用 Google 2 因素身份验证

我想开发一个使用 Google 作为身份验证提供程序的应用程序但我希望我的应用程序在帐户注册到我的应用程序之前知道 Google 帐户是否正在使用两步验证在 Google 开发文档中找不到所需的 API This answer http
layoutAttributesForSupplementaryViewOfKind:atIndexPath: 传入不正确的indexPath

我有一个习惯UICollectionViewLayout它使用补充视图将页脚放置在每个页面的底部这似乎一直运作良好直到我开始在页面底部插入单元格由于补充视图必须链接到 UICollectionView 中的 NSIndexPath 因
ASP.NET：Response.Redirect(...) 之后代码会发生什么？

Response Redirect 是否会导致当前正在运行的方法中止或者 Response Redirect 之后的代码也执行吗也就是说在Response Redirect之后是否需要返回退出Sub Response Redirec
如何通过 Qt 5.6 将 QML 应用程序窗口设置为透明？

我是 Qt 和 QML 的新手现在我设置了一个窗口并希望将其设置为透明用户可以在我的应用程序中看到我的桌面我尝试使用WA TranslucentBackground and opacity 但是它不起作用这是我的 QML 代码非常
如何在swift中将字节数组转换为base64字符串？

这是我在 Objective C 中的示例代码 NSString getImageString unsigned char charValue unsigned long sizeOfBytes uint8 t commandbyte ui
scipy：插值轨迹

我有一个由一系列序列形成的轨迹 x y 对我想使用样条曲线在该轨迹上插入点我该怎么做呢使用scipy interpolate UnivariateSpline不起作用因为两者都没有x nor y是单调的我可以引入参数化例如长度d
将数据从一页发送到另一页

我正在尝试使用 C ASP Net 将表单数据从一个页面发送到另一个页面我有两个页面default aspx和default2 aspx 这是我在default aspx中的代码
Spring 通过自定义身份验证提供程序记住我

我想为我的应用程序实现记住我服务我面临的主要问题是我正在使用自定义身份验证提供程序它使用第三方应用程序进行身份验证我无法直接访问他们的数据库我检查了这个Link https stackoverflow com questions 7
FFMPEG + Android 包装器使用 FFMPEG 的最新版本

我正在尝试编译 FFMPEG 以与我的 Android 应用程序一起使用我看过 https github com halfninja android ffmpeg x264 https github com halfninja andro
如何使机械化不会因该页面上的表单而失败？

import mechanize url http steamcommunity com br mechanize Browser factory mechanize RobustFactory br open url print br r

如何使机械化不会因该页面上的表单而失败？

如何使机械化不会因该页面上的表单而失败？ 的相关文章

随机推荐

热门标签

如何使机械化不会因该页面上的表单而失败？的相关文章