使用 python mechanize 通过 NTLM 身份验证登录页面

2023-12-30

我想使用 mechanize 登录页面并检索一些信息。但是我尝试验证它只是失败并显示错误代码HTTP 401，如下所示：

r = br.open('http://intra')
File "bui...e\_mechanize.py", line 203, in open
File "bui...g\mechanize\_mechanize.py", line 255,
in _mech_openmechanize._response.httperror_seek_wrapper: HTTP Error 401: Unauthorized

到目前为止，这是我的代码：

import mechanize
import cookielib

# Browser
br = mechanize.Browser()

# Cookie Jar
cj = cookielib.LWPCookieJar()
br.set_cookiejar(cj)

# Browser options
br.set_handle_equiv(True)
# br.set_handle_gzip(True)
br.set_handle_redirect(True)
br.set_handle_referer(True)
br.set_handle_robots(False)

# Follows refresh 0 but not hangs on refresh > 0
br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)

# If the protected site didn't receive the authentication data you would
# end up with a 410 error in your face
br.add_password('http://intra', 'myusername', 'mypassword')

# User-Agent (this is cheating, ok?)
br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]
# Open some site, let's pick a random one, the first that pops in mind:
# r = br.open('http://google.com')
r = br.open('http://intra')
html = r.read()

# Show the source
print html

我究竟做错了什么？来访http://intra（内页）例如chrome，它会弹出一个窗口并询问用户名/密码一次，然后一切都很好。

弹出的对话框如下所示：

经过大量研究后，我设法找出了这背后的原因。

查找所有网站都使用所谓的NTLM认证 http://hc.apache.org/httpclient-legacy/authentication.html#Authentication_Schemes，机械化不支持。这可以帮助找出站点的身份验证机制：

wget -O /dev/null -S http://www.the-site.com/

所以代码稍微修改了一下：

import sys
import urllib2
import mechanize
from ntlm import HTTPNtlmAuthHandler

print("LOGIN...")
user = sys.argv[1]
password = sys.argv[2]
url = sys.argv[3]

passman = urllib2.HTTPPasswordMgrWithDefaultRealm()
passman.add_password(None, url, user, password)
# create the NTLM authentication handler
auth_NTLM = HTTPNtlmAuthHandler.HTTPNtlmAuthHandler(passman)

browser = mechanize.Browser()
handlersToKeep = []

for handler in browser.handlers:
    if not isinstance(handler,
    (mechanize._http.HTTPRobotRulesProcessor)):
        handlersToKeep.append(handler)

browser.handlers = handlersToKeep
browser.add_handler(auth_NTLM)

response = browser.open(url)
response = browser.open("http://www.the-site.com")
print(response.read())

最后，如前所述，需要修补机械化here https://stackoverflow.com/questions/13649964/python-mechanize-with-ntlm-getting-attributeerror-httpresponse-instance-has-no:

--- _response.py.old    2013-02-06 11:14:33.208385467 +0100
+++ _response.py    2013-02-06 11:21:41.884081708 +0100
@@ -350,8 +350,13 @@
             self.fileno = self.fp.fileno
         else:
             self.fileno = lambda: None
-        self.__iter__ = self.fp.__iter__
-        self.next = self.fp.next
+
+        if hasattr(self.fp, "__iter__"):
+            self.__iter__ = self.fp.__iter__
+            self.next = self.fp.next
+        else:
+            self.__iter__ = lambda self: self
+            self.next = lambda self: self.fp.readline()

     def __repr__(self):
         return '<%s at %s whose fp = %r>' % (

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

authentication

mechanize

使用 python mechanize 通过 NTLM 身份验证登录页面的相关文章

蟒蛇 | MySQL | AttributeError：模块“mysql.connector”没有属性“connect”

我正在学习 python 中的一个新库 mysql 我尝试执行以下命令 import mysql connector mydb mysql connector connect host localhost user root passwd
如何使用 Python 3 绕过 HTTP Error 403: Forbidden with urllib.request

您好不是每次都这样但有时在尝试访问 LSE 代码时我会收到每一个烦人的 HTTP 错误 403 禁止消息任何人都知道我如何仅使用标准 python 模块来克服这个问题遗憾的是没有漂亮的汤 import urllib request
使用python查找txt文件中字母出现的次数

我需要从 txt 文件中读取该字母并打印 txt 文件中出现的次数到目前为止我已经能够在一行中打印内容但计数有问题有人可以指导吗 infile open grades txt content infile read for char
稀有对象的 python 类型注释，例如 psycopg2 对象

我了解内置类型但是我如何指定稀有对象例如数据库连接对象 def get connection and cursor gt tuple psycopg2 extensions cursor psycopg2 extensions conn
反编译Python 3.9.2的PYC文件[重复]

这个问题在这里已经有答案了目前我有一个 3 9 2 版本的 python 的 PYC 文件 P S 这适用于所有 3 9 及更高版本我正在尝试反编译 PYC 文件但它显示错误因为 uncompyle6 或者更确切地说新版本 de
Series.sort() 和 Series.order() 有什么区别？

s pd Series nr randint 0 10 5 index nr randint 0 10 5 s Output 1 3 7 6 2 0 9 7 1 6 order 按值排序并返回一个新系列 s order Output 2 0
使用 Paramiko 进行 DSA 密钥转发？

我正在使用 Paramiko 在远程服务器上执行 bash 脚本在其中一些脚本中存在与其他服务器的 ssh 连接如果我只使用 bash 不使用 Python 我的 DSA 密钥将被第一个远程服务器上的 bash 脚本转发并使用以连接
Python Tkinter 模块不显示输出

我正在尝试学习 Python 并尝试使用 Python 中的 GUI 并遇到了这个 Tkinter 模块我的代码运行但运行时窗口没有出现我的代码如下 from Tkinter import to create a root windo
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
运行 Python 单元测试，以便成功时不打印任何内容，失败时仅打印 AssertionError()

我有一个标准单元测试格式的测试模块 class my test unittest TestCase def test 1 self tests def test 2 self tests etc 我的公司有一个专有的测试工具它将作为命令行
Paste.httpserver 并通过 HTTP/1.1 Keep-alive 减慢速度；使用 httperf 和 ab 进行测试

我有一个基于paste httpserver 的Web 服务器作为HTTP 和WSGI 之间的适配器当我使用 httperf 进行性能测量时如果每次使用 num conn 启动一个新请求我每秒可以执行超过 1 000 个请求如果我使
从 Flask 运行 NPM 构建

我有一个 React 前端我想在与我的 python 后端 API 相同的源上提供服务我正在尝试使用 Flask 来实现此目的但我遇到了 Flask 找不到我的静态文件的问题我的前端构建是用生成的npm run build in s
是否需要关闭没有引用它们的文件？

作为一个完全的编程初学者我试图理解打开和关闭文件的基本概念我正在做的一项练习是创建一个脚本允许我将内容从一个文件复制到另一个文件 in file open from file indata in file read out file
在Raspberry pi上升级skimage版本

我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
如何指示 urwid 列表框的项目数多于当前显示的项目数？

有没有办法向用户显示 urwid 列表框在显示部分上方下方有其他项目我正在考虑类似滚动条的东西它可以显示条目的数量或者列表框顶部底部的单独栏如果这个行为无法实现有哪些方法可以实现这个通知在我的研究过程中我发现这个问题 ht
如何在亚马逊 EC2 上调试 python 网站？

我是网络开发新手这可能是一个愚蠢的问题但我找不到可以帮助我的确切答案或教程我工作的公司的网站用 python django 构建托管在亚马逊 EC2 上我想知道从哪里开始调试这个生产站点并检查存储在那里的日志和数据库我有帐户信
带 Flask 的 RPI dht22：无法将第 4 行设置为输入 - 等待 PulseIn 消息超时

我正在尝试制作一个 Raspberry Pi 3 REST API 使用 DHT22 提供温度和湿度整个代码 from flask import Flask jsonify request from sds011 import SDS01
如何编写一个接受 int 或 float 的 C 函数？

我想用 C 语言创建一个扩展 Python 的函数该函数可以接受 float 或 int 类型的输入所以基本上我想要f 5 and f 5 5 成为可接受的输入我认为我不能使用if PyArg ParseTuple args i v
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
定义在文本小部件中双击时选择哪些字符

在 Windows 上双击文本小部件中的单词也将选择连接的标点符号有什么方法可以定义您想要选择的角色吗 tcl wordchars该变量的值是一个正则表达式可以设置它来控制什么被视为单词字符例如通过双击 Tk 中的文本来选择单

随机推荐

唯一索引与使用唯一索引的唯一约束

我正在尝试比较两个模式以确保它们同步在一个模式中我看到 2 列上有一个唯一索引除此之外我还看到了使用唯一索引的唯一约束我是Oracle新手但我的一般理解和根据this https stackoverflow com questi
我应该使用什么数据结构来模拟 Cassandra 中的“按计数器排序”？

假设我目前有一张这样的桌子 create table comment counters contentid uuid commentid uuid liked counter PRIMARY KEY contentid commentid
unix 脚本 - 制作文本文件时出现问题

我正在编写一个简单的unix脚本如下所示 bin bash mkdir tmp temp1 cd tmp temp1 echo ab bc cj nn mm gt output txt grep ab output txt gt newo
在断言中使用“sequence.triggered”时重置感知

我有一些断言使用triggered序列的性质这对于检查当 X 发生时 Y 一定在过去的某个时间发生形式的属性很有用让我们举一个简单的例子给定三个信号 a b and c c仅允许在以下情况下走高 a3 个周期前为高并且b2 个周
javafx 中每个 .css 文件和行的“未知属性”警告

当我从 git 导入团队的小组项目时遇到问题当导入到 Eclipse 时我必须从构建路径库添加 JavaFX SDK 一旦我打开其中包含 css 文件的样式包它们都会有每行代码下方有黄色警告线例如 label fx font siz
ADO.NET 实体框架教程 [已关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
frama-c mingw __restrict__ 关键字

我是 Frama C 的新手我想在Windows环境下运行它我的编译器是gcc mingw 我尝试运行价值分析教程中的相同示例因为我对库头文件有问题我发现无法运行 frama c 因为restrict关键词它显示 string h
来自 sk_buff 的 IP 地址

我正在编写一个注册 netfilter 挂钩的内核模块我试图通过使用来获取呼叫者的IP地址sk buff gt saddr成员有没有办法获得人类可读的 IP 即 x x x x 格式我找到了这个功能inet ntop 但它似乎在内核头
如何从 VC++ 2008 开发的 GUI 中打开帮助文件（chm 等）？

我正在尝试为我在 VC 2008 中开发的 GUI 添加一些帮助我想编译一个 chm 文件或者一个可以从我的菜单访问的 hlp 文件任何人都可以告诉我如何执行此操作吗多谢 Under HKLM Software Microsoft
如何在 Heroku 上托管的 Django 项目中使用 Werkzeug 交互式回溯调试器？

在 Django 项目中安装了 django extensions 后您可以在本地计算机上使用manage py runserver plus激活非常有用的 Werkzeug 调试器这样 500 错误页面就可以让您以交互方式浏览堆栈从
如果操作未经过身份验证，expressJS 呈现登录引导模式

我正在编写一个expressjs ejs应用程序它使用Twitter Bootstrap 3作为网页我使用 Bootstrap Modal 进行登录我已将模式包含在标题部分中因此它可用于每个网页但是如果用户尚未登录则需要先进行
如何捕获Kafka-Spring中的反序列化错误？

我正在启动一个使用 kafka 消息的应用程序我跟着Spring文档 https docs spring io spring kafka docs 2 2 4 RELEASE reference error handling deseri
Android-L CardView 视觉触摸反馈

谁能向我解释一下如何在 CardView 中实现 Google I O 2014 上演示的一些视觉触摸反馈这是我在 XML 中使用 CardView 的方式可能缺少一些小东西所以我只是想知道是否有人可以帮助我
导入其他依赖项需要的依赖项版本[重复]

这个问题在这里已经有答案了我有两个箱子X and Z我想同时使用但是X依赖于取决于Z在某些特定版本上例如 mongodb依赖于tokio 0 2 而我使用的是tokio 0 3 X不再出口Z所以我认为必须手动指定Z in Cargo
使用 Json.Net 反序列化，将子对象反序列化为保存 json 的 string/similar？

我正在尝试使用 Json 创建一个配置文件该文件将保存各种类型对象的配置考虑这个文件 cameras type Some Namespace CameraClass assembly Some Assembly configuratio
更改主页按钮的长按功能

我正在寻找 Android 技巧来更改长按主页按钮的功能目前长按主页按钮打开任务管理器相反我希望长单击充当短单击这意味着将我们带到默认启动器的主页理想情况下这个技巧适用于所有 Android 版本但如果它仅适用于 2 3
通过 C# 在 excel 中使用模板

作为我正在生成的 C 程序的一部分我需要生成 1 个工作簿其中包含 2 个不同的工作表和第 3 个可以多次生成的工作表最有效的方法是什么我已经研究过使用模板尽管我不确定如何重复某些工作表同时只显示其他工作表一次任何帮助或建议将
用于从视频创建小 gif 的 Lib/API？

我想从现有视频创建 GIF 我搜索了相关问题但没有找到任何可以帮助我的链接我一直在寻找任何可以帮助我从视频创建位图的库或 API 然后我将再次从该位图创建 GIF 或直接从视频创建 GIF 是否有任何库或 API 可以从视频中捕获位图序
打字稿“元素类型上不存在属性”

我将开始我的 Typescript 之旅所以我有video在我的 Html 和中标记 ts将这些行归档 class KomakhaPlayer private container private video Element this co
使用 python mechanize 通过 NTLM 身份验证登录页面

我想使用 mechanize 登录页面并检索一些信息但是我尝试验证它只是失败并显示错误代码HTTP 401 如下所示 r br open http intra File bui e mechanize py line 203 in ope

使用 python mechanize 通过 NTLM 身份验证登录页面

使用 python mechanize 通过 NTLM 身份验证登录页面 的相关文章

随机推荐

热门标签

使用 python mechanize 通过 NTLM 身份验证登录页面的相关文章