python 仅使用 urllib2 获取标头

2023-12-19

我必须使用 urllib2 实现一个仅获取标头的函数（不执行 GET 或 POST）。这是我的功能：

def getheadersonly(url, redirections = True):
    if not redirections:
        class MyHTTPRedirectHandler(urllib2.HTTPRedirectHandler):
            def http_error_302(self, req, fp, code, msg, headers):
                return urllib2.HTTPRedirectHandler.http_error_302(self, req, fp, code, msg, headers)
            http_error_301 = http_error_303 = http_error_307 = http_error_302
        cookieprocessor = urllib2.HTTPCookieProcessor()
        opener = urllib2.build_opener(MyHTTPRedirectHandler, cookieprocessor)
        urllib2.install_opener(opener)

    class HeadRequest(urllib2.Request):
        def get_method(self):
            return "HEAD"

    info = {}
    info['headers'] = dict(urllib2.urlopen(HeadRequest(url)).info()) 
    info['finalurl'] = urllib2.urlopen(HeadRequest(url)).geturl() 
    return info

使用答案中的代码this https://stackoverflow.com/a/2070916/842837 and this https://stackoverflow.com/a/554580/842837。然而这is doing即使标志是重定向False。我尝试使用以下代码：

print getheadersonly("http://ms.com", redirections = False)['finalurl']
print getheadersonly("http://ms.com")['finalurl']

在这两种情况下，它都给予了morganstanley.com。这里有什么问题吗？

首先，您的代码包含几个错误：

根据每个请求getheadersonly您安装一个新的全局 urlopener，然后在后续调用中使用urllib2.urlopen
您发出两个 HTTP 请求来获取响应的两个不同属性。
实施urllib2.HTTPRedirectHandler.http_error_302并不是那么微不足道，我不明白它首先如何防止重定向。

基本上，您应该了解每个处理程序都安装在开启器中以处理某种类型的响应。urllib2.HTTPRedirectHandler是否可以将某些 http 代码转换为重定向。如果您不需要重定向，请勿将重定向处理程序添加到 opener 中。如果您不想打开 ftp 链接，则不要添加FTPHandler, etc.

您所需要的就是创建一个新的开启器并添加urllib2.HTTPHandler()在其中，将请求自定义为“HEAD”请求，并将请求的实例传递给打开器，读取属性，然后关闭响应。

class HeadRequest(urllib2.Request):
    def get_method(self):
        return 'HEAD'

def getheadersonly(url, redirections=True):
    opener = urllib2.OpenerDirector()
    opener.add_handler(urllib2.HTTPHandler())
    opener.add_handler(urllib2.HTTPDefaultErrorHandler())
    if redirections:
        # HTTPErrorProcessor makes HTTPRedirectHandler work
        opener.add_handler(urllib2.HTTPErrorProcessor())
        opener.add_handler(urllib2.HTTPRedirectHandler())
    try:
        res = opener.open(HeadRequest(url))
    except urllib2.HTTPError, res:
        pass
    res.close()
    return dict(code=res.code, headers=res.info(), finalurl=res.geturl())

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

urllib2

python 仅使用 urllib2 获取标头的相关文章

围绕 readline 构建的 python 批处理的触发器选项卡完成

背景我有一个 python 程序它导入并使用 readline 模块来构建自制的命令行界面我有第二个 python 程序围绕 Bottle 一个 Web 微框架构建充当该 CLI 的前端第二个 python 程序向第一个程序打开
如何在 AWS CDK 创建的 Python Lambda 函数中安装外部模块？

我在 Cloud9 中使用 Python AWS CDK 并且我部署简单的 Lambda 函数那应该是发送 API 请求到 Atlassian 的 API当对象上传到 S3 存储桶时也是由 CDK 创建的这是我的 CDK 堆栈代码 fr
Python逻辑运算符优先级[重复]

这个问题在这里已经有答案了哪个运算符优先4 gt 5 or 3 lt 4 and 9 gt 8 这会被评估为真还是假我知道该声明3 gt 4 or 2 lt 3 and 9 gt 10 显然应该评估为 false 但我不太确定 pyth
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
将数据帧行转换为字典

我有像下面的示例数据这样的数据帧我正在尝试将数据帧中的一行转换为类似于下面所需输出的字典但是当我使用 to dict 时我得到了索引和列值有谁知道如何将行转换为像所需输出那样的字典任何提示都非常感激 Sample data pri
Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
对图像块进行多重处理

我有一个函数必须循环遍历图像的各个像素并计算一些几何形状此函数需要很长时间才能运行在 24 兆像素图像上大约需要 5 小时但似乎应该很容易在多个内核上并行运行然而我一生都找不到一个有据可查解释充分的例子来使用 Multiproc
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
Pandas 根据 diff 列形成簇

我正在尝试使用 Pandas 根据表示时间以秒为单位的列中的差异来消除数据框中的一些接近重复项例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
字典和数组作为类变量与实例变量

这是赚取积分的简单方法请解释以下内容 class C a b 0 c def init self self x def d self k v self x k v self a k v self b v self c append v d
迭代 pandas 数据框的最快方法？

如何运行数据框并仅返回满足特定条件的行必须在之前的行和列上测试此条件例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1
您可以使用关键字参数而不提供默认值吗？

我习惯于在 Python 中使用这样的函数方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default

随机推荐

在 folium 地图上绘制数据帧中的纬度经度点 - iPython

我有一个带有纬度经度坐标的数据框 latlon 51 249443914705175 0 13878830247011467 51 249443914705175 0 13878830247011467 51 24976823997686
避免在继承的 java 类中进行强制转换

我有一堂课 class MyClass public MyClass getParent public MyClass getChildren 和一个子类 MySubClass extends MyClass public String g
android 动态改变样式

我已经在 styles xml 中描述了对象的属性不管对象是什么我想在 styles xml 中动态更改这些属性有人知道我该怎么做吗你可以这样做活动中 this setTheme R style ThemeRed 在 styles
如何在由knitr制作的HTML5幻灯片中使用“R生成”图作为半透明背景？

我想在 HTML5 幻灯片的第一页添加一个绘图我可以以动态的方式实现这一点吗也就是说背景图像将由 R 代码生成而不是插入半透明的 PNG 图像谢谢 Update 我想要的是您可以使用块选项dev args为了达成这个您需要正确
什么是语句的不可达端点（unreachable endpoint）？

受到这个问题的回答的启发 C 中 switch 的空情况是否与下一个非空情况合并 https stackoverflow com questions 15164318 is empty case of switch in c sharp c
使用 wincertstore 的 Python 请求

我试图通过 requests 包连接到我公司的内部网页但由于 python 不使用 Windows 默认的受信任证书因此连接被拒绝我发现 wincertstore 可用于获取 Windows 默认证书但我仍然不确定如何将其与我的请求
.NET / WPF 中的通用 JSON 解析器？

我读过很多关于如何使用 DataContractJsonSerializer 将 JSON 对象反序列化为特定对象的教程但是我想将我的对象反序列化为由字符串数组或字典组成的字典例如当我说 JsonObject Parse myJSO
在Python中分割字符串

我有一个像这样的字符串这是括号测试和引号测试我正在尝试用 Python 编写一些内容将其按空格分开同时忽略方括号和引号内的空格我正在寻找的结果是 this is 括号测试和引号测试这是一个适用于您的测试输入的简单解决方案
如何在数据库中存储自定义用户字段

我正在尝试找到一个教程来指导我基于用户的自定义字段如何工作就像在调查网站中一样它们允许用户创建自定义字段并存储它们更重要的是存储通过这些字段输入的数据我正在寻找一些描述如何在数据库上完成此操作的内容我在寻找一种方法时遇到了一些麻烦
fwrite 对于大量小写入的效率

我有一个程序可以使用以下命令保存许多 gt 1GB的大文件fwrite它工作得很好但不幸的是由于每次调用的数据的性质fwrite只写1 4字节结果写入可能需要一个多小时其中大部分时间似乎是由于系统调用开销或至少在 fwrite 的
TextView 椭圆高度明智

有没有等价的android ellipsize 对于 y 轴上太长的文本省略 x 轴上太长的文本我有一个 TextView 它必须是固定高度但是它里面的文本通常太长无法全部容纳我希望它在被切成两半之前停止我不想设置android
Android SearchRecentSuggestions - 在 SearchView 中输入时不会显示建议

我有一个可用的搜索小部件并且想要添加搜索历史记录建议我按照 Android 教程 http developer android com guide topics search adding recent query suggestion
如何为 VSTS 添加 GIT 子模块以与 Visual Studio 2017 一起使用

如何在 Azure GIT 中创建子模块存储库和我的另一个项目 C MVC 并在 Azure GIT 中使用它或在 Visual Studio 2017 IDE 中引用它是否有任何视频显示此内容或解释此内容的文档我没有看到任何东西尤其
使用factomineR 进行因子分析

当我在 R 中使用函数 CA 时遇到问题我的数据是 data row names Conscient NonConscient MoinsSouvent 185 213 PlusieursfMois 98 56 PlusieursfSem
“此 HTML5 文档检查接口已弃用”

在做一个项目时我正在检查它是否有 W3C 错误使用HTML 验证器 https addons mozilla org en us firefox addon html validator Firefox 的插件在此过程中我发现了一个以
Java-多边形和线的交点

有没有什么函数可以给我一个交点Polygon and Line2D 我有一个多边形和一个我知道相交的线段我想要交点的实际值而不是布尔答案给你有趣的方法是 getIntersections 和 getIntersection 前者解析所
EF core 5 多对多过滤器

这是我的查询 public async Task
量角器无法单击元素内嵌入的

我有两个嵌入式 span 里面的元素 a 元素我需要在第二个触发点击事件 span The by id方法上的id我创建的类没有触发点击我也尝试过by binding但这不起作用请帮助代码 div class add player
使用 JavaScript 添加微数据

我有一个基于 Javascript 和 php 的评级系统每个页面上都会显示结果 X 票 moyenne X X 是数字 moyenne 表示平均符号我想要 javascript 添加微数据信息源代码应该显示如下内容 span X
python 仅使用 urllib2 获取标头

我必须使用 urllib2 实现一个仅获取标头的函数不执行 GET 或 POST 这是我的功能 def getheadersonly url redirections True if not redirections class MyHT

python 仅使用 urllib2 获取标头

python 仅使用 urllib2 获取标头 的相关文章

随机推荐

热门标签

python 仅使用 urllib2 获取标头的相关文章