我在这里尝试做的是获取给定 URL 的标头,以便确定 MIME 类型。我想看看是否http://somedomain/foo/
例如,将返回 HTML 文档或 JPEG 图像。因此,我需要弄清楚如何发送 HEAD 请求,以便我可以读取 MIME 类型,而无需下载内容。有谁知道一个简单的方法来做到这一点?
urllib2 https://docs.python.org/2/library/urllib2.html可用于执行 HEAD 请求。这比使用 httplib 好一点,因为 urllib2 会为您解析 URL,而不是要求您将 URL 拆分为主机名和路径。
>>> import urllib2
>>> class HeadRequest(urllib2.Request):
... def get_method(self):
... return "HEAD"
...
>>> response = urllib2.urlopen(HeadRequest("http://google.com/index.html"))
像以前一样,可以通过response.info() 获得标头。有趣的是,您可以找到您被重定向到的 URL:
>>> print response.geturl()
http://www.google.com.au/index.html
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)