在下载之前使用 HTTP 标头获取文件大小，该标头与从 urlopen 检索到的标头不匹配

2024-04-02

为什么使用时内容长度不同requests and urlopen(url).info()

>>> url = 'http://pymotw.com/2/urllib/index.html'

>>> requests.head(url).headers.get('content-length', None)
'8176'
>>> urllib.urlopen(url).info()['content-length']
'38227'
>>> len(requests.get(url).content)
38274

我打算检查文件的大小（以字节为单位），以便根据以下内容将缓冲区拆分为多个线程Range in urllib2但如果我没有文件的实际大小（以字节为单位），它将无法工作。

only len(requests.get(url).content) gives 38274这是最接近的，但仍然不正确，而且它正在下载我不想要的内容。

默认情况下，请求将发送'Accept-Encoding': 'gzip'作为请求标头的一部分，服务器将使用压缩内容进行响应：

>>> r = requests.head('http://pymotw.com/2/urllib/index.html')
r>>> r.headers['content-encoding'], r.headers['content-length']
('gzip', '8201')

但是，如果您手动设置请求标头，那么您将获得未压缩的内容：

>>> r = requests.head('http://pymotw.com/2/urllib/index.html',headers={'Accept-Encoding': 'identity'})
>>> r.headers['content-length']
'38227'

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pythonrequests

urllib

在下载之前使用 HTTP 标头获取文件大小，该标头与从 urlopen 检索到的标头不匹配的相关文章

从 1D 列表创建 2D 列表

我对 Python 有点陌生我想将一维列表转换为二维列表给定width and length这个的matrix 说我有一个list 0 1 2 3 我想做一个2 by 2该列表的矩阵我怎样才能得到matrix 0 1 2 3 widt
Python Tweepy：Twitter Api 说 /users/lookup 不存在

我正在制作一个研究应用程序研究具有高权威的 Twitter 用户之间的交互其中一部分是提取有关用户的信息我使用 Tweepy for Python 构建了一个应用程序过去 2 天我一直在提取用户信息没有出现任何问题突然提出这样的
OutOfRangeError（请参阅上面的回溯）：FIFOQueue '_1_batch/fifo_queue' 已关闭并且元素不足（请求 32，当前大小 0）

我在使用队列中张量流读取图像时遇到问题请让我知道我犯了什么错误下面是代码 import tensorflow as tf slim tf contrib slim from tensorflow python framework imp
Python 的“platform.mac_ver()”报告不正确的 MacOS 版本

我正在使用Pythonplatform module https docs python org 3 library platform html要识别 MacOS 版本如下所示 import platform print platform
二进制数据的Python字符串表示

我试图理解 Python 显示表示二进制数据的字符串的方式这是一个使用的示例乌兰多姆操作系统 http docs python org library os html os urandom In 1 random bytes os ura
matplotlib：在次要标签下绘制主要刻度标签

这看起来应该很容易但我不知道该怎么做我有一个 X 轴上有时间的图我想设置两组刻度小刻度显示一天中的小时大刻度显示日月所以我这样做 set date ticks to something sensible xax ax get
使用记事本打开文本文件作为python中的帮助文件？

我想为我的简单程序的用户提供打开帮助文件的机会以指导他们如何充分利用我的程序理想情况下我希望在 GUI 上有一个蓝色的小帮助链接可以随时单击该链接从而在本机文本编辑器例如记事本中打开 txt 文件有没有一种简单的方法可以做到
从内存中发送图像

我正在尝试为 Discord 机器人实现一个系统该系统可以动态修改图像并将其发送给机器人用户为此我决定使用 Pillow PIL 库因为它对于我的目的来说似乎简单明了这是我的工作代码的示例它加载一个示例图像作为测试修改在其上
导入 scipy.stats 时，出现“ImportError: DLL load failed: 找不到指定的过程”

我无法导入 scipy stats 并收到以下错误但不知何故 import scipy as sp 仍然可以正常工作其他库如numpy pandas都可以毫无问题地导入我尝试在 Anaconda 中重新安装 scipy 1 2 1 降
Selenium 上的切换窗口

我在 Python 中使用 Selenium 和 PhantomJS 我需要打开一个新窗口并控制它出于测试目的我这样做 from selenium import webdriver driver webdriver PhantomJS
python matplotlib 使用按钮事件添加和删除图形中的文本

我试图在调用button press event 时将文本添加到鼠标指针位置的图形中并在调用button release event 时将其删除我已成功添加文本但无法将其删除这是我使用的代码的一部分 def onclick even
带有redirect_uri的social-auth-app-django Facebook后端状态

我知道我的问题听起来像是重复的但我到处寻找但没有找到任何解决方案我正在努力为我的 django web 应用程序实现社交登录到目前为止谷歌推特和雅虎登录均按预期工作但facebook总是给出以下错误 URL 被阻止此重定向失败
如何列出静态链接的 python 版本中可用的所有 openssl 密码？

在python 2 7 8到2 7 9升级中 ssl模块从使用更改为 DEFAULT CIPHERS DEFAULT aNULL eNULL LOW EXPORT SSLv2 to DEFAULT CIPHERS ECDH AESGCM D
如何在 iPython 中获取最后分配的变量的值？

我是一个完全的 iPython 新手但我想知道是否有办法获取最后分配的变量的值 In 1 long variable name 333 In 2
如何在Python中获取套接字的外部IP？

当我打电话时socket getsockname 在套接字对象上它返回我的机器的内部 IP 和端口的元组但是我想找回我的外部IP 最便宜最有效的方式是什么如果没有外部服务器的配合这是不可能的因为您和另一台计算机之间可能存在任意
Pandas 使用什么规则来生成视图和副本？

我对 Pandas 在决定数据帧中的选择是原始数据帧的副本或原始数据帧的视图时使用的规则感到困惑例如如果我有 df pd DataFrame np random randn 8 8 columns list ABCDEFGH index
在 grpc python 中处理异步流请求

我试图了解如何使用双向流处理 grpc api 使用 Python API 假设我有以下简单的服务器定义 syntax proto3 package simple service TestService rpc Translate stre
检测反射 DLL 注入

在过去的几年中恶意软件以及一些渗透测试工具如 Metasploit 的 meterpreter 负载已经开始使用反射 DLL 注入 PDF http www harmonysecurity com files HS P005 Ref
为什么我可以使用 tsql 连接到 Azure MS SQL，但不能使用 pymssql？

我今天在哪里 TDSVER 7 3 tsql H example database windows net U me D ExampleDB p 1433 P notreallymypassword 这不会 gt gt gt import
使用 pyspark 计算所有可能的单词对

我有一个文本文档我需要找到整个文档中重复单词对的可能数量例如我有下面的word文档该文档有两行每行用分隔文档 My name is Sam My name is Sam My name is Sam My name is Sa

随机推荐

Kafka 0.8，是否可以使用java代码创建带有分区和复制的主题？

在 Kafka 0 8beta 中可以使用下面提到的命令创建主题here http kafka apache org 08 quickstart html bin kafka create topic sh zookeeper local
如何每隔 n 个字符或最近的前一个空格分割字符串

我想每 15 个字符包括空格插入一个换行符我目前正在使用下面的正则表达式它在某种程度上起作用但它占用了单词后最近的空格并且我想要最近的前一个空格有任何想法吗 const split str replace s S 15 g 1
拆分 ng 重复项？

简单的问题如果我的控制器中有这个 scope somedata Item 1 Item 2 set from something else 有没有办法在 ngRepeat 表达式中分割我的视图的一些数据就像是 div item div
ApiController Post 中的 Async 和 Await

我仍然不太清楚 net 4 5 中的 async 和 wait 到目前为止我想我明白了等待将函数在其右侧放在单独的线程上将执行返回给当前函数的调用者但会劫持当前函数代码的其余部分直到等待异步函数完成如果我误解了什么
当前上下文中不存在名称“...”

我的里面有一个清单Main 我正在尝试从变量中将一个项目添加到该列表中但它抛出了错误名称 dogList 在当前上下文中不存在在我的里面addDog 方法 dogList Add 由于上述原因无法正常工作 namespace Dogg
postgresql 的 mysql_insert_id 替代品

有没有替代方案mysql insert id PostgreSQL 的 php 函数大多数框架通过查找 ID 中使用的序列的当前值来部分解决问题但是有时主键不是串行列从 PostgreSQL 的角度来看用伪代码来说 insert
Android 中的上传和下载速率分析[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在尝试开发一个 Android 应用程序来测量网络的上传和下载速度我可能需要每 2 秒左右运行一次并对其进行分析 SpeedTe
return Json 函数没有更新我的下拉列表

我有一个包含填充下拉列表的视图我添加了一个按钮以便用户可以在 jquery 模式中添加新的下拉列表值因此当用户单击添加新的下拉列表值时我想刷新下拉列表但目前没有任何更新这是我对下拉列表的看法 model Communique M
调用方法出错，启动jvm失败

我正在使用 javafx v8 0 40 开发桌面应用程序我用inno 5创建了一个exe文件当我在计算机中运行exe文件时它已安装并运行没有任何问题另一方面当我尝试在其他计算机上安装并运行它时在安装结束时会弹出窗口对话框
创建文件系统“驱动程序”

我想为 Windows 物理磁盘上的自定义文件系统创建一个驱动程序我不完全知道解释它的最佳方式但该设备已经具有适当的驱动程序以及 Windows 与之通信的所有内容但我希望用户能够将设备插入到他们的电脑将其显示在我的电脑中并
调用 didEnterBackground 后是否可以在主线程上执行某些操作？

首先如果您认为我的问题是虚拟的我想说声抱歉我是 iOS 和多线程的新手只是想了解事情是如何发生的据我所知didEnterBackground是 iOS 在应用程序挂起之前调用的最后一个函数应用程序有大约 5 秒的时间从中返回否
用不均匀向量列表中的正值替换正表值

背景我最近问这个问题 https stackoverflow com questions 72899527 replacing a subset of table values with a list of vectors 然而我使示例
在 Excel 中打开特定电子表格的 win cmd 是什么？

我知道您可以从 win cmd 行打开 Excel 文件但是如何使用 win cmd 打开该文件中的特定电子表格呢将以下代码粘贴到文本编辑器记事本写字板 Word ETC 例如使用 vbs 扩展名保存文件 ExcelSheet2
使用 Javascript 将数据/有效负载发送到 Google Chrome 推送通知

我正在研究 Google Chrome 推送通知并尝试将有效负载发送给 google Chrome 工作人员但是我不知道如何接收此有效负载我有一个 API 可以在数据库中创建和保存通知我需要通过以下方式发送值 https andro
JACC 提供程序如何使用其部署的服务器的主体到角色映射功能？

我正在写一个JACC提供者在此过程中这意味着实施PolicyConfiguration http download oracle com javaee 6 api javax security jacc PolicyConfigurat
Angular 6：错误 TypeError：“...不是一个函数” - 但它是

我现在真的很困惑因为我得到了ERROR TypeError this device addKeysToObj is not a function 但我实现了这个函数所以我不知道有什么问题或者为什么它不可调用我已经在 Firefox 和
从 HTTP 端点发送消息到 JMS

我正在尝试使用骆驼路由它将接受 http 端点上的有效负载然后将该有效负载写入 JMS 队列到目前为止我所拥有的路线如下但是一条空消息被传递到 jms 队列消息到达那里但没有正文路线如下
为什么 pytesseract 导致 AttributeError: 'NoneType' 对象没有属性 'bands'？

我正在尝试开始使用 pytesseract 但正如你在下面看到的我遇到了问题我发现人们遇到了似乎相同的错误他们说这是 PIL 1 1 7 中的错误其他人说这个问题是由于 PIL 懒惰造成的需要强制 PIL 加载图像im load
array_reduce() 不能用作 PHP 的关联数组“reducer”？

我有一个关联数组 assoc 并且需要将其简化为字符串在这种情况下 OUT
在下载之前使用 HTTP 标头获取文件大小，该标头与从 urlopen 检索到的标头不匹配

为什么使用时内容长度不同requests and urlopen url info gt gt gt url http pymotw com 2 urllib index html gt gt gt requests head url he

在下载之前使用 HTTP 标头获取文件大小，该标头与从 urlopen 检索到的标头不匹配

在下载之前使用 HTTP 标头获取文件大小，该标头与从 urlopen 检索到的标头不匹配 的相关文章

随机推荐

热门标签

在下载之前使用 HTTP 标头获取文件大小，该标头与从 urlopen 检索到的标头不匹配的相关文章