urllib2 python（传输编码：分块）

2023-11-22

我使用以下 python 代码来下载 html 页面：

response = urllib2.urlopen(current_URL)
msg = response.read()  
print msg

对于诸如以下的页面this one，它打开 url 时没有错误，但随后仅打印 html 页面的一部分！

在以下几行中，您可以找到 html 页面的 http 标头。我认为问题是由于“传输编码：分块”造成的。

看来 urllib2 仅返回第一个块！我很难阅读剩余的块。我如何读取剩余的块？

Server: nginx/1.0.5
Date: Wed, 27 Feb 2013 14:41:28 GMT
Content-Type: text/html;charset=UTF-8
Transfer-Encoding: chunked
Connection: close
Set-Cookie: route=c65b16937621878dd49065d7d58047b2; Path=/
Set-Cookie: JSESSIONID=EE18E813EE464664EA64086D5AE9A290.tpdjo13v_3; Path=/
Pragma: No-cache
Cache-Control: no-cache,no-store,max-age=0
Expires: Thu, 01 Jan 1970 00:00:00 GMT
Vary: Accept-Encoding
Content-Language: fr

我发现如果指定了 Accept-Language 标头，服务器不会丢弃 TCP 连接，否则会丢弃。

curl -H "Accept-Language:uk,en-US;q=0.8,en;q=0.6,ru;q=0.4" -v 'http://www.legifrance.gouv.fr/affichJuriJudi.do?oldAction=rechJuriJudi&idTexte=JURITEXT000024053954&fastReqId=660326373&fastPos=1'

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

urllib2

chunked

transferencoding

urllib2 python（传输编码：分块）的相关文章

是否有解决方法可以通过 CoinGecko API 安全检查？

我在工作中运行我的代码一切都很顺利但在不同的网络家庭 WiFi 上我不断收到403访问时出错CoinGecko V3 API https www coingecko com api documentations v3 可以观察到在
保存为 HDF5 的图像未着色

我目前正在开发一个将文本文件和 jpg 图像转换为 HDF5 格式的程序用HDFView 3 0打开似乎图像仅以灰度保存 hdf h5py File Sample h5 img Image open Image jpg data np
Python 中的舍入浮点问题

我遇到了 np round np around 的问题它没有正确舍入我无法包含代码因为当我手动设置值而不是使用我的数据时返回有效但这是输出 In 177 a Out 177 0 0099999998 In 178 np rou
处理 Python 行为测试框架中的异常

我一直在考虑从鼻子转向行为测试摩卡柴等已经宠坏了我到目前为止一切都很好但除了以下之外我似乎无法找出任何测试异常的方法 then It throws a KeyError exception def step impl contex
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
跟踪 pypi 依赖项 - 谁在使用我的包

无论如何是否可以通过 pip 或 PyPi 来识别哪些项目在 Pypi 上发布可能正在使用我的包也在 PyPi 上发布我想确定每个包的用户群以及可能尝试积极与他们互动预先感谢您的任何答案即使我想做的事情是不可能的这实际上是不
将 python2.7 与 Emacs 24.3 和 python-mode.el 一起使用

我是 Emacs 新手我正在尝试设置我的 python 环境到目前为止我已经了解到在 python 缓冲区中使用 python mode el C c C c将当前缓冲区的内容加载到交互式 python shell 中显然使用了什么
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
如何使用 Pandas、Numpy 加速 Python 中的嵌套 for 循环逻辑？

我想检查一下表的字段是否TestProject包含了Client端传入的参数嵌套for循环很丑陋有什么高效简单的方法来实现吗非常感谢您的任何建议 def test parameter a list parameter b list g
Pandas Merge (pd.merge) 如何设置索引和连接

我有两个 pandas 数据框 dfLeft 和 dfRight 以日期作为索引 dfLeft cusip factorL date 2012 01 03 XXXX 4 5 2012 01 03 YYYY 6 2 2012 01 04 XX
使用 xlrd 打开 BytesIO (xlsx)

我正在使用 Django 需要读取上传的 xlsx 文件的工作表和单元格使用 xlrd 应该可以但因为文件必须保留在内存中并且可能不会保存到我不知道如何继续的位置本例中的起点是一个带有上传输入和提交按钮的网页提交后文件被捕获req
在Python中检索PostgreSQL数据库的新记录

在数据库表中第二列和第三列有数字将会不断添加新行每次每当数据库表中添加新行时 python 都需要不断检查它们当 sql 表中收到的新行数低于 105 时 python 应打印一条通知消息警告数量已降至 105 以下另一方面
如何通过 TLS 1.2 运行 django runserver

我正在本地 Mac OS X 机器上测试 Stripe 订单我正在实现这段代码 stripe api key settings STRIPE SECRET order stripe Order create currency usd em
javascript 是否有等效的 __repr__ ？

我最接近Python的东西repr这是 function User name password this name name this password password User prototype toString function r
Python3 在 DirectX 游戏中移动鼠标

我正在尝试构建一个在 DirectX 游戏中执行一些操作的脚本除了移动鼠标之外我一切都正常是否有任何可用的模块可以移动鼠标适用于 Windows python 3 Thanks I used pynput https pypi or
从 NumPy ndarray 中选择行

我只想从 a 中选择某些行NumPy http en wikipedia org wiki NumPy基于第二列中的值的数组例如此测试数组的第二列包含从 1 到 10 的整数 gt gt gt test numpy array nump
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
Scipy Sparse：SciPy/NumPy 更新后出现奇异矩阵警告

我的问题是由大型电阻器系统的节点分析产生的我基本上是在设置一个大的稀疏矩阵A 我的解向量b 我正在尝试求解线性方程A x b 为了做到这一点我正在使用scipy sparse linalg spsolve method 直到最近一切都
使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

作为一个潜在的解决方案这个问题 https stackoverflow com questions 76476327 how to avoid creating many binary switching variables in gekk

随机推荐

应用程序池的回收会杀死 Kestrel 但不会重新启动

背景在 IIS 8 上托管非核心 ASP net 站点时可以利用IIS应用程序初始化模块在 IIS 启动时或者我相信当应用程序池被回收时主动初始化预热 Web 应用程序据我所知在 IIS 上托管 net Core 应用程
如何在 BASH 中使用 xmlstarlet 计算 XML 文档中的元素数量？

我需要计算某个元素在 XML 文档中出现的次数我需要计数的元素称为 ThreadGroup 要计数的元素
动态 linq 构建表达式

我需要为动态搜索创建动态 linq 表达式基本搜索可以工作但无法与集合一起使用我能够获得书名和作者但无法获得所需的页面标题我得到了例外 left11 Expression Property page1 标题我认为我构建的表达式无
类似 memcached 的键/值缓存，同时使用 RAM 和磁盘 [关闭]

很难说出这里问的是什么这个问题模棱两可含糊不清不完整过于宽泛或言辞激烈无法以目前的形式合理回答如需帮助澄清此问题以便重新打开访问帮助中心我有一个 Java Web 应用程序可以在后端使用第三方 Web 服务调用 Web
如何解决内核配置无效问题

我正在尝试构建模块但这里有一些问题错误内核配置无效 include generated autoconf h 或 include config auto conf 丢失在内核 src 上运行 make oldconfig make
如何创建使用 asp:ListItem 列表作为子控件的 ASP.NET 用户/服务器控件？

我希望创建一个用户服务器控件该控件将使用如下内容创建
提取 keras 模型的最后一层作为子模型

假设我们有一个卷积神经网络 M 我可以使用以下方法从图像中提取特征 extractor Model M inputs M get layer last conv output features extractor predict X 我怎样
使用 net tcp 的 WCF 双工服务：“需要流安全性...”

我正在编写一项服务允许用户注册并在事件发生时接收通知我正在尝试使用 netTcpBinding 来执行此操作但即使在本地计算机上运行也会不断出现错误当我尝试发送通知时我超时并收到此错误需要流安全性http www w3 org
SCRIPT5022：已达到 10 次 $digest() 迭代。流产！并重定向到index.html

Problem 我正在尝试在引导模式窗格中加载 Angular JS 应用程序但它在 Internet Explorer 上显示奇怪的行为我们已在 IE9 和 8 上对其进行了测试我们发现出现以下错误 JSON 未定义对象错误未定义
如何将网络中的图形加载到 PyTorch 几何图形并设置节点特征和标签？

Goal 我正在尝试导入图表FROMnetworkx 到 PyTorch 几何和设置标签和节点特征这是Python中的问题我该如何做到这一点从networkx到PyTorch几何的转换大概通过使用from networkx功能如
访问类别中的私有变量会导致链接器错误

编辑我不会这样做我现在意识到这有多么危险但是这个问题仍然纯粹出于学术目的我正在尝试在 NSCollectionView 上实现一个类别该类别将允许我访问私有变量 displayedItems 我需要能够在我的子类中访问它因此
未捕获的引用错误：$未定义（ajax）

我在一个简单的 jsp 上遇到此错误未捕获的引用错误未定义我只是试图回忆一下 Eclipse 上另一个项目的服务休息但它似乎不起作用代码在这里
HttpUrlConnection 带进度条的分段文件上传

我想通过以下方式检查上传文件的进度HttpUrlConnection 我怎样才能做到这一点我尝试在写入数据时计算字节OutputStream但这是错误的因为只有当我打电话时才会真正上传conn getInputStream 所以我需要以
用悬停而不是点击触发 fancybox？

我试图在鼠标悬停在链接上时触发 fancybox 但没有运气有什么建议吗 document ready function This is basic uses default settings a inline fancybox hide
使用 alpha 透明度从 0 到 1 绘制透明渐变

我在 Android 中有一个动态生成的位图我想从顶部边缘开始羽化这样边界区域在顶部完全透明并逐渐在下面稍微变为完全不透明创建均匀的完全透明的顶部边缘 transparentPaint new Paint Paint ANTI AL
自定义 Bootstrap 4 的网格系统断点

我有一个应用程序其中设计需要分别从台式机到平板电脑或 xl 到 lg 的 1280 个断点然而 Bootstrap 本身在 1200 处有 xl 断点我需要全局更改 xl 断点以进行引导我必须从源文件重新编译 Bootstrap 4
如何从 git diff --no-index 中排除文件和目录

如何排除文件和目录git diff no index 例如我想显示两个目录之间的差异project1 project2而忽略了他们的高层 git目录 project1 git project2 git 和他们所有的 DS Store fi
使用 BoneCP：处理来自池的连接

我刚刚开始使用 BoneCP 这是我第一次使用连接池我对应该如何使用它有点困惑目前我将 BoneCP 对象保存为静态变量因此我可以在不同的连接之间使用它当我完成连接后我将其关闭connection close 我应该这样做还是不
为什么每个公共类都在单独的文件中？

我最近开始学习Java 发现很奇怪每个Java公共类都必须在单独的文件中声明我是一名 C 程序员 C 不强制执行任何此类限制 Java为什么要这样做呢有没有什么设计考虑编辑基于一些答案为什么 Java 在 IDE 时代还不取消这
urllib2 python（传输编码：分块）

我使用以下 python 代码来下载 html 页面 response urllib2 urlopen current URL msg response read print msg 对于诸如以下的页面this one 它打开 url 时没

urllib2 python（传输编码：分块）

urllib2 python（传输编码：分块） 的相关文章

随机推荐

热门标签

urllib2 python（传输编码：分块）的相关文章