如何使用urllib3下载文件？

2024-04-08

这是基于该网站上的另一个问题：使用 urllib3 下载文件的最佳方式是什么 https://stackoverflow.com/questions/17285464/whats-the-best-way-to-download-file-using-urllib3但是，我不能在那里发表评论，所以我问另一个问题：

如何使用 urllib3 下载（更大的）文件？

我尝试使用与 urllib2 一起使用的相同代码（在Python 3中从网络下载文件 https://stackoverflow.com/questions/7243750/download-file-from-web-in-python-3），但 urllib3 失败：

http = urllib3.PoolManager()

with http.request('GET', url) as r, open(path, 'wb') as out_file:       
    #shutil.copyfileobj(r.data, out_file) # this writes a zero file
    shutil.copyfileobj(r.data, out_file)

这表示“bytes”对象没有属性“read”

然后我尝试使用该问题中的代码，但它陷入无限循环，因为数据始终为“0”：

http = urllib3.PoolManager()
r = http.request('GET', url)

with open(path, 'wb') as out:
    while True:
        data = r.read(4096)         
        if data is None:
            break
        out.write(data)
r.release_conn()

但是，如果我读取内存中的所有内容，文件就会正确下载：

http = urllib3.PoolManager()
r = http.request('GET', url)
with open(path, 'wb') as out:
    out.write(data)

我不想这样做，因为我可能会下载非常大的文件。不幸的是，urllib 文档没有涵盖本主题中的最佳实践。

（另外，请不要建议使用 requests 或 urllib2，因为它们在自签名证书方面不够灵活。）

你已经非常接近了，所缺少的部分正在设置preload_content=False（这将是即将发布的版本中的默认设置）。您还可以将响应视为类似文件的对象，而不是.data属性（这是一个神奇的属性，希望有一天会被弃用）。

- with http.request('GET', url) ...
+ with http.request('GET', url, preload_content=False) ...

这段代码应该可以工作：

http = urllib3.PoolManager()

with http.request('GET', url, preload_content=False) as r, open(path, 'wb') as out_file:       
    shutil.copyfileobj(r, out_file)

urllib3 的响应对象也遵循io界面 https://docs.python.org/2/library/io.html，所以你也可以做类似的事情...

import io
response = http.request(..., preload_content=False)
buffered_response = io.BufferedReader(response, 2048)

只要你添加preload_content=False对于您的三种尝试中的任何一种并将响应视为类似文件的对象，它们都应该有效。

不幸的是，urllib 文档没有涵盖本主题中的最佳实践。

您完全正确，我希望您考虑通过在此处发送拉取请求来帮助我们记录此用例：https://github.com/shazow/urllib3 https://github.com/shazow/urllib3

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用urllib3下载文件？的相关文章

ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
如何使用 Python boto3 获取 redshift 中的列名称

我想使用 python boto3 获取 redshift 中的列名称创建Redshift集群将数据插入其中配置的机密管理器配置 SageMaker 笔记本打开Jupyter Notebook写入以下代码 import boto3
将 C++ 指针作为参数传递给 Cython 函数

cdef extern from Foo h cdef cppclass Bar pass cdef class PyClass cdef Bar bar def cinit self Bar b bar b 这总是会给我类似的东西 Can
使用 Python 3 动态插入到 sqlite

我想使用 sqlite 写入多个表但我不想提前手动指定查询有数十种可能的排列例如 def insert sqlite tablename data list global dbc dbc execute insert into tab
检查 python 中命令行参数的数量

我是蟒蛇新手还是把脚弄湿了我正在尝试做这样的事情 import sys if len sys argv lt 3 or lt len sys argv gt 3 print This script will compare two fi
从 pyspark.sql 中的列表创建数据框

我完全陷入了有线的境地现在我有一个清单li li example data map lambda x get labeled prediction w x collect print li type li 输出就像 0 0 59 0 0
为什么第二个 request.session cookies 返回空？

我想使用 requests Session post 登录网站但是当我已经登录主页然后进入帐户页面时看来cookies还没有保存因为cookies是空的而且我无法进入正确的帐户页面 import requests from bs4
python celery -A 的无效值无法加载应用程序

我有一个以下项目目录 azima init py main py tasks py task py from main import app app task def add x y return x y app task def mul
python 中的 h2o 框架子集

如何在 python 中对 h2o 框架进行子集化如果 x 是一个 df 并且 Origin 是一个变量那么在 pandas 中我们通常可以通过以下方式进行子集化 x x Origin AAF 但使用 h2o 框架会出现以下错误 H2O
在Python中读取tiff标签

我正在尝试用 Python 读取 tiff 文件的标签该文件是 RGB 的uint16每个通道的值我目前正在使用tifffile import tifffile img tifffile imread file tif 然而 img是一
Python MySQL 操作错误：1045，“用户 root@'localhost' 的访问被拒绝

我试图通过以下方式从我的 python 程序访问数据库 db mysql connect host localhost user Max passwd maxkim db TESTDB cursor db cursor 但是我在第一行代码
在 Mac OSX 上从 Python 3.6 运行 wine 命令

我正在尝试用 Python 编写一个打开的脚本wine然后发送代码到wine终端打开一个 exe程序这 exe程序也是命令驱动的我可以打开wine 但我无法进一步 import shlex subprocess line usr bin
更改QLineEdit的ClearButton图标

我想在Windows 10 1909 64位上的Python 3 8和PyQt5 5 15 0 上更改我的QLineEdit的ClearButton图标稍后我想在Linux上运行代码我尝试应用此处找到的代码如何在 QLineEdit
Python“非规范化”unicode 组合字符

我正在寻找标准化 python 中的一些 unicode 文本我想知道是否有一种简单的方法可以在 python 中获得组合 unicode 字符的非规范化形式例如如果我有序列u o xaf i e latin small lette
如何在 Django Rest 框架中编写“删除”操作的测试

我正在为 Django Rest Framework API 编写测试我一直在测试删除我对创建的测试工作正常这是我的测试代码 import json from django urls import reverse from re
PIL.Image.open和tf.image.decode_jpeg返回值的区别

我使用 PIL Image open 和 tf image decode jpeg 将图像文件解析为数组但发现PIL Image open 中的像素值与tf image decode jpeg不一样为什么会出现这种情况 Thanks 代
高效创建抗锯齿圆形蒙版

我正在尝试创建抗锯齿加权而不是布尔圆形掩模以制作用于卷积的圆形内核 radius 3 no of pixels to be 1 on either side of the center pixel shall be decimal a
将时间添加到日期时间

我有一个像这样的日期字符串然后使用strptime 所以就像这样 my time datetime datetime strptime 07 05 15 m d Y 现在我想添加 23 小时 59 分钟my time 我努力了 timed
如何使用xlwt设置文本颜色

我无法找到有关如何设置文本颜色的文档在 xlwt 中如何完成以下操作 style xlwt XFStyle bold font xlwt Font font bold True style font font background col

随机推荐

如何在数据库中存储很旧的日期？

这实际上不是我遇到的问题但想象一下有人正在建立一个有关中世纪的网站并想要存储日期他们会如何做 MySQL 规范DATE说它不会低于 1000 年当格式为YYYY MM DD 您如何存储有关的信息苏格兰国王肯尼思二世去世 http en
Bootstrap 4 无线电验证

我需要在使用 Bootstrap 4 的页面中使用 Radio 元素进行表单验证方面的一些帮助我需要在单选元素下方添加错误消息 div class invalid feedback Please choose an option div
如何使用Control.FromHandle？

我看到一个名为 Control FromHandle 的方法它应该允许您访问它现在我想使用这段代码尝试一下 DllImport user32 dll SetLastError true static extern IntPtr F
write 函数在 Unix 上需要 unistd.h，那么 Windows 上呢？

我已经从 Linux 计算机更改为 Windows 但在编译代码时遇到了问题因为这两个操作系统不共享相同的头文件由于unistd h没有明显包含在内 Visual C不知道什么read write close socklen t and
当其中一个参数中有空格时，nodeJS child_process.spawn 不起作用

我正在尝试使用child process spawn功能语法是 child process spawn command args options 每当我在 args 数组的任何元素中包含空格时该命令都会简单地发出参数这是我用来测试它的
适用于多个应用程序的 OWIN 身份验证服务器

我正在实现一个解决方案该解决方案具有 MVC 客户端让我们在 localhost 4077 调用此 CLIENT 和 WebAPI 服务在 localhost 4078 调用 API 我已经在 API 中实现了 OWIN OAuth
Roslyn：如何使用 Roslyn C# 获取声明语法的命名空间

我有一个包含一些类文件的 C 解决方案借助 Roslyn 我能够解析解决方案以获取解决方案中的项目列表从那里我可以获得每个项目中的文档然后我可以获得每个 ClassDeclarationSyntax 的列表这是起点 foreac
Android EditText (TextView) 如何绘制闪烁的光标？

我正在制作自己的蒙古竖字TextView and EditText 通过扩展从头开始View 我试图了解闪烁光标是如何在Android TextView源代码 https github com android platform framew
从 Stripe 获取 Webhook 异常

我正在尝试从 Stripe 设置一个 webhook 来处理payment intent succeeded事件但我得到一个例外这是我来自 Node 后端的代码我已经提取了我希望的所有相关部分如果需要其他任何内容请告诉我 cons
使用react-testing-library测试material ui popper时如何修复“TypeError: document.createRange is not a function”错误？

我有一个材料用户界面TextField焦点打开时Popper 我正在尝试使用react testing library 来测试这种行为成分 import ClickAwayListener from material ui core Cl
如何在 SQL 中过滤掉包含空数据或空数据的特定列的行？

在 SQL 中我们如何进行检查以过滤包含列数据为 null 或空的所有行例如 Select Name Age from MEMBERS 我们需要检查 Name 不应等于 null 或空这将适用于所有理智的数据库眨眼眨眼并将返回名称
在无父 LinearLayout 上设置 LayoutParams

我以编程方式创建 LinearLayout 然后我想通过自定义编写的适配器将其附加到 GridView 我想为新创建的 LinearLayout 设置宽度和高度当我尝试这样做时出现以下异常 03 18 15 50 54 648 E An
使用 JSON 将用户定义的对象从 jQuery 传递到 ASP.NET Webmethod

我正在尝试将一些简单的 JSON 从 jQuery 传递到 ASP NET 4 5 Webmethod 它并没有按照我想要的方式工作如果我接受输入作为单独的参数它就会起作用 WebMethod public static Address
为 Matlab 编译 MEX 文件时如何忽略 `mexopts.sh`？

The f命令行参数mex允许指定的位置mexopts sh我们希望使用的但是有没有办法告诉Matlab忽略mexopts sh 为了编译特定的 MEX 文件我需要指定CC CFLAGS等调用时直接在命令行mex 已给出的值mexop
在 Eclipse 中调试（Java）；中断查看值时无法将鼠标悬停在变量上

我正在使用 Eclipse 编写 Java 代码适用于 Android 并尝试像平常一样调试代码不过我通常使用 C 据我所知在 Eclipse 中调试非常糟糕我不知道我是否做错了什么但这似乎很糟糕这是正在运行的代码我收到某种异
SQL 更新 WHERE xx AND 最近记录

我需要做一些看似非常简单的事情 bdd gt query UPDATE mytable SET aaa aaa bbb bbb WHERE name name 我的问题我有多个记录与此 WHERE 匹配并且我只想更新最新的记录我有一个
仅捕获 UIView 2 手指 UIPanGestureRecognizer

我有几个UIScrollViews 在我的视图控制器中我想覆盖一个捕获 2 根手指滑动的视图UIPanGestureRecognizer这不会记录UIScrollView滑动手势当我使用 2 根手指平移手势在内容上放置透明视图时不会检
该脚本的安全性（强化程度）如何？

下面的脚本 test php 旨在放置在我所有 WordPress 站点的特定目录中它的目的是抓取下面 source地址处的文件并将其解压到它所在的目录中这就是它的全部目的例如我的中央服务器上将有一个仪表板界面其中列出了存在此脚本
用于静态管理的包装组件

我想创建一个新组件其中包含Inputs and Fields from aor并用在
如何使用urllib3下载文件？

这是基于该网站上的另一个问题使用 urllib3 下载文件的最佳方式是什么 https stackoverflow com questions 17285464 whats the best way to download file us

如何使用urllib3下载文件？

如何使用urllib3下载文件？ 的相关文章

随机推荐

热门标签

如何使用urllib3下载文件？的相关文章