在 Python 中使用 urllib2。如何获取正在下载的文件的名称？

2023-12-22

我是一个Python初学者。我正在使用 urllib2 下载文件。下载文件时，我指定一个文件名，用于将下载的文件保存在硬盘上。但是，如果我使用浏览器下载文件，则会自动提供默认文件名。

这是我的代码的简化版本：

def downloadmp3(url):
    webFile = urllib2.urlopen(url)
    filename = 'temp.zip'
    localFile = open(filename, 'w')
    localFile.write(webFile.read())

该文件下载得很好，但如果我在浏览器中输入变量“url”中存储的字符串，则下载时会为该文件指定一个默认文件名。我想将此文件名用于我下载的文件，而不是“temp.zip”或我指定的任何文件名。

如何使用 urllib2 （或其他一些 Python 库）以我下载的服务器想要的文件名保存文件？

如果有人不明白这个问题，请说出来，以便我可以尽力说得更清楚。

文件名通常由服务器通过 content-disposition 标头包含：

content-disposition: attachment; filename=foo.pdf

您可以通过以下方式访问标头

result = urllib2.urlopen(...)
result.info() <- contains the headers


i>>> import urllib2
ur>>> result = urllib2.urlopen('http://zopyx.com')
>>> print result
<addinfourl at 4302289808 whose fp = <socket._fileobject object at 0x1006dd5d0>>
>>> result.info()
<httplib.HTTPMessage instance at 0x1006fbab8>
>>> result.info().headers
['Date: Mon, 04 Apr 2011 02:08:28 GMT\r\n', 'Server: Zope/(unreleased version, python 2.4.6, linux2) ZServer/1.1 Plone/3.3.4\r\n', 'Content-Length: 15321\r\n', 'Content-Type: text/html; charset=utf-8\r\n', 'Via: 1.1 www.zopyx.com\r\n', 'Cache-Control: max-age=3600\r\n', 'Expires: Mon, 04 Apr 2011 03:08:28 GMT\r\n', 'Connection: close\r\n']

See

http://docs.python.org/library/urllib2.html http://docs.python.org/library/urllib2.html

但请注意，该标头不需要存在。否则，您需要根据请求的 URL 自行生成一个合理的名称 - 例如从 URI 的最后一个组成部分开始。在这种情况下，请使用 Python 的 urlparse() 方法。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Download

default

filenames

urllib2

在 Python 中使用 urllib2。如何获取正在下载的文件的名称？的相关文章

是否有解决方法可以通过 CoinGecko API 安全检查？

我在工作中运行我的代码一切都很顺利但在不同的网络家庭 WiFi 上我不断收到403访问时出错CoinGecko V3 API https www coingecko com api documentations v3 可以观察到在
元组有什么用？

我现在正在学习 Python 课程我们刚刚介绍了元组作为数据类型之一我阅读了它的维基百科页面但是我无法弄清楚这种数据类型在实践中会有什么用处我可以提供一些需要一组不可变数字的示例吗也许是在 Python 中这与列表有何不同每
在 django ORM 中查询时如何将 char 转换为整数？

最近开始使用 Django ORM 我想执行这个查询 select student id from students where student id like 97318 order by CAST student id as UNSIG
如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

我正在尝试使用全向模块 http docs opencv org trunk db dd2 namespacecv 1 1omnidir html用于对鱼眼图像进行扭曲处理Python 我正在尝试适应这一点C 教程 http docs op
用枢轴点拟合曲线 Python

我有下面的图我想用 2 条线来拟合它使用 python 我设法适应上半部分 def func x a b x np array x return a x b popt pcov curve fit func up x up y 我想用另
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
删除flask中的一对一关系

我目前正在使用 Flask 开发一个应用程序并且在删除一对一关系中的项目时遇到了一个大问题我的模型中有以下结构 class User db Model tablename user user id db Column db String
Pandas 日期时间格式

是否可以用零后缀表示 pd to datetime 似乎零被删除了 print pd to datetime 2000 07 26 14 21 00 00000 format Y m d H M S f 结果是 2000 07 26 14
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
为什么 PyYAML 花费这么多时间来解析 YAML 文件？

我正在解析一个大约 6500 行的 YAML 文件格式如下 foo1 bar1 blah name john age 123 metadata whatever1 whatever whatever2 whatever stuff thi
“隐藏”内置类对象、函数、代码等的名称和性质[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我很好奇模块中存在的类builtins无法直接访问的例如 type lambda 0 name function of module
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
使用特定颜色和抖动在箱形图上绘制数据点

我有一个plotly graph objects Box图我显示了箱形图中的所有点我需要根据数据的属性为标记着色如下所示我还想抖动这些点下面未显示 Using Box我可以绘制点并抖动它们但我不认为我可以给它们着色 fig a
python import inside函数隐藏现有变量

我在我正在处理的多子模块项目中遇到了一个奇怪的 UnboundLocalError 分配之前引用的局部变量问题并将其精简为这个片段使用标准库中的日志记录模块 import logging def foo logging info fo
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
模拟pytest中的异常终止

我的多线程应用程序遇到了一个错误主线程的任何异常终止例如未捕获的异常或某些信号都会导致其他线程之一死锁并阻止进程干净退出我解决了这个问题但我想添加一个测试来防止回归但是我不知道如何在 pytest 中模拟异常终止如果我只
Django-tables2 列总计

我正在尝试使用此总结列中的所有值文档 https github com bradleyayers django tables2 blob master docs pages column headers and footers rst 但页
如何计算Python中字典中最常见的前10个值

我对 python 和一般编程都很陌生所以请友善我正在尝试分析包含音乐信息的 csv 文件并返回最常听的前 n 个乐队从下面的代码中每听一首歌曲都是一个列表中的字典条目格式如下 album Exile on Main Street
在 JavaScript 函数的 Django 模板中转义字符串参数

我有一个 JavaScript 函数它返回一组对象 return Func id name 例如我在传递包含引号的字符串时遇到问题 Dr Seuss ABC BOOk 是无效语法 I tried name safe 但无济于事有什么解

随机推荐

300GB Postgis 表索引速度慢

我正在将大约 300GB 的等高线数据加载到 postgis 表中为了加快这个过程我读到首先加载数据然后创建索引是最快的加载数据只花了大约2天的时间但现在我已经等待索引大约30天了它仍然没有准备好查询是 create inde
如何使用 React Native Agora 显示传入视频通话

我想在我的 React Native 应用程序中添加实时通话功能我正在使用agora和socket io来使其实时并且当应用程序位于前台时它工作正常但是当应用程序关闭时我被卡住了因为应用程序关闭时套接字不起作用我想像来电屏幕一样显示
您可以将图像分配给 border-right 吗？

我正在 html 和 css 中制作一个导航菜单但我希望每个导航项的右侧边框是一个图像 I tried border right url image jpg 但这没有用我该怎么做您可以使用背景图像然后将背景图像放置在每个元素的右侧
在java中，除了遵循if-else梯子之外，还有什么更好的选择呢？

情况我正在检查文件名文件名存储在String变量称为str并根据入住条件if语句我正在设置一个名为的变量的值mailType if str contains template if str contains unsupported ma
Java -> Scala，集合上的性能

在Java中根据集合的用法我们不使用相同的实现即ArrayList vs LinkedList 来自 Java 背景有人可以告诉我关于 Scala 集合和性能注意事项我应该了解什么吗看来 Scala List 的不可变版本是某种不
在 Angular 中的兄弟组件之间传递数据

Above image depicts my Angular 2 application Main component has two child components FromComponent and ToComponent FromC
通过 PubSubHubbub 推送新直播的通知

我希望收到有关 YouTube 频道的新直播的通知如中所述YouTube v3 推送通知 https developers google com youtube v3 guides push notifications我已经设置了一个公共
在 MATLAB 中向量化线性方程组的解

Summary 本问题涉及线性回归计算算法的改进我有一个 3D dlMAT 表示在不同曝光时间拍摄的同一场景的单色照片的数组向量IT 从数学上讲沿第三维的每个向量dlMAT代表需要解决的单独线性回归问题需要估计其系数的方程的形式为
为什么 * 不被视为数学符号？ [复制]

这个问题在这里已经有答案了我正在回答这个question https stackoverflow com questions 39515852 what exactly is classified as a symbol in c 395
创建多个动态图表

我正在开发一个网络应用程序 MEAN stack 我正在尝试使用 ChartJS 圆环图但我需要它完全动态首先图表的数量是动态的每个图表代表其他东西所以有时它会是 3 个有时是 20 个第二我希望我能够访问每个图表以进行实时
有人有使用 NHibernate 创建偶尔连接的浏览器应用程序的经验吗？

我们需要使基于 ASP NET NHibernate 浏览器的企业应用程序能够在连接到客户服务器或从客户服务器断开连接时正常运行有人这样做过吗如果是这样你是怎么做到的技术架构等背景我们开发和销售基于浏览器的企业应用程序供建筑
如何确定字符串开头是两个还是一个数字？

我怎样才能确定什么数字带有随意的位数位于字符串的开头一些可能的字符串 1123 http example com 2 daas 应该返回 1123 和 2 使用正则表达式 using System Text RegularExpres
Android TextView 在从右到左的设备上右对齐

我正在编写一个以希伯来语显示的应用程序为此我右对齐 TextView 的文本在 Nexus 设备上进行开发时一切都运行良好并且使用 TextView 的 android gravity right 来按应有的方式显示文本当我在运行
使用spec/test文件夹设置tsconfig

假设我把我的代码放在下面src和测试下spec spec classA spec ts src classA ts classB ts index ts tsconfig json 我只想转译src to the dist文件夹自从ind
firebase.database.ServerValue.TIMESTAMP 触发 child_changed 两次，哪一个是正确的？

设定时firebase database ServerValue TIMESTAMP在参考中 child changed 被调用两次一次调用是本地时间另一次调用是实际服务器时间吗我正在使用以下方法处理双重调用 ref once 打电话
为什么我的 div 中没有调用我的 javascript 函数？

我希望 div 只调用一个函数不移动我在页面上的位置而不是调用我的 JavaScript 函数它会移动我在页面上的位置我究竟做错了什么在 joomla 内部运行为什么我的 div 中没有调用我的 JavaScript 函数 ht
jQuery droppable - 在拖动期间接收事件（不仅仅是在初始拖动时）

我在用jQuery 可删除 http jqueryui com demos droppable 和这个结合jQuery 可拖动 http jqueryui com demos draggable 以允许用户通过将列表中的项目拖放到表上来向
带非 TLS 后端的 HTTPS 负载均衡器和带 TLS 后端的 HTTPS 负载均衡器有什么区别

我正在尝试配置负载均衡器 https cloud google com load balancing 使用 HTTPS 提供的证书提供服务让我们加密 https letsencrypt org 尽管我还做不到读这篇文章article ht
为什么 Ajax.BeginForm 不传递表单值？

我试图通过调用 Ajax BeginForm 显示部分视图但我无法接收表单的值我需要获取控制器中隐藏输入 bookId 的值例如 5 View using Ajax BeginForm Detail Books new AjaxOpt
在 Python 中使用 urllib2。如何获取正在下载的文件的名称？

我是一个Python初学者我正在使用 urllib2 下载文件下载文件时我指定一个文件名用于将下载的文件保存在硬盘上但是如果我使用浏览器下载文件则会自动提供默认文件名这是我的代码的简化版本 def downloadmp3 u

在 Python 中使用 urllib2。如何获取正在下载的文件的名称？

在 Python 中使用 urllib2。如何获取正在下载的文件的名称？ 的相关文章

随机推荐

热门标签

在 Python 中使用 urllib2。如何获取正在下载的文件的名称？的相关文章