使用 Python 进行 requests.get() 后 PDF 文件损坏

2024-04-19

我正在尝试使用 requests.get() 下载 PDF 文件。它适用于我发现的大多数测试 PDF 文件，但对于本例则不起作用，并且文件已损坏。如果我用浏览器打开 URL 并保存文件，它就可以正常工作。我尝试使用“Stream”分块下载它，但结果相同。你能向我解释一下我错过了什么吗？

import requests

file_url = 'http://medianet.edmond-de-rothschild.fr/edram/pdf/kiid_fr0010172767_en_20200120_20200128_1954.pdf'


headers = {'Content-type': 'application/pdf'}
r = requests.get(file_url, headers=headers)

with open("python.pdf", "wb") as pdf:
    pdf.write(r.content)
    pdf.close()

修复header信息使其发挥作用。

import requests

file_url = "http://medianet.edmond-de-rothschild.fr/edram/pdf/kiid_fr0010172767_en_20200120_20200128_1954.pdf"

headers = {
    "User-Agent": "PostmanRuntime/7.20.1",
    "Accept": "*/*",
    "Cache-Control": "no-cache",
    "Postman-Token": "8eb5df70-4da6-4ba1-a9dd-e68880316cd9,30ac79fa-969b-4a24-8035-26ad1a2650e1",
    "Host": "medianet.edmond-de-rothschild.fr",
    "Accept-Encoding": "gzip, deflate",
    "Connection": "keep-alive",
    "cache-control": "no-cache",
}

r = requests.get(file_url, file_url, headers=headers)

with open("python.pdf", "wb") as pdf:
    pdf.write(r.content)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

pdf

pythonrequests

使用 Python 进行 requests.get() 后 PDF 文件损坏的相关文章

有没有办法离线将多个 Plotly HTML 文件合并/嵌入到一个页面/HTML 文件中？

我正在尝试将多个图表合并成一个 HTML 报告来发送问题是我真的不认为子图是最好的主意因为图表相对不相关不同的 X Y 轴我所需要做的只是将图表附加到 1 个 HTML 文件中有一个指南解释了如何使用绘图 URL 来完成此操作但
Python：我可以修改元组吗？

我有一个 2 D 元组实际上我以为它是一个列表但错误说它是一个元组但无论如何该元组的形式为浮点数 val prod id 现在我有一个字典其中包含 key gt prod id 和 value prod name 现在我想将
将 python scikit learn 模型导出到 pmml

我想将 python scikit learn 模型导出到 PMML 中什么 python 包最适合我读到Augustus https github com opendatagroup augustus 但我找不到任何使用 scikit
在 Windows 上使用 Python 打开设备句柄

我正在尝试使用 Giveio sys 驱动程序该驱动程序需要先打开一个文件然后才能访问受保护的内存我正在查看 WinAVR AVRdude 中的 C 示例它使用以下语法 define DRIVERNAME giveio HANDL
如何在 for 循环中跳过一些迭代

在 python 中我通常简单地循环遍历范围 for i in range 100 do something 但现在我想跳过循环中的几个步骤更具体地说我想要类似的东西continue 10 这样它就会跳过整个循环并将计数器增加 10
是否可以在 SQLAlchemy 中创建一个可以创建父记录的事件侦听器？

有两个表父表和子表我想创建一个事件监听器触发器如果孩子没有父母它可以创建父母这就是我试图做的 class parent db Model tablename parent id db Column db Integer prim
将 KB/MB/GB 等字符串解析为数值

为了不发明自行车我想知道是否有任何库能够将大小字符串 MB KB TB MiB KiB 等的各种表示形式解析为基于数字字节的值 ActiveState Receipes 有一个示例here http code activestate c
AWS Lambda - 在区域之间自动复制 EC2 快照？

我想创建一个 Lambda 函数 python 它将自动将已创建的快照复制到另一个区域我已联系 AWS Support 他们只向我发送了用于 RDS 数据库的 GitHub 脚本没有 EC2 快照复制脚本任何帮助都会很棒谢谢是的
为什么通过selenium切换到alert不稳定？

为什么通过selenium切换到alert不稳定例如 1 运行代码一切顺利一切都很顺利但如果这段代码在几分钟内运行那么可能会出现错误例如没有可以单击的元素等等 2 在一个站点上有一个警报窗口 alert driver swi
Python - 如何将双引号附加到字符串并存储为新字符串？

我正在使用 Python 2 6 并且想将双引号附加到字符串并将其存储为新的字符串变量我不想打印它但稍后在我的 python 脚本中使用它例如 a apple b some function a gt b would be equal
如何在 PyCharm 中启用 flake8 的自动代码格式化

我使用 Tox 运行单元测试并使用 flake8 命令检查代码格式错误每次我在 PyCharm 中编码时我都会运行 tox 然后意识到我有一堆烦人的格式错误我必须返回并手动修复我希望 PyCharm 自动格式化代码根据 flak
将 pandas DataFrame 与 Series 进行比较

我看过this https stackoverflow com questions 26285661 working with comparing dataframes and series and generating new dataf
在 Django 1.9 中使用信号

在 Django 1 8 中我能够使用信号执行以下操作一切顺利 init py from signals import 信号 py receiver pre save sender Comment def process hashtag
Python 字符串参数解析

我正在 python 中使用 cmd 类它将所有参数作为一个大字符串传递给我将此 arg 字符串标记为 args 数组的最佳方法是什么 Example args arg arg1 arg2 with quotes arg4 arg5 1
插入失败“OperationalError：没有这样的列”

我尝试使用我尝试修复的姓名和电话创建一个数据库但它会随时向我重播 File exm0 py line 14 in
为什么这个记忆器适用于递归函数？

我不明白为什么下面的代码是这样的fib以线性而非指数时间运行 def memoize obj Memoization decorator from PythonDecoratorLibrary Ignores kwargs cache ob
Mac OS 上的 pybluez 安装错误

我尝试安装pybluez使用以下命令 pip install pybluez sudo easy install pybluez 但对于这两个命令我最终都会出错环境 Mac OSX 10 9 1 Python 2 7 点日志 cc fno
Python 中的“lambda”是什么意思，最简单的使用方法是什么？

您能否给出一个示例和其他示例来说明何时以及何时不使用 Lambda 我的书给了我一些例子但它们很令人困惑拉姆达起源于拉姆达演算 http en wikipedia org wiki Lambda calculus和 AFAIK 首先实
python字符串包含双引号字符

我的输入字符串由字符组成包括双引号和单引号和 B SS JU PQ AD DDSFD ABD E J 但是当我从文本文件打开上述输入并打印它时第三行中的双引号被打印为 xe2 x80 x9d 我的目标是进行简单的字符计数 B 2
安装 confluence-kafka 时“文件名或扩展名太长”？

我在使用 pip install confluence kafka 安装 confluence kafka 时遇到一些问题但我收到此错误文件名或扩展名太长详细信息如下 Collecting confluent kafka Using

随机推荐

无法将“&Thing”与“Thing”进行比较

我知道该错误意味着什么但我无法修复它我在用着mockers为了测试我的工作当我尝试验证提供给模拟特征函数的结构参数时我陷入了困境简化的代码 cfg test extern crate mockers cfg test extern
Google feed api 已弃用，我如何找到网站的 rss feed？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我使用 Google Feed API 来查找特殊关键字或网站的 rss feed 现在这个 api
如何计算EMGU中两幅图像之间的相关性？

我有两个图像假设它们具有相同的大小我想使用 EMGU 和 C 计算两个图像之间的相关性我没有找到任何函数可以做到这一点并自己实现了相关性计算但我宁愿使用内置函数有这样的功能吗 Thanks I think 图像 MatchTem
Symfony2 隐藏字段上的数据转换器

我已经搜索过但没有发现有人遇到这个问题我已经按照食谱中的规定创建了自己的数据转换器一切似乎都是正确的但我收到错误表单的视图数据应该是 Niche SecurityBundle Entity BusinessUser 类的实例但它
didEnterRegion 以更大的半径调用（iOS）

我希望更精确地调用 didEnterRegion 但我无法做到这一点以下是我所做的我使用了 distanceFilter 和desiredAccuracy 的最佳值 Apple 提供的最精确的 GPS 设置并设置了目标 CLCircu
使用 cocoapods 更改导入的库

我正在使用 cocoapods 进行一个项目突然我发现自己在其中一个库中进行了一些更改我怎样才能确保这些更改永远不会被覆盖pod update 有没有办法在不更新 github 项目的情况下在 pod 中引入更改更新分叉项目我尝试
Solr 索引与存储

我对太阳能场的索引和存储属性的行为有点困惑例如如果我在 Schema xml 中有以下内容
初始化NSObject时预留了多少内存？

当我在 Objective c 中使用这个语句时 NSObject object NSObject alloc init 为对象保留多少内存您可以使用以下代码测试对象的大小 import
python pandas 对列的操作

您好我想知道使用 pandas 对 python 中的列进行操作的最佳方法我有一个经典数据库我已将其作为数据框加载并且我经常必须对每一行进行操作如果标记为 A 的列中的值大于x 则用列 C 减去列替换该值 D 现在我做类似的事情
当应用程序 css 和 javascript 标签在 Rails 上初始化时，fullcalendar 标题工具栏按钮不显示

我想在我的 Rails 项目上运行 fullcalendar 我正在按照以下步骤操作https github com bokmann fullcalendar rails https github com bokmann fullcalen
如何在Scala3中编译并在运行时执行scala代码？

我想使用 Scala3 编译并执行在运行时以字符串形式给出的 Scala 代码例如在 Scala 2 中我会使用 Reflection import scala reflect runtime universe as ru import
如何为浏览器生成CMY三角形？（CSS、SVG、画布？）

我正在尝试为一个项目生成一个 CMY 三角形我希望能够使用 css svg 或 canvas 直接在网络上渲染它根据 Amelia 的评论我尝试构建一个 CSS SASS 类来用线性渐变渲染三角形 triangle include b
如何在 Android 应用程序中保存数据

我最近编写了一个 Android 应用程序这只是一个简单的应用程序可让您通过几个简单的计数间隔来记录篮球比赛的得分我收到添加保存功能的要求这样您就可以保存您的分数然后将其加载回来目前当您停止应用程序时您的数据就会丢失所以我
反应本机打字稿“字符串”不可分配给“从不”类型的参数。使用中导航

我不断收到错误消息提示字符串不能分配给反应本机打字稿中从不类型的参数我不知道为什么有人可以帮我修复这个错误吗先感谢您代码片段 const loadReport id string gt setPostId id navig
如何从联合结果中进行选择？

我有一个像这样的 MySQL 脚本 SELECT FROM WHERE UNION ALL SELECT FROM WHERE 现在如何从并集结果中再次选择这不起作用 SELECT FROM SELECT FROM WHERE UNION
Java 应该将数组视为对象吗？

我经常认为允许使用数组作为适当的对象及其自己的方法而不是依赖于 Arrays Arrays 和 ArrayUtils 等辅助类是一个好主意例如 ints sort Arrays sort ints int onemore ints add
我如何知道电子表格单元格是否使用 Google Apps 脚本合并

在 Google 文档电子表格中如果合并单元格A1和A2 有办法吗使用谷歌应用程序脚本确认它们已合并 GAS中有合并功能https developers google com apps script class range merge
jQuery 中的 attr() 是否强制小写？

我正在尝试操作 svg viewBox 属性它看起来像这样
运行时检查失败 #2 - 变量“索引”周围的堆栈已损坏

好吧我想我知道问题是什么我只是很难调试它我正在使用 directx api 并尝试根据我拥有的一本书生成一个沿 x 和 z 轴的平面问题是当我创建索引时我认为我设置的值超出了索引数组的范围我只是很难弄清楚我做错了什么我不熟悉这
使用 Python 进行 requests.get() 后 PDF 文件损坏

我正在尝试使用 requests get 下载 PDF 文件它适用于我发现的大多数测试 PDF 文件但对于本例则不起作用并且文件已损坏如果我用浏览器打开 URL 并保存文件它就可以正常工作我尝试使用 Stream 分块下载它但

使用 Python 进行 requests.get() 后 PDF 文件损坏

使用 Python 进行 requests.get() 后 PDF 文件损坏 的相关文章

随机推荐

热门标签

使用 Python 进行 requests.get() 后 PDF 文件损坏的相关文章