“application/octet-stream”而不是 application/csv？

2024-01-03

我对 Python 还很陌生。我想确认数据集的类型（下面代码中的URL）确实是一个csv文件。但是，当通过标题检查时，我得到“application/octet-stream”而不是“application/csv”。

我假设我在读取数据时以错误的方式定义了某些内容，但我不知道是什么。

import requests
url="https://opendata.ecdc.europa.eu/covid19/casedistribution/csv/data.csv"
d1 = requests.get( url )

filePath = 'data/data_notebook-1_covid-new.csv'
with open(filePath, "wb") as f: 
    f.write(d1.content)

## data type via headers #PROBLEM
import requests
headerDict=d1.headers

#accessing content-type header
if "Content-Type" in headerDict:
    print("Content-Type:")
    print( headerDict['Content-Type'] )

我假设我在读取数据时以错误的方式定义了某些内容

不，你没有。这Content-Type标头是supposed来指示响应正文是什么，但是您无法强制服务器将其设置为您期望的值。有些服务器只是配置不当，无法正常运行。

application/octet-stream是其中最通用的内容类型 - 它只为您提供“这是一堆字节，玩得开心”之外的更多信息。

更重要的是，每种内容不一定有一种真实类型，只有或多或少广泛认可的惯例。对于 CSV，常见的一种是text/csv.

So if you're确定内容是什么，请随意忽略 Content-Type 标头。

import requests

url = "https://opendata.ecdc.europa.eu/covid19/casedistribution/csv/data.csv"
response = requests.get(url)

filePath = 'data/data_notebook-1_covid-new.csv'
with open(filePath, "wb") as f: 
    f.write(response.content)

在没有任何进一步信息的情况下，以二进制模式写入文件是一个好主意，因为这将完全按原样保留原始字节。

为了将其转换为字符串，需要使用某种编码对其进行解码。由于 Content-Type 在这里没有给出任何指示（它可以说Content-Type: text/csv; charset=XYZ），来自 Internet 的数据的最佳第一个假设是 UTF-8：

import csv

filePath = 'data/data_notebook-1_covid-new.csv'
with open(filePath, encoding='utf-8') as f: 
    reader = csv.reader(f, delimiter=',')
    for row in reader:
        print(row)

如果结果是错误的（即存在解码错误或乱码），您可以尝试其他编码，直到找到有效的编码。如果您一开始就以文本模式写入文件，则这是不可能的，因为错误解码造成的任何数据损坏都会进入文件。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

csv

requestheaders

“application/octet-stream”而不是 application/csv？的相关文章

Django：将博客条目查看次数增加一。这有效率吗？

我的索引视图中有以下代码 latest entry list Entry objects filter is published True order by date published 10 for entry in latest ent
如何在 Windows 10 上使用 python 3.7 的 anaconda 包？

我使用的是 Windows 10 Pro 64 位版本我从此页面下载Anaconda3 2019 03 Windows x86 64 exe https www anaconda com distribution https www an
只使用 Django 的某些部分？

我喜欢 Django 但对于一个特定的应用程序我只想使用它的一部分但我对 Django 的内部工作原理还不够熟悉所以也许有人可以指出我必须做什么的正确方向查看具体来说我想使用模型和数据库抽象 The 缓存API http doc
如何将本机 popcount 与 numba 一起使用

我正在使用 numba 0 57 1 我想在我的代码中利用本机 CPU popcount 我现有的代码太慢因为我需要运行它数亿次这是一个 MWE import numba as nb nb njit nb uint64 nb uint6
如何测试使用 XCom 的 Apache Airflow 任务

我正在尝试找出一种测试 DAG 的方法其中有几个任务使用 XCom 进行通信由于控制台命令只允许我从 DAG 运行任务有没有一种方法可以测试通信而无需通过 UI 运行 DAG Thanks 这是一种对我有用的方法尽管 Airflow
如何使用 django (python) 和 s3 上传文件？

我正在寻找一种将文件上传到 s3 的方法我正在使用 django 我目前正在使用亚马逊的 python 库进行上传以及以下代码 View def submitpicture request fuser request session lo
Python sqlite3参数化删除表

我在 python 中删除 sqlite3 表时遇到问题我正在使用标准sqlite3模块 self conn sqlite3 connect sql drop table self conn execute sql u table nam
python 脚本中 os.system 的 256 和 512 响应代码是什么

当我在 python 中使用 os system ping 服务器时我得到多个响应代码使用的命令 os system ping q c 30 s SERVERANME 0 在线 256 离线 512 512 是什么意思 Per the
如何为 C 分配的 numpy 数组注册析构函数？

我想在 C C 中为 numpy 数组分配数字并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
使用 python 只读取 Excel 中的可见行

我想只读取 python 中 Excel 工作表中的可见行输入 Excel表所以当我过滤时作为 python 中的输出在本例中我将仅获得可见数据 1 行这是我的代码 from openpyxl import load workbo
如何删除 pandas 数据框中的唯一行？

我遇到了一个看似简单的问题在 pandas 数据框中删除唯一的行基本上相反drop duplicates https pandas pydata org pandas docs stable generated pandas Data
如何在交互式绘图（Python）中获得鼠标指向的（x，y）位置？

我使用 ipython 笔记本带有魔法 matplotlib nbagg 我正在审查matplotlib widget Cursor但仅查看光标widgets Cursor http matplotlib org 1 4 3 exampl
如何在数据框中绘制包含三列的无向图，形成 3 种不同类型的节点（三方）？

我正在尝试使用三个不同的列表绘制网络的可视化这三个列表形成 3 种类型的节点下面的代码正在运行如图所示需要两个列表用户 ID 评分但是我希望我的图表是三部分的即 user userId review ratings prod
如何加速 pandas 字符串函数？

我正在使用 pandas 矢量化 str split 方法来提取从上的拆分返回的第一个元素我还尝试使用 df apply 与 lambda 和 str split 来产生等效的结果使用 timeit 时我发现 df apply 的
Scrapy的redirect_urls异常.KeyError

我是 Scrapy 和 Python 的新手最近推出了我的第一个蜘蛛有一个功能似乎以前有效但现在它只适用于我试图废弃的一些网站代码行是 item url direct response request meta redirect u
如何使用 pygame.mixer 重复音乐？

我创建了以下使用 pygame mixer 播放 mp3 音乐的代码然而音乐不会重复有什么想法可以让音乐重复播放吗这是代码 playlist list playlist append put music here mp3 playl
如何可视化多维数据上的 kmeans 聚类

我在 mnist 数据集上使用 kmeans 聚类算法并希望可视化聚类后的图到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
如何保持 python 3 脚本 (Bot) 运行

不是母语英语抱歉英语可能很蹩脚我也是编程新手您好我正在尝试使用 QueryServer 连接到 TeamSpeak 服务器来创建机器人经过几天的努力它有效只有 1 个问题而我却被这个问题困扰了如果您需要检查这是我正在使
在多个图表上绘制一条线

I don t know how this thing is called or even how to describe it so the title may be a little bit misleading The first a
在Python中从CSV文件中获取随机行并找到相应的单词，就像测验一样

抱歉标题含糊不清想不出更好的表达方式我有一个包含德语英语单词的 CSV 文件如下所示 Ja Yes Nein No Katze Cat 我希望我的 python 脚本从 CSV 文件中打印一个随机的德语单词并要求他们输入英语单词

随机推荐

如何在CodeIgniter中显示数据库中的图像？

我正在使用 CodeIgniter 2 1 0 和 MySQL 数据库我已经通过表单上传了图像并成功将其存储在上传目录中并且我还成功将图像的完整路径存储在数据库中但我在通过从数据库调用完整路径来显示图像时遇到问题这是我的上传代码 i
使用 OpenCV 从 .avi 视频获取帧

include cv h include highgui h int main int argc char argv CvCapture capture 0 IplImage frame 0 capture cvCaptureFromAVI
PDFBox U+00A0 在此字体的编码中不可用

我在调用 PDField 的 setValue 方法并尝试设置包含特殊字符的值时遇到问题 field setValue TEST BY TEST 详细来说如果我的值包含 U 00A0 等字符我会收到以下异常引起原因 java lang
React-slick：从 slick-carousel 导入 CSS 失败

在这里反应初学者我的应用程序使用 create react app 我正在拉入反应光滑 https github com akiran generator react slick用于旋转木马我正在尝试遵循react slick 设置中提
将 DICOM 图像转换为 jpeg 图像

我的代码是 import java awt image BufferedImage import java io BufferedOutputStream import java io File import java io FileOut
Joomla - 如何突出显示活动页面的菜单项

如何突出显示活动页面的菜单项谢谢斯蒂芬请使用以下 CSS 来突出显示所选活动当前菜单项 menu ul ul padding left 10px menu ul li active a font weight bold menu
有没有一种聪明的方法来赋予消息不同的优先级？

我一直在想我希望能够在与 erlang 进程对话时为不同的消息分配不同的优先级我希望能够首先处理高优先级消息然后处理低优先级消息我尝试过不同的方法方法1 loop gt receive high Msg gt Do somethi
获取最后插入记录的 ID - 访问 DAO、ODBC、SQL Server 2008 身份字段

这是一个非常常见的问题但我无法获取最后插入记录的 ID 我使用带有 ODBC 链接表的 DAO 来复制记录及其子记录我的表位于 SQL Server 2008 中并且具有 ID 字段的标识字段这是我到目前为止所尝试过的我的第一段代
适用于任何 ICollection 和 ICollection 类型的调试器可视化工具

我用网格创建了表单来可视化任何集合 ICollection ICollection
如何为 Java 创建 REST 客户端？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案通过 JSR 311 及其实现我们拥有了通过 REST 公开 Java 对象的强大标准然而在客户
未登录时是否可以获取公共 Facebook 动态墙？

我实际上是在问是否有可能在没有身份验证令牌的情况下获得公共墙源如果我没有登录 Facebook 我仍然可以看到公开帖子这是一个很好的例子 http www facebook com adele http www facebook com
将相同的“*.dll”引用添加到同一解决方案中的多个项目

我有一个 Visual Studio 2008 NET C CLI 解决方案我的解决方案由许多子项目组成我为每个项目定义了一个自定义构建目录并将其称为输出我的解决方案我的第一个项目 exe MySecondProject dll
在防护测试中何时更喜欢使用“and”而不是“andalso”

我很好奇为什么逗号是一个快捷方式and并不是andalso在警卫测试中由于我称自己为 C 本地人所以我看不到短路布尔求值的任何缺点我使用编译了一些测试代码to core标记以查看实际生成的代码使用逗号我看到左边的值和右边的值都被评
JavaScript 中逗号运算符的作用是什么？

如果我使用 1 09 1 returns 1 09 但如果我使用 1 09 1 returns 9 我知道 1 09 不是一个数字最后一段代码中的逗号有什么作用更多示例 if 0 9 alert ok alert if 9 0 aler
ReportLab 是否有可流动的 matplotlib？

我想将 matplotlib 图表嵌入到 ReportLab 直接生成的 PDF 中即不先保存为 PNG 然后将 PNG 嵌入到 PDF 中我想我会得到更好质量的输出有谁知道ReportLab是否有matplotlib flowabl
Netlogo：带有两个列表的“foreach”命令

我有一个完整的有向图每个链接都有自己的权重我已经成功地选择了每只海龟的最大输出链接但是有时两只乌龟的最大输出链接彼此相反导致两个彼此相反的链接被选择如果发生这种情况我希望具有较低值的链接消失我用这个创建了两个列表 set m
阻止 MassTransit 为消费者主机创建 RabbitMQ 交换

是否可以将 MassTransit 配置为不为消费者主机创建 RabbitMQ 交换我的 RabbitMQ 用户没有足够的权限在消费队列所在的主机上声明交换因此 MassTransit 无法启动并出现以下错误 Unhandled Exc
使用 postMessage 跨域 iframe 调整大小

我已经在这里阅读了所有跨域 iframe 帖子感谢你们所有人和其他地方 postMessage 脚本位于跨域 iframe 调整大小 https stackoverflow com questions 5606920 cross dom
setResourceValue NSURLTagNamesKey 错误

尝试使用 setResourceValue 将标签颜色设置为蓝色时出现错误 var error NSError let listofTags NSWorkspace sharedWorkspace fileLabels let theURL
“application/octet-stream”而不是 application/csv？

我对 Python 还很陌生我想确认数据集的类型下面代码中的URL 确实是一个csv文件但是当通过标题检查时我得到 application octet stream 而不是 application csv 我假设我在读取数据时以错

“application/octet-stream”而不是 application/csv？

“application/octet-stream”而不是 application/csv？ 的相关文章

随机推荐

热门标签

“application/octet-stream”而不是 application/csv？的相关文章