使用 pandas 从 zip 中读取特定的 csv 文件

2023-12-02

这是我感兴趣的一个数据。

http://fenixservices.fao.org/faostat/static/bulkdownloads/Production_Crops_E_All_Data.zip

它由 3 个文件组成：

我想用 pandas 下载 zip 并从 1 个名为 Production_Crops_E_All_Data.csv 的文件创建 DataFrame

import pandas as pd
url="http://fenixservices.fao.org/faostat/static/bulkdownloads/Production_Crops_E_All_Data.zip"
df=pd.read_csv(url)

Pandas 可以下载文件，可以处理 zip 文件，当然也可以处理 csv 文件。但是，如何处理包含多个文件的存档中的 1 个特定文件呢？

现在我收到错误

ValueError: ('在压缩的 zip 文件 %s 中找到多个文件)

这篇文章没有回答我的问题，因为我在 1 个 zip 中有多个文件将压缩文件读取为 pandas DataFrame

从这个链接

try this

from zipfile import ZipFile
import io
from urllib.request import urlopen
import pandas as pd

r = urlopen("http://fenixservices.fao.org/faostat/static/bulkdownloads/Production_Crops_E_All_Data.zip").read()
file = ZipFile(io.BytesIO(r))
data_df = pd.read_csv(file.open("Production_Crops_E_All_Data.csv"), encoding='latin1')
data_df_noflags = pd.read_csv(file.open("Production_Crops_E_All_Data_NOFLAG.csv"), encoding='latin1')
data_df_flags = pd.read_csv(file.open("Production_Crops_E_Flags.csv"), encoding='latin1')

希望这可以帮助！编辑：将 python3 StringIO 更新为 io.StringIO

编辑：更新了 urllib 的导入，将 StringIO 的用法更改为 BytesIO。另外你的 CSV 文件不是 utf-8 编码，我尝试了 latin1 并且有效。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

使用 pandas 从 zip 中读取特定的 csv 文件的相关文章

如何对预测值进行反向移动平均（在 pandas 中，rolling().mean）操作？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我有一个像这样的 df import numpy as np import pandas as pd import matplotlib
在python中合并3个dict()

如果多个字典之间有公共字符串是否有逻辑合并多个字典的方法即使这些公共字符串在一个 dict 的值与另一个 dict 的键之间匹配我在 SO 上看到了很多类似的问题但似乎没有一个问题能解决我将较低级别文件中的多个键与较高键值中的
numpy：与索引数组有效求和

假设我有 2 个矩阵 M 和 N 都有 gt 1 列我还有一个索引矩阵 I 有 2 列 1 列代表 M 一列代表 N N 的索引是唯一的但 M 的索引可能出现多次我想要执行的操作是 for i j in w M i N j 除了 fo
SparkSession 初始化需要很长时间

SparkSession 初始化需要很长时间才能成功这是我的代码 import findspark findspark init import pyspark from pyspark sql import SparkSession sp
SQLAlchemy 在 MySQL 上使用什么列类型作为“文本”？

我的总体用例是试图确定我是否可以编写一个与数据库无关的至少支持 Postgres 和 MySQL 存储一些大数据作为原始文本认为 500MB 作为粗略的理论上限基于这个答案 https stackoverflow com a 2557
当类的任何属性被修改时，类如何运行某些函数？

是否有一些通用方法可以让类在以下情况下运行函数 any它的属性被修改了吗我想知道是否可以运行某些子进程来监视类的更改但也许有一种方法可以继承class并修改一些on change函数是 Python 类的一部分有点像默认的 repr
如何使用 matplotlib 面向对象的 API 设置轴刻度和刻度标签

我需要一些在 Python2 7 下的 Matplotlib pyplot 中绘图的帮助我想生成一个具有以下 x 轴的图 x 轴应该是这样 https i stack imgur com zcosX jpg 我到目前为止通过使用myaxi
如何在 Django Admin 中禁用事务？

I used transaction non atomic requests for 被超越的save in Person model如下所示 store models py from django db import models fro
如何实现带有 ([start ,] stop [ step]) 签名的 python 方法，即左侧的默认关键字参数

由于在 python 3 X 中 build idrange 函数返回的不再是一个列表而是一个可迭代的一些旧代码在我使用时失败range 方便地生成我需要的列表所以我尝试实现我自己的lrange像这样的函数 def lrange st
将函数应用于 3D numpy 数组

我有一个来自 Image PIL Pillow 对象的 numpy 3D 数组 178 214 235 180 215 236 180 215 235 146 173 194 145 172 193 146 173 194 126 171
Keras 中的条件批量归一化

我正在尝试在 Keras 中实现条件批量标准化我假设我必须创建一个自定义层因此我从正常化 https github com keras team keras blob master keras layers normalization
sqlalchemy，使用反向包含（不在）子列值列表中进行选择

我在flask sqlalchemy 中有一个典型的帖子标签与一篇帖子相关的许多标签关系并且我想选择我提供的列表中未标记任何标签的帖子首先我建立的模型 class Post db Model id db Column db In
iter(fp.readline, '') 中的行而不是 fp 中的行：

我读了内置函数iter的例子在内置函数 Python 3 7 0 文档 https docs python org 3 library functions html iter with open mydata txt as fp for l
ModuleNotFoundError：没有名为“googleapiclient”的模块

如果这是一个愚蠢的问题我深表歉意我在 stackoverflow 上搜索过但没有找到解决办法我正在致力于从 Python 2 7 迁移到 Python 3 8 我收到一个程序的以下错误请帮我 Traceback most rece
在IPython笔记本中自动播放声音

我经常在 IPython 笔记本中运行长时间运行的单元我希望笔记本在单元完成执行时自动发出蜂鸣声或播放声音有没有办法在 iPython 笔记本中执行此操作或者我可以在单元格末尾放置一些命令来自动播放声音我正在使用 Chrome 如果
确定 pyInstaller 生成的 Python EXE 中的应用程序路径

我有一个驻留在单个 py 文件中的应用程序我已经能够让 pyInstaller 将其成功捆绑到 Windows 的 EXE 中问题是应用程序需要一个 cfg 文件该文件始终直接位于应用程序旁边的同一目录中通常我使用以下代码构建路
使用 python pyad 访问对象 [] 时出现问题

我在尝试使用 pyad 访问活动目录用户属性时遇到问题这是我的代码 user pyad aduser ADUser from cn tuser print user get attribute lastLogonTimestamp 这些是
WTforms 表单未提交但不输出验证错误

我正在尝试使用以下方式上传文件flask uploads工作和遇到一些障碍我会告诉你我的flask查看函数 html 希望有人能指出我缺少的内容基本上发生的情况是我提交了表格但失败了if request method POST and
python生成器太慢，无法使用它。我为什么要使用它？什么时候？

最近我收到一个问题哪一个是最快的 iterator list comprehension iter list comprehension and generator 然后编写简单的代码如下 n 1000000 iter a iter ra
关闭 IPython Notebook 中的自动保存

我正在寻找一种方法来关闭 iPython 笔记本中的自动保存我已经通过 Google Stack Overflow 搜索看到了有关如何打开自动保存的参考资料但我想要相反的内容关闭自动保存如果这是可以永久设置的东西而不是在每个笔记本的

随机推荐

img.onerror 似乎不适用于 IE8

我正在尝试从网址加载图像来检查互联网连接当没有互联网连接时它应该显示一个 dojo 警告对话框这适用于 Firefox 但不适用于 IE8 以下是代码片段 var img new Image img src userGuideUrl1
您可以从扩展程序访问 chrome:// 页面吗？

当你编写manifest json文件时你必须指定matches用于您的内容脚本这http and https工作正常但如果我尝试包括chrome 或其任何变体我收到错误消息指出我正在尝试对我的应用程序使用无效的方案matches
如何防止 Visual Basic 2012 中以下代码的 SQL 注入

我对如何防止 SQL 注入感到困惑我在网上查看过我是使用存储过程还是创建变量我完全迷失了 Try connection Open we got here so our connection to the db is sound ch
Windows Phone 8 模拟器仅返回雷蒙德位置

我正在使用以下代码 Geolocator myGeolocator new Geolocator DesiredAccuracy PositionAccuracy High Geoposition myGeoposition await m
WPF - 跨线程事件

我的问题是我想使用新线程在画布中添加项目所以我有多个方法底部的示例它们生成例如图像并设置一些属性然后他们应该通过事件回调生成的思考以下是我调用的为画布生成想法的线程的一部分 Here I create the event in t
将表名作为参数传递给 SqlCommand 的问题

这个问题的目标是避免SQL注入我有查询选择插入更新删除当我需要发送表名作为参数时我该怎么做我将非常感谢你的帮助 insertCommand CommandText update tableName set code code
jQuery 可选定制

我有一个 jQuery 可供选择如下所示它实际上是一个有序列表有序列表位于名为 myBorderDiv 的 div 内当我按下 control 并将鼠标悬停在项目上时所有项目都会出现不需要的效果在 IE8 中如下图所示如何克
PHP $_SESSION 标头重定向后为空

当我进行标头重定向时我丢失了 SESSION 中的数据当我使用调试器完成此操作时我可以在 exit 之前看到 SESSION 中的所有数据登录 php 确保您正在使用该功能session start 在 if 语句之前myaccou
Google 表格：根据第 1 行中的日期隐藏列

我没有在 Excel 或 Google Sheets 中编写脚本的经验因此我尝试扩展一下看看是否有解决我的问题的方法我们在厨房改造业务中使用 Google 表格制作每周日历我们从左到右组织几周并在这些栏中列出我们当前正在从事的工作
如何解决机器人框架中测试自动化的 ssl 证书错误

通过机器人框架运行自动化测试时我的 Web 应用程序出现 ssl 证书错误我尝试了下面带有不同镶边选项的代码但没有一个在有或没有布尔值的情况下也能工作 list Create List unsafely treat insecure
打印数组元素

以下 C 程序的预期输出是打印数组元素但实际运行时却并非如此 include
Python 中的梯形规则

我正在尝试在 Python 2 7 2 中实现梯形规则我写了以下函数 def trapezoidal f a b n h float b a n s 0 0 s h f a for i in range 1 n s 2 0 h f a i
cherrypy/jquery CORS 麻烦

我有一个基于 Cherrypy 的简单 Python Web 服务器其资源应提供API 服务器有以下代码来提供CORS def CORS cherrypy response headers Access Control Allow Ori
如何创建多个警报？

我可以使用下面的代码创建和取消警报我想创建多个警报闹钟时间来自数组列表在此数组列表中我想为每个日期创建一个警报按下取消按钮将仅取消当前警报我该怎么做 public void onCreate Bundle savedInstan
Caffe：如果两层反向传播渐变到同一个底部斑点会发生什么？

我想知道如果我有一个层生成一个底部斑点该斑点进一步被两个后续层消耗这两个层都会生成一些梯度来填充反向传播阶段的 Bottom diff 将两个梯度相加形成最终梯度吗或者说只有他们一个人能够活下去根据我的理解 Caffe 层需要在用
FOS用户包认证

How FOS 用户包通过此服务容器对用户进行身份验证 this gt container gt get security context gt getToken gt getUser 我想操纵身份验证过程我应该在捆绑包中查看哪里实际上
Android 设备安装新字体

我需要在我的 Android 设备上安装泰米尔字体是否可以在 Android 设备中安装新的 Unicode 字体您可以将自己的字体嵌入到自己的应用程序中供自己使用您无法将字体添加到现有设备除非作为自定义固件构建的一部分或者可能通
Swift 将 .uppercaseString 仅应用于字符串的第一个字母

我正在尝试制作一个自动更正系统当用户输入大写字母的单词时自动更正不起作用为了解决这个问题我复制了键入的字符串应用了 lowercaseString 然后比较它们如果字符串确实输入错误则应该更正该单词然而替换键入的单词的单词
使用概念来选择类模板专业化

这个问题演示如何使用 C 20 概念进行选择超载 for a function模板我正在尝试做类似的事情选择专业化 for a class模板我从一个类模板开始Angle
使用 pandas 从 zip 中读取特定的 csv 文件

这是我感兴趣的一个数据 http fenixservices fao org faostat static bulkdownloads Production Crops E All Data zip 它由 3 个文件组成我想用 panda

使用 pandas 从 zip 中读取特定的 csv 文件

使用 pandas 从 zip 中读取特定的 csv 文件 的相关文章

随机推荐

热门标签

使用 pandas 从 zip 中读取特定的 csv 文件的相关文章