读取压缩在一个文件中的多个 csv 文件

2023-12-15

我在文件夹中的几个 zip 文件中有几个 csv 文件,例如:

  • A.zip(包含 csv1、csv2、csv3)
  • B.zip(包含 csv4、csv5、csv6)

位于文件夹路径中C:/Folder/,当我在文件夹中加载普通 csv 文件时,我使用以下代码:

import glob
import pandas as pd
files = glob.glob("C/folder/*.csv")
dfs = [pd.read_csv(f, header=None, sep=";") for f in files]

df = pd.concat(dfs,ignore_index=True)

接下来是这篇文章:在python中读取csv压缩文件

zip 中的一个 csv 的工作方式如下:

import pandas as pd
import zipfile

zf = zipfile.ZipFile('C:/Users/Desktop/THEZIPFILE.zip') 
df = pd.read_csv(zf.open('intfile.csv'))

知道如何为我优化这个循环吗?


Use zip.namelist()获取 zip 内的文件列表

Ex:

import glob
import zipfile
import pandas as pd

for zip_file in glob.glob("C/folder/*.zip"):
    zf = zipfile.ZipFile(zip_file)
    dfs = [pd.read_csv(zf.open(f), header=None, sep=";") for f in zf.namelist()]
    df = pd.concat(dfs,ignore_index=True)
    print(df)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

读取压缩在一个文件中的多个 csv 文件 的相关文章

随机推荐

  • Div 内未知大小文本的底部填充

    Here I want to have a text padding margin on the bottom part of my Div to have a more organized and tidier look 我希望它能够灵活
  • 如何格式化文本字段javafx

    我希望能够以 hh mm ss 格式在 javafx 文本字段中输入时间 我将如何格式化文本字段 我已经获得了正则表达式方法 因此它只接受数字作为输入 public void format TextField t String regex
  • 为什么使用 == 比较两个整数有时有效有时无效? [复制]

    这个问题在这里已经有答案了 我知道我在使用 时比较参考 这不是一个好主意 但我不明白为什么会发生这种情况 Integer a 100 Integer b 100 Integer c 500 Integer d 500 System out
  • 在 Android 中使用 OpenCV 从 CameraFrame 检测 RGB 值

    我想检测 RGB 中哪个值最大 我怎样才能检测到这一点 我想显示哪种颜色出现频率最高 RGB 值 例如 在图像中 红色出现率最高 因此它将显示颜色为红色 并以百分比形式显示其值 我通过获取图像的行和列进行了尝试 如下所示 public Ma
  • 获取 wifi 信号强度

    有没有办法在C 中获取wifi信号强度 目前我也得到了同样的结果 Process proc new Process proc StartInfo CreateNoWindow true proc StartInfo FileName net
  • 为什么我的方法会陷入无限递归?

    我编写了一种方法来帮助构建四叉树 每个四叉树都有一个根节点 一个根节点有4个子节点 我使用深度递归来阻止该函数划分太多次 传入的深度等于正方形边长以 2 为底的对数 始终传入正方形 然而 我从中得到了无限递归 有人明白为什么吗 当我运行它时
  • 根据查询结果设置用户变量

    是否可以根据 MySQL 中的查询结果设置用户变量 我想要实现的是这样的 我们可以假设两者USER and GROUP是独一无二的 set user 123456 set group select GROUP from USER where
  • 如何动态改变背景颜色的资源?

    我有以下控制 我想更改某些事件触发器的背景颜色 我想做这个clrGray资源作为某些事件点击的颜色 我已经尝试过以下方法 但没有成功 XAM
  • 单击项目 RecyclerView 时不显示 toast

    好吧 我知道 可能已经有人问过这个问题了 我已经为我的问题找到了可能的解决方案这个链接 但是 由于未知的原因 该解决方案对我不起作用 我想显示一个Toast当一个项目 aCardView 在 a 内单击RecyclerView This T
  • 如何实现 Functor[数据集]

    我正在努力研究如何创建一个实例Functor Dataset 问题是当你map from A to B the Encoder B 必须在隐式范围内 但我不知道该怎么做 implicit val datasetFunctor Functor
  • 使用 php 从通过 ajax 发送的 dataURI 生成 png 文件

    我有一个 svg 文件 它生成 dataURI png 并且效果很好 我希望将该 dataURI 保存为图像 因此我尝试通过 ajax 将 dataURI 发送到另一个可以执行 PHP 的服务器 但我无法让它发挥作用 这是生成 dataUR
  • Xamarin Form - 如何在 UWP 中存储 PDF 或 JPEG 格式的图像

    大家好 我正在开发 DMS 应用程序 用户可以通过扫描仪扫描文档或图像并上传到服务器 为了扫描目的 我参考了这个link它工作完美 现在的问题是 ImageScanner ScanFilesToFolderAsync ImageScanne
  • 格式化和显示
    时出现问题

    我对编码还很陌生 所以请耐心等待 我已经读到不同的浏览器以不同的方式显示水平规则 我似乎无法在 Firefox 或 Chrome 中得到正确的结果 到目前为止我只检查过两个 这是我的 hr 在 Firefox 中的样子 http posti
  • CSS 获取没有类的最后一个孩子

    这对你们来说是一个棘手的挑战 CSS 选择器要获取 last child那个没有类 到目前为止我已经尝试过 nav item not nav item mobile last child nav item last child not na
  • 当前 = 当前 * 10 + (c - '0');

    我试图通过这段代码读取未知数量的整数 while 1 int c getchar if c EOF break else if isdigit c current current 10 c 0 else total current curr
  • 压缩而不创建父文件夹

    我有一个这样的文件夹结构 project folder 01 file1 cpp file2 cpp folder 02 file1 cpp file2 cpp 我想以我得到的方式 当我解压时 压缩项目文件夹的内容 folder 01 fi
  • Java 中的 switch case 逻辑表达式语句 - 与 JS 或 PHP

    在 JavaScript 中 我也在 PHP 中看到过 您可以在案例中使用逻辑表达式 例如 switch true case d lt 10 document write Less than 10 break case d 10 docum
  • C# 模块预计包含程序集清单

    大家好 我是 C 世界的新手 我必须使用它 因为依赖于来自多播源的 xceedzip dll 压缩数据 在编写了一些用于接收提要的代码后 我在调用此 dll 时遇到了障碍 据我了解 我需要使用 System Reflection 并调用 d
  • 使用 Gradle 中的构建类型在一台设备上运行使用 ContentProvider 的同一应用程序

    我已经设置 Gradle 将包名称后缀添加到我的调试应用程序中 这样我就可以在一部手机上拥有我正在使用的发布版本和调试版本 我引用的是这个 http tools android com tech docs new build system
  • 读取压缩在一个文件中的多个 csv 文件

    我在文件夹中的几个 zip 文件中有几个 csv 文件 例如 A zip 包含 csv1 csv2 csv3 B zip 包含 csv4 csv5 csv6 位于文件夹路径中C Folder 当我在文件夹中加载普通 csv 文件时 我使用以