从多个 csv 文件中提取行和文件名

2024-05-01

我的文件夹中有多个以日期为文件名的 csv 文件（20080101.csv 到 20111031.csv）。 csv 文件具有共同的标题。 csv 文件如下所示：

20080101.csv  
X ;Y; Z  
1 ; 1 ; 3  
1 ; 2 ; 6  
1 ; 3 ; 24  
2 ; 1 ; 24  
2 ; 2 ; 24  

20080102.csv   
X ;Y; Z  
1 ; 1 ; 0.1  
1 ; 2 ; 2  
1 ; 3 ; 67  
2 ; 1 ; 24  
2 ; 2 ; 24  

20080103.csv  
X ;Y; Z  
1 ; 1 ; 3  
1 ; 3 ; 24  
2 ; 1 ; 24  
2 ; 2 ; 24  

20080104.csv   
X ;Y; Z  
1 ; 1 ; 34  
1 ; 2 ; 23  
1 ; 3 ; 67  
2 ; 1 ; 24  
2 ; 2 ; 24

… 等等。我想编写一个读取行的脚本，如果在给定行中我们有 X=1 和 Y=2，则整行将与文件名一起复制到新的 csv 文件中，提供以下输出：

X ;Y ; Z ; filename  
1  ; 2 ; 6 ; 20080101  
1  ; 2 ; 2 ; 20080102  
1  ; 2 ; NA; 20080103  
1  ; 2 ; 23; 20080104

任何想法如何做到这一点以及我应该研究的模块的任何建议或任何示例。感谢您的时间和帮助。

干杯，纳文

这是一个结构良好的问题，逻辑应该是显而易见的。对于某人来说，提供完成的代码将违背任务的目的。首先，在问题中添加“作业”标签，然后思考你想做什么： 1）循环文件（在打开时跟踪每个文件名） 2）从当前文件中读取行 3) 如果满足选择标准（x==1 且 y==2），则写入该行。

要开始使用，请尝试：

import csv, os

for fn in os.listdir():
    if ".csv" in fn:
        with open(fn, 'r', newline='') as f:
            reader = csv.reader(f, delimiter=";")
            for row in reader:
                ...

然后扩展解决方案以打开输出文件并使用 csv.writer 写入选定的行。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

从多个 csv 文件中提取行和文件名的相关文章

Python 3 os.urandom

在哪里可以找到完整的教程或文档os urandom 我需要获得一个随机 int 来从 80 个字符的字符串中选择一个字符如果你只需要一个随机整数你可以使用random randint a b 来自随机模块 http docs pytho
使用 python 中的公式函数使从 Excel 中提取的值的百分比相等

import xlrd numpy excel Users Bob Desktop wb1 xlrd open workbook excel assignment3 xlsx sh1 wb1 sheet by index 0 colA co
为什么删除临时文件时出现WindowsError？

我创建了一个临时文件向创建的文件添加了一些数据已保存然后尝试将其删除但我越来越WindowsError 编辑后我已关闭该文件如何检查哪个其他进程正在访问该文件 C Documents and Settings Administra
Python - 来自 .进口

我第一次尝试图书馆我注意到解决图书馆内导入问题的最简单方法是使用如下结构 from import x from some module import y 我觉得这件事有些糟糕也许只是因为我不记得经常看到它尽管公平地说我还没有深入研究
Pandas：如果单元格包含特定文本则删除行

pandas 中的这段代码不起作用如果该列包含提供的任何文本数字我希望它删除该行目前我只能在单元格与我的代码中传递的确切文本匹配时才能使其工作因为它只删除显示 Fin 的单元格不是金融或金融 df2 df df Team Fin
在没有模型的情况下将自定义页面添加到 django admin

我正在尝试在没有模型关联的情况下向管理员添加自定义页面这就是我迄今为止所取得的成就 class MyCustomAdmin AdminSite def get urls self from django conf urls import
一段时间后终止线程的最 Pythonic 方法

我想在线程中运行一个进程它正在迭代一个大型数据库表当线程运行时我只想让程序等待如果该线程花费的时间超过 30 秒我想终止该线程并执行其他操作通过终止线程我的意思是我希望它停止活动并优雅地释放资源我认为最好的方法是通过Thre
从扫描文档中提取行表 opencv python

我想从扫描的表中提取信息并将其存储为 csv 现在我的表提取算法执行以下步骤应用倾斜校正应用高斯滤波器进行去噪使用 Otsu 阈值进行二值化进行形态学开局 Canny 边缘检测进行霍夫变换以获得表格行去除重复行 10像素范围内相
Django send_mail SMTPSenderRefused 530 与 gmail

一段时间以来我一直在尝试使用 Django 从我正在开发的网站接收电子邮件现在我还没有部署它并且我正在使用Django开发服务器我不知道这是否会影响它这是我的 settings py 配置 EMAIL BACKEND djang
Geodjango距离查询未检索到正确的结果

我正在尝试根据地理位置的接近程度来检索一些帖子正如您在代码中看到的我正在使用 GeoDjango 并且代码在视图中执行问题是距离过滤器似乎被完全忽略了当我检查查询集上的距离时我得到了预期距离 1m 和 18km 但 18km 的帖
SMTP_SSL SSLError: [SSL: UNKNOWN_PROTOCOL] 未知协议 (_ssl.c:590)

此问题与 smtplib 的 SMTP SSL 连接有关当与 SMTP 无 ssl 连接时它正在工作在 SMTP SSL 中尝试相同的主机和端口时出现错误该错误仅基于主机 gmail 设置也工作正常请检查下面的示例如果 Out
Python：IndexError：修改代码后列表索引超出范围

我的代码应该提供以下格式的输出我尝试修改代码但我破坏了它 import pandas as pd from bs4 import BeautifulSoup as bs from selenium import webdriver im
返回表示每组内最大值的索引的一系列数字位置

考虑一下这个系列 np random seed 3 1415 s pd Series np random rand 100 pd MultiIndex from product list ABDCE list abcde One Two T
将seaborn.palplot轴添加到现有图形中以可视化不同调色板

将seaborn人物添加到子图中是usually https seaborn pydata org examples cubehelix palette html创建图形时通过传递 ax 来完成例如 sns kdeplot x y cma
Anaconda 无法导入 ssl 但 Python 可以

Anaconda 3 Jupyter笔记本无法导入ssl 但使用Atom终端导入ssl没有问题我尝试在 Jupyter 笔记本中导入 ssl 但出现以下错误 C ProgramData Anaconda3 lib ssl py in
当数据库不是 Django 模型时，是否可以使用数据库中的表？

是否可以从应用程序数据库中的表获取查询集该表不是应用程序中的模型如果我有一个不是名为 cartable 的模型的表从概念上讲我想这样做 myqueryset cartable objects all 有没有相对简单的方法来做到这一点
Python SSL X509：KEY_VALUES_MISMATCH

Python HTTPS server from http server import HTTPServer SimpleHTTPRequestHandler import ssl https stackoverflow com a 408
Django 与谷歌图表

我试图让谷歌图表显示在我的页面上但我不知道如何将值从 django 视图传递到 javascript 以便我可以绘制图表姜戈代码 array Year Sales Expenses 2004 1000 400 2005 1170 460
python 线程安全可变对象复制

Is 蟒蛇的copy http docs python org 2 library copy html模块线程安全吗如果不是我应该如何在 python 中以线程安全的方式复制 deepcopy 可变对象蟒蛇的GIL http en w
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此

随机推荐

处理 Kotlin 协程中自定义 okhttp 拦截器抛出的异常

我正在使用自定义Interceptor与我的 Android 应用程序中的 Retrofit 客户端一起在某些特定情况下会引发异常我正在尝试使用 Kotlin 协程使其工作问题是我无法处理前面提到的错误因为在拦截器实例中抛出异常的那
运行 py.test 时出现错误 ImportMismatchError

当我在本地运行测试时它工作正常但是在创建 docker 并在容器内运行后我收到以下错误 usr local lib python3 5 site packages pytest config py 325 in getconftest
如何加入数据框（来自数据集的集合）？

我正在寻找并找出最好的加入方式nSpark 数据帧 Example List df1 df2 df3 dfN 哪里都df有一个我可以参加的约会递归像这样 List df1 df2 df3 dfN reduce a b gt a join
Lua userdata：无法同时进行数组访问和方法

我遇到了这个人的问题 Lua userdata数组访问及方法 https stackoverflow com questions 26970316 lua userdata array access and methods 其中当我设置用
Oracle 求两个时间戳的平均值

我不明白这有多难但我似乎无法在任何地方找到解决方案它是针对日期完成的但我看不到让它适用于时间戳我正在尝试做 select avg last timestmp ref timestmp as average from param 它一
查找椭圆或贝塞尔曲线上的等距点

目前我正在编写 JavaScript 代码将对象放置在屏幕上的椭圆上我试图找到能够解决这个问题之一的算法椭圆将是完美的但如果它太昂贵贝塞尔曲线也可以抱歉但不幸的是我的数学不允许我使用我找到的答案 https mathoverf
ffmpeg通过添加框或边框来扩展（而不是调整大小）视频大小

假设我有一个特殊分辨率的视频例如 1280x718 我想将其更改为 1280x720 但我宁愿只在顶部和底部添加一行而不是将 718 像素垂直插值到 720 所以基本上我正在寻找一种方法告诉 ffmpeg 创建 1280x720 的输
二维高斯函数不能产生正确的结果

我想写一个返回一个的函数np array尺寸的nx x ny包含具有均值的中心高斯分布mu and sd sig 下面的代码在某些情况下有效但在许多情况下无效有什么问题或者我还应该写什么来获得我需要的东西 import matplotl
PHP 按值对数组进行分组

我有一个像这样的数组 Array 0 gt ing 1 ing 1 gt ing 1 amount 2 gt ing 1 det 3 gt ing 1 meas 4 gt ing 2 ing 5 gt ing 2 amount 6 gt i
如何在Linux中为特定程序设置进程ID

我想知道是否有某种方法可以在运行某些应用程序之前强制使用 Linux 的某些特定进程 ID 我需要提前知道进程ID 实际上有一种方法可以做到这一点自内核 3 3 设置了 CONFIG CHECKPOINT RESTORE 在大多数发行版
类型错误：fit_transform() 需要 2 个位置参数，但给出了 3 个

我有熊猫数据框df 我想对连续和分类特征进行编码df使用不同的编码器我觉得用起来很舒服make column transformer 但是下面显示的代码失败了LabelEncoder 但可以很好地与OneHotEncoder handle
如何在Android中将图像文件转换为pdf文件

我正在尝试在 Android 应用程序中将图像文件 jpg 转换为 pdf 文件我用过itextpdf罐子和机器人文本罐都不适合我下面是使用时的代码itextpdf Document document new Document Str
JavaScript 中检查变量是否为字符串

JavaScript 中如何确定变量是字符串还是其他内容这对我有用 if typeof myVar string myVar instanceof String it s a string else it s something else
MySQL：如何检索随机行或多个随机行？

我有一个 MySQL 数据库表用于存储照片的 URL 我需要从特定类型的数据库中提取 5 条随机记录我可以像这样提取 5 条记录 SELECT Photos FROM Photos WHERE Photos Type ID 4 LIMI
在 Android Studio 中启动 Activity 时出错

我正在尝试制作一款具有多个 java 文件的 Android Studio 应用程序然而当我尝试运行我的应用程序时它说 Error while executing am start n com example company appn
在 React 中使用“ref”作为数组

当我尝试使用 Redux 在 React 中将输入引用为数组时我遇到了一些问题下面的代码将数组中的每一篇文章映射一个面板 var articles this props item array articles map article i
Anaconda-Python RequestsDependencyWarning：urllib3 (1.22) 或 chardet (2.3.0) 与支持的版本不匹配

我收到一条警告该警告似乎没有在任何其他在线资源中涵盖我安装了 Anaconda Python 3 6 创建新的 Conda 环境时收到的警告是 RequestsDependencyWarning urllib3 1 22 or char
从 *Roated* 子组件访问父 @Component 和变量

我正在尝试使用嵌套子组件中的按钮切换位于主应用程序模板顶部的侧面导航菜单我不知道如何到达父级中的 sidenav 组件来告诉它sidenav open 我知道子组件上的 Input 和 Output 但据我了解要使用它我需要有某种 D
如何使用UIPageViewController同时显示上一个和下一个视图的一部分

我使用了这个很棒的教程如何在 Swift 中使用 UIPageViewController https spin atomicobject com 2015 12 23 swift uipageviewcontroller tutorial
从多个 csv 文件中提取行和文件名

我的文件夹中有多个以日期为文件名的 csv 文件 20080101 csv 到 20111031 csv csv 文件具有共同的标题 csv 文件如下所示 20080101 csv X Y Z 1 1 3 1 2 6 1 3 24 2 1

从多个 csv 文件中提取行和文件名

从多个 csv 文件中提取行和文件名 的相关文章

随机推荐

热门标签

从多个 csv 文件中提取行和文件名的相关文章