使用Python csv模块更新文件

2024-01-11

我正在使用 python 的 csv 模块从外部工具不断更新的 csv 中提取数据。我遇到了一个问题，当我到达文件末尾时，我收到 StopIteration 错误，但是，我希望脚本继续循环，等待外部工具添加更多行。

到目前为止我想出的是：

f = open('file.csv')
csvReader = csv.reader(f, delimiter=',')
while 1:
    try:
        doStuff(csvReader.next())
    except StopIteration:
        depth = f.tell()
        f.close()
        f = open('file.csv')
        f.seek(depth)
        csvReader = csv.reader(f, delimiter=',')

这具有预期的功能，但看起来也很糟糕。捕获 StopIteration 后不可能进行循环，因为一旦抛出 StopIteration，它将在每次后续调用 next() 时抛出 StopIteration。有人对如何实现这一点有任何建议吗？这样我就不必做这种愚蠢的讲述和寻求？或者有一个不同的 python 模块可以轻松支持此功能。

您的问题不在于 CSV 阅读器，而在于文件对象本身。您可能仍然需要在上面的代码片段中进行疯狂的旋转，但最好创建一个文件对象包装器或子类来为您完成此操作，并将其与 CSV 阅读器一起使用。这使得复杂性与 csv 处理代码隔离开来。

例如（警告：未经测试的代码）：

class ReopeningFile(object):
    def __init__(self, filename):
        self.filename = filename
        self.f = open(self.filename)

    def next(self):
        try:
            self.f.next()
        except StopIteration:
            depth = self.f.tell()
            self.f.close()
            self.f = open(self.filename)
            self.f.seek(depth)
            # May need to sleep here to allow more data to come in
            # Also may need a way to signal a real StopIteration
            self.next()

    def __iter__(self):
        return self

然后您的主代码变得更简单，因为它不必管理文件重新打开（请注意，您也不必在文件重新启动时重新启动 csv_reader：

import csv
csv_reader = csv.reader(ReopeningFile('data.csv'))
for each in csv_reader:
    process_csv_line(each)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用Python csv模块更新文件的相关文章

如何在 Windows 10 上使用 python 3.7 的 anaconda 包？

我使用的是 Windows 10 Pro 64 位版本我从此页面下载Anaconda3 2019 03 Windows x86 64 exe https www anaconda com distribution https www an
Pandas 字符串提取所有匹配项

我正在学习 pandas 系列字符串方法中的正则表达式操作我能够从字符串中提取第一个数字但我的正则表达式与第二个数字不匹配如何捕获这两个数字注意第二行第二个元素在这里是 NAN CODE import pandas as pd d
如何测试使用 XCom 的 Apache Airflow 任务

我正在尝试找出一种测试 DAG 的方法其中有几个任务使用 XCom 进行通信由于控制台命令只允许我从 DAG 运行任务有没有一种方法可以测试通信而无需通过 UI 运行 DAG Thanks 这是一种对我有用的方法尽管 Airflow
如何忽略传递给函数的意外关键字参数？

假设我有一些功能 f def f a None print a 现在如果我有一本字典比如dct a Foo 我可以打电话f dct 并得到结果Foo打印但是假设我有一本字典dct2 a Foo b Bar 如果我打电话f dct2
如何使用 django (python) 和 s3 上传文件？

我正在寻找一种将文件上传到 s3 的方法我正在使用 django 我目前正在使用亚马逊的 python 库进行上传以及以下代码 View def submitpicture request fuser request session lo
重新索引错误没有意义

I have DataFrames大小在 100k 到 2m 之间我正在处理这个问题的框架是如此之大但请注意我必须对其他框架执行相同的操作 gt gt gt len data 357451 现在这个文件是通过编译许多文件创建的所以它
如何为 Intellij/PyCharm 设置 PYTHONSTARTUP 脚本

我尝试添加PYTHONSTARTUP环境变量我还尝试了自定义启动脚本但更令人惊讶的是这also没有工作 npa别名无法识别出于一点绝望我什至尝试添加到interpreter options 那什么也没做实际上是什么Interpr
Python 按照层次结构按多个分隔符分割字符串

我只想根据多个分隔符例如 and 和按顺序分割字符串一次例子 121 34 adsfd gt 121 34 adsfd dsfsd and adfd gt dsfsd adfd dsfsd adfd gt dsfsd adfd dsf
与其他格式相比，Apache Parquet 格式有哪些优缺点？

Apache Parquet 的一些特性是自我描述柱状格式独立于语言与 Apache Avro 序列文件 RC 文件等相比我想了解一下这些格式我已经读过 Impala 如何使用 Hadoop 文件格式 https www clo
如何在Python中求和

我想知道如何在 python 中表示总和而不需要像这样的循环here http docs scipy org doc scipy reference tutorial optimize html 我们有 def rosen x The Ro
读取文件特定行号的有效方法。（奖励：Python 手册印刷错误）

我有一个 100 GB 的文本文件它是来自数据库的 BCP 转储当我尝试导入它时BULK INSERT 我在第 219506324 行上收到一个神秘错误在解决此问题之前我想看看这一行但可惜的是我最喜欢的方法 import line
python：是否有用于对输入流进行分块的库函数？

我想对输入流进行分块以进行批处理给定一个输入列表或生成器 x in 1 2 3 4 5 6 我想要一个能够返回该输入块的函数说如果chunk size 4 then x chunked 1 2 3 4 5 6 这是我一遍又一遍地做的事
Python，多线程，获取网页，下载网页

我想在一个站点批量下载网页我的 urls txt 文件中有 5000000 个 url 链接大约有300M 如何让多线程链接这些网址并下载这些网页或者如何批量下载这些网页我的想法 with open urls txt r as f
在python中安装scipy模块时出错

我正在尝试使用 pip 在 python 中安装 scipy 模块它显示以下错误 Command c users sony appdata local programs python python35 32 python exe u c
如何加速 pandas 字符串函数？

我正在使用 pandas 矢量化 str split 方法来提取从上的拆分返回的第一个元素我还尝试使用 df apply 与 lambda 和 str split 来产生等效的结果使用 timeit 时我发现 df apply 的
Scrapy的redirect_urls异常.KeyError

我是 Scrapy 和 Python 的新手最近推出了我的第一个蜘蛛有一个功能似乎以前有效但现在它只适用于我试图废弃的一些网站代码行是 item url direct response request meta redirect u
如何将 fields 参数传递到 Google Drive Python API 调用中

I have results drive service files list body execute where body q query string maxResults 1 为了提高性能我想限制返回的字段如下所述 https
(de)从 CSV 序列化为对象（或者最好是类型对象的列表）

我是一名 C 程序员试图学习 C 似乎有一些内置的对象序列化但我在这里有点不知所措我被要求将测试数据从 CSV 文件加载到对象集合中 CSV 比 xml 更受青睐因为它更简单且更易于人类阅读我们正在创建测试数据来运行单元测试该集
如何配置 Eclipse 在使用 Pydev 插件选择“运行”或“调试”时启动浏览器

我正在使用 Eclipse Pydev 插件学习 Python 和 Django 当我按运行或调试时我希望内部或外部浏览器使用 URL http 127 0 0 1 启动或刷新我见过用 PHP 插件完成的但没有用 Pydev
在 Flutter 中保存照片（尤其是保存到相机胶卷）

我不知道如何保存到相机胶卷相当于React Native的CameraRoll saveToCameraRoll https facebook github io react native docs cameraroll html sav

随机推荐

通过 for 循环绑定的事件中数值错误

var rows document getElementsByClassName row for var i 0 l rows length i lt l i if i 2 0 rows i click function alert I a
调用 RedirectToAction 时 Response.Cookies 会重置

在我的 asp net mvc 项目中我有一个 AccountController 它在登录时将带有用户首选项的 cookie 设置为 Request Response 然后执行 RedirectToAction 重定向后 cookie
NoSuchModuleError：无法加载插件：sqlalchemy.dialects:redshift.psycopg2

我正在尝试从我的 python 代码连接到 redshift 我安装的点 psycopg2 2 6 1 redshift sqlalchemy 0 4 1 SQLAlchemy 1 0 9 我的虚拟机有 libpq dev python p
PHP 升级后第 0 行出现未知错误 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我该如何解决这个奇怪的问题我将我的 VPS 上的 PHP 更新到了 5 6 0 现在在这个特定的脚本上我收到了这两个错误而我之前没有
如何知道拉斐尔对象是否被隐藏？

我正在创建一个图表应用程序在其中隐藏和显示一些元素例如 var c paper circle 10 10 10 c hide var c2 paper circle 10 10 10 c2 show 现在我想对这样的形状采取行动例如计
ModuleNotFoundError - Python 3 的 PyMySQL

我正在尝试让一个简单的测试程序在我的机器上运行并连接到 SQL DB 我pip安装然后卸载然后用pip3安装 pymysql 我遇到的问题导入 PyMySQL ModuleNotFoundError 没有名为 PyMySQL 的模块当我
nodejs根据时间戳查询azure存储表

我使用以下查询成功查询了带有分区键的表 var query new azure TableQuery where PartitionKey ne test 但我尝试用时间戳查询但失败了 var query new azure TableQu
访问 https://api.sandbox.paypal.com/v1/ payments/billing-plans/xxxxxxxxxxx 时收到 Http 响应代码 500

我创建了许多计费计划直到上周都运行良好我正在尝试删除该计划但在访问时收到错误 Got Http response code 500https api sandbox paypal com v1 payments billing pla
空接口有代码味道吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动
Redshift - 如何删除 NOT NULL 约束？

由于Redshift不支持ALTER COLUMN 我想知道是否可以从 Redshift 中的列中删除 NOT NULL 约束您无法更改该表还有一种替代方法您可以创建带有 NULL 约束的新列将旧列中的值复制到此新列然后删除旧列
如何在无头 Chrome 上使用 Selenium Webdriver？

我正在学习使用 Selenium 进行一些基本操作例如截屏抓取和测试并且希望将其与 Headless Chrome 一起使用该 Chrome 从 Chrome 59 开始已经稳定我已经能够使用 selenium webdriver
尝试将多个命令行参数传递给 javaws 启动应用程序？

我见过类似的问题但没有一个能够帮助我解决我的问题我被要求能够传递多个命令行参数来启动我们使用的自定义 Java 应用程序无论如何我已经尝试过这个命令因为我能找到的所有文档都说 javaws open arg1 arg2 arg3
如果收到 Firebase 安全规则信函，我该怎么办？ [复制]

这个问题在这里已经有答案了到达邮件需要做什么 rules rules version 2 service cloud firestore match databases database documents This rule allow
使用 IntelliJ 或 Play 时如何使“Java Hot Spot MaxPermSize”警告消失？

当我启动 IntelliJ 或运行时收到此警告play in a Play http www playframework com 项目 Java HotSpot TM 64 Bit Server VM warning ignoring op
git checkout 分支，不删除其中已删除的文件

这是我面临的情况充满生成文件的目录错误地提交到存储库它们显然不应该是所以我想删除它们 git rm cached foo cat gt foo gitignore gitignore git add foo git commit m
jquery ajax传递具有相同键的多个值的数据

有没有一种简单的方法可以使用 jquery 构建这样的 ajax 查询 http www test com value happy value good value day I tried getJSON http www test com
如何检索 Amazon cloudsearch 中的所有可搜索（未删除）文档

我想从 cloudsearch 检索所有可搜索文档我尝试做这样的否定搜索 search mySearchEndPoint cloudsearch amazonaws com 2011 02 01 search bq not keyword
使用 R 中 {boot} 中的 boot() 函数对最高级别的集群数据进行非参数引导

我有两级分层数据我正在尝试在最高级别上执行非参数引导采样即通过替换对最高级别的集群进行随机采样同时保留原始的集群内数据我想使用 boot 包中的 boot 函数来实现此目的因为我想使用需要引导对象的 boot ci 来构建 BC
我们如何使用 python Social auth openid connect 集成任何 SSO 提供商？

在我的项目中客户可以通过管理面板配置自己的 SSO 服务我可以创建遗传密码吗像这样这里我使用 python Social auth open id 模块 python Social auth 仅为 google OpenID con
使用Python csv模块更新文件

我正在使用 python 的 csv 模块从外部工具不断更新的 csv 中提取数据我遇到了一个问题当我到达文件末尾时我收到 StopIteration 错误但是我希望脚本继续循环等待外部工具添加更多行到目前为止我想出的是 f

使用Python csv模块更新文件

使用Python csv模块更新文件 的相关文章

随机推荐

热门标签

使用Python csv模块更新文件的相关文章