Python - CSV：具有不同长度行的大文件

2023-12-09

简而言之，我有一个 20,000,000 行的 csv 文件，它具有不同的行长度。这是由于陈旧的数据记录器和专有格式造成的。我们得到以下格式的最终结果作为 csv 文件。我的目标是将此文件插入到 postgres 数据库中。我怎样才能做到以下几点：

保留前 8 列和最后 2 列，以获得一致的 CSV 文件
将新列添加到 csv 文件 ether 的第一个或最后一个位置。

1, 2, 3, 4, 5, 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, img_id.jpg, -50
1, 2, 3, 4, 5, 0,0,0,0,0,0,0,0,0, img_id.jpg, -50
1, 2, 3, 4, 5, 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, img_id.jpg, -50
1, 2, 3, 4, 5, 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, img_id.jpg, -50
1, 2, 3, 4, 5, 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, img_id.jpg, -50
1, 2, 3, 4, 5, 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, img_id.jpg, -50
1, 2, 3, 4, 5, 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, img_id.jpg, -50
1, 2, 3, 4, 5, 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, img_id.jpg, -50
1, 2, 3, 4, 5, 0,0,0,0,0,0, img_id.jpg, -50
1, 2, 3, 4, 5, 0,0,0,0,0,0,0,0,0,0,0 img_id.jpg, -50

读取一行csv, then:

newrow = row[:8] + row[-2:]

然后添加新字段并将其写出来（也可以使用csv).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Parsing

csv

ETL

Python - CSV：具有不同长度行的大文件的相关文章

JavaScript 相当于 Python 的参数化 string.format() 函数

这是 Python 示例 gt gt gt Coordinates latitude longitude format latitude 37 24N longitude 115 81W Coordinates 37 24N 115 81W
boto3 资源（例如 DynamoDB.Table）的类型注释

The boto3库提供了几种返回资源的工厂方法例如 dynamo boto3 resource dynamodb Table os environ DYNAMODB TABLE 我想注释这些资源以便我可以获得更好的类型检查和完成但我
在 macOS 中通过 Python 访问进程的压缩 RAM（顶部的 CMPRS）的方法？

我试图弄清楚如何从 Python 访问任何给定进程占用的实际 RAM 量我发现 psutil Process PID memory info rss 工作得很好直到操作系统决定开始压缩某些进程的 RAM 然后所有的 memory in
numpy 使用 datetime64 进行数字化

我似乎无法让 numpy digitize 与 datetime64 一起使用 date bins np array np datetime64 datetime datetime 2014 n 1 s for n in range 1 1
可以用 Django 制作移动应用程序吗？

我想知道我是否可以在我的网站上使用 Django 代码并以某种方式在移动应用程序 Flutter 等框架中使用它那么是否可以使用我现在拥有的 Django 后端并在移动应用程序中使用它所以就像models views etc 是的有
python是带有字符串的运算符行为[重复]

这个问题在这里已经有答案了我无法理解以下行为我正在创建 2 个字符串并使用 is 运算符来比较它对于第一种情况它的工作方式有所不同对于第二种情况它按预期工作当我使用逗号或空格时它显示是什么原因False与比较is当没有使用
python 中的 Johansen 协整检验

我找不到任何有关在处理统计和时间序列分析 pandas 和 statsmodel 的 Python 模块中执行 Johansen 协整检验的功能的参考有谁知道是否有一些代码可以执行时间序列之间的协整测试现在这已在 Python 的 s
使用 scipy curve_fit 拟合噪声指数的建议？

我正在尝试拟合通常按以下方式建模的数据 def fit eq x a b c d e return a 1 np exp x b c np exp x d e x np arange 0 100 0 001 y fit eq x 1 1 1
django-admin.py makemessages 不起作用

我正在尝试翻译一个字符串 load i18n trans Well Hello there how are you to Hola amigo que tal 我的 settings py 文件有这样的内容 LOCALE PATHS os
如何使用 sys.path.append 在 Python 中导入文件？

我的桌面上有两个目录 DIR1 and DIR2其中包含以下文件 DIR1 file1 py DIR2 file2 py myfile txt 这些文件包含以下内容 file1 py import sys sys path append s
Pandas style.bar 颜色基于条件？

如何渲染其中一列的 Pandas dfstyle bar color属性是根据某些条件计算的 Example df style bar subset before after color ff781c vmin 0 0 vmax 1 0 而
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
无法在 python 3.8 上将带有 webapp 的 python 部署到 azure

我正在尝试使用部署一个测试项目Flask使用以下方法将框架迁移到 Azure 云中Azure CLI https learn microsoft com en us azure app service containers quicksta
解析 XML 标签不匹配时出错
检测 IDLE 的存在/如何判断 __file__ 是否未设置

我有一个脚本需要使用 file 所以我了解到 IDLE 没有设置这个有没有办法从我的脚本中检测到 IDLE 的存在 if file not in globals file is not set 如果你想做一些特别的事情 file 未设置
Python：高精度time.sleep

你能告诉我如何在 Win32 和 Linux 上的 Python 2 6 中获得高精度睡眠函数吗您可以在中使用浮点数sleep http docs python org library time html time sleep 该参数可以
Django 模型：如何使用 mixin 类来覆盖 django 模型以实现 save 等功能

我想在每次保存模型之前验证值所以我必须重写保存函数代码几乎是一样的我想把它写在 mixin 类中但失败了我不知道如何写 super func 我英语不好抱歉 class SyncableMixin object def sav
如何循环遍历字典列表并打印特定键的值？

我是 Python 新手有一个问题我知道这是一个非常简单的问题运行Python 3 4 我有一个需要迭代并提取特定信息的列表以下是列表称为部分的示例已截断数千个项目 state DEAD id phwl type name
将 CSV 复制到 Amazon RDS 托管的 Postgresql 数据库

我有一个使用 Amazon 的 RDS 服务托管的数据库我正在尝试编写一个 Web 服务来更新所述数据库我遇到的问题是它不允许我使用 COPY 命令因为我收到此错误错误必须是超级用户才能复制到文件或从文件复制我正在使用我为数据库
使用 urllib 编码时保持 url 参数有序

我正在尝试用 python 模拟 get 请求我有一个参数字典并使用 urllib urlencode 对它们进行 urlencode 我注意到虽然字典的形式是 k1 v1 k2 v2 k3 v3 urlencoding 后参数的顺序切

随机推荐

sed 搜索范围并打印第一组

我有一个如下所示的文件 myname something something something myname something something myname something and it follows and no stand
在 Python 中从基类对象创建对象

我有一个基类 class Animal object def init self name None food None self name name self food food def eat self print The s eats
将一个文件中的汉字写入另一个文件

我有一个里面有汉字文本的文件我想将这些文本复制到另一个文件中但文件输出与中文字符混乱请注意在我的代码中我已经使用 UTF8 作为我的编码 BufferedReader br new BufferedReader new FileR
将 .net core 项目发布到 iis 时出现 HTTP 错误 500.19，代码为 0x80070005

我想在我的电脑的 IIS 管理器上发布示例 net core Web 应用程序但失败了我正在使用 Microsoft 指南但它对我不起作用如果您有解决此问题的合理经验我将不胜感激看到您的建议我缺少 IIS gt Modules
Google 日历 API 移动事件

协议如下在谷歌开发者网站上他们在每个 api 函数描述的底部都有一个用于尝试 api 的工具特别是我正在使用日历 api 其中写着使用下面的 API 资源管理器 https developers google com google
使用 Swing 计时器更新标签

我在这段代码中遇到了一些问题我正在使用一个随机数启动一个计时器并且我想每秒更新一个带有倒计时的 JLabel 但我还没有弄清楚如何做到这一点因为计时器触发的唯一监听器是在它的末尾据我所知这是代码 int i getTimer ma
KB4338830 更新后冻结 Winsock 应用程序

我们的应用程序在一段时间后突然冻结KB4338830更新不幸的是应用程序无法重新启动也无法关闭我怀疑这一切都是因为我正在使用的winsock 刚刚移植它是在vb net上编写的该程序与其他PC的连续发送和接收数据有关有人遇到过同
Visual Studio 2012 XAML 设计器 - 无法添加多个项目

我是 VS 2012 的新手每次使用时都会遇到这个问题XAML设计器每次我向窗口添加一个项目例如单选按钮图像标签时它都会删除前一个项目结果我的窗口中只能有一项我知道这是荒谬的我错过了什么这是窗口的xaml
如何垂直对齐 div 中的文本？

我正在尝试找到将文本与 div 对齐的最有效方法我尝试了一些方法但似乎都不起作用 testimonialText position absolute left 15px top 15px width 150px height 309px
如何使用 python Tkinter 隐藏 Windows 控制台？

我尝试将 py 文件重命名为 pyw 但用 py2exe 编译并没有什么区别我尝试使用 root withdraw 但它所做的只是冻结应用程序防止弹出初始画布并且无论如何都无法删除命令提示符窗口有没有人有办法解决吗我的根是根 T
LINQ to Entities 不支持“日期”。仅支持初始值设定项、实体成员和实体导航属性

我正在尝试执行以下代码并收到错误 public List
有没有办法更改FixedLenNullInSource 和TrimTrailingBlanks 的值？

有没有办法改变值FixedLenNullInSource and TrimTrailingBlanks I use sp help比较不同服务器的输出以查看表是否相同 FixedLenNullInSource and TrimTrailin
在 imageview 中显示来自 Intent 的 jpg 图像

如何显示从 android intent action SEND in an imageview 用户从应用程序列表中选择我的应用程序来共享图像图像是sent via intent我的活动打开了但如何在图像视图中使用此图像 using
istio-proxy 访问日志是什么意思？

我试图通过查看 istio proxy 访问日志它记录每次访问来对我的服务进行故障排除但是我找不到任何解释日志中每个条目含义的文档例如 2018 12 20T11 09 42 302Z GET HTTP 1 1 200 0 614
C# 嵌套类序列化

我正在尝试序列化订单的虚拟集合其中每个订单都包含一个产品该集合序列化良好但订单内的示例产品属性被遗漏订单领取 XmlRoot Orders public class OrderCollection ICollection
上传文件抛出无方法签名异常（在 getFile() 方法中）

我正在尝试上传文件并将其存储在文件中这是 GSP 中的代码
当轴标签分成多条线时会偏离中心

我在用graph twoway scatter并添加我自己的ylabels 我经常有很长的标签并将它们分成多行然而当我想要破解的时候却遇到了问题some标签超过两行但不超过两行当我这样做时单行标签相对于它们的中心是偏离的tick标记
Laravel 如何使用 Eloquent 获取对象的行号？

我想根据用户的创建日期了解用户的位置我该如何使用 Eloquent 来做到这一点我希望能够做这样的事情 User getRowNumber user obj 我想你想要 MySQL 解决方案所以你可以这样做 DB statement
选定的项目数据从表格到 ZK 中的文本框

我正在开发一个小型 Web 应用程序用于存储医院患者的数据以便更多地了解 zk 及其令人惊叹的功能这次我的目标是当我选择一行复选标记时我想将该行的数据红色获取到相应的文本框蓝色当我选择表的任何行时这将起作用也许这是
Python - CSV：具有不同长度行的大文件

简而言之我有一个 20 000 000 行的 csv 文件它具有不同的行长度这是由于陈旧的数据记录器和专有格式造成的我们得到以下格式的最终结果作为 csv 文件我的目标是将此文件插入到 postgres 数据库中我怎样才能做到

Python - CSV：具有不同长度行的大文件

Python - CSV：具有不同长度行的大文件 的相关文章

随机推荐

热门标签

Python - CSV：具有不同长度行的大文件的相关文章