将 CSV 值读入列表字典的最 Pythonic 方法

2023-11-24

我有一个 CSV 文件，其数据列顶部的标题如下：

a,b,c
1,2,3
4,5,6
7,8,9

我需要在列表字典中阅读它：

desired_result = {'a': [1, 4, 7], 'b': [2, 5, 8], 'c': [3, 6, 9]}

当阅读本文时DictReader我正在使用嵌套循环将项目附加到列表中：

f = 'path_to_some_csv_file.csv'
dr = csv.DictReader(open(f))
dict_of_lists = dr.next()
for k in dict_of_lists.keys():
    dict_of_lists[k] = [dict_of_lists[k]]
for line in dr:
    for k in dict_of_lists.keys():
        dict_of_lists[k].append(line[k])

第一个循环将字典中的所有值设置为空列表。下一个循环遍历从 CSV 文件读取的每一行，其中DictReader创建一个键值字典。内部循环将值附加到与相应键匹配的列表中，因此我最终得到了所需的字典列表。我最终不得不经常写这个。

我的问题是，是否有一种更 Pythonic 的方法来使用内置函数而不使用嵌套循环，或者更好的习惯用法，或者存储此数据结构的替代方法，以便我可以通过使用键查询来返回可索引列表？如果是这样，是否还有一种方法可以预先格式化列所摄取的数据？

根据您存储的数据类型以及如果您可以使用 numpy，执行此操作的一个好方法是numpy.genfromtxt:

import numpy as np
data = np.genfromtxt('data.csv', delimiter=',', names=True)

这将创建一个 numpy结构化数组，它提供了一个很好的接口，用于通过标头名称查询数据（请确保使用names=True如果您有标题行）。

给定示例data.csv包含：

a,b,c
1,2,3
4,5,6
7,8,9

然后您可以使用以下方式访问元素：

>>> data['a']        # Column with header 'a'
array([ 1.,  4.,  7.])
>>> data[0]          # First row
(1.0, 2.0, 3.0)
>>> data['c'][2]     # Specific element
9.0
>>> data[['a', 'c']] # Two columns
array([(1.0, 3.0), (4.0, 6.0), (7.0, 9.0)],
      dtype=[('a', '<f8'), ('c', '<f8')])

genfromtext根据您的要求，还提供了一种“格式化由列预先摄取的数据”的方法。

转换器 : 变量，可选

将列数据转换为值的函数集。转换器还可以用于为丢失的数据提供默认值：converters = {3: lambda s: float(s or 0)}.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将 CSV 值读入列表字典的最 Pythonic 方法的相关文章

pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
如何使用 imaplib 获取“消息 ID”

我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好所以我认为 Message ID 是正确的但我不知道如何获取它我只知道 imap fetch uid XXXX 有人有解决方案吗来自 IMAP 文档本身 IMAP4消息号
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
如何在 pytest 中将单元测试和集成测试分开

根据维基百科 https en wikipedia org wiki Unit testing Description和各种articles https techbeacon com devops 6 best practices inte
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
C# 将数据写入 CSV 文件

我正在尝试写入csv使用 C 语言逐行文件这是我的功能 string first reader 0 ToString string second image ToString string csv string Format 0 1 n
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
对图像块进行多重处理

我有一个函数必须循环遍历图像的各个像素并计算一些几何形状此函数需要很长时间才能运行在 24 兆像素图像上大约需要 5 小时但似乎应该很容易在多个内核上并行运行然而我一生都找不到一个有据可查解释充分的例子来使用 Multiproc
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
将 JSON 对象传递给带有请求的 url

所以我想利用 Kenneth 的优秀请求模块 https github com kennethreitz requests 在尝试使用时偶然发现了这个问题自由库API http wiki freebase com wiki API 基本上
Pandas 根据 diff 列形成簇

我正在尝试使用 Pandas 根据表示时间以秒为单位的列中的差异来消除数据框中的一些接近重复项例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
在 Pandas 中使用正则表达式的多种模式

我是Python编程的初学者我正在探索正则表达式我正在尝试从描述列中提取一个单词数据库名称我无法给出多个正则表达式模式请参阅下面的描述和代码描述 Summary AD1 Low free DATA space in data
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
使用 NumPy 将非均匀数据从文件读取到数组中

假设我有一个如下所示的文本文件 33 346 1223 10 23 11 23 12 23 13 23 14 23 15 23 16 24 10 24 11 24 12 24 13 24 14 24 15 24 16 25 14 25 15
当鼠标悬停在上面时，intellisense vscode 不显示参数或文档

我正在尝试将整个工作流程从 Eclipse 和 Jupyter Notebook 迁移到 VS Code 我安装了 python 扩展它应该带有 Intellisense 但它只是部分更糟糕我在输入句点后收到建议但当将鼠标悬停在其上方
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

如何将sender参数传递给system.timers.timer

如何将sender参数传递给system timers timer在 NET 中 timer1 timer new System Timers Timer interval timer1 timer AutoReset true timer
如何使用 R 从 MATLAB 序列日期数字中提取时间？

我有一些需要在 R 中使用的 MATLAB 序列日期号但我必须将它们转换为正常日期 Matlab datestr 733038 6 ans 27 Dec 2006 14 24 00 你可以看到它给出了日期和时间 Now we try in
如何将字符串转换回列表

我有一个清单 ab 1 2 a b c I did strab str ab So strab现在是一个字符串我想将该字符串转换回列表中我怎样才能做到这一点最简单和最安全的方法是使用ast literal eval import as
Firebase：提供的存储桶与 Swift 中当前实例的存储桶不匹配

我有以下代码 let storageRef FIRStorage reference forURL gs slugbug appspot com dots intentional let imageRef storageRef child
React useContext() 性能，自定义钩子内的 useContext

我使用了一个结构反应钩子它是基于全球Context包含减速器的组合如 Redux 中另外我广泛使用定制挂钩来分离逻辑我有一个包含异步 API 请求的钩子它变得相当麻烦我有机会将该钩子的几乎每个函数拆分为其他钩子但每个函数都使
ADB 命令切换不会保留活动开发人员选项设置，但没有实际效果

正如标题所说如果我发出以下命令 adb shell settings put global always finish activities 1 如果我转到开发人员选项我可以看到切换从关闭更改为打开还 adb shell se
列出 SQL Server 2005 中哪些列具有全文索引

如何列出数据库中具有全文索引的所有表列 select distinct object name fic object id table name name column name from sys fulltext index colum
使用 Amazon RedShift 透视表

我在 Amazon RedShift 中有多个表它们遵循多个维度列和一对指标名称值列的模式 DimensionA DimensionB MetricName MetricValue dimA1 dimB1 m1 v11 dimA1 di
在 ruby 中使用 sjcl.js 创建的 AES 解密

您好让我们假设客户端有一个密钥该密钥不通过与加密数据相同的通道传输我想要完成的是解密结果斯坦福 Javascript 加密库 sjcl 在红宝石中或者对于具有支持 AES 的加密库的任何其他语言的概括这是我在 javascript
?#iefix 如何解决 IE6-IE8 中的网页字体加载问题？

网上有很多这样的文章 http www fontspring com blog fixing ie9 font face problems建议添加一个 iefix到 eot 网址我很想知道how这能解决问题吗谢谢 IE8 及更早版本的
405 尽管 CORS 仍不允许方法

我正在尝试使用 Angular 开发前端应用程序由于我添加了授权标头对于 HTTP POST 和 GET 请求我得到405 不允许的方法尽管我似乎允许服务器端的一切我的 Chrome 浏览器中的调试器说它要求Access Contr
XGBoost 从增强器对象中获取分类器对象？

我通常使用以下方法来表达特征重要性 regr XGBClassifier regr fit X y regr feature importances 其中 type regr 是但是我有一个腌制的 mXGBoost 模型解包后会返回一
Nuxt + Vuetify。如何应用主题颜色

我正在使用 Nuxt js Vuetify js 项目查看文件assets style app styl we have Import and define Vuetify color theme https vuetifyjs com
如何删除 Chart.js 中轴的线条/规则？

我设法使用以下方法删除图表中的所有水平线规则 scales xAxes gridLines display false 但我也想去掉代表 Y 轴的规则条但我想保留标签不幸的是我找不到任何选择我只能删除整个轴包括标签我正在使用
MongoDB - 错误：getMore 命令失败：找不到游标

我需要创建一个新字段sid大约 500K 文档集合中的每个文档每个sid是唯一的并且基于该记录的现有记录roundedDate and stream fields 我使用以下代码来执行此操作 var cursor db getCollec
ajax加载tab后的回调

如何将一些代码应用于 ajax 加载选项卡的内容我尝试在加载的内容中使用 document ready 但这阻止了 css 样式的加载不知道为什么有回调函数吗我应该以其他方式在加载的文档中使用 document ready 和样式吗
Matlab 中图例标记的高级定制

It is relatively simple to add basic modifications to markers in matlab legends The legend produced by the following cod
如何在Swing java中的JTable的一行中添加按钮

我制作了一个 swing GUI 其中包含带有一些行和列的 JTable 我应该如何向 JTable 中的行添加一个按钮您不将其添加到行中而是将其添加到单元格中本教程描述您需要什么
使用 gradle 产品风味删除 AndroidManifest 元素

我正在设置一个包含一些产品风格的 Android Gradle 项目我想要
将 CSV 值读入列表字典的最 Pythonic 方法

我有一个 CSV 文件其数据列顶部的标题如下 a b c 1 2 3 4 5 6 7 8 9 我需要在列表字典中阅读它 desired result a 1 4 7 b 2 5 8 c 3 6 9 当阅读本文时DictReader我正在使

将 CSV 值读入列表字典的最 Pythonic 方法

将 CSV 值读入列表字典的最 Pythonic 方法 的相关文章

随机推荐

热门标签

将 CSV 值读入列表字典的最 Pythonic 方法的相关文章