当事先不知道字段时使用 DictWriter 写入 CSV

2024-01-10

我正在将一大段文本解析为字典，最终目标是创建一个 CSV 文件，其中键作为列标题。

csv.DictWriter(csvfile, fieldnames, restval='', extrasaction='raise', dialect='excel', *args, **kwds)

问题的出现是因为任何第 n 行的字典都可以包含一个新的、以前从未使用过的密钥。然后我希望 CSV 也包含这个新密钥的列。简而言之，我的所有字段事先都不知道，所以我无法编译完整的fieldnames一开始。

有推荐的方法吗csv.DictWriter http://docs.python.org/2/library/csv.html?highlight=dictwriter#csv.DictWriter不忽略缺失的字段，而是将它们添加到fieldnames反而？只是改变fieldnames此时，前面的行的字段数会错误地减少。

而不是使用词典编写器这在你的情况下可能会令人困惑，因为我尝试使用字典没有排序writerow的方法csv。这是我所做的：

"""
a) First took all the keys of dictionary and sorted it, which is not necessary.
b) Created a result list which appends value related the headers which is key of our input dict and if key is not available then .get() will return None. 
   So result list will contain lists for rows data.
c) Wrote header and each row from result list in csv file
"""

data_dict = [{ "Header_1":"data_1", "Header_2":"data_2", "Header_3":"data_3"},
             { "Header_1":"data_4", "Header_2":"data_5", "Header_3":"data_6"},
             { "Header_1":"data_7", "Header_2":"data_8", "Header_3":"data_9", "Header_4":"data_10"},
             { "Header_1":"data_11", "Header_3":"data_12"},
             { "Header_1":"data_13", "Header_2":"data_14", "Header_3":"data_15"}]

"""
   In the third dict we have extra key, value.
   In forth we dont have have header_2 were we aspect blank value in our csv file.
"""
process_data = [ [k,v] for _dict in data_dict for k,v in _dict.iteritems() ]           

headers = [ i[0] for i in process_data ]
headers = sorted(list(set(headers)))

result = []
for _dict in data_dict:
    row = []
    for header in headers:
        row.append(_dict.get(header, None))
    result.append(row)


import csv
with open('demo.csv', 'wb') as csvfile:
    spamwriter = csv.writer(csvfile, delimiter=';', dialect='excel', 
                            quotechar='|', quoting=csv.QUOTE_MINIMAL)
    spamwriter.writerow(headers)    
    for r in result:
        spamwriter.writerow(r)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

当事先不知道字段时使用 DictWriter 写入 CSV 的相关文章

在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
如何使用 imaplib 获取“消息 ID”

我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好所以我认为 Message ID 是正确的但我不知道如何获取它我只知道 imap fetch uid XXXX 有人有解决方案吗来自 IMAP 文档本身 IMAP4消息号
更改 R 中 ggplot geom_polygon 的颜色方案

我正在使用地图库和 ggplot 的 geom polygon 创建地图我只是想将默认的蓝色红色紫色配色方案更改为其他颜色我对 ggplot 非常陌生所以如果我没有使用正确的数据类型请原谅我使用的数据如下所示 gt head
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
如何通过在 Python 3.x 上按键来启动和中断循环

我有这段代码当按下 P 键时会中断循环但除非我按下非 P 键否则循环不会工作 def main openGame while True purchase imageGrab if a sum gt 1200 fleaButton ti
如何从Python中的字符串中提取变量名称和值

我有一根绳子 data var1 id 12345 name John White python中有没有办法将var1提取为python变量更具体地说我对字典变量感兴趣这样我就可以获得变量的值 id和name python 这是由提供
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
Pandas 根据 diff 列形成簇

我正在尝试使用 Pandas 根据表示时间以秒为单位的列中的差异来消除数据框中的一些接近重复项例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
将 2D NumPy 数组按元素相乘并求和

我想知道是否有一种更快的方法专用 NumPy 函数来执行 2D NumPy 数组的元素乘法然后对所有元素求和我目前使用np sum np multiply A B 其中 A B 是相同维度的 NumPy 数组m x n 您可以使用np
在 Pandas 中使用正则表达式的多种模式

我是Python编程的初学者我正在探索正则表达式我正在尝试从描述列中提取一个单词数据库名称我无法给出多个正则表达式模式请参阅下面的描述和代码描述 Summary AD1 Low free DATA space in data
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
使用yield 进行字典理解

作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
如何为每个屏幕添加自己的 .py 和 .kv 文件？

我想为每个屏幕都有一个单独的 py 和 kv 文件应通过 main py main kv 中的 ScreenManager 选择屏幕设计应从文件 screen X kv 加载类等应从文件 screen X py 加载 Screens
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
如何读取Python字节码？

我很难理解 Python 的字节码及其dis module import dis def func x 1 dis dis func 上述代码在解释器中输入时会产生以下输出 0 LOAD CONST 1 1 3 STORE FAST 0 x
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在
从 Twitter API 2.0 获取 user.fields 时出现问题

我想从 Twitter API 2 0 端点加载推文并尝试获取标准字段作者文本和一些扩展字段尤其是用户字段端点和参数的定义工作没有错误在生成的 json 中我只找到标准字段但没有找到所需的 user fields 用户
列表值的意外更改

这是我的课 class variable object def init self name name alias parents values table name of the variable self name 这是有问题的函数 f

随机推荐

如何使用 XSLT 查找中的元素数量？

我有一个包含以下类型的 XML 架构
为什么我的下拉列表所选项目每次只显示列表中的第一项？

我在使用 ASP NET 时遇到问题DropDownList它由 XML 文件填充 rblState DataSource dsState rblState DataValueField abbreviation rblState Data
使用 @Value Spring 注解从 .yaml 读取的属性映射的正确用法是什么

我通过以下方式从 Spring Boot 应用程序中的某些 yaml 读取的地图中注入了属性 Value app map private Map
使用自定义反序列化器和 JSON.Net 反序列化 JSON

我的 JSON 看起来像这样 MobileSiteContents au en http www url1 com http www url2 com cn zh http www url2643 com 我正在尝试将其反序列化为IEnum
垂直对齐容器中的文本

我正在尝试对齐与浮动元素相邻的跨度元素这是小提琴 http jsfiddle net w7vngc43 2 heading background color tomato heading after content display blo
SLF4J-Log4J 似乎没有禁用日志记录

看起来虽然日志级别设置为INFO 但SLF4J仍在评估表达式 package com ab test slf4j import org apache log4j PropertyConfigurator import org slf4j L
iPhone 是否需要高分辨率和标准分辨率的副本？

想知道 iPhone 应用程序是否需要高分辨率和低分辨率图像拥有副本会增加文件大小这是我需要减少的我过去构建过应用程序并且只使用高分辨率没有在文件名中附加 2x 这些应用程序在低分辨率和高分辨率设备上看起来都很棒所以让我知道
检索包含某个跨度类的数据

using file get contents 我打开一个 Internet URL 并获取该网页的内容 HTML 内部有许多相同的 span 类标签 span class always the same class always dyna
是否可以将 C# 泛型方法类型参数限制为“可从”包含类的类型参数“分配”？

我怀疑答案是否定的但我想知道是否可以做这样的事情 public class MyGenericClass
如何获取嵌套滚动视图中所有Recycler View项目视图位置（x，y）

我必须在回收器视图的左侧绘制一条曲线连接回收器视图中的所有项目但是我无法获取回收器视图项目的所有位置来开始绘制自定义视图我尝试获取 x y 在 onBindViewHolder 中的位置但它不起作用我虽然在nestedscroll
md-menu 覆盖 Angular 2 中的默认最大宽度

我正在使用 Angular 2 Angular Material 并且我愿意在 md 菜单中显示更多数据因此我需要将 md 菜单的最大宽度设置为更高的值它的默认值为 280px img src assets images ic not
使用 awk 或 perl 从 CSV 中提取特定列（解析）

背景我想从 csv 文件中提取特定列 csv 文件以逗号分隔使用双引号作为文本限定符可选但当字段包含特殊字符时限定符将在那里请参阅示例并使用反斜杠作为转义字符某些字段也可能为空示例输入和所需输出例如我只希望第 1 3
Spark：执行器内存超出物理限制

我的输入数据集大约是150G 我正在设置 conf spark cores max 100 conf spark executor instances 20 conf spark executor memory 8G conf spark
什么是上下文对象设计模式？

什么是上下文对象设计模式上下文是数据的集合通常存储在Map或者在充当具有访问器和修饰符的结构的自定义类中它用于维护状态并在系统内共享信息请参阅此 PDF 以获取详细说明 https www dre vanderbilt edu sc
matlab中的“+”打包或模块化编程：类似于python的导入？

我有 Java 或 Python 等语言的背景其中通过打包系统和导入指令也称为命名空间别名启用模块化编程从历史上看 MATLAB 解决命名冲突等问题的方法可以归结为设置使用 MATLABPATH 使用前缀重命名扩展标识符等到目
在 iOS 应用程序中拥有初始化屏幕的正确方法

查看调用某些端点获取初始数据的最佳位置在哪里在某些应用程序主要是游戏中菜单之前有一个加载屏幕这是启动屏幕还是在 viewDidLaunchWithOptions 期间设置的视图或者只是一个初始视图如果我的搜索是正确的则无
Akka 会淘汰 Camel 吗？

My 理解Akka 的特点是它提供了一个模型多个独立的线程可以通过该模型以高度并发的方式相互通信它使用参与者模型其中每个线程都是一个参与者负责执行特定的工作您可以编排在什么条件下将哪些消息传递给哪些参与者我以前使用过 Cam
在 Swing 中加载数据时的 JProgressBar

我有一个来自 UI 的服务器调用它的响应时间有点高所以我想在从服务器加载数据期间显示进度条我已经尝试使用以下代码approach https stackoverflow com questions 10442406 basic ind
blockinfile 不断添加块

我想使用 blockinfile 将文本块添加到我的 ElasticSearch 配置中但每次运行我的 playbook 时该块都会添加到文件中即使它已经存在这是一个问题因为 ElasticSearch 不只是获取最后一个值它还
当事先不知道字段时使用 DictWriter 写入 CSV

我正在将一大段文本解析为字典最终目标是创建一个 CSV 文件其中键作为列标题 csv DictWriter csvfile fieldnames restval extrasaction raise dialect excel args

当事先不知道字段时使用 DictWriter 写入 CSV

当事先不知道字段时使用 DictWriter 写入 CSV 的相关文章

随机推荐

热门标签