使用 python 3 代码在 CSV 文件中查找特定标头

2024-01-09

现在我有Python 3代码，它获取CSV文件中的一列数据，根据空格将每个单元格中的短语分隔成单独的单词，然后将数据导出回新的CSV文件中。

我想知道是否有一种方法可以告诉 python 仅将格式化代码应用于具有特定标题的特定列？

这是我的源数据的样子

Keyword              Source       Number 
Lions Tigers Bears     US          3
Dogs Zebra            Canada       5
Sharks Guppies         US          2

这是我的代码，它将每个单元格中的短语根据空格分隔成单独的单词

with open(b'C:\Users\jk\Desktop\helloworld.csv', 'r') as datafile:
    data = []
    for row in datafile:
        data.extend(item.strip() for item in row.split())
with open('test.csv', 'w') as a_file:
    for result in data:
        result = ''.join(result)
        a_file.write(result + '\n')
        print(result)

这样源数据就变成了

 Keywords         Source         Number
 Lions            US              3
 Tigers
 Bears
 Dogs             Canada          5

ETC

在这种情况下，我只需要将所有这些代码应用于具有标题的一列Keyword。理想情况下，我想做的是将“源”和“数字”中找到的数据扩展到这些新创建的行（Lions US 3 - Tigers US 3 - Bears US 3 等），但我还没有真正做到还没弄清楚那部分！

我在论坛上闲逛了一段时间，试图找到答案，我知道你可以告诉 python 读取 CSV 文件的第一行，其中放置了标题（headers = file.readline()）但除此之外我就迷失了。使用 CSV 阅读器可以更轻松地完成此任务吗？

Use the csv module https://docs.python.org/3/library/csv.html将数据拆分为列。使用csv.DictReader()对象，以便更轻松地通过标题选择列：

import csv

source = r'C:\Users\jk\Desktop\helloworld.csv'
dest = 'test.csv'

with open(source, newline='') as inf, open(dest, 'w', newline='') as outf:
    reader = csv.DictReader(inf)
    writer = csv.DictWriter(outf, fieldnames=reader.fieldnames)
    for row in reader:
        words = row['Keyword'].split()
        row['Keyword'] = words[0]
        writer.writerow(row)
        writer.writerows({'Keyword': w} for w in words[1:])

The DictReader()将从文件中读取第一行并将其用作为每行生成的字典的键；所以一行看起来像：

{'Keyword': 'Lions Tigers Bears', 'Source': 'US', 'Number': '3'}

现在，您可以单独处理每一列，并仅使用该列的第一个单词更新字典Keyword为剩余单词生成附加行之前的列。

我假设你的文件是comma分开了。如果需要不同的分隔符，则设置delimiter该角色的参数：

reader = csv.DictReader(inf, delimiter='\t')

用于制表符分隔的格式。有关各种选项，请参阅模块文档，包括称为dialects.

Demo:

>>> import sys
>>> import csv
>>> from io import StringIO
>>> sample = StringIO('''\
... Keyword,Source,Number
... Lions Tigers Bears,US,3
... Dogs Zebra,Canada,5
... Sharks Guppies,US,2
... ''')
>>> output = StringIO()
>>> reader = csv.DictReader(sample)
>>> writer = csv.DictWriter(output, fieldnames=reader.fieldnames)
>>> for row in reader:
...     words = row['Keyword'].split()
...     row['Keyword'] = words[0]
...     writer.writerow(row)
...     writer.writerows({'Keyword': w} for w in words[1:])
... 
12
15
13
>>> print(output.getvalue())
Lions,US,3
Tigers,,
Bears,,
Dogs,Canada,5
Zebras,,
Sharks,US,2
Guppies,,

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

csv

使用 python 3 代码在 CSV 文件中查找特定标头的相关文章

此 TypeError 消息中提到的“代码对象”是什么？

在尝试使用Python时exec声明我收到以下错误 TypeError exec arg 1 must be a string file or code object 我不想传递字符串或文件但什么是代码对象如何创建一个创建代码对象的
使用python查找txt文件中字母出现的次数

我需要从 txt 文件中读取该字母并打印 txt 文件中出现的次数到目前为止我已经能够在一行中打印内容但计数有问题有人可以指导吗 infile open grades txt content infile read for char
稀有对象的 python 类型注释，例如 psycopg2 对象

我了解内置类型但是我如何指定稀有对象例如数据库连接对象 def get connection and cursor gt tuple psycopg2 extensions cursor psycopg2 extensions conn
如何返回 cost, grad 作为 scipy 的 fmin_cg 函数的元组

我怎样才能使 scipy 的fmin cg使用一个返回的函数cost and gradient作为元组问题是有f对于成本和fprime对于梯度我可能必须执行两次操作非常昂贵 grad and cost被计算此外在它们之间共享变量可
Series.sort() 和 Series.order() 有什么区别？

s pd Series nr randint 0 10 5 index nr randint 0 10 5 s Output 1 3 7 6 2 0 9 7 1 6 order 按值排序并返回一个新系列 s order Output 2 0
如何过滤 Pandas GroupBy 对象并获取 GroupBy 对象？

当对 Pandas groupby 操作的结果执行过滤时它返回一个数据帧但假设我想执行进一步的分组计算我必须再次调用 groupby 这似乎有点绕有更惯用的方法吗 EDIT 为了说明我在说什么我们无耻地从 Pandas 文档中窃取
AttributeError：“模块”对象没有属性[重复]

这个问题在这里已经有答案了我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
python 中的 <> 运算符有什么作用？

我刚刚遇到这个here http www feedparser org feedparser py 总是这样使用 if string1 find string2 lt gt 1 pass 什么是 lt gt 运算符这样做为什么不使用通常的
Paste.httpserver 并通过 HTTP/1.1 Keep-alive 减慢速度；使用 httperf 和 ab 进行测试

我有一个基于paste httpserver 的Web 服务器作为HTTP 和WSGI 之间的适配器当我使用 httperf 进行性能测量时如果每次使用 num conn 启动一个新请求我每秒可以执行超过 1 000 个请求如果我使
Plotly：如何检查基本图形结构（版本 4）

对于旧版本的plotly 例如在 Jupyterlab 中您可以简单地运行figure像这样检查你的图形的基础知识 Ouput data marker color red size 10 symbol 104 mode markers l
从 Flask 运行 NPM 构建

我有一个 React 前端我想在与我的 python 后端 API 相同的源上提供服务我正在尝试使用 Flask 来实现此目的但我遇到了 Flask 找不到我的静态文件的问题我的前端构建是用生成的npm run build in s
是否需要关闭没有引用它们的文件？

作为一个完全的编程初学者我试图理解打开和关闭文件的基本概念我正在做的一项练习是创建一个脚本允许我将内容从一个文件复制到另一个文件 in file open from file indata in file read out file
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
使用 PIL 在 Tkinter 中显示动画 GIF

我正在尝试制作一个程序来使用 Tkinter 显示动画 GIF 这是我最初使用的代码 from future import division Just because division doesn t work right in 2 7 4
AWS Lambda 不读取环境变量

我正在编写一个 python 脚本来查询 Qualys API 中的漏洞元数据我在 AWS 中将其作为 lambda 函数执行我已经在控制台中设置了环境变量但是当我执行函数时出现以下错误 module initialization
minizinc python 安装

我通过 anaconda 提示符在 python 上安装了 minizinc 就像其他软件包一样 pip install minizinc 该软件包表示已成功安装我可以导入该模块但是我正在遵循基本示例https minizinc py
rpy2 无法加载外部库

希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包该包以 rJava 作为依赖项 venneuler 和 rJa
如何（安全）将 Python 对象发送到我的 Flask API？

我目前正在尝试构建一个 Flask Web API 它能够在 POST 请求中接收 python 对象我使用 Python 3 7 1 创建请求使用 Python 2 7 运行 API 该 API 设置为在我的本地计算机上运行我试图发
用于插入或替换 URL 参数的 Django 模板标签

有人知道 Django 模板标签可以获取当前路径和查询字符串并插入或替换查询字符串值吗例如向 some custom path q how now brown cow page 3 filter person 发出请求电话 urlpar

随机推荐

jquery load() 的 Javascript 替代品

有人可以给我一个替代 jquery load 的纯 JavaScript 示例吗或者将我指向带有示例的仪式站点谢谢 UPDATE 这不是我想问的我需要使用 Ajax 加载 URL 并将返回的 HTML 插入到 div 中我不太明白缺
如何检查 PL/SQL BEFORE UPDATE 触发器中是否显式指定了列值？

有没有办法告诉 PL SQL 中哪些列被显式更新BEFORE UPDATE扳机例如我要设置 new last modified by USER仅当UPDATE语句没有明确指定该列的值 Use the UPDATING功能 if upda
Chrome 开发者工具“样式”选项卡显示 CSS 定义褪色，为什么？

我已经使用 Chrome 很长时间了但我从来没有我不记得了在样式面板中遇到过褪色的 CSS 定义选择器尚未在其他地方定义 Example 编辑为了清楚起见我不是指用户代理样式表我不明白为什么它会褪色以及这意味着什么该定义似乎
Laravel 表单 html，带有 PUT 路由的 PUT 方法

我的路线中有这个 Domain URI Name Action
使用 twinx 时控制跟踪器

右下角的跟踪器以红色突出显示报告相对于右侧 y 轴的 y 值如何让跟踪器报告相对于左侧 y 轴的 y 值 import matplotlib pyplot as plt import numpy as np np random see
将“django-filter”与 CHOICES 字段一起使用 - 需要“Any”选项

我正在使用非常酷的 django filter 通过 http github com alex django filter http github com alex django filter 要么似乎无法理解文档要么只是需要一点推动
Ruby Regex - 需要替换正则表达式匹配中出现的每个字符

这是我的字符串 mystring Q object1 this is a testyay asdkf asfkd object2 yo ho ho 我要分开mystring在逗号上因此我想暂时去掉转义引号之间的逗号因此我需要匹配转
C++：宏参数中可以有空格吗？

如果我定义一个带有参数的宏如下所示 define define int a int a 并提供一个参数中间有空格如下所示 define int a 并得到输出 int a 有可能的使用 define ASSIGN A B B A 我想
Grafana日志插件不显示日志面板

我正在尝试创建一个支持日志面板的 Grafana 插件我正在关注来自他们网站的路线 https grafana com docs grafana latest developers plugins build a logs data so
突出显示 FlowDocument 中的部分文本

我想突出显示文本中的某些部分FlowDocument根据搜索结果我正在做的是获取搜索词在文本中出现的索引FlowDocument然后在从找到的索引开始到找到的索引搜索词长度结束的文本范围上应用背景颜色 TextRange content
将鼠标悬停在另一个元素上时更改一个元素的类 d3

我有一个图像列表和图像标题列表我希望当我将鼠标悬停在相应的图像上时能够显示标题的悬停状态更改 css 但我不知道如何连接这两个数据我的代码如下我有它这样当您单击顶部数字时信息就会显示在下面
将焦点设置在 Windows 中的控制台上？

是否可以将焦点设置在 Windows 中的控制台应用程序上 SetFocus http msdn microsoft com en us library ms646312 VS 85 aspx看起来很有希望但它需要一个 HWND 而且我不
VARCHAR2 列上的 ResultSet.getString() 返回空字符串

免责声明我实际上对 Oracle 和 Java 都一无所知问题出在其他一些开发人员在某个时间点完成然后离开公司的项目中现在我必须设置网络服务器数据库并使其全部启动并运行代码大约是这样的 OracleDataSource ods n
扩展基元而不对其进行原型设计

我正在开发一个相当丑陋的库它可以让你做一些奇怪的事情有了图表您可以以链式样式映射一组集合并且当您更改整个系统中要改变的值当最终类型是 JS 原语时问题就出现了就我而言在使用值和对象制作图表后我可以执行以下操作 CHAIN
动态添加项目到边框视口

我想首先创建一个空视口布局边框然后向其中添加项目最后渲染并显示但是当我创建视口元素时它抛出一个错误说未捕获的类型错误无法读取未定义的属性 flex 这是我的代码
通过adb授予PACKAGE_USAGE_STATS权限

adb shell pm grant x y z android permission PACKAGE USAGE STATS 这是授予的命令PACKAGE USAGE STATS通过 adb 获得权限但只有当我从未在本机设置中切换此权限
如何使用react-router-dom创建受保护的路由？

如何创建受保护的路由react router dom并将响应存储在 localStorage 中以便用户下次尝试打开时可以再次查看其详细信息登录后他们应该重定向到仪表板页面所有功能都添加到 ContextApi 中代码沙箱链接 C
webpack "--watch" 与 "--hot" ：有什么区别？

使用有什么区别 webpack watch and webpack dev server hot thanks 根据 webpack 文档 https webpack github io docs tutorials getting sta
仅 Vault Enterprise 的 Vault Sidecar 注入器权限被拒绝

我正在尝试探索Vault Enterprise 但当我使用Vault Enterprise时 Sidecar的权限被拒绝但当我尝试使用本地Vault服务器时似乎工作正常这是包含本地保管库的工作示例的存储库保险库边车注射器应用程序 ht
使用 python 3 代码在 CSV 文件中查找特定标头

现在我有Python 3代码它获取CSV文件中的一列数据根据空格将每个单元格中的短语分隔成单独的单词然后将数据导出回新的CSV文件中我想知道是否有一种方法可以告诉 python 仅将格式化代码应用于具有特定标题的特定列这是我的源数

使用 python 3 代码在 CSV 文件中查找特定标头

使用 python 3 代码在 CSV 文件中查找特定标头 的相关文章

随机推荐

热门标签

使用 python 3 代码在 CSV 文件中查找特定标头的相关文章