如何使用 Python 将多个文本文件中的数据提取到 Excel 中？（每张纸一个文件的数据）

2024-06-19

到目前为止，为了让我的代码读取文本文件并导出到 Excel，我有：

import glob

data = {}
for infile in glob.glob("*.txt"):
    with open(infile) as inf:
        data[infile] = [l[:-1] for l in inf] 

with open("summary.xls", "w") as outf:
    outf.write("\t".join(data.keys()) + "\n")
    for sublst in zip(*data.values()):
        outf.write("\t".join(sublst) + "\n")

这样做的目标是访问特定文件夹中的所有文本文件。

但是，当我运行它时，Excel 给出了一个错误：

“无法打开文件，因为：在文档顶层无效。第 1 行，位置 1。outputgooderr.txt outputbaderr.txt。fixed_inv.txt

Note：outputgooderr.txt、outputbaderr.txt.、fixed_inv.txt 是我希望导出到Excel 的文本文件的名称，每张纸一个文件。

当我只有一个文件供程序读取时，它就能够提取数据。不幸的是，这不是我想要的，因为我有多个文件。

请让我知道我可以解决这个问题的任何方法。一般来说，我是编程的初学者，非常感谢任何建议！谢谢。

如果您不反对将输出的 Excel 文件作为 .xlsx 而不是 .xls，我建议您使用Pandas https://pandas.pydata.org/pandas-docs/stable/。尤其pandas.read_csv() https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html and DataFrame.to_excel() https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_excel.html

我提供了一个完全可重现的示例，说明您可以如何执行此操作。请注意，我在前 3 行中创建了 2 个 .txt 文件用于测试。

import pandas as pd
import numpy as np
import glob

# Creating a dataframe and saving as test_1.txt/test_2.txt in current directory
# feel free to remove the next 3 lines if yo want to test in your directory
df = pd.DataFrame(np.random.randn(10, 3), columns=list('ABC'))
df.to_csv('test_1.txt', index=False)
df.to_csv('test_2.txt', index=False)

txt_list = [] # empty list
sheet_list = [] # empty list

# a for loop through filenames matching a specified pattern (.txt) in the current directory
for infile in glob.glob("*.txt"): 
    outfile = infile.replace('.txt', '') #removing '.txt' for excel sheet names
    sheet_list.append(outfile) #appending for excel sheet name to sheet_list
    txt_list.append(infile) #appending for '...txt' to txtt_list

writer = pd.ExcelWriter('summary.xlsx', engine='xlsxwriter')

# a for loop through all elements in txt_list
for i in range(0, len(txt_list)):
    df = pd.read_csv('%s' % (txt_list[i])) #reading element from txt_list at index = i 
    df.to_excel(writer, sheet_name='%s' % (sheet_list[i]), index=False) #reading element from sheet_list at index = i 

writer.save()

输出示例：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Excel

openpyxl

如何使用 Python 将多个文本文件中的数据提取到 Excel 中？（每张纸一个文件的数据）的相关文章

在时间序列线图上绘制点

我有这个数据框我想绘制它的线图正如我所绘制的 Graph is 生成的代码是 fig ax plt subplots figsize 15 5 date time pd to datetime df Date df df set ind
Selenium AttributeError：列表对象没有属性 find_element_by_xpath

我正在尝试从网站上抓取一些营养数据到目前为止一切似乎都进展顺利直到我遇到格式略有不同的页面使用 selenium 和这样的行返回一个空列表 values browser find elements by class name siz
Python/Pandas –– ParserError：标记数据时出错。 C 错误：第 i 行中预期有 x 字段，但看到了 y

我需要一些帮助我正在使用以下代码 matplotlib inline import csv from datetime import datetime import numpy as np import pandas as pd from
如何融化数据框以获取范围内的所有日期？

我有一个这样的数据集 import pandas as pd pd DataFrame col1 1 2 start date 1 3 2019 1 10 2019 end date 1 5 2019 1 12 2019 我想为开始日期和结
在 Pycharm 中使用 scikit-learn 未解析的属性引用“predict()”

当使用 scikit learn 中的决策树分类器时 docs http scikit learn org stable modules tree html展示您将存储分类器的变量重新分配给其自身的输出调用fit method clf t
从 Windows 文件系统中的任何位置运行 python 脚本

我已经实现了一些实用程序来满足我的需要以使用 Python 简化开发需要多个 py文件和一些额外的 template文件重命名 txt file 我希望能够从文件系统中的任何位置使用此实用程序例如如果我当前位于某个文件夹中我想运
Celery未注册任务KeyError

我通过在终端中执行以下命令来启动工作程序 celery A cel test worker loglevel INFO concurrency 10 n worker1 h 然后我收到一条长循环错误消息指出 celery 已收到未注册的任
Numpy、Python：广播时自动扩展数组维度

考虑以下 Numpy 数组广播练习 import numpy as np v np array 1 0 2 0 T column array A2 np random randn 2 10 2D array A3 np random ran
将行转换为 pandas 中逗号分隔的字符串

我有一个熊猫数据框 from pandas import DataFrame import pandas as pd df2 DataFrame a one one two two three two one six b x y z y x
没有实例的 Django Formset

In this http docs djangoproject com en dev topics forms modelforms inline formsetsDjango Doc 解释了如何创建一个表单集该表单集允许您编辑属于特定作
如何从sqlalchemy中的select语句创建新表？

我正在使用 sqlalchemy 的核心功能来编写一些抽象层该层本身需要能够从 select 语句创建表示例代码 metadata MetaData bind engine table Table table name metadata
无法为从图中加载的张量变量赋值

我已经训练了一个模型并保存了它现在我试图了解权重扰动如何影响其准确性因此我需要修改权重变量中保存的值本质上会为其添加一些噪声问题是加载它们后我无法为它们分配值我正在使用 TensorFlow 版本 1 2 1 来训练和加载模型
如何在没有任何数据行的情况下读取 Excel 表/ListObject 中的计算列的公式

我有一个以外部查询作为数据源的 ListObject 它返回 18 列 ListObject 之前已添加了额外的 4 个计算列现在 ListObject 有 0 个数据行但是虽然有 0 个数据行但我似乎无法读取计算列的预定义公式如
转换为 Base 64 时，TypeError: 'str' 不支持缓冲区接口 [重复]

这个问题在这里已经有答案了 im Image open filePath load image self msg str bytearray list im getdata convert image data to string enco
安装/编译 pylzma（lzma python 绑定）

我已经向作者提出了这个问题website http www joachim bauch de projects pylzma comment page 1 comment 5211 但我想我也可以在这里问我一直在尝试使用以下设置安装 py
Scipy - 求矩阵列空间的基数

我正在尝试编写一个简单的单纯形算法其第一步是找到一个基本的可行解决方案选择 A 的线性独立列的一组 B 将 x 中与不在 B 中的列相对应的所有分量设置为零求解 m 个所得方程以确定 x 的分量这些是基本变量我知道解决方案将涉及使
使用 spaCy 添加多个 EntityRuler（ValueError：'entity_ruler' 已存在于管道中）

下列link https stackoverflow com questions 57477852 spacy matcher with entities spanning more than a single token展示如何在实体跨越
致命Python错误：init_import_size：无法在Anaconda Prompt中导入站点模块

当我启动 Anaconda Prompt 时收到以下错误消息致命 Python 错误 init import size 无法导入站点模块 Python运行时状态已初始化回溯最近一次调用最后一次文件 C Users blue App
创建将一把小提琴按色调分割的小提琴图的正确方法是什么？

创建将一把小提琴分开的小提琴图的正确方法是什么hue 我尝试了不同的方法似乎唯一的方法是创建一个为数据集中的每个条目共享相同值的功能并将该功能的名称传递为x fig plt figure figsize 20 8 fig add sub
编写适用于 ndarray 和 MaskedArray 的通用数值函数的最佳实践

有没有比以下更漂亮的方式 import numpy as np from numpy import ma def foo x pkg ma if isinstance x ma MaskedArray else np return pkg

随机推荐

如何在 PHP 中比较两个数组并列出差异？

我正在构建一个表单来执行以下操作打印从 MySQL 获取的用户和权限表用户拥有的每一项权限都是一个复选框而他们缺少的每一项权限都是一个未选中的复选框允许管理员选中和取消选中复选框以授予或删除权限提交表单后显示一个确认页面其中仅
我可以依赖 ES6 `Symbol` 的字符串表示形式吗？

我正在开发一个 ES6 应用程序它通过网络发送一些数据其中一部分涉及作为 ES6 实现的标识符Symbols 例如 const FOO Symbol foo Calling Foo toString yields Symbol foo
如何正确使用fork、exec、wait

我正在编写的 shell 需要执行用户提供给它的程序这是我的程序的非常简短的简化版本 int main pid t pid getpid this is the parents pid char user input NULL size
任何使用 hibernate 、 DI 、 AOP 的 spring MVC 示例应用程序 [重复]

这个问题在这里已经有答案了可能的重复 Spring MVC 示例 Web 应用程序 https stackoverflow com questions 777946 spring mvc sample web app 我为 spring
java.lang.IllegalStateException（onSaveInstanceState后无法执行此操作）

我在不同的情况下收到此错误并显示以下消息活动已被破坏并且 onSaveInstanceState 之后无法执行此操作我正在编写一个应用程序其中两个 Activity 相互交互活动 A launch 活动 B使用意图这活动 B班级有
检查对象是否更改的最佳实践是什么？

我需要知道如何检查对象是否发生更改基本上我需要一个名为 TrackChanges 的属性当我将其设置为 true 一次并且如果该对象中的任何数据被更改时同一对象上的方法 IsObjectChanged 可以返回 true 您是否曾
如何从文件中读取两行并在 for 循环中创建动态键，后续

这个问题紧接着所讨论的问题如何从文件中读取两行并在 for 循环中创建动态键 https stackoverflow com q 41929351 868546 但是问题的本质已经发展到我想要解决的某种复杂性下面是我的数据结构用空格
如何在Go中将字节数组转换为字符串[重复]

这个问题在这里已经有答案了 byte字符串会引发错误 string byte n 也会引发错误顺便说一下例如文件名的 sha1 值是字符串它是否明确需要 utf 8 或任何其他编码集谢谢我用来转换的最简单方法byte to st
如何通过 JNI 从 Android 中的信号处理函数调用 Java 函数

我的目标是将信号从内核发送到在用户空间中运行的 Android 服务收到此信号后服务应该向内核发出 IOCTL 回调通过 ioctl 调用从内核获取数据后它必须显示给用户为此我从 Java 服务调用本机方法该方法注册 siga
你能用 C# 编写一个同样优雅的排列函数吗？

我非常喜欢这个 6 行解决方案并尝试在 C 中复制它基本上它会排列数组的元素 def permute xs pre if len xs 0 yield pre for i x in enumerate xs for y in perm
如何导航到 Angular 7 中的锚点

我已经在routingModule和所有路径中启用了anchorScrolling 但是当我单击链接时没有任何反应 nav bar component html div class sidenav a href class closeBtn
在 CSHTML 页面中实现 switch 语句

我正在尝试做一些不同的事情我有一个包含 ID 的视图根据 Id 的值我想更改显示的标题就像是 switch id case test h1 Test Site h1 case prod h1 Prod Site h1 break 我
为每列指定不同的 float_format（科学记数法与小数精度）

我有多个列有些我想要科学记数法其他的则需要特定级别的小数精度 Frequency n 0 0 0023 2 3 1 0 0420 4 5 2 0 5460 6 7 3 0 1230 8 9 频率可以有很小的数量级所以我最终得到了十亿个
tomcat 7上部署war时出现死循环

我尝试将战争部署到 Tomcat 7 0 29 中我有以下日志堆栈 GRAVE Error waiting for multi thread deployment of context descriptors to complete ja
如何按日期对包含通过合并 get_posts 结果创建的 WP post 对象的数组进行排序？

我想通过合并 2 个单独的帖子的结果来创建单个帖子数组get posts查询并按发布日期对数组进行排序在我下面的代码中 get posts 为 args b and args a已合并为一个数组但它们是分开的的 9 个标题 args
机器学习鸡尾酒会音频应用

我对这篇文章有一个疑问鸡尾酒会算法 SVD 实现用一行代码 https stackoverflow com questions 20414667 cocktail party algorithm svd implementation i
通过 css 或 javascript 查找当前工作浏览器是否为 safari

我研究了如何识别浏览器是否是 Safari 在javascript window devicePixelRatio对于 chrome 和 safari 对象都给出 1 在CSS media screen and webkit min dev
JUnit 崩溃说方法应该是静态的，然后崩溃说它不应该？

我正在尝试在 JUnit 中进行一个简单的示例测试测试两件事然后进行拆卸 import org junit public class TestFoobar Test public void testOneThing Code that
GCD 和线程

我想了解一些有关 GCD 和线程的知识我的视图控制器中有一个 for 循环它要求我的模型执行一些异步网络请求因此如果循环运行 5 次模型将发出 5 个网络请求考虑到我正在使用 NSURLConnection 的 sendAsyn
如何使用 Python 将多个文本文件中的数据提取到 Excel 中？（每张纸一个文件的数据）

到目前为止为了让我的代码读取文本文件并导出到 Excel 我有 import glob data for infile in glob glob txt with open infile as inf data infile l 1 fo

如何使用 Python 将多个文本文件中的数据提取到 Excel 中？ （每张纸一个文件的数据）

如何使用 Python 将多个文本文件中的数据提取到 Excel 中？ （每张纸一个文件的数据） 的相关文章

随机推荐

热门标签

如何使用 Python 将多个文本文件中的数据提取到 Excel 中？（每张纸一个文件的数据）

如何使用 Python 将多个文本文件中的数据提取到 Excel 中？（每张纸一个文件的数据）的相关文章