如何追加多个文本文件并将每个文件名放入 pandas 的新列中？

2024-02-29

我有很多*.txt文件夹中的文件，每个文件具有相同的结构：每个文件中的四列相同，但行数不同。

1.txt
  0.00781238   0.00082577   0.00781238  -0.03314453
  0.01562476   0.00064219   0.01562476  -0.03145172
  0.02343713  -0.00105686   0.02343713  -0.03775329
  0.03124951  -0.00016571   0.03124951  -0.00232971
  0.03906189   0.00240464   0.03906189   0.04244080

2.txt
  0.00781238  -0.00409547   0.00781238  -0.01004241
  0.01562476   0.00239794   0.01562476   0.03342835
  0.02343713  -0.00112586   0.02343713   0.00152711
  0.03124951   0.00374492   0.03124951   0.03581025
  0.03906189   0.00124744   0.03906189  -0.01969909
  0.04687427   0.00192426   0.04687427   0.05292329
  0.05468665   0.00266910   0.05468665   0.02569642

以及更多 1 到 65 的 txt 文件。

我想要这样的结果

Samplename   value1       value2       value3       value4  
1.txt        0.00781238   0.00082577   0.00781238  -0.03314453
1.txt        0.01562476   0.00064219   0.01562476  -0.03145172
1.txt        0.02343713  -0.00105686   0.02343713  -0.03775329
1.txt        0.03124951  -0.00016571   0.03124951  -0.00232971
...            
2.txt
2.txt
...
65.txt

使用 os.walk 查找文件，然后连接从每个文件创建的各个数据帧：

import pandas as pd
import os

txtfolder = r'/home/bera/Desktop/textfiles/' #Change to your folder path

#Find the textfiles
textfiles = []
for root, folder, files in os.walk(txtfolder):
    for file in files:
        if file.endswith('.txt'):
            fullname = os.path.join(root, file)
            textfiles.append(fullname)
textfiles.sort() #Sort the filesnames

#Read each of them to a dataframe
for filenum, file in enumerate(textfiles, 1):
    if filenum==1:
        df = pd.read_csv(file, names=['value1','value2','value3','value4'], delim_whitespace=True)
        df['Samplename']=os.path.basename(file)
    else:
        tempdf = pd.read_csv(file, names=['value1','value2','value3','value4'], delim_whitespace=True)
        tempdf['Samplename']=os.path.basename(file)
        df = pd.concat([df, tempdf], ignore_index=True)
        
df = df[['Samplename','value1','value2','value3','value4']] #Reorder columns

#    Samplename    value1    value2    value3    value4
# 0       1.txt  0.007812  0.000826  0.007812 -0.033145
# 1       1.txt  0.015625  0.000642  0.015625 -0.031452
# 2       1.txt  0.023437 -0.001057  0.023437 -0.037753
# 3       1.txt  0.031250 -0.000166  0.031250 -0.002330
# 4       1.txt  0.039062  0.002405  0.039062  0.042441
# 5       2.txt  0.007812 -0.004095  0.007812 -0.010042
# 6       2.txt  0.015625  0.002398  0.015625  0.033428

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

file

Text

如何追加多个文本文件并将每个文件名放入 pandas 的新列中？的相关文章

如何迭代按值排序的 Python 字典？

我有一本字典比如 a 6 b 1 c 2 我想迭代一下by value 不是通过键换句话说 b 1 c 2 a 6 最直接的方法是什么 sorted dictionary items key lambda x x 1 对于那些讨厌 la
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
如何使用 imaplib 获取“消息 ID”

我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好所以我认为 Message ID 是正确的但我不知道如何获取它我只知道 imap fetch uid XXXX 有人有解决方案吗来自 IMAP 文档本身 IMAP4消息号
Django 模型在模板中不可迭代

我试图迭代模型以获取列表中的第一个图像但它给了我错误即模型不可迭代以下是我的模型和模板的代码我只需要获取与单个产品相关的列表中的第一个图像模型 py class Product models Model title models
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
获取给定类文件的目录路径

我遇到的代码尝试从类本身的 class 文件所在的同一目录中读取一些配置文件 File configFiles new File this getClass getResource getPath listFiles new Filenam
如何从Python中的字符串中提取变量名称和值

我有一根绳子 data var1 id 12345 name John White python中有没有办法将var1提取为python变量更具体地说我对字典变量感兴趣这样我就可以获得变量的值 id和name python 这是由提供
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
Seaborn Pairplot 图例不显示颜色

我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常但由于某种原因图例不会显示相关的颜色我无法找到解决方案因此如果有人有任何建议请告诉我 x sns pairplot stats2 hue
如何删除文件

我们有一个脚本 scripts ourscript php和一个文件 media movie1 flv 当我们运行时我们如何删除这个文件ourscript php Using unlink http php net manual en f
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
将名称字符串编码为唯一的数字

我有一大堆名字数以百万计他们每个人都有一个名字一个可选的中间名和一个姓氏我需要将这些名称编码为唯一代表这些名称的数字编码应该是一对一的即一个名称只能与一个数字相关联一个数字只能与一个名称相关联对此进行编码的明智方法是什么我
如何在 OSX 上安装 numpy 和 scipy？

我是 Mac 新手请耐心等待我现在使用的是雪豹 10 6 4 我想安装numpy和scipy 所以我从他们的官方网站下载了python2 6 numpy和scipy dmg文件但是我在导入 numpy 时遇到问题 Library F
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
具有自定义值的 Django 管理外键下拉列表

我有 3 个 Django 模型 class Test models Model pass class Page models Model test models ForeignKey Test class Question model M
字典和数组作为类变量与实例变量

这是赚取积分的简单方法请解释以下内容 class C a b 0 c def init self self x def d self k v self x k v self a k v self b v self c append v d

随机推荐

在毕加索中加载实际图像之前模糊缩略图

我正在使用 picasso 显示来自 URL 的图像我在加载实际图像之前先显示缩略图我想模糊该缩略图我如何在 picasso 中实现这是我的源代码 pb setVisibility View GONE Picasso with ge
根据打字稿函数中的另一个参数限制一个参数的类型

interface INavigation children string initial string function navigation children initial INavigation return null 我有一个类似
Java 中的 StAX XML 格式化

是否可以使用 StAX 特别是 woodstox 使用换行符和制表符格式化输出 xml 即采用以下形式
sbt 0.13.8 URI 有一个权限组件

在 sbt 项目中运行 sbt 时出现此错误我有 JDK 8 和 sbt 0 13 8 我可以毫无问题地运行 activator 命令但我需要 sbt 工作因为我的 IDE IntelliJ IDEA 使用它来加载项目 E work
ebean 和 play 框架中的复合键

我刚刚开始使用 Play 框架完成教程涵盖基本功能后我尝试在数据库和游戏之间设置连接我的一个关系有模式 CREATE TABLE IF NOT EXISTS shop CatPath parentC INT NOT NULL ch
即使使用 sudo，也无法以 +x 权限执行脚本文件

我无法从已安装的分区运行脚本我创建了一个基本的 Hello World 脚本可以从我的主目录正常执行但是当我将其移动到已安装的分区时我无法执行该文件 ls l rwxr xr x 1 user user 31 Mar 4 21 33
-1103错误域= NSURLErrorDomain代码= -1103“资源超出最大大小”iOS 13

当 iOS 13 上的响应较大 14kb 时我们会遇到以下网络错误 1103 Error Domain NSURLErrorDomain Code 1103 resource exceeds maximum size 由于我们使用 Ala
ExtJS 中自动调整文本字段标签大小

在 ExtJS 中是否可以将文本字段的标签调整为最佳大小以使其文本适合一行 The labelWidth http docs sencha com extjs 4 1 1 api Ext form Labelable cfg labelW
按字母顺序搜索名称的查询

我已经用过LIKE条件但它要求我将全名输入数据库才能找到名称 if searchby equals Name try Class forName sun jdbc odbc JdbcOdbcDriver System out printl
即使忘记了“new”，我什么时候应该自动创建一个对象？

假设我有以下对象构造函数 function Foo bar this bar bar 如果我在全局范围内运行该函数而不使用new关键字然后bar将被设置在任何范围内Foo 被称为 var foo Foo 42 console log bar
为什么C风格的注释会让insert语句运行两次？

长话短说我开始遇到 ORA 00001 主键违规我追踪到这个问题因为我的一些INSERT INTO语句运行了两次然后我发现有问题的命令之后有一个 C 风格的注释 WHENEVER SQLERROR EXIT FAILURE SET
有没有办法像 withCString 一样链接函数？

有没有办法链接像这样的函数withCString 我的意思是任何函数看起来像f Foo gt CFoo gt IO a gt IO a 例如假设有一个函数cFunc CString gt CFoo gt CBar gt IO 通常我会
用于确保 shell 脚本在任何给定时间仅运行一个实例的 Shell 片段 [重复]

这个问题在这里已经有答案了可能的重复确保一次只运行一个 shell 脚本实例的快速而肮脏的方法 https stackoverflow com questions 185451 quick and dirty way to ensure
每秒写入文件数

我想将访问率较高的网站的访问记录下来并存档每秒可以对日志文件执行多少写入如果您无法使用 Analytics 为什么不使用网络服务器现有的日志系统呢如果您使用的是真正的网络服务器那么它几乎肯定是一种已经针对最大吞吐量进行了优化的日志记
CollisionBitMask 如何工作？ Swift/SpriteKit

据我所知物理体的默认设置是当它们相互碰撞时会相互弹开直到您将它们的碰撞位掩码设置为相同的数字然而由于我相信碰撞位掩码我在完成看起来应该非常简单的事情时遇到了一个巨大的问题 let RedBallCategory UInt32 0x
订阅主题的 Angular HTTP 调用关闭主题

我有两个可以获取给定对象的服务用于获取完整列表的初始 HTTP 调用以及用于实时更新新元素的 Websocket 通知我想将这两个调用连接到同一个可观察对象以便显示页面不了解后端有这样的电话 private getInitialD
UIWebView：禁用富文本编辑器的复制/剪切选项

我有一个带有 contentEditable div 的 UIWebView 来实现某种富文本编辑器一旦用户选择任何文本片段我需要修剪 UIMenuController 中出现在 Web 视图中的复制和剪切选项网络上似乎有很多解决方案
hive 0.14 更新和删除查询配置错误

在阿帕奇中hive 0 14我们可以通过支持更新和删除查询ACID配置 hive configuration hive support concurrency true hive enforce bucketing true hive ex
在Qt中获取本地IP地址

有没有跨平台的方法来获取本地IP地址即看起来像192 168 1 49 使用Qt的计算机我想为 Symbian 手机创建一个 FTP 服务器并且想显示 FTP 客户端应连接的 IP 地址 Use QNetworkInterface a
如何追加多个文本文件并将每个文件名放入 pandas 的新列中？

我有很多 txt文件夹中的文件每个文件具有相同的结构每个文件中的四列相同但行数不同 1 txt 0 00781238 0 00082577 0 00781238 0 03314453 0 01562476 0 00064219 0 0

如何追加多个文本文件并将每个文件名放入 pandas 的新列中？

如何追加多个文本文件并将每个文件名放入 pandas 的新列中？ 的相关文章

随机推荐

热门标签

如何追加多个文本文件并将每个文件名放入 pandas 的新列中？的相关文章