【Python】pandas合并多个CSV表,去重表头

2023-05-16

我们有三个子表,每个表都有表头但是没有每行的索引,每一个表在csv文件中结构如下:

name,age
x,65
y,77
z,10

通过Pandas打开 data = pd.read_csv(r'test.csv'),默认会加上行索引,并且第一行为列索引

  name  age
0    x   65
1    y   77
2    z   10

data = pd.read_csv(r'test.csv',header=None),将列索引置为空则会再次补充表头

      0    1
0  name  age
1     x   65
2     y   77
3     z   10

正常的合并会导致以下情况:


name,age
x,65
y,77
z,10
name,age
x,65
y,77
z,10
name,age
x,65
y,77
z,10  

因此在我们合并时,希望做到的是只保存一个表头,不添加行索引。但是通过df.drop_duplicates()去重对读入的表头只能去掉一个,因为作为表头的那一行不会进行匹配。

代码整理如下

import pandas as pd
import glob

def hebing(csv_list, outputfile):
    for inputfile in csv_list:
        f = open(inputfile)
        data = pd.read_csv(f)
        data.to_csv(outputfile, mode='a', index=False)
    print('完成合并')

def quchong(file):
    df = pd.read_csv(file, header=None)
    datalist = df.drop_duplicates()
    datalist.to_csv('result_new.csv', index=False, header=False)
    print('完成去重')

if __name__ == '__main__':
    csv_list = glob.glob('*.csv')
    output_csv_path = 'result.csv'
    print(csv_list)
    hebing(csv_list, output_csv_path)
    quchong(output_csv_path)

结果


name,age
x,65
y,77
z,10
x,6
y,7
z,1
x,650
y,770
z,100
  
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【Python】pandas合并多个CSV表,去重表头 的相关文章

  • 第三方登录之数据库设计

    第三登录之数据库设计 现在很多网站和应用都会接入第三方登录来减少用户注册 xff0c 即方便又快捷 比如说qq登录 xff0c 微信 xff0c 新浪微博等方式 关于第三方登录数据库设计 xff0c 涉及到2张表的设计 xff0c 一张用户
  • 51单片机的定时器/计数器

    7 2 2 定时器 计数器的结构 51单片机的定时器 计数器结构如图7 7所示 T0由特殊功能寄存器TH0 TL0构成 T1由特殊功能寄存器TH1 TL1构成 T0 和T1都具有定时器和计数器两种工作模式 xff0c 4种工作方式 xff0
  • 汇编指令控制单片机LED灯

    一 点亮LED灯 简单的对P1口进行操作就可以了 代码 xff1a ORG 0000H AJMP MAIN ORG 0100H MAIN MOV P1 0FEH 点亮LED1 AJMP MAIN END 二 延时控制流水灯 延时程序生成 x
  • <数据结构> 顺序表

    目录 一 顺序表介绍 二 准备工作 1 创建顺序表 2 初始化顺序表 3 检测是否需要扩容 4 销毁顺序表 5 打印顺序表 三 四大功能 1 增加数据 头插 尾插 指定下标插入 2 删除数据 头删 尾删 指定下标删除 3 查找数据 4 修改
  • Python实现--使用微信定时每天和女友发送定制消息(附代码教程)

    但凡有些事情重复时 xff0c 我就在想怎么可以用程序来自动化 这里想分享如何每天给女友定时微信发送 晚安 xff0c 如果只是晚安 xff0c 就略显单调 xff0c 于是爬取金山词霸每日一句 xff0c 英文和翻译 xff0c 借此设定
  • 容器(ubuntu20.04)开启远程桌面rdp(显示xterm和xclock)(下)

    docker pull chanhyeok sshd ubuntu20 04 root 64 fv az844 904 tmp docker images grep sshd ubuntu20 04 chanhyeok sshd ubunt
  • Python3 函数

    1 函数 1 1函数概念 函数 function 是将具有独立功能的代码块组织成为一个整体 xff0c 使其具有特殊功能的代码集 1 2 函数的作用 使用函数可以加强代码的复用性 xff0c 提高程序编写的效率 1 3 无参数函数语法格式
  • iphone6 修改版本&&iccid解锁

    原创文章 转载请备注 https blog csdn net qq 29173507 article details 104881386 设备 xff1a iphone6卡贴机 IOS12 4 9版本 US SM运营 流程 xff1a 越狱
  • 小米空气净化器2S换pm2.5传感器风扇

    原创文章 转载请备注 https blog csdn net qq 29173507 article details 111466293 设备 小米空气净化器2s 问题 pm2 5的数值显示为0不变 传感器异常 18年年底买了一台净化器 冬
  • vscode插件的使用highlight-words

    highlight words 高亮插件 xff0c 挺好用的 插件管理的搜索框查找并安装该插件即可 插件说明也要看一下哦 原创文章 转载请备注 https blog csdn net qq 29173507 article details
  • c语言程序的编译过程

    操作系统 xff1a ubantu 工具gcc 文件 test c abner 64 DESKTOP M6D2HEN mytest cat test c include lt stdio h gt define MAXC 3 define
  • C语言关键字_record

    重要关键字 涉及流程和单数据类型的关键字 xff0c 功能一般都比较简单 xff0c 在使用过程中很快就会熟悉 下列关键字相对前者来说 xff0c 功能较多 xff0c 值得好好学习 extern 实现外部链接 修饰符extern用在变量或
  • gcc -D选项 宏定义

    用法 Dname 定义宏name 默认定义内容为字符串 1 Dname 61 defn 定义宏name xff0c 并且内容为defn C语言中使用 define来定义宏 xff0c gcc也可以定义宏给源代码使用 不过gcc D选项就简陋
  • 程序员的自我修养--看书总结(更新ing)

    对从事linux平台相关开发的程序员 xff0c 或者是底层编译链接感兴趣的人 xff0c 程序员的自我修养 是很值得看的一本中文书 正如书的副标题 xff0c 链接 装载与库 是主要的内容 挑了书中感兴趣的部分 linux平台相关内容 x
  • 关于C语言中自增和自减运算符的使用及注意事项

    43 43 是自增运算符 xff0c 是单目运算符 xff0c 其作用是使单个变量的值增1 它有两种使用情况 xff1a 1 xff09 前置 xff1a 43 43 i xff0c 先执行i 61 i 43 1 再使用i值 xff1b 2
  • 面试题record

    线程 和 进程 联系和区别 线程的同步和互斥 各种锁的相关信息 死锁的总结要写一下 进程的通讯 进程序的内容空间 xff0c 进程空间相关的内容 编译链接相关知识 C 语言提供了多种预处理功能 xff0c 如宏定义 文件包含 条件编译等 合
  • 解决Debian终端无法正常显示中文的问题

    1 安装locales span class token function apt span span class token function install span locales y 2 添加配置 dpkg reconfigure
  • 使用nano时怎么保存退出的问题

    使用多点机器人X 2平台 xff0c 在ros机器人端 xff0c 对文件进行修改保存时 xff0c 用到nano编辑器 xff0c 修改后保存修改并退出的方法 xff1a 以修改 launch 文件为例 xff1a 打开并修改文件 xff
  • abaqus开发问题

    abaqus使用子程序vs2013和ivf2013一直关联不上 xff0c 怎么破
  • java10进制数和16进制数字相互转换

    1 将java10进制数字转换为16进制 String hex 61 Integer toHexString numb 2 将java 16进制字符转换为10进制数 BigInteger bigint 61 new BigInteger h

随机推荐

  • linux下fcitx部分窗口无效的问题解决

    问题描述 linux下部分窗口切换输入法正常 xff0c 部分窗口切换输入法没有效果 xff0c 无法输入中文 xff0c 使用的是fcitx 问题原因 fcitx未安装好 xff0c 需要再安装fcitx gtk2或者fcitx gtk3
  • 【opencv 学习】使用tesseract-ocr机芯数字识别

    今天学习 tesseract ocr开源库的使用 xff0c 这是个开源的能够识别多语言文字的库 下面是在Windows上安装的步骤 1 xff1a 下载软件 xff0c 选择最新的版本安装 https github com UB Mann
  • 在idea中使用findbugs工具

    目录 一 首先需要在idea内部搜索findbugs工具 xff0c 进行安装 二 自己下载findbugs xff0c 安装到Idea中 xff0c 进行使用 三 find sec bugs安全规则组件的应用 xff0c 在二的步骤中提供
  • linux实现Tomcat的定时重启

    还是吃了能力的亏 xff0c 因为很少写shell脚本 xff0c 导致一个很简单的问题困扰 1 shell脚本 如果不会写的 xff0c 百度下来的脚本 xff0c 单独执行没有任何问题 xff0c 但是一旦通过定时任务去执行的话 xff
  • rt-thread tcp服务器 多客户端连接

    1 tcp 服务端测试 我们从rt thread 源码中的example 文件夹可以找到一个名为tcpserver c 的文件 我们按照官网说明 添加此文件拖进项目中去 即可实现tcpserver 测试功能 参考链接 stm32f429网络
  • C++后端开发——POSIX网络API解析

    网络中进程之间如何通信 xff1f 本地的进程间通信 xff08 IPC xff09 有很多种方式 xff0c 但可以总结为下面4类 xff1a 消息传递 xff08 管道 FIFO 消息队列 xff09 同步 xff08 互斥量 条件变量
  • win11右键菜单怎么修改 Windows11修改右键菜单为win10风格的步骤方法

    有很多朋友升级到win11系统之后不是特别喜欢右键菜单 xff0c 因为经常需要多点击一次显示更多选项 xff0c 很不舒服 大家就想知道如何修改回原来win10的右键菜单 xff0c 其实还是有方法的 xff0c 除了使用软件以外 xff
  • win11WiFi无法连接网络怎么办 Windows11WiFi无法连接网络的解决方法

    最近不是win11系统出来了吗 很多小伙伴在体验win11系统的过程种 经常会遇到各种各样的问题 比如win11wifi无法连接网络 那么win11wifi无法连接网络怎么办呢 下面小编就给大家带来win11wifi无法连接网络的解决方法
  • Win11更改声音输出设备的方法

    如果您的计算机连接了多个输出设备 xff0c 为了方便切换 xff0c 有什么简单便捷的方法吗 xff1f 下面小编就给大家带来4种不同的更换方法 xff0c 希望对您有所帮助 更多系统教程尽在小白系统重装官网 单击由 Wi Fi 图标 扬
  • Win11热点连接成功但没网?Win11移动热点和网络冲突的解决方法

    Win11热点连接成功但没网怎么办 xff1f 出现这样的情况多半是更新了系统补丁KB5014697后 xff0c 其具体表现为打开移动热点 xff0c 使移动设备连接到计算机开启的移动热点后 xff0c 计算机的浏览器无法打开网页 xff
  • Win11暂停更新点不了怎么办?Win11暂停更新是灰色的如何解决?

    Win11暂停更新点不了怎么办 xff1f Win11暂停更新是灰色的如何解决 xff1f 有很多朋友发现了这个情况 xff0c 原先自己设置了暂停更新 xff0c 但是等到突然某一天系统就会开始更新 xff0c 这时用户想要再点暂停更新就
  • Win11玩绝地求生(PUBG)崩溃怎么办?Win11玩绝地求生崩溃解决方法

    绝地求生 xff08 PUBG xff09 是一款非常有趣射击类游戏 xff0c 哪怕升级Win11系统也有很多小伙伴都在体验 xff0c 但有不少小伙伴在Win11系统更新完之后发现经常会出现崩溃或者闪退的情况 xff0c 很多小伙伴不清
  • 重装系统后没声音如何解决

    重装系统之后不少用户总是遇到各种各样的问题 xff0c 例如说电脑重装系统后没声音 xff0c 却不知道应该怎么解决 今天 xff0c 我们就来看看重装系统后没有声音怎么办的解决方法 工具 原料 xff1a 系统版本 xff1a windo
  • OpenStack之Region、Available Zone、Host Aggregates

    OpenStack之Region Available Zone Host Aggregates 亚马逊AWS是公共云计算的先驱 xff0c 一些云计算中重要的产品设计和基础概念可以说都是亚马逊引入的 这其中有两个非常重要的概念 xff1a
  • idea安装copilot

    目录 1 申请资格 2 安装插件 3 使用Copilot 现在已经要收费了 xff0c 申请资格变成购买了 10美金一个月 不过如果是学生的话可以进行学生认证 xff0c 使用学生认证来免费使用 非学生的话如果想要使用可以搞个github学
  • 【Leetcode】342. Power of Four(二进制计算)(判定是否为4的幂次方)

    Given an integer signed 32 bits write a function to check whether it is a power of 4 Example 1 Input 16 Output true Exam
  • signal 11 (SIGSEGV), code 1 (SEGV_MAPERR), fault addr 0xc

    span class hljs number 02 span span class hljs subst span span class hljs number 02 span span class hljs number 00 span
  • 【剑指offer】数字在排序数组中出现的次数

    统计一个数字在排序数组中出现的次数 解题思路 xff1a 遍历查找不是本题的最优解 xff0c 既然给出的是有序数组 xff0c 所以我们只需要找到目标的左侧和右侧的索引即可 所以我们可以找到本数组当中key 43 0 5和key 0 5的
  • 【剑指offer】栈的压入、弹出序列(Python中List模拟栈队列操作)

    题目描述 输入两个整数序列 xff0c 第一个序列表示栈的压入顺序 xff0c 请判断第二个序列是否可能为该栈的弹出顺序 假设压入栈的所有数字均不相等 例如序列1 2 3 4 5是某栈的压入顺序 xff0c 序列4 5 3 2 1是该压栈序
  • 【Python】pandas合并多个CSV表,去重表头

    我们有三个子表 xff0c 每个表都有表头但是没有每行的索引 xff0c 每一个表在csv文件中结构如下 xff1a name age x 65 y 77 z 10 通过Pandas打开 data 61 pd read csv r 39 t