如何将 pandas 数据框的多行标题合并到单个单元格标题中？

2024-01-07

我有一个来自 Excel 文件的 pandas DataFrame，其标题分为多行，如下例所示：

    0           1       2       3           4           5           6           7
5   NaN         NaN     NaN     NaN         NaN         NaN         NaN         Above
6   Planting    Harvest NaN     Flowering   Maturity    Maturity    Maturity    ground
7   date        date    Yield   date        date        date        date        biomass
8   YYYY.DDD    YYYY.DDD(kg/ha) YYYY.DDD    YYYY.DDD    YYYY.DDD    YYYY.DDD    (kg/ha)
9   NaN         NaN     NaN     NaN         NaN         NaN         NaN         NaN
10  1999.26     2000.21 5669.46 2000.14     2000.19     2000.19     2000.19     11626.7
11  2000.27     2001.22 10282.5 2001.15     2001.2      2001.2      2001.2      20565
12  2001.27     2002.22 8210.09 2002.15     2002.2      2002.2      2002.2      16509

我需要按列合并（即用空格作为粘合）第 5 至 9 行（包括），以便只有一个像这样的标题（我已格式化表格以便于阅读，因此有更多选项卡比实际应该的）

Planting date YYYY.DDD   Harvest date YYYY.DDD    Yield (kg/ha)  Flowering date YYYY.DDD     Maturity date YYYY.DDD  Maturity date YYYY.DDD  Maturity date YYYY.DDD Above ground biomass (kg/ha)
1999.262                2000.206                5669.45623      2000.138                    2000.19                 2000.19                 2000.19                 11626.73122
2000.268                2001.216                10282.49713     2001.151                    2001.2                  2001.2                  2001.2                  20564.99427
2001.272                2002.217                8210.091653     2002.155                    2002.201                2002.201                2002.201                16509.03802

我想这应该是相当微不足道的，但我找不到我的解决方案。

任何帮助将不胜感激

您可以先选择loc http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.loc.html，然后替换NaN空字符串fillna http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.fillna.html并申请join。如有必要，删除第一个和最后一个空格str.strip http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.strip.html然后通过选择删除第一行df.loc[10:]:

df.columns = df.loc[5:9].fillna('').apply(' '.join).str.strip()

#if need monotonic index (0,1,2...) add reset index
print (df.loc[10:].reset_index(drop=True))
  Planting date YYYY.DDD Harvest date YYYY.DDD(kg/ha) Yield YYYY.DDD  \
0                1999.26                      2000.21        5669.46   
1                2000.27                      2001.22        10282.5   
2                2001.27                      2002.22        8210.09   

  Flowering date YYYY.DDD Maturity date YYYY.DDD Maturity date YYYY.DDD  \
0                 2000.14                2000.19                2000.19   
1                 2001.15                 2001.2                 2001.2   
2                 2002.15                 2002.2                 2002.2   

  Maturity date (kg/ha) Above ground biomass  
0               2000.19              11626.7  
1                2001.2                20565  
2                2002.2                16509

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Excel

python27

pandas

如何将 pandas 数据框的多行标题合并到单个单元格标题中？的相关文章

类型错误：float() 参数必须是字符串或数字，而不是“列表”python

我的 Python 有问题这是我的代码 def calcola a input b float a 0 split c float a 0 split d float a 0 split e float a 0 split j float
Paramiko SSHException 通道已关闭

我一直在使用 Paramiko 在 Linux Windows 机器上发送命令它可以很好地在 Ubuntu 机器上远程执行测试但是它不适用于 Windows 7 主机以下是我收到的错误 def unit for event self
numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
在Python中以交互方式执行多行语句

我是 Python 世界的新手这是我用 Python 编写的第一个程序我来自 R 世界所以这对我来说有点不直观当我执行时 In 15 import math import random random random math sqrt
按多个键分组并对字典列表的值进行汇总/平均值

在Python中按多个键进行分组并对字典列表进行汇总平均值的最Pythonic方法是什么假设我有一个字典列表如下所示 input dept 001 sku foo transId uniqueId1 qty 100 dept 001
在 Linux 上的 Python 中使用受密码保护的 Excel 工作表

问题很简单我每周都会收到一堆受密码保护的 Excel 文件我必须解析它们并使用 Python 将某些部分写入新文件我得到了文件的密码当在 Windows 上完成此操作时处理起来很简单我只需导入 win32com 并使用 clie
如何将类添加到 LinkML 中的 SchemaDefinition？

中的图表https linkml io linkml model docs SchemaDefinition https linkml io linkml model docs SchemaDefinition and https link
在谷歌云上训练神经网络时出现“无法获取路径的文件系统”错误

我正在使用 Google Cloud 在云上训练神经网络如下例所示 https cloud google com blog big data 2016 12 how to classify images with tensorflow u
Pandas groupby apply 执行缓慢

我正在开发一个涉及大量数据的程序我正在使用 python pandas 模块来查找数据中的错误这通常工作得非常快然而我当前编写的这段代码似乎比应有的速度慢得多我正在寻找一种方法来加快速度为了让你们正确测试它我上传了一段相当大的
如何使用 Celery 多工作人员启用自动缩放？

命令celery worker A proj autoscale 10 1 loglevel info启动具有自动缩放功能的工作人员当创建多个工人时 me mypc projects x celery multi start mywork
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
PyArmor - 打包为一个可执行文件

当我执行此命令时您好使用 PyArmor pyarmor pack main py 它将它打包到一个名为的文件夹中dist里面包含我的 exe 以及许多 Python 扩展文件据我所知 PyArmor 使用 PyInstaller 来
如何正确导入主代码和模块中同时使用的模块？

假设我有一个主脚本 main py 它导入另一个 python 文件import coolfunctions另一个 import chores 现在假设 Coolfunctions 也使用家务活中的东西因此我声明import chore
用于多个窗口的 Tkinter 示例代码，为什么按钮无法正确加载？

我正在编写一个程序应该按一下按钮即可打开一个窗口按另一个按钮关闭新打开的窗口我使用类以便稍后可以将代码插入到更大的程序中但是我无法正确加载按钮 import tkinter as tk class Demo1 tk Frame
Django Rest Framework POST 更新（如果存在或创建）

我是 DRF 的新手我阅读了 API 文档也许这是显而易见的但我找不到一个方便的方法来做到这一点我有一个Answer与 a 具有一对一关系的对象Question 在前端我曾经使用 POST 方法来创建发送到的答案api answe
更换壳牌管道[重复]

这个问题在这里已经有答案了在 subprocess 模块的 Python 2 7 文档中我找到了以下片段 p1 Popen dmesg stdout PIPE p2 Popen grep hda stdin p1 stdout stdo
在 scipy 中创建新的发行版

我试图根据我拥有的一些数据创建一个分布然后从该分布中随机抽取这是我所拥有的 from scipy import stats import numpy def getDistribution data kernel stats gauss
在 Python 中访问 argparse 的参数值

我正在尝试为我的程序设置一些简单的标志参数但无法弄清楚如何访问它们我有 argparser parser argparse ArgumentParser description Simple PostScript Interpreter
Pip 无法在 Windows 上安装 Twisted

我正在尝试在 Windows 8 计算机上安装 Twisted 在 Twisted 官方网站上只有一个 Windows 版的 Wheel 文件 https twistedmatrix com trac wiki Downloads htt
Confluence：使用 VBA 更新现有页面

我尝试使用 VBA 更新 Confluence 页面我的想法是使用REST API加载页面内容修改内容然后上传修改后的版本这是我的代码 Private Sub TestRESTApi Dim uname As String uname

随机推荐

始终返回相同布尔值的 Python 函数

在函数式编程中有时useful有一个总是返回的函数True or False 对于每个参数甚至多个参数某些模块中定义的内置函数或函数是否具有这种确切的行为我不知道有任何内置的但你可以将它们定义为 false lambda False
如何在 Eclipse 动态 Web 项目中添加类路径条目作为发布/导出依赖项？

我使用成功创建了一个项目检票口快速入门 http wicket apache org start quickstart html并通过运行将其转换为 Eclipse 动态 Web 项目 mvn eclipse clean eclipse e
为什么无限递归会导致段错误

为什么无限递归会导致段错误为什么堆栈溢出会导致段错误我正在寻找详细的解释 int f f int main f 每次调用 f 时都会增加堆栈的大小这是存储返回地址的位置以便程序知道 f 完成时要转到哪里由于您永远不会退出 f 因
文本输入占位符对齐

对齐 TextInput 组件的占位符文本的最佳方法是什么我已经尝试使用样式组件如下所述似乎没有这方面的属性 render return
使用 pre_save 信号编辑上传的文件（djangos FileField）

我想在保存之前在字节级别编辑上传的文件即搜索并删除某个字节序列我按以下方式设置了 pre save 信号 class Snippet models Model name models CharField max length 256 u
用日期和星座填充二维数组的更好方法

我正在解决以下问题我想填充一个二维 365 2 数组第一个值应该保存日期从 1 月 1 日开始到 12 月 31 日结束第二个值应该包含每个日期相应的星座 e g array 0 0 持有 101 并且array 0 1 持有白羊
Scala 等待 future 序列

我希望像下面这样的代码会等待两个 future 但事实并非如此 object Fiddle val f1 Future throw new Throwable baaa emulating a future that bumped into
XCode 服务器：打开模块“MobileCoreServices”的导入文件：权限被拒绝

在 XCode 8 中运行机器人并使用 Swift 3 代码时我收到此错误打开模块 MobileCoreServices 的导入文件权限被拒绝我用的是迦太基我在同一台计算机上使用另一个用户帐户运行 macOS 服务器有人可以帮忙
SQLite 尝试写入只读数据库错误

我有一个填充 SQLite 数据库的控制台应用程序当应用程序自行运行时我不会收到任何错误如果我运行应用程序的多个实例其中每个应用程序都位于自己的文件夹中并且每个应用程序填充自己的数据库我偶尔会遇到以下异常 System Data
Nodejs 使用 Loop 下载多个文件时丢失数据

今天我尝试从我的服务器下载许多文件下载 js function getPhotos req res Get User Photos var fileReader fs readFile data user json utf8 funct
使用 boot2docker 从主机共享代码目录不会在来宾上调用 inotify

我正在尝试使用 boot2docker Virtualbox 设置开发环境与 docker 容器共享主机上的文件夹是可行的但由于它是通过 Virtualbox 共享文件夹共享的所以 inotify 不会在容器内部触发并且不会重新加载
帮助我理解这段 Scala 代码：scalaz IO Monad

这是我试图理解的代码它来自http apocalisp wordpress com 2010 10 17 scalaz tutorial enumeration based io with iteratees http apocalisp
它们的区别是什么：remotes/origin/HEAD、origin/main 和remotes/origin/main？

git branch a main remotes origin HEAD gt origin main remotes origin main 他们的区别是什么 remotes origin HEAD origin main remote
在 Java 中，不使用正则表达式来判断字符是字母还是数字的最佳方法是什么？

在不使用正则表达式的情况下在 Java 中识别 string charAt index 是 A z 字母还是数字的最佳和或最简单方法是什么谢谢 Character isDigit string charAt index JavaDoc
如何让CURL保存到不同的目录？

我需要能够传入文件下载的 URL 以及要保存文件的路径我认为这与 CURL 上的 O 和 o 有关但我似乎无法弄清楚例如这就是我现在在 bash 脚本中使用的内容 bin sh getsrc curl O 1 getsrc http
无法识别的字段：documenDB 中出现“ntreturn”错误

我正在取Unrecognized field ntoreturn 当我尝试更改 aws documentDB 中的页面时出错我用过Robo3t用于使用 SSH 隧道连接 DocumentDB 附和克坦莫迪 https stackover
“timedMetadata”已弃用。另一种方法？ <更新>

使用 PlayerItem timedMetadata 粘贴在下面已经有一段时间了并且效果很好然而 Apple 似乎已将此方法标记为 iOS 13 中已弃用并且可能或将被删除 Xcode 确实告诉我我必须使用另一种名为 AVP
释放后的 ASAN 堆使用情况

我正在运行 ASAN 来查找一个非常大的项目中的内存泄漏我已找到原因但不知道如何解决我制作了一个示例程序来使问题易于理解在下面的程序中我只能解决指定的代码对于其余代码无法进行解决因此请建议我可能必须解决以下 ASAN 错误
使用批处理脚本进行字符串处理

我当前正在创建一个批处理脚本该脚本必须循环遍历文件中的行检查某些字符串以及是否存在带有的匹配前缀将其注释掉我对批处理脚本完全陌生到目前为止我所得到的是 for f j in CMakeLists txt do if j Ext
如何将 pandas 数据框的多行标题合并到单个单元格标题中？

我有一个来自 Excel 文件的 pandas DataFrame 其标题分为多行如下例所示 0 1 2 3 4 5 6 7 5 NaN NaN NaN NaN NaN NaN NaN Above 6 Planting Harvest N

如何将 pandas 数据框的多行标题合并到单个单元格标题中？

如何将 pandas 数据框的多行标题合并到单个单元格标题中？ 的相关文章

随机推荐

热门标签

如何将 pandas 数据框的多行标题合并到单个单元格标题中？的相关文章