如何将合并的 Excel 单元格与 NaN 读取到 Pandas DataFrame 中

2023-11-26

我想将 Excel 工作表读入 Pandas DataFrame。但是，存在合并的 Excel 单元格以及空行（完整/部分NaN填充），如下图所示。需要澄清的是，John H. 已下订单购买从《The Bodyguard》到《Red Pill Blues》的所有专辑。

当我将此 Excel 工作表读入 Pandas DataFrame 时，Excel 数据无法正确传输。 Pandas 将合并的单元格视为一个单元格。数据框如下所示：（注意：（）中的值是我想要的值）

请注意，最后一行不包含合并单元格；它只具有以下价值Artist柱子。

EDIT: I did try the following to forward-fill in the NaN values:(Pandas: Reading Excel with merged cells)

df.index = pd.Series(df.index).fillna(method='ffill')

但是，那NaN价值观依然存在。我可以使用什么策略或方法来正确填充 DataFrame？有没有取消合并单元格并复制相应内容的 Pandas 方法？

您尝试转发的引用链接仅需要填写index柱子。对于您的用例，您需要fillna for all数据框列。因此，只需前向填充整个数据帧：

df = pd.read_excel("Input.xlsx")
print(df)

#    Order_ID Customer_name            Album_Name           Artist  Quantity
# 0       NaN           NaN            RadioShake              NaN       NaN
# 1       1.0       John H.         The Bodyguard  Whitney Houston       2.0
# 2       NaN           NaN              Lemonade          Beyonce       1.0
# 3       NaN           NaN  The Thrill Of It All        Sam Smith       2.0
# 4       NaN           NaN              Thriller  Michael Jackson      11.0
# 5       NaN           NaN                Divide       Ed Sheeran       4.0
# 6       NaN           NaN            Reputation     Taylor Swift       3.0
# 7       NaN           NaN        Red Pill Blues         Maroon 5       5.0

df = df.fillna(method='ffill')
print(df)

#    Order_ID Customer_name            Album_Name           Artist  Quantity
# 0       NaN           NaN            RadioShake              NaN       NaN
# 1       1.0       John H.         The Bodyguard  Whitney Houston       2.0
# 2       1.0       John H.              Lemonade          Beyonce       1.0
# 3       1.0       John H.  The Thrill Of It All        Sam Smith       2.0
# 4       1.0       John H.              Thriller  Michael Jackson      11.0
# 5       1.0       John H.                Divide       Ed Sheeran       4.0
# 6       1.0       John H.            Reputation     Taylor Swift       3.0
# 7       1.0       John H.        Red Pill Blues         Maroon 5       5.0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何将合并的 Excel 单元格与 NaN 读取到 Pandas DataFrame 中的相关文章

无法在 selenium 和 requests 之间传递 cookie，以便使用后者进行抓取

我用 python 结合 selenium 编写了一个脚本来登录网站然后从driver to requests这样我就可以继续使用requests进行进一步的活动 I used item soup select one div class
Series.sort() 和 Series.order() 有什么区别？

s pd Series nr randint 0 10 5 index nr randint 0 10 5 s Output 1 3 7 6 2 0 9 7 1 6 order 按值排序并返回一个新系列 s order Output 2 0
创建上下文后将 jar 文件添加到 pyspark

我正在笔记本上使用 pyspark 并且不处理 SparkSession 的创建我需要加载一个包含一些我想在处理 rdd 时使用的函数的 jar 您可以使用 jars 轻松完成此操作但在我的特定情况下我无法做到这一点有没有办法访问sp
使用 Paramiko 进行 DSA 密钥转发？

我正在使用 Paramiko 在远程服务器上执行 bash 脚本在其中一些脚本中存在与其他服务器的 ssh 连接如果我只使用 bash 不使用 Python 我的 DSA 密钥将被第一个远程服务器上的 bash 脚本转发并使用以连接
如何确保 re.findall() 停止在正确的位置？

这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
尝试在 Anaconda 上安装 pygame 时，Python 3.x 降级为 Python 2.7

我正在使用 Anaconda Python 3 我正在尝试安装 pyOpenGL Vpython 和 pygame 安装 pyOpenGL 和 Vpython 就可以使用conda install 当我尝试安装 Pygame 时使用con
类型错误：需要二进制或 unicode 字符串，得到 618.0

I ve been trying to implement this ML Linear Model into my dataset https www tensorflow org tutorials estimator linear L
Arcpy 模数在 Pycharm 中不显示

如何将 Arcpy 集成到 Pycharm 中我尝试通过导入模块但它没有显示我确实知道该模块仅适用于 2 x python arcpy 在 PyPi Python 包索引上不可用因此无法通过 pip 安装要使用 arcpy 您需要
AttributeError：“模块”对象没有属性[重复]

这个问题在这里已经有答案了我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
Python将文本文件解析为嵌套字典

考虑以下数据结构 HEADER1 key value key value HEADER2 key value key value HEADER3 key value HEADER4 key value key value 原始数据中没有缩进
使用 for 循环创建一系列元组

我已经搜索过但找不到答案尽管我确信它已经存在了我对 python 很陌生但我以前用其他语言做过这种事情我正在以行形式读取数据文件我想将每行数据存储在它自己的元组中以便在 for 循环之外访问 tup i inLine wher
查找 Pandas DF 行中的最短日期并创建新列

我有一个包含多个日期的表有些日期将为 NaN 我需要找到最旧的日期所以一行可能有 DATE MODIFIED WITHDRAWN DATE SOLD DATE STATUS DATE 等因此对于每一行一个或多个字段中都会有一个日期
Airflow 1.9 - 无法将日志写入 s3

我在 aws 的 kubernetes 中运行气流 1 9 我希望将日志发送到 s3 因为气流容器本身的寿命并不长我已经阅读了描述该过程的各种线程和文档但我仍然无法让它工作首先是一个测试向我证明 s3 配置和权限是有效的这是在我们
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
无法通过 Python 子进程进行 SSH

我需要通过堡垒 ssh 进入机器因此该命令相当长 ssh i
AWS Lambda 不读取环境变量

我正在编写一个 python 脚本来查询 Qualys API 中的漏洞元数据我在 AWS 中将其作为 lambda 函数执行我已经在控制台中设置了环境变量但是当我执行函数时出现以下错误 module initialization
pandas 中数据帧中的随机/洗牌行

我目前正在尝试找到一种方法来按行随机化数据框中的项目我在 pandas 中按列洗牌排列找到了这个线程在 pandas 中对 DataFrame 进行改组排列 https stackoverflow com questions 157
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome
如何（安全）将 Python 对象发送到我的 Flask API？

我目前正在尝试构建一个 Flask Web API 它能够在 POST 请求中接收 python 对象我使用 Python 3 7 1 创建请求使用 Python 2 7 运行 API 该 API 设置为在我的本地计算机上运行我试图发
无法安装最新版本的 Numpy (1.22.3)

我正在尝试安装最新版本的 numpy 即 1 22 3 但看起来 pip 无法找到最后一个版本我知道我可以从源代码本地安装它但我想了解为什么我无法使用 pip 安装它 PS 我有最新版本的pip 22 0 4 ERROR Could n

随机推荐

智能支付按钮为 IPN 传递自定义变量

我的网站上有两个用于每月订阅的智能按钮运行良好我成功收到 IPN 响应其中付款信息已准备好添加到数据库中但我需要通过 IPN 响应获取应用程序的 UserID 如何使用智能支付按钮传递自定义变量以便将其传递到 IPN 如果可能的话
Maven 本地存储库与 leiningen 的依赖关系

我正在开始lein newclojure 中的项目并想要使用goose文章提取库不幸的是我在任何公开可用的 Maven 存储库中都找不到该库的 jar 因此我开始将其添加到本地 Maven 存储库中在项目目录中我复制了 goose
如何在 Python 中使用 BeautifulSoup 找到文本字符串后的表格？

我正在尝试从几个网页中提取数据这些网页的显示方式并不统一我需要编写代码来搜索文本字符串然后转到紧随该特定文本字符串的表然后我想提取该表的内容这是我到目前为止所得到的 from BeautifulSoup import Beauti
如何确定 Office 加载项是否在 Excel 或 Excel Online 下运行？

我正在编写一个 Office 加载项以前称为 Apps for Office 我在用着office js在某些代码点中我想检查应用程序是在 Excel 桌面软件中运行还是在 Web 上运行 Excel Online 就像是 if Of
如何为 Amazon S3 存储桶配置 SSL

我使用 Amazon S3 存储桶通过 NET 应用程序上传和下载数据现在我的问题是我想使用 SSL 访问我的 S3 存储桶是否可以为 Amazon s3 存储桶实施 SSL 您可以通过 SSL 访问您的文件如下所示 https s
Firebase Cloud Messaging 开发和发布简介

我最近从 Google Cloud Messaging 切换到 Firebase Cloud Messaging 对于 GCM 我必须选择沙箱选项正如这里所描述的 https developers google com cloud mes
使用 Google App Engine 实现“开头为”和“结尾为”查询

我想知道是否有人可以提供一些指导指导我如何使用 Python 对数据存储模型实现开头或结尾查询在伪代码中它的工作原理类似于查询属性 P 以 X 开头的所有实体 A or 查询属性 P 以 X 结尾的所有实体 B 谢谢马特您可以使
如何从服务器优雅地关闭套接字

在服务器端我试图优雅地关闭连接的套接字我知道套接字上事件的正确顺序应该是使用 SocketShutdown Send 选项关闭套接字循环等待直到套接字接收返回 0 字节套接字关闭我有几个问题如果 Socket Receiv
使用连接字符串的 DocumentDB .Net 客户端

我检查了 MSDN on DocumentDB for Net here 并找到了 3 个有效的构造函数然而它们都没有使用连接字符串这对我来说听起来很奇怪是否真的没有办法用连接字符串而不是端点 authKey组合来实例化客户端或者
Spring Oauth2 Client，自动刷新过期的access_token

让我解释一下我的用例我需要有一个 spring boot oauth2 客户端应用程序不是资源服务器因为我们已经有一个单独的资源服务器另外我还有以下要求对于每个向资源服务器发出的请求我们需要发送 id token 通过自定义re
使用python ElementTree的itertree函数并将修改后的树写入输出文件

我需要解析一个非常大 40GB 的 XML 文件从中删除某些元素然后将结果写入新的 xml 文件我一直在尝试使用 python 的 ElementTree 中的 iterparse 但我对如何修改树然后将生成的树写入新的 XML 文件
为什么malloc+memset比calloc慢？

据了解calloc不同于malloc因为它初始化分配的内存和calloc 内存设置为零和malloc 内存没有被清除所以在日常工作中我认为calloc as malloc memset 顺便说一句为了好玩我编写了以下代码作为基准
如何在Ajax中发送js数组

我创建了一个像这样的JS数组var detailsArr new Array 并将一些数据推入该数组现在我通过 Ajax 将这个数组推送到我的 Spring 控制器如下所示 ajax type POST url submit data
SQL 查询 - 将结果连接到一个字符串中[重复]

这个问题在这里已经有答案了我有一个包含以下代码的 sql 函数 DECLARE CodeNameString varchar 100 SELECT CodeName FROM AccountCodes ORDER BY Sort 我需要将
从外部表中选择时出现 sqlplus 错误：ORA-29913：执行 ODCIEXTTABLEOPEN 标注时出错

我设置了一个简单的 Oracle 外部表测试但我与 DBA 和 Unix 管理员一起无法开始工作以下是基于Oracle的外部表概念我们使用的数据库是11g 这是外部表定义 drop table emp load CREATE TA
如何使用FlowDocument的IDocumentPaginatorSource DocumentPaginator将FlowDocument转换为FixedDocument？

I have DocumentPaginator dp IDocumentPaginatorSource document DocumentPaginator and FlowDocument document new FlowDocume
在 IOS 4.x 或更低版本中，将子视图添加到视图时不会调用 viewDidAppear 方法，为什么？

在 iOS 4 x 或更低版本中 viewDidAppear 和 viewWillAppear viewDidDisappear 和 viewWillDisappear 等 ViewController 的委托方法不会被调用相同的方法在
创建 Django 管理操作来复制记录

我想创建一个 Django 管理操作允许我创建记录的副本这是用例管理员单击应用程序中要复制的记录旁边的复选框管理员从管理操作下拉菜单中选择复制管理员点击开始 Django 管理员使用新 ID 创建重复记录页面被刷新并添加新的
C++ ABI 问题列表

我见过很多关于 C 为何没有像 C 那样的标准 ABI 的讨论我很好奇问题到底是什么到目前为止我已经想出了名称修改异常处理 RTTI 还有与 C 有关的其他 ABI 问题吗我的头顶上浮现出 C 特定在哪里可以找到 this 参
如何将合并的 Excel 单元格与 NaN 读取到 Pandas DataFrame 中

我想将 Excel 工作表读入 Pandas DataFrame 但是存在合并的 Excel 单元格以及空行完整部分NaN填充如下图所示需要澄清的是 John H 已下订单购买从 The Bodyguard 到 Red Pill

如何将合并的 Excel 单元格与 NaN 读取到 Pandas DataFrame 中

如何将合并的 Excel 单元格与 NaN 读取到 Pandas DataFrame 中 的相关文章

随机推荐

热门标签

如何将合并的 Excel 单元格与 NaN 读取到 Pandas DataFrame 中的相关文章