将 pandas 数据帧导出到 xlsx：处理 python 3.9 上的 openpyxl 问题

2024-07-04

使用最新的软件包版本：openpyxl：3.0.6 |熊猫：1.2.3 |蟒蛇：3.9

在将上面的软件包更新到报告的最新版本之前，下面的功能运行良好。

现在它会引发错误：“zipfile.BadZipFile：文件不是 zip 文件”。

这样的功能确实很有用，并且很高兴知道它是否可以修复以使其正常工作。

下面的函数可以直接运行，只需将“pathExport”替换为您的导出目录进行测试即可。

    def append_df_to_excel(filename, df, sheet_name='Sheet1', startrow=None,
                           truncate_sheet=False, 
                           **to_excel_kwargs):
        """
        Append a DataFrame [df] to existing Excel file [filename]
        into [sheet_name] Sheet.
        If [filename] doesn't exist, then this function will create it.
    
        Parameters:
          filename : File path or existing ExcelWriter
                     (Example: '/path/to/file.xlsx')
          df : dataframe to save to workbook
          sheet_name : Name of sheet which will contain DataFrame.
                       (default: 'Sheet1')
          startrow : upper left cell row to dump data frame.
                     Per default (startrow=None) calculate the last row
                     in the existing DF and write to the next row...
          truncate_sheet : truncate (remove and recreate) [sheet_name]
                           before writing DataFrame to Excel file
          to_excel_kwargs : arguments which will be passed to `DataFrame.to_excel()`
                            [can be dictionary]
    
        Returns: None
    
        (c) [MaxU](https://stackoverflow.com/users/5741205/maxu?tab=profile)
        """
        from openpyxl import load_workbook
    
        # ignore [engine] parameter if it was passed
        if 'engine' in to_excel_kwargs:
            to_excel_kwargs.pop('engine')
    
        writer = pd.ExcelWriter(filename, engine='openpyxl')
    
        # Python 2.x: define [FileNotFoundError] exception if it doesn't exist 
        try:
            FileNotFoundError
        except NameError:
            FileNotFoundError = IOError
    
    
        try:
            # try to open an existing workbook
            writer.book = load_workbook(filename)
            
            # get the last row in the existing Excel sheet
            # if it was not specified explicitly
            if startrow is None and sheet_name in writer.book.sheetnames:
                startrow = writer.book[sheet_name].max_row
    
            # truncate sheet
            if truncate_sheet and sheet_name in writer.book.sheetnames:
                # index of [sheet_name] sheet
                idx = writer.book.sheetnames.index(sheet_name)
                # remove [sheet_name]
                writer.book.remove(writer.book.worksheets[idx])
                # create an empty sheet [sheet_name] using old index
                writer.book.create_sheet(sheet_name, idx)
            
            # copy existing sheets
            writer.sheets = {ws.title:ws for ws in writer.book.worksheets}
        except FileNotFoundError:
            # file does not exist yet, we will create it
            pass
    
        if startrow is None:
            startrow = 0
    
        # write out the new sheet
        df.to_excel(writer, sheet_name, startrow=startrow, **to_excel_kwargs)
    
        # save the workbook
        writer.save()

pathExport = r"F:\PYTHON\NB-Suite_python39\MNE\outputData\df.xlsx"
df1 = pd.DataFrame({'numbers': [1, 2, 3],
                    'colors': ['red', 'white', 'blue'],
                    'colorsTwo': ['yellow', 'white', 'blue']
                    })

append_df_to_excel(pathExport, df1, sheet_name="DF1", index=False, startcol=0, startrow=0)

好的，我能够复制这个问题。这是pandas有关的。 pandas 1.1.5 之前一切正常在 pandas 1.2.0 中他们做到了一些变化 https://pandas.pydata.org/docs/whatsnew/v1.2.0.html

当你实例化的时候pd.ExcelWriter with

writer = pd.ExcelWriter(filename, engine='openpyxl')`

它会创建大小为 0 字节的空文件并覆盖现有文件，然后在尝试加载它时会出现错误。它不是openpyxl相关，因为最新版本的openpyxl它与 pandas 1.1.5 配合良好。

解决方案 - 指定mode='a'，将上面的行更改为

writer = pd.ExcelWriter(filename, engine='openpyxl', mode='a')

或者 - 看看this https://stackoverflow.com/a/66472617/4046632 or this https://stackoverflow.com/a/20221655/4046632解决方案在实例化之前加载文件pd.ExcelWriter.

编辑：我在评论中被告知mode='a'如果文件不存在，它将引发 FileNotFoundError。虽然在这种情况下它不会创建文件是出乎意料的，但解决方案是移动创建writer现有的内部try阻止并创建一个writer与模式w in the except part:

def append_df_to_excel(filename, df, sheet_name='Sheet1', startrow=None,
                           truncate_sheet=False, 
                           **to_excel_kwargs):
        """
        Append a DataFrame [df] to existing Excel file [filename]
        into [sheet_name] Sheet.
        If [filename] doesn't exist, then this function will create it.
     
        Parameters:
          filename : File path or existing ExcelWriter
                     (Example: '/path/to/file.xlsx')
          df : dataframe to save to workbook
          sheet_name : Name of sheet which will contain DataFrame.
                       (default: 'Sheet1')
          startrow : upper left cell row to dump data frame.
                     Per default (startrow=None) calculate the last row
                     in the existing DF and write to the next row...
          truncate_sheet : truncate (remove and recreate) [sheet_name]
                           before writing DataFrame to Excel file
          to_excel_kwargs : arguments which will be passed to `DataFrame.to_excel()`
                            [can be dictionary]
     
        Returns: None
     
        (c) [MaxU](https://stackoverflow.com/users/5741205/maxu?tab=profile)
        """
        from openpyxl import load_workbook
     
        # ignore [engine] parameter if it was passed
        if 'engine' in to_excel_kwargs:
            to_excel_kwargs.pop('engine')
     
        
     
        # Python 2.x: define [FileNotFoundError] exception if it doesn't exist 
        try:
            FileNotFoundError
        except NameError:
            FileNotFoundError = IOError
     
     
        try:
            writer = pd.ExcelWriter(filename, engine='openpyxl', mode='a')
            # try to open an existing workbook
            writer.book = load_workbook(filename)
             
            # get the last row in the existing Excel sheet
            # if it was not specified explicitly
            if startrow is None and sheet_name in writer.book.sheetnames:
                startrow = writer.book[sheet_name].max_row
     
            # truncate sheet
            if truncate_sheet and sheet_name in writer.book.sheetnames:
                # index of [sheet_name] sheet
                idx = writer.book.sheetnames.index(sheet_name)
                # remove [sheet_name]
                writer.book.remove(writer.book.worksheets[idx])
                # create an empty sheet [sheet_name] using old index
                writer.book.create_sheet(sheet_name, idx)
             
            # copy existing sheets
            writer.sheets = {ws.title:ws for ws in writer.book.worksheets}
        except FileNotFoundError:
            # file does not exist yet, we will create it
            writer = pd.ExcelWriter(filename, engine='openpyxl')
     
        if startrow is None:
            startrow = 0
     
        # write out the new sheet
        df.to_excel(writer, sheet_name, startrow=startrow, **to_excel_kwargs)
     
        # save the workbook
        writer.save()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将 pandas 数据帧导出到 xlsx：处理 python 3.9 上的 openpyxl 问题的相关文章

如何设置 pandas DataFrame _repr_html_ 方法的默认样式？

我有一个 pandas DataFrame 其中有一列是 url 并且我编写了以下格式化程序以将其作为链接呈现在我的笔记本中 def make clickable val target blank to open new window re
pandas：将一个数据帧中的行添加到另一个数据帧？

我有两个具有相同列标题的数据框我正在迭代 df1 中的行拆分其中一列然后使用这些拆分列创建多行以添加到另一个数据帧 for index row in df1 iterrows curr awards row AWARD split f
Pandas，如果其他列为空，则连接某些列

我有一个 CSV 文件应该如下所示 ID years active issues Truck1 8 In dire need of a paintjob Car 5 3 To small for large groups 然而 CSV 的
用 pandas 将字符串拆分为数字和文本

设置我有一个pandas包含 iso 列的数据框其中包含化学同位素符号例如 4He 16O 197Au 我想使用以下方法在绘图上标记许多但不是全部同位素annotate 函数于matplotlib 标签格式应在上标中包含原子质量
通过 Pandas 数据帧运行 nltk sent_tokenize

我有一个由两列组成的数据框 ID 和 TEXT 假装数据如下 ID TEXT 265 The farmer plants grain The fisher catches tuna 456 The sky is blue 434 The s
没有要聚合的数字类型 - groupby() 行为发生变化吗？

我对一些团体代码有问题我很确定这些代码曾经运行过在较旧的 pandas 版本上在 0 9 上我得到没有要聚合的数字类型错误有任何想法吗 In 31 data Out 31
Python pandas - 根据集体 NaN 计数删除组

我有一个基于不同气象站的多个变量温度压力等的数据集 stationID Time Temperature Pressure 123 1 30 1010 5 123 2 31 1009 0 202 1 24 NaN 202 2 24 3
用python划分两个数据框

我有两个数据框 df1 and df2 df1 TIMESTAMP eq1 eq2 eq3 2016 05 10 13 20 00 40 30 10 2016 05 10 13 40 00 40 10 20 df2 TIMESTAMP eq
Pandas：获取重复索引

给定一个数据帧我想获取重复的索引这些索引在列中没有重复的值并查看哪些值不同具体来说我有这个数据框 import pandas as pd wget https www dropbox com s vmimze2g4lt4ud3 a
了解 pandas 中的 lambda 函数

我正在尝试解决 Python 课程的问题发现有人在 github 中实现了同一问题的解决方案我只是想了解 github 中给出的解决方案我有一个名为 Top15 的 pandas 数据框包含 15 个国家地区数据框中的一列是 H
检查 Pandas 中的单个单元格值是否为 NaN

我只想检查 Pandas 系列中的单个单元格是否为空即检查一个值是否为NaN 所有其他答案都适用于系列和数组但不适用于单个值我努力了pandas notnull pandas isnull numpy isnan 有没有只针对单一值的
pandas 多项式外推

使用 pandas 进行插值很容易df interpolate pandas 中是否有一种方法可以同样优雅地执行类似推断之类的操作我知道我的外推法适合二阶多项式同样优雅是一个有点艰巨的任务但这是可以做到的据我所知您需要手动计算推
有没有办法将 npz 文件转换为 panda 数据框？

我有一个很大的 npz 文件我用 numpy 的 np load 加载了它我想将其转换为 panda 的数据框以便我可以使用 scikit learn 应用机器学习算法 KNN K Means DT 我是 python 新手所以我对
重命名数据框中的元组列名称

I am new to python and pandas I have attached a picture of a pandas dataframe I need to know how I can fetch data from t
使用 pandas 数据框进行主成分分析

如何根据 pandas 数据框中的数据计算主成分分析 Most sklearn http scikit learn org stable 对象一起工作pandas数据框很好这样的东西对你有用吗 import pandas as pd im
循环 pandas 数据框来创建虚拟对象

我有一个数据集如下所示 year state election year 1 yes 2010 haryana 1 2010 haryana 1 2010 up 0 2011 goa 1 2012 h
查找与 id 匹配的最接近时间戳的行，并添加具有值的行

我有 2 个数据帧并且想根据最近的日期时间和匹配 ID 在 df1 中插入一行其中包含 df2 中的值 df 示例如下 df1 storeID datetime 0 111 2020 01 01 00 50 00 1 222 2020
导入文本文件：没有要从文件中解析的列

我正在尝试从 sys stdin 获取输入这是hadoop 的map reducer 程序输入文件为txt格式数据集预览 196 242 3 881250949 186 302 3 891717742 22 377 1 8788871
使用 Matplotlib 创建箱线图

我正在使用 python 3 和 jupyter 笔记本我有一个 pandas 数据框其结构如下 location price Apr 25 ASHEVILLE 15 0 Apr 25 ASHEVILLE 45 0 Apr 25 ASH
熊猫读_csv。如何忽略换行符之前的分隔符

我正在读取一个包含数值的文件 data pd read csv data dat sep header None 在文本文件中每行以空格结尾因此 pandas 等待不存在的值并在每行末尾添加一个 nan 例如 2 343 4 234

随机推荐

C# 奇怪的精度丢失 int 到浮动和向后

当尝试从 int 转换为 float 并向后转换时会发生奇怪的事情原始示例代码整数值 28218681 val 28218681 浮点 fVal 浮点 val fVal 2 821868E 07 int val2 int fVal v
PHP SQLSRV：sqlsrv_query() 是否可以正确地准备 select 语句？

TL DR Does sqlsrv query 做同样的工作select陈述比sqlsrv prepare and sqlsrv execute 关于准备好的陈述做什么我怎样才能做一个安全的select陈述一点历史我是 PHP 开发
Opencv 3D 来自立体对中的点

OpenCV 中是否有一个简单的函数可以从立体相机对中获取对象的 3D 位置和姿态我用棋盘校准了相机和基线我现在想要获取一个已知的物体就像同一个棋盘一样在它自己的坐标中具有已知的 3D 点并找到真实世界的位置在相机坐标中有一些
在 Visual Studio 中启动 Web API 项目的最简洁方法（无视图）

删除 Visual Studio API 模板通常附带的所有额外内容如视图和其他如果您只想拥有 WebAPI 服务则不需要的内容的最干净方法是什么我假设 VIEWS 文件夹用于 MVC 视图也许我错了它需要有一个正在运行的 API
Python就地写入文件任意位置

我正在尝试在 python 中就地编辑文本文件它非常大因此无法将其加载到内存中我打算替换我在里面找到的逐字节字符串 with f as open filename txt r b if f read 8 01234567 f seek
UIWebView 中自动填充用户名和密码

我正在为我做一个非常简单的应用程序当我启动这个应用程序时它只会将我带到这个网页https social tre it expert https social tre it expert 我想自动登录那么有没有办法自动填写用户名和密码
Java中等待的最佳方式

我有一个应用程序需要等待一段未知的时间它必须等到服务器完成几个数据字段的填充服务器的 API 为我提供了一种请求数据的方法非常简单服务器的 API 还提供了一种接收回数据的方法一次接收一个字段它没有告诉我所有字段何时完成填充等
如何按字母顺序对单键字典数组进行排序？

我想对 Facebook 的 Graph API 返回的好友列表进行排序排序后的结果需要是按好友名字的字母顺序排列 name Joe Smith id 6500000 name Andrew Smith id 82000 name Dor
ActiveRecord 触摸导致死锁

我的应用程序使用touch广泛地利用 Rails 的模板缓存系统当批量中的许多不同对象之间创建许多关系时我的应用程序会执行某种类型的工作有时其中一些工作会导致级联touches 导致死锁我可以针对这种情况进行编码我经常看到这种情
Instagram 如何命名文件

Instagram 如何命名文件文件名是随机的吗基于某种哈希或者它们有什么意义吗例如 http distilleryimage2 instagram com 21a9ca729bf511e2985c22000a1f9ad3 7 jp
为什么这个简单的洗牌算法（通过 random() 排序）存在偏差？

In 这个线程 https stackoverflow com a 18650169 17102262我们看到这个简单而漂亮的算法来洗牌数组 function shuffle
限制 Webstorm 中的重构范围

有没有一种方法可以配置 Webstorm 以便在重构时忽略我项目的特定区域具体来说我希望能够忽略包含第 3 方依赖项和构建资产的文件夹例如 node modules 您可以按照描述创建这些文件夹的 JavaScript 库here h
如何在ggplot2图例标签中添加Latex代码？

考虑以下示例 p lt ggplot data data frame A c 1 2 3 4 5 6 7 8 B c 4 1 2 1 3 2 4 1 C c A B A B A B A B p lt p geom line aes x A
为什么 BITMAPS 加载“向上”？

如果您有一个非常非常大的 JPG 和嵌入 HTML 的 BMP 并将其加载到 Firefox 中您会注意到 JPG 将向下加载从左到右绘制然后向下而 BMP 将向上加载从右向左绘画然后向上只是好奇我不久前写了一个位图
更改引导程序中单击按钮的颜色

我正在尝试更改单击按钮的颜色我正在蓝色的 Bootstrap 按钮上执行此操作但我的代码不起作用我的 JavaScript 代码如下它没有改变颜色
jqGrid - 未应用日期和时间格式

我有一个显示 3 列的 jqGrid 其中一列是日期时间正在返回的 SQL 日期时间字段 colModel 设置如下 colModel name col1 sortable false name col2 sortable false n
我可以分享到我的 NativeScript 应用程序吗？

在 NativeScript 的当前状态下是否可以创建一个在 Android 上侦听共享意图的应用程序我想要实现的是例如在 Android 上的网络浏览器中打开一个网站点击共享并在共享目标列表中查看我的 NativeScript 应
如何隐藏 html 表格中的多行（数千行）

我有很多行的 html 页面大约 40000 table tr td row 1 td tr tr td row 2 td tr tr td row 30000 td tr table 我需要一种快速的方法来隐藏显示具有指定名称的行集
如何修复 emacs 中的“正则表达式匹配器中的堆栈溢出”

我是 Emacs 的忠实粉丝并且经常使用它尤其是在编程和调试使用 gud C C 时最近我必须调试一个程序相当简单但需要计算大量数据图论但我遇到了一个相当烦人的问题在程序逐步执行过程中出现以下错误 error in pr
将 pandas 数据帧导出到 xlsx：处理 python 3.9 上的 openpyxl 问题

使用最新的软件包版本 openpyxl 3 0 6 熊猫 1 2 3 蟒蛇 3 9 在将上面的软件包更新到报告的最新版本之前下面的功能运行良好现在它会引发错误 zipfile BadZipFile 文件不是 zip 文件这样的功能确实

将 pandas 数据帧导出到 xlsx：处理 python 3.9 上的 openpyxl 问题

将 pandas 数据帧导出到 xlsx：处理 python 3.9 上的 openpyxl 问题 的相关文章

随机推荐

热门标签

将 pandas 数据帧导出到 xlsx：处理 python 3.9 上的 openpyxl 问题的相关文章