Pandas to_excel-如何让它更快

2023-11-27

我有一个包含 12,000 行和 34 列的数据框。 pandas 将其写入 Excel 大约需要 15 秒。我读到了一些关于 to_excel 函数的讨论，使其更快的一种方法是添加 engine='xlsxwriter'。我使用以下代码。

writer = pd.ExcelWriter('outputfile.xlsx',engine='xlsxwriter')
res_df.to_excel(writer,sheet_name='Output_sheet')

想知道是否有办法使用 dask 或任何其他库使这项工作更快？

dataframe.memory_usage() 给了我以下输出：

Index   80
col1    95528
col2    95528
col3    95528
col4    95528
col5    95528
col6    95528
col7    95528
col8    95528
col9    95528
col10   95528
col11   95528
col12   95528
col13   95528
col14   95528
col15   95528
col16   95528
col17   95528
col18   95528
col19   95528
col20   95528
col21   95528
col22   95528
col23   95528
col24   95528
col25   95528
col26   95528
col27   95528
col28   95528
col29   95528
col30   95528
col31   95528
col32   95528
col33   95528
col34   95528

Thanks!

您可以使用pyexcelerate以获得更快的速度。

from pyexcelerate import Workbook

values = [res_df.columns] + list(res_df.values)
wb = Workbook()
wb.new_sheet('sheet name', data=values)
wb.save('outputfile.xlsx')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

performance

pandas

exporttoexcel

Pandas to_excel-如何让它更快的相关文章

识别左侧由 delta 链接的簇，右侧由不同 delta 链接的簇

考虑排序后的数组a a np array 0 2 3 4 5 10 11 11 14 19 20 20 如果我指定了左增量和右增量 delta left delta right 1 1 这就是我期望的集群分配方式 a 0 2 3 4 5 1
Pandas - 过滤器和正则表达式搜索 DataFrame 的索引

我有一个 DataFrame 其中列是 MultiIndex 索引是名称列表即index Andrew Bob Calvin 我想创建一个函数来返回数据帧中使用名称 Bob 或以字母 A 开头或以小写字母开头的所有行如何才能做到这一点
如何将热图刻度标签映射到值并将这些值添加为图例

我想在seaborn中创建一个热图并且有一个很好的方式来查看标签 With ax figure tight layout 我正进入状态这显然很糟糕 Without ax figure tight layout 标签被裁剪代码是 im
您使用什么来通过其自定义协议来测试（功能/负载/压力）您的网络服务？

我最近创建了一个回合制游戏服务器可以接受数十万个并发客户端连接长话短说 Linux 上的 epoll 通信基于简单定制基于线路的协议该服务器允许客户端连接寻找游戏比赛中的其他玩家玩所述游戏发送动作聊天消息等并在游戏结束时
将多索引的一级拆分为列

所以我有一个数据框 df pd DataFrame foo fizz 1 foo fizz 2 foo buzz 3 foo buzz 4 bar fizz 6 bar buzz 8 columns a b c a b c 0 foo fi
Pandas：参差不齐的时间序列的时间加权滚动平均值

我有一个参差不齐意思是不规则的频率时间索引的 DataFrame 我想对其执行时间加权滚动平均值以维护 DataFrame 的原始索引假设记录的值在被另一个值取代之前一直有效实现此目的的一种方法是将参差不齐的 DataFrame
使用定制距离函数从 Pandas Dataframe 创建距离矩阵

我有一个包含两列的 Pandas 数据框 id 唯一标识符和 date 如下所示 test df head id date 0 N1 2020 01 31 1 N2 2020 02 28 2 N3 2020 03 10 我创建了一个自定义
Pandas read_sql 读取时更改大量 ID

我将 Oracle 数据库转移到 SQL Server 一切似乎都很顺利各种 ID 列都是很大的数字因此我不得不使用 Decimal 因为它们对于 BigInt 来说太大了我现在尝试使用 pandas read sql 使用 pyod
在循环中动态添加方法时的范围问题

我有一个 API 用于分析我的锻炼数据我抓取的数据跑卫 http runkeeper com 的网站我的主类是一个子类pandas DataFrame 它基本上是表格数据的容器它支持按列名索引返回列值的数组我想根据数据中存在的
mysql查询先慢后快

我有 2 个 myISAM 表分别称为 tests 和 completed tests 一个有 170 个条目另一个有 118k 条目当我运行此查询时 SELECT ct archive ct status ct score ct u
从 pandas 值序列创建 pandas 区间序列

我能找到的最接近的答案似乎太复杂如何在 pandas 中创建间隔列 https stackoverflow com a 47396828 575530 如果我有一个看起来像这样的 pandas 数据框 Value 6 12 56 60 1
Itertools 与嵌套循环性能

我必须生成列表中所有两对项目组合现在我知道有两种方法可以实现这一点嵌套 for 循环和 python 的内置迭代工具 from itertools import combinations foo 1 2 3 4 for i in xr
如何在大空间尺度上加速A*算法？

From http ccl northwestern edu netlogo models community Astardemo http ccl northwestern edu netlogo models community Ast
预填充 UICollectionView 单元重用队列

问题我有一个应用程序只有一个UICollectionView我第一次滚动它时很卡顿我已将来源范围缩小到正在创建新单元格 2 的事实使用initWithFrame 因为周围没有可以重复使用的细胞初始滚动后重用队列不为空单元格可以
组内条件计数

我想在之后进行条件计数groupby 例如按列的值分组A 然后计算每组中值出现的频率5出现在列中B 如果我整个过程都这样做DataFrame 只是len df df B 5 所以我希望我能做到df groupby A df B 5 siz
从 Golang 调用 C 函数

我想在 Golang 中编写控制器逻辑并处理 json 和数据库同时在 C 中使用我的数学处理模型在我看来调用 C 函数的开销必须尽可能低就像设置寄存器 rcx rdx rsi rdi 一样执行一些操作fastcall 并获取 r
将连续行与相同的列值合并

我有一个看起来像这样的东西我该如何处理 0 d 0 The DT 1 Skoll ORGANIZATION 2 Foundation ORGANIZATION 3 4 based VBN 5 in IN 6 Silicon LOCATIO
从 Pandas 数据框中删除值仅出现一次的行

我有一个包含不同 ID 的每月记录的数据框我只需要对具有多个月记录的 ID 进行一些分析 ID Month Metric1 Metric2 1 2018 01 01 4 3 1 2018 02 01 3 2 2 2018 02 01 1
将 numpy 数组写入文本文件的速度

我需要将一个非常高的两列数组写入文本文件而且速度非常慢我发现如果我将数组改造成更宽的数组写入速度会快得多例如 import time import numpy as np dataMat1 np random rand 1000
python 中的 Johansen 协整检验

我找不到任何有关在处理统计和时间序列分析 pandas 和 statsmodel 的 Python 模块中执行 Johansen 协整检验的功能的参考有谁知道是否有一些代码可以执行时间序列之间的协整测试现在这已在 Python 的 s

随机推荐

防止位图太大而无法上传到纹理android

我需要以图库形式全屏显示原始图像对于拇指来说它将完美地工作当我尝试使用原始源全屏显示该图像时它将无法显示大多数情况下如果图像分辨率大于2000 则会显示错误位图太大无法上传到纹理 android 我想阻止这种情况我搜索谷歌但
在条件作用域内声明隐式类型变量并在外部使用它

在下面的简化代码中 if city New York City var MyObject from x in MyEFTable where x CostOfLiving VERY HIGH select x else var MyObje
如何从Unity Player返回到之前运行的Android Activity？

我遇到了与本主题中提到的相同的问题将 Unity 与 Eclipse 集成单击后退按钮但建议的解决方案不起作用我有一个嵌入本机 Android 应用程序的 Unity 播放器我可以毫无问题地启动 Unity Player 但现在我想使
如何修复 iOS 中的“TIC SSL 信任错误”？

当我尝试使用网络服务登录应用程序时我也设置了我的plist file像下面这样我收到以下错误我的控制台上显示此错误 TIC SSL Trust Error 5 0x1c017fbc0 3 0 NSURLSession NSURLCon
NoSQL 中什么是先读后写？

我在一本书上读到 Cassandra是一个NoSQL数据库提倡先读后写而不是关系模型先读后写在 NoSQL 上下文中意味着什么先读后写意味着您在修改单元格之前先检查单元格的值 Read Before write 是 Cassand
为什么 ftell() 在 fread() 之后显示错误的位置？

在尝试使用 c fread 调用读取简单的文本文件时我遇到了一个非常奇怪的错误我做了一个非常简单的程序来显示该错误 int main int argc char argv FILE fh fopen adult txt r if fh
如何使用提交后挂钩将提交的文件从 SVN 复制到 Web 目录？

我的 Ubuntu 服务器安装了 Apache 和 Subversion 我使用该服务器作为临时服务器纯粹用于测试目的我使用 Apache 来托管 Web 应用程序并使用 Subversion 来保存源代码的版本控制副本我当前的工作
如何在 DDD 中管理领域逻辑和事件之间的事务？

我正在研究 DDD 和事件源中的编程我看到一个例子当调用域逻辑时例如Order placeOrder 它将发布一个事件例如OrderPlaced 并且事件将被发送到 MQ 作为事件存储域逻辑 Order placeOrder 应该
如何在 Windows 中使用 golang 清除控制台？

我尝试了很多方法比如 package main import os os exec func main c exec Command cls c Stdout os Stdout c Run and C system C CString
我可以自定义 Elastic Search 以使用我自己的停用词列表吗？

具体来说我想在没有停用词列表的情况下对所有内容例如谁进行索引 Elastic Search 是否足够灵活且易于更改默认情况下 elasticsearch 使用的分析器是标准分析仪使用默认的 Lucene 英语停用词我通过将以下内容
如何在jquery中的textarea中输入时显示文本

我正在寻找一种在 jquery 中的文本区域中输入时预览文本的方法正是你在 Stackoverflow 中使用的
如何打造私有财产？

我试图在我的土地上建立一个私有财产 m file interface MyClass Private property nonatomic retain NSMutableArray stuff end implementation MyC
使用 SFINAE 检测 constexpr

我正在努力升级一些 C 代码以利用 C 11 中的新功能我有一个特征类其中有一些返回基本类型的函数这些函数在大多数情况下但并非总是返回常量表达式我想根据功能是否是做不同的事情constexpr或不我想出了以下方法 templa
C# 对 StreamWriter 参数进行单元测试

我有一堆类它们都实现了一个接口其中一个参数是 StreamWriter 我需要检查 StreamWriter 的内容我试图找到一种方法来避免在测试服务器上写入文本文件并打开它们来检查内容有没有办法快速将 StreamWriter 内
是否可以与“const fn”的结果匹配？

我尝试过天真的方法 fn main gt Result lt Box
VS 2008 Intellisense 缺失：组合键绑定到当前不可用的命令

Intellisense 已停止处理我的 aspx 文件并且我查看了解决该问题的其他问题但没有解决方案当我尝试格式化 aspx 文档 Ctrl K Ctrl D 时状态栏显示组合键已绑定到当前不可用的命令格式文档轮廓不再显示我
如何在保存记录之前清理数据（删除 html 标签）？

我想知道 Rails3 是否有一种简单的方法可以在将输入数据保存到数据库之前从输入数据中删除 html 标签现在数据已由 HAML 在视图级别进行清理 JS 没有被执行之类的东西但我想完全删除潜在的有害数据基本上我的问题是是否有
是否可以在 Gradle 中定义 Android 字符串数组资源？

在 Android 版 Gradle 中我试图生成与此字符串数组资源等效的内容
来自扫描仪的 Java 循环/用户输入

制作一个简单的篮球程序我询问主队名称本赛季有多少场比赛然后循环询问下一场球队比赛基本上当我启动 do while 循环时它效果很好除非用户输入例如俄亥俄州例如输出将从剩余 6 场比赛变为剩余 4 场比赛通常它会问
Pandas to_excel-如何让它更快

我有一个包含 12 000 行和 34 列的数据框 pandas 将其写入 Excel 大约需要 15 秒我读到了一些关于 to excel 函数的讨论使其更快的一种方法是添加 engine xlsxwriter 我使用以下代码 wri

Pandas to_excel-如何让它更快

Pandas to_excel-如何让它更快 的相关文章

随机推荐

热门标签

Pandas to_excel-如何让它更快的相关文章