如何制作从大型 xlsx 文件加载 pandas DataFrame 的进度条？

2024-01-10

from https://pypi.org/project/tqdm/ https://pypi.org/project/tqdm/:

import pandas as pd
import numpy as np
from tqdm import tqdm

df = pd.DataFrame(np.random.randint(0, 100, (100000, 6)))
tqdm.pandas(desc="my bar!")p`
df.progress_apply(lambda x: x**2)

我获取了这段代码并对其进行了编辑，以便从 load_excel 创建一个 DataFrame 而不是使用随机数：

import pandas as pd
from tqdm import tqdm
import numpy as np

filename="huge_file.xlsx"
df = pd.DataFrame(pd.read_excel(filename))
tqdm.pandas()
df.progress_apply(lambda x: x**2)

这给了我一个错误，所以我将 df.progress_apply 更改为：

df.progress_apply(lambda x: x)

这是最终的代码：

import pandas as pd
from tqdm import tqdm
import numpy as np

filename="huge_file.xlsx"
df = pd.DataFrame(pd.read_excel(filename))
tqdm.pandas()
df.progress_apply(lambda x: x)

这会产生一个进度条，但它实际上并不显示任何进度，而是加载进度条，当操作完成时，它会跳转到 100%，从而达不到目的。

我的问题是：如何使这个进度条发挥作用？
Progress_apply 内部的函数实际上做了什么？
有更好的方法吗？也许是 tqdm 的替代品？

任何帮助是极大的赞赏。

以下是利用 tqdm 的单行解决方案：

import pandas as pd
from tqdm import tqdm

df = pd.concat([chunk for chunk in tqdm(pd.read_csv(file_name, chunksize=1000), desc='Loading data')])

如果您知道要加载的总行数，则可以使用参数添加该信息total到 tqdm 函数，产生百分比输出。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Excel

pandas

tqdm

如何制作从大型 xlsx 文件加载 pandas DataFrame 的进度条？的相关文章

Python 中的舍入浮点问题

我遇到了 np round np around 的问题它没有正确舍入我无法包含代码因为当我手动设置值而不是使用我的数据时返回有效但这是输出 In 177 a Out 177 0 0099999998 In 178 np rou
Pandas/Google BigQuery：架构不匹配导致上传失败

我的谷歌表中的架构如下所示 price datetime DATETIME symbol STRING bid open FLOAT bid high FLOAT bid low FLOAT bid close FLOAT ask open
处理 Python 行为测试框架中的异常

我一直在考虑从鼻子转向行为测试摩卡柴等已经宠坏了我到目前为止一切都很好但除了以下之外我似乎无法找出任何测试异常的方法 then It throws a KeyError exception def step impl contex
跟踪 pypi 依赖项 - 谁在使用我的包

无论如何是否可以通过 pip 或 PyPi 来识别哪些项目在 Pypi 上发布可能正在使用我的包也在 PyPi 上发布我想确定每个包的用户群以及可能尝试积极与他们互动预先感谢您的任何答案即使我想做的事情是不可能的这实际上是不
Python zmq SUB 套接字未接收 MQL5 Zmq PUB 套接字

我正在尝试在 MQL5 中设置一个 PUB 套接字并在 Python 中设置一个 SUB 套接字来接收消息我在 MQL5 中有这个 include
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
如何使用 Mysql Python 连接器检索二进制数据？

如果我在 MySQL 中创建一个包含二进制数据的简单表 CREATE TABLE foo bar binary 4 INSERT INTO foo bar VALUES UNHEX de12 然后尝试使用 MySQL Connector P
如何使用python在一个文件中写入多行

如果我知道要写多少行我就知道如何将多行写入一个文件但是当我想写多行时问题就出现了但是我不知道它们会是多少我正在开发一个应用程序它从网站上抓取并将结果的链接存储在文本文件中但是我们不知道它会回复多少行我的代码现在如下 r
pyspark 将 twitter json 流式传输到 DF

我正在从事集成工作spark streaming with twitter using pythonAPI 我看到的大多数示例或代码片段和博客是他们从Twitter JSON文件进行最终处理但根据我的用例我需要所有字段twitter J
javascript 是否有等效的 __repr__ ？

我最接近Python的东西repr这是 function User name password this name name this password password User prototype toString function r
Jupyter Notebook 找不到 Python 模块

不知道发生了什么但每当我使用 ipython 氢原子或 jupyter 笔记本时都找不到任何已安装的模块我知道我安装了 pandas 但笔记本说找不到我应该补充一点当我正常运行脚本时 python script py 它确实导入
pip 列出活动 virtualenv 中的全局包

将 pip 从 1 4 x 升级到 1 5 后pip freeze输出我的全局安装系统软件包的列表而不是我的 virtualenv 中安装的软件包的列表我尝试再次降级到 1 4 但这并不能解决我的问题这有点类似于这个问题 http
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
如何在 VBA 中声明接受 XlfOper (LPXLOPER) 类型参数的函数？

我在之前的回答里发现了问题 https stackoverflow com q 19325258 159684一种无需注册即可调用 C xll 中定义的函数的方法我之前使用 XLW 提供的注册基础结构并且使用 XlfOper 类型在 V
Scipy Sparse：SciPy/NumPy 更新后出现奇异矩阵警告

我的问题是由大型电阻器系统的节点分析产生的我基本上是在设置一个大的稀疏矩阵A 我的解向量b 我正在尝试求解线性方程A x b 为了做到这一点我正在使用scipy sparse linalg spsolve method 直到最近一切都
在 JavaScript 函数的 Django 模板中转义字符串参数

我有一个 JavaScript 函数它返回一组对象 return Func id name 例如我在传递包含引号的字符串时遇到问题 Dr Seuss ABC BOOk 是无效语法 I tried name safe 但无济于事有什么解
更改 Tk 标签小部件中单个单词的颜色

我想更改 Tkinter 标签小部件中单个单词的字体颜色我知道可以使用文本小部件来实现与我想要完成的类似的事情例如使单词 YELLOW 显示为黄色 self text tag config tag yel fg clr yellow s
cv2.VideoWriter：请求一个元组作为 Size 参数，然后拒绝它

我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频构造 VideoWriter 对象时文档表示 Size 参数应该是一个元组当我给它一个元组时它拒绝它当我尝试用其他东西替换它时它不会接受它因为它说参数不是
Kivy - 单击按钮时编辑标签

我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo

随机推荐

django-filter：使用 ChoiceFilter 并根据请求进行选择

我正在使用 django filter 并需要添加ChoiceFilter根据我收到的请求进行选择我正在阅读 ChoiceFilter 的文档但它说 This filter matches values in its choices a
将 csv 最快导入数据库表

我已经实现了一个导入功能该功能从 Asp Net 应用程序中的 csv 文件获取数据文件大小可以从几 kb 到最大 10 MB 不等但是当发生导入并且文件大小 gt 50000 时大约需要 20 分钟这时间太多了我需要在 2
如何在由javascript创建的html中显示动态url图像

我试图通过 Javascript 生成的动态链接直接以 HTML 形式显示图像 function dynamicUrl var url http xxx xxx xxx dynamic variables jpg return url 我的
适用于多类型用户的猫鼬模型

我正在用 MEAN stack 为学生和老师建立一种社交网络学生有自己的帐户页面与教师的帐户页面不同我有一个供教师和学生使用的注册页面注册时用户必须使用 select html 标签选择帐户的类型学生或教师我想要一个代表两种
UITableView reloadData 导致 UITextField 辞职 FirstResponder

我有一个文本字段设置为使用输入的每个字母更改 tableView 的数据源并调用 reloadData 但由于某种原因每次输入字母时键盘都会消失有人知道为什么吗您的文本字段正在辞职因为重新加载的单元格被发送 resignFir
Three.js：在场景角落显示世界坐标轴

我想在相机的右下角显示指示世界坐标方向 x y z 的箭头就像在 Maya 中所做的那样这样当围绕对象旋转相机或在场景中移动时您仍然可以识别世界坐标的方向我尝试使用两种不同的方法来完成此任务但到目前为止都没有奏效我有一个带有三个
[IllegalStateException]：Spark 结构化流正在终止流查询并出现错误

我创建了一个 Spark 结构化流应用程序在应用程序中我从 Kafka 主题中提取数据为了恢复目的我使用检查点我面临的挑战如下 ERROR StreamExecution Query id cf9e0f0a 653a 4246 a
MySQL 在一个查询中进行多个连接？

我有以下查询 SELECT dashboard data headline dashboard data message dashboard messages image id FROM dashboard data INNER JOIN
SWIG ImportError：未定义的符号：_Py_RefTotal

我对 SWIG 真的很陌生我尝试编译 SWIG 中给出的示例但出现以下错误 python Python 2 6 5 r265 79063 Apr 16 2010 13 09 56 GCC 4 4 3 on linux2 Type hel
Spring Cloud 发现多个服务版本

我在问自己一个问题但没有找到答案也许这里有人对此有想法在 Spring Cloud 中使用服务注册表 Eureka 与 RestTemplate 和 Feign 客户端我有不同的构建版本的同一服务通过 Actuator 的 inf
模拟 textarea Jest 测试的更改

我有以下组件 render return
有什么方法可以使 R 中散点图中的绘图点更加透明吗？

我有一个 3 列矩阵绘图由基于第 1 列和第 2 列值的点绘制但基于第 2 列 6 个不同组着色我可以成功绘制所有点但是分配了紫色的最后一个绘图组组 6 掩盖了其他组的绘图有没有办法让情节更加透明 s lt read tab
单击被忽略：与表单控件关联的标签元素存在问题

我已使用 for 属性将标签元素关联到表单字段当我在表单字段下方显示验证消息时会出现此问题例如在下面的演示中表单字段 1 有一个必需的验证 onblur 单击标签选择表单字段 1 Now click在表单字段 2 标签上应将焦点
重写类和实例方法的 method_missing 吗？

我正在尝试编写一个通用模块以将动态方法创建的 method missing 模式应用于我的一些 Rails 模型这些模型既有类方法又有实例方法虽然我可以相当直接地为任一类情况编写模块 module ClassVersion exten
在 Angular 9 中如何强制 http 客户端响应模型中的属性日期类型？

我正在开发 Angular 9 项目我收到的回复之一包含 type 的属性Date 但是当我发送请求时 MyModel class MyModel prop string myDate Date request sent like thi
ProGuard 可能会导致错误的计算

我遇到了一个非常奇怪的错误下面的一小段代码使用了相当简单的数学 protected double C n k int n int k if k lt 0 k gt n return 0 double s 1 for int i 1 i l
Javascript |无法用 String.replace() 替换 \n

我有解析网站并从数据库中获取信息的代码它看起来像这样 var find body match text date 结果我有 n n n n 然后我尝试替换 n 但它不起作用 var str find 1 replace new RegE
SQLite 数据库文件使用什么扩展名重要吗？

SQLite 数据库使用的文件扩展名有优点还是缺点 SQLite 本身似乎不需要命名约定但可能还有其他原因导致特定扩展有用或有问题例如某些工具编程语言安装程序等或最终用户考虑因素最常见的似乎是 sqlite db and db
匿名哈希切片 - 语法？

我喜欢哈希片并经常使用它们 my h h keys vals 效果非常好但有两件事一直困扰着我首先是否可以将上面的两行合并为一行代码如果能够声明哈希并一次性填充所有内容那就太好了其次是否可以对现有的匿名哈希进行切片例如 my
如何制作从大型 xlsx 文件加载 pandas DataFrame 的进度条？

from https pypi org project tqdm https pypi org project tqdm import pandas as pd import numpy as np from tqdm import tqd

如何制作从大型 xlsx 文件加载 pandas DataFrame 的进度条？

如何制作从大型 xlsx 文件加载 pandas DataFrame 的进度条？ 的相关文章

随机推荐

热门标签

如何制作从大型 xlsx 文件加载 pandas DataFrame 的进度条？的相关文章