向数据框添加行的有效方法

2024-04-17

由此question https://stackoverflow.com/questions/28056171/how-to-build-and-fill-pandas-dataframe-from-for-loop和其他人似乎不建议使用concat or append构建 pandas 数据框，因为它每次都会重新复制整个数据框。

我的项目涉及每 30 秒检索少量数据。这可能会运行 3 天的周末，因此有人很容易预计一次会创建超过 8000 行。向此数据框添加行的最有效方法是什么？

我用了这个答案df.loc[i] = [new_data]建议，但我有 > 500,000 行，而且速度非常慢。

虽然给出的答案对于OP的问题很有帮助，但我发现在预先处理大量行时（而不是OP描述的欺骗）使用csvwriter将数据添加到内存中的CSV对象更有效，然后最后使用pandas.read_csv(csv)生成所需的 DataFrame 输出。

from io import BytesIO
from csv import writer 
import pandas as pd

output = BytesIO()
csv_writer = writer(output)

for row in iterable_object:
    csv_writer.writerow(row)

output.seek(0) # we need to get back to the start of the BytesIO
df = pd.read_csv(output)
return df

对于约 500,000 行，速度提高了 1000 倍，并且随着行数的增加，速度提升只会变得更大（the df.loc[1] = [data]相对来说会慢很多）

希望这可以帮助那些在处理比OP更多的行时需要效率的人。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

向数据框添加行的有效方法的相关文章

如何有条件地组合两个相同形状的 numpy 数组

这听起来很简单但我想我把它想得太复杂了我想创建一个数组其元素是从两个形状相同的源数组生成的具体取决于源数组中哪个元素更大为了显示 import numpy as np array1 np array 2 3 0 array2 np
蟒蛇 |如何将元素随机添加到列表中

有没有一种方法可以将元素随机添加到列表中内置函数 ex def random append lst a lst append b lst append c lst append d lst append e return print ls
无法将 datetime.datetime 与 datetime.date 进行比较

我有以下代码并收到上述错误由于我是 python 新手我无法理解这里的语法以及如何修复错误 if not start or date lt start start date 有一个datetime date 从日期时间转换为日期的方法
Pytest：如何使用从夹具返回的列表来参数化测试？

我想使用由固定装置动态创建的列表来参数化测试如下所示 pytest fixture def my list returning fixture depends on other fixtures return a dynamically
对打开文件的脚本进行单元测试

我编写了一个脚本它打开一个文件读取内容并进行一些操作和计算并将它们存储在集合和字典中我该如何为这样的事情编写单元测试我的问题具体是我会测试文件是否打开文件很大这是unix字典文件我如何对计算进行单元测试我真的必须手动计算
如何在“python setup.py test”中运行 py.test 和 linter

我有一个项目setup py文件我用pytest作为测试框架我还在我的代码上运行各种 linter pep8 pylint pydocstyle pyflakes ETC 我用tox在多个 Python 版本中运行它们并使用以下命令构
如何用xlrd读取公式

我正在尝试做一个解析器它读取几个 Excel 文件我通常需要位于行底部的值您可以在其中找到所有上部元素的总和因此单元格值实际上是 sum 或 A5 0 5 可以说对于使用 Excel 打开此文件的用户来说它看起来像一个数字这
multiprocessing.freeze_support()

为什么多处理模块需要调用特定的function http docs python org dev library multiprocessing html multiprocessing freeze support在被冻结以生成 Wi
使用 Python 中的 IAM 角色访问 AWS API Gateway

我有一个 AWS API 网关我想使用它来保护其安全IAM 角色 http docs aws amazon com apigateway latest developerguide permissions html 我正在寻找一个包来帮助
在 Windows 上将 Word2vec 与 Tensorflow 结合使用

In 本教程文件 https github com tensorflow models blob master tutorials embedding word2vec py L45通过 Tensorflow 找到以下行第 45 行来加
如何将同步函数包装在异步协程中？

我在用着aiohttp https github com aio libs aiohttp构建一个 API 服务器将 TCP 请求发送到单独的服务器发送 TCP 请求的模块是同步的对于我来说是一个黑匣子所以我的问题是这些请求阻塞了整
如何解码 dtype=numpy.string_ 的 numpy 数组？

我需要使用 Python 3 解码按以下方式编码的字符串 gt gt gt s numpy asarray numpy string hello nworld gt gt gt s array b hello nworld dtype S1
Pandas，按最大返回值进行分组 AssertionError：

熊猫有问题我想听听你的意见我有这个数据框我需要在其中获取最大值代码就在下面 df stack pd DataFrame 1 0 2016 0 NonResidential Hotel 98101 0 DOWNTOWN 47 6122
如何在 Keras 中使用部分输入进行训练，其余部分用于损失函数

我是 Keras 新手正在尝试实现神经网络机器学习模型输入张量看起来像 X1 X2 和输出 Y 注意 X1 和 X2 是相关的在模型中只有 X1 将用于训练但 X1 和 X2 都将传递给损失函数该损失函数是 X1 X2 y pr
从 python 中的缩进文本文件创建树/深度嵌套字典

基本上我想迭代一个文件并将每行的内容放入一个深层嵌套的字典中其结构由每行开头的空格数量定义本质上目标是采取这样的事情 a b c d e 并将其变成这样的东西 a b c d e Or this apple colours red
如何表示类的实例与将其作为输入的类之间的关系？

我有一堂课叫House 这个类的实例是house class House def init self height length self height height self length length def housePlan hou
DRF：以编程方式从 TextChoices 字段获取默认选择

我们的网站是 Vue 前端 DRF 后端在一个serializer validate 方法我需要以编程方式确定哪个选项TextChoices类已被指定为模型字段的默认值 TextChoices 类缩写示例 class PaymentM
如何使用 FastAPI 在 HTMX 前端中使用 HX-Redirect？

我试图在登录后在前端重定向我像这样从我的 htmx 前端发出请求
Django - 缺少 1 个必需的位置参数：'request'

我收到错误 get indiceComercioVarejista 缺少 1 个必需的位置参数要求当尝试访问 get indiceComercioVarejista 方法时我不知道这是怎么回事 views from django ht
Python 中的迭代器 (iter()) 函数。 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案对于字典我可以使用iter 用于迭代字典的键 y x 10 y 20 for val in iter y print val 当

随机推荐

如何在 `git rm abc.c` 之后恢复文件？

我应该删除另一个文件git rm abc c 但我删错了我怎样才能恢复它现在当我发出git status 它说 deleted abc c 顺便说一句我现在还有其他未提交的更改您需要执行两个命令第一个命令将取消暂存文件将其
无法使用 mono 命令提示符为 gtk# 编译 hello.cs

本来希望this https stackoverflow com questions 8835352 cannot compile gtk example会有所帮助但会出现不同的错误尝试将以下内容编译为 hello cs using G
将 CloudTrail 日志导入 Logstash

我正在尝试将日志从 CloudTrail 获取到 ElasticSearch 中以便我们可以更好地了解 AWS 账户中发生的情况我已经在我的机器 Ubuntu 14 04 上设置了 Logstash 和 ElasticSearch 并且
在 Django 中，如何查找属于字符串一部分而不是包含该字符串的术语？

例如我的表中两个字段下有三行如下所示 id name 1 brown cat 2 black dog 3 person 这里出现了一个字符串或者一个句子 A brown cat jumps over a person 我如何使用这个字
如何让 python setuptools 找到顶级模块

我有一个包其结构简化如下所示 mypackage init py setup py module1 py module2 py mysubpackage init py mysubmodule1 py mysubmodule2 py
如何在 Jenkins 管道中的 zip 文件管道实用程序插件中排除 Jenkinsfile 和自动化脚本

我在詹金斯的工作区结构如下图所示 automation scripts dist assets datasim images icons node modules src config pm2 json package json 在上面的目
这段用于确定圆和线段是否相交的代码正确吗？

显然很难找到一条线是否存在的答案segment和圆相交例如如果你用谷歌搜索你会发现这个问题 https stackoverflow com questions 1073336 circle line segment collision
boost:asio IPv4 地址和 UDP 通信

问题已解决请参阅底部的解决方案说明我正在尝试构建一个简单的应用程序来测试支持以太网的微控制器我想做的就是发送和接收小 UDP 数据包该代码使用 boost asio 进行网络连接并且非常简单为了调试我将所有初始化移出构造函数
在测试环境 (Mac OS X) 中模拟较差的带宽？

我们有一个定制的 Flash HTML5 视频播放器供我们网站上的用户使用我目前正在为带宽次优的用户充实体验基本上我们希望客户端代码能够检测到由于过度缓冲而导致的不良用户体验我想在我的本地开发环境中测试这个带宽不足处理代码有
有没有办法在不同平台上测试phonegap构建应用程序

所以我使用Android开发sdk开发了一个phonegap应用程序我使用 Phonegap build 为 Simbian WebOS Windows iOS 和 Blackberry 构建我的项目但我没有用于这些平台的设备来测试我的
更改 MySQL 表以添加外键约束会导致错误

问题为什么在尝试更改具有外键约束的表时会出现错误 Details 我有1张桌子 HSTORY我将其用作所有其他特定历史表即USER HISTORY BROWSER HISTORY PICTURE HISTORY 我还包括了PICTURE
是否可以使用 __rmod__ 覆盖 str 的 % 行为？

我想做 x doSomething y 对于任何 x 和任何 y 来说这都很容易做到参见下面的代码但 x 是 str 的情况除外有没有什么方法例如添加特殊方法或引发特定错误导致旧式字符串格式化失败类似于 1 doSomthin
实体框架多重聚合性能

我有一个关于实体框架查询构建的问题 Schema 我有一个这样的表结构 CREATE TABLE dbo DataLogger ID bigint IDENTITY 1 1 NOT NULL ProjectID bigint NULL CO
使用 Ransack 搜索值数组

我是 Ransack 的新手我遇到了 Ransack 未明确涵盖的案例我基本上试图搜索一个值但搜索到的值包含在一个数组中 CODE 最后还有这一段user rep code list cont这是用户的默认数组属性目前看起来像这样
如何在javascript函数中获取Table的所有td值

我有一个数据表其中显示子行展开折叠功能它运行良好但我想获取表的最后一个 td 的内容现在我创建了一个函数该函数在数据表中放置一些硬编码值扩大的地方在那个地方我想得到那些 td 值这是我发布的代码
如何向JTable中插入数据？

我编写此代码用于在表中显示字符串但它没有显示并且没有任何效果有什么问题吗 public pamnel initComponents String columnNames First Name Last Name Sport of Yea
ASP.NET MVC 和 Web 服务

向我的 ASP NET MVC 项目添加 Web 服务是否会破坏 MVC 的整个概念该 Web 服务 WCF 依赖于我的 MVC 项目中的模型层来与后端进行通信因此在我看来它需要成为 MVC 解决方案的一部分我应该将其添加到控制器层
让 Scala 在 .net 上运行的分步指南？

我从未使用过 Net 框架需要向某人证明 Scala 确实可以在 Net 上运行我需要使用 Scala 进行快速而肮脏的 Net 设置以处理一些现有的 JVM Scala 代码我找不到这方面的分步指南我将不胜感激一些这方面的资
如何在 Xcode 中禁用一个文件的优化

我的 Xcode 项目依赖于另一个库当我使用以下命令构建项目时这会导致项目出现错误 O3 option 这些错误仅存在于一个文件中所以我想关掉 O3 该文件的选项是否可以打开目标看下Build Phases 打开Compile
向数据框添加行的有效方法

由此question https stackoverflow com questions 28056171 how to build and fill pandas dataframe from for loop和其他人似乎不建议使用con

向数据框添加行的有效方法

向数据框添加行的有效方法 的相关文章

随机推荐

热门标签

向数据框添加行的有效方法的相关文章