pandas 中的块总数

2024-04-20

在下面的脚本中,有没有办法找出总共有多少个“块”?

import pandas as pd
import numpy as np

data = pd.read_csv('data.txt', delimiter = ',', chunksize = 50000) 

for chunk in data:
    print(chunk)

Using len(chunk)只会告诉我每个人有多少。

有没有一种方法可以在不手动添加迭代的情况下做到这一点?


CSV 是基于行的,在全部扫描完毕之前,进程无法知道其中有多少行。

不过,假设 CSV 文件格式良好,则只需进行极少的扫描:

sum(1 for row in open('data.txt', 'r'))

如果您需要提前计算有多少块,这可能会很有用。完整的 CSV 阅读器对此来说有点大材小用了。上面的行具有非常低的内存要求,并且执行最少的解析。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

pandas 中的块总数 的相关文章

  • 数据操作 startdate enddate python pandas

    我有一个促销描述数据集 其中包含有关正在运行的各种促销活动及其开始日期 结束日期的信息 promo item start date end date Buy1 get 1 A 2015 01 08 2015 01 12 Buy1 get 1
  • 以类似字典的方式将新项目添加到某些结构化数组中

    我想扩展 numpy 中的结构化数组对象 以便我可以轻松添加新元素 例如 对于一个简单的结构化数组 gt gt gt import numpy as np gt gt gt x np ndarray 2 dtype names A B fo
  • 在 django 中构建动态表单

    我正在尝试根据存储在数据库中的字段及其定义动态构建一个表单 在我的数据库中 我定义了 1 个带有一些标签的复选框和 1 个带有一些标签的文本字段 如何根据数据库中的数据在我的视图中动态构建表单 Thanks 以下是我在 EuroDjango
  • 如何在代码中停止 autopep8 未安装消息

    我是一名新的 Python 程序员 使用 Mac 版本的 VS Code 1 45 1 创建 Django 项目 我安装了 Python 和 Django 扩展 每次我保存 Django 文件时 代码都会弹出此窗口 Formatter au
  • Django/gevent socket.IO 与 redis pubsub。我把东西放在哪里?

    我有一个独立的 python 脚本 它只是从 Twitter 的流 API 捕获数据 然后在收到每条消息时 使用 redis pubsub 将其发布到频道 tweets 这是该脚本 def main username username pa
  • 从 SQL Server 中调用 Python 文件

    我的文件名中有 Python 脚本 C Python HL py 在此 Python 脚本中 有预测模型以及对 SQL 数据库中某些表的更新 我想将此文件称为 SQL 作业 我怎样才能做到这一点 这个问题不一样 如何在 SQL Server
  • 无法将 python 数据框中的列类型从 object 转换为 str

    我已经下载了一个csv文件 然后将其读取到python dataframe 现在所有4列都有对象类型 我想将它们转换为str类型 现在dtypes的结果如下 Name object Position Title object Departm
  • 为 Keras 编写自定义数据生成器

    我将每个数据点存储在 npy 文件中 其中shape 1024 7 8 我想通过类似的方式将它们加载到 Keras 模型中ImageDataGenerator 所以我编写并尝试了不同的自定义生成器 但它们都不起作用 这是我改编的一个this
  • 包装 C++ Qt 小部件以便在 Python 中与 PySide 一起使用

    在 Python 中使用自定义 Qt 显示小部件包装自定义 C 库以便在基于 PySide 的 QApplication 中使用的最佳方法是什么 C 库是否需要特殊处理才能使用 SWIG 进行包装 封装的 Qt 小部件能否与 PySide
  • 将 Matlab MEX 文件中的函数直接嵌入到 Python 中

    我正在使用专有的 Matlab MEX 文件在 Matlab 中导入一些仿真结果 当然没有可用的源代码 Matlab 的接口实际上非常简单 因为只有一个函数 返回一个 Matlab 结构体 我想知道是否有任何方法可以直接从Python调用M
  • 如何从列表中删除“\xe2”

    我是 python 新手 正在使用它在我的项目中使用 nltk 对从网页获得的原始数据进行单词标记后 我得到了一个包含 xe2 xe3 x98 等的列表 但是我不需要这些并想删除它们 我只是尝试过 if x in a and if a st
  • 如何从 Selenium 获取元素的属性

    我正在 Python 中使用 Selenium 我想得到 val of a
  • 使用 PIL 合并图像时模式不匹配

    我正在传递 jpg 文件的名称 def split image into bands filename img Image open filename data img getdata red d 0 0 0 for d in data L
  • 在Python中计算矩阵乘以其转置(AA^T)的最快方法

    在Python中将矩阵与其转置 AA T 相乘的最快方法是什么 我认为 NumPy SciPy 没有考虑使用例如时涉及的对称性 np dot or np matmul 得到的矩阵总是对称的 所以我可以想象有一个更快的解决方案 None
  • Windows 10 上的 Tensorflow 安装问题

    我正在尝试在 Win 10 计算机上安装 Tensorflow 我成功安装了Python 3 7 然后尝试按照tensorflow org上的安装说明进行操作 执行时 pip install tensorflow 我收到以下错误消息 错误
  • Python中如何实现相对导入

    考虑 stuff init py mylib py Foo init py main py foo init py script py script py想要进口mylib py 这只是一个示例 但实际上我只想在父目录中进行模块的相对导入
  • 矩阵求逆 (3,3) python - 硬编码与 numpy.linalg.inv

    对于大量矩阵 我需要计算定义为的距离度量 尽管我确实知道强烈建议不要使用矩阵求逆 但我没有找到解决方法 因此 我尝试通过对矩阵求逆进行硬编码来提高性能 因为所有矩阵的大小均为 3 3 我预计这至少会是一个微小的改进 但事实并非如此 为什么
  • 继承自 NumPy 数组的类如何更改其自身的值?

    我有一个继承自 NumPy n 维数组的简单类 我想要该类的两个方法可以更改该类实例的数组值 其中一种方法应将类实例的数组设置为类实例的列表数据属性的值 另一种方法应将一些列表值附加到类实例的数组中 我不确定如何实现这一点 但我的尝试如下
  • 应用程序的外观 - Py2exe / wxPython

    所以我的问题是我的应用程序的外观和感觉 因为它看起来像一个旧的外观应用程序 它是一个 wxPython 应用程序 在 python 上它运行良好并且看起来不错 但是当我使用 py2exe 将其转换为 exe 时 外观很糟糕 现在我知道如果你
  • 如何访问模板缓存? - 姜戈

    I am 缓存 HTML在几个模板内 例如 cache 900 stats stats endcache 我可以使用以下方式访问缓存吗低级图书馆 例如 html cache get stats 我确实需要对模板缓存进行一些细粒度的控制 有任

随机推荐

  • 在 GoDaddy 上将 Surge CNAME 记录的主机名设置为 @

    我正在尝试使用 Surge 将我的投资组合部署到我的域 www dillonbartkus com 说明如下 我使用的是通过 Google Suite 购买的 GoDaddy 域名 在图中 它显示了主机名为的 CNAME 记录www and
  • 对 Java 操作应用超时控制

    我正在使用第三方 Java 库与 REST API 进行交互 REST API 有时可能需要很长时间才能响应 最终导致java net ConnectException被抛出 我想缩短超时时间 但无法修改第三方库 我想在 Java 方法的调
  • XMPP 服务器的 libxml2 与 expat

    我正在尝试从头开始创建一个 XMPP 库 以及后来的服务器 Go http golang org 尽管语言本身无关紧要 作为学习 XMPP 协议和服务器软件开发一般知识的一种手段 正如许多人所知 XMPP 是基于 XML 的消息传递协议 它
  • 当我的名称为字符串时如何执行 JavaScript 函数

    我有 JavaScript 中函数的名称作为字符串 如何将其转换为函数指针以便稍后调用 根据情况 我可能也需要将各种参数传递到该方法中 一些函数可能采用以下形式namespace namespace function args 不要使用ev
  • Django 超出 Postgres 最大连接数

    我在 Django 应用程序中遇到问题 该应用程序在运行时超出了与 Postgres 的最大同时连接数 100 Gunicorn与异步eventlet工人 当达到连接限制时 应用程序开始返回500 错误直到可以建立新的连接 这是我的数据库配
  • 在 ViewAnimator 中的按钮上执行(单击())后,Espresso 测试卡住/不活动

    Problem 我在运行 Espresso 测试时遇到问题 在登录按钮上调用 Perform click 方法后 测试继续运行 但不会继续运行 直到 45 秒过去并且测试自动失败 同时 登录正常 Context 我有一个 Activity
  • 如何正确使用 std::stod

    我正在编写一个简单的线性计算器 例如 用户可以输入两个方程 字符串 例如 y 5x 3 和 y 3x 6 该计算器最基本的功能是它将返回这两条线的交点 我似乎无法弄清楚的障碍是如何将字符串解析为两个数据 斜率和 y 截距 这是一个简单的计算
  • Mongoose 嵌套架构与嵌套模型

    在模式 子文档 中嵌套模式与创建两个单独的模型并引用它们之间有什么区别 它们的性能如何 子文件 const postSchema new Schema title String content String const userSchema
  • 错误:无法为 gevent 构建轮子,这是安装基于 pyproject.toml 的项目所必需的

    我正在使用Python 3 9 我尝试安装 python 包 pip exe install gdbgui 0 13 2 0 但这给了我一个错误 ERROR Failed building wheel for gevent Failed t
  • Conda 环境名称在 Powershell 中 conda init 后隐藏 git 分支

    我为 Powershell 安装了 Posh Git 模块 最近我还安装了 Anaconda 并执行了conda init 显然 这修改了profile ps1文件中添加以下代码 region conda initialize Conten
  • 设置应用组合唯一索引后在 mysql 上删除哪些行/忽略

    假设我有一个包含几列的表 我知道如何查找重复项 然后使用此表达式仅保留一条记录 添加组合索引 ALTER IGNORE TABLE part3 ADD UNIQUE INDEX gtu region trait pop author ris
  • 如何通过 app.json 在 Heroku 上运行 Docker Hub 容器?

    我想为开源项目创建一个 部署到 Heroku 按钮 单击该按钮时 我希望 Heroku 从 Docker hub 部署最新的映像 我怎样才能通过我的app json显现 The app json 架构 https devcenter her
  • 无法访问EC2中安装的tomcat实例

    我已在 Ubuntu EC2 实例中安装 tomcat 7 它已启动并正在运行 但我无法使用公共 IP 54 213 225 148 8080 访问它 我还按照之前的帖子中指定的方式设置了安全组 但是 仍然没有运气 对此的任何帮助将不胜感激
  • 如何测试应用商店购买收据获取原始应用版本

    我想在应用程序启动时加载应用程序购买收据 如何模拟应用程序购买 不是应用程序内购买 而是实际的应用程序购买 以便我获得收据 我正在尝试从付费变为免费增值 我正在使用此代码加载收据 BOOL isAppPreviouslyPurchased
  • 自 Symfony 2.8 以来生成捆绑包时询问多应用程序的新选项

    在 Symfony 2 8 之前 因为我需要 Symfony 中的多应用系统 我遵循这两篇文章来实现这一目标 http jolicode com blog multiple applications with symfony2 http j
  • 替换viewpager中的片段

    我目前在用另一个片段替换 ViewPager 中的某个片段时遇到问题 想要替换的片段 id 是我的 部门 它有一个 Imagebutton id 用来开始替换 我尝试应用其他类似问题的一些建议 其中大多数都是旧的 并且在允许嵌套片段的新 a
  • 32 位 .NET 应用程序和 64 位 .NET 应用程序之间有区别吗?

    我的理解是 NET 应用程序是独立于平台的 因此纯 NET 代码应该在 x86 或 64 位机器上运行 除非您的 NET 代码调用某些本机代码 否则它是平台相关的 真的吗 NET http en wikipedia org wiki NET
  • 如何在Python中查找绑定方法的实例?

    gt gt gt class A object def some self pass gt gt gt a A gt gt gt a some
  • MVC 4如何正确地将数据从控制器传递到视图

    我目前有一个带有 LINQ 语句的控制器 我将数据从该语句传递到我的视图 我正在尝试寻找一种更有效 更好的编码方法来做到这一点 我的家庭控制器声明如下 Var Melt Furnace1 from item in db tbl dppITH
  • pandas 中的块总数

    在下面的脚本中 有没有办法找出总共有多少个 块 import pandas as pd import numpy as np data pd read csv data txt delimiter chunksize 50000 for c