在下面的脚本中,有没有办法找出总共有多少个“块”?
import pandas as pd
import numpy as np
data = pd.read_csv('data.txt', delimiter = ',', chunksize = 50000)
for chunk in data:
print(chunk)
Using len(chunk)
只会告诉我每个人有多少。
有没有一种方法可以在不手动添加迭代的情况下做到这一点?
CSV 是基于行的,在全部扫描完毕之前,进程无法知道其中有多少行。
不过,假设 CSV 文件格式良好,则只需进行极少的扫描:
sum(1 for row in open('data.txt', 'r'))
如果您需要提前计算有多少块,这可能会很有用。完整的 CSV 阅读器对此来说有点大材小用了。上面的行具有非常低的内存要求,并且执行最少的解析。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)