Python 读取输入的最快方法

2023-11-22

我想读取一个包含整数列表列表的巨大文本文件。现在我正在执行以下操作：

G = []
with open("test.txt", 'r') as f:
    for line in f:
        G.append(list(map(int,line.split())))

然而，大约需要 17 秒（计时）。有什么办法可以减少这个时间吗？也许，有一种方法可以不使用地图。

numpy 有以下功能loadtxt and genfromtxt，但都不是特别快。在广泛分布的图书馆中可用的最快的文本阅读器之一是read_csv函数于pandas (http://pandas.pydata.org/）。在我的计算机上，读取每行包含两个整数的 500 万行大约需要 46 秒numpy.loadtxt, 26 秒numpy.genfromtxt，以及 1 秒多一点的时间pandas.read_csv.

这是显示结果的会话。（这是在Linux，Ubuntu 12.04 64位上。你在这里看不到它，但是每次读取文件后，通过运行清除磁盘缓存sync; echo 3 > /proc/sys/vm/drop_caches在一个单独的 shell 中。）

In [1]: import pandas as pd

In [2]: %timeit -n1 -r1 loadtxt('junk.dat')
1 loops, best of 1: 46.4 s per loop

In [3]: %timeit -n1 -r1 genfromtxt('junk.dat')
1 loops, best of 1: 26 s per loop

In [4]: %timeit -n1 -r1 pd.read_csv('junk.dat', sep=' ', header=None)
1 loops, best of 1: 1.12 s per loop

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 读取输入的最快方法的相关文章

希伯来语中的稀疏句子标记化错误

尝试对希伯来语使用稀疏句子标记 import spacy nlp spacy load he doc nlp text sents list doc sents I get Warning no model found for he Onl
为什么我的代码不能根据字典解码加密字符串？

我有一本字典其中包含代表字母的键和值例如一个简单的 DICT CODE b g n a p o x d t y 我收到了一个加密代码并将该字符串转换为一个列表其中每个项目都是一个单词我需要根据字典中的项目来解决它代码示例是 wo
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器？

如何在 PyCharm 4 5 2 中使用 PyPy 作为标准默认解释器一切都在 Ubunutu 14 10 下运行并且 pypy 已经安装您可以在项目的设置下进行配置这个官方文档直接涵盖了 https www jetbrains
根据开始列和结束列扩展数据框（速度）

我有一个pandas DataFrame含有start and end列加上几个附加列我想将此数据框扩展为一个时间序列从start值并结束于end值但复制我的其他专栏到目前为止我想出了以下内容 import pandas as
numpy 使用 datetime64 进行数字化

我似乎无法让 numpy digitize 与 datetime64 一起使用 date bins np array np datetime64 datetime datetime 2014 n 1 s for n in range 1 1
如何将 self 传递给装饰器？

我该如何通过self key下面进入装饰器 class CacheMix object def init self args kwargs super CacheMix self init args kwargs key func Cons
PyMC3-自定义 theano Op 进行数值积分

我使用 PyMC3 进行参数估计使用必须定义的特定似然函数我用谷歌搜索了一下发现我应该使用densitydist实现用户定义的似然函数的方法但它不起作用如何在 PyMC3 中合并用户定义的似然函数并找出最大 aposteriori
为什么我无法在 Mac OS X Terminal.app 上的 Python 解释器中显示 unicode 字符？

如果我尝试粘贴 unicode 字符例如中间的点在我的 python 解释器中它什么也不做我在 Mac OS X 上使用 Terminal app 当我只是在 bash 中时我没有遇到任何问题但在解释器中 python Pytho
django-admin.py makemessages 不起作用

我正在尝试翻译一个字符串 load i18n trans Well Hello there how are you to Hola amigo que tal 我的 settings py 文件有这样的内容 LOCALE PATHS os
如何使用 sys.path.append 在 Python 中导入文件？

我的桌面上有两个目录 DIR1 and DIR2其中包含以下文件 DIR1 file1 py DIR2 file2 py myfile txt 这些文件包含以下内容 file1 py import sys sys path append s
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
禁用复选框上的输入

需要在取消选中该复选框时禁用输入并在选中该复选框时启用它我的代码是这样的 div class y div
如何使用 Keras ImageDataGenerator 预测单个图像？

我已经训练 CNN 对图像进行 3 类分类在训练模型时我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它现在我的网络在测试集上训练得非常准确但我不知道如何在单图像预测上应用预处理功能如
检测 IDLE 的存在/如何判断 __file__ 是否未设置

我有一个脚本需要使用 file 所以我了解到 IDLE 没有设置这个有没有办法从我的脚本中检测到 IDLE 的存在 if file not in globals file is not set 如果你想做一些特别的事情 file 未设置
为什么 smtplib.SMTP().sendmail 不发送 DKIM 签名邮件

我已经在服务器上设置了 postfix 以及 openDKIM 当我跑步时 echo Testing setup mail s Postfix test my email address 我收到电子邮件邮件标题中有一个DKIM Signa
Python 通过从现有 csv 文件中过滤选定的行来写入新的 csv 文件

只是一个问题我试图将 csv 文件中的选定行写入新的 csv 文件但出现错误我试图读取的 test csv 文件是这样的两列 2013 9 1 2013 10 2 2013 11 3 2013 12 4 2014 1 5 2014
Python：高精度time.sleep

你能告诉我如何在 Win32 和 Linux 上的 Python 2 6 中获得高精度睡眠函数吗您可以在中使用浮点数sleep http docs python org library time html time sleep 该参数可以
如何为所有用户安装 Anaconda python？

Anaconda python 发行版 https store continuum io cshop anaconda 非常方便地部署科学计算环境 SCE 并根据需要切换python版本默认情况下安装会将 python 定位到 anac
使用 urllib 编码时保持 url 参数有序

我正在尝试用 python 模拟 get 请求我有一个参数字典并使用 urllib urlencode 对它们进行 urlencode 我注意到虽然字典的形式是 k1 v1 k2 v2 k3 v3 urlencoding 后参数的顺序切

随机推荐

在没有 UAC 提示的情况下从 .NET 应用程序执行进程

我有一个场景我需要从 NET 应用程序启动 EXE 但我无法绕过弹出的 UAC 提示甚至在另一个 EXE 启动之前就会触发提示可能是在调用时Process Start 我使用此代码来启动应用程序 var info new Proces
CSS（也许带有Compass）：跨浏览器渐变

我想在 CSS 中获得渐变也许通过Compass 适用于所有主要浏览器包括 IE7 有没有一种简单的方法可以做到这一点无需编写大量代码也无需自定义图像文件我看了指南针的梯度混合但它不适用于 Internet Explorer 有
网址中可以输入中文吗？

URL中可以输入中文吗经测试 URL中可以输入中文并且会转换为punycode并发出请求到达相关页面但目前是否还有其他人会验证网站 URL 是否也允许使用中文字符 Punycode 的存在是为了能够在不受支持的软件中使用非拉丁脚本
使用 jQuery Ajax 获取另一个页面的 div 内容

我希望 page html 通过 ajax 请求 side html 的内容并提取其两个 div 的内容但尽管我尝试了一切但我无法找到解析响应的正确方法这是 side html div ContentA div div Content
如果不等待任务怎么办？

这是我的代码 private static Stopwatch stopwatch static void PrintException Exception ex Console WriteLine stopwatch Elapsed Co
Facebook 广告 API 错误 - 未启用使用

因此我一直在尝试创建一个使用 Facebook Ads API 来获取广告费用和统计数据的应用程序我已经创建了一个应用程序并将我的广告帐户 ID 添加到应用程序设置中但仍然收到错误 error message 274 The ad a
为什么使用 C++ Typedef？

我对 typedef 的理解是给一个声明一个别名这样的 int 声明现在将被称为 Integer 但为什么为什么有人会使用 typedef 更有利的原因是什么 typedef int Integer Integer blamo 50 c
C++ 中的粗体输出

我正在构建一本字典当我打印输出单词定义时我想以粗体打印单词本身当我打印时 cout lt
您可以通过 Flex 使用 Amazon S3 吗？

由于缺少 clientaccesspolicy xml 通过 Flex 使用 Amazon S3 似乎存在问题有什么解决办法吗 Edit 下面的两个答案都很棒并且有效我都赞成我不会为这个问题指定答案因为它们都有效您可以通过 Fle
在 VB 中键入时，如何使智能感知上的 Enter 键的反应方式与 Visual Studio 中的 C# 中的反应方式相同？

我使用的是 Visual Studio 2008 并且习惯了 C 当智能感知弹出时我通过按 Enter 键选择我想要的内容它不会跳到下一行在 VB 中当我在智能感知上按下回车键时我会跳转到下一行有谁知道这个智能感知选项的设置可能
是否可以在 Emacs 中用文本替换边缘位图？

我很想用简单雅致的文本甚至可能是一个很好的 unicode 字符例如 u2026省略这可能吗不它不是边缘位图实际上是位图即覆盖在边缘上的 0 1 位向量没有办法直接将任意 unicode 字符渲染到边缘上您可以做的就是
IN 子句中的通配符

SQL 我想在 IN 子句中使用通配符但没有得到我期望的结果我的查询是这样的 SELECT DISTINCT ID FROM INST WHERE TYPE in IP International 请帮助解决这个问题解决方案应该是使用
Python for 循环中的“pass”和“continue”有区别吗？

两个Python关键字之间有什么显着差异吗continue and pass就像例子中一样 for element in some list if not element pass and for element in some list
可以改变JButton的形状吗？

是否可以将 JButton 的形状从矩形更改为圆形 Sean Cogan 提供的链接就是您所需要的如果您想要简短请设置一个图像圆形或任何您希望按钮看起来相似的形状使用setIcon然后在 JButton button1 上设置这些值
获取类转换异常，其中两个类完全相同

我正在做一个 JBoss SEAM 项目当我查看表单时我收到此错误 java lang ClassCastException it cogitoweb csi entity csiorelav CsiTipoLav cannot be
Unix 域：connect()：没有这样的文件或目录

如标题所述我的连接调用具有相应地址的 unix 域类型套接字会导致错误ENOENT 没有这样的文件或目录两个套接字已正确初始化并且相应地创建并绑定了套接字文件服务器和客户端套接字在不同的进程中运行尽管客户端进程是 fork 和
使用标记列表构建抽象语法树

我想从令牌列表构建 AST 我正在制作一种脚本语言并且已经完成了词法分析部分但我不知道如何创建 AST 所以问题是我该如何采取这样的事情 WORD int WORD x SYMBOL NUMBER 5 SYMBOL 并将其转换为抽象语
GWT - 在单元树中添加和删除节点

这里我有一个完整且非常简单的示例来动态添加删除单元树的节点我的例子效果不太好似乎有是刷新问题只有关闭展开节点才会显示正确的结果我在这个论坛上也没有找到适合这个问题的答案也许有人可以尝试我的例子并告诉我问题出在哪里任何其
在一个 JFrame 中使用两个 JPanel

我正在尝试创建一个程序允许用户单击按钮将某些内容放入JPanel并允许他们移动该物品我已经找到了一个很好的布局来允许移动组件请参阅this关联但是我只是好奇创建这样的布局的最佳方法我的希望是有这样的东西我怎样才能做到这一点我
Python 读取输入的最快方法

我想读取一个包含整数列表列表的巨大文本文件现在我正在执行以下操作 G with open test txt r as f for line in f G append list map int line split 然而大约需要 17

Python 读取输入的最快方法

Python 读取输入的最快方法 的相关文章

随机推荐

热门标签

Python 读取输入的最快方法的相关文章