如何对生成器对象或迭代器进行切片？

2024-02-27

我想循环遍历迭代器的“切片”。我不确定这是否可能，因为我知道不可能对迭代器进行切片。我想做的是这样的：

def f():
    for i in range(100):
        yield(i)
x = f()

for i in x[95:]:
    print(i)

这当然失败了：

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-37-15f166d16ed2> in <module>()
  4 x = f()
  5 
----> 6 for i in x[95:]:
  7     print(i)

TypeError: 'generator' object is not subscriptable

有没有一种Python式的方法来循环生成器的“切片”？

基本上，我实际关心的生成器读取一个非常大的文件并逐行对其执行一些操作。我想测试文件的片段以确保事情按预期执行，但让它运行整个文件非常耗时。

Edit:
如前所述，我需要将其记录在文件中。我希望有一种方法可以使用生成器明确指定这一点，例如：

import skbio

f = 'seqs.fna'
seqs = skbio.io.read(f, format='fasta')

seqs 是一个生成器对象

for seq in itertools.islice(seqs, 30516420, 30516432):
    #do a bunch of stuff here
    pass

上面的代码满足了我的需要，但是仍然非常慢，因为生成器仍然循环遍历所有行。我希望只循环指定的切片

一般来说，答案是itertools.islice https://docs.python.org/3/library/itertools.html#itertools.islice，但你应该注意的是islice实际上不会也不能跳过值。它只是抓住然后扔掉start开始前的值yield- 值。所以通常最好避免islice如果可能的话，当您需要跳过很多值和/或被跳过的值获取/计算成本昂贵时。如果您能找到一种不首先生成值的方法，那就这样做。在您的（显然是人为的）示例中，您只需调整range object.

在尝试在文件对象上运行的特定情况下，拉出大量行（特别是从慢速介质中读取）可能并不理想。假设您不需要特定的行，您可以使用一个技巧来避免实际读取文件的大块，同时仍然测试到文件的一定距离，即seek到猜测的偏移量，读出到行尾（丢弃您可能在中间查找的部分行），然后islice从该点开始，无论您想要多少行。例如：

import itertools

with open('myhugefile') as f:
    # Assuming roughly 80 characters per line, this seeks to somewhere roughly
    # around the 100,000th line without reading in the data preceding it
    f.seek(80 * 100000)
    next(f)  # Throw away the partial line you probably landed in the middle of
    for line in itertools.islice(f, 100):  # Process 100 lines
        # Do stuff with each line

对于文件的具体情况，您可能还想查看mmap https://docs.python.org/3/library/mmap.html它可以以类似的方式使用（如果您正在处理数据块而不是文本行，并且可能会随机跳转，则非常有用）。

Update:根据您更新的问题，您需要查看 API 文档和/或数据格式，以准确弄清楚如何正确跳过。看起来像skbio提供一些跳过使用的功能seq_num，但如果不处理大部分文件，仍然会读取 http://scikit-bio.org/docs/0.4.0/generated/skbio.io.format.fasta.html#module-skbio.io.format.fasta。如果数据以相同的序列长度写出，我会查看文档Alignment;对齐的数据可以在根本不处理前面的数据的情况下加载，例如通过使用Alignment.subalignment创造新的Alignment为您跳过其余数据 http://scikit-bio.org/docs/0.4.0/generated/skbio.alignment.Alignment.subalignment.html#skbio.alignment.Alignment.subalignment.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何对生成器对象或迭代器进行切片？的相关文章

Python - 套接字错误，地址正在使用

我目前正在尝试在 Xubuntu 12 10 x64 上设置 SiriServer 这不是重点当我运行服务器时 python 返回错误 socket error Errno 98 Address already in use 默认情况下
Python执行windows cmd函数

我知道你可以使用 subprocess 通过 Python 脚本运行 Linux 终端命令 subprocess call ls l for linux 但我找不到在 Windows 上做同样事情的方法 subprocess call di
TypeError：PyQt4.QtCore.QVariantAnimation 表示 C++ 抽象类，无法实例化

我有这个 PyQt5 片段我正在尝试将其转换为 PyQt4 PyQt5 版本运行得很好但是当我尝试转换为 PyQt4 时出现此错误我删除了QtWidgets但我仍然收到此错误我也尝试过实例化self animation QtCor
如何将 pymongo.cursor.Cursor 转换为字典？

我正在使用 pymongo 查询一个区域内的所有项目实际上是查询地图上一个区域内的所有场馆我用了db command SON 在搜索球形区域之前它可以返回一本字典字典中有一个名为results其中包含场馆现在我需要在一个正方形区域
如何从 Django 中的 ModelForm 手动创建选择字段？

我有一个ModelForm其中字段之一名为creator is a ForeignKey 因此对于 form creator Django 渲染
在循环中初始化变量[重复]

这个问题在这里已经有答案了我试图弄清楚初始化某些变量时的最佳实践是什么我的代码现在看起来像这样 int nHexCount 0 int prevState sc state bool bOnlySpaces true bool bIsV
使用 QtDesigner 的 pyQt 信号/槽

我正在尝试编写一个与 QGraphicsView 交互的程序我想在 QGraphicsView 中发生事件时收集鼠标和键盘事件例如如果用户单击 QGraphicsView 小部件我将获得鼠标位置类似的东西我可以很容易地对其进行硬
重命名 TensorFlow 中保存模型的变量范围

是否可以在张量流中重命名给定模型的变量范围例如我根据教程创建了 MNIST 数字的逻辑回归模型 with tf variable scope my first scope NUM IMAGE PIXELS 784 NUM CLASS B
如何为Python的mechanize设置超时值？

如何为Python的mechanize设置超时值亚历克斯是正确的 mechanize urlopen需要一个timeout争论因此只需插入一些浮点型秒数 http docs python org library socket html
Python elasticsearch DSL 聚合/每个文档嵌套值的度量

我试图找到 2 级嵌套中的最小值每个文档单独的最小值到目前为止我能够进行聚合计算搜索结果中所有嵌套值的最小值但无需按文档进行分隔我的示例架构 class MyExample DocType myexample id Intege
python中根据变量类型处理数据子集

我将以下数据存储在 csv df sample csv 中我将列名放在名为 cols list 的列表中 df 数据样本 df data sample pd DataFrame new video BASE SHIVER PREFER
Numpy - 两个矩阵的行之间的协方差

我需要计算两个不同矩阵的每一行之间的协方差即第一个矩阵的第一行与第二个矩阵的第一行之间的协方差依此类推直到两个矩阵的最后一行我可以在没有 NumPy 的情况下使用下面附加的代码来完成此操作我的问题是是否可以避免使用 for 循环
Linux 中如何确定哪个进程正在使用某个端口

我目前正在其默认端口上运行 RethinkDB 因为如果我将浏览器指向localhost 8080我看到 RethinkDB Web 界面我想关闭 RethinkDB 并使用以下命令在另一个端口上重新打开它 port offset争论然
类型错误：“State”和“State”实例之间不支持“<” PYTHON 3

我正在尝试利用队列类中的 PriorityQueue 但是我在将自定义对象放入 PQ 时遇到问题我已经实施了 cmp 函数如下 def cmp self other return self priority gt other prior
如果 Django 中的表单字段与 Python 关键字同名，如何声明该字段？

我在 Django 中有一个简单的表单看起来像这样 class SearchForm forms Form text forms CharField from forms DateField until forms DateField 失
如何在 Robot Framework 中将变量定义为具有列表值的字典

在我的一个测试用例中我需要定义一个字典其中键是字符串值是字符串数组我怎样才能在机器人框架中做到这一点我第一次尝试使用如下所示的构造但行不通 Variables Dictionary A StringA1 StringA2 B S
在 python matplotlib 中格式化损坏的 y 轴

我正在 matplotlib 中处理一个相当复杂的条形图它包含来自多个源的摘要数据每个源都沿 x 轴标记 y 轴上有一系列结果许多结果都是异常值我尝试使用断开的 y 轴来显示这些结果而不会使用以下组合来扭曲整个图表这个方法 h
如何在 python 解释器 shell 中重复最后一个命令？

如何重复上一条命令常用键向上 Ctrl 向上 Alt p 不起作用他们创造出无意义的人物 ve kakarukeys localhost ve python Python 2 6 6 r266 84292 Nov 15 2010 21
在matplotlib中绘制曲线连接点

所以我试图绘制曲线来连接点这是我正在使用的代码 def hanging line point1 point2 a point2 1 point1 1 np cosh point2 0 np cosh point1 0 b point1 1
AIORedis 和 PUB/SUB 不是 asnyc

I used aioredis http aioredis readthedocs org en latest examples html用于编写异步服务该服务将侦听某个通道并以异步方式运行一些命令基本上我从示例页面 http aior

随机推荐

text-shadow（和其他 css3）导致滚动滞后

我注意到我越多地使用某些 CSS3 元素即box shadow and text shadow 页面上存在的滚动滞后越多我注意到 FF4 和 Chrome 10 上都有这个问题有什么好的方法来衡量或减少这个问题吗我想要良好的性能但
ggplot geom_tile（或热图）中的分割填充：第三个值的两种颜色

我有分类数据我想映射使用热图 geom tile 的频率就像下面的示例一样 data mtcars freq lt data frame xtabs cyl gear mtcars count number of 4 6 8 cyl c
收到 iOS 推送通知时打开视图控制器

我想在用户单击收到的推送通知消息时打开特定的视图控制器但是当我收到推送通知消息并单击该消息时仅打开应用程序但不会重定向到特定的视图控制器我的代码是 void application UIApplication application
不支持的关键字：元数据

这行 WebSecurity InitializeDatabaseConnection connectionStringName DefaultConnection userTableName UserProfile userIdColum
为什么 p[:] 的设计在这两种情况下的工作方式不同？

p 1 2 3 print p 1 2 3 q p supposed to do a shallow copy q 0 11 print q 11 2 3 print p 1 2 3 above confirms that q is not
发布 npm 包的模拟以供 jest 的模块模拟系统使用

我正在发布一个私有 npm 包并且也想为其发布模拟我希望这些嘲笑能够被笑话的人接受模块模拟系统 https jestjs io docs en manual mocks html 该包是一个使用上下文并发出网络请求的反应库该库的所有
如何并行化 while 循环？

iter lt 1000 myvec lt c while is null myvec nrow myvec lt iter x rnorm 10 mean 0 sd 1 if sum x gt 2 5 myvec lt rbind myv
使用 redux-toolkit 处理错误

有关我的案例中的错误的信息深深地存在于响应中我正在尝试将我的项目移至redux toolkit 以前是这样的 catch e let warning switch e response data error message 问题是redu
.NET Core 在处理 HTTPS 证书时出现未知错误 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我正在尝试构建一个使用 HTTPS 连接的 NET Core 服务器我使用创建了一个自签名证书dotnet dev certs工
前面带0的数字？ [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我有功能 x 012 echo x 3 为什么结果是3 33333 但如果我使用 x 012 那么就对了问题是这该如何解释呢以
递归定位包含目标键和值的嵌套字典

关于这个问题有很多问题但就我而言它们不起作用我试图找到一个给定目标键和值对的嵌套字典我的递归函数没有返回任何内容修复后最大深度递归错误 def recursive lookup k sv d if k in d return d
如何在我的项目中嵌入可执行文件

我想在我的 Xcode Cocoa 项目中嵌入一个命令行可执行文件然后使用 NSTask 启动它我应该在 setLaunchPath 中使用哪个路径 Thanks 您应该将其添加到您的资源文件夹中然后在运行时读取应用程序的资源包路
无法在 Android Studio 中导入 org.apache.http.HttpResponse

我想在 Android Studio 中使用这些库 import org apache http HttpResponse import org apache http client HttpClient import org apache
Camera2 API - 如何设置长曝光时间

我正在尝试在我的应用程序中以 30 秒的曝光时间捕获图像我知道这是可能的因为库存相机允许这样做但是 SENSOR INFO EXPOSURE TIME RANGE 应该以纳秒为单位给了我范围 13272 869661901 几秒钟后
Mac 操作系统上找不到 /dev/kvm

我最近将我的 Macbook pro 更新到了 Mac OS High Sierra 现在我遇到了一个问题我无法再在 Android Studio 中启动模拟器警告 dev kvm is not found 显示当我尝试启动模拟器时
使用注释创建时，bean 默认是如何命名的？

我正在使用别人编写的 Spring java 代码我想引用一个由注释字段 classABC 创建的 bean Component public class ClassService Autowired ClassABC classABC
获取在publish:end事件中选择发布的语言

我为发布结束事件创建了一个事件处理程序我能够获取正在发布的项目如何获取用户在发布选项中选择的语言弄清楚了这一点实际上 publish end 事件对每种语言都会触发一次并且您可以通过执行以下操作获得正在发布的语言EventArg
Apache + PHP 中的“标题之前的脚本输出结束”

UPDATE 此问题是由于脚本完成之前服务器请求超时造成的我在共享 LAMP 主机 nearlyfreespeech net 上运行遗留代码并且最近添加了一个无法在生产中工作的新脚本我的 apache 错误日志显示该消息End of
psycopg2.errors.InFailedSqlTransaction：当前事务被中止，命令被忽略，直到事务块结束

我编写了一个 scrapy 程序来从站点抓取数据如果我抓取到 json 文件或 csv 文件该程序会成功抓取当我尝试抓取到 postgres 数据库时会出现问题下图显示了我收到的错误我该如何修复错误 def process ite
如何对生成器对象或迭代器进行切片？

我想循环遍历迭代器的切片我不确定这是否可能因为我知道不可能对迭代器进行切片我想做的是这样的 def f for i in range 100 yield i x f for i in x 95 print i 这当然失败了 Type

如何对生成器对象或迭代器进行切片？

如何对生成器对象或迭代器进行切片？ 的相关文章

随机推荐

热门标签

如何对生成器对象或迭代器进行切片？的相关文章