Python：如何将输出捕获到文本文件？（现在仅捕获 530 行中的 25 行）

2024-01-06

我已经潜伏在 SO 上做了相当多的工作，并进行了大量的搜索和阅读，但我也必须承认，总的来说，我在编程方面是一个相对菜鸟。我正在努力边学边学，所以我一直在使用 Python 的 NLTK。在下面的脚本中，我可以让一切正常工作，除了它只写多屏幕输出的第一个屏幕，至少我是这么想的。

这是脚本：

#! /usr/bin/env python

import nltk

# First we have to open and read the file:

thefile = open('all_no_id.txt')
raw = thefile.read()

# Second we have to process it with nltk functions to do what we want

tokens = nltk.wordpunct_tokenize(raw)
text = nltk.Text(tokens)

# Now we can actually do stuff with it:

concord = text.concordance("cultural")

# Now to save this to a file

fileconcord = open('ccord-cultural.txt', 'w')
fileconcord.writelines(concord)
fileconcord.close()

这是输出文件的开头：

Building index...
Displaying 25 of 530 matches:
y .   The Baobab Tree : Stories of Cultural Continuity The continuity evident 
 regardless of ethnicity , and the cultural legacy of Africa as well . This Af

为了将整个 530 个匹配项写入文件，我在这里缺少什么？

text.concordance(self, word, width=79, lines=25)似乎还有其他参数manual http://nltk.googlecode.com/svn/trunk/doc/api/nltk.text-pysrc.html#Text.concordance.

我看不出有什么办法可以提取一致性索引的大小，但是索引打印代码 http://nltk.googlecode.com/svn/trunk/doc/api/nltk.text-pysrc.html#ConcordanceIndex.print_concordance似乎有这部分：lines = min(lines, len(offsets))，因此你可以简单地通过sys.maxint作为最后一个论点：

concord = text.concordance("cultural", 75, sys.maxint)

Added:

现在看看你的原始代码，我看不出它以前可以工作的方式。text.concordance不返回任何内容，但将所有内容输出到stdout using print。因此，简单的选择是将标准输出重定向到您的文件，如下所示：

import sys

....

# Open the file
fileconcord = open('ccord-cultural.txt', 'w')
# Save old stdout stream
tmpout = sys.stdout
# Redirect all "print" calls to that file
sys.stdout = fileconcord
# Init the method
text.concordance("cultural", 200, sys.maxint)
# Close file
fileconcord.close()
# Reset stdout in case you need something else to print
sys.stdout = tmpout

另一种选择是直接使用相应的类并省略文本包装器。只需复制位here http://nltk.googlecode.com/svn/trunk/doc/api/nltk.text-pysrc.html#Text.concordance并将它们与来自的位组合起来here http://nltk.googlecode.com/svn/trunk/doc/api/nltk.text-pysrc.html#ConcordanceIndex.print_concordance你就完成了。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python：如何将输出捕获到文本文件？（现在仅捕获 530 行中的 25 行）的相关文章

如何使用显式引用转储 YAML？

递归引用非常适合ruamel yaml or pyyaml ruamel yaml dump ruamel yaml load A A id001 id001 然而它显然不适用于普通引用 ruamel yaml dump ruamel
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
当我在 Pandas 中使用 df.corr 时，我的一些列丢失了

这是我的代码 import numpy as np import pandas as pd import seaborn as sns import matplotlib pyplot as plt data pd read csv dea
根据开始列和结束列扩展数据框（速度）

我有一个pandas DataFrame含有start and end列加上几个附加列我想将此数据框扩展为一个时间序列从start值并结束于end值但复制我的其他专栏到目前为止我想出了以下内容 import pandas as
WindowsError：[错误 126] 使用 ctypes 加载操作系统时

python代码无法在Windows 7平台上运行 def libSO lib ctypes cdll LoadLibrary ConsoleApplication2 so lib cfoo2 1 3 当我尝试运行它时得到来自python
Python Fabric - 未找到主机。请指定用于连接的（单个）主机字符串：

如何获取找不到主机请指定用于连接的单个主机字符串面料如何解决 def bootstrap host ec2 54 xxx xxx xxx compute 1 amazonaws com env hosts host env use
为什么我无法在 Mac OS X Terminal.app 上的 Python 解释器中显示 unicode 字符？

如果我尝试粘贴 unicode 字符例如中间的点在我的 python 解释器中它什么也不做我在 Mac OS X 上使用 Terminal app 当我只是在 bash 中时我没有遇到任何问题但在解释器中 python Pytho
动态 __init_subclass__ 方法的参数绑定

我正在尝试让类装饰器工作装饰器会添加一个 init subclass 方法到它所应用的类但是当该方法动态添加到类中时第一个参数不会绑定到子类对象为什么会发生这种情况举个例子这是可行的下面的静态代码是我试图最终得到的示例 cl
与 while 循环一样，如何跳过 for 循环中的步骤？

我尝试像 while 循环一样跳过 for 循环中的几个步骤在 while 循环中步骤根据特定条件进行调整如下面的代码所示 i 0 while i lt 10 if i 3 i 5 else print i i i 1 result
在Python中计算内存碎片

我有一个长时间运行的进程不断分配和释放对象尽管正在释放对象但 RSS 内存使用量会随着时间的推移而增加如何计算发生了多少碎片一种可能性是计算 RSS sum of allocations 并将其作为指标即便如此我该如何计算分母
Python多处理错误“ForkAwareLocal”对象没有属性“连接”

下面是我的代码我面临着多处理问题我看到这个问题之前已经被问过我已经尝试过这些解决方案但它似乎不起作用有人可以帮我吗 from multiprocessing import Pool Manager Class X def init
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
如何使用 Keras ImageDataGenerator 预测单个图像？

我已经训练 CNN 对图像进行 3 类分类在训练模型时我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它现在我的网络在测试集上训练得非常准确但我不知道如何在单图像预测上应用预处理功能如
对数据帧的每 2 小时数据进行 Groupby

我有一个数据框 Time T201FN1ST2010 T201FN1VT2010 1791 2017 12 26 00 00 00 854 69 0 87 1792 2017 12 26 00 20 00 855 76 0 87 1793
处理大文件的最快方法？

我有多个 3 GB 制表符分隔文件每个文件中有 2000 万行所有行都必须独立处理任何两行之间没有关系我的问题是什么会更快逐行阅读 with open as infile for line in infile 将文件分块读入内存
Python：高精度time.sleep

你能告诉我如何在 Win32 和 Linux 上的 Python 2 6 中获得高精度睡眠函数吗您可以在中使用浮点数sleep http docs python org library time html time sleep 该参数可以
在 Django shell 会话期间获取 SQL 查询计数

有没有办法打印 Django ORM 在 Django shell 会话期间执行的原始 SQL 查询的数量 Django 调试工具栏已经提供了此类信息例如 5 QUERIES in 5 83MS但如何从 shell 中获取它并不明显您可
使用 urllib 编码时保持 url 参数有序

我正在尝试用 python 模拟 get 请求我有一个参数字典并使用 urllib urlencode 对它们进行 urlencode 我注意到虽然字典的形式是 k1 v1 k2 v2 k3 v3 urlencoding 后参数的顺序切
缓存 Flask-登录 user_loader

我有这个 login manager user loader def load user id None return User query get id 在我引入 Flask Principal 之前它运行得很好 identity loa

随机推荐

为什么我一定要揭开脆弱的自己？

我创建了一个名为VerifyObject 其中包含具有类似签名的函数 typealias handlerCodeID String gt Void class func checkPause withID String runOnPause
为什么嵌套的describe()块看不到外部块中定义的变量？

我在实际代码中遇到了这个问题但我整理了一个简单的例子来证明这一点下面的代码工作正常我在我的根目录中设置了一个变量describe 在我的子系统中可以访问的块describe s it blocks describe simple ob
Fortran SAVE 语句

我读过有关save 英特尔语言参考文档中的声明但我不太明白它的作用有人可以用简单的语言向我解释一下当save语句包含在模块中原则上当模块超出范围时该模块的变量将变为未定义除非使用 SAVE 属性声明它们或者使用 SAVE 语
ViewPager2 上的 TransactionTooLargeException

我看到了很多关于 ViewPager 的问题但现在它已经上线了ViewPager2 我得到了一个java lang RuntimeException android os TransactionTooLargeException data
CKEditor - 使用数据处理器删除脚本标签

我对 CKEditor 还很陌生两天前开始使用它而且我仍在与一些配置作斗争例如从编辑器中删除标签例如如果用户在源模式下键入以下内容我想将其删除查看文档我发现这可以使用 HTML 过滤器来完成我这样定义了它但它不起作用 v
如何增加 JVM 内存？ [复制]

这个问题在这里已经有答案了你好我想知道我是否可以根据我的应用程序增加 JVM 内存如果可以我该如何增加 JVM 内存我怎样才能知道 JVM 的大小启动 JVM 时可以调整两个参数以满足您的内存需求 Xms
如何通过 Jayway JsonPath 展平带有嵌套列表的 json？

目前我需要根据配置处理一些 json 结果而不是硬代码例如 json如下 data orderNo CG8310150 details skuId 4384 amount 2 skuId 4632 amount 5 orderNo CG
如何让greatmonkey 检查页面上是否找到文本

我确实在谷歌和用户脚本网站上做了一些研究但没有成功找到答案那么基本上我如何检查页面上是否找到特定文本并且文本没有特殊标签或任何东西对于 FF GM 来说一个粗略但快速的方法 if Text you are looking for
Android随机多项选择测验：如何识别正确答案

我正在尝试为 Android 创建一个随机多项选择测验我想显示字符串数组中的随机问题另一个字符串数组的相应答案显示在四个选项之一中其他三个选项将来自另一个字符串数组该数组将用于随机提供所有问题的错误答案两个问题有没有更好的方
Mono 不写入设置默认值

这是我的问题如果我只使用一个 Windows 窗体项目并且仅调用 Settings Default Save 运行时 Mono 会创建一个 user config 文件其中包含每个设置的默认值很好到目前为止一切都很好但现在我添加了
CSS 不显示任何内容且不透明动画且关键帧不起作用

我有一个非常基本的 HTML 片段其目的是从display none to display block不透明度从 0 变为 1 我使用的是 Chrome 浏览器它使用 webkit前缀作为偏好并做了 webkit keyframes设置
Excel-DNA：F# 初始化错误 [错误] 方法未注册

作为一名新手 F 开发人员我尝试创建一个简单的 Excel DNA 函数如下所示
启用 DMA 的 UART Tx 模式

我已经为 UART 在传输模式下编写了一个简单的设备驱动程序并启用了 DMA 和中断我使用的硬件是 omap 4460 pandaboard 其中加载了 Linux 3 4 下面我分享一下相关部分的代码在开放阶段 dma map io
使用 Angularjs 在选择下拉列表中设置默认值

我有一个对象如下我必须将其显示为下拉菜单 var list id 4 name abc id 600 name def id 200 name xyz 在我的控制器中我有一个带有值的变量该值决定在下拉列表中默认选择数组中的上述三项中的
当我尝试运行在 GitHub 上找到的代码时，我遇到了这个问题。 Pydot 和 graphivz 已安装但仍然出现此错误[重复]

这个问题在这里已经有答案了 2022 07 19 18 41 58 081967 W tensorflow stream executor platform default dso loader cc 64 Could not load d
如何告诉 ProGuard 保留私有字段而不指定每个字段

这是我的课 package com tools app holiday public class Holiday private String name private Calendar dateFrom Calendar getInsta
Git 从以前的提交范围创建分支？

我有一个操作系统项目的一堆提交我想将最后的 20 个提交提取到另一个分支这样我就可以拉取请求我怎么能这样做呢原因是我可能有 150 次提交但其中大部分都是为了更大的贡献但尚未准备好但下一个版本即将发布 Thanks 你可以这样
如何在 mysql 中将 csv 文件导出到我的计算机

我正在尝试将表以 csv 格式从远程服务器导出到我的台式计算机我有这个代码 select from order into outfile C Users Sleep Shop Desktop MySQL Scripts outfile c
Scala 和 Java 的构建器库

我需要一个可以从 Scala 和 Java 调用的构建器库在 Scala 中使用默认的命名参数就足够简单了但是我如何从 Java 调用这段代码呢见下文或者也许我应该使用两种语言都更通用的流畅 API Scala case class
Python：如何将输出捕获到文本文件？（现在仅捕获 530 行中的 25 行）

我已经潜伏在 SO 上做了相当多的工作并进行了大量的搜索和阅读但我也必须承认总的来说我在编程方面是一个相对菜鸟我正在努力边学边学所以我一直在使用 Python 的 NLTK 在下面的脚本中我可以让一切正常工作除了它只写多屏幕

Python：如何将输出捕获到文本文件？ （现在仅捕获 530 行中的 25 行）

Python：如何将输出捕获到文本文件？ （现在仅捕获 530 行中的 25 行） 的相关文章

随机推荐

热门标签

Python：如何将输出捕获到文本文件？（现在仅捕获 530 行中的 25 行）

Python：如何将输出捕获到文本文件？（现在仅捕获 530 行中的 25 行）的相关文章