Python NLTK 多线程

2023-12-28

我正在编写一个算法,它可以识别给定文本中的句子,将每个句子拆分成单词并在经过一些验证后返回这些单词。

我想在多线程的帮助下实现同样的功能。

我正在调用处理每个句子的函数threading.thread()它会抛出一个错误:

AttributeError: 'WordListCorpusReader' object has no attribute '_LazyCorpusLoader__args'  

然而,很少有博客建议使用“wn.ensure_loaded()“ 功能。

但是 python 抛出一个错误说ensure_loaded()没有定义。

有人可以帮我解决这个问题吗?

EDIT:

text = "This is my sample text. I want to break it into sentences"  
sentences=(re.split(r"(?<!\w\.\w.)(?<![A-Z][a-z]\.)(?<=\.|\?)\s",text))  
wn.ensure_loaded()      
co = CoOccurence()     #CoOccurence is a class in my package which will work on the sentences  
for sentence in sentences:  
    t = Thread(target=co.__prepareHash__, args=(sentence,)) #co.__prepareHash__   is an other method which works around the sentences  
    threads.append(t)  
    t.start()  

flag =1  
while (flag):  
    flag = __isThreadAlive__()  

这给我一个错误:Attribute error: 'WordNetCorpusReader' object has no attribute '_LazyCorpusLoader__args'
当我尝试检查时wn.ensure_loaded(),它抛出AttributeError: 'module' object has no attribute 'ensure_loaded'

与参考号。到 :这个问题 https://stackoverflow.com/questions/27433370/what-would-cause-wordnetcorpusreader-to-have-no-attribute-lazycorpusloader

谢谢


None

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python NLTK 多线程 的相关文章

  • python 模拟第三方模块

    我正在尝试测试一些处理推文的类 我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观 我的想法是模拟实际的 Sixohsix 类 通过随机生成新推文或从数据库检索它们来模拟推文的
  • 主线程如何在该线程之前运行?

    我有以下代码 public class Derived implements Runnable private int num public synchronized void setA int num try Thread sleep 1
  • Python逻辑运算符优先级[重复]

    这个问题在这里已经有答案了 哪个运算符优先4 gt 5 or 3 lt 4 and 9 gt 8 这会被评估为真还是假 我知道该声明3 gt 4 or 2 lt 3 and 9 gt 10 显然应该评估为 false 但我不太确定 pyth
  • 如何使用 imaplib 获取“消息 ID”

    我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好 所以我认为 Message ID 是正确的 但我不知道如何获取它 我只知道 imap fetch uid XXXX 有人有解决方案吗 来自 IMAP 文档本身 IMAP4消息号
  • 通过列表理解压平列表列表

    我正在尝试使用 python 中的列表理解来展平列表 我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目 我编写了这个函数 def flat listoflist for item in listoflis
  • 将数据帧行转换为字典

    我有像下面的示例数据这样的数据帧 我正在尝试将数据帧中的一行转换为类似于下面所需输出的字典 但是当我使用 to dict 时 我得到了索引和列值 有谁知道如何将行转换为像所需输出那样的字典 任何提示都非常感激 Sample data pri
  • if 语句未命中中的 continue 断点

    在下面的代码中 两者a and b是生成器函数的输出 并且可以评估为None或者有一个值 def testBehaviour self a None b 5 while True if not a or not b continue pri
  • 在java中实现你自己的阻塞队列

    我知道这个问题之前已经被问过并回答过很多次了 但我只是无法根据互联网上找到的示例找出窍门 例如this http tutorials jenkov com java concurrency blocking queues html or t
  • 如何在 pytest 中将单元测试和集成测试分开

    根据维基百科 https en wikipedia org wiki Unit testing Description和各种articles https techbeacon com devops 6 best practices inte
  • 从零开始的 numpy 形状意味着什么

    好的 我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况 这对我来说是有意义的 它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑 为什么这么定义呢 据我所知 这只是表达空数组的
  • 如何计算numpy数组中元素的频率?

    我有一个 3 D numpy 数组 其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素 我只显示了几个元素 array 136 129 130 103 102 101 我
  • Pandas 数据帧到 numpy 数组 [重复]

    这个问题在这里已经有答案了 我对 Python 很陌生 经验也很少 我已经设法通过复制 粘贴和替换我拥有的数据来使一些代码正常工作 但是我一直在寻找如何从数据框中选择数据 但无法理解这些示例并替换我自己的数据 总体目标 如果有人真的可以帮助
  • 以同步方式使用 FastAPI,如何获取 POST 请求的原始正文?

    在中使用 FastAPIsync not async模式 我希望能够接收 POST 请求的原始 未更改的正文 我能找到的所有例子都显示async代码 当我以正常同步方式尝试时 request body 显示为协程对象 当我通过发布一些内容来
  • 使用 Python pandas 计算调整后的成本基础(股票买入/卖出的投资组合分析)

    我正在尝试对我的交易进行投资组合分析 并尝试计算调整后的成本基础价格 我几乎尝试了一切 但似乎没有任何效果 我能够计算调整后的数量 但无法获得调整后的购买价格有人可以帮忙吗 这是示例交易日志原始数据 import pandas as pd
  • 更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

    theano base compiledir指编译后的文件存放的目录 有没有办法可以永久设置theano base compiledir到不同的位置 也许通过修改一些内部 Theano 文件的内容 http deeplearning net
  • 按元组分隔符拆分列表

    我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
  • 暂停下载线程

    我正在用 C 编写一个非常简单的批量下载程序 该程序读取要下载的 URL 的 txt 文件 我已经设置了一个全局线程和委托来更新 GUI 按下 开始 按钮即可创建并启动该线程 我想要做的是有一个 暂停 按钮 使我能够暂停下载 直到点击 恢复
  • 使用 NumPy 将非均匀数据从文件读取到数组中

    假设我有一个如下所示的文本文件 33 346 1223 10 23 11 23 12 23 13 23 14 23 15 23 16 24 10 24 11 24 12 24 13 24 14 24 15 24 16 25 14 25 15
  • Tkinter - 浮动窗口 - 调整大小

    灵感来自this https stackoverflow com a 22424245 13629335问题 我想为我的根窗口编写自己的调整大小函数 但我刚刚注意到我的代码显示了一些性能问题 如果你快速调整它的大小 你会发现窗口没有像我希望
  • 您可以使用关键字参数而不提供默认值吗?

    我习惯于在 Python 中使用这样的函数 方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default

随机推荐

  • Ruby 有类似 Python 的列表推导式吗?

    Python有一个很好的特性 print j 2 for j in 2 3 4 5 gt 4 9 16 25 在 Ruby 中就更简单了 puts 2 3 4 5 map j j 2 但如果是关于嵌套循环 Python 看起来更方便 在Py
  • 将大型 Rails 应用程序分解为较小的应用程序? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • jQuery 的 attr() 函数用 html 特殊字符破坏 html?

    请看一下下面的代码 http jsfiddle net htdTg 2 http jsfiddle net htdTg 2 在第一个链接中有一个包含 html 特殊字符的 title 属性 lt 其次是 实际上后面跟着哪个字符并不重要 当我
  • 如何在 Vue.js 中引用“”中的文本

    如何引用 Vue js 中的文本 Vue component component template
  • 如何防止java webstart应用程序被盗版

    我有一个 java swing 应用程序 打算通过互联网销售 目前我倾向于使用 java webstart 来部署应用程序 该产品将授权用户一次只能在一台计算机上使用该程序 我担心这个模型的盗版问题 我想安装一些安全功能来强制执行许可证模型
  • 如何获得预先指定特征的大型语料库的 tf-idf 矩阵?

    我有一个包含 3 500 000 个文本文档的语料库 我想构造一个 3 500 000 5 000 大小的 tf idf 矩阵 这里我有 5 000 个不同的特征 单词 我在用scikit sklearn在Python中 我在哪里使用Tfi
  • React.js - 即使在绑定后“this”也未定义

    我正在尝试捕捉onChange输入和调用事件setState使用新值 但是一旦我输入输入 我就会得到 Uncaught TypeError Cannot read property setState of undefined 尽管我已经打电
  • iPython - 在配置文件中设置魔法命令

    我主要通过笔记本使用 iPython 但也在终端中使用 我刚刚通过运行创建了我的默认配置文件ipython profile create 我似乎无法弄清楚如何让配置文件运行我每次使用的几个神奇命令 我试图在网上和我正在读的书中查找这一点 但
  • 如何使用 Spring Data 获取数据

    嘿 我想创建一个扩展 JpaRepository 的存储库并获取结果而不编写实际查询 在我的示例中 我有 2 个表 Book 和 Author 通过多对多关系映射 假设我想按特定的author id 获取书籍列表 因为在我的书籍实体中 我没
  • 无法在 Vim 中映射

    周末拿到了我的第一台 Mac 我正在努力适应 我的 vimrc 中的这一行在我的 Windows 上有效 但无法通过 iTerm 与 vim 一起工作 inoremap
  • 具有约束关联类型错误“类型不可转换”的 Swift 协议

    我创建了 2 个具有关联类型的协议 类型符合Reader应该能够生成符合以下类型的实例Value 复杂性层来自于符合以下条件的类型Manager应该能够生产混凝土Reader产生特定类型的实例Value 任何一个Value1 or Valu
  • */ 中 d 的 shell 脚本; do在本地运行,但在circleci中不起作用

    我构建了一个脚本 当我尝试在本地运行它时 它工作正常 但是当我在 Circleci 上运行它时 我收到错误 这是脚本 usr bin env bash for d in do cd d for f in do if f sh then if
  • 提示用户打开另一个工作簿

    我正在编写一个子程序 我需要用户打开特定的工作簿 因为我需要将数据从将打开的工作簿复制到运行该子程序的工作簿 由于将打开的文件是月度报告 因此用户很难始终将其以相同的文件名保存在同一位置 因此 如果要求用户打开工作簿 月度报告 那就太好了
  • VS Code 自动导入不使用绝对路径且不缩进

    我将 Typescript 与 SvelteKit 结合使用 当我输入可以自动导入的内容时 如上面的 GIF 所示 自动导入不会使内容保持相同的缩进级别 我还需要绝对路径 src not src VS 代码的设置称为 TypeScript
  • Magento 报告 - 产品 - 产品订购问题:具有相同 ID 的项目 (Mage_Catalog_Model_Product) 已存在

    问题 在 Magento 管理面板中 通过 报告 产品 订购的产品 生成报告时 会发生错误 Item Mage Catalog Model Product with the same id 45 already exist 0 home g
  • 读取文件中的每一行并将每一行放入一个字符串中

    我有一个文本文件 我想读入该文件并将文件中的每一行放入其自己的字符串中 所以该文件将有 4 行 2017 01 2005 59 30 353879833382971575 迈克尔 因此 在代码中 我需要读取文件并拆分每一行并将它们放入一个字
  • 垂直错开 div

    有没有办法像这张图片一样以交错的垂直排列方式显示 div 到目前为止 我已经使用 Flexbox 来接近 但无法交错行 因为我不想预先确定每行有多少个圆圈 我希望用户的浏览器宽度来控制每行有多少个圆圈 因此圆圈 div 上没有类或子项 随着
  • Play框架 路由不区分大小写

    我们目前正在开发 Play 2 5 x 我们希望实现不区分大小写的路由 比如说 GET via v1 organizations http organizationApi 在我们想要实现的URL中 http localhost 9000 a
  • MFC不支持小于0x0501的WINVER

    我有一个 C 项目引用了许多其他项目 库 这是针对多年前创建的应用程序 大约每年更新一次并完成新版本 我多年来一直使用 Visual Studio 6 更新和构建此应用程序的新版本 没有出现任何问题 我正在尝试切换到 Visual Stud
  • Python NLTK 多线程

    我正在编写一个算法 它可以识别给定文本中的句子 将每个句子拆分成单词并在经过一些验证后返回这些单词 我想在多线程的帮助下实现同样的功能 我正在调用处理每个句子的函数threading thread 它会抛出一个错误 AttributeErr