python中使用numpy数组出现内存错误

2024-03-21

我收到此代码的以下错误：

model = lda.LDA(n_topics=15, n_iter=50, random_state=1)
model.fit(X)
topic_word = model.topic_word_
print("type(topic_word): {}".format(type(topic_word)))
print("shape: {}".format(topic_word.shape))
print ("\n")
n = 15
doc_topic=model.doc_topic_
for i in range(15):
    print("{} (top topic: {})".format(titles[i], doc_topic[0][i].argmax()))

topic_csharp=np.zeros(shape=[1,n])
np.copyto(topic_csharp,doc_topic[0][i])
for i, topic_dist in enumerate(topic_word):
    topic_words = np.array(vocab)[np.argsort(topic_dist)][:-(n+1):-1]
    print('*Topic {}\n- {}'.format(i, ' '.join(topic_words)))

错误是：

Traceback (most recent call last):
File "C:\Users\csharp.py", line 56, in <module>
topic_words = np.array(vocab)[np.argsort(topic_dist)][:-(n+1):-1]
MemoryError

我正在拟合模型的文档大约有 1,50,000 行文本。词汇大小：558270 n_words：13075390（预处理后）

我该如何解决这个错误？

如果您的数组对于 RAM 来说太大，请使用 numpy.memmap。看http://docs.scipy.org/doc/numpy-1.10.0/reference/ generated/numpy.memmap.html http://docs.scipy.org/doc/numpy-1.10.0/reference/generated/numpy.memmap.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

textmining

LDA

topicmodeling

python中使用numpy数组出现内存错误的相关文章

如何在 Google App Engine 的 Python 中获取 StringProperty 的值？

如何获取 nbd Model 的值我想返回由多个字段组成的描述但我无法让它工作这是我的班级代码 class User ndb Model name ndb StringProperty email ndb StringProperty
如何让python优雅地失败？

我只是想知道如何让 python 在所有可能的错误中以用户定义的方式失败例如我正在编写一个处理大项目列表的程序并且某些项目可能不符合我定义的格式如果 python 检测到错误它目前只会输出一条丑陋的错误消息并停止整个过程但是
最小二乘法拟合直线 python 代码

我有一个由 X 和 Y 坐标组成的散点图我想使用直线的最小二乘拟合来获得最佳拟合线直线最小二乘拟合是指如果 x 1 y 1 x n y n 是测量数据对则最佳直线是y A Bx 这是我的Python代码 number of poin
正则表达式，选择最接近的匹配

假设以下单词序列 BLA text text text text text text BLA text text text text LOOK text text text BLA text text BLA 我想做的是将 BLA 中的文本
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
Perl 是否有相当于 Python 的 `if __name__ == '__main__'` 的功能？

有没有一种方法可以确定当前文件是否是 Perl 源中正在执行的文件在 Python 中我们使用以下结构来做到这一点 if name main This file is being executed raise NotImplemente
在Python中以交互方式执行多行语句

我是 Python 世界的新手这是我用 Python 编写的第一个程序我来自 R 世界所以这对我来说有点不直观当我执行时 In 15 import math import random random random math sqrt
Python——捕获异常的效率[重复]

这个问题在这里已经有答案了可能的重复 Python 常见问题解答异常有多快 https stackoverflow com questions 8107695 python faq how fast are exceptions 我记得
reStructuredText：README.rst 未在 PyPI 上解析

我有一个托管在 Github 和 PyPI 上的 Python 项目在 Github 上 https github com sloria TextBlob blob master README rst https github com s
返回上个月的日期时间对象

如果 timedelta 在它的构造函数中有一个月份参数就好了那么最简单的方法是什么 EDIT 正如下面指出的那样我并没有认真考虑这一点我真正想要的是上个月的任何一天因为最终我只会获取年份和月份因此给定一个日期时间对象返回的最
Python 3在for循环中更改字典键的值不起作用

我的 python 3 代码没有按预期工作 def addFunc x y print x y def subABC x y z print x y z def doublePower base exp print 2 base exp d
PyArmor - 打包为一个可执行文件

当我执行此命令时您好使用 PyArmor pyarmor pack main py 它将它打包到一个名为的文件夹中dist里面包含我的 exe 以及许多 Python 扩展文件据我所知 PyArmor 使用 PyInstaller 来
Jupyter Notebook 中的深色模式绘图 - Python

我正在使用 Jupyter Notebook 目前正在使用 JupyterThemes 的深色日光主题我注意到我的绘图不是处于黑暗模式并且文本仍然是黑色并且在日光照射的背景上无法读取 JupyterThemes 的自述文件建议在 ipy
Selenium 不会在新选项卡中打开新 URL（Python 和 Chrome）

我想使用 Selenium WebDriver 和 Python 在不同的选项卡中打开相当多的 URL 我不确定出了什么问题 driver webdriver Chrome driver get url1 time sleep 5 driv
更换壳牌管道[重复]

这个问题在这里已经有答案了在 subprocess 模块的 Python 2 7 文档中我找到了以下片段 p1 Popen dmesg stdout PIPE p2 Popen grep hda stdin p1 stdout stdo
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
在Python中连续解析文件

我正在编写一个脚本该脚本使用 HTTP 流量行解析文件并取出域目前仅将它们打印到屏幕上我正在使用 httpry 将流量连续写入文件这是我用来删除域名的脚本 usr bin python import re input open r
Python：无法使用 os.system() 打开文件

我正在编写一个使用该应用程序的 Python 脚本pdftk http www pdflabs com tools pdftk the pdf toolkit 几次来执行某些操作例如我可以在 Windows 命令行 shell 中使用
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
如何更改matplotlib中双头注释的头大小？

Below figure shows the plot of which arrow head is very small 我尝试了下面的代码但它不起作用它说引发 AttributeError 未知属性 s k 属性错误未知属性头宽

随机推荐

Java 精确计算 - 使用选项

我试图对 JAVA SQL 中精确计算的选项进行一些简洁的概述到目前为止我找到了以下选项使用双打接受他们的缺点不行 use BigDecimals 在复杂的公式中使用它们对我来说是有问题的 use String format De
将函数应用于列表中所有数据帧的某些列，然后为列赋值

类似问题已回答here https stackoverflow com questions 22002838 same function over multiple data frames in r 我有一个数据框列表即 1000 如下所
增强 qi::rule 上的精神语义动作

我一直在阅读语义动作我有一个如下所示的规则 property rule identifier rule gt gt lit L gt gt type specification rule gt gt lit L gt gt alnum g
Emacs：如何将杀戮环从系统剪贴板中分离出来？

默认情况下 Emacs 23 x 似乎会将被删除的内容复制到删除环和系统剪贴板是否可以将杀戮环和剪贴板分开例如 ctrl k 将内容放入终止环 cmd x 将内容放入系统剪贴板并保留终止环这在中讨论过这个线程 http lists g
如何在每个测试方法之前和之后执行sql脚本

有一个 Sqlspring中的注释允许执行sql测试方法前后的代码 Test Sql init sql Sql scripts clean sql executionPhase Sql ExecutionPhase AFTER TEST M
与 Kotlin 泛型的混淆

我是 Kotlin 的新手我正在尝试编写一些相当简单的代码但是我不知道如何使用泛型来使其工作我有一个Handler代表事物处理程序的特征我无法更改处理程序的代码因为它来自库 trait Handler
当我构建多个 ProductFlavors 时，使用 Facebook SDK INSTALL_FAILED_CONFLICTING_PROVIDER

我正在构建一个包含多个 Android 应用程序productFlavors 并使用Facebook SDK v4 1进行登录和分享内容问题是当我尝试在已安装相同应用程序但风格不同的设备上安装应用程序时会引发错误它不允许我安装第
如何向 Quill.js 添加新格式（
标签）？

我想添加一个按钮来添加 hr 标记到quill js 测试版 http beta quilljs com docs quickstart editor 这里的fiddle https jsfiddle net Lgxkj4ag div sp
如何多次发送文件

有两个 C 项目一个项目用于客户端另一个项目用于服务器第一步是运行服务器然后选择一个目标文件夹然后运行客户端项目选择一些text txt发送到服务器的目标文件夹只有客户端可以向服务器发送文件 Demo 1 choosing f
为什么有些资源文件放在META-INF目录下

我想知道为什么有些资源文件放在JAR中的META INF目录下我总是将像 test properties 这样的资源放在根目录下将它们放入 META INF 有什么好处吗许多 Java EE API 都有一个约定即当您将特定的配置
iText，Font、BaseFont 和 createFont() 发生了什么？

关于 font 和 basefont 的情况对我来说有很多谜团尤其是当涉及到构造函数时 iText 网站提供了这一行作为新字体的示例代码 BaseFont unicode BaseFont createFont c windows fon
Rails 4 - 如何使用枚举？

我正在尝试在 Rails 4 上制作一个应用程序我发布了这个问题并得到了一些建议 Rails 4 Simple Form 如何保存键和显示值 https stackoverflow com questions 36539924 rails
如何使用 OpenCV 交换图像中的蓝色和红色通道

我在交换图像的通道特别是红色和蓝色时遇到了一些问题我正在使用 Opencv 3 0 0 和 Python 2 7 12 以下是我交换频道的代码 import cv2 img cv2 imread input car1 jpg The
逗号运算符重置此

在下面code https www typescriptlang org play src var 20x 20 3D 20 7B 20f 3A 20function 20 20 7B 20return 20this 20 3D 3D 3D
将图像缩略图添加到网格布局中？

我有一个图像列表我需要将小缩略图添加到框架中我目前有框架SpringLayout 如何使用滚动窗格在某些网格中添加缩略图如时尚照片列表可能很大所以我需要一个滚动窗格我不知道如何处理这个问题SpringLayout 我知道如何添加
如何在Python中将pptx导出为图像（png、jpeg）？

我用 Python 开发了一段小代码来生成 PPTX 文件但我还想生成一张 PNG 或 JPEG 格式的幻灯片图片 from pptx import Presentation from pptx util import Inches im
为 Blazor WASM 保存时重新编译 .razor 文件

有没有办法让 Blazor WebAssembly 重新编译 razor文件更改更新然后保存时我已经习惯了这种情况在传统的 ASP NET Core MVC razor 视图以及客户端框架如 Angular 中发生在 ASP NET
DRAM 访问的性能计数器

我想找回DRAM 存取次数在我的应用程序中准确地说我需要区分数据和代码访问之间该处理器是一个Intel R Core TM i7 4720HQ CPU 2 60GHz Haswell 基于英特尔软件开发人员手册第 3 卷 https
无法在生产环境中实例化模块

我刚刚将我的程序推送到 Heroku 上并且我测试 Angular 的页面加载了以下错误未捕获错误 injector modulerr 无法实例化模块 diceAngularApp 原因是错误 injector unpr 未知提供者
python中使用numpy数组出现内存错误

我收到此代码的以下错误 model lda LDA n topics 15 n iter 50 random state 1 model fit X topic word model topic word print type topic

python中使用numpy数组出现内存错误

python中使用numpy数组出现内存错误 的相关文章

随机推荐

热门标签

python中使用numpy数组出现内存错误的相关文章