如何用Python从LDA模型生成词云？

2023-12-15

我正在对报纸文章进行一些主题建模，并使用 Python3 中的 gensim 实现了 LDA。现在我想为每个主题创建一个词云，使用每个主题的前 20 个单词。我知道我可以打印单词，并保存 LDA 模型，但是有没有办法只保存每个主题的顶部单词，以便我可以进一步使用它来生成单词云？

我尝试用谷歌搜索，但找不到任何相关内容。任何帮助表示赞赏。

您可以使用 Gensim 的内置方法 show_topic 从 LDA 模型中获取 topn 单词。

lda = models.LdaModel.load('lda.model')

for i in range(0, lda.num_topics):
    with open('output_file.txt', 'w') as outfile:
        outfile.write('{}\n'.format('Topic #' + str(i + 1) + ': '))
        for word, prob in lda.show_topic(i, topn=20):
            outfile.write('{}\n'.format(word.encode('utf-8')))
        outfile.write('\n')

这将写入一个格式类似于以下内容的文件：

Topic #69: 
pet
dental
tooth
adopt
animal
puppy
rescue
dentist
adoption
animal
shelter
pet
dentistry
vet
paw
pup
patient
mix
foster
owner

Topic #70: 
periscope
disneyland
disney
snapchat
brandon
britney
periscope
periscope
replay
britneyspear
buffaloexchange
britneyspear
https
meerkat
blab
periscope
kxci
toni
disneyland
location

您可能需要也可能不需要根据您的需要进行调整，即生成前 20 个单词的列表，而不是将其输出到文本文件。

这篇文章中的答案很好地解释了如何使用原始文本创建词云。如何打印lda主题模型和每个主题的词云

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

LDA

WordCloud

如何用Python从LDA模型生成词云？的相关文章

适用于 Python 3.x 的 Hive 客户端

是否可以使用 Python 3 x 连接到 hadoop 并运行 hive 查询我正在使用Python 3 4 1 我发现可以按照这里写的方式完成 https cwiki apache org confluence display Hiv
Python OverflowError：数学范围错误[重复]

这个问题在这里已经有答案了当我尝试这个计算时出现溢出错误 output math exp 1391 12694245 100 我知道发生这种情况是因为使用的数字超出了双精度数的范围但有什么方法可以解决这个问题并获得输出值有人可以帮
以 str.format 切片字符串

我想实现以下目标str format x y 1234 5678 print str x 2 str y 2 我能够做到这一点的唯一方法是 print 0 1 format str x 2 str y 2 现在这是一个例子我真正拥有的是
使用 glGetFloatv 检索 pyglet 中的模型视图矩阵

我正在使用 pyglet 在 python 中进行 3D 可视化并且需要检索模型视图和投影矩阵来进行一些选择我使用以下方式定义我的窗口 from pyglet gl import from pyglet window import wi
Python实时读取串口数据

我正在使用 Python 中的脚本通过串行端口以 2Mbps 的速度从 PIC 微控制器收集数据 PIC 在 2Mbps 下完美定时工作 FTDI USB 串行端口在 2Mbps 下工作也很好均通过示波器验证我每秒发送消息大小约为 1
将 2D Panda 的 DataFrame 列表转换为 3D DataFrame

我正在尝试创建一个将标签值保存到 2D DataFrame 的 Pandas DataFrame 这是我到目前为止所做的我正在使用读取 csv 文件pd read csv并将它们附加到列表中出于这个问题的目的让我们考虑以下代码 imp
使用 Matplotlib 的范围绘制图像的 3D 轮廓

正如我所介绍的here https stackoverflow com questions 18792624 fits image input to a range in plot python 在二维中我想知道如何缩放要绘制到绘图中
如何将嵌套的Python字典转换为简单的命名空间？

假设我有一个深度为 N 的嵌套字典如何将每个内部嵌套字典转换为简单的命名空间 example input key0a test key0b key1a key2a keyNx key2b test key1b test example o
如何使用appium自动化Android手机后退按钮

我正在使用 Appium python 客户端库对 Android 上的混合移动应用程序进行测试自动化我无法找到任何方法来自动化或创建手势以使用电话后退按钮返回到应用程序的上一页有没有可以使用的驱动函数我尝试了 self dri
自适应支付 API 错误 580001

我正在 python 中向 paypal 自适应支付 API 发出 PAY 请求并收到通用错误 id 580001 没有其他信息 headers API credentials for the API caller business ac
在 python 中使用 subprocess.call 时如何将 stdout 重定向到文件？

我正在从另一个 python 脚本 A 调用一个 python 脚本 B 使用 subprocess call 如何将 B 的标准输出重定向到指定的文件我正在使用 python 2 6 1 传递一个文件作为stdout参数为subproc
如何打印和显示子进程 stdout 和 stderr 输出而不失真？

也许有人可以帮助我解决这个问题我在 SO 上看到了许多与此类似的问题但没有一个问题同时处理标准输出和标准错误也没有处理像我这样的情况因此出现了这个新问题我有一个 python 函数它打开一个子进程等待它完成然后输出返回代码以
Tkinter 如何根据此组合框自动更新第二个组合框

我在 Tkinter Python 中遇到了组合框更新的问题我有两个组合框组合框A with values A B C and 组合框B 我想要的是当值A在组合框中选择A然后在组合框中B显示值 1 2 3 当值B在组合框中选择A然后在
返回吃异常

我至少发现了以下行为weird def errors try ErrorErrorError finally return 10 print errors prints 10 It should raise NameError name E
如何使用资源模块来衡量函数的运行时间？

我想使用Python代码测量函数的CPU运行时间和挂钟运行时间此处建议资源模块如何以 Python 代码不是从终端的形式分别测量函数的 CPU 运行时间和挂钟运行时间 https stackoverflow com q 192046
Python 对列表中的值求和（如果它存在于另一个列表中）

我有一个列表和一组 a list 1 2 2 1 1 1 b list 1 2 我正在寻找对应 b list 中的项目并将它们从 a list 中的值相加以便输出为 1 3 2 1 我尝试过的 sum 0 for i in a list
python 相当于 sed

有没有一种方法无需双循环即可完成以下 sed 命令的操作 Input Time Banana spinach turkey sed i Banana s Toothpaste file Output Time BananaToothpas
混合两个列表的Pythonic方法[重复]

这个问题在这里已经有答案了我有两个长度为 n 和 n 1 的列表 a 1 a 2 a n b 1 b 2 b n 1 我想要一个函数作为结果给出一个列表其中包含两个中的替代元素即 b 1 a 1 b n a n b n 1 以下方法有
Python Web 编程的不同方法的优缺点

我想使用 Python 编写一些服务器端脚本但我对这样做的方法有点迷失了它从 DIY CGI 方法开始似乎以一些相当强大的框架结束这些框架基本上可以自己完成所有工作中间有很多东西比如web py http webpy org P
使用 TkInter 绑定设置不可交互（点击）覆盖

我已经浏览了其他几篇关于类似问题的帖子所有这些似乎都指向this https stackoverflow com questions 29458775 tkinter see through window not affected by

随机推荐

在 servlet 中（private static final long serialVersionUID = 1L）是什么意思？

谁能告诉我这是什么意思 private static final long serialVersionUID 1L None
log4net.ThreadLogicalContext 和 log4net.ThreadContext 有什么区别

不太明白官方文档的解释逻辑线程可以从一个托管线程跳转到另一个托管线程 ThreadContext 和 ThreadLogicalContext 有什么区别有人可以详细说明一下吗 Thanks 我应该回去并将其添加到我自己的问题中 Ste
无法导入/配置 Qt 项目

我已将以下 GitHub 项目克隆到我的硬盘上 https github com leozide leocad 我还安装了 Qt Creator 4 5 0 但是当我尝试在 Qt Creator 中加载项目时它说没有有效的套件并且不
实现 PCIe Linux 设备驱动程序（想要从内核驱动程序访问我的卡寄存器）

我正在编写一个设备驱动程序来访问 PCIe 卡上 FPGA 中的内存该卡启动并被探测发现 proc iomem 80000000 840fffff PCI Bus 03 80000000 83ffffff 0000 03 00 0 84
也许使用 JOIN 选择 65 年内的日期范围？

我正在尝试在 PHP 发布脚本上提取查询该脚本将提取信息 SELECT id FROM leads WHERE status Passed AND campaign id 22d0cf4f 0f81 28b1 d8dc 4f046bd1d
移动菜单打开和关闭按钮在 Chrome 中显示，但在 Safari 中不显示

我们的移动菜单在 Pixel 5 上的 Chrome 和 Firefox 中运行良好在 iPhone 5s 我唯一的 iPhone iPad Mini 2 和较旧的 iPad 上汉堡菜单打开和关闭图标不显示在 Chrome 和 Fir
如何从 Android Studio 手动重启 ADB

我之前在 Android Studio 上开发过 Android 应用程序一切正常我在真实设备上工作 Android Studio 可以毫无问题地识别它突然当我退出 android studio 并断开连接并重新连接我的设备时它不
使用鼠标位置旋转玩家的功能是基于鼠标距离而不是位置

我遵循了 Unity 论坛上关于如何根据鼠标位置旋转对象的答案该代码可用于更改旋转但它使用一些其他参数来旋转对象如您在本记录中看到的这是我的鼠标检测和位置编辑代码来自Game cs s update 功能 playerLocati
java.lang.illegalargumentexception url 中存在非法字符

我想请求网络服务我的参数是这样的 urlString http ip autodownload andro php key apps apk 2 bla bla bla public void getRequest String Url T
如何在不改变IGrouping类型的情况下对它进行排序？

我有一个 IGrouping 类型的对象并且希望在不更改对象类型的情况下对组内的元素进行排序换句话说我有 var tmp group OrderBy x gt x with group存在类型IGrouping
从 Firebase 中删除特定用户

有没有办法从 firebase 获取特定用户帐户然后将其删除例如 I need a means of getting a specific auth user var user firebase auth getUser uid Note
Objective-C 中的鼠标按下事件

我知道这个问题以前被问过很多次但对我来说没有任何作用下面的代码根本不会做任何事情 void mouseDown NSEvent event NSLog It worked 我尝试了很多不同的方法来使其发挥作用包括创建自定义NSEven
typedef 模板声明的替代方案

我正在努力实现 namespace NTL typedef std valarray vector 通过标准 C 我知道这是不允许的但我需要一种快速且简单的方法无需重新实现所有函数运算符重载等来获取模板 typedef 我现在正在
如何使用 C# 从 URL 下载 ZIP 文件？

我想从某个网址下载 ZIP 文件当我打开浏览器并输入 URL 时浏览器会直接开始下载 ZIP 文件但是我想要的是使用 C 代码自动执行此操作我尝试过以下代码 private void btnDownload Click object
python 绘制多重图

我尝试使用 graphviz 在 Python 中绘制多重图现在我可以用 Python 绘制常用的图表如下所示 import pygraphviz as pgv G pgv AGraph G add node a G add node
空手道-如何仅在失败的情况下自动重新运行[重复]

这个问题在这里已经有答案了空手道中是否有任何方法可以在同一执行中自动仅重新运行 UI 测试自动化失败的场景甚至在 API 中我使用 gradle 作为构建工具这是我这边的要求如果任何测试失败应该再次重试如果我们可以在每个功能场
Firestore - 使用数组添加对象

一整天都在这里用这个东西自杀我正在上两门课系和文章 export class Department articals Artical moms number id string constructor and export class
如何使用 jQuery 获取、操作和替换文本节点？

这是我的代码 li class det price a href designer customize 278258 dpid 1 Printing a from 10 li 我在任何给定页面上都有大约十五个这样的块我想获取文本节点来自
从 ANT 启动 Eclipse 运行配置

我正在将 Orion 服务器用于基于 Java 的 Web 应用程序我有一个运行配置可以使用正确的类路径和所有必要的配置启动 Orion 我还有几个 ANT 脚本用于将文件复制到构建路径我想创建一个 ANT 脚本来关闭 Orion 复
如何用Python从LDA模型生成词云？

我正在对报纸文章进行一些主题建模并使用 Python3 中的 gensim 实现了 LDA 现在我想为每个主题创建一个词云使用每个主题的前 20 个单词我知道我可以打印单词并保存 LDA 模型但是有没有办法只保存每个主题的顶部单词

如何用Python从LDA模型生成词云？

如何用Python从LDA模型生成词云？ 的相关文章

随机推荐

热门标签

如何用Python从LDA模型生成词云？的相关文章