在Python中绘制二维矩阵，代码和最有用的可视化

2023-11-25

我有一个非常大的矩阵（10x55678），采用“numpy”矩阵格式。该矩阵的行对应于一些“主题”，列对应于单词（文本语料库中的唯一单词）。该矩阵中的每个条目 i,j 都是一个概率，这意味着单词 j 以概率 x 属于主题 i。因为我使用的是 ids 而不是真实的单词，并且由于我的矩阵的维度非常大，所以我需要以某种方式将其可视化。您建议使用哪种可视化？一个简单的情节？还是更复杂、信息更丰富的？（我问这些是因为我对有用的可视化类型一无所知）。如果可能的话你能给我一个使用 numpy 矩阵的例子吗？谢谢

我问这个问题的原因是我想对我的语料库中的单词主题分布有一个总体了解。欢迎任何其他方法

你当然可以使用 matplotlib 的imshowor pcolor方法来显示数据，但正如评论所提到的，如果不放大数据子集，可能很难解释。

a = np.random.normal(0.0,0.5,size=(5000,10))**2
a = a/np.sum(a,axis=1)[:,None]  # Normalize

pcolor(a)

Unsorted random example

然后，您可以根据单词属于簇的概率对它们进行排序：

maxvi = np.argsort(a,axis=1)
ii = np.argsort(maxvi[:,-1])

pcolor(a[ii,:])

enter image description here

这里 y 轴上的单词索引不再等于原始顺序，因为事物已经排序。

另一种可能性是使用networkx包来绘制每个类别的单词簇，其中概率最高的单词由更大或更接近图中心的节点表示，并忽略那些在该类别中没有成员资格的单词。这可能会更容易，因为您有大量单词和少量类别。

希望这些建议之一有用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在Python中绘制二维矩阵，代码和最有用的可视化的相关文章

如何将人物传奇带到前台？

我有一系列子图其中每个子图都有一个图例我想在每个子图之外与相邻子图重叠问题在于图例位于其自己的图的顶部但位于相邻图的下方 Legend 不将 zorder 作为参数所以我不知道如何解决这个问题这是我使用过的代码 import
Json.dump 失败并显示“必须是 unicode，而不是 str”TypeError

我有一个 json 文件其中恰好有大量中文和日文以及其他语言字符我将其加载到我的 python 2 7 脚本中使用io open如下 with io open multiIdName json encoding utf 8 as j
为什么我会得到“ufunc 'multiply' did not contains a loop with Signature Matching types dtype('S32') dtype('S32') dtype('S32')”，其值来自 raw_

我正在尝试创建一个非常简单的程序它将绘制一个抛物线其中v是速度 a是加速度和x是时间用户将输入值v and a then v and a and x将决定y 我试图用这个来做到这一点 x np linspace 0 9 10 a ra
将 2D Panda 的 DataFrame 列表转换为 3D DataFrame

我正在尝试创建一个将标签值保存到 2D DataFrame 的 Pandas DataFrame 这是我到目前为止所做的我正在使用读取 csv 文件pd read csv并将它们附加到列表中出于这个问题的目的让我们考虑以下代码 imp
使用 Python 将阿拉伯语或任何从右到左书写系统的字符串打印到 Linux 终端

非常简单的例子是 city print city 我期望输出是但实际上输出是相反的字符串字母看起来有点不同因为它们有开始中间和结束形式我无法将其粘贴到此处因为复制粘贴会再次更正字符串的顺序如何在 Linux 终端上正确打印阿拉
self.__dict__.update(**kwargs) 的风格是好是坏？

在 Python 中假设我有一些类 Circle 它继承自 Shape Shape 需要 x 和 y 坐标此外 Circle 需要半径我希望能够通过执行类似的操作来初始化 Circle c Circle x 1 y 5 r 3 Cir
Python 中嵌套列表的排序和分组

我有以下数据结构列表的列表 4 21 1 14 2008 10 24 15 42 58 3 22 4 2somename 2008 10 24 15 22 03 5 21 3 19 2008 10 24 15 45 45 6 21 1 1
为什么最简单的 requests_mock 示例在 pytest 中失败？

我有一个特殊的问题requests mock 我想用它pytest测试我的 API 包装器库我尝试过使用requests mock 文档中的第一个示例 http requests mock readthedocs io en latest
在 python 中使用 subprocess.call 时如何将 stdout 重定向到文件？

我正在从另一个 python 脚本 A 调用一个 python 脚本 B 使用 subprocess call 如何将 B 的标准输出重定向到指定的文件我正在使用 python 2 6 1 传递一个文件作为stdout参数为subproc
Python itertools groupby 中令人不安的奇怪行为/错误？

我在用itertools groupby解析一个短的制表符分隔的文本文件文本文件有几列我想做的就是对具有特定值的所有条目进行分组x在特定的列中下面的代码对名为的列执行此操作name2 寻找变量中的值x 我尝试使用以下方法来做到这一点c
如何在 matplotlib 中第一个 x 轴的底部添加第二个 x 轴？

我指的是已经提出的问题here https stackoverflow com questions 10514315 how to add a second x axis in matplotlib 在此示例中用户通过将第二个轴添加到与标
如何使用资源模块来衡量函数的运行时间？

我想使用Python代码测量函数的CPU运行时间和挂钟运行时间此处建议资源模块如何以 Python 代码不是从终端的形式分别测量函数的 CPU 运行时间和挂钟运行时间 https stackoverflow com q 192046
Python 包安装：pip 与 yum，还是两者一起安装？

我刚刚开始管理 Hadoop 集群我们使用 Bright Cluster Manager 直至操作系统级别 CentOS 7 1 然后使用 Ambari 以及适用于 Hadoop 的 Hortonworks HDP 2 3 我不断收到安装
Python 中的颜色处理

对于我的聚类 GUI 我目前对聚类使用随机颜色因为我事先不知道最终会得到多少个聚类在 Python 中这看起来像 import random def randomColor return random random random ra
在 Python 中伪造一个对象是否是类的实例

假设我有一堂课FakePerson它模仿基类的所有属性和功能RealPerson 不扩展它在Python 3中是否可以伪造isinstance 为了认识到FakePerson as a RealPerson只通过修改对象FakePers
重新安装后使用 pandas dataframes 时出现问题

我已经重新安装了 Python 和 Anaconda 现在面临以下问题在我将 pkl 文件加载到数据帧并尝试查看该文件后如下所示 df pd read pickle example pkl df 我收到错误 AttributeErr
将同一 numpy 数组的两个视图组合成单个视图而不复制数组？

我有一个大型 2d numpy 数组我想删除它的子集并处理函数剩下的内容我需要对许多子集执行此操作因此理想情况下我不想每次都创建数组的副本该函数不会更改数组中的任何值 mat np load filename mat 1 mat i
将 .parquet 编码为 io.Bytes

目标将 Parquet 文件上传到 MinIO 这需要将文件转换为字节我已经能够做到这一点了 csv json and txt bytes data to csv encode utf 8 bytes json dumps self d
Python Web 编程的不同方法的优缺点

我想使用 Python 编写一些服务器端脚本但我对这样做的方法有点迷失了它从 DIY CGI 方法开始似乎以一些相当强大的框架结束这些框架基本上可以自己完成所有工作中间有很多东西比如web py http webpy org P
IOError：在 Linux 上的 ReportLab 中使用 matplotlib PNG 时“解码器 zip 不可用”，适用于 Windows

我正在使用 ReportLab 打印 matplotlib 生成的图表我可以在我的 Windows 开发机器上毫无问题地执行此操作然而当我部署到 Ubuntu 服务器时渲染失败并出现所述错误我假设我缺少一个 Python 模块但

随机推荐

在 OS X 上安装 C++ 库

我试图理解一些基本概念但我似乎无法弄清楚它们我真的很困惑为 C 安装我认为它们被称为库意味着什么我正在尝试安装 OpenCV 但我不知道安装它需要做什么如何检查或者 OpenCV 到底是什么它是一个库框架还是其他东西我的
在 HTML 中嵌入 vlc 播放器

我正在尝试在网页中嵌入 vlc 播放器最好的方法是什么实际上我必须使用 vlc 流式传输视频文件并将其显示在网页上以便登录我网站的其他用户可以看到该视频我尝试过各种片段但无法嵌入它任何帮助将不胜感激谢谢 HTML 方式确保在
类方法的并行执行

我需要并行执行同一类的许多实例的方法为此我尝试使用Process start 和Process join 命令来自multiprocessing module 例如对于一个类 class test def init self def m
为什么给定的转换运算符不调用构造函数？

struct A struct B B A pA B operator A pA return this template
在 R 中绘制决策边界

我有一系列来自的建模类标签knn功能我有一个包含基本数字训练数据的数据框以及另一个用于测试数据的数据框我将如何为返回值绘制决策边界knn功能我必须在锁定的计算机上复制我的发现因此如果可能请限制第三方库的使用我只有两个类别标签
当 setMaximumSize() 和 setPreferedSize() 不起作用时，如何对 JComponent 设置硬限制？

我正在尝试制作一个类似于 Photoshop 或 Paint Shop Pro 中的图像处理框架但我遇到了问题现在我有一个带有 JDesktopPane 的 JFrame 窗口当我单击按钮时会生成一个 JInternalFrame
Coq 中是否有一套最小完整的策略？

我见过很多 Coq 策略它们在功能上是相互重叠的例如当你在假设中得到确切的结论时你可以使用assumption apply exact trivial 也许还有其他人其他例子包括destruct and induction对于无感
从 C# 进行 VLC 远程控制

我正在尝试从 C 控制 VLC 媒体播放器我尝试使用 Net 中的 FindWindow 命令获取窗口句柄但我发现每次播放文件时窗口的名称都会发生变化我遇到的最大问题是将 wm commands 发送到 vlc 这种方法适用于 Win
在 Android 中将文件从内部存储复制到外部存储

My app 安卓API 15 制作一张图片并将其存储在内存的文件夹中现在我想将此文件复制到外部存储内的另一个文件夹例如 sdcard myapp 我尝试了以下方法方法 1 private void copyFile File sr
Python Google cloud firestore错误504超过截止日期

我在 python 中有一个 fore firestore 函数其中我为一个集合的所有用户执行 for 循环然后进入另一个集合以获取一些指标并在第一个集合中更新此指标我运行该函数但在执行过程中的某个时刻该函数中断并给出以下错误 R
对包含字母数字条目的 VARCHAR 列进行排序

我正在使用 SQL Server 该列是VARCHAR 50 我想这样排序 1A 1B 2 2 3 4A 4B 4C 5A 5B 5C 5N 14 Draft 21 22A 22B 23A 23B 23C 23D 23E 25 26 FR0
我无法准确理解 JavaScript 的方法 string.match(regexp) 的 g 标志是如何工作的

在 JavaScript The Good Parts 一书中它解释了方法string match regexp 如下 match 方法匹配一个字符串和一个正则表达式如何这取决于 g 标志吗如果没有 g 标志则调用 string
Angularjs - 在 tr ng-repeat 中添加额外的行

NG repeat 出现在表行上我的问题是我们如何才能实现以下目标 tr Looping here tr 现在当数据对象在 a 上循环时 tr 我有一个场景我必须将 1 行数据分成两部分显示 tr Eg Table 数据1 数据1 2
React：ReferenceError：regeneratorRuntime 未定义

我正在尝试在我的反应应用程序中使用异步和等待 onSubmit async model gt await this setState data model 添加上述代码后我在浏览器控制台中收到错误 ReferenceError 未定义 r
Android 屏幕在显示/隐藏系统栏时闪烁

问题我想在用户向上滚动 RecyclerView 时显示系统栏并在用户向下滚动时隐藏系统栏然而使用我的方法它可以工作但内容在显示隐藏过程中奇怪地移动和闪烁您在此处上传了该行为的视频 https drive google com
获取 Java 堆栈跟踪中涉及的对象

我可以使用检索当前堆栈跟踪Thread currentThread getStackTrace 但这只给了我调用中涉及的类是否可以检索调用跟踪中涉及的对象实例也许某种库允许我从堆中检索对象我有一个问题需要我追溯到一个 Spring
如何在 numpy 中对二维数组进行装箱？

我是 numpy 的新手我有一个 2D 对象数组我需要将其装入一个较小的矩阵中然后获取每个容器中对象的数量以制作热图我按照答案在这个线程上创建垃圾箱并对一个简单的数组进行计数但我不确定如何将其扩展到二维这是我到目前为止所拥有的
如何在没有 Activity/Service 的情况下创建 BroadcastReceiver？

我正在尝试创建没有活动服务的 BroadcastReceiver 虽然当代码中存在活动时当我删除活动时注册和执行代码没有问题但它失败了我确实使用清单注册了 BroadcastReceiver 但是当从项目中删除活动时它不会被调用
Java-声明新的泛型集时出现意外的类型错误

我以为我知道我在用泛型做什么但显然不知道 ArraySetList
在Python中绘制二维矩阵，代码和最有用的可视化

我有一个非常大的矩阵 10x55678 采用 numpy 矩阵格式该矩阵的行对应于一些主题列对应于单词文本语料库中的唯一单词该矩阵中的每个条目 i j 都是一个概率这意味着单词 j 以概率 x 属于主题 i 因为我使用的是 id

在Python中绘制二维矩阵，代码和最有用的可视化

在Python中绘制二维矩阵，代码和最有用的可视化 的相关文章

随机推荐

热门标签

在Python中绘制二维矩阵，代码和最有用的可视化的相关文章