有没有办法在热图中保留聚类但减少观察数量？

2023-12-07

我的数据集包含 20 列、90 个观察值（行）。我生成了一个非常简洁的热图，它使用 pheatmap 包将我的数据分为两组。虽然它并不完全干净，但树状图的两个簇几乎根据我的条件将我的样本分为两个不同的组。现在我想将这组 90 个观察值减少到大约 20-30 个观察值，但仍然希望保留相同的聚类顺序，如图所示pheatmap。有没有办法做到这一点？或者任何其他包可以将我的观察结果减少到最小集，并且仍然可以通过现在看到的聚类顺序来保留？代码为pheatmap is

pheatmap(mydata[rownames(df.90),],scale="row",clustering_distance_cols = "correlation",show_rownames= T,show_colnames=T,color=col,annotation=batch.annotation,cluster_col=T,fontsize_row = 8,fontsize_col = 8,clustering_method = "ward.D2",border_color = NA,)

我错过的 R 中的任何包都可以处理此类甚至是pheatmap我可以用作减少变量的函数，并进行一种排列测试，以找到仍然可以保留聚类的最小观察集

数据是患者的行中的基因和列中的表达。

我想回答我自己的问题并希望得到反馈。我用的是kmeans_k=30在 pheatmap 中，获得了 29 个聚类，这些聚类仍然能够保留我之前对 90 个观测值进行聚类的情况。从那里我获得了各自簇中的基因。我从观测值两侧的热图中选择了前 5 个簇，这些簇仍然可以生成我所需的热图，因为它们是具有高 SD 的簇。由于在我的 pheatmap 中，我有scale =“row”并保持行树状图和列树状图打开，所以即使现在我也不想更改它们。因此，当我现在绘制这 31 个基因（观察值）时，实际上它们进一步改进了我的行聚类，并按照我想要的更清晰的方式将它们完全划分为 2 组。 kemans 和新热图的代码

km 表示 30

obj<-pheatmap(df.90,scale="row",clustering_distance_cols = "correlation",show_rownames= T,show_colnames=T,color=col,annotation=batch.annotation,cluster_col=T,fontsize_row = 6,fontsize_col = 7,clustering_method = "ward.D2",border_color = NA,cellwidth = NA,cellheight = NA,kmeans_k = 30)

检索簇并提取观察结果/基因

obj$kmeans$cluster

获取顶部聚类并用热图绘制它们

pheatmap(mydata[rownames(df.31),],scale="row",clustering_distance_cols = "correlation",show_rownames= T,show_colnames=T,color=col,annotation=batch.annotation,cluster_col=T,fontsize_row = 8,fontsize_col = 8,clustering_method = "ward.D2",border_color = NA,)

大家觉得这个方法怎么样？这虽然不像我想要的那样，但我认为这也没有错。如果有人可以提供更好的方法或途径，或者他们认为这也不正确，我希望得到反馈。谢谢

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

permutation

hclust

pheatmap

有没有办法在热图中保留聚类但减少观察数量？的相关文章

R中的函数重新排序和排序值[重复]

这个问题在这里已经有答案了我正在尝试以下功能 stest lt data frame group c John Jane James mean c 3 5 1 transform stest group reorder group mea
将 jupyter R 内核与 Visual Studio 代码结合使用

对于 python jupyter 笔记本我目前正在使用 VSCode python 扩展但是我找不到任何使用替代内核的方法我对 jupyter R 内核特别感兴趣有没有办法在 VSCode 中使用 R 内核来处理 jupyter
如何以 HH:MM 表示小数时间

我有一个十进制格式的时间 22 13以小时为单位我想在 R 中将其表达为HH MM 我是说 22 08 贬值秒有人可以帮助我吗语法 02 0f是将值四舍五入为整数并使其始终为 2 个单位所以 7 8分钟将转换为字符 08 x lt
Shiny中的DT：仅更改单行的颜色

我有一个数据集 ID Value 102 306 41 800 101 783 105 193 myID 334 我想将其绘制为数据表其中只有带有 myID 的行为橙色表的其余部分为蓝色看过之后辅助函数 https rstudio g
从 R 中的函数绘制到文件

背景嘿大家我是 R 的新手在一位团队成员提供了关于 R 在学术环境中的有用性的教程后我对使用它产生了兴趣我正在尝试编写一个脚本来自动从多个文件中读取数据然后将结果图表绘制到多个文件中以便可以轻松地将它们添加到手稿中 Power
按列名称索引拆分数据框

这是先前问题的变体 df lt data frame matrix rnorm 9 9 ncol 9 names df lt c c 1 d 1 e 1 a p b p c p 1 o1 2 o1 3 o1 我想按下划线后面的column
替换 gtable 中 ggplot 的元素：标签和网格线

我正在学习操纵ggplot对象与gtable 这是我问的一个相关问题用 grid 和 gtable 拆解 ggplot https stackoverflow com questions 27750737 dismantling a gg
为什么R中的转置函数将数字转换为字符？

我在 Excel 中构建了一个简单的矩阵其中包含一些字符值和一些数值 Excel 中设置的数据的屏幕截图 https i stack imgur com UpQ1I png 我使用 openxlsx 包将其读入 R 如下所示 librar
merge.zoo 删除时区

的结果merge zoo与其输入的时区不同考虑下面的例子 library zoo zoo a zoo data frame a 1 5 seq as POSIXct 2014 01 01 00 00 01 tz UTC as POSIXc
从 R 中的因子记录创建变量

我有点迷失了我有一个如下所示的数据框 tract ageClass count 1 0 4 71 2 0 4 192 3 0 4 81 1 5 8 9 2 5 8 86 3 5 8 42 我想要这样的结果 tract 0 4 5 8 1
用 R 将矩阵划分为 N 个大小相等的块

如何使用 R 将矩阵或数据帧划分为 N 个大小相等的块我想水平切割矩阵或数据框例如给定 r 8 c 10 number of chunks 4 data matrix seq r c nrow r ncol c gt gt gt da
R 语言与 php 集成以获取 R 的结果

我有以下 R 脚本 assign data path data path lt C Users Owner Desktop R work assign valus to the following three percent train p
即使设置了语言环境，data.frames中的藏文字符也无法在R控制台中显示（中文可以，矩阵中的藏文可以）

在 R 中藏文字符位于 data frames 中时无法正确显示 gt Sys setlocale LC CTYPE Tibetan 1 Tibetan China 950 gt data frame a a 1
ggplot2 中列组合的分面图

我正在做相关性的组合并且想在 ggplot2 中绘制每个组合然而我希望每个组合都在一个单独的面板上而不是一个面板上的所有点 making up columns in my real data I m doing correlatio
将表达式捕获为 R 中的函数体

我正在尝试编写一个程序该程序将表达式作为输入并返回一个以该表达式绑定作为其主体的函数 caller lt function expr params Function lt function params body env parent f
调整 R 图的边距

我对调整 R 图的边距很感兴趣我在 MacOS 上使用 R Studio 在 2013 intel CPU Macbook pro 上运行这是我用于生成绘图的数据 spins lt runif 50 min 0 max 50 这是我用来
如何更改 ggplot2 中轴标签上的小数位数？

具体来说这是在facet grid 中在谷歌上广泛搜索了类似的问题但不清楚语法或它的去向我想要的是 y 轴上的每个数字在小数点后都有两位数即使尾随一位是 0 这是scale y continuous 或 element text
如何使用 purrr::pmap 在nested.data.frame中绘制多个ggplot

我对 purrr pmap 在nested data frame中制作多个ggplot图有一些疑问我可以使用 purrr map2 毫无问题地运行下面的代码并且可以在nested data frame中制作多重图 2个图作为示例我在
R 是解释型编程语言还是编译型编程语言？

R 是解释型编程语言还是编译型编程语言 The R FAQ https cran r project org doc FAQ R FAQ html What is R 003f说 R 的核心是一种解释型计算机语言
将多个对齐的绘图放置在一页上时避免浪费空间

我想将四个图放在一个页面上轴标签应仅打印在最边缘即x仅用于底部图表的轴标签以及y仅左图的轴标签这既适用于整个轴的名称也适用于各个刻度线我可以使用以下代码生成一些内容 pdf file ExampleOutput pdf widt

随机推荐

如何在java中创建类型安全的泛型数组？

我想在 java 中创建一个通用数组维护 Java 通常提供的类型安全性我正在使用这段代码 class Stack
“of”与“from”运算符

之间唯一的区别是Observable of and Observable from参数格式像Function prototype call and Function prototype apply Observable of 1 2 3
1帧内使用opengl es在ipad上最多可以绘制多少个三角形？

ipad上一帧最多可以画多少个三角形另外用于绘制这些三角形的 gl 调用数量是否有限制您在 iPad 上遇到的三角形总数的唯一限制是内存大小以及您希望渲染的速度发送的顶点越多应用程序将使用的内存就越多渲染速度就越慢例如在我的
utf8' 编解码器无法解码位置 15 中的字节 0x89：起始字节无效

这是我的项目的视图其中我尝试使用 boto 将图像从本地系统上传到 s3 class ImageList generics ListCreateAPIView queryset Image objects all serializer c
如何在gem5中启用ARM半主机？

我尝试运行在 QEMU 上运行的半主机退出指令 mov r0 0x18 ldr r1 0x20026 svc 0x00123456 但是gem5似乎没有正确处理它并崩溃了以下补丁将其添加到 baremetal py 但不添加到 fs py
jquery改变用户滚动的背景颜色

jquery 是否有可能在用户向下滚动页面时背景动画从 50 白色变为 90 白色或其他所以首先是颜色rgba 255 255 255 5 当用户滚动到颜色下方 210px 时become rgba 255 255 255 9 更新后的更
Darwin/MacOS 是否修改了 Bash？

我想知道使用 Bash 内置命令的 Bash 脚本的可移植性据我了解每种 UNIX 风格都倾向于修改各种 UNIX 实用程序但他们是否倾向于不理睬 Bash 和 Bash 内置函数呢尤其是 MacOS 呢据我所知 bash 在 M
从 C++ 扩展中获取 MIME 类型

有什么方法可以在给定文件扩展名的情况下获取 C 中的 MIME 类型吗我读过有关 HKEY CLASSES ROOT 的内容但老实说我不知道如何使用它我想要的是作为输入 string extension pdf string ext
SWT 是否分发可在任何受支持的操作系统上运行的 JAR？

The SWT项目目前为每个受支持的操作系统维护一个可分发的版本例如 swt 3 4 2 win32 win32 x86 zip swt 3 4 2 gtk linux x86 zip swt 3 4 2 carbon macosx zi
EF 6 - 如何正确执行并行查询

创建报告时我必须执行 3 个涉及相同上下文的独立实体的查询因为它们很重所以我决定使用 ToListAsync 为了让它们并行运行但是令我惊讶的是我得到了一个例外使用 EF 6 并行执行查询的正确方法是什么我应该手动启动新任务
为什么使用 LWUIT 的三星手机不支持阿拉伯字体？

我已经在一些三星手机上测试了我的移动应用程序以进行测试三星 Corby b3410 和三星 c6712 这些手机上未显示阿拉伯字体但它可以在诺基亚手机上正常工作我在用着System font用于显示阿拉伯字体为什么这些手机不支持如
Latin-1 / UTF-8 编码 php

我有一个 UTF 8 编码与 Latin 1 混合的数据库我认为这就是问题所在这就是字符在数据库中的样子 should be 当我将标题设置为然后字符就出来了当我删除标题时它们会像数据库中一样出现我希望他们像这样出来如果可能的
Core Haskell 将类型应用于函数意味着什么？

我为 Core Haskell 编写了一个自定义的漂亮打印机以便更好地研究 Core 的结构这台漂亮打印机的要点是它需要核心模块并在输出中包含数据构造函数默认情况下Outputable执行好像不行这是我运行漂亮打印机的模块的代码
如何将多域用户电子邮件添加到 Azure AD

我们有三个不同的网站我们希望使用 Azure AD 来实现单点登录我的问题是如何将可能拥有不同电子邮件地址的用户添加到 Azure AD 通过 API 例如电子邮件受保护电子邮件受保护电子邮件受保护 etc 当我尝试通过 API
如何在 Eclipse 编辑器中打开外部浏览器

如何以编程方式使用 Eclipse 插件中的打开选项打开 Safari 等外部浏览器 try PlatformUI getWorkbench getBrowserSupport getExternalBrowser openURL new
使用 PHP 创建 Web 服务

我想用 PHP 创建一个可供不同消费者网页 Android 设备 iOS 设备使用的 Web 服务我来自 Microsoft 背景因此对如何使用 C 等进行操作很满意理想情况下我希望能够提供可以发送 JSON 的 REST 服务
如何使用 React 导航在 mobx 商店中导航？

我可以用this props navigation从屏幕组件进行导航我应该如何在 mobx 存储文件中执行类似操作或者我应该在商店中进行导航吗我读了无需导航道具即可导航文章但它似乎只适用于屏幕组件对吗有人说用global变量来存
具有选择类的语义 UI 多级下拉列表不会展开

当我尝试使用下拉菜单时search selection并选择一个子类别它会展开到自身中并且下拉列表中会出现一个小滚动条如果我不添加search selection它似乎运行得很好 JSFiddle https jsfiddle net
JavaScript 图像 URL 验证

我需要验证图像 url 以检查该 url 是否是以下任何扩展名的图像 jpeg jpg gif png 示例当我们验证此 url 时http www example com asdf jpg它应该给我们真正的价值和像这样的网址http w
有没有办法在热图中保留聚类但减少观察数量？

我的数据集包含 20 列 90 个观察值行我生成了一个非常简洁的热图它使用 pheatmap 包将我的数据分为两组虽然它并不完全干净但树状图的两个簇几乎根据我的条件将我的样本分为两个不同的组现在我想将这组 90 个观察值减少到大

热门标签