如何识别每个簇内的序列？

2024-01-08

使用作为一部分的 biofam 数据集TraMineR:

library(TraMineR)
data(biofam)
lab <- c("P","L","M","LM","C","LC","LMC","D")
biofam.seq <- seqdef(biofam[,10:25], states=lab)
head(biofam.seq)
     Sequence                                    
1167 P-P-P-P-P-P-P-P-P-LM-LMC-LMC-LMC-LMC-LMC-LMC
514  P-L-L-L-L-L-L-L-L-L-L-LM-LMC-LMC-LMC-LMC    
1013 P-P-P-P-P-P-P-L-L-L-L-L-LM-LMC-LMC-LMC      
275  P-P-P-P-P-L-L-L-L-L-L-L-L-L-L-L             
2580 P-P-P-P-P-L-L-L-L-L-L-L-L-LMC-LMC-LMC       
773  P-P-P-P-P-P-P-P-P-P-P-P-P-P-P-P

我可以进行聚类分析：

library(cluster)
couts <- seqsubm(biofam.seq, method = "TRATE")
biofam.om <- seqdist(biofam.seq, method = "OM", indel = 3, sm = couts)
clusterward <- agnes(biofam.om, diss = TRUE, method = "ward")
cluster3 <- cutree(clusterward, k = 3)
cluster3 <- factor(cluster3, labels = c("Type 1", "Type 2", "Type 3"))

然而，在此过程中，biofam.seq 中的唯一 id 已被数字 1 到 N 的列表替换：

head(cluster3, 10)
[1] Type 1 Type 2 Type 2 Type 2 Type 2 Type 3 Type 3 Type 2 Type 1
[10] Type 2
Levels: Type 1 Type 2 Type 3

现在，我想知道每个簇内有哪些序列，以便我可以应用其他函数来获取每个簇内的平均长度、熵、子序列、相异性等。我需要做的是：

将旧 id 映射到新 id
将每个簇中的序列插入到单独的序列对象中
对每个新序列对象运行我想要的统计信息

我怎样才能完成上面列表中的2和3？

例如，第一个集群的状态序列对象可以简单地通过以下方式获得

bio1.seq <- biofam.seq[cluster3=="Type 1",]
summary(bio1.seq)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

clusteranalysis

datamanipulation

traminer

如何识别每个簇内的序列？的相关文章

R data.table 1.9.2 关于 setkey 的问题

这似乎是 1 8 10 后引入的一个错误与包含列表的 DT 的 setkey 相关运行下面两个代码来查看问题 library data table dtl lt list dtl 1 lt data table scenario 1 p
如何返回包含最大值标签的向量

我有一个 4 列数组我想获得一个向量其中每行包含包含该行最大值的列的标签我可以在循环中执行此操作但我想使用矩阵函数来提高速度我怎样才能在不编写自己的库函数的情况下做到这一点有一个函数可以做到这一点如果x是你的矩阵尝试max
如何绘制每条线之间具有特定距离的图形

实际上我尝试绘制一个图形但它将所有列线放在一起并显示因此它不具有代表性我尝试制作模拟数据并向您展示我如何绘制它并向您展示我想要的内容我不知道如何制作像下面所示的示例的数据但我在这里做了什么 set seed 1 M lt
使用 pkg:sjPlot 函数创建一个生成部分斜体单元格的数据框

我正在尝试创建一个简单的数据表其中 Coral taxon 列中的属名称为斜体而 spp 列中的属名称为斜体属名后面的部分不大写我尝试使用 expression 函数对 Coral taxon 的每一行进行编码但没有成功 sum
R中整数类和数字类有什么区别

我想先说我是一个绝对的编程初学者所以请原谅这个问题是多么基本我试图更好地理解 R 中的原子类也许这适用于一般编程中的类我理解字符逻辑和复杂数据类之间的区别但我正在努力寻找数字类和整数类之间的根本区别假设我有一个简单的向量x
读取R中打开的Excel文件

有没有办法将打开的Excel文件读入R 当Excel中打开一个excel文件时 Excel会对文件加锁比如R中的read方法无法访问该文件你能绕过这个锁吗 Thanks 编辑这发生在带有原始 Excel 的 Windows 下发生错
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个
不同 R/lme4 版本的单一拟合结果不匹配

我试图将 R 版本 3 5 3 lme4 1 1 18 1 的随机效应估计与 R 版本 4 1 1 lme4 1 1 27 1 相匹配然而当存在奇异拟合时这两个版本之间的随机效应存在微小差异我对奇点警告很满意但令人费解的是不同版本
如何绘制大时间序列（数千次给药次数/药物剂量）？

我正在尝试绘制医院中如何开出单一药物的图解在这个虚拟数据库中我在 2017 年 1 月 1 日之后遇到了 1000 名患者绘图的目的是了解该药物的给药模式在接近入院出院或患者住院期间是否更频繁高剂量给药 Get random d
用表达式分割轴标签

我有一个带有包含表达式的长标签的图我想将其分成两行在表达式中添加 n 结果不符合预期 ylabel lt expression A very long label with text and n expression alpha bet
R 中按时间划分的平均值

我每秒测量一次化合物浓度我想求 30 秒和 60 秒的平均值我一直在阅读这里的帖子我尝试过lubridate and dplyr 但没有运气我正在努力完成这项工作但我一直没能做到我正在从 SAS 过渡到 R 所以请耐心等待这是
R 将多个值与向量进行比较并返回向量[重复]

这个问题在这里已经有答案了我有一个向量 A 对于 A 的每个元素我想检查它是否等于第二个向量 Targets 中的任何元素我想要一个逻辑值向量其长度为 A 作为返回也提到了同样的问题here http r 789695 n4 na
跟踪循环迭代

抛硬币成功你赢100 否则你输50 你会一直玩直到你口袋里有钱a 的价值如何a在任何迭代中都被存储 a lt 100 while a gt 0 if rbinom 1 1 0 5 1 a lt a 100 else a lt a 50
从日期变量创建月末日期

我有一个包含日期变量的大型数据框它反映了该月的第一天有没有一种简单的方法来创建代表该月最后一天的新数据框日期变量以下是一些示例数据 date start month seq as Date 2012 01 01 length 4 by
R、Rcpp 与 Armadillo 中矩阵 rowSums() 与 colSums() 的效率

背景来自 R 编程我正在扩展到 C C 形式的编译代码Rcpp 作为循环交换以及一般的 C C 效果的实践练习我实现了 R 的等效项rowSums and colSums 矩阵的函数Rcpp 我知道它们以 Rcpp 糖的形式存在并
尝试使用 JRI 将 R 与我的 Java 应用程序集成，但出现错误。谁能解释一下原因和解决办法吗？

我需要将 Java 与 R 集成来运行一些数学命令并使用 R 的功能进行绘图以下部分代码给出了错误 public static void main String args HelloRWorld r new HelloRWorld r h
列出 R 数据文件的内容而不加载

我有时用print load myDataFile RData 当我加载数据文件时列出它的内容有没有办法列出内容而不加载数据文件中包含的对象我认为如果不加载对象就无法做到这一点解决方案可能是使用包装器将 R 对象保存到save 该函数
正态分布平均值的贝叶斯推理玩具 R 代码 [降雪量数据]

我有一些降雪观测 x lt c 98 044 107 696 146 050 102 870 131 318 170 434 84 836 154 686 162 814 101 854 103 378 16 256 我被告知它遵循正态分布
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
picker输入字体或背景颜色

我在闪亮的仪表板中使用 pickerInput 这很好除了一个问题背景颜色和字体颜色太相似使得过滤器选择难以阅读有什么办法可以改变背景或字体颜色吗如果可能的话我想继续使用 pickerInput 但如果有一个带有 selectI

随机推荐

按频率对 Javascript 数组进行排序，然后过滤重复项

获取 javascript 数组按值的频率排序然后过滤唯一值的优雅方法是什么 So apples oranges oranges oranges bananas bananas oranges becomes oranges banan
关注有值的输入字段

我专注于 jQuery 的输入字段 input text focus 输入字段中已有一些文本值当我聚焦时光标在最后一个字母之后闪烁我如何将光标放在第一个字母之前你可以使用我为你创建的这个小插件修改自这个脚本 http blog v
如何在CoordinatorLayout中的Viewpager下面获取Adview

此刻AdView出现在里面ViewPager所以它会阻止应用程序中的内容我怎样才能得到AdView出现在下面ViewPager而不是在里面我试过把AdView in a RelativeLayout以下ViewPager但随后AdVie
具有 CRUD 方法的类违反了单一职责原则？

我试图理解单一责任原则我有以下问题单一职责原则 SRP 规定永远不应该班级变更的原因不止一个通常我们的Resource Service和Repository类有创建读取更新和删除方法我们正在将每个班级更改为修改任何这些操
BigQuery 下载或导出为 JSON 不考虑类型

我在 BigQuery 中运行的查询 SELECT 5 as a 当我运行上述查询并选择时得到的架构另存为表格当我将查询结果下载为 JSON 时得到的 JSONor当我导出表时 a 5 这不应该是 a 5 From 导出表数据导出限制
C# Mysql - 在异步等待服务器的数据库查询上使用锁

I have TcpListener类和我正在使用async await读写对于该服务器我创建了单个数据库实例在其中准备了所有数据库查询但对于不止一个TcpClient我不断遇到异常类型异常MySql Data MySqlClie
找不到模块“file-name.png”或其相应的类型声明 - Typescript React

我正在尝试在我的打字稿反应项目中导入一个 png 如下所示 import logo from assets Logo svg 我收到了这个 TS 错误 Cannot find module assets Logo svg or its co
为什么 Meteor 抱怨集合的插入方法已经定义了？

谁能告诉我为什么下面的代码会抛出以下错误 Error A method named players insert is already defined 我是 Meteor 和 Coffeescript 的新手所以我可能会忽略一些简单的东西
在 Matlab 中使用单个校准图像校正镜头畸变

我想纠正一系列图像的镜头畸变所有图像都是用固定在适当位置的相机拍摄的并且还可以使用同一设置的棋盘图像检测到扭曲的棋盘图像的角点后我想计算径向扭曲系数以便我可以校正图像类似于估计相机参数 http www mathworks co
检测设备是否有 GPS

如何检测GPS是否可用 iPod touch 和 iPad WiFi 版本没有 GPS 它们有基于 WiFi 的其他功能无论如何如何知道 GPS 是否可用或者如何检测 iPod Touch 或 iPad Wifi 型号这是 iOS
无法从源 Pylance 解析导入“flask”（reportMissingModuleSource）

当我写作时 from flask import Flask 一条黄线即将出现flask并说明无法从源 Pylance 解析导入 flask reportMissingModuleSource 另外我也能够成功地使用这个包完成工作但问题是
如何在 R闪亮中显示多个.xpt文件并根据它们的列过滤它们？

当我尝试上传多个 xpt 文件以在 R闪亮应用程序的主面板中显示表格时它给我带来了以下问题我也在寻找过滤选项我想在上传多个文件时按列进行过滤以便在每个数据框数据表的主面板中显示适当的行 Error Warning Error in
ORM 和构造函数

我正在研究 NET ORM 实现并且有一个重要的紧迫问题是否有任何 NET ORM 实现不需要数据库中每个字段的公共属性当我看到这样的例子时this https web archive org web 20090831053827 h
Objective-C - 使用 GDB 打印方法参数

我正在努力使用 GDB 调试我的 Objective C 程序我有一个函数 NSString reverse NSString someString我想调试它我设置断点的方法如下 gdb break MyClass reverse 现在
如果当前行包含字符串，如何打印文件中的下一行？

我正在尝试编写一些内容来打印文件中的某些行假设该文件如下所示 name 1 name a name 2 name b name 3 extra 1 name c name 4 extra 1 name d 所以通常我可以做if line
如何将动态外部组件加载到 Angular 应用程序中

我在 Angular 应用程序中遇到问题我想要一个用 Typescript 编写的角度应用程序 aot 目的是显示带有一些小部件的用户仪表板小部件是一个角度组件我的应用程序附带了一些嵌入式小部件但小部件应该通过市场之类的东西来扩展
Elasticsearch：为什么我的查询返回太多结果？

我正在查询http elasticsearch myserver net 9200 my index foo 使用以下查询 query ids type foo values fff bar baz 但我收到的响应有 12 个命中这是我的
并行计算右侧的连续零位（尾随）：解释？

考虑这个链接 http graphics stanford edu seander bithacks html ZerosOnRightParallel来自 Bit Twiddling Hacks 网站为了计算尾随位使用以下算法 uns
预期类型为“System.Int64”，但实际值的类型为“System.String”

有时我们应用程序的用户会收到此信息无效强制转换异常预期类型为 System Int64 但实际值的类型为 System String 我们无法重现这种情况并且它发生在identityDataGrid 模型的 DataGrid Id 字段
如何识别每个簇内的序列？

使用作为一部分的 biofam 数据集TraMineR library TraMineR data biofam lab lt c P L M LM C LC LMC D biofam seq lt seqdef biofam 10 25

如何识别每个簇内的序列？

如何识别每个簇内的序列？ 的相关文章

随机推荐

热门标签

如何识别每个簇内的序列？的相关文章