我有一个关于使用距离矩阵进行聚类的问题,但稀疏。
是否存在不扩展矩阵并且可以使用稀疏表示的稀疏距离对象格式?
目前我正在做以下事情
# read sparse matrix
sparse <- readMM('sparse-matrix')
distance <- as.dist(sparse)
稀疏矩阵已经是正确的距离矩阵,对于未连接的条目,其具有 NA。
>sparse
[1,] . . .
[2,] 1 . .
[3,] 1 . .
> as.dist(sparse)
1 2
2 1
3 1 0
但是用 as.dist 转换它失败了
asMethod(object) 中的错误:不允许负长度向量
大概是因为它将矩阵扩展为完整的形式。矩阵 (NxN) 大小为 N = 49281
例如 hclust 方法需要此格式(dist 对象)
类似问题没有答案在 R 帮助列表中 http://r.789695.n4.nabble.com/sparse-distance-object-td4634299.html
距离矩阵如何稀疏?每两个对象之间都有一个距离,因此它实际上是一个非常稠密的矩阵。然而,三角矩阵足以描述相互距离(如D = D')。这实际上是由以下方法生成的对象的情况dist
.
如果距离矩阵由于许多对象相同而稀疏,那么您可能只想计算唯一对象的距离矩阵。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)