使用谱聚类对看不见的点进行聚类

2024-03-11

我在用谱聚类 http://papers.nips.cc/paper/2092-on-spectral-clustering-analysis-and-an-algorithm方法对我的数据进行聚类。实施似乎工作正常。但是，我有一个问题 - 我有一组看不见的点（训练集中不存在），并且希望根据 k 均值导出的质心对这些点进行聚类（论文中的步骤 5）。然而，k 均值是在 k 个特征向量上计算的，因此质心是低维的。

有谁知道一种方法，可用于将看不见的点映射到低维并计算投影点与步骤 5 中 k 均值导出的质心之间的距离。

迟到的答案，但这是如何做到的R。我自己一直在寻找，但最终我自己编写了代码。

##Let's use kernlab for all kernel stuff
library(kernlab)

##Let's generate two concentric circles to cluster
r1 = 1 + .1*rnorm(250) #inner
r2 = 2 + .1*rnorm(250) #outer
q1 = 2*pi*runif(500) #random angle distribution
q2 = 2*pi*runif(500) #random angle distribution

##This is our data now
data = cbind(x = c(r1*cos(q1),r2*cos(q2)), y = c(r1*sin(q1),r2*sin(q2)))

##Let's take a sample to define train and test data
t = sample(1:nrow(data), 0.95*nrow(data))
train = data[t,]
test = data[-t,]

##This is our data
plot(train, pch = 1, col = adjustcolor("black", alpha = .5))
points(test, pch = 16)
legend("topleft", c("train data","test data"), pch = c(1,16), bg = "white")


##The paper gives great instructions on how to perform spectral clustering
##so I'll be following the steps
##Ng, A. Y., Jordan, M. I., & Weiss, Y. (2002). On spectral clustering: Analysis and an algorithm. Advances in neural information processing systems, 2, 849-856.
##Pg.2 http://papers.nips.cc/paper/2092-on-spectral-clustering-analysis-and-an-algorithm.pdf
#1. Form the affinity matrix
k = 2L #This is the number ofo clusters we will train
K = rbfdot(sigma = 300) #Our kernel
A = kernelMatrix(K, train) #Caution choosing your kernel product function, some have higher numerical imprecision
diag(A) = 0
#2. Define the diagonal matrix D and the laplacean matrix L
D = diag(rowSums(A))
L = diag(1/sqrt(diag(D))) %*% A %*% diag(1/sqrt(diag(D)))
#3. Find the eigenvectors of L
X = eigen(L, symmetric = TRUE)$vectors[,1:k]
#4. Form Y from X
Y = X/sqrt(rowSums(X^2))
#5. Cluster (k-means)
kM = kmeans(Y, centers = k, iter.max = 100L, nstart = 1000L)
#6. This is the cluster assignment of the original data
cl = fitted(kM, "classes")
##Projection on eigen vectors, see the ranges, it shows how there's a single preferential direction
plot(jitter(Y, .1), ylab = "2nd eigenfunction", xlab = "1st eigenfunction", col = adjustcolor(rainbow(3)[2*cl-1], alpha = .5))

##LET'S TRY TEST DATA NOW
B = kernelMatrix(K, test, train) #The kernel product between train and test data

##We project on the learned eigenfunctions
f = tcrossprod(B, t(Y))
#This part is described in Bengio, Y., Vincent, P., Paiement, J. F., Delalleau, O., Ouimet, M., & Le Roux, N. (2003). Spectral clustering and kernel PCA are learning eigenfunctions (Vol. 1239). CIRANO.
#Pg.12 http://www.cirano.qc.ca/pdf/publication/2003s-19.pdf

##And assign clusters based on the centers in that space
new.cl = apply(as.matrix(f), 1, function(x) { which.max(tcrossprod(x,kM$centers)) } ) #This computes the distance to the k-means centers on the transformed space

##And here's our result
plot(train, pch = 1, col = adjustcolor(rainbow(3)[2*cl-1], alpha = .5))
points(test, pch = 16, col = rainbow(3)[2*new.cl-1])
legend("topleft", c("train data","test data"), pch = c(1,16), bg = "white")

输出图片

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

clusteranalysis

kmeans

使用谱聚类对看不见的点进行聚类的相关文章

如何在Python中绘制k距离图

如何在 DBSCAN 中绘制在 python 中给定最小点值的距离图我正在寻找拐点和相应的 epsilon 值在 sklearn 中我没有看到任何返回此类距离的方法我错过了什么吗您可能想使用 numpy 提供的矩阵运算来加速距
对一维数据进行最佳聚类？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有人有一篇论文解释如何CKmeans 1d dp http cran r project org
Rand Index函数（聚类性能评估）

据我所知 python 中没有可用于 Rand Index 的软件包而对于调整后的 Rand Index 您可以选择使用sklearn metrics adjusted rand score labels true labels pred
K 均值可用于帮助基于像素值的图像分离吗？

我正在尝试根据像素值分离灰度图像假设一个 bin 中的像素为 0 到 60 另一个 bin 中的像素为 60 120 120 180 依此类推直到 255 范围在此大致等距案件然而通过使用 K 均值聚类是否可以更实际地测量我的像素值
删除加权有向图中的循环

这是我其他帖子的后续问题具有大小约束的聚类算法 https stackoverflow com questions 30112428 algorithm for clustering with size constraints 我正在研究
Python：3 维空间中的 DBSCAN

我一直在寻找 3 维点的 DBSCAN 实现但运气不佳有谁知道我的图书馆可以处理这个问题或者有这方面的经验吗我假设 DBSCAN 算法可以处理 3 个维度通过将 e 值设置为半径度量并通过欧几里德分离测量点之间的距离如果有人尝试过
R 中的 PCA 多重图

我有一个如下所示的数据集 India China Brasil Russia SAfrica Kenya States Indonesia States Argentina Chile Netherlands HongKong 0 0854
R 聚类-带有观察标签的轮廓

我用以下方法进行层次聚类clusterR 中的包使用silhouette函数我可以获得树状图中任何给定高度 h 截止点的簇输出的轮廓图 run hierarchical clustering if require cluster ins
DBSCAN 算法可以创建少于 minPts 的簇吗？

我刚刚编写了 DBSCAN 算法我想知道 DBSCAN 算法是否可以允许集群中的点数少于所使用的 minPts 参数我一直在使用http people cs nctu edu tw rsliang dbscan testdatagen
使用 igraph 在 R 中进行 Louvain 社区检测 - 分配交替的组成员资格分配

我一直在使用 igraph 在 R 中运行 Louvain 社区检测感谢我之前查询的这个答案 https stackoverflow com questions 49834827 louvain community detection i
计算 3D 平面的 Voronoi 图

是否有代码库可以计算 3D 平面平行四边形的 Voronoi 图我检查了 Qhull 它似乎只能处理点在它的示例中 Voro 可以处理不同大小的球体但我找不到任何多边形在这张图片中 3d 中的样本平面 https i stac
如何总结组合列表

我有一个包含 2 个元素组合的列表如下所示 cbnl lt list c A B c B A c C D c E D c F G c H I c J K c I H c K J c G F c D C c E C c D E c C E
如何从一个巨大的矩阵中获得最大可能的列序列和最少可能的行NA？

我想从数据框中选择列以便得到结果连续的列序列尽可能长而带有 NA 的行数尽可能少因为之后必须删除它们我想这样做的原因是我想运行TraMineR seqsubm 自动获取转移成本矩阵按转移概率并稍后运行cluster agnes
python scikit-learn 缺失数据聚类

我想对缺少列的数据进行聚类手动执行此操作我将在没有此列的情况下计算缺少列的距离使用 scikit learn 不可能出现丢失数据的情况也没有机会指定用户距离函数是否有机会对缺失数据进行聚类示例数据 n samples 1500
循环系统发育树上的节点标签

我正在尝试创建循环系统发育树我有这部分代码 fit lt hclust dist Data 4 method complete members NULL nclus 3 color c red blue green color list
如何在 scipy 层次聚类中获取非单例簇 ID

根据this http docs scipy org doc scipy reference generated scipy cluster hierarchy dendrogram html scipy cluster hierarchy
如何在Python中的二值图像上使用kmeans聚类？

我试图对两个不同的人采取二元面具其他一切都是黑色的现在我想使用将每个人分组到他们自己的集群中K means这样我最终就可以在它们周围绘制边界框这是我到目前为止的代码 def kmeans img k values range 1 5
Apache Spark MLLib - 使用 IDF-TF 向量运行 KMeans - Java 堆空间

我正在尝试从大文本文档集合 TF IDF 向量在 MLLib 上运行 KMeans 文档通过 Lucene 英语分析器发送稀疏向量由 HashingTF transform 函数创建无论我使用的并行程度如何通过合并函数 KMea
在 mahout-0.6 上运行“Mahout in Action”中的示例代码时出现 IOException

我正在学习 Mahout 并阅读 Mahout in Action 当我尝试运行第 7 章 Simple KMeans Clustering java 中的示例代码时弹出了一个异常线程 main 中的异常 java io IOExcep
估计/选择 DBSCAN 的最佳超参数

我需要根据不同介词的分布找到自然出现的名词类别如施事工具时间地点等我尝试使用 k means 聚类但帮助较少效果不佳我正在寻找的类有很多重叠可能是因为类的非球状形状和 k means 中的随机初始化我现在正在使用 DBS

随机推荐

未捕获的类型错误：未定义不是 WordPress 中的函数（匿名函数）[重复]

这个问题在这里已经有答案了我收到以下错误这似乎是 Javascript 未解释符号未捕获的类型错误未定义不是函数 main js 1 匿名函数 main js 1 下面附加的是 main js 代码这在某个时候工作得很好我正在
BrowserSync Gulp 无法在 Chrome 中打开

我尝试在 Chrome 中使用 BrowserSync 和 Gulp 在本地主机上打开我的网站但它不起作用默认情况下它在 Firefox 中打开一切正常但是当我更改 gulpfile js 中的参数以在 Chrome 中打开网站
iOS7 上的 TableViewCell 中不会显示复选标记

我现在正在研究一个奇怪的问题我的应用程序部署目标设置为 iOS6 因此我想同时支持 iOS6 和 iOS7 我只有一个简单的 UITableView 用户可以在其中选择首选的通知声音代码为 UITableViewCell tableVi
预测 git Push 中将推送多少数据

我偶尔会使用昂贵的互联网连接并且我想知道至少大约有多少数据将被推送到远程git push 事实上我想我很喜欢我的评论可以将其作为答案发布当您推送时 git 会创建一个包含所有必需对象的包并将其上传到远程这意味着我们正在寻找一种
将 less 和 css 文件捆绑在一起

我觉得捆绑应该用于将一堆一起使用的文件分组到一个交付给浏览器的文件中这意味着对于我的根样式我想做类似以下的事情 var bundle new StyleBundle Content style Include Content mysty
网格/列表视图的概念如何将图像发送到 imageitem 类

在我的项目中我想加载 url 图像并在 gridview 活动中显示它们但如何将这些图像加载到 gridview 适配器呢所以我试图理解这个概念grid list view适配器据我了解在一个基本示例中它包含 3 个活动 1 主
Doctrine 2 QueryBuilder 添加多个选择元素/参数？

我仍在与 QueryBuilder 学说作斗争因为当我想将另一个元素添加到选择表达式中时我认为它无法正常工作在这两种情况下学说 queryBuilder gt getQuery gt getResults 返回一个数组其中实体表示
如何将不存在的链接重定向到 Angular 2 中的主页？

如果用户输入不存在的链接我希望页面重定向到主页我该怎么做谢谢 RouteConfig path home name Home component HomeComponent path about name About componen
for 循环和 apply 函数系列之间的性能差异是什么？

人们常说一个人应该更喜欢lapply over for循环但也有一些例外例如 Hadley Wickham 在他的 Advance R 书中指出的那样 http adv r had co nz Functionals html htt
创建真正的随机数[重复]

这个问题在这里已经有答案了可能的重复为什么我的随机数生成器在 C 中不是随机的 https stackoverflow com questions 932520 why does it appear that my random num
全角页脚不会粘在底部

我没有设法将全宽页脚粘贴到网页底部当页脚上方的主要内容低于一定高度时页脚下方会出现空白区域我尝试过使用各种解决方案例如以下 css 代码 html body margin 0 padding 0 min height 100 pos
禁用 Alt+F4 但允许通过代码关闭表单，CloseReason.UserClosing 没有帮助

I want that the form will not close by doing Alt F4 but if Application Exit or this Close is called from the same Form i
我可以在按钮单击时显示/创建 jsTree 吗？

我有一个divid result 我用它来显示用户操作的结果我也放了纯文本和html 每次用户操作后该 div 都会被新的覆盖results 现在我想在这个 div 中显示一个实例jsTree http www jstree com 我
编码.UTF8 还是编码.Unicode？

Is Encoding Unicode https learn microsoft com en us dotnet api system text encoding unicode只是 UTF 16 的一个名称那为什么只叫Unicode
Smallcheck 中的“Depth”参数应该控制到什么程度？

我正在做我的第一个真正的工作smallcheck 我对如何使用有点困惑Depth范围在开始之前让我先说明一下我正在使用什么smallcheck for 在工作中我们在我们自己的内部数据库前构建一个简单的 Web 服务 Web 服务执行
我可以覆盖 web.config 中的连接字符串以进行本地开发吗？

我有一个 WebForms 项目它有一个连接字符串硬编码到 web config 中用于调试 web Debug config 该连接字符串指向用于开发的数据库服务器我想运行该数据库的本地副本以便我的更改不会立即影响其他人我一直在
Tomcat：PreResources 标签未加载 jar

我正在使用 tomcat 9 并尝试从 PreResources 标签下面加载所有与项目相关的 jar
如何在 Windows 10 创意者更新中使用 Acrylic Accent？

我找不到任何使用 Acrylic Accent 的详细文档创建背景画笔 https learn microsoft com en us uwp api Windows UI Composition Compositor 我找到了一个pos
将 AUMID 转换为应用程序名称 C#

给定 AppUserModelID AUMID 有没有办法从这些数据中获取应用程序名称而不尝试对 AppUserModelID 进行一些字符串操作我正在寻找一个 api 调用来处理这个或类似的事情在下面的情况下应用程序名称将为 Mi
使用谱聚类对看不见的点进行聚类

我在用谱聚类 http papers nips cc paper 2092 on spectral clustering analysis and an algorithm方法对我的数据进行聚类实施似乎工作正常但是我有一个问题我有一

使用谱聚类对看不见的点进行聚类

使用谱聚类对看不见的点进行聚类 的相关文章

随机推荐

热门标签

使用谱聚类对看不见的点进行聚类的相关文章