我可以使用自动编码器进行聚类吗？

2024-05-02

在下面的代码中，他们使用自动编码器作为监督聚类或分类，因为它们具有数据标签。http://amunategui.github.io/anomaly-detection-h2o/ http://amunategui.github.io/anomaly-detection-h2o/但是，如果我没有标签，我可以使用自动编码器来聚类数据吗？问候

深度学习自动编码器始终是无监督学习。您链接到的文章的“监督”部分是评估它的表现。

以下示例（取自我的书《Practical Machine Learning with H2O》的第 7 章，其中我在同一数据集上尝试了所有 H2O 无监督算法 - 请原谅插件）采用 563 个特征，并尝试将它们编码为两个隐藏节点。

m <- h2o.deeplearning(
  2:564, training_frame = tfidf,
  hidden = c(2), auto-encoder = T, activation = "Tanh"
  )
f <- h2o.deepfeatures(m, tfidf, layer = 1)

第二个命令提取隐藏节点权重。f是一个数据框，有两个数字列，每行一行tfidf源数据。我只选择了两个隐藏节点，以便可以绘制集群：

每次运行的结果都会改变。您（也许）可以使用堆叠自动编码器或使用更多隐藏节点获得更好的结果（但随后您无法绘制它们）。在这里我觉得结果受到数据的限制。

顺便说一句，我用这段代码制作了上面的图：

d <- as.matrix(f[1:30,]) #Just first 30, to avoid over-cluttering
labels <- as.vector(tfidf[1:30, 1])
plot(d, pch = 17) #Triangle
text(d, labels, pos = 3) #pos=3 means above

（P.S.原始数据来自Brandon Rose 关于使用 NLTK 的优秀文章 http://brandonrose.org/clustering. )

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

我可以使用自动编码器进行聚类吗？的相关文章

如何获取基于Keras的LSTM模型中每个epoch的一层权重矩阵？

我有一个基于 Keras 的简单 LSTM 模型 X train X test Y train Y test train test split input labels test size 0 2 random state i 10 X t
YOLO 目标检测：算法如何预测大于网格单元的边界框？

我试图更好地理解 YOLO2 和 3 算法的工作原理该算法处理一系列卷积直到达到13x13网格然后它能够对每个网格单元内的对象以及这些对象的边界框进行分类如果您查看这张图片您会发现红色边框比任何单个网格单元都大边界框也以对象的
如何在 CAFFE 的新网络中重复使用同一网络两次

我有一个预训练的网络我们称之为N 我想在新网络中使用两次有人知道如何复制吗然后我想为每个副本分配不同的学习率例如 N1是第一个副本N N2是第二个副本N 新网络可能如下所示 N1 gt joint ip N2 gt layer 我知
如何平衡 GAN 中生成器和判别器的性能？

这是我第一次使用 GAN 我面临着判别器多次优于生成器的问题我正在尝试重现PA模型来自本文 http openaccess thecvf com content ICCV 2017 papers Sajjadi EnhanceNet Si
ValueError：Layerequential_20 需要 1 个输入，但它收到了 2 个输入张量

我正在尝试使用 Tensorflow 中的 KMNIST 数据集和我正在使用的教科书中的一些示例代码构建一个简单的自动编码器但当我尝试拟合模型时我不断收到错误错误说ValueError Layer sequential 20 expe
H2O R api：从网格搜索中检索最佳模型

我正在使用h2oR 中的包 v 3 6 0 并且我构建了一个网格搜索模型现在我正在尝试访问最小化验证集上的 MSE 的模型在Python中sklearn 这在使用时很容易实现RandomizedSearchCV Pseudo code
保存并加载 keras 自动编码器

看看这个奇怪的加载保存模型情况我保存了变分自动编码器模型及其编码器和解码器 autoencoder save autoencoder save overwrite True encoder save encoder save overw
H2O 是否或将会提供任何与 h2o word2vec 一起使用的预训练向量？

H2O 最近在其 API 中添加了 word2vec 能够在您自己提供的语料库上轻松训练自己的词向量真是太好了然而使用大数据和大型计算机存在更大的可能性由于网络带宽和计算能力的限制谷歌或 H2O ai 等软件供应商可能无法访问这种类
尝试理解 Pytorch 的 LSTM 实现

我有一个包含 1000 个示例的数据集其中每个示例都有5特征 a b c d e 我想喂7LSTM 的示例以便它预测第 8 天的特征 a 阅读 nn LSTM 的 Pytorchs 文档我得出以下结论 input size 5 hid
Keras：模型准确率在达到 99% 准确率后下降，损失为 0.01

我正在 keras 中使用改编的 LeNet 模型来进行二元分类我有大约 250 000 个训练样本比率为 60 40 我的模型训练得很好第一个 epoch 的准确率达到 97 损失为 0 07 10 个 epoch 后准确率超过
使用 load_model 加载经过训练的tensorflow.keras模型会返回JSON解码错误，而未经训练的模型加载正常

我有一个训练有素的 Keras 模型使用 tensorflow keras API 构建和训练并使用tf keras save model 没有可选参数的方法 Tensorflow 是最新的我的 Python 版本是 3 8 根据我的
在 Tensorflow 中使用队列将数据馈送到网络时分开验证和训练图

我一直在做大量关于如何使用队列将数据正确输入网络的研究但是我在互联网上找不到任何解决方案目前我的代码能够读取训练数据并执行训练但无需验证和测试这里有一些重要的行构成了我的代码 images volumes utils inputs
如何使用 TensorFlow 设置 Udacity 深度学习课程的学习环境 (Windows)

相信很多对深度学习感兴趣的人都听说过这门课程 https www udacity com course deep learning ud730 https www udacity com course deep learning ud730
H2O R 中的子集化

我有一个 h2o 对象子集的标准 R sub1 lt trans trans Type 1 我在水中也尝试过同样的方法它不工作 sub1 lt trans trans Type 1 我也尝试过 sub1 lt h2o exec tran
如何加载 caffe 模型并转换为 numpy 数组？

我有一个 caffemodel 文件其中包含 ethereon 的 caffe tensorflow 转换实用程序不支持的层我想生成我的咖啡模型的 numpy 表示我的问题是如何将 caffemodel 文件我还有 prototx
我可以使用自动编码器进行聚类吗？

在下面的代码中他们使用自动编码器作为监督聚类或分类因为它们具有数据标签 http amunategui github io anomaly detection h2o http amunategui github io anomaly
使用 Keras 的 ImageDataGenerator 预测单个图像

我对深度学习很陌生所以请原谅我这个可能很简单的问题我训练了一个网络来分类positive and negative 为了简化图像生成和拟合过程我使用了ImageDataGenerator和fit generator函数如下图 imp
当我想在电脑中加载该模型时，我可以在 colab bu 中加载我的深度模型，但我不能

我在colab中通过keras 2 3 1和tensorflow 2 1 0训练了一个深度模型我用JSON和Keras保存了我的模型 saveWeightPath content drive My Drive model info mod
了解 YOLO 是如何训练的

我试图了解 YOLO v2 是如何训练的为此我使用这个 keras 实现https github com experiencor keras yolo2 https github com experiencor keras yolo2在
对于只有 10000 个单词的字典来说，真正需要什么嵌入层 output_dim？

我正在训练一个 RNN 其单词特征集非常少大约 10 000 个我计划在添加 RNN 之前从嵌入层开始但我不清楚真正需要什么维度我知道我可以尝试不同的值 32 64 等但我宁愿先有一些直觉例如如果我使用 32 维嵌入向量则每

随机推荐

_mm256_fmadd_ps 比 _mm256_mul_ps + _mm256_add_ps 慢？

我有一个图像处理算法来计算a b c d与AVX 伪代码如下 float a new float N float b new float N float c new float N float d new float N assign va
CSS3 过渡缩放但不平移

我在任何地方都找不到这个问题的答案可能是因为它不存在但无论如何是否可以独立定义平移和缩放的转换而不是定义 transition property transform 现在我得到了以下定义 logo position absolute
spring boot feign 客户端获取 HTTP 404

我目前正在检查如何在我的项目之一中使用 Feign 作为声明式 REST 客户端以下是假客户端 FeignClient name SEARCHCABMS configuration AppFeignConfiguration class
AWS Athena 扁平化来自嵌套 JSON 源的数据

我想从 Athena 中的嵌套 JSON 创建一个表描述的解决方案here http docs aws amazon com athena latest ug json html使用 hive Openx JsonSerDe 等工具尝试在
Leiningen 中的本地依赖项无需创建 Maven 存储库？

我正在构建一个 Compojure Web 应用程序我希望它使用我编写的另一个 Clojure 项目中的函数我对 Maven 一点也不熟悉据我所知它的学习曲线非常陡峭很遗憾一切 https stackoverflow com q
如何在 PHP 中运行 ffmpeg 命令

我需要在 PHP 中运行 ffmpeg 命令但是 php ffmpeg 不再支持最新版本并且已经过时我可以知道在网络文件中运行 ffmpeg 命令的替代方法吗 PHP Javascript jQuery 我尝试exec and shel
将对象数组作为请求中的 url 参数传递

我需要将一个对象数组每个对象有 2 个字段作为 http 请求的 url 中的参数我该怎么做以及这个链接应该是什么样子您可以使用您的结构创建一个 xml 即一个对象数组每个对象都有两个字段然后将其转换为字符串如下所示举个例子
如何对 Grails 应用程序进行并发修改测试

我想运行测试来模拟用户同时修改 Grails 应用程序的某些数据我可以使用任何插件工具机制来有效地做到这一点吗它们不必是特定于 grails 的应该可以并行触发多个操作我更愿意在功能级别上运行测试到目前为止我正在使用 Sele
h 文件中声明的 c++ 静态数组给出警告“已定义但未使用”

我对以下内容感到好奇我在头文件中声明了一个简单的 C 数组如下所示 static int userCardsIndexes INITIAL CARDS NUMBER 0 1 8 9 16 17 它给了我很多警告 userCardsInd
从 Glassfish 取消部署 Grails 应用程序会发生类不变性违规

我有一个在 Glassfish 中运行的 Grails 应用程序但是当我取消部署时它会出现违反类不变性快速查看堆栈跟踪并在网络上搜索报告这是 Log4j 的问题我当时使用的是最新的log4jlog4j 1 2 16 jar 任何
aria-live 和 JAWS

我正在尝试让 aria live 区域与 JAWS 11 和 IE8 一起正常工作使用下面的代码我可以让 JAWS 在单击按钮时宣布新值但行为不是我所期望的本例的 JSFiddle http jsfiddle net fLzhR
带有多个嵌入图像的 VB.NET 电子邮件

请有人给我一些关于如何发送包含多个嵌入图像的电子邮件的指示我可以发送一封基本电子邮件也可以使用 AlternateView 发送一封带有单个嵌入图像的电子邮件在 bodyText 中作为 XElement 我有 img src 然后我
在 firebase 动画列表中，有没有办法让 firebase 列表在加载之前知道小部件的预期高度？

有没有办法明确告诉 firebase 动画列表特定小部件的高度应该是多少就我而言 firebase 列表中的每个项目都有一个基于子级数量的可变大小它是一个评论线程每当一个大线程超出视口上方时它就会被处理并且忘记高度这会导致在尝
Material-UI 标签与选项值不同

我有一个材质 UI
Urban Airship：默认状态栏通知的自定义图标

Urban Airship 建议创建自定义通知CustomPushNotificationBuilder如果您想对状态栏通知进行任何修改包括简单地更改图标不幸的是使用RemoteView因为通知会带来许多与定制制造商和或特定于平台的
在 Android 4.2.2 和 4.3 上关闭 BluetoothSocket 时出现致命信号 11 SIGSEGV

我的应用程序在 Android 2 3 3 到 4 1 2 下运行良好但自从 Android 4 2 2 和 Android 4 3 以来我有一个 fatal signal 11 SIGSEGV at 0x00 当我关闭蓝牙插座时我查
Emacs 退出终端

在 Emacs 中运行终端模式时使用M x term using C x C o我无法切换到另一个缓冲区来继续处理事情我知道这是可能的M x shell但使用此命令时 shell 的某些方面不起作用 less more 手册页等我想知道
从属性文件加载属性并使其在整个作业/管道中可用 - Jenkins 声明性语法

我的要求很简单我只是想外部化一些值以使我的 Jenkinsfile 更可重用为此我需要从 Jenkinsfile 旁边的文件加载属性并确保这些属性是可以在管道中的任何地方使用我对 Groovy 和 Jenkins 代码仍然很陌生
让第 3 方在无需访问完整项目/源代码的情况下进行 Symfony 设计

我正在开发 Symfony 2 WebApp WebApp已经上线大约两年了现在我想更新一下设计这项工作应该外包给第三方当然设计师需要访问所有样式 sass 文件和模板 twig 文件才能进行设计我怎样才能做到这一点而又不让
我可以使用自动编码器进行聚类吗？

在下面的代码中他们使用自动编码器作为监督聚类或分类因为它们具有数据标签 http amunategui github io anomaly detection h2o http amunategui github io anomaly

我可以使用自动编码器进行聚类吗？

我可以使用自动编码器进行聚类吗？ 的相关文章

随机推荐

热门标签

我可以使用自动编码器进行聚类吗？的相关文章