K-means算法的参数详解

2023-11-02

参数名称	默认值及输入类型	参数解释
algorithm	默认：Auto 有auto、full和elkan三种选择。	algorithm: 优化算法的选择，有auto、full和elkan三种选择。 full就是一般意义上的K-Means算法， elkan是使用的elkan K-Means算法。 auto则会根据数据值是否是稀疏的(稀疏一般指是有大量缺失值)，来决定如何选择full和elkan。如果数据是稠密的，就选择elkan K-means，否则就使用普通的Kmeans算法。
copy_x	True	主要起作用于提前计算距离的情况，如果是True,则表示在源数据的副本上提前计算距离时，不会修改源数据。
init	默认值为‘k-means++’ 有三个可选值：‘k-means++’、‘random’、或者传递一个ndarray向量。	(1)‘k-means++’ 用一种特殊的方法选定初始质心从而能加速迭代过程的收敛（1）、从输入的数据点集合（要求有k个聚类）中随机选择一个点作为第一个聚类中心；（2）、对于数据集中的每一个点x，计算它与最近聚类中心(指已选择的聚类中心)的距离D(x)；（3）、选择一个新的数据点作为新的聚类中心，选择的原则是：D(x)较大的点，被选取作为聚类中心的概率较大；（4）、重复2和3直到k个聚类中心被选出来 (2)‘random’ 随机从训练数据中选取初始质心。 (3)如果传递的是一个ndarray，则应该形如 (n_clusters, n_features) 并给出初始质心。
max_iter	默认值为300 int型，	最大迭代数。
n_clusters	默认为8 int型	生成的聚类数，
n_init	默认值为10 int型	用不同的聚类中心初始化值运行算法的次数，最终解是在inertia意义下选出的最优结果。
n_jobs	int型。	指定计算所用的进程数。内部原理是同时进行n_init指定次数的计算。 -1，则用所有的CPU进行运算。若值为1，则不进行并行运算若值小于-1，为-2，则用到的CPU数为总CPU数减1。
precompute_distances	默认值是auto auto,True,False三个参数值可选	是否需要提前计算距离如果选择auto，当样本数*质心数>12兆的时候，就不会提前进行计算，如果小于则会与提前计算。提前计算距离会让聚类速度很快，但是也会消耗很多内存。
random_state	默认值为numpy.RandomState 类型，还可以选择int型	用于初始化质心的生成器（generator）。如果值为一个整数，则确定一个seed。
tol	1e-4	float型，容忍的最小误差，当误差小于tol就会退出迭代，与inertia结合来确定收敛条件。
verbose	默认为0	是否输出详细信息，

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

K-means算法的参数详解的相关文章

互联网晚报

今日看点双11首日天猫1小时超2600个品牌GMV超去年全天京东4小时售1 9亿件商品菜鸟推出物流领域首个个人减碳账单双11网友开始比拼回收量特斯拉中国推出自营融资租赁购车服务可零首付购买特斯拉小鹏汽车智驾安全体系升级
低秩矩阵(矩阵填充)-图像修复、协同过滤

转载自 https blog csdn net manduner article details 80564414 一矩阵填补 Matrix Completion 矩阵填补的应用很广泛论文 Matrix completion by de
Windows终端工具——Hyper使用及配置

简介同步发布在个人博客 https www zhyong cn posts 1aac 欢迎访问一直以来都想找一个可以替换windows自带的cmd工具常见的有cmder Babun 甚至是git bash 详见知乎问答 Window
Keil-C51 与 Keil -ARM 共存的方法

按照之前的安装情况来看我们将C51和ARM安装在了不同的文件夹里将C51安装装包内的C51和UV4复制到ARM的安装包中复制过程中会出现如下情况此时选择跳过这些文件修改ARM文件中的TOOLS INI文件将C51文件夹中TOOL
nginx 之 proxy_pass 接口转发的规则

今天上了一个多页应用发现接口转发后是 401 最后发现是接口转发出错了地址里多拼了一个路径以前我一直以为location 字段会替换掉 proxy pass 里面配置的 url 地址今天了解了一下发现还是有不少细节的 node
JDBC连接MySQL5.7.18失败的解决方法

java lang ClassNotFoundException com mysql jdbc Driver at org apache catalina loader WebappClassLoader loadClass WebappC
Linux基础 - NTP时间同步

博客主页 Passerby Wang的博客 CSDN博客系统运维云计算 Linux基础领域博主所属专栏 Linux基础上期文章 Linux基础 DNS服务进阶如觉得博主文章写的不错或对你有所帮助的话还望大家多多支持呀关注点赞
数字化转型的一般性框架-数字化转型网

数字化转型的一般性框架数字化转型是一个全面的系统性的过程需要从多个方面进行考虑和实践以下是数字化转型的一般性框架定义数字化转型的愿景和目标企业需要明确数字化转型的愿景和目标包括数字化转型的战略方向目标市场竞争优势等分析业
malloc 背后的虚拟内存和 malloc实现原理

面试的时候经常会被问到 malloc 的实现从操作系统层面来说 malloc 确实是考察面试者对操作系统底层的存储管理理解的一个很好的方式涉及到虚拟内存分页分段等下面逐个细说 1 虚拟内存首先需要知道的是程序运行起来的话需要被加
Git上传文件不能超过100M 解决方案

文件上传git仓库时文件限制大小解决方案上传项目到Git上当某个文件大小超过100M时就会上传失败因为默认的限制了上传文件大小不能超过100M 如果需要上传超过100M的文件就需要我们自己去修改配置首先打开终端进入项目所在
【华为OD机试真题 JAVA】计算堆栈中的剩余数字

JS版华为OD机试真题 JS 计算堆栈中的剩余数字标题计算堆栈中的剩余数字时间限制 1秒内存限制 32768K 语言限制不限向一个空栈中依次存入正整数假设入栈元素n 1 lt n lt 2 31 1 按顺序依次为nx n4
图像边缘检测——一阶微分算子 Roberts、Sobel、Prewitt、Kirsch、Robinson

图像为什么会有边缘图像边缘一般指图像的灰度变化率最大的位置成因主要如下 1 图像灰度在表面方向变化不连续 2 图像中物体在空间上的深度不一致 3 在光滑的表面上颜色不一致 4 图像中物体的光影所以边缘检测指的是从图像中检测边缘点和边缘
ubuntu 16.04 安装 CUDA9.0 和 cuDNN7

文章目录 ubuntu 16 04 安装 CUDA9 0 和 cuDNN7 1 英伟达驱动安装 1 1 方法一 ubuntu 系统自动安装我只用过这个方法 1 2 方法二命令行 1 3 查看是否安装成功 2 CUDA 2 1 下载 CU
Python机器视觉--OpenCV入门--机器视觉与OpencCV用途简介

1 机器视觉介绍现在说的机器视觉 Machine Vision 一般指计算机视觉 Computer Vision 简单来说就是研究如何使机器看懂东西就是是指用摄影机和电脑代替人眼对目标进行识别跟踪和测量等机器视觉并进一步做图形处理
从Java到Go的过渡：实现服务器自动化运维

目录 Go语言基础自动化运维从Java到Go的过渡在今天的博客中我们将探讨如何使用Go语言进行服务器自动化运维例如Ansible和Puppet 作为一名Java开发者这是一个极好的机会来学习和理解Go语言并开始你的Go语言开发
华为OD机试 - 告警抑制（C & Python）

题目描述告警抑制是指高优先级抑制低优先级告警的规则高优先级告警产生后低优先级告警不再产生请根据原始告警列表和告警抑制关系给出实际产生的告警列表注意 1 不会出现循环抑制的情况 2 告警不会传递比如 A gt B B gt C
浅谈JDBC，JDBC实现的几大步骤

前言当我们学完数据库之后总觉得数据库和java之间是没有联系的但是我们还是要去学数据库是为了什么呐现在就来了现在我就来给大家讲讲怎么将数据库和java进行联系我们也可以用数据库代替以前的IO流来存东西了 JDBC 概述 JDBC
day04-数组

1 数组 1 1什么是数组理解数组就是存储数据长度固定的容器存储多个数据的数据类型要一致 1 2数组定义格式记忆 1 2 1第一种数据类型数组名示例 int arr double arr char arr 1 2 2第二种数
【正点原子FPGA连载】第三十一章交通灯实验-摘自【正点原子】领航者ZYNQ之FPGA开发指南_V2.0

1 实验平台正点原子领航者ZYNQ开发板 2 平台购买地址 https item taobao com item htm id 606160108761 3 全套实验源码手册视频下载地址 http www openedv com th
【MySQL调优】如何进行MySQL调优？一篇文章就够了！

导航 Java笔记踩坑汇总 Java基础进阶 JavaWeb SSM SpringBoot 瑞吉外卖 SpringCloud 黑马旅游谷粒商城学成在线 MySQL高级篇设计模式常见面试题源码目录一监控报警二排查慢SQ

随机推荐

C#9.0新特性

运行环境 NET 5 0 vs2019 16 8版本以上目标类型推导在这之前我们创建一个对象 Point p new Point x y 9 0中进行了优化 Point p new x y Point ps new 1 2 new 5
java多线程-对象及变量的并发访问

synchronized同步方法该关键字可用来保障原子性可见性和有序性方法内的变量为线程安全多个线程的情况下各个线程的变量为其私有互不影响实例变量非线程安全问题与解决方案在被调用方法前加synchronized关键字上锁同
高质量程序设计指南C++ C 代码规范

这里只是搬运作者对匈牙利命名规则做合理简化之后的命名规则比较适合于 Windows应用程序的开发建议1 类型名和函数名均以大写字母开头的单词组合而成例如 class Node 类名 class LeafNode 类名 void D
修改镜像源和修改PATH

ls a 显示所有文件夹这里就有我们需要的bashrc 修改path 和condarc 修改镜像 vim bashrc or condarc 打开文件直接摁i进入修改模式进行修改修改完以后esc wq 确认保存退出就好了
qt opengl 2d纹理数组

2d纹理数组就是用一个纹理数组类型的变量保存数个纹理这样就避免了使用多个单个的纹理对象这再批处理一系列相同大小的纹理时非常有用我这里用到的场景是在点精灵中使用纹理数组使得每个精灵纹理上不同的图案我用的图片有16张当顶点为16个时
单片机c51 单一外中断的应用

1 在51单片机的P1接口上有8只LED 在外部中断0输入引脚P3 2 INT0 引脚接有一只按钮开关K1 程序要求将外部中断0设置成负跳沿触发程序启动时 P1口上的8只LED亮按一次开关按钮K1 使引脚接地产生一个负跳沿触发的外部中
python os.walk读取路径下文件名

import os dir path C for root dirs files in os walk dir path for file in files print os path join root file if file len
android自定义view之地图（一）

最近参加了一个比赛要用到自己做一个自定义的小地图所以在网上查找了一些关于自定义view的有关资料也了解了自定义控件的初步知识效果图第一阶段我画了一个自制的网格图点哪个网格就会哪个网格就会显示工作环境图代码介绍 1 我们都知道
Qt之QProcess(一)运行cmd命令

Qt提供了QProcess类 QProcess可用于完毕启动外部程序并与之交互通信一启动外部程序的两种方式 1 一体式 void QProcess start const QString program const QStringLi
python3 题解（47 定义有理数类）

有理数类问题浮点数的运算很多时候都是近似的因为计算机无法表示一个无限的小数有理数总可以表示为整数的比值并且有理数的四则运算结果还是一个有理数除0除外如果是有四则运算则可以考虑用有理数表示这样可以没有舍入误差分析记录一个
Markdown基础

Markdown学习标题 N个空格二级标题三级标题字体 Hello World 两边都加2个就变成粗体 Hello World 两边都加1个就变成斜体 Hello World 两边都加3个就变粗斜体 Hello World
css世界读书笔记->line-height（1）

如果 line height 的值是1 5 font size大小是14px 那么半行距的大小是 14px 4 5 14px 2 3 5px border及line height等传统css属性没有小数的概念因此3 5px需要取整处理 1
基于卷积神经网络-门控循环单元结合注意力机制(CNN-GRU-Attention)时间序列预测，单列数据输入模型。matlab代码，2020版本及以上。评价指标包括:R2、MAE、MSE、RMSE

清空环境变量 warning off 关闭报警信息 close all 关闭开启的图窗 clear 清空变量 clc 清空命令行 tic restoredefaultpath 导入数据 f xlsread windspeed xls She
sql server学习笔记——批处理语句、存储过程

目录批处理语句 1 批处理语句简介示例一示例二存储过程一什么是存储过程 1 存储过程的简介 2 存储过程包含的内容 3 存储过程的优点 4 存储过程的分类系统存储过程用户定义存储过程 5 常用的系统储存过程 1 一般常用的存
专访帝国软件的创造者：仍然在路上的80后

全球的网站数量已经超过了一亿并且还在以惊人的速度继续增长 CMS作为一种位于Web前端 Web 服务器和后端办公系统或流程内容创作编辑之间的软件系统为互联网应用的丰富和发展起到了至关重要的作用最近我们注意到有一款口碑很好的CMS
Yii2 选择布局的方式

方案1 控制器内成员变量 public layout false 不使用布局 public layout main 设置使用的布局文件方案2 控制器成员方法内 this gt layout false 不使用布局 this gt layo
EMC 电磁兼容知识简易解析

EMC基础知识电磁兼容性 EMC Electromagnetic Compatibility 设备在共同的电磁环境中能一起执行各自功能的共存状态即该设备不会由于受到处于同一电磁环境中其他设备的电磁发射导致不允许的降级也不会使同一电磁环
iphone或安卓配置Charles抓包

4个步骤完成iPhone配置Charles抓包步骤 Charles官网下载地址 Download a Free Trial of Charles Charles Web Debugging Proxy 1 连接到wifi 并设置代理地址可
React传递参数的多种方式

最常见的就是父子组件之间传递参数父组件往子组件传值直接用this props就可以实现在父组件中给需要传递数据的子组件添加一个自定义属性在子组件中通过this props就可以获取到父组件传递过去的数据父组件 render re
K-means算法的参数详解

参数名称默认值及输入类型参数解释 algorithm 默认 Auto 有auto full和elkan三种选择 algorithm 优化算法的选择有auto full和elkan三种选择 full就是一般意义上的K Means算法 e

K-means算法的参数详解

K-means算法的参数详解 的相关文章

随机推荐

热门标签

K-means算法的参数详解的相关文章