贝叶斯优化优化参数，以Kmeans为例

2023-11-18

文章目录

步骤一：构造黑盒目标函数
步骤二：确定取值空间
步骤三：构造贝叶斯优化器
全部代码

贝叶斯优化有几个步骤：

构造黑盒目标函数
确定取值空间
构造贝叶斯优化器

下面以kmeans为例：

步骤一：构造黑盒目标函数

这个函数主要是运行需要的函数，然后使用计算一个指标（只能是一个指标哈！），然后贝叶斯优化会在迭代的时候最大化这个指标，如果需要最小化这个指标，则可以在目标值前面加一个负号

def f_score(n_clusters, n_init, my_iter):
    k_means = KMeans(n_clusters=int(n_clusters), n_init=int(n_init), max_iter=int(my_iter))
    k_means.fit(data)
    if k_means.labels_.max() == -1 or k_means.labels_.max() == 0 or \
            k_means.labels_.max() == k_means.labels_.shape[0] - 1:
        return -1
    score = metrics.silhouette_score(data, k_means.labels_, metric='euclidean')  # 使用轮廓系数作为最终指标，最大化轮廓系数
    return score  # 最后要输出一个指标，贝叶斯优化器会尝试最大化这个指标

步骤二：确定取值空间

这个主要是确定搜索值的范围的：[最小，最大]

    pbounds = {'n_clusters': (4, 20),
               'n_init': (5, 20),
               'my_iter': (200, 500), }

步骤三：构造贝叶斯优化器

    optimizer = BayesianOptimization(
        f=f_score,  # 黑盒目标函数
        pbounds=pbounds,  # 取值空间
        verbose=2,  # verbose = 2 时打印全部，verbose = 1 时打印运行中发现的最大值，verbose = 0 将什么都不打印
        random_state=1,
    )

全部代码

import pandas as pd
import numpy as np
from sklearn import metrics
from bayes_opt import BayesianOptimization
from sklearn.cluster import KMeans


# 步骤一：构造黑盒目标函数
def f_score(n_clusters, n_init, my_iter):
    k_means = KMeans(n_clusters=int(n_clusters), n_init=int(n_init), max_iter=int(my_iter))
    k_means.fit(data)
    if k_means.labels_.max() == -1 or k_means.labels_.max() == 0 or \
            k_means.labels_.max() == k_means.labels_.shape[0] - 1:
        return -1
    score = metrics.silhouette_score(data, k_means.labels_, metric='euclidean')  # 使用轮廓系数作为最终指标，最大化轮廓系数
    return score  # 最后要输出一个指标，贝叶斯优化器会尝试最大化这个指标


if __name__ == '__main__':
    data = pd.DataFrame(data=np.random.randint(0, 10, size=(2000, 10))) # 生成数据
    # 步骤二：确定取值空间
    pbounds = {'n_clusters': (4, 20),
               'n_init': (5, 20),
               'my_iter': (200, 500), }
    # 步骤三：构造贝叶斯优化器
    optimizer = BayesianOptimization(
        f=f_score,  # 黑盒目标函数
        pbounds=pbounds,  # 取值空间
        verbose=2,  # verbose = 2 时打印全部，verbose = 1 时打印运行中发现的最大值，verbose = 0 将什么都不打印
        random_state=1,
    )
    # 开始运行
    optimizer.maximize(  # 运行
        init_points=10,  # 随机搜索的步数
        n_iter=50,  # 执行贝叶斯优化迭代次数
    )
    print(optimizer.max['params'])  # 最优参数
    print(optimizer.max['target'])  # 最优值

输出为：

{'my_iter': 235.44227635380747, 'n_clusters': 19.807354168254797, 'n_init': 17.245557591846417}
0.08350507522285436

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

数据分析

优化

贝叶斯优化优化参数，以Kmeans为例的相关文章

最流行的五大数据模型工具

当今的商业决策对基于天的数据依赖越来越强烈然而正确而连贯的数据流对商业用户做出快速灵活的决策起到决定性的作用建立正确的数据流和数据结构才能保证最好的结果这个过程叫做数据建模为了避免认为错误并且加快进度我们需要使用专业的软件来帮
数据缺失类型：MCAR、MAR、MNAR

2022 01 23 1 Missing Completely at Random MCAR 2 Missing at Random MAR 3 Missing Not at Random MNAR 参考 AI for Medical Pr
时间序列特征构造：以电力负荷预测为例讲解（python语言）

个人电气博文目录传送门学好电气全靠它个人电气博文目录持续更新中时间序列特征构造时间序列问题首先不管是回归问题还是分类问题一个模型的好坏决定因素由数据集的大小特征值的选取和处理算法其中最重要的是特征值的选取和处理今天
全网最详细的Python安装教程，超级详细·小白秒懂！！！

目录 1 安装版本说明 2 准备工作确定操作系统及位数 2 1 确定方法1 2 2 确定方法2 3 下载Python安装包 4 安装Python 5 测试Python是否安装成功 6 Python安装成功后找不到编写代码的桌面快捷方式 7
python招聘数据分析可视化系统+爬虫+7种薪资预测算法+Flask框架（源码）

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业毕业设计 2023 2024年计算机专业毕业设计选题汇总建议收藏毕业设计 20
Python获取去哪儿旅游数据并作可视化攻略

嗨喽大家好呀这里是爱看美女的茜茜呐开发环境版本 python 3 8 编辑器 pycharm 第三方库 requests gt gt gt pip install requests parsel gt gt gt pip inst
多线程编程与性能优化

引言在上一篇的入门篇中我们对Android线程的基础概念和多线程编程模型有了初步了解本篇将深入探讨多线程编程技术和性能优化策略以提升应用的效率和响应性高级多线程编程技术使用线程池管理线程线程池是一组预先创建的线程用于执行任务
Pipeline 助您轻松驾驭海量数据！

前言数据治理在当今信息时代变得至关重要随着数据量的不断增长和多样化组织需要有效地管理和利用这些数据以支持业务决策和创新发展不论是做数据分析还是数据解析利用 Pipeline 可以帮助组织实现数据治理的自动化和规范化为组织提供更
天猫数据分析-天猫查数据软件-11月天猫平台饮料市场品牌及店铺销量销额数据分析

今年以来饮料是快消品行业中少数保持稳定增长的品类之一 11月份饮料市场同样呈现较好的增长态势根据鲸参谋电商数据分析平台的相关数据显示今年11月份天猫平台上饮料市场的销量为2700万环比增长约42 同比增长约28 销售额为13亿
探索关系：Python中的Statsmodels库进阶

目录写在开头 1 多元线性回归场景介绍 2 Logistic回归 2 1 Logistic回归的概念 2 2 应用案例 2 2 1 建立模型和预测
滤光片截止带上尖峰的抑制

具有很宽截止带的边缘滤光片往往会出现尖峰 1 这些峰值具有较高透射率并且在光谱范围上很窄这是由滤光片的核心腔体结构导致的腔体的存在会稍微扩展特性因此有时会采用优化或合成工艺来引入它们峰值随系统任何层的厚度变化而移动因此它始终存在
Python-一键爬取图片、音频、视频资源

前言使用Python爬取任意网页的资源文件比如图片音频视频一般常用的做法就是把网页的HTML请求下来通过XPath或者正则来获取自己想要的资源这里我做了一个爬虫工具软件可以一键爬取资源媒体文件但是需要说明的是这里爬取资源
深入挖掘：Python中的Statsmodels库高级应用

写在开头随着数据科学的发展解决更为复杂问题的关键往往在于深入了解数据并采用更高级的分析工具本文将带您深入探讨Python中的Statsmodels库并引入一些高级功能为更深入的数据挖掘奠定基础 1 方差分析 1 1 方差分析概念
航空港务数据大屏为航空港的可持续发展提供有力支撑！

随着经济的发展不断加建与扩建民用机场空港行业规模不断扩大在不断引进和消化发达国家先进技术的同时中国深入开展了对新技术和新材料的研究极大地丰富和发展了中国的机场建设技术且各项机场建设计划均已落实推进行业在经济发展的推动下欣欣向荣
航空港务数据大屏为航空港的可持续发展提供有力支撑！

随着经济的发展不断加建与扩建民用机场空港行业规模不断扩大在不断引进和消化发达国家先进技术的同时中国深入开展了对新技术和新材料的研究极大地丰富和发展了中国的机场建设技术且各项机场建设计划均已落实推进行业在经济发展的推动下欣欣向荣
实现智能化运维的关键驱动力，你知道可观测性工具吗

可观测性是指根据系统产生的数据评估内部系统状态的能力对于IT运维团队来说可观测性工具是非常重要的通过这些工具 IT团队可以同时观察或深入了解IT基础架构中不同应用程序和资源的健康状况和状态从而主动检测异常分析问题并解决问题可观测
bokeh，一个超强的 Python 库详解

概要数据可视化在数据分析和报告中扮演着关键角色而Python的Bokeh库为创建交互式具有吸引力的可视化图表提供了强大的工具本文将介绍Bokeh的基本概念安装方法以及详细的示例代码以帮助大家了解如何使用Bokeh创建出色的数据可
番外篇-Julius AI帮你做数据分析

今天咱们聊聊如何利用AI大模型来做数据分析非常适合小白体验尤其是缺乏项目经验的同学强烈建议关注收藏也欢迎私信交流 1 站在巨人肩膀在数据分析领域 AI技术的飞速发展正引领一场革命随着大型机器学习模型的不断完善数据分析变得前所未
广告竞价策略：激发广告变现潜能的关键

在数字化时代广告已经成为企业推广品牌产品和服务的关键手段之一为了最大程度地发挥广告的效果广告竞价策略成为广告主和数字营销专业人士关注的焦点通过巧妙运用竞价策略广告主可以在激烈的市场竞争中脱颖而出实现广告变现的潜能 admaoy
GPT4+Python近红外光谱数据分析及机器学习与深度学习建模

详情点击链接 GPT4 Python近红外光谱数据分析及机器学习与深度学习建模第一 GPT4 入门基础 1 ChatGPT概述 GPT 1 GPT 2 GPT 3 GPT 3 5 GPT 4模型的演变 2 ChatGPT对话初体验注册与

随机推荐

快速入门XPath语法，轻松解析爬虫时的HTML内容

快速入门XPath语法轻松解析爬虫时的HTML内容爬虫时很多网站返回的是HTML文件可以用正则表达式 re库或XPath语法来匹配目标内容这两种方法属于爬虫的基本技能实战中要会灵活运用对于一些结构和内容复杂的HTML 用re
通达信接口怎么样抓取股票实时数据？

通达信接口怎么样抓取股票实时数据股票爬取接口在股票交易中常常使用到的一些辅助工具股票爬取接口主要是利用l1和l2接口来执行获取股票实时行情数据的原理将自己需要查询的需求就可以在接口软件上搜索就可以很快的获取数据了那么在获取的过程中
聊聊java高并发系统之异步非阻塞

聊聊java高并发系统之异步非阻塞几种调用方式同步阻塞调用即串行调用响应时间为所有服务的响应时间总和半异步异步Future 线程池异步Future 使用场景并发请求多服务总耗时为最长响应时间提升总响应时间但是阻塞主请求
【点云格式互转】ply转bin、任意点云格式转ply

本文为博主原创文章未经博主允许不得转载本文为专栏 python三维点云从基础到深度学习系列文章地址为 https blog csdn net suiyingy article details 124017716 3D点云存储方式的种
08_STM32的存储结构

STM32的存储器结构存储器是单片机结构的重要组成部分存储器是用来存储编译好的程序代码和数据的有了存储器单片机系统才具有记忆功能按照存储介质的特性可以分易失性存储器和非易失性存储器两类易失性存储器断电后里面存储的内容会
802.11K/V/R协议介绍

802 11K V R协议介绍 1 传统无线漫游介绍 1 1 什么是无线漫游一台无线终端备 STA 通过连接Wi Fi获取上网体验 Wi Fi名称又称为SSID 是由无线接入网 AP 提供的因为一台AP设备的覆盖范围有限所以无线网络
解决同时多个请求的处理问题，和定时任务

应用场景发布系统让他晚上2点执行发布的一串任务定时任务更新访问量晚上2点定时将数据从redis更新到mysql中去商城类的抢购工作大批量的用户涌入承载不了一次性处理这么多的活儿用这个方式也可以目录结构 1 让woker运
maven项目debug查看依赖包源代码办法

默认的maven工程好像很难加载依赖的源代码办法如下 maven调试时无法进入源码办法一在debug配置里面找到source 把带source的jar包放进去添加的时候选add 再选external archive 这里要
jQuery——前端技术栈

1 jQuery说明 jQuery 是一个 JavaScript 函数库是一个轻量级的写的少做的多的 JavaScript 库 jQuery 库包含以下功能 HTML 元素选取 HTML 元素操作 CSS 操作 HTML 事件函数
gin框架07--PureJSON

gin框架07 PureJSON 介绍案例说明介绍通常 JSON 使用 unicode 替换特殊 HTML 字符例如 lt 变为 u003c 如果要按字面对这些字符进行编码则可以使用 PureJSON Go 1 6 及更低版本无
DataFrame入门丨Pandas数据分析基础(4)

个人主页互联网阿星格言选择有时候会大于努力但你不努力就没得选作者简介大家好我是互联网阿星和我一起合理使用Python 努力做时间的主人如果觉得博主的文章还不错的话请点赞收藏留言支持一下博主哦行业资料 PPT模板简
Qt 6.x中Qt Quick简介及示例

Qt Quick首次在Qt 4 7和Qt Creator 2 1中引入是一种高级UI技术 Qt Quick模块是用于编写QML Qt Meta Object Language Qt元对象语言应用程序的标准库 Qt QML模块提供了QML
Linux获取本机的IP的几种方式

共计五条命令使用的方式都不同但原理相同充分利用LInux管道技术 root vagrant centos65 ifconfig eth0 grep Bcast cut d f2 cut d f1 192 168 191 2 root v
西门子PLC的编程工具是什么？

西门子PLC编程工具主要有下面这几个 1 STEP 7 Simatic Manager STEP 7或者Simatic Manager是西门子PLC编程最常用的软件开发环境它是一款强大的集成开发环境可以用来编写调试PLC编程代码还可
《基础篇第4章：vue2基础》：使用vue脚手架创建项目

文章目录 4 1初始化脚手架 4 1 1说明 4 1 2具体步骤 4 1 3模板项目的结构 4 1 4 创建第一个vue项目分析index html组成部分 4 1 5render函数 4 1 6修改默认配置本人其他相关文章链接 4 1初
ubuntu wget ERROR 403: Forbidden 错误

解决办法临时变更wget的UA wget U 浏览器的useragent 下载地址永久变更Wget 未测试修改配置文件 etc wgetrc 添加下面这一行 header User Agent 浏览器的useragent 上面这个配置
【vue】vue history和hash用法和区别

vue中模式选择 router gt index js const router new VueRouter mode history base process env BASE URL routes hash和history区别 1 ha
彷徨

1 什么是hbase HBASE是一个高可靠性高性能面向列可伸缩的分布式存储系统利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群 HBASE的目标是存储并处理大型的数据更具体来说是仅需使用普通的硬件配置就
相传韩信才智过人，从不直接清点自己军队的人数，只要让士兵先后以三人一排、五人一排、七人一排地变换队形，而他每次只掠一眼队伍的排尾就知道总人数了。

题目描述相传韩信才智过人从不直接清点自己军队的人数只要让士兵先后以三人一排五人一排七人一排地变换队形而他每次只掠一眼队伍的排尾就知道总人数了输入3个非负整数a b c 表示每种队形排尾的人数 a lt 3 b lt 5 c l
贝叶斯优化优化参数，以Kmeans为例

文章目录步骤一构造黑盒目标函数步骤二确定取值空间步骤三构造贝叶斯优化器全部代码贝叶斯优化有几个步骤构造黑盒目标函数确定取值空间构造贝叶斯优化器下面以kmeans为例步骤一构造黑盒目标函数这个函数主要是运行需要的