AutoML领域的一把利器---HyperGBM

2023-05-16

AutoML领域的一把利器—HyperGBM

文章目录

    • AutoML领域的一把利器---HyperGBM
  • 前言
  • 一、何为AutoML?
  • 二、如何使用HyperGBM
    • 1.引入库
    • 2.读入数据
    • 3.初始化make_experiment
    • 4.调用make_experiment
    • 5.预测结果并提交kaggle
    • 6.训练过程图展示
    • 7.比赛排名进入TOP10%
  • 三、写在最后的话


前言

之前因为工作上的需求,需要做一个多分类模型来处理一个网站上的用户多分类问题,无奈自己当时对这个领域了解不多,不过也没办法,工作来了就得做,所以就一步步的开始从数据预处理,特征分析,筛选,模型选择,模型调参优化进行尝试,好在最终也算是完成了工作(一个字,累啊)。现在回过头来看一下,是否当初可以有更好的解决方案呢?或者说有没有一个高效的autoML框架可以帮助我完成这些工作呢?接下来,想介绍这样一款满足我以上需求的开源autoML框架—HyperGBM


一、何为AutoML?

简单来说,就是将机器学习应用于现实问题的端到端流程自动化的过程,其产生的主要原因就是因为机器学习的应用需要大量的人工干预,这些人工干预表现在:特征分析、模型选择、参数调节等机器学习的各个方面。AutoML视图将这些与特征、模型、优化、评价有关的重要步骤进行自动化地学习,使得机器学习模型无需人工干预即可被应用。

ps:关于autoML有很多优秀的paper,这里推荐一篇个人比较喜欢的供大家学习参考
Automated Machine Learning Methods, Systems, Challenges.pdf。

二、如何使用HyperGBM

本次用例数据来源于kaggle,kaggle上面每个比赛都有相当多的专业人士参与,你除了可以在kaggle上验证自己的一些技术和想法,同时你也可以学习到很多新的解题方法(个人强烈推荐的ML学习平台)

1.引入库

import pandas as pd
from hypergbm import make_experiment
from hypernets.searchers import EvolutionSearcher
from MyGeneralSearchSpaceGenerator import MyGeneralSearchSpaceGenerator

2.读入数据

train_data =pd.read_csv(r"./../resource/train.csv",index_col=0)
test_data = pd.read_csv(r"./../resource/test.csv",index_col=0)

3.初始化make_experiment

reward_metric = 'logloss' ##此次比赛的评估方法为Logloss
search_space = MyGeneralSearchSpaceGenerator() ##自定义的搜索空间
rs = EvolutionSearcher(search_space,optimize_direction='min',population_size=100,
					   sample_size=5,candidates_size=5,regularized=True, use_meta_learner=True)##初始化进化搜索算法
exp = make_experiment(train_data,eval_data=None,test_data=test_data,reward_metric=reward_metric,
                      cv=True,n_folds=5,max_trials=300,target='target',searcher=rs,log_level='info')

ps:这里有很多参数,具体可以参考GitHub上的说明文档

4.调用make_experiment

estimator = exp.run()

5.预测结果并提交kaggle

pred_proba = estimator.predict_proba(test_data)
pf = pd.DataFrame(pred_proba)
pf.to_csv("./../resource/hypergbm_out.csv", encoding='utf-8', header=None)

6.训练过程图展示

在这里插入图片描述

7.比赛排名进入TOP10%

在这里插入图片描述

三、写在最后的话

最近一直在学习研究HyperGBM,Hypernets内部实现的逻辑和技术, 这个过程也同时加深了我对ML各个环节技术的深入理解,如果你对autoML/ML/kaggle感兴趣,欢迎大家一起交流,讨论。后面我也会不断的分享一些HyperGBM具体的技术实现的文章。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

AutoML领域的一把利器---HyperGBM 的相关文章

  • 针对vue的配置文件

    针对vue的配置文件 我们在根目录下创建一个 vue config js 文件 xff0c 将下方配置下去 module exports 61 区分打包环境与开发环境 process env NODE ENV 61 61 61 39 pro
  • Linux | LVM | 对比三种逻辑卷(Logic Volume)

    概述 为了满足在性能和冗余等方面的需求 xff0c LVM支持了下面三种Logic Volume xff1a Linear Logic Volume 线性逻辑卷Striped Logic Volume 条带化逻辑卷Mirror Logic

随机推荐

  • MySql ERROR 1129

    ERROR 1129 HY000 Host 39 mysql02 39 is blocked because of many connection errors unblock with 39 mysqladmin flush hosts
  • SpringBoot整合Shiro

    Apache Shiro是一个强大且易用的Java安全框架 执行身份验证 授权 密码学和会话管理 相比较Spring Security xff0c shiro有小巧 简单 易上手等的优点 所以很多框架都在使用shiro Shiro包含了三个
  • PB数据窗口对象之Button

    Button 重要属性 Action 属性 该属性是Button 控件最重要的一个属性 在数据窗口画板中 xff0c 可以选择一个按钮有哪个动作 可选的动作都是事先定义好的 xff0c 开发人员没有机会精确定义某个动作的执行 xff0c 只
  • 聊聊前端八股文?

    大家好 xff0c 我是若川 xff0c 点此加我微信进源码群 xff0c 一起学习源码 同时可以进群免费看Vue专场直播 xff0c 有尤雨溪分享 Vue3 生态现状以及展望 前些天 xff0c 我看到 剑指前端offer 一系列文章 x
  • 新手向:前端程序员必学基本技能——调试JS代码

    1前言 大家好 xff0c 我是若川 最近组织了源码共读活动 xff0c 感兴趣的可以加我微信 ruochuan12 参与 xff0c 已进行三个月了 xff0c 大家一起交流学习 xff0c 共同进步 想学源码 xff0c 极力推荐之前我
  • 全新的 Vue3 状态管理工具:Pinia

    大家好 xff0c 我是若川 最近组织了源码共读活动 xff0c 感兴趣的可以点此加我微信 ruochuan12 参与 xff0c 每周大家一起学习200行左右的源码 xff0c 共同进步 同时极力推荐订阅我写的 学习源码整体架构系列 包含
  • 推荐2022前端必看的新书 《Vue.js设计与实现》

    大家好 xff0c 我是若川 持续组织了6个月源码共读活动 xff0c 感兴趣的可以点此加我微信 ruochuan12 参与 xff0c 每周大家一起学习200行左右的源码 xff0c 共同进步 同时极力推荐订阅我写的 学习源码整体架构系列
  • 面试官问:跨域请求如何携带cookie?

    大家好 xff0c 我是若 川 持续组织了6个月源码共读活动 xff0c 感兴趣的可以点此加我微信 ruochuan12 参与 xff0c 每周大家一起学习200行左右的源码 xff0c 共同进步 同时极力推荐订阅我写的 学习源码整体架构系
  • 如何写好技术文章(看张鑫旭老师的直播总结

    大家好 xff0c 我是若川 持续组织了6个月源码共读活动 xff0c 感兴趣的可以点此加我微信 ruochuan12 参与 xff0c 每周大家一起学习200行左右的源码 xff0c 共同进步 同时极力推荐订阅我写的 学习源码整体架构系列
  • Element使用的async-validator表单校验库源码超详细解析

    大家好 xff0c 我是若川 持续组织了8个月源码共读活动 xff0c 感兴趣的可以 点此加我微信ruochuan12 参与 xff0c 每周大家一起学习200行左右的源码 xff0c 共同进步 同时极力推荐订阅我写的 学习源码整体架构系列
  • 我捡到宝了!2022版前端面试上岸手册,最新最细致!

    大裁员背景下 xff0c 没什么比辞职后找不到工作更扎心 xff01 在行情好转前 xff0c 前端程序员只能 猥琐发育 xff0c 不轻易跳槽 xff0c 同时要修炼内功 xff1a 对八股文 底层源码 重点项目等进行查缺补漏 xff0c
  • 点击页面元素跳转IDE对应代码,试试这几个工具!

    大家好 xff0c 我是若川 我持续组织了近一年的源码共读活动 xff0c 感兴趣的可以 点此扫码加我微信 ruochuan12 参与 xff0c 每周大家一起学习200行左右的源码 xff0c 共同进步 同时极力推荐订阅我写的 学习源码整
  • 为什么说组件库的源码非常值得学习?

    大家好 xff0c 我是若川 最近来了一些新朋友 xff0c 感谢大家关注 相比于原生 JS 等源码 我们或许更应该学习正在使用的组件库的源码 xff08 如 xff1a element antd vant semi arco tdesig
  • 写一个Vue DevTools,让开发体验飞一会

    大家好 xff0c 我是若川 我持续组织了近一年的源码共读活动 xff0c 感兴趣的可以 点此扫码加我微信 lxchuan12 参与 xff0c 每周大家一起学习200行左右的源码 xff0c 共同进步 同时极力推荐订阅我写的 学习源码整体
  • 偷偷盘点前端面试官才知道的进阶秘籍

    很多人都说35岁是程序员的职业尽头 而我们部门leader是位80年的大哥 xff0c 曾经是字节3 1大佬 xff0c 今年43岁了依然独当一面 于是 xff0c 我向他请教了 不被淘汰 的秘籍 他总结了两点 xff1a 1 努力修炼内功
  • Facebook CrypTen安全多方计算(MPC)框架介绍及核心代码分析

    简单介绍 CrypTen是Facebook在2019年10月开源的 用于多方安全计算 MPC 的框架 其底层依赖于深度学习框架PyTorch 官网说明见 xff1a https ai facebook com blog crypten a
  • 开源软件Asterisk:386变身交换机

    有关开源软件最令人激动的事情之一就是其创建超越传统的IT基础架构的应用程序的方式 一个恰当的例子是称作 Asterisk 的电话应用程序 Asterisk是一种功能非常齐全的应用程序 xff0c 提供了许多电信功能 也许它最著名的应用是当作
  • 2016.9---2017.1半年总,外派工作的感觉真爽 (补17年1月)

    16年8月份 xff0c 第二版订餐系统上线 xff0c 我就着手出去上班 xff0c 8月初提交简历后 xff0c 面试就一发不可收 xff0c 一直到12月初才出去 xff0c 历时四个月 xff0c 期间边学习边面试 xff0c 但这
  • gerrit - first commit

    最近公司有新项目 xff0c 已经让领导帮我把clone和push的权限都开通了 xff0c 但是在push的时候还是提交失败 xff0c 错误信息如下 xff1a git push origin master Counting objec
  • AutoML领域的一把利器---HyperGBM

    AutoML领域的一把利器 HyperGBM 文章目录 AutoML领域的一把利器 HyperGBM 前言一 何为AutoML xff1f 二 如何使用HyperGBM1 引入库2 读入数据3 初始化make experiment4 调用m