进击的橘子猫正式改名上线啦!
我的CSDN主页:https://blog.csdn.net/Orange_Spotty_Cat
也欢迎大家搜索微信公众号“进击的橘子猫”,我也会定期分享数据科学、Python、大数据、项目管理与PPT的相关知识。
让我们进击起来吧!
简介
-
本篇主要介绍机器学习建模的整个流程。
-
经过了3年的沉淀,我重新整理了之前在CSDN中的数据分析与挖掘的框架,现在将重新将这篇文章改写为机器学习建模的流程介绍。
-
主要的差异在于,我将原本在框架中的“架构设计”部分删除,该部分日后会单独作为一个板块介绍(介绍传统数据仓库与大数据平台的概念与技术)。
-
同时,基于之前CSDN的原文,我会将每个步骤进行更加详细的描述,当然,日后也会继续针对每个步骤涉及的知识点单独出文章介绍。也一如既往的欢迎大家支持并提出建议!
几句话概括版
机器学习建模主要可以拆解为以下7个步骤:
-
场景设计:确认模型的需求,梳理建模的思路,初步拟定模型所需的特征清单
-
数据收集:探查数据源与现有表结构,确认数据现状,圈定建模所需要的数据
-
数据预处理:根据数据源加工指标,并根据数据情况进行清洗、转换与标准化
-
特征工程与筛选:对加工好的特征进行分箱或转换,并根据重要性筛选入模的特征
-
模型训练:选择适合的机器学习模型,分割数据集进行模型训练
-
模型评估:在测试集上测试模型在未知数据集上的表现,结合评估表现进行调
-
部署上线:将模型代码进行封装,并在生产环境进行部署与上线