神奇Pizza问题带来—今天就搞懂机器学习中的多元线性回归和多项式回归问题+PolynomialFeatures转换器

2023-05-16

大家好呀呀呀,这里是X,机器学习脚步不能停!!!🍗🍚🧆
这篇博客必搞懂在机器学习里这两者的区别和联系,欢迎收藏~✨

在这里插入图片描述

文章目录

  • 光速理解他们两个之间的概念
    • 多元线性
    • 多项式回归
  • 神奇Pizza🍕
    • 多元线性回归时
    • 多项式回归时(考虑一元情况)
      • PolynomialFeatures转换器用法

光速理解他们两个之间的概念

多元线性

我们把包括两个或两个以上自变量的回归称为多元线性回归

再说一次什么是“回归”:
我们想知道两个变量之间的关系,我们可以用直线的斜率来表示X和Y,那么由图中的点确定线的这样的一个过程就是回归

大概长这样:
在这里插入图片描述

多项式回归

多项式回归,回归函数是回归变量多项式的回归。多项式回归模型是线性回归模型的一种,此时回归函数关于回归系数是线性的。
多项式回归的最大优点就是可以通过增加x的高次项对实测点进行逼近,直至满意为止。

大概长这样:
在这里插入图片描述

神奇Pizza🍕

多元线性回归时

我们直接先观察多元线性回归的表达式,可以看到都是“一次幂”的
在处理pizza价格预估问题的时候,出现过一个问题,那就是我们已经知道了pizza的直径会影响价格,那么还有什么其他的因素会影响价格呢?😏😏
(如果对pizza问题不了解的朋友可以先去看一下在简单线性回归问题时,pizza问题雏形是什么样的,这里附上一个🔗,是我自己总结的比较“水的”pizza简单线性回归问题:传送门)

一次幂的意思我的理解就是:
举pizza例子,它和直径有关,它也可以和pizza配料有关,🥎并且它们和价格y的关系都是“线性的”,注意这里,是有其他的变量,就是有直径、有配料,等等

之前我们只有直径来评估,现在多了一个解释变量,那么这么做就提升了模型的性能

那么现在问题来了:如果pizza直径和价格y之间不是线性关系怎么办呢?
那么这个时候就会用到——多项式回归

在这里插入图片描述

多项式回归时(考虑一元情况)

大家观察上面的式子也可以发现,多项式回归的自变量,它不是“一次幂”,它可能有“很多幂”,并且自变量只有一个,自变量x和因变量y之间的关系被建模为n次多项式,那么这个时候我们怎么处理呢?
首先,我们怎么得到其他次幂的自变量?
在机器学习中,我们要对这样的式子进行“预处理”——PolynomialFeatures转换器

PolynomialFeatures转换器:可以用于为一个特征表示增加多项式特征
特征就是不是只有一次幂,而是有高次幂🎨
而且这还要根据数据的发展趋势来进行来决定,当太过于复杂时,那么多项式回归就不在适合于处理这组数据.🛶
适合的情况,像这样:
在这里插入图片描述

PolynomialFeatures转换器用法

关于这个的用法,推荐大家去看两篇博客:传送门1,传送门2,因为这个部分没啥好细说的,这个部分在机器学习里是属于“预处理”部分👨‍🏫,我相信看这两篇文章对这个转换器的用法已经非常清楚了😏

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

神奇Pizza问题带来—今天就搞懂机器学习中的多元线性回归和多项式回归问题+PolynomialFeatures转换器 的相关文章

随机推荐