线性回归算法

2023-11-07

一、监督学习完整流程(房价预测为例)

给出正确答案,根据我们的数据来说房子实际的价格是多少(回归问题-根据之前的数据预测出一个准确的输出值)

另一种监督学习流程-分类问题(寻找癌症肿瘤问题)

当我们想要预测离散的输出值,例如寻找癌症肿瘤并想要确认肿瘤是良性的还是恶性的,这就是0/1离散输出问题。

在监督学习中我们有一个数据集(训练集,包含不同房屋价格),我们的任务就说从这个数据中学习预测房屋的价格。

常见的符号定义

注意:m代表训练样本的数量,(x,y)—x作为训练样本,y作为输出数据(结果)

(X(i),y(i))i上标,i代表训练行

监督学习算法工作方式:

注:讲训练集里的房屋价格,放到学习算法中,然后输出一个函数,通常大小写成h(h代表hypothesis(假设)h表示一个函数)

输入的是房屋尺寸大小,就像想出售的房屋;h根据输入的x值来得出y值

二、代价函数(最有可能的直线与我们的数据相拟合)

通过m(训练数据集),假设函数用来进行预测的函数就是这样是线性函数形式。引入术语θ0θ1(模型参数),主要讨论如何选择不同参数θ0θ1,我们会得到不同的假设函数,如下三组例子所示

 


假设θ0θ1是直线,得出这两个参数的值来假设函数表示的直线,尽量的与这些数据点很好的拟合。在我们训练集中我们会得到一定数量的样本,x表示卖出哪所房子,并且知道这所房子的实际价格,所以我们尽量选择参数值,给出训练集中的x值,我们能合理的预测值,让我们给出标准的定义在线性回归中,我们要解决的是一个最小化问题。

实现预测值与实际值之差平方值最小,尽量减少平均误差。

首先要定义一个代价函数

我们主要做的是关于θ0θ1对函数(θ0,θ1)求最小值

代价函数如上图所示,代价函数也被称为平方误差函数,如下图所示:

代价函数可视化

使用一个简化假设也就是θ1*x我们可以将这个函数看成是把θ0设为0,所以只有一个参数就是 θ1代价函数看起来与之前的很像唯一的区别是现在 h(x) 等于θ1*x 只有一个参数 θ1 所以我的优化目标是将 J(θ1) 最小化 。用图形表示是过原点的直线。

需要理解两个重要函数:第一个是假设函数。第二个是代价函数

假设函数:

代价函数:


最终目标:we should try to minimize the cost function. In thiscase, \theta_1 = 1θ1​=1 is our global minimum

深度学习代价函数的作用

几个重要公式包括了假设h、参数θ、代价函数J 以及优化目标

 


竖直方向 的高度就表示代价函数 J(θ0,θ1) 的值不难发现这是一个弓形曲面我们来看看三维图这是这个曲面的三维图水平轴是θ0θ1竖直方向表示 J(θ0,θ1) 旋转一下这个图

 就更能理解这个弓形曲面所表示的代价函数了。

误差平方通过这些图形,更接近代价函数这些值。、


 


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

线性回归算法 的相关文章

  • LaTex 之 数学运算符号

    属于号 in 开根号 sqrt 求和符号 sum 积分符号 int min max 大于等于 小于等于号 导言区使用两个宏包 usepackage amsmath usepackage amssymb 大于等于号 geqslant or g
  • Code Review的亲身实践

    Code Review 中文叫代码审查 指的是完成了部分功能的代码开发之后 在代码真正合并到仓库主分支之前 邀请同事帮你进行代码的审核和检查 检查代码的质量 规范 设计等等方面的过程 代码审查的好处 知识共享 进行代码审查的好处很多 其中一

随机推荐

  • Elasticsearch入门初探-单机多节点集群

    实时搜索引擎Elasticsearch 简称ES 是一个基于Apache Lucene 的开源搜索引擎 无论在开源还是专有领域 Lucene可以被认为是迄今为止最先进 性能最好 这里分享Elasticsearch入门在单机下如何配置多节点集
  • 数据权限——Mybatis拦截器实现

    一 需求背景介绍 1 需求介绍 需要实现数据权限管理 包含角色 普通用户 组长 管理员 其中普通用户只能看到自己创建的项目 组长能看到自己所管理的普通用户创建的项目 管理员能看到所有项目 相关表为 项目表 包含责任人owner字段 owne
  • iconfont下载到本地使用教程

    1 选择Symbol下载至本地 2 将压缩包进行解压 将压缩包如下后缀的文件放入项目中 iconfont css iconfont ttf iconfont woff iconfont woff2 通过import进行导入到index cs
  • 使用python-docx生成word文档

    基于python docx生成自定义word文档 源代码 from docx import Document from docx shared import Pt Inches from docx oxml ns import qn fro
  • Linux 字节序与字节对齐优化

    1 字节序跟Linux Windows无关 是由CPU构架决定 同一个CPU不管装的是Windows 或 Linux 字节序都是一样的 2 字节对齐 Linux 全用 attribute packed 作用于结构体 类似于pragma pa
  • 【深度学习】——循环神经网络RNN及实例气温预测、单层lstm股票预测

    引言 密集连接网络和卷积神经网络都有主要的特点 那就是它们没有记忆 它们单独处理每个输入 在输入和输入之间没有保存任何状态 举个例子 当你在阅读一个句子的时候 你需要记住之前的内容 我们才能动态的了解这个句子想表达的含义 生物智能已渐进的方
  • easyexcel poi根据模板导出Excel

    1 导入依赖
  • 最大和的连续子数组

    1 题目背景 给你一个整数数组nums 请你找出一个具有最大和的连续子数组 子数组最少包含一个元素 返回其最大和 子数组是数组中的一个连续部分 2 代码实现 public class Solution public static void
  • 关于HTTP常见状态码

    http状态码 HTTP Status Code 表示网页服务器超文本传输协议响应状态的3位数代码 是服务器用来告诉客户端当前请求响应的状态 通过状态码判断服务器运行状态 分类的第一位数字来表示 1xx表示消息 2xx表示成功 3xx表示重
  • 指向函数的指针 ------ 函数指针(function pointer)

    函数具有可赋值给指针的物理内存地址 一个函数的函数名就是一个指针 它指向函数的代码 一个函数的地址是该函数的进入点 也是调用函数的地址 函数的调用可以通过函数名 也可以通过指向函数的指针来调用 函数指针还允许将函数作为变元传递给其他函数 不
  • 读写一致 && MySQL&&Redis

    存储一致性 CPU存储 L1L2Cache等等 不懂CPU如何读写内存还敢说自己是程序员 知乎 zhihu com 基础知识 1 什么是cache line cache line 位于 CPU 与内存之间 CPU想要获得数据的时候 先从CP
  • Typora+PicGo+Alist 私人图床教程

    前置资源 已安装好typora 直接官网下载即可 Typora 官方中文站 typoraio cn 安装好PicGo 稳定版优先 推荐稳定版2 3 1 PicGo 腾讯云COS 下载链接 下载速度快 https picgo 12517503
  • 人民币兑换python

    输入一个人民币的整数值 100以内以元为单位 编程找到用10元 5元 2元 1元表示的总数量的最小组合方式 输入形式 从控制台输入一个整数值 表示以元为单位的人民币币值 输出形式 向控制台输出四个整数 以空格分隔 分别表示兑换成的10元 5
  • linux安装minio以及springboot整合使用

    文章目录 1 linux安装minio 2 springboot整合minio使用 1 linux安装minio 1 新建文件夹 mkdir home minio 数据文件夹 mkdir home minio data 创建日志文件夹 mk
  • python-selenium-pytest-allure UI自动化测试

    一 下载及安装插件 python selenium pytest allure 辅助 pyautoit pymysql 二 代码框架 1 基础文件 main py if name main pytest main alluredir all
  • 台式电脑没鼠标怎么移动光标_台式电脑没有鼠标怎么操作电脑

    没鼠标只能靠键盘操作了 以下都是键盘快捷键命令F6 选择操作区域光标键 选择目标backspac 退回上一级目录enter 进入 运行 table 项目选择单独按Windows 显示或隐藏 开始 功能表Windows BREAK 显示 系统
  • gettimeofday windows上的实现

    gettimeofday是Linux上的函数 在windows的实现 这里直接转doubango工程中的tsk time c 源文件种的实现 可以参考 include tsk time h include tsk debug h if TS
  • CodeBlocks新手安装以及汉化(20,03版本)

    CodeBlocks 20 03安装以及汉化设置 CodeBlocks官网 https www codeblocks org downloads binaries CodeBlocks 20 03安装包及汉化包下载 链接 https pan
  • 利用python实现简易版的贪吃蛇游戏(面向python小白)

    本文来源于公众号 csdn2299 喜欢可以关注公众号 程序员学府 引言 作为python 小白 总是觉得自己要做好百分之二百的准备 才能开始写程序 以至于常常整天在那看各种语法教程 学了几个月还是只会print hello world 这
  • 线性回归算法

    一 监督学习完整流程 房价预测为例 给出正确答案 根据我们的数据来说房子实际的价格是多少 回归问题 根据之前的数据预测出一个准确的输出值 另一种监督学习流程 分类问题 寻找癌症肿瘤问题 当我们想要预测离散的输出值 例如寻找癌症肿瘤并想要确认