[机器学习] 代价函数（cost function）

2023-10-27

前言：代价函数也叫做损失函数，loss function。机器学习中训练模型的过程就是优化代价函数的过程，代价函数对每个参数的偏导数就是梯度下降中的梯度。

1、代价函数的定义

假设有训练样本（x，y）,模型为f，参数为w，f(w)= $w^Tx$ ，我们需要度量预测值f(w)与真实值y之间的差异，我们将这种差异函数叫做代价函数，如果多个样本，则可以将所有代价函数的取值求平均，计作J(w)。因此我们可以知道代价函数的一些性质：
    1、对于每一种算法，代价函数不是唯一的 ;
    2、代价函数是参数w的函数；
    3、代价函数J(w)衡量着模型的好坏，值越小表示模型和参数越符合样本；
    4、J(w)是一个标量；

当确定h后，我们需要知道参数w，那么什么样的w是我们想要的呢，也就是模型训练什么时候才结束？我们的做法就是最小化J(w)，通过不断改变w获得最小的J(w),即：

minwJ(w)

$\min_w J(w)$

优化参数过程中，常用的方法是梯度下降法，需要对J(w)求偏导，那么需要代价函数对w可微。

2、常用的代价函数

2.1 均方误差

在线性回归中，最常用的是均方误差(Mean squared error)，具体形式如下：

J(w0,w1)=12n∑i=1n(y¯(i)−y(i))2=12n∑i=1n(fw(x(i))−y(i))2

$J(w_0,w_1)=\frac{1}{2n}\sum_{i=1}^n(\bar y^{(i)}-y^{(i)})^2=\frac{1}{2n}\sum_{i=1}^n(f_w(x^{(i)})-y^{(i)})^2$

2.2 交叉熵

在逻辑回归中，最常用的代价函数是交叉熵（cross entropy）。《神经网络与深度学习》中的一种解释：

交叉熵是对「出乎意料」（译者注：原文使用suprise）的度量。神经元的目标是去计算函数y, 且y=y(x)。但是我们让它取而代之计算函数a, 且a=a(x)。假设我们把a当作y等于1的概率，1−a是y等于0的概率。那么，交叉熵衡量的是我们在知道y的真实值时的平均「出乎意料」程度。当输出是我们期望的值，我们的「出乎意料」程度比较低；当输出不是我们期望的，我们的「出乎意料」程度就比较高。
香农信息量用来度量不确定的大小：一个时间的香农信息量为0，表示该事件的发生不会给我们提供任何新的信息，例如确定性事件的发生，发生的概率为1，发生了也不会引起任何惊讶；当不可能的事情发生时，香农信息量无穷大，表示给我们提供了无穷多的新信息，并且使人无限的惊讶。公式如下：

J(w)=−1n[∑i=1n(y(i)logfw(x(i))+(1−y(i))log(1−fw(x(i)))]

$J(w)=-\frac{1}{n}[\sum_{i=1}^{n}(y^{(i)}\log f_w(x^{(i)})+(1-y^{(i)})\log(1-f_w(x^{(i)}))]$

2.3 神经网络中的代价函数

类似交叉熵函数。。。待续，对数损失函数，指数损失函数，一般损失函数。。。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

[机器学习] 代价函数（cost function）的相关文章

从 Vision 到 Language 再到 Action，万字漫谈三年跨域信息融合研究

本文作者为阿德莱德大学助理教授吴琦他在为雷锋网 AI 科技评论投递的独家稿件中回顾了他从跨领域图像识别到 Vision to Language 相关的研究思路如今正将研究领域延伸到与 Action 相关的工作雷锋网 AI 科技评论对文
6.63 猜数字之生成随机数

1 生成 m n 的随机数 m n 的元素个数为 n m 1 若利用模进行 n m 1 运算其结果为 0 n m 此时左右两边同加 m 其结果为 m n void TestRand 生成 m n 的随机数 rand n m 1 m sra
Django图书商城系统实战开发 - 实现个人中心管理

Django图书商城系统实战开发实现个人中心管理介绍在本项目中我们已经实现了登录注册商品详情查看购物车购买个人订单管理评价功能接下来我们将完成个人中心管理的模块包括个人密码修改个人地址管理和注销功能本文将详细介绍如
I2C总结（单主机和多主机）

I2C在使用过程中单个主机是不论是硬件I2C还是硬件I2C都不太难理解好时序很容易实现还有就是很多人认为硬件I2C有很多缺点其实这是谬论吧硬件I2C在稳定性上胜过软件I2C 而且不占用MCU时间可以实现I2C中断如果系统有硬件I

随机推荐

Java开发快速上手！3分钟就能完成的Redis主从复制搭建，完整PDF

前言高并发几乎是每个程序员都想拥有的经验原因很简单随着流量变大会遇到各种各样的技术问题比如接口响应超时 CPU load升高 GC频繁死锁大数据量存储等等这些问题能推动我们在技术深度上不断精进我们知道高并发代表着大流量
【Flutter 3-1】Flutter手把手教程UI布局和Widget——底部导航栏BottomNavigationBar使用

作者弗拉德来源弗拉德公众号 fulade me BottomNavigationBar BottomNavigationBar 和 BottomNavigationBarItem 配合来共同展示Flutter里面的底部状态栏底部状
敏捷开发之Scrum扫盲篇

转载至 http www cnblogs com taven archive 2010 10 17 1853386 html 现在敏捷开发是越来越火了人人都在谈敏捷人人都在学习Scrum和XP 为了不落后他人于是我也开始学习Scrum
kerberos 术语和认证流程介绍

重要术语 1 KDC 全称 key distributed center 作用整个安全认证过程的票据生成管理服务其中包含两个服务 AS和TGS 2 AS 全称 authentication service 作用为client生成TGT
操作系统的文件结构

文件的逻辑结构主要有 1 连续结构 2 多重结构 3 转置结构 4 顺序结构文件的物理存储主要有 1 顺序结构 2 链接结构 3 索引结构文件的目录结构主要有 1 一级目录结构 2 二级目录结构 3 树形结构 4 无环图
Springboot定时任务

下文为 Scheduled的使用方法 1 简介 Scheduled支持三种部署方式 fixedRate fixedRateString 上一次执行开始后 n秒后再次执 fixedDelay fixedDelayString 上一次执行完毕后
舵机的三条线分别代表什么

橙色信号线红色正极棕褐色负极
@RequestParam和@PathVariable的用法与区别

SpringBoot PathVariable URL变量 Web应用中的URL通常不是一成不变的例如微博两个不同用户的个人主页对应两个不同的URL http weibo com user1和http weibo com user2 我们
工厂（factory）模式

转自 http www cnblogs com hegezhou hot archive 2010 11 30 1892227 html 一开篇一个多月没有写文章了一方面是由于家庭的原因还有一方面是因为工作上的原因所以在这里给大家
使用hutool库，对excel进行一些导出、导入操作

所用到的各种类依赖的话百度一下吧最后再给上全部代码 import cn hutool core collection CollUtil import cn hutool core io IoUtil import cn hutool p
Struts 2 标签

原文 https www mkyong com struts2 struts 2 shidden hidden value example 在struts2中可以使用
调gensim库，word2vec模型的保存和加载

一模型的保存模型保存可以有很多种格式根据格式的不同可以分为2种一种是保存为 model的文件一种是非 model文件的保存我常用的保存格式是 model和 vector直接上代码和结果 1 保存为model文件数据的读入 fi
PCIe中断之MSI和MSI-X的区别（详细）总结附图文快速掌握

目录一整体介绍二 MSI和MSI X对比 2 1 中断向量连续 2 2 映射区域区别 2 3 MSI X配置空间 2 3 1 MSI X Capbility介绍 2 3 2 Capbility ID介绍 2 3 3 Message C
tree树做过滤

代码如下递归tree关键词搜索 param key 需要递归的key名 param keyword 需要搜索查询的关键字 param treeList 遍历tree列表 param first 是否是首次传入默认true functio
Thymeleaf （select、checkbox)数据绑定和数据回回显

第一种情况 select 数据绑定前端页面 div class col sm 10 div
放大电路中的自激震荡及相位补偿方法

自激震荡产生原因 1 电容对信号的超前和滞后作用要分析自激震荡首先得了解电路中的相移放大电路中使信号发生相移的罪魁祸首主要在于电容如果电容串接在电路中则构成高通滤波电路在截止频率之前相位超前90 2 之后相移为0 如图1所示
2023年数学建模：种群竞争模型及其MATLAB实现

订阅专栏后9月比赛期间会分享思路及Matlab代码目录种群竞争模型 MATLAB实现实战案例两种昆虫的竞争
Typora常用快捷键（详细）

1 typora常用快捷键 ctrl 切换编辑语法模式预览模式 ctrl 1 6 标题1 6 等同于一级标题空格标题内容二级标题空格标题内容三级标题空格标题内容最多六级标题 ctrl B 粗体 ctrl I 斜体 ct
Unity编译Android的原理解析和apk打包分析

作者张坤最近由于想在Scene的脚本组件中调用Android的Activity的相关接口就需要弄明白Scene和Activity的实际对应关系并对Unity调用Android的部分原理进行了研究本文主要探讨Scene和Activ
[机器学习] 代价函数（cost function）

前言代价函数也叫做损失函数 loss function 机器学习中训练模型的过程就是优化代价函数的过程代价函数对每个参数的偏导数就是梯度下降中的梯度 1 代价函数的定义假设有训练样本 x y 模型为f 参数为w f w wTx w T

[机器学习] 代价函数（cost function）

[机器学习] 代价函数（cost function） 的相关文章

随机推荐

热门标签

[机器学习] 代价函数（cost function）的相关文章