深度学习中常见的loss函数汇总

2023-11-08

损失函数(Loss Function)分为经验风险损失函数和结构风险损失函数，经验风险损失函数反映的是预测结果和实际结果之间的差别，结构风险损失函数则是经验风险损失函数加上正则项(L1或L2)。深度学习中的损失函数被用于模型参数的估计，通常作为学习准则与优化问题相联系，即通过最小化损失函数求解和评估模型。
机器学习任务中的损失函数可以大体分为两种类型：回归损失和分类损失。在此基础上，在深度学习任务中又发展了很多不同的损失函数，由于在网络训练过程中损失函数指导着网络的学习，因此选择合适的损失函数也很重要。常见的有下面几种：

回归损失：平均绝对误差(MAE/L1损失)，平均平方误差(MSE/L2损失)，smooth L1 loss，Huber损失，log cosh loss，quantile loss；
分类损失：0-1损失，logistic loss(对数损失)，hinge loss(铰链损失)，exponential loss(指数损失)，KL散度；
识别、检测和分割常用的损失：softmax cross-entropy loss，weighted cross-entropy loss，focal loss，OHEM，center loss，triplet loss，contrastive loss，L-softmax，LMCL，IOU loss，GIOU loss，DIOU loss，CIOU loss，dice loss。

回归损失

MAE/L1 loss：
M A E = 1 n ∑ i = 1 n ∣ f ( x i ) − y i ∣ MAE = \frac1n\sum \limits_{i=1}^{n}|f(x_i)-y_i| MAE=n1i=1∑n∣f(xi)−yi∣
平均绝对误差(Mean Absolute Error，MAE)是对估计值和真实值之差取绝对值的平均值。由上图可以看出，（1）MAE曲线连续，但是在 f ( x i ) − y i = 0 f(x_i)-y_i=0 f(xi)−yi=0 处不可导，求解效率低；（2）梯度较为稳定，但是即使损失很小梯度仍然保持不变，不利于模型的收敛；（3）对异常值更鲁棒（相比于L2 loss）。由于神经网络的问题较为复杂，因此很少使用，但是可以利用L1进行正则化，即将L1损失(权重1范数的和)加在其他损失的后面，作为正则项。正规化是防止过拟合的一种重要技巧，L1正则项的好处是能保持解的稀疏性，即为了使损失最小化，一些影响小的权重参数经过学习设置为0，可以用于特征选择。
MSE/L2 loss：
M S E = 1 n ∑ i = 1 n ( f ( x i ) − y i ) 2 MSE = \frac1n\sum \limits_{i=1}^{n}(f(x_i)-y_i)^2 MSE=n1i=1∑n(f(xi)−yi)2
均方误差(Mean Square Error，MSE)是对估计值和真实值之差取平方和的平均值。由上图可以看出，（1）MSE是平滑函数、处处可导，因此在求解优化问题时有利于误差梯度的计算；（2）随着误差的减小，梯度也在减小，因此使用固定的学习速率，也能较快的收敛到最小值；（3）通过平方计算放大了估计值和真实值的距离，因此对于异常值带来很大的惩罚，从而降低正常值的预测效果；（4）误差很大时梯度也很大，在训练初期不稳定，容易梯度爆炸。L2进行正则化可以防止过拟合，在正则化后的梯度下降迭代公式中，会给权重参数乘以一个小于1的因子 1 − α λ m 1-\alpha\frac{\lambda}m 1−αmλ，其中 λ \lambda λ为正则化参数，因此权重值减小，从而得到的模型越平滑。
Smooth L1 loss：
S m o o t h L 1 = 1 n ∑ i = 1 n { 0.5 ( f ( x i ) − y i ) 2 i f ∣ f ( x i ) − y i ∣ < 1 ∣ f ( x i ) − y i ∣ − 0.5 o t h e r w i s e Smooth\space L1 = \frac1n\sum \limits_{i=1}^{n}\left\{ \begin{array}{rcl} 0.5(f(x_i)-y_i)^2 & &if \space {|f(x_i)-y_i| <1}\\ |f(x_i)-y_i|-0.5 & & {otherwise}\\ \end{array} \right. Smooth L1=n1i=1∑n{ 0.5(f(xi)−yi)2∣f(xi)−yi∣−0.5if ∣f(xi)−yi∣<1otherwise
Smooth L1 是L1和L2两种损失的结合，目前多用于目标检测中（例如Faster RCNN）的边框回归损失，能从两个方面限制梯度：（1）当预测框与 ground truth 差别过大时，梯度值不至于过大；（2）当预测框与 ground truth 差别很小时，梯度值足够小。
Huber loss：
H u b e r l o s s = 1 n ∑ i = 1 n { 1 2 ( f ( x i ) − y i ) 2 i f ∣ f ( x i ) − y i ∣ ≤ δ δ ∣ f ( x i ) − y i ∣ − 1 2 δ 2 o t h e r w i s e Huber \space loss = \frac1n\sum \limits_{i=1}^{n}\left\{ \begin{array}{rcl} \frac12(f(x_i)-y_i)^2 & &if \space {|f(x_i)-y_i| \leq \delta}\\ \delta|f(x_i)-y_i|- \frac12\delta^2 & & {otherwise}\\ \end{array} \right. Huber loss=n1i=1∑n{ 21(f(xi)−yi)2δ∣f(xi)−yi∣−21δ2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习中常见的loss函数汇总的相关文章

【图像配准】

非配对配准 Non rigid registration 和配对配准 Rigid registration 是医学图像配准中常用的两种方法它们有着不同的含义和应用非配对配准 Non rigid registration 非配对配准是指将
卷积神经网络：专门用于图像和语音处理的深度学习模型

随着人工智能技术的发展和应用深度学习模型在图像和语音处理领域中扮演着越来越重要的角色其中卷积神经网络 Convolutional Neural Network 简称CNN 是一种专门用于图像和语音处理的深度学习模型本文将介绍卷积神经
MIT_线性代数笔记：第 23 讲微分方程和 exp(At)

目录微分方程 Differential equations 矩阵指数函数 Matrix exponential e A t e At
Python机器学习实战：用Python构建10个有趣的应用

机器学习是一门强大的工具可以用于解决各种各样的问题通过学习机器学习您可以开发出能够自动化任务做出预测甚至创造艺术的应用程序如果您是一名 Python 开发人员那么您将很高兴知道有许多可以用 Python 构建的有趣机器学习应用
卷积神经网络：专门用于图像和语音处理的深度学习模型

随着人工智能技术的发展和应用深度学习模型在图像和语音处理领域中扮演着越来越重要的角色其中卷积神经网络 Convolutional Neural Network 简称CNN 是一种专门用于图像和语音处理的深度学习模型本文将介绍卷积神经
图像分割-Grabcut法(C#)

版权声明本文为博主原创文章转载请在显著位置标明本文出处以及作者网名未经作者允许不得用于商业目的本文的VB版本请访问图像分割 Grabcut法 CSDN博客 GrabCut是一种基于图像分割的技术它可以用于将图像中的前景和背景分离
基于深度学习的停车位关键点检测系统（代码+原理）

摘要 DMPR PS是一种基于深度学习的停车位检测系统旨在实时监测和识别停车场中的停车位该系统利用图像处理和分析技术通过摄像头获取停车场的实时图像并自动检测停车位的位置和状态本文详细介绍了DMPR PS系统的算法原理创新点和实验
探索人工智能：深度学习、人工智能安全和人工智能编程（文末送书）

文章目录学习AI要看的第一本书人工智能应当以人为本史蒂芬卢奇 Stephen Lucci 萨尔汗 M 穆萨 Sarhan M Musa 丹尼科佩克 Danny Kopec 已故通晓六点明白人工智能是怎么回事基本概念和历史
蒙牛×每日互动合作获评中国信通院2023“数据+”行业应用优秀案例

当前在数字营销领域品牌广告主越来越追求品效协同针对品牌主更注重营销转化的切实需求数据智能上市企业每日互动股票代码 300766 发挥自身数据和技术能力优势为垂直行业的品牌客户提供专业的数字化营销解决方案颇受行业认可就在不久前举
【需求响应】改进连续时间控制方法用于分散式需求响应的恒温负荷研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码及文章
【需求响应】改进连续时间控制方法用于分散式需求响应的恒温负荷研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码及文章
深度好文：最全的大模型 RAG 技术概览

本文是对检索增强生成 Retrieval Augmented Generation RAG 技术和算法的全面研究对各种方法进行了系统性的梳理涉及了 RAG 流程中的数据拆分向量化查询重写查询路由等等在做 RAG 的小伙伴一定知道
【图像融合】基于联合双边滤波和局部梯度能量的多模态医学图像融合研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码图像文章
用CHAT分析高校体育智慧教学体系构建与探索研究现状

CHAT回复现阶段高校体育智慧教学体系的构建与探索研究还处于初级阶段但全球数字化转型大潮的推动下一些较为前沿的研究和实践已经开始出现 1 教学平台的建设很多高校已经开始尝试使用在线教育平台进行体育教学把传统的面对面授课模式转变为
用通俗易懂的方式讲解：使用 LlamaIndex 和 Eleasticsearch 进行大模型 RAG 检索增强生成

检索增强生成 Retrieval Augmented Generation RAG 是一种结合了检索 Retrieval 和生成 Generation 的技术它有效地解决了大语言模型 LLM 的一些问题比如幻觉知识限制等随着 RAG
如何用GPT进行论文润色与改写？

详情点击链接如何用GPT GPT4进行论文润色与改写一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Ge
AI在广告中的应用——预测性定位和调整

营销人员的工作就是在恰当的时间将适合的产品呈现在消费者面前从而增加他们购买的可能性随着时间的推移营销人员能够深入挖掘越来越精准的客户细分市场他们不仅具备了实现上述目标的能力而且这种能力还在呈指数级提升在AI技术帮助下现在的营销
史上最全自动驾驶岗位介绍

作者自动驾驶转型者编辑汽车人原文链接 https zhuanlan zhihu com p 353480028 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心求职交流技术交流群本
深度学习(5)--Keras实战

一 Keras基础概念 Keras是深度学习中的一个神经网络框架是一个高级神经网络API 用Python编写可以在TensorFlow CNTK或Theano之上运行 Keras优点 1 允许简单快速的原型设计用户友好性模块化和可扩
自动驾驶离不开的仿真！Carla-Autoware联合仿真全栈教程

随着自动驾驶技术的不断发展研发技术人员开始面对一系列复杂挑战特别是在确保系统安全性处理复杂交通场景以及优化算法性能等方面这些挑战中尤其突出的是所谓的长尾问题即那些在实际道路测试中难以遇到的罕见或异常驾驶情况这些问题暴露了实车

随机推荐

Python运算符重载及其可重载运算符

每个类型都有其独特的操作方法例如列表类型支持直接做加法操作实现添加元素的功能字符串类型支持直接做加法实现字符串的拼接功能也就是说同样的运算符对于不同序列类型的意义是不一样的这是怎么做到的呢其实在 Python 内部每种序列类型
AJAX面试题

1 什么是AJAX 为什么要使用Ajax 请谈一下你对Ajax的认识什么是ajax AJAX是 Asynchronous JavaScript and XML 的缩写他是指一种创建交互式网页应用的网页开发技术 Ajax包含下列技术基于
蓝桥杯备赛Day8——队列

大家好我是牛哥带你学代码本专栏详细介绍了蓝桥杯备赛的指南特别适合迎战python组的小白选手专栏以天作为单位定期更新将会一直更新直到所有数据结构相关知识及高阶用法全部囊括欢迎大家订阅本专栏队列也属于基础数据结构队列概念
C#串口通信三步走

第一步实例化串口通讯类 SerialPort sp new SerialPort 第二步设置串口信息并打开串口串口设置 public void SetSP string PortName string BaudRate string
项目开发总结报告（GB8567——88）(转载)

项目开发总结报告 GB8567 88 1引言1 1编写目的说明编写这份项目开发总结报告的目的指出预期的阅读范围 1 2背景说明 a 本项目的名称和所开发出来的软件系统的名称 b 此软件的任务提出者开发者用户及安装此软件的计算中心 1
unity3D 巡逻兵

游戏要求创建一个地图和若干巡逻兵使用动画每个巡逻兵走一个3 5个边的凸多边型位置数据是相对地址即每次确定下一个目标位置用自己当前位置为原点计算巡逻兵碰撞到障碍物则会自动选下一个点为目标巡逻兵在设定范围内感知到玩家会自动追
UPC思维题--移动

题目描述考虑333的立方体有六个面每个面有九个正方形染色方法如下角上的方格是red 中心是green 其他为blue 初始有一个机器人站在立方体顶面中心面朝一个blue方格它将接受到一系列如下指令 L 左转90度 R 右转90
gzip 命令

NAME gzip compression decompression tool using Lempel Ziv coding LZ77 SYNOPSIS gzip cdfhkLlNnqrtVv S suffix file file gu
SQL Server连接字符串句法

Application Name 应用程序名称应用程序的名称如果没有被指定的话它的值为 NET SqlClient Data Provider 数据提供程序 AttachDBFilename extended properties 扩
ts总结之 ts中的类型

其他内容 ts中的类型编译选项 webpack打包类文章目录 ts是什么 ts增加了什么 TypeScript中的基本类型字面量 number boolean string any unknown 类型断言 void never o
（一）（C语言）实现顺序表（静态分配）的基本操作（初始化、判断是否为空，打印表，插入和删除等）讲解（含相关C语言代码讲解及运行结果）

一 C语言实现顺序表静态分配的基本操作初始化查找打印表插入和删除等讲解含C语言完整代码讲解及运行结果文章目录一顺序表二顺序表相关操作 1 初始化 2 插入 3 删除 4 打印表 5 查找三完整代码讲解 C语言
如何在chrome浏览器调试JS代码

文章目录资源 Sources 面板控制台 Console 断点 Breakpoints debugger 命令暂停并查看日志记录总结参考文献在编写更复杂的代码前让我们先来聊聊调试吧调试是指在一个脚本中找出并修复错误的过程
如何解决merge conflict的方法

如何解决merge conflict的方法首先在pull的时候加上rebase 解决conflict 最后push git pull rebase origin remote if there is conflict clean it a
3月份的字节跳动面经

本人2本毕业目前工作四年一直是Android 做的都是些二线公司没做过一线四年跳了三家公司在家休息了几个月今年3月份开始面试由于跳槽过多而且已经是现在Android市场的原因内推的我的字节哥们儿推了不知道多少个部门才把我
Python轻松搞定免费语音合成，利用百度AI为短视频配音

1 创建百度AI账号 1 1 点击进入百度AI 左上角开放能力 gt 语音合成 gt 立即使用如果是试用可以直接点击在线语音合成不过语音不能下载要下载还得用下面方式调用百度AI的API 1 2 然后登录百度云账户进入管理中心
qemu-virtio基本原理

virtio是相当复杂的网上写virtio原理解析的文章也不少这里我想通过最简练易懂的方式来解释一下virtio的原理一方面也完善一下自己对virtio的理解文中含有大量个人理解如果发现有错误的地方欢迎与我交流 virtio整体流
掌财社:掌握CCI指标捕捉爆发牛股

什么是CCI指标 CCI指标又叫顺势指标其英文全名为 Commodity Channel Index 是由美国股市分析家唐纳德R 兰伯特 Donald r Lambert 于20世纪80年代所创是指导股市投资的一种中短线指标 CCI指标
linuxas3+apache2+mysql5+php5+discuz5+zend3.3+supesite.docx

最近领导要装个supesite discuz 方便公司内部用对于公司内部用来说是大了点感觉有些大财小用了但如果考虑以后做成门户还是很值得的于是就动手配置出于linux系统的稳定与安全选择linux作为平台本配置所用系统与软件
认识glBegin

初学OpenGL的时候总有很多函数或者函数的参数不会用不明白其作用今天主要总结一下关于glBegin 中的参数用法一 glBegin glBegin表示一组用于定义一个或者多个图元的顶点的开始此函数通常与glEnd函数联用在glB
深度学习中常见的loss函数汇总

损失函数 Loss Function 分为经验风险损失函数和结构风险损失函数经验风险损失函数反映的是预测结果和实际结果之间的差别结构风险损失函数则是经验风险损失函数加上正则项 L1或L2 深度学习中的损失函数被用于模型参数的估计通常作

深度学习中常见的loss函数汇总

回归损失

深度学习中常见的loss函数汇总 的相关文章

随机推荐

热门标签

深度学习中常见的loss函数汇总的相关文章