拉格朗日乘子法详解（Lagrange multiplier）

2023-05-16

最近在视频的变换编码里推导最优变换（KL变换）时需要用拉格朗日乘子法，之前在机器学习的各种优化问题里也要用到这个方法，特此仔细钻研一番，总结如下：

注：这篇博客讲的很全面，这里部分参考了他的讲解。

注：本文只讲了拉格朗日函数的构造，看完本文后再去了解拉格朗日对偶函数的推导以及对偶问题。

先上浓缩精华

核心：极值点处，函数和约束条件一定相切，梯度一定共线（同向or反向）！！！
以此为思想基础构建拉格朗日函数，把等式约束条件和不等式约束都通过引入拉格朗日乘子（就是个系数）整合到一个新函数里，使得原本的复杂的多约束优化问题变成了最简单的无约束优化问题，直接对构造出的拉格朗日函数的所有变量（包括原本的变量 x i , i = 1 , 2 … , m x_i,i=1,2\ldots,m xi,i=1,2…,m和新引入的乘子变量 λ k , μ j , j = 1 , 2 … , n , k = 1 , 2 … , l \lambda_k,\mu_j,j=1,2\ldots,n,k=1,2\ldots,l λk,μj,j=1,2…,n,k=1,2…,l）求偏导等于零，得到的就是最终解。
用途：求解含有等式约束的最优化问题的局部最优解！！（极值点不一定是最小点，所以不是全局最小哟）；对于含有不等式约束的问题，要用到扩展的拉格朗日乘数法，这个扩展就是KKT条件的引入，更多细节参见这篇博文。

再谈完整细节

最优化问题按照约束条件的有无和类别可分为三类：
（一） “无约束" 优化问题
直接对所有 m m m个变量求偏导，令偏导等于0，联立方程组求出来的点就可能是极值点，具体是不是那就代到原函数里看看是不是比周围的值都小就行。
∂ F x i = 0 i = 1 , 2 … , m \frac{\partial F}{x _i}=0 \quad i=1,2\ldots,m xi∂F=0i=1,2…,m
补充注解：

偏导等于0只是极值点的必要条件，所以可能是。
直观地看，极值点左右的导数一定异号，又因为函数连续，所以极值点的导数只能为0。
必要条件：满足必要条件不能说明一定是；不满足则一定不是！！
充分条件：满足充分条件则一定是；不满足则给出的信息为0

下面（二）（三）类优化问题都是通过构造拉格朗日函数把问题转化为第（一）类的。

（二）“等式约束” 优化问题
目标函数（待优化的函数）为 f ( x ) f(x) f(x),约束条件为 h k ( x ) , k = 1 , 2 … , l h_k(x),k=1,2\ldots,l hk(x),k=1,2…,l，问题建模为
m i n f ( x ) s . t . h k ( x ) = 0 min f(x) \quad s.t. \quad h_k(x)=0 minf(x)s.t.hk(x)=0
这时候我们构建拉格朗日函数：
为什么这么构建参见知乎这个回答，很好理解，就因为梯度共线：
一个等式约束欸但表示对理解共线最有帮助：
∇ f ( x ∗ ) + λ ∇ h ( x ∗ ) = 0 , x ∗ 为极值点 \nabla f(x^*)+\lambda\nabla h(x^*)=0,x^*为极值点 ∇f(x∗)+λ∇h(x∗)=0,x∗为极值点
多个等式约束则表示为：
∇ f ( x ∗ ) + ∑ k = 1 l λ k ∇ h k ( x ∗ ) = 0 , x ∗ 为极值点 \nabla f(x^*)+\sum_{k=1}^l\lambda_k \nabla h_k(x^*)=0,x^*为极值点 ∇f(x∗)+k=1∑lλk∇hk(x∗)=0,x∗为极值点
L ( x , λ ) = f ( x ) + ∑ k = 1 l λ k h k ( x ) L(x,\lambda)=f(x)+\sum_{k=1}^l\lambda_kh_k(x) L(x,λ)=f(x)+k=1∑lλkhk(x)
L ( x , λ ) L(x,\lambda) L(x,λ)即拉格朗日函数， λ k \lambda_k λk是拉格朗日乘子.上面的公式实际上就是下面的拉格朗日函数对x求偏导的结果。

这时就成了第一类的无约束优化了，只是变量增多了 l l l个，同第一类问题，分别对 m + l m+l m+l个变量求偏导，得出来的解代入目标函数就ok了！
∂ F λ k = 0 ，这得到的就是那组等式约束 \frac{\partial F}{\lambda _k}=0 ，这得到的就是那组等式约束 λk∂F=0，这得到的就是那组等式约束
∂ F x i = 0 ，这得到的就是 ∇ f ( x ∗ ) + ∑ k = 1 l λ k ∇ h k ( x ∗ ) = 0 \quad \frac{\partial F}{x _i}=0，这得到的就是\nabla f(x^*)+\sum_{k=1}^l\lambda_k \nabla h_k(x^*)=0 xi∂F=0，这得到的就是∇f(x∗)+k=1∑lλk∇hk(x∗)=0
（三）“等式约束+不等式约束” 优化问题
这是最复杂也最常见的一种模型。问题建模为：
m i n f ( x ) s . t . h k ( x ) = 0 , g j ( x ) ≤ 0 j = 1 , 2 … , n ; k = 1 , 2 … , l minf(x) \quad s.t.h_k(x)=0\quad,\quad g_j(x)\leq0\quad j=1,2\ldots,n;k=1,2\ldots,l minf(x)s.t.hk(x)=0,gj(x)≤0j=1,2…,n;k=1,2…,l
思路一样，还是要最终转化为无约束的简单优化问题，但这里要分为两步：

先把不等式约束条件转化为等式约束条件。 how？ → \to → 引入 松弛变量 / KKT乘子
再把等式约束转化为无约束优化问题。 how? → \to → 同(二)，引入拉格朗日乘子

构造拉格朗日函数为：
L ( x , λ , μ ) = f ( x ) + ∑ k = 1 l λ k h k ( x ) + ∑ j = 1 n μ j g j ( x ) L(x,\lambda,\mu)=f(x)+\sum_{k=1}^l\lambda_kh_k(x)+\sum_{j=1}^n\mu_jg_j(x) L(x,λ,μ)=f(x)+k=1∑lλkhk(x)+j=1∑nμjgj(x)

λ k \lambda_k λk是为等式约束引入的拉格朗日乘子
μ j \mu_j μj是为不等式约束引入的松弛变量

至此，含不等式约束的最复杂的优化问题也转化为无约束的简单问题了，剩下的就只有求偏导了。
即最终只需要求解，解出来的就可能是极值点啦（KKT也只是必要条件）：
{ ∇ f ( x ∗ ) + ∑ k λ k ∇ h k ( x ∗ ) + ∑ j μ j ∇ g j ( x ∗ ) = 0 ( 1 ) μ j ≥ 0 ( 2 ) μ j g j ( x ∗ ) = 0 ( 3 ) h k ( x ∗ ) = 0 ( 4 ) g j ( x ∗ ) ≤ 0 ( 5 ) \left\{ \begin{aligned} \nabla f(x^*) + \sum_{k}\lambda_k\nabla h_k(x^*)+\sum_{j}\mu_j\nabla g_j(x^*)& = &0 \quad (1)\\ \mu_j & \geq & 0 \quad (2)\\ \mu_jg_j(x^*) & = & 0 \quad (3)\\ h_k(x^*) & = & 0 \quad (4)\\ g_j(x^*) & \leq & 0\quad (5)\\ \end{aligned} \right. ⎩⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎧∇f(x∗)+k∑λk∇hk(x∗)+j∑μj∇gj(x∗)μjμjgj(x∗)hk(x∗)gj(x∗)=≥==≤0(1)0(2)0(3)0(4)0(5)

这里由于有不等式约束因此要引入KKT条件（Karush–Kuhn–Tucker conditions）

这个KKT可以说是很神秘很厉害了，之前学无线网络也一直在用它求解不等式优化问题，现在学机器学习，视频编码竟然还是要用，所以只要有不等式约束的优化是绕不开了，不过thank god也不算太难？（手动一个不太自信还很尴尬的微笑）关于KKT条件，我这篇博文做了详解。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

拉格朗日乘子法详解（Lagrange multiplier）的相关文章

LQR制导

LQR制导引言在ardupilot中固定翼飞机横航向位置控制 xff08 制导律 xff09 采用L1制导律 xff0c 最近想将一些其他的控制理论用于ardupilot代码中 xff0c 通过ardupilot论坛 xff0c 看到已
2022年度总结

年度总结参加工作的第一年很快就过去了 xff0c 从四月份离校到公司 xff0c 直到农历腊月27回家 xff0c 工作了9个月的时间 xff0c 总的来说工作和学习的差别还是很大的 xff0c 从学生到社畜的转换还是花了一段时间的接下
HTTP基本认证

在HTTP中 xff0c 基本认证 xff08 英语 xff1a Basic access authentication xff09 是允许http用户代理 xff08 如 xff1a 网页浏览器 xff09 在请求时 xff0c 提供用
c# 设置代理服务器发送http请求

span class token keyword using span span class token namespace System span span class token punctuation span span class
Blaze：高性能C++数学库

Blaze xff1a 高性能C 43 43 数学库本文译自 xff1a Blaze A high performance C 43 43 math library Blaze是一个用于密集和稀疏算法的开源高性能 C 43 43 数学库
c/c++编译：使用CMAKE进行跨平台开发

前言本文介绍跨平台cmake的编写 xff0c 主要是linux和windows用cmake对项目的编译这是一个通用模板 xff0c 能够应用到更加复杂的项目中 xff0c 项目例子用https blog csdn net qq 364
对于应用层HTTP协议的学习

lt start gt 在TCP IP协议栈中 xff0c HTTP协议处于应用层 xff0c 它在最顶层进行数据报转发给应用进程 xff0c 它是最靠近用户的那一层它的默认端口号为80 HTTP协议是基于请求响应的协议 xff0c 那么
编程开发环境搭建

全部目录下载 amp 安装官方下载Vs2019其它历史版本下载开始使用安装C 43 43 的工作负载 xff08 环境 xff09 打开vs后有这些模板创建出一个控制台应用程序更多参考文档使用手册c 43 43 参考手册Visual
c++创建第一个控制台程序

目录创建控制台应用程序打印出Hello World 空项目创建vs自带打印的创建桌面向导自定义创建了解代码抛转引玉减少为什么什么是 include 它是预处理指令什么是iostream 它是c 43 43 标准库头件编写前的了解
python3-操作SQLite、创建表、添加数据、查询数据

SQLlte数据类型 SQLite能保存什么样的数据类型可以保存空值整数浮点数字符串和blob 什么是blob xff1f xff1f 是二进制大对象例如图片音乐 zip文件什么是游标游标是在数据库中用来移动和执行查询的对象
初学者都能看懂的95%置信区间

项目github地址 xff1a bitcarmanlee easy algorithm interview and practice 经常有同学私信或留言询问相关问题 xff0c V号bitcarmanlee github上star的同学
c# WindowForm练习项目主窗体设计

窗体分割器 SpliContainer分割器在项目主窗体分割成左右俩部分设置边框线属性 MonthCalendar月历控件添加程序所需要的按钮退出修改密码添加会员按钮固定好左边的容器组件 ImageList 按钮太多添加图
C#-WinForm班级下拉框数据绑定

前台展示后台方法 span class hljs keyword using span System span class hljs keyword using span System Collections Generic span c
C#--WinForm项目主窗体设计

主窗体基本设置大小颜色去边框出现的位置 Panel控件背景图颜色布局 xff1a Label标签文本字体背景颜色布局按钮布局文本字体颜色背景色底部panel 绑定控件边框颜色用label标签导入图标 S
C# -- 实现WinForm程序的密码修改

修改窗体程序密码的示例实现分析前台弹出修改窗体编写后台方法 xff0c 调用通用数据访问类Update方法数据验证 xff0c 判断原密码是否与旧密码符合 xff0c 俩次输入的新密码是否一致更新程序全局变量前台弹出修改窗体编
C#--WinForm--表格数据控件DataGridView--绑定模式

官方文档 DataGridView控件提供了一种强大而灵活的以表格形式显示数据的方式用户可以使用DataGridView控件来显示少量数据的只读视图 xff0c 也可以对其进行缩放以显示特大数据集的可编辑视图扩展DataGridView
ASP.NET--网站配置、发布与部署

网站发布前的配置信息配置文件下载网站发布的基本步骤写好的项目在本机上发布打开目录查看 xff1a 部署网站安装IIs 打开控制面板程序和功能启用或关闭Windows功能安装后返回控制面板管理工具双击打开 xff1a
c/c++ hash表（哈希表、字典表）

表 1 表存储数据 key gt value 2 表存储数据结构的困难怎么查找一个一个key去比较去查找 xff1f 61 61 效率不高 3 Hash算法加快查找将字符串的key 转成整数使用整数找到对应的value Hash算
c/c++ UDP通讯

UDP通讯 1 无连接的不需要反复的确认和握手等待根本不关心对方是否存在 2 不可靠可能有丢包和先发后到 3 UDP通讯快速占用系统资源少 4 UDP提供作为传输层协议的最基本功能将其他的交给用户自己来管理 UDP服务端 1 创

随机推荐

c#程序流程控制与调试技术

If选择结构为什么要使用关系运算符简单If 选择结构1 逻辑运算符
特征融合之基于贝叶斯理论的特征融合算法

参考文献 xff1a 1 刘渭滨邹智元邢薇薇模式分类中的特征融合方法 J 北京邮电大学学报 2017 04 5 12 2 Ma A J Yuen P C Lai J H Linear Dependency Modeling for C
初学者都能看懂的蒙特卡洛方法以及python实现

项目github地址 xff1a bitcarmanlee easy algorithm interview and practice 经常有同学私信或留言询问相关问题 xff0c V号bitcarmanlee github上star的同学
postman安装包

postman34位和64位安装包 xff0c 访问API 下载地址 xff1a 链接 xff1a https pan baidu com s 1p 830DPPKumXiwMPVtKYsw 提取码 xff1a 8p6k
STM32入门：STM32F401CDU6库函数工程文件搭建

STM32F401CDU6库函数工程文件搭建根据下图的结构进行复制粘贴操作 xff0c 代码部分在本文末有贴出来 xff0c STM32F4xx DSP StdPeriph Lib V1 8 0文件下载 xff08 使用part1即可 x
减小vscode-cpptools的内存占用

在VScode菜单栏文件 gt 首选项 gt 设置搜索C Cpp intelliSenseCacheSize 修改默认的5120为512
Ubuntu20.04 安装tcp调试工具mNetAssist步骤

概述在Ubuntu20 04上安装一个比较好用的网络调试助手mNetAssist 下载链接 mNetAssist链接提取码 vrsm 安装进入文件 mNetAssist release amd64 deb的所在文件夹 xff0c 然后
页面加载时，添加进度条，提高用户体验

这几个月做了个项目 xff0c 在此对一些问题做一个记录项目是前后端分离的 xff0c 前端用的 npm 43 webpack 问题 xff1a 由于系统某页面数据量过大或网络较差等原因 xff0c 导致页面还未完全加载出来 xff0c
matlab绘制三维图像，用ga工具箱求解有约束的优化问题（接力遗传算法）

绘制目标函数图像目标函数的图像绘制为 xff08 未考虑约束条件 xff09 画法1代码有约束的三维函数图像绘制 x1 61 10 1 10 x2 61 6 1 6 x1 x2 61 meshgrid x1 x2 f 61 exp x1
多元线性回归 stata

文章目录回归的思想 xff0c 任务 xff0c 使命 xff0c 分类线性回归一定只能用于有线性关系的变量吗数据的分类数据的标准化处理最小二乘法拟合一元线性回归方程的几个结论回归系数的解释遗漏变量会造成内生性 xff08 扰动项和变量相
C++编译报错：||error: ld returned 1 exit status|

这个问题我遇到过三次了 xff0c 每次好像原因都不一样 xff0c 在网上看到很多博客都记录了这个问题 xff0c 每人原因也都不同 xff0c 所以可以有多种原因都引发这个错误但我不懂ld returned 1 exit status
C++ day34 异常（三）异常规范，未捕获异常，意外异常，异常导致内存泄漏

文章目录异常规范 xff08 C 43 43 98添加 xff0c C 43 43 11已摒弃 xff0c 不建议使用 xff09 异常规范的作用 xff08 正是这俩作用的鸡肋和难办使它失去了粉丝 xff09 C 43 43 11支持的
C++ day37 标准模板库STL初识

文章目录简介是什么 xff1a 容器类模板 xff0c 迭代器类模板 xff0c 函数对象模板 xff0c 算法模板的集合STL不是面向对象编程 xff0c 而是泛型编程 xff01 历史 xff1a 1994年发布模板类vector示
STM32烧录 Error:Flash Download Failed-“Cortex-M3“ 解决方案—ST-Link调试

STM32烧录 Error Flash Download Failed 34 Cortex M3 34 解决方案 ST Link调试开发环境介绍设置步骤1 于Device中选择与你的开发板相匹配的芯片 xff0c 一般主芯片上都有标注2
SQL （十四）插入数据（insert语句，把数据插入表中）

文章目录插入完整的行 xff1a values子句不安全写法安全写法 xff1a 在表名后的括号明确给出列名小结插入行的一部分 xff1a 简单插入某些查询的结果 xff08 即检索出的数据 xff09 xff1a insert sel
模2除法（CRC冗余码计算）和二进制/十进制除法

文章目录 CRC循环冗余检验 xff1a 余数为0就没出错 xff1b 不能确定哪几个比特出错了二进制除法 xff08 和十进制除法其实一样 xff01 xff09 模2除法 xff08 不同于二进制除法 xff01 本质就是异或而已 xf
latex超链接Argument of \Hy@setref@link has an extra }.错误解决

用了 usepackage url 来在文章中写了超链接 xff0c 如 url https www baidu com 但是直接编译后没有颜色 xff0c 就是黑色的 xff0c 参考文献也是黑色的加入下面两句代码可以让超链接显示出颜色
希捷移动硬盘更换文件系统（exfat vs NTFS）

毕业资料多 xff0c 专门买了个移动硬盘 xff0c 希捷的 2T 第一次买移动硬盘 xff0c 以为和常规U盘一样 xff0c 买来没仔细看说明书就直接用上了 xff0c 但是使用过程中老出问题 xff0c 比如从featurize平台
LPWAN——Sigfox实战经验介绍

0 序最近半年的时间一直在从事这方面的开发工作 xff0c 到目前为止对于Sigfox有一定想法和经验 xff0c 同时目前国内对于该技术的使用和应用还处在刚刚起步的阶段 xff0c 很多博客对Sigfox的讲解是一个浅尝辄止的介绍 xf
拉格朗日乘子法详解（Lagrange multiplier）

最近在视频的变换编码里推导最优变换 xff08 KL变换 xff09 时需要用拉格朗日乘子法 xff0c 之前在机器学习的各种优化问题里也要用到这个方法 xff0c 特此仔细钻研一番 xff0c 总结如下 xff1a 注 xff1a 这篇博

拉格朗日乘子法详解（Lagrange multiplier）

拉格朗日乘子法详解（Lagrange multiplier） 的相关文章

随机推荐

热门标签

拉格朗日乘子法详解（Lagrange multiplier）的相关文章