最优化理论·非线性最小二乘

2023-10-26

最优化理论·非线性最小二乘

标签(空格分隔): 数学

非线性最小二乘问题是椭圆拟合中最易遇到的优化问题,本文主要对非线性二乘的基本分析做简单介绍

1. 什么是最小二乘问题

目标函数能够写为m个函数平方和的优化问题
在这里插入图片描述

其中,每个函数 f i ( x ) f_i(x) fi(x)都是待优化向量 x x x的函数。

2.非线性最小二乘问题

  • f i ( x ) f_i(x) fi(x)是关于 x x x的非线性函数时,即为非线性优化问题
  • 此时,需要利用Taylor一阶展开近似 f i ( x ) f_i(x) fi(x)

2.1 f i ( x ) f_i(x) fi(x)的一阶近似

  • x ( k ) x^{(k)} x(k)是解 x x x的第k次近似,在此处将 f i ( x ) f_i(x) fi(x)进行一阶展开,并令一阶展开值为 φ i ( x ) \varphi_i(x) φi(x)
    在这里插入图片描述

  • 对上式进行整理,得到
    在这里插入图片描述
    在这里插入图片描述

  • 可以看到,一阶近似 φ i ( x ) \varphi_i(x) φi(x)是关于待优化向量 x x x的线性函数:

    • 在这里插入图片描述
      f i ( x ) f_i(x) fi(x)的梯度【 f i ( x ) f_i(x) fi(x)对向量x求导】在 x ( k ) x^{(k)} x(k)处的取值
    • 在这里插入图片描述
      f i ( x ) f_i(x) fi(x) x ( k ) x^{(k)} x(k)处的取值

2.2 F(x)的近似

在得到 f i ( x ) f_i(x) fi(x)的一阶近似后,便可以计算得到F(x)的一阶近似,该一阶近似为 Φ ( x ) \Phi(x) Φ(x)
在这里插入图片描述
在这里插入图片描述

2.3 分析 Φ ( x ) \Phi(x) Φ(x)的具体形式

  • 将平方和形式写为行向量、列向量乘积形式
    Φ ( x ) = [ φ 1 ( x ) , φ 2 ( x ) , ⋯   φ m ( x ) ] ⋅ [ φ 1 ( x ) φ 2 ( x ) … φ m ( x ) ] \Phi(x) = \left [ \varphi_1(x),\varphi_2(x),\cdots\,\varphi_m(x) \right ] \cdot \begin{bmatrix} \varphi_1(x)\\ \varphi_2(x)\\ \dots\\ \varphi_m(x) \end{bmatrix} Φ(x)=[φ1(x),φ2(x),φm(x)]φ1(x)φ2(x)φm(x)

  • φ i ( x ) \varphi_i(x) φi(x)的具体形式代入
    [ φ 1 ( x ) φ 1 ( x ) … φ 1 ( x ) ] = [   ▽ f 1 ( x ( k ) ) T ⋅ x − [ ▽ f 1 ( x ( k ) ) T − f 1 ( x ( k ) ) ]   ▽ f 2 ( x ( k ) ) T ⋅ x − [ ▽ f 2 ( x ( k ) ) T − f 2 ( x ( k ) ) ] …   ▽ f m ( x ( k ) ) T ⋅ x − [ ▽ f m ( x ( k ) ) T − f m ( x ( k ) ) ] ] \begin{bmatrix} \varphi_1(x)\\ \varphi_1(x)\\ \dots\\ \varphi_1(x) \end{bmatrix} = \begin{bmatrix} \ \bigtriangledown f_1(x^{(k)})^T \cdot x-\left [ \bigtriangledown f_1(x^{(k)})^T -f_1(x^{(k)})\right ]\\ \ \bigtriangledown f_2(x^{(k)})^T \cdot x-\left [ \bigtriangledown f_2(x^{(k)})^T -f_2(x^{(k)})\right ]\\ \dots\\ \ \bigtriangledown f_m(x^{(k)})^T \cdot x-\left [ \bigtriangledown f_m(x^{(k)})^T -f_m(x^{(k)})\right ]\\ \end{bmatrix} φ1(x)φ1(x)φ1(x)= f1(x(k))Tx[f1(x(k))Tf1(x(k))] f2(x(k))Tx[f2(x(k))Tf2(x(k))] fm(x(k))Tx[fm(x(k))Tfm(x(k))]

  • 继续整理得到
    [ φ 1 ( x ) φ 2 ( x ) … φ m ( x ) ] = [   ▽ f 1 ( x ( k ) ) T   ▽ f 2 ( x ( k ) ) T …   ▽ f m ( x ( k ) ) T ] ⋅ x − [   ▽ f 1 ( x ( k ) ) T   ▽ f 2 ( x ( k ) ) T …   ▽ f m ( x ( k ) ) T ] ⋅ x ( k ) + [   f 1 ( x ( k ) )   f 2 ( x ( k ) ) …   f m ( x ( k ) ) ] \begin{bmatrix} \varphi_1(x)\\ \varphi_2(x)\\ \dots\\ \varphi_m(x) \end{bmatrix}= \begin{bmatrix} \ \bigtriangledown f_1(x^{(k)})^T \\ \ \bigtriangledown f_2(x^{(k)})^T \\ \dots\\ \ \bigtriangledown f_m(x^{(k)})^T \\ \end{bmatrix} \cdot x -\begin{bmatrix} \ \bigtriangledown f_1(x^{(k)})^T \\ \ \bigtriangledown f_2(x^{(k)})^T \\ \dots\\ \ \bigtriangledown f_m(x^{(k)})^T \\ \end{bmatrix} \cdot x^{(k)}+ \begin{bmatrix} \ f_1(x^{(k)})\\ \ f_2(x^{(k)})\\ \dots\\ \ f_m(x^{(k)})\\ \end{bmatrix} φ1(x)φ2(x)φm(x)= f1(x(k))T f2(x(k))T fm(x(k))Tx f1(x(k))T f2(x(k))T fm(x(k))Tx(k)+ f1(x(k)) f2(x(k)) fm(x(k))

  • 引入 A k A_k Ak b b b!!!!!!
    在这里插入图片描述

在这里插入图片描述

其中:在这里插入图片描述

  • 则有
    [ φ 1 ( x ) φ 1 ( x ) … φ 1 ( x ) ] = A k ⋅ x − b \begin{bmatrix} \varphi_1(x)\\ \varphi_1(x)\\ \dots\\ \varphi_1(x) \end{bmatrix}= A_k \cdot x - b φ1(x)φ1(x)φ1(x)=Akxb

  • 那么,目标函数 F ( x ) F(x) F(x)的一阶近似 Φ ( x ) \Phi(x) Φ(x)的简洁形式为
    Φ ( x ) = ( A k x − b ) T ⋅ ( A k x − b ) \Phi(x) = (A_kx-b)^T \cdot (A_kx-b) Φ(x)=(Akxb)T(Akxb)
    它为标准的线性最小二乘问题

2.4 转化为线性最小二乘后的分析

Φ ( x ) = ( A k x − b ) T ⋅ ( A k x − b ) \Phi(x) = (A_kx-b)^T \cdot (A_kx-b) Φ(x)=(Akxb)T(Akxb)

  • 一阶近似得到的优化问题就是线性最小二乘问题,可以利用最小二乘问题求解,直接求解梯度为0的点,即目标函数在 x ( k ) x^{(k)} x(k)处的最小值点应该满足如下线性方程的解
    在这里插入图片描述

  • A K A_K AK为列满秩时,以上方程的解如下
    在这里插入图片描述

这里注意,利用上述方法求得的最优解为目标函数在 x ( k ) x^{(k)} x(k)处的一阶近似最小值,不能作为全局最优解,只能说明在局部向最优解点又进一步走近了,记为 x ( k + 1 ) x^{(k+1)} x(k+1)

在这里插入图片描述

2.5 对 x ( k + 1 ) x^{(k+1)} x(k+1)更新等式进一步分析化简

在这里插入图片描述

即有:

在这里插入图片描述

  • H k H_k Hk是目标函数 F ( x ) F(x) F(x)的一阶近似函数 Φ ( x ) \Phi(x) Φ(x)的Hessian矩阵,即可以说是目标函数 F ( x ) F(x) F(x)的近似Hessian矩阵
  • A k A_k Ak是目标函数 F ( x ) F(x) F(x)的梯度矩阵

注意:按照这里的推导,可以通过一步步迭代计算 x x x的最优值,这种方法可以称之为Gaussian-Newton方法,但仔细观察发现,当近似Hessian阵奇异或者近似奇异时,以上算法无法使用!也就引出了著名的LM算法


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

最优化理论·非线性最小二乘 的相关文章

  • 《普林斯顿微积分》读书笔记

    写在前面 并不完整 只有零散的记忆 二 三刷的时候再补充吧 一些初等函数的导数 例如 x n n x n 1 sin x cos x 积分等于反导数 其他 待补充
  • warning: dereferencing type-punned pointer will break strict-aliasing rules(转)

    warning dereferencing type punned pointer will break strict aliasing rules 在 gcc 2 x 下编译没有任何 warning 信息的代码换到 gcc 3 x 版本下
  • 参数估计(Parameter Estimation):频率学派(最大似然估计MLE、最大后验估计MAP)与贝叶斯学派(贝叶斯估计BPE)

    基础 频率学派与贝叶斯学派 http www douban com group topic 16719644 http www zhihu com question 20587681 最大似然估计 Maximum likelihood es
  • AssetDatabase的方法

    静态函数 描述 AddObjectToAsset 添加对象到资产 AllowAutoRefresh 递减一个内部计数器 Unity使用它来决定是否允许自动的资产数据库刷新行为 AssetPathToGUID 获得资产的GUID ClearL
  • Lorenz系统、简单的Rossler系统和Chua电路系统的混沌吸引子——MATLAB实现

    1 Lorenz系统 美国著名气象学家E N Lorenz在1963年提出来的用来刻画热对流不稳定性的模型 即Lorenz混沌模型 可以简单描述如下 x
  • 基础算法题——炎炎消防队(取巧、三分)

    炎炎夏日 题目描述 夏天的重庆格外地炎热 很容易起火 消防士们都全副武装 一旦发生险情就立马赶往救火 森罗是消防队中的一员 他在灭火的过程中突发奇想 如果能用退火的原理求解函数求最小值 那不就可以很容易计算了吗 翌日 森罗来到即将高考的弟弟
  • 插入排序的几种优化及测试结果

    插入排序很简单的了 于是我将算法的优化的第一站选在了这里 编程珠玑 在第十一章就首先讨论了这个问题 我写的基本版本 void insertSort1 int a int len int i int j int tmp for i 1 i l
  • oracle优化-----监控指标

    author skatetime 2010 03 24 昨天一个朋友问我 如何优化数据库 在想优化数据库前 首先要确认数据库是否需要优化 这就需要一些监控指标了 如 事务响应时间 数据库的逻辑读 数据库的物理读 物理写等 日常监控这些指标
  • hdu 5792 World is Exploding 2016 Multi-University 5

    Problem acm hdu edu cn showproblem php pid 5792 题意 给一个序列 V 问有多少个由下标组成的四元组 a b c d 满足 a b c d a lt b c lt d Va lt Vb Vc g
  • 为什么样本方差里面要除以(n-1)而不是n?

    前段日子重新整理了一下这个问题的解答 跟大家分享一下 如果有什么错误的话希望大家能够提出来 我会及时改正的 话不多说进入正题 首先 我们来看一下样本方差的计算公式 刚开始接触这个公式的话可能会有一个疑问就是 为什么样本方差要除以 n 1 而
  • LaTeX 数学公式大全!

    LaTeX 数学公式大全 这里是来自一篇教程的截图 很全面
  • 2020年高教社建模国赛真题A题--炉温曲线

    2020年高教社杯全国大学生数学建模竞赛题目 请先阅读 全国大学生数学建模竞赛论文格式规范 A题 炉温曲线 在集成电路板等电子产品生产中 需要将安装有各种电子元件的印刷电路板放置在回焊炉中 通过加热 将电子元件自动焊接到电路板上 在这个生产
  • 防止sigmoid和tanh激活函数溢出的C++实现

    引言 上一期 我们介绍了softmax函数的C 实现 但是考虑到sigmoid和tanh函数也是带 e e e的次幂 所以现在我们来考虑该函数的防止溢出实现 sigmoid函数 原理 该函数的公式为 1 1
  • 论文纠错(一)

    说说最近读的几篇论文的问题 果然有的论文还是不能细细地去读 一读就发现有问题 第一个是MSPCA里面的公式 7 到公式 8 那个Sr前面的2是不应该有的 也就是推导的时候出错了 第二个是GPUTENSOR里面的Gpu product的算法
  • DBA思考方式感悟

    author skate time 2012 07 21 DBA思考方式感悟 某某牛人为什么能想到那么绝妙的方法 某某人为什么那么聪明 这样的话大家都听过 有时想想大家先天素质都差不多 那就是后天人家爱思考 知道如何思考 于是聊聊如何让自己
  • 先验概率及后验概率等解释

    20201010 0 引言 在学习统计学的时候 在概率估计的部分 经常会遇到最大似然估计 最大后验估计等名词 这些似然和后验 都跟贝叶斯准则中的一些名词定义有关 这里参考书籍 Think Bayes 这部书 来记录这些名词 1 由糖果例子来
  • 【华为OD机试真题 python】数字加减游戏【2022 Q4

    题目描述 数字加减游戏 小明在玩一个数字加减游戏 只使用加法或者减法 将一个数字s变成数字t 在每个回合中 小明可以用当前的数字加上或减去一个数字 现在有两种数字可以用来加减 分别为a b a b 其中b没有使用次数限制 请问小明最少可以用
  • gym 101512 BAPC 2014 I Interesting Integers

    Problem codeforces com gym 101512 attachments vjudge net contest 186506 problem I Meaning 给出一个 正整数 n 要找尽量小的 a 和 b a lt b
  • Mathematica函数大全

    一 运算符及特殊符号 Line1 执行Line 不显示结果 Line1 line2 顺次执行Line1 2 并显示结果 name 关于系统变量name 的信息 name 关于系统变量name 的全部信息 command 执行Dos 命令 n
  • 模2除法——用非常直观的例子解释

    前言 差错检测中有名唤CRC之方法 但很多学习者难以理解其运行原理 特别是模2除法 故博主将其原理以示例方式记录下来 以便同道稍作借鉴 因博主水平有限 难免会出现错误 希各位能多多包涵和给予建议 注意 本博客假设各位已理解CRC原理但对模2

随机推荐