线性代数 --- 最小二乘在直线拟合上的应用与Gram-Schmidt正交化(上)

2023-10-26

最小二乘在直线拟合上的应用

在前一篇最小二乘的文章中:

线性代数 --- 投影与最小二乘 下(多元方程组的最小二乘解与向量在多维子空间上的投影)_松下J27的博客-CSDN博客多变量方程组的最小二乘,向量到多维子空间上的投影。https://blog.csdn.net/daduzimama/article/details/129559433?spm=1001.2014.3001.5501

我们知道了:1,正规方程, 2,计算最优解的方法,3,计算投影的方法

        在这篇文章中,我会从最小二乘在拟合直线上的应用开始,先是用实例来说明最小二乘的实际应用。紧接着,我会从这个例子出发,循序渐进的引出为什么我们希望A的列向量不仅仅是相互独立的,更希望他们是相互正交的。从而导出,如何令A的列向量彼此正交,这就是著名的Gram-Schmidt正交化。(需要再次重申的是,学习不是为了考试,不是为了背公式,更不需要题海战术,而是“知其(Gram-Schmidt)然,知其(Gram-Schmidt)所以然”)

拟合直线

        拟合直线可以说是最小二乘最好的应用之一。简而言之,就是用m>2个点(也可以说是m个观测点,及其所对应的m个数据)去拟合一条直线。

        对某个实验而言,如果他的实验结果是线性的,且没有任何实验误差,则两次实验的结果就能确定一条符合这一实验规律的直线b=C+Dt,而且后续所有的实验结果都应当落在这条直线上。假定现有m个实验结果,他们在横坐标上的值为t_{1},t_{2},...,t_{m},他们在纵坐标中所对应的值分别是b_{1},b_{2},...,b_{m}。现在我们用方程b_{i}=C+Dt_{i}表示一条穿过这些点的直线,得到如下方程组:

        如果m个实验结果都没有误差,则,上述方程组有解,且有唯一解C,D。但,如果实验结果有误差,则不可能找到一个完美的C,D,让这条直线穿过所有的点。这是一个(overdetermined system)超定方程组,m>2个方程,2个未知数,方程组无解。用矩阵来表示为:

        因实验结果的误差导致方程组无解,因此,我们只能找一条尽可能贴近所有点的直线。对于矩阵A而言,他有两个列向量,方程组无解,所以无法通过线性组合得到等式右端的列向量。在维持A的两个列向量不变的情况下,我们通过新的线性组合\hat{C}\hat{D},在A的列空间中找到了最接近向量b的向量p,即,b在A的列空间C(A)上的投影。

        同时,也最小化了每个点与直线之间的纵向误差e_{i},即,最小化E={e_{1}}^{2}+{e_{2}}^{2}+...+{e_{m}}^{2}。其中,e_{i}=b_{i}-C-Dt_{i}。(但这不是我推崇的思维,应该优先考虑用投影的角度思考!)

方程左右两边同时乘以A^{T},得到“正规方程(Normal Equation)”:

A^{T}A\hat{x}=A^{T}b(或A^{T}A\hat{x}=Pb,其中P为投影矩阵)

其中等式左边A^{T}A等于:

 等式右边A^{T}b等于:

最终得到A^{T}A\hat{x}=A^{T}b


 Example 1:

 如图(a),在一个实验中的不同时刻t1,t2,t3下,得到三组测量值b1,b3,b3,分别是(注意,他们并不是等间隔的):

 对应的方程组为:

        方程组无解,因为这三点不在一条直线上。通过求解最小二乘方程组,联立正规方程A^{T}A\hat{x}=A^{T}b

\large A=\begin{bmatrix} 1 &-1 \\ 1 &1 \\ 1 &2 \end{bmatrix}                \large \hat{x}=\begin{bmatrix} \hat{C}\\ \hat{D} \end{bmatrix}                \large b=\begin{bmatrix} 1\\ 1\\ 3 \end{bmatrix}

左边A^{T}A

\large \mathbf{A^{T}A=\begin{bmatrix} 1 & 1 &1 \\ -1& 1 & 2 \end{bmatrix} \begin{bmatrix} 1 &-1 \\ 1 &1 \\ 1 &2 \end{bmatrix} = \begin{bmatrix} 3 & 2\\ 2 & 6 \end{bmatrix}}

右边A^{T}b

\large A^{T}b=\begin{bmatrix} 1 &1 &1 \\ -1&1 & 2 \end{bmatrix}\begin{bmatrix} 1\\ 1\\ 3 \end{bmatrix} = \begin{bmatrix} 5\\ 6 \end{bmatrix}

得到:

 最终得到最优解为,\hat{C}=9/7,\hat{D}=4/7。 

 \large \hat{x}=(A^{T}A)^{-1}A^{T}b=\begin{bmatrix} 6 &-2 \\ -2& 3 \end{bmatrix} \begin{bmatrix} 5 \\ 6 \end{bmatrix} = \begin{bmatrix} 9/7\\ 4/7 \end{bmatrix}

对应的最佳拟合直线为:

\large f(x)=9/7+4/7t

投影p为:

\large p=A(A^{T}A)^{-1}A^{T}b=A\hat{x}=\begin{bmatrix} 1 & -1\\ 1 & 1\\ 1 & 2 \end{bmatrix}\begin{bmatrix} 9/7\\ 4/7 \end{bmatrix}=\begin{bmatrix} 5/7\\ 13/7\\ 17/7 \end{bmatrix}

        现在我们结合下图(b),从投影的角度来回顾一下这个问题。 向量b无法通过矩阵A的两个列向量[1,1,1]和[-1,1,2]通过线性组合得到,因为,b不在A的列空间内。通过把向量b投影到A的列空间上,在A的列空间上找到了一个离向量b最近的向量p,这个投影向量p可以通过A的两个列向量的线性组合得到,线性组合的权重为 \hat{C}=9/7,\hat{D}=4/7 。

 Attention:

        现在,我们已经得到了最优拟合的直线方程f(t)=9/7+4/7t,我们把t=(-1, 1, 2)时在直线上所对应的点求出来,看看有什么神奇的事发生!

当t=-1时,f(t=-1)=9/7-4/7=5/7,当t=1时,f(t=1)=9/7+4/7=13/7,当t=2时,f(t=2)=9/7+8/7=17/7。然后把这些点绘制到图(a)上,并且把图(a)和图(b)放在一起看。

        接下来我们会看到,这两幅图以不同的艺术形式描述了同一个数学问题, 且, 他们是密切相关的

关联1:投影向量p

        最开始,我们在图(a)中,描绘了三个不在同一直线上的数据点(t1=-1,b1=1),(t2=1,b2=1),(t3=2,b3=3)。然后,我们用投影的方式/求解正规方程的方式求得了最小二乘解\large \hat{x},同时也求出了向量b在A的列空间C(A)上的投影向量p=[5/7, 13/7, 17/7],这些都体现在了图(b)中。最后,我们根据最优拟合直线的函数,算出了t=(t1,t2,t3)时在直线上所对应的数据点(t1=-1,p1=5/7),(t2=1,p2=13/7),(t3=2,p3=17/7),并绘制到图(a)中。

        可见,投影向量p中三个元素的值,正好是拟合直线上t所对应的点。对于图(b)而言,用线性代数的语言说,是把b拉到了子空间C(A)上。对于图(a)而言,通过最小化每个点到最优拟合直线上的距离e1,e2,e3,把本不在同一直线上的三个点b1,b2,b3拉到了同一条直线上。且p1,p2,p3正好等于投影向量p中元素的值。

        换句话说,“把b投影到A的列空间上”和“把三个原始数据点(t1,b1),(t2,b2),(t3,b3)移到了同一条直线上”,这两个概念是等同的。

关联2:误差向量e

向量b减去投影向量p,就能得到误差向量e(他垂直于C(A)):

\large e=b-p=\begin{bmatrix} 1\\ 1\\ 3 \end{bmatrix} - \begin{bmatrix} 5/7\\ 13/7\\ 17/7 \end{bmatrix} = \begin{bmatrix} 2/7\\ -6/7\\ 4/7 \end{bmatrix}

向量e中的每个元素值的含义是什么? 实际上就是图(a)中,每个b与p之间的误差


(全文完)

作者 --- 松下J27

参考文献(鸣谢)

1,线性代数及其应用,侯自新,南开大学出版社,1990.

2,Linear Algebra and Its Applications(Fourth Edition) - Gilbert Strang(文中大部分插图来自于这本书)

3,Introduction to Linear Algebra,Fifth Edition - Gilbert Strang

格言摘抄:

(配图与本文无关)

版权声明:文中的部分图片,文字或者其他素材,可能来自很多不同的网站和说明,在此没法一一列出,如有侵权,请告知,立即删除。欢迎大家转载,但是,如果有人引用或者COPY我的文章,必须在你的文章中注明你所使用的图片或者文字来自于我的文章,否则,侵权必究。 ----松下J27

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

线性代数 --- 最小二乘在直线拟合上的应用与Gram-Schmidt正交化(上) 的相关文章

  • 证明正定矩阵的充要条件:全部顺序主子式大于0

    定理 f x T A x f x TAx f xTAx 正定的充要条件是
  • 矩阵论——正交向量

    向量正交 向量 u u u与向量 v v v正交 u
  • 生态系统过程模型

    生态系统过程模型 根据生态系统的生理生态学特性 结合影响生态系统过程的观测指标 提出的能够反映生态系统过程的机制模型 统计模型 stochasticmodel statisticmodel probabilitymodel 指以概率论为基础
  • 蓝桥杯2021年第十二届真题第一场-砝码称重

    题目 题目链接 题解 动态规划 状态定义 dp i j 表示前i个砝码是否能称出重量为j的物品 状态转移 对于第i个砝码 选和不选两种情况 对于选又可以分为放在左边和放在右边 看样例 存在加和减的情况 也就是放在左边和右边的情况 我们规定放
  • 矩阵 行列式的计算

    行列式要求 要计算行列式 那么这个矩阵一定是一个方阵 行列式性质 行列式转置后值不变 互换行列式中两行 值变为相反数 行列式中两行成比例 行列式为0 行列式中一行所有元素乘以一个数后加到另一行 行列式值不变 行列式的计算有很多方法 矩阵的行
  • 线性代数 - 特征向量和特征值

    今天在看到这个马汉诺拉距离的时候 又看到了这个东西 就是利用特征值来进行协方差方向上的伸缩 突然感觉到了线性代数的作用了 但是实际上 我今天看到了非常多的内容 但是都没有吸收完 很多内容都是线性代数的东西 但是这些东西我都忘了 这里先挖个坑
  • 高等数学——驻点,拐点,极值点

    一 定义不同 1 极值点 若f a 是函数f x 的极大值或极小值 则a为函数f x 的极值点 极大值点与极小值点统称为极值点 极值点是函数图像的某段子区间内上极大值或者极小值点的横坐标 极值点出现在函数的驻点 导数为0的点 或不可导点处
  • 刚体动力学

    文章目录 刚体状态 将某个物体从局部坐标系变化到全局坐标系 对时间求导 对矩阵求导 惯性 刚体属性 1 质心 计算方法 体素法 直接计算法 四面体体积 四面体的中心 2 惯性张量 世界坐标系中的惯性变量 刚体运动 力矩 刚体的固定属性 当前
  • 2022年第十四届华中杯数学建模A题解题思路附代码

    A 题 分拣系统优化问题 某电商公司配送中心的工作流程分为统计汇总 转运上架 按订单分拣 核对打包等 步骤 其中 分拣环节操作复杂 耗时较长 其效率是影响配送中心整体性能的关键因素 首先 系统统计汇总出当天全部待配送订单所包含的所有货品及相
  • jsp+Echarts实现图表可视化,连接数据库,从数据库拿数据

    实现可视化的图表 jsp mysql eclipse 从数据库拿数据改变表格的数据算是echarts的初始入门案例的升级版 想了解Echarts的各位大大 传送门 https echarts apache org examples zh e
  • 计算机二级python经典真题

    计算机二级python经典考题 1 键盘输入正整数n 按要求把n输出到屏幕 格式要求 宽度为20个字符 减号字符 右填充 右对齐 带千位分隔符 如果输入正整数超过20位 则按照真实长度输出 例如 键盘输入正整数n为1234 屏幕输出 1 2
  • 问题 D: 稀疏矩阵类型判断

    题目描述 输入一个稀疏矩阵 输出其类型 类型包括 上三角 对角线及其右上方的元素非0 其它元素为0 下三角 对角线及其左下方的元素非0 其它元素为0 对称 沿对角线对称的元素非0且相等 空矩阵 所有元素都为0 其它为普通矩阵 输入 输入包括
  • Game101现代计算机图形学作业1

    Game101现代计算机图形学作业1 一 作业描述 二 解决方法 一 模型变换 二 投影变换 绕任意轴旋转 三 总结 四 参考和引用 一 作业描述 给定三维下三个点 v 0 2 0 0
  • 逆矩阵的算法

    花了10分钟 终于明白矩阵的逆到底有什么用 首先 我们先来看看这个数的倒数 倒数 其实矩阵的逆矩阵也跟倒数的性质一样 不过只是我们习惯用A 1表示 问题来了 既然是和倒数的性质类似 那为什么不能写成1 A 其实原因很简单 主要是因为矩阵不能
  • 矩阵的分解——LU分解

    LU分解 LU分解是矩阵分解的一种 将一个矩阵分解为一个下三角矩阵和一个上三角矩阵的乘积 有时需要再乘上一个置换矩阵 LU分解可以被视为高斯消元法的矩阵形式 在数值计算上 LU分解经常被用来解线性方程组 且在求逆矩阵和计算行列式中都是一个关
  • matlab 计算点云中值

    目录 一 概述 1 算法概述 2 主要函数 二 代码示例 三 结果展示 四 参数解析 输入参数 输出参数 五 参考链接 本文由CSDN点云侠原创 原文链接 如果你不是在点云侠的博客中看到该文章 那么此处便是不要脸的爬虫 一 概述
  • 第一章 函数 极限 连续

    第一章 函数 极限 连续 第一节 函数 一 函数的概念及常见函数 1 函数概念 函数的两个基本要素 对应关系 定义域 判断两函数相等 从函数的两基本要素入手 即两函数的对应关系 表达式 定义域相同 对 于 任 意 x
  • 机器学习入门——线性代数简单回顾

    本节课程回顾了一些简单但常用的线性代数知识 很基础的 我会直接跳过 并对矩阵的一些运算进行编程实现 3 1 矩阵的加法和标量乘法 矩阵加法 要求行列数要相等 然后 每个元素对应相加 exp 矩阵的标量乘法 每个元素都要乘 exp 3 2 矩
  • 近日,小序一

    最近啊 想明白一些事情 人活着 为了什么 为名利 为欲望 还是为来生 为名利者 争权夺势 终会迷失本心 为欲望者 浑浑噩噩 终会误入歧途 唯有为来生者 无欲无求 一心向善 一心向善者 是灵魂富有的人 但往往生活贫瘠 所以 我为什么 你又为什
  • Herriott池的建模

    摘要 在气体光谱学中 为了获得足够灵敏的吸收测量 通常要求具有较长的光程长度 充气体积包裹在反射镜之间的多通道单元是满足这一要求的一种方式 同时在途中控制光束发散 避免了对超大设备的需求 Herriott单元是这种系统的一个例子 其特点是使

随机推荐

  • RabbitMQ--交换机、队列、消息

    交换机 autoDelete 如果设置为true 唯一的一个交换机或者队列解绑 那么该队列将会被自动删除 交换机类型 faout 经过交换机的消息直接转到所有与这个交换器绑定的队列中 无视rounting key的存在 direct 经过交
  • 国密:SM2公私钥加签验签

    一 工具类 POM中增加hutool
  • jdbc mysql 重连_JDBC实现Mysql自动重连机制的方法详解

    JDBC是一个用于连接和访问各种数据库的应用编程接口 它可以提供Java程序和各种数据库之间的连接服务 以下是成都seo技术频道编辑带来的实现Mysql自动重连机制的JDBC方法的详细说明 日志 使用连接器 J连接属性 自动连接 真 来避免
  • 我的Docker部署笔记

    Centos7下安装Docker 1 root账户登录 查看内核版本 root localhost uname a Linux localhost localdomain 3 10 0 1160 el7 x86 64 1 SMP Mon O
  • var与let的区别【一看就懂的知识】

    今天偶尔翻看了一本书 JavaScript编程精解 在函数这一章节中难免会看到 作用域 这个字眼 之前对于作用域的概念本就不是很敏感 也就匆匆略过了 反过来看时 才明白这是一个比较重要的点 下面借作用域这一概念深入了解一下本文的重点 var
  • 5.QT5中的connect的实现

    在QT4中 解析信号槽是通过将信号槽的名字转化为字符串 然后通过connect解析该字符串 得到信号函数的相对序号和 然后创建信号connectionlist 但是 所有的检查都在运行时 通过解析字符串进行 这意味着 如果信号槽的名称拼写错
  • springcloud之服务配置中心

    springcloud之服务配置中心 SpringCloud Config简介 Config Server基本使用 Config Client基本使用 Config整合Eureka Config配置搜索路径 SpringCloud Conf
  • 2021.11.7总结

    数据结构 将第三章栈与队列知识点看完了 栈是先进后出表 队列是先进先出表 然后发现了书上有很多题目 慕课上面也有很多题目 只是我自己没写而已 下周从第一章开始写题 然后洛谷很久没写题目了 下周 将数据结构书上和课程的题目写完 到第三章 洛谷
  • 开启OLED透明屏代理之路:高质量显示解决方案的商机

    随着科技的不断进步 OLED透明屏作为一种创新的显示技术 正逐渐在各个领域得到广泛应用 作为一名OLED透明屏代理商 你将有机会参与其中 共享这一蓬勃发展的市场 一 介绍OLED透明屏的概念和特点 1 1 什么是OLED透明屏 OLED透明
  • pandas_数据处理分析基本

    一 Pandas基础用法 20210405 fancy lee 1 pandas介绍 Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具 该工具是为了解决数据分析任务而创建的 panda
  • ESP-12F开发环境

    ESP 12F可以使用arduino IDE快速开发 1 首先安装arduino IDE 搜索直接下载即可 2 在文件 gt 首选项 gt 附加开发板管理器网址中添加ESP8266开发板 网址 http arduino esp8266 co
  • PHP curl 传输文件流

    PHP版本5 5以下时可直接使用 拼接要传输的文件的绝对路径即可 params file str replace ABSOLUTE PATH str PHP版本5 5以上时 需要使用curl file create函数 创建一个 CURLF
  • Python中Pickle模块的dump()方法和load()方法

    Python中的Pickle模块实现了基本的数据序列与反序列化 一 dump 方法 pickle dump obj file protocol 注释 序列化对象 将对象obj保存到文件file中去 参数protocol是序列化模式 默认是0
  • docker 使用pytorch在gpu上训练模型

    docker 使用pytorch在gpu上训练模型 安装docker 下载docker image 建立启动容器进入docker虚拟空间 不一定能运行起来 安装docker sudo apt get y install docker io
  • 百度旋转验证码(8-24,js逆向)

    网址 aHR0cHM6Ly96aXl1YW4uYmFpZHUuY29tL2xpbmtzdWJtaXQvdXJs 一 抓包分析 刷新网页 先看第一个包 提交参数是ak和时间戳 ak是定值 返回的参数中 as和tk后面都会用到 然后点击提交链接
  • Android AnimationDrawable动画与APP启动引导页面

    Android AnimationDrawable动画与APP启动 加载引导页面 画面 AnimationDrawable是Android的Frame动画 可以简单的认为此AnimationDrawable能够将一系列资源图片加载成 电影
  • 大数据分析引擎之presto简介

    大数据分析引擎之presto简介 简介 presto是一个大数据分析引擎 不属于hadoop体系 他是基于内存的 他的集群模式是主从式的 他可以与任何的大数据存储引擎做集成 集成的时候使用它的Connectors集成 从这里我们可以他可以和
  • SpringBoot集成mybatis-plus生成实体类

    1 pom xml添加依赖 2 配置mybatis plus 在application yml中添加 配置数据库连接 3 在com dtest02 demo system config下添加MyBatisPlusConfig java 4
  • 踩坑:nacos利用startup.cmd -m standalone启动错误

    1 报错信息 PS D SpringCloud nacos nacos bin gt startup cmd m standalone startup cmd 无法将 startup cmd 项识别为 cmdlet 函数 脚本文件或可运行程
  • 线性代数 --- 最小二乘在直线拟合上的应用与Gram-Schmidt正交化(上)

    最小二乘在直线拟合上的应用 在前一篇最小二乘的文章中 线性代数 投影与最小二乘 下 多元方程组的最小二乘解与向量在多维子空间上的投影 松下J27的博客 CSDN博客多变量方程组的最小二乘 向量到多维子空间上的投影 https blog cs