将博客搬至CSDN

2023-05-16

对与θH ,由于ACCE ,所以CAB=θH'=θH .此时满足

tanθH=tanθH'=Lrt-1'          [hz2] 

tanθH=tanθH'=Lrt-1'     (1)

可由角速度关系

ωt-1=Vt-1rt-1         

可得ω[hz3] =VLtanθHt-1

由于系统中dt 非常小,所以近似为1,dt 内自车中心D 以角速度ω 匀速转动,因此

yaw=yaw'[hz4] +dtω

yawt=yawt-1+Vt-1LtanθHt-1dt

获得当前车辆实际姿态角后,

xt=xt-1+cosyawt-1Vt-1dt

yt=yt-1+sinyawt-1Vt-1dt

在模型中α 为已知量(控制量)

自车运动状态的数学模型如下

xt=xt-1+αtcosθHt-1dt

yt=yt-1+αtsinθHt-1dt

yawt=yawt+Vt-1LtanθHt-1dt

vt=vt-1+αtdt

lqr轨迹跟踪模型

θH ---------------------转向角

yaw ---------------------姿态角

yaw' ---------------------x2 点的目标姿态角

d1 ---------------------t 时刻距x1 点的距离

d2 ---------------------t 时刻距x2 点的距离

D ---------------------自车中心点

lqr原理:t 时刻自车更新当前所在位置D 的坐标并计算出与目标轨迹距离最近的点(),x2 点对应的速度大小,航向角yaw' ,曲率与速度期望值是确定的,在t 时刻自车也存在一个当前状态(state) 实际的航向角yawtVt 与曲率半径,通过当前状态与期望点的误差值进行lqr线性二次计算可得到最佳的输出加速度α 与前轮转向角θH ,从而使自车快速以最小的时间成本到达期望点x2 。此后期望点将不断后移,直到达到终点。

相关数学模型

xt=xt-1+xt-1dt

xt=θt-1Vt-1

θt=θt-1+ωt-1dt

ωt=VLθHt-1

Vt=Vt-1+αt-1dt[hz5] 

其中xt 为当前位置与最近点的距离,xt 表示当前自车与期望目标点距离的变化率,θt 表示当前姿态角变化率vt 表示当前速度

xt=xtxtθtωtVt

xt=10000 dt0000 0Vt-1100 00dt00 00001 . xt-1xt-1θt-1ωt-1θHt-1+ 000VL0 0000dt . θHt-1αt-1

上式称为系统的离散状态空间方程,该方程中所有变量可以完全表示系统当前状态,只要我们在t 时刻对系统施加一个确定的前轮转向角θHt 和确定的加速度αt ,系统就能被改变。称θHtαt 为控制量。

lqr的计算任务是在获取xt 的状态下的状态量后,根据线性算法计算出t 时刻最优的控制量θHα ,使得系统的xt 能更快更平稳地趋于目标轨迹,由于该系统的时间非连续,存在dt ,所以采用离散lqr进行求解

在使用时会出现连续时间与离散时间的不同推导过程,在连续时间下,系统的状态发生变化是上一个状态受到外界干扰或者系统输入量影响而导致的改变。

而对于一个离散时间系统

xt+1=Axt+But,x0=xinit                                                                          (1)[hz8] 

其中,A∈Rn×nB∈Rn×m[hz9] 

关于最优问题,就在于如何选择合适的 u0,u1,...[hz10]  ,使得状态量 x0,x1,...  足够小,因此得到好的调节和控制;或者使得 u0,u1,...  足够小,以使用更少的能量。这两个量通常相互制约,如果采用更大的输入u  ,就会驱使状态量 x  更快达到 0。采用线性二次调节原理可以解决这个问题。

这里先给出lqr的计算过程再逐一解释:

  • 计算出目标轨迹点,确定迭代参数N ,并得出轨迹中每一离散点的目标切线切线曲率、速度
  • 设置迭代初始值PN=QfQf=Q
  • 循环迭代:Pt-1=Q+ATPtA-ATPtB(R+BTPtB)-1BTPtA
  • 从t=0,…N-1,计算反馈系数kt=(R+BTPt+1B)-1BTPt+1A
  • 得到优先的控制量Ut*=-ktxt
  • 更新自车状态并判断是否到达终点,若否,则重复第③步。[hz11] 

为了使系统趋于0,我们设定了代价函数[hz12] 

J(U)=k=1N(XkTQXk+ukTRuk)                                              (2)

                                   J(U)=τ=0N-1 (XτTQXτ+uτTRuτ)+XQfXN                            (3)

(2)(3)代价方程是等价的,(2)式将最后一项分离了出来便于观察迭代过程。

一般来说,矩阵Q与矩阵R为对角矩阵,对角矩阵的元素对应着不同的状态控制量的权重,越大说明对该量的重视程度越大。即希望这个量在变化过程中保持较小的值。

其中函数参数 U=(u0,u1,..,uN) ,并且矩阵 Q,Qf,R  为正定矩阵,及

Q=QT≥0,Qf=QfT≥0,R=RT>0

Q 给定状态代价矩阵

Qf 最终状态代价矩阵

R 输入代价矩阵

N :时间范围 (考虑 )

Q,R :分别设定状态偏差和输入的相对权重

R>0 :意味着任何非零输入都增加 J 的代价

xτTQxτ :衡量状态偏差

uτTRuτ :衡量输入大小

xNTQfxN :衡量最终状态偏差

因此,关于 LQR 问题就是找出使得代价函数 J(U)  最小的一组控制输入(u0,u1,...,uN-1)lqr  。

求解:

       求解时使用动态规划法[hz13] 解决

首先定义一个值函数 Vt:Rn→R , 其中 :t=(0,…,N)

Vt(z)=minut,…,uN-1(τ=tN-1 (xτTQxτ+uτtRuτ)+xNTQfxN)                                (4)

如果设置 xt=z ,根据公式 (1) 的关系,xτ+1=Axτ+Buτ , 并且 τ=t,…,N

 Vt(z) 可以表示在 t  时刻,从状态 z  开始的 LQR 最小代价值

 V0(x0) 表示在 0 时刻,从状态 x0  开始的 LQR 最小代价值

 Vt 可以表示为二次型的形式,即 VT(z)=zTPtz , 其中 Pt=PtT≥0

。当 t=N  时,代价值函数为:

VN(z)=zTQfz                                                                                          (5)

因此 。PN=Qf

根据动态规划原理,等式 (4) 可以写成如下递归关系式:

              Vt(z)=minw(zTQz+wTRw+Vt+1(Az+Bw))                                            (6)

其中,

zTQz+wTRw :如果 , 则代表 ut=w  时刻产生的代价值;

Vt+1(Az+Bw) :代表从 t+1  时刻开始,引起的最小代价值;

提取等式 (6) 中与 w  无关的选项得

Vt(z)=zTQz+minw(wTRw+Vt+1(Az+Bw))                                               (7)

等式 (7) 描述了 Vt(z)  与 Vt+1(z)  之间的递归关系。

最优控制率 ut  可以表示为[hz14] 

             utlqr=argminw(wTRw+Vt+1(Az+Bw))                                                    (8)

求极值

假设 Vt+1=zTPt+1z  , 并且 Pt+1=Pt+1T≥0

, 等式 (10) 可以进一步转化为 Pt+1  的形式:

             Vt(z)=zTQz+minw(wTRw+(Az+Bw)TPt+1(Az+Bw))                          (9)

为了求最小值,对 w  求导,导数为零的点即为最值点。

 2wTR+2(Az+Bw)TPt+1B=0                                                               (10)

推导等式 (10),求取 w :

wTR+zTATPt+1B+wTBTPt+1B=0wT(R+BTPt+1B)=-zTATPt+1B(合并同类项并移项[hz15] )(R+BTPt+1B)Tw=-BTPt+1TAz(转置)(R+BTPt+1B)w=-BTPt+1Az(Pt+1=Pt+1T,R=RT)w=-(R+BTPt+1B)-1BTPt+1Az(矩阵求逆) (11)

由等式 (11) 可知,最优输入为

             w*=-(R+BTPt+1B)-1BTPt+1Az                                                              (12)

将等式 (12) 带入等式 (9) 得

 Vt(z)=zTQz+w*TRw*+(Az+Bw*)TPt+1(Az+Bw*)                           (13)

对等式 (13) 化简得

 Vt(z)=zTQz+w*TRw*+(Az+Bw*)TPt+1(Az+Bw*)=zTQz+w*TRw*+zTATPt+1Az+2zTATPt+1Bw*+w*TBTPt+1Bw*=zTQz+zTATPt+1Az+w*T(R+BTPt+1B)w*+2zTATPt+1Bw*=zTQz+zTATPt+1Az+zTATPt+1B(R+BTPt+1B)-1(R+BTPt+1B)(R+BTPt+1B)-1BTPt+1Az-2zTATPt+1B(R+BTPt+1B)-1BTPt+1Az=zTQz+zTATPt+1Az+zTATPt+1B(R+BTPt+1B)-1BTPt+1Az-2zTATPt+1B(R+BTPt+1B)-1BTPt+1Az=zTQz+zTATPt+1Az-zTATPt+1B(R+BTPt+1B)-1BTPt+1Az=zT(Q+ATPt+1A-ATPt+1B(R+BTPt+1B)-1BTPt+1A)z=zTPtz[hz16]  (14)

上述公式化简过程中,由于 Pt+1=Pt+1T,R=RT

,所以 ((R+BTPt+1B)-1)T=(R+BTPt+1B)-1  。

由等式 (14) 可知

 Pt=Q+ATPt+1A-ATPt+1B(R+BTPt+1B)-1BTPt+1A                                    (15)

求解过程

关于 LQR 的求解过程,可以采用动态规划算法,依据上述公式 (18) 的递归关系,反向递推,求出满足一定条件的最小代价值。

确定迭代范围 N

设置迭代初始值 PN=Qf

循环迭代,t=N,…,1

Pt-1=Q+ATPt+1A-ATPt+1B(R+BTPt+1B)-1BTPt+1A

则反馈系数 Kt=-(R+BTPt+1B)-1BTPt+1A ,对于时间 t=0,…,N-1

优化的控制量utlqr=Ktxt

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

将博客搬至CSDN 的相关文章

  • struct和class的区别

    总结 xff0c 主要有这么几点不同 xff1a 1 struct 是值类型 xff0c class 是对象类型 2 struct 不能被继承 xff0c class 可以被继承 3 struct 默认的访问权限是public 而class
  • c++中模板类的成员函数的声明与定义应该放在头文件里

    今天尝试自己实现vector数据结构底层 xff0c 在定义vector模板类的时候 xff0c 还想像往常一样把类分为 h文件和 cpp文件 xff0c 把成员函数的声明放在 h文件中 xff0c 把具体实现放在 cpp文件中 xff0c
  • Byte 高位/低位简介绍(大端格式/小端格式)

    一个byte由8个二进制位构成1个字节 即1Byte 61 8Bit 其中左边是高位 xff0c 右边是低位 high four 61 byte amp 0xf0 gt gt 4 0xf0 61 11110000 low four 61 b
  • Python3+Requests库带验证码登陆学校教务系统的尝试。

    毕业快两年了 xff0c 上班空闲摸鱼的时候无意中打开了学校的教务系统 发现浏览器还记着我的学号和登陆密码 果然是很多东西你自己都忘了 xff0c 浏览器的云端都帮你记着 xff0c 输入验证码之后居然登陆进去了 学校的教务系统还是一如既往
  • RK3568开发笔记-socketCan编程

    目录 前言 一 socket can创建 xff1f 二 系统can节点设置 三 can过滤器设置 四 can数据发送 五 can数据接收 总结 前言 CAN是ControllerArea Network xff08 控制器局域网 xff0
  • vs2015基于UDP协议的简单通信例程

    vs2015基于UDP协议的简单通信例程 关键字 xff1a socket套接字 udp通信 注意 xff1a 1 UDP发送和接受数据分别使用sendto 和recvfrom 函数 xff0c 注意函数的用法 xff1b 2 在vs201
  • memcpy与结构体

    前言 最近小学期做通信的实验 xff0c 很有意思 通讯是用了老师统一规定的结构体 xff0c 但是苦于结构体与要传输时字符串数组的转换 xff0c 思索了很久没有结果 启发 在zigbee协议栈已经看到 xff0c 传输结构体时 xff0
  • (一)SAS初识

    1 SAS常用工作窗口 结果 xff08 Result xff09 窗口 管理SAS程序的输出结果 xff1b 日志 xff08 Log xff09 窗口 记录程序的运行情况 xff1b SAS资源管理器 xff08 Explore xff
  • 2021-08-31

    二次规划求解器OOQP的基础使用 前言一 OOQP所包含参数的定义二 简单调用1 头文件2 参数设置3 进行求解4 取出计算结果 总结 前言 OOQP作为一款强大的开源凸优化库 支持C 43 43 Matlab调用 现在这里记录下其简单的使
  • Smart PLC与Wincc通过Simatic NET建立OPC通讯(1)

    有已经组态好的XDB文件可以在我的博客下载中心下载SIMATIC NET通讯 xff0c 下载完成直接导入到Simaticnet软件即可 xff0c 如下图 xff1a 下载链接 xff1a https download csdn net
  • 如何下载西门子PLC的CAD图库

    1 进入西门子下载中心 xff0c 网址如下 xff1a https www automation siemens com bilddb search aspx multipleObjectTypes 61 61 64 63 65 60 2
  • 串联电阻和并联电阻的计算方法

    注 xff1a 并联电路的电阻计算公式 1 R总 61 1 R1 43 1 R2 电阻可以无限数量的串联和并联组合连接在一起形成复杂的电阻电路 在之前的教程中 xff0c 我们学习了如何将各个电阻连接在一起形成一个系列电阻器网络或并联电阻器
  • 西门子V90 PN控制FB284块的个人理解

    FB284块的引脚定义 xff1a 1 MDI xff08 Manual Data Input xff09 称为设定值直接给定运行方式 即上位控制器直接设置目标位置 速度 加减速度后 xff0c 轴自动移动到目标位置的定位方式 MDI也是实
  • 伺服驱动

    1 什么是丝杠的导程 xff1f 伺服电机旋转一圈360度 xff0c 同时带动丝杠旋转360度 导程只是关系到丝杆转一圈 xff0c 丝杆螺母走的距离 如果配有减速机的话 xff0c 会有一个减速比 xff0c 如果减速比为1 12的话
  • 增量式编码器与绝对值编码器的区别

    增量式编码器只能记住自己走了多少步 xff0c 当然会有一个原点 在开机第一次走过原点一千 xff0c 它是不知道自己的位置在什么地方 绝对值编码器只要上电就能知道自己现在所处的位置 xff0c 绝对值编码器需要刻更多的线 xff0c 成本
  • RS422-RS485-RS232标准接线

    1 RS422标准接线 2 RS485标准接线 3 RS485全双工接线
  • C语言中关于合法的数值常量

    1 八进制常量 xff1a 开头必须是0 xff0c 且八进制是0 7之间组成的数 xff0c 例如 xff0c 029就是错误的八进制表示方式 2 十六进制常量 xff1a 0X开头 xff0c 包含字母ABCDEF xff0c 不区分大
  • C中关于“表达式必须是可修改的左值错误”的解决方式

    注意1 xff1a 1 num 10 是字符数组名 xff0c a i num指向字符常量 xff0c 字符数组名是无法修改的 2 所以可以用strcpy字符串复制功能就可以了 3 另外写成s 61 a i 也可以 4 又或者将结构体内ch
  • (二)SAS基本语法

    1 语句 SAS语言的基本单位是语句 xff0c 多条SAS语句构成一个SAS程序 xff08 SAS xff09 xff1b Libname mylib 34 c sasdata 34 语句通常由一个关键词 SAS名称 特殊字符 运算符等
  • TCP协议详解

    参考博客 在可靠的TCP网络通信中 xff0c 客户端和服务器端通信建立连接的过程可简单表述为三次握手 建立连接的阶段 和四次挥手 释放连接阶段 xff0c 下图是这两个阶段的一个完整的表述 xff1a 其状态图可以表示为 xff0c 在T

随机推荐