通过反馈和坐标变化来消除系统非线性的控制方法,称为反馈线性化。
反馈线性化(feedback linearization)是用来设计非线性系统(nonlinear systems)控制器的主要方法之一。本文由具有柔性关节的单连杆操纵臂控制实例出发,介绍反馈线性化的基本概念。通过选取不同的系统输出,具有柔性关节的单连杆操纵臂可以是一个相对阶为4没有内部动力学的系统,也可以是相对阶为2的最小相位系统。一个实例足以覆盖本文全部讲解内容,这也是我选择这个实例的原因。一些术语的中文翻译不一定准确,我将必要的英文原文写在后面,实际翻译以专业的参考书为准。
本文并不涉及模型不确定性(model uncertainty)的处理方法,以及不可反馈线性化(not feedback linearizable)的非线性系统控制方法。前者通常以自适应(adaptive)的方法处理,后者可以使用反步法(backstepping),这两块如果我以后有空会在后续文章里详细讲解。
考虑竖直平面上的具有柔性关节的单连杆操纵臂(the single-link manipulator with flexible joint)1,其拥有2个自由度,即关节角
α
\alpha
α和电机角
θ
\theta
θ。假设连杆末端固定有重物,且连杆本身质量相对重物可以忽略不计,重力零点位于连杆最低点。
图1. 竖直平面上的具有柔性关节的单连杆操纵臂
用拉格朗日方程求解数学模型,系统的势能(重力
V
g
\mathcal V_g
Vg和弹性
V
s
\mathcal V_s
Vs)和动能(hub
K
h
\mathcal K_h
Kh和link
K
l
\mathcal K_l
Kl)为
V
g
=
m
g
l
(
1
−
cos
α
)
,
V
s
=
1
2
K
s
(
α
−
θ
)
2
,
K
h
=
1
2
J
h
θ
˙
2
,
K
l
=
1
2
J
o
α
˙
2
+
1
2
m
(
l
α
˙
)
2
,
\begin{aligned} \mathcal V_g&=mgl(1-\cos \alpha),\\ \mathcal V_s&=\frac{1}{2}K_s(\alpha-\theta)^2,\\ \mathcal K_h&=\frac{1}{2}J_h\dot \theta^2,\\ \mathcal K_l&=\frac{1}{2}J_o\dot \alpha^2+\frac{1}{2}m(l\dot \alpha)^2, \end{aligned}
VgVsKhKl=mgl(1−cosα),=21Ks(α−θ)2,=21Jhθ˙2,=21Joα˙2+21m(lα˙)2,
其中
J
h
J_h
Jh、
J
o
J_o
Jo分别为hub和重物关于各自重心的转动惯量。为了简化变量,定义
J
l
=
J
o
+
m
l
2
J_l=J_o+ml^2
Jl=Jo+ml2作为link的转动惯量,这也是我们熟悉的平行轴定理。
由
L
=
K
−
V
\mathcal L = \mathcal K − \mathcal V
L=K−V,得到拉格朗日运动方程(Lagrange function of motion)为
d
d
t
∂
L
∂
α
˙
−
∂
L
∂
α
=
0
,
d
d
t
∂
L
∂
θ
˙
−
∂
L
∂
θ
=
τ
。
\begin{aligned} \frac{d}{dt}\frac{\partial \mathcal L}{\partial \dot \alpha}-\frac{\partial \mathcal L}{\partial \alpha}&=0,\\ \frac{d}{dt}\frac{\partial \mathcal L}{\partial \dot \theta}-\frac{\partial \mathcal L}{\partial \theta}&=\tau。 \end{aligned}
dtd∂α˙∂L−∂α∂Ldtd∂θ˙∂L−∂θ∂L=0,=τ。
经过运算得到数学模型
J
l
α
¨
+
m
g
l
sin
α
+
K
s
(
α
−
θ
)
=
0
,
J
h
θ
¨
−
K
s
(
α
−
θ
)
=
τ
。
\begin{aligned} J_l\ddot \alpha+mgl\sin\alpha+K_s(\alpha-\theta)&=0,\\ J_h\ddot \theta-K_s(\alpha-\theta)&=\tau。 \end{aligned}
Jlα¨+mglsinα+Ks(α−θ)Jhθ¨−Ks(α−θ)=0,=τ。
令
x
1
=
α
x_1=\alpha
x1=α,
x
2
=
α
˙
x_2=\dot \alpha
x2=α˙,
x
3
=
θ
x_3=\theta
x3=θ,
x
4
=
θ
˙
x_4=\dot \theta
x4=θ˙。则有状态空间(state-space)模型
[
x
˙
1
x
˙
2
x
˙
3
x
˙
4
]
=
[
x
2
−
m
g
l
J
l
sin
x
1
−
K
s
J
l
(
x
1
−
x
3
)
x
4
K
s
J
h
(
x
1
−
x
3
)
]
+
[
0
0
0
1
J
h
]
τ
。
(
1
)
\begin{bmatrix} \dot x_1\\ \dot x_2\\ \dot x_3\\ \dot x_4 \end{bmatrix}= \begin{bmatrix} x_2\\ -\frac{mgl}{J_l}\sin x_1-\frac{K_s}{J_l}(x_1-x_3)\\ x_4\\ \frac{K_s}{J_h}(x_1-x_3) \end{bmatrix}+ \begin{bmatrix} 0\\ 0\\ 0\\ \frac{1}{J_h} \end{bmatrix}\tau。\qquad(1)
⎣⎢⎢⎡x˙1x˙2x˙3x˙4⎦⎥⎥⎤=⎣⎢⎢⎡x2−Jlmglsinx1−JlKs(x1−x3)x4JhKs(x1−x3)⎦⎥⎥⎤+⎣⎢⎢⎡000Jh1⎦⎥⎥⎤τ。(1)
非线性系统(1)可以通过状态变换(state transformations)转化为可反馈线性化系统。
对于非线性系统,定义坐标变换 z = T ( x ) z=T(x) z=T(x),其中 T : R n → R n T:\mathbb R^n\to \mathbb R^n T:Rn→Rn是微分同胚(diffeomorphism)。也就是说 T T T光滑(smooth),即连续可微,同时 T − 1 T^{-1} T−1存在且光滑。
对于线性系统,微分同胚等价于
T
T
T为可逆矩阵,而且该性质是全局(global)的,即在全部
R
n
\mathbb R^n
Rn空间成立。而对于非线性系统,全局微分同胚的证明不容易,大多数情况只能证明局部(local)微分同胚,即在一个范围(region)
Ω
∈
R
n
\Omega\in\mathbb R^n
Ω∈Rn成立。我们可以通过隐函数定理(implicit function theorem)2证明局部微分同胚的存在性。
引理1:令 T ( x ) T(x) T(x)为范围 Ω ∈ R n \Omega\in\mathbb R^n Ω∈Rn上的一个光滑函数。若雅可比矩阵 ∇ T = ∂ T ∂ x \nabla T=\frac{\partial T}{\partial x} ∇T=∂x∂T在点 x 0 ∈ Ω x_0\in\Omega x0∈Ω处非奇异(nonsingular),则 T ( x ) T(x) T(x)在 Ω \Omega Ω的子范围是一个局部微分同胚。
非线性系统
x
˙
=
f
(
x
)
+
g
(
x
)
u
\dot x=f(x)+g(x)u
x˙=f(x)+g(x)u被称为输入-状态可反馈线性化(input-state feedback linearizable),如果存在一个微分同胚
z
=
T
(
x
)
z=T(x)
z=T(x),
T
(
0
)
=
0
T(0)=0
T(0)=0,使得
z
˙
=
A
z
+
B
β
−
1
(
z
)
[
u
−
α
(
z
)
]
,
\dot z=Az+B\beta^{-1}(z)[u-\alpha(z)],
z˙=Az+Bβ−1(z)[u−α(z)],
其中
(
A
,
B
)
(A,B)
(A,B)可控,且
β
(
z
)
\beta(z)
β(z)是可逆矩阵对所有
z
∈
Ω
⊂
R
n
z\in \Omega\subset\mathbb R^n
z∈Ω⊂Rn都成立。上式称为
z
z
z-动力学(
z
z
z-dynamics),即非线性系统经过反馈线性化后的正规形式(normal form)。
考虑机械臂模型和微分同胚
z
=
T
(
x
)
z=T(x)
z=T(x)
z
1
=
x
1
,
z
2
=
x
2
,
z
3
=
−
m
g
l
J
l
sin
x
1
−
K
s
J
l
(
x
1
−
x
3
)
,
z
4
=
−
m
g
l
J
l
x
2
cos
x
1
−
K
s
J
l
(
x
2
−
x
4
)
。
\begin{aligned} z_1&=x_1,\\ z_2&=x_2,\\ z_3&=-\frac{mgl}{J_l}\sin x_1-\frac{K_s}{J_l}(x_1-x_3),\\ z_4&=-\frac{mgl}{J_l}x_2\cos x_1-\frac{K_s}{J_l}(x_2-x_4)。 \end{aligned}
z1z2z3z4=x1,=x2,=−Jlmglsinx1−JlKs(x1−x3),=−Jlmglx2cosx1−JlKs(x2−x4)。
系统在
z
z
z-坐标下的动力学为
z
˙
1
=
z
2
,
z
˙
2
=
z
3
,
z
˙
3
=
z
4
,
z
˙
4
=
−
z
3
(
m
g
l
J
l
cos
z
1
+
K
s
J
l
+
K
s
J
h
)
+
m
g
l
J
l
(
z
2
2
−
K
s
J
h
)
sin
z
1
+
K
s
J
l
J
h
τ
。
(
2
)
\begin{aligned} \dot z_1&=z_2,\\ \dot z_2&=z_3,\\ \dot z_3&=z_4,\\ \dot z_4&=-z_3\left(\frac{mgl}{J_l}\cos z_1+\frac{K_s}{J_l}+\frac{K_s}{J_h} \right)+\frac{mgl}{J_l}\left(z_2^2-\frac{K_s}{J_h}\right)\sin z_1+\frac{K_s}{J_lJ_h}\tau。 \end{aligned}\qquad (2)
z˙1z˙2z˙3z˙4=z2,=z3,=z4,=−z3(Jlmglcosz1+JlKs+JhKs)+Jlmgl(z22−JhKs)sinz1+JlJhKsτ。(2)
因此,如果我们选择控制器
τ
=
J
l
J
h
K
s
[
v
+
z
3
(
m
g
l
J
l
cos
z
1
+
K
s
J
l
+
K
s
J
h
)
−
m
g
l
J
l
(
z
2
2
−
K
s
J
h
)
sin
z
1
]
,
\tau=\frac{J_lJ_h}{K_s}\left[v+z_3\left(\frac{mgl}{J_l}\cos z_1+\frac{K_s}{J_l}+\frac{K_s}{J_h} \right)-\frac{mgl}{J_l}\left(z_2^2-\frac{K_s}{J_h}\right)\sin z_1\right],
τ=KsJlJh[v+z3(Jlmglcosz1+JlKs+JhKs)−Jlmgl(z22−JhKs)sinz1],
则可以得到线性系统
z
˙
1
=
z
2
,
z
˙
2
=
z
3
,
z
˙
3
=
z
4
,
z
˙
4
=
v
。
\begin{aligned} \dot z_1&=z_2,\\ \dot z_2&=z_3,\\ \dot z_3&=z_4,\\ \dot z_4&=v。 \end{aligned}
z˙1z˙2z˙3z˙4=z2,=z3,=z4,=v。
考虑单输入单输出(SISO)非线性系统
x
˙
=
f
(
x
)
+
g
(
x
)
u
,
y
=
h
(
x
)
,
(
3
)
\begin{aligned} \dot x&=f(x)+g(x)u,\\ y&=h(x), \end{aligned}\qquad (3)
x˙y=f(x)+g(x)u,=h(x),(3)
其中
u
∈
R
u\in\mathbb R
u∈R,
y
∈
R
y\in\mathbb R
y∈R,
x
∈
R
n
x\in\mathbb R^n
x∈Rn,且
f
,
g
,
h
f,g,h
f,g,h在域(domain)
D
⊂
R
n
D\subset\mathbb R^n
D⊂Rn上光滑。
求得
y
y
y关于时间的导数为
y
˙
=
∂
h
∂
x
(
x
)
f
(
x
)
+
∂
h
∂
x
(
x
)
g
(
x
)
u
。
\dot y=\frac{\partial h}{\partial x}(x)f(x)+\frac{\partial h}{\partial x}(x)g(x)u。
y˙=∂x∂h(x)f(x)+∂x∂h(x)g(x)u。
如果
∂
h
∂
x
(
x
)
g
(
x
)
≠
0
\frac{\partial h}{\partial x}(x)g(x)\neq 0
∂x∂h(x)g(x)=0对任意
x
∈
D
0
x\in D_0
x∈D0成立,那么该非线性系统被称为在域
D
0
D_0
D0上相对阶(relative degree)为1。也就是说,
u
u
u显式出现(explicitly appear)在
y
˙
\dot y
y˙中,而当
u
u
u显式出现在
y
y
y中时,我们称该非线性系统相对阶为0。如果
∂
h
∂
x
(
x
)
g
(
x
)
=
0
\frac{\partial h}{\partial x}(x)g(x)= 0
∂x∂h(x)g(x)=0,那么我们继续求导,直到
u
u
u第一次显式出现。
为了方便重复求导,我们定义李导数(Lie derivative)。函数
h
h
h关于(with respect to)
f
f
f的李导数记作
L
f
h
(
x
)
=
∂
h
∂
x
(
x
)
f
(
x
)
。
L_fh(x)=\frac{\partial h}{\partial x}(x)f(x)。
Lfh(x)=∂x∂h(x)f(x)。
基于李导数,我们有
L
f
k
h
(
x
)
=
L
f
L
f
k
−
1
h
(
x
)
=
∂
∂
x
(
L
f
k
−
1
h
(
x
)
)
f
(
x
)
,
L
g
L
f
k
h
(
x
)
=
∂
∂
x
(
L
f
k
h
(
x
)
)
g
(
x
)
。
\begin{aligned} L_f^k h(x)&=L_fL_f^{k-1}h(x)=\frac{\partial}{\partial x}(L_f^{k-1}h(x))f(x),\\ L_gL_f^k h(x)&=\frac{\partial}{\partial x}(L_f^kh(x))g(x)。 \end{aligned}
Lfkh(x)LgLfkh(x)=LfLfk−1h(x)=∂x∂(Lfk−1h(x))f(x),=∂x∂(Lfkh(x))g(x)。
如果
L
g
h
(
x
)
=
0
L_g h(x)=0
Lgh(x)=0,即相对阶大于1,那么继续求导直到
L
g
L
f
r
−
1
h
(
x
)
≠
0
L_gL_f^{r-1}h(x)\neq 0
LgLfr−1h(x)=0在
r
r
r时第一次成立,即
u
u
u显式出现在
y
y
y的
r
r
r阶导数
y
(
r
)
y^{(r)}
y(r)中,此时称该非线性系统的相对阶为
r
r
r。
如果非线性系统相对阶为
r
r
r,那么
L
g
L
f
i
h
(
x
)
=
0
L_gL_f^i h(x)=0
LgLfih(x)=0,
∀
i
=
1
,
2
,
⋯
,
r
−
2
\forall i = 1,2,\cdots,r-2
∀i=1,2,⋯,r−2,同时
y
(
r
)
=
L
f
r
h
(
x
)
+
L
g
L
f
r
−
1
h
(
x
)
u
y^{(r)}=L_f^rh(x)+L_gL_f^{r-1}h(x)u
y(r)=Lfrh(x)+LgLfr−1h(x)u。此时
y
y
y系统输入-输出可反馈线性化(input-output linearizable),相应的状态反馈控制器为
u
=
1
L
g
L
f
r
−
1
h
(
x
)
[
v
−
L
f
r
h
(
x
)
]
。
u=\frac{1}{L_gL_f^{r-1}h(x)}\left[v-L_f^rh(x)\right]。
u=LgLfr−1h(x)1[v−Lfrh(x)]。
除非
r
=
n
r=n
r=n,该非线性系统仍有部分状态不受
u
u
u控制,剩下的
(
n
−
r
)
(n-r)
(n−r)个状态定义了该非线性系统的零动力学(zero dynamics)。对于一个相对阶为
r
r
r的系统,存在微分同胚
z
=
T
(
x
)
z=T(x)
z=T(x)使得非线性系统(3)转化为输入-输出可反馈线性化标准型(input-output linearizable canonical form)
η
˙
=
ϕ
(
η
,
ζ
)
,
ζ
˙
=
A
0
ζ
+
B
0
β
0
−
1
(
η
,
ζ
)
[
u
−
α
0
(
η
,
ζ
)
]
,
y
=
C
0
ζ
,
\begin{aligned} \dot \eta&=\phi(\eta,\zeta),\\ \dot \zeta&=A_0\zeta+B_0\beta_0^{-1}(\eta,\zeta)\left[u-\alpha_0(\eta,\zeta)\right],\\ y&=C_0\zeta, \end{aligned}
η˙ζ˙y=ϕ(η,ζ),=A0ζ+B0β0−1(η,ζ)[u−α0(η,ζ)],=C0ζ,
其中
z
=
[
η
T
,
ζ
T
]
T
z=[\eta^T,\zeta^T]^T
z=[ηT,ζT]T,
η
∈
R
n
−
r
\eta\in\mathbb R^{n-r}
η∈Rn−r,
ζ
∈
R
r
\zeta\in\mathbb R^r
ζ∈Rr,且
(
A
0
,
B
0
,
C
0
)
(A_0,B_0,C_0)
(A0,B0,C0)是标准型
A
0
=
[
0
1
0
⋯
0
0
0
1
0
⋮
⋱
⋮
0
1
0
0
⋯
0
]
,
B
0
=
[
0
0
⋮
0
1
]
,
C
0
=
[
1
0
⋯
0
0
]
。
A_0=\begin{bmatrix} 0&1&0&\cdots&0\\ 0&0&1& &0\\ \vdots& & &\ddots &\vdots\\ 0& & & &1\\ 0&0&&\cdots&0 \end{bmatrix}, B_0=\begin{bmatrix} 0\\ 0\\ \vdots\\ 0\\ 1 \end{bmatrix}, C_0=\begin{bmatrix} 1&0&\cdots&0&0 \end{bmatrix}。
A0=⎣⎢⎢⎢⎢⎢⎡00⋮0010001⋯⋱⋯00⋮10⎦⎥⎥⎥⎥⎥⎤,B0=⎣⎢⎢⎢⎢⎢⎡00⋮01⎦⎥⎥⎥⎥⎥⎤,C0=[10⋯00]。
由此可见非线性系统的正规形式被分解为(decomposed in)两部分,即能够被反馈线性化的
ζ
\zeta
ζ-动力学,以及表征(characterize)内部动力学(internal dynamics)的
η
\eta
η变量(variables)。
ζ
\zeta
ζ-动力学对应的反馈控制器为
u
=
α
0
(
η
,
ζ
)
+
β
0
(
η
,
ζ
)
v
,
(
4
)
u=\alpha_0(\eta,\zeta)+\beta_0(\eta,\zeta)v,\qquad (4)
u=α0(η,ζ)+β0(η,ζ)v,(4)
其中
α
0
(
η
,
ζ
)
=
L
f
r
h
(
x
)
L
g
L
f
r
−
1
h
(
x
)
∣
x
=
T
−
1
(
η
,
ζ
)
,
β
0
(
η
,
ζ
)
=
1
L
g
L
f
r
−
1
h
(
x
)
∣
x
=
T
−
1
(
η
,
ζ
)
\alpha_0(\eta,\zeta)=\left.\frac{L_f^r h(x)}{L_gL_f^{r-1}h(x)}\right|_{x=T^{-1}(\eta,\zeta)}, \beta_0(\eta,\zeta)=\left.\frac{1}{L_gL_f^{r-1}h(x)}\right|_{x=T^{-1}(\eta,\zeta)}
α0(η,ζ)=LgLfr−1h(x)Lfrh(x)∣∣∣∣∣x=T−1(η,ζ),β0(η,ζ)=LgLfr−1h(x)1∣∣∣∣∣x=T−1(η,ζ)
零动力学通过在 η \eta η-动力学中设置 ζ = 0 \zeta=0 ζ=0得到: η ˙ = ϕ ( η , 0 ) \dot \eta=\phi(\eta,0) η˙=ϕ(η,0),其不可观也无法被 u u u控制,需要额外分析其稳定性。非线性系统(3)被称为最小相位(minimum phase),如果零动力学在域 D D D上有一个渐近稳定的平衡点(asymptotically stable equilibrium)。
注意:1. 线性系统也可能有相对阶,即 r ≠ n r\neq n r=n,但是其零动力学也是线性的;2. 非线性系统的相对阶可能不明确(undefined),尤其当 L g L f i h ( x ) = 0 L_gL_f^i h(x)=0 LgLfih(x)=0对某些 x x x取值成立(即奇异点),此时该非线性系统不可转化为输入-输出可反馈线性化标准型。
假设控制目标(control objective)是让
y
(
t
)
y(t)
y(t)跟踪一个期望信号
y
d
(
t
)
y_d(t)
yd(t)。令
e
(
t
)
=
y
(
t
)
−
y
d
(
t
)
e(t)=y(t)-y_d(t)
e(t)=y(t)−yd(t)是跟踪误差。设计反馈控制器(4),其中
v
v
v选择如下:
v
=
y
d
(
r
)
−
k
r
−
1
e
(
r
−
1
)
−
⋯
−
k
1
e
˙
−
k
0
e
=
y
d
(
r
)
−
∑
j
=
0
r
−
1
k
j
(
L
f
j
h
(
x
)
−
y
d
(
j
)
)
。
\begin{aligned} v &= y_d^{(r)}-k_{r-1}e^{(r-1)}-\cdots-k_1\dot e-k_0e\\ &=y_d^{(r)}-\sum_{j=0}^{r-1}k_j\left(L_f^j h(x)-y_d^{(j)} \right)。 \end{aligned}
v=yd(r)−kr−1e(r−1)−⋯−k1e˙−k0e=yd(r)−j=0∑r−1kj(Lfjh(x)−yd(j))。
注意:为什么没有 L g L f j − 1 h ( x ) L_gL_f^{j-1} h(x) LgLfj−1h(x)?因为 L g L f i h ( x ) = 0 L_gL_f^i h(x)=0 LgLfih(x)=0, ∀ i = 1 , 2 , ⋯ , r − 2 \forall i = 1,2,\cdots,r-2 ∀i=1,2,⋯,r−2。
代入该反馈控制器,得到线性误差动力学
e
(
r
)
+
k
r
−
1
e
(
r
−
1
)
+
⋯
+
k
1
e
˙
+
k
0
e
=
0
。
e^{(r)}+k_{r-1}e^{(r-1)}+\cdots+k_1\dot e+k_0e=0。
e(r)+kr−1e(r−1)+⋯+k1e˙+k0e=0。
通过合理选择参数(coefficients)
{
k
0
,
k
1
,
⋯
,
k
r
−
1
}
\{k_0,k_1,\cdots,k_{r-1}\}
{k0,k1,⋯,kr−1},特征方程(characteristic equation)
s
(
r
)
+
k
r
−
1
s
(
r
−
1
)
+
⋯
+
k
1
s
+
k
0
=
0
s^{(r)}+k_{r-1}s^{(r-1)}+\cdots+k_1s+k_0=0
s(r)+kr−1s(r−1)+⋯+k1s+k0=0
的根(root)可以任意分配(assign)。这意味着跟踪误差可以以指数速率(expoentially fast)渐进收敛于0。
下面考虑内部动力学
η
˙
=
ϕ
(
η
,
ζ
)
\dot \eta=\phi(\eta,\zeta)
η˙=ϕ(η,ζ)。令
y
ˉ
d
(
t
)
=
[
y
d
(
t
)
y
˙
d
(
t
)
⋯
y
d
r
−
1
(
t
)
]
T
。
\bar y_d(t)=\begin{bmatrix} y_d(t)&\dot y_d(t)&\cdots&y_d^{r-1}(t) \end{bmatrix}^T。
yˉd(t)=[yd(t)y˙d(t)⋯ydr−1(t)]T。
假设
y
ˉ
d
(
t
)
\bar y_d(t)
yˉd(t)对所有
t
≥
0
t\geq 0
t≥0有界(bounded),且
η
˙
=
ϕ
(
η
,
y
ˉ
d
(
t
)
)
\dot \eta=\phi(\eta,\bar y_d(t))
η˙=ϕ(η,yˉd(t))的解意义明确(well defined)、有界,且一致(uniformly)渐进稳定,那么该反馈控制器保证全部状态有界,且跟踪误差指数收敛于0。
考虑与上节相同的机械臂模型。首先考虑输出 y = x 1 y=x_1 y=x1,该情况下相对阶为4,与状态变换后的非线性系统(2)阶数相同,因此没有内部动力学。
下面考虑输出
y
=
x
3
y=x_3
y=x3。对
y
y
y求导数,
y
˙
=
x
4
,
y
¨
=
K
s
J
h
(
x
1
−
x
3
)
+
1
J
l
τ
。
\begin{aligned} \dot y &= x_4,\\ \ddot y &= \frac{K_s}{J_h}(x_1-x_3)+\frac{1}{J_l}\tau。 \end{aligned}
y˙y¨=x4,=JhKs(x1−x3)+Jl1τ。
因此,该情况下相对阶为2。设计反馈控制器为
u
=
J
l
(
y
¨
d
−
K
s
J
h
(
x
1
−
x
3
)
−
λ
1
(
y
−
y
d
)
−
λ
2
(
y
˙
−
y
˙
d
)
)
,
u=J_l\left(\ddot y_d-\frac{K_s}{J_h}(x_1-x_3)-\lambda_1(y-y_d)-\lambda_2(\dot y-\dot y_d)\right),
u=Jl(y¨d−JhKs(x1−x3)−λ1(y−yd)−λ2(y˙−y˙d)),
其中
λ
1
,
λ
2
>
0
\lambda_1,\lambda_2>0
λ1,λ2>0。零动力学为
x
˙
1
=
x
2
,
x
˙
2
=
m
g
l
J
1
sin
x
1
+
K
s
J
l
x
1
,
\begin{aligned} \dot x_1 &= x_2,\\ \dot x_2 &= \frac{mgl}{J_1}\sin x_1+\frac{K_s}{J_l}x_1, \end{aligned}
x˙1x˙2=x2,=J1mglsinx1+JlKsx1,
器为
u
=
J
l
(
y
¨
d
−
K
s
J
h
(
x
1
−
x
3
)
−
λ
1
(
y
−
y
d
)
−
λ
2
(
y
˙
−
y
˙
d
)
)
,
u=J_l\left(\ddot y_d-\frac{K_s}{J_h}(x_1-x_3)-\lambda_1(y-y_d)-\lambda_2(\dot y-\dot y_d)\right),
u=Jl(y¨d−JhKs(x1−x3)−λ1(y−yd)−λ2(y˙−y˙d)),
其中
λ
1
,
λ
2
>
0
\lambda_1,\lambda_2>0
λ1,λ2>0。零动力学为
x
˙
1
=
x
2
,
x
˙
2
=
m
g
l
J
1
sin
x
1
+
K
s
J
l
x
1
,
\begin{aligned} \dot x_1 &= x_2,\\ \dot x_2 &= \frac{mgl}{J_1}\sin x_1+\frac{K_s}{J_l}x_1, \end{aligned}
x˙1x˙2=x2,=J1mglsinx1+JlKsx1,
即
J
l
α
¨
+
m
g
l
sin
α
+
K
s
α
=
0
J_l\ddot \alpha+mgl\sin\alpha+K_s\alpha=0
Jlα¨+mglsinα+Ksα=0,显然渐进稳定于原点。
Groves, K., & Serrani, A. (2010). Modeling and Nonlinear Control of a Single-link Flexible Joint Manipulator, (3), 13. Retrieved from https://www2.ece.ohio-state.edu/~passino/lab5prelabnlc.pdf ↩︎
Farrell, J. A., & Polycarpou, M. M. (2006). Adaptive Approximation Based Control. Wiley Press. Hoboken, NJ, USA: John Wiley & Sons, Inc. https://doi.org/10.1002/0471781819 ↩︎