反馈线性化：具有柔性关节的单连杆操纵臂

2023-11-05

文章目录

写在前面
机械臂模型
输入-状态反馈线性化
输入-输出反馈线性化

写在前面

通过反馈和坐标变化来消除系统非线性的控制方法，称为反馈线性化。

反馈线性化(feedback linearization)是用来设计非线性系统(nonlinear systems)控制器的主要方法之一。本文由具有柔性关节的单连杆操纵臂控制实例出发，介绍反馈线性化的基本概念。通过选取不同的系统输出，具有柔性关节的单连杆操纵臂可以是一个相对阶为4没有内部动力学的系统，也可以是相对阶为2的最小相位系统。一个实例足以覆盖本文全部讲解内容，这也是我选择这个实例的原因。一些术语的中文翻译不一定准确，我将必要的英文原文写在后面，实际翻译以专业的参考书为准。

本文并不涉及模型不确定性(model uncertainty)的处理方法，以及不可反馈线性化(not feedback linearizable)的非线性系统控制方法。前者通常以自适应(adaptive)的方法处理，后者可以使用反步法(backstepping)，这两块如果我以后有空会在后续文章里详细讲解。

机械臂模型

考虑竖直平面上的具有柔性关节的单连杆操纵臂(the single-link manipulator with flexible joint)¹，其拥有2个自由度，即关节角 α \alpha α和电机角 θ \theta θ。假设连杆末端固定有重物，且连杆本身质量相对重物可以忽略不计，重力零点位于连杆最低点。

竖直平面上的具有柔性关节的单连杆操纵臂

图1. 竖直平面上的具有柔性关节的单连杆操纵臂

用拉格朗日方程求解数学模型，系统的势能(重力 V g \mathcal V_g Vg和弹性 V s \mathcal V_s Vs)和动能(hub K h \mathcal K_h Kh和link K l \mathcal K_l Kl)为

V g = m g l ( 1 − cos ⁡ α ) ， V s = 1 2 K s ( α − θ ) 2 ， K h = 1 2 J h θ ˙ 2 ， K l = 1 2 J o α ˙ 2 + 1 2 m ( l α ˙ ) 2 ， \begin{aligned} \mathcal V_g&=mgl(1-\cos \alpha)，\\ \mathcal V_s&=\frac{1}{2}K_s(\alpha-\theta)^2，\\ \mathcal K_h&=\frac{1}{2}J_h\dot \theta^2，\\ \mathcal K_l&=\frac{1}{2}J_o\dot \alpha^2+\frac{1}{2}m(l\dot \alpha)^2， \end{aligned} VgVsKhKl=mgl(1−cosα)，=21Ks(α−θ)2，=21Jhθ˙2，=21Joα˙2+21m(lα˙)2，
其中 J h J_h Jh、 J o J_o Jo分别为hub和重物关于各自重心的转动惯量。为了简化变量，定义 J l = J o + m l 2 J_l=J_o+ml^2 Jl=Jo+ml2作为link的转动惯量，这也是我们熟悉的平行轴定理。

由 L = K − V \mathcal L = \mathcal K − \mathcal V L=K−V，得到拉格朗日运动方程(Lagrange function of motion)为

d d t ∂ L ∂ α ˙ − ∂ L ∂ α = 0 ， d d t ∂ L ∂ θ ˙ − ∂ L ∂ θ = τ 。 \begin{aligned} \frac{d}{dt}\frac{\partial \mathcal L}{\partial \dot \alpha}-\frac{\partial \mathcal L}{\partial \alpha}&=0，\\ \frac{d}{dt}\frac{\partial \mathcal L}{\partial \dot \theta}-\frac{\partial \mathcal L}{\partial \theta}&=\tau。 \end{aligned} dtd∂α˙∂L−∂α∂Ldtd∂θ˙∂L−∂θ∂L=0，=τ。

经过运算得到数学模型

J l α ¨ + m g l sin ⁡ α + K s ( α − θ ) = 0 ， J h θ ¨ − K s ( α − θ ) = τ 。 \begin{aligned} J_l\ddot \alpha+mgl\sin\alpha+K_s(\alpha-\theta)&=0，\\ J_h\ddot \theta-K_s(\alpha-\theta)&=\tau。 \end{aligned} Jlα¨+mglsinα+Ks(α−θ)Jhθ¨−Ks(α−θ)=0，=τ。

令 x 1 = α x_1=\alpha x1=α, x 2 = α ˙ x_2=\dot \alpha x2=α˙, x 3 = θ x_3=\theta x3=θ, x 4 = θ ˙ x_4=\dot \theta x4=θ˙。则有状态空间(state-space)模型

[ x ˙ 1 x ˙ 2 x ˙ 3 x ˙ 4 ] = [ x 2 − m g l J l sin ⁡ x 1 − K s J l ( x 1 − x 3 ) x 4 K s J h ( x 1 − x 3 ) ] + [ 0 0 0 1 J h ] τ 。 ( 1 ) \begin{bmatrix} \dot x_1\\ \dot x_2\\ \dot x_3\\ \dot x_4 \end{bmatrix}= \begin{bmatrix} x_2\\ -\frac{mgl}{J_l}\sin x_1-\frac{K_s}{J_l}(x_1-x_3)\\ x_4\\ \frac{K_s}{J_h}(x_1-x_3) \end{bmatrix}+ \begin{bmatrix} 0\\ 0\\ 0\\ \frac{1}{J_h} \end{bmatrix}\tau。\qquad(1) ⎣⎢⎢⎡x˙1x˙2x˙3x˙4⎦⎥⎥⎤=⎣⎢⎢⎡x2−Jlmglsinx1−JlKs(x1−x3)x4JhKs(x1−x3)⎦⎥⎥⎤+⎣⎢⎢⎡000Jh1⎦⎥⎥⎤τ。(1)

输入-状态反馈线性化

非线性系统(1)可以通过状态变换(state transformations)转化为可反馈线性化系统。

坐标变换和微分同胚

对于非线性系统，定义坐标变换 z = T ( x ) z=T(x) z=T(x)，其中 T : R n → R n T:\mathbb R^n\to \mathbb R^n T:Rn→Rn是微分同胚(diffeomorphism)。也就是说 T T T光滑(smooth)，即连续可微，同时 T − 1 T^{-1} T−1存在且光滑。

对于线性系统，微分同胚等价于 T T T为可逆矩阵，而且该性质是全局(global)的，即在全部 R n \mathbb R^n Rn空间成立。而对于非线性系统，全局微分同胚的证明不容易，大多数情况只能证明局部(local)微分同胚，即在一个范围(region) Ω ∈ R n \Omega\in\mathbb R^n Ω∈Rn成立。我们可以通过隐函数定理(implicit function theorem)²证明局部微分同胚的存在性。

引理1：令 T ( x ) T(x) T(x)为范围 Ω ∈ R n \Omega\in\mathbb R^n Ω∈Rn上的一个光滑函数。若雅可比矩阵 ∇ T = ∂ T ∂ x \nabla T=\frac{\partial T}{\partial x} ∇T=∂x∂T在点 x 0 ∈ Ω x_0\in\Omega x0∈Ω处非奇异(nonsingular)，则 T ( x ) T(x) T(x)在 Ω \Omega Ω的子范围是一个局部微分同胚。

输入-状态可反馈线性化的条件

非线性系统 x ˙ = f ( x ) + g ( x ) u \dot x=f(x)+g(x)u x˙=f(x)+g(x)u被称为输入-状态可反馈线性化(input-state feedback linearizable)，如果存在一个微分同胚 z = T ( x ) z=T(x) z=T(x)， T ( 0 ) = 0 T(0)=0 T(0)=0，使得
z ˙ = A z + B β − 1 ( z ) [ u − α ( z ) ] ， \dot z=Az+B\beta^{-1}(z)[u-\alpha(z)]， z˙=Az+Bβ−1(z)[u−α(z)]，
其中 ( A , B ) (A,B) (A,B)可控，且 β ( z ) \beta(z) β(z)是可逆矩阵对所有 z ∈ Ω ⊂ R n z\in \Omega\subset\mathbb R^n z∈Ω⊂Rn都成立。上式称为 z z z-动力学( z z z-dynamics)，即非线性系统经过反馈线性化后的正规形式(normal form)。

机械臂实例1

考虑机械臂模型和微分同胚 z = T ( x ) z=T(x) z=T(x)
z 1 = x 1 ， z 2 = x 2 ， z 3 = − m g l J l sin ⁡ x 1 − K s J l ( x 1 − x 3 ) ， z 4 = − m g l J l x 2 cos ⁡ x 1 − K s J l ( x 2 − x 4 ) 。 \begin{aligned} z_1&=x_1，\\ z_2&=x_2，\\ z_3&=-\frac{mgl}{J_l}\sin x_1-\frac{K_s}{J_l}(x_1-x_3)，\\ z_4&=-\frac{mgl}{J_l}x_2\cos x_1-\frac{K_s}{J_l}(x_2-x_4)。 \end{aligned} z1z2z3z4=x1，=x2，=−Jlmglsinx1−JlKs(x1−x3)，=−Jlmglx2cosx1−JlKs(x2−x4)。

系统在 z z z-坐标下的动力学为

z ˙ 1 = z 2 ， z ˙ 2 = z 3 ， z ˙ 3 = z 4 ， z ˙ 4 = − z 3 ( m g l J l cos ⁡ z 1 + K s J l + K s J h ) + m g l J l ( z 2 2 − K s J h ) sin ⁡ z 1 + K s J l J h τ 。 ( 2 ) \begin{aligned} \dot z_1&=z_2，\\ \dot z_2&=z_3，\\ \dot z_3&=z_4，\\ \dot z_4&=-z_3\left(\frac{mgl}{J_l}\cos z_1+\frac{K_s}{J_l}+\frac{K_s}{J_h} \right)+\frac{mgl}{J_l}\left(z_2^2-\frac{K_s}{J_h}\right)\sin z_1+\frac{K_s}{J_lJ_h}\tau。 \end{aligned}\qquad (2) z˙1z˙2z˙3z˙4=z2，=z3，=z4，=−z3(Jlmglcosz1+JlKs+JhKs)+Jlmgl(z22−JhKs)sinz1+JlJhKsτ。(2)

因此，如果我们选择控制器
τ = J l J h K s [ v + z 3 ( m g l J l cos ⁡ z 1 + K s J l + K s J h ) − m g l J l ( z 2 2 − K s J h ) sin ⁡ z 1 ] ， \tau=\frac{J_lJ_h}{K_s}\left[v+z_3\left(\frac{mgl}{J_l}\cos z_1+\frac{K_s}{J_l}+\frac{K_s}{J_h} \right)-\frac{mgl}{J_l}\left(z_2^2-\frac{K_s}{J_h}\right)\sin z_1\right]， τ=KsJlJh[v+z3(Jlmglcosz1+JlKs+JhKs)−Jlmgl(z22−JhKs)sinz1]，
则可以得到线性系统
z ˙ 1 = z 2 ， z ˙ 2 = z 3 ， z ˙ 3 = z 4 ， z ˙ 4 = v 。 \begin{aligned} \dot z_1&=z_2，\\ \dot z_2&=z_3，\\ \dot z_3&=z_4，\\ \dot z_4&=v。 \end{aligned} z˙1z˙2z˙3z˙4=z2，=z3，=z4，=v。

输入-输出反馈线性化

相对阶和李导数

考虑单输入单输出(SISO)非线性系统

x ˙ = f ( x ) + g ( x ) u ， y = h ( x ) ， ( 3 ) \begin{aligned} \dot x&=f(x)+g(x)u，\\ y&=h(x)， \end{aligned}\qquad (3) x˙y=f(x)+g(x)u，=h(x)，(3)
其中 u ∈ R u\in\mathbb R u∈R， y ∈ R y\in\mathbb R y∈R， x ∈ R n x\in\mathbb R^n x∈Rn，且 f , g , h f,g,h f,g,h在域(domain) D ⊂ R n D\subset\mathbb R^n D⊂Rn上光滑。

求得 y y y关于时间的导数为
y ˙ = ∂ h ∂ x ( x ) f ( x ) + ∂ h ∂ x ( x ) g ( x ) u 。 \dot y=\frac{\partial h}{\partial x}(x)f(x)+\frac{\partial h}{\partial x}(x)g(x)u。 y˙=∂x∂h(x)f(x)+∂x∂h(x)g(x)u。
如果 ∂ h ∂ x ( x ) g ( x ) ≠ 0 \frac{\partial h}{\partial x}(x)g(x)\neq 0 ∂x∂h(x)g(x)=0对任意 x ∈ D 0 x\in D_0 x∈D0成立，那么该非线性系统被称为在域 D 0 D_0 D0上相对阶(relative degree)为1。也就是说， u u u显式出现(explicitly appear)在 y ˙ \dot y y˙中，而当 u u u显式出现在 y y y中时，我们称该非线性系统相对阶为0。如果 ∂ h ∂ x ( x ) g ( x ) = 0 \frac{\partial h}{\partial x}(x)g(x)= 0 ∂x∂h(x)g(x)=0，那么我们继续求导，直到 u u u第一次显式出现。

为了方便重复求导，我们定义李导数(Lie derivative)。函数 h h h关于(with respect to) f f f的李导数记作
L f h ( x ) = ∂ h ∂ x ( x ) f ( x ) 。 L_fh(x)=\frac{\partial h}{\partial x}(x)f(x)。 Lfh(x)=∂x∂h(x)f(x)。
基于李导数，我们有
L f k h ( x ) = L f L f k − 1 h ( x ) = ∂ ∂ x ( L f k − 1 h ( x ) ) f ( x ) ， L g L f k h ( x ) = ∂ ∂ x ( L f k h ( x ) ) g ( x ) 。 \begin{aligned} L_f^k h(x)&=L_fL_f^{k-1}h(x)=\frac{\partial}{\partial x}(L_f^{k-1}h(x))f(x)，\\ L_gL_f^k h(x)&=\frac{\partial}{\partial x}(L_f^kh(x))g(x)。 \end{aligned} Lfkh(x)LgLfkh(x)=LfLfk−1h(x)=∂x∂(Lfk−1h(x))f(x)，=∂x∂(Lfkh(x))g(x)。
如果 L g h ( x ) = 0 L_g h(x)=0 Lgh(x)=0，即相对阶大于1，那么继续求导直到 L g L f r − 1 h ( x ) ≠ 0 L_gL_f^{r-1}h(x)\neq 0 LgLfr−1h(x)=0在 r r r时第一次成立，即 u u u显式出现在 y y y的 r r r阶导数 y ( r ) y^{(r)} y(r)中，此时称该非线性系统的相对阶为 r r r。

输入-输出可反馈线性化的条件

如果非线性系统相对阶为 r r r，那么 L g L f i h ( x ) = 0 L_gL_f^i h(x)=0 LgLfih(x)=0， ∀ i = 1 , 2 , ⋯ , r − 2 \forall i = 1,2,\cdots,r-2 ∀i=1,2,⋯,r−2，同时 y ( r ) = L f r h ( x ) + L g L f r − 1 h ( x ) u y^{(r)}=L_f^rh(x)+L_gL_f^{r-1}h(x)u y(r)=Lfrh(x)+LgLfr−1h(x)u。此时 y y y系统输入-输出可反馈线性化(input-output linearizable)，相应的状态反馈控制器为
u = 1 L g L f r − 1 h ( x ) [ v − L f r h ( x ) ] 。 u=\frac{1}{L_gL_f^{r-1}h(x)}\left[v-L_f^rh(x)\right]。 u=LgLfr−1h(x)1[v−Lfrh(x)]。

除非 r = n r=n r=n，该非线性系统仍有部分状态不受 u u u控制，剩下的 ( n − r ) (n-r) (n−r)个状态定义了该非线性系统的零动力学(zero dynamics)。对于一个相对阶为 r r r的系统，存在微分同胚 z = T ( x ) z=T(x) z=T(x)使得非线性系统(3)转化为输入-输出可反馈线性化标准型(input-output linearizable canonical form)
η ˙ = ϕ ( η , ζ ) ， ζ ˙ = A 0 ζ + B 0 β 0 − 1 ( η , ζ ) [ u − α 0 ( η , ζ ) ] ， y = C 0 ζ ， \begin{aligned} \dot \eta&=\phi(\eta,\zeta)，\\ \dot \zeta&=A_0\zeta+B_0\beta_0^{-1}(\eta,\zeta)\left[u-\alpha_0(\eta,\zeta)\right]，\\ y&=C_0\zeta， \end{aligned} η˙ζ˙y=ϕ(η,ζ)，=A0ζ+B0β0−1(η,ζ)[u−α0(η,ζ)]，=C0ζ，
其中 z = [ η T , ζ T ] T z=[\eta^T,\zeta^T]^T z=[ηT,ζT]T， η ∈ R n − r \eta\in\mathbb R^{n-r} η∈Rn−r， ζ ∈ R r \zeta\in\mathbb R^r ζ∈Rr，且 ( A 0 , B 0 , C 0 ) (A_0,B_0,C_0) (A0,B0,C0)是标准型
A 0 = [ 0 1 0 ⋯ 0 0 0 1 0 ⋮ ⋱ ⋮ 0 1 0 0 ⋯ 0 ] , B 0 = [ 0 0 ⋮ 0 1 ] , C 0 = [ 1 0 ⋯ 0 0 ] 。 A_0=\begin{bmatrix} 0&1&0&\cdots&0\\ 0&0&1& &0\\ \vdots& & &\ddots &\vdots\\ 0& & & &1\\ 0&0&&\cdots&0 \end{bmatrix}, B_0=\begin{bmatrix} 0\\ 0\\ \vdots\\ 0\\ 1 \end{bmatrix}, C_0=\begin{bmatrix} 1&0&\cdots&0&0 \end{bmatrix}。 A0=⎣⎢⎢⎢⎢⎢⎡00⋮0010001⋯⋱⋯00⋮10⎦⎥⎥⎥⎥⎥⎤,B0=⎣⎢⎢⎢⎢⎢⎡00⋮01⎦⎥⎥⎥⎥⎥⎤,C0=[10⋯00]。
由此可见非线性系统的正规形式被分解为(decomposed in)两部分，即能够被反馈线性化的 ζ \zeta ζ-动力学，以及表征(characterize)内部动力学(internal dynamics)的 η \eta η变量(variables)。 ζ \zeta ζ-动力学对应的反馈控制器为

u = α 0 ( η , ζ ) + β 0 ( η , ζ ) v ， ( 4 ) u=\alpha_0(\eta,\zeta)+\beta_0(\eta,\zeta)v，\qquad (4) u=α0(η,ζ)+β0(η,ζ)v，(4)
其中
α 0 ( η , ζ ) = L f r h ( x ) L g L f r − 1 h ( x ) ∣ x = T − 1 ( η , ζ ) , β 0 ( η , ζ ) = 1 L g L f r − 1 h ( x ) ∣ x = T − 1 ( η , ζ ) \alpha_0(\eta,\zeta)=\left.\frac{L_f^r h(x)}{L_gL_f^{r-1}h(x)}\right|_{x=T^{-1}(\eta,\zeta)}, \beta_0(\eta,\zeta)=\left.\frac{1}{L_gL_f^{r-1}h(x)}\right|_{x=T^{-1}(\eta,\zeta)} α0(η,ζ)=LgLfr−1h(x)Lfrh(x)∣∣∣∣∣x=T−1(η,ζ),β0(η,ζ)=LgLfr−1h(x)1∣∣∣∣∣x=T−1(η,ζ)

零动力学通过在 η \eta η-动力学中设置 ζ = 0 \zeta=0 ζ=0得到： η ˙ = ϕ ( η , 0 ) \dot \eta=\phi(\eta,0) η˙=ϕ(η,0)，其不可观也无法被 u u u控制，需要额外分析其稳定性。非线性系统(3)被称为最小相位(minimum phase)，如果零动力学在域 D D D上有一个渐近稳定的平衡点(asymptotically stable equilibrium)。

注意：1. 线性系统也可能有相对阶，即 r ≠ n r\neq n r=n，但是其零动力学也是线性的；2. 非线性系统的相对阶可能不明确(undefined)，尤其当 L g L f i h ( x ) = 0 L_gL_f^i h(x)=0 LgLfih(x)=0对某些 x x x取值成立（即奇异点），此时该非线性系统不可转化为输入-输出可反馈线性化标准型。

跟踪控制器设计

假设控制目标(control objective)是让 y ( t ) y(t) y(t)跟踪一个期望信号 y d ( t ) y_d(t) yd(t)。令 e ( t ) = y ( t ) − y d ( t ) e(t)=y(t)-y_d(t) e(t)=y(t)−yd(t)是跟踪误差。设计反馈控制器(4)，其中 v v v选择如下：
v = y d ( r ) − k r − 1 e ( r − 1 ) − ⋯ − k 1 e ˙ − k 0 e = y d ( r ) − ∑ j = 0 r − 1 k j ( L f j h ( x ) − y d ( j ) ) 。 \begin{aligned} v &= y_d^{(r)}-k_{r-1}e^{(r-1)}-\cdots-k_1\dot e-k_0e\\ &=y_d^{(r)}-\sum_{j=0}^{r-1}k_j\left(L_f^j h(x)-y_d^{(j)} \right)。 \end{aligned} v=yd(r)−kr−1e(r−1)−⋯−k1e˙−k0e=yd(r)−j=0∑r−1kj(Lfjh(x)−yd(j))。

注意：为什么没有 L g L f j − 1 h ( x ) L_gL_f^{j-1} h(x) LgLfj−1h(x)?因为 L g L f i h ( x ) = 0 L_gL_f^i h(x)=0 LgLfih(x)=0， ∀ i = 1 , 2 , ⋯ , r − 2 \forall i = 1,2,\cdots,r-2 ∀i=1,2,⋯,r−2。

代入该反馈控制器，得到线性误差动力学
e ( r ) + k r − 1 e ( r − 1 ) + ⋯ + k 1 e ˙ + k 0 e = 0 。 e^{(r)}+k_{r-1}e^{(r-1)}+\cdots+k_1\dot e+k_0e=0。 e(r)+kr−1e(r−1)+⋯+k1e˙+k0e=0。
通过合理选择参数(coefficients) { k 0 , k 1 , ⋯ , k r − 1 } \{k_0,k_1,\cdots,k_{r-1}\} {k0,k1,⋯,kr−1}，特征方程(characteristic equation)
s ( r ) + k r − 1 s ( r − 1 ) + ⋯ + k 1 s + k 0 = 0 s^{(r)}+k_{r-1}s^{(r-1)}+\cdots+k_1s+k_0=0 s(r)+kr−1s(r−1)+⋯+k1s+k0=0
的根(root)可以任意分配(assign)。这意味着跟踪误差可以以指数速率(expoentially fast)渐进收敛于0。

下面考虑内部动力学 η ˙ = ϕ ( η , ζ ) \dot \eta=\phi(\eta,\zeta) η˙=ϕ(η,ζ)。令
y ˉ d ( t ) = [ y d ( t ) y ˙ d ( t ) ⋯ y d r − 1 ( t ) ] T 。 \bar y_d(t)=\begin{bmatrix} y_d(t)&\dot y_d(t)&\cdots&y_d^{r-1}(t) \end{bmatrix}^T。 yˉd(t)=[yd(t)y˙d(t)⋯ydr−1(t)]T。
假设 y ˉ d ( t ) \bar y_d(t) yˉd(t)对所有 t ≥ 0 t\geq 0 t≥0有界(bounded)，且 η ˙ = ϕ ( η , y ˉ d ( t ) ) \dot \eta=\phi(\eta,\bar y_d(t)) η˙=ϕ(η,yˉd(t))的解意义明确(well defined)、有界，且一致(uniformly)渐进稳定，那么该反馈控制器保证全部状态有界，且跟踪误差指数收敛于0。

机械臂实例2

考虑与上节相同的机械臂模型。首先考虑输出 y = x 1 y=x_1 y=x1，该情况下相对阶为4，与状态变换后的非线性系统(2)阶数相同，因此没有内部动力学。

下面考虑输出 y = x 3 y=x_3 y=x3。对 y y y求导数，
y ˙ = x 4 ， y ¨ = K s J h ( x 1 − x 3 ) + 1 J l τ 。 \begin{aligned} \dot y &= x_4，\\ \ddot y &= \frac{K_s}{J_h}(x_1-x_3)+\frac{1}{J_l}\tau。 \end{aligned} y˙y¨=x4，=JhKs(x1−x3)+Jl1τ。
因此，该情况下相对阶为2。设计反馈控制器为
u = J l ( y ¨ d − K s J h ( x 1 − x 3 ) − λ 1 ( y − y d ) − λ 2 ( y ˙ − y ˙ d ) ) ， u=J_l\left(\ddot y_d-\frac{K_s}{J_h}(x_1-x_3)-\lambda_1(y-y_d)-\lambda_2(\dot y-\dot y_d)\right)， u=Jl(y¨d−JhKs(x1−x3)−λ1(y−yd)−λ2(y˙−y˙d))，
其中 λ 1 , λ 2 > 0 \lambda_1,\lambda_2>0 λ1,λ2>0。零动力学为
x ˙ 1 = x 2 ， x ˙ 2 = m g l J 1 sin ⁡ x 1 + K s J l x 1 ， \begin{aligned} \dot x_1 &= x_2，\\ \dot x_2 &= \frac{mgl}{J_1}\sin x_1+\frac{K_s}{J_l}x_1， \end{aligned} x˙1x˙2=x2，=J1mglsinx1+JlKsx1，
器为
u = J l ( y ¨ d − K s J h ( x 1 − x 3 ) − λ 1 ( y − y d ) − λ 2 ( y ˙ − y ˙ d ) ) ， u=J_l\left(\ddot y_d-\frac{K_s}{J_h}(x_1-x_3)-\lambda_1(y-y_d)-\lambda_2(\dot y-\dot y_d)\right)， u=Jl(y¨d−JhKs(x1−x3)−λ1(y−yd)−λ2(y˙−y˙d))，
其中 λ 1 , λ 2 > 0 \lambda_1,\lambda_2>0 λ1,λ2>0。零动力学为
x ˙ 1 = x 2 ， x ˙ 2 = m g l J 1 sin ⁡ x 1 + K s J l x 1 ， \begin{aligned} \dot x_1 &= x_2，\\ \dot x_2 &= \frac{mgl}{J_1}\sin x_1+\frac{K_s}{J_l}x_1， \end{aligned} x˙1x˙2=x2，=J1mglsinx1+JlKsx1，
即 J l α ¨ + m g l sin ⁡ α + K s α = 0 J_l\ddot \alpha+mgl\sin\alpha+K_s\alpha=0 Jlα¨+mglsinα+Ksα=0，显然渐进稳定于原点。

Groves, K., & Serrani, A. (2010). Modeling and Nonlinear Control of a Single-link Flexible Joint Manipulator, (3), 13. Retrieved from https://www2.ece.ohio-state.edu/~passino/lab5prelabnlc.pdf ↩︎
Farrell, J. A., & Polycarpou, M. M. (2006). Adaptive Approximation Based Control. Wiley Press. Hoboken, NJ, USA: John Wiley & Sons, Inc. https://doi.org/10.1002/0471781819 ↩︎

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)