无人机轨迹学习,路径跟踪方案
个人总结:
1.强化学习:建立一种奖励机制,它最符合人类的学习机制,学习一个最优策略(policy),可以让本体(agent)在特定环境(environment)中,根据当前的状态(state),做出行动(action),从而获得最大回报(G or return)。
2.RBF Neural Networks:RBF神经网络是一种性能优良的前馈型神经网络,RBF网络可以任意精度逼近任意的非线性函数,且具有全局逼近能力. RBF神经网络可以根据具体问题确定相应的网络拓扑结构,具有自学习、自组织、自适应功能,它对非线性连续函数具有一致逼近性,学习速度快,可以进行大范围的数据融合,可以并行高速地处理数据。
对环境进行建模,在网络中分布各个节点,通过碰撞函数分析与碰撞物碰撞的几率,通过距离函数计算到目标点的距离,在两个函数的作用下,无人机趋向于最优路径。因自身具有学习能力,对环境的改变也能够适应;
3.蚁群算法:基于概率的路径规划算法,前期收敛速度慢,容易陷入局部最优点,但对运算要求不高;
4.人工势场法:基本思想是将物理空间的障碍物抽象为斥力场,将目标点抽象为引力场,障碍物排斥无人机防止其碰撞,目标点吸引无人机使其向终点飞行。不需要建立复杂的环境模型,结构简单,运算量比较小,能够实时处理并反馈信息,但这种方法存在陷入局部最小值的情况,无人机在斥力场周围徘徊,找不到目标点的路径;改进算法就是在无人机和目标点的距离作为一个因子,加入到斥力场函数中,使得目标点不论在任何情况下都是全局势场最小的点,这样就能脱离局部最小值的束缚;
Adaptive trajectory tracking neural network control with robust compensator for robot manipulators
提出了一种基于径向基函数(RBF)的自适应轨迹跟踪神经网络控制方法,用于具有鲁棒补偿器的n连杆机器人机械手实现高精度的位置跟踪。为了保证控制系统的稳定性和鲁棒性,由于摩擦力、外部干扰误差和参数变化等原因,设计一种能够实现精确轨迹跟踪和良好控制性能的合适控制方案的困难之一是。针对这一问题,研究了基于RBF网络的n连杆机器人关节位置控制问题。RBF网络由于其快速学习算法和更好的逼近能力,在这类问题中显示了巨大的前景。自适应RBF网络能够有效地提高系统在大不确定性下的控制性能。利用反向传播算法和李雅普诺夫稳定性定理,推导出网络参数的自适应转向规律,保证了整个系统的稳定性和权值自适应的收敛性。在该控制方案中,鲁棒补偿器作为辅助控制器,在质量变化、外部干扰和建模不确定性等各种环境下,保证系统的稳定性和鲁棒性。
Improvement of Tracking Control of a Sliding Mode Controller for Robot Manipulators by a Neural Network
本文提出了一种神经网络控制技术,在非模型框架下利用滑模控制方法提高机器人机械手的跟踪性能。
Intelligent Leaning and Control of Autonomous Mobile Robot using MLP and RBF based Neural Network in Clustered Environment
利用智能多层感知器(MLP)和径向基函数(RBF)神经网络技术,研究了自主移动机器人的运动控制问题。避障和目标寻找是本研究中最重要的两种行为。基于ANN的控制器采用100种训练模式进行训练,使移动机器人在未知环境下不与障碍物发生碰撞而向目标移动。通过MATLAB仿真,对控制器的性能进行了仿真研究。
在环境中考虑了迷宫型障碍物,从路径长度和导航训练机制的速度两个方面验证了算法的有效性。移动机器人路径在未知环境下的结果表明,与MLP网络相比,RBFN产生的路径最短。此外,RBF网络在导航过程中还具有更高的收敛速度。
Automatic Path Planning for an Unmanned Drone with Constrained Flight Dynamics
提出了一种基于无人机飞行动力学模型和控制约束的路径几何约束估计方法。在此基础上,提出了一种考虑几何约束的新的寻路方法,并对其进行了理论和实证研究。
蚁群算法:
-
提出基于视场蚁群算法的机器人全局路径规划算法,建立局部信息素扩散模型及信息素扩散栅格表,将当前路径的信息素沿机器人在该路径点所受虚拟视场力方向,向邻近路径平滑扩散,将其叠加于全局信息,保证了信息素的光滑性,同时增强了隐含全局最优路径所在子空间的信息素浓度,加强蚂蚁个体间的协作能力,降低了蚁群算法的复杂度及深度(迭代次数和运行时间)。
-
蚁群是经过群体中个体之间的协作行为及启发信息寻找到全局最优路径,蚂蚁个体是以前几代蚂蚁在所经过路径上留下与其路径长度成反比的信息素作为先验知识和协作媒介,在信息素挥发机制下趋向于选择具有较强信息素的路径,并释放自己的信息素,这种正反馈机制使得问题的解不断向全局最优解方向进化,最终蚁群算法收敛于一条全局最优路径或者近似最优路径。
-
缺陷:蚂蚁个体必须在数次接触障碍物后,通过逐步降低近障碍物区域的信息素浓度完成对障碍物的规避;
卷积神经网络:
-
卷积神经网络,是一种前馈神经网络,人工神经元可以响应周围单元,可以进行大型图像处理。卷积神经网络包括卷积层和池化层。
-
CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。由于CNN的特征检测层通过训练数据进行学习,所以在使用CNN时,避免了显式的特征抽取,而隐式地从训练数据中进行学习;再者由于同一特征映射面上的神经元权值相同,所以网络可以并行学习,这也是卷积网络相对于神经元彼此相连网络的一大优势。卷积神经网络以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性,其布局更接近于实际的生物神经网络,权值共享降低了网络的复杂性,特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。
RBF神经网络:
和普通的三层神经网络,RBF 神经网络的区别在中间层。中间层采用 RBF Kernel 对输入作非线性变换,以便输出层训练线性分类器。
其实在深度学习出现之前,RBF神经网络就已经提出了 2-stage training。
第一阶段为非监督学习,从数据中选取记忆样本(图四中的紫色中心)。例如聚类算法可在该阶段使用。
第二阶段为监督学习,训练记忆样本与样本输出的联系。该阶段根据需要可使用 AD/BP。
小结:
-
RBF神经网络的训练过程可以使用BP,因此应纳入BP神经网络的范畴。
-
RBF神经网络的训练分两阶段,这一点类似深度学习,且使RBF神经网络不同于SVM with RBF kernel。
两者最重要的区别:1 中间层神经元的区别。2 中间层数的区别。3 运行速度的区别。
BP_NN 的训练方式:
第一步 随机取输入值
第二步 估计输出结果跟目标的误差。
第三步 改变每层每个神经元的权重(weight) 。以求更小误差。
(Perceptron神经元的权重:就是每个神经元的输出对总的输出占多大的分量。