一种分布式的多机器人包含避碰控制方法
【技术领域】
[0001] 本发明涉及智能机器人技术领域,具体来说涉及一种分布式的多机器人包含避碰 控制方法。
【背景技术】
[0002] 随着计算机技术、控制理论、人工智能理论、传感器技术的不断成熟和发展,由多 学科交叉而形成的机器人学研宄也进入了一个崭新的阶段。从可编程的、示教再现型的工 业机器人到具有一定传感能力和适应能力的机器人,再到配备多种先进传感器,具有较强 适应能力的智能机器人,机器人学的研宄工作经历了一个从简单到复杂,从功能单一到功 能多样,从工业制造领域到军事侦察、核工业、航空航天、服务业、基因工程等诸多领域的过 程。可以预见,在不久的将来,机器人技术在各个领域的应用将会更加广泛和深入。而各种 机器人系统在实际工作中的广泛应用又为机器人学提出了新的要求和新的研宄课题。多机 器人系统的研宄就是在这些新的应用需求驱动下提出,并随着机器人学的不断发展而逐渐 成为机器人学研宄的一个重要分支。
[0003] 多机器人系统协调控制已成为控制领域新兴的研宄热点,并且作为控制理论界的 综合性前沿课题,其研宄范畴涉及到生物、数学、物理、控制、计算机、通信以及人工智能等 领域,并且在诸多工程领域已得到了成功应用,其中包括:机器人编队、分布式计算、空间 开发与探测、无线传感器网络定位以及智能电网调度等工程实际中。其主要任务是设计控 制协议,并通过局部交换来实现全局交换,从而达到理想的一致性状态。
[0004] 现有的协调控制算法经常集中在无领航者或单领航者的情况下,而包含控制在实 际应用中则更为普遍。所谓包含控制,是指一组跟随者在多个领航者的引领下,从而到达并 保持在由领导者所围成的最小几何空间(凸包)中运动。在实际应用中,包容控制在多个 机器人共同完成危险物资处理、敌区搜索、火灾营救以及合作运输等协调任务中具有大量 的潜在应用。譬如,一组具有不同性能的小车从出发地移动到目的地,此时,我们只需在部 分小车上配有传感器来探测危险障碍物,那么这些小车指定为领航者,其余小车则为跟随 者。通过探明危险障碍物的位置,领航者能够形成一个安全的移动区域,如果跟随者一直在 由领航者形成的安全区域内移动,则该组小车能够安全顺利地到达目的地。作为一种特殊 的多领航情况,多机器人网络的包容控制得到了学者们的极大重视。
[0005] 在多机器人包含控制研宄方面,目前很多研宄工作致力于对控制协议的设计 改进以提高系统的稳定性,以及通过局部交换来实现全局交换,从而达到理想的一致性 状态° 例如:Mei J,Ferrari-Trecate (Containment control in mobile networks. IEEE Transactions on Automatic Control,2008)针对固定无向网络研宄了其包含控 制问题,提出停一走策略,从而驱使一组单积分个体进入到由领航者所构成的凸包中。 Ziyang Meng, Ren Wei, (Distributed finite-time containment control for multiple lagrangian systems. Proc of American Control Conf. Baltimore:IEEE Press, 2010) 讨论的带有未知参数的的拉格朗日系统的包含控制问题,基于相对位置和速度矢量提 出了带有参数估计器的自适应包含控制协议。在实际应用中,网络个体会受到模型不 确定性、网络传输速度和传感器可视范围的影响,个体之间通常为有向通信。Yongcan Cao, Daniel Stuat(Distributed containment for multiple autonomous vehicles with double-integrator dynamics:algorithns and experiments. IEEE Trans on Control Systems Technology, 2011)研宄二阶有向网络的包容控制问题,提出了当领导者静止 或运动的时相应的控制协议。Chengjie Xu ;Ying Zheng(Necessary and sufficient conditions for distributed containment control of multi-agent systems without velocity measurement,Control Theory&Applications 2014)提出在二阶多机器人网络 中仅知道领导者位置信息时,应用分布式滤波器来对邻居机器人速度进行估计,从而实现 包含控制。在大规模的多机器人包含控制中如何合理的选择领导者,并且避免规模增大时 机器人个体之间的避碰问题,是控制工程师非常感兴趣的问题,该控制问题具有两个显著 特征,一是个体之间存在着局部信息传递,二是个体独立进行分布式控制,可以看出由个体 形成的网络的拓扑结构起着非常重要的作用,其领导者的选择是群体实现同步的前提条 件,因此为了解决的多机器人系统的同步包含控制问题,需要着重解决群体网络拓扑结构 的构建以及机器人规模增大时机器人个体之间的避碰问题。
【发明内容】
[0006] 本发明的目的是,为了解决机器人个体之间的避碰问题,本发明提供一种基于局 部信息可知的能解决机器人群体规模增大时机器人个体之间的碰撞问题及群体网络拓扑 结构可控的包含控制方法。
[0007] 实现本发明的技术方案是,本发明一种基分布式的多机器人包含控制方法,将多 机器人网络同图论相结合,并应用可控性理论级最大匹配算法确定有向网络中的领导者跟 随者集合;领导者集合确定后,当领导者静止时,根据领导者机器人与跟随者机器人之间的 作用力关系及控制参数,引入势能函数实现避碰,设计出领导者静态时的包含避碰控制率; 当领导者运动时,针对局部信息可知的情况,即部分跟随者对领导者速度不可知,为跟随者 设计幂次估计器实现对领导者的速度估计,进而根据移动机器人的运动特性和控制参数, 设计多个机器人领导者动态时的包含避碰控制率。
[0008] 所述方法包括以下步骤:
[0009] (1)针对有向网络中各机器人之间的通信关系,应用可控性理论确定网络中的领 导者与跟随者集合;
[0010] (2)当领导者静态时,由领导者与邻居机器人之间的通信关系,设计跟随者机器人 的位置控制算子;
[0011] (3)在跟随者位置控制算子的基础上引入势能函数,确保跟随者机器人在运动过 程中互相之间能够实现避碰,形成领导者静态时的包含避碰控制率;
[0012] (4)当领导者动态时,由领导者与邻居机器人之间的通信关系,设计跟随者机器人 的位置控制算子;
[0013] (5)针对局部信息可知时,即网络拓扑中存在部分跟随者对领导者速度不可知的 情况,为跟随者机器人制定的控制策略中引入幂次估计器,来估计领导者机器人的速度,确 定跟随者机器人的速度控制算子;
[0014] (6)最后将机器人的位置控制算子和方向控制算子加权集成,并引入势能函数确 保运动过程中个体之间互相避碰,形成动态机器人的分布式包含避碰控制率。
[0015] 所述领导者与跟随者集合的方法有:
[0016] 1)应用图论的方法表示网络中的机器人之间的通信关系,并将有向图G(A)转换 为二分图H(A)表不:
[0017] 其中我们把多机器人系统视为由N个节点组成的有向网络G,NXN矩阵A = {aijli,j e [1,N]}表示网络中节点的邻接关系,如果节点i能够接受到j的信息,有aiJ> 0。转化后的二分图
分 别表示状态矩阵A的各列与各行的节点集合,r = {(Xpxplaij辛0}表示边集。
[0018] 2)根据二分图最大匹配算法,求得网络中的匹配节点与非匹配节点集合,对于一 个非匹配节点数不为0的网络,驱动节点数极为非匹配节点数。
[0019] 3)将机器人网络中的驱动节点视为领导者,其它节点为跟随者。
[0020] 机器人领导者静态时的包含避碰控制率的方法如下:
[0021] 1)跟随者机器人的位置控制算子由跟随者机器人和其邻居机器人之间通信关系 确定;
[0022] 跟随者的二阶动力学
模型如下:
[0024] 给定一个具有n个机器人的有向拓扑结构网络,应用可控性理论确定出网络中的 跟随者集合和领导者集合,分别用F = {vp v2, . . .,vj和L = {vm+1, vm+2, . . .,vj表示跟随 者集合和领导者集合。其位置控制算子表示为:
[0026] 其中ayt)是非负权值因子,表示邻接矩阵A = [a』G RNXN中第(i,j)个对应 的项。
[0027] 2)为跟随者机器人间引入势能函数,避免跟随者机器人运动过程中发生碰撞;势 能函数表示为:
[0029]VijU^Xj)定义如下:
[0031]其中,d指的是在所有机器人的运动过程中所应该保持的最小安全距离,r是机器 人能感知势能函数的距离,kij= k 0, x u的定义如下:
[0033] 3)针对跟随者机器人设计速度自检测项,将位置控制算子和势能函数加权集成, 形成当领导者静态时的包含避碰控制率。
[0034] 多个机器人领导者动态时的包含避碰控制率的方法如下:
[0035] 1)跟随者机器人的位置控制算子由跟随者机器人和其邻居机器人之间通信关系 确定,其表达式同(2)式;
[0036] 2)对动态领导者网络拓扑中可能存在部分跟随者对领导者速度不可知的情况,为 跟随者机器人制定的控制策略中引入幂次估计器,来估计领导者机器人的速度,确定跟随 者机器人的速度控制算子;
[0037] 提出的幂次估计器表示为:
[0039] 其中a > 0, Sgn为符号函数ieF,巧表示第i个跟随者对期望速度的估计。vd 表示对领导者机器人的给定速度。其速度控制算子表示为:
[0041] 3)最后将机器人的位置控制算子和方向控制算子加权集成,并引入势能函数确保 运动过程中个体之间互相避碰,形成动态机器人的分布式包含控制率。
[0042] 本发明的有益效果是:
[0043] (1)本发明将图论与机器人群体的控制相结合,形象直观的表现出机器人位置之 间形成的网络拓扑以及控制作用关系;
[0044] (2)本发明将控制理论中的可控性理论应用于多机器人系统中,应用可控性理论 及图论中的二分图最大匹配算法提出了一种包含控制中如何有效地选取确定领导者跟随 者集合的方法,确定了网络中的拓扑结构,为控制协议的设定和为群体实现同步包含控制 奠定了前提条件。
[0045] (3)本发明在设计包含控制率时引入了自定义的势能函数,当多个跟随者能有效 地实现当机器人规模增大时机器人个体之间在运动过程中的避碰问题。
[0046] (4)本发明在针对局部信息可知时,即当领导者动态时,部分跟随者对领导者速度 信息不可知的情况下,为跟随者机器人制定的控制策略中引入幂次估计器,来估计领导者 机器人的速度,从而实现由局部可知到全局可知,实现机器人群体在速度方向上的同步。
[0047] (5)本发明提出了一种新的当领导者静态和动态时的包含控制率,并通过李雅普 诺夫第二方法及Barbalat定理等证明了该控制率能够有效地实现多机器人的包含避碰控 制。
[0048] (6)位置控制算子与速度方向控制算子的加权集成可实现对于机器人位置关系变 化的自适应,在保证群体网络拓扑结构可控的基础上实现机器人群体的同步包含。
【附图说明】
[0049] 图1是本发明二分图最大匹配算法确定驱动节点示意图;
[0050] 图1 (a)表不网络拓朴结构图,图1 (b)表不对应二分图,图1 (c)表不找最大匹配 边集,图1 (d)表示确定驱动节;
[0051] 图2是本发明网络拓扑结构图;
[0052] 图3是领导者静态时包含控制示意图;
[0053] 图4是领导者静态时最终的位置误差;
[0054] 图5领导者动态时包含控制示意图;
[0055] 图6是领导者动态时最终的位置误差;
[0056] 图7为本发明方法的步骤框图。
【具体实施方式】
[0057] 下面结合附图,对本发明进行详细的描述。
[0058] 本发明【具体实施方式】的步骤如图7所示。
[0059] 采用二分图最大匹配算法确定驱动节点示意图:一般而言,复杂网络控制的目标 是:通过对若干选取的控制节点输入信号,使得整个网络能够可控并达到预期的状态。
[0060] 在现代控制理论中,系统可控性是反映输入对系统状态的控制能力的更为一般的 概念。给定一个线性定常控制系统:
[0062] 其中A = &)_和B = (b分别称为系统矩阵和输入矩阵(M彡N)。如果对 于任意给定的初态x(0) = X。和终态x f,都存在控制输入u和有限时刻T使得x(T) = xf, 那么就称系统(8)是可控的。可控性一个经典的充要判据是对应的可控性矩阵满秩,即有
[0064] 现在我们把系统(8)视为由N个节点组成的有向网络G的状态方程,其中NXN 矩阵A= {ai」i,je [1,N]}表示网络中节点的邻接关系,如果节点i能够接受到j的信 息,有a。〉0。向量x(t) =(x^t),x2(t),…,xN(t))T表示N个节点在时刻t的状态, NXM矩阵B= {bijli G [1,N],j G [1,M]}表示节点与外部控制信号的连接关系,u(t)= (ujt),u2(t),. . .,uM(t))TSM个输入节点在t时刻的状态,其中bij= 1表示信号节点i 上施加信号Uj(t)。
[0065] 一个网络中的最大匹配的求取可以用二分图的方式求解,将有向图G(A)转换为 二分图H(A):
分别表示状态 矩阵A的各列与各行的节点集合,r = {(Xi,Xj) |aij辛0}表示边集。根据二分图最大匹配 算法,可以求得网络中的匹配节点与非匹配节点,对于一个非匹配节点数不为0的网络,驱 动节点数极为非匹配节点数。控制一个网络G(A),只需将控制信号输入非匹配节点并且保 证控制信号可达任意匹配节点即可。
[0066] 图1以一个机器人网络为例描述了应用二分图匹配算法求取有向网络中驱动节 点的过程。考察图1(a)所示给定拓扑结构的有向网络,将网络转化为图1(b)所示二分图 结构,考察此二部图的最大匹配边,其最大匹配边集如图i(c)虚线所示,由图可知边:r- 5_,2+-r,3+- 7_,4+- 3_5+- 3_,6+- 5_,7+- 5_为最大匹配边集;节点 1、3、5、7 匹配节点数,2、 4、6为非匹配节点数,即如图1(d)中的所示,空心节点2、4、6即为驱动节点,对此三个节点 的控制就可以使整个网络可控。
[0067] 首先我们应用图1中所示的可控性理论确定网络中的领导者跟随者合集,可知: 2、4、6节点为领导者合集,1、3、5、7节点为跟随者合集。其拓扑结构可表示为图2所示形式, 我们在二维空间中考虑该网络的协调控制,即XiGR2,ViGR2,UiGR2,i= 1,2, . . .,n。 [0068] 领导者静态时的同步包容现象如图3所示,基于静态领导者的包含避碰控制问题 就是驱动m个跟随者机器人,使它们移动进入以n-m个领导者机器人所形成的凸包范围内, 且最终速度都趋向于零。同时,在整个运动的过程中,能够保持碰撞规避。
[0069] 由前面的叙述步骤,对于每一个跟随者机器人ieF,设计分布式控制协议如下:
[0071] 其中,1 > y >0,e>0,aij(t)是非负权值因子,表示邻接矩阵A= [aij]eRnxn 中第(i,j)个对应的项。考虑的领导者机器人是静态的,最终跟随者机器人的状态也会是 静态的,所以这里的Vi(t)最终会趋近于零。另外,定义如前面公式(4)所示下。
[0072] 对于控制律(9),
项是用于保证群体的碰撞规避性,另一项
是用于驱动跟随者位置能够不断趋近于领导者来实现最终的包 含行为,而0Vi(t)则表示机器人的速度随时间的耗散。
[0073] 图3是0- 50s内各节点的运动轨迹。从图3中可以看出所有跟随者最终都能够 进入到三角形中,即所有跟随者都最终收敛到领导者所组成的静态凸包中。由图2可知机 器人3受2、4、5机器人影响,其轨迹大约运动向2、
4、5机器人凸包中运动。机器人5受机器 人1、4、6、7影响,亦运动至机器人1、4、6、7凸包中。机器人1受机器人2影响、机器人7受 机器人3影响,并分别向2、3机器人运动,且由于势能函数的存在,运动过程中能够实现避 碰。图4为其位置误差曲线,由图4可知机器人运动6s后都收敛至领导者组成的凸包中。
[0074] 领导者动态时的同步包容现象如图5所示:动态的领导者包容避碰问题,先用可 控性理论确定领导者跟随者集合,然后驱动领导者以恒定的初始速度4 =4向可控的目 标状态运动,同时,为跟随者设置合适的控制协议,确保跟随者能够进入由领导者所形成的 凸包中,并且运动过程中实现避碰。考虑到并不是每个跟随者都能获得群体中领导者的速 度信息,跟随者机器人可以通过与周围邻居机器人的信息交互,使速度趋近于领导者的速 度,使最终运动状态能够达到一致。这样的情况下,对于动态领导者的网络拓扑结构,我们 为跟随者制定的控制策略中引入幂次估计器,来估计领导者机器人的速度,提出的幂次估 计器如下:
[0076] 其中:a> 〇;iGF,$表示第i个跟随者对期望速度的估计。
[0077] 由于领导者机器人拥有一致恒定的速度vd,不同领导者机器人的相对坐标保持不 变。对于跟随者机器人采用速度估计的方法进行"分布式"信息交互,我们给出网络动力学 模型(7)的控制律如下:
[0078] Vj(t) =vd(t),iGL,
[0080] 观察图5可知,在网络拓扑结构图2中,机器人7与领导者之间无直接联系,当领 导者运动时,其速度由幂次估计器得出。由图5和图6可知,机器人1和机器人7临近于距 离领导者所组成的凸包,且其位置在领导者运行的方向前方,故能够快速收敛到领导者组 成的凸包中,由图5可知,机器人1距离凸包距离比机器人7更近,故机器人1收敛速度最 快。只能体3由于本来就在领导者组成的凸包中,但其运动方向与凸包运动同方向,故也能 较快的收敛到凸包中平衡位置。机器人5由于在领导者后方同向于领导者运动故收敛最 慢。由图2和图5可知,机器人5受机器人3的吸引影响,机器人7受机器人3的吸引影响, 但由于势能函数的存在使得这三个机器人之间能够实现避碰。由图6可知机器人运动30s 后都收敛至领导者组成的凸包中。仿真图6给出了机器人运动过程中的位置误差示意。
[0081] 在本发明的构思基础上可以进行的各种替换、变化和修改,这些替换、变化和修改 不应排除在发明的保护范围之外。
【主权项】
1. 一种分布式的多机器人包含避碰控制方法,其特征在于,所述方法将多机器人网络 同图论相结合,并应用可控性理论及二分图最大匹配算法确定有向网络中的领导者跟随者 集合;领导者集合确定后,当领导者静止时,根据领导者机器人与跟随者机器人之间的作用 力关系及控制参数,引入势能函数实现避碰,设计出机器人领导者静态时的包含避碰控制 率;当领导者运动时,针对局部信息可知的情况,即部分跟随者对领导者速度不可知,为跟 随者设计幂次估计器实现对领导者的速度估计,进而根据移动机器人的运动特性和控制参 数,设计多个机器人领导者动态时的包含避碰控制率; 所述方法包括以下步骤: (1) 针对有向网络中各机器人之间的通信关系,应用可控性理论确定网络中的领导者 与跟随者集合; (2) 当领导者静态时,由领导者与邻居机器人之间的通信关系,设计跟随者机器人的位 置控制算子; (3) 在跟随者位置控制算子的基础上引入势能函数,确保跟随者机器人在运动过程中 互相之间能够实现避碰,形成领导者静态时的包含避碰控制率; (4) 当领导者动态时,由领导者与邻居机器人之间的通信关系,设计跟随者机器人的位 置控制算子; (5) 针对局部信息可知时,即网络拓扑中存在部分跟随者对领导者速度不可知的情况, 为跟随者机器人制定的控制策略中引入幂次估计器,来估计领导者机器人的速度,确定跟 随者机器人的速度控制算子; (6) 最后将机器人的位置控制算子和方向控制算子加权集成,并引入势能函数确保运 动过程中个体之间互相避碰,形成动态机器人的分布式包含避碰控制率。2. 根据权利要求1所述的一种分布式的多机器人包含避碰控制方法,其特征在于,所 述确定领导者与跟随者集合的方法为: (1) 应用图论的方法表示网络中机器人之间的通信关系,并将有向图G(A)转换为二分 图H⑷表示: 其中把多机器人系统视为由N个节点组成的有向网络G,NXN矩阵A = iaiJ|i,j e [1,N]}表示网络中节点的邻接关系,如果节点i能够接受到j的信息,有aiJ> 〇 ;转化后的二分图HU) = (d,r),其中分 别表示状态矩阵A的各列与各行的节点集合,Γ = {(Xi, Xj) Iaij辛0}表示边集; (2) 根据二分图最大匹配算法,求得网络中的匹配节点与非匹配节点集合,对于一个非 匹配节点数不为〇的网络,驱动节点数即为非匹配节点数; (3) 将机器人网络中的驱动节点视为领导者,其它节点为跟随者。3. 根据权利要求1所述的多机器人同步包含避碰控制方法,其特征在于,所述机器人 领导者静态时的包含避碰控制率的方法如下: (1)跟随者机器人的位置控制算子由跟随者机器人和其邻居机器人之间通信关系确 定; 跟随者的二阶动力学模型如下: 文/(,)= ^/(O = Uj{l), ? = I, 2,..., η 其中χ为机器人的位置量,ν为机器人的速度量,u为机器人的控制输入。针对任意有 η个机器人的有向拓扑结构网络,应用可控性理论确定出网络中的跟随者集合和领导者集 合,分别用F = Iv1, v2, . . .,vj和L = {vm+1, vm+2, . . .,νη}表示跟随者集合和领导者集合;其 位置控制算子表示为:其中au(t)是非负权值因子,表示邻接矩阵A = [au] e R胃中第(i,j)个对应的项; (2) 为跟随者机器人间引入势能函数,避免跟随者机器人运动过程中发生碰撞;势能 函数表示为: L=-s^tVij(XiiXj) V。· (Xi, Xj)定义如下:其中,d指的是在所有机器人的运动过程中所应该保持的最小安全距离,r是机器人能 感知势能函数的距离,kij= k 0, X u的定义如下:(3) 针对跟随者机器人设计速度自检测项,将位置控制算子和势能函数加权集成,形成 当领导者静态时的包含避碰控制率。4.根据权利要求1所述的多机器人同步包含避碰控制方法,其特征在于,所述多机器 人领导者动态时的包含避碰控制率的方法如下: (1) 跟随者机器人的位置控制算子由跟随者机器人和其邻居机器人之间通信关系确 定,其表达式为:其中au(t)是非负权值因子,表示邻接矩阵A = [au] e R胃中第(i,j)个对应的项; (2) 对动态领导者网络拓扑中可能存在部分跟随者对领导者速度不可知的情况,为跟 随者机器人制定的控制策略中引入幂次估计器,来估计领导者机器人的速度,确定跟随者 机器人的速度控制算子; 提出的幂次估计器表示为:其中α > 0, Sgn为符号函数i e F,表示第i个跟随者对期望速度的估计;vd表示 对领导者机器人的给定速度;其速度控制算子表示为:(3)最后将机器人的位置控制算子和方向控制算子加权集成,并引入势能函数确保运 动过程中个体之间互相避碰,形成动态机器人的分布式包含控制率。
【专利摘要】一种分布式的多机器人包含控制方法,包括以下步骤:(1)针对有向网络中各机器人之间的通信关系,确定网络中的领导者与跟随者集合;(2)当领导者静态时,设计跟随者机器人的位置控制算子;(3)引入势能函数,确保跟随者机器人在运动过程中互相之间能够实现避碰,形成领导者静态时的包含控制率;(4)当领导者动态时,设计跟随者机器人的位置控制算子;(5)为跟随者机器人制定的控制策略中引入幂次估计器,估计领导者机器人的速度,实现由局部可知到全局可知并确定跟随者机器人的速度控制算子;(6)将机器人的位置控制算子和方向控制算子加权集成,并引入势能函数确保运动过程中个体之间互相避碰,形成动态机器人的分布式包含控制率。
【IPC分类】G05D1/02
【公开号】CN104898663
【申请号】CN201510161320
【发明人】陈世明, 王培 , 柯予宸, 裴惠琴
【申请人】华东交通大学
【公开日】2015年9月9日
【申请日】2015年4月8日