基于模糊推理系统的多机器人角度控制围捕方法

xiaoxiao2021-3-1  175

基于模糊推理系统的多机器人角度控制围捕方法
【技术领域】:
[0001] 本发明涉及了一种在动态环境下基于角度控制的多机器人围捕策略,具体为一种 基于模糊推理系统的多机器人角度控制围捕方法。
【背景技术】:
[0002] 由于多机器人系统具有空间上的分布性、功能上的多样性、执行任务时的并行性、 较强的容错能力和更低的经济成本等单机器人无法比拟的优越性,使得多机器人系统近年 来成为人们广泛关注的热点。多机器人系统研究的主要问题包括群体结构、任务分配、通信 方式、协作学习等。为了使得研究更具有在实际场景中的意义,研究者们集中对一些多机器 人任务进行研究,包括编队协作、搜索、围捕等。其中,多机器人协作围捕是一个非常典型的 问题,它涉及到多机器人领域中的多个方面,包括多机器人体系结构、通信方式、协作控制、 任务分配等技术,拓展后在军事以及工业领域有着较为广泛的的应用。
[0003] 文献[1]探讨了以势场栅格法为基础的协作围捕策略,引入"虚拟范围"减少了路 径规划次数。文献[2]模拟免疫系统中B细胞的抗体间的相互作用,提出了机器人行为决策 围捕算法,使得追捕机器人形成有效包围圈,实现多机器人围捕。文献[3]提出了基于多机 器人学习的围捕方式,取得了一定的效果。文献[4]分析了成功围捕目标机器人的临界条 件,并设计了多机器人的伏击围捕方案,取得了良好的效果。文献[5]提出了一种基于动态 预测目标轨迹尾部点的多机器人围捕算法,通过多项式拟合对机器人进行预测并实现围 捕。文献[6]通过L型,R型,Μ型模糊控制器的设计实现多机器人围捕,通过实验验证了可行 性。文献[7]提出了队形、包抄、捕捉策略,结合状态转换保证了任务实现。文献[8-10]采用 尝试模拟和利用生物免疫系统及动物捕食过程,探讨并实现了多机器人任务。
[0004] 参考文献:
[0005] [1]SUGAR T G,KUMAR V.Control of cooperating mobile manipulators[J] .IEEE Transactions on Robotics and Automation.2002.18(1):94-103;
[0006] [2]谭永丽,方彦军.基于人工免疫系统的多机器人追捕问题[J].武汉大学学报, 2014,47(1):105-109。
[0007] [3]Liu Jie,Liu Shuhua,ffu Hongyan,et al.A pursuit evasion algorithm based on hierarchical reinforcement 1earning[C]//International Conference on Measuring Technology and Mechatronics Automation. Zhangjiajie: IEEE,2009:482-486;
[0008] [4]付勇,汪浩杰.一种多机器人围捕策略[J].华中科技大学学报(自然科学版), 2008,36(2):26-29;
[0009] [5]胡俊,朱庆保.基于动态预测轨迹和围捕点的多机器人围捕算法[J].电子学 报,2011,39(11 ):2480-2485;
[0010] [6]袁瑷焦继乐曹志强等.基于模糊控制协调策略的多自主机器人围捕[J].华中 科技大学学报(自然科学版),2011,39(2) :328-331;
[0011] [7]CA0 Zhi-qiang,Zhang Bin,Wang Shuo,et al.Cooperative hunting of multiple mobile robots in an unknown environment[J].Acta Automatica Sinica, 2003,29(4):536-543;
[0012] [8]Khan,Muhammad T,De Silva,Clarence ff.Autonomous and robust multirobot cooperation using an artificial immune system[J]. International Journal of Robotics and Automation,2012,27(1):60_75;
[0013] [9]Gao Yunyuan,ffei Wei.Multi-robot autonomous cooperation intergrated with immune based dynamic task allocation[C]//Proceedings of the sixth international conference on intelligent systems design and applications, ISDA2006,2:586-591;
[0014] [10]C.Muro,R.Escobedo,L.Spector,R.P.Coppinger.ffolf-pack(Canis lupus) hunting strategies emerge from simple rules in computational simulations!!J] .Behavioural Processes.2011(3)〇
[0015] 但以上研究工作没有充分考虑到多机器人围捕策略中的以下相关问题:首先,由 于过于简化多机器人问题使得策略的实际有效性不能保证。其次,机器人在仿真环境中,对 移动机器人的运动方式限制过多,且未考虑机器人的运动学约束,没有体现移动机器人在 环境中的实际运行状态,难以验证算法在实际情况中的可行性。再者,没有给出多机器人围 捕的整体围捕流程,无法覆盖多机器人围捕任务中的各种复杂情况。最后,逃跑者由于感知 以及运动方式上的不足使得逃跑者较为容易的实现围捕。

【发明内容】

[0016]发明目的:
[0017] 本发明提供一种基于模糊推理系统的多机器人角度控制围捕方法,其目的是解决 以往所存在的问题。
[0018] 技术方案:
[0019] 基于模糊推理系统的多机器人角度控制围捕方法,其特征在于:该方法采用两层 模糊推理来实现多机器人围捕策略;第一层模糊推理系统为决策层,用于对围捕任务状态 进行识别,选择对应的多机器人策略;当围捕者处于搜索状态时,决策层模糊推理的输出 Search,围捕者执行搜索策略;当围捕者处于接近状态时,决策层输出Approach,即接近策 略;当围捕者处于围捕状态时,决策层输出Surround,围捕者进行围捕策略。
[0020] 决策层模糊规则的设计以3个围捕者与目标的距离Lle作为输入;通过隶属度函数 进行模糊化:隶属度函数将精确的输入值转化为对应的模糊集以及相应的隶属度;L le的模 糊集为距离区间上的{S,M,L};再对规则库中的规则进行匹配;第i条规则心如下:
[0021 ] R/. ij L^.is 為狐1 L... is 凡 cuid A is St.
[0022] 其中Lle表示第i号机器人距离逃跑者e的距离,4为第i条规则的第n个输入的模糊 集;Si为规则的输出,表示决策选择的策略;
[0023] 根据每条规则的前件,利用梯形隶属度函数计算在对应模糊集上0~1的隶属度;3 个输入变量经过隶属度函数模糊化得到的隶属度为以 1(342(3^3(3,再对规则进行匹配,得到模 糊规则的隶属度为输入变量隶属度中的最小值;
[0024]最后将各条规则的输出按照模糊规则隶属度进行叠加,得到输出;输出的策略包 括搜索策略,接近策略,围捕策略。
[0025] 搜索策略:
[0026]当决策层模糊推理的输出为Search,围捕者执行搜索策略,具体实现采用随机搜 索方式进行搜索;每个机器人拥有多组备选的左右轮速,其中包含了直行、左转、右转行为; 机器人每次随机选取其中一组左右轮速来运动;
[0027]接近策略:
[0028] 当决策层输出Approach时,围捕者整体执行接近策略,即围捕者对逃跑者进行接 近;采用模糊推理系统实现对目标的接近;
[0029] 对于该模糊推理系统,以被围捕者的预测点为接近目标,围捕者当前的朝向与目 标之间的偏角α作为输入,输出为一组左右轮速值;
[0030] 输入通过隶属度函数模糊化,夹角的模糊集为在-180°到180°上的{匪,NS,0,PS, ΡΜ};模糊化后,根据规则库进行推理,得到最终的输出;规则如下:
[0031] If a is NM then Output is LRT
[0032] 当偏角α较大时(匪),输出LRT,即机器人向右侧大幅度转向的一组左右轮速,并逐 渐朝向目标;随着偏角的减小,机器人将通过直行迅速接近目标;
[0033] 模糊规则库中的每条规则的输出均为一组左右轮速;在得到模糊推理系统的输出 的一组左右轮速后,需要根据机器人当前的运动信息计算出单位时间后的坐标;在实际环 境中,机器人的运动方式不是单纯的质点,而是符合运动学约束的运动方式,机器人的运动 不存在突变;因此,该坐标的计算需要符合轮式机器人的运动学约束;
[0034] 为了在仿真程序中更好的体现机器人的运动,所有机器人的运动基于以下5组左 右轮速形成;
[0035]为了保证多机器人围捕算法的可行性,需要考虑机器人运动学约束,这样可以真 实模拟实际情况,更好的验证多机器人围捕算法;轮式机器人的线速度及角速度由左右轮 谏Vr·, VI计筧得到
[0038] 根据线速度及角速度,可以计算出单位之间t内机器人在X,Y方向上的运动距离
[0039] dx = R · (1-cos ω t) (3)
[0040] dy = R · sin ω t(4)
[0041] 其中R为机器人运动旋转的极径,由机器人线速度及角速度计算得到
\ · r " / /
[0043]公式(5)中的d为轮式机器人的轮 子直径。
[0046]最后可以根据机器人当前位姿(^。,0。)计算得到运行单位时间〖后的机器人位 姿(Xn,yn,0n),其中x,y,0分别表示机器人当前的横坐标、纵坐标以及当前朝向角,下标C表 示当前时刻,η表示单位时间t后的时刻。
[0047] 基于角度控制的多机器人围捕策略:
[0048] 通过控制围捕者间角度,优先对角度线接近形成包围圈的围捕策略;首先根据首 次采集到的逃跑者的运动信息,对逃跑者进行动态预测,再以逃跑者预测运动方向为标准, 基于围捕者数量,均匀建立多条角度线;角度线建立后就与逃跑者位置绑定,不再与逃跑者 运动方向相关,从而避免逃跑者的连续转动导致角度线的大幅度摆动,同时也降低了多机 器人对于角度线频繁地重新分配而导致无法形成有效包围的可能;
[0049]然后,围捕者优先对最近的角度线进行接近,以此保证围捕态势的形成与保持;随 着围捕者依次均抵达角度线之后,包围态势逐渐形成;
[0050] 最后,各个围捕者在保持角度线上的同时,调整位姿不断接近逃跑者,缩小包围 圈,实现最终围捕。
[0051] 围捕者当前位置到逃跑者预测位置的连线,与逃跑者预测位置建立的角度线的夹 角Θ的绝对值较大时,说明围捕者未形成围捕态势,则通过对Θ控制来实现优先对角度线进 行接近;当Θ趋近于0时,说明围捕者已到达角度线,围捕态势大体形成,通过调整围捕者的 运动方向,在接近的同时要保持Θ趋近于0,以保证围捕态势的保持,从而实现包围圈的收 缩。
[0052] 对逃跑者的预测是根据逃跑者当前的位姿信息,预测一定步数后的位置;步数的 计算由公式得出:
[0053] Ν=μ · max(Lie,L2e,L3e)(9)
[0054] 其中Lle表示3围捕者与逃跑者间的距离;当围捕者整体距离目标较远时,预测步数 较大,μ根据实际环境试验得出;随着机器人整体的接近,包围圈逐渐缩小,预测步数逐渐降 低至逃跑者实际位置。
[0055] 模糊推理系统实现角度控制围捕策略:
[0056] 由于每个机器人的策略是一致的,即对优先抵达角度线再进行保持接近,因此每 个机器人都由一套模糊推理系统完成,这样可以减少由于多机器人系统输入量过多导致模 糊推理系统的规则库过于庞大;模糊推理系统的输入为:逃跑者与围捕者运动方向的夹角 α,以及围捕者到逃跑者的连线与角度线的夹角β,根据逃跑者的预测位姿,建立角度线(虚 线);围捕者位置与角度线的夹角为α,通过调整α角度控制围捕态势的形成,围捕者运动方 向与逃跑者运动方向的夹角为β,表现出在动态环境下的对围捕者以及逃跑者运动信息的 考虑;
[0057] 以α和β为模糊推理系统的输入;输入变量通过梯形隶属度函数进行模糊化;α角度 的模糊集为由-30°到+30°上的{Ν,ΖΕ,Ρ},β角度的模糊集为由0°到180°上的{S,M. L. Τ};根 据第i条规则心所示,当α为模糊集4、β为4时,规则输入一组直行的左右轮速;
[0058] Ri: If a is Λ\ and β is /1? then Output is STR
[0059] 当α较大时,根据当前围捕者与逃跑者间的运动信息,对其方向进行优先调整,使 其对角度线进行接近;当围捕者抵达角度线附近,再调整机器人的运动,使其在保持该相对 角度位置的情况下对围捕者进行接近。
[0060] 对于整个围捕成功的判定,通过围捕者距离逃跑者的距离,逃跑者之间距离以及 逃跑者距离围捕者形成的集合中心位置来判断。
[0061] 优点及效果:
[0062] 本发明提供一种基于模糊推理系统的多机器人角度控制围捕方法。本文给出了多 机器人围捕的整体实现流程,并通过模糊推理系统对多机器人围捕任务建立了分层模型。 其中围捕机器人与逃跑机器人的运动符合车体运动学约束,并同时为逃跑者设计了较好的 逃跑策略。最后,通过仿真程序验证算法的可行性。其在充分考虑轮式机器人的运动学约束 前提下,围捕机器人根据逃跑者位置信息对其运动趋势进行预测,通过角度控制优先形成 围捕态势,采用模糊推理系统实现多机器人围捕控制,实现包围圈的形成及最终收缩包围。 最后通过实验验证研究方法的有效性,结果表明该算法能有效的实现多机器人围捕。
【附图说明】
[0063] 图1为初始围捕环境图;
[0064] 图2为.围捕成功图;
[0065]图3为.围捕任务整体流程图;
[0066]图4为围捕区域图;
[0067]图5为距离隶属度函数图;
[0068]图6为机器人对目标点接近图;
[0069]图7为轮式机器人运动行为图;
[0070] 图8为.角度控制围捕策略示意图;
[0071] 图9为模糊推理系统输入图;
[0072]图10为基于虚拟目标点的人工势场图;
[0073]图11为.围捕成功判定图;
[0074]图12为初始环境图;
[0075]图13为随机搜索图;
[0076]图14为接近策略图;
[0077]图15为围捕策略图;
[0078]图16为最终围捕图;
[0079] 图17为.其他初始状态围捕策略效果,其中a为.实验一初始;b为实验一最终围捕; c为实验二初始图;d为实验二最终围捕图;
[0080] 图18为逃跑者与几何中心距离图;
[00811图19为围捕者间距离图;
[0082]图20为围捕者距离逃跑者距离图。
【具体实施方式】:
[0083] 首先结合附图对本发明做进一步的说明:
[0084] 本发明提供一种基于模糊推理系统的多机器人角度控制围捕方法,多机器人围捕 任务描述:
[0085] 针对具体多机器人围捕认任务,给出以下描述:在一个连续有限的区域中,存在多 个围捕机器人(方形)和一个的逃跑机器人(圆形)(如图1所示),它们随机分布在环境中。机 器人周围的深色区域为模拟的各个机器人的感知范围。围捕者之间能够共享信息。为了保 证公平,逃跑者和围捕者的最大移动速度与感知范围是相同的。因此当围捕者发现逃跑者 的同时,逃跑者发现围捕者,且单个围捕者无法实现对目标的抓捕。
[0086] 当逃跑者出现在任意围捕者的感知范围中时,则认为发现逃跑者,发现者将通知 其他队友已发现目标,多机器人开始协作进行围捕,逃跑者开始进行逃跑策略。其中,发现 者通过记录目标的运动信息(位置,速度,方向等),对目标下一步可能移动到的位置进行预 测,并通知其他机器人对该预测区域进行围捕。
[0087] 在整个的运动过程中保证避开障碍物并且机器人之间不发生碰撞。如图2所示,考 虑逃跑者与围捕者间距离以及围捕者彼此间距离,当以上距离均缩小到一定程度后,逃跑 者由于围捕者的合围导致无法移动或向各个方向移动都无法脱离包围圈时,此时认为围捕 成功。
[0088]多机器人围捕过程:
[0089] 为了全面考虑多机器人围捕任务中可能遇到的复杂情况,在这里提出完整的多机 器人围捕流程,如图3所示。
[0090] (1)初始环境:多个围捕者分散在环境中,通过随机搜索策略对单个逃跑者进行搜 索。
[0091 ] (2)发现围捕者:当有围捕者发现逃跑者后,发现者根据目标并采集目标运动信 息,并广播发现目标这一信息,围捕者整体开始进行围捕。
[0092] (3)接近:当围捕者整体距离逃跑者较远时,围捕者优先对逃跑者进行接近策略, 以避免过早进行围捕导致围捕时间过长,效率降低。
[0093] (4)围捕:当围捕者整体距离目标较近时,围捕者根据围捕策略对逃跑者进行围 捕,直至围捕成功。
[0094] (5)目标丢失:在整个围捕过程中,由于环境与任务的复杂性,导致围捕者可能会 丢失逃跑者目标。当丢失目标时,根据最后一次发现目标的位置,对目标可能存在的区域进 行搜索
[0095]多机器人围捕策略:
[0096]本文通过模糊推理系统来实现多机器人围捕策略。模糊推理系统是一个基于规则 的智能控制器,主要用来解决带有模糊现象的复杂推理问题。由于人们希望机器人具有人 类的智能,而模糊推理系统又正好符合人类的思维习惯,不需要建立精确的数学模型,通过 语言变量代替数学变量,易于将人类的思考策略实现在控制方面。因此模糊推理系统适用 于对复杂环境进行控制,并且广泛应用于移动机器人运动控制。
[0097]为了保证整个围捕任务的有效完成,需要保证围捕者在适当的时机进行为围捕, 而不是一味的进行包围收缩。过早的进行围捕将导致围捕成功率降低。
[0098]如图4所示,中心点为逃跑者。以逃跑者为中心,建立半径分别为LjPL2的感知区域 与围捕区域。整个围捕任务划分为三种状态。
[0099] (1)搜索状态:当所有围捕者都在感知区域以外时,围捕者未发现逃跑者,围捕者 整体处于对逃跑者的搜索状态。
[0100] (2)接近状态:当有围捕者抵达感知区域,则认为逃跑者与围捕者发现彼此,此时 关注其他围捕者所在区域:当围捕者都在围捕区域以外的位置时,说明围捕者整体距离目 标较远,围捕者应对逃跑者进行接近。
[0101] (3)围捕状态:随着接近策略的执行,当有半数以上的围捕者处于围捕区域内或感 知区域内时,围捕者整体将对目标进行围捕。
[0102] 决策层模糊推理系统:
[0103] 为了避免因为机器人数量的增加导致模糊规则库中的规则数量过大,在这里采用 两层模糊推理来实现多机器人围捕策略。第一层模糊推理系统为决策层,用于对上文中的 围捕任务状态进行识别,选择对应的多机器人策略。
[0104] 当围捕者处于搜索状态时,决策层模糊推理的输出Search,围捕者执行搜索策略; 当围捕者处于接近状态时,决策层输出Approach,即接近策略;当围捕者处于围捕状态时, 决策层输出Surround,围捕者进行围捕策略。
[0105] 决策层模糊规则的设计以3个围捕者与目标的距离Lle作为输入。通过图5所示隶属 度函数进行模糊化:
[0106] 隶属度函数将精确的输入值转化为对应的模糊集以及相应的隶属度。Lie的模糊集 为距离区间上的{S,M,L}。再对规则库中的规则进行匹配。第i条规贝如下:
[0108] 其中Lle表示第i号机器人距离逃跑者e的距离,4为第i条规则的第η个输入的模 糊集。Si为规则的输出,表示决策选择的策略。
[0109] 根据每条规则的前件,利用梯形隶属度函数计算在对应模糊集上0~1的隶属度。3 个输入变量经过隶属度函数模糊化得到的隶属度为以 1(342(3^3(3,再对规则进行匹配,得到模 糊规则的隶属度为输入变量隶属度中的最小值。
[0110] 最后将各条规则的输出按照模糊规则隶属度进行叠加,得到输出。输出的策略包 括搜索策略,接近策略,围捕策略。
[cm]策略层模糊推理系统:
[0112] 搜索策略:
[0113] 当决策层模糊推理的输出为Search,围捕者执行搜索策略,具体实现采用随机搜 索方式进行搜索。每个机器人拥有多组备选的左右轮速,其中包含了直行、左转、右转等行 为。机器人每次随机选取其中一组左右轮速来运动。
[0114]接近策略:
[0115] 当决策层输出Approach时,围捕者整体执行接近策略,即围捕者对逃跑者进行接 近。采用模糊推理系统实现对目标的接近。
[0116] 对于该模糊推理系统,以被围捕者的预测点为接近目标,围捕者当前的朝向与目 标之间的偏角α作为输入,输出为一组左右轮速值。如图6所示,以下方圆点为目标点,机器 人朝向与目标点的夹角作为模糊推理系统的输入。
[0117]输入通过隶属度函数模糊化,夹角的模糊集为在-180°到180°上的{匪,NS,0,PS, PM}。模糊化后,根据规则库进行推理,得到最终的输出。示例规则如下:
[0118] Ifais NM then Output is LRT
[0119] 当偏角a较大时(匪),输出LRT,即机器人向右侧大幅度转向的一组左右轮速,并逐 渐朝向目标。随着偏角的减小,机器人将通过直行迅速接近目标。
[0120] 模糊规则库中的每条规则的输出均为一组左右轮速。在得到模糊推理系统的输出 的一组左右轮速后,需要根据机器人当前的运动信息计算出单位时间后的坐标。在实际环 境中,机器人的运动方式不是单纯的质点,而是符合运动学约束的运动方式,机器人的运动 不存在突变。因此,该坐标的计算需要符合轮式机器人的运动学约束。
[0121] 为了在仿真程序中更好的体现机器人的运动,所有机器人的运动基于以下5组左 右轮速形成。
[0122] 如图7所示,其中每个箭头代表一组左右轮速,通过左右轮速的差值来体现机器人 的转向方向和幅度。模糊推理系统的输出的左右轮速,都是基于以上5组轮速的线性叠加。
[0123] 为了保证多机器人围捕算法的可行性,需要考虑机器人运动学约束,这样可以真 实模拟实际情况,更好的验证多机器人围捕算法。轮式机器人的线速度及角速度由左右轮 速v r,VI计算得到
[0126] 根据线速度及角速度,可以计算出单位之间t内机器人在X,Y方向上的运动距离
[0127] dx = R · (1-cos ω t) (3)
[0128] dy = R · sin ω t(4)
[0129] 其中R为机器人运动旋转的极径,由机器人线速度及角速度计算得到
[0131]公式(5)中的d为轮式机器人的轮子直径。
[0134] 最后可以根据机器人当前位姿(^。,0。)计算得到运行单位时间〖后的机器人位 姿(xn,yn,9 n)〇
[0135] 基于角度控制的多机器人围捕策略:
[0136] 考虑到围捕者与逃跑者的最高速度一致,为了避免过度接近逃跑者而导致所有围 捕者在逃跑者的一侧从而无法形成包围圈,提出了通过控制围捕者间角度,优先对角度线 接近形成包围圈的围捕策略。首先根据首次采集到的逃跑者的运动信息,对逃跑者进行动 态预测,再以逃跑者预测运动方向为标准,基于围捕者数量,均匀建立多条角度线。角度线 建立后就与逃跑者位置绑定,不再与逃跑者运动方向相关,从而避免逃跑者的连续转动导 致角度线的大幅度摆动,同时也降低了多机器人对于角度线频繁地重新分配而导致无法形 成有效包围的可能。然后,围捕者优先对最近的角度线进行接近,以此保证围捕态势的形成 与保持。随着围捕者依次均抵达角度线之后,包围态势逐渐形成。最后,各个围捕者在保持 角度线上的同时,调整位姿不断接近逃跑者,缩小包围圈,实现最终围捕。
[0137] 图8为三个围捕者对角度线进行接近的示意图。其中中心点逃跑者的预测位置,Θ 为围捕者当前位置到逃跑者预测位置连线与最接近的角度线的夹角。当Θ的绝对值较大时, 说明围捕者未形成围捕态势,则通过对Θ控制来实现优先对角度线进行接近;当Θ趋近于〇 时,说明围捕者已到达角度线,围捕态势大体形成,通过调整围捕者的运动方向,在接近的 同时要保持θ趋近于0,以保证围捕态势的保持,从而实现包围圈的收缩。
[0138]对逃跑者的预测是根据逃跑者当前的位姿信息,预测一定步数后的位置。步数的 计算由公式得出:
[0140] 其中Lle表示3围捕者与逃跑者间的距离。当围捕者整体距离目标较远时,预测步数 较大,μ根据实际环境试验得出。随着机器人整体的接近,包围圈逐渐缩小,预测步数逐渐降 低至逃跑者实际位置。
[0141] 模糊推理系统实现角度控制围捕策略:
[0142] 由于每个机器人的策略是一致的,即对优先抵达角度线再进行保持接近,因此每 个机器人都由一套模糊推理系统完成,这样可以减少由于多机器人系统输入量过多导致模 糊推理系统的规则库过于庞大。模糊推理系统的输入如图9所示。根据逃跑者的预测位姿, 建立角度线(虚线)。〇为围捕者位置与角度线的夹角,通过调整α角度控制围捕态势的形成, β为围捕者运动方向与逃跑者运动方向的夹角,表现出在动态环境下的对围捕者以及逃跑 者运动信息的考虑。
[0143] 以α和β为模糊推理系统的输入。输入变量通过梯形隶属度函数进行模糊化。α角度 的模糊集为由-30°到+30°上的{Ν,ΖΕ,Ρ},β角度的模糊集为由0°到180°上的{S,M. L. Τ},模 糊规则根据实际实验进行制定。如第i条规则心所示,当α为模糊集次、β为4时,规则输入 一组直行的左右轮速。
[0145]当α较大时,根据当前围捕者与逃跑者间的运动信息,对其方向进行优先调整,使 其对角度线进行接近;当围捕者抵达角度线附近,再调整机器人的运动,使其在保持该相对 角度位置的情况下对围捕者进行接近。
[0146]根据该模糊推理系统,可以保证围捕者在考虑逃跑者运动状态的情况下,均匀的 分布在逃跑者周围。在包围圈形成的过程中,小幅度的对逃跑者接近;在包围圈形成之后, 大幅度的进行收缩包围。
[0147] 逃跑者策略:
[0148] 为了保证围捕算法的有效性,逃跑者也需要一定的智能策略来应对围捕策略。在 这里采用人工势场作为逃跑者的智能策略。当逃跑者检测到围捕者后,将围捕者视为障碍 物,受到障碍物的斥力进行远离,逃跑方向为斥力的合力方向,速度为逃跑者的最高速度。
[0149] 如图10所示,中心的逃跑者受到2个围捕者的综合围捕。通过人工势场的斥力计 算,逃跑者的逃跑方向为向右箭头方向。由于传统人工势场并没有考虑到轮式机器人的运 动学约束,所以在这里引入模糊推理系统实现逃跑者的运动控制。在逃跑方向上的最大步 长上建立一个虚拟目标点,将逃跑者的运动转化为对虚拟目标点的接近,再通过前文提到 基于模糊推理系统的接近策略来执行。
[0150] 围捕成功条件:
[0151] 对于整个围捕成功的判定,通过围捕者距离逃跑者的距离,逃跑者之间距离以及 逃跑者距离围捕者形成的集合中心位置来判断。
[0152]图11中,空心圆表示围捕者,中心深色大圆表示逃跑者,小圆表示围捕者形成的几 何中心位置。第i个围捕者与第j个围捕者之间的距离记作S^,围捕者形成的几何中心与逃 跑者的距离记作C。当以上距离各小于一定阈值(ε 8,ε?,ε。)时,认为围捕成功,具体阈值的设 定由机器人运行速度及实际环境进行设定。通过这3组距离的判定可以保证围捕者的包围 圈的有效性。
[0156] 上述公式中,Xi,yi并表示第i号机器人的坐标,Xe,ye表示逃跑者坐标。
[0157] 实验结果及分析:
[0158] 本算法通过仿真来模拟实际的多机器人围捕。为了使仿真更具有真实性,采集实 体机器人与实际环境的相关数据,包括机器人尺寸、机器人轮子直径、机器人最高轮速、最 高安全速度以及有效感知范围,按照一定比例缩减,体现在仿真程序中。围捕成功阈值根据 实际情况进行设定.
[0159]图12为多机器人围捕开始阶段,3个红色围捕者对蓝色的逃跑者进行追捕。彼此未 发现对方。逃跑者根据第4节的决策层进行策略选择,执行随机搜索策略。
[0160]如图13,根据搜索策略,围捕者在仿真环境中进行随机搜索。
[0161]如图14所示,当有围捕者进入中间逃跑者的感知范围,且其他机器人处于围捕范 围外时,决策层选择接近策略。在接近过程中,围捕者对逃跑者运动信息进行采集并预测, 图中逃跑者前方的白色方块为预测位置,围捕者整体接近预测位置。由于接近的策略的运 行,保证了围捕者整体的运动方向朝向逃跑者,有利于接下来围捕策略的进行。
[0162] 当接近策略运行一段时间后,围捕者整体距离逃跑者较近,决策层选择围捕策略。 如图15,围捕者整体对预测位置建立角度线并进行包围。各个围捕者对其各自角度线接近。
[0163] 通过一段时间的运行,围捕者最终实现了对逃跑者的围捕,如图16。随着不断对角 度线的接近,围捕态势大体形成,最终围捕者收缩包围圈完成最终围捕,逃跑者被围捕者均 匀的包围在几何中心中无法移动,围捕成功。在整个过程中,可以看到任意机器人的运动轨 迹均是连续变化的。机器人通过左右轮差速来调整运动,符合轮式机器人的运动学约束 。
[0164] 针对多机器人围捕策略,为了验证研究方法的有效性和适用性,我们在不同的环 境进行围捕实验。图17为在围捕者与逃跑者彼此发现的初始条件下,本围捕算法都能有效 的实现最终的围捕。
[0165] 为了分析围捕过程的有效性,需要考虑多方面因素。在本实验中,主要关注围捕态 势的保持与包围收缩的效果。如图11,主要通过3方面的参数评价围捕效果ImSihC。综合 考虑整个围捕过程中上述三方面数据变化来评价围捕策略。
[0166]图18,19,20中不同的线分别表示三次不同围捕实验,相关评价参数的变化情况。 横坐标为运动步数,纵坐标为归一化后的距离信息。可以看到,在整个围捕过程中,由于初 始位置不同,几个评价参数的初始值并不相同,但是围捕者间距离以及围捕者与逃跑者间 的距离随着运行步数的增加稳定减少,体现了整个围捕过程中围捕态势的维持以及收缩。 逃跑者与围捕者几何中心的距离存在小幅度波动,主要原因在于逃跑者感知到围捕者后进 行了不可预测的逃跑,但随着围捕的进行,最终将抵达一个较低的数值。
[0167] 综上所述:
[0168] 本文研究了多机器人围捕任务,通过对任务的分析设计里详细的围捕任务整体流 程,并通过两层模糊推理系统完成围捕任务。第一层通过部分环境数据进行决策,选择搜 索、接近或围捕策略。第二层通过模糊推理系统分别实现了接近与基于角度控制的多机器 人围捕策略。使用仿真程序进行实验,仿真程序的环境依照实际环境中的参数按照比例缩 减,机器人的运动均符合运动学模型约束。在不同初始条件下进行多次仿真实验,验证了算 法的可行性,取得了较好的效果。
【主权项】
1. 基于模糊推理系统的多机器人角度控制围捕方法,其特征在于:该方法采用两层模 糊推理来实现多机器人围捕策略;第一层模糊推理系统为决策层,用于对围捕任务状态进 行识别,选择对应的多机器人策略;当围捕者处于搜索状态时,决策层模糊推理的输出 Search,围捕者执行搜索策略;当围捕者处于接近状态时,决策层输出Approach,即接近策 略;当围捕者处于围捕状态时,决策层输出Surround,围捕者进行围捕策略; 决策层模糊规则的设计以3个围捕者与目标的距离Lle3作为输入;通过隶属度函数进行 模糊化:隶属度函数将精确的输入值转化为对应的模糊集以及相应的隶属度;Lle3的模糊集 为距离区间上的{S,M,L};再对规则库中的规则进行匹配;第i条规则R 1如下: Ri: If Lie island L2e island L3e is^then Output is Si 其中Lle表示第i号机器人距离逃跑者e的距离,4为第i条规则的第n个输入的模糊集;S1 为规则的输出,表示决策选择的策略; 根据每条规则的前件,利用梯形隶属度函数计算在对应模糊集上〇~1的隶属度;3个输 入变量经过隶属度函数模糊化得到的隶属度为%,邮,收,再对规则进行匹配,得到模糊规 则的隶属度为输入变量隶属度中的最小值; 最后将各条规则的输出按照模糊规则隶属度进行叠加,得到输出;输出的策略包括搜 索策略,接近策略,围捕策略。2. 根据权利要求1所述的基于模糊推理系统的多机器人角度控制围捕方法,其特征在 于:搜索策略: 当决策层模糊推理的输出为Search,围捕者执行搜索策略,具体实现采用随机搜索方 式进行搜索;每个机器人拥有多组备选的左右轮速,其中包含了直行、左转、右转行为;机器 人每次随机选取其中一组左右轮速来运动; 接近策略: 当决策层输出Approach时,围捕者整体执行接近策略,即围捕者对逃跑者进行接近;采 用模糊推理系统实现对目标的接近; 对于该模糊推理系统,以被围捕者的预测点为接近目标,围捕者当前的朝向与目标之 间的偏角α作为输入,输出为一组左右轮速值; 输入通过隶属度函数模糊化,夹角的模糊集为在-180°到180°上的{NM,NS,0,PS,PM}; 模糊化后,根据规则库进行推理,得到最终的输出;规则如下: If a is NM then Output is LRT 当偏角α较大时(匪),输出LRT,即机器人向右侧大幅度转向的一组左右轮速,并逐渐朝 向目标;随着偏角的减小,机器人将通过直行迅速接近目标; 模糊规则库中的每条规则的输出均为一组左右轮速;在得到模糊推理系统的输出的一 组左右轮速后,需要根据机器人当前的运动信息计算出单位时间后的坐标;在实际环境中, 机器人的运动方式不是单纯的质点,而是符合运动学约束的运动方式,机器人的运动不存 在突变;因此,该坐标的计算需要符合轮式机器人的运动学约束; 为了在仿真程序中更好的体现机器人的运动,所有机器人的运动基于以下5组左右轮 速形成; 为了保证多机器人围捕算法的可行性,需要考虑机器人运动学约束,这样可以真实模 拟实际情况,更好的验证多机器人围捕算法;轮式机器人的线速度及角速度由左右轮速vr, Vi计算得到根据线速度及角速度,可以计算出单位之间t内机器人在X,Y方向上的运动距离 dx = R ·( Ι-cos ω t) (3) dy = R · sin ω t (4) 其中R为机器人运动旋转的极径,由机器人线速度及角速度计算得到公式(5)中的d为轮式机器人的轮子直径; xn = Xc+dy cos ω t+dx sin ω t (6) yn = yc-dy sin ω t+dx cos ω t (7)θη= 0C+ ω t (8) 最后可以根据机器人当前位姿(^。,9。)计算得到运行单位时间t后的机器人位姿(χη, yn,0n),其中X,y,0分别表示机器人当前的横坐标、纵坐标以及当前朝向角,下标c表示当前 时刻,η表示单位时间t后的时刻。3. 根据权利要求1所述的基于模糊推理系统的多机器人角度控制围捕方法,其特征在 于:基于角度控制的多机器人围捕策略: 通过控制围捕者间角度,优先对角度线接近形成包围圈的围捕策略;首先根据首次采 集到的逃跑者的运动信息,对逃跑者进行动态预测,再以逃跑者预测运动方向为标准,基于 围捕者数量,均匀建立多条角度线;角度线建立后就与逃跑者位置绑定,不再与逃跑者运动 方向相关,从而避免逃跑者的连续转动导致角度线的大幅度摆动,同时也降低了多机器人 对于角度线频繁地重新分配而导致无法形成有效包围的可能; 然后,围捕者优先对最近的角度线进行接近,以此保证围捕态势的形成与保持;随着围 捕者依次均抵达角度线之后,包围态势逐渐形成; 最后,各个围捕者在保持角度线上的同时,调整位姿不断接近逃跑者,缩小包围圈,实 现最终围捕。4. 根据权利要求3所述的基于模糊推理系统的多机器人角度控制围捕方法,其特征在 于:围捕者当前位置到逃跑者预测位置的连线,与逃跑者预测位置建立的角度线的夹角Θ的 绝对值较大时,说明围捕者未形成围捕态势,则通过对Θ控制来实现优先对角度线进行接 近;当Θ趋近于0时,说明围捕者已到达角度线,围捕态势大体形成,通过调整围捕者的运动 方向,在接近的同时要保持Θ趋近于〇,以保证围捕态势的保持,从而实现包围圈的收缩。5. 根据权利要求4所述的基于模糊推理系统的多机器人角度控制围捕方法,其特征在 于: 对逃跑者的预测是根据逃跑者当前的位姿信息,预测一定步数后的位置;步数的计算 由公式得出: Ν=μ · max(Lie,L2e,L3e) (9) 其中Lie表示3围捕者与逃跑者间的距离;当围捕者整体距离目标较远时,预测步数较 大,μ根据实际环境试验得出;随着机器人整体的接近,包围圈逐渐缩小,预测步数逐渐降低 至逃跑者实际位置。6. 根据权利要求3所述的基于模糊推理系统的多机器人角度控制围捕方法,其特征在 于:模糊推理系统实现角度控制围捕策略: 由于每个机器人的策略是一致的,即对优先抵达角度线再进行保持接近,因此每个机 器人都由一套模糊推理系统完成,这样可以减少由于多机器人系统输入量过多导致模糊推 理系统的规则库过于庞大;模糊推理系统的输入为:逃跑者与围捕者运动方向的夹角α,以 及围捕者到逃跑者的连线与角度线的夹角β,根据逃跑者的预测位姿,建立角度线(虚线); 围捕者位置与角度线的夹角为α,通过调整α角度控制围捕态势的形成,围捕者运动方向与 逃跑者运动方向的夹角为β,表现出在动态环境下的对围捕者以及逃跑者运动信息的考虑; 以α和β为模糊推理系统的输入;输入变量通过梯形隶属度函数进行模糊化;α角度的模 糊集为由-30°到+30°上的^,,?},0角度的模糊集为由〇°到18〇°上的{5,丄.1'};根据第1 条规则R1所示,当α为模糊集、β为4时,规则输入一组直行的左右轮速; Ri: If a is/ljand β is^then Output is STR 当α较大时,根据当前围捕者与逃跑者间的运动信息,对其方向进行优先调整,使其对 角度线进行接近;当围捕者抵达角度线附近,再调整机器人的运动,使其在保持该相对角度 位置的情况下对围捕者进行接近。7. 根据权利要求1所述的基于模糊推理系统的多机器人角度控制围捕方法,其特征在 于:对于整个围捕成功的判定,通过围捕者距离逃跑者的距离,逃跑者之间距离以及逃跑者 距离围捕者形成的集合中心位置来判断。
【专利摘要】基于模糊推理系统的多机器人角度控制围捕方法,该方法采用两层模糊推理来实现多机器人围捕策略;第一层模糊推理系统为决策层,用于对围捕任务状态进行识别,选择对应的多机器人策略;当围捕者处于搜索状态时,决策层模糊推理的输出<i>Search</i>,围捕者执行搜索策略;当围捕者处于接近状态时,决策层输出<i>Approach</i>,即接近策略;当围捕者处于围捕状态时,决策层输出<i>Surround</i>,围捕者进行围捕策略。使用仿真程序进行实验,仿真程序的环境依照实际环境中的参数按照比例缩减,机器人的运动均符合运动学模型约束。在不同初始条件下进行多次仿真实验,验证了算法的可行性,取得了较好的效果。
【IPC分类】G05D1/02
【公开号】CN105487544
【申请号】CN201610032491
【发明人】段勇, 黄骁
【申请人】沈阳工业大学
【公开日】2016年4月13日
【申请日】2016年1月18日

最新回复(0)