专利详情

标题基于自适应通信策略的未知环境多目标搜索方法及系统
[标]当前申请(专利权)人南开大学 | 中兵智能创新研究院有限公司
申请日2023年12月14日
申请号CN202311726971.X
公开(公告)日2024年6月14日
公开(公告)号CN117724487B
授权日-
法律状态/事件授权
专利类型授权发明
发明人张建磊 | 余雪玮 | 张春燕 | 王子珩 | 苏波 | 宋威龙
受理局中国
当前申请人(专利权)地址300071 天津市南开区卫津路94号 (天津,天津,南开区)
IPC分类号G05D1/43 | G05D1/246 | G05D1/633 | G05D1/644 | G05D1/648 | G05D109/10
国民经济行业分类号-
代理机构北京高沃律师事务所
代理人杜阳阳
被引用专利数量-
专利价值-

摘要

本发明公开一种基于自适应通信策略的未知环境多目标搜索方法及系统,涉及目标搜索技术领域,方法包括获取目标未知区域的位置坐标,并将其栅格化表示,形成多机器人系统的搜索环境模型。每个栅格被赋予信息数组,包括障碍物信息、覆盖信息、目标占据信息以及通信条件信息,机器人在搜索过程中实时更新搜索环境模型中对应栅格的信息数组,得到更新后的搜索环境模型。并基于自适应通信策略,控制所述多机器人系统,并选择进入相应的机器人目标搜索框架,完成多目标的覆盖搜索。本发明通过自适应通信策略,使多机器人系统能够高效地执行多目标搜索任务。

1.一种基于自适应通信策略的未知环境多目标搜索方法,其特征在于,包括:

获取目标未知区域的位置坐标;

根据所述位置坐标,将所述目标未知区域进行栅格化表示,得到多机器人系统的搜索环境模型;所述搜索环境模型中每一栅格被赋予一信息数组,所述信息数组包括障碍物信息、覆盖信息、目标占据信息以及通信条件信息;

根据设定位置关系,将所述多机器人系统中的各机器人放置在所述目标未知区域中,并基于自适应通信策略,控制所述多机器人系统对所述目标未知区域进行多目标搜索,得到当前时刻各所述机器人的多目标搜索结果;所述多目标搜索结果包括当前时刻所述机器人所在栅格处的第一障碍物信息、第一覆盖信息、第一目标占据信息以及第一通信条件信息;所述多机器人系统包括多个机器人以及机器人目标搜索框架;所述机器人目标搜索框架包括基于群体智能算法协同搜索的搜索框架和基于预测合作探索的搜索框架;

根据各个时刻每一所述机器人的多目标搜索结果,更新所述搜索环境模型中对应栅格的信息数组,得到更新后的搜索环境模型;

根据更新后的搜索环境模型,确定所述目标未知区域中的各个目标;

其中,所述自适应通信策略具体为:

若所述机器人所在栅格处的第一通信条件信息为通信质量优,则控制所述机器人根据相邻机器人的共享信息计算自身路径预测收益;所述收益包括环境覆盖率的增量、相邻两个时刻的转向角度以及自身路径方向上相邻机器人的数量;

当所述自身路径预测收益大于设定阈值时,控制所述机器人选择基于群体智能算法协同搜索的搜索框架,并对所述目标未知区域进行多目标搜索;

当所述自身路径预测收益小于或等于设定阈值时,控制所述机器人选择基于预测合作探索的搜索框架,协同相邻机器人对所述目标未知区域进行多目标搜索;

若所述机器人所在栅格处的第一通信条件信息为通信质量差,则控制所述机器人选择基于群体智能算法协同搜索的搜索框架,并对所述目标未知区域进行多目标搜索。

2.根据权利要求1所述的一种基于自适应通信策略的未知环境多目标搜索方法,其特征在于,在得到多机器人系统的搜索环境模型之后,还包括:

根据所述搜索环境模型中所述栅格的信息数组,分别构建障碍物信息地图、覆盖信息地图、目标占据信息地图以及通信条件信息地图。

3.根据权利要求2所述的一种基于自适应通信策略的未知环境多目标搜索方法,其特征在于,所述障碍物信息地图中障碍物信息的公式表达具体如下:



其中,αij(t)为t时刻的障碍物信息,D1c(t)表示t时刻存在障碍物的栅格集合,D1nc(t)表示t时刻的不存在障碍物的栅格集合。

4.根据权利要求2所述的一种基于自适应通信策略的未知环境多目标搜索方法,其特征在于,所述覆盖信息地图中覆盖信息的公式表达具体如下:



其中,βij(t)为t时刻的覆盖信息,D2c(t)表示t时刻被覆盖的栅格集合,D2nc(t)表示t时刻的没有被覆盖的栅格集合。

5.根据权利要求2所述的一种基于自适应通信策略的未知环境多目标搜索方法,其特征在于,所述目标占据信息地图中目标占据信息的公式表达具体如下:



其中,γij(t)为t时刻的目标占据信息,D3c(t)表示t时刻存在目标的栅格集合,D3nc(t)表示t时刻的不存在目标的栅格集合。

6.根据权利要求2所述的一种基于自适应通信策略的未知环境多目标搜索方法,其特征在于,所述通信条件信息地图中通信条件信息的公式表达具体如下:



其中,δij(t)为t时刻的通信条件信息,D4c(t)表示t时刻通信质量为差的栅格集合,D4nc(t)表示t时刻通信质量为优的栅格集合。

7.根据权利要求1所述的一种基于自适应通信策略的未知环境多目标搜索方法,其特征在于,在得到多机器人系统的搜索环境模型之后,还包括:

对所述搜索环境模型进行模型初始化,具体包括:

将所述搜索环境模型中每个栅格的障碍物信息设置为不存在障碍物;

将所述搜索环境模型中每个栅格的覆盖信息设置为没有被覆盖;

将所述搜索环境模型中每个栅格的目标占据信息设置为不存在目标;

将所述搜索环境模型中每个栅格的通信条件信息设置为通信质量优。

8.根据权利要求1所述的一种基于自适应通信策略的未知环境多目标搜索方法,其特征在于,根据所述位置坐标,将所述目标未知区域进行栅格化表示,具体包括:

根据所述位置坐标,得到区域边长为x×y的所述目标未知区域;

将所述目标未知区域划分为栅格边长为d的M×N个栅格;

其中,M=x/d,N=y/d。

9.一种基于自适应通信策略的未知环境多目标搜索系统,其特征在于,包括:

坐标获取模块,用于获取目标未知区域的位置坐标;

模型建立模块,用于根据所述位置坐标,将所述目标未知区域进行栅格化表示,得到多机器人系统的搜索环境模型;所述搜索环境模型中每一栅格被赋予一信息数组,所述信息数组包括障碍物信息、覆盖信息、目标占据信息以及通信条件信息;

区域搜索模块,用于根据设定位置关系,将所述多机器人系统中的各机器人放置在所述目标未知区域中,并基于自适应通信策略,控制所述多机器人系统对所述目标未知区域进行多目标搜索,得到当前时刻各所述机器人的多目标搜索结果;所述多目标搜索结果包括当前时刻所述机器人所在栅格处的第一障碍物信息、第一覆盖信息、第一目标占据信息以及第一通信条件信息;

其中,所述自适应通信策略具体为:

若所述机器人所在栅格处的第一通信条件信息为通信质量优,则控制所述机器人根据相邻机器人的共享信息计算自身路径预测收益;所述收益包括环境覆盖率的增量、相邻两个时刻的转向角度以及自身路径方向上相邻机器人的数量;

当所述自身路径预测收益大于设定阈值时,控制所述机器人选择基于群体智能算法协同搜索的搜索框架,并对所述目标未知区域进行多目标搜索;

当所述自身路径预测收益小于或等于设定阈值时,控制所述机器人选择基于预测合作探索的搜索框架,协同相邻机器人对所述目标未知区域进行多目标搜索;

若所述机器人所在栅格处的第一通信条件信息为通信质量差,则控制所述机器人选择基于群体智能算法协同搜索的搜索框架,并对所述目标未知区域进行多目标搜索;

更新模块,用于根据各个时刻每一所述机器人的多目标搜索结果,更新所述搜索环境模型中对应栅格的信息数组,得到更新后的搜索环境模型;

目标确定模块,用于根据更新后的搜索环境模型,确定所述目标未知区域中的各个目标。

技术领域

[0001]本发明涉及目标搜索技术领域,特别是涉及一种基于自适应通信策略的未知环境多目标搜索方法及系统。

背景技术

[0002]多个机器人通过协调与合作能够克服单个机器人智能性有限的瓶颈,从而提高系统的鲁棒性、可扩展性与灵活性,这一点已经引起了科研界和工程界的广泛关注。目标搜索技术作为多机器人系统领域的基础而重要的研究课题之一,其目标在于实现多个机器人对目标进行尽可能快速的搜索或定位。在进行目标搜索过程中,根据搜索环境的复杂性,可以将其分为简单环境与受限环境两种。当前大部分研究仅仅设置了没有任何障碍的搜索环境空间,即空白空间。

[0003]然而,实际应用场景中通信环境的复杂多变性也是一个不可忽视的因素。其中存在的干扰、远距离、遮挡、天气、故障等因素影响了通信网络,导致通信条件呈现出“受限”与“时变”的特点。这种情况下,很难保障机器人间通信数据的实时性、完整性与正确性,从而导致搜索效率降低,甚至可能出现无法完成既定任务的情况。

发明内容

[0004]本发明的目的是提供一种基于自适应通信策略的未知环境多目标搜索方法及系统,可灵活适应不同的通信条件,提高多目标搜索的搜索效率。

[0005]为实现上述目的,本发明提供了如下方案:

[0006]第一方面,本发明提供了一种基于自适应通信策略的未知环境多目标搜索方法,包括:

[0007]获取目标未知区域的位置坐标;

[0008]根据所述位置坐标,将所述目标未知区域进行栅格化表示,得到多机器人系统的搜索环境模型;所述搜索环境模型中每一栅格被赋予一信息数组,所述信息数组包括障碍物信息、覆盖信息、目标占据信息以及通信条件信息;

[0009]根据设定位置关系,将所述多机器人系统中的各机器人放置在所述目标未知区域中,并基于自适应通信策略,控制所述多机器人系统对所述目标未知区域进行多目标搜索,得到当前时刻各所述机器人的多目标搜索结果;所述多目标搜索结果包括当前时刻所述机器人所在栅格处的第一障碍物信息、第一覆盖信息、第一目标占据信息以及第一通信条件信息;

[0010]根据各个时刻每一所述机器人的多目标搜索结果,更新所述搜索环境模型中对应栅格的信息数组,得到更新后的搜索环境模型;

[0011]根据更新后的搜索环境模型,确定所述目标未知区域中的各个目标。

[0012]可选的,所述自适应通信策略具体为:

[0013]若所述机器人所在栅格处的第一通信条件信息为通信质量优,则控制所述机器人根据相邻机器人的共享信息计算自身路径预测收益;所述收益包括环境覆盖率的增量、相邻两个时刻的转向角度以及自身路径方向上相邻机器人的数量;

[0014]当所述自身路径预测收益大于设定阈值时,控制所述机器人选择基于群体智能算法协同搜索的搜索框架,并对所述目标未知区域进行多目标搜索;

[0015]当所述自身路径预测收益小于或等于设定阈值时,控制所述机器人选择基于预测合作探索的搜索框架,协同相邻机器人对所述目标未知区域进行多目标搜索;

[0016]若所述机器人所在栅格处的第一通信条件信息为通信质量差,则控制所述机器人选择基于群体智能算法协同搜索的搜索框架,并对所述目标未知区域进行多目标搜索。

[0017]可选的,在得到多机器人系统的搜索环境模型之后,还包括:

[0018]根据所述搜索环境模型中所述栅格的信息数组,分别构建障碍物信息地图、覆盖信息地图、目标占据信息地图以及通信条件信息地图。

[0019]可选的,所述障碍物信息地图中障碍物信息的公式表达具体如下:

[0020]

[0021]其中,θij(t)为t时刻的障碍物信息,D1c(t)表示t时刻存在障碍物的栅格集合,D1nc(t)表示t时刻的不存在障碍物的栅格集合。

[0022]可选的,所述覆盖信息地图中覆盖信息的公式表达具体如下:

[0023]

[0024]其中,βij(t)为t时刻的覆盖信息,D2c(t)表示t时刻被覆盖的栅格集合,D2nc(t)表示t时刻的没有被覆盖的栅格集合。

[0025]可选的,所述目标占据信息地图中目标占据信息的公式表达具体如下:

[0026]

[0027]其中,γij(t)为t时刻的目标占据信息,D3c(t)表示t时刻存在目标的栅格集合,D3nc(t)表示t时刻的不存在目标的栅格集合。

[0028]可选的,所述通信条件信息地图中通信条件信息的公式表达具体如下:

[0029]

[0030]其中,δij(t)为t时刻的通信条件信息,D4c(t)表示t时刻通信质量为差的栅格集合,D4nc(t)表示t时刻通信质量为优的栅格集合。

[0031]可选的,在得到多机器人系统的搜索环境模型之后,还包括:

[0032]对所述搜索环境模型进行模型初始化,具体包括:

[0033]将所述搜索环境模型中每个栅格的障碍物信息设置为不存在障碍物;

[0034]将所述搜索环境模型中每个栅格的覆盖信息设置为没有被覆盖;

[0035]将所述搜索环境模型中每个栅格的目标占据信息设置为不存在目标;

[0036]将所述搜索环境模型中每个栅格的通信条件信息设置为通信质量优。

[0037]可选的,根据所述位置坐标,将所述目标未知区域进行栅格化表示,具体包括:

[0038]根据所述位置坐标,得到区域边长为x×y的所述目标未知区域;

[0039]将所述目标未知区域划分为栅格边长为d的M×N个栅格;

[0040]其中,M=x/d,N=y/d。

[0041]第二方面,本发明提供了一种基于自适应通信策略的未知环境多目标搜索系统,包括:

[0042]坐标获取模块,用于获取目标未知区域的位置坐标;

[0043]模型建立模块,用于根据所述位置坐标,将所述目标未知区域进行栅格化表示,得到多机器人系统的搜索环境模型;所述搜索环境模型中每一栅格被赋予一信息数组,所述信息数组包括障碍物信息、覆盖信息、目标占据信息以及通信条件信息;

[0044]区域搜索模块,用于根据设定位置关系,将所述多机器人系统中的各机器人放置在所述目标未知区域中,并基于自适应通信策略,控制所述多机器人系统对所述目标未知区域进行多目标搜索,得到当前时刻各所述机器人的多目标搜索结果;所述多目标搜索结果包括当前时刻所述机器人所在栅格处的第一障碍物信息、第一覆盖信息、第一目标占据信息以及第一通信条件信息;

[0045]更新模块,用于根据各个时刻每一所述机器人的多目标搜索结果,更新所述搜索环境模型中对应栅格的信息数组,得到更新后的搜索环境模型;

[0046]目标确定模块,用于根据更新后的搜索环境模型,确定所述目标未知区域中的各个目标。

[0047]根据本发明提供的具体实施例,本发明公开了以下技术效果:

[0048]本发明提供了一种基于自适应通信策略的未知环境多目标搜索方法及系统,方法包括:首先获取目标未知区域的位置坐标,并将其栅格化表示,形成多机器人系统的搜索环境模型。每个栅格被赋予信息数组,包括障碍物信息、覆盖信息、目标占据信息以及通信条件信息。多机器人根据设定位置关系放置在目标未知区域中,基于自适应通信策略进行多目标搜索,得到各机器人的多目标搜索结果。这些结果包括障碍物信息、覆盖信息、目标占据信息和通信条件信息。通过更新搜索环境模型中对应栅格的信息数组,考虑各机器人的多目标搜索结果,得到更新后的搜索环境模型。最终,根据更新后的搜索环境模型确定目标未知区域中的各个目标。本发明通过自适应通信策略,使多机器人系统能够在未知环境中灵活适应不同的通信条件,降低了多机器人目标搜索所耗费的时间,提高了多目标搜索的搜索效率。

附图说明

[0049]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

[0050]图1为本发明实施例一提供的基于自适应通信策略的未知环境多目标搜索方法流程图;

[0051]图2为本发明实施例一提供的基于通信自适应的分层分布式模型预测控制(ACC-HDMPC)框架示意图;

[0052]图3为本发明实施例一提供的搜索环境模型示意图;

[0053]图4为本发明实施例一提供的仿真环境设置示意图;其中,图4(a)为第一仿真环境设置示意图,图4(b)为第二仿真环境设置示意图,图4(c)为第三仿真环境设置示意图;

[0054]图5为本发明实施例一提供的基于HDMPC与ACC-HDMPC方法的搜索任务完成迭代次数对比图;

[0055]图6为本发明实施例一提供的基于HDMPC与ACC-HDMPC方法的搜索耗时对比图;

[0056]图7为本发明实施例一提供的基于HDMPC与ACC-HDMPC方法的任务成功率对比图;

[0057]图8为本发明实施例二提供的基于自适应通信策略的未知环境多目标搜索系统结构图。

具体实施方式

[0058]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

[0059]本发明的目的是提供一种基于自适应通信策略的未知环境多目标搜索方法及系统,可灵活适应不同的通信条件,提高多目标搜索的搜索效率。

[0060]为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

[0061]实施例一

[0062]如图1所示,本实施例提供了一种基于自适应通信策略的未知环境多目标搜索方法,包括:

[0063]步骤101:获取目标未知区域的位置坐标。

[0064]步骤102:根据所述位置坐标,将所述目标未知区域进行栅格化表示,得到多机器人系统的搜索环境模型;所述搜索环境模型中每一栅格被赋予一信息数组,所述信息数组包括障碍物信息、覆盖信息、目标占据信息以及通信条件信息。

[0065]步骤103:根据设定位置关系,将所述多机器人系统中的各机器人放置在所述目标未知区域中,并基于自适应通信策略,控制所述多机器人系统对所述目标未知区域进行多目标搜索,得到当前时刻各所述机器人的多目标搜索结果;所述多目标搜索结果包括当前时刻所述机器人所在栅格处的第一障碍物信息、第一覆盖信息、第一目标占据信息以及第一通信条件信息。

[0066]步骤104:根据各个时刻每一所述机器人的多目标搜索结果,更新所述搜索环境模型中对应栅格的信息数组,得到更新后的搜索环境模型。

[0067]步骤105:根据更新后的搜索环境模型,确定所述目标未知区域中的各个目标。

[0068]其中,在执行步骤102时,如图3所示,根据目标未知区域的位置坐标,构建的多机器人系统的搜索环境模型可以为矩形区域C,其边长为x×y。将区域C栅格化为边长为d的M×N个栅格,设机器人t时刻的真实坐标为Pr(xr(t),yr(t)),栅格坐标为Pg(xg(t),yg(t))。

[0069]具体的,M=X/d,N=Y/d;坐标转换公式为:xg(t)=xr(t)/d,yg(t)=yr(t)/d。

[0070]例如机器人t时刻的真实坐标为(5,5),若栅格的边长为1,根据坐标转化公式,此时机器人所在栅格为(5,5)。

[0071]其中,搜索环境模型中每一栅格被赋予一信息数组,信息数组包括障碍物信息、覆盖信息、目标占据信息以及通信条件信息。

[0072]具体的,每个栅格被赋值一个信息数组[αij(t),βij(t),γij(t),δij(t)],数组中分别表示t时刻该栅格的障碍物信息αij(t)、覆盖信息βij(t)、目标占据信息γij(t)以及通信条件信息δij(t)。

[0073]在本实施例所提供的一种可选实施方式中,在执行步骤102之后,还包括:

[0074]根据所述搜索环境模型中所述栅格的信息数组,分别构建障碍物信息地图、覆盖信息地图、目标占据信息地图以及通信条件信息地图这四张栅格环境地图。

[0075]具体的,上述四张栅格环境地图,分别为:障碍物信息地图C1(t)[αij(t)]M×N、覆盖信息地图C2(t)[βij(t)]M×N、目标占据信息地图C3(t)[γij(t)]M×N、通信条件信息地图C4(t)[δij(t)]M×N。

[0076]其中,所述障碍物信息地图中障碍物信息的公式表达具体如下:

[0077]

[0078]式中,αij(t)为t时刻的障碍物信息,D1c(t)表示t时刻存在障碍物的栅格集合,D1nc(t)表示t时刻的不存在障碍物的栅格集合。

[0079]其中,所述覆盖信息地图中覆盖信息的公式表达具体如下:

[0080]

[0081]式中,βij(t)为t时刻的覆盖信息,D2c(t)表示t时刻被覆盖的栅格集合,D2nc(t)表示t时刻的没有被覆盖的栅格集合。

[0082]其中,所述目标占据信息地图中目标占据信息的公式表达具体如下:

[0083]

[0084]式中,γij(t)为t时刻的目标占据信息,D3c(t)表示t时刻存在目标的栅格集合,D3nc(t)表示t时刻的不存在目标的栅格集合。

[0085]其中,所述通信条件信息地图中通信条件信息的公式表达具体如下:

[0086]

[0087]式中,δij(t)为t时刻的通信条件信息,D1c(t)表示t时刻通信质量为差的栅格集合,D1nc(t)表示t时刻通信质量为优的栅格集合。

[0088]在本实施例所提供的一种可选实施方式中,在执行步骤102之后,还包括对所述搜索环境模型进行模型初始化,由于环境未知,因此初始时将每个栅格赋值αij(t)=0、βij(t)=0、γij(t)=0,δij(t)=0。

[0089]具体包括:将所述搜索环境模型中每个栅格的障碍物信息设置为不存在障碍物。将所述搜索环境模型中每个栅格的覆盖信息设置为没有被覆盖。将所述搜索环境模型中每个栅格的目标占据信息设置为不存在目标。将所述搜索环境模型中每个栅格的通信条件信息设置为通信质量优。

[0090]其中,在执行步骤103时,具体包括:

[0091]将所述多机器人系统中的各机器人根据设定位置关系放置在所述目标未知区域中,基于自适应通信策略,所述多机器人系统对所述目标未知区域进行多目标搜索,得到当前时刻各所述机器人的多目标搜索结果。

[0092]具体的,将机器人与搜索目标简化为二维空间中的质点,机器人运动方程如下所示:

[0093]

[0094]如图3所示,每个机器人在[0,2π]范围内可沿均匀分布的A1~A8八个方向移动与探测,机器人与其他机器人的通信距离为dcom,探测范围为图示半径为dtec的圆形区域,记该圆形区域的外切正方形区域为Dtec,将Dtec栅格化为L×L个栅格。则矩阵Cd=[θij]L×L可以表示机器人的L阶探测矩阵,θij表示位于(i,j)的栅格是否在机器人的探测范围内。其中:

[0095]

[0096]Dtec∪Dntec=Dtec。

[0097]

[0098]搜索目标随机分布在搜索空间中,其能在距离机器人距离为dobj时被发现,将其占据情况与机器人探测范围做同样的栅格化处理。对于机器人Ri,取其环境覆盖矩阵的L阶子矩阵利用Hadamard积求取更新后的L阶覆盖子矩阵

[0099]

[0100]利用替换中的对应位置矩阵即可获得更新后的环境覆盖矩阵。也就可以分的βij(t)覆盖,机器人能够探测到的范围,即做了栅格化处理的,未探测到的就还未进行栅格化处理的。

[0101]其中,多机器人系统在进行多目标搜索过程中还进行栅格地图更新,具体可以如下:

[0102]机器人在行进过程中将持续更新障碍物地图与通信条件地图C4(t)[δij(t)]M×N。设t时刻时机器人Ri的位置为从本地读取到当前通信条件为取值如下:

[0103]

[0104]感知到的障碍物位置为则根据坐标转换公式(2),得到Ri对应的栅格位置与感知到的障碍物对应栅格位置令即可获得更新后的障碍物地图与通信条件地图。

[0105]其中,所述自适应通信策略具体为:

[0106]若所述机器人所在栅格处的第一通信条件信息为通信质量优,则控制所述机器人根据相邻机器人的共享信息计算自身路径预测收益;所述收益包括环境覆盖率的增量、相邻两个时刻的转向角度以及自身路径方向上相邻机器人的数量。

[0107]当所述自身路径预测收益大于设定阈值时,控制所述机器人选择基于群体智能算法协同搜索的搜索框架,并对所述目标未知区域进行多目标搜索。

[0108]当所述自身路径预测收益小于或等于设定阈值时,控制所述机器人选择基于预测合作探索的搜索框架,协同相邻机器人对所述目标未知区域进行多目标搜索。

[0109]若所述机器人所在栅格处的第一通信条件信息为通信质量差,则控制所述机器人选择基于群体智能算法协同搜索的搜索框架,并对所述目标未知区域进行多目标搜索。

[0110]具体的,由于邻居的通信状态在通信条件未知的情况下是难以确定的,本方法设计机器人从本地获得自身的通信状态条件。如图2所示,机器人首先基于自身维护的通信地图D4c(t)获得当前所在栅格位置的通信质量情况,如果通信情况良好,机器人则保持向邻居共享信息,同时通过通信网络综合邻居机器人共享的环境覆盖信息地图C2(t)[βij(t)]M×N、目标占据信息地C3(t)[γij(t)]M×N,以及其预测路径JE(t)计算个人当前基于底层搜索算法的路径预测收益,收益函数包括一次迭代周期中环境覆盖率的增量、相邻两个时刻的转向角度以及搜索方向上相邻机器人的数量三个方面,如果计算保持当前搜索方法能够获得覆盖收益,则不需要进行更大范围的区域路径预测,否则选择合作伙伴并在比原本搜索范围更大尺度的区域协同进行路径预测,以探索更有效的搜索区域。

[0111]当机器人判断自身处于恶劣通信条件时,如果保持基于与其他伙伴的信息交互与协同合作,有可能带来反作用,因此设计如下策略:首先此时机器人不再与周围邻居进行信息交互;同时,关闭信息收发的通道,也不再计算个人预测路径收益函数;最后,如果机器人在底层群体智能方法搜索层,将保持当前策略,不会进入区域预测层,如果机器人已经在区域预测层,将回退至底层群体智能方法搜索层。直到机器人再次查询到所处的地图栅格通信条件为良好时,机器人才有可能再次进入区域路径预测层。这种策略有利于多机器人系统充分利用良好通信条件的优势,规避恶劣通信条件带来的不利影响。为证明本方法的有效性与适应性,设置底层的搜索算法为当前四类主流的群体智能搜索方法,分别是A-RPSO、ALGSA、IGES与PFSMS。

[0112]本实施例中,针对自适应通信策略,提供了一种分级自适应通信策略伪代码,具体可以如下表格内容所示:

[0113]表1分级自适应通信策略伪代码

[0114]

[0115]

[0116]

[0117]

[0118]为了验证本实施例提供的多目标搜索方法的有效性,本实施例进行了对比验证试验,仿真环境为i7-9750H,主频2.60GHz,16GB内存,使用MATLAB R2017b为仿真工具。如图4所示,实验构造了不同的通信、障碍物与目标分布的三类地图。在通信限制条件设置上,每种地图中通信良好与恶劣条件各占均为50%,恶劣通信条件将模拟通信中断或干扰情况,使机器人收到的邻居环境覆盖信息地图C2(t)[βij(t)]M×N、目标占据信息地C3(t)[γij(t)]M×N、预测路径JE(t)有50%的概率被随机取反或者遗失。在障碍物的设置上,设置了封闭区域与类似墙体的开放区域。

[0119]其中实验参数设置如下表2所示:

[0120]表2实验参数设置

[0121]

[0122]

[0123]根据图4(a)、图4(b)和图4(c)上述的三类地图,基于HDMPC与ACC-DMPC框架的搜索方法进行对照实验,在两种框架下均分别结合A-RPSO、ALGSA、IGES、PFSMS四种群体智能方法,面向10、15、25三种规模的多机器人系统,各开展50次重复实验,最后统计均值进行对比分析,具体实验设置如表1所示,实验统计数据如表3所示。其中,图5-图6对比了基于两种方法的搜索任务完成迭代次数与耗时,图7对ACC-HDMC较HDMPC方法的在迭代次数与耗时方面的性能提升进行了展示。

[0124]表3实验统计数据记录

[0125]

[0126]

[0127]

[0128]

[0129]

[0130]

[0131]在迭代次数上,以ARPSO算法为例,基于本方法,其在Map1环境下,在多机器人规模为15时,在50次重复实验中,搜索平均迭代次数为576.98次,在相同条件下基于HDMPC的方法迭代次数为771.24次,本方法迭代次数有显著下降,平均性能提升了25.19%,而迭代次数的多少侧面体现了通信成本的大小,这说明本方法能够有效减少多机器人系统搜索所需要的通信资源。

[0132]在搜索用时上,以PFSMS算法为例,基于本方法,其在Map3环境下,在多机器人规模为25时,在50次重复实验中,平均耗时为268.48秒,在相同条件下基于HDMPC的方法耗时为396.05秒,本方法搜索耗时有显著下降,平均性能提升了32.21%,这说明本方法能够有效减少机器人系统搜索所需要的时间。

[0133]综合来看,基于不同的群体智能方法,在不同的通信、障碍物、目标分布、机器人规模的对比实验中,提出的基于ACC-HDMPC框架与分级通信策略的搜索方法比基于HDMPC的搜索方法在恶劣通信条件下性能有明显提升,主要体现在任务完成迭代次数与耗时显著降低。

[0134]综上所述,本实施例提出的基于自适应通信策略的未知环境下多机器人系统多目标搜索方法能够灵活适应未知环境不同通信条件,在通信条件、障碍物分布、目标分布均不同的3个地图中分别基于A-RPSO、ALGSA、IGES、PFSMS四种群体智能方法进行对比试验,实验结果表明本方法在通信成本与搜索时间上较HDMPC方法性能有显著提升。

[0135]实施例二

[0136]为了执行上述实施例一对应的方法,以实现相应的功能和技术效果,下面提供一种基于自适应通信策略的未知环境多目标搜索系统。

[0137]如图8所示,本实施例提供了一种基于自适应通信策略的未知环境多目标搜索系统,包括:

[0138]坐标获取模块801,用于获取目标未知区域的位置坐标。

[0139]模型建立模块802,用于根据所述位置坐标,将所述目标未知区域进行栅格化表示,得到多机器人系统的搜索环境模型;所述搜索环境模型中每一栅格被赋予一信息数组,所述信息数组包括障碍物信息、覆盖信息、目标占据信息以及通信条件信息。

[0140]区域搜索模块803,用于根据设定位置关系,将所述多机器人系统中的各机器人放置在所述目标未知区域中,并基于自适应通信策略,控制所述多机器人系统对所述目标未知区域进行多目标搜索,得到当前时刻各所述机器人的多目标搜索结果;所述多目标搜索结果包括当前时刻所述机器人所在栅格处的第一障碍物信息、第一覆盖信息、第一目标占据信息以及第一通信条件信息。

[0141]更新模块804,用于根据各个时刻每一所述机器人的多目标搜索结果,更新所述搜索环境模型中对应栅格的信息数组,得到更新后的搜索环境模型。

[0142]目标确定模块805,用于根据更新后的搜索环境模型,确定所述目标未知区域中的各个目标。

[0143]本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

[0144]本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。