基于关系图深度强化学习的机器人多目标包围问题新算法——中科院自动化所蒲志强教授团队

经典案例

客户中科院自动化所

场地大小

关键词中科院，关系图，深度强化学习，机器人，多目标包围问题

被捕捉物机器人

核心配置

在多机器人系统的研究领域中，包围控制是一个重要的课题。其在民用和军事领域都有广泛的应用场景，包括协同护航、捕获敌方目标、侦察监视、无人水面舰艇巡逻狩猎等。

这些应用的核心问题是如何控制一个多机器人系统，涉及多目标分配，同时解决目标包围和避碰子问题。这是一个巨大的挑战，特别是对于分散的多机器人系统。

中科院自动化所蒲志强教授团队在2022年ICRA大会发表论文，提出了一种基于关系图的深度强化学习方法，对各种条件下的多目标避碰包围(MECA)问题具有良好的适应性。

论文检索页面

定义任务

该研究定义了一个MECA任务，即在具有L个静态障碍物(黑色圆圈)的环境中，由N个机器人(绿色圆圈)组成的多机器人系统，协同包围K (1 < K < N)个静止或运动的目标(红色圆圈)。

所有机器人需要自动形成多组，包围所有目标，每组需要形成圆形队形，包围一个独立的目标，同时避免碰撞。这涉及到以下三个子问题：

1) 动态多目标分配与分组

2) 每组分别包围目标

3) 相互之间避免碰撞

分散式多机器人系统的MECA图解

方法框架

在MECA问题中，存在三种类型的实体，即机器人、目标和障碍物。不同的实体对机器人有不同的影响关系，例如避障、包围目标、与其他机器人合作等。

研究提出了一种基于机器人级和目标级关系图(RGs)的DRL分散方法，命名为MECA-DRL-RG方法。

具体而言：

1. 利用图注意网络(GATs)对机器人级RGs进行建模和学习，该RGs由每个机器人与其他机器人、目标和障碍物之间的三个异构关系图组成。

2. 利用GAT构建目标级RG，构建机器人与各目标之间的空间关系。目标的运动由目标级RG建模，并通过监督学习进行学习，以预测目标的轨迹。

3. 此外，定义了一个知识嵌入式复合奖励函数，解决MECA中的多目标问题。采用基于集中式训练和去中心化执行框架的演员-评论家训练算法对策略网络进行训练。

MECA-DRL-RG方法的整体结构

实验验证

研究团队分别进行了仿真实验和真实环境实验。在真实实验中，情景设置为：6个机器人在有2个障碍物的环境中包围2个移动的目标。机器人的位置和速度数据由NOKOV度量动作捕捉系统提供。

6个机器人在有2个障碍物的环境中包围2个移动目标

仿真实验和真实实验都验证了，相比于其他方法，MECA-DRL-RG方法使机器人能够从周围环境中，学习异构空间关系图，并预测目标的轨迹，从而促进每个机器人对其周围环境的理解和预测。证实了MECA-DRL-RG方法的有效性。

并且，无论机器人、障碍物或目标的数量增加，抑或是目标的移动速度加快，MECA-DRL-RG方法都表现出良好的性能，具有广泛的适应性。

MECA-DRL-RG方法训练曲线

参考文献：

T. Zhang, Z. Liu, Z. Pu and J. Yi, "Multi-Target Encirclement with Collision Avoidance via Deep Reinforcement Learning using Relational Graphs," 2022 International Conference on Robotics and Automation (ICRA), Philadelphia, PA, USA, 2022, pp. 8794-8800, doi: 10.1109/ICRA46639.2022.9812151.

动作捕捉系统用于丝驱动连续体机器人研究

四川大学

动作捕捉用于蛇运动分析及蛇形机器人开发

长春理工大学

基于深度相机的下肢外骨骼的自适应梯级步态生成方法

北京航空航天大学自动化科学与电气工程学院

基于示教学习的手术机器人缝合技能学习

重庆邮电大学

无人车实验室编队中的动作捕捉

燕山大学机械工程学院

柔性微创手术机器人性能实验验证

吉林大学机械与航天工程学院

动作捕捉系统验证OPT追踪井下无人机的性能

中国矿业大学计算机科学与技术学院

具有编码能力的可展开结构人造肌肉

汕头大学

（转自新华网）蓄势数载业初就 | 水下悬浮隧道项目一瞥

交通运输部天津水运工程科学研究院

无人机室内定位与自主建造

同济大学建筑系

边云协同电力自主巡检系统的研发

中国电力科学研究院

动作捕捉技术识别细小错位机械外骨骼适应性升级

哈尔滨工业大学-机器人技术与系统国家重点实验室

动作捕捉助力多足机器人各腿间的数据协调

上海交通大学

装配机器人（机械臂）组装技能学习

哈尔滨工业大学（深圳）

动捕技术助力研发太空机械臂航天设备有望实现“自愈”

北京航空航天大学

无人驾驶汽车定位追踪

中国汽车技术研究中心

应用虚拟现实技术的柔性上肢康复机器人

重庆理工大学

六旋翼无人机室内定位系统

西北工业大学

工业机器人动作捕捉与协作定位研究

东南大学自动化学院

水下仿生机器人：红外动捕系统用于机器海豚开发

深圳大学

白酒上甑工艺工业机器人系统研究

上海交通大学

动作捕捉技术助力行星漫游车的技术创新

上海交通大学

仿生机器人的运动规划

中原工学院

机械外骨骼中的恒力悬浮背包研究

哈尔滨工业大学

无人机协同“嗅出”数字信息素狼群算法提升地图构建精度

电子科技大学自动化工程学院

无人机编队与协同控制

电子科技大学

人车协同导航定位技术优化

哈尔滨工业大学

中科院自动化所多智能体协同控制平台编队与自主避障

中科院自动化所

动作捕捉系统用于绳索牵引康复机器人轨迹规划与验证

西安电子科技大学

动作捕捉系统用于悬臂式掘进机精准位姿测量

中国矿业大学

动作捕捉助力重庆理工大学采摘机器人项目研究

重庆理工大学

动作捕捉系统用于四足机器人开发

长沙高博会现场

光学动作捕捉用于锥束CT平台几何位置校正

浙江大学转化医学院

焊接机器人本体标定中动作捕捉的应用

四川大学电气工程学院

嫦娥五号回家！航天器交会对接研究中动作捕捉系统的应用

南京航空航天大学航天学院

双机械臂机器人定位与运动规划

上海大学机电工程与自动化学院

效率提升4倍，动作捕捉助力科技冬奥水立方变身冰立方

科技冬奥水立方冬-夏场景转换项目课题

精度亚毫米级！无人机编队定位技术解读

北京科技大学机械工程学院

多旋翼无人机室内定位与飞控算法测试平台

哈尔滨工业大学航空学院

蛇形机器人高空电缆巡检

中国矿业大学机电工程学院

动作捕捉系统用于苹果采摘机器人

西北农林科技大学

让机器学会“察颜观色”：人体行为识别

吉林广播电视大学

动作捕捉系统用于柔性机械臂的末端定位控制

四川大学电气工程学院

自动驾驶沙盘系统

天津卡达克

机器人性能测试系统

浙江谱麦科技

动作捕捉系统用于飞行机械臂目标检测与定位算法验证

南京航空航天大学

采摘机器人果实三维空间定位性能验证中动作捕捉系统的应用

重庆理工大学

无人机控制算法验证与空间定位数据收集

中国石油大学无人系统实验室

手势识别模型训练

哈工大深圳校区理学院

动作捕捉系统用于室内组合定位技术研究

哈尔滨工业大学

多指灵巧手设计

浙江工业大学机械学院

动作捕捉助力无人车多源传感器信息融合导航技术

哈尔滨工业大学

索并联机构中的理论验证

清华大学机械工程系

动作捕捉助力无源上肢外骨骼的基础协调性评估

四川大学

视觉位姿检测的精度验证

北京航空航天大学

绳驱动上肢外骨骼机器人开发

北京航空航天大学

动作捕捉系统用于机器人关节位移与几何参数标定

同济大学航空航天与力学学院

动作捕捉系统用于地下隧道移动机器人定位与建图

中国矿业大学机电工程学院

生机电一体化穿戴式机器人的研发

南方科技大学

四足仿生机器人的步态优化

山东大学控制学院

动作捕捉系统用于苹果采摘机器人拾取模式的研究

西北农林科技大学、北方民族大学、贵州中医药大学和萨肯·塞富林哈萨克农业技术大学组成的研究团队

多智能体协同控制室内空间定位试验平台的研发

北京理工大学

人机协同拆卸工作集成遮掩感知的手物姿态预估模型

香港理工大学

批量建筑装配机器人的“智慧眼”：动捕技术验证传感器的感知系统

同济大学建筑与城市规划学院

仿生机器鳄鱼：基于动作捕捉的仿生步态规划

中山大学

动作捕捉助力人机耦合模型及其在下肢外骨骼的设计

华南理工大学

动作捕捉系统助力非人类灵长类动物模型和系统的研究

海南大学生物医学工程学院

动捕技术助力基于映射规划框架的四旋翼飞行器自主导航研究

哈尔滨工业大学

动作捕捉用于差速驱动移动基座的可变形机器人轨迹优化研究

浙江大学

运动捕捉系统和人工神经网络ELM联合校准提升工业机器人的绝对精度

同济大学航空航天与力学学院

运动捕捉系统助力电力线巡检机器人的自主落线研究

中科院自动化所

动作捕捉系统助力无人机着陆结构设计

中国石油大学（华东）

动作捕捉系统助力基于机器视觉和倾角传感器的位姿检测系统研究及验证

西安电子科技大学机电工程学院

人体关节角度解算的动态对齐方法

重庆邮电大学生物信息学院

绳牵引并联机器人动态避障方法

哈尔滨工业大学（深圳）

多机器人编队集中式轨迹规划：基于概率推理的连续高斯过程

哈尔滨工业大学

多无人机在线路径规划的新算法

南京航空航天大学自动化学院