辽宁工程技术大学学报(自然科学版)

2007, No.136(06) 915-918

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于强化学习的多机器人编队导航
Multi-robots formation and navigation based reinforcement learning

赵杰;姜健;臧希喆;

摘要(Abstract):

针对多机器人系统在未知环境编队导航过程中遇到较长障碍物时,顺时针绕障和逆时针绕障的不同选择会给导航效率带来很大影响的问题,提出了一种三层强化学习方法。由高层的基于"条件-行为对"的在线学习适应环境障碍物的动态变化,中层采用角色交叉包含式控制结构保持队形,底层采用离线式常规强化学习机制获得避碰规则。仿真实验结果表明,由于只在高层保持在线学习,使学习空间得以缩小,学习时间得以缩短。该方法为复杂环境下的多机器人编队导航提供了一种有效的自主学习策略。

关键词(KeyWords): 多机器人系统;强化学习;编队导航;角色

Abstract:

Keywords:

基金项目(Foundation): 教育部长江学者和创新团队发展计划基金资助项目(IRT0423)

作者(Author): 赵杰;姜健;臧希喆;

Email:

DOI:

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享