基于社区感知网络的多机器人系统Q-学习与运动控制研究

被引量 : 0次 | 上传用户:ycmk07js2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于网络的多机器人系统领域研究取得了很好的成果,但从整体来看基于网络环境下的多机器人系统研究仍然面临许多亟需解决的问题,主要包括:如何应对实际环境复杂性所带来的静态节点无法全部连通问题;如何处理网络信息传输带来的时延、噪声、数据包丢失等困扰;如何增强网络化环境下机器人的环境理解能力;在网络化系统的框架下,如何高效的实现多机器人之间的运动控制等。增强学习是多机器人系统通过与外界环境交互的一类有效的机器学习方法。Q-学习作为增强学习的一种典型算法,由于其不用建立环境模型,通过试错法与环境的不断交互获得策略的改进和完善,最终实现对机器人的运动控制。通过在环境中部署静态节点,构建可相互连通的静态节点群组形成一个社区,通过无线通信方式形成多跳的社区感知网络。针对维数灾和学习不充分等问题,本硕士论文采用ε-半径近邻分类方法对机器人的历史状态进行分类和降维,同时将信息交互与共享等方法有机结合,提高机器人的Q-学习效率。最后,考虑学习信息在静态节点社区感知网络传输存在时滞特性,将拓扑网络的时滞假设为等时滞和异时滞两种情况,分别讨论多机器人系统在两种时滞社区感知网络环境下的Q-学习算法与运动控制。主要研究工作如下:第一,针对基于网络的多机器人系统存在的不足,给出了社区感知网络架构。利用静态智能节点提供社区内其他机器人的历史学习信息进行综合决策进而加快自身学习,提出了一种改进的多机器人Q-学习算法实现对机器人的运动控制。第二,针对社区感知网络环境下的多机器人强化学习中存在的维数灾和对社区网络内智能节点提供的其他机器人的历史信息学习不充分等问题,提出一种在线ε-半径近邻状态分类方法,对机器人历史状态进行实时的降维分类;同时利用社区近邻集更充分的学习其他机器人的历史信息;最后分析了Q值矩阵收敛性问题。第三,针对社区网络感知环境下机器人之间的信息交互的问题,通过融合社区网络内的机器人的学习信息,提出社区信息共享机制及社区Q值表更新规则,从而减小网络计算量和复杂度。同时考虑到学习信息在社区网络内的传输存在时滞特性,给出基于等时延的社区网络Q-学习算法更新规则,最后通过实验实现了对机器人实时的运动控制。第四,在社区感知网络环境下,考虑信息在静态感知节点间传输的异时滞特性,定义且计算社区拓扑网络的时延矩阵,针对多机器人编队行为的一致性任务要求,设计基于行为一致性的奖赏函数,提出基于异时滞社区网络的多机器人行为一致性Q-学习算法,实现多机器人在异时滞社区网络感知环境下的行为一致性控制。
其他文献
信息技术是新技术革命的标志,进入新世纪信息技术更是蓬勃发展。与此同时在信息的交互之中大量的数据产生。随着人们不断的研究发现这些数据其实隐藏着很多有用的信息。但是如
近年来,企业改制改组是我国市场经济发展过程中的现象之一,但在市场经济进一步深化的今天,传统的国有运输企业面临着激烈的市场竞争。由于现代人力资源管理的理念、方法在企业改
1997年亚洲金融危机的爆发,使国际社会认识到,国际金融问题的解决除西方发达国家外,还需要有影响的发展中国家参与。1999年12月,二十国集团创始会议在柏林召开,G20应运而生。以中
能源是关系到国家社会、经济发展全局性的重大战略问题,是我国国民经济、社会生产力持续发展的重要基础,因而节能减排及新能源开发就成为我国当前的战略性新兴产业,而风力发
经济的信息化是当今时代的主题。近年,随着我国电力产业市场化程度的不断加深,这就要求国家电网公司及各级供电企业必须探索出新的管理体制以适应新的挑战。新一代基于网络技
<正>查拳是流传较广的中国传统拳术长拳的五大流派之一,起源于山东冠县,距今已有1200余年的历史。查拳姿势舒展挺拔,发力迅猛,动静有致,刚柔兼备,节奏鲜明,步法灵活多变,结构
期刊
密闭电石炉尾气具有成分复杂、净化难、热值较高等特点。现有的利用方法存在可选择的成熟技术少、限制条件多等问题。以年产6万吨电石的电石厂为例,进行了技术经济分析,提出了
目的:研究肝细胞核因子4α(hepatocyte nuclear factor4α,HNF4α)对肝癌细胞凋亡的影响以及与p38MAPK信号转导通路的关系,揭示HNF4a抗肝癌的机制。方法:1.收集处于对数生长期
针对初中英语教学中对学生写作能力培养不够重视这一现象,本研究对初三学生英语写作策略的使用情况做了实证调查。研究的目的是调查学生在写作过程中是否使用了写作策略,使用写
目的:观察清肺口服液治疗小儿呼吸道合胞病毒(RSV)肺炎前后患儿血清中白细胞介素6(IL-6)和肿瘤坏死因子α (TNF-α)表达水平的变化,探讨清肺口服液如何通过调节细胞因子而发挥