动态着舰环境下舰载机自主降落的强化学习算法研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:fengjikun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
航母/舰载机系统是海军最强大的武器系统,但是受跑道狭窄、甲板运动、海况复杂等因素的影响,舰载机进近着舰一直被视为一项高难度、高风险的任务。自动着舰系统是全天候高强度作战能力的基础保障,能引导和控制舰载机在各种天气、海况下安全着舰,使着舰难度大大降低,研发舰载机自动着舰系统对提高我国海军国防军事力量具有重要意义。强化学习在解决序列决策问题上具有先天优势和成功实践,本文尝试用强化学习方法解决舰载机自动着舰问题。传统的强化学习方法要求智能体处于稳定环境中,但是着舰环境往往处于动态变化中,对自动着舰智能体的训练及应用产生很大影响。因此,本文除研究自动着舰算法外,还研究了如何针对变化较大的着舰环境,提高强化学习智能体的泛化能力的问题,主要包括以下内容:首先,分析了动态环境下舰载机着舰过程的主要影响因素。通过分析发现,航母运动导致理想着舰点位置的偏移,使着舰任务的目标发生变化,而大气扰动导致飞机位置偏离标准下滑道,并且使环境动力学模型发生变化,对训练过程产生影响。因此,本文将着舰过程中的航母运动和大气扰动视为影响着舰成功率的主要因素,并在仿真实验环境中进行相应设置来模拟动态变化的着舰环境。然后,设计了基于DDPG的舰载机自动着舰算法。针对航母运动和大气扰动带来的问题,一方面建立了能适应航母运动的MDP模型,另一方面从记忆库中抽取训练样本时用分层抽样取代简单随机抽样的方法,减小了大气扰动导致的数据分布的变化及其在训练过程中产生的波动。在仿真实验环境下进行实验,验证了算法可以适应着舰过程中的航母运动和大气扰动,在此基础上通过改变不同的航母速度验证了算法对不同着舰环境的泛化能力。进一步,对于与训练环境差异较大的着舰环境,本文将不同环境下的着舰任务视为不同的强化学习任务,提出了基于模型的迁移强化学习算法(MBTRL)。MBTRL在源环境中预训练时同时学习策略模型和环境模型,在目标环境中应用时先对环境模型进行迁移,再借助环境模型完成策略模型的迁移,从而快速适应目标环境。在统一的强化学习实验平台下进行实验,实验结果表明,MBTRL在新环境中的学习速度、跳变启动都有明显提升,渐进性能的提升在环境差异较大时更为明显。最后将MBTRL应用到着舰问题中,在仿真实验环境下进行不同环境下的着舰实验,实验结果显示出了MBTRL良好的适应能力,有效解决了环境变化较大时着舰成功率降低的问题。
其他文献
视网膜色素变性(Retinitis pigmentosa,RP)是视网膜上感光细胞逐渐变性凋亡,同时伴随着视网膜色素上皮细胞功能障碍,造成夜盲,渐进性视野缺失,最终导致失明的一种遗传性视网
20世纪90年代以来,随着永磁材料性能的提高及控制技术的发展,永磁同步电机的应用领域不断拓宽,对永磁同步电机控制性能的要求也越来越高,先进控制算法的应用对于永磁同步电机控制系统性能的提升具有重要意义。滑模变结构控制对外部扰动和系统参数变化具有很强的鲁棒性,成为永磁同步电机控制领域最为重要的控制策略之一。为了在保证滑模控制鲁棒性的前提下削弱抖振,本文首先构建了基于新型趋近律的永磁同步电机速度环滑模控
现实世界中充满着矛盾、对抗、冲突或合作等问题,微分对策作为能够通过数学方式对这些复杂问题进行有效刻画和处理的重要方法,自提出以来就备受重视。微分对策现有的研究成果
光活性金属-有机框架(MOFs)材料因其在光催化、分子识别等领域重要的应用前景成为材料化学研究的热点之一。其关键科学问题是如何合理选择与组装构筑模块,并有效调节各组分在
后现代主义作家唐·德里罗(Don DeLillo,1936-)的作品多以关注美国当代社会文化问题为主,但其有关历史的小说并非沿袭传统历史叙事的套路,将历史孤立于真实性反思中,而是在历
本文是一篇英译汉翻译实践报告,其研究文本摘自Why We Should Read一书的前两章。该书是英国作者Stuart Petre Brodie Mais的书评汇总集。在该书中,作者Mais对自己喜爱的英国小说和外国作品都进行了全面细致的分析,以此鼓励读者阅读此前并未接触过的读本,并且在阅读时,欣赏原文的优点而不是挑剔原文的个别疏漏。本报告首先介绍了研究背景和意义,其次描述了翻译过程,包括译前准
由黄瓜连作引起的土壤肥力下降、微生物群落结构单一、病原菌积累等障碍,是影响黄瓜品种和产量的重要原因。其中根结线虫危害大、防治困难成为黄瓜上严重的土传病害之一。近年来研究者们采用微生物菌剂在定植前撒施或者定植后灌根,既能有效控制病害、又有利于农业生产可持续健康发展。本试验以课题组前期筛选、诱变得到的高效突变核桃内生解淀粉芽孢杆菌GHt-q6为材料,采用大田试验研究GHt-q6菌株在黄瓜体内的定殖力、
随着电机越来越多地应用在我们生活的方方面面,传统电机由于受限于自身结构设计与工作原理很难实现小型化与高效化,与现阶段便携式电子产品的发展趋势存在一定冲突,而超声电机(Ultra Sonic Motor,USM)的出现则在一定程度上填补了传统电机的空白。通过利用压电陶瓷的逆压电效应将定子与转子间的摩擦力转化为动能,具有体积小、抗电磁干扰能力强、扭矩大等特点。而超声电机高驱动电压的需求则对驱动电路的小
范成大是南宋时期一位重要的政治家、文学家,是南宋“中兴四大家”之一。近年来,学界对他的研究在各方面都取得了丰富的成果。前人研究重点大多着眼于范成大的生平事迹、交游往来、著作辑佚、诗词研究、书法艺术等方面,尤其是他的田园诗与使金诗,更是研究的重中之重。但在这些前人的研究著作中,较少有涉及到佛教方面的内容,所以本文将尝试把范成大著作中有关佛教方面的内容做一个整体的研究。重点从范成大的所有现存诗词、笔记
西瓜是一种重要的瓜果类作物,不仅果肉具有较高的营养价值,瓜皮还具有清热利尿降血压的功效,深受各年龄层次人群欢迎。而小型西瓜是一种重量较小,便于携带的西瓜品种,目前主要在温室中种植较多,连作导致很多病害发生,严重影响西瓜的产量和质量。目前调查研究发现,温室内最多出现的就是西瓜白粉病和西瓜枯萎病。为了进一步培育新品种,选育出一些抗病性较强的品种,本次试验对山西省农业科学院提供的73个小型西瓜品种进行各