基于强化学习的导弹制导控制系统设计

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:zzdlily_4000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
制导与姿态控制系统是导弹控制系统的两个重要部分,导弹的姿态控制系统即为导弹自动驾驶仪。目前,在设计制导律时,需要充分考虑飞行条件、制导精度和外界干扰等因素,而传统的导引方法(如比例导引律等)很难兼顾这些因素。同样在姿态控制系统设计时,针对每组特征点按照一定的准则(如时域指标、频域指标等)设计参数,但这会使设计的导弹模型与实际的弹体模型存在一定的差异。而强化学习算法是一种弱模型依赖的算法,其不需要对环境精准建模,因此有必要对导弹的制导律设计与姿态控制系统设计进行深入的研究。本文以某制导炸弹为研究对象,以强化学习方法为主要研究方法,进行以下几个方面的研究:首先引入描述导弹运动的常用坐标系以及不同坐标系之间的转换关系,推导出导弹和目标的相对运动模型,为后续基于强化学习的制导律设计奠定基础;同时根据动力学原理与运动学原理,对导弹的姿态运动建立了非线性模型,给出了六自由度弹道方程,为后续章节的基于强化学习的控制系统设计和数值仿真打下了基础。其次,研究了基于强化学习方法的制导律。首先考虑制导系数动作空间维数较小这一特性,选用了DQN算法对导弹拦截任务进行了制导律设计,给出了制导环境MDP的设计过程,经过多回合的训练之后,奖励值逐渐收敛。之后针对DQN算法中的过估计导致的动作指令选取的局部最优问题,引入一个神经网络来减小DQN算法的过估计问题,学习结果表明,脱靶量相比于DQN算法也有明显的减小。在改变多种仿真条件下,脱靶量也能维持较好的效果。然后,研究了基于强化学习的过载自动驾驶仪在线调整控制参数。首先,利用策略梯度算法对过载自动驾驶仪的控制参数进行设计,该方法将导弹看作为智能体,读取飞行状态信息并建立动作策略和奖惩机制。其次,针对策略梯度算法存在的对数据利用率不高和学习效率低的缺点,采用DDPG算法对导弹自动驾驶仪的控制参数进行设计并进行比较分析。基于强化学习方法设计控制参数也大大降低了控制参数的设计难度和工作量。本文将此方法进行了实验仿真并与增益调度法进行比较,验证了设计的可行性。最后,对本文的工作进行了总结,并分析了基于强化学习方法在制导律和控制系统设计方面仍存在的问题,给出了下一步的研究方向。
其他文献
近年来,金融科技凭借互联网、大数据、区块链、人工智能等高新技术与传统金融业态深度融合,有效提高了金融服务质效、促进了金融创新发展。2020年5月以来,习近平总书记提出并多次强调要“加快形成以国内大循环为主体、国内国际双循环相互促进的新发展格局”。推动形成“双循环”新发展格局,是未来一段时期经济发展的首要任务,也是“十四五”时期金融改革发展的着眼点。在此背景下,加强高新技术在金融领域的应用,以金融科
<正>2011年8月15日至17日,由南岳佛教协会主办的"慧思大师与南岳佛教"学术研讨会在慧思当年所辟道场南岳福严寺隆重举行。这次受邀参加会议的专家学者、法师有六十多位,分五场进行发言讨论。来自海内外
期刊
金融抑制是维护金融安全较为稳妥的一种选择,市场主体不断寻求各种金融工具规避金融监管以实现“监管套利”。金融科技由英、美发达国家传入中国后,大打金融科技的普惠金融、金融脱媒功能,被少数人异化后,以达到规避金融监管的目的。金融科技作为新生事物,本身就具备比传统金融更高的风险性和脆弱性。因此,加强金融监管,构建完善的金融科技监管框架十分必要和重要。现如今,全球金融科技发展快速,并涌现出了一系列个性不同的
<正>一、前言人类的生产历史是科学在技术上的突破。随着信息技术的发展,各种新兴技术手段被引入到了金融行业,金融技术发展日新月异,但金融科技无法改变金融业务的本质和风险。本文对我国金融科技应用的风险防控进行了深入的研究,并从现有的监管体制入手,提出了更加具有前瞻性、动态性、全面性的风险防范对策,从而进一步推动金融科技应用的创新与发展。
期刊
<正>近年来,我国已形成覆盖城乡的社会保障体系,社保覆盖面不断扩大,人民群众的关注度也越来越高,社保基金的安全,直接关系到社会的和谐稳定发展。社会保险基金事关广大参保人员的切身利益,是社会保险事业的生命线,是百姓的“养老救命钱”。随着基金量激增,再加上缴、支、管等环节运行复杂,社保基金的监管难度也不断增大,违规领取社保待遇的情况仍时有发生。
期刊
期刊
<正>一、金融科技发展与应用现状近年来,随着移动互联网、人工智能、大数据、云计算、区块链和密码技术为代表的信息技术与金融业务深度融合,金融科技在全球范围内蓬勃发展,科技对金融服务各细分领域渗透逐步加深,科技驱动的金融业务创新愈发活跃。当前,金融科技正成为世界经济数字化转型的新动力,
期刊
根据《河南省2018年大气污染防治攻坚战工作方案》中"在2018年10月底前完成全省陶瓷、钢铁、水泥、碳素、玻璃行业的超低排放改造"的要求,南阳中联卧龙水泥有限公司通过技术对比,在原有SNCR脱硝的基础上,采用"热碳催化还原复合脱硝技术"于2018年3月完成了公司熟料生产线的氮氧化物超低排放技术改造。通过近一年的生产运行,成功实现了"氮氧化物≤50mg/m~3,氨逃逸≤8mg/m~3"预期目标,且
<正>主持人:重复领取养老金等社保待遇,是目前社会保险领域较为常见的违规行为。人社部印发的《关于城镇企业职工基本养老保险关系转移接续若干问题的通知》(人社部规[2016]5号)规定,实施之后重复领取基本养老金的参保人员,由本人与社会保险经办机构协商确定保留其中一个养老保险关系并继续领取待遇,其他的养老保险关系应予以清理,个人账户剩余部分一次性退还本人。其他相关政策文件也作了类似规定。对于已经重复领
期刊
工业锅炉广泛应用于多种行业的生产过程中,其排放的氮氧化物(NOx)是我国大气污染的主要来源之一。目前,工业锅炉中NOx的排放控制技术大多采用SNCR技术。然而随着NOx排放标准的提高,采用单一SNCR技术不能满足工业锅炉的NOx排放要求。SNCR-SCR联合脱硝技术因其具有脱硝效率高和占地面积小等优点受到越来越多的关注。本文基于计算流体力学及优化设计方法,对一台40 MW水平链条热水锅炉中的SNC