基于深度强化学习的多机协同空战方法研究

来源 :自动化学报 | 被引量 : 0次 | 上传用户：water663

【摘要】

：

多机协同是空中作战的关键环节,如何处理多实体间复杂的协作关系、实现多机协同空战的智能决策是亟待解决的问题.为此,提出基于深度强化学习的多机协同空战决策流程框架(Deep-reinforcement-learning-based multi-aircraft cooperative air combat decision framework,DRL-MACACDF),并针对近端策略优化(Proximal policy optimization,PPO)算法,设计4种算法增强机制,提高多机协同对抗场景下智能体

【作者】

：

施伟冯旸赫程光权黄红蓝黄金才刘忠贺威

【机构】

：

国防科技大学系统工程学院,北京科技大学人工智能研究院,北京科技大学自动化学院

【出处】

：

自动化学报

【发表日期】

：

2021年7期

【关键词】

：

多机协同空战智能决策深度强化学习 PPO算法增强机制

【基金项目】

：

国家自然科学基金(71701205,62073333)资助。

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于下垂控制的并联逆变器间环流控制策略

针对线路阻抗差异导致微网在孤岛运行时存在功率耦合问题,传统下垂控制策略难以实现精确的功率均分,从而导致并联系统间存在较大环流。为此,首先建立了并联逆变器数学模型,在分析并联系统功率传输特性和环流特性的基础上,提出一种容性条件下的下垂控制策略。在传统下垂控制中加入虚拟电容,保证等效连线阻抗主要呈容性的同时,解决输出功率耦合以及引入虚拟阻抗导致的电压跌落问题;然后对无功环节进行改进,通过将固定不变的下垂系数改为变系数来改善功率均分精度,从而实现更好的环流抑制效果;最后,进行了仿真分析。结果表明,所提控制策略可

期刊

逆变器并联环流控制下垂控制虚拟阻抗功率均分精度

基于轮轨关系的地铁钢轨侧磨病害分析及维护方法

为实现地铁钢轨典型侧磨病害的科学维护,进行了大量地铁线路及钢轨侧磨病害数据采集,结合侧磨钢轨轮轨接触关系的计算和分析,得出钢轨侧磨病害形成机理,提出一种基于改善轮轨关系的钢轨侧磨病害维护方法及策略,减少轮对和钢轨蠕滑,抑制侧磨的发展速率,从而提高钢轨服役寿命,对于地铁线路运营成本和安全风险降低具有实际意义。

期刊

轮轨关系侧磨维护策略

基于深度强化学习的多机协同空战方法研究

其他学术论文