基于深度强化学习的多机协同空战方法研究

来源 :自动化学报 | 被引量 : 0次 | 上传用户:water663
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多机协同是空中作战的关键环节,如何处理多实体间复杂的协作关系、实现多机协同空战的智能决策是亟待解决的问题.为此,提出基于深度强化学习的多机协同空战决策流程框架(Deep-reinforcement-learning-based multi-aircraft cooperative air combat decision framework,DRL-MACACDF),并针对近端策略优化(Proximal policy optimization,PPO)算法,设计4种算法增强机制,提高多机协同对抗场景下智能体
其他文献
针对线路阻抗差异导致微网在孤岛运行时存在功率耦合问题,传统下垂控制策略难以实现精确的功率均分,从而导致并联系统间存在较大环流。为此,首先建立了并联逆变器数学模型,在分析并联系统功率传输特性和环流特性的基础上,提出一种容性条件下的下垂控制策略。在传统下垂控制中加入虚拟电容,保证等效连线阻抗主要呈容性的同时,解决输出功率耦合以及引入虚拟阻抗导致的电压跌落问题;然后对无功环节进行改进,通过将固定不变的下垂系数改为变系数来改善功率均分精度,从而实现更好的环流抑制效果;最后,进行了仿真分析。结果表明,所提控制策略可
为实现地铁钢轨典型侧磨病害的科学维护,进行了大量地铁线路及钢轨侧磨病害数据采集,结合侧磨钢轨轮轨接触关系的计算和分析,得出钢轨侧磨病害形成机理,提出一种基于改善轮轨关系的钢轨侧磨病害维护方法及策略,减少轮对和钢轨蠕滑,抑制侧磨的发展速率,从而提高钢轨服役寿命,对于地铁线路运营成本和安全风险降低具有实际意义。