【摘 要】
:
随着近年来作战仿真技术的飞速发展,基于仿真技术的指挥训练能够有效提升人员训练的训练效果和组织效率。而在军队信息化水平逐步提升的过程中,作战力量呈现小型化和多能化的发展趋势,使得以分队为主体的基本作战单元的地位更为重要。研究分队级作战仿真系统,以弥补传统军事训练中对抗性弱等缺点,对于提高营、连、排一级指挥员的指挥技能有着重要的意义。构建逼真的计算机兵力(Computer Generated Forc
论文部分内容阅读
随着近年来作战仿真技术的飞速发展,基于仿真技术的指挥训练能够有效提升人员训练的训练效果和组织效率。而在军队信息化水平逐步提升的过程中,作战力量呈现小型化和多能化的发展趋势,使得以分队为主体的基本作战单元的地位更为重要。研究分队级作战仿真系统,以弥补传统军事训练中对抗性弱等缺点,对于提高营、连、排一级指挥员的指挥技能有着重要的意义。构建逼真的计算机兵力(Computer Generated Forces,CGF)行为模型对于提升分队级作战仿真系统的性能有着重要的影响。路径规划是CGF认知行为建模中的关键内容之一,对多种高层智能行为(如决策、规划、协同等)的实现起到支撑作用。而目前在分辨率是营以下、模型颗粒度细化到单兵、单装、单车的分队指挥训练模拟系统中,动态陆战场环境中多自由度CGF路径规划是一个亟待解决的问题。为满足实际仿真系统的应用需求,动态环境中多自由度CGF路径规划算法必须到达以下三点要求:算法的实时性、结果的真实性和环境自适应性。基于空间表示模型的全局路径规划算法虽然可以满足算法实时性的要求,但是其无法满足CGF的动力学约束且仅能用于静态环境。而目前基于强化学习的路径规划算法虽然能有效应对动力学约束,且能通过赋予CGF学习能力来增强环境自适应性,但是将该类方法应用于本文所研究的路径规划问题仍面临三点挑战:易陷入局部极小区域、奖励稀疏和环境部分可观。为解决上述挑战,一方面,本文考虑在初始全局信息已知的动态环境中,提出了层次化路径规划架构。该架构分为两层,高层通过采用全局路径规划算法来生成子目标序列,从而帮助底层避开局部极小区域;底层通过采用基于强化学习的局部运动规划算法来生成满足动力约束的可行轨迹。在此架构下,针对离散动作空间,本文采用基于线性基函数的强化学习方法来构建局部运动规划的白盒模型,将其与简单子目标图算法相结合,提出层次化路径规划算法SG-RL(Subgoal Graph-Reinforcement Learning);针对连续复杂状态动作空间,本文采用深度强化学习方法来构建局部运动规划的黑盒模型,并将其与改进的跳点搜索算法相结合,提出了层次化路径规划算法JPS-IA3C(Jump Point Search-improved Asynchronous Advantage Actor-Critic)。另一方面,本文考虑在初始全局信息未知的动态环境中,提出了基于记忆与领域知识的路径规划算法MK-A3C(Memory and Knowledge-based Asynchronous Advantage Actor-Critic)。该算法在A3C基础上引入了记忆机制与领域知识,来为CGF构建信念环境模型和改进的训练任务架构与奖励函数,以克服上述提及的三点挑战。仿真实验结果表明,本文所提出的基于强化学习的路径规划方法能够避开局部极小区域,应对奖励稀疏引起的策略无法收敛的问题,和克服动态环境中状态部分可观造成的信息缺失的问题。此外,所提出的方法能够满足分队级作战仿真系统所提出的实时性,真实性和自适应性的要求。
其他文献
随着教育理念的不断更新,新课改的不断深入,初中体育也越发受到重视。而将德育教育渗透进初中体育中是新课改的重要内容,具有着非常意义。将德育渗透进体育教学中,能够让学生在强身健体、获取体育知识、理论、技能的同时,培养良好的体育素质与精神品质,从而帮助学生身心健康发展。本文就德育在在初中体育中的作用与如何将德育教育有效渗透进体育课堂中展开讨论,望为初中体育教学提供帮助。
网上零售商的多样化和网购的普及激发了物流业的迅猛发展。虽然大量的物流运输促进了经济的发展和服务的便捷,快递公司们仍然面临着很多挑战:1)物流成本居高不下;2)节假日快递数量激增导致物流运力不足从而屡屡发生“爆仓”现象;3)专用物流车辆加剧了交通拥堵和环境污染(如碳排放)等问题。在本文中,我们提出了基于众包公共交通系统(CPTS)的城市包裹分发与筹划(CPDCP:City-wide Package
近年来,包括协同搜索和救援在内的许多实际应用都引起了人们对机器人群体控制的极大关注。机器人群体通过单个机器人间的交互,实现机器人群体的协同运动,具有空间和功能的分布式和高容错性等特征。使得机器人群体大于个体之和,机器人群体可以执行单体机器人难以完成的复杂任务。机器人群体控制仍面临很多挑战,例如机器人群体避障时的群集一致性问题。这是由于未知环境下,机器人彼此之间的交互和环境的交互同时进行,频繁且量大
当代科技革命、产业革命和新军事革命的发展,使得计算机技术、互联网技术、数字通信技术等新兴技术不断涌现,从而引起社会深刻变革,对情报工作也产生深远影响,它们既丰富了情报搜集手段、加快了情报分析和传输速度,也给情报管理、情报机构建设带来巨大挑战。面对这一形势,美国依托强大的科技和经济实力,积极推动“军民融合”发展战略,并将军民合作的内容扩展到情报领域,主张在情报工作领域推进军民融合式发展,充分利用民间
社会心态是一段时间内由弥散在整个社会或社会群体/社会类别中的社会共识、各类需求满足与否的感受、社会情绪及社会价值观、社会行为共同构成的一种社会心境状态。社会需求是社会心态的动力基础,社会需求的满足与否通过情绪感染推动民众弥漫性社会情绪的产生,进而通过社会认同和沟通形成社会共识,而社会共识进一步积淀形成更稳定的社会价值观。社会情绪、社会共识和社会价值观又共同影响民众的社会行为,体现了社会心态中社会需
异构传感器智能监视网(Heterogeneous Sensor Intelligent Surveillance Network,HSISN)是由部署在特定监测区域内、搭载各类传感器且具有一定感知、计算和通信能力的传感器节点通过无线组网实时协作构成的监视网络系统。系统能够采集和处理被监控区域内的环境信息,并通过无线网络将信息上传到控制中心,从而达到远程监视的目的。系统具有快速部署、精准感知、成本低
冷冻电子显微技术(cryo-EM)在结构生物学中得到越来越广泛的应用。在应用冷冻电镜技术对分子结构进行三维重构的过程中,显微图像中颗粒的挑选效果影响着后续的颗粒分类和分析的质量,直接关系到最终三维重构的分辨率。本文考察了目标检测中的深度学习算法,对卷积网络的结构、目标检测的分类算法和目标框的坐标回归机制进行了研究。在此基础上,本文提出了一种RSelector卷积神经网络方法,用于冷冻电镜图像中的颗
通信信号调制识别技术是在非协作通信情况下,对接收信号的调制样式进行识别,它属于信号检测和解调的中间环节,是一项非常重要的技术。在民用领域常被用于频谱监管,在军事领域常被用于通信侦察、通信干扰等。本文针对现有的调制识别算法在低信噪比下识别率低、人工提取特征适用性差等问题,对基于特征提取的调制识别算法进行研究,根据特征提取方法的不同,研究包括两个方面:一是基于人工特征方面。研究了新型信息熵特征和传统循
随着互联网技术的发展及智能手机等设备的普及,互联网上的视频数据每天都在以爆炸性趋势增长。如何对网络中的视频数据进行分析识别,对于视频的分类、存储、检索都有着至关重要的作用。而在视频分析研究中,基于视频内容的人体动作识别是其中最为普遍且最为关键的主要任务,在互联网异常视频检测、智能监控、人机交互以及军事领域都有着广泛的实际应用前景。有效提取视频中的时空信息是视频动作识别任务中的关键问题,3D卷积神经