基于多维状态动作的DDPG冲突解脱算法研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:yushui223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2019年,国内民航年旅客量达到13亿以上,同比增长6.9%。随着空域拥挤问题日趋严峻,航空业面临巨大挑战,包括空管人员的压力激增、航班延误率显著增加、飞行冲突问题突出等。其中,实现高效的冲突探测与解脱技术是保障飞行安全的首要任务,特别对于复杂、高密度的空域环境尤为重要。这项工作的进行也对维护飞行秩序、防止航空器碰撞、缓解空中交通压力、保障空中交通安全具有重大意义。面对巨大的空中交通压力,民航领域内的研究者相继提出了多种算法,包括经典算法和人工智能算法,但均存一定的局限性。本文主要研究内容包括:针对现有DDPG模型的状态、动作维度不能满足现实管制场景的需求,提出了基于多维度状态、动作的DDPG-Net单智能体短期冲突解脱模型;通过开源空中交通管制仿真平台OpenScope构建环境模型,以及OpenAI开源强化学习环境库Gym和BADA航空器性能模型,设计了一套模拟管制环境“AtcEnv”,并通过仿真系统的交互进行解脱策略的学习;通过相关的评价指标对模型进行解脱策略的评估与分析。模型中,智能体的解脱动作包含高度、速度以及航向角三个自由度,状态包括位置信息、与其他航空器的最小距离、速度等十个自由度。首先,本文利用Gym对仿真环境进行注册,对OpenScope进行功能性改造,引入成都双流机场最新进近区域内的固定点数据,包括各个扇区参数、进离场航线数据、进近区管辖范围数据等,设计了简单的进近区ATC管制环境。该环境包括独立的进场、离场情景,充分考虑了各种复杂情况下的冲突。其次,针对不同空域的复杂程度设计了相应的冲突场景,如航路上的交叉冲突以及对头冲突,进、离场时的对头冲突、超越冲突等,构建完备的冲突集。为了降低模型的复杂度,假设航空器在转弯过程中不考虑最小转弯半径的限制。最后,考虑到解脱动作的连续性以及智能体状态的复杂性,本文以保障飞行安全为前提,对航空器解脱策略进行研究。通过构建的空中交通管制仿真环境实现智能体之间的交互训练任务,设计了冲突解脱模型的奖励函数,采用深度强化学习中经典算法DDPG进行解脱策略的学习。仿真实验结果表明该算法对于多种冲突环境均能够搜索到较优的解脱策略,冲突解脱成功率达到89%以上,可以作为管制员进行冲突解脱的参考方案之一。本文的研究工作包括数据处理、仿真环境搭建、冲突场景构建和深度强化学习技术等,为解决民用航空领域中的空中交通冲突问题,提供了一种新的建模思想和解决方案。经过多次仿真实验的验证,证明了算法的有效性与先进性。
其他文献
由于液压系统具体方向、速度、载荷程序控制及无级调速控制等优点,已广泛应用于工业的各个领域。特别是随着计算机软件技术、电子技术和通信技术的高速发展以及不同领域的应用,液压技术从原有的手动单一控制逐步迈向自动化控制,并广泛的应用于建筑、水利水电、冶金、矿山等各种工业领域,在航空测试领域中也大量采用了液压系统。发动机及其部附件在检修后就需要进行性能测试,由于我国目前的航空发动机多采用液压控制附件非电子式
随着透镜等光学器件在光电民用产品、天文观测系统、高能激光系统中的广泛应用,传统光学加工技术已无法满足其低成本、高效率、无损伤等要求。大气等离子体光学加工基于化学刻蚀原理,不仅具有较高加工速率,非接触的加工方式还可有效避免加工表面出现机械损伤和裂纹,是一种极具发展前景的新型光学加工技术。然而,电感耦合等离子体(Inductively coupled plasma,ICP)炬管作为产生等离子体射流的关
乳酸菌(Lactic acid bacteria,LAB)是食品微生物的重要成员。由于它对人和动物健康有益,因此它在食品及医药工程领域具有重要应用前景。乳酸菌中存在大量染色体外的遗传物质,为其克隆载体系统的发展提供了极好的材料。近10多年来,随着乳酸菌内源性质粒的去除和电穿孔技术的建立以及乳酸菌中表达信号的分离,已建立和发展了一系列具有不同用途的乳酸菌载体和受体系统。这些载体包括克隆载体、整合载体
近年来,物联网相关技术飞速发展,物联网也被广泛应用于环境监测,智慧城市,目标跟踪等多个场景中。在物联网应用场景中,如何高效收集物联网设备的数据一直是研究的热点问题。在网络规模较大的物联网中,通常需要部署大量用以监测并转发数据的物联网设备,而这会带来昂贵的部署成本。并且,如果在极端环境(如:发生自然灾害的区域,火山等)中部署的物联网设备来获取周围环境的信息,收集设备获取的信息是极其困难的。利用低成本
在空中交通系统中,终端区是重要的组成部分,主要设立在一个或几个主要机场附近。终端区的运行情况好坏直接影响空中交通的有序运行。相关流量管理人员对终端区交通的运行状况与发展趋势正确把握,有利于及时制定有效的流量管理措施,保障整个空中交通网络的流畅运行。目前,有学者对于终端区交通态势识别与预测方法进行研究,但是这些方法都是基于单个终端区而进行的,没有考虑终端区之间的相互流通关系。为此本文面向多终端区进行
近年来,随着国内民用航空事业的飞速发展,航空器在多跑道机场场面滑行的过程中频繁发生冲突碰撞及跑道入侵等事件,从而导致进离港航班的延误率的增高,严重影响了机场场面的运行效率及安全性。如何合理地规划航空器场面滑行路径及高效地完成冲突解脱策略是现阶段国内机场最关注的问题之一。基于上述问题,本文提出了一种基于冲突热点的航空器场面滑行路径规划算法,来提高复杂场面环境下的航空器滑行效率。本文的主要工作和创新点
航空运输是一个特别容易受气象因素影响的领域,当气象情况较为恶劣,且大面积分布,不满足飞行器正常航行的条件时,现有的空中管制调配手段,主要由管制员进行航向引导,绕飞危险天气,比较严重时,让航班被动地等待,直到计划航线经过的区域恢复容量后才可通行。该情况给人们的出行带来了极大的不便,甚至会造成一定的经济损失。危险天气已经成为航班延误的重要原因。因此,研究危险天气下的空中交通管理策略,具有重要的现实意义
我国铁路总里程长,其中有砟轨道应用广泛,但在列车循环动载荷下,石砟会出现移位、凹陷等现象,进而产生轨道表面不平顺、不符合截面承力设计要求等安全隐患问题,因此铁路边坡需要定期维护。经调研,大型配砟车可进行大修及新铺设铁路线作业,但在山区及道岔仍采用45人一组、人工使用大拉耙进行边坡维护的原始作业方式,因此,工务中小型铁路边坡维护机械的研发及推广使用十分必要。该设备可用于道岔、山区及作业时间紧、不便大
通过车辆自感知进行路表面状态监控是智能网联交通环境下提升道路安全与通行效率的有效手段。多车数据所提供的大量样本和中央云平台的快速处理方法,可帮助在路面发生如结冰等表面材质变化的状况时进行及时准确的响应,降低交通事故的危害。当轮胎处于单一路面峰值附着系数的路面上行驶时,车轮滑移率与当前轮胎受到的路面附着系数有确定的对应关系。因此可基于滑移率与路面附着系数的特征推测当前路面的峰值附着系数,进而推测对应
在品牌形象设计的研究中,前期调研是必不可少的一项关键环节,有着举足轻重的作用,品牌的前期调研,是设计的前提,是设计的准备工作,是设计成功与否的重要标志。随着现代设计教育的不断发展和深入,品牌形象设计需要更有针对性,许多品牌的本土化也急需去完善。本文以农产品品牌的调研为例,浅析品牌形象设计的前期调研方法与路径。