无人机通信系统的无线资源智能管理技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:mervin10183
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通信用户的增多,传统的地面通信网络已无法满足人们对无线通信超可靠性、高服务质量、多样性的需求。无人机通信作为一种典型的空中通信手段,能够为用户提供高可靠性、高灵活性、易部署、低成本的通信服务,被视为未来空中网络解决方案和地面通信的补充。面向增强通信覆盖和应急通信的需求,单无人机中继和无人机集群基站是两个典型通信场景。资源管理是无人机通信系统中的一项关键技术,由于传统的无线资源管理技术根据完全且精确的环境状态信息推导出策略,不仅难以实现,而且计算复杂度高,还无法根据环境的变化改变策略。为此,本文面向无人机通信系统的两个典型通信场景,重点研究无线资源智能管理技术。首先,研究了基于强化学习的分层智能决策(Reinforcement Learning Based Hierarchical Intelligent Decision-Making,RLB-HIDM)架构,然后在这个架构的基础上,分别制定了单无人机中继和无人机集群基站的通信资源管理方案。针对单无人机中继通信链路的资源管理问题,提出了一种分三步的智能解决方案(Three-Step Intelligent Solution,TSIS)。面向无人机集群基站场景,针对无人机机间通信的资源管理问题,提出了基于快速强化学习的资源管理算法;针对无人机集群基站对地面用户通信的资源管理问题,提出了基于聚类辅助的多智能体强化学习(Clustering-Aided Multi-Agent Reinforcement Learning,CA-MARL)方案,使无人机通信系统能够以低复杂度实现智能、自主的动态资源管理。本文的主要研究贡献和创新点如下:(1)面向单无人机中继和无人机集群基站典型通信场景中的无线资源管理问题,本文研究了RLB-HIDM架构,并设计了每一层的决策方案。该架构与传统架构相比,不需要提前获知所处环境的每一个信息,仅需得到与环境交互的反馈,在尝试和错误中探索最优策略,因此能适应动态环境,此外计算复杂度远低于传统架构。(2)针对单无人机中继通信链路的发射功率与路径优化问题,提出了一种分三步的智能解决方案(TSIS),将高维度的联合决策转化为低维度的子问题。第一步进行降维,提出了基于模型参数重构的机器学习(Model Parameter Reconstructive Machine Learning,MPR-ML)算法完成无人机最优飞行高度部署;第二步设计了基于蚁群优化的无人机二维飞行轨迹,以低复杂度解决NP难问题;第三步提出了基于优先级采样双延迟深度确定性策略梯度(Prioritized Sampling Twin Delayed Deep Deterministic Policy Gradient,PS-TD3)的功率控制算法,使功率决策快速收敛到最优。仿真结果表明,所提方案和算法的决策性能、收敛速度和计算复杂度相比传统算法有明显优势。(3)针对无人机集群基站场景中机间通信的集群部署问题和功率优化问题,本文提出了基于深度Q网络(Deep Q-Network,DQN)的集群模式和发射功率联合决策算法,并提出了三种DQN的改进算法提升其收敛性。为了使集群模式和功率控制的联合决策能够适应环境的变化,本文分别提出了基于元深度Q学习(Meta Deep Q-Network,Meta-DQN)和基于模型价值扩展的深度Q网络(Model Value Expansion Deep Q-Network,MVE-DQN)的两种快速强化学习算法,与DQN算法相比,可大大减少收敛所需样本数,而且Meta-DQN算法可实现更小样本的学习,MVE-DQN算法能够以更高概率收敛到最优解,仿真结果验证了算法的有效性。(4)针对无人机集群基站对地通信的用户关联、节点部署、功率控制和时频资源块分配的联合优化问题,本文提出了CA-MARL方案,将高维度的联合优化问题解耦为三个子优化问题,分两个阶段解决,以较低的复杂度解决联合优化中的NP难问题。阶段一:预部署阶段,首先提出了基于改进期望-最大化(Modified Expectation-Maximization,MEM)的无监督聚类算法,将用户关联问题转换为无人机与用户簇匹配的问题,降低了决策维度,然后,研究了基于Kuhn-Munkres(KM)的无人机-簇匹配算法,完成用户关联和无人机节点的预部署。阶段二:无人机节点位置微调阶段,本文提出了多智能体双延迟深度确定性策略梯度(Multi-Agent Twin Delayed Deep Deterministic Policy Gradient,MATD3)算法决策无人机的飞行轨迹和发射功率,该算法以低偏差的Q值估计更易达到最优策略;提出了基于多智能体优势动作-评价(Multi-Agent Advantage Actor-Critic,MAA2C)的时频资源块的分配算法,优势更新的特点使训练更容易收敛,且能够有效抵抗典型干扰。仿真结果表明,本文所提CA-MARL方案能够以低复杂度达到较优的策略,并且MATD3和MAA2C性能优于传统强化学习算法。
其他文献
道路信息获取在环境、经济、军事等领域具有重要意义。在应急救灾领域中,面对复杂地形、恶劣天气的情况,实时快速掌握道路的基本信息和道路周边状况更是尤为重要。合成孔径雷达(Synthetic Aperture Radar,SAR),作为一种可机载或星载的微波成像雷达,因其具有全天候、全天时对地观测的能力,自发明以来就被广泛应用于遥感和测绘。随着SAR成像技术的快速发展,高质量高分辨率SAR影像的获取已不
空间交会对接是航天器长期在轨运行期间不可缺少的操作,是载人航天活动必须掌握的一项基本技术。空间对接机构是实现空间飞行器的在轨机械连接、建立空间飞行器之间的联系、保证空间飞行器安全分离的系统。由于具有寿命长、成本低以及精度高等优点,模块化空间对接机构被应用于各种在轨装配服务与卫星回收捕获等领域,与传统对接机构相比,模块化空间对接机构可在复杂工作环境下进行在轨组装、在轨更换、功能拓展和升级等作业,不仅
热活化延迟荧光(Thermally activated delayed fluorescence,TADF)材料可以通过逆系间窜越通道(Reverse intersystem crossing process,RISC)将三线态激子上转化至单线态,再通过单线态激子的辐射跃迁实现100%内量子效率,成为近年来有机电致发光器件(Organic light-emitting diodes,OLED)领域
能源短缺和碳排放是世界各国持续关注的重要议题。质子交换膜燃料电池(PEMFCs)是一种清洁、高效的能量转化装置,在降低碳排放和缓解能源危机方面具有巨大潜力。PEMFCs拥有高能量密度、运转安静、可快速冷启动等优势,已经被广泛应用于燃料电池电动汽车(FCEV)、船舶、航空航天、军工设备等领域。质子交换膜(PEM)是PEMFCs内部最重要的核心组件之一,具有传导质子和分隔反应气体的双重功能。因此,PE
二维层状材料,例如石墨烯(graphene),二硫化钼(Mo S2),二硒化钨(WSe2),氮化硼(h-BN)等,具有原子级的厚度和优异的电学、力学及光学等物理特性,在新型二维器件的研究和应用中展示出巨大的潜力;诸如二维晶体管、反相器和二维机电谐振器等各类新型二维器件也引起了国内外的广泛关注,不断催生出新的重要研究成果。在二维器件研究中,器件制备工艺是一个十分重要的环节,不仅直接影响到各类器件研究
随着红外探测技术的不断发展,探测精度逐步提高,飞行器的红外隐身设计面临严峻挑战。特别是基于速度突防的理念,飞行器的飞行速度越来越快,导致其表面温度和红外辐射强度急剧升高,受到的红外探测威胁也与日俱增,需要采用有效的红外隐身措施,以提高战场生存能力。与通常的载人飞行器相比,无人高速飞行器的红外隐身面临战场环境复杂、服役环境恶劣、材料性能要求高、多频谱兼容隐身困难等一系列问题,使其红外隐身设计的难度更
空间电磁场是指分布于空间中且忽略时间因子后的稳态或准稳态电磁场。传统的空间电磁场分布调控侧重于远场区的波束方向图赋形。然而随着电磁理论与技术的不断发展,以局域微波热疗、近场成像、近场无线输能等为代表的应用场景,不再侧重对角度域波束进行控制,而是希望在任意给定目标区域内对电磁场的空间分布进行精细化调控,从而更为准确地实现能量传递或信息获取。尽管目前已经有诸如近场聚焦、平面波综合等专门类型的电磁场赋形
湿地是地球上生产力最高的生态系统之一,为生物圈和人类社会提供了一系列必不可少的生态服务功能。然而,当前湿地却面临着来自气候变化和人类活动的双重胁迫,导致了天然湿地的严重退化和萎缩,这使得针对湿地未来气候风险的评估研究以及相应的适应性管理策略的制定迫在眉睫。明确不同类型环境因子如何影响湿地物种的生境适宜性是制定科学湿地管理策略的首要前提,能够为气候变化下优先保护物种和区域的选取提供科学指导。生态位模
高压BCD(Bipolar-CMOS-DMOS)工艺将Bipolar器件、CMOS器件、DMOS功率器件同时制作在同一芯片上,综合了三类器件各自的优点,使得设计人员可以灵活地设计集成了功率、模拟和数字信号处理功能的功率集成电路。自上世纪80年代意法半导体公司首次研发成功之后,高压BCD工艺短时间内即成为了功率集成电路的主流制造工艺,并对功率半导体领域产生了深远的影响。从衬底材料的分类上,BCD技术
随着风电系统和区域电网之间互联进程的加快,各类频发的故障事件(如短路故障、负荷突增、发电机故障切除等)以及风能间歇式特性引起的故障,正在威胁系统的安全稳定运行。因此,开展风电互联电力系统的安全性评估及安全稳定性提升的控制,对于保障风电互联电力系统的安全稳定运行具有重要意义。目前,在大规模风电并网场景下,由于并网接口采用变流器,从而使风电系统与电力系统解耦,导致风电互联电力系统的等效旋转惯量降低,削