论文部分内容阅读
现在,基于802.11标准的无线局域网(Wireless Local Area Network,WLAN)已经在全球范围内部署,成为人们生活中不可缺少的一部分。随着无线设备的不断增加,移动业务的不断发展,无线流量的不断增长,用户对WLAN的吞吐量、时延等性能需求越来越高。在用户需求的驱动下,802.11标准也在不断演进。然而,目前标准的演进工作主要集中在物理层,如果没有对管理接入控制的媒体接入控制(Media Access Control,MAC)层协议的进一步优化,最终用户能从改进的物理层性能中获益甚少。另一方面,为了提升区域吞吐量,多WLAN接入点(Access Point,AP)联合部署已成为必然趋势。然而,不同于地面AP的二维部署,基于WLAN的无人机(Unmanned Aerial Vehicle,UAV)通信网络对AP部署提出了新的挑战。综上所述,本文从接入控制和AP部署的角度出发,一方面对WLAN的MAC层协议进行优化,研究MAC层中亟待解决的接入控制问题,提升WLAN的吞吐量、时延和公平性等性能指标;另一方面,优化UAV通信网络的三维部署,提升系统能效,实现持续的空中通信服务。本文的主要研究内容和贡献如下:1.高接入负载下MAC层增强型退避算法研究随着智能设备的不断普及,WLAN接入节点的数量日益增长。在高接入负载下,802.11标准的二进制指数退避算法(Binary Exponential Backoff,BEB)会引发严重的传输碰撞和短期不公平问题。针对高接入负载的WLAN场景,本文对BEB算法进行改进,提出了增强型退避算法,以减少碰撞概率提升短期公平性。首先,本文将退避区间设计为不相交且线性增长的,以此减少碰撞概率;然后,本文通过减缓竞争窗口的重置速度来提升短期公平性:一个节点只有连续多次传输成功后才能减少竞争窗口至初始值。对于上述增强型退避算法,本文一方面使用离散时间三维马尔可夫链模型对所提算法的归一化吞吐量性能进行理论分析,另一方面通过仿真与其他退避算法对比验证了所提算法的优越性能。2.基于汤普森采样的802.11 ac WLAN速率自适应算法研究随着802.11标准的演进,标准的物理层愈加复杂。而多输入多输出(Multi-input Multi-output,MIMO)与信道绑定技术的引入,导致了802.11ac物理层巨大的传输速率查找空间。传统的速率自适应(Rate Adaptation,RA)算法无法快速且准确地收敛至最优速率。针对802.11ac标准,本文基于汤普森采样设计了 RA算法。首先,面对802.11ac标准巨大的速率查找空间,为了加快RA算法的收敛,本文通过移除部分速率来压缩查找空间;然后,受到多臂老虎机问题的启发,本文基于汤普森采样算法查找最优的速率。针对稳定信道环境和非稳定信道环境,本文分别设计了一般的速率自适应算法和加入滑动窗口的速率自适应算法。最后,本文通过仿真验证了所提RA算法可以获得比其他算法更高的吞吐量并且更接近性能上限。3.基于多智能体深度强化学习的按需信道绑定算法研究随着无线流量的不断增长,WLANAP的流量负载日益加重。为了满足各个AP的实时流量需求,本文基于深度强化学习理论设计了按需信道绑定算法,以减少整体网络的平均传输时延。为了避免动作空间“爆炸”,多智能体深度强化学习在该问题中被采用:每个AP对应一个智能体,智能体采用AP的缓存队列长度和负载到达率表征AP所处的状态,并将整体网络的平均传输时延和平均剩余缓存队列长度的加权和作为奖励。特别地,本文使用真实的校园WLAN流量记录来训练和测试所提算法的性能,训练测试结果表明所提算法具有良好的收敛性,并且能实现比其他算法更低的传输时延。4.基于深度强化学习的UAV空中AP三维部署算法研究由于UAV的能量限制,持续通信是UAV通信网络的关键问题。为了实现高能效、公平、持续的空中通信服务,本文提出了基于深度强化学习的UAV空中AP控制算法,实现服务与能量补充调度的动态平衡。首先,本文基于深度强化学习架构,将UAV空中服务与充电决策环境映射为UAV的位置、剩余电量以及用户数据量的状态空间,通过控制UAV的飞行方向和飞行距离,在持续通信的前提下实现能效与服务公平的最大化。其次,为了实现持续通信的动态平衡,本文通过大量的训练构造了基于公平性与能效的奖励函数。仿真测试结果表明,本文所提出的算法不仅实现了 UAV持续通信服务,还在保证服务公平性的同时获得了更高的系统传输数据量和能效。