基于增强学习的F-RAN编码缓存策略

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:studied1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
雾无线接入网(Fog Computing Based Radio Access Network,F-RAN)作为5G无线接入网解决方案之一,具有低前传链路开销、低传输时延、低网络拥塞等特点,提供了更多的通信信息与控制功能。深度增强学习(Deep Reinforcement Learning,DRL)结合了深度学习(Deep Learnning,DL)处理感知问题和增强学习(Reinforcement Learning,RL)处理控制决策问题的优势,可以解决现实中复杂场景下的感知决策问题。目前多数文献并未考虑文件流行度等环境参数变化场景下的F-RAN协作编码缓存和缓存替换配置问题,且经典算法在该场景下的应用具有局限性,因此可以结合人工智能(Artificial Intelligence,AI)范畴的DRL方法,在确定系统状态空间及动作空间的情况下,将协作编码缓存和缓存替换过程建模为离散时间系统(Discrete Time System,DTS)下单智能体的感知决策问题,通过智能体对变化环境的适应性探索并基于回报函数确定状态转移动作,给出编码缓存策略和缓存替换配置的局部最优解。论文主要以DRL启发式算法为主,如DB3C,CBA3C算法,解决了文件流行度变化场景下F-RAN中的协作编码缓存策略问题以及编码缓存替换配置问题,主要包括以下两部分研究内容和结论:(1)针对文件流行度变化场景下的F-RAN协作编码缓存策略问题,论文分析并构建符合该问题场景的DRL模型,采用基于DQN的启发式算法DB3C,确定系统状态空间和动作空间并根据缓存文件联合传输成功率确定回报函数,调整参数以实现算法在文件流行度变化场景下的收敛。仿真分别对比DB3C、RL算法、带编码最流行文件缓存算法及无编码最流行文件缓存算法在系统回报上的表现,证明DB3C具有较优的性能。(2)针对文件流行度变化场景下的F-RAN缓存替换配置问题,论文分析并构建符合该问题场景的DRL模型,采用Camul算法和A3C多线程训练模式相结合的启发式算法CBA3C,确定系统状态空间和动作空间,并综合考虑缓存命中率和系统开销推导回报函数,调整参数以实现算法在文件流行度变化场景下快速收敛。仿真分别对比CBA3C、LRU、LFU、MARKING 和 DQN 算法,证明 CBA3C 启发式算法能够在保证系统较好缓存命中率的同时取得较低系统总开销。
其他文献
近来,有研究发现电磁波(EM)的一种特性是同一频带下能够多路传输携带轨道角动量(OAM)的涡旋电磁波,并且不同轨道角动量模态的涡旋电磁波束之间相互正交。因此,轨道角动量可以作为新的资源应用于无线通信中。通过同轴发送多个OAM涡旋电磁波束,可以实现同时同频传输多路信号,这种基于轨道角动量的多模态复用将大大提升无线通信系统的容量及频谱效率。将OAM涡旋电磁波束应用于无线通信,首先要对轨道角动量的基本理
近年来,随着无人机技术的发展,无人机的应用范围越来越广泛,现已广泛应用于航拍、信息采集等领域。在无线通信领域,无人机也被视为未来无线通信网络中的一个重要承载形式。得益于其体积小、灵活性高等特点,搭载基站的无人机在一些特殊场景中被看作是有效解决通信问题的途径,例如灾后的通信恢复、短时大规模集会应急通信等。为了充分利用无人机的机动性特点,无人机的静态部署位置以及其动态轨迹优化是一个重要的研究内容。围绕
视频能够直观地给用户提供丰富的信息,用户也对视频相关的应用和服务有着极大的需求。但由于原始视频是由一帧一帧图片组成的,巨大的数据量给视频的存储和传输都带来了巨大的困难,因此原始视频需要经过压缩编码之后才能够投入使用。由于编码器与解码器的严格对应关系,视频压缩编码标准提供了统一的码流格式和相应的技术规范,这也使得视频编码标准成为了视频行业发展的基础。而视频分辨率的提高以及直播等新兴视频应用的出现也给