基于强化学习的无线资源管理算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:pomerku
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的高速发展,第五代移动通信系统成为当前关注的重点。不同的应用场景对网络有不同的需求,采用基站超密集部署以提升网络容量,采用网络切片技术以满足服务质量迥异的业务需求。因而,基站选择策略和网络切片资源管理算法就成为学者们研究的热点。3GPP在R14中提出了双连接方案,即用户可以同时连入4G基站与5G基站。在该场景下,传统的基于接收信号强度的算法已经不再适用于基站选择问题,无线接入网侧的网络切片资源管理也需要专门设计。因此,在双连接场景下,本文分别以用户为中心和以基站为中心,研究了基于强化学习算法的移动通信网络资源优化问题,主要研究内容如下:(1)针对已有基于强化学习算法的基站选择策略收敛较慢且无法适应网络场景动态多变的问题,提出了一种基于强化学习的双连接基站选择算法。该算法以用户设备为中心,以最大化用户吞吐量为目标。该算法将基站选择问题映射为一个强化学习问题:将用户设备作为学习者,将无线接入技术选择策略作为动作空间,将当前时刻连入基站所获得的吞吐量作为回报值,从而计算出下一时刻选择各个基站的概率。仿真结果表明,相比于传统的基于接收信号强度的算法,在双连接场景下,所提算法减少了用户设备切换次数、提高了统计时间段内用户的总吞吐量。(2)针对双连接场景中网络切片资源管理问题,在无线接入网侧,提出了一种基于深度强化学习的网络切片资源管理系统。该系统为了合理地分配整个系统内的无线资源,将最大化用户满意度与资源利用率的加权和作为优化目标。首先,提出在该场景下需要研究的问题,分别为切片级和用户级的资源分配问题;然后,针对该问题设计了一种网络切片资源管理系统,该系统包含两个模块,分别解决上述两个问题;最后,对所提网络切片资源管理系统设计了系统状态、回报和用户信息采集的信令流程。(3)针对所提网络切片管理系统,基于深度Q学习算法具体实现了该系统中的切片级资源管理问题。由于传统的Q学习算法并不能适用于状态空间连续的情况,因此添加并训练了一种神经网络,即利用深度Q学习算法灵活动态地调整个系统的切片资源,并映射到各个基站上。该算法将切片资源管理问题映射为一个深度强化学习问题:将中央控制器作为学习者,将系统的切片资源分配情况和用户满意度情况作为状态空间,将系统的切片资源的动态分配作为动作空间,将系统的资源利用率与用户平均满意度作为回报值。仿真表明,在双连接场景下,所提算法在保证用户满意度的同时提升了资源利用率。
其他文献
绩效管理是公共管理学提出的概念,属于人力资源管理的范畴,在西方得到广泛的应用。实践证明,建立完善的绩效管理体系,有助于促进个人的发展,保证组织目标的实现。我国处于社
自21世纪初以来,移动和网络技术已进入快速发展阶段,我们生活的各方各面都受到互联网技术的影响,随之兴起的交叉领域互联网金融也因其良好的前景在最近几年迅猛发展,各类理财APP如喷井般涌现,市场竞争越来越激烈。与此同时,随着理财APP逐渐饱和,获取新用户不仅成本越来越高同时也越来越困难,而新用户下载应用之后,却有很高比例的人没有进行理财,这对理财平台是极大的损失,因此关注新用户理财转化有很大现实意义的
人类经济飞速发展,对能源的需求越来越大,但当前现状并不乐观,传统能源被过度使用,材料利用率较低,释放出大量的废热,环境被污染,各国正极力探寻解决问题的措施,当前备受关注
在过去的十几年里,拓扑能带理论的发展为电磁波的操控提供了新的有效的方法。利用光子晶体、人工表面等离激元晶体等人造晶体结构,观测到了一系列有趣的光学拓扑现象,如受拓
由于生物学反应的复杂性,传统的体相检测技术可以检测到反应过程的总体变化,但很难对生物反应的分子过程和瞬时状态进行直观的检测。近些年来兴起并逐渐成熟的单分子技术包括
北特鲁瓦油田位于滨里海盆地东缘,沉积环境主要以碳酸盐岩台地相为主,其主要为带凝析气顶和边底水的构造-岩性复合型层状碳酸盐岩油气藏。随着油田进入全面开发的阶段,目的层
离子液体是化学化工领域的一类新型绿色介质,具有良好的稳定性、导电性、可设计性、特殊溶解性以及不易燃、蒸汽压小等特性。其中烯丙基类离子液体与传统烷基类离子液体相比,
高原低涡是造成高原及其东部周边地区降水的主要天气系统,掌握其活动的规律及变化特征有着十分重要的科学意义。本文主要分析了在夏季青藏高原的低涡系统与高原地表感热的自
在众多聚合物中,聚四氟乙烯(PTFE)凭借良好的摩擦性能,广泛应用于航空工业、机械、电子电器等领域。PTFE作为一种理想的自润滑材料,在高载、低速滑动工况下摩擦因数可低至0.0
近年来,全球数据呈现爆炸式增长,这虽然给人们提供了更丰富、全面的信息资源,但是也给信息检索带来了困难。搜索引擎作为人们获取网络信息的主要手段,在新的时代背景下,还存在一些不足,比如:噪声数据多、返回结果重复、不够精简等。为了解决上述问题,问答系统应运而生,并凭借其快速、高效、准确的优点得到了快速发展和广泛应用。但在实际应用中,输入语句不完整、语义表述不清等问题对问答系统的性能产生了很大影响。因此,