基于深度强化学习的数据中心光互连拓扑研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:whhdgcr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据流量需求的不断增大,以及下一代高性能数据中心对处理速率和链路带宽需求的不断提升,传统的电交换网络已经无法高效承载高速数据交互的需求。同时,随着云计算、物联网、流媒体行业的快速发展,部署在数据中心中的应用类型日趋多样化,其流量分布特征差异较大,传统的数据中心都是基于固定的网络连接结构与路由策略,其适应性和灵活性差,无法保证网络性能。近年来,在交换技术方面,得益于光交换对链路速率和数据的透明性,基于光电混合交换技术的互连架构打破了传统电交换网络在带宽和功耗等方面的局限性,同时避免了全光交换的快速控制和冲突解决问题。在网络控制方面,软件定义网络、深度强化学习、意图驱动网络等技术得到了长足的发展,使得在光电混合互连的数据中心中由一个统一的智能决策控制器来实现底层电、光交换设备的一体化管控成为可能,进而实现流量的精确调度。基于上述分析,光电混合组网技术具备灵活的链路连接特性,这为网络拓扑重构以适配不同应用和服务产生的各种流量分布提供了可能性。因此,本文针对传统数据中心电互连网络在应对业务动态流量时存在适应性差的问题,从路由优化和拓扑优化两个方面来对数据中心业务进行优化重构。(1)在优化策略方面,本论文采用DDPG深度强化学习算法,通过与基于OMNeT++的网络仿真系统与深度强化学习模型的迭代交互,来让模型学习复杂任务控制策略,实现对拓扑结构与业务流量分布关系的持续训练。(2)同时,为了实现网络重构的自动化控制,本文提出了一种新的网络架构,在光电混合网络的基础上使用SDN控制器来进行网络的规划,深度强化学习模型根据SDN控制器实时收集的业务流量分布信息,实现网络拓扑的自动优化重构,进而提升网络性能。实验结果表明,针对给定的流量强度,采用深度强化学习进行训练后的模型与未训练的模型相比,可以显著降低平均网络延迟和丢包率。
其他文献
全光微分器是全光信号处理系统中的重要组成部件。随着信号处理系统的不断发展,人们对系统的响应速度和频率提出了越来越高的要求。传统的信息处理普遍采用光-电-光转换模式,这种模式的缺点在于电信号的处理部分频率响应有限,使得整个系统不能响应高频信号。因此,对于高频信号,光-电-光处理模式已经不能满足需求,未来信息技术发展的趋势是要突破光域信号处理技术,全光信号处理系统将取代现存的光-电-光信号处理模式。硅