论文部分内容阅读
标识网络是基于标识分离映射思想而设计的新型互联网络,通过引入接入标识与路由标识分别表示用户的身份与位置信息,解决了传统网络中因IP地址“二义性”所导致的在移动性、安全性、扩展性等方面的缺陷。然而,标识网络具有大规模部署、设备众多、场景复杂等特征,缺乏与之相匹配的高效的管理系统。为了保障接入交换路由器、标识映射服务器、数据中继服务器等各设备的健康运作,以提供稳定可靠的标识分离映射机制,设计标识网络场景的网络管理系统尤为关键,对于丰富标识网络体系内容具有十分重大的现实意义。本文基于该场景,设计并实现了标识网络分域管理系统。在对各设备进行分域管理的同时,提出了一种基于深度强化学习的设备放置策略方案,以最小化累计管理成本,更有力地保障标识网络的可控可管性。本文的具体工作如下:首先,概述了与标识网络、网络管理和分域管理相关的国内外研究现状,简述了标识网络的组网模型,并介绍了网络管理和深度强化学习的相关技术原理。其次,分析了标识网络分域管理系统的设计需求,给出了总体设计与模块化设计,并对各功能模块和策略模块的实现做了阐述。其中,管理信息库模块对各设备与各个管理域的具体被管对象进行了抽象定义与组织,提供了管理的基础。同时,针对现有网管协议的不足,设计了标识网络分域管理协议,提供故障管理、性能管理和配置管理功能的交互。还有管理数据库模块支持对管理数据的维护。此外,基于分域管理功能,设计并实现了基于深度强化学习的设备放置策略模块:通过对新设备上线、域管理站故障和负载过重场景的分析,总结了设备放置问题;在此基础上定义了管理成本函数,并建立了马尔可夫决策过程模型,包含状态空间、行为空间和奖励机制等内容;基于该模型,采用深度强化学习合理感知环境状态,生成最小化累计管理成本的设备放置决策序列,以保障各个管理域的负载均衡,提高系统的可用性与扩展性。最后,搭建了相应的测试拓扑对管理功能和策略性能进行测试,验证了网络管理协议、故障管理、性能管理、配置管理及管理数据库等功能模块的有效性。同时对比分析了不同算法策略、不同参数模型对各性能指标的影响,验证了在分域管理的基础上,本文提出的设备放置策略方案在管理成本和管理负载均衡等方面具有更优越的表现。