论文部分内容阅读
通信网高速迭代升级带来多维度信息混乱问题,如格式不一致、信息缺失等,容易造成通信网有效数据(如故障数据)“质差”和“量少”两大问题,难以支撑数据驱动型算法正常实施。数据增强技术可用于扩增并优化小规模数据集以解除算法在数据层面上的限制。本文以自优化通信网数据增强技术为中心,围绕数据增强的“自优化、条件性、高拟合”三点核心挑战,主要完成了单条件定长数据增强、多条件变长数据增强两项研究工作,缓解了通信网关键数据短缺的重要问题,显著提升了通信网场景下人工智能模型的性能。主要工作和创新成果如下:(1)针对单一条件定长通信网有效数据自优化增强的技术挑战,研究并提出对抗生成网络框架下基于多层感知机的单类型定长通信网数据增强方法,在对抗生成网络的半监督机制下采用一个多层感知机自优化调整并学习原始测量数据数据分布规律,另一个多层感知机用于数据规范化参数的生成以降低模式崩溃风险。(2)针对多条件变长通信网有效数据自优化增强的技术挑战,研究并提出了对抗生成网络框架下基于卷积神经网络和循环神经网络的多类型变长通信网数据增强方法,一方面在算法一基础上引入循环神经网络作为增强模型生成器并采用小批量生成策略进行训练,使得模型能学习和合成变长序列数据,提高脏数据利用率,同时能够更好地捕获通信网数据时间特性;另一方面引入卷积神经网络,用于识别包括拓扑数据类型在内的不同标签数据,协同循环神经网络生成对应标签的通信网数据。(3)本文采用从某运营商骨干传输网采集的数据以及英国骨干网流量数据作为数据集对两个算法进行仿真验证。结果表明,算法一中增强前后单类型定长数据分布图重叠度达90%以上且所训练的单目标预测模型准确率高达100%,算法二中多类型变长数据在增强前后数据分布直方图重叠度达95%以上,多目标预测模型准确率提升到98%以上。相较于算法一,算法二在原始脏数据利用率提升50倍以上,增强后数据自相关性与原始数据高度拟合。