论文部分内容阅读
IP_TASCM(IP Trace Analysis System based on Code Moving)数据平台是CERNET华东(北)地区网络中心,为了支持网络测量数据的整理和分析所开发的一个IP TRACE采集、分析和结果共享的软件平台系统。该系统需要存储大量的IPTRACE以满足研究需要。本论文的研究和开发工作围绕该数据平台的数据管理系统进行,该系统能够以合理的方式和有效的手段对IP_TASCM平台中IP TRACE进行高效的管理,使磁盘空间和IP TRACE信息资源都可以得到最合理的利用。
论文首先讨论分析了数据管理系统的需求,并根据需求确定了论文研究目标和研究内容。
随后,论文对数据管理系统有关的关键问题进行了讨论和解决,包括数据压缩算法的选择与改进,数据预测和数据管理算法的设计,数据还原的模型与算法等。
其中压缩算法包括文本压缩、抽样和聚类3类方法,并给出了单独压缩和组合压缩方案。数据预测方法根据对数据量变化规律的分析从传统的预测方法中进行选择并改进。数据管理算法采用背包算法的改进方法,使得磁盘空间和数据资源都可以得到最合理的利用。而还原模型根据网络协议的特点以及应用对还原流量的要求,分别设计了不同的模型,包括3个TCP还原模型和2个UDP还原模型。
依据以上这些问题的研究并结合系统需求,从6个方面给出了系统的功能和相应的结构设计,并给出了各个模块具体的结构和算法流程,最终实现了数据管理系统。
最后,论文设计了2个方案对数据管理系统进行了测试。方案1模拟了系统即将满的情况,测试了系统给出的管理策略。方案2对一段IP TRACE进行压缩和还原并对比了结果与原数据,证实了还原的可靠性。