论文部分内容阅读
网络流量数据处理技术是信息领域发展迅速的学科之一,处于很重要的地位。由于互联网业务不断丰富,新兴的网络应用持续增多,使网络流量数据的内容种类不断增加,网络流量数据的规模也呈指数级增加,这给网络的运营和管理带来难题,要解决这些问题,有赖于网络流量数据的有效和高效处理。本文首先介绍了网络数据流量的特点和数据处理的概念,以及处理海量数据的要点,分析了网络数据流量处理的总体流程,并在此基础上从其中的数据处理软件入手进行展开研究。数据库是最常用的数据处理软件,本文对其功能和性能特点进行了研究,并研究了典型的关系数据库系统和SQL语言的特点,对其性能优化的方面进行了研究。接着,设计了基于文件处理的数据处理软件,用C++语言编程实现,完成了数据文件的筛选、排序、连接、聚合和行列转换等常用数据处理操作,并对这些操作的流程和性能做了描述。最后,针对数据文件的行列转换处理,对SQL语言和该基于文件处理的数据处理软件做了性能分析和对比,并采用实际的网络流量数据进行测试。实验结果表明,该数据处理软件在特定的应用上比SQL查询的效率高出数十倍,而且性能更加稳定,不受聚合时间粒度的影响。