论文部分内容阅读
3G网络的普及加速了人们迈向互联网时代的步伐,通信运营商拥有庞大的3G用户数量,越来越多的研究人员加入到3G网络数据分析与研究的行列中。但是目前对于3G网络数据的研究主要是基于运维数据的用户移动行为的分析与研究,很少涉及到用户的网络行为。在当今互联网的大时代下研究用户的网络行为有着十分重要的意义。通过研究移动用户的网络行为,运营商除了能够持续跟踪记录用户的网络行为、探索用户深层次的业务需求,还可以将研究的结果用来指导制定运营商的营销策略,真正的实现面向用户的精准营销。在对用户网络行为的研究中,本文首先利用采集的3G核心网数据实现了移动应用的识别,接着设计实现了用户网络行为的识别与预测系统,较为全面地分析与挖掘了用户的网络行为,本文的研究工作主要分为以下几部分:1.本文首先介绍了用户网络行为研究的目的以及国内外关于此课题取得的一些研究成果;接着介绍了3G核心网数据的采集与预处理,确定了数据的采集接口并给出了源数据预处理的实现过程,得到了可供分析使用的数据集。2.实现了移动应用的识别与用户网络行为偏好的分析。通过DPI技术,本文分析了目前主流的移动应用并且提取出了每种移动应用的特征值,然后根据这些特征值建立了移动应用特征库,通过采集数据与特征库的匹配识别出用户使用的移动应用;在移动应用的识别基础上,本文提出了基于分散度识别算法的用户网络行为偏好分析系统,对用户的上网偏好进行了分析,实现了对移动用户上网时段与上网内容偏好的识别。3.本文通过决策树算法建立了网络行为的预测模型,实现了用户网络行为的预测;通过对比常用的决策树算法,本文选择C4.5算法建立决策树,同时给出了处理连续型属性的方法,完成了连续型属性的离散化过程;接着通过后剪枝技术实现了对预测模型的剪枝与优化,并给出了详细的实现方法,最后得到了较为可靠的网络行为预测模型。