论文部分内容阅读
随着信息技术和互联网的飞速发展,互联网日益成为人们工作、学习和生活的一部分。而在网络使用过程中,由于用户具有各自的兴趣爱好和访问习惯,因此他们关注的内容也不完全相同,使用网络的时间和服务也各不相同,并且不同的网络用户群体不可避免地带有各自的群体行为特征。了解网络用户的群体行为,能从更宏观的角度得到网络使用轮廓,一方面为用户使用网络提供一定的指导意义,帮助其更加充分合理的利用网络资源;另一方面也协助网络管理者进行异常流量检测等网络管理工作。校园网作为互联网的一个组成部分,其用户的专业性、多样性和使用网络的目的性较强,决定了它流量的复杂性比普通互联网用户具有更明显的特征。探究和了解校园网用户群体行为特征,可以为校园网的网络规划与建设等工作提供重要的理论基础,因此对校园网用户群体行为的研究显得日益重要。本文从校园网用户角度出发,把数据挖掘技术应用到用户网络行为分析当中,根据河南理工大学校园网用户上网的实际情况,运用了数据挖掘中一种基于划分的k-means聚类分析算法,并将这种聚类算法应用到用户最频繁使用的应用协议属性中,提高了聚类的质量和准确度。在分析结果的时候,结合河南理工大学校园网实际,针对用户上网的数据做了相应的统计分析,使结果更加全面,更具说服力。