论文部分内容阅读
近年来,随着教育信息化工作的快速推进,高校无线局域网的逐步建设,以及移动智能终端的广泛普及,高校无线用户数量明显有激增之势,积累了海量无线网络数据。与有线网络不同的是,无线网的用户有较为明显的移动特性,加之当前无线网络支持用户无缝漫游,会产生大量漫游轨迹数据,从这些数据中提取有价值的信息以辅助决策,成为巨大的挑战。因此,对于无线用户漫游群体行为的应用研究显得尤为重要。本文基于北京交通大学校园无线网真实数据对用户的漫游群体移动行为进行数据挖掘分析,得出用户移动属性特征及聚类结果。首先,对基于无线局域网的用户群体移动行为轨迹研究现状进行了分析,介绍了校园无线用户数据常用的采集方式和数据预处理技术,在此基础上,扩展了无线用户移动漫游轨迹向量的定义,提出了基于相遇总AP数的无线用户加权相似性计算方法,选择基于层次的凝聚型聚类算法对无线用户进行聚类,并对聚类算法过程进行了设计和实现。其次,设计并实现了真实的校园无线网测量平台,主要采用syslog日志、SNMP和终端仿真telnet三种收集方式,从多家无线厂商AC上收集数据,经过结构化处理后存储至MySQL数据库,将无线网运行现状和用户移动行为特征等以图表方式直观展现出来。最后,选择Dartmouth学院无线网数据与交大无线数据作为实验对象,通过前期数据筛选标准与过滤后,分别对两个数据集进行基于用户加权相似度的计算,从而基于用户移动漫游轨迹向量对无线用户群体进行聚类,对实验无线局域网用户聚类的结果进行分析,验证了基于无线用户移动漫游轨迹向量的加权相似度聚类算法的适用性,根据聚类结果对无线用户群体行为进行了研究分析,并以北交大威海校区无线用户数据为例验证了本文提出的聚类算法,同样无线用户被聚类成不同大小的类簇,且聚类效果显著,达到验证目的。本文的研究有助于理解校园无线网的运行现状和规律,可为无线网络管理、网络性能优化和后期的网络规划提供参考依据,通过对校园无线网用户漫游历史数据进行聚类分析,根据用户群体移动行为,挖掘出同类用户,可为特定同类用户精准推送个性化、智能化服务。