论文部分内容阅读
数据可视化是针对数据在视觉表现形式方面进行研究的科学。数据可视化目标主旨是通过图形化的手段,能够清晰有效地传达和沟通信息。非法分子通过伪基站非法发送垃圾短信,进行广告发送或实施诈骗,对社会造成极为恶劣的影响。伪基站能借助简单的设备实现移动,位置信息难以获取。如何发现伪基站的时空分布规律,揭示伪基站的行为模式,直观展示伪基站的动态变化规律成为伪基站数据可视化的研究重点。首先,针对垃圾短信内容分类问题,提出一种基于关键词的垃圾短信分类算法来提高文本分类的准确性,采用基于内容的短信分类算法,结合相关的文本关键词提取技术,确定垃圾短信内容的主要关键词。对垃圾短信在地图上按时序进行动态模拟。结合相关统计方法对垃圾短信进行可视化展现。其次,针对如何确定是否为同一伪基站发送的垃圾短信问题,提出一种以时间、经纬度点、垃圾短信内容为归类条件的归类方法,以提高垃圾短信归类的准确性。针对大量垃圾短信地图显示混乱问题,通过不同颜色标记不同内容的垃圾短信来提高各个垃圾短信地理分布的展现效果;在地图中嵌入饼图和柱状图,显示各个分类短信的内容分布情况,方便进行数据分析。再次,针对发现具体伪基站移动变化规律的问题,提出了一种伪基站路线模拟算法,来模拟伪基站移动路径。同时采用对垃圾短信位置聚合的算法,来提高模拟位置的准确性。为了更全面探索伪基站垃圾短信的时空变化规律和行为模式,基于不同的时间粒度和空间粒度设计了多种可视化视图;提出了时空结合的可视化分析方法。最后,采用上述方法设计伪基站行为模式可视化框架,使用伪基站数据对本文提出的方法进行了实验,验证了本文方法的有效性。