论文部分内容阅读
随着生活水平的提高,私家车数量的增多,任意行驶、肇事逃逸等交通问题也越来越多,这些违法行为给人们的正常生活带来了严重的安全隐患,套牌车问题就是其中之一。套牌车辆活动区域往往相距较远,对其分析需要结合车辆的活动位置进行,因此,地域越广、时间跨度越大的车流数据能给套牌车检测方法带来一定的优势。而传统的套牌车辆检测方法一般在单机上运行,有限的存储与计算能力在一定程度上制约其利用海量数据进行套牌车辆检测。如何利用海量数据快速检测出更多更全的套牌车辆具有非常重要的研究价值与实际意义。本文根据最大速度不可达原理,提出了一种基于MapReduce编程模型的分布式套牌车辆检测算法,并分别在Hadoop和Spark平台完成算法的实现,与传统方法的对比实验结果表明,本文算法能够更快、更准、更全的发现海量数据中的套牌车辆。结合该算法与时间逻辑异常的轨迹拆分算法及其他辅助模块,本文设计并实现了一套基于云计算的智能交通卡口数据分析系统。该系统为用户提供了从数据收集到套牌车辆建模分析再到可疑车辆的轨迹展示的一站式服务;相比一般系统而言,具有更准确的套牌车辆检测精度,更快的计算速度,更灵活的建模方式,更高效的数据存储管理,以及更直观的轨迹展示等优势。本文基于分布式技术实现对海量套牌车数据的分析与检测,这不仅是对传统套牌检测方法的一次创新,而且是对分布式计算的一次探索与实践。对大数据分析及其在交通领域的应用具有实际意义。