论文部分内容阅读
针对大规模浮动车数据应用环境中的快速地图匹配问题,本文设计并实现了一个分布式并行地图匹配系统,重点探讨了以下三个方面的问题:
第一,多核集群环境下分布式并行地图匹配系统设计。本文选择Windows HPC Server2008 R2作为系统集群,从网络拓扑与节点设置等方面阐述了集群设计。针对消息传递编程模型无法充分利用多核处理器计算资源的缺陷,本文将消息传递编程模型与共享存储编程模型相融合,设计了混合式并行编程模型,通过两级并行的方式实现对多核集群计算资源的充分利用。在运用现有分解策略对匹配系统的并行模型进行适应性分析后,认为数据并行是最符合集群特点的任务并行模式。
第二,新型待匹配路段初筛算法设计。现有待匹配路段初筛算法用冗余网格的策略来保证网格的置信度,针对这种缺陷,本文提出了网格置信度的量化计算方法,并根据待定位点离网格中心越近,网格置信度越高的原理,设计了新型的待匹配路段初筛算法。文章详细描述了新算法的网格划分规则和网格索引计算方法并对算法复杂度和算法优化能力做出了评估。
第三,内存数据库应用探索。文章提出利用内存数据库策略来避开高频率检索中磁盘数据库I/O开销的设想,并将SQLite内存数据库作为实验案例,探索内存数据库对匹配系统效率的优化效果。
在上述内容基础之上,文章实现了分布式并行地图匹配系统原型,并设计了三组实验。分别从待匹配初筛算法、不同数据存储方法和并行编程模型三个方面验证本文所提方法的改进效果。结果表明,新型初筛算法能将系统处理效率提升1~3倍;SQLite内存数据库可将匹配速率提升0.6倍;混合并行编程模型能将系统处理效率提升1.7~2.0倍。本文的研究成果可为大规模浮动车数据处理提供有实际参考价值的解决方案。