论文部分内容阅读
车辆轨迹重建是指根据车辆的离散GPS轨迹数据推断其在实际道路网络中的连续移动轨迹的过程。车辆轨迹重建主要包括两个处理阶段,即地图匹配和路径推断。第一阶段,通过地图匹配方法将某车辆原始的离散GPS轨迹数据映射到实际道路网络的对应路段上。此时,对于两个连续采样时刻的GPS轨迹数据,其映射的路网路段并不一定是拓扑连续的,因此在地图匹配阶段还无法得到该车辆连续的移动轨迹;第二阶段,路径推断方法结合道路网络拓扑结构以及路网全局GPS轨迹历史统计信息,推断车辆在当前时刻的匹配路段和上一采样时刻的匹配路段之间的连续移动轨迹。车辆轨迹重建在各种基于位置的交通信息服务领域中具有重要的应用价值,如城市规划、交通流预测、路径推荐等领域。但是,在实际的城市路网环境下进行车辆轨迹重建时,由于在低频采样而导致的GPS轨迹采样点的稀疏性以及其测量噪声等因素的影响下,地图匹配方法的准确性难以得到保证。同时,由于低频轨迹数据中的采样时间间隔较长,这将导致两个相邻采样时刻的轨迹数据对应的匹配路段之间存在的候选轨迹集合变得很大,在实时性约束条件下,如何在上述候选轨迹集合中为车辆推断出合理的连续轨迹变得具有挑战性。首先,本文针对城市路网环境下的低频采样GPS轨迹数据,为了获得较高的地图匹配准确性,提出了一种基于隐马尔可夫滤波器的地图匹配方法。相对于已有算法,所提方法能够进一步有效提升地图匹配算法的准确率;进一步,提出了一种时空约束下的贝叶斯路径推断模型,能够实现对车辆在两个相邻采样时刻对应的匹配路段之间的移动轨迹进行有效推断;在上述工作的基础上,提出了一种并行化流式车辆轨迹重建模型,在保证准确率的情况下,能够实时地处理大规模的车辆轨迹重建问题。本文具体研究内容如下:(1)实现了针对大规模车辆GPS轨迹数据的预处理方法。首先对原始GPS轨迹数据进行特征分析,提出了车辆GPS轨迹数据的清洗规则;为了验证算法在不同采样间隔下的性能,对清洗过的车辆GPS轨迹数据进行了不重叠抽样;对城市路网地图使用Geo Hash网格法进行划分,在地图匹配时不仅有效地减少了候选路段的数量而且能够更高效的进行GPS轨迹点的候选路段提取,进而有效改善了地图匹配方法的性能。(2)针对城市路网中低频采样的GPS轨迹数据,提出了一种基于隐马尔可夫滤波器的地图匹配方法。该方法在保证准确性的基础上可以进一步提高地图匹配方法的鲁棒性;为了进一步提高地图匹配的准确率,修正了地图匹配中传统的观测概率计算模型,并在转移概率计算时引入了空间约束条件进行约束。(3)考虑到驾驶员在路径选择时的随机性,提出了一种时空约束下的贝叶斯路径推断模型。该模型可以有效地推断出车辆在两个连续的轨迹点对应的匹配路段之间的行驶轨迹。该方法将路径推断问题转换为根据候选路径的联合后验选择概率来搜索K个最可能候选路径的问题。其中,在估计模型参数时,考虑了历史GPS轨迹中每个路段的频率,而不是路段转移次数,从而减轻了稀疏GPS采样带来的影响,提高了路径推断的准确率。另外,本文在该模型中引入了时空约束和概率阈值约束条件以减小搜索空间,从而显著提高了模型的性能。(4)针对城市路网中的大规模车辆轨迹重建问题,提出了一种并行化流式车辆轨迹重建模型。同时将该模型在Spark Structured Streaming框架上进行实现,并在分布式集群中对所提模型的性能进行测试评估。