论文部分内容阅读
导航定位在无人驾驶、公共交通等领域具有重大应用价值和前景,随着移动智能计算平台的普及,民用导航软件逐步深入民众生活.定位精度是影响导航软件体验的重要因素,但目前导航系统定位精度有限,依靠原始定位数据难以满足日常精确导航的需求.为解决这一应用痛点,本文首次提出导航定位吸附课题,将导航定位从确定“点”的位置,转移为确定“线”的位置,旨在提高路线规划中导航起始道路位置的精准度,解决了导航规划中,起始导航位置定位准确率低的问题,为后续合理的路线规划奠定了基础.鉴于路网数据的保密性,本文将课题研究内容简化为判断某条路是否为导航发起时的真实道路的二分类问题.在实验过程中,借鉴轨迹匹配的思想,结合发起导航时的GPS信息、发起导航前的前序辅助GPS点信息、当前GPS点周围道路信息以及路网信息四部分基础数据,共计生成218个特征.经单因素以及多因素方差分析验证,在95%的置信水平下,89.5%的特征能够单独区分正负样本,9.1%的特征在与其他特征结合时能够区分正负样本.实验中,数据样本量为21100,其中正负样本比例接近3:2,近似为平衡数据.实验前后分别使用了SVM,RF以及XGBoost算法进行五折交叉验证.结果显示,对样本整体而言,基于径向基函数的SVM模型最高预测准确率为76.44%,模型训练耗时9.74s;基于Gini不纯度的RF模型最高准确率为80.01%,模型训练耗时1.45s;基于对数似然损失函数的XGBoost模型最高准确率为82.61%,模型训练耗时8.48s.XGBoost模型训练时间较长与服务器性能有较大关系,由于资源有限,本文仅在双核服务器下运行程序,因此没有彰显出XGBoost支持并行的优势.针对正负样本而言,SVM算法预测准确率、召回率以及F1值均极不稳定;RF算法预测结果均较为稳定,其准确率、召回率以及F1值维持在70%~80%之间,但负样本各项指标均低于正样本;XGBoost算法与RF一致,对正,负样本的预测较为稳定,负样本的各项指标均低于正样本,但准确率、召回率以及F1值能基本维持在85%左右.实验中,负样本各项指标均低于正样本的现象与负样本为构造样本有关.此外,对比RF与XGBoost算法Top10重要度特征,结果显示有60%的特征重合.RF中辅助GPS高精度分布特征并非预期的重要特征,按照常理该特征不应作为重要特征出现.而XGBoost算法的重要特征均与预期相符,是较为准确的重要特征排序,具体排序结果为:道路长度、机头方向、起点流量、导航点到道路的垂足距离、垂足点距离道路上游出口的长度、导航点GPS精度、连通道路长度、辅助GPS机头方向最大值、辅助GPS机头方向平均值、道路Formway.综上,XGBoost算法对本文课题具有最佳的预测能力,二分类准确率达82.01%.在本次实验中,共采用了三种不同类型的模型进行二分类.模型算法由简单到复杂,从弱学习器到集成学习,算法覆盖了凸二次规划、决策树以及提升树.在逐步提高模型复杂度的同时,降低模型方差以及偏差,实现了模型预测精度的逐步提升,是有效的模型选择方案.但不足之处在于,数据样本量相对不足,无法实现分城市,分GPS数量等级预测,以进一步提高预测精度。