论文部分内容阅读
近年来,随着定位技术的发展和附有GPS功能的智能设备的普及产生庞大规模的轨迹数据,同时,随着大数据处理方式的不断发展进步还有人们不断变化的市场需求,人们逐渐可以发现并挖掘出这些轨迹数据所蕴含的价值,比如在揭示移动对象历史轨迹的同时也可以精确地反映出其运动特点和规律等。故而,愈来愈多的国内外研究学者将研究重点转移到移动对象轨迹预测问题上面。针对互联网海量的移动对象轨迹数据,本研究提出一种Prefix PTPA轨迹预测算法,该算法的主要思想是,首先对数据进行数据清洗和预处理并提出一种基于经纬度分类的轨迹处理算法,然后对数据进行停留点探测以及聚类的操作,其中在轨迹聚类提出了一种改进的DBSCAN密度聚类算法,一系列数据处理最后将GPS轨迹集转化为轨迹序列,并结合序列模式挖掘算法进行预测。通过与马尔科夫预测模型等经典算法比较,实验结果表明Prefix PTPA轨迹预测算法有优势,算法的平均预测准确率有所提高。本文的主要研究内容如下:由于原始数据集规模巨大而杂乱,可能存在格式不满足要求的情况,基于此本研究提出了一种基于经纬度分类(ABLLC)的数据处理算法,从经度和纬度还有时间三个维度去除不合规范轨迹和大量重复轨迹,虽然数据预处理会浪费一定时间,但是为后续轨迹预测研究数据处理节省大量时间,总体上会使得预测结果更加快速和精确。其次在停留点聚类处理过程中,提出了一种新的密度聚类算法VP-DBSCAN,该算法是为了改善由于DBSCAN算法参数固定以致于算法不能很好地适应密度不均匀的数据集的缺点,因此本研究提出了可变参数的思想,来实现对具有不同密度的簇的数据集进行聚类,使得聚类结果更加准确。最后本研究对比基于Markov链的轨迹预测方法,在序列模式挖掘算法Prefix Span的基础上提出了PrefixPTPA轨迹预测算法。通过实验和对比算法比较,表明该预测算法的平均准确率有一定程度的提高,能取得较好的预测结果。