基于序列模式挖掘的轨迹预测算法研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:buffon149
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着定位技术的发展和附有GPS功能的智能设备的普及产生庞大规模的轨迹数据,同时,随着大数据处理方式的不断发展进步还有人们不断变化的市场需求,人们逐渐可以发现并挖掘出这些轨迹数据所蕴含的价值,比如在揭示移动对象历史轨迹的同时也可以精确地反映出其运动特点和规律等。故而,愈来愈多的国内外研究学者将研究重点转移到移动对象轨迹预测问题上面。针对互联网海量的移动对象轨迹数据,本研究提出一种Prefix PTPA轨迹预测算法,该算法的主要思想是,首先对数据进行数据清洗和预处理并提出一种基于经纬度分类的轨迹处理算法,然后对数据进行停留点探测以及聚类的操作,其中在轨迹聚类提出了一种改进的DBSCAN密度聚类算法,一系列数据处理最后将GPS轨迹集转化为轨迹序列,并结合序列模式挖掘算法进行预测。通过与马尔科夫预测模型等经典算法比较,实验结果表明Prefix PTPA轨迹预测算法有优势,算法的平均预测准确率有所提高。本文的主要研究内容如下:由于原始数据集规模巨大而杂乱,可能存在格式不满足要求的情况,基于此本研究提出了一种基于经纬度分类(ABLLC)的数据处理算法,从经度和纬度还有时间三个维度去除不合规范轨迹和大量重复轨迹,虽然数据预处理会浪费一定时间,但是为后续轨迹预测研究数据处理节省大量时间,总体上会使得预测结果更加快速和精确。其次在停留点聚类处理过程中,提出了一种新的密度聚类算法VP-DBSCAN,该算法是为了改善由于DBSCAN算法参数固定以致于算法不能很好地适应密度不均匀的数据集的缺点,因此本研究提出了可变参数的思想,来实现对具有不同密度的簇的数据集进行聚类,使得聚类结果更加准确。最后本研究对比基于Markov链的轨迹预测方法,在序列模式挖掘算法Prefix Span的基础上提出了PrefixPTPA轨迹预测算法。通过实验和对比算法比较,表明该预测算法的平均准确率有一定程度的提高,能取得较好的预测结果。
其他文献
当前以社交网络为代表的复杂网络规模庞大且充满活力,如Twitter的日活跃用户数量超过为1.34亿,Snapchat的日活用户数超2亿,Facebook的月活用户突破20亿。这些海量数据构成了
禾本科,也称作牧草家族,是一个开花的单子叶植物种类。家族成员包括主要的粮食作物、为食草动物提供食物的牧草以及具有陆生生物环境多样性的植被。因此,禾本科是研究物种多
我国土壤盐渍化愈来愈严重,其主要分布的位置在华北、西北及沿海地区,最突出的是宁夏地区。本文以宁夏石嘴山市惠农区燕子墩乡为例,分析该区域降雨蒸发前后,水盐运移的动态变
目的:①比较所有研究对象及各组间CAP与PAP的关系;及其在新疆维吾尔族、汉族中所有研究对象及各组间是否有差别。②探讨尿微量蛋白与CAP及PAP的关系,及其在维族、汉族间的差
堆石料是土木、水利等工程建设中普遍使用的材料,受颗粒破碎及排列、级配、石料成因、渗透性等因素影响,其强度与变形特性描述非常复杂。堆石料的强度变形特征,不仅受其宏观
近年来计算机的计算能力不断提高,卷积网络被广泛的应用到图像处理任务之中,计算机视觉领域中各项视觉任务的检测性能得到了提高。目标检测任务是计算机视觉领域的重要任务之
随着社交网络的不断发展,社区发现已经成为复杂网络领域的一个重要的研究热点。若干个社区组成了一个完整的网络,在社区的内部,节点之间的连接相对紧密,而社区与社区之间节点
在文献中,有关影响回指消解的因素探究仍无一致定论。有些学者认为回指消解与先行词有关(Caramazza et al.,1977;Nicol et al.,1989;赵冬梅、刘志雅,2006;李榕,2016;吴明军、
社交事件发布及参与平台越来越受到人们的关注,这种线上与线下相结合的全新方式不仅具有传统的线上交流功能,而且将网络社交放到了现实,其主要功能是为用户提供一种社交事件
随着工业生产设备的自动化水平不断提高,现代工业过程更趋向于集成化、复杂化和智能化。如何准确及时地排除生产过程中的故障,对于保证生产安全至关重要。近几年,传感器技术