论文部分内容阅读
随着智能移动终端及各种具备定位功能设备的普及,人们能够很方便的获取到个人的移动轨迹。这些轨迹是很多基于位置服务的基础,其中包含了大量有价值的知识模式。通过对轨迹数据进行分析,可以为用户画像、热点区域检测、城市交通监控及城市功能区识别等提供支持。通常原始的轨迹中会包含大量的冗余数据,数据量较大;并且随着用户规模的增大,轨迹数据的量几乎呈指数级增长。海量的轨迹数据不仅会占用大量的存储空间,还会对数据的传输和处理造成巨大的挑战。轨迹压缩技术能够在损失少量信息的前提下,大幅度的减少轨迹数据存储所需的空间,方便数据的传输与处理。传统的基于位置信息保持(Position-Preserving)的轨迹压缩算法关注于捕捉轨迹的位置信息,在压缩过程中易造成移动对象方向信息的丢失。然而,轨迹的方向信息对于描述轨迹的语义起着至关重要的作用,移动对象方向的改变表明了用户的行为(停留、拍照等)。并且很多基于轨迹的数据发现任务十分的依赖于轨迹的方向信息,例如:轨迹聚类与分类、地图匹配及异常轨迹检测等。在线压缩算法具有支持在线压缩的优势,在轨迹压缩算法中扮演着重要的角色。但对于现有的在线压缩算法而言,其不仅存在着方向误差不可控的问题,还存在着同步欧式距离(Synchronous Euclidean Distance,SED)误差较大和压缩精确度较低的问题。为了进一步减小在线压缩算法的SED误差,本文提出了一个基于开放窗口时间比例算法(OPW-TR)的改进算法——局部最优化开放窗口时间比例算法(LO-OPW-TR).通过使用基于局部最优化的新锚点选择策略,该算法能够有效的降低SED误差。针对现有算法存在的丢失移动对象方向信息、丢失点和轮廓保持不佳的问题,在LO-OPW-TR算法的基础上,本文又进一步的提出了一个面向方向保持的轨迹压缩算法(HMOTC)。HMOTC算法不仅考虑到了轨迹中定位点之间的方向变化,还考虑到了定位点与轨迹段之间的方向变化,因此能够精确的捕捉轨迹的方向信息。通过增加对方向误差的控制,使得该算法能够更好的对轨迹轮廓进行控制,实现了更加精确的轨迹压缩。真实数据集和多种误差度量方式下的实验结果证实了 HMOTC算法的优越性。