基于动态规划和DTW匹与的时间序列索引方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:marsmoonhoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,时间序列在包括金融、生物等领域得到广泛应用,越来越多的受到学者的关注和研究。在其众多的研究领域中,时间序列的相似性查询问题得到了较为广泛的研究,该问题常常转化为建立时间序列索引问题。尽管动态时间规整(DTW)是用于计算时间序列相似性的强有力工具,但是由于该算法不满足三角不等式,且时间复杂度较高,因此很难直接用于建立时间序列索引。为了解决DTW算法存在的问题,研究者引入了下界(low-bound)算法,并利用下界距离建立时间序列索引。下界距离严格小于等于DTW距离,其与DTW距离的接近程度(tightness)决定了索引的效果。  本文对前人在时间序列索引问题上的研究做了综合性的回顾与评述,分析了现有算法的优点和存在的问题,并提出了一个全新的、基于动态规划的时间序列索引技术,建立了一种新型的索引树。算法利用DTW匹配关系对序列产生划分,提出了一种分段的索引结构,并给出了建立索引结构的算法。并根据索引结构的特点,给出了利用动态规划求解待查序列与索引结构的下界距离的方法,最后给出了相似性查询的过程。同时,为了更有效的建立索引,增加分段划分的有效性,提高索引效果,本文还提出了一种新型的计算两条时间序列中心的算法,并利用该算法为DBA算法求解初始解,从而优化了DBA算法求解多条时间序列的中心序列的效果。实验部分证明了本文提出的中心序列算法能够求解得到更有效的中心序列,在规整窗口较大时,本文的索引算法有着更接近DTW距离的下界距离,能够更有效的排除距离较大的序列,其索引效果要好于现有的索引算法。
其他文献
随着互联网的迅猛发展,出现了大量以视频会议、视频点播、远程教育应用为代表的新型多媒体会议系统应用需求。虽然基于ITU-T提出的H.323协议和IETF提出的SIP协议开发的会议系统
近年来,对于超混沌系统的研究引起了科学工作者的广泛兴趣。与低维混沌系统相比,超混沌系统至少在四维及更高维的非线性系统中具有两个或两个以上正的Lyapunov指数,具有更为
应急通信系统是应付紧急情况时使用的通信系统。应急通信涉及多个通信系统。应急通信将各种网络联合起来使用,优势互补、相互协作,以便更好地完成更复杂的通信任务。一旦通信
OMG组织将UML作为面向对象分析和设计建模语言的标准,因此,UML被广泛地用来对复杂问题建立模型。虽然UML可以较好地描述系统的行为特性,但它是不可执行的,只是对动态行为的静态描
房地产业的迅速发展使得对建筑物图形的需求越来越多。传统的房地产业绘图过程是测绘人员根据测绘数据制作测绘文档——通常是Excel表格,然后绘图人员依据测绘文档在CAD等软
随着计算机和企业办公自动化的普及,电子文档成为企业文档的最主要的形式。Internet的出现,加速了电子文档的交流,同时使得电子文档的数量急剧膨胀。企业对文档的应用也有了新的需求,文档由原来的信息的载体逐步转变为信息和知识的综合体。信息抽取应运而生,它是为了在大量的文本信息中找到用户感兴趣的信息点而产生的技术。谢菲尔德大学研发了一个信息抽取和自然语言理解的软件平台GATE(General Arch
移动终端技术的飞速发展,使得在移动设备上进行电子签名的需求日趋频繁,并且随着基于SM2的数字证书成为一种趋势,在移动办公环境中使用此证书进行数字签名的行为逐渐得到规范
计算机系统是一个复杂的结构,管理复杂性的关键是通过一些定义好的接口把计算机系统分成不同的抽象层次,使得底层的实现细节可以被忽略,简化高层组件的设计。然而定义好的接
随着互联网的迅速发展及其应用的不断深入,人们对通信的需求也日益增长。个人通信的最终目标是任何人在任何时间、任何地点可以以任何方式实现任何类型的通信业务,因此,支持