基于动态时间规整的时序数据相似度量方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:qq174548079
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列数据广泛存在于生活的各个领域,针对时间序列的相似度量算法是机器学习重要的研究内容,广泛应用于生物序列分析、离群点检测等场景。动态时间规整距离(Dynamic Time Warping,DTW)是一种重要的时间序列相似性度量算法,该算法具有较好的弹性和鲁棒性,但同时DTW存在病态对齐、算法时间复杂度高等问题,现有研究存在众多对DTW的改进算法,其中基于稀疏路径的DTW算法(Sparsified-Paths Search Space DTW,SPDTW)考虑限制对齐路径矩阵的搜索范围来减少距离度量过程的计算量,而基于局部加权的DTW算法(Locally Weighted DTW,LDTW)通过考虑时间序列之间的类别,解决了DTW算法中时序对齐平等对待实例特征而忽略其局部辨别特性问题,但是以上两种DTW改进算法都各自存在缺点。在进行理论分析和实验验证后,本文提出基于稀疏路径的局部加权DTW算法(Sparsified-Paths Search Space LDTW,SP-LDTW)。该算法在训练集迭代生成权值矩阵的过程中,根据序列的类别生成一个同类序列间和一个异类序列间的稀疏路径矩阵,在生成的稀疏路径上迭代权值矩阵;然后将生成的权值矩阵用于测试集的K近邻分类过程。将提出的算法在UCR数据集上进行仿真验证,SP-LDTW与LDTW算法在分类正确率上结果相同,但是SP-LDTW在生成权值矩阵的过程时间开销大幅低于LDTW算法,证明了SP-LDTW在减小时间消耗方面的有效性。为了进一步提升SP-LDTW算法的效率,在训练权值矩阵的过程中,探究不同阈值对生成稀疏路径矩阵的影响。基于阈值的SP-LDTW算法首先在训练集通过交叉验证法学习一个合适的阈值,然后将所选择的阈值应用于权值矩阵的训练以及后续的K近邻分类中。最后在UCR数据集上进行仿真验证,实验结果显示,基于阈值的SP-LDTW算法在生成权重矩阵的过程时间开销大幅低于SP-LDTW算法,部分数据集上阈值的SP-LDTW算法的K近邻分类正确率高于SP-LDTW算法。本文对DTW的改进算法进行研究分析,针对SPDTW和LDTW算法存在的缺陷进行改进,提出了SP-LDTW算法,经过实现验证,该算法相比于LDTW能够大幅减少生成权值矩阵的时间开销,同时在部分数据集上提升了K近邻分类的正确率。
其他文献
本文立足“一带一路”背景,以塔吉克斯坦Y企业现状及经营环境为研究对象,以制定怎样的发展战略摆脱目前经营困境为研究问题。本文借助内部环境分析法、PEST分析法和波特五力
近年来,随着计算机科学技术的快速发展,图像分辨率逐渐增高,传统像素级的图像分割方法很难满足实时性要求。超像素是近年来兴起的一种图像预分割技术,它将图像分割成若干个具
随着《全日制义务教育小学科学课程标准》的颁布,关注学生的主体地位已逐渐成为了小学一线科学教师的教学导向。从教学设计的维度上来说,小学科学学科的一线教师们需要更进一步地关注小学生的学习方式和过程,即思考如何激发小学生的科学学习兴趣、如何引导小学生在进行独立探究的过程中获取相关的科学知识与技能、以及如何支持小学生进行持续而深入地探究。部分教师已经采用了问题驱动法来优化自身的教学设计,因其能为如何关注小
病程相关(Pathogenesis-related,PR)蛋白质是一类受病原物诱导的蛋白质,在植物抵抗生物、非生物胁迫过程中发挥着重要作用。水稻(Oryza sativa L.)是世界上最重要的粮食作物之一,作为近一半人口的主粮,其高产、稳产对全球尤其是亚洲地区的粮食安全具有重大意义。水稻生长往往会受到冷、热、旱、盐和淹等恶劣环境的威胁,因此,了解水稻胁迫应答机理,培育耐逆的水稻品种具有重要意义。
随着百度知道、Yahoo!和Quora等开放领域问答系统的快速发展,大量的问答数据日渐积累,如何高效地重用现有的问答资源以服务大量用户是现今问答系统亟需解决的问题。自动问答是自然语言处理中增长最快且极具挑战性的任务之一,旨在构建能够自动回答用户以自由文本提出的问题。对于问答系统,问题目标分类是一个至关重要的步骤,旨在根据预期的答案类型准确地对提出的问题进行分类,从而对给出的候选答案进行语义约束。并
目的:通过生物信息学方法设计鲍曼不动杆菌多表位组装肽并对其进行原核表达与纯化,将纯化后的重组多表位组装肽(rMEP)免疫接种Balb/c小鼠后分析其免疫原性和免疫保护性,探究rMEP作为鲍曼不动杆菌基因重组亚单位疫苗的可行性。方法:1.利用生物信息学软件预测并结合免疫学检测筛选出鲍曼不动杆菌外膜蛋白FilF、NucAb的T、B细胞表位,以预测到的Ata蛋白粘附素高概率肽段为骨架,在其N末端和C末端
目的:麻风病是一种慢性感染性疾病,其中皮肤和周围神经系统被麻风分枝杆菌侵入,具体感染及免疫机制尚不清楚,Th17细胞和Treg细胞均来自于初始CD4+T细胞,Th17和Treg细胞之间的平衡对于免疫稳态和耐受是至关重要的,免疫反应是麻风发病机制中的主要因素,麻风患者中Th 1 7/Treg细胞的平衡是否改变尚未明确,Th17细胞的标记为转录因子RORγt和Th17分泌的细胞因子IL-17;Treg
自由活塞式内燃发电机(Free Piston Linear Generator,FPLG)是近些年兴起的一种热门的混合动力装置。相较传统内燃机而言,FPLG具有结构紧凑、高效率以及燃料适应性广等优点。
高温超导材料由于具有零电阻、Meissner效应和宏观量子效应等特殊性质,且相对于低温超导材料其运行成本更低,因此被广泛应用于制备超导磁体和超导电缆。高温超导体在强磁场作
通常情况下,在人机交互过程中人体所受到的伤害大部分都是因为机械设备对人体产生的冲击效果超过了一定的人体耐受力。因此,对过程中可能会发生的碰撞进行研究,将有利于机械