面向时间序列数据的马田系统分类方法及其应用研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:sanhaijin123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列分类问题作为时间序列数据挖掘技术中的研究热点之一,其应用遍及各行各业。对海量的时间序列数据分类,获取有用的信息与知识,可以用于指导生活实践,快速解决实际问题。然而时间序列数据的特点具有高维性及随着时间的变化而变化,它的产生过程极易受到环境因素的影响,并存在一定的噪声。针对此类复杂数据,研究如何从中获取有效的信息和知识,是对科学研究及社会生产事件具有重要的理论研究价值及现实意义。马田系统(Mahalanobis-Taguchi System,MTS)是一种面向多元数据的分类、诊断和预测的定量模式识别方法。MTS有着诸多优点,如:MTS是基于数据的分析方法并可以实现真正意义上的降维,简化分类问题,并提高分类的精度和效率;MTS构建了一个连续的测量尺度,计算的是测试样本偏离基准空间的程度,这样有利于采取相对应的解决措施,提高解决问题的柔性。但作为一种新兴的方法,MTS在理论和应用上仍存在一些不足之处。本文面向时间序列数据,针对传统MTS存在的问题,采用多重马氏距离法、改进质量损失函数、多叉树理论等方法对其进行改进,目标是发展MTS成为一种适用于时间序列数据分类的高效方法。由于时间序列自身的高维特性,在实际应用中,通常需要对时间序列进行局部特征提取或全局特征分解,以降低原时间序列数据的维度,不同的时间序列数据类型,特征提取的方式是不同的。因此,本文从不同的时间序列类型出发,开展对时间序列特征提取的讨论,进而执行分类器的分类。本文的研究工作主要包括以下几方面的内容:(1)MTS算法优化研究MTS在面向时间序列数据分类时,通常会出现特征数目庞大、数据海量及类别种类较多的问题,针对传统MTS特征变量个数受限的不足,引入特征子集的概念及新的测量尺度——多重马氏距离(Multiple Mahalanobis Distance,MMD)来改进MTS。同时,在大数据背景下,选用训练数据时的错误率重新定义了质量损失函数中的损失值,使得损失不再主观定义,从而通过改进系统阈值,提高算法的识别精度。再借助于多分类规则(Multiple classification rule,MCR)及多叉树(Multi branched tree,MT)理论,拓宽MTS在多分类领域的应用。研究表明:传统MTS经过上述方法改进之后,其分类性能及应用广度得到了提高。(2)面向具有典型特征的时间序列数据的MTS分类方法及其应用研究以具有典型特征的时间序列数据分类为研究背景,展开特征提取及MTS分类研究的讨论。首先,考虑其具有的典型特征,构建了可以刻画其特征的时间序列混合模型。通过周期图、最小二乘法、阶跃判别及统计量,对混合模型的参数进行了估计,从而刻画了原有时间序列的典型特征。其次,将时间序列提取的典型特征与阈值改进后的MCRMTS算法相融合,利用MCR-MTS在特征优化及多分类方面的优势,实现对时间序列的快速高效分类。最后,为了验证混合模型特征提取融合MCR-MTS算法的分类能力和效果,采用了UCI数据库的控制图数据集进行了实验,并将其与其他常用分类方法进行比较分析。结果表明,基于时间序列混合模型及MCR-MTS算法能有效表征具有典型特征的时间序列,简化分类系统,识别精度高,是一种更为有效的面向典型特征时间序列的分类方法。(3)面向信号类的时间序列数据的MTS分类方法及其应用研究以信号类的时间序列数据分类为研究背景,展开特征提取及MTS分类研究的讨论。首先,通过变分模态分解,将信号数据分解为多个模态分量,提取各分量中的多个信号特征。此时对于每条原始振动信号而言,特征数目是庞大的,同时,信号类的时间序列分类问题通常为多分类问题。因此,通过引入MMD-MT-MTS算法,以解决特征数目庞大和多类别的问题,且利用MTS正交表和信噪比在优化系统时的优势,挑选出各类别中有利于分类的敏感模态分量,从而真正实现变分模态分解与MTS分类器的统一结合。最后,为了验证信号分解特征提取融合MMD-MT-MTS算法的分类能力和效果,采用美国凯斯西储大学电气工程实验室的滚动轴承故障模拟实验台采集的轴承数据进行了实验,再与其它文献中的算法诊断结果进行对比研究。研究表明:基于变分模态分解融合MMD-MT-MTS算法能有效提取信号类的时间序列特征,分类性能和降维效果更优,是一种更为有效的面向信号类的时间序列的分类算法。(4)面向一般性的时间序列数据的MTS分类方法及其应用研究以一般性的时间序列数据分类为研究背景,展开特征提取及MTS分类研究的讨论。首先,通过对时间序列等长分段,将时间序列分解为多个子序列,提取子序列中的多个时域特征。此时对于每条原始时间序列而言,特征数目随着分段数的增长而成倍数增长。因此,针对一般性的时间序列在特征提取上没有上述研究提取的精准,为了提高分类精度,通过引入MMD-MCR-MTS算法,以解决特征数目庞大和多类别的问题,且利用MTS正交表和信噪比在优化系统时的优势,挑选出原始序列中具有辨别性的子序列。最后,为了验证分段特征提取结合MMD-MCR-MTS算法的分类能力和效果,采用加州大学里弗赛德分校提供的时间序列数据集进行了实验,再与其它文献中的算法诊断结果进行对比分析。研究表明:基于分段特征提取结合MMD-MCR-MTS算法能有效提取一般性的时间序列特征,可以寻找到具有辨别性的子序列且分类性能更优,是一种更为有效的面向一般性时间序列的分类算法,具有良好的实际应用价值。综上所述,本文以时间序列分类问题为研究对象,针对MTS的不足,以MTS改进为主线,以多重马氏距离法、多叉树算法及各种类型时间序列不同的特征提取方法为主要手段,目标是发展MTS使其成为一种实用高效的、适合于时间序列分类的方法,并应用于现实问题的研究中。
其他文献
张雪门根据我国的实际情况,借鉴国外理论与实践经验,开发幼儿园行为课程,走上了我国幼儿园课程本土化与科学化的探索道路。随着学者对张雪门教育思想研究,行为课程的精神内涵实践价值不断被挖掘。行为课程理论将行动视为是认知的主体因素,挑战了传统的认知观,从而引发我们对幼儿园教育的思考。
会议
现阶段,不同类型的误差因素直接影响着地质实验测试结果的准确性,其中涉及到了相关技术形式的选取和周围自然环境等。伴随着我国科学技术的不断改进和创新,原子吸收被广泛应用到了地质实验测试工作中,相关部门可以借助该种方式来制定健全的技术标准,从而提升地质行业领域的稳定性,促使其良好开展。在本文中,重点阐述了在地质实验测试环节中对于原子吸收的应用情况。
简要介绍了西昌钢钒炼铁总厂化产工序电捕焦油器内部构造特点及工作原理,并对电捕焦油器投产运行以来出现的较为典型的电气故障,进行分析和提出相应的解决方案,保证电捕焦油器安全、稳定的运行,提高电捕焦油器后的煤气质量,同时也降低职工作业安全风险,减少职工劳动强度和安全环保事故的发生。
劳动教育基地建设是高职教育体系培养社会需求人才的核心举措。随着国家全面推进劳动教育,劳动教育深入高职院校课程,劳动教育基地建设运行机制成为各方重要研究课题。在此形势下,高职院校劳动教育基地建设可以遵循以下流程:前期设置资源驱动机制系统,包括政府引领带动机制、企业利益驱动机制、项目遴选合作机制、专业基础建设机制;中期设置沟通交流机制系统,包括信息沟通机制、人才融通机制、情感交流机制、社会交流机制;后
当前,如何改变小学生劳动教育弱化乃至缺位的现状,使其发挥应有的育人功能,是摆在我们面前的重要课题。我们围绕劳动教育,构建学校、家庭、社会"三位一体"的劳动教育大环境,从自我服务、家务劳动、班级劳动和公益活动四个方面培养学生的劳动观念,开展常态化劳动教育活动,形成学生劳动实践评价机制,积极落实立德树人根本任务。
期刊
学位
2021年11月26日,国务院发布《关于修改〈中华人民共和国烟草专卖法实施条例〉的决定》,增加了第六十五条,即“电子烟等新型烟草制品参照本条例卷烟的有关规定执行”,将电子烟正式纳入专卖和国家监管范围。至此,对电子烟的危害以及是否需要监管的诸多讨论,终于形成定论。为了落实这一政策,产业界、学术界、市场监管部门都在积极探索各种途径。本文探讨了电子烟监管体系构建问题,提出了基于网络和密码技术的电子烟监管
期刊
随着现代社会的快速发展,特别是智能手机等便携式移动成像设备的普及,图像已经成为人们获取信息、对外交流的重要途径。然而成像过程从来都不是完美的,测量过程中存在不确定性,表现为模糊、噪声和记录图像中的其他退化因素。图像去模糊是从一个模糊观测图像中重构出潜在清晰图像的过程,其是图像处理领域中一个极具挑战性的问题。对潜在图像进行先验建模是图像去模糊的核心问题,尽管很多有效的先验模型已经被提出用于图像去模糊
随着通信技术、网络技术和汽车工业的高速发展,车、人、路、物全方位互连的车联网已经成为智慧交通系统、无人驾驶等领域的重要基础设施。现代车辆利用各种车载传感器、计算资源、存储资源和通信设备使得车联网的应用形式丰富多样,既有从事环境感知的车辆感知系统,又有对外提供类似云计算服务的车辆云。这种多元化的车联网生态能够更好的改善交通治理水平、行车安全和驾驶体验,同时提高环境感知和数据服务能力。然而,车联网通信
含能材料因其能量密度高、产热产气速率快、做功能力强等特性而得到广泛应用。然而,由于含能材料的亚稳态结构及对热等外界激励条件的敏感性,使其在工业应用中极易引发事故,对人员和环境带来危害。在这些激励条件中,热是最普遍的形式,因此,含能材料热危险性一直是其安全性研究的一个重要热点。不过含能材料热危险性评估结果的可靠性很大程度取决于动力学模型及量热参数的准确性。绝热量热法作为含能材料热分解参数重要的获取手