基于协同学习的时间序列异常检测研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:dzxxdzc2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列数据产生于人类生活和工业的方方面面,在如今数据量急剧增长的时代背景之下,如何更有效地管理与运用这些时间序列数据成为研究者们的关注焦点。虽然时间序列中的异常数据规模和数量较少,但其中隐含的某些信息可能对科技研究或生产生活有着重要的影响。从提出时间序列异常检测的问题以来,国内外众多的研究者对其进行了深入而广泛的研究,并且也提出了应用于众多领域的异常检测方法,但是在时间序列异常检测领域内仍然存在着许多值得研究、探讨和解决的问题。本文围绕时间序列异常检测方法进行研究,主要工作如下:(1)时间序列多尺度异常检测方法针对时间序列点异常检测和线性分段的问题,本文提出一种时间序列多尺度异常检测方法。通过Haar小波变换压缩时间序列,把时间序列分解在不同的尺度上,再使用二次回归模型将小波变换后的时间序列分割成可变长度的模式序列(子序列),并计算模式异常值,然后通过小波重构函数重构原始时间序列,最后通过与自适应阈值相比较检测原始时间序列中的异常模式。使用仿真数据集Keogh_Data对方法进行验证和评估,并与测试Keogh_Data数据集的三种异常检测方法IMM、TSA-Tree和Tarzan进行比较,实现结果表明,对实验数据进行3级小波分解,能够达到很好的异常检测效果;并且与Tarzan方法、基于距离的方法和基于密度的方法在检测精度、检测效率和检测速率方面进行比较,在短期精度和效率方面该方法能够达到93.5%和96.2%,在长期精度和效率方面依然能够达到91.7%和90.5%,异常检测效果有较为明显的提升。(2)基于协同训练和选择性集成学习的时间序列异常检测方法针对传统分类方法进行时间序列异常检测不足的问题,提出基于协同学习的时间序列异常检测方法。传统分类方法主要是通过给定的有标记子序列训练分类器,使分类器对未知的子序列进行预测分类,但在实际研究中大量的有标记子序列需要花费很长的时间和人力才能获得,而数据集中存在的是大量无标记子序列,因此提出结合标记序列和大量无标记序列的协同训练算法对时间序列进行分析。协同训练算法在训练学习过程中又会受到分类器差异性的限制,针对这个问题,结合选择性集成学习提出基于协同学习的时间序列异常检测算法RFCL,并且与小波变换多尺度的方法相结合,辅助协同学习算法选择未标记序列进行分类器的训练和学习,用于时间序列模式的异常检测。最后,在理论研究的基础上,采用仿真数据集Keogh_Data、Ma_Data和真实的经济数据集进行实验,以验证本文所提出的异常检测方法;实验结果表明,本文提出的基于协同学习的时间序列异常检测算法RFCL可以有效的检测出时间序列中的异常模式,并且具有较高的检测精度和检测效率。
其他文献
目的:为有效控制视网膜母细胞瘤的局部复发或转移,降低其死亡率,尽可能保留患眼视力,避免损害容貌,初步探讨颅脑X-刀治疗视网膜母细胞瘤的方法、疗效。方法:2003年7月至2005
红松是我国东北林区的主要森林树种之一,其木材、树皮、种子等均已被开发利用,红松种鳞常作为副产物而废弃,造成资源浪费。本研究以红松种鳞为原料研究红松种鳞多酚的降血糖
作为热轧工艺应用的重要设备,卷取机的规范化应用至关重要。确保其张力控制系统的高效化建设,不仅有助于热轧工艺的高效化应用,更对热轧钢材的质量提升具有重大影响。本文在
通过分布式光伏发电集中一点接入型系统对电网线路电压的影响分析及仿真,研究了光伏线路电压与接入点距离、线路参数、光伏发电及负荷存在的直接关系,通过控制光伏并网逆变器
建筑业与经济的发展、人类社会的进步以及人民生活水平的改善有着密切的关系。建筑业作为名副其实的国民经济支柱产业,在中国经济发展以及城市建设过程中发挥着举足轻重的作
近年来,校园欺凌问题被媒体多次报道,受到政府和学界的高度重视。校园欺凌侵犯了青少年的基本受教育权,对被欺凌者的生理以及心理都会造成极大的负面影响,对欺凌事件的旁观者以及校园环境同样具有消极影响。农村寄宿制学校作为留守青少年的聚集地,是农村地区学校的主体组成部分,其校园欺凌的研究相对缺乏,农村寄宿生这一群体不但是每个农村家庭的希望,更是国家发展的未来。采取措施,减少校园欺凌的发生,保障青少年的生命健
动态图形设计在国际上经历了数十年的发展,已经是一个非常成熟的设计类别。近年来,动态图形设计出现在各种媒体的运用中,其已经成为各种动态媒体中重要的组成部分。动态图形
<正>全产业链产品与服务的出口质量高低关系着中国核工业在"一带一路"市场中扩大出口的竞争能力大小。本文在总结"华龙一号"核电及相关核技术应用产品海外出口经验的基础上,
本文共分三个部分。第一章简要叙述了SQP算法与SSLE算法的发展历史和概况,介绍了近期发展的一些新成果,考察了这些算法全局收敛性与局部超线性收敛性的条件,讨论了其中存在的
目的:应用蛋白质组学技术寻找非霍奇金淋巴瘤与健康对照组血清中差异表达的蛋白。方法:选择山西省肿瘤医院血液内科2004年7月~2005年12月经病理诊断确诊的72例初治的非霍奇金