基于机器学习的工业控制系统数据异常检测方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:cchmily2624
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
工业控制系统ICS(Industrial Control Systems)作为国家的重要基础设施,被广泛地运用在能源化工、智能农业、交通等重大工业生产领域。与传统工业控制系统处于封闭和独立的环境不同,现代ICS信息化进程中加入了许多计算机相关的技术,使其变得开放、便捷和互联,但同时也带来了许多信息安全问题。工业控制系统采集的是工业的时序数据,具有数据量大、采集时间长、数据类型多的特点,不适合大规模人工标记标签做有监督学习,因此ICS的异常检测通常是采用无监督的学习方式。然而基于无监督的算法往往需要大量的数据去学习,但有的工业系统在短时间内并不能产生足够的数据量,而时间越长被入侵的风险就越大,本文要解决的是针对短时间内ICS采集到的数据流的异常检测;其次,若使用基于时间的循环神经网络模型,如果模型中的时间步较长,则会带来梯度消失和梯度爆炸等问题。为解决上述的问题,本文将提出一种新颖的异常检测混合模型,并为对比常用无监督学习算法异常检测性能进行了数据集选取和预处理研究,最后为验证本文提出解决方案可行用于实际工业控制系统当中,本文的主要研究内容从以下几个方面展开:(1)本文首先叙述了 ICS对社会和国家具有重大的意义,接着介绍了目前常用处理异常检测问题的相关算法,比如:基于统计学方法、基于规则信息方法以及基于无监督、半监督和全监督的机器学习相关算法。针对ICS采集数据流的特点和单个模型处理局限性,本文提出了一种聚类加循环神经网络的混合模型来解决上述提到的问题。(2)选用两个常用的数据异常检测的数据集:CCF数据集和SKAB数据集。在大多数工业控制系统中,通常观察者不清楚传感器采集到的数据具体物理意义且采集数据的属性特征较多,这个特点正好与CCF数据集中的特征背景信息被抹除,且特征维度较大相符合,所以选用该数据集来研究模型使用的广泛性。而SKAB数据集则是标准的工业数据集,且每一个特征维度的信息都是已知的,因此可以用它来研究模型使用的特殊性。本文对以上两种数据集进行相应的数据的预处理和特征提取步骤,以用于对后续学习算法模型的训练和测试。(3)在ICS中通常选用无监督方式进行异常数据流的检测,而且CCF数据集与一般工业数据集有相似之处并且数据量足够大,并有部分分类标签,因此可以用其对聚类算法K-means和LOF进行相应的性能测试和对比。而SKAB数据集则是特定工业背景下的时序数据集,具有明确的特征背景信息和分类标签,可用于LSTM算法性能测试。为解决ICS异常检测难题,本文提出了基于K-means、LOF和LSTM的混合模型,并用两种数据集验证其性能,结果表明混合模型在整体上的性能要优于单个子模型。最后将提出的混合模型投入到实际的工业系统中,证明其能满足真实场景应用需要。本文主要探讨了短时间内ICS采集到的数据流的特点,以及现有算法在处理在方面问题的弊端,并提出了一种混合模型来解决相关问题。且通过两种代表性的数据集来验证混合模型的性能,能满足ICS异常检测实际应用。
其他文献
在阿里云对象存储Object Storage Servic(OSS)服务器运营维护工作中,人工运维、规则化异常检测依然占据主流,异常检测场景的多样性促使代码开发管理任务繁重,服务器集群的动态变化和调整、区域阈值设定及人工调参的运维方法使得运维任务繁重,运维人员分身乏力,所以需要一种更智能化的异常检测系统伴随服务器集群的动态发展,以保障业务稳定,提高运维效率。本文使用时序数据挖掘技术构建了XGBOO
随着互联网技术和制造业技术高速发展,以及工业互联网、智能制造等理念的提出,实现车间设备网络化和数字化已成为重点关注方向。并且刀具在切削过程中,很难直接检测到刀具切削状态,而刀具切削出现异常,不仅会降低刀具寿命,增加加工件残次品产出数量,甚至可能会造成数控设备出现故障。基于此,本文搭建了基于MTConnect协议的数控设备数据可视化客户端,同时提出了基于主轴负载的数控设备刀具切削异常检测方法,主要研
目前,车辆轻量化设计已成为各汽车生产企业在产品开发中的重要环节。相比较乘用车,商用货车由于整备质量、结构刚度和强度性能普遍较高,因此轻量化空间更大。货箱作为整车上的最大零部件,其重量占整车重量的15%。30%,货厢轻量化技术的研究和应用对货车轻量化具有重要意义。本文基于某轻卡车型现有设计,利用多学科优化平台Optimus,对货箱瓦楞板进行优化设计,优化后可减重45kg,减重幅度达到15%以上,而一
异常检测问题是机器学习领域的一个经典问题,其旨在从给定数据中检测出偏离正常模式的样本。而时间序列异常检测,即针对时间序列数据的异常检测,无论在学术界还是工业界都具有重大的意义。时间序列异常检测可以自动地从大量互联网公司业务或工业机械等监控数据中自动地发现异常,从而避免损失。现有的时间序列异常检测算法主要有特征提取和端到端两种方式,不过这些算法存在严重的问题:(1)对于基于特征提取的异常检测,为了保
2021年,济南市政府研究室坚持以人民为中心、坚持服务全市中心大局,通过三大举措强化法治宣传,狠抓工作落实,使全体党员干部依法行政的意识不断强化,依法决策和依法治理水平不断提升。
期刊
随着信息化时代的到来及飞速发展,互联网、银行、电商等无数企业的IT系统日渐庞大,所需要的运维成本越来越高,传统的运维架构已经没办法支撑IT系统的高效工作,因此智能化运维 AIOps(Artificial Intelligence for IT Operations)应运而生。AIOps将大数据和机器学习算法结合在一起,实现低花销、高效率的运维模式,使得各大企业有了更大的发展空间。AIOps有很多业
2021年3月,十三届全国人大四次会议批准了"十四五"规划和2035年远景目标纲要,在市场经济飞速发展,知识更新迭代、日新月异的大背景下,管理会计已应运而生,它是一门专业学科,在制定和执行组织战略中发挥综合作用,为企业管理者正确决策提供了有利的依据。其中本量利分析工具通过数学模型更能直观揭示成本、业务量和利润直接的关系,便于制定有效、科学和可行的经营战略,减轻成本压力,进一步提高企业的竞争力与经济
习近平法治思想中蕴含着深刻的系统观,其系统观主要表现为要素联系观、整体布局观、一体建设观、重点突破观。法治政府建设应以习近平法治思想的系统观为引领,一方面在法治系统下加强法治政府整体建设,构建具有政治性、人民性、本土性、一体性、统一性的政府特质,另一方面加强法治政府子系统内部建设,强化其要素建设、协调其各环节、注重特别领域和涉外方面的行政法治建设。