论文部分内容阅读
在流程工业与计算机应用迅速发展的当下,企业与技术的快速发展带来了各个生产环节的优化升级。在技术手段与生产产品得以发展的背景下,面向流程工业各行业领域的大数据处理技术应运而生。对于如何科学有效地利用这些数据,对企业生产过程、企业生产产品等方面有很大的价值和重要的意义。以事件为中心处理实时数据的方案为数据处理提供新的思路,复杂事件检测作为从事件流中检测出企业所需要的事件的方法被应用在多种行业领域,对于海量复杂的流程工业数据的事件检测成为近年来一个值得研究的问题。作为流程工业监测设备和生产流程的重要步骤,复杂事件检测可以为企业提供故障处理、流程优化的依据,但由于流程工业生产环境复杂,网络传输拥堵、延迟,生产过程易受外界干扰等原因,因此还存在以下问题需要解决:(1)流程工业将不同设备的事件流聚集并做统一处理,事件的时序性是保证复杂事件检测正确性的关键,首要任务就是将事件进行筛选和修正乱序事件,检测出中间复杂事件;(2)从中间复杂事件到满足用户查询需求的复杂事件,需要通过进一步的模式匹配检测更深层次的事件;(3)单机部署难以完成检测海量实时事件的任务,因此,为了保证复杂事件检测任务高效率的完成,需要采用合理的分布式框架和策略;复杂事件检测作为一种有效的事件流处理技术,将来自于不同事件源的简单事件按照特定的模式和规则复合成满足要求的复杂事件。本文针对流程工业中复杂事件检测面临的上述问题展开研究,主要工作内容和创新概括如下:(1)通过针对时序关系的事件检测方法完成从简单事件到中间复杂事件的检测,该方法的重点在于进入NFA匹配前先对事件进行筛选,匹配通过的事件进入到扩展哈希结构中修正时序,实验证明该方法减少了检测时间,并为进一步检测做保障;(2)提出基于事件树的检测方法,创新性的加入共享结果序列与查询约束的策略,并通过实验证明了该方法能够提高事件的检测率;(3)采用分布式实时流处理框架Storm与复杂事件处理引擎相结合的处理方式,使用基于事件流和规则流的数据分发策略,使得实验检测结果用时更少。通过对流程工业中复杂事件检测方法的研究,完成了从简单事件到复杂事件的过程,为事件分析和预测奠定了基础,因此,本文具有积极重要的研究意义。