论文部分内容阅读
随着当前的电子采集设备如RFID(Radio Frequency Identification)、传感器等的广泛应用及其高速发展,产生了空前的海量动态数据流。由于复杂事件检测技术能够帮助人们从这些海量数据中获取有用信息,因而近年来受到了广泛关注与研究。传统的对复杂事件的检测都是在内存中进行的,检测的事件都是发生在一个相对较短的时间内,但现实生活中还存在着这样的一些复杂事件,它们从开始发生到其完全结束延续时间很长,通常称这种是面向长过程的复杂事件。由于内存的有限性,完全采用传统的检测技术对长过程复杂事件检测并不可行,而目前几乎还没有对长过程事件流进行复杂事件检测的研究成果,因此对长过程复杂事件检测技术的研究迫在眉睫。为了实现面向长过程的复杂事件检测,本文以传统的检测方法为基础,结合长过程事件流自身的特点,设计了事件流在内外存的存储和置换策略,使得对长过程复杂事件的检测成为可能并具有较高的效率。本文的主要贡献如下:首先,提出了对象树对内存中的事件实例进行存储。对象树是一种基于属性共享的结构,具有压缩事件的作用,使有限的内存空间存储更多的事件实例,并且由于将相同的对象事件存储到同一棵树中,也方便了检测匹配的进行。其次,在内存满时,设计了一种将事件实例从内存调出到外存的PR置换策略。该策略基于事件流的规律性,将内存中最不会发生检测的对象事件调出到外存,这使对长过程复杂事件的检测成为可能并使得检测具有较高的效率。再次,为了检测存储于外存的事件,提出了一种称为外存事件实例映射表的结构来帮助查找所需实例。由于它能对外存事件的存储位置进行索引,因而加速了匹配检测的进行。最后,在对置换到外存的事件存储时,本文采用分类存储的策略,将事件按其属性分类存储到不同的文件中,并以文件名作为索引,文件中只存储时间戳。这种分类存储方式不仅对事件实例进行了一定程度的压缩,而且便利了检测的进行。通过理论和实验的评估,证明了本文为进行长过程复杂事件检测所提出的事件存储和置换策略能够对长过程复杂事件进行完整的检测并使得检测具有较高的效率。