大规模时序数据流中完整事件趋势的高效识别研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jintaijing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大规模时序数据流中实时识别完整事件趋势(CET)在金融服务、实时商业分析和供应链管理等应用中具有重要作用。在完整事件趋势识别过程中可能产生大量中间结果,这些中间结果为CET识别系统带来巨大时空开销。目前国际上最新的方法设计了一种压缩图模型。在这种压缩图中,CET被表示为压缩图中一条路径,不同CET的相同子序列通过图中共同路径进行共享存储。此方法消除了中间结果冗余存储,使得内存空间利用更加高效。然而,每当一个事件到来后,该方法必须遍历图来将这个事件插入到图中。因此,该方法需要O(n~2)的时间复杂度来完成个事件的构图,致使该方法构图时延非常高,难以满足实际应用需求。针对CET识别过程的高延时问题,提出了一种新的基于属性的索引图(ABI Graph)模型。ABI图将事件和事件的属性值具现为图中的两类节点,并使用这两类节点之间的边来表示事件和属性值之间的关联关系,从而将关联事件匹配转化成事件和属性值的匹配。为了从高速事件流中构造ABI图,根据比较器的不同,将匹配模式中谓词进行分类。并根据谓词和事件的属性来动态生成属性节点,尽量降低属性节点规模以降低构图复杂度。根据ABI图中边的连续性特点,设计了一种范围边表达方式,通过两个指针来表达每个事件节点的所有出边,成功将每个事件的构图时间开销和空间开销降低到了O(log(m))和O(1),其中是ABI图中属性节点个数。同时,基于ABI图中事件构图独立的特点,在动态构图基础上解决属性节点同步问题,设计了一种并行方法来进一步加速构图过程。构图完成后,针对基于BFS的遍历算法高内存开销低时间开销和基于DFS的遍历算法高时间开销低内存开销特点,设计了一种基于锚节点的并行遍历算法,结合两种基本算法的优势,高效从ABI图中提取所有CET。同时,基于通用分布式计算引擎设计了一种分布式CET提取算法,克服了单机系统物理资源限制问题。最后,通过详细的实验,比较了本方法和最新方法的性能。实验表明,本方法在时间开销上相比最新方法能够达到3个数量级的提升。
其他文献
实践表明,利用油中溶解气体的成分和含量数据可以有效分析和诊断电力变压器的内部故障。且变压器油中溶解气体分析技术经过多年的研究与应用实践已趋于成熟,至今仍然是变压器故障诊断的首选手段。目前,变压器油中溶解气体分析技术的发展趋势是将其与人工智能等先进技术相结合,以改变需要人工深度参与的现状和进一步提高故障诊断的准确性。本文基于该技术的已有成果,研究变压器故障诊断的智能化方法。主要内容包括:变压器故障与
近年来,随着网络技术与物流行业的迅速发展,双渠道销售模式越来越普遍。其中,供应链成员提供的价格与服务水平大大影响了消费者的购买决策。同时,随着经济的高速发展与生活水平的提高,消费者逐渐开始追求个性化,一些企业开始为消费者提供定制化的产品。产品与销售渠道的多样性促进了产品的更新换代,同时也积留了很多旧产品。在环保意识的驱使和相关法律法规的支持下,企业纷纷加入闭环供应链。这样既可以实现资源循环利用,又
铸造数值模拟的后处理结果是分析和预测铸造缺陷的重要依据,铸造充型过程的分析通常依靠充型体积、流动速度和流线等后处理结果,但并未对导致冷隔等铸造缺陷形成的关键区域进行计算与突出显示,不仅增加了冷隔缺陷的分析难度,而且也无法准确定量地预测出冷隔缺陷。本文通过对铸造充型过程数值模拟的研究,提出了用于计算交汇位置的方法,并将其应用于冷隔缺陷的预测中,结合温度场结果实现了对冷隔缺陷的预测,准确地预测了铸造充
轴向柱塞泵作为液压系统的核心元件之一,具有压力大、效率高以及泄漏低等优点,被越来越多地应用到船舶舱底疏水系统中。与普通滑靴斜盘式柱塞泵相比,斜盘连杆式柱塞泵传动机构的运动形式较为复杂,但柱塞的运动更加简单,两者在流量和压力脉动特性方面也有较大不同。本文以斜盘连杆式轴向柱塞泵为研究对象,基于现有脉动特性研究理论和方法,从柱塞运动特性入手,对柱塞泵的脉动频率特性进行分析,并进一步对泵出口处流量脉动率和
自组装是生命体系形成过程中必不可少的过程,是自然界中多种多样生命体形成的根源[1]。随着高分子化学的发展,人工合成高分子的自组装已逐渐成为构建新型结构的一种有效手段。而随着超分子相互作用的发展,通过超分子相互作用介导的自组装体系,不仅实现了自组装体系的外在调控,而且丰富了自组装体系的结构和功能。氢键作为一种超分子相互作用,其在自组装中的应用为直接构建微米级囊泡组装体的策略提供了新思路。同时,氢键具
基于布里渊光时域反射仪(BOTDR)的分布式光纤传感系统,具有空间分辨率和测量精度高的优点,同时系统结构简单易实现。本文主要研究了BOTDR在实际应用中数据处理方面的问题,在不降低空间分辨率和信号处理速度的前提下提高系统的准确度。本文具体研究内容如下:(1)研究了均值滤波,中值滤波,高斯滤波,小波变换去噪等传统算法在BOTDR信号处理中的效果,通过仿真和实验对比了不同卷积核大小对滤波性能的影响,从
四波混频是一种重要的非线性效应,被广泛地应用于光学参量放大、全光波长转换、全光信号处理等领域。四波混频的效率受相位匹配条件的限制,可以通过设置作用光之间的波长关系来满足相位匹配,但这限制了系统的带宽。准相位匹配可以打破相位匹配条件的限制,但是常用的准相位匹配方法由于需要定量的补偿相位失配,其普适性不足,在无法预估相位失配量时,可能不再适用。近些年来,“从损耗中获得增益”的想法被广泛研究,该方案通过
超级电容器具有功率密度高、循环寿命长、充放电速率快等诸多优点,广泛应用于移动通讯、医疗卫生等领域。然而,受限于外界恶劣环境的影响,超级电容器在低温环境下由于电解质中离子迁移缓慢造成的性能衰减或在受力变形时由于电极脱落所造成的器件失效严重影响了其在更广泛领域的使用。印刷电子技术的发展使得平面超级电容器更易于通过电极构筑与器件设计实现新颖的功能,并用于缓解甚至解决上述问题。本文中,针对超级电容器在低温
近年来,由于随机微分方程理论与平均场理论的逐渐成熟与广泛应用,一类新的随机微分方程,即McKean-Vlasov随机微分方程吸引力大批学者的关注,他们研究了此类方程的适定性、解的存在唯一性、遍历性等。在此基础上,本文通过运用Burkholder-Davis-Gundy不等式、Gronwall不等式、压缩映射定理等基础理论知识,研究了一类更加一般的McKean-Vlasov随机微分方程,此类方程与经
随着可再生能源的广泛开发利用,风能、太阳能等新能源在能源结构中的占比不断提高。而负荷侧,电动汽车、变频空调等直流负荷越来越多,这导致电力系统负荷结构产生了新的形态。在上述背景下,传统配电网结构正逐步由交流配电网步入交直流混联配电网。其交流配网侧保留了传统配电网的技术优势,直流配网则具备输电效率高、利于分布式电源(Distributed Generation,DG)接入等特点,已成为未来电网的重要发