分布式环境下全局序列模式挖掘技术研究

来源 :计算机集成制造系统 | 被引量 : 0次 | 上传用户:boguiyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于分布式环境下挖掘全局序列模式常常产生过多候选序列,加大了网络通信代价。为此提出一种基于分布式环境下的全局序列模式快速挖掘算法。该算法将各站点得到的局部序列模式压缩到一种语法序列树上,避免了重复的序列前缀传输;基于合并树中节点序列规则和简单的特点,提出一种项扩展和序列扩展剪枝策略,有效地约减了候选序列,减少了网络传输量,从而快速生成全局序列模式。理论和实验表明,在大数据集环境下该算法性能优越,能够有效地挖掘全局序列模式。
其他文献
针对行蓄洪区复杂河道的特点,提出了行蓄洪区的计算与预报方法,使得卡尔曼半自适应滤波模型可以用于复杂河道行蓄洪的调度和实时洪水预报.把该模型用于淮河干流中游鲁台子—吴
在研究冲压工艺加工需求和加工工序的基础上,应用多色集合理论建立了冲压工艺规划的数学模型。该模型包括围道矩阵和多色图等两个部分,多色图描述冲压工序的相互作用。应用此模
以业务对象间数值型关联关系为出发点,提出一种基于日志的业务对象关联模型,并将对象间关联关系与业务对象清晰分离开来。据此设计了一种代码生成器,以支持在模型变化之后系
在工作流执行过程中,为了更有效地避免失败路径,提高执行效率,提出了一种识别工作流无效路径的方法。在分析业务活动之间数据上依存关系的基础上,挖掘出存在于活动之间潜在的数据依存规则,在语义上补充了工作流的控制规则。在不修改工作流模型的情况下,利用数据依存规则,无效路径的识别算法可以预先对未来的执行路径进行搜索,识别出不可能执行成功的路径,减少执行失败的可能性。这种方法保持了业务过程逻辑的合理性。最后,
提出一种基于IDF模型对未来事件预测能力来选择合适的IDF模型的方法.通过对香港气象台13个不同历时的年最大降雨资料的数据分析,发现IDF模型的预测能力取决于它的数学形式、