论文部分内容阅读
工作流是一种反映业务流程的计算机化的模型,是为了在先进计算机环境支持下实现经营过程集成与经营过程自动化而建立的、可由工作流管理系统执行的业务模型。工作流的生命周期包括工作流设计、工作流配置、工作流执行、工作流诊断四个阶段。工作流挖掘技术不是一个工作流设计的工具,但它对充分理解现有业务过程执行情况有很大的帮助。工作流挖掘的目标是:倒转过程,收集和利用运行数据,从而支持工作流设计和分析。本文首先介绍了工作流技术最新的发展状况,以及WfMC的工作流参考模型,然后文章总结了当前工作流建模的主要方法,提出了工作流建模领域存在的机遇和挑战。在详细讨论流程挖掘方法前,文章对与挖掘有关的技术和理论进行了描述,包括日志的数学表达模型,Petri网和工作流网的相关属性,Petri网到工作流网的映射关系等。然后文章描述目前流程挖掘领域较为完善的α-算法,指出了α-算法在挖掘某些结构上的不足和限制。本文针对现有的流程挖掘算法中存在的不足和缺陷,以及鉴于遗传算法具有自适应性、全局优化性、隐含并行性和形式简单明了等特点,提出了利用遗传方法进行流程挖掘。在介绍使用遗传方法去挖掘流程模型前,我们定义了:内部描述形式、适应度函数、遗传算子。内部描述形式定义了遗传算法的搜索空间,能够支持在流程模型中除了重复任务所有常见的结构(包括顺序,并行,选择,循环,非自由选择,不可见任务);适应度函数能够根据事件日志,正确的评价已创建的流程模型(即遗传个体)的适应度;遗传算子确保覆盖内部描述形式定义的全局搜索空间内的所有的点。它们为将要提出的遗传算法做好了理论上的准备。最后我们提出了基于遗传算法的流程挖掘,该算法是从包含若干遗传个体的初始种群开始的。每个遗传个体对应一个流程模型,并且用适应度函数去记录它的优劣,即能够评价遗传个体重现事件日志的能力。通过适应度函数来反映遗传个体与事件日志的拟合程度,同时利用遗传算子重组遗传个体以产生新的流程模型。最后,通过运行模拟日志获得足够的实验数据,对该算法的挖掘质量进行了检验分析,证明该算法在流程挖掘方面具有明显优势,有效解决了α-算法在挖掘某些结构上的不足和限制。