基于增量日志的过程挖掘方法研究

来源 :安徽理工大学 | 被引量 : 0次 | 上传用户:hu8245
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
过程感知信息系统在当代组织中变得无处不在,这些信息系统以事件日志的形式记录了大量的业务流程执行数据,而过程挖掘技术是从事件日志中抽取有用的过程知识,旨在发现、监测和增强现实的业务流程。过程挖掘技术的应用有利于提升公司生产率,在指导公司经营,节省运行成本等方面发挥着重要功效。因此,过程挖掘技术是业务流程管理中的关键技术。信息系统的不断完善使得业务流程中的数据能够被充分的发现和利用,也使得过程挖掘技术面临着不断的挑战。但是现有的过程挖掘技术大多是基于静态的事件日志,即在数据库中已存储的业务流程上进行状态的分析和研究。换句话说,对于动态更新的日志,现有的过程挖掘技术表现出一定的局限性,例如:新产生的日志进行一次挖掘需要巨大的人力物力支持,同时可能隐藏甚至丢失原有模型中的重要行为等。针对这一问题,本文提出了基于增量日志的过程挖掘方法,首先基于静态事件日志挖掘出一个初始过程模型,然后分析增量日志和原有事件日志之间的差异并根据差异情况对初始过程模型进行更新,使得更新后的过程模型既能回放静态的历史数据,又能回放新增的事件日志,提高了模型的适合度,降低了过程挖掘的时间开销,同时保证了原系统的重要行为不会丢失。本文主要工作有:(1)针对业务流程模型变化检测问题,对变化区域采用子模块局部更新方法优化过程模型,通过子模块关联矩阵和状态方程来分析子模块局部更新的可行性。结合实际的公司实施业务流程的变更,验证了该方法的有效性,并通过仿真实验证明子模块局部优化方法是可行的。(2)针对业务流程中增量日志的变化更新问题,提出了基于最优近似迹的增量日志过程模型优化方法。首先在保留所有活动基于日志的可能行为关系不变的前提下,将包含并发和循环行为的迹进行预处理,再基于数据结构串比较的思想,计算增量日志与原日志间的最优近似迹,然后,通过比对增量迹和最优近似迹之间的差异确定最优近似迹的变化位置,再根据最优近似迹寻找原模型中对应的变化域,最后,根据不同的变化类型分别采取不同的优化方案,从而得到了优化之后的过程模型。(3)针对业务流程动态变化问题,为了提高过程模型的质量,提出了基于增量日志的行为聚类过程挖掘方法。该方法通过计算增量日志中的迹之间的行为距离,对日志中的迹进行行为聚类,利用聚类后的增量日志迹对原模型进行更新优化。最后通过实例验证了该方法的有效性。图[24]表[10]参[99]
其他文献
奇异微分系统是微分方程与动力系统的一个重要领域,其在应用数学、天文学、物理学以及生物学科中有着广泛的应用。因此,探讨奇异微分系统周期解问题具有很高的学术价值。本文应用重合度延拓定理、上下解方法、三阶近似方法、平均方法研究了几类奇异微分系统周期解的存在性和稳定性问题。全文的组织结构如下:第一章,绪论,简述奇异微分系统的背景、研究现状和意义。同时给出了重合度定理、上下解方法、三阶近似方法、平均方法一些
因果中介分析是通过中介变量识别解释自变量和因变量之间关系的因果机制。目前,中介分析的研究主要集中在自然直接与间接效应推断,很少进行效应的估计与分布的研究。本文分别在简单中介模型、具有混杂变量的中介模型、具有交互作用的中介模型和具有多个中介变量的中介模型下进行了自然直接与间接效应估计,并由Delta方法获得了估计量的分布。论文的主要工作包括以下四个部分。第一部分对单个中介变量情形,运用线性回归建立自
随着现代通信技术的发展,对相关元器件的需求也越来越大。这些年,微波介质陶瓷发展迅速,是因为由其制作的微波元器件,有不少优点,例如小巧、经济、质量轻、性能稳等,因此可以满足现代通信工具的小型化、集成化等要求。低温共烧陶瓷(LTCC:Low Temperature Co-fired Ceramic),是一种多层电路,由未烧结的流延陶瓷材料叠层在一起制成,内置印制互联导体、电路和元件,该结构被烧结成一个
移动互联网和智能终端设备可以产生大量的高维数据,这些数据具有潜在的规则和价值。然而,如果不经净化处理直接发布,可能会泄漏用户或组织的隐私信息。现有的高维数据差分隐私发布方法不能够较好地保护用户隐私。一方面,中心化差分隐私无法解决不可信服务器导致的隐私泄露问题,以及应用于众包场景存在诸多问题;另一方面,差分隐私作用于高维数据上不仅会引入大量的噪声,降低数据效用,也会产生时间复杂度高、计算复杂等问题。
文本表示是自然语言研究的基础问题,也是帮助我们高效处理文本信息的关键,传统的文本表示模型大多是基于词或短语构建,普遍存在容易丢失语义信息的问题。近年来,事件这一概念引起了学者的高度重视,叙事类文本中包含了大量的事件,面向事件对文本表示模型进行研究,以事件或事件要素作为语义单元,可以很好的保留文本中存在的深层语义信息。本文首先对文本中缺省的对象要素、时间要素和地点要素进行缺省补全的研究;然后以事件作
互联网时代信息爆炸增长,搜索引擎已经无法满足用户的需求。推荐系统通过分析用户历史行为预测用户的偏好,可以实现主动的个性化推荐。但当前推荐算法中仍存在数据稀疏和冷启动等问题影响推荐系统的性能。社交网络中存在用户行为信息和用户社会关系,考虑将社交网络应用到推荐算法中,能有效改善上述问题。因此,本文首先提取社交网络中的用户行为信息特征,然后提出一种社交网络中的矩阵分解推荐算法,主要研究内容如下:1.针对
在微博话题讨论过程中,用户更加注重输入的简化、随性的表达以及情感的输出,便自发性的转变了自己的语言表述方式。这一转变直接增加了网络新词的输出,使得微博文本情感倾向分析更加困难。为了解决这个问题,本文提出了一种基于情感新词识别的微博文本情感分析的方法。首先通过统计量方法从微博数据中识别出新词;其次根据新词的上下文信息及其语义信息识别出情感新词,;最后扩展微博情感词库并结合多种规则进行微博文本情感倾向
研究目的:分析长链非编码RNA动脉粥样硬化斑块相关转录本(long noncoding RNA atherosclerosis plaque associated transcript,lncRNA-APAT)在无冠脉斑块患者、完全钙化斑块患者和混合斑块患者外周血中的表达差异,并阐明lncRNA-APAT通过竞争性结合microRNA-181a(miR-181a)对单核-巨噬细胞功能和动脉粥样硬化
鼻咽癌是我国华南地区高发的恶性肿瘤,早期症状不明显,易造成漏诊误诊。鼻咽癌诊断存在血清学标志物敏感度及特异度不高、影像学筛查费用昂贵、分辨率不高、病理活检侵入危害等限制。因此开发更多特异性生物标志物是亟待推进的问题。本研究目的是筛选一批与鼻咽癌发生发展相关的非编码RNA(non-coding RNA)和基因标志物,阐述它们相互之间的调控模式,为进一步研究鼻咽癌病理过程中的生物学功能提供新视角。以鼻
人口老龄化问题的加剧,使得老年人口占比越来越大,养老服务产业需要满足老人日益增长的需求。但是由于国内养老资源不足,养老服务体系不够完善,使得对老人,特别是独居老人的健康照护面临严峻的挑战。传感器技术和普适计算的发展能够让各种传感器佩戴在老人身上或者部署在老人的家中,从而通过老人的运动和日常活动及生理情况的变化产生大量的数据。同时,大数据处理和人工智能技术的发展为分析居家老人的各类数据、研究老人行为