论文部分内容阅读
软件测试是检验产品质量的重要手段,从测试目标和质量控制的要求出发,它需要多个测试处理环节构成。因此,各个涉及测试流程的领域,都累积着成千上万的历史案例数据。在解决实际问题时,从累积的案例数据中挖掘可参考的知识对于生产效率的提高十分重要。然而,利用这些累积的资源却十分困难。至少存在以下三个问题:第一,积累的案例资源在结构和内容上存在很大的异构性,难以信息复用。这是由于企业各个部门往往有独立系统为生产、测试提供服务,记录方式也各有不同所造成的;第二,案例资源的数量级增长,难以对海量的案例资源有效管理和检索;第三,系统不同阶段产生的数据都在动态变化,静态元模型不能描述企业数据完整视图和功能的整体框架。因此,如何结合开放数据,利用积累的案例数据,完成元模型生成和增量式融合,从而为企业生产提供可持续参考依据,是当前领域知识融合技术上的重大挑战。本文旨在利用基于语义元模型的知识融合技术,利用多个数据源的特征和潜在关联关系,将数据映射转换为统一的实例表示方式,从而消除结构异构问题。在此基础上,基于语义标签管理大量案例实例资源。同时,为适应数据动态变化和元模型增量变更,引入开放数据,提出多策略融合方式将多个同类语义元模型对齐和整合,最终反映完整的企业业务全貌,并生成基于业务规则元模型的融合知识库,为企业生产提供可持续的知识资源服务。本文研究工作包括以下几点:(1)提出了由异构数据映射为案例模型实例的方法本文针对异构案例数据的特点,给出案例模型定义,并利用案例模板将多源异构数据转换为统一格式的实例集合。同时,定义案例模型涉及的多个语义元模型,阐述这些语义元模型之间关联关系,直观反映数据与元模型实例之间的关联、元模型与元模型之间的关联。(2)提出了基于语义标签的案例实例管理方法由于累积案例实例资源的数量庞大,各个案例表述内容存在异构性,对实例资源管理和检索存在很大的困难。本文设计一种基于语义标签的资源管理和检索方法。首先利用本文提出的结合领域维基百科的关键词抽取算法,对实例数据进行信息抽取和操作序列指代,并利用相似度匹配和聚类相关技术,聚集相关案例,最终得到语义标签集合管理每个相关案例类。实验证明,本文提出了一种利用语义标签管理大量案例资源的有效方式。(3)提出了基于开放数据的元模型增量融合策略本文针对在测试领域下累积的案例数据,考虑数据动态变更引起的元模型演化,提出一种基于开放数据的多策略的元模型融合方式。结合领域知识库和已定义的元模型,生成并整合多个版本下的元模型。最后,利用元模型生成领域知识库,并验证该融合方法在测试领域的可持续性和开放性。(4)原型系统应用设计及验证依据上述方法,设计并实现了一个开放数据下的测试案例分析管理原型系统,运用某银行软件测试公司提供的多个银行测试案例真实数据进行实验验证,证实本文方法具有较高的有效性和可拓展性,可用于存在业务流程的领域生产和知识决策上。