论文部分内容阅读
随着当前信息技术的发展,信息系统经过长期运转而产生了大量的历史数据,这些数据是提供给各种专业计算的基础。大部分的信息系统长时间内只是在局域网范围内部运行,导致信息系统的数据信息在各个分布地形成了信息孤岛。这些自治的信息系统,由于在表示和存储形式上各不相同,使得信息系统彼此独立、分布分散。当需要集成这些信息系统实现信息的共享时,会发现信息系统之间存在了大量的数据冲突,使得它们之间进行数据交流非常困难。异构数据源的集成一直是困扰企业信息化持续性发展的问题,如何屏蔽和消除数据源的异构问题是目前数据集成领域中亟待解决的问题。 数据源的异构主要包括有:系统异构、语法异构、结构异构和语义异构,现有的数据集成方法对前三种异构可以很有效的解决,但是语义异构问题还是需要人工干预修证。随着语义Web网的发展,本体被逐渐使用在数据集成领域中,利用本体对数据源信息的统一形式化描述,可以为数据集成中语义异构问题提供一种良好的解决方案。基于本体的异构数据集成已经成为目前数据集成领域的研究热点。 本文的研究来源于电力领域的参数估计系统,该系统需要实现将各种异构数据文件集成到统一模式,以完成对全网参数的辨识。本文依据参数估计系统中数据集成需求模型中存在的异构问题,从解决语义冲突的层面出发,归纳出集成过程中遇到的异构冲突,设计了基于本体的数据集成框架。该框架在中间件技术的基础上,使用本体技术扩展了中间件集成框架,加入了本体语义描述模块。该方法使用本体描述信息资源中的概念,通过实现语义异构冲突的主动发现以及构建语义映射关系,可消除异构数据集成时存在的语义异构问题,形成语义异构冲突问题的完整方案。 本文在最后将基于本体的数据集成方案实现了在电力领域实际应用的原型系统,通过系统的具体实施应用证实了本文提出的基于本体的集成方案,在解决数据集成中异构冲突问题的可行性以及实用性。