论文部分内容阅读
信息集成是利用一个或多个数据库或其它的信息源,使得来自这些数据源的数据合并起来,就像使用一个单一的数据库的过程。在信息集成中,一个中间件系统允许用户针对全局视图提出查询并从多数据源得到回答响应。在本文中,主要研究讨论信息集成中的动态信息源相关问题的研究。把GAV视图作为LAV模式的一部分,对用户提出的命令进行查询处理。在LAV模式中,数据源描述是基于全局模式之上的。LAV模式最突出的优点是可扩展性好,尤其适合信息源变化较频繁的情况,当数据源模式发生变化时,无需对全局模式进行重新定义,只需增加一个数据源的模式映射即可。但是LAV的查询重写相对于GAV更加复杂。在实际应用中,数据源的数量庞大,数据源的更新删除频繁,LAV的易扩展性极其重要。本文在基于包装器/中介器(Wrapper/Mediator)集成框架的研究基础上,在LAV模式下,提出在动态信息源基础上的集成方法,首先,针对稳固信息源支持的一个GAV视图(稳固信息源可为空),进行集成方法的研究;其次,在稳固信息源的基础上,增加信息源外延,由动态信息源导出的数据组成,在此基础上进行集成方法研究。本文主要研究内容包括查询分解:对于基于LAV模式下的查询分解,查询条件的字段中包含子查询如何进行分解;基于视图的查询重写:在LAV模式下,基于视图的查询重写的相关讨论和算法分析;LAV查询重写算法验证:针对提出的算法进行了证明和实例验证。