基于上下文仲裁的语义信息集成方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户：cyg858644

【摘要】

：

对分布异构的数据源进行无缝访问来获得相关的信息，从而达到信息共享、重用和信息系统之间的互操作已经成为当前信息社会越来越紧迫的需要。而数据源之间存在的多种异构极大地

【作者】

：

周建芳

【出处】

：

华中科技大学

【发表日期】

：

2009年期

【关键词】

：

语义信息集成上下文上下文仲裁上下文转换实体识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

对分布异构的数据源进行无缝访问来获得相关的信息，从而达到信息共享、重用和信息系统之间的互操作已经成为当前信息社会越来越紧迫的需要。而数据源之间存在的多种异构极大地阻碍了这种需要的实现。消除数据源之间的语义异构是信息集成的核心问题之一。基于本体的语义信息集成通过建立本体来描述全局模式，在本体和各个异构的数据源模式之间建立模式映射来消除数据源之间的语义异构。这种解决办法的不足之处在于：通过模式映射的方式解决的仅仅是数据源之间的模式级异构而数据源之间的异构不仅仅包括模式异构，还包括其他类型的异构。片面地解决其中某一种异构，得到的结果不仅不能让用户充分共享和重用已有的信息，反而会给用户造成迷惑和误解，导致用户做出错误的判断。为了全面解决多种语义异构，首先要对分布数据源之间的语义异构进行研究和分析。信息的上下文语义是数据源的设计者对信息所设定的一些假设和前提，描述的是数据源模式暗含的语义，这种语义无法为计算机理解和处理。为了解决上下文语义，首先需要研究上下文语义的形式化表示。用一个四元组(D，S，CV，F)对数据源的上下文语义进行形式化表示，这是一种紧密耦合的上下文描述方法。在此基础上，将上下文仲裁机制引入已有的基于本体的语义信息集成中，将原来的用三元组(G，S，M)表示的信息集成系统扩展为用五元组(G，S，C，M，B)表示，实现上下文异构的自动检测和处理。解决上下文异构的核心问题是在同一上下文类型内部的不同取值之间进行转换。根据各上下文异构的特点，对于上下文异构的四种情况，分别提出了相应的上下文转换方法。对于发生在数值型属性之间的单位异构和数量级异构，提出了一种基于星型模型的上下文转换方法；对于发生在枚举型属性之间的表示异构，提出了一种基于等价类的上下文转换方法；对于发生在抽象数据类型的属性之间的格式异构，提出了一种基于元数据格式描述的上下文转换方法。这些上下文转换方法的共同目标是减少需要预定义的转换规则的数量，提高上下文转换的适应性、扩展性、可维护性和转换效率。实体异构是分布数据源之间普遍存在的数据级异构。已有的实体异构解决方案中存在的主要问题是效率和精度问题。通过提出一种基于上下文仲裁机制的两阶段特征向量处理方法来解决信息集成中实体识别的效率问题，通过设计一个基于公共子串的字符串相似性比较函数以改进信息集成中实体识别的精度问题。为了增强系统解决语义异构的能力，在现有的基于本体的语义信息集成系统的基础上进行了两次扩展。第一次扩展是在基于本体的语义信息集成的基础上引入上下文仲裁机制，使得扩展后的语义信息集成系统可以在模式异构得到解决的基础上对上下文异构进行自动检测和解决，第二次扩展是在第一次扩展的基础上引入分布环境下实体识别的解决方法来实现在模式异构和上下文异构得到解决的基础上对实体异构的情况进行自动检测和消除，从而形成了完整的语义异构解决方案。

其他文献

贵州省黔南地区气候资源及其开发利用

通过对黔南州气候资源的基本特点和优势进行分析,结果表明:黔南属于亚热带季风湿润气候,有冬无严寒,夏无酷暑,四季分明;雨量充足,光、热、水同步;气候的地域性和垂直性差异显

期刊

气候资源开发利用黔南地区

在创新中探索在探索中前进——档案工作如何在信息化社会下发展

现代信息社会日新月异，新技术及相关学科理论的不断渗透，使得来源于社会而服务于社会的档案工作领域不断出现～些新情况、新问题。这些情况和问题，特别是思想观念落后、思想认识跟

期刊

档案创新探索

钢铁行业处理线中的传动方案

基于变频调速技术和矢量控制原理,设计钢铁行业处理线的交流异步马达的传动方案。为满足速度控制和张力控制的优化,张力控制可采用主速度辊控制、直接张力控制、间接张力控制

期刊

变频调速速度控制张力控制frequency conversion speed control tension control

正在发生的革命:商标保护与公共健康博弈中的香烟平装立法

随着控烟运动的全球化发展,越来越多的国家考虑通过香烟平装立法进行控烟。虽然香烟平装对公众健康有利,但受到各方面尤其是来自于烟草产业和知识产权组织的反对。即便如此,

期刊

香烟平装商标知识产权公众健康

园林机械（以割草机为代表）用改性PP材料开发与应用

文章从PP材料的改性原理、园林机械用改性PP材料的性能要求出发,全面阐述了园林机械用改性PP材料的开发研制过程,开发出了一系列园林机械用改性PP材料并全面在ZS系列园林机械

期刊

园林机械PP改性botanical garden machinery PP modification

加强高等师专教材建设推进中学语文教学改革——评于年河许建中主编《中学语文教材教法》

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

《中学语文教材教法》中学语文教学改革初中语文教材教材建设高等师专

结冰工况下闭式地表水换热器换热性能研究

建立了闭式地表水换热器传热特性的数学模型,并对模型进行了验证,在非结冰工况下,模型计算值与试验值误差在±17.3%之内;基于该数学模型,研究了换热管在结冰工况下的冰层变化

期刊

地源热泵换热特性结冰工况闭式地表水换热器换热管

论基层图书馆员的职业道德素养

当前，图书馆事业的发展正处在转轨的新时期，图书馆各项业务工作正深入开展，从而对基层图书馆员的职业道德素养提出了新的要求。本文从加强图书馆馆员职业道德与素养的意义出发，对

期刊

图书馆员职业道德素养

深圳市建筑能耗宏观影响因素分析及发展趋势情景预测

以深圳统计年鉴和历年深圳市民用建筑能耗统计数据为基础,总结了深圳市建筑能耗总体情况和变化趋势。对影响城市建筑整体能耗的3个宏观因素——社会经济发展水平、经济增长方

期刊

宏观能耗建筑节能总量控制因素分析情景预测

基于上下文仲裁的语义信息集成方法研究

其他学术论文