论文部分内容阅读
随着经济全球化和一体化商业大潮的涌动,动画产业蓬勃发展。由于动画制作费时费力,生产率低下,大量已有的动画素材的管理和有效重用意义重大。传统全文检索很难表达用户的查询意图并且只进行字面意思的匹配,缺乏语义处理能力;基于文本或者内容的检索模式也难以解决用户与机器理解的“语义鸿沟”;基于语义的检索应运而生。本文主要研究了基于本体的信息检索,利用本体技术和Lucene全文检索引擎的倒排索引机制,设计和实现了语义检索子系统,以及系统排序算法。首先介绍了图像检索的相关研究,分析了其中的优缺点,接着介绍了本体的相关理论,分析了本体在信息检索中的作用以及基于本体的信息检索模型,然后提出了动画素材的语义化方案,最后给出基于本体的动画素材语义检索引擎的架构设计与实现途径。为缩小检索中的“语义鸿沟”,提出了基于本体的概念扩展算法,利用本体中概念间的层次关系,提出基于距离和密度的加权概念相似度计算方法,以此衡量初始查询词和扩展词间的相似度,并利用遗传算法对查询词进行组合优化,获得最能体现用户查询意图的查询词组合再进行检索。通过分析搜索引擎排序算法,借鉴传统信息检索排序模型与Lucene默认的排序机制,提出了新的排序算法。为了验证系统设计的可行性和算法的有效性,我们利用快速原型法实现了基于本体的动画素材语义检索引擎。实验结果表明,在一定程度上提高了查全率与查准率。