论文部分内容阅读
随着图像和视频资源的日益丰富,基于关键字和描述文本的传统检索模式已不能胜任使用需要,有效管理海量数据资源的需求变得日益迫切。基于内容的检索技术应运而生,它综合了图像理解、计算机视觉、数据库和人工智能等多学科知识,具有内容描述客观、方便、灵活,入库自动化程度高,应用前景广阔等诸多优点,受到了越来越广泛的重视,并得到了迅速的发展。这篇论文在分析总结现有的基于内容的检索技术的优缺点的基础上,深入研究了静态图像和动态视频的基于内容的检索技术,并取得了一些有价值的研究成果。 论文在静态图像基于内容检索方面的研究主要包括:(1)总结了图像内容描述的构成要素和判断标准,提出了基于码本融合多特征的面向压缩图像的内容检索方法。(2)提出了基于区域布局的内容检索概念和相应的方法,包括:提出了一种融合颜色、纹理特征的区域分割算法;提出了反映区域空间布局关系的、多特征的相似性度量方法;提出和实现了基于局部搜索和基于遗传算法的两种属性关系图匹配技术,可以适应于不同的应用需求。(3)设计并实现了静态图像检索实验原型系统,包括:提出了图像内容的分层描述模型;设计实现了基于自组织神经网络聚类技术的树状多特征索引结构;提出了一种新的相关反馈模型。将静态图像检索方面提出的上述新算法,用于含千幅图像的数据库,取得了预期的、满意的实验结果。 论文在动态视频基于内容检索方面的研究主要包括:(1)提出了基于码本和区域匹配的镜头分割和关键帧提取算法,并建立了融合多特征的镜头内容描述框架。(2)提出了从视频中检测人脸和文本的方法,并实现了相机运动的判定。(3)提出一种基于超图聚类模型的故事单元的提取和描述算法,并建立了判定故事单元类型的算法框架。(4)设计并实现了视频检索实验原型系统,包括:提出了视频的多粒度分层描述模型;设计了体现多粒度和多特征的视频相似性度量方法。将动态视频检索方面提出的上述新算法用于著名故事片中的视频序列,进行自动分镜头、检测和判定故事单元等处理,取得了预期的、满意的实验结果。