CBIR关键技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:llhxdlb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术、网络技术的飞速发展,各种各样的信息爆炸式的增长,导致人们对信息检索的要求越来越迫切。而在诸多的多媒体信息中,视频图像信息占据了很大的一部分,人们一直在寻找一种有效的检索图像方法,基于内容的图像检索作为一种新兴的技术正越来越受到研究者的青睐,成为一个新的研究热点。 基于内容的图像检索包含三个层次,一个是底层视觉特征,另一个是一般语义层,最后是情景语义层。由于抽取一般语义和情景语义存在很大困难,目前绝大多数的研究都是基于底层视觉特征的,并研发出了相应的系统。但是这些系统普遍存在视觉特征与高层语义之间的不对称问题,也就是所谓的语义鸿沟。在广域图像的检索中,语义鸿沟是个很难克服的问题。如果限定在某一个狭小的领域如指纹、汽车牌照、人脸等,能产生比较准确的语义,但检索问题如果限定的领域过小就失去了它的意义。目前,可行的办法是找到一种尽量缩小语义鸿沟的办法,而语义鸿沟的彻底解决还依赖于相关的模式识别、图像分割、计算机视觉等领域技术上的突破。 要缩小语义鸿沟,我们就要特别注重三点:一个是特征的抽取与描述(这里着重指图像的底层视觉特征),这是图像检索的根本和基础;另一个为检索算法,好的检索算法表现在有着良好的时间空间复杂性,更重要的是能保证良好的检索准确率,最后一个是相关反馈,近年来绝大多数的基于内容图像检索都采用了相关反馈的策略,通过人的参与,检索结果会有非常大的改善,这种方法无论在图像检索领域还是信息检索的其他领域都具有非常重要的现实意义。 本文对基于内容的图像检索中的这些关键技术进行了探讨,并且提出了一个新颖的基于内容的图像检索模型。在这个模型中,采用了底层视觉特征与高层语义相结合的方法,而高层语义的产生和修改来自于人们相关反馈后的分类结果(采用支持向量机技术)。模型中还提出了一种新颖的适合于图像数据的聚类检
其他文献
语音识别技术在实验室条件下逐渐发展和成熟,但在噪声环境下的语音识别问题仍然是语音识别技术完全从实验室走入人们的日常生活的一大障碍。因此,作为人们交流时的一个重要的
随着网络的日益普及和Internet信息资源库的广泛使用,越来越多的人们把网络信息检索作为日常获取信息的重要手段。为了更准确、更有效地查找到自己所需的特定的网络信息,建立
随着信息技术和电子商务的迅速发展,人们对物流的需求日益增加,要求获得更灵活、快捷、合理的物流服务。然而,我国的物流企业各自为战、功能单一,各公司优势无法结合。现代物
随着网络和多媒体存取技术的快速发展,数字产品的分发和复制以前所未有的速度发展,但是由于数字产品易复制、易篡改的特性,数字产品的安全问题得不到保障。数字水印是通过在数字
迁移工作流是将移动计算技术应用于工作流管理的一项新技术,工作流业务过程中的活动被映射为迁移实例,多个迁移实例通过迁移和协作完成工作流过程。构成迁移工作流管理系统的三
工作流技术是实现业务过程自动化的核心技术,它具有合理利用已有资源、提高工作效率、过程自动化和流程监控等优点。Web服务是一种新的分布式应用程序,它具有互操作性强、新的
自1998年W3C(World Wide Web Consortium)发布了XML1.0[1](Extansible Makeup Language)标准以来,XML就迅速显示出在数据存储、数据交换等方面的优越性,短短几年时间,XML就成为
高科技的发展带动了社会信息化的发展。网络技术的飞速发展使得越来越多的人开始发挥网络的作用来办理各种事物,与此同时网络安全问题也相应的成为社会发展的重要保障。现今
目前,集成电路测试面临两个大的问题:测试时间过长和测试功耗过高。而随着集成电路不断复杂化,测试变得更加困难。特别是对基于复用思想的SoC,虽然这种设计思想有利于减少设计成
对于小样本、不确定确定问题的解决,用传统的数学建模方法并不太适合,普通高校招生人数预测就属于此类问题,灰色系统理论在解决贫信息、不确定问题方面相对于传统方法有明显