论文部分内容阅读
随着互联网技术和数据存储技术的快速发展,越来越多的信息以图像的形式表现出来,则如何有效地对大规模图像库进行管理和检索已经非常必要,其中语义清晰是其管理的重要前提。已有的研究表明:基于内容的图像检索和人为理解图像的语义之间存在巨大的鸿沟,即基于底层特征的图像内容和人为理解的图像语义之间存在“语义鸿沟”的现象,而基于图像底层视觉特征的图像自动标注技术,能够实现从图像的底层特征中提取出高级语义信息的关键字来标注图像,能很好的解决这一难题。通过机器学习方法来自动获取图像语义内容,实现图像的自动标注具有非常重要的研究意义。本文的研究目标是实现基于机器学习的图像的自动标注,本文选择的机器学习算法是贝叶斯算法,在完成贝叶斯集成学习算法设计与实现的基础之上,实现图像的自动标注。即基于贝叶斯集成分类器,通过对图像的底层视觉特征的处理分析,实现自动获取能够表示图像高层语义信息的关键词,并用来表示图像的含义。本文对贝叶斯分类器采用集成的学习方法加以改进,在各成员贝叶斯分类器的基础之上,主要通过提高集成中各成员分类器之间的多样性,来完成集成算法的实现。图像自动标注的实现,是将贝叶斯集成分类器作为图像标注的模型,通过图像训练数据集的训练,得到标注模型,实现对待标注图像的自动标注,即本文把图像的自动标注问题转化为图像底层视觉特征的分类问题。本文还设计完成了Web图像检索系统平台,实现图像用文本那样以同样的方式被检索,把图像的相关研究工作得以贯通表现,为以后图像的研究处理带来很大方便,同时,也是向实现类似商业图像检索的一种学习尝试。本文通过标准UCI数据库和Core数据库对集成的贝叶斯算法进行实验分析,验证了集成算法的有效性。实验结果表明本文所采用的集成算法很好的提升了分类准确率,同时,本文验证了基于贝叶斯集成算法的标注系统,能有效的实现了图像的自动标注。