论文部分内容阅读
近年来,随着Web2.0的迅速发展,越来越多的人愿意将自己的图片共享到互联网上。互联网上的图像信息越来越多,已成为一个巨大的图像资源库。随着互联网上图像信息的急剧膨胀,如何管理和组织互联网上的图像变得十分迫切。图像标注技术是管理和检索这些丰富的网络图像的关键技术。它通过给图像添加表示图像内容的若干关键词,实现从利用图像内容管理图像到利用标注管理图像的转变。因此,很多成熟的文本管理和检索方法可以被应用于图像的管理和检索中。
本文主要针对图像检索中的图像自动标注技术进行研究,从个人图像自动标注入手,在此基础上重点研究网络图像标注。论文的主要工作和创新之处如下:
1.对个人图像自动标注算法进行了研究,重点讨论了基于概率模型、基于分类和基于图模型的标注方法。
2.在已有的图像标注方法基础上,提出了一种新的基于语义聚类和图算法的自动图像标注方法。利用基于软约束的半监督图像聚类算法对训练图像区域进行语义聚类,并利用流形排序学习算法挖掘语义概率和区域聚类中心的联合概率表,从而可以标注图像。该方法充分结合了图像的视觉特征和高层语义。实验结果表明了该方法在个人图像标注方面具有较高的查全率和查准率。
3.提出了一种新颖的网络图像自动标注算法。该方法综合考虑了网络图像的特点以及图像标注过程中关键词整体关系的重要性,采用了一种多渐进式方式对网络图像已有的原始候选词及扩展候选词进行排序,再利用改进的Top N策略挑选最终标注结果。论文在真实数据集上了做了大量的实验。实验结果表明,我们所提出的方法在网络图像标注中的具有明显优越性。
4.构建了基于多渐进式的网络图像标注算法的图像检索演示系统。通过基于多渐进式的网络图像标注算法对图像标注上若干个反映图像内容的关键词,实现了将基于内容的图像检索转变成基于文本的图像检索。