论文部分内容阅读
由于图像作为多媒体信息中的最基本、应用最广泛的载体,图像检索一直是信息检索中相当活跃的研究课题。经过数十年的发展,基于内容的图像检索(Content Based Information Retrieval, CBIR)从出现发展至今受到广泛关注。但是,训练样本数量少、正样本和负样本的数量不对称及与用户交互的实时性要求一直制约着CBIR的发展。本文以相似性度量为切入点,提出一种结合短期学习和长期学习,将视觉相似性和语义相似性综合考虑的图像检索方法——RCAS (Real-time Classification in Asymmetric and Small data collection),在提高图像检索性能的同时为解决上述三个问题提供了一种解决方案。相似性度量一直是CBIR研究中最关键的部分之一,一些文献证明从相关反馈中学习相似性度量可以在一定程度上提高检索性能。RCAS算法首先从日志数据中学习语义相似性,然后以此为先验知识从标记样本和未标记样本中学习视觉相似性。同时,RCAS算法结合了机器学习中半监督学习和相关反馈算法的优点,对有关类和无关类中未标记样本采用不同的方式加以利用。并从未标记数据中随机抽取子集扩充负例样本集合,利用日志数据和相关反馈结果扩充正例样本集合。从而解决了小样本和不对称问题。RCAS还可以在与用户的相关反馈中及时地将检索结果返回给用户,满足了实时性要求。本文将RCAS与SVM-AL、Naive-AL和SSAIR三种算法在基于COREL的扩充数据库上,从前N个检索结果的准确率、PR图和反馈影响三组指标评价进行大规模对比实验。实验结果证明RCAS在各项评估参数上的表现都优于其他算法。最后,在本文提出算法和实验对比的基础上,开发了名为“Thinking&Mining"的基于内容的图像检索系统。此系统可以实现以图找图,并且可以方便的添加后续的改进算法。