论文部分内容阅读
在基于内容的图像检索领域中,如何学习出用户的高层语义概念是解决“语义鸿沟”的有效途径。用户关注概念区域是用户高层语义在图像中的集中体现,是相比于其他区域更能体现用户主观概念的区域。基于用户关注概念区域发现的用户高层语义学习成为了本文的重点研究内容。多示例学习机制是有别于传统机器学习机制的新的学习机制。在多示例学习机制下,在基于标识样本生成的未标识示例空间中,对未知真实函数进行最佳的逼近,从而对未标识样本进行有效预测。在图像检索领域中,由图像生成的区域组成了示例空间。在示例空间中基于多样性密度算法搜索最优示例,该示例表征了用户关注概念区域,所以基于多示例学习机制能够良好地学习出用户关注概念区域。本文在基于多样性密度算法的多示例学习框架下,解决了图像检索中用户关注概念区域发现问题,并构建了基于多示例学习的图像检索系统。本文主要研究工作如下:首先,本文对传统的机器学习机制进行了研究,并重点研究多示例学习机制的理论与应用,并把多示例学习机制应用到基于内容的图像检索领域中。其次,在对多示例学习机制中示例生成算法研究的基础上,从目标概念命中和噪声引入的平衡角度出发,本文提出基于窗口滑动的多尺度示例生成算法。在此算法框架下,生成示例空间进行最优示例搜索。再次,从应用的角度出发,本文构建了基于多示例学习机制的图像检索系统。为了对该图像检索系统进行全面而有效的评测,本文基于经典Corel 10000图像库做了系列实验。基于MIL的方法在采用P@N做测评时,其前十、二十、三十幅图像的精确率分别达到了56.6%、42.6%、36.6%,并优于基于查询向量扩大化的相关反馈算法,并取得的优于基于QVE方法的时间复杂度。最后,基于MIL对用户关注概念区域进行了有效地发现和框定。对比于CKNN-ROI方法以及Saliency Map方法,在关注概念区域的框定准确率上有了较大的提升。