论文部分内容阅读
随着计算机、互联网以及存储技术等高新技术的发展,数字图像的传播及存储数量正在以惊人的速度增长。因此人们需要更加快速、准确的图像检索方法来查询所需要的图像及相关信息。传统基于内容的图像检索方式仅仅通过计算图像间低层特征的距离获取不同图像之间的相似程度,无法解决“语义鸿沟”问题,得到的查询结果并不十分理想。因此基于语义的图像检索技术随之产生并发展迅速,逐渐成了图像检索领域的研究重点。目前,研究者通常利用传统机器学习算法来实现图像语义映射,而传统机器学习算法训练速度慢,且泛化能力不足。为了提高图像语义映射的实时性,研究选用回声状态网络静态分类模型作为图像语义映射的关键算法。为提高分类器的对图像低层特征的适应性及泛化能力,本研究引入集成学习的思想,提出了多储备池回声状态网络图像语义映射模型,并将映射得到的语义特征融入到图像检索之中,提高图像检索的准确度。论文的主要研究内容及工作如下:(1)研究对回声状态网络分类模型训练过程中存在的问题进行优化,根据储备池内状态变量的变化量,变化速度及变化趋势来判断训练结束与否,有效避免震荡和发散现象对训练速度和准确度的影响。(2)为提高语义映射速度,本研究将回声状态网络静态分类模型应用于图像语义映射之中,该网络训练速度快,且避免了传统神经网络存在局部最优的问题。同时,为解决图像特征数据维数较高的问题,本文引入集成学习思想,将图像特征按照特征种类进行划分,针对划分后的图像特征分别构造储备池形成多储备池回声状态网络图像语义映射模型,并线性融合各储备池得到的结果。由于集成学习方法便于通过并行算法实现,因此本研究以多核并行的方式实现多储备池回声状态网络模型。实验结果表明优化后的分类器性能得到了一定程度的提高。(3)在图像语义映射的基础上,本研究将语义特征融入到图像检索之中。提出了颜色模糊相关图(CFC)的概念并利用该方法提取图像低层特征,该方法在颜色自相关图(CAC)的基础上考虑了不同颜色量化值之间的相似程度,同时保留了颜色自相关图空间复杂度低的优点。之后利用通过语义映射得到的语义特征向量对图像库进行过滤,在一定程度上缩小了检索范围,排除了部分干扰,有效提高了查询性能。