论文部分内容阅读
信息检索是情报科学领域的重要研究内容之一。随着数字信息技术的飞速发展以及互联网通信技术的广泛普及,多媒体信息检索领域也随之产生了许多新的研究课题。数字图像作为多媒体信息资源的重要形式之一,以直观的形式,包含了易于人类视觉系统识别的丰富信息。图像是除文本之外被本人们使用最频繁的信息资源,随着当今图像生成设备和在线图像共享服务的逐步普及,图像信息资源的规模正在以前所未有的速度不断增长,海量的图像信息构成了巨大的且仍在不断膨胀的图像数据库。基于内容的图像检索(CBIR,content-based image retrieval)技术在提出早期就得益于数字图书馆发展浪潮的兴起而快速发展。如今,CBIR技术由于其广泛的应用领域和较高的应用价值为越来越多的研究者所关注。CBIR算法将图像的视觉内容作为描述特征来进行图像的匹配和检索。图像底层视觉特征通常指颜色特征、纹理特征和形状特征,其中图像的形状特征能够有效地描述人类视觉系统对图像内容的感知,并能够在相似图像的区分识别中提供具有重要价值的视觉线索。本文围绕基于形状分析技术的图像检索这一命题,探讨了相关的图像内容的分割和描述方法,并对其中涉及的形状分割,轮廓分析和特征融合分析这三个关键技术环节进行了深入研究。在形状分割过程中,根据形状分析在图像检索中的应用需要,本文提出了一种基于形态学滤波特性的边缘算子,使用多方向结构元素实现了边缘的精确检测,并根据图像的灰度特征自适应的调整各方向结构元素检测结果的权值,最后合理地调整结构元素的尺寸大小。仿真实验结果表明,与经典微分边缘算子及常用形态学算法相比,该算法不仅具有很强的抗噪性能,而且能更有效的提取图像中不同方向的边缘信息。在基于轮廓的形状分析过程中,形状描述子应体现目标的整体形状信息和重要特征点信息,并具备对噪声干扰的鲁棒性。本文提出一种基于轮廓重构和特征点弦长的图像检索算法,首先在目标轮廓提取的基础上分析轮廓的能量保持率,并进行轮廓的降维重构处理,从而减少了随机噪声造成的轮廓畸变。然后通过新定义的支持域来计算轮廓点的特征强度,并分析了支持域半径与特征点提取结果的关系,从而筛选出有效的轮廓特征点。最后,根据轮廓点和相应特征点间的弦长关系构造轮廓特征函数,经相应处理后最终得到的形状描述子满足不变性要求。大量实验表明,本文算法无论在常规样本库中,还是噪声样本库中都具有更优的检索性能。在基于特征融合的形状分析过程中,视觉特征描述方法作为标本识别中最为关键的步骤,应体现目标的整体形状信息和轮廓形状特征,并具备较强的鲁棒性。基于对标本识别中形状特征的研究,本文提出了一种基于组合视觉特征的标本描述方法,改进Hu矩的特征提取算法,消除了数据冗余,并增强了边缘细节的描述。利用近似轮廓点来精简轮廓顶点数量,得到目标轮廓的近似多边形,提高了轮廓描述过程的实时性。通过一种基于特征点的方法来描述标本轮廓,并利用傅里叶描述子对其进行分析,保证了算法的高计算效率和向量维度的紧致性。实验结果表明,本文算法在动物标本以及叶形标本构成的数据环境中,都显示出了优于其他比较算法的检索性能。