论文部分内容阅读
本论文研究的主要内容是基于内容的图像结构表示和分类。作为一个有着广泛应用前景的研究领域,基于内容的图像分类吸引了越来越多的研究人员参与,取得了许多研究成果并开发了一些商用和研究型系统。但由于缺少结构化的表示,基于内容的图像分类存在一定的问题。基于此,一些学者研究用神经网络表示和处理数据结构的方法,通过结构的反传算法(BPTS)学习和分类树型和图型结构信息。 本文在前人工作的基础上,分别对特征提取、结构内容的表示和分类,各种迭代网络分类器以及误差收敛曲线进行了研究和讨论。设计并实现了一个基于结构内容的图像分类系统。 在特征提取方面,总结了CBIR中成熟的颜色、纹理和形状特征提取方法。提出了一种分块主色HSV特征提取算法。实验结果证明,主色HSV相对RGB更符合人的视觉和心理感知;中心分块在描述局部信息的同时也能突出主题。 给出了图像结构化表示的数学定义以及通过结构反传(BPTS)算法的自适应处理数据结构迭代神经网络的一般框架。 提出了一种基于树型结构的自然图像表示和分类的方法。实现了对图像逐步分级的四叉树型结构(无区域分割)的表示以及在UC Berkeley的图像库分割结果基础上的自动邻接区域二叉树和人工生成多叉树型结构表示。讨论了几种不同迭代神经网络模型的分类器以及通过结构反传的树型结构的学习流程。实验结果表明,基于迭代神经网络的结构表示和分类方法具有很强的结构学习能力,而且相对于传统的BP网络,分类性能有很大的提高。同时,基于分割结果的树型表示,尤其是人工生成的多叉树涵盖更多的语义信息且能得到较好的分类结果。 最后,对比了不同网络结构和不同的隐层神经元个数对分类结果以及误差收敛曲线的影响。从迭代神经网络的输入样本入手详细分析了错误的实例并提出了本文的不足和今后的研究方向。