基于词袋模型的图像分类关键技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:yuxuan423
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类是当今计算机视觉领域持续热点研究问题,而机器学习作为解决图像分类问题的理论支撑和模型方法,也因实际问题的复杂性,得到进一步发展。虽然让计算机完全理解图像丰富的语义困难重重,但近年来词袋模型被成功引入处理图像分类,并快速衍生出一系列高效的图像分类算法,使得图像分类研究向前迈出了一大步。本文围绕词袋模型基础框架的关键步骤:码书学习和特征空间汇合进行初步研究。首先,提出增量神经网络学习改进传统聚类手段构建码书,此方法能在线、高效学习合适的视觉单词集合,同时以网络的形式表示码书,为后续特征编码提供了更丰富的信息。进而设计了基于子图的编码方法,有效利用码书网络中单词之间的联系为特征编码。实验表明,结合这两种方法能有效的提升了图像分类准确度及计算效率。然后,在分析现有基于稀疏表示的码书模型的迭代学习算法缺点的基础上,将自调式学习机制引入基于稀疏表示的码书学习算法,设计了一套从简单到复杂的学习框架学习基于稀疏表示的码书模型,通过实验分析验证了这种有序学习机制能改善原有迭代算法的结果,并提升分类效果。最后,详细分析二阶特征空间汇合方法,然后针对其造成的高维图像特征表示问题,提出一种融合黎曼流形上图嵌入判别分析的图像低维二阶统计信息特征表示。实验表明,该方法既可以有效降低图像特征表示维度,又能保持高的分类准确度。
其他文献
随着各种图像采集设备的普及,图像资源日益剧增。如何在大规模图像集中快速地找到并定位某个对象,是实际应用中需要解决的技术难题。对象定位技术一直是多媒体技术领域的热点