论文部分内容阅读
图像分类是一种非常重要的获取目标类别(猫,汽车等)和场景类别(沙滩,植被等)的手段。广泛地应用于多媒体检索,视觉导航,智能监控等领域。然而,我们获得的图像往往会存在各种几何变化和光度变化,以至于准确地提取图像中的视觉信息变得非常困难,从而无法准确地对图像进行分类。局部不变特征不仅区分性强,而且可以对各种几何和光度变化具有非常好的不变性。局部不变特征的研究对图像分类系统显得尤为重要。鉴于词袋(Bag-of-Words)图像表示模型在图像分类应用中取得的巨大成功,本文在图像分类的实验中都采用该模型来对图像进行全局表示。第二章介绍了词袋模型的基本框架与核心技术。为提高实验效率,使用快速k-means算法构建视觉字典。利用空间金字塔为词袋模型中的局部不变特征加入空间位置信息。针对图像分类问题中最常见也是影响最大尺度变化、旋转变化、光度变化,本文从局部特征不变采样和局部不变特征描述两个方面展开了研究。在快速密集SIFT的基础上提出了旋转变换特征。旋转变换特征采用特定的采样规则,并在特征描述时进行近似的彩色SIFT描述,在提高特征计算效率的同时又增加了特征的区分性和光度不变性。通过对特征进行旋转变换实现等价的多方向采样,在几乎不增加特征计算量的同时提高了旋转不变性。使用金字塔采样的方式以增加采样的尺度不变性。通过实验验证了旋转变换特征在图像分类时的有效性与高效性。第五章将局部不变特征应用于回转窑烧结状态识别。与普通对象不同,火焰属于辐射型对象,火焰的亮度与颜色能一定程度上反应熟料的烧结状态,所以光度不变的特征并不利于对回转窑图像的准确描述。根据回转窑图像中火焰的特点设计出了局部形态和彩色特征,将其用于对回转窑烧结状态的识别,获得了较高的识别精度。