论文部分内容阅读
物体识别是当今计算机视觉领域的一个难点问题,引起越来越多的计算机视觉工作者的兴趣与关注,其主要过程是使用相关算法在图像中把感兴趣的物体识别出来。同时,它也是机器人导航、人机交互、图像理解、图像自动标注、基于内容的图像搜索、智能视频监控等应用项目中的关键难题,有着广泛的研究和应用背景。本课题的研究进展将会促使相关应用领域当中的关键问题得到更好地解决。本文对基于特征匹配结合分割验证的物体识别方法进行了研究。在前人基于投票机制的物体识别方法的基础上,整合SIFT (Scale Invariant Feature Transform,以下都简称SIFT)特征提取和特征投票的过程,采用MeanShift算法对投票结果的统计方法进行了改进,达到较好的实验结果。对物体识别的两个应用:基于内容的图片搜索和视频跟踪,本课题也进行了细致的研究。在图片搜索领域,目前主流的技术是通过文本去查找图片。谷歌和百度等搜索引擎采用的便是基于图片标签的匹配,用户输入文本信息,系统返回文本对应的图片。本课题的研究目的是用户输入一幅图片,系统返回与之相似的图片。Sivic和Zisserman借鉴了文本信息检索当中的tf-idf模型,得到了比较好的实验结果。首先把从训练集中提取得到的特征进行kmeans聚类,生成的每一个簇集定义为一个单词,给每个单词关联一个倒排文件(它表示的含义是该单词在训练集所有图片当中的分布情况)。然后把从查询图片中提取到的特征量化到这些单词当中,最后对查询图片与训练集中图片进行相似度评测。Nister和Stewenius在这个工作基础上提出了分层聚类的做法,利用树形索引,极大地缩短了特征量化所需的时间。我们的工作在前人的基础上利用模糊分类理论,改进了特征量化的过程,实现了一个小型的图片搜索系统。在视频跟踪领域当中,实际应用中复杂的动态背景、运动目标的尺度伸缩、目标遮挡、光线亮度的变化等等都给跟踪造成巨大的挑战。本课题期望实现一种鲁棒实时的跟踪系统,能够克服运动目标的尺度变化、部分遮挡以及光线亮度变化等不利因素。预期采用的方法是在kalman滤波预测的框架内,采用基于特征和区域统计特性的目标描述方法,利用改进的系统状态向量对运动目标进行跟踪。