一种物体识别方法的研究及若干应用

来源 :复旦大学 | 被引量 : 0次 | 上传用户:lshwy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体识别是当今计算机视觉领域的一个难点问题,引起越来越多的计算机视觉工作者的兴趣与关注,其主要过程是使用相关算法在图像中把感兴趣的物体识别出来。同时,它也是机器人导航、人机交互、图像理解、图像自动标注、基于内容的图像搜索、智能视频监控等应用项目中的关键难题,有着广泛的研究和应用背景。本课题的研究进展将会促使相关应用领域当中的关键问题得到更好地解决。本文对基于特征匹配结合分割验证的物体识别方法进行了研究。在前人基于投票机制的物体识别方法的基础上,整合SIFT (Scale Invariant Feature Transform,以下都简称SIFT)特征提取和特征投票的过程,采用MeanShift算法对投票结果的统计方法进行了改进,达到较好的实验结果。对物体识别的两个应用:基于内容的图片搜索和视频跟踪,本课题也进行了细致的研究。在图片搜索领域,目前主流的技术是通过文本去查找图片。谷歌和百度等搜索引擎采用的便是基于图片标签的匹配,用户输入文本信息,系统返回文本对应的图片。本课题的研究目的是用户输入一幅图片,系统返回与之相似的图片。Sivic和Zisserman借鉴了文本信息检索当中的tf-idf模型,得到了比较好的实验结果。首先把从训练集中提取得到的特征进行kmeans聚类,生成的每一个簇集定义为一个单词,给每个单词关联一个倒排文件(它表示的含义是该单词在训练集所有图片当中的分布情况)。然后把从查询图片中提取到的特征量化到这些单词当中,最后对查询图片与训练集中图片进行相似度评测。Nister和Stewenius在这个工作基础上提出了分层聚类的做法,利用树形索引,极大地缩短了特征量化所需的时间。我们的工作在前人的基础上利用模糊分类理论,改进了特征量化的过程,实现了一个小型的图片搜索系统。在视频跟踪领域当中,实际应用中复杂的动态背景、运动目标的尺度伸缩、目标遮挡、光线亮度的变化等等都给跟踪造成巨大的挑战。本课题期望实现一种鲁棒实时的跟踪系统,能够克服运动目标的尺度变化、部分遮挡以及光线亮度变化等不利因素。预期采用的方法是在kalman滤波预测的框架内,采用基于特征和区域统计特性的目标描述方法,利用改进的系统状态向量对运动目标进行跟踪。
其他文献
随着计算机技术的不断发展和互联网Web 2.0时代的来临,社交网络(如:Twitter、Facebook、微博)逐渐成为当今国内外社会化媒体的重要平台。微博服务平台作为社交网络的一种,也
随着科技的发展,以往单一的教学方式逐步被改善。多媒体教室以多渠道的教学内容呈现方式,将理论教学和直观教学有机的结合在一起,调动了学生的学习兴趣。目前,在多媒体教室的
在常规的显示设备上,高动态范围三维体数据直接体绘制常常受到显示设备动态范围的限制,动态范围相对狭小的显示设备及其每颜色通道8位的编码方式成为了动态范围宽广、分布极
我国目前正在加速各领域的信息化建设,在此过程中,信息安全保障的需求日益显现出来。目前大部分组织对信息安全的理解还只停留在技术层面上,认为外部网建立了防火墙能防黑客,
随着智能交通、智慧城市等新概念的提出,使得车载自组网(Vehiclar Ad Hoc Networks,VANETs)成为当前研究的热点。VANETs作为一种特殊的移动自组织网络(Mobile Ad Hoc Network
事件流作为数据库领域的新兴热点问题,近年来获得了日益广泛的关注。很多应用在本质上都是事件驱动的,例如,RFID采集到的元数据可以看做是一种简单事件,商业事务处理中每次交
随着现代服务业的发展,各种业务信息系统层出不穷,其中一个关键的问题是各服务提供商之间如何有效地分享利益,实现服务的可持续运营。因此对服务计费软件的效率,灵活性和可扩
Web服务作为解决企业间的数据交换和集成等问题的分布式计算模型,在开放的网络环境下,存在安全隐患。传统的安全机制只能保证Web服务传输层和网络层的数据安全,不能保证Web服
近年来,现代服务业发展迅速。现代服务业大多需要IT服务系统的支持,这催生了对服务工程的系统研究。哈尔滨工业大学在模型驱动体系结构(MDA)的基础上提出了面向服务的模型驱
随着新型非易失性存储器(Non-Volatile Memory,NVM)技术的飞快发展,这类存储器件在访问性能、写寿命等方面越来越接近内存。存储级内存技术(Storage Class Memory,SCM)是针对