论文部分内容阅读
视觉是人类获取信息的一个重要来源。科学研究表明,人类所获取的信息中,四分之三以上的信息是视觉图像信息。同时,随时技术的发展,视频类的信息越来越多,能够理解视频中的内容并进行处理的需求也与日俱增,这就需要利用计算机中的视频技术对视频做相应的处理,如按照不同的属性将视频进行自动归类,根据用户的选择对视频中的对象进行相关操作以及对感兴趣的对象进行实时的检测和跟踪等。因而,能够获取并且处理相关的图像、视频信息来得到所需要的信息的技术一直以来就是研究的热点和难点。面对这些接踵而来的需求,传统的视频压缩编码标准如MPEG—1/2和H.26x都采用基于帧的技术,然而却不要求对场景进行分割处理,虽然能获得较高的压缩比,并且在很多领域得到广泛的应用,但是在现有条件下却无法满足上述的需求。为此,MPEG-4编码采用了与以往以不同的帧格式压缩编码方式的编码规范,采用了基于包含若干视频对象(VO:Video Object)的视频层(VOP:Video ObjectPlan)的编码方式,这为跟踪视频对象提供了基础。为了能够研究视频序列里的对象,就需要从视频序列里提取出感兴趣的视频对象,并选取一定的描述方式来表达对象,然后采用一定的步骤来进行跟踪。然而视频对象的分割和提取是一个研究难点,同时,不同的视频对象表示方式也将导致不同的视频对象跟踪方法。为此,本文研究了主流的几种不同的对象的分割提取、表示和跟踪方法,提出了一种联合使用特征点(IP)和几何特征点来描述视频对像的方法,使得对象的描述更精确,并对于物体遮挡有一定的鲁棒性;同时,视频对象特征点的数量一般比较大,并且有不少不相关的特征点干扰,为此,本文提出了一种算法,可以在很大程度上去除无关特征的干扰,并且使得感兴趣对象本身的特征点的冗余性也有很大程序的降低。同时也给出了基于此种描述方式的对象跟踪算法。由于上述的处理,使得计算Mahalanobis距离的开销大大的降低。最后,通过相关的实验,对算法的分割和跟踪的有效性进行了验证。实验表明,该算法可以自动的获取视频中的活动对象,有效的去除了大量无关的特征点,并对视频对象进行跟踪处理,算法取得了很好的效果。无线传感网络的应用在许多方面都需要节点的位置信息,在有些情况下,位置信息是决定信息是否有价值的决定性因素,也可能是完成下一个功能的必要因素,如消息路由就可能以节点的位置作为路由的依据。因此如何计算出节点的位置信息,显得的非常重要,但无线网络的节点都受到一些资源的限制,如计算能力差,内存小,通信半径小,电源持续时间短等,这些因素都限制了定位技术,定位算法的选择。目前存在许多的定位系统,但大部分都是处于实验阶段或模型提出阶段,真正能实际应用的非常少,主要原因它们所依据的测量技术误差普遍较大,实现困难,同时定位算法的复杂度高,工作量大,通信费用高。