论文部分内容阅读
三维物体运动估计是计算机视觉中的一个重要部分。它包括刚体和非刚体的运动分析。区别于传统的基于匹配与基于光流的分析方法,本文采用基于神经网络的分析方法,对三维刚体的运动参数估计进行研究。
本文针对三维刚体运动参数估计的情况,建立神经网络模型来求得感兴趣刚体的运动参数估计。主要内容归纳如下:
第一章介绍了运动分析的理论与刚体运动分析的国内外研究现状,提出了本文的研究内容及方法。
第二章介绍了三维运动分析的基础理论,包括摄像机模型、刚体运动模型,简单介绍了传统的两种运动分析方法。
第三章重点研究了摄像机的单目标定及双目标定。由于三维刚体运动分析中涉及到刚体上特征点的三维坐标,故需要通过摄像机系统来求取刚体的三维坐标。首先通过单目标定得到摄像机的内部参数;然后在此基础上标定出双目摄像机的位置关系,从而计算刚体的三维坐标。
第四章探讨了运动分割的内容。研究刚体的运动,首先需要从摄像机拍摄的场景中分离出运动的刚体,这里采用基于背景维护的运动物体分割,得到运动区域,为进一步提取运动刚体的特征点提供数据。
第五章重点研究了特征点的提取及匹配。在运动分割得到刚体运动区域的前提下,通过Harris角点检测和强角点检测的方法,提取出运动刚体的特征点,并且根据基于灰度的块匹配方法在左右摄像机之间建立特征点匹配以求取刚体特征点的三维坐标,根据多分辨率光流的匹配方法在前后运动图像帧之间建立特征点匹配,为下一步运动参数估计提供准备。
第六章着重分析研究了基于神经网络的三维刚体运动参数估计。首先简单介绍了神经网络的原理及优点,并介绍了之后重点使用的Newton-Raphson收敛方法。然后对于基于三维点匹配与基于二维运动场的情况,分析如何使用神经网络模型来求解运动参数估计。仿真实验很好的验证了算法的可行性,应用于实际序列上也得到了较好的结果。
最后对本文所进行的研究做了总结,并对之后的进一步研究做了相应的展望。