论文部分内容阅读
静态图像的分割解释和序列图像的运动分析是计算机视觉中两个基本的问题,已有大量的研究工作者对这些领域进行了深入的研究并提出了大量行之有效的方法,并业已在人们的生产生活中显示出越来越大的作用。 本文在静态图像的分割解释和序列图像的运动分析这两方面都做了大量富有成效的研究,作者成功地建立了一个面向人脸图像的全自动目标提取解释与运动分析系统,所做的工作从功能上主要包括三个方面:人脸目标的解释,人脸区域的运动分析和人脸面部特征点的跟踪。 在静态图像的分割解释方面:作者仔细的研究分析了当今流行的基于统计模型的方法,并选取ASM/AAM作为基本的出发点,并将这一技术进行了大量的分析、推广和综合,做了各种改进,并将之成功的运用到人脸图像的分割和解释上,并用实验证明了其高效性和鲁棒性。 在序列图像的区域运动分析方面:作者以基本的L-K算法为出发点,推导了支持任意变换的快速的逆成分算法,并将之成功的运用到人脸序列图像的运动分析,该算法可以实时的完成对目标的跟踪,并对目标的任意仿射变换都能高效的支持。 在序列图像的点运动分析方面:作者以经典的光流方程为出发点,并将不确定性分解理论和子空间光流理论有机的融合在一起,并引入了区域运动分析中的逆成分算法思想,得到了高效的点运动估计,实验证明该算法能有效地跟踪到具有2D和1D甚至基本没有纹理的具有退化结构的目标点(极端情况只要全部点都不全在一个方向上退化即可)。 作者通过有机的融合上面三种算法,实现了一套全自动的目标提取与运动分析系统,这套系统已成功的运用在人脸视频中,它能自动的从视频中提取人脸区域,并得到人脸的二维解释,实时的跟踪视频中的人脸,并给出半稠密的点对应。半稠密的点对应这一步有效的解决了SFM问题中得一个关键难题correspondence,这为下一步对人脸作自动的三维分析提供了坚实基础;而人脸的二维解释和运动分析这一步则能在基于对象的视频压缩等领域得到更积极的应用。 从数学上,作者对统计模型的研究、子空间理论的运用和矩阵协方差加权技术等在计算机视觉的应用都进行了深入的研究,作出了一定的贡献。值得注意的是,本文的算法不仅对人脸有效,而是对一类刚性/柔性目标均能高效的进行目标的运动分析与解释,如手,汽车等。