论文部分内容阅读
三维重建就是从给定一组图像集中恢复摄像机的姿态和场景三维表面。过去三十多年来,这一问题获得了广泛和较为深入的研究,其研究成果也开始应用于解决主要来源于医疗系统和数字城市及娱乐系统中存在的实际问题。本文围绕“序列图像三维重建”这一课题,分别对摄像机自标定、立体视觉图像匹配和多视图表面重建的基础理论、实现技术和实际应用进行了如下创新性的研究:(1)为了解决内外参自由变化时的摄像机自标定问题,本文提出了一种新的高效算法,该算法并不知晓摄像机和场景任何信息,解决了当前算法并不能很好地处理摄像机成像像素宽高比偏离1.0时的自标定问题,本文算法通过均衡处理代价函数中的内参变化,使得即使当像素宽高比极大地偏离1.0如实际中遇到的0.6和2.3时,都可以准确且高效地同时恢复内外参和三维场景点。(2)立体视觉图像匹配,也即立体匹配或称立体对应,要求准确计算每个像素的视差,特别是在稀疏纹理、重复纹理、深度不连续和遮挡区域。对于分辨率不高的一般图像对,为了一次性高效计算各区域的像素视差,本文提出了一种基于图割的立体匹配算法。该算法主要由两个步骤组成,依次是像素匹配代价计算和视差图全局优化。为了大幅减少当前算法在场景深度不连续处所产生的过渡平滑现象和在稀疏纹理处产生的错误匹配,前一个步骤采用的是基于图像采样噪声无关的自适应权重加窗匹配算法。为了显示地求解遮挡区域和不连续区域的像素视差,后一个步骤使用遮挡和平滑惩罚代价来约束整幅视差图,而且采用基于图割的能量最小化方法快速优化。(3)对于分辨率较高的图像对应用,一般全局算法较难收敛到全局最优,计算较为耗时,可以通过迭代的方式快速计算部分像素视差。为了逐步快速求得准确的视差,综合自适应窗和自适应权算法分别在深度不连续处和稀疏纹理处准确估计视差的优点,本文提出了一种新的基于置信度的自适应窗权局部立体匹配算法。该算法首先整形基于像素匹配的代价(本文采用的是截断绝对色差),然后在一定窗形下作自适应权聚合,接着找到具有最小匹配代价的匹配(即WTA优化过程),根据所定义的置信度公式算出其置信值。如果置信值超过一定阈值,则为可靠匹配并将其视为可信赖的视差估计,并输出结果。(4)相比于稀疏点的结构重建,多视图表面重建是为了恢复场景精细表面。受视场角的限制,存在多种可能场景相容于同一组图像。为了尽可能地减少这种不确定性,一方面定义可视局部光照一致性来约束空间同一三维点投影到各像平面上的颜色分布,另一方面定义局部平滑性约束使得重建表面更加光滑,最后构建全局能量函数,并使用图割方法快速优化。本文综述了当前研究状况,建立了一种表面重建算法实现模型,同时实现并比较研究了几种经典算法,其中给出了部分实验结果。本文最后给出了一些尚待解决和未来可能会出现的问题,并指出了进一步研究的方向。