论文部分内容阅读
通过二维图像获取三维信息是计算机视觉的主要研究目标之一,随着其应用的不断扩大和深入,新的科技需求和科学问题不断出现,其中从多视点图像、序列图像与无序图像集(包括网络图像)中获取三维信息更是当前的主流方向,特别对未定标的图像系统,难度更大。本文根据研究第四代人机交互中AVR (from actual to virtual reality)三维虚拟现实的要求,着重研究了涉及多视点图像、序列图像与无序图像集(包括网络图像)中获取三维信息的若干有关提高三维重建精度的问题。在高精度相机定标、从射影重建到度量重建中自定标、定标参数的统计优化理论与算法方面取得了一定的成果,并建立了一个AVR的重建原型系统(3DPOM).论文的主要贡献如下:1.在高精度相机定标方面,针对图像中表面纹理不丰富的景物需要借助人工标记进行辅助特征匹配的问题,提出了一类编码圆环标记的检测与识别系统方法。该方案引入同态滤波压抑了光照变化对图像二值化的影响;在对标记成像边缘检测时,提出了1D边缘检测法,从而能够快速、准确地拟合出标记中心位置;在对编码区域译码时,提出了仿射变换矫正与极坐标变换相结合的方法,降低了成像形变造成的译码错误率。整个系统具有抗光照变化鲁棒性强、标记中心定位精度高和译码准确等特点2.对多视点图像三维重建的精度提高问题,对固定焦距相机的自定标,提出了基于LMI (Linear Matrix Inequality)松弛技术的多视点固定焦距值全局优化求解方法。以往不少研究者从本征矩阵出发讨论了如何从两视点中估计焦距值,本文借助绝对对偶二次曲面给出了从多视点中进行固定焦距值的全局优化求解方法。该方法在绝对对偶二次曲面的基本成像约束方程基础上,把固定焦距作为独立未知量纳入到目标函数中,构造了带约束的多项式极值问题,通过使用基于LMI松弛的优化方法获得了焦距的全局最优解。合成数据和真实图像实验均表明本文方法是有效的,具有计算时间快和鲁棒性好的优点。3.在长序列图像的三维重建过程中容易出现误差积累问题,针对焦距固定相机且未定标情况,提出了长序列图像相机焦距的最优估计和度量重建结果的层次融合式重建方法。该方法利用焦距固定和序列较长的两个特点,把重建的各个阶段紧密有机地整合在一起,通过焦距参数的分组自标定与集中投票相结合的方式,得到了概率意义下的最优焦距值,减小了焦距估计的偏差。在对度量重建结果进行融合时,提出了极小化基于L∞范数表示的重投影误差的融合算法,克服了以往极小化基于L2范数表示的重投影误差容易陷入局部极值的缺点。实验表明重建结果具有较高的准确度,可满足基于长序列图像的建模、绘制以及增强现实等应用的要求。4.针对无序未定标图像集合中进行三维重建所面临的图像组织和相机鲁棒自定标问题,捉出了基于生成树层次剖分的射影重建层次融合和鲁棒绝对对偶二次曲面估计方法。在图像有序化过程中,构造了两视点几何关系监督下的生成树,为了减少误差积累对投影矩阵精确性造成的不利影响,在生成树剖分的基础上实现了图像的群组划分,按照与层次剖分相反的次序把各个群组内的射影重建结果融合在一起。为了将射影重建正确转换为度量重建,把有无穷远平面约束的基于绝对对偶二次曲面的自定标纳入RANSAC计算框架下,提高了自定标成功率。实验结果表明生成树层次融合三维重建方法可以对无序图像进行正确的相机位置估计和场景结构恢复。在以上各部分的合成与真实数据实验验证的基础上,最后实现了一个实用简便、精度高、真实感强的模型重建原型系统3DPOM,作为AVR实验平台和总结性的成果,为今后进一步的研究打下了坚实的基础。