论文部分内容阅读
随着人工智能技术的快速发展,三维计算机视觉得到了更多学者的关注。飞行时间(Time of Flight,TOF)三维成像是计算机视觉领域的重要研究方向,由于帧速率高、响应速度快等优势,广泛应用于无人深空探测、机器人导航、自动驾驶、实时定位与地图构建(Simultaneous Localization and Mapping,SLAM)等领域。但是,TOF成像技术会受到系统噪声和非系统噪声的影响,给TOF点云的三维场景分割和目标提取带来了困难和挑战。本文针对这些问题,提出了基于无监督学习的TOF矢量点云自适应提取算法。本文研究内容包括以下几个方面:1.研究了TOF三维成像系统组成、成像物理原理和数学模型、深度测量误差分析理论。开展了k-means聚类算法、K-NN(K-Nearest Neighbor)分类算法、K-NN搜索算法和空间组织索引的基本原理研究,详细分析了kd-tree(K-dimensional Tree)索引的结构特性、算法流程和时间复杂度。2.针对TOF成像结果在不同场景、距离模式以及分辨率中存在差异而产生的自适应目标提取难题,结合机器学习思想,提出TOF矢量点云的自适应目标提取方法,研究了不同分辨率、不同目标物、不同视角、不同距离模式以及不同拍摄环境下的复杂目标提取算法的适用性,其中分辨率包括320×240、640×480分辨率,目标包括不同的目标物和不同的目标物数量,视角包括不同拍摄视角和不同目标物视角,距离模式包括1m、3m、4m距离模式,拍摄环境主要包括实验台、室内场景和室外环境。3.开展了半径滤波、K-NN滤波以及SOR(Statistical Outlier Removal)滤波的理论性研究,并将本文提出的方法与它们进行了比较研究。研究对比线性扫描法和kd-tree索引法在动态K-NN搜索中的流程,提出了基于kd-tree局部重用特征缓存的动态K-NN快速搜索方法。4.对本文提出的算法进行了详细的实验验证和分析。实验表明,二分迭代k-means算法相比于等分法和聚类法,具备优秀性能的同时,具有更强的鲁棒性。基于点云矢量无监督学习的目标提取算法具有良好的自适应提取效果,且F1值和F值相较于V-RS(Vector-RANSAC)方法分别提高了30%和10%左右,相较于其他传统方法整体提高了50%和30%左右。基于kd-tree局部重用特征缓存的动态K-NN快速搜索算法相比于kd-tree方法,在未降低滤波效果的前提下,当迭代次数达到25时计算效率可提升51%左右。对上述算法进行了详细的数据分析,总结各算法的特性、适应区间以及参数的选取对算法结果的影响。本论文的主要创新工作为:1.提出了一种基于无监督学习的TOF矢量点云自适应提取算法。第一步通过FVP-k-means(Full Vector Projection k-means)算法对初始TOF点云数据进行全局的目标定位。第二步通过基于高斯分布的迭代K-NN滤波算法完成目标所在区域的局部噪点滤除。2.提出基于kd-tree局部重用特征缓存的动态K-NN快速搜索方法。定义了动态K-NN搜索问题的概念,分析了冗余计算原理和优化空间。通过“近邻表”数据结构缓存节点的重用近邻特征,减少kd-tree索引的构建次数,提高计算效率。