论文部分内容阅读
水下环境的复杂性使得水下图像的信息量缺乏,给目标识别和定位带来一定障碍,特别是对于非结构化目标的提取与识别存在很大的困难,这也是当前水下信息处理领域研究的热点之一。由于多尺度真实地反映出现实世界的表现形式,因此受到了学界的广泛重视。目前对尺度的概念有多种解释,如采用不同分辨率作为图像尺度的,也有以图像尺寸大小为尺度的,有的以距离远近作为尺度,还有以卷积核的参数为尺度。本文以海底目标为研究对象,重点研究了基于高斯尺度空间的非结构目标多尺度模型的建立,多尺度特征的提取,多尺度特征的图像匹配以及在水下非结构目标定位中的应用。论文首先回顾了基于视觉的水下多尺度理论的发展及现状,讨论了多尺度的定义及其基本理论,阐明了不同的尺度表达模型的特点。重点研究了高斯尺度空间理论,高斯尺度空间成为图像研究中的一个重要方面,是由于高斯尺度空间理论简单以及高斯函数本身的许多独特性质。通常的尺度变换会随着尺度的增加图像越来越模糊,更多的细节被丢失,采用高斯差函数可以保留这些细节信息。在高斯尺度空间的构造中正确选用尺度参数,以使图像信息的变化呈现均匀的特点显得尤其重要。目前许多高斯尺度空间应用中采用的层之间的尺度参数关系并不明确,使得分层效果不理想。论文基于视觉特征模型提出一种自适应高斯尺度参数的算法,并通过试验验证了它的有效性,从而为图像的高层次处理如目标识别等提供信息量稳定变化的尺度空间。尺度不变性是衡量特征提取算法的一个重要因素。针对水下图像噪声大的特点,本文提出了具有抗噪特性的尺度不变特征提取算法,算法是建立在Harris角点特征和高斯尺度空间的基础之上,在不同尺度下提取同一目标的Harris角点,从最高层的特征点开始往下搜索它们的对应点,本文还给出了该算法下求特征尺度的方法,实验表明多尺度特征点具有较强的抗噪能力和尺度不变性,且计算量少。SIFT(ScaleInvariant Feature Transform)算子因其具有良好的尺度、旋转、光照等不变特性而在图像匹配中得到广泛的应用,本文给出了水下图像的SIFT特征提取效果。结合熵的理论,本文给出多尺度熵的定义,并在此基础上通过多尺度熵差提取了水下烟囱图像的外部轮廓。本文接着研究了基于SIFT算法的水下图像匹配技术。为了增加匹配数,我们分析了彩色图像特征检测的可行性,指出了此算法在彩色图像处理中的应用潜力,并为后续工作提供借鉴及参考。针对SIFT算法采用128维向量来表征一个特征点导致计算量过大的缺陷,本文给出了基于圆形窗口的SIFT简化算法,对每个特征点只采用12维特征向量表示,在不明显降低匹配数量的同时,较大提高了计算机处理的实时性。同时,由于原算法中主方向的获得是通过对8维方向向量的统计获得,导致主方向产生量化误差,简化的SIFT算法由于采用圆形窗口,不存在量化误差,因此旋转不变性优于原算法,实验结果也验证了该结论。论文最后讨论了上述研究成果在目标定位中的应用。首先描述坐标之间的转化关系以及多种相机标定方法,并采用Zhang的平面标定算法对相机进行内部参数标定;再利用SIFT特征匹配方法求得稳定的匹配点对求得基本矩阵与本质矩阵,分解后得到单目相机的外部运动参数,通过采用立体视觉方法和运动恢复结构SFM(structure from motion)方法得到目标的三维信息,实现目标的定位。本章最后给出了目标三维信息获取的流程和计算机仿真,实验结果表明了本文方法能够满足水下机器作业的精度要求。本文针对水下机器人作业中基于视觉的目标定位问题开展了一系列的研究工作,其研究成果可为水下智能机器人作业提供理论依据和技术手段。