论文部分内容阅读
视觉机器人通过相机采集周围场景的图像,基于图像获取目标物体的位置和姿态信息,进而控制机械臂完成相应的操作。其中通过图像准确快速的获取目标的位姿信息是至关重要的环节,具体到本文的应用场合,目标是获取RRU产品上电源口的位姿信息。考虑到传统的目标检测技术需要人工设计提取的特征,对复杂背景环境下的目标检测准确度和效率都比较低,本文选择鲁棒性好、精度高的深度神经网络来进行目标检测。本文设计了一种神经网络和传统图像处理技术结合的方法来获取电源口的位姿信息,首先使用神经网络对电源口中的两个插针进行边界框预测,然后基于预测边界框使用大津算法阈值化和图像矩来求取两个插针中心,间接得到电源口的位姿信息。考虑到相机畸变会引起图像扭曲和插针形状失真,造成基于预测边界框中的像素信息获取中心点时会存在误差,本文中对使用的相机建立畸变模型,对采集到的图像进行去畸变处理。由于待检测物体插针为特定目标,需要自主建立数据集。本文中介绍了数据集的具体建立过程,以及网络训练过程使用的数据集增广手段。数据增广手段包括随机裁剪、偏转、缩放、颜色抖动等。实现目标检测的神经网络模型基于CornerNet进行改进得到,具体的改进有以下四个方面:考虑到CornerNet由于其特征提取网络结构复杂,存在大量的计算成本。本文中使用具有稠密连接且参数量少的DenseNet作为基础特征提取网络,实现特征复用和增强。引入深度可分离卷积,充分减少网络参数和计算量。引入SE模块,增强通道信息的传播。引入连续的可变形卷积层,使得卷积感受野可以随着待检测目标的尺寸和形状自适应调整。此外还讨论了网络优化方法的选取和非极大值抑制算法的改进,使用具有动态学习率边界的优化器进行参数更新效果更优,使用改进的柔性非极大值抑制算法去除冗余边界框能有效的改善检测效果。实验结果表明,同一参数优化方法和非极大值抑制方法条件下,改进后的最优神经网络模型与原始网络模型相比,网络参数数量大大减少,约为原网络的1/28倍,基于测试数据集的精度指标AP提升了7.2%,其中AP50和AP75分别达到95.8%和92.7%。