服务机器人的目标物品识别与分割

来源 :北京信息科技大学 | 被引量 : 1次 | 上传用户:sunbody
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着服务机器人在近年来的快速发展,机器人的相关应用算法也在不断的更新。目标识别作为其核心算法之一,在机器人应用中具有重要的作用。特别是其检测速度决定着机器人目标物抓取的效率。同时人工智能在近几年得到了快速的发展。尤其是以神经网络和机器学习为基础的深度学习方法正逐渐应用到各行各业中,在目标检测领域,深度学习相关算法的更新对检测精度的提升起到了重要的作用。近年来,目标检测的算法主要有两种:单阶段目标检测算法和两阶段目标检测算法。其中以单发多边框检测器(Single Shot MultiBox Detector,SSD)、快速多目标检测器(You Only Look Once,YOLO)系列算法为代表的单阶段检测网络,在检测速度上有很大的提升,但检测精度不高;而以快速区域卷积神经网络(Fast R-CNN)、Faster R-CNN等区域卷积神经网络系列为代表的双阶段检测网络大幅度提高了目标定位、分类的精度,但检测速度相对较慢。因此,如何平衡检测精度和检测速度,是深度学习相关算法需要改进的地方。本文是以两阶段的掩码区域卷积神经网络(Mask R-CNN)网络为基础展开服务机器人目标检测与分割系统的研究。Mask R-CNN是区域卷积神经网络系列的检测网络,检测精度较高,对于远距离的小目标有较高的检测精度,而服务机器人更注重检测、分割的精确度。因此,本文将在保证较高检测精度的前提下,通过修改网络结构来提升相关算法的检测速度。考虑到Mask R-CNN网络中的卷积神经网络提取到的特征图具有很高的维度,过高的维度会占用大量的计算内存,产生大量的计算任务。为此,本文对Mask R-CNN网络进行改进:将头部轻量化区域卷积神经网络(Light Head R-CNN)引入到Mask R-CNN网络中,增加分离大卷积层和去掉多余的全连接层;同时调整区域建议网络(Region Proposal Network,RPN)网络中“锚点”的比例,应用到Tenworflow框架下。以此节省内存空间及提高检测速度。最后,在带有KinectⅡ的家庭服务机器人平台上对改进的Mask R-CNN网络进行了测试。测试结果表明:与原始的Mask R-CNN相比,改进的Mask R-CNN网络在保证检测精度的同时,可以大幅提高算法运行的速度,检测时间缩短2倍以上。有助于后续提高服务机器人目标抓取任务的效率。
其他文献
视频合成孔径雷达(Video Synthetic Aperture Radar,Video SAR)是一种新型SAR成像模式,因其具有高帧率成像的特点,可以有效解决传统SAR在地面运动目标检测(Ground Moving Tar
随着计算机视觉的不断发展,行人检测技术也越来越受到人们关注,在实际生活中的应用也越来越广泛。目前,计算机硬件的性能不断提升,日常生活中产生的图像视频数据急剧增加,为
随着人工智能技术的快速发展,家庭服务机器人的应用越来越广泛,其中人脸识别作为家庭服务机器人的主要功能,成为了计算机视觉和机器人领域的研究热点之一。传统的人脸识别算法局限于实验室环境中,现实环境中的人脸图片和服务机器人拍摄的人脸图片会受到角度、光线、分辨率、形态等影响,一定程度上影响人脸识别的准确率。近年来,随着深度学习在图像识别、视频识别等领域取得巨大的进展,研究基于深度学习的人脸识别技术在家庭服
体育竞赛中,持续竞争优势对参赛队的可持续性发展具有非常重要的作用。拥有持续竞争优势的参赛队可以获得更多的投入,能更好的进行梯队建设,往往在下次比赛中的夺牌呼声更高;失去持续竞争优势的参赛队或将面临更大的外部问责,直至破坏运动队的可持续发展。本文将持续竞争优势理论运用于全国大运会项目绩效研究之中,比较分析主观评分类和客观类项目竞争优势的持续性差异,初步探讨影响项目持续竞争优势的因素及原因。本文按照选
大数据时代,各行各业与互联网的紧密结合产生了海量的业务数据,通过分析这些业务数据可以为公司制定更好的运营策略,从而提升公司的盈利能力。Hadoop MapReduce系统的出现简
改革开放40年,我国经济高速发展,企业对资金需求量增大,在传统融资方式难以满足企业融资需求的背景下,利用资产支持证券进行融资不断被企业采用,被市场接受。信用增级作为资产证券化的重要一环,尤其对主体评级不高的企业融资有重要意义。在国内信用增级研究相对匮乏的背景下,对其进行研究不仅可以丰富研究内容,还能给实务操作提供参考。鉴于此,本文选择了“星美国际影院信托受益权资产支持专项计划”这一案例,借助现有相
多目标优化问题广泛存在于各种实际工程应用中,越来越多的研究人员将目光聚焦于与之对应的多目标优化算法领域。其中基于分解的多目标优化算法(MOEA/D)被视为非常有竞争力的算法,其在众多测试问题中都表现良好,但其性能对于分解的方法非常依赖,算法期望得到一个在PF面上均匀分布的权重向量,如果权重向量不均匀,则目标向量永远不会均匀。此外,大多数算法在处理低维问题时表现良好,但在高维空间会出现性能退化。本文
目的研究基于Leksell定向仪及三维影像系统的立体定向颅内电极植入方法安全性及可靠性。方法在自主研发的影像处理系统上三维呈现病人脑部影像,重建脑表面血管,设计合适的电
会议
机载雷达前视成像和目标检测在前视侦察、精确制导、物资空投和地形避让等军事和民用领域有着十分重要的应用。然而,常规的多普勒波束锐化或者合成孔径雷达存在前视成像盲区。基于波束扫描的雷达,能够获取前视区域的实波束图像,但是收到天线尺寸的限制,使得实波束图像方位向分辨率较低,通常无法实现前视区域中多个感兴趣目标的有效分辨与检测。因此,开展机载雷达前视成像检测一体化技术的相关研究,对提升机载雷达的性能有着重
自从2006年变换光学提出以来,人们按照自己的想法自由设计光的行走路径。变换光学通过推导坐标变换得到材料的电磁参数,超构材料逐渐成熟的发展更是促成了变换光学的繁荣。在过去的十几年里,人们依据变换光学在理论上设计出大量拥有强大功能的光学器件,如隐形器件、旋转器件和光学幻像装置等。在实际实验中,科研工作者们会引入简化的材料参数以便制造,例如在微波段实现的隐形器件和旋转器件等,但在材料参数简化后,隐形和