基于深度学习的机械臂交互预测研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:xiaofei3310
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
预测推理是机器人模仿人类智能的一项重要能力。近年来计算机视觉领域中的视频预测技术为机器人提供了预测编码的实现手段,使得机器人可以根据少量连续的视频等信息通过图像生成的方式预测得到合理的未来场景,机器便可以像人一样根据环境状态运用自身的预测能力自行规划完成一些操作任务,极大提高了机器人的智能性。目前,实现上述目标存在技术上的挑战性,包括如何构建视频预测模型从而得到准确真实的预测、如何评价预测生成的结果并选择出机器人可以使用的优秀模型、机器人如何根据视频预测模型实现自监督的运动规划。本文主要围绕以上三点开展了如下研究工作:1)开展基于机械臂与物理环境交互场景的视频预测研究。构建融合变分自编码器与生成对抗网络的无监督学习视频预测模型训练结构以及LSTM-CNN的图像预测生成器;搭建基于UR5机械臂的实验平台并完成交互轨迹数据集的制作,训练得到视频预测模型。实验结果表明,通过动态前景像素转换与静态背景合成的方式,模型可以得到较为清晰准确的预测。2)提出基于人眼视觉感知的图像质量评价指标。不同的视频预测模型往往造成不同类型和不同程度的失真,从而降低了机器人面向预测的可操作性。视频预测任务的图像质量评价必须考虑是否符合人的视觉感知来判断其合理性,而不仅仅依靠PSNR或SSIM等浅层信息。本文基于人类视觉感知的双向强迫选择(2AFC)实验,提出了一种基于卷积特征提取的视频预测结果感知评价方法。评价结果符合视频预测质量随时间下降的规律与人眼感知。另外,实验发现VggNet结构作为特征提取网络,对图像质量更为敏感,更容易对相似图像进行区分评价。3)提出并实现基于视频预测的自监督操作规划算法。以视频预测模块为核心,通过预测人为指定的任务像素点分布变化,优化目标距离损失函数选择出最优的采样动作执行规划。实验结果验证了自监督规划算法的有效性,可以完成机械臂对物体的推移旋转交互,同时也证明了视频预测模型的有效性。
其他文献
频谱感知的主要目的是在复杂的无线通信环境中精准且迅速地检测出频谱空穴,为非授权用户接入空闲的授权信道提供合理的途径。因此,频谱感知被普遍认为是认知无线电技术的基石
k-means算法是机器学习中一种经典的被广泛应用的无监督学习算法。k-means算法在处理大规模聚类场景下的效率提升具有重要研究价值,本文为提升k-means算法在大数据场景下的效
本文证明了在二维旋转双层流体内部界面上行进的小振幅孤波的存在性,这里假设该流体深度有限、上下边界均固定且受重力及内界面张力作用。此外,本文还假设流体中无相对静止点
随着各种网络技术的不断发展,移动互联应用覆盖全国各地,然而目前人们对于高带宽移动互联的需求正与日剧增。虽然移动设备具有多个网络接口,但由于传统的TCP传输协议(Transmi
工作流是提供科学实验的常用模型,它由许多任务,数据流和计算依赖性组成。将工作流任务与用于执行的计算资源(VM)映射的过程(保留任务之间的依赖性)被称为工作流调度。工作流
随着“大数据”时代的到来,教育大数据、智慧教育、教育数据挖掘等一系列结合教育学、统计学、计算机科学的概念相继被提出,政府、企业、学校、研究者、管理者、教师、社会公
知识经济时代,知识管理是企业管理活动中极为重要的内容,是企业和团队生存和革新的基础。知识共享是达成知识管理目标的必要手段,随着工作团队逐渐成为各企业的运作单位,团队
目的:对比分析中央型小细胞肺癌(small cell lung cancer,SCLC)和中央型鳞状细胞癌(squamous cell carcinoma,SCC)的18F-FDG PET/CT形态特点和代谢特征,并探讨18F-FDG PET/CT在局
目的:了解运用PDCA管理降低住院抗菌药物使用强度的效果。方法:将我院2015年7月到2016年6月的抗菌药物使用强度作为对照组,该阶段尚未实施PDCA管理,而2016年7月到2016年12月
淋巴瘤是一组异质性的血液肿瘤,弥漫性大B细胞淋巴瘤(DLBCL)是其中常见的一种亚型,约占所有淋巴瘤患者的30-40%。其中活化B细胞样型淋巴瘤(ABC-DLBCL)最容易产生耐药性,因此,