写字机器人感知与推理方法研究

来源 :哈尔滨工程大学 | 被引量 : 2次 | 上传用户:jay1222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为人工智能技术的重要载体,机器人扮演了越来越重要的角色。而智能写字机器人对于辅助人类书写、提高书写速度与质量具有重要意义,也是对多种人工智能技术的创新性与集成性应用。从让写字机器人具备学习和思考能力两方面分析,智能写字机器人存在普遍及其独特的研究难点,例如,用于帮助写字机器人获取写字场景知识的多目标分割算法及部分遮挡目标识别算法研究、用于训练写字机器人学习写字相关动作的增强学习算法研究、用于实现写字机器人常识推理的知识表示与推理方法研究、用于实现写字机器人处理异常的异常检测与常识推理方法研究,以及如何将上述多种人工智能技术集成到写字机器人上等。本文重点研究写字机器人的视觉知识获取、动作学习、常识推理与异常处理算法,目的是实现写字机器人主动地学习关于环境及其自身的知识、智能地探索环境和操作目标、利用所获取的知识与推理逻辑更好地理解任务与环境、以及处理执行任务时遇到的异常,使写字机器人更加智能和具有柔性。首先,写字机器人应该获得较全面的关于写字场景的视觉知识,才能实现合理的目标操作、任务规划及常识推理。鉴于深度数据对于感知环境和操作目标有独到的作用,本文以Kinect为传感器在获取深度图像的基础上,重点研究了深度图像滤波、深度图像分割、目标尺寸数据的自动获取方法,以及部分遮挡目标的自动识别方法。深度图像滤波是利用深度图像获取视觉知识的前提,本文针对由结构光和环境造成的深度图像中存在过多噪声的问题,提出了一种基于像素滤波与加权移动平均滤波的组合滤波算法,在大量对比实验的基础上得到组合滤波算法的最优参数和组合方式,通过比较双边滤波算法及引导滤波算法的结果,表明本文提出的组合滤波算法对去除深度图像噪声点及抑制噪声斑点闪烁效果更好。在深度图像滤波的基础上,为帮助写字机器人获取写字场景中目标的信息,提出了一种基于深度值梯度特征与K-均值聚类的深度图像多目标分割方法,该方法提取深度图像中目标平面的深度方向梯度特征和深度幅值特征,经过两次K-均值在特征数据上的聚类,能够自动分割出不同倾斜角度和深度的平面。在深度图像滤波和分割的基础上,为实现写字机器人获取关于写字场景中目标尺寸的知识,基于Kinect深度成像几何原理提出了一种基于深度图像的目标尺寸自动获取方法,该方法所获数据与实际目标尺寸能够保持一致。针对写字场景中目标可能局部被遮挡导致难以识别的问题,提出了一种基于Bilattice推理框架与组合SVM的部分遮挡目标识别方法,实现了对部分遮挡的粉笔盒的识别,通过与采用级联分类器的识别方法实验结果对比,表明本文利用机器学习和加入先验知识推理的方法对部分遮挡目标识别的精度更高。其次,写字机器人应该能够根据写字场景环境自主地规划和采用动作,为了训练写字机器人基于输入的视觉特征学习写字相关动作,本文重点研究了状态表示方法和增强学习算法,提出了一种基于生长型神经气(Growing neural gas,GNG)网络与eNAC(episode natural Actor-critic)算法的动作学习方法。针对写字机器人需要根据已知目标信息寻找感兴趣目标的问题,采用GNG网络表示MDP(Markov decision process)问题的状态空间,将场景的视觉图像输入映射成GNG网络,其中不同目标映射为网络中的不同神经元节点,再用适用于连续动作/状态空间MDP问题的eNAC算法从GNG网络节点表示的状态中学习,实现了Gazebo仿真环境下Pr2机器人根据已知目标信息寻找感兴趣目标的目的。最后,为实现写字机器人利用所获取的知识思考它的行为与任务进展,并对异常进行处理,在写字机器人常识推理及异常处理方面,重点研究了常识推理中的矛盾知识的判断与处理方法以及异常检测和处理方法。针对常识推理存在矛盾知识的问题,提出了一种基于常识之间关系的矛盾知识检测和处理方法,改进了主动逻辑规则中矛盾知识的判定条件及消解方法,使主动逻辑更适于写字机器人常识推理。针对写字机器人需要处理可能遇到的异常,分析了元认知环的异常处理机制并用主动逻辑的规则实现,Q-学习机从回报改变的网格结构中学习的实验验证了元认知环对异常处理的有效性。在主动逻辑与元认知环的研究基础上,本文引入了课题组提出的双闭环的认知和元认知结构作为写字机器人学习和推理系统的框架。提出了一种基于A-distance矩阵对实值向量流表示的谓词流状态异常检测算法,对写字任务的异常检测实验验证了算法的有效性。最后,本文设计了写字机器人获取手臂长度的知识与写字机器人取书两个案例,综合运用知识获取、动作学习与元认知推理,验证了具备元认知推理和学习能力的写字机器人能够有效地在获取知识并处理异常。
其他文献
<正> 胃下垂是常见的消化道疾病之一,其主要症状是上腹部胀满、下坠、嗳气吞酸、纳呆或呕、便溏或干、夜寐不眠等。与祖国医学“胃脘胀满”和“脾阳下陷”等表现的症状大致相
高校应收及暂付款,是学校资产的重要组成部分。随着高等教育事业的发展,高校经济业务量大增,资金往来频繁。
财政支出结构,也称“财政支出构成”,是指财政支出规模总额中各类支出的组合以及各类支出在支出总额中所占的比重。当前我国正处于社会矛盾丛生的历史阶段,发挥好公共财政的公共
目的:通过观察慢喉喑患者服用慢喉喑1号方后,患者声音嘶哑严重程度的观察和治疗前后间接喉镜或纤维喉镜下声带充血、声带水肿肥厚程度及声门闭合情况的观察,评估化痰开音方治
随着我国城市轨道交通网工程的不断进行,地铁建设在城市轨道交通建设中所占的比例越来越重。而顶管技术作为一种在我国市政管道建设中得到广泛应用的非开挖施工方法,在进行施工
随着中国农业产业结构调整的深入进行,农业科技示范园在产业调整过程中发挥越来越重要的作用。农业科技示范园的产生是农业生产力发展到一定水平的必要产物,是一种正在迅速发
目的探讨改良立体定向软通道微创穿刺引流术对高血压壳核脑出血患者术后神经功能(NIHSS)评分及血肿清除率的影响。方法选取2014年3月至2016年11月我院86例高血压壳核脑出血患者
近年来,高层建筑发展迅速,建筑朝体型复杂、功能多样的综合用途发展。从建筑功能的要求上讲,上部需要小开间的轴线布置和较多的墙体,下部要求柱网大,少墙体以提供尽可能大的
从2004年至2014年,中央近十年连续发布的一号文件重点关注农村金融问题,其许多政策建议都与农村金融改革和完善农村金融服务密切相关,国家在金融支农方面给予大量的政策扶持和政
鸡大肠杆菌病是严重危害养鸡业的一种重要的细菌性传染病。随着养殖规模的扩大,该病也在不断增加,给养鸡业造成了严重的经济损失。鸡大肠杆菌病是由大肠杆菌所引起的局部或全