【摘 要】
:
所谓物体可供性(affordance)是指:目标物体结合其所具备的能力和所处的外界环境,展现出的潜在“操作可能性”(actionpossibilities)。由于这种“操作可能性”与环境和执行者
论文部分内容阅读
所谓物体可供性(affordance)是指:目标物体结合其所具备的能力和所处的外界环境,展现出的潜在“操作可能性”(actionpossibilities)。由于这种“操作可能性”与环境和执行者间可能存在的交互关系密切相关,因此物体可供性研究对于场景理解、行为识别等研究领域都有着重要意义。本文针对视觉可供性学习问题,从可供性分割和可供性推断两个方面开展研究,主要完成了如下工作:首先,设计了一个面向区域关系感知的深度卷积神经网络,通过感知目标物体内部不同区域之间的关系,实现了基于区域功能可供性的图像分割。此外,本文还提出将坐标卷积和多孔空间金字塔池化层融合,对提取的图像特征进行协同优化。与现有基于目标检测的可供性学习方法不同,本文提出的方法能够以端到端的方式直接为输入图像生成像素级的可供性分割图。在公开数据集IIT-AFF和UMD上的测试结果展现本文方法的优越性。其次,提出了一种基于时空双流网络的视觉可供性推断方法,结合物体自身属性和执行者操作意图来识别图像中各物体的功能可供性。具体地,空间流网络对目标物体进行特征提取;时间流网络利用视频帧间关系获取运动线索,实现具体操作区域的定位;两分支相结合以确定物体的功能类别,解决物体具有多类可供性的问题。此外,本文还基于GradCAM方法对各个可供性类别的激活特征进行了可视化,辅助判定操作区域的定位准确性。本文所提出的网络框架在训练过程中无需精细的分割标签,仅利用动作类别标签即可完成训练,因此大大提高了方法的实用性。而在OPRA数据集上的实验结果也证明了该网络的有效性。基于上述工作,本文实现了基于关系感知的视觉可供性学习,一方面利用物体内部各区域之间的关系实现可供性分割,另一方面基于操作者与目标物体间的交互关系完成可供性推断。本文的方法能够有效克服已有方法由于过分依赖目标检测所导致的误检、漏检、分割不全等问题,在人机交互、自主机器人等领域具有巨大的应用潜力。
其他文献
目前在世界各国的蔬菜批发市场中,蔬菜废弃物逐年快速增长,这些废弃物给环境带来了诸多问题。本文结合老挝国内的蔬菜废弃物处理及工艺技术发展情况,主要运用哥巴式沼气池和
随着经济发展,工业化进程加速,使得建筑、工业与交通的能耗随之上升,带来了全球化石能源日益枯竭的挑战,而利用清洁、无污染的太阳能为建筑采暖系统提供热能是减少建筑总能耗
随着我国电力行业的发展,我国供热机组占火电机组总装机容量的比例越来越大。供热机组冬季在大抽汽量工况下运行,一次调频动态特性发生了变化,调频性能变差。为了研究大抽汽
机床旋转轴几何误差对机床加工精度有非常大的影响。五轴联动数控机床两个旋转轴的运动导致空间误差项增多,并且旋转轴与直线轴误差在测量中存在耦合,给误差的测量和辨识带来
脉冲系统模型兼有连续模型和离散模型的共同特征,具有丰富的应用背景,研究成果具有重要的实际应用价值。近年来,关于脉冲系统的输入到状态稳定性问题以及脉冲系统的观测器设
随着制造业的高速发展,对工业产品的表面质量及机械性能的要求越来越高。等离子束表面强化技术以其成本低、效率高、易维护等特点成为材料表面热处理的重要技术手段。利用关
山西潞安余吾热电2×135MW CFB锅炉设有炉内喷钙脱硫系统、SNCR脱硝系统和布袋除尘系统。对于循环流化床锅炉目前经过初步改造,NOx浓度计烟尘排放浓度可以满足超低排放要求,对于脱硫系统的优化设计及改造成为了余吾电厂迫在眉睫的任务。本文首先总结了国内外工程上常用的脱硫方案和技术,并重点对石灰石-石膏湿法脱硫及利用循环流化床脱硫塔形式的脱硫技术(CFB-FGD)进行了分析比较,并将CFD用于这两
烽火台是长城防御体系的重要组成部分,其作用就是通过施放烟火,将收集到的战争信息传递出去。古代传递信号称"驿传"。烽火台选址大多在地势较高、视野开阔的地方,它的分布也
叠层复合材料(或复合材料层合板,以下简称FRP板),具有轻质高强、加工成型方便、耐化学腐蚀等优势,近年来在不同的工程和产业领域特别是土木工程中的应用越来越广泛。但是FRP
了解居民能源消费状况是制定能源转型目标及相关政策的基础。居民电力消费不平衡不充分现象是能源贫困的表现,对健康、环境、性别平等各种方面造成影响,制约我国社会经济发展