基于Where-What Network模型的物体识别方法研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:xiaohan52132500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文所使用的Where-What Network模型,粗略建模人类视觉系统信息处理的两条通路结构:腹侧通路主要处理物体的外形轮廓等信息,即主要负责物体的类型识别;背侧通路主要处理物体的空间位置信息等,即主要负责物体的空间定位。这是一个通用模型,可以在复杂背景下进行物体的识别与定位。该模型可以应用于注意力选择及识别等领域。前期的Where-What Network模型共有四个版本:WWN-1实现了自然背景下单个目标物体的两种能力:一定位置下的物体识别和某一类型出现在哪个位置,但是只是实现了五个位置的学习和测试。WWN-2在WWN-1的基础上,实现了自然背景下单个物体在任意位置上的注意和识别,并且是在不提供任何位置和类型信息的前提下进行测试(free-viewing)。WWN-3实现了自然背景下多个目标物体的检测和识别,并且物体为任意轮廓(WWN-1和WWN-2中物体使用方形轮廓)。WWN-4显示了直接从感受器和效应器取得输入上的优势。前期四个模型主要处理单一尺度的物体。本文的主要工作包括:简化网络结构,去掉已有模型中IT和PP区域,形成一个简化版本的模型结构;实现WWN-5模型,使WWN网络可以处理不同尺度的物体。本文所涉及到的算法模型,是自主心智发育算法的一个框架,基于颅骨闭合(skull-closed)这个概念,具有任务非特定性、增量学习等特点。简化网络结构,即除去模型中原有的IT、PP区域,节约资源,简化计算,提高性能。这一简化处理最初源自将模型应用于海宝智能机器人上时对时间的要求。海宝机器人要在游客面前展示现场进行样本学习,同时测试学习成果这一过程,因此要尽量缩短计算时间。简化网络结构后,不但时间缩短,同时识别率也有所提高。WWN-5模型,利用多个感受野区域,解决了WWN前四个版本只能处理单一尺寸的物体这一关键问题,使模型更具通用性。本文用大量的实验结果证实了WWNs模型在结构和性能上的优势。
其他文献
视觉是人类获取信息的最主要的来源,而视频在多媒体视觉信息中占有着非常重要的地位。但是视频在存储、网络传输中却频频遇到难题:占有空间过大、网络带宽过小、网络误码丢包
学位
作为一种新兴的计算模式,云计算是并行计算、分布式计算和网格计算的综合发展,或者说是这些计算科学概念的商业实现,同时它也是虚拟化技术、效用计算、将基础设施作为服务、将平
桥式起重机是在国民经济中发挥重要作用的装备型产品,在室内外工矿企业、铁路运输、港口码头等部门和场所均得到广泛的运用。然而传统的培训方法已经不能满足目前对桥机司机的需求。基于虚拟现实技术的桥机仿真训练系统将会提供一种新的培训方式,使培训工作规范化和现代化。本文重点介绍了桥式起重机仿真训练系统的实现过程及其中一些关键问题。该系统提供一个虚拟的工作环境,在显示设备上逼真再现桥式起重机驾驶员在操作桥机过程
工作流技术是对业务流程各环节间业务规则的抽象、概括、描述和执行的技术;是实现业务流程的管理与集成,从而最终实现业务执行过程自动化的核心技术。研究和推广工作流技术能大
信号的稀疏结构广泛应用于医学成像、疾病诊断、信息传输和雷达技术等。实际数据显示,信号的稀疏(逼近)模型对信号的恢复是有益的,甚至是必不可少的。随着应用的广泛出现,最近,一个
粒子群优化(Particle Swarm Optimization, PSO)算法是智能优化算法的代表之一。该算法的特点是简单,需要设置和调整的参数较少,收敛速度较快,且容易实现。所以它自一提出,就
基因微阵列为基因功能的研究提供了一种强有力的工具,对疾病分类、病例诊断以及药物研制等具有非常重要的实际意义。由于实验成本很高,基因样本数量常常很少,而检测的基因数目相
随着移动产业的高速发展以及无线网络覆盖范围在全球范围内的迅速扩张,社会已经进入了信息网络时代,人们生活的数字信息化程度也越来越深。目前,普适计算已经成为了当今国际
学位