视觉超完备拓扑表示的稀疏编码计算模型

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lgkenny1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉问题是科学领域和工程领域中一个极富挑战性的研究课题,具有重要的理论意义和广泛的应用前景。其中生物视觉的研究揭示了大量的事实,如感知刺激、神经元活动和感知行为之间的关系等等,但却很少有成果被转化到计算机视觉领域而产生实际的应用,而计算机视觉领域的研究成果也几乎和真正的生物视觉相去甚远。近年来,生物视觉与计算机视觉,这两个研究方向的交叉与融合逐渐成为视觉研究的热点。其中,视觉的概率统计方法,从计算的角度,利用信息论,研究视觉系统完成计算任务的工作原理与信息处理机制,为二者的融合提供了很好的结合点,从而促进人们更加全面而透彻的认识视觉的本质。 本文基于概率统计的方法,从计算的角度,系统地研究了在自然景物输入条件下,大脑的初级视觉皮层(V1区)进行超完备(overcomplete)、拓扑(topographic)和稀疏(sparse)表示的计算模型及其生理学功能等问题。由于大脑的初级视觉皮层中,大量存在着超完备、拓扑和稀疏表示的现象,这些表示策略具有很大的优点,可以更有效率和灵活地提取信号中的内在结构、综合局部表示和分布式表示的优点、更加易于找到相似性和高阶相关、增加信噪比和增加联想记忆的存储和表示容量等等。因此,研究其计算机理及生理学功能有着重要的意义、提出的计算模型具有广泛的应用前景。 本文的主要贡献有以下几个方面: 1.本文结合基函数的高维空间准正交性的先验假设,在基函数和输入数据向量的点积上定义独立的特征子空间,基于最大化后验概率(maximumapos-teriori,MAP)的方法,得到了超完备的独立子空间分析模型(overcompleteindependentsubspaceanalysis,OISA)。OISA模型不仅进一步拓展了独立分量分析算法,能够从自然图像中得到重要的相位不变的特征,而且解决了超完备表示的问题。 2.针对二维空间拓扑结构的超完备表示问题,本文在基函数与输入数据向量的点积上定义具有二维空间拓扑结构的二层生成模型,并基于最大化后验概率的方法,结合准正交性的混合矩阵先验,得到了超完备拓扑独立分量分析模型(overcompletetopographicindependentcomponentanalysis,OTICA)。通过使用自然图像训练,OTICA模型能够同时得到超完备表示、相位不变性(用来解释初级视觉皮层中复杂细胞的反应属性)以及拓扑结构(这与初级视觉皮层中的功能柱类似)三种特性。因此,OTICA可以更加合理地作为Vl区复杂细胞反应属性的解释模型。通过与其他传统的模型比较,OTICA模型具有更高的编码效率。 3.当输入为自然图像序列,引入时间因素时,我们结合稀疏性、时间稳定性和拓扑结构三种统计属性的统一框架下,定义包含时间因素的邻域函数,利用最大化后验概率的方法,得到超完备冒泡算法(overcompletebubblemodel)。由于进一步考虑了时间稳定性,超完备冒泡算法同时得到了超完备、空间和时间上的拓扑结构。模型得到的泡状反应结构能够更好地提取输入中的低阶不变特征。 4.针对往往包含大量噪声的实际情况,本文在基函数系数上定义二维空间拓扑结构的二层生成模型,采用近似极大似然的方法,得到了具有超完备表示的拓扑稀疏编码(topographicsparsecoding,TSC)。TSC模型进一步拓展了经典的稀疏编码模型,能够从自然图像中得到相位不变的特征以及与初级视觉皮层相似的功能柱结构。同时,由于TSC模型本身考虑了噪声以及超完备的表示,因此TSC模型具有很好的去噪功能。与其他去噪算法相比,具有更高的信噪比,更好地保留了图像的细节信息。
其他文献
作为最自然的人机交互方式之一,手势识别一直是近年来人机交互与计算机视觉领域的热点研究领域之一,大量的研究致力于利用现有的视觉设备得到实时稳定,鲁棒性高的跟踪与识别
一词多义现象给计算机对自然语言的处理带来了许多困难,有不少自然语言理解领域的问题归根到底是解决词语歧义的问题。从人们最初注意到歧义的影响至今已经过去了60多个年头,
纸币识别器是自助售卖领域的核心设备之一,目前已广泛应用于各种金融交易场合。但随着嵌入式技术的发展,8位或16位单片机裸机已经越来越不能满足应用的需要。而基于金融货币
RNA(脱氧核糖核酸)是生物系统内最为重要的分子之一,它在生物体内行使多种功能。预测RNA二级结构具有重要意义,知道了RNA的二级结构就可以获得许多有益的信息,不仅能使我们更
随着计算机和网络技术的飞速发展,计算机安全问题日益突出。入侵检测是计算机安全体系结构中的一个重要的组成部分。目前入侵检测系统的研究已经有了长足的进步,开发出了许多
本文研究了异构数据流下对基于地理位置的时间线进行提取的问题。针对该问题,本文提出了一个异构文本数据流下基于地理位置的时间线处理框架,并对其中的技术点进行了深入的研
船舶制造作为重工行业的一种,其发展对于我国具有重要的经济、政治和军事意义。通过分析国内目前造船企业的现状,论文给出制约造船企业效率提高的两个关键因素,即造船模式和生产
在有限元分析中,使用六面体网格要比四面体网格更为理想。一方面,在同样的顶点数目下,相比于四面体网格,六面体网格的计算精度更高;另一方面,达到同样的计算精度,所需的六面体网格的顶点数目比四面体网格少。因此,研究六面体网格的生成算法,对有限元分析有重要意义。一个有效的六面体网格模型要求所有六面体的Jacobian值均大于零,然而,现有的诸多生成六面体网格的方法都无法从理论上保证生成的六面体模型的Jac
随着互联网的迅速发展,高效稳定的路由协议成为保障网络性能的重要因素,协议测试理论和测试方法的研究也日益显得重要。协议一致性测试和互操作性测试是协议实现能够在实际环
各种流媒体传输技术如同百花齐放,单播、IP组播、P2P或应用层组播ALM是目前流媒体传输的主要形式。单播流媒体适应性好,但难以规模化;IP组播是规模化流媒体最有效传输方式,但