论文部分内容阅读
视觉问题是科学领域和工程领域中一个极富挑战性的研究课题,具有重要的理论意义和广泛的应用前景。其中生物视觉的研究揭示了大量的事实,如感知刺激、神经元活动和感知行为之间的关系等等,但却很少有成果被转化到计算机视觉领域而产生实际的应用,而计算机视觉领域的研究成果也几乎和真正的生物视觉相去甚远。近年来,生物视觉与计算机视觉,这两个研究方向的交叉与融合逐渐成为视觉研究的热点。其中,视觉的概率统计方法,从计算的角度,利用信息论,研究视觉系统完成计算任务的工作原理与信息处理机制,为二者的融合提供了很好的结合点,从而促进人们更加全面而透彻的认识视觉的本质。
本文基于概率统计的方法,从计算的角度,系统地研究了在自然景物输入条件下,大脑的初级视觉皮层(V1区)进行超完备(overcomplete)、拓扑(topographic)和稀疏(sparse)表示的计算模型及其生理学功能等问题。由于大脑的初级视觉皮层中,大量存在着超完备、拓扑和稀疏表示的现象,这些表示策略具有很大的优点,可以更有效率和灵活地提取信号中的内在结构、综合局部表示和分布式表示的优点、更加易于找到相似性和高阶相关、增加信噪比和增加联想记忆的存储和表示容量等等。因此,研究其计算机理及生理学功能有着重要的意义、提出的计算模型具有广泛的应用前景。
本文的主要贡献有以下几个方面:
1.本文结合基函数的高维空间准正交性的先验假设,在基函数和输入数据向量的点积上定义独立的特征子空间,基于最大化后验概率(maximumapos-teriori,MAP)的方法,得到了超完备的独立子空间分析模型(overcompleteindependentsubspaceanalysis,OISA)。OISA模型不仅进一步拓展了独立分量分析算法,能够从自然图像中得到重要的相位不变的特征,而且解决了超完备表示的问题。
2.针对二维空间拓扑结构的超完备表示问题,本文在基函数与输入数据向量的点积上定义具有二维空间拓扑结构的二层生成模型,并基于最大化后验概率的方法,结合准正交性的混合矩阵先验,得到了超完备拓扑独立分量分析模型(overcompletetopographicindependentcomponentanalysis,OTICA)。通过使用自然图像训练,OTICA模型能够同时得到超完备表示、相位不变性(用来解释初级视觉皮层中复杂细胞的反应属性)以及拓扑结构(这与初级视觉皮层中的功能柱类似)三种特性。因此,OTICA可以更加合理地作为Vl区复杂细胞反应属性的解释模型。通过与其他传统的模型比较,OTICA模型具有更高的编码效率。
3.当输入为自然图像序列,引入时间因素时,我们结合稀疏性、时间稳定性和拓扑结构三种统计属性的统一框架下,定义包含时间因素的邻域函数,利用最大化后验概率的方法,得到超完备冒泡算法(overcompletebubblemodel)。由于进一步考虑了时间稳定性,超完备冒泡算法同时得到了超完备、空间和时间上的拓扑结构。模型得到的泡状反应结构能够更好地提取输入中的低阶不变特征。
4.针对往往包含大量噪声的实际情况,本文在基函数系数上定义二维空间拓扑结构的二层生成模型,采用近似极大似然的方法,得到了具有超完备表示的拓扑稀疏编码(topographicsparsecoding,TSC)。TSC模型进一步拓展了经典的稀疏编码模型,能够从自然图像中得到相位不变的特征以及与初级视觉皮层相似的功能柱结构。同时,由于TSC模型本身考虑了噪声以及超完备的表示,因此TSC模型具有很好的去噪功能。与其他去噪算法相比,具有更高的信噪比,更好地保留了图像的细节信息。