论文部分内容阅读
Marr的视觉计算理论不仅是计算机视觉和人工智能发展的理论基础,同时也对人类视觉系统的研究有着重大的影响和贡献。但由于人眼具有特殊的空间频率感受机制,而视觉计算理论中有关空间频率的研究较少,所以,将空间频率的概念及模型引入到视觉计算理论成为了完善该理论的重要途径,也是本文的主要任务和工作。本文将以视觉计算理论为研究基础,并引入了感受野的频率特性、空间频率多通道理论、视觉的空间频率对比敏感度曲线等重要理论和方法,将视觉计算理论从空域发展到频域,进一步完善视觉计算理论并建立起频域视觉计算理论。本文的主要研究工作如下:1.深入研究视觉感受野、视觉计算理论以及视觉频率多通道等理论,依此建立Marr算子在频域上的数学模型,并将频域Marr算子赋予生理学意义,使其模拟出视觉对比敏感度曲线,得出算子本身参数对于人眼空间频率感受机制的影响。2.将频域Marr算子应用于实践,解决Marr算子本身不易解决的视觉计算问题。例如一些视错觉图片的信息提取,这些视错觉图片一般仅产生于人眼视觉系统,计算机却一般难以发现。成功地模拟出这些视错觉图片不但更接近视觉系统的本质,而且更加体现出频域视觉计算理论的视觉可计算性。3.利用频域的Marr算子解决视觉计算理论中的一大难题——视觉的“整体性”。通过用频域视觉计算理论成功解释陈霖的视觉实验来达到视觉“整体性”的效果。本文将人眼的空间频率感受特性与视觉计算理论较为成功地结合起来并用基本建立起来的频域视觉计算理论分析和解释了许多重要现象和实验,证明了频域视觉计算理论强大的视觉可计算性,解决了视觉计算理论本身的“整体性”不足,这些成果无论对于生理学还是计算机视觉来说都具有重要意义。