论文部分内容阅读
视网膜生理功能及视觉机制研究是生物神经学和信号处理领域的一个研究热点,其目的是通过揭示和分析视网膜生理功能的神经计算机理以构建面向实践应用的视觉神经网络模型。近年来,随着计算技术的高速发展和神经生理学新成果的不断涌现,基于视网膜计算机理的神经网络模型在机器视觉的应用中被越来越多的研究者所关注。边沿是图像中灰度不连续或发生急剧变化的区域之间的边界,是图像的一个重要特征。有效克服边沿检测中噪声消除和边沿定位之间的“两难”问题,增强并提取图像的边沿,在图像分割和识别等较高层次特征的描述中具有重要意义。本文立足于视觉信息处理是亮度、颜色和运动等多通道并行、相互交叉这一基本机制,并结合对视网膜边沿检测和运动检测功能及机制的梳理,构建了基于视网膜神经计算机制的亮度通道边沿检测模型、运动通道目标运动检测模型,双通道并行交叉的边沿增强提取模型。本文所做工作如下:(1)系统梳理了视网膜边沿检测的生理机制,构建基于视网膜神经计算机制的边沿检测模型(retina Net-Edge),重点研究了网络的拓扑结构、各类神经元的输入输出关系及感受野特性等;(2)系统梳理了视网膜运动检测的生理机制,构建基于视网膜神经计算机制的目标运动检测模型(retina Net-Motion),重点研究了网络的拓扑结构、方向选择性电路、各层神经元的感受野特性及输入输出关系等;(3)结合亮度通道和运动通道的特点,建立综合的基于视网膜综合计算机理的运动目标边沿提取模型(retina Net-Edge Enh),利用运动信息提升边沿检测的效果,着重分析了运动信息的反馈机制;(4)从算法的复杂度及方法的适用性等方面重点分析了几种常用的边沿检测性能评估方法,以针对性地对后续实验结果进行合理且精确的评估,提升边沿质量的评估的可信度;(5)仿真结果表明:retina Net-Edge模型既精准高效地提取图像边沿,又注重非线性地保留图像中的重要细节如纹理等,边沿定位精度更高,错检、漏检几率更小,整体效果优于经典的Canny算子及新近提出的基于震颤的神经网络模型[35];retina Net-Motion模型能较好地检测目标运动的“敏感点”及方向;retina Net-Edge Enh模型进一步改善了retina Net-Edge模型的边沿检测性能,在保持边沿像素精度的同时在一定程度上锐化边沿,能有效弱化或去除拐角处的虚假边沿。本文关于目标边沿增强和提取的神经计算方法的研究,工程上实现了以新的途径增强图像边沿的清晰度,降低噪声,使其更好地应用于目标追踪、目标识别、图像匹配或医学观测等各个领域,以达到实时处理、高精度,低功耗的要求;科学上则可以加深人们对视神经计算机理和视网膜生理功能的认识和全面了解,促进脑科学和认知科学等相关学科的发展。