面向非结构化场景目标定位的超完备视觉计算模型及应用

来源 :郑州大学 | 被引量 : 0次 | 上传用户:vicovicovicovico
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频以及图像信息在无人驾驶、视频监控、目标定位等社会、经济和国家安全领域中的需求持续迅猛增长,使其呈现出对象复杂性、媒体数据规模化、应用需求多样化的特点。这些信息既可被人直接感知并理解,也可被计算机处理利用。动物视皮层的信息处理机制与传统的基于像素的计算机视觉在信息处理基本原理、计算模式和方法上有着本质的差别,目前的计算机视觉针对复杂非结构化场景的处理能力和效率都很难与视觉系统相比较,很难满足现实应用的需求。结合视觉认知等相关科学,探索更符合生物学机理的实际计算模型并改进现有的计算机处理模式代表了目前目标定位技术研究发展的主要趋势。本文围绕视觉感知特征提取、表达与计算这一核心科学问题。基于有效编码假说和视觉系统是适应自然环境结果的假设,在视觉信息稀疏编码模型基础上,以自然图像的统计特性为切入点,研究模拟复杂视觉信息处理模式的稀疏超完备表示方法,建立并完善模拟初级视皮层(Ⅵ区)复杂信息处理机制的稀疏超完备视觉计算模型,用以改进传统方法,解决由于许多不确定因素或无法预测状态的存在而导致的非结构化场景中目标识别的能力和效率问题。然而,由于超完备增加了稀疏分解的组合搜索难度,同时改变了输入空间与编码空间的对称性,使得模型求解和计算及应用方法变得复杂。因此,进一步提出了应用视觉计算模型相关的关键算法,解决提取有效的自然图像统计特征的问题,并基于上述模型和算法提出针对非结构化场景目标定位方法。实验结果验证了模型和算法的正确性和有效性,主要研究结果包括:(1)基于视觉系统是适应自然环境的结果的假设,以自然图像的统计特性作为问题的切入点,阐述当前与图像统计特性相关的动物视觉生理实验结果及相关信息处理机制,归纳总结并形成相关计算方法、优化判据和优化算法基础。(2)在上述研究基础上,模拟Ⅵ区稀疏编码机制、超完备表示机制和感受野机制,建立了基于稀疏超完备的视觉计算模型。首先从自然图像中学习简单细胞感受野超完备集,然后对自然图像有效特征进行表示,最后提取了形成视像的有效信息。(3)针对非结构化场景中的目标定位问题,进一步提出基于神经元响应及动态阈值方法相结合的自动目标定位算法,采用基于目标指导的方法,解决了复杂非结构化场景中的多类别误差去除问题。验证了算法的正确性和有效性。实验结果表明,该算法能够提高复杂非结构化场景中的目标定位准确性和实时性。
其他文献
DNA测序是现代生物学研究的重要手段,目前已为公共生物数据库积累了海量的数据资源,主要包括由Sanger测序产生的EST序列以及由下一代测序(NGS)产生的序列,这些信息被广泛应用
管道作为油气运输的主要方式,具有非常重要的作用,但由于各种原因造成管道破损,引起管道泄漏,产生很大危害,所以无泄漏的安全运行是管道输送最基本的条件。随着我国石油天然
在移动机器人跟踪运动目标的过程中,为顺利完成任务需要解决两个关键问题:一是准确的检测出运动目标并分辨其类别,二是根据运动目标的状态制定有效的跟踪策略。同种类的运动物体
金属锯床是金属加工行业中的重要工具之一,它的使用性和切削效果直接影响到工业生产的效率和质量。进刀锯切操作是锯床的主要操作,通常情况下,该操作是由操作员根据经验来完
随着平面喷绘技术的成熟,喷墨技术开始从平面延伸到三维。南开大学进行了三维喷绘机器人原理机的研究,该原理机存在精度不够高、作业空间较小、每次只能喷一种颜色等问题。原因
生物特征识别是利用人类特有的生理或行为特征对个人身份进行识别的技术。它提供了一种高可靠性、高稳定性的身份鉴别途径。人耳识别作为这一领域的一个新的分支,同时也是模
随着技术手段的进步和发展,电磁流量计在流量测量领域得到了广泛的应用,其中多电极电磁流量计的研究为流量的测量开拓了新的领域。本文基于多电极电磁测量的理论和方法,将其应用到血液流速的监测中,通过拾取血管外壁的感应电压来获取人体血液流速信息。首先,介绍了电磁流量计相关的测量原理,着重阐述了由传统单电极对测量演变发展而来的多电极电磁测量相关理论。基于Shercliff权函数理论引出一种微元面积权函数理论,
目标跟踪是利用先验信息估计出目标的后验信息,其在自动控制、导航、跟踪、制导、人工智能、信息融合和故障检测等领域已经得到广泛应用。对于线性模型和高斯噪声下的目标状态
凝汽器是大型换热设备,广泛应用于电力、化工、冶金、机械等行业,是汽轮机的重要组成部分,它使凝汽式汽轮机做功后排除的蒸汽凝结成水,形成并保持所需要的真空,降低排汽压力和排汽