基于视觉记忆的目标检测算法:一个特征学习与特征联想的过程

被引量 : 0次 | 上传用户:alex851123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标检测是计算机视觉中最为基础的研究方向,其任务在于从图像中检测并定位目标物体。当前,目标检测在视频监控、人机交互、智能交通、辅助驾驶、医学图像分析等领域都有着重要的应用。大多目标检测算法将目标检测的问题简化为一个二分类问题,即通过训练学习得到目标的特征模型,然后判断待检测图片中滑动窗口内是否存在目标,如果存在则定位该目标位置。所以目标检测的主要步骤包括目标模型构建、目标搜索和目标分类。由于视觉图像会受到光照变化、背景干扰、目标遮挡等方面的影响,很多目标检测算法存在鲁棒性和实时性问题。但是,人类的视觉系统则可以在更为复杂的情况下完成目标检测任务。因此,模拟人类视觉完成目标检测的机理和机制,构建具有人类视觉智能的目标检测算法,是改进目标检测算法和提高其性能的重要途径。本文深度分析了人类视觉记忆机制在完成目标检测时的工作机理,结合研究团队提出的特征学习与特征联想的概念,通过构建基于视觉记忆的特征学习与特征联想模型,开展模拟人的视觉智能的目标检测算法研究。文章的主要工作及贡献包括:(1)构建了基于视觉记忆的特征学习与特征联想模型,并在此基础上构建了基于视觉记忆的目标检测算法框架。通过研究视觉记忆在完成目标检测时的工作机理,将视觉记忆描述为一个特征学习与特征联想的过程。结合长期视觉记忆和视觉工作记忆的工作机理,采用特征处理方式和视觉记忆必要特征对视觉记忆进行了模拟。其中特征处理方式是人类视觉系统为方便快速的搜索目标而提取特征时所采用的方法,视觉记忆必要特征则是对目标进行分类判别时所需的重要特征。(2)提出了一种基于选择性注意机制的显著性检测算法来模拟视觉记忆保存的特征处理方式。为了解决显著性检测算法会受到小尺度细节图像干扰的问题,基于目标的尺度、颜色和位置信息采用了分层的显著性计算方法,从而提取输入图像的显著图。并在此基础上,通过自适应阂值对显著图进行二值化,然后从得到的二值图中提取目标检测候选区域。(3)基于特征学习与特征联想的视觉记忆模型,构建了模拟人类视觉智能的目标检测算法。该算法采用了局部可变模型作为检测器,以目标的边缘和强度特征作为主要特征来模拟视觉记忆必要特征;同时还采用了基于选择性注意机制的显著性检测算法来提取目标检测候选区域,从而缩小了目标检测的搜索区域。通过多个数据集中对本文算法的测试和分析,结果显示本文算法在保证目标检测准确率的同时提高了目标检测算法的实时性,且对于不同场景的图像均具有一定的适用性。(4)针对目前大多视频摘要生成算法无法提供目标属性信息且容易丢失目标时间和空间信息的问题,本文构建了一种基于目标检测的视频摘要生成算法。该算法基于目标检测提取目标的关键帧,并由此生成包含目标所有信息的视频摘要,同时可根据目标的属性信息来进行检索。通过该算法生成的视频摘要,人们可以在实际视频监控平台中方便快捷的浏览和搜索监控视频。(5)构建了基于目标检测的图像质量评价算法。该算法提取图像的检测器得分和显著性得分来描述图像的清晰度、背景复杂度和图像中目标的完整性,并由此对图像质量进行评价。通过多个数据集对本文图像质量算法进行测试,结果显示本文算法符合人类视觉系统评价图像质量时的特性。
其他文献
第九章戳卡放置的位置并建立气腹对于腹壁疝及切口疝的腹腔镜治疗戳卡的放置和建立气腹是顺利完成手术的关键。问题集中在以下几个方面:是否应该总是采用开放的方法建立气腹;
社会工业的发展与进步带来的是新一代的技术革新,而计算机与网络的发展应用又给仓储业带来了新的机遇和挑战,计算机越来越多的受到了企业的重视,而相应的仓储管理软件也受到了相
随着全球范围内油气资源勘探开发程度日益加剧,钻井技术朝着水平井、大斜度井、大位移井等定向钻井领域发展,常规成熟的滑动导向钻井方法基本满足了勘探开发的需求。但是定向钻
本世纪初,我国开展了社区矫正试点工作,经过多年的不懈努力,取得了可喜的成绩。但由于我国社会、经济、文化等本土因素的制约,目前社区矫正制度在我国尚未完善,还有很多方面
近几年来,随着计算机信息化及internet的普及,运用先进的系统和软件开发企业级的职能软件,已经成为职工工作的一种重要的形式。但目前国内市场的中小型超市的运营状况是其信息化
在电力系统现场实际工作中,电容器差压保护和零压保护很容易被混淆。从三个方面具体分析了电容器差压保护和零压保护的区别。讨论了其在一次接线、二次接线外观上以及在调试试
推动本国学生出国留学是高等教育国际化的核心内容之一。经历多年的社会发展和时势变迁,高等教育高度发达的美国在出国留学方面逐渐形成一定规模,并在21世纪呈现出一些新趋势
近年来,智能手机在移动终端市场具有很高的占有率。随着智能手机的功能日益强大,它们能完成的工作也越来越多,例如拍摄照片、定位导航、支付账单、浏览网页、发送电子邮件等
互联网的快速发展对传统意义民法上的继承提出了很大的挑战。目前,中国现行的法律法规中,还没有详细具体地对网络虚拟遗产继承进行规制管理的条款,然而,像QQ号码继承纠纷这样
数据包络分析(DEA)理论作为可以评价具有多投入和多产出指标的决策变量的一种非参数方法,由于具有简单易行,无需人为确定权重等优点,受到越来越多的学者的肯定和重视,同时也