【摘 要】
:
随着信息技术的发展,在诸如图像检索、智能导航、视频监控以及其他计算机视觉任务领域,场景识别和分类都有着广泛的应用前景和理论意义,这对快速准确地实现场景图像的分类提
论文部分内容阅读
随着信息技术的发展,在诸如图像检索、智能导航、视频监控以及其他计算机视觉任务领域,场景识别和分类都有着广泛的应用前景和理论意义,这对快速准确地实现场景图像的分类提出了更高的要求。然而由于场景图像的多样性、模糊性以及可能随时改变的照明和尺度条件,使得场景图像的处理和识别相对困难。故如何使计算机充分利用图像所包含的信息进行自主快速的学习,从而能够迅速有效地识别出图像的场景类别,成为计算机视觉领域的重要课题。因此,为了降低传统场景分类技术的局限性,本文提出基于传统的词袋模型和深度学习的场景分类方法,发挥深度学习强大的特征学习能力,并从场景图像中学习更多层次化的视觉信息。主要包含以下三方面的内容:第一,针对传统低层特征表达能力不足的情况,使用卷积神经网络进行提取的特征代替传统的局部特征,发挥CNN卷积层对图像特征强大的学习能力,获取到图像更多层次的信息。本文设计和训练了快速多层次的卷积神经网络模型,并根据重构图像对不同层次的特征进行对比分析,提取到更适合构建视觉词典的特征。第二,针对传统词袋模型空间信息不足的情况,结合空间金字塔模型的思想,将提取的卷积特征使用改进的软分配编码方法进行特征编码,生成卷积向量的空间视觉词典,并训练不同内核的SVM分类器,以得到更好的准确率。第三,设计并实现一个场景分类系统,用于本文的实验和算法测试,包括基本的输入输出、算法选择、图像分类的测试以及结果展示等功能。通过实验的对比分析,表明本文构建的网络模型实现了图像多层次数据的提取,提高了特征的表达能力,与空间视觉词袋模型结合,弥补了空间信息的不足,为实现更高准确率的场景分类提供了一种新的方法。
其他文献
随着无线通信技术的发展以及对频谱资源需求的日益增加,频谱资源已经变得非常紧张。认知无线电是频谱复用的一种典型实现方式,它允许从用户接入主用户授权的频谱。这意味着认
目的:分析海南省人民医院近年急性肠系膜缺血(Acute mesenteric ischemia,AMI)患者的临床资料,总结该病的发病因素、临床特点,诊断及治疗,提高对该病的认识。方法:按照国际疾
随着无线通信的迅速发展,无线通信的频谱资源日趋紧张。但研究发现好多授权频段的资源没有得到充分利用。认知无线电技术通过允许非授权用户检测并机会式接入授权系统频带,来
植物的三维建模一直是计算机图形学和计算机视觉等研究领域的重难点,而花朵更是因为其几何结构和种类的多样性使得其建模的过程更加复杂和困难。而随着计算机信息技术、硬件
【目的】基于器官去细胞生物支架制备技术,通过双向电泳(2-DE)电泳、LC-MS/MS技术比较正常大鼠与四氯化碳(CCL4,carbon tetrachloride)诱导肝纤维化大鼠模型2W、4W、6W和8W组去细
随着移动互联网上视频的清晰度越来越高,人们对移动端的视频业务的需求越来越普遍,但是国内无线网络经常因为网络带宽或终端能力的限制不能满足用户观看实时高清视频的需求。
视频运动目标检测与跟踪是计算机视觉学科中的一个很热门的方向,它包括数字图像处理、模式识别,甚至还涉及人工智能和机器学习等,已经被很好的应用在军事、工业、智能交通、
随着民航的快速发展,增长的飞行流量和紧张的空域资源之间的矛盾日益突显,扇区结构需要经常改变以适应不断增长的交通流量需求。在此过程中,需要对扇区容量进行持续评估,辅助扇区规划与日常流量管理。本文针对扇区容量需要随扇区结构改变而经常更新,且对于扇区规划阶段,管制员工作负荷不能科学确定的情况,提出了基于海量航迹数据的K-means聚类和神经网络算法模型评估管制扇区容量的新技术。技术方面,本文首先分析了扇
IP电话是一种通过互联网或其他使用IP技术的网络,来实现新型的电话通讯。很多大型的公司为了方便管理,提高生产力会采取每个工位配置一台的情况。若设备管理员想对其中的一台
随着微波集成电路技术水平的提高,毫米波雷达系统已越来越多的进入人们的日常生活领域——如安全防护、汽车主动安全及智能交通监控等。本文主要针对雷达系统的信号处理方法