【摘 要】
:
场景分类是指根据场景图像所包含的内容自动识别该图像的场景类别,是计算机视觉领域的基础任务之一,是目标检测、目标跟踪和图像检索等计算机视觉任务的研究基础。随着数字多
论文部分内容阅读
场景分类是指根据场景图像所包含的内容自动识别该图像的场景类别,是计算机视觉领域的基础任务之一,是目标检测、目标跟踪和图像检索等计算机视觉任务的研究基础。随着数字多媒体技术的迅猛发展,计算机以及智能手机的不断普及,每天都有大量的图像数据产生,目前亟需有效的手段对海量图像数据进行管理分析。因此,场景图像分类的研究备受学术界和工业界的关注。近些年来,随着深度学习的火热发展,卷积神经网络已经在场景分类任务中取得了突破性的进展。本文主要研究了多尺度的卷积神经网络,并提出了两种基于深度卷积神经网络的场景分类方法,主要研究如下:(1)针对现有基于卷积网络的场景算法的不足,本文提出了一种基于端到端的多尺度卷积神经网络场景分类方法。现有的基于卷积网络的场景分类方法大多采用多步骤策略,首先将卷积神经网络作为特征提取器从多个尺度提取场景图像的高层语义特征,然后使用传统的中层表达方法得到场景的多尺度特征。这类场景分类方法将特征学习与分类器训练孤立开,有违深度学习的端到端思想。本文改进现有算法的不足,提出了一种端到端的多尺度卷积神经网络,将多尺度场景块提取、特征学习、多尺度特征融合和分类器训练统一到卷积神经网络中。另外,该方法采用多任务学习策略和特征预融合策略,充分挖掘各尺度下场景特征的性能。最后,本文所提出的基于端到端的多尺度卷积神经网络场景分类方法在MIT67室内场景数据库和Scene 15场景数据上分别取得了80.9%和94.5%的精度。(2)根据现实生活中场景图像往往包含大量目标的特点,本文提出了一种具有判别性的深度场景特征分类方法。首先,该方法使用迭代算法从原始场景图像中提取具有判别性的场景图像块,该图像块包含的场景目标既可以有效代表当前场景类别,又明显区别于其他场景类别。然后,该方法分别从局部和全局的角度出发,一方面使用卷积网络提取场景图像的全局特征,另一方面使用改进的局部特征聚合描述符从场景图像块中提取局部特征。最后,本文联合了场景的局部和全局特征在MIT 67室内场景数据库和Scene 15场景数据中分别取得了83.2%和94.8%的精度。
其他文献
目的:探讨特发性水肿病人早期肾损害诊断指标.方法:对50例正常对照和40例特发性水肿患者采用ELISA方法检测尿微量白蛋白(mALB)、视黄醇结合蛋白(RBP),尿转铁蛋白(TRF)和α1-
本文着重解读了国家标准GB 21551. 6-2010《家用和类似用途电器的抗菌、除菌、净化功能空调器的特殊要求》中的抗菌、除菌、净化3个概念及其未来修订的方向,明确了净化空调的
<正>1 引言根据 WTO 的相关数据,2006年全球纺织品出口总额为2186亿美元,服装出口3114美元,在全球纺织品贸易中我国服装出口为954亿美元,占全球服装出口30.6%,尽管2006 年我
提出一种利用Zigbee技术进行无线抄表的解决方案;在对Zigbee网络层和应用层研究的基础上,设计并实现一个基于Zigbee的无线抄表系统AMRS,它能够满足多种抄表模式要求,实现无线
运用文献资料、问卷调查、数理统计等研究方法,对大学生体育服装品牌需求心理进行了调查和分析,较为客观的反映大学生体育服装品牌需求心理,结合对大学生体育消费市场的预测,
结合环境,融入大石桥历史文化背景,通过园林表现手法,依据城市绿地规划学、园林生态学、环境景观学、园林美学、建筑学、人体结构学等学科,建造出满足城市水系供水需求,集文化、娱
对乌鲁木齐周边公路改造工程进行了分析,以乌鲁木齐周边公路沿线地区为重点研究区域,根据周边公路改造状况和沿线生态影观现状,从城市景观和生态角度出发,对乌鲁木齐城郊生态
脂肪酸生物合成系统是植物抵御外界胁迫的重要因素之一,植物可以通过调节自身脂肪酸合成来应对各种逆境。植物表皮蜡质是由脂肪酸、烷烃、醇类等物质组成的一类有机混合物,不仅具有保水、清洁、防止病原危害以及外力损伤等作用,还可以抵御紫外辐射、高温、冷害等外界环境的胁迫。温度是影响植物分布的主要环境因素之一,高温胁迫不仅影响植物的生长、发育,还严重地影响植物繁殖。为阐明表皮蜡质的合成与花花柴(Karelini
一九七二年五月,也就是“七十年代爆炸性杰作”《增长的极限》发表不到两个月,在英国伦敦一座精致的别墅内,房主人、当代最杰出的历史学家汤因比,正和一位来自日本的客人—
佛教自传人中国以后,特别是随着佛典的翻译和流传,僧人与文人名士的交往,寺院讲经方式的普及,佛教在中国文学的诸多方面发挥着越来越大的影响。佛学为中国文学带来了新的意境、新