【摘 要】
:
深度卷积神经网络(DCNN)的基本运算单元为卷积计算,这种计算具有局部连接与平移不变等特性,可以有效提取图像数据的特征,但是卷积计算不具有尺度不变性,这导致DCNN存在对目标尺度变化不适应的问题,无法同时提取到对多个尺度目标均有效的特征。目前,解决DCNN对目标尺度变化不适应的一种有效方法是多尺度特征融合。本文研究现有的多尺度特征融合方法,在人头检测与计数任务中进行应用与改进,提升卷积神经网络的性
论文部分内容阅读
深度卷积神经网络(DCNN)的基本运算单元为卷积计算,这种计算具有局部连接与平移不变等特性,可以有效提取图像数据的特征,但是卷积计算不具有尺度不变性,这导致DCNN存在对目标尺度变化不适应的问题,无法同时提取到对多个尺度目标均有效的特征。目前,解决DCNN对目标尺度变化不适应的一种有效方法是多尺度特征融合。本文研究现有的多尺度特征融合方法,在人头检测与计数任务中进行应用与改进,提升卷积神经网络的性能。首先,本文对计算机视觉领域中的多尺度特征融合方法进行研究,将这些特征融合方法,依据被融合的特征是否在DCNN同一层级(layer)分为两类:深度方向特征融合与宽度方向特征融合。前者融合的特征是DCNN不同层级的特征,典型的有应用在目标检测中的特征金字塔(FPN)与语义分割中的编码解码结构等;后者融合的特征是DCNN同一层级下的特征,典型的有Inception模块与应用在人群计数的多列卷积(MCNN)等。其次,本文基于FPN提出上采样尺度融合网络(USFN)进行人头部的检测,实现深度方向特征融合方法的应用,并设计上采样融合模块(USFM)与特征增强模块(FERM),对FPN进行改进。其中,USFM通过深层特征图线性插值与深度可分离卷积结合的方式进行尺度扩增,有效解决了FPN采用反卷积产生的棋盘效应与计算量大的问题;FERM为一个轻量的卷积网络模块,用于弥补特征融合导致的部分抽象信息的缺失。经实验验证,USFN在BRAINWASH数据集上较FPN的平均精度提升4.9%,检测速度提升22.9%,证实本文的USFN方法改进了PFN的检测效果。最后,基于多尺度特征融合的研究与深度方向特征融合的应用,本文基于MCNN与编码解码结构提出通道权重融合网络(CWFN)进行人群计数,实现深度方向特征融合与宽度方向特征融合结合的应用。CWFN在编码阶段采用MCNN多分支结构进行特征提取,不同的是设计了密集感应模块将输入特征转化为权重向量,为多分支结构提取到的特征分配权重,进行宽度方向的特征加权融合。另外在解码过程采用上采样融合模块(USFM),来生成高质量的密度图估计结果,从而提升人群计数统计结果的准确度。经实验验证,CWFN在Shanghai Tech与UCF_CC_50数据集较基准算法MCNN的平均绝对误差(MAE)与均方根误差(RMSE)明显降低,并通过消融实验,进一步分析了该方法中,各模块的作用和有效性。通过本文对多尺度特征融合的应用验证,深度方向特征融合能够提升人头检测的检测精度,宽度方向特征融合与深度方向特征融合均能提升人群计数的准确度,并且两种融合方式相结合的方法能够使计数准确度进一步提升。综上所述,通过多尺度特征融合,能够有效解决DCNN对目标尺度变化不适应的问题,并且本文基于FPN与MCNN改进的人头检测方法USFN与人群计数方法CWFN,均相对原有方法有所提升。
其他文献
图像恢复是指从低质量图像中恢复出原始的高质量图像的任务。图像质量的退化通常发生在图像采集、传输以及存储过程中,可能存在的退化包括附加噪声、下采样、模糊以及像素损坏等,因此图像恢复任务主要包括:图像去噪、图像去模糊、图像超分辨率重建以及图像修复等。本文主要基于CT(Computed Tomography)图像开展去噪和超分辨率重建等图像恢复任务的研究。CT是现代放射学中最重要的成像方式之一,由于能够
本文以纳米磁性材料固定化纤维素酶的制备以及在水解过程中的性能优化为研究的主要内容。以壳聚糖作为修饰纳米Fe3O4的材料,采用响应曲面法设计了Box-Behnken试验方法,探究纤
本文主要研究了两个问题:首先,我们对最低阶Nédélec元的Crank-Nicolson离散格式的磁热耦合模型的二重网格算法进行超收敛性分析.我们的主要贡献将包括两部分.一方面,为了克服经典的二重网格算法对于最低阶Nedelec元不收敛的困难,我们把粗网格上非线性项在超收敛解处进行牛顿型泰勒展开,这是不同于经典的二重网格在粗网格上的处理数值解的方法.另一方面,我们利用插值后处理技术提高了二重网格解
“皇帝的新装”真实并广泛的存在于现代组织中,2001年美国安然的破产事件,2017年中国长生生物集团的“疫苗案”,这些现实中真实存在的沉默案例均表明员工沉默在大多数时候是非常有害的,不仅会降低组织的工作绩效和管理者的决策质量,也会降低员工的积极性,产生倦怠等不好的情绪,还会间接对他人造成伤害。当代的公司管理者都希望可以高效地解决组织内员工沉默这一消极的现象。员工沉默与领导者密切相关,学术界新出现的
目标跟踪算法作为计算机视觉中的经典问题,过去几十年来激发了许多国内外研究学者的兴趣,目标跟踪算法也随之得到了突破性进展,广泛引用到了生活和工作当中。该技术历时几十年的发展,相继不断改进发展出了Kalman滤波、粒子滤波、Mean Shift算法等经典跟踪算法,其中Mean Shift跟踪算法作为单目标跟踪算法里最经典的算法,以其计算量小,且对目标发生边缘遮挡、旋转、变形等不敏感的优点广泛受到学者关
纤维素是世界存在最广泛的可再生资源,利用微生物生产的纤维素酶可以将其降解转化成可直接利用的小分子物质。对解决环境污染、农作物资源浪费等问题具有重大意义。本文主要针对高温降解纤维素菌株的筛选、产酶条件的优化、单一组分纤维素酶的分离纯化及蛋白酶酶学性质的研究等方面进行探索。结果如下:(1)于三种堆肥中分离出12株纤维素降解菌株,经过初筛和复筛结合对比,获得一株能够高效降解纤维素的嗜热菌株A7。对菌株进
目的1.观察温阳祛邪针灸法治疗轻中度抑郁症的临床有效性,并比较其与认知行为疗法的疗效差异。探讨温阳祛邪针灸法是否为轻中度抑郁症的临床治疗提供一种有效、可行的方案。2.观察温阳祛邪针灸组和认知行为疗法组的轻中度抑郁症患者血浆中促肾上腺皮质激素(ACTH)及皮质醇(CORT)的变化,从HPA轴的角度分析温阳祛邪针灸法对轻中度抑郁症患者产生疗效的作用机制。方法将符合诊断及纳入标准的60例轻中度抑郁症患者
目的本研究调查本科护生考试焦虑、元认知能力、学业自我效能感和应对方式的现状及影响因素,探讨考试焦虑、元认知能力、学业自我效能感和应对方式之间的相关性,为在本科护理学生中开展有效的心理健康教育提供科学依据。方法本研究采用便利抽样法,于2018年5~8月,将辽宁省5所普通高等教育医学院校(沈阳医学院、辽宁中医药大学、锦州医科大学、大连医科大学、中国医科大学)的本科护理学生作为研究对象。应用一般情况调查
专利作为发明创造的法定市场独占权,不仅是当今世界普遍认可的民事权利,而且因其对技术市场的合法垄断而构成重要的市场资源。随着知识经济的发展,技术的日趋复杂,专利数量的
高光谱图像的光谱波段数目一般达到上百个,可以提供较为丰富的光谱信息,图像中的每个像素都可以看成是一个高维度的向量。虽然数百个维度的光谱信息可以允许更精细的地物分类,但过高维度和样本数量之间的不平衡问题也制约了高光谱影像分类方法的发展。如何解决高维小样本遥感影像分类问题、如何实现同物异谱的地物精细分类问题等仍然是高光谱图像处理的难点。本论文深入分析了高光谱遥感图像空间上下文信息与邻域像素的联系,提出