基于SSD的行人检测方法研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:asdfghjkg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前智能化发展已成为一种趋势,而计算机视觉是人工智能的一个重要的研究领域,由于其非常广泛的应用及能带来巨大的商业价值,成为工业界和学术界的青睐。行人检测作为目标检测中的一个经典问题,在许多实际应用场景中包括安防、无人驾驶、监控和机器人等领域,都具有十分重要的科学价值。在实际场景的行人检测过程中,由于人所处的环境复杂多变,人的穿着,外界光照变化及所处背景的改变,各种各样的身体姿态,被遮挡等因素造成行人的外观差距很大,准确快速的行人识别与定位依旧是颇具难度和挑战的研究任务。针对这种现象,本文研究了基于单目多目标检测器(Single Shot MultiBox Detector,SSD)的卷积神经网络模型,改进后的算法在检测速度和检测精度两个方面上相较于当前经典的SSD算法都有了一定的提升。本文的具体工作如下:(1)在提高算法的训练速度方面,本文改进了SSD网络的基础网络部分。为了减少卷积神经网络复杂计算量,使用具有不同尺寸的卷积核来限制输入信号的数量,并通过添加单通道的卷积层来降低网络维度。由于每层的输入数据在训练时的分布会发生变化,导致一定程度上的信息丢失,因此在每一个卷积层的输出端都加入了批规范化,使下一层神经网络的输入分布保持相同,从而加快网络训练时收敛的速度,同时提高卷积网络的检测速度。(2)在提高算法的检测精度方面,本文优化了SSD算法中卷积神经网络的特征提取方式,使得最终输出的特征能更好的表达出输入图像的各个维度的特征信息。该方法的基本过程有三个,分别为从下至上的不同维度特征生成,从上至下的特征补充增强,以及卷积神经网络层特征与最终输出的各维度特征之间的关联表达。神经网络的深度、卷积核大小和特征层选择对目标检测的性能有很大的影响,本文基于目标检测算法SSD进行深入研究,提出了一种基于改进SSD的稀疏连接的多尺度融合行人检测方法,这种算法在训练速度和检测精度上都取得良好的性能。通过在PASCAL VOC和CUHK Occlusion图像数据集上的实验数据进行对比,表明本文采用的一些优化设计比原有算法具有更高的准确性,检测速度达到31fps满足实时性要求,具有一定的应用价值。
其他文献
随着智能硬件逐渐进入大众的视野,使得嵌入式设备的开发愈来愈繁杂。使用广泛的单核处理器以及同构多核处理器的处理性能已经很难达到应用需求。为了减弱开发难度提升计算机
高强高模聚乙烯(HSHMPE)纤维具有高强、高模、质轻柔软、优良的耐磨、耐化学和抗冲击等许多优异的性能,被广泛的应用于工业和一些特殊领域中。但是由于HSHMPE分子量极高,大分
随着Wi-Fi接入点的广泛覆盖,基于Wi-Fi的室内定位技术成为室内定位技术的热门研究方向之一。现有研究多是针对同一环境中的Wi-Fi定位问题,建立或优化基于Wi-Fi位置指纹库的多
数据匿名化因其安全性和有效性所特有的优势,常被用于解决数据发布的隐私泄露问题。针对相似性攻击造成隐私泄露的问题,本文提出(r,k)–匿名模型,基于敏感属性邻近关联,设定
在飞速发展的大数据时代,知识资源日益丰富和膨胀,为使用户能够从海量互联网信息中快速获取准确信息,需利用自动摘要技术,浓缩文本信息。自动摘要是运用计算机技术对文本文档
近十年来,计算机视觉在图像分类、目标检测、图像分割等图像处理任务上取得了巨大的进步,深度网络的性能在这些任务中有了很大的提升,为新的图像处理任务奠定了基础。尽管基
光学频率梳(OFC)简称光频梳,其光谱具有一系列间隔相等的频率分量,不同分量之间具有稳定且相干的相位关系。光频梳因其载波数量大、频率间隔固定、相干性好等优点,被广泛应用
在我国,学生辅导员是高等院校教师队伍的重要组成部分,在大学生全面发展的过程中发挥着极其重要的作用。因此,学界对于辅导员群体的研究热情持续高涨,研究范式也呈现多样化的
聚甲醛是一种机械性能优异的热塑性工程塑料,但其LOI仅为15%,极易燃烧,从而极大地限制其更广泛的应用,因此改善POM的阻燃性能具有重要意义。本论文从阻燃剂种类、阻燃剂添加
孪生支持向量机在机器学习领域有着广泛的应用,其主要目的是用来解决二分类问题,是多分类问题在现实生活中是最为常见的。因此研究人员对孪生支持向量机进行改进,提出了许多