基于SSD的行人检测与跟踪方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:lilinjun0954
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测与跟踪作为人工智能的重要底层技术,应用场景广阔,特别是在自动驾驶、服务机器人、视频监控等领域。近年来,随着深度学习浪潮席卷计算机视觉领域,行人检测与跟踪问题的研究取得了快速发展。行人检测方面,出现了许多基于卷积网络的检测算法;行人跟踪方面,深度特征结合相关滤波的思路成为主要研究方向。然而,由于行人所处环境复杂多变、易受到光照变化、尺寸变化、相似背景等因素的影响,准确快速的检测与跟踪行人依然是颇具难度和挑战的研究任务。本学位论文以行人检测与跟踪为主要研究内容,提出了基于SSD(Single Shot Multi-box Detector)的行人检测与跟踪算法。当前基于卷积神经网络的行人检测算法无法兼顾检测质量与检测速度。针对这一问题,本论文提出基于SSD的行人检测算法。在SSD算法的基础上,引入交通场景下行人的先验信息并调整神经网络的连接方式,可有效缓解SSD算法检测小目标时出现的漏检问题。算法首先利用调整后的网络得到初步的行人位置信息与行人特征信息,之后采用AdaBoost(AdaptiveBoosting)算法对行人框做进一步的分类,增强算法对难分辨样例的判别能力。所提出的算法具有较高的检测准确度,在检测速度上有着一定优势。当前行人跟踪的主流研究思路是深度特征结合相关滤波,这类算法存在的问题是,行人特征的提取与滤波器的训练是割裂的,无法充分发挥深度学习框架的整体优势。本学位论文设计出一种新的卷积网络替代相关滤波,将目标行人特征的提取与相关滤波的训练统一到深度学习框架中,使得跟踪算法可以随着目标外观的不断变化做出对应的更新。行人跟踪中时常出现行人相遇、遮挡等情况,会导致跟踪错误的对象。本论文利用主旁瓣比来判断目标是否被遮挡,同时结合目标行人的运动信息来增强跟踪算法的鲁棒性。此外,在本论文提出的行人检测算法的基础上,我们利用行人再识别领域数据集训练的残差网络提取不同行人的特征,结合行人的位置信息和外观信息计算不同行人框的相似度,进而实现行人跟踪。该算法在跟踪处于遮挡状态的行人时,显示出较其他算法更好的效果。
其他文献
农村土地承包经营权"三权分离"趋势已基本明晰,基于鼓励、放活经营权的农村土地承包经营权流转规模正在不断扩大,流转价格是新形势下流转市场发育程度和流转体系健全水平的重
“‘黑夜给了我黑色的眼睛/我却用它寻找光明’。如果说,重点班的学生生活在蓝天白云下,沐浴着阳光,那么普通班的学生就是在黑夜中摸索、徘徊、挣扎……所幸的是,我从普通班挤入了
本文以102名初、中、高级马达加斯加学生作为调查对象,以学生使用频率高和偏误频率高的一些常用介词(在、跟、从、给、对、往、为)作为考察范围,采用定性和定量的方法,通过预
节律是指附着在音节和音节组合中的声音的高低、轻重、长短、快慢、间歇等语言特征。汉语节律的构成要素有停连、节奏、重音、声调、语调和基调等。汉语是声调语言,节律特征
我国在社会经济建设的过程中,促进了建筑行业的较快发展,在较大程度上提高了人们的生活质量。但是,在发展的过程中也对环境造成了较大的污染,在一定程度上减缓了我国经济的发
近年来,我国一直把帮助促进小微企业的成长作为未来国家发展的重要战略方向之一,并相继推出了一系列针对于小微企业的相关优惠鼓励政策,使得近年来其发展有了一个非常良好的
背景:大量体外细胞实验和动物实验表明,白藜芦醇不仅具有抗氧化应激、抗炎、抗病毒、抗肿瘤和延缓衰老等生理活性,还具有骨保护作用。目的:观察白藜芦醇对钛磨损颗粒诱导小鼠
双及物结构一直是语言学研究的焦点,前人对双及物结构的研究大致可以分为三类:结构主义,转换生成语法和认知语言学,但是均有缺点和不足之处。本文的研究是基于Goldberg的构式
构建反映粮食种植面积变化的动态模型,将2004—2016年31个省区按照粮食主产区和非主产区进行样本分组,运用面板联立方程分析价格、风险、成本和需求等市场因素对粮食种植面积
近年来,随着我国股权分置改革的逐步完成,越来越多的上市公司选择实施股权激励制度,股权激励越来越受到企业的重视。股权激励作为一种长期的激励方式和分配制度,可以使委托人