基于深度相机人脸与行人感知系统的设计与实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:ljc1007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉是人工智能的重要研究领域,目标检测作为计算机视觉的基础任务,是学术界和工业界的研究热点。其中,关于人的感知更是具有广泛的应用意义,尤其是在智能安防、无人驾驶和移动机器人等行业。在这些行业的解决方案中很多使用深度相机进行人的感知,以达到快速准确以及三维定位的目的。在一些商业化及开源代码中,一般只针对单一设备或特定场景,并且难以根据用户需求进行二次开发或功能扩展与删减。基于以上原因,本文提出基于深度相机,易于扩展且方便开发的人脸与行人感知系统。本系统主要分为四个模块:硬件层、驱动层、应用层、可视化层。层间,层内的功能单元相互独立,接口格式统一,易于调用,方便功能单元以插件形式扩展与删减;硬件层兼容异构的相机设备,包括多种深度相机,彩色相机;驱动层统一相机的接口;应用层内的某个单元可以方便被其他单元调用,例如检测单元可为跟踪单元服务;可视化层使用机器人操作系统的3D可视化工具,能够以多种显示方式查看结果。本系统针对相机个数可分为单深度相机系统与多深度相机系统,前者的感知应用包括人脸检测与识别,行人检测与跟踪;后者克服单深度相机系统覆盖面小的缺点,组成相机网络,实现对行人的跨区域长时间的跟踪。本系统针对人脸感知集成了快速人脸检测与识别算法,方便部署于低功耗设备。对于RGB相机,集成Dlib人脸检测器。对于深度相机,本文提出了基于Dlib训练器并联合RGB-D信息进行人脸(头)检测的方法,可使用深度相机准确检测人脸(头)。人脸识别模块使用特征脸与费希尔脸的方法。对于行人感知,本系统使用了传统的基于RGB-D的算法和基于多模态深度学习模型的方法,前者使用强大的三维图像处理库PCL进行开发,后者基于当前快速而高效的faster R-CNN框架。本系统的跟踪模块利用Tracking-by-Detection的思想,并使用扩展卡尔曼滤波的方法以达到抗遮挡的效果。最后,本系统使用多个深度相机组成网络,使用相机标定的方法使得每个相机知道其它相机以及地面的位置,从而重构相机所覆盖到的三维世界,实现跨区域长时间的行人跟踪。
其他文献
介绍科威特海湾大桥建设项目的工程概况、架桥施工总体方案,以及所用超大型成套装备与技术方案的设计过程及技术背景。该套超大型装备包括1套1 800 t/60 m双幅箱梁架桥机,2套
水泥混凝土材料体系的电化学研究最近取得了若干重要进展。本文涉及交流阻抗谱应用于水泥混凝土材料科学的若干理论问题,包括交流阻抗谱各个参数与硬化水泥浆体结构相关的理论
血热泛指人体中津血、营血之血分之热。血热证是津液气血和卫气营血辨证《新血证论》中与血瘀证、血虚证、血燥证等同一范畴独立的证。其具有津血、营血之血热的功能紊乱,亦
河北省是一个人口大省,人口老龄化问题十分严重。社会养老保险在促进经济发展与社会稳定、改善民生等方面起着关键作用。2015年4月,中共中央政治局通过《京津冀协同发展规划
20世纪30年代,皮亚杰提出了关于儿童道德发展的理论。其基本内容包括:儿童道德判断的起源和发展;儿童的道德判断有一种明显的“道德实在论”特征,造成儿童“道德实在论”的主
近年来,预制装配化技术以其施工速度快、安全、环保及对周围交通环境影响小等优点在桥梁建设中得到了越来越广泛的应用。作为桥梁上部结构,大吨位整孔预制混凝土箱梁也顺应着
目的:探讨社区老年高血压患者的服药依从性与其生活质量的相关性。方法:采用中国心血管病人生活质量评定问卷和Morisky服药依从性量表,对197名社区老年高血压患者进行调查分
大学生的创业能力关乎大学生创业的成败,积极寻求提高大学生创业能力的有效途径对提高大学生创业的成功率有重要意义。本文将探索创业知识对创业能力的影响。结果表明,创业知
<正>一、教学版本:本课题选自浙教版(A版)必修4之1·2节二、本节教学流程:首先在直角三角形中定义锐角三角函数,然后引出在直角坐标系中利用终边上的点的坐标表示锐角三角函