【摘 要】
:
疲劳会使司机在驾驶时产生睡意,这是交通事故发生的重要原因之一。因此如果能够监测司机的实时状态,在其有睡意的时候给予警告,可以有效预防交通事故的发生。当前存在的嗜睡检测技术大致可以分为三类:(1)基于车辆参数的检测技术;(2)基于生理参数的检测技术;(3)基于视觉特征的检测技术。基于视觉特征的检测技术仅需要车载摄像头对司机的驾驶状态进行监控,相比于基于生理参数的方法所需成本更低,且不会影响司机的正常
论文部分内容阅读
疲劳会使司机在驾驶时产生睡意,这是交通事故发生的重要原因之一。因此如果能够监测司机的实时状态,在其有睡意的时候给予警告,可以有效预防交通事故的发生。当前存在的嗜睡检测技术大致可以分为三类:(1)基于车辆参数的检测技术;(2)基于生理参数的检测技术;(3)基于视觉特征的检测技术。基于视觉特征的检测技术仅需要车载摄像头对司机的驾驶状态进行监控,相比于基于生理参数的方法所需成本更低,且不会影响司机的正常驾驶。而且基于视觉特征的检测技术是直接监控司机的面部表情,与基于车辆参数的检测技术相比更加可靠,受到司机驾驶习惯的影响更低。所以本文采用基于视觉特征的技术进行司机嗜睡检测研究,通过司机的面部表情以及头部的动作判断司机在驾驶过程中是否产生了睡意。传统的方法采用手工制作的特征提取面部信息,但这样提取出来的特征过程复杂,依赖具体任务,可移植性差。因此本文采用了深度学习的方式提取面部特征,基于卷积神经网络(Convolutional Neural Network,CNN)提出了两种嗜睡检测方案:(1)本文提出了一个基于司机嗜睡动作识别模型(Drowsiness Action Recognition Model,DARM)。该模型基于三维卷积神经网络(3D Convolutional Neural Network),能够识别出四种动作,包含一个非嗜睡动作和三个嗜睡动作。然后,将光流输入到模型中进一步提取运动信息,提高了嗜睡检测的正确率。最后在NTHU-DDD(National Tsinghua University Driver Drowsiness Detection)数据上进行了验证该模型的性能,实验结果显示正确率达到了86.6%,优于现有的方法。(2)本文提出了一种基于微调TEA(Temporal Excitation and Aggregation)网络的检测方法。该方法首先使用多任务级联卷积神经网络(MTCNN)进行脸部特征的提取,去除背景等冗余信息。然后提取出来的图像输入到TEA网络中进行司机嗜睡动作识别,该网络包含了ME(motion excitation)块和MTA(multiple temporal aggregation)块,能够很好的进行时间信息建模,与同类算法相比拥有更好的性能。
其他文献
近年来,国民经济迅速发展,人们生活水平不断提高,在关注生活品质的同时,自身健康问题也越来越受到重视。大众对于健身的观念也发生了转变,人们不再满足于通过医疗器械健身,或者是盲目的健身计划,而是寻求更加专业的、有计划的健身方式,从而可以避免盲目性的健身。例如肥胖是一个日益严重的公共健康问题,已经发展为流行病,肥胖是引发糖尿病、高血压、冠心病的重要危险因素,甚至还会让孩子面临心理和社交上的问题。除了控制
随着数据量的急剧增长,数据的存储和计算负担成为了许多用户的困扰,本地存储已经难以满足用户需求,云存储技术的出现很好地解决了这个难题。但是数据上传到云服务器之后,数据就不在用户的控制下了,许多安全问题就产生了。其中最重要的一个安全问题就是云端的数据的完整性,云服务器并不是完全可信的,服务器可能会因为各种原因导致数据的损坏,因此用户需要一个有效的方式来验证数据的完整性。一个好的数据完整性审计方案可以帮
大学生的体质健康问题越来越引起社会各界的广泛关注,大学生作为国家发展的新生力量,其体质健康关系着国家是否能有足够的力量迎接富强道路上的艰难险阻。但随着科技现代化的到来,人们的生活方式发生了很大的改变,大学生的体质健康状态也逐年下滑。机器学习方法正在以各种形式被应用于社会生活的方方面面,在很多领域为人们生活提供了方便。本文主要针对大学生体质健康问题,运用机器学习的方法,对不同类别体质的大学生进行运动
图像及视频分割作为多媒体数据内容挖掘与理解的关键步骤,成为近年热点研究的话题之一。视频协同分割作为视频处理的关键技术,相比诸多需要大量标注进行监督学习的方法,其通过挖掘视频间的相似性信息来弥补监督信息不足的缺点。同时,当下深度学习技术已广泛应用在许多领域,但多数深度学习技术依赖大量的数据标注。为解决获取成本高且时效性较低的数据标注的问题,迁移学习被研究者提出,以实现将已有的知识应用到目标任务中。无
入侵检测是网络安全技术的热点之一。通过分析从网络环境中提取到的数据,它可以检测是否有入侵行为的发生。随着计算机网络的不断发展,不断增长的网络流量给入侵检测带来了挑战。这使得入侵检测需要处理的数据量越来越大,而硬件的处理能力却并没有以相同的速度进步。为了提高入侵检测方法的检测性能,对数据进行降维是重要的研究内容。特征选择是数据降维的重要措施之一,它可以加快入侵检测的速度和提高入侵检测的性能。特征选择
网络中影响力节点的识别具有重要的社会意义和实际应用价值。传统影响力节点识别算法多以无符号网络为媒介,仅考虑个体间的正向链接关系。然而在真实的网络环境中,个体之间的联系不仅存在积极正向的关系,还存在消极负向的关系。一些基于符号网络的节点影响力识别算法也只是在传统识别算法的基础上进行简单改进,没有充分考虑节点间链接的正负属性。为准确识别出符号网络中的影响力节点,本文出了一种基于符号网络节点间依赖关系的
随着计算机网络技术的飞速发展,人们的交流变得更加便捷。然而,在网络中的交流可能会涉及一些重要内容,比如:个人的账户密码、企业的机密、国家的保密文件等。在传输的过程中,数据的安全性也受到人们的关注,隐写术也应运而生。隐写的载体可以是图像、文本、视频、音频等。日常沟通中图像占有较大的比重,因此本文采用的以图像为载体。针对隐写图像安全性、鲁棒性和最佳嵌入位置等方面的不足,研究与分析相关成果的基础上,提出
近年来,在线社交网络在世界范围内迅速普及,成为人们日常交流、信息获取和讨论热点事件不可或缺的工具。人们加入多个不同社交网络平台,如微博和推特,能够同时享受不同的服务。作为跨平台用户的自然人则充当了连接多个网络的桥梁。跨社交网络用户对齐问题旨在从多个不同社交网络上的众多虚拟账户中寻找相同的自然人。该问题由于其在跨网络商务推荐、链路预测、网络空间安全等应用领域的潜在实用价值受到学术界和工业界的广泛关注
近年来,自然语言处理各个领域取得迅猛的发展。支撑发展的核心技术之一—深度学习,在学术领域和工业界均取得了巨大的成就。许多学者们用深度学习技术来处理文本信息,借助神经网络和注意力机制进行文本情感色彩的判断。由于语言本身的复杂性,一个句子、一段文字可能会表达出多个不同的感情倾向,在借助深度学习技术分析较长篇幅文本的情感极性时遇到瓶颈。因此,将长文本进行细粒度的划分,从方面级的角度分析文本的情感成为当下
动态阈值神经P(DTNP)系统是一种新型分布式和并行计算模型,它结合了神经元的脉冲机制和动态阈值机制。DTNP系统在理论上已经被证明是图灵通用计算设备。本文主要研究DTNP系统与多尺度变换结合在图像融合中的应用,包括多焦点图像融合、红外与可见光图像融合和多模态医学图像融合。本文主要的工作和贡献如下:(1)提出了一种具有局部邻域结构的二维DTNP系统。(2)提出了一个基于DTNP系统的多焦点图像融合