人脸表情识别及其在视频分类与推荐中的应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:weiandlu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着智能接口和人机交互技术的迫切需求和快速发展,以人脸表情识别为主的情感计算成为新的研究热点。人脸表情识别能够增强人机交互的智能性和友好性,具有重要的科研价值和应用价值。另外,随着数码照相机、摄像机的广泛使用和多媒体共享网络(如YouTube)的快速发展,网络视频的数量正呈海量增长,如何从观察者的情感角度高效准确的对这些视频进行分类与推荐对于网站管理和增强用户体验变得至关重要。本文在总结国内外人脸表情识别及视频分类与推荐研究现状的基础上,分析了现有研究存在的问题与缺陷,提出了一种基于空间特征和隐动态条件随机场的表情识别方法,并且以此为基础,从观察者表情识别的情感角度对视频进行分类与推荐,取得了良好的效果。具体的研究工作如下:首先,对表情图像进行预处理,本文提出了一种基于人脸检测的眼睛定位算法,以定理的形式给出了图像旋转前后坐标的对应关系并进行了证明。在检测到人脸之后,采用形态学滤波与求区域中心相结合的方法对眼睛进行精确定位。接着对表情图像进行尺度归一化和灰度归一化操作,为后续操作奠定了基础。其次,本文提出了一种基于空间特征和隐动态条件随机场的表情识别方法。首先把构造组合Haar特征的过程嵌入到改进的AdaBoost算法中,提取出表情的空间特征。然后提出了一种新的图模型—隐动态条件随机场,它结合了隐条件随机场和动态条件随机场的优点。采用最大似然估计的方法对其参数进行估计,并且把它与已有的概率模型进行了比较。接着通过把空间特征嵌入到隐动态条件随机场中,即把时间特征和空间特征结合起来,对人脸表情进行识别,在Cohn-Kanade数据库上的实验证明了算法的有效性和准确性。最后,根据提出的表情识别方法,对观察者观看视频的表情进行识别,构造出他们的情感曲线,根据已有的心理学及电影学研究基础,对视频进行分类与推荐。通过表情的变化次数及规律,给出了视频类别及推荐分数。在我们收集的数据库上进行实验,效果良好,绝大多数观察者对视频类别及推荐分数的结果是满意的。文章最后总结了本文的主要工作和存在的不足,并且对该领域未来的发展趋势进行了展望。
其他文献
随着网络用户的不断扩大、系统数量的不断增多,使得企业网络数据、Internet上的数据、电子邮件等无数个不同的商用软件数据量爆炸性地增长,数据之间的关系也越来越复杂,这些
多旋翼飞行器具有体积小、重量轻、机械结构简单、操作方便、成本低等特点,因而具有广泛的应用前景。在军事上,可以用做侦查、诱饵、电子干扰、通信中继和无人战斗机等;在民
公众出行信息服务系统是城市信息化建设的重要组成部分。它依托各种信息资源,通过互联网为公众提供出行信息服务。近些年来我国公众出行信息服务系统的建设取得了一些成果,但也
掌纹识别作为一种新兴的生物识别技术,因其识别区域大、易采集、精度高和可靠性高等优点得到了较快的发展。掌纹识别算法包括掌纹图像采集、掌纹图像预处理、掌纹特征提取以
在煤矿钻孔水位监测系统中,钻孔水位是煤矿最重要的安全参数,水位传感器是实现其测量的主要设备。目前,常用的浮子式水位传感器工作原理简单、稳定可靠,广泛应用在水利水电行
无线传感器网络是资源受限型网络,传感器节点的能量、通信能力、计算和存储能力都是非常有限的。为了维持网络更长的工作时间,设计能量高效的路由协议成为无线传感器网络研究面
目前,计算机视觉系统正在广泛地应用于视觉检测、视觉导航和自动化装配领域中。在大多数视觉系统中,摄像机都是作为摄像工具,对摄像目标进行处理,但是摄像机是被动传感器,当
本论文致力于软件可靠性优化分配技术的研究与实现的目的。全面分析了串联系统、并联系统、基于重要度复杂度、基于故障率分析、架构方式和基于AHP方式的多种软件系统可靠性
随着数据库技术的广泛应用,企业信息系统产生了大量的数据,如何从这些海量数据中提取对企业决策分析有用的信息成为企业决策管理人员所面临的重要难题。数据仓库与OLAP(联机分析
长时间运行的Web应用系统存在软件老化现象。软件老化会造成严重的经济损失、对系统可靠性影响大,如何解决Web应用系统软件老化问题已成为当前研究的热点。为了降低软件老化