基于隐马尔可夫模型的唇语识别方法研究

来源 :北方工业大学 | 被引量 : 2次 | 上传用户:aspxcss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人机交互的迅速发展,语音识别作为最高效最便捷的人机交互方式之一,受到了研究者广泛的关注。但是在复杂的环境中,语音识别受到很大干扰,无法满足人类的正常需求,因此,唇语识别技术开始兴起,该技术在智能人机交互、视频大数据的挖掘、视频监控的语音读取等领域都有不可限量的发展前景。本文将根据说话者嘴唇的视觉特征来理解话语内容,主要从唇部区域定位、唇部的特征提取和唇语识别环节进行研究。在唇部区域定位方面,本文选用AdaBoost算法用于人脸检测和定位,通过嘴唇在人脸中的固定位置,获取本文的感兴趣区域(ROI),即嘴唇区域。在唇部特征提取方面,本文获取嘴唇轮廓关键点进行曲线拟合,通过嘴唇轮廓曲线,获取曲线的参数作为嘴唇视觉的形状特征;再利用拟合曲线建立唇部轮廓模型,获取视觉几何特征,两者相结合,形成嘴唇整体视觉特征向量;通过本文优化的局部敏感判别分析(OLSDA)方法对视觉特征向量进行降维操作,保持主要特征信息,减少冗余度。在唇语识别环节,本文在隐马尔可夫模型的基础上,采用K均值聚类算法对唇动序列特征向量进行量化聚类,作为识别环节训练和识别的输入。考虑本文的需求,利用本文自制的视频数据库作为样本进行实验,实验结果表明,本文搭建的唇语识别系统有较为理想的性能,同时也验证了本文提出的唇部定位、特征提取以及唇语识别环节算法的可行性。
其他文献
在真核生物中 ,基因组DNA是以染色质的状态存在和发挥作用的。目前的研究已经鉴定了多种可以调节染色质结构和功能的蛋白质和酶复合物 ,包括不依赖ATP的染色质修饰酶、依赖于
随着新课程标准的实施,体育教学逐渐形成为体育发展的一个热点。体育课对缓解高中生学习压力,激发学生的学习热情,具有十分重要的作用。为此如何培养学生体育学习的兴趣和是什么
新课程改革的核心理念在于以学生发展为中心,重视学生的主体地位。贯彻这一理念,我们必须倡导的新的学习方式,构建以学生为主体的学习方法。长期以来,我根据小学生的特点,注意从情
目的研究和分析胎膜早破护理的要点以及对产妇的影响观察。方法对照组的产妇实行临床护理模式,主要包括对症护理、作息护理、翻身护理、饮食护理等,给观察组的患者进行护理干
本文介绍了硝酸羟胺的基本性质,综述了硝酸羟胺(HAN)的合成方法,对主要工艺的特点、原理进行了归纳总结,指出了各方法的优缺点。
针对多旋翼植保无人机在全自动作业过程中转弯效率低下的问题,提出了一种新的弯道姿态控制算法。对弯道处航路进行重新规划,由"几"字型航路变为更适合转弯的曲线航路;设计了
<正>作为观众,我们是将电视剧《北风那个吹》当作历史来"读"的。该剧记述了从"文革"中知识青年上山下乡到改革开放初期下海经商这一段历史时期,这是中国社会的一次重要转型期
听是语言活动的一种形式,也是语言学习的重要内容。听力技能的培养是一个综合技能的培养,包括学生对句子,对文章的理解能力.逻辑思维能力和概括能力,同时也是培养学生的语言交际能
通过文献资料方法、调查问卷法等相关方法,对女子足球运动员的运动损伤的进行调查分析,结果显示女子足球运动员的踝关节损伤者较为普遍。对运动损伤的原因进行分析,并提出了
翻译适应选择论为多维度解释翻译活动提供了一个崭新的视角。文章基于该理论的研究,把译者主体的适应选择与诗词翻译这一载体相结合,从语言维、文化维和交际维的适应性转换视