基于深度学习方法的口型识别技术的研究

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:xcumuhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在语音识别当中,口型识别技术可以起到很好的辅助作用,该技术可以结合视觉通道和听觉通道的信息,相比于使用单独的听觉通道来进行识别效果更好。本文针对人脸检测、人眼检测、唇部分割和口型识别等口型识别系统中的主要问题进行了研究。本文首先提出了一种基于唇部复合特征(几何特征和像素特征)来逐步地精确定位唇部的方法,第一步先利用人脸五官特定的几何位置关系初步地定位唇部,然后在此区域中利用唇部在HSV颜色空间中的像素特征精确地定位到唇部,并且该方法可以适用于不同光照亮度条件下的检测。最后使用深度学习的方法提取唇部的特征,使用自建的汉语口型数据库训练出模型来完成口型识别的任务。实验结果表明,将该方法应用于孤立字的口型识别当中准确率很高,可以达到94%。
其他文献
结合南方生态公益林资源现状特点,给出了生态公益林经营的一般模式和特殊模式,论述了不同形式重点生态区位地带性植被亚热带常绿阔叶林的恢复与重建模式及非重点生态区位针阔混
护理工作是充满高压力的工作。护士在紧张繁重的工作中承受了很大的精神、心理压力,其心理健康状况比一般人群差。结核病是一种高传染性疾病,由于疾病的特殊性,给结核病科护士造
利用嗜黑液菌对木质素进行厌氧降解处理,研究在厌氧降解过程中,木质素的元素组成、分子量、结构基团的变化及其红外光谱和氢谱。结果表明,在厌氧降解过程中,分子量大于4 950
目的:了解血站工作人员对职业危害的认知和防护措施。方法:对血站46名工作人员进行问卷调查。结果:血站工作人员对职业危害认知较高,但其认知意识和防护行为仍有必要提高和加强。
通过外加不同强度的电磁场处理滨梅茎段外植体,以促进其不定芽的增殖。结果表明:对滨梅外植体施加强度为97kA/m磁场,处理10min,可明显地促进不定芽的增殖,其增殖倍数是对照的2.3倍。
在模拟干旱胁迫祭件下,对4种不同类型楸树叶片的叶绿素荧光动力学参数进行了研究,结果表明,干旱胁迫对揪树叶片的叶绿素荧光参数存在显著影响。随着干旱胁迫的加剧,PSⅡ最大光化
虚拟实验系统是一个网络环境下建设远程教学系统的实验环境,它是一种异构问题的解决手段.随着计算机和虚拟现实技术的发展,它在以实验课程为基础的理工科教学中,将显得更加必