唇读中的特征提取、选择与融合

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:dinosonic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
唇读是利用计算机来识别唇动序列的一门技术,它涉及到模式识别、人工智能、图像处理等多个领域。本文主要研究了单视觉通道下,唇读中的特征提取、选择与融合,主要研究工作包括:1.在特征提取方面,分析了流形学习这种非线性的特征提取方法在唇读中的应用。为了有效提取出唇动过程中的本质特征,本文分析了两种流形学习方法(Isomap和局部线性内嵌(LLE))在唇读中的应用。最初提出的Isomap和LLE方法对于训练集以外的新样本没有一种好的方法能找到其内嵌表示,本文提出了基于核的Isomap和LLE方法,实验结果表明,利用流形这种非线性特征提取方法达到的识别性能虽然要低于传统的基于线性的特征提取方法,但通过流形学习得到的低维内嵌相比于传统的方法更能够反映出唇动的本质特征。2.在特征选择方面,提出了一种基于AdaBoost的最优Gabor核选择算法。Gabor变换因其良好的识别性能在模式识别领域得到了较高的认可。但利用Gabor变换提取出来的特征维数太高,导致所需训练样本的个数显著增加,限制了其在唇读中的应用。考虑到嘴唇区域的表观对称性和Gabor核函数的方向性,本文提出了一种基于AdaBoost的最优Gabor核选择算法。提出的方法首先将嘴唇区域对称地划分成四个子块,在每个子块上利用AdaBoost自适应的选择具有最优判别能力的Gabor核函数。实验表明,所选择的Gabor核函数与嘴唇区域的表观具有一致的方向性。最终产生的特征向量的维数明显降低,达到了优于传统方法的性能。3.在特征融合方面,提出了一种在分类器级融合全局特征和局部特征的方法。在过去的文献中,大量的基于像素的特征提取方法被提出来。传统的特征提取方法只利用了全局特征或局部特征。然而一些心理学的研究表明,人类在识别物体时,不仅利用了全局特征也利用了局部特征,并且在从局部分析物体之前先利用了全局特征。基于这些研究,本文提出了一种在分类器级融合全局与局部特征的方法,全局分类器利用离散傅里叶变换(DFT)来提取全局特征,局部分类器利用分块的Gabor小波变换来提取局部特征。最终的分类器将全局和局部分类器的输出联合得到最终的判别结果。实验结果表明提出的方法要明显优于传统的基于局部特征的分类器或基于全局特征的分类器。
其他文献
随着信息技术的飞速发展,计算机已经普遍应用于各行各业,成为目前应用最为广泛的信息处理和信息传输的设备。而这些信息处理设备在商业、军事、政府中处理重要的涉密信息时,
中医舌诊是通过观察舌的各种特征来了解人体的健康状况,从而对各种疾病做出诊断及病情评估,是祖国中医学应用最广、最有价值的诊法之一。随着现代科学技术的发展,将图像处理
近年来,随着虚拟仪器技术、运动控制技术的显著进步以及工业总线的迅速普及,将虚拟仪器技术应用于数控折弯机系统,使信号采集、传输、处理分析和控制一体化,已成为一种趋势。
自上世纪九十年代以来,多媒体信息迅速膨胀,基于内容的视频检索成为了研究的热门课题。其中,如何利用机器学习理论使计算机能自动获取视频中的语义信息,以便有效地进行视频语
近几年来,随着脉冲神经网络及其学习算法研究的快速发展,越来越多的研究结果显示脉冲神经元通过接受、发放脉冲来传输信息和实现功能的工作原理更加接近于真实的生物神经元,
随着现代电子技术的发展,通信技术、计算机网络技术都有了飞速的进步,而二者的结合又将两种技术推广到更多的应用领域。传统的通信网正在逐步发展成为以通信技术为底层支撑,
随着计算机网络技术的飞速发展,网络已进入社会生活的各个领域和环节,人们日常生活中的许多活动都逐步转移到网络上来。网络信息技术应用的日益普及,应用层次逐渐深入,应用领域从
科学工作流作为近年来出现的一种新的应用泛型,可集成、构造和协同分布异构的数据、服务和软件,提高科学实验过程的自动化。科学工作流应用通常是数据和计算密集型的,对计算
发展循环经济是一项涉及面广、综合性很强的系统工程,是建设资源节约型、环境友好型社会和实现可持续发展的重要途径。循环经济评价指标体系是国家建立循环经济统计制度的基
任务调度是分布式并行计算平台,如Hadoop、Dryad等,最核心的功能。任务调度结果的优劣极大地影响着系统吞吐率、计算集群的资源利用率以及作业的性能。同时,由于计算集群的异