【摘 要】
:
随着计算机应用的不断深入,人们对于基于语音的人机交互需求越来越多,但由于语音存在噪音等干扰因素的影响,导致其处理性能往往不太理想,如何提高语音处理的性能及其识别率是
论文部分内容阅读
随着计算机应用的不断深入,人们对于基于语音的人机交互需求越来越多,但由于语音存在噪音等干扰因素的影响,导致其处理性能往往不太理想,如何提高语音处理的性能及其识别率是基于语音的交互技术研究的核心课题。本文在研究现有的基于语音说话人识别技术的基础上,引入盲信号分离和协同学方法,设计并构造了一种基于协同学的语音身份识别方案,并对该方案进行了较为深入的研究,主要研究工作表现在以下几个方面:(1)在对现有基于语音说话人的识别方案进行分析的基础上,针对其存在的不足,设计了一种基于协同学的语音身份识别方案,并构造了该方案的模型,模型将基于语音的识别分为语音段的预处理、特征参数的提取、特征参数还原以及身份识别四个部分。(2)语音预处理中,在现有语音预处理方法的基础上引入了盲信号分离技术,分别设计并实现了盲信号去噪、采样和量化、预加重、分帧和加窗以及端点检测等的具体处理算法。(3)对于特征参数的提取,借鉴现有特征参数提取算法的思想,设计并实现了基于线性预测倒谱系数和梅尔频率倒谱系数的组合语音特征值提取算法。(4)在特征参数的还原处理中,引入协同学思想和K-均值聚类算法,设计了基于协同学的参数还原模型,对模型中的基于K-均值聚类算法的原型模式向量选择、基于协同学的特征参数还原等关键模块的处理算法进行了详细的设计及实现。(5)对于身份的识别,采用对待检语音进行基于协同学还原后的语音特征值与存档的特征信息的相似度计算来判定说话人的身份,设计并实现了基于相似度的身份判定算法。(6)对本文中所设计的主要算法从参数选取、识别性能等方面进行了分析,另外从抗噪性、鲁棒性等方面对识别算法进行仿真实验的验证,实验结果表明该方案在有噪声和语音改变后其识别效果比已有的方法具有较高的准确度,可增强语音识别的性能。
其他文献
<正>体育时空》杂志由新疆维吾尔自治区体育局主管,《体育时空》杂志社、新疆维吾尔自治区体育科研所主办。国内统一刊号:CN65-1212/G8,国际标准刊号:ISSN 1009-9328,邮发代
第30届伦敦奥运会,中国男篮小组赛五战负惨遭淘汰。这是近8届奥运会中国男篮在奥运会上的最差成绩,这让广大中国球迷失望万分,同时也值得中国篮球人去深思、去总结这次失利的原
目的 :探明卵巢癌对顺铂产生耐药的机理。方法 :采用顺铂体外诱导法建立卵巢癌耐药细胞株HO 8910 / 2。MTT法测定其耐药倍数和交叉耐药性 ,原子吸收法测定细胞内Pt浓度 ,分光
随着微型产品需求日益增加,微成形技术得到迅猛的发展。塑性微成形技术具有生产成本低、成形件性能好等优点,非常适合微型零件的批量化生产,在微机电系统以及微系统技术等领
收集2012年审核的注册报送的化学药品说明书样稿292例,分析其中存在的不符合我国法规要求的问题,对问题较多的医学项目逐项详细列举其存在的主要问题和具体品种。结果发现样
目的研究在建立人工气道患者清理呼吸道分泌物的过程中,应用机械吸-呼技术的具体效果。方法选取2015年1月-2016年12月在本院建立人工气道的患者89例,将其随机分为两组,研究组
随着经济社会的发展,环境友好和绿色环保越来越符合大众需求。材料制备更需要节能、环保和绿色途径。长期以来,γ-辐照主要用于高分子材料的聚合、改性和食品保鲜及杀菌等方面
随着现代制造业的发展,设计在产品的制造过程中占的地位越来越重要,而在设计过程中,最重要的阶段就是产品的概念设计。有关调查显示概念设计阶段决定了产品后期80%的性能和成
成都具有大面积的绿色视野、独特的休闲文化气息等美学价值,并具有构建田园意象与自然文化统一的打造潜力。本文主要探讨世界现代田园城市建设和绿道规划的内涵和特点,结合世
磷化在化学转化膜处理技术中应用最为广泛,是提升钢铁耐蚀性、延长其使用寿命最直接且最有效的手段。锌系、锰系和铁系磷化是最常见的磷化膜类型,其中,锰系磷化膜的耐腐蚀保