基于SOFM、VQ与HMM的说话人识别技术研究

来源 :西安科技学院 西安科技大学 | 被引量 : 0次 | 上传用户:wangj30
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术经历了数十年的发展,已经取得了巨大的进步,然而与人类的听觉能力相比还处于初级阶段,与其广阔的应用需求显得力所不及,目前有实力的发展国家都纷纷展开说话人识别技术的研究,我国的863计划也包括该项技术,应该说说话人识别技术已经成为21世纪信息领域中最有发展潜力的技术之一。 论文研究内容集中在说话人识别的策略方面。通过考察分析现有的各种说话人识别技术,认为就目前情况来说,要么是改进现有成熟的主流识别技术进一步提高识别率,要么将现有成熟的主流技术与比较前沿的技术相结合从而找到一种实用的说话人识别技术。基于以上认识,本文将研究重点放在人工神经网络与说话人识别主流技术隐马尔可夫模型(HMM)相结合上以及对HMM的前端处理矢量量化的改善上。提出将VQ说话人识别技术与HMM说话人识别技术相结合,引入自组织特征映射神经网络(SOFM)代替普通VQ识别中的LBG算法进行码书设计、矢量量化的说话人识别策略,并采用了自适应技术,同时建立一个小规模的说话人识别系统以验证所提出的说话人识别策略。 通过理论分析与实验可知,采用SOFM算法代替普通LBG算法可以实现码书训练的全局最优及其训练时间的可控性,采用并行算法可提高计算速度;采用本文所提出的说话人识别策略,与单HMM识别方式相比可以减少前端量化误差,提高HMM的识别精度,由VQ识别结果与HMM识别结果共同决定最终识别结果,提高了系统的可靠性。自适应处理技术的采用使得系统参数可以根据由于如年龄等因素引起说话人声音的变化而作相应的调整。
其他文献
电磁兼容(EMC)是一门新兴的综合性学科。它涉及的基础知识面非常宽广,直接应用和涉及的知识有电磁场理论、电工原理、电子技术、电磁测量、信号分析、机械结构、自动控制、生
面对全球不断发生的严重洪水灾害以及随着人类社会经济的不断发展,洪水灾害所造成的经济损失与日俱增,这使得水库在防洪中的地位不断提高。由于猛进水库的重要性和及其工程设施
离散制造系统是离散事件动态系统(DEDS)研究的一个重要内容,离散制造系统中调度的许多问题,可以描述为下列串行生产线的问题,其模型可看成为n个工件依次通过m个工作台进行加
沥青混凝土摊铺机是用来铺筑沥青混凝土路面的工程机械,是路面机械的主要机种之一,它将拌和好的沥青混合材料均匀地摊铺在路基或路面基层上,经初步振捣和整平,形成具有一定宽