应用说话人聚类技术改善语言辨识系统识别率

来源 :电声技术 | 被引量 : 0次 | 上传用户:sfyaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人差异是影响语言辨识系统性能的一个重要方面。采用说话人聚类技术对训练数据进行了预分类,以此为基础训练各种语言模型,得到聚类后的语言辨识系统。高斯混合模型、高斯混合模型一全局背景模型和遍历隐马尔可夫模型3种语言模型的实验证明,这种方法是有效的,它普遍地减小了说话人差异对语言辨识的影响,提高了语言辨识率。
其他文献
1病例介绍患者,男性,56岁.左肾结核,准备行左肾切除,术前行留置导尿.患者排尿后,将用石蜡油润滑了的普通型双腔导管插入尿道,当插入尿管长度的一半时有阻力感.
介绍了一种高速的RS译码器的结构方案。由于一般BM算法的实现结构不规则,以及延时过长的缘故,在VLSI的设计中,广泛采用的是eE算法,采用的改进BM算法,使得BM算法的实现结构规则,并且延时更小。另外还采用了一种新的有限域乘法结构,有规则的结构,易于HDL语言实现。
目的 分析老年人切口疝的易发因素并提出预防措施。方法 回顾性分析1993年10月至2000年5月间收治的腹壁切口疝20例,从疝发生时间、切口类型、切口情况、伴发病症以及麻醉效果等方面对切口
2016年,“后真相”一词入选英国《牛津词典》年度词汇,反映这一年政治领域内极度紧张的状态。《牛津词典》将“后真相”定义为:情绪的影响力超过事实。
针对基于传声器阵列的声源定位闭式解问题,提出了一种基于特征值分解的闭式一步最小二乘定位算法,并通过计算机仿真比较了其与球形插值法及球形内插法的性能,表明球形插值法和一