【摘 要】
:
单通道语音分离(Single-channel speech separation,SCSS)是指在没有充足先验信息的情况下,从所输入的单通道混合语音信号中提取并恢复原纯净语音的过程。人耳具有很强的语音
论文部分内容阅读
单通道语音分离(Single-channel speech separation,SCSS)是指在没有充足先验信息的情况下,从所输入的单通道混合语音信号中提取并恢复原纯净语音的过程。人耳具有很强的语音分离能力,受此启发出现了基于计算听觉场景分析(computationalauditory scene analysis,CASA)的单通道语音分离方法(CASA-based SCSS),并成为了此领域研究的重要分支。本文基于计算听觉场景分析理论,对单通道多说话人混合语音分离问题进行了研究,具体内容如下:(1)进行了语音特征分析,根据语音的短时平稳性,利用傅里叶变换将其转到频域,采用语谱图表征语音的频谱,采用类似的基音谱图表征语音倒谱;(2)进行了较精确的基音周期检测,以基音谱图上呈现出的连续基音周期轨迹为依据,较准确地估计基音周期,为后续分离提供依据;(3)对比分析了不同类型的噪声在不同信噪比下对语音频谱及倒谱的影响,并研究了一种在低信噪比条件下的频谱谐波定位方法;(4)进行了信噪分离方法研究,以基音周期轨迹为线索,分离来自同一说话人的语音段。以基音周期为依据得到语音各次谐波的位置,采用梳状滤波提取谐波的频谱,通过逆傅里叶变换重构分离语音;(5)进行了多人混合语音分离方法研究,采用了混合高斯模型进行说话人识别,将分离出来的语音段根据说话人识别结果进行匹配,将来自同一说话人的分离语音进行时序组合,实现多人混合语音的分离;实验表明,本文所研究的信噪分离方法在消除多种典型噪声干扰方面能得到较好的效果,对于两人同时说话的混合语音,能分离各个说话人的语音,音质效果较好。
其他文献
光子晶体是一种介电常数(或折射率)周期性调制的结构,其自发辐射抑制和光子局域化性质使其可以简便而有力地限制和调控光子。它的基本原理是光在介电常数周期性调制的结构中散
物联网被誉为继计算机、互联网和移动通信之后又一次信息产业的革命性浪潮。分析了国外ISO/IEC,ITU—T和ETSI等标准化组织的研究现状,介绍了国内标准化组织TC10对物联网领域内的
在传统的课堂教学模式下,教师是课堂的主导,作为被动接受者的学生缺乏应有的活跃状态和思辨能力。而互动式教学模式重新确立了学生的主体地位,体现了国家对大学生素质教育的
荷兰农业资源匮乏,是一个典型的人多地少的国家。随着农业"链战略行动计划"的实施和创意农业产业链模式在农业经营上的运用,荷兰利用自身优势改变了农业落后的现状,一跃成为
半导体量子点(quantum dots,QDs),也被称为荧光胶体半导体纳米晶或半导体纳米晶,可广泛应用于生物荧光探针、生物细胞标记和检测分析跟踪等领域。QDs的荧光性质受表面修饰剂以及合
荸荠皮果醋含有多种氨基酸、有机酸以及黄酮类物质。研究通过小鼠实验考察了荸荠皮果醋的体内抗氧化效果。实验结果表明:中剂量荸荠皮果醋(0.3mL/天)能对小鼠血清、肝脏和肾脏中
本文从教材内容、实习条件、专业教师素质以及学生学习积极性等方面,分析了当前机械制造技术基础教学中存在的主要问题,并针对这些问题提出了可行性解决方案,为进一步改革该
<正> 进入七月份以后,东南亚金融市场发生了罕见的巨大波动。首先是泰国爆发货币风潮,泰铢一泻千里,屡创历史新低。随后,菲律宾、马来西亚、印尼、新加坡等国金融市场也开始
英语是一门语言学科,语言的最本质功能就是社会交际功能。文章从多鼓励引导让学生敢说、多创设情境让学生乐说、多利用资源让学生会说三个方面,研究通过口语交际“三部曲”,
应用原位X射线衍射法对盐湖卤水体系的两个子体系———NaCl-H2O和NaCl-KCl-H2O溶液在低温条件下进行扫描,获得了实验条件下体系的衍射图谱,得到了溶液低温相变过程的信息。