嘈杂背景下的声源定位及语音分离实现技术的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wxa180395
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在嘈杂的语音通信环境中,由于存在背景噪声和其他说话人的声音,使得感兴趣说话人的声音难以听清,极大地影响了语音通信的质量。随着时代的发展,人们对语音通信质量的要求越来越高,这一问题的解决已迫在眉睫。麦克风阵列的研究,是目前阵列信号处理领域的新兴研究方向,为上述问题的解决引入了新思路。在时域和频域的基础上增加空间域,在噪声处理、声源定位和跟踪、语音提取和分离等方面,弥补单个麦克风的不足。因而,麦克风阵列能够广泛应用于嘈杂背景下的语音通信环境,提高语音通信质量。本文介绍了一种基于麦克风阵列的嘈杂背景下声源定位和语音分离方法,提出了在DSP平台上的硬件和软件实现方案。本文涉及的声源定位和语音分离技术,以麦克风阵列近场语音传播模型为基础。首先,使用频率聚焦技术,形成整个语音频带的频域平均相关矩阵;使用近场宽带2D-MUSIC算法,完成声源的定位和跟踪;再根据估计的方位信息,使用近场最小方差波束形成技术,完成语音的提取和分离。算法实现方案,包括硬件和软件两部分。硬件方面,搭建了以TMS320C6713为核心的通用阵列语音处理平台。软件部分,针对这样一个任务繁多,计算量庞大的算法,进行了软件系统设计和优化。实现的主要难点,包括多个任务的调度、代码优化和麦克风校正等。其中,任务调度对算法各任务进行合理的优先级划分,使系统协调工作。代码优化部分,采用汇编语言与C语言联合编程,使用DSPLIB提高编程效率,以及进行折衷处理,在保证算法实现效果的前提下,尽量提高运行速度。麦克风校正,主要是保证各个麦克风的幅度响应一致,从而保证距离定位的准确性。通过硬件和软件的实现,本系统基本完成了声源的二维定位和跟踪,以及单个声源的语音增强功能,验证了工程实现的可行性。最后,本文对测试结果进行分析,并提出了进一步工作的重点。
其他文献
全球定位系统(GPS)是精密的卫星导航定位系统。GPS系统作为一个世界范围内全天候导航定时系统,在军用和民用导航方面的作用日益重要。除了GPS,还有俄罗斯的GLONASS和欧洲的Gali
本论文主要进行水声图像处理和模式识别领域的算法研究和开发。包括图像处理的基本算法、基于脉冲耦合神经网络(PCNN)的图像处理算法、形态学图像处理算法及目标识别算法。本
移动WiMAX空口规范采用IEEE802.16e协议,采用全IP包分复用互联架构,功能上融合了蜂窝移动通信系统与宽带无线城域网,支持固定、便携、车载环境下的高速数据传输与异构网间无
下一代移动通信的目标是实现高质量、高速率的移动多媒体传输。正交频分复用(OFDM)由于可以有效的对抗信道的多径效应,因而被认为是下一代移动通信的一种关键物理层技术,目前
近年来,随着基于WEB技术的应用系统日益增长和快速普及,在新闻传媒,出版发行等领域得到了广泛的使用。由于基于WEB的应用系统不依赖于客户端进行访问,因此作为一种广泛交流使
随着科技的快速发展,无线通信已经广泛渗透在人们的日常生活,不仅提高了人们的工作效率,也为人们休闲娱乐的开展提供了便利。为了更好地保证无线通信业务的服务质量,建设更高
随着互联网的广泛普及和宽带网络的高速发展,流媒体的应用已经成为近几年来研究的一个热点。目前流媒体软件大多是基于客户端/服务器模式的,然而其服务端的瓶颈极大地限制了