麦克风阵列的语音定位和跟踪方法研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:q2316456q
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据语音信息实现对当前说话人跟踪的语音定位技术在视频电话会议、大型会议场所记录、语音识别预处理装置、助听设备等场合具有广泛的应用前景和潜在的经济效益。由多个麦克风组成的阵列在时域和频域的基础上增加了空间域,使得麦克风阵列的语音定位和跟踪方法逐渐成为了一个研究热点。然而,由于实际环境的复杂性和语音信号的特殊性,现有的方法在定位精度、跟踪实时性、可行性等方面都存在不足。本文从实际应用背景出发,研究麦克风阵列的语音定位和跟踪方法,旨在实现一种能够应用于实际环境的语音跟踪系统。 本文设计了一种基于实时信号采集的多通道语音采集系统,搭建了语音信号处理系统的硬件平台,为语音处理算法的分析研究提供了良好的硬件环境。文中对语音信号时延估计方法进行了较深入的研究,提出了一种去混响的预滤波处理方法提高了广义互相关时延估计法在强混响环境下的时延估计性能,提出了一种接收信号正负延迟的判决准则,提高了自适应时延估计法在正负延迟情况下的时延估计精度,扩大了其时延估计范围,期间设计了一种基于LabVIEW的LMS自适应滤波器,实现了两路语音信号之间时延的实时估计,能应用于实际环境中语音信号的实时分析和处理。同时,深入研究了基于时延的几何定位方法,对线性阵列、三角阵列和平面四方阵列作了详细的理论推导和精度分析,分析比较了各阵列的优缺点,提出了相应的改进方案。最后,提出了一种应用于小型室内会议场合的语音实时跟踪系统,详细阐述了其应用方案和实现步骤,通过在实际环境中的测试,分析了误差产生因素中采样频率、阵元间距和信噪比之间的关系并给出了理论证明,从而优化了系统参数,使其具有较好的定位精度。 文中的实验结果都是结合硬件平台对实际语音信号研究分析得到的,所以无论是改进方案还是设计的应用系统,在实际环境应用中都取得了良好的效果,具有一定的实际意义。
其他文献
随着信息技术的不断发展,人们对多媒体信息服务的要求越来越高,已不再满足于被动地接受多媒体信息,而希望能够对自己感兴趣的多媒体数据进行交互,第一代视频编码算法H.263、M
最近几十年以来,医学超声成像领域发展迅速,涌现出了一大批具有突破性意义的新技术,新方法,其中很有代表性的一个就是多普勒超声成像技术。与其它医学成像技术如x光、核磁共
近年来,随着语音识别技术和嵌入式系统的发展,基于嵌入式系统的语音识别技术被广泛运用到汽车、智能玩具、工业控制等领域。基于语音的人机交互更加自然、便利,以及嵌入式系
随着新一代网络信息技术的发展,企业的信息披露方式正从陈述式向互动式转变。加强互动式信息披露行为的研究对于完善信息披露制度、提高资本市场信息效率具有重要意义。基于
目前,移动通信发展要求更高的传输速率,更高的传输质量。为此3G协议中为了满足上/下行数据业务不对称的需求提出了高速下行链路分组接入技术(HSDPA)来提升系统容量,满足用户
随着计算机网络特别是因特网技术的发展,网络在我们的日常生活及工作中扮演着越来越重要的角色。而在网络增长的同时,越来越多的敏感信息被在线存储和管理,使网络更加脆弱、
声学多普勒流速剖面仪(Acoustic Doppler Current Profiler,简称ADCP)是一种基于水声多普勒原理进行工作的测速声呐设备,在现代水文测验中得到越来越多的应用,对其技术的研究
本文介绍了电子侦察数字接收机参数估计模块的基本算法,详细讨论了雷达信号脉内分析算法和二次抽取算法,并以基于ADSP TS201S芯片,采用一系列的优化方法,提高了系统信号处理
随着信息产业的飞速发展,通信技术和计算机技术的融合已成为必然趋势,因特网的出现则加速了两种技术的融合,全球通信产业呈现移动化、宽带化、IP化的趋势。IEEE802.16e的出现
随着WiMAX正式成为3G标准,WiMAX的角色由最初的作为最后一公里的宽带接入补充一跃成为炙手可热的3G宽带移动通信。WiMAX有固定和移动二个版本。由于提供了较目前移动通信更高