基于机器学习的双麦克风手机语音增强算法研究

来源 :南京师范大学 | 被引量 : 2次 | 上传用户：a15968331849

【摘要】

：

手机作为目前市场最大,消费人群最广的便携式移动通讯设备,其通话质量的改善一直以来受到了广泛的关注。由于使用场合很广,需要应对的背景噪声环境也十分复杂,这就要求应用于

【作者】

：

章雒霏

【出处】

：

南京师范大学

【发表日期】

：

2017年01期

【关键词】

：

神经网络手机双麦克风语音增强语音活动检测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

手机作为目前市场最大,消费人群最广的便携式移动通讯设备,其通话质量的改善一直以来受到了广泛的关注。由于使用场合很广,需要应对的背景噪声环境也十分复杂,这就要求应用于手机平台上的消噪算法可以灵活地应对多种噪声,在保证语音通话质量的前提下,对背景噪声进行有效抑制,而且算法的性能不会因使用者握机姿势的不同或通话过程中手机的转动而下降,对真实环境具有良好的鲁棒性。近年来人工智能的应用已逐步覆盖各个领域,机器学习作为其核心,强调在不断的数据学习中改善算法的性能,这种特性使得机器学习相关算法(如神经网络)能够灵活应对复杂而多变的外部环境,如果能将机器学习应用于手机消噪算法中一定会显著提升算法在真实场景下的性能,然而相关研究工作却并不多。本文尝试将机器学习中的神经网络模型应用于手机消噪算法中,并针对消噪算法的各个部分进行了改进,提高了算法在真实使用场景下的灵活性和鲁棒性。全文工作及创新点主要包含下列几个方面:(1)针对现有的双通道VAD算法依赖于固定阈值难以在多种不同的噪声环境下准确地检测语音和噪声等问题。论文第二章结合神经网络提出了一种新的双通道VAD算法,该算法以分频带能量差和归一化互通道相关作为两类新的特征,采用神经网络对语音和噪声进行分类,不依赖于固定的阈值,可以灵活应对复杂而多变的噪声环境,较现有的基于互通道能量差及其改进的VAD算法准确性更高。(2)论文的第三章利用了手机两个麦克风接收带噪语音信号功率的比值在噪声段和语音段的不同,提出一种新的基于互通道功率比值的VAD算法,在此基础上,将第二章的神经网络VAD算法与基于互通道功率比值的VAD算法相结合,最终得到一种适用于手机消噪处理中的语音和噪声活动检测算法,该算法能够分别针对语音和噪声进行准确的检测,使用检测结果控制时域语音增强算法对带噪语音信号进行消噪处理,在滤除噪声的同时能够显著降低对语音信号造成的损伤,提高语音的可懂度,特别是对方向性的语音干扰也能够有很好的抑制效果。(3)为了进一步滤除第三章时域语音增强处理后残留的线性不相关噪声,论文的第四章将时域输出的增强语音信号和背景噪声信号转化到频域进行进一步的消噪处理,并分别针对消噪算法中两个重要的组成部分:噪声估计和噪声消除做了改进。首先结合单、双麦克风的噪声估计算法,提高了噪声估计的准确性,然后将基音检测与消噪处理相结合,在语音帧中估计语音基音频率确定语音和噪声频率点,针对语音和噪声频率点分别调整维纳滤波器的参数,在对噪声进行滤除的同时尽可能地保留语音频点,从而减少了语音失真。实验结果表明,与现有的双麦克风消噪算法相比,经过改进后的频域消噪算法能够更有效地减少对语音信号造成的损害,提高了手机的通话质量。(4)使用者握机姿势的不同或通话过程中手机的转动会对消噪算法的性能产生影响,如果能够实时确定手机的位置,并依据当前位置及时调整消噪算法的参数则能够提高算法的性能。现有的定位算法大多需要三个以上的麦克风阵列,无法直接用于双麦克风的手机上。论文第五章结合手机这一特定的应用场景提出了一种只使用两个麦克风在三维空间中定位手机位置的新方法,该方法使用互通道时延和通过对目标语音到达两个麦克风的传播路径进行分析提出的新特征子带互通道功率比作为输入,训练神经网络输出手机的空间位置。(5)当检测到手机偏离标准通话位置时,依据第五章神经网络定位的结果及时地对论文第三和第四章中的时域和频域消噪算法的参数进行调整,避免了算法因手机位置的移动而造成的通话性能下降。实验结果表明,现有的双麦克风消噪算法由于忽略了手机转动的问题,在真实场景下的性能无法得到保障,而本论文提出的消噪算法性能更加稳定也更具有实用性。论文的结尾概括了全文的主要工作和创新性的研究成果,并对进一步的研究进行了展望。

其他文献

论德育在信息化教学环境中的价值体现

中职信息化教学环境中的德育现状　　随着我国网络信息技术的发展，互联网+技术已经上升为国家创新创业的主力引擎之一，同时新技术也迅速渗透入社会生活的方方面面。人工智能、大数据云技术、跨境电商、共享经济等等，无一不体现出网络信息技术给各行各业带来的变革。　　在教育行业，特别是职业教育，要求学生比普通中小学学生更快适应网络信息技术结合各个传统专业所产生的新知识。因此，近十年来信息化教学环境给中职学校带来的

期刊

构造函数法在高等数学竞赛中的应用

构造法是在高数的解题和证明中一种常用的方法,它是根据问题的已知,抓住内在隐含的联系,从而构造出函数,解决问题的方法。本文通过高数微积分竞赛中的实例,提出构造函数的一

期刊

构造法高等数学微积分竞赛

森林降水化学的变化特征和机理

研究并比较了湖南酸雨区韶山小集水区林内降水的化学特征,结果表明,与大气降水相比,穿冠水和地表穿透水中的富集的离子浓度除了NO 3-和Na+外均明显增加,到达地表的降水离子增

期刊

森林降水化学湖南酸雨大气污染Acid depositionChemical propertiesShaoshan forestHunan

宽带Fabry-Perot谐振腔天线及可重构技术在其中的应用

Fabry-Perot干涉仪于1899年由C.Fabry和A.Perot共同发明。它利用多光束干涉原理产生了半宽度很小的细锐条纹,具有极高的色分辨本领,能够精确地测量和控制光的频率和波长,因此

学位

Fabry-Perot谐振腔天线低剖面高增益宽带可重构

道教的承负观之我见

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

之我见

有机垃圾的处理和资源化技术进展

有机垃圾具有易腐烂、热值低、有机质含量丰富等特点 ,常规的填埋和焚烧难以妥善处理。文章在分析各类有机垃圾组成和特性的基础上 ,认为堆肥化处理、厌氧发酵和综合利用应是

期刊

有机垃圾好氧堆肥厌氧发酵综合利用

在创新中提高思想政治理论课教学质量——基于“毛泽东思想和中国特色社会主义理论体系概论”课的调查分析

思想政治理论课教学要关注“90后”大学生的心理意识和价值观念;要注重把教学内容和其所学的专业知识相融合,以问题意识引导教学,以专题形式开展教学,以分析典型案例助推教学

期刊

思想政治理论课调查教学

事业单位行政事务人员日常事务处理技巧浅析

随着社会的发展,时代的变迁,行政事务人员这个职位在事业单位中越来越受到重视,十分具有研究价值。文章以改进和提升行政事务人员的职业技能为目标,将自身工作经验有机地融入

期刊

行政事务人员事业单位日常事务处理

基于机器学习的双麦克风手机语音增强算法研究

其他学术论文