语音端点检测算法的研究及应用

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:a76s333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音端点检测(也称语音活动检测,Voice Activity Detection VAD)是指从混有噪声的语音信号中检测语音信息的存在与否。语音端点检测通常用于语音编码、语音增强等语音处理系统中,起到了降低语音编码速率、占用较少通信带宽、提高了移动设备使用效率、准确识别语音信息等作用。在语音信号分析中,首先要求对系统输入的含噪音信号进行判断,准确地找出信号中有用的信息段,减少信号处理的数据量,提高语音处理效率。传统的双门限法语音端点检测算法在无噪声污染的环境中检测准确度较高,但在实际的噪声环境中,尤其是低信噪比条件下,端点检测正确率较低。本文以不同语者性别信息为前提,对小波能量熵端点检测算法进行改进。实验数据表明,改进的小波能量熵算法有效的提高了端点检测的准确率。本文研究的主要内容和成果如下:1.本文提出了一种基于语音属性统计量的语音信号分析方法。已有的语音分析方法主要关注语音短时能量、短时过零率、基音周期、共振峰频率、Mel倒谱系数等特征,本文根据不同语者发音特性从短时能量方差、Mel倒谱距离方差、MFCC倒谱距离方差属性等方面进行多维度的语音信号分析。对从语音信号中提取到的239维数据,运用Relief[1]特征选择算法进行降维,建立合理的特征集合。实验表明,引入语音属性统计量后,语音信息识别准确率得到明显的提高。2.根据不同性别语者发音特性,引入模糊隶属度函数的概念,对语音信号的语者性别信息进行检测。由不同性别语者的基音频率变化曲线,建立了模糊隶属度函数模型,此模型可以对语者性别信息做出初步的判别。在分析语者性别模糊隶属度的基础上,对于不能准确识别语者性别信息的语音文件进一步采用决策树模型进行识别。实验表明,在低信噪比条件下,该混合模型对语者性别信息的识别有较大改进,识别效果较好。3.在准确识别语者性别信息的前提下,本文分析了小波算法和小波能量熵算法在语音端点检测应用中的优点与不足之处,并对小波能量熵算法从运算准确率方面进行了改进。最后,通过仿真实验运用改进的小波能量熵算法对含噪声的语音文件进行了测试与分析。实验数据表明,在不同噪声背景、信噪比为5db时,该算法能准确的检测出语音段和非语音段,显著地降低了信息丢失量,准确率有较大提高。
其他文献
香烟烟雾危害女性生殖健康,香烟烟雾的某些成分被育龄妇女吸收后会导致生育能力的下降甚至不育。研究发现香烟烟雾中含有很多有害物质,如尼古丁、苯、铅、多环芳烃等,能够引
随着经济社会的发展和市场经济的日益成熟,企业财务向管理会计转型已经是必然趋势。而且信息时代的财务管理也不再满足于单纯的流水记账,而是要求将财务管理的理念,融合到公
本文从"冷思考"立场出发,对翻转课堂面临的传统教学理论制约、教师信念欠缺、教师能力不足等困境及其成因进行系统分析,指出教师培训和认知的不完善、家庭和学校的相互制约是
目的分析进行血液成分采集时不同护理方式的效果。方法选取我站进行血液成分采集的60例人员作为研究对象随机分组,对照组进行常规护理,实验组进行全面护理,对比护理质量以及
<正>2013年11月27日,宁波跨境贸易电子商务进口试点业务正式启动试运行。截至2014年11月底,宁波跨境贸易电子商务进口业务累计消费者累计下单137.1万单,单证放行134.6万单,货
<正>现代信息技术的发展为语文教育提供了一个重要的载体和媒介,笔者从自身的教学实践出发,谈谈信息技术对高中语文教学所产生的积极影响。创设中生成,生成中感悟信息技术以
英国当代作家威廉·戈尔丁的名作《蝇王》最显著的艺术特色之一是其象征主义表现手法。本文从背景、人物形象及细节和道具三个方面的象征意蕴入手,隐喻性地揭示了人的善恶原
<正>广西北海市辖海城区、银海区、铁山港区和合浦县,23个乡镇、7个街道办事处、341个村委会、86个社区居委会,全市户籍人口174.3万人,其中北海市常住人口164.37万人。全市城
目的探讨系统化的综合护理措施在体外冲击波碎石治疗尿路结石中应用效果。方法 62例行体外冲击波碎石治疗的尿路结石患者根据随机数字表法分为观察组与对照组两组各31例。对
<正>最近读谢熊猫君翻译的《为什么最近有很多名人,如比尔·盖茨、马斯克、霍金等,让人们警惕人工智能?》一文,心情非常复杂,一方面期待人工智能为生活带来更多的便利,另一方
期刊