神经网络在语音质量客观评价应用中的研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:dragoncon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有语音质量主观评价存在费时、费力、费钱,灵活性不够,重复性和稳定性较差,受人的主观影响较大等缺点。为了克服主观评价的缺点,有必要寻求方便、快捷的客观评价方法。传统的音质客观评价判断模型用简单的数学形式难以体现听觉系统对语音的感知性状,于是本文采用接近于主观评价处理方式的神经网络系统模型,针对大词汇量汉语语音数据库,进行基于输入-输出方式、仅基于输出方式的语音质量客观评价;以及针对有限单词闭集汉语语音数据库,进行基于转移概率测度的语音质量可懂度客观评价;并对相关神经网络的结构、算法进行分析研究。传统的音质客观评价方法高度依赖于特征参数和失真测度,而且对信道干扰式样的增加很敏感;判断模型用简单的数学形式难以体现听觉系统对语音的感知性状。本文通过建立以径向基函数神经网络(RBFNN)为听觉判断模型的语音质量客观评价系统,有效地实现了从语音特征参数空间到人的听觉感知的非线性映射。RBF神经网络语音质量客观评价系统模型对特征参数的依赖性大大降低;而且在增加信道干扰式样的情况下,依然能取得高度相关的评价性能;评价结果性能比传统音质评价方法好;取得了跟主观评价MOS分值的高度相关性。但是训练建立一个RBFNN系统模型的时间代价较大。基于广义同余神经网络(GCNN)的语音质量客观评价系统模型,时间代价更小、音质评价性能更好。建立了基于GCNN的音质评价系统模型,除具有RBFNN系统模型的所有优势外,具有更简单的系统结构、更强的泛化性能、更高的主客观相关系数、更小的偏差和绝对误差,训练建立系统模型的时间代价节省约三分之一。总之,GCNN系统模型相比于RBFNN系统模型,无论在建模系统所需的时间方面,还是在语音质量评价的相关性能方面都具有明显的优势。提出了一种结构、算法更简单的递归神经网络——递归广义同余神经网络(RGCNN);并建立了基于递归广义同余神经网络的音质评价系统模型。从网络结构和调权算法两方面详细介绍了新提出的RGCNN,并总结了相比其它递归神经网络所具有的特点和优点;辨识仿真验证了RGCNN的有效性和收敛的快速性。为了体现语音信号的动态时变特性,考虑采用含有动力学性状的RGCNN,用于音质客观评价。通过建立基于RGCNN的语音质量客观评价系统模型,对连续语句语音和数字串话音进行基于输入-输出方式的音质客观评价,取得了理想的效果。提出了采用神经网络,对基于输出方式的语音质量进行客观评价的一种新方法——NN/OBQA。由于基于输入-输出方式的评价方法要求必须有原始输入语音、在时间上要求内同步的缺陷;尝试采用神经网络进行基于输出方式的语音质量客观评价。NN/OBQA音质客观评价方法仅对语音系统输出端的待测语音信号提取特征参数,然后通过神经网络完成特征参数到主观评价MOS分的非线性映射,其映射值即为仅依赖于输出的音质客观评价结果;其与主观评价MOS分之间达到高度相关。针对MOS分的音质评价研究已有不少,但对语音信息可懂度方面的音质评价研究,成果不多。本文针对有限闭集语音,探索设计了基于转移概率测度的可懂度评价原理;依照原理,提出了两种可懂度评价的具体方法:基于欧式距离转移概率测度的音质可懂度评价方法——EDTPM/ISQA和基于线性相关转移概率测度的音质可懂度评价方法——LCTPM/ISQA;提出了采用失真数据作为转移参考矩阵的思路方法,并详细分析了干净参考矩阵、失真参考矩阵的评价性能。对两种转移概率测度方法,采用干净参考矩阵、失真参考矩阵对语音质量成功地进行了可懂度评价;失真参考矩阵改善了客观可懂度评价结果与主观可懂度之间的相关性能。
其他文献
以党建统领工作全局,把党建优势转化为发展动力,今年以来,铜陵市国资委“四力”齐发,国资国企展现出了强劲发展势头.
目前,诸多无线接入技术,特别是无线网状网(Wireless Mesh Network,WMN)的进展为无线流媒体业务的推广奠定了基础。WMN具有可靠性高、网络扩展性好等优势,但其通信环境以及多
一、前言为了预测X100级高强度钢管材的性能及其在管道建设上应用的前景,由BG Technology, BP Amoco和Shell Global Solutions三家公司制订的工业性合作研究计划已经开始实施
胡雪岩是中国近代著名红顶商人,政治家,徽商代表人物.他曾官居二品,凭借卓越的商业才能,利用过手的官银在上海筹办私人钱庄,后在全国各地设立了“阜康”钱庄分号,被称为“活
目的:观察患者病情变化是护理工作者的基本功。方法:对患者病情进行全面调查研究的必要方法。结果:在护理工作中,观察具有一定的临床意义,与护理科研有着密切的关系,是病情观察在临
生态学、教育生态学、生态语言学为我们提供了分析跨文化外语教学的独特视角,跨文化外语教学是一个生态系统,它具有生命性、整体性、开放性、动态平衡性、共生性等生态特征,
压铸模是保证压铸件质量的重要工艺装备,它直接影响着压铸件的形状、尺寸、精度、表面质量等。设计压铸模时,必须全面分析压铸件的结构、了解压铸机及压铸工艺、掌握金属液的填
美丽的彩云之南是我们可爱的故乡秀丽的阳宗海畔是我们激烈的战场金马踏月,碧鸡报晓腾飞的海鸥展翅翱翔以优质的产品翱翔全球筑牢根基,抓好储备