语音转换中声道谱参数变换算法的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:edwardlj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换技术就是指在维持说话人语言内容不变的情况下,将源说话人声音的个性特征进行转化,使得变换后的语音更贴近目标人语音。语音转换技术属于语音信号处理衍生出来的一个研究方向,语音转换与语音信号分析、识别和合成等研究方向有着密不可分的联系且相互之间促进发展,还有许多实际应用如文语转换、制作影视作品配音、医学领域等等。本文重点研究以下内容:(1)对语音转换系统中各个部分的作用进行讨论;主要针对声道谱特征参数这一特征的转换进行研究并且依此介绍许多经典转换模型,如矢量量化、高斯混合、线性多变量回归、人工神经网络等等。(2)径向基函数神经网络常被用作转换模型,该神经网络的核函数参数通常采纳K-均值聚类进行训练,由于此方法具有一些缺点如收敛速度慢、容易落入局部最优中、泛化能力不强等。本文提出改进粒子群算法优化径向基函数的方法来提高此网络的性能,以便于更准确的获得源说话人与目标人之间谱包络的映射关系并研究其在语音转换系统中起到的作用。实验成果表明,本文提出的转换方案能够有效提升神经网络的性能,使转换后的语音更接近于目标语音。(3)常规语音转换系统中声道谱特征参数都根据单一的径向基函数神经网络规则进行转换,这样很难匹配所有的特征参数,使得转换语音的质量有所下降。为了改善上述情况,本文提出自组织特征映射与改进粒子群优化径向基函数神经网络联合转换声道谱特征参数,利用自组织特征映射良好的分类能力建立多转换规则。通过主观和客观的评价:这种多类别映射规则可以提升转换的精确度,使得语音信号的质量得到提升。
其他文献
目的:通过检测Id-1、MVD、ER在子宫内膜癌中的表达,探讨三者在子宫内膜癌发生、发展中的作用及意义。方法:采用免疫组织化学SP法检测30例正常子宫内膜、15例子宫内膜复杂性增
<正> 1977年5月间,省蚕茶研究所五·七中学孙宪老师热情地向我馆反映,他与学生一道在其学校的后山一带采集到一批石器和大量陶片,证实孙老师发现文物的地点是两处古文化遗址
期刊
近30年来,人们对ARDS进行了广泛深入的研究,但是其在危重病人中的发病率与死亡率仍居高不下。ARDS的相关因素诸多,流行病学调查对ARDS的研究相当重要,可为研究者提供重要的
<正>前文有专家为各位读者朋友介绍了一些中药面膜的基本知识,本文将奉献一大波美容面膜,其中必有一款适合你。怎样选适合自己的中药面膜,这是很多人非常关注的问题,需要告诫
植物内生真菌与宿主植物长期互惠共生,能够产生与宿主相同或相似的化学成分。它们在植物内广泛存在,并且表现出丰富的物种和代谢产物多样性,可以认为是在医药、农业等相关领
【正】 前著《〈庄子〉校读札记》发表于《天津师大学报》1990年第2期,今再就其杂篇各篇续记数条于下:
阿拉伯国名的来历江于编译一个国家名称的演变通常是历史学家们喜欢探讨的课题,因为这有助于人们了解这个国家的文化渊源和历史变迁。在中世纪,阿拉伯国家分为马什里克(Mashriq)地区国家
目的:细丝蛋白A(filamin A, FLNa)属于非肌性肌动蛋白结合蛋白,是一种主要分布在细胞质的大分子蛋白质,起初被认为能够绑束纤维状肌动蛋白,并可以诱使其形成强有力的立体肌动
毛泽东在革命战争和国防建设的实践中,坚持实事求是的精神,根据国内外政治形势、作战对手变化、敌我力量对比、我军的作战能力和任务以及战争形势的发展,辩证地看待阵地战这
雷达接收机中射频通道的热噪声系数是衡量雷达接收机工作性能的主要技术指标。本文基于的原理设计了一款中频雷达接收机噪声系数测试仪,设计并实现了固态、低噪声场放、本振