论文部分内容阅读
综观语言合成技术的研究已有二百多年的历史,但是真正有实用意义的近代语音合成技术是随着计算机技术和数字信号处理技术的发展而发展起来的,主要是让计算机能够产生高清晰度、高自然度的连续语音。近几十年来国际和国内的研究主要集中在按规则文语转换,即将书面语言转换成口头语言。基于语音数据库的语音合成方法有望进一步提高语音合成的自然度。 因为这是一种采用自然语音波形直接拼接的方法,进行拼接的语音单元是从一个预先录下的自然语音数据库中挑选出来的,因此有可能最大限度地保留语音的自然度。但由此产生了一系列新的需要研究的问题,包括:如何确定语音合成的基元,根据什么准则去挑选合适的基元;韵律参数定量化问题,对数据库进行定标问题;以及如何将统计的方法和规则方法相结合使机器能自动发现和找出所需的语音单元,保证最高的合成语句自然度等等。 本文研究了一种新型的、嵌入式的中文电子阅读器。该中文电子阅读器,充分利用了数字信号处理器一DSP的实时处理图象、实时处理声音的能力。它包含了高集成度的图象传感器模块和语音合成模块。可以实时的扫描图象,将图象中的文字识别出来,并转换成声音。详细设计了此阅读器中的语音合成部分的硬件电路和一些重要的接口驱动程序。着重研究了语音合成原理和方法。为了满足提高合成语音的自然度,丰富合成语音的表现力,降低语音合成技术的复杂度等要求。对常用的TD—PSOLA合成方法进行改进,采用数据挖掘算法对韵律参数进行预测,提高了语音合成的质量。利用聚类的方法,对计算机上的语音合成系统的大语料库进行了裁减,满足便携式阅读系统的要求。最后研制出一个完整的阅读样机,可以验证语音合成的效果。