基于语料库的歌声合成方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:shihaiquanhanhan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音处理技术有着广泛的应用领域,歌声合成是语音处理技术的一个新的应用领域。对歌声合成方法的研究在谱曲作词、唱片制作、娱乐等领域都有很大的应用价值,虽然国际上对歌声合成方法已有一定的研究,但针对普通话的歌声合成方法则开展得较少,同时由于比单纯的语音合成多了关于音调检测与变换方面的处理过程,因此具有一定的挑战性。针对一个实际的普通话歌声合成应用需求,本文力图在现有语音合成与歌声合成技术基础上,建立起一个具有较高合成质量的普通话歌声合成系统。首先,本文介绍了音频处理、语音及歌声合成方面的主要技术,以及基于语料库的歌声合成方法的体系结构。其次,本文详细给出了歌声合成语料库的预处理方法,在此基础上研究并实现了对歌声的音符自动切分、清浊音识别、音高识别等歌声预处理算法。第三,提出了一种基于自适应滤波器的歌声旋律调整算法。算法的核心部分是设计一个具有自适应能力的滤波器,将音频信号的每一个周期都准确的检测出来。接着利用Hanning窗来平滑,减少了调整后音频信号的噪音。本文设计并实现了该旋律自动调整系统,并将处理结果与已有的旋律调整算法进行了比较。实验结果表明,本文提出的旋律调整算法获得的音质要优于其它方法。最后,在上述算法基础上,针对本文对歌声合成的具体应用需求,设计了一个基于语料库的歌声合成算法,为了增加合成歌声的清晰度与流畅度,设计了压线与歌声音强平滑等后处理算法,并实现了一个基于给定旋律与歌词的歌声合成系统,该系统首先检测出给定旋律所对应的音高、音长,然后对歌词对应的歌声语料库进行旋律变换与歌声合成,最终输出合成后的歌声。为了对合成质量进行评估,本文将歌声合成的结果进行了主观评测,结果表明,歌声合成的结果是可以接受的,该系统可以用于日常的娱乐。
其他文献
网络技术的日新月异使网络几乎融入到了社会的各个方面,互联网成为实现信息收集处理、加强交流、提高工作生活效率和质量的重要方式。然而,网络的普及以及传输所倚仗的协议都
图像压缩是图像存储、传输的基础。原始图像数据存储空间较大,不利于存储、传输。为了减小图像数据的存储空间和通信带宽,实现数据实时处理、显示和传输,需要对原始图像进行
危险与可操作性(Hazard and Operability Analysis HAZOP)分析是一种广泛应用于化学流程工业的危险分析方法。为克服现有的HAZOP分析专家系统在“非常规”分析方面的局限性,
无线传感器网络由大量部署在感知区域进行信息采集的传感器节点组成。无线传感器网络的一个关键问题就是传感器节点的能源有限并且在一些应用中是不可恢复的。所以降低能量消
目前,医学图像三维重建技术获得了国内外医疗和图像处理领域广泛的关注。通过对人体器官或组织进行三维重建,能够更直观、更准确地重现对象的三维结构,辅助医生对病变体及其
随着计算机硬件技术的高速发展和计算机图形学研究的深入,光线跟踪渲染技术越来越得到人们的关注并且成为实时渲染和离线渲染研究的热点问题。动态场景的渲染及如何管理动态
随着计算机技术、通信技术和网络技术的飞速发展,计算机系统的安全性日益受到重视,访问控制作为一种重要的安全技术,已经渗透到操作系统、数据库、网络的各个方面。基于角色的访
信息技术的进一步飞速发展,对信息安全的各项领域提出了更高的要求。计算机硬件、并行计算等方面的发展,使得传统的RSA密码体制受到越来越多的威胁,人们逐渐转向优点众多的椭
建设信息化军队,打赢信息化战争是我军当前肩负的重要历史使命和多年以来确立的战略目标。当前军队搞信息化建设,没有现成的经验可循,只有脚踏实地,在经验中总结,在实践中摸
运动目标的检测和跟踪是计算机视觉、图像处理、模式识别等多领域共同研究的热门课题,近些年来已经取得的很多成果,被广泛地应用到军事导航、监控监视、医学诊断、视频检索等