论文部分内容阅读
基于计算机的发音质量自动评分技术近年来被广泛的研究和应用到实际的教学和考试当中。目前文本相关的发音质量评分技术已经相当成熟,达到了实用的水平,但是对于文本无关的发音质量评分技术的研究比较欠缺,还没有达到实际应用的水平,这主要受制于连续语音识别技术的发展。故本文旨在对文本无关的发音质量评分技术做一些探索性的研究。 在对连续语音识别和发音质量评分中的各种关键技术进行初步研究的基础之上,本文提出了一种文本无关双模型发音质量评分算法,用以评测文本无关类发音的质量。双模型的方法可以同时满足语音识别和语音评分对声学模型相互矛盾的要求。在双模型的框架下,使用最大似然线性回归和最大后验概率相结合的自适应方法改善了声学模型的语音识别性能;提出了改进的评分特征计算方法,以及对评分特征个性化调整的方案,提高了评分特征对于发音质量的描述能力;在评分特征融和映射阶段,运用分类与得分相结合的思想,提出了多元线性回归与多层感知器神经网络相结合的两级映射评分方法,提高了映射方法的准确性和稳定性。最终,通过这些改进的策略,使文本无关发音质量的机器分与专家人工分的相关度达到了0.675。