基于语音技术的学前儿童言语功能自动评估系统研究

来源 :中国科学院大学(中国科学院深圳先进技术研究院) | 被引量 : 0次 | 上传用户:askkwr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
言语障碍通常指的是包括语言能力、说话能力和听觉等沟通问题的总称。在我国儿童群体中,言语障碍的发病率较高,且研究表明,言语障碍对儿童的健康成长影响很大,容易对儿童认知功能的发展和心理发育造成影响,进而出现情绪和行为上的问题。但同时有很多研究表明,在言语障碍中占比最高的功能性构音障碍儿童在言语获得的早期经过及时的干预和治疗后,可以取得很大改善甚至完全康复,故对学前儿童言语功能做综合客观评估至关重要,可为患儿创造及时确诊的机会,以便采取有针对性的策略进行干预和康复治疗。本论文主要研究针对学前儿童的言语功能自动评估系统。该系统基于语音识别和语音信号处理技术,对儿童言语系统的构音功能和发声功能进行可靠、便捷、实时的综合评估。同时,评估系统基于语音识别技术,且研究表明,基于语音识别的言语自动评估系统性能与语音识别系统本身高度相关。因此,本系统还根据中文儿童发音的特点,分析了Pitch特征、语速扰动、音量扰动对儿童语音识别性能影响,并进一步分析这些因素对言语功能自动评估系统的影响。最后,还基于声强检测和基频检测算法对正常儿童和构音障碍儿童语音的声强和基频分布做统计分析。通过实验发现,增加Pitch特征提升了学前儿童ASR系统的性能,在不同测试集上字错率均有下降。对于评估系统的影响,该因素虽然改变了GOP阈值与相关系数的关系曲线,但并没有提升构音清晰度评估相关系数的峰值。在测试集与训练集匹配的情况下,在模型训练中增加语速扰动和音量扰动均在一定程度上提升了儿童语音识别系统的识别率。而在测试集与训练集不匹配的情况下,如功能性构音障碍儿童测试集,语速扰动训练后的声学模型识别正确率更低,而音量扰动训练后的声学模型识别正确率显著增高。对于评估系统而言,两个扰动因素的影响刚好相反,在基线模型基础上,语速扰动因素使构音清晰度评估相关系数显著提升,而音量扰动因素则使构音清晰度评估系统性能明显下降。为分析学前儿童的构音清晰度与声母和韵母的关系,我们单独基于声母和韵母来评估儿童的构音清晰度,发现学前儿童的构音清晰度更多的反映在声母的发音上。更进一步,我们统计和分析人工标注和自动评估的音素错误率,发现两者在复韵母和声母上具有显著的相关性,可作为构音清晰度的客观评估工具。最后,对正常儿童与构音障碍儿童发音的韵母持续时长、声强和基频按年龄与性别统计发现,构音障碍儿童比正常儿童的单韵母持续时间更长,同一性别和年龄的两组儿童在声强和基频上存在显著性差异,但这种差异并不一致。而且,构音障碍儿童在这三个统计数据的分布上比正常儿童更加分散,存在较大的个体间差异。
其他文献
兔为草食动物,采食的很多青饲料亦是中药,既有营养,又能防病治病,长期使用不产生抗药性,无副作用,可根据季节和兔群健康状况就地选择采用.
为解决隔膜泵中单曲轴渐开线花键的加工问题,对"5330"滚齿机进行改造、调整和提精。通过大修恢复了该机床的各项几何精度,尤其对分度蜗轮副进行了"两珩、两研、三跑合"和跑珩、跑
学会学习是小学数学学生发展的核心素养之一。本文从树立正确的学习观出发,探讨培养学生学会学习小学数学的具体路径。
如何将传统的管理模式转变为现代化管理,是当代科技发展对科研管理提出的新要求,本文通过分析企业科技项目的特点,阐述了科技项目管理在企业发展中的重要性,并对沈冶机械科技
打造能源革命排头兵,为什么是“山西”?$$9月1日,国务院印发的《关于支持山西省进一步深化改革促进资源型经济转型发展的意见》,是党中央、国务院为山西转型发展做好的又一次顶层
报纸
自首制度是一项重要的刑罚裁量制度,我国刑法第67条第对自首进行了比较原则的规定。但在检察机关对自首认定的实践中,新情况、新类型犯罪层出不穷,导致仅凭刑法的原则性规定,