【摘 要】
:
针对包含发音动作参数和情感语音的双模态汉语普通话数据库非常匮乏的问题,设计包含中性、高兴、愤怒及悲伤4种情感的普通话语音库。该语音库由10名被试录制的1 440段音频及
【机 构】
:
太原理工大学信息工程学院,忻州师范学院电子系
【基金项目】
:
国家自然科学基金(61371193);山西省研究生创新基金(2015BY24);山西省教育改革创新项目(J2016097)~~
论文部分内容阅读
针对包含发音动作参数和情感语音的双模态汉语普通话数据库非常匮乏的问题,设计包含中性、高兴、愤怒及悲伤4种情感的普通话语音库。该语音库由10名被试录制的1 440段音频及发音动作数据组成,文本长度有双音节词和句子两种类型。为了确保该数据库的有效性,邀请普通话较好、听力正常的10名评价者组成评价小组,对数据库内所有音频文件进行评价。根据评价小组评价结果结合发音动作数据的稳定性进行筛选,得到语音质量较好、发音动作参数稳定的双模态情感语音数据库。该数据库可用于开展情感语音的发音动作研究,进而单独或联合作为情感语音识别算法的样本数据,对情感语音识别率的提高具有积极的作用。
其他文献
目的探讨股静脉置管化疗非小细胞肺癌并发血栓形成的临床特征、诊断、治疗方法及效果。方法回顾分析我科2007年1月至2010年7月行股静脉置管化疗的非小细胞肺癌患者发生血栓的
学科教学在人才培养中发挥着核心作用,但是,由于升学压力的存在,使我国对智育重视的程度远远超过了德育,学科育人功能陷入困境。本文提出要统筹学科教学,整合育人功能,建设学
选取全球85个国家和地区,共计969个气象站点的1961—1990年的气象资料,以月最高温度的平均值、月最低温度的平均值、月平均温度、月平均降水量、日平均日照时数及各地海拔高
目的观察中年体检人群血尿酸水平与骨密度及骨代谢标记物的相关性,探讨尿酸在骨代谢中的可能作用。方法对214例中年(45~65岁)体检人群进行横断面研究,观察尿酸与骨密度及骨代
<正>重庆闹市中心古老的清真寺旁,坐落着重庆主城区唯一的民族小学——重庆精一民族小学。学校坚持"多元一体,惟精惟一"的办学理念,恪守"学如浩瀚,求其一精"的校训,百余年的
偏振成像的机理是偏振成像技术的理论基础。从菲涅尔公式、瑞利散射、物体表面纹理和光洁度等方面对偏振成像的机理进行了初步的研究。揭示了偏振成像机理很复杂且不唯一,并受
<正>在前面几期中,我们介绍了发生在太阳核心区里的太阳能量产生机制。这一机制不仅在理论上可行,而且经过对太阳中微子的细心探测,以及对太阳中微子问题的艰辛求解,在观测上
红薯是典型的高钾低钠食物,其膳食纤维含量很高,比看着有筋的大白菜高很多。而且,新鲜红薯的维生素C含量比西红柿、苹果的还要高一些。红心和黄心红薯含有淀粉、可溶性糖、维生
从企业的角度出发,对国外几个优秀中央政府门户网站的企业服务情况与中国作了比较分析,总结了国外中央政府门户网站企业服务的特点和优势,指出了中国中央政府门户网站企业服
美日等处于全球半导体产业链“头部”的国家在疫情中正表现出越来越明显的逆全球化趋向。据《华尔街日报》报道,美国政府正寻求与美国最大芯片制造商英特尔公司和台积电就在美