【摘 要】
:
目前在自然语音合成中,合成语音的可懂度已经具有较高水平,但是合成的自然度和准确度仍有待提升,一方面是当前合成的语音听起来机器味比较重,缺乏节奏感,另一方面是对于有歧义的句子,不正确的短语划分和停顿导致听众对合成语音的理解出现偏差。因此在自然语音合成中,语言中韵律信息的检测,尤其是韵律短语边界的检测对改善语音合成质量有着重要意义。现阶段,在英语短语边界检测研究中,由于韵律特征不明显,使得短语边界尤其是中间短语边界的自动检测非常困难。因此,本文针对英语短语边界分类检测中存在的问题,分别从韵律特征提取和模型构建
论文部分内容阅读
目前在自然语音合成中,合成语音的可懂度已经具有较高水平,但是合成的自然度和准确度仍有待提升,一方面是当前合成的语音听起来机器味比较重,缺乏节奏感,另一方面是对于有歧义的句子,不正确的短语划分和停顿导致听众对合成语音的理解出现偏差。因此在自然语音合成中,语言中韵律信息的检测,尤其是韵律短语边界的检测对改善语音合成质量有着重要意义。现阶段,在英语短语边界检测研究中,由于韵律特征不明显,使得短语边界尤其是中间短语边界的自动检测非常困难。因此,本文针对英语短语边界分类检测中存在的问题,分别从韵律特征提取和模型构建两方面进行短语边界检测研究。
首先,本论文设计了英语短语边界检测系统的总体框架,构建了语音信号预处理、特征提取以及短语边界检测模型三个模块,并进行了初步的特征提取。
其次,针对元音类型对短语边界检测中元音时长特征的影响,在目前已有的元音时长特征基础上,提出了基于元音分类的归一化时长特征提取方法,并在特征提取过程中加入比例因子补偿说话人语速变化的问题。建模方法选用了长短期记忆(LSTM)神经网络进行短语边界检测。在实验中,通过比较不同特征集下检测的结果可知,在加入基于元音分类的归一化元音时长特征之后,LSTM模型在两个语料库BURSC和BURNC上的主短语边界检测的F-score分别提高了2.8%和6.3%,中间短语边界检测的F-score分别提升了4.9%和5.7%。
再次,考虑到元音上下文环境对元音时长的影响,提出基于固有元音特性的时长计算方法,更为准确地提取了元音时长特征。同时,模型构建方面在原有的LSTM检测模型中加入注意力机制用于增强有效特征的提取。实验结果表明,在加入新特征之后,基于LSTM模型的检测结果整体准确率提高了3.9%,并且在中间短语边界检测的F-score提升了11.1%。通过对比原有LSTM模型和改进后Att-LSTM模型的检测结果发现,Att-LSTM对边界检测的准确率提高了2.7%。
最后,对本论文中全部的工作内容进行了总结,并指出本文中有待解决和完善的方面以及下一步的工作方向。
其他文献
随着第5代(5G)移动通信的发展,无线中继技术也发挥了更加重要的作用,无线中继技术可以扩大无线通信的传输距离和提高通信业务的可靠性;随着绿色通信理念的提出,使得能量效率(EE,energy efficiency)成为无线中继系统的研究热点,特别是下行链路能量效率(DLEE,downlink transmission energy efficiency)。本文针对无线中继系统,开展了以提升系统的EE为目标的信息传输、功率优化等问题的研究,提出了相应的传输策略和功率优化方案,进一步实现绿色通信。本文主要做的研
作者简介:黄依婷(1990— ),女,汉族,江苏江阴人,硕士研究生。主要研究方向:工商管理。 摘 要:2020年新冠肺炎疫情在全球蔓延,我国传统外贸受到了严重冲击。但与此同时,跨境电商却释放出了巨大发展潜力,显示出其对外贸创新发展的引领作用,越来越多的传统外贸逐渐转型跨境电商。文章分析了江阴地区的传统外贸企业转型跨境电商过程中面临的问题,针对面临的问题,提出相应的分析和建议。 关键词:江阴;传
摘 要:随着修订后租赁准则的发布,建筑施工企业的日常租赁核算业务和运营流程管理发生了较大的变化,为了促使建筑施工企业能够快速适应不断变化的市场环境,文章首先对新租赁准则可能给建筑施工企业带来的变化进行了详细分析,并在此基础上讨论了租赁准则修订可能给建筑施工企业日常财务管理工作带来的影响,最后针对这些影响提出了相对应的措施,目的在于帮助我国建筑施工企业能够顺应时代的发展,借助新租赁准则的实施提高企业
作者简介:钟丹(1995— ),女,汉族,辽宁大石桥人,硕士研究生。主要研究方向:会计。 摘 要:行业发展、政策出台使光伏企业发展的风险与危机并存。本文通过因子分析构建财务绩效评价模型,对35家光伏企业财务绩效进行分析,分析光伏企业财务绩效存在的问题,并提出改进的建议,以提高光伏企业的财务绩效。 关键词:光伏企业;财务绩效;因子分析 全球变暖日益严重,应对全球气候变化已成为人类社会最大的共识
作者简介:雷艳(1982— ),女,汉族,陕西渭南人。主要研究方向:财务管理。 摘 要:衡量一个国家的经济发展水平的重要指标就是该国的制造业发展水平,目前全球提出了人类进入制造业发展4.0时代的概念,我国提出了“中国制造2025”的口号。制造业发展过程中一个永恒的主题就是制造业成本管控问题,如何对制造业成本进行有效的管控是各国所有制造业企业所面临的重大课题。文章对全球制造业成本会计的研究方法和发
作者简介:方旭(1989— ),女,汉族,辽宁阜新人。主要研究方向:高级会计。 摘 要:近些年,科技信息技术的飞速发展促进了会计工作的变革,使得财会工作发生了翻天覆地的变化,未来财务工作会向着会计信息化和会计电算化方向发展,这也是时代发展的必然趋势。财务工作中最为重要的内容就是财会信息,会计信息的准确性至关重要,通过信息化技术手段进行管理,就能够使得财务信息更加的精准。信息化的社会运用信息技术手
韵律是指人类语音所特有的节奏、语调和词汇重音模式。语调重音是重要的韵律特征之一,其正确的理解和表达不仅能够帮助计算机更好地理解自然语言,实现人和计算机之间的自然语言通信,还可以使语音合成中合成的语音听起来更自然,流畅,富有情感并极具表现力。此外韵律信息还可以助力训练计算机辅助发音训练系统,此系统可帮助外语学习者听说更地道的外语,满足学习者自主学习的需求。因此,语调重音的检测识别对于自然语言理解、语音合成和外语自主学习都具有重要意义。
目前对于语调重音检测的研究,主要存在如下问题:韵律特征提取方面
作者简介:吴碧霞(1981— ),女,汉族,广东云浮人。主要研究方向:财务管理。 摘 要:城投公司作为我国地方基础设施建设平台,承担着地方基础设施建设以及政府投融资任务,一般情况下不具备盈利性质,其盈利主要是通过地方政府补贴来实现,属于带有政府性质的特殊市场经营主体。目前,政府不能再直接为城投公司债务提供担保,城投公司面临着融资渠道狭窄问题,并且大多城投公司财务管理模式依旧采用传统管理模式,存在
近年来,无线通信系统的应用已经覆盖到人类生活的各个方面。移动性作为无线终端的本质属性,随着飞速发展的无线通信技术的不断进步而逐渐增强。数据传输的媒介也越发的开放,再考虑到无线网络构架的不稳定性,若要在具备上述特质的通信系统中实现安全、可靠的数据传输,是一件具有严峻挑战的事情。于是,人们越来越关注通信系统的底层安全问题,从而使得物理层安全成为通信安全研究的重要课题。物理层安全问题引起广泛关注的原因可以归结为两点,一方面随着计算机技术飞速发展与进步,量子计算机一种具有极强计算能力技术得以问世,从而使得基于密码
在无线通信中,多输入多输出(MIMO)的概念一提出,便引起巨大关注。作为新型的无线通信关键技术之一,具有显著增强分集增益,提高系统吞吐量、以及减少干扰的潜力。空间调制(Spatial Modulation,SM),是面向MIMO系统的一种空间复用技术。该技术最突出的优点,即可以完全避免信道间干扰,并且可以增加能量效率。SM要求每次只有一根天线被激活,剩余天线全部保持缄默,对空间资源造成了极大浪费。广义空间调制(Generalized Spatial Modulation,GSM),在每一个传输时隙内,多根