基于ResNet-BLSTM的端到端语音识别

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:cnars
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度学习的端到端语音识别模型中,由于模型的输入采用固定长度的语音帧,造成时域信息和部分高频信息损失进而导致识别率不高、鲁棒性差等问题。针对上述问题,提出了一种基于残差网络与双向长短时记忆网络相结合的模型,该模型采用语谱图作为输入,同时在残差网络中设计并行卷积层,提取不同尺度的特征,然后进行特征融合,最后采用连接时序分类方法进行分类,实现一个端到端的语音识别模型。实验结果表明,该模型在Aishell-1语音集上字错误率相较于传统端到端模型的WER下降2.52%,且鲁棒性较好。
其他文献
由于国内对优质矿业项目和产品的需求不断增加,国内矿业企业纷纷走出国门,寻找并开发优质矿业资源,然而很多企业并没有掌握到境外矿业投资项目风险控制的核心技能,造成不断的
发端于欧美国家的景观体育赛事,自21世纪初登陆我国,受到了广大民众的关注与推崇。这种利用公共开放空间举行的新兴体育赛事,在体育赛事的组织管理方面与传统赛事相比,其组织管理
<正>支气管热成形术(BT)在非药物治疗难治性哮喘方面取得了令人瞩目的成就,其通过特殊导管电极在气道壁释放可转换为热能的射频能量,作用于支气管平滑肌细胞,以减少支气管平
基于空间位置的服务在个人安全、旅游、医疗、运输、公安、通信等领域应用广泛,极大程度满足了人们对信息消费的需求。人们在享受这种便捷性的同时,也对定位系统的精确度提出
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
仁者乐山,智者乐水,博取山水形意的山水盆景,一直以来都是中国盆景艺术长河中的潺潺中流。孤木写近景,丛林或水旱状中景,山水盆景则可移天缩地,横亘高远,以“一峰则太华千寻,
为减小实验误差,提高检测结果的精确度及准确性,评定菌落总数的不确定度。对样品中菌落总数不确定度的来源进行分析,通过建立测量模型,采用合成标准不确定度的方法,评定菌落
[目的]探讨针刺对2型糖尿病胰岛素抵抗的作用机制.[方法]采用2型糖尿病(NIDDM)大鼠模型,分为两组,观察组10只,以针刺治疗,取穴:中脘、曲池、合谷、足三里等.对照组10只,不做