语音识别场景下的生成式短文本自动摘要方法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:LittleCam
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和移动通信技术的不断发展,我们所面临的信息过载问题也日益严重,而文本自动摘要技术作为有效解决该问题的方法之一,一直以来都是自然语言处理领域的研究热点。目前,语音识别和自然语言处理联系紧密,而经过语音识别系统输出的文本也会面临各种各样的自然语言处理任务。因此,本文研究一种语音识别场景下的生成式短文本自动摘要方法,以探究文本自动摘要技术在复杂场景下的可行性。
  本论文的研究内容分为了两部分:基于ASR的文本预处理和基于ASR的文本自动摘要。第一部分旨在对语音识别后的文本进行预处理,并将其独立为一种通用的文本预处理技术,以供包括文本自动摘要在内的多种自然语言处理任务使用。这一部分着重研究了中文分词、词性标注和标点预测这三个子任务,提出了一种能够同时完成这三个任务的方法,并且采用多个流行的序列标注模型进行对比。第二部分旨在采用生成式的方法来根据预处理后的文本生成高质量的摘要,并且验证第一部分中的文本预处理操作的必要性。本文在Transformer模型的基础上添加了Pointer-Generator网络以及LVT机制,然后也尝试添加了词性标注特征,并且针对所有模型都分别采用了以字符和单词作为基本编码单元来进行对比。
  实验结果表明,文本预处理部分中综合中文分词、词性标注和标点预测这三个任务于一体来同时完成的方法,对于标点预测任务相对有较大精度损失,而对于其他两个任务影响较小。对于这三个任务来说,基于双向LSTM网络添加SelfAttention机制后,其表现优于双向LSTM结合CRF这一经典的序列标注模型。文本自动摘要部分以Transformer模型为基准,通过实验证明采用单词做为基本编码单元的模型表现均优于以字符为基本编码单元的模型。并且,在基于词编码的Transformer模型的基础上添加Pointer-Generator网络和LVT机制后,取得了LCSTS数据集上目前以来最佳的测试效果。
其他文献
本文主要研究基于采样数据的事件驱动系统及其应用。首先基于推广的连续离散分析方法给出了在不同通讯条件下保证事件驱动系统指数稳定的充分条件,而后分别将其应用到一类本质非线性系统的输出反馈控制,一类多输出非线性系统的观测器设计以及多智能体系统分布式优化等问题中。主要工作可以总结如下:  第一章介绍了课题的研究背景。分别说明了事件驱动控制,输出函数未知的非线性系统镇定问题,非线性观测器设计及分布式优化与控
四旋翼飞行器是一种结构简单、体积较小、易于操控、能够垂直起降的无人航空器,它凭借着这些优点被广泛应用于民用和军事领域。四旋翼无人机能够稳定飞行需要依靠它的飞行控制系统,因此对飞控系统的研究具有重要意义。对于这个欠驱动、多变量、强耦合的非线性系统,可能还会受到各种环境因素的影响,提高四旋翼控制系统的稳定性、鲁棒性和抗扰性是很有必要的。本文基于自抗扰控制技术,设计了四旋翼姿态和位置的自抗扰控制器,实现
中医在我国医疗体系处于重要地位,几千年来为民族繁荣和人民健康做出了巨大贡献,特别在最近的新冠疫情(COVID-19)中,中医诊疗技术发挥了重要作用。在“人工智能+”的大背景下,智能中医技术的研究能为中医打开智能化发展的新格局。中医知识体系庞大且错综复杂,医师严重依赖大量临床经验。将中医知识库融合多源体征信息,嵌入中医领域知识,再进行全过程高效、客观的健康管理是智能中医研发的必然趋势。  本文的研究
学位
本文探讨了生命科学领域的一个热点问题—-疾病标志物识别,并且采用计算机科学领域网络分析方法解决该问题,这种交叉研究使其在理论和应用层面上都具有巨大的研究价值和科学意义。生物体是存储并加工信息的复杂系统,而该系统的核心是其组成成分准确地行使各自的功能并且相互协调合作,疾病的产生和发展往往是分子之间调控机制异常导致的,因此,设计有效的数学分析方法发现疾病相关的分子调控机理(疾病标志物),对疾病深入了解
视图合成作为计算机视觉领域的一项热门的研究,在虚拟现实、场景三维展示、2D视频转3D视频等领域应用广泛,为传统的图像和视频媒体提供了更为生动的信息展示方式。作为其中的关键性技术,深度估计为视图合成提供了场景的几何信息和从已知视图中采样的依据,其质量直接决定了视图合成的效果。  传统的基于多视图立体几何的深度估计方法依赖于特征点匹配算法,在真实世界中复杂的自然场景下拍摄的图片经常会出现光照不一致或者
学位