基于Transformer的生成式文本摘要模型研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:xibao774313066
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
任务旨在从文档中生成一段简短的、连贯的并保留源文本关键信息的自然语言摘要。不同于传统的抽取式文本摘要,生成式文本摘要是对源文本的内容加以抽象化的理解,然后再重新生成一段摘要文本。目前主流的方法都是将神经网络模型应用到生成式文本摘要中,这些方法一般使用序列到序列的框架来构建文本摘要模型,且这些模型通常都引入了一些优化组件来解决生成式文本摘要的袋外词、重复词等问题,例如使用指针生成器结构,覆盖率机制和拷贝机制等。这些优化组件实际上都是在模拟人类进行总结文本摘要的过程,从而去优化模型的摘要生成效果。本文提出的生成式文本摘要模型不同于主流基于序列到序列的模型,它是直接将文本摘要任务看作是一种语言建模问题。论文模型将输入和输出文本串连到一个联合序列中,然后使用一个公共的Transformer作为编码器对这个联合序列进行编码,最终形成的是一个语言模型来进行文本摘要任务。通过这种方法,还可以将基于Transformer的预训练语言模型来初始化文本摘要模型的参数,从而使得文本摘要模型能够利用大规模语料训练出来的语言模型的强大文本表示能力。此外,模型还使用了两阶段的训练任务,包括微调训练和终端任务训练。微调训练是使用文本摘要任务相关的语料库来对预训练语言模型进行训练,而终端任务训练则是针对最终的文本摘要模型进行训练,使模型能够预测新数据并生成摘要。两阶段训练的结合使得预训练语言模型能够更加适应文本摘要任务,对于文本摘要模型来说也可以学习到更深层的文本语义信息。本文的模型使用大型中文文本摘要数据集LCSTS来进行模型训练和测试,通过在此数据集上进行实验和评测,得出的ROUGE评测结果表明模型效果达到了最前沿水平,且生成的摘要结果所包含主题信息的丰富程度非常高,摘要语句也有非常好的连贯性。
其他文献
2020年初,为了打赢疫情防控阻击战,各省市中小学春季开学延迟到了五月份,为了响应教育部“停课不停学”的号召,学生开始了线上学习.由于疫情的突发性,以及没有可以借鉴的成熟的教学模式,老师们只能是赶鸭子上架,边教边学边实验,虽然线上教学取得了一些成绩,但学生的线上学习效果并不理想.疫情发生之后,增强学生的线上学习效果是数学教育工作者们关注的热点问题.我们需要一方面深度分析学生的线上学习实际,另一方面
高精密度光纤工艺在线测量在光纤器件制造过程中起到重要作用,测量精度决定着高功率光纤激光器的制造功率上限和光纤传感器的制造精度。传统的方法然而传统的方法存在测量精度低、测量种类少和测量速度慢等问题,因此如何对光纤工艺进行快速准确的测量成为了一个国内外关注的热点。针对传统方法的不足,本文结合图像处理技术,设计并实现了一种光纤工艺测量装置,提高了光纤工艺的测量精度、测量范围和测量速度。本文主要工作是开发
学位
石墨烯和Cu增强Al基复合材料均具有电导率高、强度高的特点,是很有发展前景的电缆材料。但它们在制备过程中易生成金属间化合物且材料的均匀性差,这限制了其的广泛应用。针对上述问题,本论文以石墨烯和Cu增强Al基复合材料为研究对象,分别采用机械搅拌法、化学法和球磨法制备混合粉末,再采用SPS技术烧结成形,研究关键工艺参数对复合材料的组织结构及性能的影响。对于Cu增强Al基复合材料,混粉方式、Cu粉粒径和
随着“一带一路”倡议的提出及“亚投行”等战略的稳步推进,我国与世界其他国家之间的经济、文化交流更加频繁。来自世界各地在华从事文化交流、商务活动、教育合作的外籍人员不断增多,会议口译变得愈加频繁。口译员已经成为对外合作交流不可或缺的角色,与此同时,对于口译工作人员整体素质要求也在不断升级:口译员在具备翻译语言能力和水平的基础上,还应充分考虑目的语听众的文化背景及接受能力,以达到更高水平的翻译效果。该
命名实体识别是指识别出文本中存在的命名实体并对其进行标注,其应用范围广泛,是信息抽取、机器翻译和知识图谱等诸多任务的重要技术根基。如何利用深度学习技术从中文文本中自动、准确、快速地识别出命名实体,具有重大的研究价值和实践意义。首先详细介绍了Bi LSTM-CRF框架的原理和存在的局限性。目前基于字符向量的Bi LSTM-CRF模型成为主流方法,但在文本表示、特征提取、模型训练效率等方面存在局限性。
学位
电网系统中高压并联电抗器、电力变压器等大型电力设备在运行时由于电磁力的影响会持续不断地进行低频振动,发出低频振动噪声。经过长时间持续不断地运行,电力设备内部会逐渐出现机械故障,随着时间推移,故障程度越来越重,很容易引起局部短路,引发火灾、大面积停电等事故。因此,研发针对电力设备的便携式检测设备,在电力设备的故障初期及时发现电力设备内部潜在的故障,具有十分重要的现实意义。本文设计并实现了一个电力设备
相较于传统的频率合成器,直接数字频率合成器(DDS)具有频率分辨率高、跳频速度快、相位噪声较好等优势。但是,作为一种数字化频率合成技术,DDS的杂散特性较差,这是制约DDS性能的主要因素。近年来,国内外学者针对DDS的杂散理论和杂散抑制技术进行了大量研究,大大提高了DDS的杂散性能。本文将采样-零阶保持模型从理想DDS频谱分析引入到相位截断杂散的分析中来,拓展了其应用范围,有助于简单、直观地分析实
目的:1、研究迷走右锁骨下动脉合并B型主动脉综合征的发病率2、研究TEVAR及联合体外开窗技术、烟囱技术、血管搭桥等技术治疗迷走右锁骨下动脉的手术效果。3、研究迷走右锁骨下动脉在脑血管及上肢血运中的作用。方法:采用病例资料回顾性研究,调取华中科技大学附属同济医院心脏大血管外科2013年1月至2019年6收治的3542个病例主动脉夹层病例,收集到合并迷走右锁骨下动脉合并B型主动脉夹层患者共29例,对