基于语义的引用内容情感分析及其应用研究

来源 :东北林业大学 | 被引量 : 2次 | 上传用户:cainong_111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
引文分析是科技评价与管理领域的一个重要研究议题。引用内容分析相较于传统的只考察被引频次的引文分析方法而言可以有效发现引用内容中的语义关联、情感倾向等有重要价值的引用信息,从而更加全面的判断引文的引用价值。但引用内容的情感分析不同于传统文本(如微博文本)的情感分类,引用内容中表达的情感大多为隐含的,这使得引用内容情感(尤其是负面情感)自动识别的准确率较低。随着引用内容分析研究的深入,结合引用内容生成单篇论文的科学摘要也逐渐受到研究者们的关注,其可从被引文献的应用角度阐明被引文献在科学社区中的贡献。但是,当前的引文摘要研究没有考察施引者的施引情感,使得生成的引文摘要带有一定的片面性。本文对引用内容的情感分类问题及基于施引情感的引文摘要生成问题进行了研究。通过捕捉施引者用以表达施引情感的话语模式,以提升引用内容情感分类的性能。在引用内容情感分类的基础上生成考察施引情感的逐面引文摘要,从而更好地阐述被引文献在科学社区中的贡献和价值。具体研究内容如下:(1)基于话语模式的引用内容情感分类研究。从引用内容的上下文语境中提取反映引用内容语义和结构特性的特征,将具有逻辑关系的特征进行组合以提取引用片段中的话语模式,捕捉施引者用以表达引用情感的隐含的语义结构。将提取出的话语模式连同其他有助于区分引用情感的特征相结合构成特征模板输入条件随机场(CRF)模型,同时引入否定范围特征以增强负面引用情感的识别准确率。基于构造的特征模板,利用CRF模型实现对引用内容隐含情感的自动分类。实验结果表明,考察引用片段中隐含的话语模式,有助于提升引用内容情感识别的性能。同时,对引用内容否定范围的界定,对识别负面的引用情感起到了积极的作用。(2)基于引用内容情感的引文摘要生成研究。在对引用片段进行引用情感分类的基础上,为目标文献的正面、负面和中性引文集合分别生成摘要,将各类情感的引文摘要合并形成目标文献的逐面摘要,以更清晰地阐述目标文献在科学社区中的贡献和价值。使用BERT预训练模型对引文片段进行处理,生成考虑引文片段上下文语义信息的文本向量。为了聚类时能够更合理的描述对象与类簇之间的隶属关系,使用基于柔性划分的Fuzzy-C-Means聚类算法对向量化后的引文片段进行归类。最后,使用LexRank与MMR相结合的方法选择摘要内容,以使最终生成的摘要内容兼顾重要性与多样性。实验结果表明,本文所使用的摘要算法在文本向量化表示、聚类、摘要内容选取三个方面都优于基线方法,从技术上全面提升了摘要生成的性能。同时,从摘要内容看,基于情感的逐面引文摘要相较于一般的引文摘要能更好地概括目标文献的优缺点,从而更有利于揭示目标文献的应用价值。
其他文献
我国的低渗透油藏分布范围广、储量丰富、开发潜力大,研究其开发技术对实现国内原油增产增储具有重要意义。低渗透油藏CO2驱相比于常规开采技术能够显著提高采收率,对低渗透
随着智能手机的普及以及互联网平台的不断增多,现今服务器后端经常面临着大量的高并发访问情况,服务器前端的处理速度和用户的访问量增长已经不成正比,为了用户的使用体验以及服务器端压力的缓解,必须在现今场景下研究一款高可用性的分布式缓存系统。它既使用户在使用APP等软件时能够及时得到系统的反馈而不至于超时,又可以使常用数据存储于缓存系统中来减少服务器的压力。所以一个维持高可用性的分布式缓存系统非常适用于现
本论文基于不饱和亚胺参与的反应以及二氢苯并呋喃的设计合成研究,主要研究内容如下:第一章 七元杂环化合物广泛存在于天然产物和药物分子中,含氮杂类化合物是七元杂环化合物
现如今,稀土元素在各个领域都得到了应用发展,如电子产品、新材料、新能源和石油化工等,早已成为世界瞩目的重要战略资源。但是,稀土资源是不可再生资源,当人们开采时,资源会
背景:纳米材料的生物毒性对人类健康构成了严重的威胁,其毒性越来越成为不可忽略的因素。因此我们需要一种简单而有效的方法来预测未知纳米颗粒的毒性。方法:在本文中,我们利
精子发生与成熟是影响哺乳动物繁殖效率的主要因素之一。睾丸曲细精管中,雄性生殖细胞经历一系列分化步骤及形态变化形成成熟的雄性配子,此过程通常伴随着表观修饰的调控。组
谷氨酸脱竣酶(Glutamate decarboxylase,GAD)能催化L-谷氨酸(或L-谷氨酸盐)生成γ—氨基丁酸,是微生物发酵法产γ-氨基丁酸的关键酶。γ-氨基丁酸在食品药品等领域具有很高的
论文主要研究底夸克偶素辐射衰变到粲夸克偶素J/Ψ加一个光子的过程。根据费曼规则,该过程树图的贡献来源于量子电动力学(QED)即:通过一个虚光子碎裂得到,但由于电磁耦合常数
强子谱是检验强相互作用基本理论—量子色动力学(QCD)的场所,也是认识强子内部结构的重要手段,因而强子谱是当今强子物理的最具挑战性的问题之一。QCD这个理论有三个基本特征
目的探讨保妇康栓联合克霉唑阴道片治疗外阴阴道假丝酵母菌病(以下简称VVC)的临床疗效及安全性,用以提高临床治疗VVC效果以及降低VVC的复发率。方法将临床上遇到的VVC患者116