论文部分内容阅读
随着社交媒体平台的快速发展,网络用户得以随时浏览新闻报道,并发表和交流自己的观点与情感。因此,文本情感分析吸引了世界范围内的研究关注。但文本情感分析通常只对文本做出正负面极性分析,缺乏对文本针对特定主题的立场倾向分析能力,而且这恰恰是大量实际应用中用户真正关注的内容。因此,社交媒体文本立场分析研究具有巨大的科学价值与商业价值。文本立场分析目的是分析并判断文本包含的针对特定话题所持有的立场,即支持、反对以及中立。现有的研究主要包括基于机器学习的方法和基于深度学习的方法。基于机器学习的方法通常依赖于人工特征构造和筛选,但构造特征的过程往往消耗大量的人力;基于深度学习的方法通过端到端的构造过程避免了繁琐的特征工程,但往往缺乏对文本交互过程的深层建模能力。此外,受到数据集规模偏小的影响,单一模型的学习能力往往存在一定的限制。为此,本文研究结合注意力机制和多任务对抗学习的文本立场分析方法。为学习交互文本中立场相关的深层语义表示,本文首先研究基于双向长短时记忆网络的文本立场分析方法。在此基础上,进一步引入了注意力机制和匹配(Match)机制以解决文本之间长度差距过大的问题,并突出关键匹配对立场分析的权重。在Fake News Challenge2017比赛官方数据集的实验结果表明,相对于采用特征工程和集成模型等评测方法,上述方法取得与评测最佳系统相近的F1Average同时,Score值提升了0.2。针对文本立场分析任务数据集规模较小导致单一模型学习能力存在限制的问题,本文研究了基于多任务对抗学习的立场分析方法。该方法首先通过多任务学习机制,将立场分析作为主任务,阅读理解任务作为辅助任务构造多任务学习框架。针对多任务学习参数共享过程中存在噪音的问题,引入对抗训练机制,降低特征空间之间的交叉程度,以提高分类性能。实验结果表明,通过引入多任务对抗学习机制,F1Average提升0.05,Score值进一步提升0.7,达到了目前已知的最好性能,显示了本文提出的结合注意力机制和多任务对抗学习的文本立场分析方法的有效性。