论文部分内容阅读
随着互联网通讯的高速发展,在网络通讯中利用表情符号来表达情感的用户越来越多,而针对表情的推荐系统也逐渐成为聊天软件的重要功能。目前的表情推荐方法主要是基于人工为表情符号标注文字信息,并通过标注信息的文本检索来达到推荐的目的,这样的推荐效果非常有限。为解决这一问题,本文提出了利用卷积神经网络和知识图谱技术相结合的表情推荐方法,能够为用户智能地推荐与用户所写文本语义相关的表情,并通过用户选择的表情,利用知识图谱深入挖掘其意义和深层联系,从而推荐更多语义相关的表情。这些都是目前基于文本检索的主流方法所无法做到的。本文以微博文本内容与表情符号为研究对象,以从网络中收集到的带有表情的微博为数据集,目的是研究能够为用户基于文本内容推荐表情,以及能根据已有表情推荐意义相关表情的方法。本文主要分为两个部分:基于卷积神经网络的文本情感分析算法,基于知识图谱的表情推荐方法。在情感分析的部分,本文首先对数据集做预处理,清除了噪声,并将微博文本构建成有监督训练集。之后对训练集进行基于词向量的表示学习,使其转换成能够被神经网络学习的向量数据。现有的文本情感分析模型通常将文本分为“喜、怒、哀、乐”四类,这对微博文本来说显然不够细化与全面,本文参考心理学设置了“爱、悲伤、惊奇、无奈、生气、喜悦、阴险”七个情感类别,构建了卷积神经网络对文本进行情感分析。本文改进了经典卷积神经网络LeNet,增加了网络深度以增强其学习能力,并调整了输入层结构使其适用于微博文本的数据集,从而达到对微博短文本精确分类的效果。在表情推荐的部分,本文用统计学的方法抽取了微博中的情感实体(主要是能够表达情绪的词汇),用点互信息和词向量相似度结合的方法抽取了实体关系,将表情符号作为情感实体的属性,用点互信息的方法抽取了实体属性,并利用以上技术构建了情感知识图谱。最后将情感分类模型和知识图谱相结合,根据用户输入文本以及所选表情进行深度表情推荐。