论文部分内容阅读
近年来,随着认知科学与人工智能的发展,跨领域融合的情感分析研究受到了越来越多的关注。情感表达一直以来都是人类沟通中重要的一环,如何帮助计算机更好地理解人类情感,是也人工智能发展中重要的组成部分。当前主流的NLP(Natural Language Processing)情感分析手段是借助于文本中带有主观性情感色彩的特征词向量对文本进行分析、归纳和推理。而本论文则提出了一种创新的分析手段——利用文本的感官语义表征来进行情感分析。认知科学与前沿心理学的相关研究指出,人类大脑皮层对感官信息进行处理的过程中会引起人们心理情感的变化,也就是说感官感受能够影响人们的情感。因此,本研究工作利用语言中的感官信息来提升文本的情感分析效果。本文首先借助了语言学中的声音符号词(Sound Symbolic Words,SSW),从词汇的音素中提取出蕴含情感倾向的感官信息。并通过验证融合感官特征的文本表征对情感分析的促进作用,得到这样一个结论:除视觉与听觉外,人工智能还可以从更多的感官渠道获取不同维度的信息,来帮助自身的认知发展。总观全文,本论文工作的重心和创新点体现在以下三个方面:第一、建立日语词汇的感官信息数据集:历时4个月,在位于日本电气通信大学信息工程系认知科学课题组的坂本真树教授实验室中,我们完成了320个日语拟声词在43个感官维度上的数据搜集实验。对数据清洗整理后,建立了词汇音素与感官信息的关联表,确定了从文本词汇中获取感官信息的可能性。第二、感官信息的提取与融合感官特征的文本表示:在上述实验数据的基础上,我们利用分类器构造出了适用于普通词汇的感官信息提取器,并基于该信息提取器建立了融合感官特征的创新词向量训练模型。这样,我们就能够获得融合感官特征的文本表征,并以此验证了感官特征对分类效果的有效性。第三、基于感官特征的情感分析模型:为了放大文本中感官信息的贡献作用,本文依次提出了三个创新型情感分析模型,三个优化模型分别采用了Attention机制、Multi-Head机制和CNN架构来适应融合感官特征的词向量。最终,通过将本文提出的基于CNN架构的Sense NN模型与当前主流的文本分类模型BERT做对比,证明了基于感官特征融合的情感分析模型的优异性。