论文部分内容阅读
随着社交网络的不断发展,以新浪微博、Twitter为主的微博类应用,以Facebook为主的社交类应用,以Instagram为主的图片分享类应用已经成为了人们生活中密不可分的部分。现实世界中的事件会引发社交网络中的一系列讨论,而社交网络中的舆论也会影响现实世界的发展。大量的社交应用以及大量的社交网络用户带来了海量的信息,这些信息一方面为用户提供了便利,另一方面也给用户带来了信息噪声的困扰。情感信息无疑是社交网络的各类信息当中最重要的信息之一,对于情感信息的研究对用户意图的理解,信息传播的引导都有着重要的理论意义与现实意义。对社交网络中情感信息的研究与利用面临着巨大的挑战。与传统的文本信息不同,社交网络具有短文本、噪声多、语义复杂、上下文信息少等特点,因此在分析方法上和传统的使用情感信息的方法有很多差异。尤其是针对实体层面的情感信息的应用存在着巨大的挑战。本文在现有研究的基础上,针对社交网络中基于实体的情感信息的用户画像方法和基于实体情感的信息传播进行了研究,主要研究和成果如下:(1)在用户画像方面,针对当前用户画像方法对于必要情感的缺失,加入了实体层面的情感信息对用户画像进行丰富。本文针对用户博文内容进行兴趣挖掘时,一方面基于现有的方法借助维基百科作为外部知识库进行实体的链接与概念树的构建,同时对之前实体层面情感分析的方法借助句法结构信息进行了优化,并将情感信息与实体概念树中的对应实体进行绑定。最终设计了网页应用用于展示构建的用户画像。(2)在基于实体的情感传播方面,我们注意到现有的关于传播行为的研究中并没有将实体情感作为一个可能影响用户转发行为的因素进行考虑,因此我们基于上面提到的用户画像提出了三种情感传播的模型假设:“求同”模型,“存异”模型和用户偏执模型。我们选用目前研究中效果好的特征集加上基于我们情感模型计算的相似度进行转发行为预测,效果相较有所提升,然后根据结果分析情感信息的分类效果,从而从侧面说明了情感信息对于用户转发行为是存在影响的。综上所述,本文研究了社交网络中的实体情感信息对于用户画像的丰富以及对于信息传播的影响,在真实数据集上证明了本文方法的有效性并验证了我们的猜想,对于用户意图理解以及信息传播具有重要的理论和应用价值。