论文部分内容阅读
随着互联网的不断发展,各种互联网应用逐渐深入人们的生活。人们在使用互联网应用时的习惯和需求各不相同。因此,个性化逐渐成为了互联网推荐系统和广告展示需要考虑的重要因素。人们的行为习惯和偏好通常和个人的人格有关联,获取网络用户的人格可以进一步促进个性化应用的发展。传统的人格测量主要通过心理学研究人员对研究对象进行访谈或者让研究对象填写人格问卷来获取他们的人格数据。这些方法都需要大量的人工参与,难以进行大规模的用户人格测量,不适用于互联网环境。近年来社交网络迅速发展,用户在使用社交网络的过程中会产生大量的信息和行为数据。人们在网络上的行为和实际生活中的行为一样,与个人的人格息息相关。通过社交网络的数据进行人格自动化预测,可以高效地获取用户人格。本文对新浪微博进行研究,提取微博用户的用户特征和人格特征,建立预测模型,对微博用户人格进行分析预测,实验验证了模型的可行性。本文工作主要包括如下几点:(1)针对现有的社交网络用户人格预测研究通常仅考虑用户统计特征的问题,提出一种新的微博用户人格预测方法,对用户发布的微博文本进行深入分析,通过情感分析提取用户的情感特征。同时考虑用户网络关系特征和微博固有特征,提取微博用户特征集,并构建用户人格预测模型,实现了通过微博用户数据对用户人格进行自动化预测。(2)针对微博文本中包含大量的网络用语和表情符号,传统情感词典不适用于微博情感分析的问题,结合微博网络用语对传统情感词典进行扩展,同时构建微博表情符号词典。同时,本文结合中文语法特点,在传统情感词典的基础上加入否定词典和双重否定词典。通过改进后的情感词典对微博文本进行情感分析。(3)针对现有的用户人格预测研究通常仅考虑用户自身属性的问题,提出分析微博用户的网络关系特征,主要考虑用户与好友之间的相似度和和交互熟悉度。(4)针对人格预测不同的预测需求,提出建立连续预测模型和分类预测模型。在分析不同回归方法的基础上,提出采用多任务学习方法建立连续预测模型。采用支持向量机算法建立分类预测模型。