基于用户情感和网络关系分析的人格预测模型

来源 :东华大学 | 被引量 : 5次 | 上传用户:gmwang2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断发展,各种互联网应用逐渐深入人们的生活。人们在使用互联网应用时的习惯和需求各不相同。因此,个性化逐渐成为了互联网推荐系统和广告展示需要考虑的重要因素。人们的行为习惯和偏好通常和个人的人格有关联,获取网络用户的人格可以进一步促进个性化应用的发展。传统的人格测量主要通过心理学研究人员对研究对象进行访谈或者让研究对象填写人格问卷来获取他们的人格数据。这些方法都需要大量的人工参与,难以进行大规模的用户人格测量,不适用于互联网环境。近年来社交网络迅速发展,用户在使用社交网络的过程中会产生大量的信息和行为数据。人们在网络上的行为和实际生活中的行为一样,与个人的人格息息相关。通过社交网络的数据进行人格自动化预测,可以高效地获取用户人格。本文对新浪微博进行研究,提取微博用户的用户特征和人格特征,建立预测模型,对微博用户人格进行分析预测,实验验证了模型的可行性。本文工作主要包括如下几点:(1)针对现有的社交网络用户人格预测研究通常仅考虑用户统计特征的问题,提出一种新的微博用户人格预测方法,对用户发布的微博文本进行深入分析,通过情感分析提取用户的情感特征。同时考虑用户网络关系特征和微博固有特征,提取微博用户特征集,并构建用户人格预测模型,实现了通过微博用户数据对用户人格进行自动化预测。(2)针对微博文本中包含大量的网络用语和表情符号,传统情感词典不适用于微博情感分析的问题,结合微博网络用语对传统情感词典进行扩展,同时构建微博表情符号词典。同时,本文结合中文语法特点,在传统情感词典的基础上加入否定词典和双重否定词典。通过改进后的情感词典对微博文本进行情感分析。(3)针对现有的用户人格预测研究通常仅考虑用户自身属性的问题,提出分析微博用户的网络关系特征,主要考虑用户与好友之间的相似度和和交互熟悉度。(4)针对人格预测不同的预测需求,提出建立连续预测模型和分类预测模型。在分析不同回归方法的基础上,提出采用多任务学习方法建立连续预测模型。采用支持向量机算法建立分类预测模型。
其他文献
随着计算机网络技术与多媒体技术的发展,远程教育已经成为改革开放传统教育模式的强大动力和有效手段。它突破传统学校教育方式的时空束缚,与课堂教育、广播教育、电视教育共
随着互联网的快速发展和网络技术的不断进步,一种基于移动Agent的分布式计算模式成为研究的重点。现阶段移动Agent系统并没有完善的安全保障机制。因此,安全性不足阻碍了移动
为了应对客户需求和相关政策的经常变化,提高市场竞争力,企业需要经常修改业务流程,这将耗费大量的资金、人力和物力。业务流程局部的修改会涉及到整个业务流程的配置,不合理的变
人脸识别因其在安全验证系统、信用卡验证、医学、档案管理、视频会议、人机交互、公安系统(罪犯识别等)等方面的巨大应用前景而越来越成为当前模式识别和人工智能领域的一个
对训练数据的建模是机器学习中的一个核心问题,本文将数据建模的两种经典方法——流形学习与统计学习作了结合,相互取长补短。在我们之前一些相关工作的基础之上,本文基于黎
随着卫星传感器质量和数量的不断保证,针对多光谱遥感图像的分类研究理论论证不断增加,相对于传统的遥感影像,多光谱遥感图像的波段信息丰富,空间信息明显充实。传统分类方法并不能很好反映多光谱遥感图像精准的地物特征,不能完善地物特征的分类。为了避免传统的分类方法的缺陷,本文采用集成学习分类方法研讨多光谱遥感图像的分类,并对多光谱遥感图像的纹理特征,分类特征的简化降维等关键问题进行了研究,具体的研究内容如下
被称为“第三利润源泉”的物流产业,在今天呈现加速发展的趋势。现代物流发展的目标是:有效的降低物流成本、提高物流效率,而这依赖于物流过程的合理性和流转的顺畅程度,这需
数据仓库作为一个数据集合,具有面向主题、集成、反映历史变化、相对稳定的特点,它的内容来自各种异构数据库的集成数据。数据仓库的本质是一个非常大的数据存储,但是面向主
随着信息多元化的增长,通用搜索引擎已经不能满足人们对个性化信息检索服务日益增长的需要,用户对信息的需求更多的是针对受限领域和面向特定主题的。应对这种需求,需要分类精确
接入网业务是整个通信网络向用户提供的直接业务,接入网业务管理也是通信网主要的管理工作职能之一和不可分割的重要组成部分。接入网业务管理系统建设和运行的好坏直接影响