论文部分内容阅读
微博作为一种新型的社交媒体,其信息通过发布、评论、转发的形式进行传播,传播过程具有裂变性,因此,具有较快的传播速度和较广的传播范围,它的出现使得传统媒介黯然失色。研究微博传播效果,目的是通过定量分析、预测微博的影响力,更好的让微博为大众服务。微博网络中,信息的传播主要是靠用户之间的转发,故先探究用户的转发行为有利于更全面、深入地探究传播效果。针对微博传播效果进行预测,可以在消息传播过程中发现热点话题、准确地预测出微博的发展趋势,提前对网络舆情发展传播过程进行有效地干预和控制,实现信息的合理管控。本论文主要有两方面工作:一方面,通过分析验证影响用户转发行为的因素,进而预测用户是否会转发某条特定微博;另一方面,将转发规模当作衡量微博传播效果的指标,根据影响转发的因素预测微博最终的转发量。在转发行为预测研究方面,首先,对研究问题进行了简单描述,明确定义用户的转发行为和不转发行为;其次,验证提取的因素对于用户行为的影响并结合基本特征建立了转发影响特征指标体系,体系中包括用户特征、微博特征、交互特征和结构特征四方面特征;最后,采用有监督学习的分类方法,对用户是否会对给定微博产生转发行为进行预测,结果表明逻辑回归模型预测准确率较高,本文选取的特征能够反映同一用户在面对不同信息以及不同用户面对相同信息时做出的不同反应和行为。在微博转发规模预测方面,目前的研究多数将转发规模预测归于分类问题以定量描述微博传播效果。本文在预测时建立了一个多分类模型,对微博进行分类,然后,对每一类微博通过回归模型预测转发次数。在转发规模建模时既选取了用户特征和微博特征等静态特征,又考虑了微博发布后一段时间内的动态特征。鉴于影响微博转发次数的因素之间可能存在多重共线性,本文选取了基于岭回归的回归预测模型,实验证明该模型是行之有效的。