微博热点话题情感分析及传播规律研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:xumeg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博作为一个开放性的社交媒体,被越来越多的用户接受,该平台具有草根性,用户可任意发表观点、共享信息,所以其在舆论传播方面所起的作用有目共睹。微博实时推送的热点话题,以及用户转发、评论、点赞的无限制性,使消息传播的速度非常快,在这样的情况下,用户的发表的观点以博文的方式长期保留下来,个人的情绪会因为煽动和发酵而被放大,如果不及时对微博中不良的情绪进行疏导,很容易形成负面消极的舆论,甚至引发现实生活中的情绪主导型事件。所以微博管理者需要实时监控热点话题事态发展,在出现群体极性事件之前,引导舆论朝正确的方向发展。基于以上背景,本文将研究新浪微博社会和娱乐两大类热点话题的传播规律,对比两类话题在热度方面随时间增长的差异,最后选取多种方法对话题微博内容的情感极性进行分析。主要研究工作包括:第一、新浪微博热点话题有效特征的提取和话题热度公式的建立;第二、新浪微博热点话题热度曲线的绘制和拟合,话题传播规律的挖掘。本研究对新浪微博进行网络爬虫,爬取各项特征并提取出来存入EXCEL文件,按照公式计算话题热度值,并采用SPSS软件对话题热度值随时间的变化进行曲线绘制和拟合。对比两类热点话题增长曲线之间的异同,挖掘两个类话题的传播规律;第三、新浪微博热点话题博文情感极性判别。本研究采用的算法有四种:(1)基于词典的微博话题情感极性分析;(2)基于朴素贝叶斯的微博话题情感极性分析;(3)基于TextRank和词典的微博话题情感极性分析;(4)基于TextRank和朴素贝叶斯的微博话题情感极性分析。本研究的创新点有两个:第一、突破了话题热度增长趋势以自然日为时间轴的局限,提出了以话题建立时间为起始,话题发生小时数为变量,累积热度为因变量的分析方法;第二、提出了基于TextRank和词典的和基于TextRank和朴素贝叶斯的文本情感分析方法,并与传统的情感分析方法对比,分析其在正确率和效率方面的优势。
其他文献
目的探讨妇产科围手术期静脉血栓形成的防治。方法我院2013年2月至2015年2月收治的80例妇产科围术期患者,按观察组和对照组各40例划分,对照组行妇产科常规干预,观察组针对临
微弱信号测量在激光测距、机械故障诊断、通信传输等领域有着极其广泛的需求。检测淹没在噪声背景中的微弱信号是现代信号处理的研究热点和难点。本课题根据微弱信号与噪声特
<正>今年以来,在"房住不炒"的定位指导下,房地产市场调控持续深入,市场运行较为平稳。上半年,房价整体同比小幅上涨,区域分化特征明显:一线城市房价环比涨幅保持低位,二三四
国有企业改革是我国经济改革中的核心部分。目前,国有企业改革仍然面临着一系列重大的障碍,其中经济的意识形态化是一个重要的方面。所以,只有大胆地破除这种障碍,实现经济的
随着时代的不断发展,国民经济水平的不断提高,公路桥梁建设的重要作用也逐渐显现。近几年,我国公路桥梁建设数量呈逐年增长趋势,在公路桥梁施工过程中,钻孔灌注桩施工技术因
在住房和城乡建设领域,随着各种信息化技术的广泛应用,所产出的浩瀚基层数据蕴涵了不同维度下所涉及的行业和发展信息,并且已经呈现出大数据特征,传统的信息处理技术已经无法