论文部分内容阅读
伴随着网络的普及,微博有着迅猛的发展。越来越多的用户使用微博进行信息的传播,每天微博的信息量都呈爆炸式增长,如何从海量的微博信息中获取所需内容,特别是如何针对最近发生的热点话题和热门事件进行分析是当前研究的热点之一。本文采用微博情感分析技术来对微博话题进行分析和挖掘。微博情感分析相关技术的研究具有很好的应用前景和重要的实际意义。论文给出了一种基于云模型并结合语义的特征选取方法完成了微博的特征抽取工作。该方法对现有的基于2统计量的特征选择方法结合语义并利用云模型进行改进。利用云模型对于不确定性知识的处理优势,通过对特征在类别上2的统计值转换为对类别的隶属度层次进行处理,从而实现对特征分布的修正。对本文给出的微博特征抽取方法在微博数据集上进行了实验验证,证明了该方法的有效性和可行性。论文给出了一种基于组合贝叶斯网络对微博新闻话题进行情感分析的方法。该方法把微博情感分为五类,侧重对容易误判的微博情感分析类别进行分析诊断,使微博的情感分析过程更加地合理。论文把若干个不同结构的贝叶斯网络当作一系列基微博情感分析器,完成boosting迭代任务。也就是说,依次在训练集上训练每个基微博情感分析器。首个基分析器用原始的微博数据训练集训练,其它基分析器的训练取决于在其之前产生的微博情感分析器的表现,被已有微博情感分析器误判的实例会以较大的概率出现在新的微博情感分析器的训练集中,最终,这些微博情感分析器组合成为一个贝叶斯网络组合情感分析器。对本文给出的基于组合贝叶斯网络的微博情感分析的方法在微博数据集上进行了实验验证,证明了该方法的有效性和可行性。