论文部分内容阅读
随着我国互联网的发展,网络上对于社会热点,公司产品,政治政策等的讨论越来越多。因此,对于网络舆情的检测以及监控也成为了非常重要的研究方向。而如何准确地提取出舆情信息中的话题以及判断其蕴含的情感态度是舆情监控系统中最关键的问题之一。针对上述问题,本文基于普适性的舆情监控系统应用场景,分析其特征和需求。并且根据目前已有的舆情监控系统的不足缺陷,设计并实现了基于文本语义情感分析的舆情监控系统,为舆情监控提供智能化高,专业性强,准确度高的网络舆情监控技术。为了实现这一目标,本文的主要工作包括如下几个方面:1、基于舆情监控系统的应用场景,从舆情信息获取与舆情情感分析两方面进行了现有系统的分析,并阐述其不足之处。2、分析了基于词向量的话题检测算法与情感分析算法,以及其在舆情监控系统中的具体应用。构建了神经网络模型计算出词语的词向量。设计并实现了使用词向量进行舆情话题的新词发现以及话题探测的算法。针对目前忽视情感分析上下文的舆情系统现状,提出了基于词向量的递归神经网络模型用于进行文本情感分析。并针对算法准确度进行了实验验证。3、针对词向量模型中对于中文语法特征描述的不足,提出并实现了基于机器学习和词汇语法特征的情感分析算法。阐述了词袋模型以及中文语法特征的重要性,并设计出将语法特征融入词袋模型的解决方案。实现了三种机器学习算法:朴素贝叶斯分类器,SVM分类器,以及随机森林分类器。最后将基于词向量的情感分析算法与基于机器学习的情感分析算法通过提升树的模型进行融合,以完成不同模型之间的互补。4、针对舆情监控系统的具体场景要求,提出了舆情监控系统的架构设计,通过将舆情监控系统划分为离线部分和在线部分,在减少在线计算开销的同时保证了用户交互的实时性。设计并实现了基于语义情感分析的舆情监控系统,支持用户自定义监控计划,设置预警,查看舆情监控结果,对舆情监控结果进行反馈等功能,并对系统功能进行实例验证。系统的实现和验证结果标明,本文设计并实现的基于语义情感分析的舆情监控系统具有新词识别能力和较强的话题检测能力,情感分析效果好,用户界面友好,有一定的理论参考价值和应用前景。