论文部分内容阅读
随着网络的发展,各类网络社交平台已经成为人们发表自己观点、与他人交流的重要平台。基于社交网络的舆情分析也成为了一个研究热点,然而现有的舆情分析研究很少有基于校园BBS论坛展开的。另一方面。对高校管理者来说,学生的情绪状态是一个非常需求的信息,但是现阶段获取学生情绪状态信息的主要途径是问卷调查等方式。本文基于上述情况,结合校园BBS主体用户为高校学生的特点,提出展开基于校园BBS论坛的学生情感倾向研究,设计并实现了校园BBS论坛情感数据抓取与分析系统。本文的主要研究工作包括:(1)针对某高校BBS论坛,设计并实现了一个爬虫程序,用于自动化、高效的抓取论坛内的帖子和评论内容,提取出每一条内容的文本信息。(2)基于ICTCLAS分词软件,实现了一个文本分析功能模块,对每一条帖子或评论内容进行分词,并使用情感词典和情感倾向判断方法判断每一条内容的情感倾向,即正面、负面或中立。最后,选取上海某大学校园BBS论坛,分析其中的114个讨论区在8月30号至11月15号之间共计93922条帖子和评论的情感倾向,得出学生情感倾向随时间变化的波动曲线。并结合一些有影响力事件,对结果进行分析。结果表明,实验结果与客观实际情况比较符合,系统具有实用性。