论文部分内容阅读
网络舆情指的是在互联网上民众对社会管理者、公共问题产生和持有的价值观、信念以及社会政治态度的总和。移动互联网的迅速发展使得网络新闻的发布和获取变得方便快捷,碎片化时间阅读新闻也已经成为网民的主要活动,因此网络舆情对社会稳定和政治生活秩序的影响也与日俱增。本课题研究的面向网络新闻的舆情检测与分析系统,是鉴于目前网络舆情发展和规范处理的需要。它的成功开发将成为舆情信息管理不可缺少的技术措施,也将推动舆情管理信息化和服务化的快速发展。本文的工作主要包含关键技术介绍、需求分析、系统设计与实现三大方面。第一,系统常用关键技术主要包括系统的开发技术、开发环境以及功能实现需要的关键技术。论文首先简单介绍了系统采用的C#语言和数据库技术,Visual Studio2010开发环境以及SQL Server2005数据库,然后对系统功能实现所需的关键技术作了分析和介绍,主要有话题检测所需的相似度计算和话题模型的生成、话题追踪所需的自适应追踪算法以及倾向性分析中的极性词典构建和情感分析。第二,明确系统的关键技术后对系统需求进行详细分析,主要内容包括需求分析的具体任务和系统的功能需求、非功能需求以及软硬件需求、安全需求。其中需求分析的任务主要从综合要求和数据要求两大方面表述,而功能需求分六大方面进行说明,非功能需求主要对性能设计需求和系统界面风格作了详细叙述,软硬件需求又分为系统开发环境和运行环境两部分介绍。最后,设计并实现面向网络新闻的舆情检测与分析系统,同时对系统进行测试。系统的设计主要包括系统整体结构设计、数据库设计、功能模块设计、系统的登录界面、主页面以及系统的安全体系设计,同时,根据系统安全技术要求设计实现系统的数据安全与访问体系。其中数据库设计主要介绍数据库的创建、实体联系模型以及数据库表的设计,功能模块设计则重点介绍话题检测、话题追踪、以及倾向性分析三大功能模块的设计。系统实现主要详细说明舆情检测与分析系统话题检测、话题追踪、热点发现、舆情溯源以及倾向性分析五大功能模块,包括运行结果界面图以及主要功能实现的关键代码。面向网络新闻的舆情检测与分析系统实现了在各个网站门户(搜狐、新浪、新华、腾讯、凤凰)中发现网络新闻舆情信息,然后把针对同一话题的报道聚为一类,并追踪该类舆情信息的后续报道,从而分析出该话题的发展趋势以及倾向性,探究出不同的事件在网络舆情中的发生发展和演变机理,最终给决策者提供可靠的数据,把握网络舆论的主导权,有效引导网上舆论。