【摘 要】
:
随着国内互联网的快速发展,网络媒体的影响力越来越大。人们在网上交流信息,发表观点、宣泄情绪,由此产生了网络舆情。随着出现越来越多有较大负面影响力的网络公共事件,相关
论文部分内容阅读
随着国内互联网的快速发展,网络媒体的影响力越来越大。人们在网上交流信息,发表观点、宣泄情绪,由此产生了网络舆情。随着出现越来越多有较大负面影响力的网络公共事件,相关国家部门已加强了对网络信息的收集、分析,并对相关设施进行了投资,由此产生了相应的网络信息监控系统。网络信息监控系统通过实时采集网络信息,运用相关技术高效地分析数据,为用户有效监测网络敏感信息,分析网络舆情,降低成本提供了良好的支持。本文重点对网络信息监控系统的关键技术——文本情感分析进行了研究,对现有的技术方法进行改进来解决网络信息监控系统中遇到的问题,在此基础上设计实现了网络信息监控原型系统。本文的工作主要集中在以下方面:1.对现有机器学习方法在通用文本测试集上进行了比较研究。现有的对中文文本情感信息分类的研究的实验数据多集中于单个或少数几个话题领域(如酒店评论、数码产品等),对通用领域的研究较少。而网络信息情感倾向分类系统所采集的文本涉及政治、经济、文化等诸多领域,由于不同的分类器在不同领域上的分类性能不同,各有优劣,因此本文针对网络信息情感分类系统的需求,在通用测试集上对多个分类器进行了实验,评价各个分类器的性能。2.提出了一种基于可信度的多分类器融合的文本情感倾向分析算法。在对分类器性能研究的基础上,选择了KNN、SVM和最大熵作为基本分类器,然后用基于可信度的融合算法对三种分类器进行了组合。实验证明其在实际应用中的效果较好。3.在对有关技术研究的基础上,本文设计和实现了互联网信息监控原型系统,并将文本情感倾向分析技术应用在敏感信息告警功能上,最终在相关单位部署了该系统。通过系统的实际运行,证明本文提出的设计方案具有功能全面、性能稳定等特点,有效支持了相关单位对网络敏感信息的监控。
其他文献
随着信息技术不断深入应用到金融、交通、军事、生态环境监测、Web应用等领域,需要计算机处理的数据类型和数据量与日俱增。近年来,数据流作为一种新数据类型的出现引起了数据
随着图形图像处理技术在日常生活中的广泛应用,其包含的数据量和计算复杂度越来越高。其中,图形图像的相似性匹配问题是高级算法的重要基础。而传统计算机体系的规模和芯片密
为了解决安全数据库中事务处理问题,研究了安全数据库中多级事务ACIS正确性标准。提出了基于快照的多级安全并发控制算法和基于两阶段锁和串行图的多级事务调度算法。基于快
本文阐述一个基于类型系统编译器的设计和构造。基于类型系统的编译器使用了基于二阶多态λ演算的中间语言,并且对基本的类型系统进行了扩充,支持递归类型、存在类型、记录类
作者基于国防“十五”预研课题(专题编号:41308010108)的研究工作,着重研究了RISC微处理器系统的存取部件(包括Load-Store部件和总线接口部件)的体系结构,同时对国内外先进的
多自主移动机器人的分布式协调与控制是一个在工程、人工智能、人工生命等领域得到了广泛研究的问题。在这些领域中,通常主要是从经验的角度来研究该问题。与此不同的是,本文研
本文基于这四种基本传输类型,建立了三个可用于异步传输的交互模型。这三种模型有各自的特点,可以与不同的传输协议结合来实现,适用于不同情况和领域。HTTP是实现Web服务最常用
随着人们对计算速度要求的不断提高,传统的单机计算已经无法满足应用要求。近年来,随着廉价高性能个人计算机和工作站以及高速网络技术的发展, 基于网络的并行计算研究已经成
随着"数字地球"概念的提出和发展,作为其重要组成部分的三维地理信息系统也得到了长足发展.三维地理信息系统研究领域涉及地理信息系统、数据库、计算机图形学、虚拟现实技术
近些年来,神经网络的研究越来越受重视,其应用领域不断扩大,神经网络诊断技术是正在迅速发展的研究领域。由于专家系统的领域非常广泛,所以将神经网络、模糊技术、概率统计同专家