论文部分内容阅读
新闻报道是信息的重要载体,日常生活中的很多信息都是以新闻报道记载、传播和交换的。面对这些潮水般涌来的新闻报道,人们迫切需要能够自动实现信息采集、过滤、整理和利用的各种智能业务。基于事件的新闻报道分析是非常有力的工具,其目的是有效地组织和处理海量的新闻信息。本文对这个具有重要理论意义和广阔应用前景的课题进行了研究和探索,所取得的主要成果如下:●提出了基于事件的新闻报道分析框架。该框架是在基于事件的新闻报道分析技术的概念分析和层次结构的基础上构建的,概念分析对相关术语的定义进行了剖析,并给出了基于事件的新闻报道分析的层次结构,技术框架则在概念分析和层次结构的基础上探讨了基于事件的新闻报道分析实现的技术途径,明确了本文重点研究的问题。●提出并改进了部分新闻事件探测方法。首先改进了基于增量K均值的事件探测法,针对传统的增量K均值法用于事件探测时不能够客观地选择初始聚类中心这一难点问题,本文使用密度函数法进行聚类中心的初始化,论文还对邻域密度有效半径和特征空间维数的选择问题进行了讨论;还提出了一种基于ICURE的事件探测法,该算法能够有效地解决传统聚类算法在计算复杂度、数据更新时所面临的问题。●提出并改进了部分新闻事件追踪方法。提出了一种用于事件追踪的基于K近邻特征线(KNNFL)的方法,将改进后的KNN融入到NFL中形成KNNFL是为了更适合新闻事件的分析;还提出了基于反例样本修剪支持向量机(NEP-SVM)的事件追踪法,该算法根据距离和类标决定一反例样本的取舍,最后将SVM的输出结果映射成后验概率。●提出了一种事件相关多文档摘要方法。其特色在于:在提取基本新闻要素和扩展新闻要素的基础上分别形成了基本局部主题句群和扩展局部主题句群,这样可以在尽可能全面地覆盖多个主题的同时缩减自身的冗余。●设计并实现了基于事件的新闻报道分析系统IEventMiner。详细地描述了IEventMiner系统的设计思路和各功能模块,并介绍了原型系统的实现,从而对基于事件的新闻报道分析框架和相关方法进行了应用和验证。综上所述,论文的主要工作集中在基于事件的新闻报道分析的关键技术上,如事件探测、事件追踪以及事件相关多文档摘要等,在一些领域取得了一定程度的进展,实现的IEventMiner系统采用模块化的结构设计,易于系统功能的扩充和性能的完善。这些研究不仅会对系统工程技术产生积极的影响,对情报分析技术也具有很强的参考价值。