论文部分内容阅读
本文以系统工程的理论和方法为指导,结合人工智能领域的多Agent技术,利用面向Agent的软件工程技术分析和设计Web知识发现系统模型。Web知识发现系统是数据挖掘技术在网络信息处理中的应用,是在大量样本的基础上,得到数据对象间的内在特征,并以此为依据进行有目的的知识提取。Web知识发现系统不同于搜索引擎等信息检索系统,是一个并行的、异步的、智能的多Agent系统,通过多个Agent相互协助对互联网的信息进行推理和提取,并根据用户的兴趣和需求特征,将所形成的知识按照一定的策略加以选择地推荐给用户,以完成互联网智力资源共享的最终目的。
在广泛查阅文献并学习已有成果的基础上,本文对Agent技术、基于Agent的系统建模方法、Web知识发现的方法、满足个性化需求的Web知识发现等进行了较深入的研究,构建了基于Agent的Web知识发现系统模型。本文的主要研究内容如下:
(1)阐明了系统的体系结构、任务功能、通信机制与控制方式等,通过构建多个互相协作的MAS子系统来降低知识发现系统复杂性;
(2)研究文本知识提取子系统的实现,探讨了文本的结构化处理及特征表示方法,重点研究了预处理Agent、分类Agent、聚类Agent及文本摘要Agent,包括Agent的结构及所采用的知识发现方法等;
(3)研究用户兴趣特征挖掘子系统的实现,分别阐明了交互Agent、行为分析Agent、内容学习Agent、用户模型更新Agent的结构与实现方法,构造了基于概率模型的用户兴趣模型;
(4)研究知识过滤子系统的实现,讨论了知识过滤Agent、推荐Agent的结构与实现方法,采用概率模型与向量空间模型相结合的方法,利用用户兴趣模型进行知识过滤与推荐。