论文部分内容阅读
Web是一个开放性的全球分布式网络,资源分布在全球不同的地方,并且网上的资源没有统一的管理和结构,导致了信息搜寻的困难。本文通过对目前Web数据挖掘技术中国内外的研究状况和研究意义进行了详细的介绍,较为深入地分析了Web信息挖掘中的关键和难点,以及现有关于Web信息挖掘研究及已实现系统的特点与不足,充分吸取了现有工作的经验,在熟练掌握Agent理论、数据挖掘和Web数据挖掘技术的基础上,设计了一个利用Agent技术实现Web信息挖掘的系统模型,详细阐述了系统模型中各个Agent的目标、行为,各个知识库的划分以及Agent之间通信的具体实现方法,并初步检验了系统的可行性和有效性。具体体现在:
(1)详细地介绍了Agent技术的特点和分类,并分析了Agent技术在Web信息挖掘中独有的优势。然后探讨了Web挖掘的有关理论,从Web信息挖掘的定义、Web挖掘与Web信息检索的关系、Web挖掘的任务和方法、用户兴趣模型、相关度反馈等各个方面加以阐述。
(2)设计了一个基于Agent技术的Web信息挖掘系统。将Web信息挖掘的总目标分配给多个Agent完成,分别对各Agent的功能与实现中的关键技术进行了较为详尽的解释,根据用户的访问的历史记录自动建立个性化的用户信息模型。
(3)阐述了系统各个知识库、数据库的组成以及系统开发中所用的环境和Agent的功能的实现。
(4)利用Java实现了基于XML的Web数据挖掘Agent的开发,验证了所提理论的正确性和可行性。
本文将Agent技术应用于Web数据挖掘中,可以十分灵活地提供多种智能化的信息处理手段,充分体现和满足了用户个性化的需要,将有利于开拓互联网络资源的信息服务,更好地为生活和学习服务。