论文部分内容阅读
随着互联网在信息流量、规模、服务项目和复杂度等方面的迅猛发展,WWW己成为一个规模十分巨大的、分布及其广泛的全球性信息服务中心。但在WWW给人们带来丰富信息和极大便利的同时,也随之产生了一些急需解决的问题,个性化的信息服务便是其中之一。为解决这一问题站点个性化信息服务已经成为当前研究的一个热点,人们通过各种方法,对站点内容、结构、用户行为等进行数据挖掘,建立用户兴趣模型,为网站用户提供更好的服务,提高网站的竞争力,提高用户对网站的忠诚度。本文主要对基于Web的数据挖掘实现个性化信息服务中若干关键技术进行了研究,研究了数据挖掘常用方法、Web数据挖掘的体系结构、个性化信息获取的研究现状等问题,研究了现有个性化信息服务系统信息过滤聚类算法,研究了两种以PageGather算法为基础的改进算法——渐进式PageGather算法和分布式PageGather算法,研究了两种算法的应用效果,认为这些改进对降低了输入数据量和算法复杂度有一定的价值。本文还对开发基于web的个性化推荐系统的必要性、可行性、软件开发和应用的现状及系统开发应用过程中遇到的现实困难进行了研究,并提出了一种致力于用户、个性化信息系统开发者、网站三方共赢的基于web数据挖掘的个性化信息系统原型的构建方案。