论文部分内容阅读
Internet是一个庞大的、全球性的信息服务中心,它提供了各种各样的信息服务。但随着WEB上数据的爆炸式的增长,数据信息的有用性变的越来越重要了。Web挖掘技术正是基于这一背景提出来的。 本文介绍了数据挖掘的基本知识,讨论了WEB挖掘和WEB挖掘的分类。根据挖掘的内容,WEB挖掘可分为三种,WEB使用挖掘,WEB内容挖掘,WEB结构挖掘。WEB使用挖掘是本文主要的研究方向。WEB使用挖掘就是利用数据挖掘技术从WEB日志数据中挖掘用户访问网站的行为模式。本文重点分析和研究了Web使用挖掘中数据预处理和事务识别算法的应用和改进,并通过实验加以证明。还将关联规则技术应用到了Web日志挖掘中,提出了一种频繁路径的挖掘算法,用以发现网站用户的访问模式。