论文部分内容阅读
网络用户行为分析是一种新的、迅速发展的领域,它已成为当今研究的热门话题,如何为用户提供高品质和个性化的服务,如何满足用户的需求是急需解决的核心问题。用户行为分析不仅需要数据挖掘,更离不开数据挖掘中的Web挖掘。它具有很高的实用价值,尤其是在电子商务领域。本文分析了当前Web用户行为分析中的关键技术,Web使用挖掘,而Web使用挖掘的核心研究内容是Web日志中的兴趣关联规则和Web用户浏览模式的聚类算法。一方面,在用户兴趣关联规则的基础上,结合Web区域的划分,提出一种新的用户兴趣关联规则,这种兴趣关联规则来源于现今网络用户对区域的选择以及用户在页面上浏览所表现出来的不同兴趣程度,进而提出一种基于兴趣区域的使用挖掘算法。这种算法是通过点击流数据的加权计算,并通过页面浏览路径的兴趣度来提高单页面区域推荐的准确度。另一方面,在提出的用户兴趣关联规则基础上,需要为多组用户分类,以便针对不同类型的用户进行个性化推荐,研究了Web用户浏览模式的聚类算法:粗糙k-均值聚类算法和Leader聚类算法。这两种方法都存在着一些缺点,第一种方法的聚类准确率好,但是时间复杂度较大,第二种方法时间复杂度较低,但是聚类准确率不够理想。本文以模糊理论为基础,结合Leader算法,实现一种改进的基于Leader算法的用户浏览模式聚类算法。本文研究的两种方法都具有较高的实用性,在互联网站点及电子商务中都有比较大的用途,其创新点在于:1)详细分析用户的兴趣关联规则模型,并对现有模型做出改进,增加浏览区域兴趣度的概念,并进行细致的实验分析。2)对向前序列算法进行改进,提供用户的真实浏览记录,并在实验室网站提供的数据上做了详尽的分析,并做出推荐策略。3)提出一种基于Leader算法的Web用户浏览模式聚类的改进算法,并在实验中对算法的关键指标进行详细的分析评测,明确其意义和可行性。