论文部分内容阅读
本文研究了个性化服务中用户模式的挖掘,分成以下几个子问题并且针对性的研究了相应的解决方案或者算法:
(1) 如何解决用户访问的记录以及识别用户身份的问题。研究了利用web日志方式记录用户行为的方法,以及对日志数据进行预处理,数据清理和识别用户的常见算法;
(2) 如何跟踪用户的访问路径,发现用户的访问习惯。着重讨论了运用马尔可夫随机过程预测用户行为,HPG图描述页面访问的概率性的算法。并且就数据挖掘中非常著名的关联规则挖掘算法在用户模式发现中运用的可行性进行了研究。
(3) 对用户的分类问题。。本文中主要提出了两种算法——K均值聚类算法和模糊聚类算法来研究用户和文档聚类的问题。
本文中主要立足于研究利用web挖掘的常用算法和思想来研究构建个性化电子商务中用户的访问行为模式的挖掘,包括对日志文件的预处理,用户的聚类,用户行为的预测,以及由用户兴趣的挖掘文档关联的各方面。