论文部分内容阅读
随着Internet的兴起和普及,电子商务因为其成本低,方便快捷,足不出户就可购买商品等优点已经在全球得到普及和发展,并成为未来发展的趋势。然而,随着电子商务系统规模的扩大,大量的Web页面提供给用户越来越多的选择,它的发展面临了两大问题:一是用户面临众多的商品并不是全都感兴趣,会迷失在复杂的网络信息空间中,无法迅速有效地寻找到满意的商品;二是商家也不能了解用户的需求,提供给用户千篇一律的界面,不能够保证客户的忠诚度。因此,个性化地服务是制约电子商务系统发展的关键。Web数据挖掘技术(Web Data Mining)就是在这一需求下运用在了电子商务系统中。Web数据挖掘,是数据挖掘技术在Web领域的延伸与发展,是从大量的Web文档集合和在站点内进行浏览的相关数据中发现潜在的,有用的模式或信息,帮助在线用户从海量的数据空间中高效地获取有价值的知识。Web数据挖掘与电子商务系统结合可以为用户提供个性化地服务。本文的主要工作如下:1.分析了传统的协同过滤推荐算法的不足,针对原始用户-项目评分矩阵的稀疏性,提出了基于项目属性的混合协同过滤推荐算法。算法改进了传统的项目相似度算法,增加了基于项目属性的相似度计算,然后再根据新的项目相似度,预测用户对未知项目的评分,填充了原始用户-项目评分矩阵,再计算用户相似度,通过最近邻产生TopN项目推荐。最后通过实验证明了新算法使预测精度明显提高。新算法缓解了原始矩阵的稀疏性,又保留了传统协同过滤推荐算法的优势。2.分析了Web日志频繁路径挖掘的经典算法Apriori算法和WAP算法,指出了各自的缺陷,提出了基于WAP-Tree的连续频繁遍历路径算法。算法与WAP算法相比,适合挖掘连续频繁访问路径,挖掘过程中不会生成大量中间数据,受支持度的影响很小,最后从理论和实验上证明了算法性能的优越性。3.运用提出的基于项目属性的混合协同过滤推荐算法和改进的频繁遍历路径挖掘算法,设计与实现了网上书城电子商务系统,实现了商品的个性化推荐。