电子商务系统中Web数据挖掘技术的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:ynl007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的兴起和普及,电子商务因为其成本低,方便快捷,足不出户就可购买商品等优点已经在全球得到普及和发展,并成为未来发展的趋势。然而,随着电子商务系统规模的扩大,大量的Web页面提供给用户越来越多的选择,它的发展面临了两大问题:一是用户面临众多的商品并不是全都感兴趣,会迷失在复杂的网络信息空间中,无法迅速有效地寻找到满意的商品;二是商家也不能了解用户的需求,提供给用户千篇一律的界面,不能够保证客户的忠诚度。因此,个性化地服务是制约电子商务系统发展的关键。Web数据挖掘技术(Web Data Mining)就是在这一需求下运用在了电子商务系统中。Web数据挖掘,是数据挖掘技术在Web领域的延伸与发展,是从大量的Web文档集合和在站点内进行浏览的相关数据中发现潜在的,有用的模式或信息,帮助在线用户从海量的数据空间中高效地获取有价值的知识。Web数据挖掘与电子商务系统结合可以为用户提供个性化地服务。本文的主要工作如下:1.分析了传统的协同过滤推荐算法的不足,针对原始用户-项目评分矩阵的稀疏性,提出了基于项目属性的混合协同过滤推荐算法。算法改进了传统的项目相似度算法,增加了基于项目属性的相似度计算,然后再根据新的项目相似度,预测用户对未知项目的评分,填充了原始用户-项目评分矩阵,再计算用户相似度,通过最近邻产生TopN项目推荐。最后通过实验证明了新算法使预测精度明显提高。新算法缓解了原始矩阵的稀疏性,又保留了传统协同过滤推荐算法的优势。2.分析了Web日志频繁路径挖掘的经典算法Apriori算法和WAP算法,指出了各自的缺陷,提出了基于WAP-Tree的连续频繁遍历路径算法。算法与WAP算法相比,适合挖掘连续频繁访问路径,挖掘过程中不会生成大量中间数据,受支持度的影响很小,最后从理论和实验上证明了算法性能的优越性。3.运用提出的基于项目属性的混合协同过滤推荐算法和改进的频繁遍历路径挖掘算法,设计与实现了网上书城电子商务系统,实现了商品的个性化推荐。
其他文献
该文可分为三个部分.第一部分由第一和第二章构成,主要对医疗数据通讯和3DMED系统设计进行概述;第二部分由第三章构成,着重从通讯协商、信息编码、SOP服务类等方面对DICOM协
该文利用面向对象的思想,首先将地图符号分为点、线、面、文本四种类型,并从地图符号中抽象出构成地图符号的8个基本图元,然后在此基础上设计了地图符号库的面相对象模型和数
该文介绍了基于Web的自适应考试系统及其开发工具的框架和部分实现过程.系统结合了网络技术、数据库技术、数据库与Web互联技术及构件技术.该文分析了建立题库的理论基础——
该文主要讨论分布式多层应用的实现技术,包括分布式构件的开发,多层结构的设计方法,分布对象的设计原则,提出并实现了通用数据访问层来解决分布环境下的数据访问,设计并实现
由于炼铁工艺的专业性和复杂性,为阐述本文内容,首先介绍了高炉炼铁的一般过程, 说明了铁水含硅量预测的技术价值和主要的技术难度。然后,运用时间序列方法,对含硅
本文首先深入分析了CTI技术和IP技术的内涵,对基于CTI技术和IP技术的业务进行了展望,并认为网络技术和网络业务的融合是网络统一化发展的最终趋势。基于这个认识,随后本文分析了
随着信息技术的飞速发展,嵌入式系统的应用越来越广泛,从传统的通信设备到消费电子,再到工业领域,可谓是无处不在。嵌入式系统的更新换代越来越快,这就对开发工具提出了更高
本文首先探讨了当前流行的分布式数据库结构及应用体系结构,其中详细讨论了分布式数据库的实现途径,分析了浙江万里学院管理信息系统(MIS)的体系结构和功能需要,提出如何建立基于
针对MPEG数据数据结构的特殊性,该文研究了MPEG图像加密算法.通过分析研究MPEG图像编码过程和已有的几种MPEG图像加密算法,找到了MPEG图像加密算法的加密原则--优秀的MPEG加
目前经典的规划模型虽然还占统治地位,但因其处理不确定情形的能力太弱,研究者在此基础上提出了各种规划模型,还从运筹学、决策学、控制论及经济学的角度引入了新的模型用于