基于Web日志挖掘的页面推荐的研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:xeabor1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的迅猛发展,为人们提供了各种信息资源,然而,如此庞大的信息量为人们寻找自己真正感兴趣的信息带来困难。因此,要为用户提供更好的服务,关键是发现用户的潜在访问兴趣。解决这一问题的方法就是将传统的数据挖掘技术应用于Web上,通过分析研究Web服务器日志记录来获取用户的浏览模式,根据用户的行为模式,进行页面推荐和提供个性化服务。本文首先对数据挖掘、Web挖掘及Web日志挖掘进行了系统的讨论,简单的介绍了数据挖掘的过程、方法和Web挖掘的分类,详细地分析了Web日志挖掘预处理的各个步骤,包括数据净化、用户识别、会话识别、路径补充和事务识别等,并对其实现方法进行了研究;其次在对关联规则深入探讨的基础上,对Apriori算法和改进的Apriori算法进行分析,并用实例对两者进行比较,接着,介绍了序列模式挖掘的相关概念,详细描述了基于Apriori算法的类Apriori算法,并将Apriori算法的改进思想应用到类Apriori算法,改进类Apriori算法的性能,并用具体实例详细分析了改进的类Apriori算法的流程;最后设计并实现了一个基于Web日志挖掘的页面推荐系统模型,使用南京理工大学钟声网的Web服务器日志记录进行测试,并给出了相应的推荐方案,供网站设计者参考。
其他文献
现代社会是信息和网络化的社会,信息的竞争对各个行业来说都显得至关重要,尤其是对经济全球化时代下的企业更是如此。企业通过各种手段和工具从企业内部外部收集相关信息,对
无线传感器网络的广泛应用及传感器、通信、嵌入式等技术的快速发展,对传感器网络采集的数据信息要求越来越高,具有图像、音频、视频等多媒体信息感知能力的无线多媒体传感器
蛋白质三维结构与功能的关系问题是当前生命科学领域一个重大科学问题,蛋白质三维结构相似性比较则是探索蛋白质结构与功能关系的一种重要手段。基于计算机图形学方法利用分
当今,随着互联网的普及和远程教育在Web站点上的应用越来越多,学习内容日益丰富,从大量学习者的访问信息中自动获得更好更快的学习模式的需求随之也增大。如何设计出一个合适
实际隧道开挖中,围岩的地质环境变化,围岩地质结构复杂性都将给施工带来不利影响。因此,在隧道工程施工过程中,弄清地下岩体的地质特征、地层结构、地质分布规律以及隧道开挖风险
随着科学技术日新月异的发展,人们对网络的要求越来越高。有线电视网,电信电话网以及传统计算机网络开始相互融合,相互渗透,三网合一已经成为不可阻挡的大趋势。鉴于Internet
SQL语言是检索关系数据库的传统方式。使用SQL语言查询数据库,结果是精确的。然而对于没有计算机专业背景的普通用户而言,这样的查询方式是复杂的。要想利用SQL语言查询数据
最近十多年的大量研究结果表明不论网络的拓扑结构与流量类型如何,网络流量中都存在统计自相似性或长相关特性。网络流量自相似性的发现对网络流量建模、性能评价和网络控制
近年来随着计算机性能的不断提高,互联网技术和带宽的飞速增长,互联网需要进行的数据传输、数据存储、以及处理各种信息服务业务的数量也再迅猛增长。在这种情形下,孕育出了
学位