基于Web日志的增量序列模式挖掘研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:jzhiei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘为自动和智能地把海量的数据转化成有用的信息和知识提供了强有力的手段,尤其是在网络迅速发展和电子商务竞争不断激烈的今天,数据挖掘的作用更加的凸显。序列模式挖掘是数据挖掘重要的研究课题之一,是指从序列数据库中寻找频繁子序列作为模式的知识发现过程,在很多领域都有实际的应用价值,如客户购买行为模式的分析、Web访问模式的预测、疾病诊断、自然灾害预测、DNA序列分析等。随着以人为中心的交互式应用和数据的动态更新背景的日益增多,频繁模式的动态维护需求不断增长,这些都不断地刺激人们寻找更好的解决办法来尽可能地降低挖掘的代价,因而动态数据库的增量式序列模式挖掘成为序列模式挖掘在未来的研究热点。本文基于序列模式挖掘、Web服务器日志和电子商务等相关理论知识,运用文献研究、实证分析及定性定量分析相结合的方法对电子商务网站基于服务器Web日志的增量序列模式挖掘问题进行了研究,文章主要从以下四个方面展开:第一,整理和分析先前序列模式挖掘算法的相关文献资料。介绍序列模式挖掘的概念、作用和国内外研究现状,归纳现有序列模式挖掘方法中亟待解决的问题;从基本序列模式,闭合序列模式,多维序列模式,周期序列模式等不同角度对相关理论进行了梳理,为本文增量挖掘算法的提出以及特征分析提供理论基础。第二,结合理论研究,在借鉴算法优点基础之上,提出一种适于Web访问序列模式的增量挖掘算法。该算法采用扩展网格结构作为存储结构,具有占用空间小和获取信息便利的优势,同时能够根据数据库动态变化而变动结构。针对数据库更新、网站结构变化和最小支持度阈值调整三种影响挖掘结果的情况提出相应算法,为模型的构建奠定了基础。第三,构建基于Web日志的增量挖掘模型。模型分为四个模块,第一块是网站结构内容分析;第二块是数据预处理;第三块是Web访问序列模式增量挖掘算法的实现;第四块是实验结果的分析与解释。第四,本文以购物网站的真实Web日志数据为研究对象进行实例分析。运用SQL-server2005实现数据的预处理过程,通过Visual C++6.0SP6软件编译算法对数据运行测试,并根据挖掘结果,从管理学的角度为购物网站设计者提出一些建议。经实验证明,基于Web日志的增量序列挖掘算法IncWTP可以适应数据库动态变化特征,利用先前已发现的信息来挖掘网站用户访问序列模式,避免重新挖掘整个数据库,并当Web日志数据库更新或支持度阈值调整时,挖掘效果和效率均高于当前普遍使用的数据挖掘方法。
其他文献
城市作为巨大的承灾体,日益成为国际社会防灾减灾的中心和重点。城市灾害的频繁发生及其造成的各种损失,己经对城市经济社会发展构成了严重的威胁,城市对灾害的预测、防御、救助
学习目标在语文教学中的作用日益显著,正确使用学习目标能使学习目的明确、语文课堂教学效果有较大提升。本文针对学习目标制定及表述中出现的常见问题,结合语文调研的实际情
形式上的“减负”和说教式的传统教学,使本就伤痕累累的中职学生更是不堪重负:多数同学的学习兴趣尽失,睡堂、讲空话、拖拉作业,甚至厌学。近年来,我在职高语文教学中尝试创
当前农村中学生写作障碍之一是缺乏素材,平时所选素材往往十分陈旧,缺乏新意。生活是写作的源泉,农村有着浓厚的乡土文化气息,学生就是在这种文化影响下长大的,对此应该有切
【摘要】创设情境教学法通过给学生制造良好且轻松的学习氛围,使得学生积极主动地进行学习,教师利用情境教学,大大将教学效率提高了,具有很高的教学价值。文中从当前小学语文教学过程中创设情境教学法的应用现状入手,进行分析,分析了创設情境教学法对于小学语文教学的作用,并就如何充分利用创设情境教学法提高小学语文的教学质量提出了相应的建议。  【关键词】小学语文;创设情境教学法;语文教学;应用研究  【中图分类
在网络经济环境下,B to B电子商务给企业的销售和采购带来了全新的平台,而企业间的商务谈判是B to B电子商务环境下的一种重要决策活动,它是整个B to B电子商务的核心。随着
【摘要】本研究主要采用问卷调查法,对朝鲜族小学和汉族小学低年级学生的阅读素养进行了对比研究。结果表明:朝鲜族小学和汉族小学低年级学生阅读素养均接近良好水平,朝鲜族小学在阅读知识方面显著性低于汉族小学,在阅读能力与阅读态度两个维度上不存在显著性差异。研究建议朝汉小学应提高家长对培养学生阅读素养的重视程度;朝鲜族小学还应加强阅读环境建设及教师指导。  【关键词】朝鲜族小学;汉族小学;低年级;阅读素养;