用户访问模式挖掘及自适应web研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:sqs292241644
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今基于B/S的互联网应用日益广泛,各类网站所提供的功能和服务也越来越丰富,然而在智能化方面表现得不够理想。比如,网站结构缺乏灵活性;提供的服务或信息分布不合理,未能充分考虑到用户的需求;信息的访问路径未能考虑到信息的重要性和普遍关注性等等。如果网站能够根据用户的行为模式自动的学习,改良自身的组织结构和表现形式,即所谓自适应Web站点,无疑将极大的方便用户的使用。 本文在分析了Web日志记录结构及涵义的基础上,结合山东大学威海分校研究生处WWW站点,对Web用户访问模式挖掘的整个过程进行了详细的描述,并提出了若干建设性的技术方法。 本文研究将集中在基于图结构的用户访问模式挖掘及其在自适应Web站点的应用上,将数据挖掘技术、数据库技术与Web技术相结合,在分析网站逻辑结构的基础上,通过对用户访问模式的数据挖掘,对已存在的Web站点的结构及站点内的页面进行调整和改善,使其具有自适应能力和优化能力,使各类信息和服务以更有效的方式提供给用户。首先分析进行Web日志挖掘的数据基础及在进行挖掘前需要的数据准备工作,包括数据清洗、用户识别、会话识别等数据预处理过程。其次,提出一种基于Web拓扑结构(图结构)挖掘用户访问模式的方法,区别于常用的基于树形结构的Web路径分析技术,在候选集的生成和剪除过程中减少了候选集的数量,提高了发现模式的精确性和效率,并且避免了“交易变质”的问题。同时还考虑到增量日志挖掘技术的问题。利用Web日志挖掘获得的规则和模式对已存在的Web站点的结构及站点内的页面进行调整和改善。包括链接位置的变动,增加/删除页面间的链接等,运用页面聚类的结果可方便地向浏览模式相似的用户组推荐其感兴趣的主题相似的页面等,从而实现站点组织结构的优化。 运用数据挖掘技术分析用户的访问模式,同时考虑到多种相关因素,可动态的改变网站的组织结构。通过这种网站结构的调节,可以优化网站结构,提高动态网站的服务性能和服务质量,具有很大的研究和应用价值。 利用Web日志挖掘得到的用户访问模式来调整和改善Web站点的结构及站点内的页面,在理论上和应用中都还存在着一些问题需要做进一步的研究。如分
其他文献
随着计算机技术、自动化监测技术的飞速发展,人们的生活质量有了大幅的提升,对自身的财产安全和生命意识也在不断的增强,随着全球刑事犯罪事件的增多,市场对报警系统的需求也日益
本文主要是从气象的角度探讨如何建立辽宁短期电网负荷预测模型。文中通过引入温度和降水等气象因子,利用近几年的气象和电网负荷等数据采用多元回归分析方法建立了电网负荷预
传统网络防火墙属于边界型防火墙,依赖于网络的物理拓扑结构来实施它的安全策略,并且假定被防火墙隔离的内部网是安全的。随着网络的发展,这种单一控制点逐渐成为网络性能的瓶颈
近年来,便携式计算机的普及刺激了人们对移动通信的需求。人们越来越希望即使在移动过程中也能通过便携式计算机接入网络,并保持通信过程的畅通。和有线网络中的固定节点不同
近来,面向服务的体系结构(SOA)成为IT界研究的一个热点。SOA支持对服务的登记、发现和调用,其体系结构本质上是动态的,赋予企业更大的灵活性,提高了企业的竞争实力。基于J2EE平台
数据仓库的在线分析处理(OLAP,On-Line Analytical Processing)和在线数据挖掘(OLDM,On-Line Analytical Mining)通常要对大量的数据进行运算,以精简的结果来回答用户的查询
面对信息时代和急剧膨胀的能源需求,电力部门急需改进现有的用电管理系统以达到高效统计电量数据、全面分析电力市场、科学制订电价政策及准确预测电力增长等目的。随着网络与
当前精细冶金和精细化工对焦炭显微成分精细分析的需求与日俱增,但由于焦炭显微组织成分多达12类,而且其纹理特征复杂(焦炭在微纹理分类上有5个标准:热解炭;基质/包裹体;光学各向
工作流管理主要是通过调用有关的信息资源和人力资源来协调业务过程中的各个环节,使之按照一定的顺序依次进行,从而实现业务过程的自动化。电厂检修过程中存在大量流程性的业务,而对这些业务过程的管理已经成为缩短电厂检修工作的运营周期、优化并合理利用资源、提高生产效率的关键。针对这一现状,本文将工作流技术应用到电厂检修管理中,利用.Net 技术设计并实现了一种适合电厂检修的工作流管理系统原型。该系统采用工作流
随着我国公路交通建设的高速发展,汽车等交通工具的数量及其轮胎的需求量日益剧增。因由汽车轮胎引发的车毁人亡事故时有发生,其质量问题也越来越引起安全部门和生产企业的高