基于WEB日志挖掘的个性化服务技术的研究

来源 :湖北工业大学 | 被引量 : 3次 | 上传用户:qiaobianhongyaogqw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速普及和广泛应用,网络信息资源的数量及网站设计的复杂度也呈急剧增长趋势。一方面,人们越来越多地关注如何快速有效地从繁多的网络信息中寻找到潜在的、有价值的信息。另一方面,Web网上的服务商也在不断设法获取用户浏览的兴趣爱好,以便为用户提供更有针对性的服务。但是由于Web是动态的无结构的,并且Web页面的复杂程度远远大于文本文档。Web日志挖掘就是运用传统的数据挖掘技术和Web技术结合起来,来对服务器日志进行挖掘和分析处理,从海量的信息数据中发现规律性的内容,解决上面提出的各类问题。如今,针对用户特性并向用户提供个性化服务已经成为计算机技术的研究热点之一。运用Web日志挖掘技术,并结合Web站点的内容、语义信息是目前基于Web日志挖掘的个性化服务技术研究的新趋势。本文首先简述了Web日志挖掘的概念、应用、研究现状和研究目前所面临的问题,重点分析了Web日志挖掘系统的实现过程,给出了数据预处理的流程并分析了其中的难点;其中预处理过程包括数据清洗、用户识别、会话识别和路径补充。其次研究了用于Web日志挖掘技术的算法。提出了一种新的预处理模型,采用基于分析用户方cookies文件的技术方法,避免通过同一代理服务器访问网站的不同用户无法识别出来。采取了用户浏览行为的聚类算法与Web页面聚类算法相结合的方法对用户访问模式进行挖掘,直接对网站的拓扑结构和用户浏览信息进行处理的关联矩阵方法,避免了复杂的会话识别,使挖掘过程更高效多能。再次描述了个性化服务的关键技术,并形成了个性化服务推荐系统。通过之前用户访问模式挖掘,预测用户感兴趣的页面,形成推荐结果,并以增加动态链接的方式把指向这些页面的链接推荐给用户,对不同用户展现不同的网站页面,实现个性化服务。文中给出了系统模型的体系结构,阐述了各模块的用途。最后分析总结了个性化服务的应用和发展方向。
其他文献
随着网络的普及和对人们日常生活的影响的不断深入,富于交互性、开放性、即时性的BBS论坛逐渐吸引了大批的网络用户,而且还呈现不断增长的趋势。作为一种互联网交互的重要形式,
学位
随着Internet技术和GIS(Geographical Information System,地理信息系统)技术的发展,WebGIS成为GIS领域研究的热点。利用网络技术,依托空间数据库,通过与浏览器的交互,WebGIS
Internet技术的飞速发展带动了商业方式改变的创新大潮流。为了获取更多的自动化,有效的业务过程,全球业务视图等,许多公司正在将主要的经营转移到网络。为了在新的在线经济
智能电网从被提出以来就成为世界各国所讨论的一个热门话题,作为未来电网研究与发展的方向,其结构和规模正变得越来越复杂和庞大,所承载的数据也将会呈现出海量的增长方式。云计算技术所具有的分布式计算,高可靠、强容错以及易扩展的特性,能够对智能电网发展过程中所遇到的一些问题提供有效的解决方法。由于电力系统所处的特殊位置,如何保障智能电网中数据的安全性,对于电网系统安全稳定地运行具有重要的意义。因此本文主要研
目前,嵌入式电子设备已经广泛应用于人们生活的各个领域,除了要求实现必须的功能外,某些特殊的领域还对嵌入式系统提出了更高的要求:在保证嵌入式整体性能的前提下,嵌入式系统
石油地震资料处理需要海量存储和巨量计算,一直是高性能计算的重要应用领域。基于Linux的集群计算机系统由于在性价比、可靠性和可扩展性方面的明显优势,已成为目前地震资料
龙芯平台电子教室是龙芯计算机在教育信息化领域的重要应用,是由中科龙梦、红旗Linux等多家公司共同开发的教育信息化解决方案。在龙芯平台电子教室解决方案中,教师与学生桌
设计模式是指在特定背景下反复出现问题的解决方案,是经验的文档化。设计模式复用是将设计模式应用到软件系统的设计中,重复使用已有的设计方案,避免重复设计。它把软件复用
进化策略是一种模拟自然界进化规律以解决参数优化问题的典型的进化算法,作为一种新型的优化技术,弥补了传统优化技术的不足。在科学研究、生产实践中许多复杂的计算问题都可
随着互联网技术的不断发展以及运营商对硬件设施的投入,在线视频业务已经成为了网络应用的热门领域。一方面,随着在线视频用户数的急剧膨胀以及宽带网络和宽带流媒体应用的兴