论文部分内容阅读
随着计算机和网络技术的日益发展,全球上网人数与日俱增,企业上网开展业务成了一种趋势。笔者所在的网络数据库课题组近年来一直致力于基于web应用的开发课题,正是迎合了企事业应用发展的需要,并取得了一定的效果。合成树脂产品系统便是其中一个典型的开发课题,它是以高分子塑料材料为基本内容的网站,为塑料领域的科研开发者、生产者查询相关材料数据使用,为这一领域的科技工作者提供动态的浏览查询资源,为公司的科研生产、新产品开发服务。在这个背景下,对web站点的设计和功能提出了更高的要求,要求web具有智能性,能快速准确地找到用户所需信息;能为不同用户提供不同的服务,能允许用户根据自己的需要定制自己需要的页面,等等。近年来人们利用对web信息的挖掘来提高web的性能,而web日志挖掘便是其中的一项重要的研究内容。Web服务器的log日志具有完美的结构,每当用户访问web站点时,所访问的页面、时间、用户ID等信息,在log日志中都有相应的记录。分析web日志,从中发现用户浏览站点的模式,对于站点的智能化设计具有很重要的意义。本文首先就合成树脂产品系统作了全面系统的介绍,然后对web日志挖掘技术作了初步分析,并对目前常用的关联规则和序列模式识别<WP=4>算法做了详细讨论,最后应用序列模式识别的挖掘算法,设计了一个简单的web日志挖掘系统WLDMS,说明了在实际网站结构设计和经营管理中如何应用挖掘的模式,并利用它对合成树脂产品系统做了试验性的测试。