论文部分内容阅读
在市场经济下,企业竞争就是对客户和市场的争夺,如何能够根据用户需求改进营销策略和网站结构,从而抓住市场,吸引更多的客户群体,已成为企业竞争的关键。然而传统的通过用户注册来记录用户信息的模式已不能满足企业想要了解最新最全面的用户信息的需求。随着信息技术和网络技术的快速发展,人们越来越频繁的进行网上活动,Web上产生了海量访问数据,这些数据以日志形式存放,其中隐含着用户访问网站及交易习惯和兴趣,企业可以对这些数据进行处理从而得到有价值的信息。本文在分析如何从Web日志中得到用户信息的基础上,结合数据挖掘的特点,给出了基于关联规则的Web日志挖掘系统架构。首先,对Web日志挖掘系统架构的各个层次和各部分功能,以及关键技术进行了说明,并介绍了整个系统的设计流程。其次,结合Web日志数据的特点,分析并研究了数据预处理和挖掘算法实施过程;在挖掘算法实施过程中,本文选择关联规则算法,对经典的关联规则挖掘算法进行剖析,并将其与已有改进算法进行比较,在此基础上,提出一种引入关联矩阵思想的关联规则改进算法,实验证明在相同最小支持度和记录数下,改进后的算法效率优于其他算法。最后,将论文的研究成果初步应用于某海运企业管理网站,实践证明该系统的应用使得企业获得的用户信息更及时准确,用户服务质量明显提高。