论文部分内容阅读
随着互联网飞速迅猛发展,网站系统的设计和管理工作变得越加重要。从网络日志中提炼的有用知识可被用于网站结构设计,分析系统性能,理解用户的行为和动机,建立个性化网站等。用户是网站运营商最宝贵的资源,网站运营商应该更加关注用户的网络浏览行为,把握用户行为特征显得尤为关键。聚类分析技术是将数据区分为自然群体并给出每个群体特征描述的一种数据挖掘方法,是数据挖掘和知识发现的一种基本方法。聚类通过分析用户浏览行为特征,将用户划分为不同的群体。基于群体的行为共性进行细致分析,可以更好的理解用户行为,发掘用户的潜在需求和兴趣,发现其行为规律,以此完善网站结构设计,在电子商务环境下为用户提供与众不同的个性化服务。群体智能是指“任何启发于群居性昆虫群体和其它动物群体的集体行为而设计的算法和分布式问题解决策略”。基于群体智能的聚类算法具有比传统聚类算法更良好的聚类效果。蚁群聚类算法作为一种新型的优化方法,具有很强的鲁棒性和适应性,在求解复杂优化问题尤其是离散优化问题方面展现出了优异的性能和巨大的发展潜力。本文的研究基于群体智能理论,在综合国内外先进研究成果的基础上,选用了由复旦大学戴伟辉、刘寿吉等人最新提出的优化蚁群聚类算法,以实际收集到的网络用户浏览行为日志数据为例,通过数据预处理进行数据净化、用户识别、会话识别、路径补全等操作,再进行模式识别与分析,最后对用户行为进行聚类分析。从而达到可识别具有相似特征的用户群,成为分析用户和形成经营策略的基础,为用户提供更多适当服务以满足其需求。本文分为六个部分。第一章为本文研究背景、国内外研究现状、研究内容和组织框架的介绍;第二章是文献综述;第三章介绍了基于群体智能的蚁群聚类算法;第四章通过分析用户行为分类,给出了基于聚类分析的用户浏览行为分析过程及模型;第五章实际应用了优化蚁群聚类算法对网络用户行为进行聚类分析;最后一章是结论与展望。