数据挖掘的分类与聚类方法在用户访问行为中的应用研究

被引量 : 0次 | 上传用户:divide2058
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的蓬勃发展,用户网络行为越来越深入,通过特定工具采集用户网络行为信息越来越成熟,新兴的商业模式都需要精准定位用户的行为用以决策支撑。而以往的研究主要侧重于 Web浏览日志模式挖掘,较少针对特定商业需求,结合用户网络访问行为数据给出建议。数据挖掘的分类与聚类算法在商业环节中识别目标客户,挖掘行为偏好,寻找行为特征越来越受到重视。  本文首先对基于距离分类的KNN算法;基于回归的Logistic模型;基于决策树方法的C4.5算法、CART算法和随机森林算法结合实践进行阐述。针对统计软件无法实现的算法自行编写算法函数,并对各种方法的预测效果进行细致的评估。  其次对基于层次方法的AGNES、DIANA算法;基于划分方法的K-means、PAM、CLARA算法;基于密度聚类方法的DBSCAN算法结合实践进行阐述,重点讨论了算法实现的场景和效果评估。  最后通过实证的方法对用户访问黏性和连续访问路径两种行为,利用聚类和分类的方法挖掘用户的访问偏好和访问路径特定环节的影响因素。
其他文献
新型城镇化与产业结构演化调整是建设现代化经济体系的两个重要着力点。在新的时代背景下,建设新型城镇化有了更深意义,事关亿万人民的福祉,任重而道远;产业结构演化调整是经济
高技术产业是推动社会经济发展的重要力量,拥有高技术、高附加值等特点,具有一定的复杂性与研究价值。鉴于我国“诸侯经济”的特殊背景,我国区际间开放受到越来越多的关注。