论文部分内容阅读
随着网络的普及,以及相对于传统商务模式具有的无可比拟的便捷性,电子商务得到了飞速的发展。但是,由于电子商务网站中的海量的信息,用户很难瞬间定位到自己想要的商品。而对于商家而言,怎样发现客户,并留住来访的用户也是一个热点问题。
web使用挖掘的出现在一定程度上解决了上述的难题,许多学者提出并实现了基于web使用挖掘的个性化推荐系统,其能够大大提高用户的满意度。但是,对于新的来访用户,要判别其是否为潜在的消费客户,并为其制定对应的投放策略,还没有引起足够的关注。本文就是利用web使用挖掘技术,提取出了用户的模拟相似矩阵来存储用户与用户间的兴趣相似度,利用智能仿生算法中的蚁群算法来进行相似兴趣度用户的聚类,并在聚类的基础上,利用人工神经网络算法进行建模,判断客户的购买意向,进行客户发现的研究,为web营销提供策略。
由于客户购买兴趣不同,导致浏览具有不同的浏览特性。为了解决不同客户间的访问差异,首先要将客户分成具有若干访问特性的访问群体。本文采用蚁群算法来对客户进行分类。蚁群算法是模拟蚂蚁的群体行为而设计出的一类智能仿生算法,应用领域非常广泛,如聚类,模式识别等。本文系统研究了基于化学识别的蚁群聚类算法,并对其进行改进,提出了新的基于平均相似度的类解机制,使聚类质量较差的类别重新打散后再聚,并且引入了增量式聚类的思想,即根据新的访问数据来更新原有的用户聚类模式。与原来的蚁群聚类算法相比而言,该改进蚁群聚类算法具有更快的训练速度,以及更高的聚类准确度。
在增量式聚类算法的聚类结果基础之上,应用了基于BP神经网络来进行客户购买可能的预测,实现潜在客户的发现。由于用户的访问具有多变性,很难直接用线性或非线性的关系来表达,所以采用了复杂,隐式的BP神经网络。同一类别下的用户基本具有相同的访问习惯,在基于聚类基础上的预测,能得到更高的准确率。随着时间的推移,用户的集体访问习惯会有一定的变迁,本文又引入了基于增量式的聚类,能够不断更新用户的聚类特点和访问习惯,能够提高对时间迁移的容错率,提高潜在用户识别的精准率。
本文采集了某B2C网站一个月的用户访问数据,分别设计了实验来验证改进蚁群算法及BP神经网络预测模型的效果。关于增量式改进蚁群算法的验证是通过比较原蚁群算法和改进蚁群算法在个性化推荐时的准确率来评价改进蚁群算法的效果。实验结果表明,改进蚁群算法在数据动态增加的情况下,聚类结果更稳定。且从我们实验得出的推荐准确率看,明显高于原蚁群算法。从时间开销看,改进蚁群算法也明显节省了开销,提高了效率,尤其当数据是动态海量增加的情况下更加突显出增量聚类的优势。关于BP神经网络预测购买可能性的实验主要是设计了如何得到BP网络的特征,包括训练数据和测试数据的选择,并通过实验确定了网络的参数,分别将其应用于非增量和增量聚类的三个不同时间点的客户预测。实验结果表明,除了优化时间性能外,增加增量聚类后的客户发现预测准确率比起非增量的客户发现准确率更为稳定。