论文部分内容阅读
随着交友网站的发展,有目的地针对特定的交友用户进行广告投放具有明显的商业盈利价值。为了提高网站的知名度,降低运营成本,汇聚更多的用户,交友网站需要根据站点访问记录,利用Web日志挖掘技术,分析用户浏览模式,深入了解用户的访问兴趣和偏好。最终改进站点服务和广告投放渠道及投放模式,使更多的用户了解网站,对网站产生信任感。针对女之海交友广场网站的实际需求,本文将关联规则算法引入到面向交友网站的Web日志挖掘中,研究了具体的流程和关键技术,并实现了一个满足该网站要求的Web日志挖掘系统。主要工作包括:1.研究、分析和比较了现有Web日志挖掘技术;2.提出了一种获取网站拓扑结构的新方法。在Web日志挖掘数据预处理阶段,往往需要根据站点的拓扑结构来进行用户识别、会话识别和路径补充。然而目前通常都是根据网站呈现的结构特点由人工构造站点的拓扑结构,或者是利用离线浏览软件从Web服务器上直接下载网站的结构信息,再进行离线处理,构造出站点的拓扑结构。况且面对动态网站时,离线浏览软件无法获取完整的网站结构信息。因此,本文提出了一种利用软件自动获取最新网站拓扑结构的方法;3.设计并实现了一个面向交友网站的Web日志关联规则挖掘系统。该系统主要包括自动获取网站结构、数据预处理、模式发现和模式分析这四个功能。先对原始日志数据进行预处理,再将它和会员信息结合起来,使用关联规则挖掘技术进行挖掘得到被用户频繁访问的会员所具有的属性之间的关联关系。对挖掘得到的结果采用图表的形式进行可视化分析,从而获得相关的决策信息,为网站和会员的宣传以及推广提供有益的借鉴;4.将该系统应用于女之海交友广场网站,通过对其进行Web日志挖掘,得出了有益的结论。根据Web日志挖掘结果,该站点的访问用户大多在美国、香港、台湾等国家或地区,公司的管理者可以考虑在这些区域刊登广告对网站和会员进行宣传。其中位于美国的访问用户,大部分会频繁地访问身高在160cm到165cm之间且年龄小于25岁的女会员,公司可以选择发展有这类特征属性的女会员。