论文部分内容阅读
传统门户网站一直沿用着资讯栏目堆砌模式,将海量信息堆积在门户网页上供用户浏览。堆砌模式具有在有限版面上置入大量信息的优势,可以满足不同兴趣偏好用户的多样化需求,但也存在着用户获取信息效率低和获取信息同质化的两大问题。推荐引擎是用户发现信息的重要工具,通过机器学习方法对网站流量数据进行挖掘,分辨出用户的行为模式、兴趣偏好等,向用户推荐适合的内容,可以有效地解决传统门户网站存在的两大问题。 本文首先介绍了互联网信息过载的时代背景,分析了目前传统门户网站所面临的问题,提出了应用推荐引擎开展个性化信息推荐的解决思路,同时介绍了推荐系统的相关基本理论、机器学习方法及其研究现状。其次,阐述了个性化信息推荐的相关概念,对推荐系统在电子商务、互联网广告、本地化生活服务三个互联网热点领域的应用场景进行归纳,并重点描述了基于协同过滤原理的个性化信息推荐流程。再次,分析了zcsl.cc网站运营流程和主要的量化指标,指出提高转化率是zcsl.cc网站商业模式成功的关键。进而围绕zcsl.cc网站商业模式的核心点,提出了个性化推荐引擎构建的三个主要问题:用户兴趣爱好归纳存在的问题,网站内容同质化存在的问题,个性化推荐内容准确度的问题。然后,研究了个性化推荐引擎解决上述三个问题的原理,并给出了具体方法:应用聚类技术创建代表用户,应用关联分析归集代表用户的兴趣项集合,应用协同过滤算法计算在线用户相邻代表用户感兴趣的内容并给出推荐结果。最后,结合R软件,以zcsl.cc网站的用户访问行为日志数据作为实验的数据,进行聚类、关联分析、协同过滤实验计算,给出了解决问题的步骤并对计算结果进行了验证。 本文引入代表用户的概念,应用机器学习方法创建代表用户、归集代表用户的兴趣项、计算在线用户相邻代表用户感兴趣的内容、结合兴趣内容广度与用户兴趣度的T字型平衡,将个性化信息推荐结果给到在线用户,构建了基于协同过滤的门户网站个性化推荐引擎,具有一定的创新性。