论文部分内容阅读
随着近年来互联网的飞速发展,个性化推荐已成为各大主流网站的一项必不可少的服务。提供各类新闻的门户网站是互联网上的传统服务,但是与当今蓬勃发展的电子商务网站相比,新闻的个性化推荐服务水平仍存在较大差距。一个互联网用户可能不会在线购物,但是绝大部分的互联网用户都会在线阅读新闻。因此资讯类网站的用户覆盖面更广,如果能够更好的挖掘用户的潜在兴趣并进行相应的新闻推荐,就能够产生更大的社会和经济价值。个性化新闻推荐的主要挑战是帮助用户寻找他们感兴趣的文章去阅读。推荐系统要对用户的历史阅读行为进行分析,建立模型,最后给用户推荐未产生过行为的新闻。本文以基于用户行为的个性化新闻推荐系统为研究课题,重点研究了用户的行为以及如何更准确、有效地进行新闻推荐。主要研究的内容共有三个部分。第一,研究了基于用户的行为及用户阅读的新闻主题的推荐算法。该算法在计算用户或新闻相似度时融合了行为特征及主题特征两种数据,计算出最终的相似度。缓解了数据稀疏性的问题。在对该实验的过程中,分析出对用户推荐新闻的过程中,起主要作用的是用户的行为数据,说明推荐算法的性能主要是靠用户的行为数据。第二,研究了一种基于隐马尔可夫模型的推荐算法。该算法主要根据用户对新闻的行为数据来建立马尔可夫模型,预测用户阅读的下一条新闻。该算法简单易懂,不用对新闻数据进行文本主题提取,而且算法可自动过滤一些“过期的”新闻,不用考虑时间的因素。最后根据相似的用户阅读新闻的行为具有相似性对用户进行聚类,改进该算法。改进后的算法比没有聚类的情况要好,算法性能有所提高。第三,对基于隐马尔可夫模型的协同过滤算法进行系统设计。对新闻推荐进行需求分析,设计了包括新闻、网站和系统等元素的推荐场景,其中推荐系统是核心,在此基础上设计了基于马尔可夫模型的推荐系统的架构,以及各个核心。最后,完成了算法结果的展示系统,把推荐结果展示到web界面上。