论文部分内容阅读
随着移动互联网、物联网、社交网络等新技术产生和发展,人们已经从信息匮乏时代过渡到了信息过载(information overload)时代。博客、社交网络服务SNS(Social Networking Services)、微博、微信、论坛等新型互联网应用形式不断涌现,互联网上的信息量呈现了爆炸式的增长,大数据(Big Data)时代已经来临。 目前一些大型网站,例如亚马逊,在商品推荐服务方面已经做的很好,并取得了良好的效果,智能推送逐渐成为信息服务领域的研究重点。如何将用户所感兴趣的信息从大量的数据信息中挖掘出来,以便为用户提供智能化的服务,已经成为了众多学者们研究的一个新的热点话题。 本文以论坛版块的发贴内容为研究样本,将影响论坛用户兴趣的很多因素概念化为具体的指标,利用相关的网页提取技术,获取论坛用户中用户发帖内容的特征数据,采用特征向量来描述论坛用户的兴趣信息,建立论坛用户的兴趣模型,运用数据挖掘相关技术对用户兴趣进行深度挖掘,从海量数据中挖掘出用户感兴趣的内容。 通过研究论坛用户的发贴内容的特征数据,挖掘和发现用户的兴趣点,分析用户兴趣的变化规律,预测用户可能喜欢的内容,无论是商业营销还是信息服务,对于提高个性化服务水平和服务质量,以及提高用户体验,都具有重要意义。