协同过滤推荐算法在社父网络中的研究与应用

来源 :湖南大学 | 被引量 : 0次 | 上传用户:liongliong508
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据过载问题已成为制约互联网发展的重要问题。个性化推荐技术有效地缓解了这一问题,但随着互联网系统复杂性增加、数据内容多样化,个性化推荐技术的应用暴露出一些问题,如数据冷启动、用户数据稀疏性、推荐系统扩展性等问题。协同过滤推荐算法通过研究用户的喜好,实现从海量数据资源中为用户推荐其感兴趣的内容,在电子商务中得到了广泛的应用。然而,当此类算法应用到社交网络时,相似度计算方法和评价指标的重点发生了变化,从而出现推荐算法效率偏低,推荐准确度下降,导致社交网络中用户交友推荐满意度偏低。针对上述出现的问题,文中提出并设计了基于用户相似度的协同过滤推荐算法,并在仿真实验环境下对算法有效性进行了验证。论文的主要工作如下:(1)分析现有的相似度计算方法,针对社交网络的特性,重新定义用户相似度及其计算方法。用户相似度由两部分线性拟合而成:①用户属性相似度。用户的基本信息组成,用户属性划分为数值型属性和名称型属性;②用户互动相似度。以用户间的会话信息为依据,找出用户间相似的发件人和相似的收件人,用度来衡量用户互动相似度。③对两部分相似度赋予不同的权重,线性拟合得到用户相似度。(2)以用户相似度为基础,设计基于用户相似度的协同过滤推荐算法,对算法设计的依据进行讨论。通过对相似度的计算,利用Top-N排序算法对候选集进行排序,为用户产生推荐集。对算法复杂度进行分析,并和其他算法的复杂度进行比较。(3)搭建实验环境,仿真实验环境基于ApacheMahout开源平台,使用社交网络中真实的历史数据展开实验,收集并分析实验数据,从准确率、用户回复率、推荐的覆盖率等不同维度度量,对协同过滤推荐算法、基于互动的推荐算法、基于用户相似度的推荐算法三种算法进行评价。在社交网络中离线状态下对真实环境进行仿真模拟,最大化的接近真实情况。实验结果表明:基于用户相似度的协调过滤推荐算法和其他二种算法的复杂度处于同一数量级,在不增加额外开销的情况下,基于用户相似度的协调过滤推荐算法在社交网络得到的推荐结果的质量优于另外两种算法,有着更高的用户满意度。
其他文献
时至今日,癌症仍然是人类最高危的疾病之一。由于基因芯片技术的迅猛发展,海量的癌症基因表达数据能够成功获取并用于研究。利用基因表达数据来分析诊断病症,已成为后基因组
目前我国用于蔬菜生产的温室大棚总面积居世界第一位,但机械化生产水平不高,随着人们生活水平的提高和劳动力的短缺,温室大棚种植对微型机械的需求越来越迫切。现在温室中蔬
信息技术的快速发展,各种类型的多媒体数据以数字化的形式在网络上发表和传播。然而由于网络的不安全性,数字化的多媒体数据很容易受到非法复制、拷贝和篡改。因此,必须对这
目前随着互联网规模的增长,搜索引擎是从互联网获取信息的重要工具,然而在高速的发展中,搜索引擎也存在着不足.据估计垃圾网页可能占到中国总网页数量的50%左右,虽然总比例在
本文选择了几种不同构型的穴盘和不同种类的生根粉,研究了在不同穴盘构型以及不同种类生根粉的作用下,果菜类穴盘苗根系的发生规律及其调控方法,并且设计出了一款新型控根育
橘红心大白菜(Brassica camperstris L.ssp.pekinesis)因球心暴露在空气中逐渐变成橘红色而得名,营养价值丰富、色泽艳丽,是大白菜品质育种的目标之一,细胞质雄性不育系(CMS)不需
利用基因表达谱数据进行肿瘤分类是生物信息学领域的研究重点之一。基于基因表达谱,使用现代数据挖掘方法研究肿瘤的发生机制有助于肿瘤的诊断和个性化治疗。但是,基因表达谱
地震危险性评价充分考虑场地周围地震影响区内潜在震源的活动性和区域地震影响衰减规律,对场地未来一定时期内可能遭受的地震影响强烈程度及其超越概率进行分析评估,对工程抗
金属构件发生疲劳损伤具有复杂性。大部分构件在使用过程中不可拆卸,传统的力学分析、晶粒分析等方式很难实时监控金属的疲劳损伤程度。实际上,在金属构件发生疲劳损伤过程中
庙3油田位于松辽盆地南部扶新隆起带(二级构造单元)的东北部,是一个近南北方向展布的单斜构造。研究区内泉四段断裂复杂,地震界面连续性差,实钻资料与预测结果误差较大,油层