推荐系统关键技术研究

被引量 : 0次 | 上传用户:dder77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,信息技术已经从专业领域应用扩展到了人类工作和生活的各领域。形式多样的互联网信息服务和应用已渗透到人们生活的方方面面,人类社会原有的物理活动正逐渐向互联网虚拟空间活动演变。特别是社交网络、云计算和P2P应用等技术和服务形式的迅速普及,传统互联网一对多的应用模式正在过渡到多对多的web2.0应用模式,用户不仅是信息内容的使用者,同时也成为信息内容的制造者和传播者。伴随互联网信息资源规模的迅猛增长,用户要在海量信息空间中获得符合自己需求的信息也越发困难,形成了信息过载问题。学术界和业界对信息过载问题表现出了广泛的关注,开展了大量的研究和实践工作,提出了多种形式的信息个性化解决方案,以期为互联网信息服务用户提供符合其自身需求的信息。推荐系统作为一种智能个性化信息服务系统,其可借助用户建模技术对用户的长期信息需求进行描述,并根据用户模型通过一定的智能推荐策略实现有针对性的个性化信息定制。鉴于推荐系统具有用户需求驱动、主动服务和信息个性化程度高等优点,推荐系统在电子商务、在线学习和数字图书馆等领域得到了广泛应用,并已成为公认最有前途的信息个性化技术发展方向。虽然推荐系统的研究和应用已经取得了一定的成果,但随着近几年网络用户与信息资源规模进一步增长,传统推荐算法中存在的问题逐渐暴露和放大,特别是推荐系统的稀疏性问题和概念漂移问题已成为影响推荐系统准确性的主要问题,妨碍了推荐系统的进一步推广和应用。为了适应互联网信息服务的发展趋势,进一步提高推荐系统及其算法的推荐准确性,本文以减少稀疏性问题和概念漂移问题对推荐算法的影响为目标,对以下八个方面的内容进行了研究和讨论:(1)对互联网信息服务的发展现状进行分析,简要回顾了推荐系统的发展历史,概括总结了推荐系统研究和应用的现状,并详细分析现有推荐算法中存在的问题。(2)对信息过载问题进行了问题定义和成因分析,在对传统信息检索和信息过滤技术进行对比研究的基础上,从用户建模、推荐策略、算法分类和算法评估等方面,对推荐系统进行全面分析和讨论。(3)分析稀疏性问题的主要成因和表现,总结稀疏性问题直接和间接影响推荐系统的主要途径,结合现有针对稀疏性问题所进行的算法改进,给出了解决稀疏性问题的主要方法和策略。(4)传统项目间相似度计算方法存在对公共评分的过度依赖,稀疏性问题会引起公共评分数量的明显减少,而基于少量公共评分的相似度计算将难以保证计算结果的准确性和可信度。针对稀疏性问题对相似度计算的影响,结合传统相似度计算的上述缺陷,提出了一种基于加权相似度的协作推荐算法WSBCF,该算法通过在相似度计算中引入评分重合因子,实现了对相似度计算的修正,从而提高了推荐在稀疏评分环境下的准确性。(5)传统协作推荐的评分预测过程是一种建立在非稀疏评分矩阵上的理想化决策过程。在稀疏评分环境中,过度依赖个性化评分将引起推荐的整体准确性下降。针对稀疏性问题对评分预测过程的这一影响,结合人类在推荐服务中所表现出的从众心理,提出了一种基于平衡评分预测机制的协作推荐算法IBCFBP,该算法综合考虑个性化评分和全局评分在评分预测中的决策支持作用,通过动态调整个性化评分和全局评分在评分预测中的作用,从而完善和改进了传统评分预测过程。(6)协作推荐算法的各执行过程都依赖于评分矩阵实现相应功能,评分矩阵的稀疏性将对整个协作推荐产生全方位的影响。针对评分矩阵稀疏性对协作推荐的影响,在推荐对象内容可解析的应用环境中,结合基于内容推荐算法对稀疏性问题的不敏感性,提出了一种基于评分填充的混合推荐算法HRRF,该算法通过采用基于内容的推荐算法,实现了对稀疏评分矩阵的个性化评分填充,提高了评分矩阵的数据密度,从而缓解了稀疏性问题的影响。(7)分析概念漂移问题的主要成因和表现,总结概念漂移问题影响推荐算法的主要途径,结合机器学习和推荐系统领域的现有改进算法,给出了解决概念漂移问题的主要策略。(8)针对概念漂移问题对协作推荐系统的影响,结合评分重要性随时间指数形式衰减的性质,提出了一种利用评分时间特性的协作推荐算法TIBCF,该算法利用评分时间权重同时实现了对相似度计算和评分预测两个计算过程的修正,从而缓解了概念漂移问题对协作推荐的干扰作用。本文通过对上述研究内容的讨论,阐明了信息过载问题的产生原因和影响,全面分析了影响推荐系统发展的相关问题,特别针对稀疏性问题和概念漂移问题对协作推荐算法的影响,通过对协作推荐算法各执行过程的完善和改进,提出了相应的改进算法,并实验证明了所提算法在提高协作推荐预测准确性方面的有效性。本文的主要贡献包括:(1)从互联网信息服务的视角阐述了信息过载问题的产生原因和影响。(2)分析了个性化信息服务的需求,对个性化信息服务进行了形式化定义。(3)归纳总结了推荐系统的组成结构和工作原理,分析和讨论了推荐系统涉及的用户建模、推荐算法和算法评价等内容。(4)讨论了稀疏性问题和概念漂移问题的主要成因,以及二者影响推荐系统的途径,对比分析了现有解决方法,概括了解决二者的主要策略。(5)针对稀疏性问题对协作推荐的影响,通过完善相似度计算、改进评分预测机制和提高评分数据密度,缓解了稀疏性问题的影响,分别提出了WSBCF、IBCFBP和HRRF算法,并通过实验证明了上述三种算法,在提高推荐准确性方面的有效性。(6)针对概念漂移问题对协作推荐的影响,通过时间权重改进了相似度计算和评分预测过程,相应提出了TIBCF算法,并实验证明了该算法在解决概念漂移问题以及提高推荐准确性方面的有效性。
其他文献
饲料抗营养因子是饲料原料本身固有的成分,会使饲料的转化率下降,而且影响畜禽的生长性能和产品品质。本文对几种主要抗营养因子的抗营养作用及其消除方法研究情况进行了综述
2010年3月31日,融资融券正式亮相于我国证券市场,学术界对于它能否有效提高我国股市运行机制仍然存在着争议。值此融资融券推出近两年的契机,本文利用上海证券市场的经验数据
随着城市商业银行的异军突起和金融产品的不断创新,小额信贷业务已经成为金融发展史上一项重要的新生事物,也逐渐成为城市商业银行的支柱信贷产品,是城市商业银行赢利的主要
<正>【案情】就犯罪嫌疑人刘某涉嫌贩卖毒品一案,浙江省温州市龙湾区人民法院审理查明:一、2012年7月份左右的一天,被告人牛某某在温州市鹿城区下吕浦飞龙组团其暂住处将一包
改革开放30年,广东经济创造了一个令人瞩目的奇迹,在这个大环境下,广东中小企业也得到了飞速的发展,中小企业在经济增长中的地位日益明显,是促进经济增长的重要力量。然而广东经济
众所周知,卢梭和牛顿的思想是康德思想的两大来源,因而,解读康德的模式也有两种:在卢梭的思想的视域下解读康德的思想;在牛顿自然科学理论的视域下解读康德思想。然而,国内学界
随着我国政府对体育产业发展的大力支持,社会各界投资体育产业的热情逐渐蔓延。我国现阶段体育产业投融资项目与发达国家相比,仅处于萌芽状态,投资主体已经从政府一手操办转
农村幼儿园周边有丰富的自然材料,不仅获取容易,而且适合孩子操作和学习,因此,农村幼儿园可以大量运用自然材料来开展教育活动,建设“低成本、有质量甚至是高质量”的特色幼
黄土高原的土壤侵蚀是我国的重要环境问题之一,一直备受关注。坡耕地是该区土壤侵蚀的重要来源,一方面制约着当地的经济与社会发展,另一方面引发下游地区洪涝灾害、非点源污染等
中部崛起战略给湖北省高技术产业带来了难得的发展机遇,武汉城市圈作为中部最重要的区域之一,区位条件优越、产业基础扎实、科教实力雄厚,发展潜力巨大。高技术产业具有高智力密