基于用户行为分析的个性化推荐系统设计与实现

被引量 : 0次 | 上传用户:zym_Java
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet迅速普及,如何从浩如烟海的互联网数据中迅速找到相关信息,是互联网用户面临的重要问题,也是互联网技术研究的重点之一。目前,搜索引擎和信息过滤是解决该问题最常用到的两种主要技术。个性化推荐是一种新兴的信息过滤技术。它从用户的历史行为数据中发现用户的兴趣偏好,采用“推送”的方式,将用户感兴趣的信息从大量数据中过滤出来,并根据用户对信息“感兴趣”的程度,按一定的方式将相关信息呈现在用户面前。对于电子商务平台而言,使用个性化推荐技术,有助于提升平台的“长尾”优势,增加利益攸关方的收益。本文将个性化推荐相关技术引入“搜房网”垂直搜索引擎升级的设计中,分析历史用户的操作行为,提取其的兴趣模型,使用基于用户协同的过滤方式,发现当前用户兴趣,在项目库中找出当前用户可能感兴趣的信息并将之推荐给当前用户,缓解垂直搜索引擎面临的“过度筛选”问题。本文主要工作如下:概述了个性化推荐领域的经典算法、理论、研究热点及相关技术,比较了基于规则发现、基于内容过滤和基于协同过滤等相关算法和理论的优缺点,并阐述了它们各自的应用场景。同时还简要介绍了隐马尔可夫模型的相关理论。基于“搜房网”搜索引擎的用户行为特点,分析了搜索引擎系统的用户搜索行为日志,从而给出了用户行为、用户行为序列的相关定义。设计了一个序列融合算法,提取日志中的用户行为序列,同时,提出了一种计算用户行为序列相似度的方法。根据用户行为序列对用户进行了建模,并基于隐马尔可夫模型理论,设计了预测用户行为序列的模型及模型参数的估计方法。进而设计了一套基于用户行为序列分析,综合考虑了用户协同、用户行为序列相似性、项目时效性等因素的项目推荐算法。此外,还制定了相关的“冷启动”策略。最后,结合“搜房网”的实际需求,设计并实现了一个房屋信息个性化推荐系统。设计相关实验,在真实的数据集上,验证了系统的用户行为预测效果,结合隐马尔可夫模型特点,分析了系统关于用户行为预测设计上的一些局限性。并结合系统特性,讨论了评价推荐项目相关性和推荐列表排序正确性的相关指标。设计实验,评估系统在推荐列表排序、推荐项目相关性等方面的实际效果,并在此基础上分析了系统设计的不足,对系统的下一步工作进行了展望。
其他文献
西柏坡精神,概括地讲就是中共中央在西柏坡时期领导全国人民为夺取中国革命的彻底胜利、建立和建设新中国所形成的一系列思想观念、政治主张、行为方式的总和。它作为代表伟
<正>中国在解决乌克兰危机问题上的立场和态度,是中国对外政策的一个成功表现,同时也是对中俄关系发展状态的一次成功诠释。整个危机期间,中国一贯保持客观公正的立场,不偏袒
<正>"细"、"严"体现风险监管新形势当前,信息技术、网络技术的迅猛发展冲击着各个行业,而银行业由于其自身服务特点成为广泛引入信息技术的行业之一。从业务流程的电子化到服
随着国家十二五规划的制定,污水处理厂的脱氮除磷要求日趋严格,奥贝尔氧化沟作为山西污水处理厂的主流工艺,在冬季低温状况下,保证其较好地发挥其对污染物的降解能力,调试工
在中国的电影艺术领域当中,张艺谋和贾樟柯被人们誉为中国第五、第六代电影导演的领军人物,他们都是从艺术电影起家的,不同的是张艺谋现在已调转方向,把更多的精力放在商业电
装配式建筑是建筑技术的重大变革,需要市场主体主动打破原有合作模式,寻求更优合作路径,以实现建筑产业链可持续的发展。针对中国装配式建筑发展还处于初级阶段,过度依赖于政
孙中山不仅是伟大的革命先行者,而且是中国现代国家的设计者和建设者,其宪政思想是现代国家建设在政治层面上的具体体现。在中国近百年宪政思想史演进过程中,孙中山的宪政思
<正>赊销是企业的促销手段之一,其基于商业竞争和销售、收款存在时间差两方面原因而产生。赊销是一把"双刃剑",它可以扩大销售、增加盈利,扩大市场占用率及开拓新市场,能减少
浙江的改革始于农村,浙江的快速发展也得益于农村改革发展的成功。经历了改革开放36年的发展,浙江的农村发生了翻天覆地的变化。农民的生活水平大幅提高,基本实现了从温饱到
在对应收账款进行风险管理过程中,应当适当运用应收账款保理业务进行风险转移。本文将对应收账款保理业务发展中的应注的问题进行探讨。