论文部分内容阅读
随着信息技术的快速发展,web2.0技术催生了大量的在线内容。在这种情境下,帮助用户发现有用的信息将迎来巨大的挑战。在科研领域,科技论文呈现出爆炸式增长趋势。科研信息过载限制了科研人员的信息搜寻能力。如何帮助科研人员快速有效的找到感兴趣的论文成为亟需解决的问题。近年来,社交网络服务的兴起为研究者提供了公共平台,帮助他们很方便的分享感兴趣的文献并推广自己的成果。推荐系统作为新兴技术用于解决信息过载问题,已经被成功应用在社交网站中提供个性化信息服务。因此,推荐精度成为满足在线用户信息需求的至关重要的因素。在社交网络服务中,用户行为交织在计算机系统中,用户通过互相结成好友关系和参加群组开展在线社交活动并协同创造内容(例如标签、评论等)。社交网络服务方便了用户的信息交互同时也给信息搜寻实践带来新的挑战。本文将开展科研社交网络中的论文推荐研究,探寻解决信息过载问题的论文推荐方法,试图为科研人员提供个性化的论文推荐服务。现有的关于文章的推荐的研究主要集中在电子图书馆和分享型网站领域,针对科研社交网络的论文推荐研究还不充分。同时现有的推荐方法还存在诸多缺陷和不足。例如基于内容的推荐方法大多采用关键词直接匹配技术,从而会产生“失配”问题。基于协同过滤的推荐方法大多依赖用户偏好信息,而其他社交网络信息没有得到深入的挖掘,从而产生“数据稀疏”问题。现有的混合推荐方法主要集成相关度和连接度特征信息,却忽略了影响用户满意度的论文质量信息。为了弥补现有研究的不足,本文提出了一种集成的科技论文推荐框架,为科研社交网络中的研究者提供个性化论文推荐服务。本文采用设计科学研究方法,旨在创造和构建人工智能体(例如构念,模型,方法,原型系统等),以拓展和提升人和组织的能力。设计研究方法包含构造和评价两个阶段:在构造阶段,我们提出集成的科技论文推荐框架,设计了语义内容过滤方法用来解决关键词“失配”问题,提出了基于评分和基于随机游走的协同过滤方法用来解决“数据稀疏问题,并最终通过质量度分析评估科技论文阅读价值,从而提高推荐满意度;在评价阶段,我们首先以实验的方式在CiteULike数据集上验证了所提的语义内容过滤方法和另外两种协同过滤的有效性,其次,通过用户调查的方式在ScholarMate平台上评价了集成推荐框架的有用性,并将所设计的方法和算法成功应用在科研社交网络平台中。本文开展的科研社交网络的论文推荐研究有以下三个方面的贡献:首先,本文提出了集成的科技论文推荐框架和方法,为科研社交网络中的科研人员提供个性化论文推荐服务;其次,本文设计并开发了论文推荐的原型系统,并将系统成功运用在科研社交网站中,促进信息共享与合作;最后,本文通过离线实验和在线用户调查验证了所提的推荐框架和推荐方法的有效性。