论文部分内容阅读
科技服务业作为一个新兴产业,如今在现代服务业中已经扮演了十分重要的角色。在科技成果爆炸式增长的情况下,如何快速为科技从业人员或研究人员查找推荐优质的科技服务资源已经成为一个越来越重要的课题。科技服务业种类繁多,其中科学研究服务与技术咨询服务在科技服务业中占有很大的比重。如何为科研工作人员推荐其感兴趣的科技文献,以及如何为科技从业人员提供专家咨询服务的推荐是本文的重点。传统的推荐系统大多基于内容进行推荐或者基于协同过滤进行推荐,常常存在冷启动以及推荐结果的可解释性差等缺点。为了解决以上问题,本文通过融合多个数据源构造科技服务知识图谱,主要涉及到科技文献推荐服务和科技咨询服务等领域。基于科技服务知识图谱,为科研人员和科技从业者推荐科技文献和科技咨询服务。本文提出一种结合用户偏好与知识图谱路径信息的科技文献推荐方法。通过科技服务知识图谱中的文献关键字,以及用户操作等信息构造用户偏好。由于科技服务知识图谱中存在出度较大的节点,以一般的广度优先搜索方式生成路径将会耗费大量计算资源。本文提出一种基于延迟扩展的双向广度优先搜索方法。通过这种方法可以快速的生成两个节点之间的路径。最后利用LSTM(Long Short-Term Memory)提取多条路径的信息,并结合用户偏好为用户推荐其感兴趣的文献。科技从业人员在工作过程中可能存在针对专业问题需要咨询相关专家的情形。本文通过FP-growth算法挖掘专家在科技咨询中问答记录的频繁项集,并将提取出的专家共现信息融合到科技服务知识图谱中。而后通过Deep Walk提取图特征,生成专家,话题节点的词向量。本文结合提取出的图特征,统计特征和问题的文本特征,提出一种改进的Deep FM模型。通过这个模型为科技从业人员提供科技咨询服务的推荐。