论文部分内容阅读
社交媒体是Web2.0时代新兴的一种重要的互联网数据来源,其中所包含的海量、多源的社交媒体信息可以被广泛应用于信息检索和数据挖掘等信息技术领域。与此同时,社交媒体的不规范性、多样性以及即时性等特点也为社交媒体信息在这些领域的应用带来了新的挑战。为此,本文对基于话题树的社交媒体信息结构化组织方法及其应用进行了研究。其中,我们首先利用自动生成的话题树实现了对社交媒体信息的结构化组织。接下来,为了满足不同用户的信息需求,我们对社交媒体信息的层次化检索进行了研究。最后,为了更加主动地为用户推荐信息,我们提出了基于话题树的推荐模型以及推荐理由生成算法。具体的,本论文工作主要在以下三个用户交互层面上展开:?在信息组织层面,本文提出了一种基于话题树的社交媒体信息结构化组织方法。与以往的信息组织方法不同,这种方法通过话题树自动生成算法将组织结构构造和文档聚类这两个任务整合为一个框架,并且实现了信息组织结果的动态更新。特别的,该方法利用多源社交媒体之间的互补性来克服单个数据源的不同缺陷,从而极大地提升了信息组织的性能。?在信息检索层面,本文提出了一种社交媒体信息层次化检索方法。针对社交媒体内容以及来源的多样性,该方法一方面利用检索结果之间的语义关联来获取对应的话题层次结构。另一方面,它将数据源相关特征融合到传统文档排序函数中,从而显著改善了对多源社交媒体信息的检索性能。?在信息推荐层面,本文提出了一种基于带权话题的隐向量推荐模型。该方法利用话题树中隐含的话题-物品评分、话题-话题关联以及话题活跃度等信息来克服传统推荐模型中的数据稀疏问题。其中,针对社交媒体内容参差不齐的特点,我们采用了一种话题权重学习算法来提升推荐系统的性能,并通过为用户生成个性化的推荐理由来进一步改善用户的使用体验。