论文部分内容阅读
随着时代的发展,微博作为网络资源中共享、交流的社交与服务媒介平台,逐渐融入到人们的日常生活中。微博平台在为网络用户的自由言论与互动提供一个相对稳定安全环境的同时,也为用户提供一个资源互换的空间。微博用户与用户、资源之间产生了大量的显性或隐性商业化的价值信息,可供用户之间进行资源互换。商业用户主要通过微博用户的兴趣标签、关注内容等有价值的信息,挖掘微博用户的兴趣,从而达到准确推荐商品的目的。在微博大数据环境影响下,如何根据用户需求精确实现微博商品、博文推荐,已经成为当前互联网大数据研究的热点。商家在对用户进行推荐时,通常使用主题模型、协同过滤等传统的数据挖掘算法与推荐算法。但传统的数据挖掘方法在进行挖掘有价值的微博信息时,常容易出现数据歧义、语义模糊、信息冗余等问题。为避免上述问题的发生,本文将微博交互信息作为基础数据源,提出TIN-LDA模型与微博个性化混合推荐算法,以提高挖掘微博用户兴趣与微博推荐的准确性。本文的主要研究内容如下:(1)基于微博时效性与交互性特点,构建TIN-LDA模型挖掘微博用户兴趣。由于用户显性兴趣信息和隐性兴趣信息之间存在交互性、相似性、时效性,因此在不同的环境与时间段下,微博用户兴趣信息呈现出不同的类型特点。为全面挖掘微博用户兴趣,本文根据微博的时效性推断微博用户动态兴趣取向,根据微博交互性推断微博用户兴趣层次取向,以此构建TIN-LDA模型挖掘微博用户扩展属性上的兴趣主题与主题词,该方法展现了微博用户潜在兴趣的层次与动态变化。本文以主题质量、困惑度为TIN-LDA模型的评价标准,实验结果表明TIN-LDA微博用户兴趣模型能更为精确的挖掘微博用户的兴趣。(2)基于传统推荐算法,给出微博个性化混合推荐。由于微博兴趣推荐时容易受到微博文本内容稀疏性的影响,基于内容的传统推荐算法和协同过滤推荐算法难以实现微博的个性化推荐。因此本文基于挖掘微博文本信息中“多源相关信息有利于提升用户推荐质量”这一假设,结合微博多源数据的多样性特点,提出基于KTL推荐算法;结合微博多源数据的个性化特点,提出融合KTL与协同过滤的微博个性化混合推荐算法。通过F-measure实验结果表明,相较于单一的基于内容的微博推荐或单一的基于协同过滤的微博推荐,微博个性化混合推荐算法能够获取更好的效果。(3)构建微博用户兴趣平台,可视化展示微博推荐TOP-K。考虑海量数据的场景,使用SSM框架、redis和ngnix等技术,实现微博用户信息数据源的分布式、并发处理及可视化展示。同时,将微博个性化混合推荐算法与echart可视化界面相结合,应用于微博用户兴趣与商业推荐的结果展现。通过构建微博用户兴趣平台展示推荐TOP-K,平台的展示结果对于挖掘商业化的信息具有一定的价值。图[20]表[6]参[84]