面向微博用户的潜在兴趣分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:cin_long
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于互联网的迅猛发展,网络应用不断涌现。微博,作为一种方便快捷的社交网络平台一经推出便获得了人们的喜爱,成为人们在工作和生活中记录生活,抒发情感,获取信息,结交朋友的一种主要平台。然而,随着微博的迅速发展,微博上的信息量也日益增长,巨大的信息量使得人们不得不耗费更多的时间寻找自己感兴趣的信息。本课题的主要研究内容就是:从微博用户的微博信息中获取用户的潜在兴趣。挖掘出的潜在兴趣可以用来向用户提供个性化服务,如根据用户的潜在兴趣向用户推荐朋友、相关信息、商品等。现如今很多流行的社交网站,比如新浪、人人、朋友网等,也向用户提供了推荐功能,但这些社交网站中的推荐并未涉及用户的文本信息内容,使得有些推荐不一定能够符合用户的心理。因此,若能根据用户的文本信息准确地挖掘出微博用户的潜在兴趣,那么就可以向用户提供更好的推荐服务。挖掘出的用户潜在兴趣除了可以用于推荐服务,也可以用于广告投放,商家可以根据用户的潜在兴趣向其投放相应的广告,这样能够获得更好的宣传效果和商业利润。本研究的主要贡献有以下几点:第一,候选关键词提取过程中,我们除了利用基于频率的关键词提取方法外,还考虑到了词在微博信息中的位置信息,通过二者相结合的方式提取候选关键词。第二,将主题模型应用到该问题上,并且根据微博信息的特点和本实验的要求,采用了简化的Twitter_LDA对候选关键词的潜在主题进行分析。第三,将SVM算法用于微博用户潜在兴趣的分析,对提取出的候选关键词进行分类,剔除那些非兴趣词。第四,为了进一步了解微博用户的内心,对分析出的潜在兴趣,进行情感分析。通过实验得出了以下几条结论:第一,候选关键词位置信息的加入,能在一定程度上提高兴趣词的准确率和召回率;第二,简化的Twitter_LDA在一定程度上能提高兴趣词的准确率和召回率;第三,SVM算法完全适合于微博用户潜在兴趣的分析;第四,特征的不同组合对兴趣词的提取有一定的影响。
其他文献
传统的入侵检测方法主要是误用检测和异常检测,在入侵检测系统中广泛使用,但其在应用中存在着维护困难、误报率高、报警的可靠性比较低等问题。这些问题出现的原因在很大程度
近年来互联网正强有力的改变着世界。信息革命不仅极大地改变了人们的生活方式,而且带来了巨大的社会变革。互联网成了一个巨大的信息源,如何在庞杂的数据中准确地抽取出用户
目前的应用软件的开发大多基于PC,随着移动通信网络的飞速发展以及移动终端硬件性能的大幅提高,做为对行业应用软件的有益补充和扩展,在移动终端上进行应用开发的软硬件条件
视频点播(Video-On-Demand,简称VOD)是计算机技术、网络技术和多媒体技术综合发展的产物,它按照用户的要求播放视频节目,改变了过去用户被动接收节目的状况。在大型体育赛会
网络规模和应用范围的迅速扩大,导致通过网络传播的病毒的数量越来越多,危害越来越大。在病毒尚未对网络使用造成严重危害前,采取有效的防护手段阻止病毒的传播成为一个研究的课
统一建模语言(UML)是对象管理集团(OMG)的标准,是一种用于对软件密集型系统以及商业建模和非软件系统进行可视化、详述、构造和文档化的建模语言,主要适用于分析与设计阶段的系
产品设计是制造业企业生产的核心与灵魂。把产品设计作为一个综合过程来研究已经有几十年的历史,研究也相对成熟。随着网络技术在制造业企业被广泛的应用,特别是因特网的存在
网络化制造是20世纪九十年代产生的一种新的制造模式和理念,其本质在于充分利用当前蓬勃发展的计算机和网络技术,结合制造业的特征和先进的集成管理理论,实现产品设计的全数字化
随着Internet 的飞速发展,网络应用已经深入人心。网络应用的日益增多使得Internet 的安全性也摆在了我们的面前。由于Internet 的开放性以及安全的脆弱性,无论是操作系统,应
知识管理是近年来国际学术界和产业界研究的热点问题,它在实践中尤其是商业企业中得到了日益广泛的应用,创造出了巨大的商业价值。从计算机学科的角度看待知识管理,它是以互