基于内容特征提取的兴趣建模

被引量 : 4次 | 上传用户:mhj911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机和互联网应用技术的飞速发展,使得人们逐渐从信息匮乏的时代迈入了信息过载的时代。在这个时代,无论信息消费者还是信息生产者都遇到了很大的挑战:信息消费者所感兴趣内容相较于海量的信息只能算沧海一粟,面对众多的选择和陌生的领域,消费者搜寻内心的渴望变得盲目;生产者为了让自己的信息能在信息海洋中脱颖而出,费尽心机却也收获甚微,自己的内容很轻易地淹没于信息的浪潮之中。而解决上述问题的一个很好的方法就是给用户提供个性化的推荐服务。正所谓“千人千面”,推荐服务需要了解用户的兴趣所在。为提高个性化推荐的准确性和多样性,用户兴趣建模成为工作的重点。然而,用户兴趣范围广泛且并不稳定,兴趣的表示方法和建模技术受到输入数据形式的制约,特别地,当用户的相关文档为非结构化的文本数据时,自动化建模有一定的难度。基于此背景,本文对基于内容特征提取的用户兴趣建模方法做了深入的研究。先后实现了基于主题词列表和向量空间模型的表示方法,并结合词表示(Word Embedding)的相关理论,提出了基于评论属性词提取和基于“句向量”两种表示用户兴趣偏好模型的方法。通过对结果的可视化展示,本文对句向量的特性和适用场景做了详细的探讨。最后,将本文提出的模型应用于视频推荐系统之中。本文研究的创新之处在于,融合了神经网络语言模型和向量空间模型对用户兴趣偏好进行表示。在一定程度上扩展了用户兴趣建模的思路,具有启发式的意义。
其他文献
在现当代文学史上,冰心以其“冰心体”散文和“爱的哲学”而闻名,评论界欣赏她清新典雅的文笔和纯洁无邪的创作主题,对她的分析也仅仅停留在“透明、纯洁”这样一个较浅的层
车的发明和使用是人类社会生活的重大创举,从最早的车发展到今天,车已经成为人类最主要的交通工具.目前学术界,对于车的起源和发展还是缺乏统一的意见,特别是在对中国古代车
目的:探讨PET/CT误诊的原因、特点并提高重视. 方法:对本院近1年来收治的PET/CT误诊为肿瘤的腹腔结核病例8例,在病史、临床特点、化验检查结果等进行分析. 结果:本组
目前一线城市甚至二三线城市都出现了交通拥堵的状况,庞大的人口数量加之迅速增长的机动车数量使城市变的拥挤不堪。国内外的学者对交通拥堵问题进行了研究,建立了很多拥堵评
本文列举了通感比喻中的换喻表现形式,并试图用换喻的认知路径来分析其具体认知过程。文中先介绍了最新的关于换喻的理论框架,明晰了换喻的认知结构。通过参照点结构来分析通
碳绩效评价是实现新型城镇化的重要内容。通过构建碳绩效评价指标体系,指导决策者及时纠正"负绩效",激励"正绩效",以达到企业碳减排的目标。论文借鉴平衡计分卡的精髓,以四维
密祉花灯作为一种民间歌舞戏剧艺术形式,有着多种形式和节目类型等特点被当地老百姓所喜爱,有着深厚的群众基础。密祉花灯由来已久,是研究该地区民族民间艺术演变发展实情、
数学课堂是培养学生创新精神和实践能力的主战场,在新课改的推行中提倡创造性思维教学,激发学生的发散思维,可以培养学生的变通能力和独创能力,以解决课堂上面临的问题。现结
随着我国市场经济的发展,竞争压力的不断加大,企业想要在激烈的竞争环境中立于不败之地,就要与时俱进,不断改进自身的管理会计以适应日益复杂的市场环境。本文将从我国管理会计在
足球不仅是世界第一大运动,更是人们强身健体的一种方式,而影响着足球课教学质量的提高和教学组织的设计的正是教学环境。河南省郑州市中学足球体育教育作为全省中学领航地区,足