微博兴趣识别与推送系统的研究与实现

被引量 : 0次 | 上传用户:duyyy12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微型博客作为Web2.0时代互联网最广泛的应用之一,具有分散性、多样性、时效性和信息量庞大等特点。为了从大量的、分散的信息中,获取用户感兴趣的话题及相关信息,并实时推送给用户,本文针对中文微博,进行了用户兴趣识别和自动推送系统的研究和实现工作。本文在分析主流中文微博的信息特点和用户行为特点的基础上,结合国内外兴趣识别和微博交互的相关技术,重点研究了适合针对中文微博系统的信息采集、中文分词、兴趣识别和自动推送技术。本文的主要工作如下:在分析微博信息发布特点的基础上,提出了基于JAVA的任务调度技术,调用相关接口对微波信息进行采集;通过对国内外中文分词系统性能的研究,采用一种基于层叠隐形马尔科夫模型的中文分词系统与用户自定义词典相结合的分词方案,实现中文分词,同时,对分词结果进行停用词处理,以降低信息冗余度;通过对微博用户行为的分析,提出了文本分类和主题库词匹配相结合的策略,对用户兴趣进行识别;针对微博的时效性特点,采用监听器技术实现对微博信息的实时推送。本文以新浪微博为应用背景,对微博兴趣识别的结果进行详细分析。实验结果表明,论文提出的方案具有较高的准确性,能够较好地判断微博用户兴趣倾向,具有一定的工程应用价值。
其他文献
近年来,随着科学仪器的数字化、智能化、网络化的要求不断提高,以光学电子学和计算机技术为核心的图像采集处理系统广泛地应用于人们的日常生活,在国民经济发展中发挥着重要作用
介绍了以Xilinx公司Airtex-7系列FPGA为主控芯片的文件存储系统的实现。系统实现了即插即用、工作模式自动识别的文件存储系统。可进行文件存储、下载、删除,以及格式化操作;
阅读教学就是让学生借助文本,理解和体验文本的价值;借助文字的阅读,积累语文知识,训练语文技能提升人文素养。阅读是完成语文教学任务的重要手段,是培养学生全面发展不可缺少的途
目的:了解呼吸机相关性肺炎的预防与护理措施及效果。方法:选取收治的78例呼吸机相关性肺炎患者的临床资料,综合患者具体情况,均予以有效的预见性护理措施,观察护理后临床效
近几年来,“微博控”成为网络热门词汇,微博的火爆发展及其广泛影响可谓掀起了140个字符的革命。随着国内新浪微博、腾讯微博等微博系统的快速发展,微博打拐、7-23动车事故、微
为保证薄膜晶体管液晶显示器(TFT-LCD)产品装配质量,针对TFT-LCD结构特点及所用液晶材料,介绍一种日本某公司的TFT-LCD组装工艺与测试技术。研究并确定TFT-LCD组装工艺流程、
作为英语教师,如何激发和培养高职学生英语学习的兴趣是教学中一个尤为重要的部分。旨在对如何培养和激发学生英语学习的兴趣做出的几点思考,以抛砖引玉,并得到同仁指教。
科学预测我国纸消费量对指导行业发展规划,促进造纸工业有序、有条、有效发展,更好满足人们日益增长的对纸的需求具有重要意义.将灰色预测方法与马尔科夫理论结合,能有效提高预测
管理层激励机制是公司为了使高层管理人员与股东利益趋于一致性进行的一种安排,主要是为降低代理成本,提高经营效率。其与公司的经营业绩的关系,是国内外学者研究的热点问题。上
背景随着人口老龄化的加剧,脑梗死导致的危害越来越严重,给很多家庭和社会造成了极大的负担。虽然多数脑梗死危险因素是已知且可干预的,但目前仍有一些潜在的危险因素尚未得到解释,因而有必要进一步探究这些潜在危险因素,以便更好的预防脑梗死的发生。动脉粥样硬化(Atherosclerosis,AS)作为脑梗死的重要病因,目前已有很多证据表明,AS是一个慢性炎症过程,有多种炎症细胞和炎症介质参与这个过程。颈动脉