基于信息抽取的个性化校园日历系统的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:minhu315
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网的飞速发展,信息数据也随之越来越多样化和复杂化,这也给用户在查询信息时带来了很多的不便。如何从每天不断涌现的大量的数据中提取出需要的信息的也成为自然语言处理研究的重点。而本文研究的信息抽取技术应运而生,将大量无序、不规则的信息抽取出来并结构化存储,对推动信息技术的发展具有重要作用。本文的特色是研究了以事件和时间为中心的信息抽取技术,并且设计和实现了个性化校园日历系统。主要创新点和研究成果如下:首先,设计和实现了一种将规则和统计模型相结合的中文实体关系抽取算法,该方法利用正则表达式抽取出准确结果,采用条件随机场模型和最大熵模型相结合的机器学习方法给出补充结果,提高了准确率和召回率。该方法在TAC-KBP评测的SlotFilling任务中取得了较好的效果。其次,提出并设计实现了个性化校园日历系统,该系统在抽取事件信息的同时对事件中的时间信息进行整理,为人们全面了解事件提供了线索。此系统采用基于规则的方法抽取了文本信息中的时间表达式并对其进行归一化处理。在此基础上,提出词激活力模型的事件起止时间表达式的识别方法。事件的起止时间对于了解事件的发展进程提供了更多的信息。该系统已经在校园实体搜索引擎系统COSE中成功应用并上线。第三,提出一种基于WAF的情感倾向词表扩展方法以及基于机器学习的文本的情感倾向性判断方法。该方法在2011COAE评测的任务一观点词抽取与倾向性判断的问题解决上取得较好成绩。该算法模型为校园日历系统添加了情感倾向性判断功能。该功能可进一步应用于校园舆情监控。
其他文献
目的:探讨子宫平滑肉瘤的临床、病理特点,及术后60个月内随访结果,分析其预后及可能存在的影响因素.结果:该2例子宫平滑肌肉瘤均可见明确的癌及肉瘤组织成分,癌成分均为子宫
目的:观察我院护理工作实施量化管理前后在工作质量上的变化与差异.方法:依照我院各科室护理工作的实际开展情况随机抽选共5个科室,在科室护理工作展开过程中实施护理工作量
目的:传统的椎管内麻醉是以手触诊骨性解剖标志作为定位手段,观察到有脑脊液流出作为判断而进行的盲探性操作[1].但是在高龄,肥胖,脊柱畸形等患者中失败率较高[2].目前,超声
目的:对失眠症治疗过程中中西医结合治疗效果进行观察.方法:从2017年8月至2018年8月成承德市中医院收治的失眠症患者中选取120例随机分成两组,对照组60例,利用舒乐安定、阿米
目的:坏死性筋膜炎(necrotizing fasciitis,NF)是表现为皮肤、皮下组织、筋膜以及肌肉的广泛坏死的坏死性软组织感染;NF分为4型;NF依据诱因、症状、特殊体征、辅助检查、手指
目的:观察硝酸银软膏治疗长期卧床老年人褥疮的临床效果.方法:选取某养老机构收治的56例长期卧床老年人褥疮患者,将其随机分为观察组和对照组,每组各28例.对照组采用常规临床
摘要:数学和其他学科相比,具有更严谨的知识结构,需要逻辑与想象思维,需要反复操练与复习巩固。在教学过程中,若教师缺乏有效方法,则会导致教学枯燥乏味,使学生形成厌倦情绪,甚至产生厌学心理。因此,在初中数学教学中,教师需结合学生学习特点,选取有效教学方法,增强学生学习体验,以調动学生学习积极性,使其快乐学习。  关键词:初中数学;有效教学;方法  中图分类号:G633.6 文献标识码:A 文章编号:1
目的:探索睾丸支持细胞和骨髓干细胞的分离和体外培养技术;观察睾丸支持细胞对骨髓干细胞生长、增殖的影响;观察睾丸支持细胞和全反式维甲酸对骨髓干细胞向精原细胞分化的影响。