【摘 要】
:
随着计算机的普及与互联网的高速发展,越来越多的信息充斥在网络中,如何将大量无序的信息准确及时的提取、整理并组织成便于检索的形式,是急待解决的问题,信息抽取技术就是围
论文部分内容阅读
随着计算机的普及与互联网的高速发展,越来越多的信息充斥在网络中,如何将大量无序的信息准确及时的提取、整理并组织成便于检索的形式,是急待解决的问题,信息抽取技术就是围绕这个目的展开的。其中事件抽取是信息抽取的重要组成部分,事件抽取就是从非结构化文档中抽取出用户感兴趣的事件,同时用结构化形式描述,供用户查询及进一步分析。本文以自然灾害类事件作为实验对象,研究该类事件领域的信息特点,实现自然灾害类事件信息的抽取与合成。本文首先对实验语料进行预处理,去除文档的高频词和低频词,再利用文档聚类的方法实现了同一类事件侧面特征词的收集,经过一定的人工处理,最终建立了自然灾害事件的框架结构,通过框架结构指导事件的抽取。在事件信息的具体抽取过程中,先建立相关事件的抽取模板,即一组抽取规则,使用这些规则对测试语料进行模板匹配与信息抽取。实现了对自然灾害类事件的事件发生时间、事件发生地点、事件伤亡结果等侧面信息的抽取,并根据时空的一致性原则对同一事件进行了合并。实验结果表明,本文提出的基于框架的事件抽取方法是切实可行的,对于自然灾害事件的信息抽取得到了较为理想的测试结果。
其他文献
介绍了电化学催化氧化降解水中有机物的机理:电化学直接氧化和电化学间接氧化、在电催化氧化过程中应用的电极材料、电极结构及其催化特性、国内外目前的研究进展、指出了目
法国女作家缪丽叶·巴贝里的小说《刺猬的优雅》以巴黎高档住宅区的一幢公寓为背景,以交替叙事的形式,讲述了看门人米谢尔太太和少女帕洛玛的一段生活经历和精神遨游,反映了
收集整理近3年有关中医学对于痛风及高尿酸血症实验研究及临床治疗方面的文献,加以提取、分析、研究、概括,得出相关病因病机、临床分型及治法,并进行综述。
阐述了江南古典园林在以中国传统的"天人合一"自然观为指导的同时,浓缩自然,模山范水,营造了符合一定生态规律并且能满足当时特定环境容量要求的人工生态环境,构成了园林诗情
本文基于区域经济学基本理论,研究了自都市旅游定位正式提出以来,上海核心旅游资源、核心旅游企业类型数量区域差异及其与旅游经济总量区域差异的关系;上海旅游产业政策演进
又是一年备考忙。年复一年,我们不禁要想:为什么要“这样忙”?“这样忙”的价值有多大?可不可以换个“忙”法?多年来,语文高考引得众人关注和评说,而是非曲直却一言难尽……
<正>2012年9月15日,利物浦迎来了其第七届国际艺术双年展。为期十周的双年展是迄今为止英国规模最大、传播面最广、参观人数最多的当代视觉艺术节。上一届利物浦双年展吸引了
随着金融危机的不断蔓延和影响的逐渐深化,美国采取的第一轮和第二轮量化宽松货币政策,对中国物价水平产生深远影响。对此,我国应采取以下对策:加强对国际资本流动的监管,控
轨道交通建设具有公益性和商业性,其投融资形式呈现多元化,商业银行信贷支持是普遍意义上的重要来源。然而,由于轨道交通建设的投资额大、回收期长,收益不稳定等特点,其潜在
<正>一、班会主题与构思1.通过本次活动,使学生更加了解家乡邢台的历史与现在,培养学生对家乡由衷的热爱之情。2.在班会活动中深化爱家乡、爱祖国的教育,让每一个孩子在活动