【摘 要】
:
事件抽取是信息抽取领域一个重要的研究方向。事件抽取主要把人们感兴趣的,用自然语言表达的事件以结构化的形式呈现出来,如什么人,什么地方,什么时间,做了什么事等,在自动文
论文部分内容阅读
事件抽取是信息抽取领域一个重要的研究方向。事件抽取主要把人们感兴趣的,用自然语言表达的事件以结构化的形式呈现出来,如什么人,什么地方,什么时间,做了什么事等,在自动文摘,自动问答以及信息检索等领域有着广泛的应用。本文关注音乐领域的事件抽取,选择了具有代表性的演唱会及专辑事件进行深入研究。本文借鉴ACE评测中事件抽取任务的相关概念以及构建语料库的一些经验,详细定义了音乐领域我们所关注的两类事件,并且构建了语料库,详细介绍了语料标注的来源、过程、标注规范以及存储格式等。本文对事件抽取的两项关键技术——事件类型识别以及事件元素识别采用不同的处理策略,简化了事件类型的识别过程,采用了基于关键词与触发词相结合的过滤方法。在事件元素识别中,如何从众多的实体中找出事件元素,成为本文研究的重点。本文提出了两种方法:基于模式匹配的事件元素识别,以及基于最大熵的事件元素识别。在总结前人三种事件表示模型的基础上,本文结合汉语的特点以及所采用句法分析模块的特点提出了一种基于简化依存句法树模式匹配的方法;基于最大熵的方法将事件元素识别问题看作分类问题,将所有出现的实体作为候选事件元素,选取上下文、邻近实体、句法结构等特征从不同的角度描述候选元素,并采用最大熵分类器对其进行二元分类。为了发挥各自方法的优点,将基于模式匹配的方法与基于最大熵分类的方法采用级联的方式串联起来形成最终事件元素识别的解决方案,在本文构建的语料库下,最终事件识别的平均F值达到83.84%,事件元素识别的平均F值达到76.41%,整个事件识别的平均F值达到67.31%。
其他文献
STS教育即科学、技术与社会教育,是近年来世界各国理科教育改革中形成的一种新的科学教育内容,它强调科学、技术与社会的相互关系和科学、技术在社会生产、生活和发展中的应
2001年,我国开始了以提高公民科学素养为主旨的理科教育课程改革。在各门课程的价值定位和性质定位上,科学的本质和价值,科学与社会和生活的相互作用得到了一定的关注和强调
优先发展城市公共交通需要积极实施公交优先政策,设立公交专用道,为公交车辆提供优先通行信号,布设智能公交监控与调度系统,以现代通讯、信息技术为依托,构建信息化、智能化
我国区域经济发展呈不均衡状态,东、西部差距十分明显。西北五省地处我国的西北内陆地区,幅员辽阔,资源丰富,具有重要的战略地位。所以西北五省经济和金融的发展成为了影响中
本文从意识形态角度探索19世纪末中国社会文化和社会历史条件影响下的梁启超翻译思想,通过分析其代表译作《十五小豪杰》,从而论证意识形态对翻译的操控作用。本文借鉴勒菲弗
海西先行、科技先行。增强福建省区域自主创新能力,是提升海峡西岸区域经济竞争力的重要突破口;也是推进海峡西岸“两个先行区”建设的内在要求。财政科技投入是筹集科技投入
本论文基于笔者主持的浙江省教研立项课题《高中英语写作教学的有效性研究》,于2007年4月开始研究,2009年3月结题,历时两年。笔者对自二十世纪七十年代以来,西方语言学界和教
杨家埠木版年画根植于民间,装饰于节日,在长期发展过程中,根据群众的审美爱好和需要,形成为独具特色的画种。杨家埠木版年画造型夸张,构图饱满,色彩强烈,题材广泛,内容丰富,
仁学是先秦儒家思想的核心,在儒学中占有重要的地位。“仁学”思想的形成,不仅是一个由“仁”、到“礼”的进程,而且也是儒家早期关于“人”形成的一个重要阶段。本文站在时
非法经营罪是1997年《刑法》在废除1979年《刑法》中所规定的投机倒把罪后新增的一个罪名。该罪名设立后,由于《刑法》第二百二十五条第四项规定了“其他严重扰乱市场秩序行