融合数据与知识的事件抽取研究及在产品需求分析中的应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:toerrisme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件抽取技术是从海量的信息中抽取出事件信息并以结构化的形式呈现出来。事件抽取主要采用基于知识(模式匹配)和基于数据(机器学习)两种方法。基于知识的方法准确率较高,但是扩展性差。基于数据的方法召回率较高,但是存在数据稀疏问题。如何将这两种方法的优点结合起来进行事件抽取是一个值得研究的问题。针对该问题,本文所做工作如下:首先,建立了面向机械产品需求分析的事件语料库。从互联网上收集了大量与机械产品相关的文本,并且设计了一个事件标注系统,通过对文本预处理和事件标注,建立了面向机械产品需求分析的事件语料库。其次,分析了基于数据方法与基于知识方法的事件抽取本质,发现了这两种方法的事件抽取本质的一致性,从而采用了融合数据与知识的事件抽取方法。在事件类别识别中,在总结事件语料的词语信息构建了知识库的基础上,提取事件触发词及其周围的词法特征和实体特征作为事件特征,并且加入通过知识库提取的知识特征,然后利用支持向量机(SVM),进行事件类别识别。实验结果中的准确率、召回率和加权平均值都有了一定的提高,验证了该方法的有效性。然后,在事件元素识别中,同样采用融合数据与知识的方法。选取事件元素及其周围的词法特征和实体特征作为事件特征,并且在事件特征中加入了从知识库中提取的知识特征,然后利用支持向量机进行事件元素识别。实验结果表明了该方法在事件元素识别中的有效性。最后,针对机械产品需求分析设计了一个完整的事件抽取系统。在事件语料库的建立、事件类别识别和事件元素识别的研究工作基础上,采用层层递进的方式,将这三个部分组合在一起,建立了完整的事件抽取系统,可满足机械产品需求分析时事件抽取的需要。
其他文献
大概是由于“语文的外延等同于生活的外延”,所以对小学生而言,数学远比语文难以入门,难以培养兴趣。新课标实施以来,把数学的生活化作为其突破口。本期我们所选三篇文章,是
农村信用社的声誉风险是农村信用社经营、管理及其他行为或外部事件导致利益相关方对农村信用社负面评价的风险。随着各种传统媒体不断发展壮大和现代信息技术、互联网等新兴
报纸
目的:在肾细胞癌伴有下腔静脉癌栓患者中,通过术前放置下腔静脉临时滤器的方法,来确定癌栓脱落的危险因素,以期术前评估癌栓脱落的风险。方法:回顾性分析2004年1月-2014年6月笔
以工业上生产酱油、大酱的酱渣饼为提取原料,采用乙醇为提取剂,超声辅助提取大豆异黄酮。通过单因素试验和正交试验,确定最佳提取条件为:乙醇体积分数50%,提取温度70℃,提取时间40mi
冠心病是一种慢性疾病,主要是由于供应心肌血氧的血管逐渐变窄,当耗氧量增加时,出现供血不足的现象,临床表现主要包括稳定性心绞痛(SAP)及急性冠脉综合征(ACS),其主要病理基
随着利率市场改革的推进和国内金融行业整体的不断发展进步,中国金融环境与金融市场各类产品越来越接近国际先进水平。银行作为整个金融体系最重要的核心与支柱,其经营发展的变化一直是金融行业最为主要的风向标。从2000年以来,银行同业业务以其快速、安全的创利能力,受到了各大商业银行的青睐,纷纷以此作为自身的重要利润增长点之一。同业业务之所以可以在商业银行中发挥如此作用,得益于在一系列监管政策与会计处理安排下
耕地流转还不是东北黑土区农村经济发展中的一种普遍行为,只有两成左右的农户参与到这一市场之中,远远没有达到优化配置耕地资源的要求。东北黑土区作为粮食主产区,耕地流转
目的:探讨分析吗啡栓剂与双氯芬酸钠栓剂在剖宫产术后止痛中的临床效果,并观察比较不良反应。方法:采用前瞻性病例对照研究方法。选取剖宫产产妇106例,均采用硬膜外-蛛网膜下隙
有机发光二极管具有超薄、低功耗、环保、可弯曲、可折叠等优点,成为了近年来市场及科研领域的热点。为研究发光层与发光层之间的中间层结构对白光有机发光二极管色稳定性的
治扁平疣验方原为贵州工人医院侯医生所用,后为余师石恩骏教授治疗扁平疣屡用有效之方。$$ 方药组成:柴胡3克,赤芍12克,丹皮4.5克,红花3克,白芷6克,防风6克,丹参12克,薏苡仁30克。
报纸