基于语法及依存信息特征的文本流关系抽取系统

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:diger
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几十年来,随着互联网飞速发展,电子信息极速膨胀,全球信息高速流通,互联网进入到了信息冗余,繁杂,难以检索搜集的时代。如此信息爆炸,带来了互联网的新一波严峻挑战。自动抽取有效信息的需求日益突出,信息抽取由此应运而生。然而,随着互联网数据规模不断扩大,传统信息抽取系统面临数据海量性,实效性的难题。如何在大数据,流数据中,进行有效信息的抽取,成为了学者和业界炙手可热的话题和关注点。基于此背景,本文针对信息抽取领域的重要分支——关系抽取进行算法的深入研究,提出并实现了模板匹配与神经网络混合抽取方法,创新性地提出基于词向量的高速抽取方法,并且设计了针对文本流的关系抽取框架。主要内容包括:1.针对模板匹配关系抽取方法Bootstrapping存在的缺点,优化现有模板结构单一性问题,并结合递归神经网络算法MV-RNN,提出了混合抽取模型;2.文本流是以文本为内容的流数据,该形式数据具有数据量大,流速快等特点,本文针对关系抽取在文本流场景下的应用,研究并提出了基于word2vec的词向量关系抽取方法,并分析其应用价值;3.本文最后综合所提及的关系抽取方法,针对文本流数据设计实现了具有预处理、存储检索以及关系抽取模块的流文本关系抽取框架。
其他文献
期刊
在新形势下,素质教育的概念和改革教育方式的更新不断加快,国家和政府对教育改革的重视日益提高.教育改革不仅应在制度上进行,而且还应在教育人员培养上进行,教师的素质提高
现如今,绝大部分的小学教学方法比较死板,总是一味遵循“教师讲,学生听”的教学模式,教师将课本内容生搬硬套,没有进行丝毫教学方式的改革与创新,总是直接告诉学生答案,这会
阅读是语文教学中重要的一部分,对学生语文综合能力的培养具有重要的意义.随着教育制度的不断改革,为了全面提高小学语文教学水平,我国开始重视各种实践和创新的策略研究,同