油气勘探开发知识图谱核心算法的研究与实现

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:cuixy3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
石油工业的勘探、开发等过程中产生了大量研究报告。传统基于关系数据库的信息管理系统和基于关键词的信息检索系统不能有效地分析、组织和利用这些研究报告中的知识。知识图谱利用机器学习、自然语言处理、语义Web等技术,提取知识并构建知识库及其查询接口,能够有效地解决相关领域中知识查询和重用的问题。由于知识图谱的建立与领域知识密切相关,本文以油气勘探开发领域中的知识为主,在分析此领域研究报告基础上,研究构建此领域知识图谱的核心算法。本文主要对主题模型、命名实体识别、关系抽取中的核心算法进行研究。具体的研究内容如下:(1)针对油气勘探开发领域中主题数量难以确定、主题质量较低等问题,研究并实现了交互式主题模型,通过在训练过程中引入用户的监督,达到动态确定主题数量、提升主题质量的目的。此外,对其中交互操作的性能作了分析与讨论。(2)针对油气勘探开发领域中命名实体的特征,实现基于分布式词表示方法和神经网络的命名实体识别算法。同时,利用无标注数据对训练数据和词表示矩阵进行初始化,进一步提升命名实体识别的效率。(3)针对基于特征的关系表示方法中关键信息不突出、数据集线性不可分等问题,设计基于模式的向量。将其引入到远监督关系抽取中,提出基于模式的远监督关系抽取算法。实验结果表明,该算法能够有效地提升远监督关系抽取的精度。
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
建立了直流电场作用下协流式微流控装置中单乳液液滴乳化生成过程的非稳态理论模型,并开展了数值模拟研究,揭示了电场对液滴乳化生成动力学行为的调控机理,阐明了流场/电场参
增强党的思想引领力是新时代的新任务,应采取新举措完成这一任务。必须立足于历史根源、理论基础和社会现实之上,处理好科学指导、精神传承和思想落实群众的关系。历史的优秀
为得到以时间、频率、幅度和动态过程为特征量的多维度瞬时频率前兆信息,为岩爆等地质灾害的预测提供原理上的支持,开展岩石破坏声发射波形分析的研究。以花岗岩单轴压缩为实
毛泽东不仅是一个伟大的思想家、政治家、革命家和军事家,也是一个杰出的诗人。从少年时代起,毛泽东就热爱古典诗词,创作了非同凡响的旧体诗词,内容丰富,感情真挚,意象叠起,意境高远
我国东部地区是我国工业的主要分布区.结合区域经济学中韦伯的工业区位论、廖什的市场区位论等经典理论,针对我国东部地区的工业区位选择与布局的客观状况,从成本因素、集聚
目的对激光周边虹膜切除术后急慢性闭角型青光眼和正常人昼夜眼压波动进行比较。方法收集闭角型青光眼患者44例(急性闭角型青光眼25例,慢性闭角型青光眼19例)以及年龄和性别相匹
周振超,西南政法大学政治与公共管理学院院长、教授、博士生导师,MPA教育中心主任,重庆市政治学会常务副会长兼秘书长,中国政治学会理事。发表《职责同构下的层层加码:形式主义长
报纸
游乐是旅游活动的核心要素之一,游乐项目策划也是旅游规划的核心内容之一,对游乐的概念和分类研究也就具有重要的理论与实践意义.在相关概念分析的基础上,给游乐下了一个定义
独立性是独立董事制度的灵魂和基础,只有独立,才能保证其客观性和公正性.独立董事的独立性应当包括两个层次,即任职前和任职后的独立性.但问题是:过低的独立董事薪酬不足以激