网络安全知识图谱构建的关键技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:play5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的持续发展,现存互联网用户数量庞大且仍在继续增长,因此网络安全技术的关键性愈发重要。知识图谱作为一种能够从海量、异构数据中挖掘出有效信息及他们之间语义关系的技术,近年来成为研究热点。本文旨在研究网络安全领域的中文知识图谱构建过程中所涉及到的关键技术,主要集中在研究知识抽取阶段的关键问题,即:网络安全命名实体识别技术及网络安全实体间关系抽取技术,针对这两个任务本文主要的工作如下。(1)本文在第三章首先提出了一种应用在网络安全领域的中文文本语料上的命名实体识别方法,该方法研究了作为象形文字的汉字的字形属性,使用了卷积神经网络进行汉字部首的特征提取,同时引入中文语料训练的BERT(Bidirectional Encoder Representations from Transformers)预训练模型共同得到神经网络的输入特征表示,将最终的特征表示向量输入到针对实体识别任务改进的Transformer中进行特征提取,最终结合CRF(Conditional Random Field,条件随机场)层获得每个字符的实体标注结果预测,达到实体识别的目的。在实验部分,本文在多个公开的中文命名实体识别数据集上分别进行训练和性能测试,实验结果表明本模型是有效的,尤其在Weibo NER(Named Entity Recognition,命名实体识别)数据集上表现优秀。后续,利用爬虫技术收集网络安全领域相关的文本语料,在其上构建网络安全实体识别数据集进行性能测试,同样具有可观的性能表现。(2)针对实体关系抽取任务,本文在第四章同样以中文BERT预训练模型为基础,对训练语料进行特殊处理,使用特殊符号将句子中的实体标记出来,经过BERT模型之后可以得到确定实体的隐状态向量表示,之后再结合自注意力机制获得实体的每个组成字符与整句的注意力得分并进行加权平均得到该实体的最终向量表示,后续使用由全连接层和激活函数组成的神经网络结构进行关系预测。本模型结构简单,但在公开数据集及自建的领域内关系抽取数据集上的实验结果表明其在公开数据集上的表现优秀,证明了本章所提出的模型的有效性。(3)在完成网络安全领域内命名实体识别和实体间关系抽取任务后,本文在第五章设计并实现了一个自动化的语料获取及图谱构建系统,同时在此图谱之上构建了一个领域内的信息检索系统,其包含了简单的图谱查询功能和基于规则的智能问答功能。
其他文献
生物胺是一种广泛存在于发酵水产品中的小分子含氮物质,发酵水产品中的游离氨基酸能发生脱羧反应产生生物胺,摄入过量的生物胺,会造成机体产生中毒反应甚至死亡。该文对国内外发酵水产品中生物胺的危害、形成机制、影响因素以及控制方法进行综述,为未来靶向调控水产品中的生物胺提供理论基础。
目的探讨维生素A(VitA)、维生素D(VitD)、维生素K1(VitK1)水平与儿童上呼吸道感染及免疫功能的相关性。方法选取2018年7月至2020年7月沈阳医学院附属中心医院收治的115例上呼吸道感染患儿(6个月~12岁)为研究组,选取同期在医院接受体检的95例健康儿童(5个月~12岁)为对照组,采用高效液相色谱法检测两组的血清VitA水平,采用液相串联质谱法检测血清VitD和VitK1水平,
数据因其背后具有的巨大经济效益已经被置于国家战略发展的重要位置。现代信息化技术迅猛发展,大部分知识密集型企业也逐渐认识到企业的可持续发展离不开数据的应用,所以纷纷把数据的管理和利用放在了企业战略发展的重中之重。尽管部分企业已经在生产生活中注重知识的管理和集成,但是知识的整合效果并不好,大量逻辑紧密但形式分散的知识没有得到关注,没有形成知识的网络。知识图谱技术作为整合知识节点的重要工具,能以“节点-
目的:构建基于微信公众号的医保移动支付系统,实现了互联网医院的医保移动支付。方法:第三方应用与外联平台通过WebService+XML实现接口对接,医保系统与外联平台采用WebService+JSON实现对接,医保系统与HIS数据库使用存储过程实现对接,实现患者医保数据的完整闭环。结果:建立互联网医院医保移动支付系统,实现查询患者医保参保地、密码验证、医保预结算、医保结算、退费等功能。结论:系统能
维生素D与机体自身免疫、肿瘤、心血管疾病以及感染性疾病有着密切的相关性,尤其是在处于骨骼快速生长发育期的青少年儿童中地位十分重要[1]。维生素D缺乏的主要原因与摄入不足、日光照射不足有关。我国青少年由于学业繁重,缺乏室外运动,加之不良的饮食习惯等,普遍存在维生素D缺乏情况[2]。维生素D不足与肥胖以及超重的关系已经明确,但是对与生长发育的关系的研究较少[3]。林秀雯等[4]提出,全世界有6%
esaxerenone(Esa)是一种新型口服、非甾体、选择性盐皮质激素受体拮抗剂,由第一三共株式会社开发,用于治疗高血压。临床试验表明,Esa在原发性高血压患者中显示出良好的疗效和安全性,还可显著降低糖尿病肾病患者的尿蛋白,其降压效果明显优于依普利酮,可作为单一疗法或与钙通道阻滞药或肾素血管紧张素系统抑制剂联合使用。Esa的不良反应轻微,主要为高钾血症、低血压、肾功能损害、肝功能异常、头晕、头痛
慢性心力衰竭(chronic heart failure, CHF,简称慢性心衰)是多种心血管疾病(冠状动脉粥样硬化心脏病、高血压、心肌病等)进展的晚期,主要为多种病因的影响,致使心脏的舒张和(或)收缩功能受损而引起的一组临床综合征,具有极高的发病率、住院率、死亡率等特点。近些年,随着对CHF研究的不断深入,中西医治疗CHF在一定程度上取得较好的效果,现对中西医对CHF的认识以及治疗手段进行综述。
目的测定部分城乡成年居民膳食类胡萝卜素摄入量水平。方法从三个不同类型的社区中,选择184名30~60岁成人(男84,女100)作为被调查对象,采用"双份饭法"分别于夏、秋、冬、春四个季节收集被调查者连续3 d的全部膳食,用HPLC测定其中β-胡萝卜素、α-胡萝卜素、β-隐黄质、番茄红素、叶黄素和玉米黄质六种类胡萝卜素的含量。结果被调查者夏季膳食中β-胡萝卜素、α-胡萝卜素、β-隐黄质、番茄红素和叶
一、引言:《指南》指出5-6岁的幼儿对于外界事物的好奇心和探索的欲望是非常强烈的,借助事物的实际情境,感受事物的大小、粗细、高矮等量的特征并能进行简单的记录。二、背景幼儿在探究主题活动《树》中,关于"测量"活动,引导孩子用尝试"目测"和自然测量的方法认识量。有的孩子认为用小手指测量,理由是手指的长度能量出树干的粗细;有的孩子认为可以用绳子测量,理由是绳子测量处树干的粗细,
会议