面向AI芯片文献的自动信息抽取与知识重用研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:miclleg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
AI芯片设计在神经网络和集成电路领域具有重要地位和作用,吸引了大量研究人员的注意力。目前,每月新增的AI芯片文献超过千篇,且AI芯片设计还需要掌握大量数字集成电路设计知识和神经网络知识,给研究人员带来了沉重负担。采用计算机处理海量文献,从中自动提取并使用AI芯片设计相关信息与知识,可有效减轻设计人员的负担。实体识别和链接预测分别是实现自动信息抽取与知识重用的关键技术,在公共领域已得到广泛应用,但在面向AI芯片领域时,还存在以下问题:第一,该领域实体更复杂:缺乏明显特征,且存在大量嵌套,给现有模型带来了识别困难,并加重了实体边界模糊化问题;第二,现有模型普遍针对封闭世界建模,且忽略了知识的内在约束和信息交互,难以捕获深层内在关联,限制了链接预测性能。针对这些问题,本文提出了新的方法和模型,并创建了相关数据集,在此基础上开展了AI芯片领域的自动信息抽取与知识重用研究。具体工作如下:1、创建了AI芯片文献的实体识别数据集,并提出了基于门控交互注意力与概率矩阵编码的实体识别模型,有效缓解了问题一。模型采用实体类别的关键词序列作为先验知识,利用类型嵌入捕获同类实体的公共潜在特征,并通过提出的门控交互注意力机制将先验知识、类型特征与上下文相结合来辅助识别。同时采用提出的概率矩阵编码增强对嵌套实体边界的精准检测。在AI芯片领域实体识别中取得了70.9%的F1值,高于其他先进模型5.9~9.1个百分点。2、创建了AI芯片知识的开放世界链接预测数据集,并提出了基于类别约束与双阶混合注意力的开放世界链接预测模型,有效缓解了问题二。模型使用文本描述进行知识三元组的表征。通过类别约束表征将三元组类别信息转化为特征向量,用于规范训练与推理。同时采用双阶混合注意力机制对三元组内部信息进行充分的语义交互,以捕获深层的知识内在关联。在AI芯片领域的链接预测中实现了0.34的MRR值,超越其他先进模型3~12个百分点。知识重用案例显示,模型预测的方法在设计人员中一致通过,并在相关研究中得到了证实。
其他文献
干旱胁迫作为限制植物生长的重要因素,对作物的产量也有严重的影响。γ-聚谷氨酸(γ-PGA)作为一种新型的保水剂在大多数蔬菜上都有着良好的保水效果,但在杂粮作物,尤其是谷子上还缺乏应用。为了明确谷子受到的干旱胁迫后γ-PGA对其的缓解机理,本研究采用萌发试验筛选不同抗旱性的谷子品种,采用盆栽试验明确抗旱品种“冀谷36”和不抗旱品种“冀谷38”在干旱胁迫下形态、生理和分子差异后,对不抗旱品种“冀谷38
学位
为节约功耗,物联网设备需要时钟唤醒整个系统。晶体振荡器作为常见的系统时钟模块,具有稳定的频率特性,但晶体振荡器从唤醒至完全启动往往需要数百微秒的时间,起振时间长,功耗浪费大。本文围绕晶体振荡器启动时间长而导致功耗大的问题,基于28nm CMOS工艺,设计了一种新型的快速起振晶体振荡器。为了减少晶体起振时间,本文基于恒定能量注入启动的方法,提出了一种基于差分式环形振荡器复用式结构的晶体振荡器,保证了
学位
高速公路“绿色通道”的国家政策于2019年对载有鲜活农产品的车辆进一步放宽了通行费减免标准,但其具体要求如运载货物是否为规定范围内的鲜活农产品,满载率是否达到80%以上,混装是否低于20%,货物超限是否小于5%等,都增加了绿通车辆核查的工作量和难度。X射线由于其具有透视观察车内物品和货物满载程度的优势,已成为很多高速公路绿色通道入口检测的重要设备。为提高在线检测的自动化技术水平,本文针对大尺度线阵
学位
衰老是植物生长发育的最后阶段,是一种自发启动的细胞程序性死亡过程,由外界环境和内在因子共同作用。小麦是世界上重要的粮食作物,其衰老的快慢很大程度会影响作物的产量和品质。因此,研究小麦衰老过程相关基因的功能和调控机制对于提高小麦产量和品质具有重要意义。课题组前期利用持绿型品种和衰老型品种,对衰老不同阶段的旗叶进行转录组测序,分析发现NAC转录因子Ta NAC92高表达;另外,前人研究发现NAC92在
学位
油莎豆(Cyperus esculentus)块茎含油量大、适应性广、生物质产量大,被认为是最具发展前景的特色油料作物之一。油莎豆油富含油酸(>70%),油脂品质媲美橄榄油,更适合人类食用和制备优质生物柴油。然而,油莎豆块茎油酸富集的分子机制仍然未知。挖掘油莎豆参与块茎油酸及油脂富集的关键基因可为全面解析植物营养器官油脂合成调控机制以及在营养器官组装油脂富集途径提供优异基因元件和科学基础。质体硬脂
学位
为充分利用麦收后自然资源,提高土壤肥力、改善土壤供磷状况,推动晋中地区构建绿肥油菜—冬小麦轮作制度,于2020-2021年在山西农业大学冬小麦试验田开展绿肥油菜还田试验。油菜播种前设不施肥处理(CK0)、氮肥150 kg/hm~2(N)、氮肥150 kg/hm~2+磷肥60 kg/hm~2(NP1)、氮肥150 kg/hm~2+磷肥120 kg/hm~2(NP2)四个肥料用量;于后茬小麦播前20天
学位
近年来,5G通信技术、医疗、物联网和汽车电子等科技的飞速发展对模数转换器(Analog-to-Digital Converter,ADC)提出了更高分辨率和更低功耗的要求。与此同时,新兴的ADC架构——噪声整形逐次逼近寄存器型模数转换器(Noise Shaping SAR ADC)融合了SAR(Successive Approximation Register)ADC高能量效率以及Sigma-De
学位
自然语言处理是人工智能领域的关键技术。在自然语言处理领域,基于注意力机制的Transformer模型表现出比传统的神经网络更好的性能,已经成为各类任务中的主流模型。Transformer具有参数量大和运算量高等特点,需要大容量存储和高性能计算,限制了其在资源受限的边缘端设备中的应用。而边缘端部署具有离线、实时性高、数据保密等优势,应用场景广泛,亟需设计边缘端Transformer硬件加速器。但是设
学位
随着数字终端的不断发展,各类产品对模数转换器(Analog-to-Digital Converter,ADC)的速度、精度、功耗等性能要求不断提升,传统单一架构ADC难以满足当前需求。而混合结构的ADC结合了不同架构的优点,提高了ADC的性能,成为研究的热点。作为逐次逼近(Successive Approximation Register,SAR)结构和ΣΔ调制器结构的混合,噪声整形SAR ADC
学位
中国是谷子的起源地,谷子在改善人们饮食营养构成和农业产业结构调整中具有重要作用。历史上的四大传统名米分别为沁州黄、桃花米、龙山小米和金谷米,由于其具有良好的商品与食用品质特征,曾被选为皇家贡米。本文以四大名米及其同名品种共计179份材料为研究对象进行农艺性状、遗传多样性与亲缘关系研究,从中选取51份材料进行品质测定。农艺性状调查结果显示,张家口基地种植的谷子材料的株高、穗长、草重和穗粒重等数量性状
学位