基于资源感知的高效神经架构搜索关键技术研究及应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:endest
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,伴随高性能计算和大数据的发展,深度学习技术掀起了人工智能领域的研究热潮。作为深度学习的代表性模型,人工神经网络从结构、机理和功能上模拟人脑神经系统,实现高维、复杂数据的端到端学习。随着研究的深入,神经网络架构优化和超参数调优变得极其繁琐且强烈依赖领域专家经验。神经架构搜索(Neural Architecture Search,NAS)旨在自动化神经网络的架构设计流程,降低其对专家知识的依赖和人力消耗。作为自动机器学习(Automated Machine Learning,Auto ML)技术在深度神经网络设计领域的探索,NAS已成为了自动深度学习(Automated Deep Learning,Auto DL)全流程关键环节。资源感知NAS综合考虑架构精度、推理效率、平台资源消耗等指标,以搜索出面向特定资源平台的高效部署、高推理精度的网络架构。然而,当前该领域研究仍存在一些关键问题,包括:资源感知NAS效率有待提升,需从搜索策略、架构评估、资源感知策略等各方面改进;搜索空间、搜索策略的设计较少考虑待部署平台体系结构属性,即软硬件协同搜索与设计,也未涉及面向未来智能计算的非冯体系结构平台。本文探索了资源感知NAS领域搜索空间、搜索策略、评估方法、部署性能等关键技术问题,提出了针对传统体系结构和存算一体化体系结构资源平台的架构搜索方法和框架,具体工作及创新点总结为:1.针对可微架构搜索框架无法兼容处理不可微搜索目标,例如能源、时延、内存消耗、资源感知搜索目标等,以及基于独立启发式搜索策略的多目标NAS效率低、开销大的问题,本文提出了基于可微超网络和策略梯度优化(直接针对架构参数变量)的多目标NAS框架,其兼顾了可微架构搜索的高效性和多目标架构搜索良好的搜索目标兼容性,在图像分类数据集中展现了良好的精度和效率。该工作可为资源感知NAS提供搜索策略支撑。2.针对资源感知NAS中平台资源感知代价高,而基于代理模型的资源感知方法涉及较大数据采集开销,且难以泛化大规模搜索空间、预测偏差大等问题,本文提出了针对大规模空间(Mobile Net V3,规模为1025)的时延/精度数值回归、二元关系预测代理模型,以及基于多任务学习的架构二元关系联合预测/排序代理模型。实验表明,二元关系预测代理模型在给定少量标签数据点(例如100)下获得尚佳的预测效果。同时,基于多任务学习的二元关系预测模型可实现多指标联合学习,取得了优于单任务学习的预测和排序效果。该工作可为资源感知NAS提供低成本资源感知方式。3.当前资源感知NAS领域研究较少考虑非冯存算一体化(Processing-in-memory,PIM)平台资源属性,本文实证研究证实了网络架构同定点数量化、比特级稀疏性之间的相关性,即特定架构搜索空间中存在对非结构化比特级稀疏特性具有更高忍耐度的架构,其更易于在PIM资源平台上高效部署。进一步提出了面向PIM资源特性的架构搜索方法,搜索特定空间内耐比特级稀疏的网络架构,旨在显著降低网络在PIM平台下部署的ADCs资源消耗,同时,从网络架构优化的角度适当弥补定点数量化以及比特级稀疏所带来的模型精度损失。4.基于PIM资源平台的图神经网络(Graph Neural Network,GNN)计算通常涉及大规模图数据(如邻接矩阵)在Crossbar整体映射,而目前制备技术难以高产率制造大尺寸Crossbar。针对该矛盾,本文提出了基于稀疏Laplace矩阵重排序和对角分块矩阵向量乘法的谱图卷积网络(Graph Convolutional Network,GCN)部署方案,显著提升了离散小规模Crossbar利用率。以此为背景,鉴于大规模图/矩阵基于PIM平台部署的资源消耗特性,本文进一步将图/矩阵数据映射方案形式化为0-1序列决策问题,提出了稀疏感知动态映射方案搜索方法,以满足PIM平台资源对模型部署的实际约束,在大规模图数据集上的映射方案搜索实验取得了显著效果。5.NAS应用研究方面,本文在人像/人脸图像分割任务中引入NAS技术,设计了基于编码器–解码器的高效搜索空间,利用强化学习搜索策略对解码器架构进行搜索,所得架构在三个人像/人脸分割数据集上取得了显著超越人工网络的精度表现。进一步,为提升架构搜索及模型部署效率,采用了轻量化的预定义编码器模型,同时构建了多目标NAS框架,设计了两阶段训练、特征图预计算等方法,以提升架构评估效率。为应对轻量化模型低保真度评估偏差大的问题,引入知识蒸馏技术以辅助代理训练任务。该应用研究中提出的搜索过程效率提升策略和轻量化模型评估策略值得推广至NAS社区其他应用场景。
其他文献
电子器件小型化的极限是达到单分子水平,由于量子效应的影响,基于传统硅基技术手段难以达到如此微小的尺寸。因此采用分子电子学的手段,以自下而上的方法制备分子集成电路为电子器件的进一步小型化提供了新的机遇。同时,分子电子学也为探明化学反应机理、纳米电催化、异构体识别、生物探测、研究并发现微尺度下的物理效应提供了有效的手段。这种巨大的研究价值吸引着研究人员在该领域不断的探索并取得了巨大的进步。单分子器件中
单细胞测序是一种在单个细胞水平上对遗传信息进行测序和量化的新兴技术,可用于解析细胞的类型、状态、相互作用机制及其进化等,现已成为当前疾病研究的重要途径。机器学习方法,包括聚类分析、分类、多数据整合等,日益成为单细胞测序数据分析的主要方法。通过聚类分析方法能够有效划分细胞类型;通过提取并学习现有细胞类型标签,构建细胞分类模型,可快速、精准地指导同类型细胞识别;单细胞多组学数据整合分析可以有效结合细胞
随着人类社会的不断发展进步,工业污水的乱排乱放和海洋中船舶的油污泄漏问题日益严重,这些污水流进了江河田地,造成了大量河虾鱼类的死亡和秧苗的枯萎,给生态环境带来了不可逆转的损失,同时也限制了人类社会经济的快速发展。因此如何有效解决水资源中的油污污染的问题,以便进行二次水循环利用成为了人们日益关切的问题。传统的油水分离的方法大多都工艺复杂,耗时耗力,成本高,且分离效率低,无法有效分离油水混合物。因此我
研究背景分子靶向药物已经广泛应用于非小细胞肺癌(NSCLC)的治疗,但对于靶向治疗原发或继发耐药,以及无法接受单药免疫治疗的中晚期肺癌患者,含铂方案的化疗仍然是目前中国临床肿瘤协会(CSCO)非小细胞肺癌指南推荐的治疗策略。为提升化疗疗效和肺癌患者的生存率,探索能够精准预测疗效、疾病进展或者生存时间的分子标志物具有重要意义。本课题利用基于甲基化特异性的多重荧光实时定量PCR的体系联合检测肺泡灌洗液
目的:通过对丝素蛋白材料在制备工艺中的条件进行调控改变其结构、亲水性和二级结构,以期能够随之调控改变丝素蛋白材料的力学性能、亲水性、细胞相容性等。从而能够构建口腔颌面部上皮组织缺损修复中所需高强度丝素蛋白膜及多孔丝素蛋白复合支架。表面的丝素蛋白膜用于支撑缝合所需的强度,下层的多孔支架用于促进黏膜生长,诱导上皮角化、血管化。方法:本文实验通过对新鲜再生的丝素蛋白水溶液进行一定的物化处理,通过浓缩处理
氟中毒是全世界广泛存在的一种人畜共患性地方病,由于其化学性质活泼,安全范围极窄,稍有过量就会引起毒性作用,流行病学调查和实验室研究均证实了氟的雄性生殖毒性。本课题组依照已有报道,结合前期实验结果和测序分析,提出IL-17信号通路可能是氟中毒动物睾丸免疫应答反应的中心环节。因此,本项目选取动物睾丸为研究对象,通过构建氟中毒动物模型、IL-17A基因敲除和IL-17A功能加强模型,检测氟对睾丸的损伤过
第一部分:列线图预测肝癌伴门静脉癌栓患者根治术后生存期和无瘤生存期目的:肝细胞癌(Hepatocellular Carcinoma,HCC)伴门静脉癌栓(portal vein tumor thrombus,PVTT)患者的预后较差,临床预测其根治术后总生存率(Overall Survival,OS)和无瘤生存率(Rate of Free Survival,RFS)的精度较低,效能较差。列线图(N
目的:腹主动脉瘤是一种致命性疾病,常常因为瘤体突然破裂而导致患者死亡。据统计,60岁以上男性的腹主动脉瘤(Abdominal aortic aneurysm,AAA)患病率约为4-8%,女性的患病率约为0.5-1.5%。对于直径大于5cm的腹主动脉瘤,通常建议行手术处理。目前最常用的治疗手段分为传统的腹主动脉瘤切除人工血管置换术和微创的腹主动脉瘤腔内修复术,不管哪种手术治疗,都没有显著提高患者的生
量子纠缠是量子物理区别于经典物理的新奇特性,它是现代量子工程发展和应用的基本资源,如何度量、调控和制备纠缠是当前量子信息科学的重要课题。近年来研究者提出了电子自旋、半导体量子点和腔量子电动力学等系统来制备纠缠态,本文将探索采用周期性调控手段来制备纠缠态。另外,环境不可避免地对系统的影响导致系统的退相干效应在很大程度上制约了量子纠缠的制备,也制约了相关的量子工程处理方案的实现。本文将探索周期性驱动对
[研究背景]喉癌是最常见的头颈部恶性肿瘤之一,具有易发生淋巴结转移和致死率较高的特点,严重危害了人们的健康。当前喉癌的治疗,虽然采用了手术切除、激光、放疗化疗等多种疗法联合的方式,但是喉癌的生存期并未取得较好的改善。现已明确,侵袭和转移是喉癌治疗失败的重要原因,而上皮间质转化(epithelia mesenchymal transition,EMT)又是肿瘤发生转移和侵袭的重要机制,目前介导喉癌E