面向欧氏/非欧氏数据的深度神经网络压缩与加速算法研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:starboyak
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习是机器学习领域中的一个研究方向,是一种以复杂神经网络为基础架构,学习数据的内在规律和表示特征的算法。深度学习使计算机具有像人一样的分析学习能力——能够识别文字图像声音和挖掘数据内部特征,因此,深度学习已被广泛应用于搜索技术,数据挖掘,自然语言处理,图像识别,机器人导航,推荐系统和个性化技术中,同时也在其他相关领域中取得了许多成果。然而,现有的深度学习模型在计算上昂贵且占用大量内存,从而阻碍了它们在内存资源低的设备或对延迟要求严格的工业级应用中的部署。一方面,深度学习在处理欧氏数据,如图像、文字,语音时,最近的研究主要倾向于堆叠深度的网络或设计复杂的网络解决;另一方面,在处理非欧氏数据时,如复杂网络,图算法,研究者们倾向于将图的邻接矩阵作为神经网络输入,再堆叠深层次的网络解决,但当节点较多时,内存和时间消耗都会非常大。虽然近期有许多针对模型压缩和加速的研究被提出,然而还是存在许多问题,如大部分集中在自然图像处理,而不考虑其他欧氏数据,或未对非欧氏数据模型加速进行研究。为了更好的解决这些问题,在基于模型压缩和加速研究现状的基础上,本文重点在这两类数据上研究了如何利用模型压缩和加速在损失较少精度的情况下减少模型内存和时间的消耗。首先,对于欧氏数据(图像)下的模型压缩和加速问题,本文以知识蒸馏为基本方式解决。本文中,我们选取医疗图像(小儿肠镜)作为数据集,在考虑医疗实时性需求和医院数据孤岛的条件下,本文提出了一种集成知识蒸馏的框架。在该框架下,由于数据孤岛的存在,我们首先为每类病状(息肉,梅克儿憩室,溃疡和出血)图像训练复杂网络结构的二分类教师模型,随后使用集成知识蒸馏的方法整合了多个二分类教师模型(每个模型都检测一种疾病)到一个精简的多分类学生模型,以解决实时性的需求。本文首次提出集成知识蒸馏的方法打破医院间数据孤岛的问题,同时还达到医疗实时性的需求。我们在公开和真实数据集上测试了模型的性能,发现该模型可以达到可接受的结果,并可以帮助医生在实践实时中做出决策。另一方面,对于非欧氏数据(图、复杂网络)下的模型压缩和加速问题,本文以模型结构变换为基本方式解决。我们提出了一种新颖的,同时综合考虑网络拓扑结构和动量特性的神经网络框架–GTCN。GTCN模型能挖掘图中节点的拓扑结构和连边的时序变化规律。具体来说,我们的模型由两部分组成,通过图卷积捕获网络拓扑的图卷积网络和通过时空卷积捕获网络动态时间变化的时空卷积网络。此外,与其他模型相比,我们的模型可获得更好的结果和更快的训练速度。在九个实际网络的实验中,我们发现GTCN通过并行化实现了最优秀的效果和最先进的性能并加快了训练速度。
其他文献
流感作为一种具有季节性和高度传染性严重危害人类社会安全的大型流行性疾病,对于流感特别是禽流感的防控显得非常重要。禽流感病毒作为一种导致人患高致病性禽流感的病原体,侵染人体后会产生于普通流感相似的发热、腹泻、肌肉酸痛等症状。与通常的人流感病毒导致的季节性流感不同,禽流感病毒在经过基因重组后获得跨物种侵染能力,且人体对此类病毒亚型没有初步免疫能力,因此当人体初次接触到禽流感病毒后,会引发比普通流感更严
随着人们生活水平日益提高,生理机能健康越来越受到大众的关注,生理功能下降已被认为是引发人体各种疾病的主要诱因。如果不采取适当和必要的措施,生理机能下降将导致更多的并发症。生理机能评估是对人体各部分机体能力做出科学合理的评价,是预防生理机能病变、保障人体健康的重要步骤。目前生理机能的评估需要在专业人员的全力配合下进行,这样带来大量人力时间成本。针对此类问题,本文观察到将基于深度信息的人体活动分析与评
溴酸盐是含溴化物的水在进行臭氧消毒过程中形成的副产物,国际癌症研究机构(IARC)将其列为潜在的致癌物。溴酸盐的去除方法包括物理法、化学法和生物法。其中生物法通过微生物自身代谢作用在以有机物等作为电子供体条件下将溴酸盐还原为无毒的溴离子。该方法具有低能耗、无二次污染等优点,应用前景广阔。然而,在微生物还原溴酸盐的研究中,溴酸盐还原功能菌群的多样性尚不明确,溴酸盐还原功能基因和代谢机理尚未明晰,溴酸
目前全球大约有2.85亿视力障碍人士,他们因失去视觉这一重要信息源而渐渐被社会边缘化。通过将视觉图像处理技术应用到盲人辅助系统中帮助他们更好地从周围环境获取信息,具有较大的工程意义和社会意义。随着深度学习的发展,以卷积神经网络为基础的目标检测算法开始应用到盲人视觉辅助系统中,其在识别率和鲁棒性上都优于传统图像处理技术。然而,因为卷积神经网络运算中包含大量乘加计算与频繁的数据读写,导致算法移植到资源
蛋白的氧化还原是普遍存在于生物体内的一种化学反应,可由物理、化学和生物因素诱导产生。生理水平的活性氧簇(Reactive oxygen species,ROS)对细胞增殖和生长有积极的调节作用,但如果超过某一阈值,将会严重损害DNA、蛋白质、脂质等生物大分子,造成细胞功能丧失甚至不可逆损伤。含硫氨基酸甲硫氨酸(Methionine,Met)是最易被氧化的氨基酸之一,氧化后的甲硫氨酸形成两种差向异构
既有研究表明保障性住区存在特定人群特征与居住需求,其户外公共空间存在供给与需求不匹配的问题,包括户外空间景观化、功能与设施配给不足、人均活动场地面积偏小等问题。这些问题一定程度上影响了居民的居民生活质量和居住满意度。本研究以保障性住区内的户外公共空间为研究对象,聚焦于居民时空间行为与户外空间关系,围绕着如何提升保障性住区户外空间供给与需求的问题展开。研究在对深圳保障性住房项目进行普查式调研的基础上
空间RDF数据上的Top k最相关语义地点检索查询结合了基于关键词检索和基于地点检索的两种思想。这种查询会返回一组语义地点,每个语义地点都是以一个以带有关联位置信息的地点实体节点为根节点的子图。该查询通过计算一个评分函数来获取语义地点和关键词之间的相关度。这个分数由每个关键词在结果树上出现的节点和地点节点(根节点)的距离组合可得。但我们观察到由kSP(Top k Sematic Place)算法查
对话系统是自然语言处理领域一个重要的研究课题。越来越多的服务商使用智能对话系统来帮助他们减少人工开销。同时,也有越来越多的用户愿意使用智能对话助理来帮助他们完成日常的各项工作。特别是近年来,随着深度学习等技术的发展,面向开放域的对话系统逐渐成为了研究热点。为了设计更好的对话系统,对系统生成的应答进行质量评估,是研究过程中不可或缺的一步。一个好的评估方法,将有助于缩小机器对话与人类之间的差距。然而,
随着万物互联时代的来临,不同于云计算时代,大量数据在网络边缘产生,有限的网络接入带宽和应用对实时性的要求使得远端的云计算中心不能对海量数据进行高效处理。多址边缘计算(Multi-access Edge Computing,MEC)技术作为云计算模式在边缘网络中的扩展,能够在边缘网络中支持资源密集、延迟敏感型应用,并为用户提供有地理位置感知的实时服务。但与此同时,新型信息服务和面向业务类应用的快速增
在现实生活中,人们常常需要对自己拍摄的照片进行各种操作,以实现期望的视觉效果。例如给照片中的人物化妆,改变图像中的呈现的时间或季节,按照某种特定艺术风格对图像进行渲染等等。这通常需要借助相应的图像编辑工具,例如Photo Shop等,并花费大量的时间和精力才能实现上述效果。图像风格转换技术可自动地实现上述图像编辑任务,降低图像编辑的操作难度,提升易用性。给定一张内容图像作为输入和一张图像作为风格参