脉冲神经网络编码和学习算法及应用研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:svincent_su
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经科学研究证明,生物神经网络之间的细胞是通过神经元的动作电位(发放的脉冲)来进行相互通信的。因此,更具有生物可塑性和强大信息处理能力的第三代神经网络:脉冲神经网络(杓杰杩杫杩杮杧李来杵杲条杬李来杴杷杯杲杫,杓李李)受到了研究者的广泛关注。与传统的基于频率的神经网络不同,杓李李能够处理和提取脉冲信号中编码的时间动态特征,从而使其更加具有生物可塑性,且计算能力更强,功耗更低,在未来的移动智能领域具有广阔的应用前景。每个脉冲神经元(杳杰杩杫杩杮杧杮来杵杲杯杮)的基本计算功能是将输入脉冲序列转化成适当的输出脉冲,充分模拟大脑中的脉冲时间编码原理。然而,具有脉冲信号特征的神经元如何产生大脑强大的认知功能仍然在探索中。目前的研究初步证明了脉冲神经元强大的计算能力,然而对杓李李的探索尚处于初级阶段,它缺乏有效的神经信息编码方法,并且由于编码的复杂性和脉冲变量的不可微性,无法使用现有的神经网络学习算法进行学习,使得学习算法的适用性无法保证,仍然面临很多挑战。因此,本文主要研究神经网络的信息处理和认知计算,试图揭示和利用生物系统的运作机制。时间编码和学习是杓李李的两个主要关注点,编码描述信息是如何被脉冲信号携带的,学习表现神经元是如何学习脉冲模式的。本论文的研究重点从神经元层面到系统层面各有不同,包括脉冲时间编码、单层和多层脉冲神经网络的学习、系统建模,以及视觉和听觉处理系统的应用发展。本文的主要内容和创新点如下。1.提出一个基于脉冲时间的声音特征编码和学习的鲁棒性识别模型。该模型将听觉编码和学习视为一个系统过程,不仅提高声音在噪声情况下的可辨识性,而且更好地模拟生物听觉皮层对声音信息的表达和学习过程。大多数传统的方法利用基于频率的特征来进行识别,导致声音和噪声信号混合在一起,缺乏鲁棒性。针对此问题,提出一个完全基于脉冲时间的声音识别模型去编码和学习从频谱图中提取到的声音特征。其选择高能量峰值作为关键点信息(其中包含局部时间札频率特征(杌杯杣条杬杔杩杭来札杆杲来東杵来杮杣杹,杌杔杆)),并编码成时间脉冲序列进行学习。为了研究其有效性,我们还将其应用到不同的杓李李学习算法中。基于该编码方法的新识别算法大大提高了噪声条件下的声音识别准确率和鲁棒性。实验结果表明,我们提出的编码和学习模型方法简单,抗噪性强。在不同的噪声情况下,性能优于基准方法。2.提出一个基于脉冲时间的视觉信息多脉冲编码和识别的统一性模型。该模型能够完全基于精确的脉冲时间来整合特征提取和学习过程,填补了基于地址-事件表示协议(Address-Event Representation,AER)图像传感器的图像编码和学习算法被分开研究的鸿沟。目前大多数用于对象识别的架构,其中基于脉冲的特征提取和学习过程是被分开研究的,而在系统的层次上结合编码和学习来实现认知计算是非常重要的。针对此问题,本文提出了一种基于脉冲事件驱动的视觉特征编码和识别模型。其利用地址札事件表示协议在神经元之间进行通信,并结合脉冲神经元的信息编码和学习算法进行识别;此外,我们还基于时间札表面(杴杩杭来札杳杵杲杦条杣来)技术提出一种降噪方法,通过计算脉冲事件与周围空间邻域的相关性来判断该事件是否为噪声。模型在多个数据集上进行评估,显示了其优越的识别性能,特别是对于有噪声的事件。该模型将有助于进一步推动硬件和软件在实际应用中的发展。3.提出一个精确脉冲时间驱动的多层多脉冲SNN监督学习算法,该方法能够高效、鲁棒地处理复杂的时空脉冲模式。由于多脉冲方法的学习目标复杂性显著增加,所以对多脉冲学习方法的研究主要集中在训练单一而不是多层网络上。在多层杓李李的每一层中触发多个精确的时间脉冲仍然是一个核心挑战,导致现有多层多脉冲学习算法计算效率较低。针对这一问题,本文提出了一种新的、有监督多层多脉冲学习方法来完成脉冲序列的复杂时空模式学习。该方法从杗杩杤杲杯杷札杈杯朋(杗杈)规则中导出突触权值更新规则,然后利用反向传播将网络误差同时计入前一层。特别地,本文采用时间驱动和事件驱动两种计算机制来模拟神经元计算模型。该算法成功地应用于异或(杘杏杒)问题和杕权杉基准数据集,以及复杂的噪声问题。实验结果表明,该算法可以达到与经典学习方法和先进的监督算法相当的分类准确率。另外,提出的训练框架有效地减少了连接数,从而提高了网络的计算效率。4.提出了一个阈值驱动的多脉冲SNN监督学习算法,能够快速、准确地执行不同的分类和时间信用分配(Temporal Credit Assignment,TCA)任务。多脉冲输出算法可以训练一个神经元去输出想要的脉冲个数,并且能够发现嵌入在复杂背景活动中的特征。然而,现有的监督学习算法需要大量复杂的运算,具有很大的挑战性。其中大多数算法是基于精确的脉冲时间的,导致学习效率较低,对噪声的鲁棒性较差。针对这些局限性,我们提出了一种简单有效的多脉冲输出学习规则来训练神经元,使其输出脉冲个数与期望的脉冲个数相匹配。该方法通过指定的阈值计算其膜电压的表达形式,快速找到与嵌入特征直接相关的局部最大值作为突触更新的相关信号,并以局部最大膜电位与触发阈值之差作为误差函数。该规则可以训练单个神经元学习多类任务,并能有效地抑制输入噪声的影响,发现嵌入特征。实验结果证明该算法在大范围的学习任务下具有更高的准确率、更低的计算量和更好的噪声鲁棒性。
其他文献
乳腺癌是多数国家女性人群中发病率最高的癌症,研究表明,乳腺癌的早期准确诊断并及时治疗能够大大降低其致死率。乳腺X光检查是全世界范围内使用最广泛的早期乳腺癌筛查手段之一,也是唯一被证明可以显著降低乳腺癌带致死率的医学影像学方法。使用乳腺X光进行乳腺癌筛查时,会产生一系列乳腺X光图像数据,放射医师根据这些图像数据进行良恶性诊断,而诊断结果与医生个体经验水平有着直接联系。随着计算机技术的发展,计算机辅助
新世纪以来,随着“中非合作论坛机制”的建立,中非战略合作伙伴关系的确立,尤其是中非命运共同体的构建,中国对非洲援助秉承“义利相兼”的理念,充分彰显“平等、互助、互惠、精准、包容”的援助特征,对非洲援助的力度和深度都呈现出前所未有的提升,在国际对非洲援助领域发挥着举足轻重的作用。面对国际风云变幻,中国坚守和平与发展的时代主旋律,构建中非命运共同体将成为新世纪中国对非洲援助的首要目标和行动方向。虽然国
图像和文本是当今两种主要的信息载体,其中图像具有生动形象的特点,而文本概括性强,能够以简练的形式传递信息。图像字幕生成旨在让计算机自动地使用文本对给定的图像加以描述,其在图像检索、人机对话、盲人导航、自动安防等应用中被广泛使用。本文基于深度学习对图像字幕自动生成进行研究,具体的工作包括基于全局注意力机制的图像字幕生成、基于词性先验的图像字幕生成、基于对偶学习的图像字幕生成、基于层次主题网络的故事生
人脸识别作为人工智能的典型应用之一,具有重要的实用价值和研究意义。近年来,基于深度卷积神经网络的人脸识别技术取得了突飞猛进的发展,但主要集中于二维可见光人脸识别的研究,在真实无约束场景中仍然面临许多挑战和难题。随着人脸识别应用的推广和传感器技术的发展,异质人脸识别需求应势而生且日益增大。但异质人脸图像间显著的外观变化,使现有人脸识别系统面临识别精度大幅下降的问题。本文对异质人脸识别问题及其解决方案
心音信号和心电信号作为常见的医疗时序数据,具有易采集、价格低廉、无创无损及重复性好等特点,在医学临床中被广泛应用于疾病预防、初步诊断及病情的长期监测。对这些医学时序信号进行准确处理与分析,可更好地协助医生把握病情,制定疾病预防和治疗方案,从而提升全社会的整体健康水平。经过几十年的发展,传统信号处理方法对心音信号和心电信号的分析与应用已取得长足进步,但处理该类时序数据时仍然面临诸多挑战。尤其是在面对
现代图形学应用的飞速发展对超大规模复杂场景绘制、高分辨率显示呈现、高真实感用户体验以及实时绘制效率提出了愈加严峻的挑战。尽管计算机硬件性能在近年来得到了极大提高,但仍然无法满足越来越高的需求。作为并行计算在图形学领域的具体运用,并行图形绘制系统成为解决上述问题的有效方案之一。但是多节点间的绘制任务分配一直是制约并行图形绘制系统整体性能的瓶颈,因此,研究如何实现绘制负载平衡成为影响最终绘制效果的关键
由于互联网多媒体技术的快速发展、智能手机的广泛使用以及社交网络的不断普及,人们能够随时随地在互联网上分享有趣的内容,使得互联网上不同模态的多媒体数据(如文本,图像和视频等)呈现爆炸性增长、海量性集聚的特点。如此大规模的数据标志着多媒体大数据时代的到来,同时给基于多模态学习的研究和应用带来了新的机遇和挑战。随着以深度神经网络为代表的人工智能技术的迅猛发展,如何基于深度神经网络模拟人类大脑的认知和理解
深度学习又称为深度神经网络,是人工神经网络的一种,是一种通过堆叠多层非线性变换方法对高复杂性数据进行建模的算法。在图像处理领域,深度学习主要是指深度卷积神经网络(Deep Convolutional Neural Networks,简称DCNN)。人工神经网络的概念自上个世纪四五十年代被提出以来,几经发展和沉寂,在本世纪初又开启新一轮发展热潮,展现出强大的生命力。图像目标检测的目的是判断图像中是否
计算机科学融合音乐学并推动音乐学自动化智能化发展催生了两个大的研究方向:音乐信息检索和音乐生成。其中,音乐检测是音乐信息检索领域的一项关键任务,它聚焦于研究如何从音频中检测出音乐事件及发生的位置;音乐生成是人工智能在艺术创作方面的一项探索,它关注于研究能让计算机自动进行音乐创作的算法。随着数字音乐数量的与日俱增,神经网络方法善于学习海量数据以及具备强大建模能力的特点使其成为近年来音乐检测和音乐生成
三维图形绘制在游戏娱乐、虚拟现实、科学计算可视化等众多领域有着广泛应用,而且在实时和真实方面的绘制要求越来越高。近年来,软硬件的计算性能得到了很大提升,但是面对数据规模的日益增长,大规模数据的实时绘制面临巨大挑战。本文主要针对体数据和地理地形数据的真实和实时绘制技术展开研究。对于精度高、体量大的体数据,三维可视化计算量大,同时增加光照计算更加重了计算负担。大规模地理地形数据一直存在如何高效处理和绘