【摘 要】
:
人工神经网络与强化学习算法的结合显著增强了智能体的学习能力和效率.然而,这些算法需要消耗大量的计算资源,且难以硬件实现.而脉冲神经网络使用脉冲信号来传递信息,具有能
【机 构】
:
西南大学计算机与信息科学学院,西南大学人工智能学院,类脑计算与智能控制重庆市重点实验室,西南大学电子信息工程学院
【基金项目】
:
国家自然科学基金(61601376,61672436);中央高校基本科研业务费(XDJK2019C034);重庆市基础与前沿技术研究专项(cstc2016jcyjA0547);中国博士后科学基金(2018T110937);重庆市博士后科学基金(Xm2017039);国家级大学生创新创业训练计划项目(201810635017)资助~~
论文部分内容阅读
人工神经网络与强化学习算法的结合显著增强了智能体的学习能力和效率.然而,这些算法需要消耗大量的计算资源,且难以硬件实现.而脉冲神经网络使用脉冲信号来传递信息,具有能量效率高、仿生特性强等特点,且有利于进一步实现强化学习的硬件加速,增强嵌入式智能体的自主学习能力.不过,目前脉冲神经网络的学习和训练过程较为复杂,网络设计和实现方面存在较大挑战.本文通过引入人工突触的理想实现元件:忆阻器,提出了一种硬件友好的基于多层忆阻脉冲神经网络的强化学习算法.特别的,设计了用于数据-脉冲转换的脉冲神经元;通过改进脉冲时间依赖的突触可塑性规则(Spiking-timing dependent plasticity, STDP),使脉冲神经网络与强化学习算法有机结合,并设计了对应的忆阻神经突触;构建了可动态调整的网络结构,以提高网络的学习效率;最后,以Open AI Gym中的CartPole-v0(倒立摆)和MountainCar-v0(小车爬坡)为例,通过实验仿真和对比分析,验证了方案的有效性和相对于传统强化学习方法的优势.
其他文献
<正> 目前,高分子聚合物及其回收制品已在改性石油沥青中得到广泛应用。为降低成本,利用共混高聚物改性石油沥青具有一定的实用价值。所谓共混,是指两种以上的相容性高聚物的
本研究运用逆向工程技术,对玩具汽车内饰的模型进行重建并完成其成型工艺与模具设计。玩具汽车内饰的外形曲面比较复杂,采用逆向工程方法,利用三维扫描仪高效率、高精度地完
目的了解2011年3月-2013年3月医院结核病患者多药耐药菌(MDROs)感染的预防及隔离状况,为提高医院感染控制质量提供参考方案。方法对医院医务人员、检出MDROs感染的结核病住院
本文在综合评述了网络广告相关的研究成果的基础之上,对论文研究的角度、方法和逻辑结构等内容做了详细的阐述,为论文的后续研究做好了充分的理论准备。本文的主体部分可以分
宅基地使用权制度是我国特有的用益物权制度,宅基地使用权的流转是其核心。目前,我国限制宅基地使用权的自由流转,使宅基地及其房屋私下交易的隐形市场日益繁荣,纠纷逐年上升
郭沫若(1892-1978)的《女神》与惠特曼(1819~1892)的《草叶集》有着很深的渊源关系,我们分别从时代背景、诗人的个性特征和诗体解放的要求等方面来探求其接受之因;但是《女神
论文结合中国第一汽车集团公司技术中心重点产品项目——“商用车AMT”,重点研究了基于通信技术的发动机转速控制技术,并设计了发动机转速机械调节系统。主要包括以下内容:1
本文以劳动合同法实施后的企业法律环境变化为背景,以江苏东吴集团公司为研究对象,对其劳动合同风险防范问题,进行了比较系统的研究,以提高东吴集团公司合法防范劳动合同风险
文化在社会福利发展的过程中起着十分重要的作用,但纵观社会福利研究的学术史,最受重视的是经济因素和政治因素,而文化因素被轻视,甚至是忽视。然而,近些年从文化角度研究社