【摘 要】
:
针对深度强化学习中卷积神经网络(CNN)层数过深导致的梯度消失问题,提出一种将密集连接卷积网络应用于强化学习的方法。首先,利用密集连接卷积网络中的跨层连接结构进行图像特
【基金项目】
:
国家自然科学基金资助项目(61503192,61773219);江苏省自然科学基金资助项目(BK20161533);江苏省六大人才高峰项目(2014-XXRJ-007);江苏省青蓝工程项目~~
论文部分内容阅读
针对深度强化学习中卷积神经网络(CNN)层数过深导致的梯度消失问题,提出一种将密集连接卷积网络应用于强化学习的方法。首先,利用密集连接卷积网络中的跨层连接结构进行图像特征的有效提取;然后,在密集连接卷积网络中加入权重系数,加权密集连接卷积网络中的每一层都接收到前面几层产生的所有特征图,且之前所有层在跨层连接中被赋予不同的初始权重;最后,在训练中动态调整每层的权重,从而更加有效地提取特征。与常规深度强化学习方法相比,在GridWorld仿真实验中,在相同训练步数内的平均奖励值提升了85.67%;在Flapp
其他文献
介绍了自保护药芯焊丝的最新进展,分析了自保护药芯焊丝的技术先进性,计算了不同焊接材料的碳排放,比较了各种焊材的焊接综合成本。结果表明:新型自保护药芯焊丝具有优良的全
响应我院课程改革的要求,为使《移动通信终端设备的检测与维修》课程的教学满足企业对手机维修的实际要求,提高学生学习兴趣,在移动通信终端设备检测与维修教学中我们采用了
目的:探讨分析PICC个性化护理在恶性肿瘤化疗中的应用效果。方法:选择本院在2016年7月至2017年7月收治的78例恶性肿瘤化疗患者,随机分为观察组(39例)和对照组(39例),观察组与对照组患
出版于1929年的《喧哗与骚动》(下简称《喧哗》)是诺贝尔奖得主威廉·福克纳(William Faulkner)的经典小说。2015年,詹姆斯·弗兰科(James Franco)将其第2次搬上银幕(第1次是
铁氧化细菌属于化能无机营养型,常见的有嘉氏铁细菌属,氧化亚铁硫杆菌。氧化亚铁以及各种还原性硫化物为铁氧化菌提供生命活动能量。其主要碳源是二氧化碳,氮源为NH4+。由于氧化
伴随着新时代经济全球化、文化多元化趋势的不断发展,带来的是更大的思政教育压力,在面临不同的思想冲击时,容易出现影响正确人生态度的负面因素。为了做好当代大学生的思政
正交频分复用技术在无线通信系统中应用十分广泛,可有效对抗信号符号间干扰,适用于多径和衰落信道中的高速数据传输。为提高通信传输质量,需要对信道脉冲响应值进行估计。基
研究了一种带有浮空阶梯场板的AlGaN/GaN肖特基势垒二极管结构—SFFP-SBD(Stepped Insulator Floating Field Plate).该结构是结合浮空场板,阶梯场板的优点,在反向状态下,浮空
目的调查上海地区飞行员变应性鼻炎患病率并探讨其发病特点及影响发病的相关危险因素。方法分析2015年9月—12月参加上海地区年度体检在职飞行员1135例,根据问卷调查表选取高
1工程概况 上海同济大学土木学院办公楼位于上海市四平路,根据业主要求,办公楼采用数码涡旋中央空调。本设计以该办公楼的其中一层为案例,建筑面积133m^2空调面积1057m^2。