基于深度强化学习的车辆跟随决策算法研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:chenliquanhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高级驾驶辅助系统是当今汽车主动安全技术领域的研究重点之一,主要包括汽车自适应巡航系统和前方防碰撞系统。目前市场上产品化的汽车自适应巡航系统由于使用传统的基于规则的车辆跟随决策算法进行决策,无法实现高效、舒适、安全地跟随,往往需要舍弃乘车的舒适性以保证安全性。针对这一问题,提出了一种基于深度强化学习的车辆跟随决策算法,综合考虑了车辆动力学特性和刚体碰撞理论,解决了车辆跟随过程中舒适性不佳的问题。主要包括以下工作:对车辆跟随过程进行了马尔科夫决策过程建模,将车间距、前后车相对车速、跟随车辆的加速度作为状态集,即决策系统的输入;将跟随车辆的期望加速度作为动作集,即决策系统的输出;将驾驶风险原则、优化目标和个性化设计作为决策系统的决策依据,从而构建了基于深度强化学习的车辆跟随决策框架。结合最小安全距离模型,综合考虑跟车过程的安全性、舒适性和效率,设计了一个模块化的奖赏函数。基于深度确定性策略梯度算法,提出了一种车辆跟随自主决策算法。训练好的跟车模型,在多种环境下都能实现安全、舒适、高效地跟随前方车辆。针对深度确定性策略梯度算法中经验样本利用效率低的问题,以时间差分误差的大小和即时奖赏值作为划分样本优劣的标准,提出了一种新的复合优先经验回放机制,提高了经验样本的利用效率,加快了算法的收敛速度。在gym仿真平台上,将本文提出的复合优先经验回放机制与已有的机制对比,本文方法不仅在经验样本存储时具有更低的时间复杂度,更能加快模型的收敛速度和训练稳定性。在仿真环境中,对本文提出的车辆跟随决策算法进行了性能测试,实验结果表明,训练好的模型,能在不同的测试环境中实现安全、舒适、高效地跟随领航车辆,且性能优于已有算法。
其他文献
云计算作为一种新型的计算模式,具有价格低、可靠性高、按需服务、可拓展等优势,受到社会的广泛关注。云数据中心是云计算最重要的基础设施,使用虚拟化技术整合物理资源,可以高效地管理数据中心的资源。随着云数据中心规模的不断扩大,云数据中心中设备的能耗和网络资源消耗也在不断增加。合理的虚拟机放置和虚拟机迁移策略可以有效地减少云数据中心的能耗和带宽资源消耗,因此云环境下的虚拟机放置问题和迁移问题成为云计算领域
随着5G和物联网的快速发展,各种无线设备的应用空前广泛,现场调试检修的情况变得越来越普遍,传统频谱分析仪受限于体积、价格和使用条件的限制,无法适应当前的需求,而手持式频谱分析仪又限于体积成本等因素无法扩展功能,为了解决这些问题,已经有一些研究者针对特殊需要设计了便携式的频谱分析仪,一定程度上解决了现场调试检修的部分需要,但还存在着通用性差,性价比低的缺点,为此,本文基于改进的CORDIC算法设计实
随着我国铁路运输朝着高速重载方向快速发展,钢轨伤损急剧增加、使用寿命严重下降,钢轨亚表面由于疲劳裂纹引起的钢轨失效问题普遍存在,而现阶段对钢轨亚表面疲劳裂纹扩展行为及剩余寿命评估基础理论仍不完备。本文基于损伤容限理论,借助有限元软件ANSYS及FRANC3D,对U71Mn焊接钢轨亚表面抗疲劳裂纹扩展能力进行了详细探讨。论文主要研究工作包括:建立了含裂纹体的轮轨三维有限元模型,对钢轨亚表面疲劳裂纹扩
叶片是维系植物生长、发育的重要器官,对环境变化具有很强的可塑性。密度是影响植物生长的重要环境因子,通过影响植物冠层光照强度、空间距离、个体竞争等方式对植物叶片大小、形态产生重要决定作用。已有对植物叶片密度响应的研究都是从植物蔽荫综合症、光调控通路、植物免疫等方面开展的,这些研究发现了影响密度诱导的叶片表型可塑性基因的功能。但是,叶片是一个复杂的器官,它的生理功能不仅受其大小所影响,还受其形态结构所
随着乡村振兴和产业扶贫的普及与发展,以消费扶贫为依托的区域发展形式不断优化,在互联网、大数据和人工智能的发展与普及下,人们生活日益呈现便捷化和多元化的现象,县域环境中消费者消费意识和消费趋势产生转变。在完成全面脱贫的背景下,各地区在解决基本扶贫要求的前提下,致力于探索符合自身发展特色的产业扶贫模式。互联网理念作为经济顶层设计发展至今,以平台技术带动传统行业,完成传统行业的产业升级。目前多地区已建立
在城市轨道交通的日常运营过程中,信号系统是保障整个轨道交通运行安全的核心系统。目前,城市轨道交通信号系统大多数采用的是基于通信的列车运行控制系统(CBTC系统),使得CBTC系统成为我国城市轨道交通列车运行控制(ATC)系统的发展方向,而列车自动监控(ATS)系统作为ATC系统的重要部分,主要完成列车的调度、监督、控制等工作,并帮助调度人员完成对全线列车的行车管理[74]。利用仿真技术对列车自动监
创新创业教育是新时代背景之下教育领域的重要板块,是学生在专业领域学习与实践的有效途径,也是检验理论知识是否扎实的有效标准。在注重专业技能培养的高等职业院校中,“专创融合”是实现创新创业课程有效执行的复合型教学模式。总结目前高等院校中创新创业教育的发展,分析高等职业院校中“专创融合”的必要性,以及“专创融合”对有效课堂提供的实际价值。以服装设计专业为例,剖析创新创业课程与专业课程的融合发展对策,为高
信息产业的飞速发展使生活中越来越多的行业产生了新的通信需求,人们对于网络速度和通信质量的要求也在与日俱增。而目前使用的频段资源已经捉襟见肘,无法满足新的业务扩展以及更高速率的信息传输需求。毫米波是解决这一客观难题的优选途径,其不仅拥有极宽的带宽资源,而且能够实现超高速率的信息传输,所以对毫米波的研究有其必要性。目前高速铁路通信系统中大多数仍是采用较为古老的GSM-R移动通信系统,传输效率低下,不能
对地质灾害进行监测和预警始终是社会普遍重视的话题,它直接影响着人民群众的生命健康与财产安全。我国地貌特点复杂,地质灾害分布广,隐蔽性、突发性及破坏力较强,因此必须着重发展科学研究地质灾害监测技术,以降低地质灾害所带来的危害和经济损失。本文着重研究了RTU数据采集问题和数据展示问题,设计了一种地质灾害监测与预警平台,且针对高效滑坡预测问题进行了研究。为了解决高并发问题,根据RTU的类型,本平台设计了
我国地铁线路上存在大量冲击型不平顺,由此引起的轮轨系统冲击噪声严重危害司机和乘客的身心健康。弹性车轮通过在轮辋和轮芯之间增设橡胶结构,能够有效降低轮轨间的相互作用力,从而降低轮轨系统的振动噪声水平。然而,目前国内弹性车轮仅应用在有轨电车上,在地铁线路还并未得到应用。因此,深入分析冲击型激扰下地铁弹性车轮的声振特性,对推广弹性车轮的应用,以及地铁线路冲击噪声的控制都具有重要意义。本文以分析冲击型激扰