基于强化学习的自适应城市交通信号控制方法研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:selena2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
城市道路不断兴建和扩宽,基础设施建设投入也越来越大,然而城市交通拥堵问题却越来越严重,主要原因是现有的城市交通信号控制TSC (Traffic Signal Control)系统不能充分做到对交通流量的最优控制和管理。因此,如何通过交通信号的最优控制来设计和优化城市TSC系统,成为保障交通安全和畅通、增加道路通行效率及其缓解交通拥塞问题的关键所在。本文选择基于Q-learning算法的单Agent控制体系结构,基于分布式Q-learning算法的Multi-Agent系统以及Green Light District(GLD)开源仿真平台进行城市TSC系统优化研究,主要做了如下工作:(1)设计了基于单路口和井字形区域路口的城市TSC系统Agent框架,模拟城市道路控制。对于城市单路口,通过一个智能Agent实时检测每个方向的交通流数据,交通流数据通过模糊逻辑化,输入设计的单路口Q-learning决策器,寻得最优控制策略。对于区域交通控制,提出了分布式Q-learning算法和MAS结合的优化控制方式,给出了相邻路口Agent协调控制模型,实现相邻路口之间信息共享。(2)解决了Q-learning算法和分布式Q-learning算法对交通环境状态集S、动作策略集A、奖惩函数R等关键问题。状态空间的选择,设计用模糊逻辑来计算排队长度;动作策略集A:增加、保持和减少相位绿灯时间:奖惩函数R以路口车辆排队长度作为指标,以车辆排队长度最小为目的。(3)实现了分布式Q-learning算法在区域TSC系统优化上的运用,解决了区域信号协调控制问题。分布式Q-learning算法和MAS的结合,实现对城市TSC系统最优控制。城市区域交通网络是分布式的多Agent网络,建立了基于分布式Q-learning算法的Multi-Agent模型框架,同时给出了分布式Q-learning算法设计的详细步骤。最后分析了基于Q-learning算法的单路口城市TSC优化和基于分布式Q-learning算法的区域TSC优化的算法性能。在GLD中,对随机配时,固定配时,Longest-queue, Traffic-controller 1 (TC1), ACGJ-1、Q-learning算法和分布式Q-learning算法优化性能进行了模拟验证分析,实验结果表明了Q-learning算法和分布式Q-learning算法在城市TSC系统优化上优于其他算法。
其他文献
自2006年12月11日起,我国全面开放金融业,给予外资银行以国民待遇,人民币业务也已对外全面丌放。外资银行的进入将对我国银行业形成严峻的挑战和带来沉重的竞争压力,并将对我
随着信息技术的不断发展,计算正在变得无处不在。所有的软件系统都是帮助用户完成计算的工具。软件的使用者不只是计算机专业人员或者行业专家,越来越多的普通用户出现。作为
本文主要从A服装公司所面对的宏观政策背景、行业竞争状况的分析着手,利用PEST分析、五力模型、BCG矩阵、SWOT等战略分析工具来分析公司内外部环境以及公司当前战略,结合企业
高速公路因其安全、快捷、舒适的行驶环境成为我国交通运网中不可或缺的组成部分。近年来,随着社会经济的不断发展,汽车保有量连年激增,但高速公路网初步建立,较为脆弱,运营
同步加纤碎石下封层是在原有养护方法基础上兴起来的一种工艺或材料,它是采用同步加纤碎石封层车几乎同时依次喷洒(撒)一层改性乳化沥青、一层纤维、一层改性乳化沥青、一层
纺织工业的每一次跨越式发展都将带动城市空间的急剧变化和大规模扩张,纺织工业的区域布局快速影响着城镇化的进程和城镇体系布局。而城市空间作为工业发展的载体,对工业的发
通过实验,研究了人工湿地对水中以BOD5和COD有机污染物含量的表征有机污染物的降解作用。结果表明,人工湿地对水中有机污染物有明显的净化作用;细菌总数与有机物的降解没有明
介绍了某大型商业综合体存在的防火分隔和安全疏散等技术难题.针对建筑的功能和特点,基于性能化设计思想提出步行街按照“准安全区”的设计思路,从防火分隔、安全疏散、烟气
随着网络的迅速普及,网络社会开始崛起,这既为社会管理提供了新的平台,也带来了巨大的挑战。文章从我国网络社会管理存在的问题、产生原因以及对策建议等方面对既有相关研究
新时期发展书法教育,要学习贯彻十九大精神,充分发挥书法课程的育人功能。一要深入领会十九大精神,增强发展素质教育,立德树人的使命意识和紧迫感。二要充分发挥书法课程的育