基于Q—学习的单路口交通信号控制研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:XA1093815462
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前交通拥堵现象在国内外各种城市中频频发生,要解决这种现象,必然要加强交通控制与管理。在城市交通中,单路口信号控制构成了交叉口线控和面控的基础,是国内外研究的热点。 在城市交通控制中,由于交通流系统的时变性、随机性和不确定性等,使得传统的基于模型的控制理论与方法难于取得良好的控制效果,因此,智能控制理论和方法就成为了交通信号控制领域的主要研究手段之一,如模糊控制方法、有监督学习的神经网络方法和Q-学习方法等。本文以多相位、交通需求大的单交叉口为研究对象,设计了基于强化学习方法的信号控制方案。为了克服由于交通需求量大、采用多相位方案引起的状态空间庞大的问题,本文利用交通强度概念,缩小了问题的状态空间,提高了强化学习的收敛速度。通过Matlab仿真,并与感应控制的效果做了对比,验证了采用模糊推理方法对状态空间进行处理的有效性,从而可以把强化学习推广到多相位方案的单路口信号控制中,增加了实用性。本文的仿真虽然是针对四相位的,但方法同样可以推广到更多相位的控制。
其他文献
党的十九大报告中指出要“打造共建共治共享的社会治理格局”,而运用互联网等方法是进行社会治理的重要手段之一.
目的:探讨藏药如意珍宝丸及“石烙”治疗60例肩周炎的效果.方法:随机选取2017年8月至2019年8月我院肩周炎患者60例,随机分为西医治疗组(n=30)和西医治疗基础上藏药如意珍宝丸
开源软件是源代码公开,可以被大众使用的软件.与传统的商业软件相比,开源软件有使用免费、源代码开放、人员组成更加灵活、工作场所不固定等特点.与此同时,与比较成熟的商业
在面向路网的分布式铁路运输仿真平台的开发中,针对生产数据种类繁多、存取复杂等情况,分析现有两层数据管理模式的局限性,借鉴目前成熟的分布式系统数据集成、数据交换、数据服
林业承包合同的签订,不仅可以保护签订双方的权益,同时可以避免违法行为出现.本文以林业承包合同纠纷案件为研究对象,通过对纠纷案件难办原因的分析,会如何解决问题,提出几点
利用FWD动态状态下实测路表弯沉、弯沉盆形状、以及雷达测定各结构层厚度,建立计算结构层层底拉应力的方法,算出路面结构各层的应力、应变;利用FWD实测弯沉盆的数据找出表征弯沉
交通运输作为一个国家经济的基础,是社会经济快速发展的催化剂,其可持续发展的能力直接影响了经济的持续稳定健康发展,其对国民经济的正常运行具有基本承载作用,现已成为一个国家
本文研究了在国内航空公司建立收益管理预测系统的问题。收益管理技术是航空公司获取最大化收益的一项新技术。为了更好地在国内航空公司实施收益管理,文章首先分析了收益管
在通信系统中信道编码是控制传输差错的主要手段之一。传统的信道编码方案通常不考虑信息元对差错的敏感程度,为它们提供相等的检错和纠错能力。然而在一个信息分组中,信息元对
学位