【摘 要】
:
人工智能的蓬勃发展不仅给各行各业带来了深刻的变革,相关的技术也逐渐应用到人们生活的方方面面。多智能体系统作为人工智能重要技术组成之一,也受到了学界越来越多的关注。早期相关研究多着重于单智能体路径规划,或者环境已知且场景相对简单的多智能体路径规划。现在应用场景的复杂性和多变性,对多智能体系统的决策能力和路径规划的效果有了更高的要求。即便在环境简单且已知的场景,传统方法对于路径规划的求解效率也不是很高
论文部分内容阅读
人工智能的蓬勃发展不仅给各行各业带来了深刻的变革,相关的技术也逐渐应用到人们生活的方方面面。多智能体系统作为人工智能重要技术组成之一,也受到了学界越来越多的关注。早期相关研究多着重于单智能体路径规划,或者环境已知且场景相对简单的多智能体路径规划。现在应用场景的复杂性和多变性,对多智能体系统的决策能力和路径规划的效果有了更高的要求。即便在环境简单且已知的场景,传统方法对于路径规划的求解效率也不是很高,且随着智能体数量增多以及环境规模变大,路径规划的时间呈指数增长。因此传统的多智能体路径规划方法,已经不能满足实际需求。为了在上述难点中完成多智能体路径规划任务,本论文利用深度强化学习的方法,对多智能体路径规划进行了一些探索和研究,并进行仿真实验,取得了一定的成果。主要工作内容如下:(1)对智能体进行建模,搭建多智能体路径规划的仿真环境。为了使仿真更接近于实际,为智能体设置模拟传感器,智能体只能获取到距离自身一定范围内的环境信息。根据多智能体路径规划的特点,设计状态空间、动作空间以及回报函数。(2)提出一种改进MAPPO算法,在智能体进行路径规划的过程中能够选择性的关注其他智能体信息。该算法在MAPPO算法的基础上,引入了变形编码器(Transformer Encoder)对所有智能体的信息进行特征提取,然后对全局信息进行权重计算,得到的特征相对每个智能体来说关注度有所不同。评价网络的注意力更多放在对自己有用的信息上,忽略一些可能造成干扰的信息,据此能够更好的去评价整体的策略。(3)根据所搭建的仿真环境进行实验,从多个角度说明改进算法的有效性、可行性以及高效性。首先在不同智能体数量以及不同障碍物的环境中进行实验,根据实验结果从不同角度验证了改进MAPPO算法的可行性和有效性。通过与MADDPG算法对比,表明改进算法的高效性。通过设置消融实验,与基础MAPPO算法做对比,进一步验证了改进MAPPO算法中变形编码器的重要性。
其他文献
在超高温陶瓷家族中,硼化锆(ZrB2)基陶瓷因其低密度、高熔点、高热导率以及良好的化学惰性,成为航天航空领域重要的候选材料之一,受到研究人员广泛的关注。ZrB2基陶瓷的性能受到ZrB2粉体品质的显著影响,而ZrB2粉体品质则与ZrO2原料和合成工艺密切相关。因此,本论文通过调控ZrO2粒径和硼热还原工艺,开展ZrB2粉体合成和ZrB2陶瓷制备研究。在此基础上,引入Si C晶须作为第二相,进一步提高
目前的陶瓷增强铝基复合材料3D打印研究还未充分展开,相关的材料体系开发、打印工艺优化、显微结构特征、致密度提升等方面的研究工作仍然需要深入进行。本文以AlSi10Mg为基体,分别采用轻质及重质陶瓷颗粒作为增强相,通过系统的实验设计方法(Design of Experiment,DOE)深入探索了选区激光熔化技术(Selective laser melting,SLM)的打印工艺参数与打印致密度之间
在物联网(Internet of Things,IOT)和网络物理系统(Cyber Physical Systems,CPS)的飞速发展的时代,迅速获取室内人、设备以及其他物体的位置信息是现在最受关注与发展最迅速的领域之一。超宽带(Ultra-Wideband,UWB)室内定位凭借低成本、低功耗、抗多径干扰和穿透能力强等优势,成为当今室内定位的热门技术之一。然而,随着人们对室内位置服务的要求不断增
现今,与人脸技术的相关研究已经有大量的工作并实现应用,其落地实现方法有依赖互联网云平台丰富的计算资源,有利用传统机器学习方法以降低计算量的,还有依靠带GPU的高端嵌入式平台的,但这些落地实现方法难以作为兼顾实时性、安全性、复杂环境适应性、低成本与低功耗方案推广。鉴于以上问题,本课题拟设计一种轻量级人脸检测、人脸关键点检测和人脸验证算法,自制数据集,并对数据集的增强操作随机使用了多种技巧,改善模型训
近年来,随着5G时代的来临,电力系统进入到了物联网时代。伴随着电力物联网规模的不断扩大,运行环境愈发复杂多变,暂态稳定性的问题也变得愈发严重。电力系统在运行期间,时常会因为某些部位发生短路而引发相关的故障,使整个系统进入到暂态运行状态,相关参数在受到干扰的情况下也会发生显著改变,进而会给系统形成较为显著的危害。所以积极探索对暂态稳定情况进行有效调控且可靠性较强的控制技术是非常有必要的,能够提升电网
密码技术在当下信息安全形势不断严峻的背景下,仍担任着非常关键的角色。目前,根据密钥的数量和使用方法的差异,密码算法主要被分成非对称密码算法和对称密码算法,前者在加解密过程中分别使用私钥和公钥,后者则使用同一种密钥。AES和SM4算法是当下主流的对称密码算法,在信息传输方面有较高的安全性。传统的密码算法大都通过软件方法来实现,这种方法占用资源较多,运算效率低,安全性也不足。而硬件方法拥有更高的运算效
光伏发电输出特性易受外部环境改变影响,具有非线性、间歇性等特点。为提高太阳能的利用率,需要对非线性的光伏输出进行最大功率点跟踪(Maximum Power Point Tracking,MPPT)控制。另外,光伏的输出电压较低,需利用高增益DC-DC升压变换器作为升压接口以实现并网。在现有的变换器技术中,单级多单元(Single-stage Multicell,SSMC)高增益DC-DC电能变换器
随着电力产业的快速发展,输电铁塔的建设已遍布全国各地,给人民的生产生活带来了极大的便利。当前国家大力推行的生态优先、绿色发展之路,不仅造福了人类,而且鸟类的栖息环境也受到有效的保护,日益增多的鸟类在输电铁塔上驻留、排便和安家等行为给配电线路的正常运行造成了巨大的威胁。针对这一问题,电网运维工作者和相关专家提出了多种解决方案,如安装防鸟刺和智能驱鸟器来防止害鸟在杆塔周边活动。这些方案虽然可以在一定程
随着科学技术的高速发展,精密工程技术所涉及的领域越来越广泛,包括微电子技术,纳米技术,精密加工技术,航空航天技术等领域,因此,国内外对系统的精密定位,控制方法以及系统稳定性等方面也提出了相对较高的要求。本文主要根据音圈电机的自动定位来实现镜头的自动对焦进行研究及分析。首先设计音圈电机的高精密微定位平台,该平台设计可以实现手动和自动两种对焦方式,可扩展性较强。应用伺服控制方式进行音圈电机驱动设计,有
当今社会,能源短缺及环境恶化问题日益严重,新型可再生清洁能源的开发已势在必行。作为一种清洁可再生能源,氢能是代替化石能源的最佳选择之一。电解水制氢作为一种绿色的制氢途径得到广泛研究,然而水分解的两个半反应——析氢反应(hydrogen evolution reaction,HER)和析氧反应(oxygen evolution reaction,OER)自身存在较高反应能垒,缓慢的动力学过程使得实际