严格目标偏好下的最大成功联盟问题研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:fayeming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
联盟形成一直是多agent系统(multi-agent systems,MAS)和人工智能领域的一个研究热点,主要研究如何形成联盟以及形成哪些联盟可以使系统的总收益最大。然而,已有工作大都不考虑agent对于目标的偏好性,即每个agent可以参与任何目标,即使agent对这些目标毫无兴趣。在一些特殊应用场景,如角度视角受限的多摄像头协同监控系统,每个智能摄像头的行为具有很强的目标偏好性,它只会响应其监控区域内能捕捉到的目标,而对于监控区域外的目标则无能为力;又例如在灾害应急响应中,由于应急响应在时效性上的高要求,每个储备点都会优先满足就近的受灾点的需求,而不可能耗费大量人力和物力去响应很远的受灾点的需求。鉴于上述背景,本文在传统资源结盟博弈的基础上考虑agent对响应目标的严格偏好性,研究严格目标偏好下的最大成功联盟问题,本文主要研究工作如下:(1)介绍了相关的研究背景,以及国内外对联盟形成问题、尤其是资源结盟博弈的研究现状,分析并总结了当前最大成功联盟生成问题研究中存在的不足,以确定本文的研究动力和主要研究内容。(2)介绍了相关基础理论知识,包括MAS和联盟的相关概念,以及联盟形成相关理论。最后介绍了几种与本文有关的经典的优化算法,包括遗传算法、粒子群算法和最大流算法等。(3)根据agent对目标的严格偏好,基于“资源贡献量”和“资源剩余量”对传统资源结盟博弈模型进行了改进,并从理论上分析了成功联盟的充分必要条件以及搜索最大成功联盟问题的计算复杂性。(4)针对严格目标偏好下的最大成功联盟(largest successful coalition,LSC)问题,首先基于最大流网络设计了一个指数级的确定性求解算法(flow-network based exhaust algorithm,FNet EA)以获取LSC问题的全局最优解。为了提高问题的求解效率,又基于遗传算法、二维二进制编码和启发式修正方法设计了一个二维混合搜索算法(two-dimensional hybrid algorithm,2D-HA)。对比实验结果表明,2D-HA算法在求解LSC问题上表现出了很好的有效性和求解效率,可以在大规模LSC问题上耗费很短的时间就能找到和确定性算法FNet EA一样的最优解,且2D-HA算法性能不受agent数、目标数和资源数的影响,具有很强的鲁棒性。
其他文献
反常霍尔效应(AHE)多年来吸引了人们的广泛关注,理论上,铁磁体中的AHE有公认的三种可能的来源,包括了与杂质散射有关的外禀机制和源于k-空间中的Berry相位的本征机制,这些机
目的:本研究的目的是探讨长链非编码RNA肺腺癌相关转录子2(Metastasis associated lung adenocarcinoma transcript 2,MALAT2)在胃癌(Gastric cancer,GC)侵袭转移中的相关作
第一部分电凝法制作大鼠MCAo模型目的:建立SD大鼠大脑中动脉闭塞(MCAo)模型,观察记录大鼠相关行为学变化并进行评分,病理检查证实梗死范围。方法:24只SD大鼠随机分为实验组和
表面等离激元(Surface Plasmons,SPs)是一种与金属表面紧密结合的电磁激励,可将能量紧密限制在金属与电介质的界面上。SPs可有效突破传统光子器件衍射极限的限制,可将光子器
目的明确机械牵张刺激下大鼠皮肤再生相关基因表达谱的变化,并筛选出其中的关键基因。方法建立大鼠皮肤扩张模型,以未扩张皮肤为对照,以注水量不同分组取材。分别是:对照组(c
目的甲状腺肿瘤是内分泌肿瘤中最常见的一种,近年来发病率逐年升高。本课题通过检测ZNRF3基因在甲状腺癌和癌旁组织中的表达差异,结合病例标本的临床资料,初步阐明ZNRF表达与
低频时码授时是目前国际上比较先进的电波授时技术方式。也是当前国际电信联盟(ITU)比较推崇的新一代授时技术。所谓低频授时是指授时电波的工作频率较低,并且电波的输出方式多
随着智能终端的大规模普及和物联网技术的兴起,传统无线通信系统已经呈现出高密度化的特征,预期在下一代无线通信系统中,终端数目要超过百亿,且每平方公里的设备连接数要超过
视频人体行为识别,也简称为视频行为识别,是指从视频中识别特定人类对象的具体动作。人类行为丰富多样,且贯穿于生产和生活中。对视频中的人类行为进行识别,可以有效增进对视
创业投资作为资本市场上科技与金融结合的创新成果,对高新技术企业和高增长潜力的初创企业能够提供资金、技术、管理等方面的支持,在促进科技成果转化和新兴产业发展方面有显