联盟技能博弈中自利agent的协作与任务分配研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:seayi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际应用中存在很多有自利agent参与的场景,多agent协作无论在工程领域还是在管理领域都有着广泛的应用。联盟技能博弈是一个典型的多自利agent系统。通过对联盟技能博弈的深入而系统的研究能为其他自利agent的管理和协作问题提供理论和方法支持。
  完成的主要研究工作和成果总结如下:
  (1)给出联盟技能博弈的一般模型,根据影响联盟值的因素将联盟技能博弈模型分为特征函数联盟技能博弈和划分函数联盟技能博弈。研究了两种联盟技能博弈的区别与联系。
  (2)针对自利agent联盟技能博弈的任务分配问题,提出了TAASES算法、IRA算法和TAAUDA算法。这三个算法在保证agent的自利性的前提下也能保证较高的系统总收益,并且可分别为自利的服务agent、技能和任务agent提供决策支持。
  (3)研究了当联盟技能博弈中的agent处于不同地理位置,具有不同的视野范围时,自利的服务agent的任务选择策略和自利的任务agent的效益分配策略。分析了自利agent的视野范围对系统收益和个体收益的影响。
  (4)针对多自利agent联盟技能博弈,考查了如何为现有多agent系统添加新agent或者为现有agent添加新技能的问题。设计了一个动态规划算法用于求解多agent联盟技能博弈的“最大系统收益”。并提出了三种解决问题的方法,分别是最大系统收益法、最大平均贡献度法和最小供求比算法。
其他文献
随着计算机科学与信号处理技术的高速发展,调制信号参数的估计与调制方式的识别在民用和军事领域都扮演着重要的角色,例如灾害的防御、地质、海洋的探查、电子信息的对抗,情报的侦察等领域。而调制信号参数的估计,如调制方式、载频等,是能够成功识别调制信号方式的重要前提。论文的研究内容主要包括:  1、根据信号的循环平稳性在抗噪性方面的优势,采用信号的循环自相关函数进行傅里叶变换得到信号的循环谱。在载波频率估计
学位
由于鱼眼镜头的视角可达 180°左右,因此其被广泛应用于医学成像、智能交通、视频群组会议和安防监控等领域中。在近年来兴起的高级驾驶辅助系统、虚拟现实与增强现实等领域中,鱼眼镜头也有着广泛的应用前景。相比于普通镜头,鱼眼镜头在带来更大视角的同时,也导致了严重的图像畸变。对于鱼眼图像畸变矫正算法,国内外的很多科研人员都做过相关的理论研究。然而,大部分的算法复杂度高,计算量很大,只能在高性能的PC上实现
学位
视觉是人类观察和理解世界的一个重要途径,而机器视觉中的一个重要任务就是通过准确地理解人体行为动作来更好地实现人机交互。与此同时,视频数据随着网络技术的发展正在海量增长,而视频人体行为识别与定位由于在视频安防监控、视频检索以及人机交互中的巨大应用价值也引起了越来越多的机器视觉工作者的重视。  由于计算机自动识别出视频中危害人身安全的行为动作后进行自动报警,可最大程度地减少受害人的伤害,具有重要的视频
学位
智能监控系统通过结合人脸识别、目标检测与跟踪、异常检测等技术被广泛应用于众多相关领域。与此同时,在我国日趋复杂的工业网络结构中,监控视频在工业安防和工业质检等方面的作用愈加重要。然而,随之产生的海量监控视频的传输和存储给网络带宽、内存资源等方面也带来了极大的挑战。因此,保证监控视频的高效应用并提高压缩与重构效果,具有重大的应用和商业价值。  本文在分块压缩感知理论的基础上,根据监控视频自身及其应用
学位
数据压缩是指在保持数据的信息熵的条件下将数据量进行削减。因为深层自编码神经网络擅长于理解数据并对数据进行抽象表征,能够有效地对复杂数据进行压缩。为了能够将人耳听觉所能捕捉的所有频段作为输入,必须输入超长的音频信号采样,进而导致自编码网络的性能下降问题,本文提出了动态残差网络用于音乐音频有损压缩,优化了深度自编码网络模型,提出了一种结合注意力机制和残差学习的量化方法,从而实现了音频信号的压缩量化,同
学位
当代制造业等行业的高速发展,对传统金属材料的品质提出了更加苛刻的要求。在航空航天应用领域,复合材料因其优越的综合性能受到了广泛的关注。然而,在材料的长期服役以及所处工作环境的影响,材料表层及内部的原生缺陷以及在线工作引发的材料损伤等问题层出不穷。如何及时有效的发现材料中的缺陷损伤,是避免危险事故发生的重要前提。  针对无损检测的原位、非接触、远距离等实际需求,基于激光超声的无损检测技术能够较好的满
学位
多目标优化问题是科学研究和工程实践领域中的难题和热门问题。近年来,多目标进化算法(MOEAs)已经在多目标优化问题中取得了较好的应用,经典的多目标进化算法有非支配排序遗传算法(NSGA-II)和基于分解的多目标进化算法(MOEA/D)。这些算法能有效的解决无约束或者简单界约束下的多目标优化问题。未来,如何有效改进经典的多目标优化算法或者提出新的约束多目标优化算法,进而迭代求解复杂约束多目标函数成为
本文基于结构L增益奇异值方法,研究了结构不确定非线性系统的鲁棒性分析与综合问题,并以一些新的观点重新看待非线性H问题,讨论了其它增益问题与非线性H问题的内在联系.基于结构L增益奇异值进行的鲁棒分析与鲁棒综合,其基本依据是奇异值的边界特性,本文针对奇异值的上界特性给予了证明.本文重点研究了鲁棒稳定问题,得到了鲁棒稳定的充分条件,并讨论了保守性的影响.研究表明鲁棒分析中存在的保守性不仅和不确定性的结构
本文的第一部分是人脸识别技术综述。首先介绍了人脸识别技术的研究内容、历史、应用背景以及目前主要采用的人脸实验数据库的情况。并在此基础上阐述了人脸识别的各个步骤的主要任务和难点。 本文的第二部分主要对人脸检测和人眼定位的方法做了研究。介绍了目前的人脸检测的主要的算法。并详细介绍了两种不同的人脸检测和人眼定位算法。一种可以称为是自下而上的办法,即根据脸部的特征如人眼等来检测人脸的位置;另一种可以认为是
学位
作为计算机视觉领域的重要问题之一,以视频序列为载体的目标跟踪在动作识别、行人分析等应用中居于核心地位,同时其问题复杂性也让研究工作充满挑战。本文首先从历史语义信息和连续决策过程两个方面对跟踪问题的本质进行理解:即跟踪过程应为连续的决策过程,且视频序列提供的历史语义信息为后期决策提供支撑的同时也带来冗余。接着,基于该本质理解,总结出现有跟踪研究工作中的一些局限性:历史语义信息在时间与空间上的局限性,
学位