联盟谈判博弈平台及智能体谈判算法的设计与实现

来源 :天津大学 | 被引量 : 0次 | 上传用户:a200638012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能关注智能体的智能行为,比如在战略性遭遇战中打败人类或者在认知任务中胜过人类。联盟博弈可以用来模拟经济、政治和许多其他社会领域中出现的各种问题,这是一种混合动机(竞争和合作)博弈,其中参与者通过战略谈判来决定组成什么联盟以及如何在联盟成员之间分配收益。虽然联盟博弈理论中存在大量的工作,但联盟形成的过程却很少受到关注,特别是当智能体与人类交互而不是与其他自治主体交互时的联盟过程。人工智能在此类游戏中与人谈判的一个主要挑战是,谈判结果不仅依赖于谈判策略,还依赖于直觉、文化规范、信号和情感。因此,本文针对联盟游戏的在线谈判环境进行了设计并实现,该环境旨在为联盟谈判游戏中训练玩家谈判技巧以及开发基于智能体的自动谈判算法提供一个用户友好型的谈判平台。本文同时提出了一种将博弈论的理论解概念、机器学习模型与信号产生和作用机制相结合的新方法,该算法可以在联盟谈判博弈中处理人和其他智能体之间的博弈。根据谈判算法,对自动谈判智能体进行了构造和编译。我们在实现的在线联盟博弈平台上对这些智能体的性能进行了评估,实验结果验证了在此背景下智能体人机交互的几个重要特性。
其他文献
近年来,随着互联网技术的蓬勃发展以及文本信息的爆炸式增长,“信息过载”问题愈发严重。如何快速准确地从大量无结构的信息中抽取出用户感兴趣的信息成为当前自然语言处理领域的热点问题。因此,信息抽取技术受到的关注逐年增加。作为信息抽取中的重要子任务,事件抽取旨在从自然语言文本中抽取出指定的事件信息,并以结构化的形式存入数据库中。事件抽取任务分为两个子任务:事件检测和事件论元抽取,本课题主要聚焦于第一个子任
信度分配技术涉及确定系统组件对系统整体性能的贡献,强化学习的成功离不开信度分配技术。在多智能体强化学习领域信度分配主要是合作式环境下各智能体对全局奖励信号的分配。通过研究信度分配机制,来完善或解决合作式多智能体深度强化学习下单个智能体策略更新信号不准确的问题,从而达到提高多智能体学习效率和协作程度的目的。因此,多智能体信度分配是解决合作式多智能体协调问题的关键。然而,一方面之前的研究大多基于差异奖
目标检测是计算机视觉中常见而具有挑战性的任务,传统的目标检测分为滑窗提取候选区域,提取相关特征和对特征分类三个过程。该方法存在的缺陷有滑窗时间复杂和窗口冗余,除此之外,手动设计的特征在目标多样性上没有很好的鲁棒性。深度学习技术不断发展,目标候选区域和相关特征可以通过卷积神经网络来提取,目标检测任务变成端对端的形式。深度学习的检测算法在速度和准确性上有了很大提升。天文学领域中,检测日冕暗化(Coro
数字图像作为信息的重要载体之一,在人们的日常生活、娱乐和工作中发挥着至关重要的作用。伴随着数字图像的广泛传播,人们对数字图像进行修改的需求愈加迫切,由此出现了各种图像编辑软件,如Photoshop、美图秀秀等。尽管这些图像编辑软件给人们带来了极大的便利,但是也给了不法分子可乘之机。如果这些虚假图像被用于媒体、科研、司法等领域,势必会引起恶劣的影响。因此,数字图像取证引起了研究人员的广泛关注。图像彩
三维人脸的有效表示以及重建在计算机视觉和图形学有着广泛的应用。三维人脸的表示,即是通过一定的算法得到三维人脸的高维特征数据,重建就是从高维特征数据中能够通过算法模型重建出对应的三维人脸。大多数存在的线性表示算法并不能有效的重建出高质量的三维人脸数据,尤其是对于面部细节的处理比较粗糙,而最新的非线性表示方法不太适用于实际三维形状。三维人脸的表示和重建能够给人脸识别、机器情感表达等方向提供该技术支持,
深度学习技术在近些年来发展迅速,而使用深度学习技术开发的系统在各个领域被广泛应用并表现出优秀的能力。但是深度学习系统中可能存在一些缺陷,这些缺陷会使深度学习系统在某些输入下作出错误决策,导致严重后果。因此,深度学习系统的测试受到越来越多的关注。深度学习系统可被分为深度学习模型和深度学习库两部分,目前大部分深度学习测试的研究针对的是深度学习模型,很少有研究针对深度学习库进行测试。由于深度学习库被众多
近年来,深度神经网络取得了突破性的进展,如今在生活中的各个领域都得到了广泛的应用,比如图像分类识别、人脸识别、语音识别等。随着对网络结构和损失函数的不断优化,深度神经网络显著的改善了各种复杂的分类任务的性能。损失函数是深度学习中不可或缺的一部分,而对于不同的任务,有各种各样的损失函数,如MSE,BCE等。关于损失函数的性能有很多研究。一个好的损失函数理论上应该能够使得数据集中相同类别的特征的分布更
基于竞争抑制免疫层析原理,开展茶叶中草甘膦快速检测试纸条的研制。采用柠檬酸三钠还原氯金酸制备了20 nm胶体金颗粒,然后以胶体金为标记物制备草甘膦单克隆抗体-胶体金偶联物,以硝酸纤维素膜为固相载体,包被草甘膦半抗原-卵清蛋白偶联物为检测线、羊抗兔二抗为质控线,建立草甘膦的胶体金快速检测试纸条。同时优化了胶体金最适pH值、抗体最佳使用量、试纸条材料的型号,最终确定胶体金溶液的pH值为7.5,最佳抗体
运动目标的检测也就是人们常说的追踪问题,它是计算机视觉的重要组成部分。其相关的方法有很多种,其中光流法描述的是图像中像素点灰度值的变化趋势,也就是像素点的运动速度矢量场。在过去的几年中,深度学习在计算机视觉和自然语言处理等各种问题上都取得了很好的效果。而随着卷积神经网络的理论逐渐成熟,其相关研究逐渐深入到光流特征图评估的领域。本文提出了一种称为快速光流单元的网络子结构,它使原网络能够通过一种快速并
随着互联网时代的到来,视频的制作以及传播越来越便捷,视频数据大规模增长,拍摄视频逐渐成为了很多人分享生活内容的一种方式,但同时也产生了大量重复视频。视频内容具有一定的经济价值,视频盗版的行为损害了视频制作方的利益,同时也会增加视频网站的带宽和存储成本,不利于视频平台的发展。现今视频网站会根据用户喜好推荐视频,推荐重复的视频会极大影响用户的观看体验。因此需要借助计算机技术识别重复视频。本文提出了一种