论文部分内容阅读
在基于辩论的多Agent自动谈判研究中,如何提高Agent在辩论谈判过程中的自学习能力以充分发挥Agent的自适应性特点是一个亟待解决的问题。本文深入研究了基于自学习能力的辩论谈判策略中的相关问题。首先描述了国内外多Agent辩论谈判自适应策略的研究现状和存在的缺陷,介绍了基于自学习的辩论谈判策略中所涉及到的基础理论。其次,在对策略相关参数和假设进行了简要说明的基础上,对辩论谈判中自适应让步策略的产生问题进行了探讨,同时建立了基于单一时间约束和基于对手偏好的时间约束让步策略产生模型并加以比较说明。论证过程表明,依据谈判历史经验并利用粒子群RBF神经网络算法所设计出的基于对手偏好的让步策略产生模型具有较好的学习与推理能力,它是Agent参与整个双边谈判的优势策略。另外,利用经改进的案例推理方法对让步策略中所涉及的议题保留值进行学习,协助谈判参与者Agent确定议题让步幅度,优化了本文所提出的核心让步策略。再次,在对辩论的主要种类进行了简要说明的基础上,以所提出的基于对手偏好的时间约束(优化)让步策略为前提,提出了适用于本文策略研究的谈判交互语言和交互协议,给出了一种基于冲突判断和让步策略的辩论产生与选择方法,并通过设计一对话试验对辩论过程进行了详细说明,验证了该方法的合理性和有效性。不可否认,采用适当的协议、方法与流程,对辩论谈判策略进行分析与研究,具有较强的理论意义与实际价值。最后,对本文所提出的具有自学习能力的辩论谈判策略的合理性,稳定性以及有效性进行试验评估。训练并测试了一用于拟合对手偏好的粒子群RBF神经网络;另外采用Bootstrap算法对所形成的网络进行了稳定性评价;随后以模拟数据为基础,利用案例推理方法分析和学习了议题保留值,优化了本文所提出的核心让步策略函数;接着通过对比试验对策略进行了效率评估;而后设计了一适用于本文策略研究的谈判系统内部结构框架,并初步完成了一个系统原型,实现了基于辩论的多Agent双边谈判过程。本文针对将自学习方法应用于多Agent辩论谈判策略中的主要问题进行了系统的研究与讨论,提出了较完整的基于自学习的辩论谈判策略的产生、优化与选择方法,为构建基于自学习能力的多Agent辩论谈判系统进行了理论探讨。理论和试验分析表明,本文所提出的策略有利于提高谈判Agent的自适应能力和智能化程度,从而促使多Agent商务谈判向着高效和双赢的方向发展。