再励学习相关论文
PID控制是最早发展起来的控制策略之一,在控制理论和技术飞速发展的今天,PID控制由于其简单、稳定性能好、可靠性能高等优点,仍广泛的......
近年来Agent以及MAS的研究成为分布式人工智能研究的一个热点。单Agent因个体所拥有的知识、能力的限制,因此对MAS的研究迅速发展。......
在过去的二十年中,计算机网络经历了爆炸式的增长,随之而来的是越来越严重的拥塞问题。拥塞控制是确保Internet鲁棒性的关键因素,......
设计活动是产品开发过程中最重要环节之一,在CAD(Computer-Aided Designl),CAE(Computer-Aided Engineering)和CAM(Computer-Aided M......
提出了一种综合智能化的控制系统设计思想,并将其应用在发电机的励磁控制上,所设计的综合智能型电力系统稳定器兼顾对发电机端电压......
在诸如机器人足球赛等典型的可分解马尔可夫决策过程(factored Markov decision process,简称FMDP)模型中,不同状态属性在不同的状......
结合控制系统设计问题的特点,将遗传算法和再励学习分别引入到模糊神经网络控制器的离线训练和在线应用过程中,提出了一种综合智能......
针对解决对传统的多A gen t再励学习算法中,A gen t只能独立学习、不能合作学习的问题和启发式算法中只考虑了单个A gen t而没有推......
本文给出了一种改进的基于再励算法的神经网络BOXES控制系统,引入超维椭球体模糊划分状态空间的概念,并且通过神经网络的再励学习......
综合考虑再励学习的两个重要子问题 :连续空间及语言评价问题 ,提出了一种新的学习方法 ,即面向语言评价的 Takagi-Sugeno(T-S)模......
为了研究仿人、能量高效的双足机器人步行,研制了由MACCEPA(mechanically adjustable compliance and controllable equilibrium p......
本文对具有时滞的不确定控制对象提出了一种带有神经网络的Smith预估器再励学习控制方法 .文中还给出了再励学习系统中模糊自适应......
再励学习是一种利用评价信息(而不是网络实际输出与期望输出之差)来改善行为的神经模糊算法,采用"奖""罚"信号训练控制器.用再励学......
为了满足卫星姿态控制系统对控制精度、抗干扰和鲁棒性要求的不断提高,将模糊神经网络结合再励学习算法应用到卫星姿态控制系统中,......
提出一种模糊神经网络的自适应控制方案。针对连续空间的复杂学习任务,提出了一种竞争式Takagi—Sugeno模糊再励学习网络,该网络结构......
再励学习(Reinforcement Learning,RL)是一种成功地结合动态编程和控制问题的机器智能方法,它将动态编程和有监督学习方法结合到机器学......
从最优决策的角度出发,将人工智能中的再励学习方法引入主动队列管理的研究中,提出了一种基于再励学习的主动队列管理算法RLGD(rei......
股票市场是市场经济的重要组成部分。但是现有的基于演绎推理的理论分析方法在处理股市这类复杂性系统时遇到了很多困难,因此基于归......
给出了机器人足球系统基于行为的智能主体系统的模型结构.将足球机器人的行为分为3个层次,并描述了行为在各层之间的变迁,引入了再......
针对矢量控制交流调速系统,该文提出并设计了一种基于再励学习的模糊神经网络速度控制器。详细介绍了基于遗传算法的神经网络权重在......
演化艺术通过演化计算演绎出众多妙趣横生的图片,使人们的生活更加多姿多彩。传统演化艺术系统,多采取基于树的表示法,由人工筛选......
基于大系统递阶控制思想,提出了一种运用再励学习算法设计歼击机自动着陆横侧向协调控制系统的方法.将再励学习算法引入歼击机着陆......
本文介绍了Agent组织规则及再励学习的理论,给出了一种基于再励学习的Agent组织规则生成机制和相应的算法。从而得出结论Agent组织......
提出了一种用于解决地铁运行控制问题的基于再励学习的模糊自适应控制方案,解决了多控制目标下列车控制问题,确保了列车准确运行.......
提出一种基于再励学习和遗传算法的交通信号自组织控制方法.再励学习针对每一个道路交叉口交通流的优化,修正每个信号灯周期的绿信......
针对连续空间的复杂学习任务,提出了一种竞争式Takagi-Sugeno模糊再励学习网络(CTSFRLN),该网络结构集成了Takagi-Sugeno模糊推理......
将再励学习引入模糊神经网络的T-S模型,建立了模糊神经网络控制器和控制评估网络的再励学习算法,并应用于三轴稳定卫星的姿态控制.......
针对复杂再励学习系统状态空间存在维数灾问题,结合多移动机器人协调避障路径规划实际应用,用非均匀模糊分割方法将状态空间分解成......
将再励学习的模糊神经控制引入卫星姿态控制中,给出详尽的实现方法,推导了模糊神经控制器的自学习算法.直接利用再励信号,对控制器......
随着卫星姿态控制系统对控制精度、鲁棒性和抗干扰要求的不断提高,将模糊神经网络控制引入到三轴稳定卫星的姿态控制中,并采用基于时......
将模糊神经网络控制引入到三轴稳定卫星的姿态控制中,结合Q-学习和BP神经网络来解决模糊神经网络参数在线调整问题,在无需训练样本的......
关于Agent个体的机器学习一直是Agent研究的一个重要方面,本文对再励学习中的Q学习算法做了简单介绍,然后在一个基于Agent的机器人......
Agent组织是一种灵活有效的多Agent系统求解方式.Agent组织规则在Agent组织的求解过程中起着重要作用,可以有效地减少冲突提高求解......
联盟形成的收益值是模糊和不确定的,难于计算,而联盟收益值在成员变化的情况下的计算就更为复杂。Lerman等人实现了动态联盟Agent进......
人们的行为往往受到利益的驱使,决策过程中获得的奖励对决策结果和学习过程均有重要的影响。然而,奖励信号本身并未包含任何与决策任......
提出一种基于遗传算法和神经网络预测法相结合的再励学习方法,利用遗传算法对全局进行最优解搜索,将进化过程中产生的数据用来训练神......
被动动态步行是双足步行研究领域中的一个重要分支,其研究目的是对于步行现象本质特性的发掘,研究手段包括步态合成和步态分析方法......
提出一种基于模糊规则作为先验知识的启发式搜索算法,解决足球机器人中的踢球问题.算法借助球员控球空间的离散化,采用模糊规则对......
群体Agent合作是多Agent系统(MAS)研究的重要问题之一,也是MAS问题的一种有效的求解方式。针对群体Agent合作求解研究工作中存在的......
提出一种基于多Agent的交通信号控制方法.通过再励学习对交叉口的交通流进行优化,通过遗传算法产生局部学习过程的全局优化标准来......
城市交通一直是同城市发展关系最为密切的方面之一,城市交通问题也是一直困扰交通各界人士的主要问题。交通拥堵、交通安全、环境污......
针对我国城市混合交通状态复杂多变,随机性大,具有分布式交通区域控制等特点,利用多智能体技术和融合技术对其进行研究,提出了基于......
在分析多智能体特性的基础上,提出了基于多智能体的城市道路交通控制系统,并采用遗传再励学习和博弈论方法进行优化控制和区域协调,最......
考虑到神经网络学习算法的特点,给出了一种基于再励学习的自组织模糊CPN.它结合了模糊自组织CPN和再励算法的优点,在控制过程中在......
考虑到神经网络学习算法的特点,给出了一种基于再励学习的自组织模糊CPN,它结合了自组织模糊CPN和再励算法的优点,在控制过程中在......