基于神经网络的Agent增强学习模型

来源 :计算机科学 | 被引量 : 0次 | 上传用户：luomingasdf

【摘要】

：

在深入分析Agent决策过程中状态与行为空间的迁移与构造的基础上，设计了Agent基于强化学习的最优行为选择策略和Agent强化学习的神经网络模型与算法，并对算法的收敛性进行了证

【作者】

：

唐亮贵刘波唐灿程代杰

【机构】

：

重庆工商大学计算机学院,重庆大学计算机学院

【出处】

：

计算机科学

【发表日期】

：

2007年11期

【关键词】

：

AGENT 强化学习神经网络 MARKOV决策过程 Agent Reinforcement learning Neural networks Markov d

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在深入分析Agent决策过程中状态与行为空间的迁移与构造的基础上，设计了Agent基于强化学习的最优行为选择策略和Agent强化学习的神经网络模型与算法，并对算法的收敛性进行了证明。通过对多Agent电子商务系统．中Agent竞价行为的预测仿真实验，验证了基于神经网络的Agent强化学习算法具有良好的性能和行为逼近能力。

其他文献

四责协同推动全面从严治党责任落实落地

抓党建必须抓责任制。全面从严治党,必须增强管党治党意识、落实管党治党责任。今年是中国共产党成立100周年,是"十四五"开局之年,不折不扣落实全面从严治党责任意义重大,必

期刊

纪律检查机关全面从严治党监督责任一岗双责主体责任管党治党基层延伸第一责任人

基于正交多主体遗传算法的业务规则引擎推理方法

现阶段业务规则引擎多采用前向链接算法实现模式匹配的推理过程。本文提出了一种基于正交多主体遗传算法的业务规则引擎推理方法，以解决规则引擎无法求解类似组合服务竞标的竞

期刊

规则引擎竞胜标确定正交试验设计多主体系统正交多主体遗传算法Rules engine Winner determination Orthogonal

蚕沙叶绿素的提取工艺研究

以丙酮为溶剂超声波辅助萃取法提取蚕沙叶绿素的工艺，并将该方法与传统提取法、二氧化碳超临界萃取法：丙酮2．5（m1）浸提，萃取3次，每次45min，该条件下叶绿素的提取率为7．63mg叶绿素／g蚕沙

期刊

蚕沙叶绿素提取理化性质

一种改进的抑制早熟收敛的模糊遗传算法

针对遗传算法中的早熟收敛现象，提出一种改进的模糊遗传算法。该算法将群体适应度均方差和种群的进化代数作为模糊逻辑控制器判断早熟收敛的标准，并根据判断结果对优劣不等的个

期刊

早熟收敛模糊遗传算法进化代数模糊逻辑控制器种群多样性Premature convergence Fuzzy genetic algorithm E

基于神经网络的Agent增强学习模型

其他学术论文