论文部分内容阅读
人工智能领域中,机器学习是最能体现智能特征的方法之一。随着研究的进步,人们发现最好的智能学习方法是人类自身学习,因此人们引入了一些模拟人类学习的方法来解决复杂优化问题。例如神经网络、遗传算法等。而认知神经学科最新的研究指出人脑的两个最重要特征就是最优化和预测。根据这两个核心,Werbos提出了自适应动态规划法(Adaptive Dynamic Programming ADP),它具有最优化和预测的特点,是一种很有潜力的不完全依赖于模型的具有在线机器学习能力的智能控制方法。当前嵌入式技术已经渗透到了人们生活的各个方面,特别是在控制领域中,嵌入式技术扮演着比较重要的角色。把自适应动态规划方法和嵌入式技术结合起来,设计出一个不依赖于模型的能够在线学习的通用智能控制器,通过简单环境交互和学习即可实现最优运行应用,应用前景广阔。主要完成的工作如下:(1)对自适应动态规划理论和嵌入式理论进行理解和分析,为通用智能控制器的设计及实现打下扎实的理论基础。(2)对经典执行器一评价器结构的ADHDP算法做了裁剪和改进,然后以其为核心,用C语言设计和实现了通用智能控制器的主程序;同时设计了共享内存驱动程序,用来交互主程序进程和QT人机界面程序进程之间的动态数据;最后通过编译和调试,然后把完整的应用程序移植到mini2440开发板。(3)成功的向mini2440开发板移植Linux操作系统,以典型的非线性不稳定平衡点的倒立摆作为被控对象,用构建的通用智能控制器对其实施控制,仿真实验和结果达到了预期效果。本文的主要创新点为:把自适应动态规划方法与嵌入式技术相结合,设计出一个具有快速在线学习能力的通用智能控制器。