论文部分内容阅读
广义系统的最优控制问题是现代控制理论中的一个重要分支,对该问题的研究具有重要的理论意义和实际意义,并得到了国内外控制界学者的广泛关注。在传统的最优控制理论研究中,基于模型的方法已取得大量的研究成果。但在实际中,由于系统的复杂性和未知性,导致传统的最优控制方法无法解决实际问题或无法求解。因此,针对系统复杂而无法求解及系统模型未知两方面,本文研究了非传统的广义系统最优控制方法。 具体地,我们分别讨论了离散广义线性系统、离散广义非线性系统、连续广义非线性系统的最优控制问题。并结合实际,以双寡头市场广告竞争为背景,针对不同的最优控制问题,研究了非传统的最优控制方法,并为企业给出了有效的最优控制策略。主要工作包括以下几个方面: (1)研究了基于数据的系统类型的判定方法,并针对不同系统分析了系统的能控性。首先,在系统参数未知的情况下,给出了线性离散系统的一般形式,利用满足一定条件的采样数据及控制输入,判断所给出系统的类型,包括正常系统和广义系统。其次,针对给出的系统,提出一个等价完全能控性判定的充分必要条件。在没有系统辨识的情况下,通过采样数据构造能控性判定矩阵并求解构造矩阵的秩来判定系统的能控性,并给出了基于数据的广义李雅普诺夫稳定判据。此外,针对广义系统,还分别讨论了系统的因果性、因果能控性及R-能控性。最后,通过实例仿真及数值仿真说明提出的基于数据方法的有效性及可行性。 (2)研究了基于数据的离散广义线性系统线性二次型调节器(LQR)的最优控制问题。在系统模型未知的情况下,利用近似动态规划技术(ADP)提出一个新的基于数据的方法,仅利用观测的输入/输出数据,得到的最优控制使得给定的性能指标达到最小化。通过将广义系统转换成受限等价形式,可以得到仅由采样数据表示的等价的值函数,并针对两种不同的情况,分别设计了可基于数据求解的值迭代(Ⅵ)算法。改进的Ⅵ算法在求解迭代过程中,每步仅需要少量的采样数据,因此改进的Ⅵ算法大大减少了计算量。最后,通过仿真验证所提出的基于数据最优控制方法的有效性。 (3)研究了基于数据的双寡头广告竞争模型的最优控制。利用之前提出的基于ADP的方法处理离散广义非线性系统的最优控制问题。给出了一个双寡头广告竞争的离散广义非线性模型,研究了广告投入及控制策略成本最少的最优控制问题,设计了相应的基于数据的Ⅵ算法,通过对Ⅵ算法的求解,从而为企业在竞争过程中给出最优控制策略。最后,通过仿真验证了所提出的方法的有效性。 (4)研究了双寡头市场最优广告投资竞争问题。以双寡头市场为背景,建立一个新的带有连续不等式约束的广义非线性模型描述市场竞争情况,目的是在企业横向发展新市场时,给出最大化新产品市场份额的最优广告策略。利用约束转换技术得到约束的规范形式,再利用控制参数化技术,通过将投资策略近似表示成分段常数函数,从而使得提出的问题转换成一系列最优参数选择的问题,得到最优策略的数值解。通过啤酒销售的实例仿真,说明所提出模型的有效性,并给出了在不同竞争情况下最优广告策略。 (5)研究了双寡头竞争市场中投资时间最少的最优广告投资策略。采用带有连续不等式约束及终端状态约束的广义非线性模型来描述该问题,这是一个终端时间自由的最优控制问题。为了获得一个可行的广告策略,通过引入一个新的控制变量,将自由终端时间问题转换成在一个新时域上的固定终端时间问题。利用约束转换技术及控制参数化技术,使得最优控制问题转化为最优参数选择问题。另外,为了优化切换时间减少投资成本,利用Time Scaling技术,将分割时间点作为决策变量,得到更好的投资策略。最后,利用啤酒销售实例说明提出方法的有效性,并比较了基于Time Scaling优化的切换时间和基于等分分割时域的投资策略,仿真结果表明Time Scaling的优化结果更合理有效。