全文预览

第八章 非线性随机最优控制 非线性随机动力学课件

上传者:蓝天 |  格式:doc  |  页数:126 |  大小:5372KB

文档介绍
on函数。随机动态规划方程(8.1-25)或(8.1-27)是一个非齐次的二阶非线性抛物型偏微分方程。Р对自治受控系统,u均不显含t,(8.1-27)化为Р (8.1-29)Р它是非齐次的二阶非线性椭圆型偏微分方程。Р设(8.1-1)中为t的周期或概周期函数,(8.1-1)存在唯一的周期或概周期的稳态解。考虑遍历控制(8.1-1)、(8.1-2)、(8.1-7),令值函数Р (8.1-30)Р由动态规划原理经类似推导得动态规划方程Р (8.1-31)Р式中Р (8.1-32)Р为最优平均成本。当(8.1-1)为自治系统,、f不显含t时,V也不显含t,动态规划方程(8.1-31)化为Р (8.1-33)Р设是(8.1-1)的安全域,是条件转移概率密度(从t到s始终保持在内的样本函数的转移概率密度),则条件可靠性函数为Р (8.1-34)Р对系统(8.1-1)在控制约束(8.1-2)下的可靠度最大的控制问题,值函数可由(8.1-15)中令f=0,g=1,,(8.1-16)中代之以得到,即Р (8.1-35)Р类似的推导给出如下动态规划方程Р (8.1-36)Р与最终条件Р (8.1-37)Р据题意,还应有边界条件Р (8.1-38)Р式中为安全域的边界。Р设(8.1-1)为自治系统,在控制约束(8.1-2)下的平均首次穿越时间最长的最优控制问题,值函数为Р (8.1-39)Р此处为首次穿越时间,亦应理解为条件期望(即对的加权平均)。类似地推导给出如下动态规划方程Р (8.1-40)Р也有边界条件Р (8.1-41)Р三、随机动态规划方程的求解Р建立好随机动态规划方程之后,以下的步骤为:Р通过对动态规划方程求inf或sup确定u*为V的函数的表达式(最优控制律);Р将u*代入动态规划方程得最后动态规划方程,在适当的最终与边界条件下求解后一方程得值函数,代入u*的表达式得最优控制;

收藏

分享

举报
下载此文档