首页 最优控制汉密尔顿函数ppt课件

最优控制汉密尔顿函数ppt课件

举报
开通vip

最优控制汉密尔顿函数ppt课件第五章用变分法求解连续最优控制问题—有约束条件的泛函极值*上节讨论没有约束条件的泛函极值问题。但在最优控制问题中,泛函J所依赖的函数总要受到受控系统状态方程的约束。解决这类问题的思路是应用拉格朗日乘子法,将这种有约束条件的泛函极值问题转化为无约束条件的泛函极值问题。*一、拉格朗日问题考虑系统——n维连续可微的矢量函数。(5-1)式中;;*设给定,初始状态为x(t0)=x0,终端状态x(tf)自由。性能泛函为寻求最优控制u(t),将系统从初始状态x(t0)=x0转移到终端状态x(tf),并使性能泛函J取极值。(5-2...

最优控制汉密尔顿函数ppt课件
第五章用变分法求解连续最优控制问题—有约束条件的泛函极值*上节讨论没有约束条件的泛函极值问题。但在最优控制问题中,泛函J所依赖的 函数 excel方差函数excelsd函数已知函数     2 f x m x mx m      2 1 4 2拉格朗日函数pdf函数公式下载 总要受到受控系统状态方程的约束。解决这类问题的思路是应用拉格朗日乘子法,将这种有约束条件的泛函极值问题转化为无约束条件的泛函极值问题。*一、拉格朗日问题考虑系统——n维连续可微的矢量函数。(5-1)式中;;*设给定,初始状态为x(t0)=x0,终端状态x(tf)自由。性能泛函为寻求最优控制u(t),将系统从初始状态x(t0)=x0转移到终端状态x(tf),并使性能泛函J取极值。(5-2)*将状态方程式(5-1)写成约束方程形式应用拉格朗日乘子法,构造增广泛函式中λ(t)——待定的n维拉格朗日乘子矢量。(5-3)*定义纯量函数称H[x,u,λ,t]为哈密尔顿函数。则或(5-4)(5-5)(5-6)式中(5-7)*对式(5-5)右边第二项作分部积分,得将上式代入式(5-5),得(5-8)*使J´取极小的必要条件是,对任意的δu和δx,都有δJ´=0成立。设u(t)和x(t)相对于最优控制u*(t)及最优轨线u*(t)的变分为δu和δx,计算由δu和δx引起的J´的变分为:*因此得(5-9)(5-10)(5-11)(5-12)*式(5-9)称为动态系统的伴随方程或协态方程,λ又称为伴随矢量或协态矢量。式(5-10)即系统的状态方程。式(5-9)与式(5-10)联立称为哈密尔顿正则方程。式(5-11)称为控制方程,*这个方程是在假设δu为任意,控制u(t)取值不受约束条件下得到的。如果u(t)为容许控制,受到的约束,δu变分不能任意取值,那么,关系式不成立,这种情况留待极小值原理中讨论。*(5-13)(5-14)式(5-12)称为横截条件。常用于补充边界条件。例如,若始端固定,终态自由时,由于δx(t0)=0,δx(tf)任意,则有*若始端和终端都固定时,δx(t0)=0,δx(tf)=0则以作为两个边界条件。(5-16)(5-15)*实际上,上述泛函极值的必要条件,亦可由式(5-6)写出欧拉方程直接导出。即(5-17)*应用上述条件求解最优控制的步骤如下:1)由控制方程解出2)将u*代入正则方程解两边边值问题,求x*、λ*。3)再将x*、λ*代入得为所求。*例1:有系统如图1所示。欲使系统在2s内从状态转移到,使性能泛函,试求u(t)。*解:系统状态方程及边界条件为*由式(5-7),得*由欧拉方程,得**5个未知数x1,x2,λ1,λ2,u,由5个方程联立求得通解*4个积分常数C1,C2,C3,C4由4个边界条件解得*因此,最优解为*最优控制u*(t)及最优轨线x*(t)如图2所示。*例2:设问题同例1。但将终端状态改为θ(2)=0,ω(2)自由,即终端条件改成部分约束、部分自由。重求u*(t)、x*(t)。*解正则方程及控制方程与例1完全相同,只是边界条件改成时,时,代入例1的通解中可确定积分常数:*于是得*u*(t)和x*(t)的图像见图3。*比较上述结果可见,即使是同一个问题,如果终端条件不同,其最优解也不同。*二、波尔札问题设系统状态方程初始状态x(t0)=x0,终始状态x(tf)满足式中N——q维向量函数,n≥q。(5-18)(5-19)*性能泛函其中Φ、L都是连续可微的数量函数,tf是待求的终端时间。最优控制问题是寻求控制矢量u*(t),将系统从初态x(t0)转移到目标集N[x(tf),tf]=0上,并使J取极小。(5-20)*在这类极值问题中,要处理两种类型的等式约束。一是微分方程约束,一是终端边界约束。根据拉格朗日乘子法,要引入两面两个乘子矢量,一个是n维λ(t),另一个是q维μ,将等式约束条件泛函极值化成无约束条件泛函极值问题来求解。*为此,构造增广泛函写出哈密顿函数(5-22)(5-21)*于是(5-23)*对上式中最后一次作分部积分,得(5-24)*(5-25)(5-26)(5-27)这是一个可变端点变分问题。考虑x(t),u(t),tf相对于它们最优值x*(t),u*(t),t*f的变分,并计算由此引起J´的一次变分δJ´。设*图4可变终端各变分间的关系*从图4可知在端点处变分之间存在下列近似关系式中δx(t*f)——x在t*f时的一次变分;δx(t*f+δtf)——x在tf=t*f+δtf时的一次变分。式(5-28)描述了在可变终端情况下,x在这两个时刻上变分的近似关系,近似式中忽略了高阶无穷小量。(5-28)*考虑到式(5-24)右边第一项和第二项的一次变分各有两项:*因此,有(5-29)*注意到δtf、δx、δu任意性,及泛函极值存在的必要条件δJ´=0式(5-29)可得极值必要条件如下:(5-30)*式中H[x(tf),u(tf),λ(tf),tf]函数H最优轨线终端处的值。边界条件x(t0)=x0(5-32)终端时刻由下式计算(5-31)*终端时刻由下式计算式中H[x(tf),u(tf),λ(tf),tf]函数H最优轨线终端处的值。上述总共个2n+r+q+1方程,可联解出2n+r+q+1个变量。(5-32)*最后,分析哈密尔顿函数沿最优轨线随时间的变化规律。哈密顿函数H对时间的全导数为(5-33)*如果u为最优控制,必满足及(5-34)因此,有上式 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 明,哈密顿函数H沿最优轨线对时间的全导数等于它对时间的偏导数。*当H不显含t时,恒有即常数(5-35)这就是说,对定常系统,沿最优轨线H恒为常值。*例4:给定系统状态方程为设初始状态x(0)=0,终端状态约束曲线x1(1)+x2(1)-1=0求使性能泛函取极小时的最优控制u*(t)及最优轨线x*(t)。*解这是个终端时间tf给定,但终端状态受约束的拉格朗日问题。哈密顿函数*由性能泛函取极值的必要条件,得*它们的通解为*由边界条件确定积分常数*代入解得由终端约束方程x1(1)+x2(1)=1可解出μ=-3/7。*最优解*结果如图5所示*例5:设一阶系统状态方程为边界条件x(0)=1和x(tf)=0。终端时刻tf待定,试确定最优控制u*,使下列性能泛函为极小。*解这里哈密顿函数为控制方程正则方程*由边界条件x(0)=1和x(tf)=0又由式(5-32)得即*而u(tf)=-λ(tf)代入上式,得其解为由于因此,有*最优控制代入状态方程得由初始条件x(0)=C=1,故最优轨线*再以终端条件x(tf)=0代入上式,得故最优终端时刻最优解如图6所示。*
本文档为【最优控制汉密尔顿函数ppt课件】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
机构认证用户
爱赢
公司经营范围:网络软件设计、制作、图文设计、影视制作(编辑)
格式:ppt
大小:545KB
软件:PowerPoint
页数:0
分类:教育学
上传时间:2021-02-25
浏览量:35