8 - Принцип максимуму Понтрягіна

Принцип максимуму Л.С.
Понтрягіна
Визначну роль у розвитку теорії оптимального керування відіграв
академік Лев Семенович Понтрягін (1908 – 1988), який сформулював необхідні
умови оптимальності, відомі під назвою принципу максимуму. Цей
фундаментальний результат став математичною основою теорії оптимального
керування, зумовивши як динамічний розвиток сучасної теорії екстремальних
задач, так і створення числових методів їх розв'язання.
Математичне формулювання принципу максимуму
Розглянемо таку задачу оптимального керування: знайти нижню грань
функціонала
T
J (u )   f 0  x(t ), u (t ), t  dt (1)
t0
за умов
x(t )  f  x(t ), u (t ), t  , t0  t  T ; (2)
x(t0 )  S0 (t0 ) , x(T )  S1 (T ) ; (3)
x(t )  G (t ) , t0  t  T ; (4)
u  u (t ) U  u (t ) : u (t ) V (t ), t0  t  T ; u (t ) кусково-непeрервна на [t0 ,T ] , (5)
де f0 ( x, u, t ) і f ( x, u , t )   f1 ( x, u , t ),, f n ( x, u, t )  – відомі функції, визначені і
неперервні за сукупністю аргументів разом із частинними похідними першого
порядку за x(t )  G (t ), u (t ) U , t [t0 ,T ] ; S0 (t ), S1 (t ), G (t )  E n і V (t )  E r –
задані множини за t0  t  T ; x(t )  ( x1 (t ),, xn (t )) і u(t )  (u1 (t ),, ur (t )) –
шукані векторні функції на [t0 ,T ] ; [t0 ,T ] – проміжок змінення часу t , межі
якого можуть бути нефіксовані.
Будемо розглядати задачу оптимального керування (1)–(5) за V (t )  V ,
G (t )  E n , t0  t  T . Припустимо, що початкове положення керованого об'єкта
таке, що лівий кінець траєкторії або вільний ( S0 (t )  E n ), або рухається
поверхнею
S0 (t )  ( х, t ) : gi ( х, t )  0, i  1,2,, n0 ; n0  n, t0  t  T , (6)
де gi ( х, t ), i  1, n0 – відомі функції, неперервно-диференційовані за сукупністю
 g g g g 
змінних за х  E n , t [t0 ,T ] , причому система векторів  i , i ,, i , i  ,
 x1 x2 xn t 
i  1, n0 лінійно незалежна за всіх ( x, t )  S0 (t ) . Зокрема, у разі закріпленого
лівого кінця gi ( x, t0 )  xi (t0 )  xi(0) , i  1, n , тобто S0 (t0 )  {x (0) } .
Аналогічне припущення висунемо щодо кінцевого положення керованого
об'єкта: правий кінець траєкторії або вільний ( S1 (t )  E n ), або рухається
поверхнею
S1 (t )  ( х, t ) : hi ( х, t )  0, i  1,2,, n1; n1  n , t0  t  T , (7)
__________
 Гарт Л.Л.
де hi ( х, t ), i  1, n1 – відомі функції, неперервно-диференційовані за х  E n ,
 h h h h 
t [t0 ,T ] , причому система векторів  i , i ,, i , i  , i  1, n1 лінійно
 x1 x2 xn t 
незалежна за всіх ( x, t )  S1 (t ) . Зокрема, у разі закріпленого правого кінця
hi ( x,Т )  xi (Т )  xi(1) , i  1, n , тобто S1 (T )  {x (1) } .
Спочатку розглянемо випадок, коли моменти часу t0 , T закріплені.
Нехай система рівнянь
xi (t )  f i  x(t ), u (t ), t  , i  1, n , t0  t  T (8)
утворює диференціальні зв’язки в задачі оптимального керування.
Введемо у розгляд допоміжну векторну функцію
(t )  (1 (t ), 2 (t ),, n (t )) і складемо для неї систему ЗДР:
n
f
i (t )    j (t ) j  x, u, t  , i  1, n , t0  t  T , (9)
j 0 xi
де 0 (t )  0 – деяка стала. Якщо взяти деяке допустиме керування u  u (t ) U
та відповідну траєкторію x  x(t , u (t )) і підставити їх в (9), то отримаємо лінійну
систему диференціальних рівнянь, із якої однозначно визначимо векторну
функцію (t ) , t0  t  T за будь-яких початкових умов (t )   , t [t0 ,T ] і за
будь-якої заданої константи 0 .
Означення. Розв’язок (t ) , t0  t  T системи (9) називають імпульсом
керованого об'єкта, що відповідає керованому процесу (u (t ), x(t )) , t0  t  T , а
саму систему рівнянь (9) – спряженою системою відносно системи (8).
Означення. Функцією Гамільтона-Понтрягіна (гамільтоніаном) задачі
оптимального керування (1)–(5) називають функцію
n
H  H ( x, 0 , , u, t )   j (t ) f j ( x, u, t ) . (10)
j 0
Легко побачити, що системи диференціальних рівнянь (8) і (9) за

допомогою гамільтоніана можна записати у такому симетричному вигляді:
H H
хi (t )  ; i (t )   , i  1, n , t0  t  T . (11)
i xi
Означення. Систему 2n звичайних диференціальних рівнянь (11)
називають системою канонічних рівнянь Гамільтона.
Очевидно, що гамільтоніан (10) за фіксованих аргументів x, 0 , , t стає
функцією лише параметра u V і можна ставити задачу пошуку верхньої грані
sup H ( x, 0 , , u, t ) .
uV
Якщо точної верхньої грані значень неперервної функції H можна досягти в
деякій точці u  V , то відповідне значення H за фіксованих x, 0 , , t
називають максимумом значень функції H на множині V . Тому наведену
__________
 Гарт Л.Л. 2
нижче теорему, яка надає необхідні умови оптимальності для задачі керування
(1)–(5), називають принципом максимуму.
Теорема 1 (принцип максимуму для задачі із закріпленим часом). Нехай
(u (t ), x (t )) , t0  t  T – оптимальний розв’язок задачі А за V (t )  V , G (t )  E n ,

t0  t  T . Нехай моменти часу t0 і T задано. Тоді існують стала  0 і векторна

 
функція  (t )  1 (t ), 2 (t ),, n (t ) – такі, що:
 0;        (t )   0 , t
n
 2 2
1)  0 0

i 0 t T ; (12)
i 1
2) функція  (t ) задовольняє систему (9) за x  x (t ) , u  u  (t ) ,  0   0 ;


3) в кожній точці t [t0 ,T ] , яка є точкою неперервності оптимального


керування u  (t ), t0  t  T , функція H x (t ), 0 ,  (t ), u, t  змінної u досягає
свого максимуму на множині V за u  u  (t ) , тобто
H  x (t ), 0 ,  (t ), u  (t ), t   max H  x (t ), 0 ,  (t ), u, t  , t0  t  T ; (13)
uV
4) на лівому і правому кінцях оптимальної траєкторії x (t ), t0  t  T

виконуються умови трансверсальності: вектор   (t0 ) ортогональний до
різноманіття S0 (t0 ) в точці x (t0 ) , а вектор   (Т ) ортогональний до
різноманіття S1 (Т ) в точці x (Т ) . Пояснимо умову трансверсальності за умови
різних режимів на правому кінці х (Т ) траєкторії:
а) якщо правий кінець вільний ( S1 (T )  E n ) , то умова ортогональності
 (Т )  S1 (Т )  E n означає, що   (Т )  0 ;
б) якщо правий кінець рухомий (тобто S1 (T ) має вигляд (7)), то умова
  (Т )  S1 (Т ) гарантує існування сталих a1 , a2 ,, an1 ( n1  n ) – таких, що
n1
h j
 (Т )   a j

( x* (Т ), T ) , i  1, n ;
(14)

i
j 1 xi
До формули (14) необхідно також додати умову належності точки x* (Т ) до

S1 (Т ) , тобто умову h j ( х (Т ), Т )  0, j  1,2,, n1 ;
в) якщо правий кінець закріплений (тобто S1 (T )  {x (1) } ), то умова
ортогональності   (Т )  S1 (T )  {x (1) } тривіальна (виконується завжди).
Аналогічно, умова трансверсальності на лівому кінці х(t0 ) траєкторії
означає, що:
а) якщо х(t0 ) вільний, то   (t0 )  0 ;
б) якщо х(t0 ) рухомий (тобто S0 (t0 ) має вигляд (6)), то існують такі сталі
b1 , b2 ,, bn0 ( n0  n ), що
n0
g j
 (t0 )   b j

( x (t0 ), t0 ), i  1, n . (15)
xi
i
j 1
__________
До формули (15) необхідно також додати умову належності точки x (t0 ) до
S0 (t0 ) , тобто умову g j ( х (t0 ), t0 )  0, j  1,2,, n0 ;
в) якщо х(t0 ) закріплений ( S0 (t0 )  {x (0) } ), то умова трансверсальності
виконується завжди.
__________

8 - Принцип максимуму Понтрягіна

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

8 - Принцип максимуму Понтрягіна

Uploaded by

Copyright:

Available Formats

Принцип максимуму Л.С.

Легко побачити, що системи диференціальних рівнянь (8) і (9) за

t0  t  T . Нехай моменти часу t0 і T задано. Тоді існують стала  0 і векторна

2) функція  (t ) задовольняє систему (9) за x  x (t ) , u  u  (t ) ,  0   0 ;

3) в кожній точці t [t0 ,T ] , яка є точкою неперервності оптимального

4) на лівому і правому кінцях оптимальної траєкторії x (t ), t0  t  T

До формули (14) необхідно також додати умову належності точки x* (Т ) до

You might also like