You are on page 1of 4

Принцип максимуму Л.С.

Понтрягіна
Визначну роль у розвитку теорії оптимального керування відіграв
академік Лев Семенович Понтрягін (1908 – 1988), який сформулював необхідні
умови оптимальності, відомі під назвою принципу максимуму. Цей
фундаментальний результат став математичною основою теорії оптимального
керування, зумовивши як динамічний розвиток сучасної теорії екстремальних
задач, так і створення числових методів їх розв'язання.
Математичне формулювання принципу максимуму
Розглянемо таку задачу оптимального керування: знайти нижню грань
функціонала
T
J (u )   f 0  x(t ), u (t ), t  dt (1)
t0

за умов
x(t )  f  x(t ), u (t ), t  , t0  t  T ; (2)
x(t0 )  S0 (t0 ) , x(T )  S1 (T ) ; (3)
x(t )  G (t ) , t0  t  T ; (4)
u  u (t ) U  u (t ) : u (t ) V (t ), t0  t  T ; u (t ) кусково-непeрервна на [t0 ,T ] , (5)
де f0 ( x, u, t ) і f ( x, u , t )   f1 ( x, u , t ),, f n ( x, u, t )  – відомі функції, визначені і
неперервні за сукупністю аргументів разом із частинними похідними першого
порядку за x(t )  G (t ), u (t ) U , t [t0 ,T ] ; S0 (t ), S1 (t ), G (t )  E n і V (t )  E r –
задані множини за t0  t  T ; x(t )  ( x1 (t ),, xn (t )) і u(t )  (u1 (t ),, ur (t )) –
шукані векторні функції на [t0 ,T ] ; [t0 ,T ] – проміжок змінення часу t , межі
якого можуть бути нефіксовані.
Будемо розглядати задачу оптимального керування (1)–(5) за V (t )  V ,
G (t )  E n , t0  t  T . Припустимо, що початкове положення керованого об'єкта
таке, що лівий кінець траєкторії або вільний ( S0 (t )  E n ), або рухається
поверхнею
S0 (t )  ( х, t ) : gi ( х, t )  0, i  1,2,, n0 ; n0  n, t0  t  T , (6)
де gi ( х, t ), i  1, n0 – відомі функції, неперервно-диференційовані за сукупністю
 g g g g 
змінних за х  E n , t [t0 ,T ] , причому система векторів  i , i ,, i , i  ,
 x1 x2 xn t 
i  1, n0 лінійно незалежна за всіх ( x, t )  S0 (t ) . Зокрема, у разі закріпленого
лівого кінця gi ( x, t0 )  xi (t0 )  xi(0) , i  1, n , тобто S0 (t0 )  {x (0) } .
Аналогічне припущення висунемо щодо кінцевого положення керованого
об'єкта: правий кінець траєкторії або вільний ( S1 (t )  E n ), або рухається
поверхнею
S1 (t )  ( х, t ) : hi ( х, t )  0, i  1,2,, n1; n1  n , t0  t  T , (7)

__________
 Гарт Л.Л.
де hi ( х, t ), i  1, n1 – відомі функції, неперервно-диференційовані за х  E n ,
 h h h h 
t [t0 ,T ] , причому система векторів  i , i ,, i , i  , i  1, n1 лінійно
 x1 x2 xn t 
незалежна за всіх ( x, t )  S1 (t ) . Зокрема, у разі закріпленого правого кінця
hi ( x,Т )  xi (Т )  xi(1) , i  1, n , тобто S1 (T )  {x (1) } .
Спочатку розглянемо випадок, коли моменти часу t0 , T закріплені.
Нехай система рівнянь
xi (t )  f i  x(t ), u (t ), t  , i  1, n , t0  t  T (8)
утворює диференціальні зв’язки в задачі оптимального керування.
Введемо у розгляд допоміжну векторну функцію
(t )  (1 (t ), 2 (t ),, n (t )) і складемо для неї систему ЗДР:
n
f
i (t )    j (t ) j  x, u, t  , i  1, n , t0  t  T , (9)
j 0 xi
де 0 (t )  0 – деяка стала. Якщо взяти деяке допустиме керування u  u (t ) U
та відповідну траєкторію x  x(t , u (t )) і підставити їх в (9), то отримаємо лінійну
систему диференціальних рівнянь, із якої однозначно визначимо векторну
функцію (t ) , t0  t  T за будь-яких початкових умов (t )   , t [t0 ,T ] і за
будь-якої заданої константи 0 .
Означення. Розв’язок (t ) , t0  t  T системи (9) називають імпульсом
керованого об'єкта, що відповідає керованому процесу (u (t ), x(t )) , t0  t  T , а
саму систему рівнянь (9) – спряженою системою відносно системи (8).
Означення. Функцією Гамільтона-Понтрягіна (гамільтоніаном) задачі
оптимального керування (1)–(5) називають функцію
n
H  H ( x, 0 , , u, t )   j (t ) f j ( x, u, t ) . (10)
j 0

Легко побачити, що системи диференціальних рівнянь (8) і (9) за


допомогою гамільтоніана можна записати у такому симетричному вигляді:
H H
хi (t )  ; i (t )   , i  1, n , t0  t  T . (11)
i xi
Означення. Систему 2n звичайних диференціальних рівнянь (11)
називають системою канонічних рівнянь Гамільтона.
Очевидно, що гамільтоніан (10) за фіксованих аргументів x, 0 , , t стає
функцією лише параметра u V і можна ставити задачу пошуку верхньої грані
sup H ( x, 0 , , u, t ) .
uV
Якщо точної верхньої грані значень неперервної функції H можна досягти в
деякій точці u  V , то відповідне значення H за фіксованих x, 0 , , t
називають максимумом значень функції H на множині V . Тому наведену

__________
 Гарт Л.Л. 2
нижче теорему, яка надає необхідні умови оптимальності для задачі керування
(1)–(5), називають принципом максимуму.
Теорема 1 (принцип максимуму для задачі із закріпленим часом). Нехай
(u (t ), x (t )) , t0  t  T – оптимальний розв’язок задачі А за V (t )  V , G (t )  E n ,

t0  t  T . Нехай моменти часу t0 і T задано. Тоді існують стала  0 і векторна


 
функція  (t )  1 (t ), 2 (t ),, n (t ) – такі, що:

 0;        (t )   0 , t
n
 2 2
1)  0 0

i 0 t T ; (12)
i 1

2) функція  (t ) задовольняє систему (9) за x  x (t ) , u  u  (t ) ,  0   0 ;


3) в кожній точці t [t0 ,T ] , яка є точкою неперервності оптимального



керування u  (t ), t0  t  T , функція H x (t ), 0 ,  (t ), u, t  змінної u досягає
свого максимуму на множині V за u  u  (t ) , тобто
H  x (t ), 0 ,  (t ), u  (t ), t   max H  x (t ), 0 ,  (t ), u, t  , t0  t  T ; (13)
uV

4) на лівому і правому кінцях оптимальної траєкторії x (t ), t0  t  T


виконуються умови трансверсальності: вектор   (t0 ) ортогональний до
різноманіття S0 (t0 ) в точці x (t0 ) , а вектор   (Т ) ортогональний до
різноманіття S1 (Т ) в точці x (Т ) . Пояснимо умову трансверсальності за умови
різних режимів на правому кінці х (Т ) траєкторії:
а) якщо правий кінець вільний ( S1 (T )  E n ) , то умова ортогональності
 (Т )  S1 (Т )  E n означає, що   (Т )  0 ;
б) якщо правий кінець рухомий (тобто S1 (T ) має вигляд (7)), то умова
  (Т )  S1 (Т ) гарантує існування сталих a1 , a2 ,, an1 ( n1  n ) – таких, що
n1
h j
 (Т )   a j

( x* (Т ), T ) , i  1, n ;
(14)

i
j 1 xi

До формули (14) необхідно також додати умову належності точки x* (Т ) до


S1 (Т ) , тобто умову h j ( х (Т ), Т )  0, j  1,2,, n1 ;
в) якщо правий кінець закріплений (тобто S1 (T )  {x (1) } ), то умова
ортогональності   (Т )  S1 (T )  {x (1) } тривіальна (виконується завжди).
Аналогічно, умова трансверсальності на лівому кінці х(t0 ) траєкторії
означає, що:
а) якщо х(t0 ) вільний, то   (t0 )  0 ;
б) якщо х(t0 ) рухомий (тобто S0 (t0 ) має вигляд (6)), то існують такі сталі
b1 , b2 ,, bn0 ( n0  n ), що
n0
g j
 (t0 )   b j

( x (t0 ), t0 ), i  1, n . (15)
xi
i
j 1

__________
 Гарт Л.Л. 3
До формули (15) необхідно також додати умову належності точки x (t0 ) до
S0 (t0 ) , тобто умову g j ( х (t0 ), t0 )  0, j  1,2,, n0 ;
в) якщо х(t0 ) закріплений ( S0 (t0 )  {x (0) } ), то умова трансверсальності
виконується завжди.

__________
 Гарт Л.Л. 4

You might also like