Professional Documents
Culture Documents
8 - Принцип максимуму Понтрягіна
8 - Принцип максимуму Понтрягіна
Понтрягіна
Визначну роль у розвитку теорії оптимального керування відіграв
академік Лев Семенович Понтрягін (1908 – 1988), який сформулював необхідні
умови оптимальності, відомі під назвою принципу максимуму. Цей
фундаментальний результат став математичною основою теорії оптимального
керування, зумовивши як динамічний розвиток сучасної теорії екстремальних
задач, так і створення числових методів їх розв'язання.
Математичне формулювання принципу максимуму
Розглянемо таку задачу оптимального керування: знайти нижню грань
функціонала
T
J (u ) f 0 x(t ), u (t ), t dt (1)
t0
за умов
x(t ) f x(t ), u (t ), t , t0 t T ; (2)
x(t0 ) S0 (t0 ) , x(T ) S1 (T ) ; (3)
x(t ) G (t ) , t0 t T ; (4)
u u (t ) U u (t ) : u (t ) V (t ), t0 t T ; u (t ) кусково-непeрервна на [t0 ,T ] , (5)
де f0 ( x, u, t ) і f ( x, u , t ) f1 ( x, u , t ),, f n ( x, u, t ) – відомі функції, визначені і
неперервні за сукупністю аргументів разом із частинними похідними першого
порядку за x(t ) G (t ), u (t ) U , t [t0 ,T ] ; S0 (t ), S1 (t ), G (t ) E n і V (t ) E r –
задані множини за t0 t T ; x(t ) ( x1 (t ),, xn (t )) і u(t ) (u1 (t ),, ur (t )) –
шукані векторні функції на [t0 ,T ] ; [t0 ,T ] – проміжок змінення часу t , межі
якого можуть бути нефіксовані.
Будемо розглядати задачу оптимального керування (1)–(5) за V (t ) V ,
G (t ) E n , t0 t T . Припустимо, що початкове положення керованого об'єкта
таке, що лівий кінець траєкторії або вільний ( S0 (t ) E n ), або рухається
поверхнею
S0 (t ) ( х, t ) : gi ( х, t ) 0, i 1,2,, n0 ; n0 n, t0 t T , (6)
де gi ( х, t ), i 1, n0 – відомі функції, неперервно-диференційовані за сукупністю
g g g g
змінних за х E n , t [t0 ,T ] , причому система векторів i , i ,, i , i ,
x1 x2 xn t
i 1, n0 лінійно незалежна за всіх ( x, t ) S0 (t ) . Зокрема, у разі закріпленого
лівого кінця gi ( x, t0 ) xi (t0 ) xi(0) , i 1, n , тобто S0 (t0 ) {x (0) } .
Аналогічне припущення висунемо щодо кінцевого положення керованого
об'єкта: правий кінець траєкторії або вільний ( S1 (t ) E n ), або рухається
поверхнею
S1 (t ) ( х, t ) : hi ( х, t ) 0, i 1,2,, n1; n1 n , t0 t T , (7)
__________
Гарт Л.Л.
де hi ( х, t ), i 1, n1 – відомі функції, неперервно-диференційовані за х E n ,
h h h h
t [t0 ,T ] , причому система векторів i , i ,, i , i , i 1, n1 лінійно
x1 x2 xn t
незалежна за всіх ( x, t ) S1 (t ) . Зокрема, у разі закріпленого правого кінця
hi ( x,Т ) xi (Т ) xi(1) , i 1, n , тобто S1 (T ) {x (1) } .
Спочатку розглянемо випадок, коли моменти часу t0 , T закріплені.
Нехай система рівнянь
xi (t ) f i x(t ), u (t ), t , i 1, n , t0 t T (8)
утворює диференціальні зв’язки в задачі оптимального керування.
Введемо у розгляд допоміжну векторну функцію
(t ) (1 (t ), 2 (t ),, n (t )) і складемо для неї систему ЗДР:
n
f
i (t ) j (t ) j x, u, t , i 1, n , t0 t T , (9)
j 0 xi
де 0 (t ) 0 – деяка стала. Якщо взяти деяке допустиме керування u u (t ) U
та відповідну траєкторію x x(t , u (t )) і підставити їх в (9), то отримаємо лінійну
систему диференціальних рівнянь, із якої однозначно визначимо векторну
функцію (t ) , t0 t T за будь-яких початкових умов (t ) , t [t0 ,T ] і за
будь-якої заданої константи 0 .
Означення. Розв’язок (t ) , t0 t T системи (9) називають імпульсом
керованого об'єкта, що відповідає керованому процесу (u (t ), x(t )) , t0 t T , а
саму систему рівнянь (9) – спряженою системою відносно системи (8).
Означення. Функцією Гамільтона-Понтрягіна (гамільтоніаном) задачі
оптимального керування (1)–(5) називають функцію
n
H H ( x, 0 , , u, t ) j (t ) f j ( x, u, t ) . (10)
j 0
__________
Гарт Л.Л. 2
нижче теорему, яка надає необхідні умови оптимальності для задачі керування
(1)–(5), називають принципом максимуму.
Теорема 1 (принцип максимуму для задачі із закріпленим часом). Нехай
(u (t ), x (t )) , t0 t T – оптимальний розв’язок задачі А за V (t ) V , G (t ) E n ,
0; (t ) 0 , t
n
2 2
1) 0 0
i 0 t T ; (12)
i 1
__________
Гарт Л.Л. 3
До формули (15) необхідно також додати умову належності точки x (t0 ) до
S0 (t0 ) , тобто умову g j ( х (t0 ), t0 ) 0, j 1,2,, n0 ;
в) якщо х(t0 ) закріплений ( S0 (t0 ) {x (0) } ), то умова трансверсальності
виконується завжди.
__________
Гарт Л.Л. 4