You are on page 1of 8

Формулювання принципу максимуму для задачі оптимального керування

з незакріпленим часом
Розглянемо наступну задачу оптимального керування: знайти нижню
грань функціонала
T
J (u, t0 ,Т )   f0  x(t ), u(t ), t  dt (1)
t0

за умов
x(t )  f  x(t ), u (t ), t  , t0  t  T ; (2)
x(t0 )  S0 (t0 ) , x(T )  S1 (T ) ; (3)
x(t )  G (t ) , t0  t  T ; (4)
u  u (t ) U  u (t ) : u (t ) V (t ), t0  t  T ; u (t ) кусково-непeрервна на [t0 ,T ] , (5)
де x(t )  ( x1 (t ),, xn (t )) і u(t )  (u1 (t ),, ur (t )) – шукані векторні функції на
[t0 ,T ] ; f0 ( x, u, t ) і f ( x, u , t )   f1 ( x, u , t ),, f n ( x, u , t )  – відомі скалярна і векторна
функції відповідно, визначені і неперервні за сукупністю аргументів разом із
частинними похідними першого порядку за всіх x  E n , u U , t [t0 ,T ] ;
S0 (t ), S1 (t )  E п і V (t )  E r – задані множини за t0  t  T ; [t0 , T ] – проміжок
числової осі, межі якого можуть бути невідомими.
Теорема 2 (принцип максимуму для задачі з незакріпленим часом). Нехай
(u (t ), x (t )) , t0  t  T – оптимальний розв’язок задачі (1)–(5) за V (t )  V ,

G (t )  E n , t0  t  T . Нехай початковий момент часу t0 відомий, а кінцевий


момент T заздалегідь невідомий. Тоді виконуються всі твердження теореми 1 і,
крім того:
а) якщо правий кінець траєкторії закріплений ( S1 (Т )  {x (1) } , x (1)  Е п ) або
вільний ( S1 (T )  E п ) , то має місце рівність
H 
t
H  x (t ),  ,  (t ), u (t ), t   
   
 x ( ), 0 ,  ( ), u  ( ),   d  , t0  t  T ; (6)
t
0
T

б) якщо правий кінець траєкторії рухомий, тобто рухається поверхнею


S1 (t )  {( x, t ) : hi ( x, t )  0, i  1,2,, n1; n1  n} , t0  t  T , то має місце рівність
h
 
n1
H x (t ),  0 ,  (t ), u (t ), t   a j j ( x (Т ), T ) 
   

j 1 t
(7)
H 
t
 
t
 
x (), 0 ,  (), u  (),  d , t0  t  T ,
T
де сталі a1, a2 ,, an1 ( n1  n ) визначені у відповідній умові трансверсальності
n1
h j
(Т )   a j ( x(Т ), T ) .
j 1 x

__________
 Гарт Л.Л.
Отже, принцип максимуму і в разі незакріпленого часу приводить до
крайової задачі спеціального виду. Для знаходження невідомого значення T
послуговуються однією з додаткових умов – (6) або (7) – залежно від режиму на
правому кінці траєкторії, за t  T .
Зауваження. У наведених вище теоремах 1, 2 задачу А оптимального
керування розглянуто за припущень, що V (t )  V , G (t )  E n , t0  t  T . У
спеціальній літературі можна знайти наукові та прикладні результати щодо
принципу максимуму Понтрягіна для задач оптимального керування з
фазовими обмеженнями виду (4). Такі задачі приводять до істотно складніших
диференціальних моделей.

Приклад застосування теореми 2 принципу максимуму Понтрягіна


до розв’язування задачі оптимального керування з незакріпленим часом

На початку нагадаємо математичну постановку задачі оптимального


керування з незакріпленим часом, для якої був попередньо сформульований
принцип максимуму Понтрягіна (теорема 2): знайти нижню грань функціонала
T
J (u,Т )   f 0  x(t ), u (t ), t  dt (1)
t0

за умов
x(t )  f  x(t ), u (t ), t  , t0  t  T ; (2)
x(t0 )  S0 (t0 ) , x(T )  S1 (T ) ; (3)
u  u (t ) U  u (t ) V  E r , t0  t  T ; u (t ) кусково-непeрервна на [t0 ,T ] , (4)
де x(t )  ( x1 (t ),, xn (t )) і u(t )  (u1 (t ),, ur (t )) – шукані векторні функції на
[t0 ,T ] ; f0 ( x, u, t ) і f ( x, u , t )   f1 ( x, u , t ),, f n ( x, u , t )  – відомі скалярна і векторна
функції відповідно, визначені і неперервні за сукупністю аргументів разом із
частинними похідними першого порядку за всіх x  E n , u U , t [t0 ,T ] ;
S0 (t ), S1 (t )  E п за t0  t  T і V  E r – задані множини; [t0 , T ] – проміжок
числової осі, межі якого можуть бути невідомі.
Розглянемо приклад застосування теореми 2 принципу максимуму
Понтрягіна до розв’язування конкретної задачі оптимального керування з
незакріпленим часом.
Задача. Нехай деяка матеріальна точка (об’єкт) рухається вздовж осі Ox
за законом x(t )  u ; 0  t  T , де u – скалярний керувальний параметр.
Потрібно знайти таке кусково-неперервне керування u  u (t ) , що задовольняє
умову u (t )  1 , 0  t  T , за яким точка, виходячи з початкового положення
x  0   1 з нульовою швидкістю ( x  0   0) , досягне початку координат
( x T   0) з нульовою швидкістю ( x T   0) за мінімальний час T .
Уведемо фазові координати:
x1 (t )  x(t ) – положення об’єкта в момент часу t ;
__________
 Гарт Л.Л. 2
x2 (t )  x(t ) – швидкість об’єкта в момент часу t ( 0  t  T ).
У таких фазових координатах ця задача стає задачею про найшвидше
переміщення точки з положення 1,0  в положення  0,0  на координатній
площині  Оx1 , Оx2  , коли рух відбувається за законом:
 x1 (t )  x2 (t ),
 0t T ; (5)
 2
x (t )  u (t ),
u (t ) U  u (t ) : u (t )  1, 0  t  T ; u (t ) кусково-неперервна на [0,T ] . (6)
Іншими словами, маємо задачу швидкодії:
J (u,Т )  T  inf (7)
за наявності диференціальних зв’язків (5), умов на кінцях траєкторії
x1 (0)  1, x2 (0)  0 ; (8)
x1 (Т )  0, x2 (Т )  0 (9)
та обмежень на керування (6).
Застосуємо до задачі оптимального керування (5)–(9) принцип максимуму
Понтрягіна. Введемо допоміжну константу 0 і функцію імпульсу
  t    1  t  ,  2  t   , 0  t  T та складемо функцію Гамільтона-Понтрягіна:
n
H  H  x, 0 , , u, t    j (t ) f j ( x, u, t )   0  1  1 (t )  x2 (t )   2 (t )  u (t ) .
j 0

Згідно з теоремою 2 запишемо спряжену систему диференціальних


рівнянь
 H
1 (t )   x  0,


1
0t T
 (t )    H
 1 ,


2
 x2

і знайдемо її розв’язок
1 (t )  C1 , 2 (t )  C1t  C2 , 0  t  T , (10)
де C1 , C2  довільні сталі. Тоді гамільтоніан H матиме вигляд:
H   0  C1  x2 (t )   C1t  C2   u (t ) , 0  t  T . (11)
Розглянемо задачу max H максимізації гамільтоніана на множині (6).
uU
Очевидно, з огляду на лінійність функції H за u розв’язком такої задачі на
множині (6) за фіксованих x2 (t ), 0 , С1,С2 , t є функція:
 1, якщо  C1t  C2  0,

u  t   sign  C1t  C2   1, якщо  C1t  C2  0, 0  t  T . (12)
 0, якщо  C t  C  0,
 1 2

Отже, шукане оптимальне керування являє собою кусково-сталу


функцію, яка набуває значення  1 і має на відрізку  0,T  щонайбільше одну

__________
 Гарт Л.Л. 3
точку  перемикання, під час переходу через яку u  t  змінює знак. Зрозуміло,
що для функції керування u  t  можливі чотири випадки:
а) u  t   1 за 0  t  T ;
б) u  t   1 за 0  t  T ;
 1, 0  t  ,
в) u  t  змінює свій знак з «+» на «»: u (t )  
1,   t  T ;
1, 0  t  ,
г) u  t  змінює свій знак з «» на «+»: u (t )  
 1,   t  T .
Легко побачити, що кожний із перших трьох випадків приводить до
відповідної траєкторії x(t )   x1 (t ), x2 (t )  , 0  t  T , що не проходить через точку
 0,0 . Розглянемо окремо зазначені випадки.
Випадок а). Маємо стале керування u  t   1 для всіх 0  t  T . Відповідну
траєкторію x(t )   x1 (t ), x2 (t )  , 0  t  T знайдемо з системи диференціальних
рівнянь (5) за умов (8) на лівому кінці. Безпосереднім інтегруванням другого з
рівнянь (5) отримаємо рівняння
x2  t   1  x2  t   t  C2 , 0  t  T ,
де C 2  довільна стала, значення якої знайдемо, скориставшись відповідною
умовою (8): x2 (0)  C2  0 . З огляду на це друга фазова координата шуканої
траєкторії дорівнює x2  t   t , 0  t  T . Першу фазову координату знайдемо
аналогічно з першого рівняння (5) за відповідної умови (8):
t2 t2
x1  t   t  x1  t    C1; x1  0   C1  1  x1  t    1, 0  t  T .
2 2
Отже, керуванню u  t   1 , 0  t  T відповідає траєкторія руху
t2
x(t )   x1 (t ), x2 (t )  , де x1  t    1, x2  t   t , 0  t  T . Для відшукання
2
кінцевого моменту часу T скористаємось умовами (9) на правому кінці
знайденої траєкторії:
T2
x1 T    1  0, x2 T   T  0 .
2
Очевидно, що ці рівняння є суперечливі і такі, що в сукупності не дають
розв’язків. Звідси випливає, що фазова траєкторія x(t ) , яка виходить з точки
1,0  і відповідає керуванню u  t   1, 0  t  T , через точку  0,0  не проходить.
Випадок б). Маємо стале керування u  t   1 для всіх 0  t  T .
Аналогічно випадку а) відповідну траєкторію x(t )   x1 (t ), x2 (t )  , 0  t  T
знайдемо з системи ЗДР (5) за умов (8) на лівому кінці. Другу фазову
координату шуканої траєкторії одержимо з другого рівняння (5) за відповідної
умови (8):
__________
 Гарт Л.Л. 4
x2  t   1  x2  t   t  C2 ; x2 (0)  C2  0  x2  t   t , 0  t  T ;
першу фазову координату – з першого рівняння (5) за відповідної умови (8):
t2 t2
x1  t   t  x1  t     C1; x1  0   C1  1  x1  t     1 , 0  t  T .
2 2
Отже, керуванню u  t   1, 0  t  T відповідає траєкторія руху
t2
x(t )   x1 (t ), x2 (t )  , де x1  t     1, x2  t   t , 0  t  T . Для відшукання
2
кінцевого моменту часу T скористаємось умовами (9) на правому кінці
знайденої траєкторії:
T2
x1 T     1  0, x2 T   T  0 .
2
Очевидно, що ці рівняння є суперечливі і такі, що в сукупності не дають
розв’язків. Звідси випливає, що фазова траєкторія x(t ) , яка виходить з точки
1,0  і відповідає керуванню u  t   1, 0  t  T , через точку  0,0  також не
проходить.
 1, 0  t  ,
Випадок в). Маємо кусково-стале керування u (t )   із
1,   t  T
точкою перемикання  ( 0    T ), яка разом із T підлягає визначенню.
Траєкторію x(t )   x1 (t ), x2 (t )  , 0  t  T , що відповідає зазначеному керуванню,
знайдемо так само, як і раніше, з системи диференціальних рівнянь (5) за умов
(8) на лівому кінці. Спочатку знайдемо другу фазову координату x2 (t ) , 0  t  T
шуканої траєкторії з другого рівняння (5):
 1, 0  t  ,  t  С2 , 0  t  ,
x2  t     x2  t   
1,   t  T t  C2 ,   t  T .
Для визначення сталої C 2 скористаємось відповідною граничною умовою (8):
x2 (0)  C2  0  x2  t   t , 0  t   ,
а для визначення сталої C 2  умовою неперервності функції x2 (t ) у точці t   :
x2         C2  C2  2  x2  t   t  2,   t  T .
Отже, друга фазова координата шуканої траєкторії матиме вигляд
 t, 0  t  ,
x2  t    (13)
t  2,   t  T .
Аналогічно знайдемо першу фазову координату x1 (t ) , 0  t  T з першого
рівняння (5):
 t2
  C1 , 0  t  ,
 t, 0  t  ,
x1  t     x1  t    2 2
t  2,   t  T  t  2t  C ,   t  T .
 2 1

__________
 Гарт Л.Л. 5
Для визначення сталої C1 скористаємось відповідною граничною умовою (8):
t2
x1 (0)  C1  1  x1  t    1, 0  t   ,
2
а для визначення C1  умовою неперервності функції x1  t  у точці t   :
2 2
x1      1    22  С1  С1  2  1 .
2 2
Отже, перша фазова координата шуканої траєкторії матиме вигляд
 t2
  1, 0  t  ,
x1  t    2 2 (14)
  2t  2  1,   t  T .
t
 2
Як бачимо, функції керування u  t  у випадку в) відповідає траєкторія руху
x(t )   x1 (t ), x2 (t )  , 0  t  T з фазовими координатами x1  t  і x2  t  , заданими
формулами (14) і (13) відповідно. Для відшукання кінцевого моменту часу T і
точки  ( 0    T ) перемикання керування скористаємось умовами (9) на
правому кінці знайденої траєкторії:
T2
x1 T     2T  2  1  0 , x2 T   T  2  0 .
2
Це система двох (нелінійних) алгебраїчних рівнянь відносно T і  :
 T2
  2T  2  1  0, 2  4    1  0,   1,
2 2 2 2

 2  
T  2;  T  2 ; T  2,

   i,    i ,
розв’язками якої є  і  . Очевидно, що отримані комплексні
 T  2 i T   2 i
значення для  і T суперечать фізичному сенсу задачі, оскільки час t є дійсна
змінна. Звідси випливає, що фазова траєкторія x(t )   x1 (t ), x2 (t )  вигляду (14),
 1, 0  t  ,
(13), яка виходить з точки 1,0  і відповідає керуванню u (t )   ,
 1,   t  T
що змінює свій знак з «+» на «», через точку  0,0  також не проходить.
1, 0  t  ,
Випадок г). Маємо кусково-стале керування u (t )   із
 1,   t  T
точкою перемикання  ( 0    T ), яка разом із T підлягає визначенню.
Відповідну траєкторію руху x(t )   x1 (t ), x2 (t )  , 0  t  T знайдемо за тією
самою схемою, що й у випадку в). Спочатку знайдемо другу фазову координату
x2 (t ) , 0  t  T шуканої траєкторії з другого рівняння (5):
1, 0  t  , t  С2 , 0  t  ,
x2  t     x2  t   
 1,   t  T  t  C2 ,   t  T .
__________
 Гарт Л.Л. 6
Для визначення C 2 скористаємось відповідною граничною умовою (8):
x2 (0)  C2  0  x2  t   t , 0  t   ,
для визначення C 2  умовою неперервності функції x2 (t ) у точці t   :
x2         C2  C2  2 .
Отже, друга фазова координата шуканої траєкторії матиме вигляд
  t, 0  t  ,
x2  t    (15)
t  2 ,   t  T .
Аналогічно знайдемо першу фазову координату x1 (t ) , 0  t  T з першого
рівняння (5):
 t2
   C1 , 0  t  ,
  t, 0  t  ,  2
x1  t     x1  t    2
t  2 ,   t  T  t  2t  C ,   t  T .

2
1

Для визначення сталої C1 скористаємось відповідною граничною умовою (8):


t2
x1 (0)  C1  1  x1  t     1, 0  t   ,
2
для визначення C1  умовою неперервності функції x1 (t ) у точці t   :
2 2
x1       1   22  С1  С1  2  1.
2 2
Як бачимо, перша фазова координата шуканої траєкторії матиме вигляд
 t2
  2  1, 0  t  ,
x1  t    2 (16)
  2t  2  1,   t  T .
t
 2
1, 0  t  ,
Отже, функції керування u (t )   у випадку г) відповідає
 1,   t  T
траєкторія руху x(t )   x1 (t ), x2 (t )  , 0  t  T з фазовими координатами x1  t  і
x2  t  , заданими формулами (16) і (15) відповідно. Кінцевий момент часу T і
точку  ( 0    T ) перемикання керування знайдемо за допомогою граничних
умов (9) на правому кінці (9) одержаної траєкторії:
T 2
  2T  2  1  0, 2  4    1  0,   1,
2 2 2 2
  1,
2    
T  2  0; T  2; T  2 T  2.

Другий розв’язок цієї системи   1, T  2 відхилимо, оскільки він
суперечить фізичному сенсу задачі.
Звідси випливає, що в розглядуваному випадку функція керування u (t )
набуде вигляду
__________
 Гарт Л.Л. 7
1, 0  t  1,
u  (t )   (17)
 1, 1  t  2,
 
а відповідна фазова траєкторія x (t )  x1 (t ), x2 (t ) матиме координати
  1  0,5t 2 , 0  t  1,    t , 0  t  1,
x (t )   x (t )   (18)
     
1 2 2
 0,5(t 2) , 1 t 2, t 2, 1 t 2.
Можна показати, що знайдені керування і траєкторія є оптимальні в
задачі швидкодії (5)–(9) і такі, що надають функціоналу (7) мінімальне
значення J (u, Т )  2 .
Зауваження. Щодо допоміжних величин – сталої 0 та спряжених
змінних 1 (t ), 2 (t ) , 0  t  2 , – яких потребує принцип максимуму і які
визначаються формулами (10)
1 (t )  C1 , 2 (t )  C1t  C2 , 0  t  2 ,
то з вигляду керування (12), (17) зрозуміло, що лінійна функція
2 (t )  С1t  С2 , яка в точці t  1 змінює знак з «» на «+» (тобто 2 (1)  0 і
C1  C2 ), має вигляд 2 (t )  С1 (1  t ) ; 1 (t )  С1 , 0  t  2 . Для відшукання 0
 
скористаємось умовою (6) теореми 2 за t  Т : H x (Т ), 0 ,  (Т ), u  (Т ), Т  0 ,
яка з урахуванням виразу (11) для гамільтоніана набуває вигляду
0  C1  x2 (Т )  C1 (1  Т )  u  (Т )  0 .
Послуговуючись формулами (17), (18) за T  2 , отримаємо:
0  C1  0  C1 (1  2)  1  0 ,
звідки  0  C1 . Зрозуміло, що стала С1 не дорівнює 0 (якщо б С1  0 , то
отримали б, що  0  0 і 1 (t )   2 (t )  0 , 0  t  2 , а це неможливо за умов
теореми 2). Тому можемо прийняти 0  1 , 1 (t )  1 ,  2 (t )  t  1 .

__________
 Гарт Л.Л. 8

You might also like