11 - Приклад2 пр. макс

Формулювання принципу максимуму для задачі оптимального керування
з незакріпленим часом
Розглянемо наступну задачу оптимального керування: знайти нижню
грань функціонала
T
J (u, t0 ,Т )   f0  x(t ), u(t ), t  dt (1)
t0
за умов
x(t )  f  x(t ), u (t ), t  , t0  t  T ; (2)
x(t0 )  S0 (t0 ) , x(T )  S1 (T ) ; (3)
x(t )  G (t ) , t0  t  T ; (4)
u  u (t ) U  u (t ) : u (t ) V (t ), t0  t  T ; u (t ) кусково-непeрервна на [t0 ,T ] , (5)
де x(t )  ( x1 (t ),, xn (t )) і u(t )  (u1 (t ),, ur (t )) – шукані векторні функції на
[t0 ,T ] ; f0 ( x, u, t ) і f ( x, u , t )   f1 ( x, u , t ),, f n ( x, u , t )  – відомі скалярна і векторна
функції відповідно, визначені і неперервні за сукупністю аргументів разом із
частинними похідними першого порядку за всіх x  E n , u U , t [t0 ,T ] ;
S0 (t ), S1 (t )  E п і V (t )  E r – задані множини за t0  t  T ; [t0 , T ] – проміжок
числової осі, межі якого можуть бути невідомими.
Теорема 2 (принцип максимуму для задачі з незакріпленим часом). Нехай
(u (t ), x (t )) , t0  t  T – оптимальний розв’язок задачі (1)–(5) за V (t )  V ,

G (t )  E n , t0  t  T . Нехай початковий момент часу t0 відомий, а кінцевий

момент T заздалегідь невідомий. Тоді виконуються всі твердження теореми 1 і,
крім того:
а) якщо правий кінець траєкторії закріплений ( S1 (Т )  {x (1) } , x (1)  Е п ) або
вільний ( S1 (T )  E п ) , то має місце рівність
H 
t
H  x (t ),  ,  (t ), u (t ), t   
   
 x ( ), 0 ,  ( ), u  ( ),   d  , t0  t  T ; (6)
t
0
T
б) якщо правий кінець траєкторії рухомий, тобто рухається поверхнею

S1 (t )  {( x, t ) : hi ( x, t )  0, i  1,2,, n1; n1  n} , t0  t  T , то має місце рівність
h
 
n1
H x (t ),  0 ,  (t ), u (t ), t   a j j ( x (Т ), T ) 
   
j 1 t
(7)
H 
t
 
t
 
x (), 0 ,  (), u  (),  d , t0  t  T ,
T
де сталі a1, a2 ,, an1 ( n1  n ) визначені у відповідній умові трансверсальності
n1
h j
(Т )   a j ( x(Т ), T ) .
j 1 x
__________
 Гарт Л.Л.
Отже, принцип максимуму і в разі незакріпленого часу приводить до
крайової задачі спеціального виду. Для знаходження невідомого значення T
послуговуються однією з додаткових умов – (6) або (7) – залежно від режиму на
правому кінці траєкторії, за t  T .
Зауваження. У наведених вище теоремах 1, 2 задачу А оптимального
керування розглянуто за припущень, що V (t )  V , G (t )  E n , t0  t  T . У
спеціальній літературі можна знайти наукові та прикладні результати щодо
принципу максимуму Понтрягіна для задач оптимального керування з
фазовими обмеженнями виду (4). Такі задачі приводять до істотно складніших
диференціальних моделей.
Приклад застосування теореми 2 принципу максимуму Понтрягіна

до розв’язування задачі оптимального керування з незакріпленим часом
На початку нагадаємо математичну постановку задачі оптимального

керування з незакріпленим часом, для якої був попередньо сформульований
принцип максимуму Понтрягіна (теорема 2): знайти нижню грань функціонала
T
J (u,Т )   f 0  x(t ), u (t ), t  dt (1)
t0
за умов
x(t )  f  x(t ), u (t ), t  , t0  t  T ; (2)
x(t0 )  S0 (t0 ) , x(T )  S1 (T ) ; (3)
u  u (t ) U  u (t ) V  E r , t0  t  T ; u (t ) кусково-непeрервна на [t0 ,T ] , (4)
де x(t )  ( x1 (t ),, xn (t )) і u(t )  (u1 (t ),, ur (t )) – шукані векторні функції на
[t0 ,T ] ; f0 ( x, u, t ) і f ( x, u , t )   f1 ( x, u , t ),, f n ( x, u , t )  – відомі скалярна і векторна
функції відповідно, визначені і неперервні за сукупністю аргументів разом із
частинними похідними першого порядку за всіх x  E n , u U , t [t0 ,T ] ;
S0 (t ), S1 (t )  E п за t0  t  T і V  E r – задані множини; [t0 , T ] – проміжок
числової осі, межі якого можуть бути невідомі.
Розглянемо приклад застосування теореми 2 принципу максимуму
Понтрягіна до розв’язування конкретної задачі оптимального керування з
незакріпленим часом.
Задача. Нехай деяка матеріальна точка (об’єкт) рухається вздовж осі Ox
за законом x(t )  u ; 0  t  T , де u – скалярний керувальний параметр.
Потрібно знайти таке кусково-неперервне керування u  u (t ) , що задовольняє
умову u (t )  1 , 0  t  T , за яким точка, виходячи з початкового положення
x  0   1 з нульовою швидкістю ( x  0   0) , досягне початку координат
( x T   0) з нульовою швидкістю ( x T   0) за мінімальний час T .
Уведемо фазові координати:
x1 (t )  x(t ) – положення об’єкта в момент часу t ;
__________
 Гарт Л.Л. 2
x2 (t )  x(t ) – швидкість об’єкта в момент часу t ( 0  t  T ).
У таких фазових координатах ця задача стає задачею про найшвидше
переміщення точки з положення 1,0  в положення  0,0  на координатній
площині  Оx1 , Оx2  , коли рух відбувається за законом:
 x1 (t )  x2 (t ),
 0t T ; (5)
 2
x (t )  u (t ),
u (t ) U  u (t ) : u (t )  1, 0  t  T ; u (t ) кусково-неперервна на [0,T ] . (6)
Іншими словами, маємо задачу швидкодії:
J (u,Т )  T  inf (7)
за наявності диференціальних зв’язків (5), умов на кінцях траєкторії
x1 (0)  1, x2 (0)  0 ; (8)
x1 (Т )  0, x2 (Т )  0 (9)
та обмежень на керування (6).
Застосуємо до задачі оптимального керування (5)–(9) принцип максимуму
Понтрягіна. Введемо допоміжну константу 0 і функцію імпульсу
  t    1  t  ,  2  t   , 0  t  T та складемо функцію Гамільтона-Понтрягіна:
n
H  H  x, 0 , , u, t    j (t ) f j ( x, u, t )   0  1  1 (t )  x2 (t )   2 (t )  u (t ) .
j 0
Згідно з теоремою 2 запишемо спряжену систему диференціальних

рівнянь
 H
1 (t )   x  0,


1
0t T
 (t )    H
 1 ,


2
 x2
і знайдемо її розв’язок
1 (t )  C1 , 2 (t )  C1t  C2 , 0  t  T , (10)
де C1 , C2  довільні сталі. Тоді гамільтоніан H матиме вигляд:
H   0  C1  x2 (t )   C1t  C2   u (t ) , 0  t  T . (11)
Розглянемо задачу max H максимізації гамільтоніана на множині (6).
uU
Очевидно, з огляду на лінійність функції H за u розв’язком такої задачі на
множині (6) за фіксованих x2 (t ), 0 , С1,С2 , t є функція:
 1, якщо  C1t  C2  0,

u  t   sign  C1t  C2   1, якщо  C1t  C2  0, 0  t  T . (12)
 0, якщо  C t  C  0,
 1 2
Отже, шукане оптимальне керування являє собою кусково-сталу

функцію, яка набуває значення  1 і має на відрізку  0,T  щонайбільше одну
__________
точку  перемикання, під час переходу через яку u  t  змінює знак. Зрозуміло,
що для функції керування u  t  можливі чотири випадки:
а) u  t   1 за 0  t  T ;
б) u  t   1 за 0  t  T ;
 1, 0  t  ,
в) u  t  змінює свій знак з «+» на «»: u (t )  
1,   t  T ;
1, 0  t  ,
г) u  t  змінює свій знак з «» на «+»: u (t )  
 1,   t  T .
Легко побачити, що кожний із перших трьох випадків приводить до
відповідної траєкторії x(t )   x1 (t ), x2 (t )  , 0  t  T , що не проходить через точку
 0,0 . Розглянемо окремо зазначені випадки.
Випадок а). Маємо стале керування u  t   1 для всіх 0  t  T . Відповідну
траєкторію x(t )   x1 (t ), x2 (t )  , 0  t  T знайдемо з системи диференціальних
рівнянь (5) за умов (8) на лівому кінці. Безпосереднім інтегруванням другого з
рівнянь (5) отримаємо рівняння
x2  t   1  x2  t   t  C2 , 0  t  T ,
де C 2  довільна стала, значення якої знайдемо, скориставшись відповідною
умовою (8): x2 (0)  C2  0 . З огляду на це друга фазова координата шуканої
траєкторії дорівнює x2  t   t , 0  t  T . Першу фазову координату знайдемо
аналогічно з першого рівняння (5) за відповідної умови (8):
t2 t2
x1  t   t  x1  t    C1; x1  0   C1  1  x1  t    1, 0  t  T .
2 2
Отже, керуванню u  t   1 , 0  t  T відповідає траєкторія руху
t2
x(t )   x1 (t ), x2 (t )  , де x1  t    1, x2  t   t , 0  t  T . Для відшукання
2
кінцевого моменту часу T скористаємось умовами (9) на правому кінці
знайденої траєкторії:
T2
x1 T    1  0, x2 T   T  0 .
2
Очевидно, що ці рівняння є суперечливі і такі, що в сукупності не дають
розв’язків. Звідси випливає, що фазова траєкторія x(t ) , яка виходить з точки
1,0  і відповідає керуванню u  t   1, 0  t  T , через точку  0,0  не проходить.
Випадок б). Маємо стале керування u  t   1 для всіх 0  t  T .
Аналогічно випадку а) відповідну траєкторію x(t )   x1 (t ), x2 (t )  , 0  t  T
знайдемо з системи ЗДР (5) за умов (8) на лівому кінці. Другу фазову
координату шуканої траєкторії одержимо з другого рівняння (5) за відповідної
умови (8):
__________
x2  t   1  x2  t   t  C2 ; x2 (0)  C2  0  x2  t   t , 0  t  T ;
першу фазову координату – з першого рівняння (5) за відповідної умови (8):
t2 t2
x1  t   t  x1  t     C1; x1  0   C1  1  x1  t     1 , 0  t  T .
2 2
Отже, керуванню u  t   1, 0  t  T відповідає траєкторія руху
t2
x(t )   x1 (t ), x2 (t )  , де x1  t     1, x2  t   t , 0  t  T . Для відшукання
2
кінцевого моменту часу T скористаємось умовами (9) на правому кінці
знайденої траєкторії:
T2
x1 T     1  0, x2 T   T  0 .
2
Очевидно, що ці рівняння є суперечливі і такі, що в сукупності не дають
розв’язків. Звідси випливає, що фазова траєкторія x(t ) , яка виходить з точки
1,0  і відповідає керуванню u  t   1, 0  t  T , через точку  0,0  також не
проходить.
 1, 0  t  ,
Випадок в). Маємо кусково-стале керування u (t )   із
1,   t  T
точкою перемикання  ( 0    T ), яка разом із T підлягає визначенню.
Траєкторію x(t )   x1 (t ), x2 (t )  , 0  t  T , що відповідає зазначеному керуванню,
знайдемо так само, як і раніше, з системи диференціальних рівнянь (5) за умов
(8) на лівому кінці. Спочатку знайдемо другу фазову координату x2 (t ) , 0  t  T
шуканої траєкторії з другого рівняння (5):
 1, 0  t  ,  t  С2 , 0  t  ,
x2  t     x2  t   
1,   t  T t  C2 ,   t  T .
Для визначення сталої C 2 скористаємось відповідною граничною умовою (8):
x2 (0)  C2  0  x2  t   t , 0  t   ,
а для визначення сталої C 2  умовою неперервності функції x2 (t ) у точці t   :
x2         C2  C2  2  x2  t   t  2,   t  T .
Отже, друга фазова координата шуканої траєкторії матиме вигляд
 t, 0  t  ,
x2  t    (13)
t  2,   t  T .
Аналогічно знайдемо першу фазову координату x1 (t ) , 0  t  T з першого
рівняння (5):
 t2
  C1 , 0  t  ,
 t, 0  t  ,
x1  t     x1  t    2 2
t  2,   t  T  t  2t  C ,   t  T .
 2 1
__________
Для визначення сталої C1 скористаємось відповідною граничною умовою (8):
t2
x1 (0)  C1  1  x1  t    1, 0  t   ,
2
а для визначення C1  умовою неперервності функції x1  t  у точці t   :
2 2
x1      1    22  С1  С1  2  1 .
2 2
Отже, перша фазова координата шуканої траєкторії матиме вигляд
 t2
  1, 0  t  ,
x1  t    2 2 (14)
  2t  2  1,   t  T .
t
 2
Як бачимо, функції керування u  t  у випадку в) відповідає траєкторія руху
x(t )   x1 (t ), x2 (t )  , 0  t  T з фазовими координатами x1  t  і x2  t  , заданими
формулами (14) і (13) відповідно. Для відшукання кінцевого моменту часу T і
точки  ( 0    T ) перемикання керування скористаємось умовами (9) на
правому кінці знайденої траєкторії:
T2
x1 T     2T  2  1  0 , x2 T   T  2  0 .
2
Це система двох (нелінійних) алгебраїчних рівнянь відносно T і  :
 T2
  2T  2  1  0, 2  4    1  0,   1,
2 2 2 2
 2  
T  2;  T  2 ; T  2,

   i,    i ,
розв’язками якої є  і  . Очевидно, що отримані комплексні
 T  2 i T   2 i
значення для  і T суперечать фізичному сенсу задачі, оскільки час t є дійсна
змінна. Звідси випливає, що фазова траєкторія x(t )   x1 (t ), x2 (t )  вигляду (14),
 1, 0  t  ,
(13), яка виходить з точки 1,0  і відповідає керуванню u (t )   ,
 1,   t  T
що змінює свій знак з «+» на «», через точку  0,0  також не проходить.
1, 0  t  ,
Випадок г). Маємо кусково-стале керування u (t )   із
 1,   t  T
точкою перемикання  ( 0    T ), яка разом із T підлягає визначенню.
Відповідну траєкторію руху x(t )   x1 (t ), x2 (t )  , 0  t  T знайдемо за тією
самою схемою, що й у випадку в). Спочатку знайдемо другу фазову координату
x2 (t ) , 0  t  T шуканої траєкторії з другого рівняння (5):
1, 0  t  , t  С2 , 0  t  ,
x2  t     x2  t   
 1,   t  T  t  C2 ,   t  T .
__________
Для визначення C 2 скористаємось відповідною граничною умовою (8):
x2 (0)  C2  0  x2  t   t , 0  t   ,
для визначення C 2  умовою неперервності функції x2 (t ) у точці t   :
x2         C2  C2  2 .
Отже, друга фазова координата шуканої траєкторії матиме вигляд
  t, 0  t  ,
x2  t    (15)
t  2 ,   t  T .
Аналогічно знайдемо першу фазову координату x1 (t ) , 0  t  T з першого
рівняння (5):
 t2
   C1 , 0  t  ,
  t, 0  t  ,  2
x1  t     x1  t    2
t  2 ,   t  T  t  2t  C ,   t  T .

2
1
Для визначення сталої C1 скористаємось відповідною граничною умовою (8):

t2
x1 (0)  C1  1  x1  t     1, 0  t   ,
2
для визначення C1  умовою неперервності функції x1 (t ) у точці t   :
2 2
x1       1   22  С1  С1  2  1.
2 2
Як бачимо, перша фазова координата шуканої траєкторії матиме вигляд
 t2
  2  1, 0  t  ,
x1  t    2 (16)
  2t  2  1,   t  T .
t
 2
1, 0  t  ,
Отже, функції керування u (t )   у випадку г) відповідає
 1,   t  T
траєкторія руху x(t )   x1 (t ), x2 (t )  , 0  t  T з фазовими координатами x1  t  і
x2  t  , заданими формулами (16) і (15) відповідно. Кінцевий момент часу T і
точку  ( 0    T ) перемикання керування знайдемо за допомогою граничних
умов (9) на правому кінці (9) одержаної траєкторії:
T 2
  2T  2  1  0, 2  4    1  0,   1,
2 2 2 2
  1,
2    
T  2  0; T  2; T  2 T  2.

Другий розв’язок цієї системи   1, T  2 відхилимо, оскільки він
суперечить фізичному сенсу задачі.
Звідси випливає, що в розглядуваному випадку функція керування u (t )
набуде вигляду
__________
1, 0  t  1,
u  (t )   (17)
 1, 1  t  2,
 
а відповідна фазова траєкторія x (t )  x1 (t ), x2 (t ) матиме координати
  1  0,5t 2 , 0  t  1,    t , 0  t  1,
x (t )   x (t )   (18)
     
1 2 2
 0,5(t 2) , 1 t 2, t 2, 1 t 2.
Можна показати, що знайдені керування і траєкторія є оптимальні в
задачі швидкодії (5)–(9) і такі, що надають функціоналу (7) мінімальне
значення J (u, Т )  2 .
Зауваження. Щодо допоміжних величин – сталої 0 та спряжених
змінних 1 (t ), 2 (t ) , 0  t  2 , – яких потребує принцип максимуму і які
визначаються формулами (10)
1 (t )  C1 , 2 (t )  C1t  C2 , 0  t  2 ,
то з вигляду керування (12), (17) зрозуміло, що лінійна функція
2 (t )  С1t  С2 , яка в точці t  1 змінює знак з «» на «+» (тобто 2 (1)  0 і
C1  C2 ), має вигляд 2 (t )  С1 (1  t ) ; 1 (t )  С1 , 0  t  2 . Для відшукання 0
 
скористаємось умовою (6) теореми 2 за t  Т : H x (Т ), 0 ,  (Т ), u  (Т ), Т  0 ,
яка з урахуванням виразу (11) для гамільтоніана набуває вигляду
0  C1  x2 (Т )  C1 (1  Т )  u  (Т )  0 .
Послуговуючись формулами (17), (18) за T  2 , отримаємо:
0  C1  0  C1 (1  2)  1  0 ,
звідки  0  C1 . Зрозуміло, що стала С1 не дорівнює 0 (якщо б С1  0 , то
отримали б, що  0  0 і 1 (t )   2 (t )  0 , 0  t  2 , а це неможливо за умов
теореми 2). Тому можемо прийняти 0  1 , 1 (t )  1 ,  2 (t )  t  1 .
__________

11 - Приклад2 пр. макс

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

11 - Приклад2 пр. макс

Uploaded by

Copyright:

Available Formats

Формулювання принципу максимуму для задачі оптимального керування

G (t )  E n , t0  t  T . Нехай початковий момент часу t0 відомий, а кінцевий

б) якщо правий кінець траєкторії рухомий, тобто рухається поверхнею

Приклад застосування теореми 2 принципу максимуму Понтрягіна

На початку нагадаємо математичну постановку задачі оптимального

Згідно з теоремою 2 запишемо спряжену систему диференціальних

Отже, шукане оптимальне керування являє собою кусково-сталу

Для визначення сталої C1 скористаємось відповідною граничною умовою (8):

You might also like