Professional Documents
Culture Documents
11 - Приклад2 пр. макс
11 - Приклад2 пр. макс
з незакріпленим часом
Розглянемо наступну задачу оптимального керування: знайти нижню
грань функціонала
T
J (u, t0 ,Т ) f0 x(t ), u(t ), t dt (1)
t0
за умов
x(t ) f x(t ), u (t ), t , t0 t T ; (2)
x(t0 ) S0 (t0 ) , x(T ) S1 (T ) ; (3)
x(t ) G (t ) , t0 t T ; (4)
u u (t ) U u (t ) : u (t ) V (t ), t0 t T ; u (t ) кусково-непeрервна на [t0 ,T ] , (5)
де x(t ) ( x1 (t ),, xn (t )) і u(t ) (u1 (t ),, ur (t )) – шукані векторні функції на
[t0 ,T ] ; f0 ( x, u, t ) і f ( x, u , t ) f1 ( x, u , t ),, f n ( x, u , t ) – відомі скалярна і векторна
функції відповідно, визначені і неперервні за сукупністю аргументів разом із
частинними похідними першого порядку за всіх x E n , u U , t [t0 ,T ] ;
S0 (t ), S1 (t ) E п і V (t ) E r – задані множини за t0 t T ; [t0 , T ] – проміжок
числової осі, межі якого можуть бути невідомими.
Теорема 2 (принцип максимуму для задачі з незакріпленим часом). Нехай
(u (t ), x (t )) , t0 t T – оптимальний розв’язок задачі (1)–(5) за V (t ) V ,
j 1 t
(7)
H
t
t
x (), 0 , (), u (), d , t0 t T ,
T
де сталі a1, a2 ,, an1 ( n1 n ) визначені у відповідній умові трансверсальності
n1
h j
(Т ) a j ( x(Т ), T ) .
j 1 x
__________
Гарт Л.Л.
Отже, принцип максимуму і в разі незакріпленого часу приводить до
крайової задачі спеціального виду. Для знаходження невідомого значення T
послуговуються однією з додаткових умов – (6) або (7) – залежно від режиму на
правому кінці траєкторії, за t T .
Зауваження. У наведених вище теоремах 1, 2 задачу А оптимального
керування розглянуто за припущень, що V (t ) V , G (t ) E n , t0 t T . У
спеціальній літературі можна знайти наукові та прикладні результати щодо
принципу максимуму Понтрягіна для задач оптимального керування з
фазовими обмеженнями виду (4). Такі задачі приводять до істотно складніших
диференціальних моделей.
за умов
x(t ) f x(t ), u (t ), t , t0 t T ; (2)
x(t0 ) S0 (t0 ) , x(T ) S1 (T ) ; (3)
u u (t ) U u (t ) V E r , t0 t T ; u (t ) кусково-непeрервна на [t0 ,T ] , (4)
де x(t ) ( x1 (t ),, xn (t )) і u(t ) (u1 (t ),, ur (t )) – шукані векторні функції на
[t0 ,T ] ; f0 ( x, u, t ) і f ( x, u , t ) f1 ( x, u , t ),, f n ( x, u , t ) – відомі скалярна і векторна
функції відповідно, визначені і неперервні за сукупністю аргументів разом із
частинними похідними першого порядку за всіх x E n , u U , t [t0 ,T ] ;
S0 (t ), S1 (t ) E п за t0 t T і V E r – задані множини; [t0 , T ] – проміжок
числової осі, межі якого можуть бути невідомі.
Розглянемо приклад застосування теореми 2 принципу максимуму
Понтрягіна до розв’язування конкретної задачі оптимального керування з
незакріпленим часом.
Задача. Нехай деяка матеріальна точка (об’єкт) рухається вздовж осі Ox
за законом x(t ) u ; 0 t T , де u – скалярний керувальний параметр.
Потрібно знайти таке кусково-неперервне керування u u (t ) , що задовольняє
умову u (t ) 1 , 0 t T , за яким точка, виходячи з початкового положення
x 0 1 з нульовою швидкістю ( x 0 0) , досягне початку координат
( x T 0) з нульовою швидкістю ( x T 0) за мінімальний час T .
Уведемо фазові координати:
x1 (t ) x(t ) – положення об’єкта в момент часу t ;
__________
Гарт Л.Л. 2
x2 (t ) x(t ) – швидкість об’єкта в момент часу t ( 0 t T ).
У таких фазових координатах ця задача стає задачею про найшвидше
переміщення точки з положення 1,0 в положення 0,0 на координатній
площині Оx1 , Оx2 , коли рух відбувається за законом:
x1 (t ) x2 (t ),
0t T ; (5)
2
x (t ) u (t ),
u (t ) U u (t ) : u (t ) 1, 0 t T ; u (t ) кусково-неперервна на [0,T ] . (6)
Іншими словами, маємо задачу швидкодії:
J (u,Т ) T inf (7)
за наявності диференціальних зв’язків (5), умов на кінцях траєкторії
x1 (0) 1, x2 (0) 0 ; (8)
x1 (Т ) 0, x2 (Т ) 0 (9)
та обмежень на керування (6).
Застосуємо до задачі оптимального керування (5)–(9) принцип максимуму
Понтрягіна. Введемо допоміжну константу 0 і функцію імпульсу
t 1 t , 2 t , 0 t T та складемо функцію Гамільтона-Понтрягіна:
n
H H x, 0 , , u, t j (t ) f j ( x, u, t ) 0 1 1 (t ) x2 (t ) 2 (t ) u (t ) .
j 0
і знайдемо її розв’язок
1 (t ) C1 , 2 (t ) C1t C2 , 0 t T , (10)
де C1 , C2 довільні сталі. Тоді гамільтоніан H матиме вигляд:
H 0 C1 x2 (t ) C1t C2 u (t ) , 0 t T . (11)
Розглянемо задачу max H максимізації гамільтоніана на множині (6).
uU
Очевидно, з огляду на лінійність функції H за u розв’язком такої задачі на
множині (6) за фіксованих x2 (t ), 0 , С1,С2 , t є функція:
1, якщо C1t C2 0,
u t sign C1t C2 1, якщо C1t C2 0, 0 t T . (12)
0, якщо C t C 0,
1 2
__________
Гарт Л.Л. 3
точку перемикання, під час переходу через яку u t змінює знак. Зрозуміло,
що для функції керування u t можливі чотири випадки:
а) u t 1 за 0 t T ;
б) u t 1 за 0 t T ;
1, 0 t ,
в) u t змінює свій знак з «+» на «»: u (t )
1, t T ;
1, 0 t ,
г) u t змінює свій знак з «» на «+»: u (t )
1, t T .
Легко побачити, що кожний із перших трьох випадків приводить до
відповідної траєкторії x(t ) x1 (t ), x2 (t ) , 0 t T , що не проходить через точку
0,0 . Розглянемо окремо зазначені випадки.
Випадок а). Маємо стале керування u t 1 для всіх 0 t T . Відповідну
траєкторію x(t ) x1 (t ), x2 (t ) , 0 t T знайдемо з системи диференціальних
рівнянь (5) за умов (8) на лівому кінці. Безпосереднім інтегруванням другого з
рівнянь (5) отримаємо рівняння
x2 t 1 x2 t t C2 , 0 t T ,
де C 2 довільна стала, значення якої знайдемо, скориставшись відповідною
умовою (8): x2 (0) C2 0 . З огляду на це друга фазова координата шуканої
траєкторії дорівнює x2 t t , 0 t T . Першу фазову координату знайдемо
аналогічно з першого рівняння (5) за відповідної умови (8):
t2 t2
x1 t t x1 t C1; x1 0 C1 1 x1 t 1, 0 t T .
2 2
Отже, керуванню u t 1 , 0 t T відповідає траєкторія руху
t2
x(t ) x1 (t ), x2 (t ) , де x1 t 1, x2 t t , 0 t T . Для відшукання
2
кінцевого моменту часу T скористаємось умовами (9) на правому кінці
знайденої траєкторії:
T2
x1 T 1 0, x2 T T 0 .
2
Очевидно, що ці рівняння є суперечливі і такі, що в сукупності не дають
розв’язків. Звідси випливає, що фазова траєкторія x(t ) , яка виходить з точки
1,0 і відповідає керуванню u t 1, 0 t T , через точку 0,0 не проходить.
Випадок б). Маємо стале керування u t 1 для всіх 0 t T .
Аналогічно випадку а) відповідну траєкторію x(t ) x1 (t ), x2 (t ) , 0 t T
знайдемо з системи ЗДР (5) за умов (8) на лівому кінці. Другу фазову
координату шуканої траєкторії одержимо з другого рівняння (5) за відповідної
умови (8):
__________
Гарт Л.Л. 4
x2 t 1 x2 t t C2 ; x2 (0) C2 0 x2 t t , 0 t T ;
першу фазову координату – з першого рівняння (5) за відповідної умови (8):
t2 t2
x1 t t x1 t C1; x1 0 C1 1 x1 t 1 , 0 t T .
2 2
Отже, керуванню u t 1, 0 t T відповідає траєкторія руху
t2
x(t ) x1 (t ), x2 (t ) , де x1 t 1, x2 t t , 0 t T . Для відшукання
2
кінцевого моменту часу T скористаємось умовами (9) на правому кінці
знайденої траєкторії:
T2
x1 T 1 0, x2 T T 0 .
2
Очевидно, що ці рівняння є суперечливі і такі, що в сукупності не дають
розв’язків. Звідси випливає, що фазова траєкторія x(t ) , яка виходить з точки
1,0 і відповідає керуванню u t 1, 0 t T , через точку 0,0 також не
проходить.
1, 0 t ,
Випадок в). Маємо кусково-стале керування u (t ) із
1, t T
точкою перемикання ( 0 T ), яка разом із T підлягає визначенню.
Траєкторію x(t ) x1 (t ), x2 (t ) , 0 t T , що відповідає зазначеному керуванню,
знайдемо так само, як і раніше, з системи диференціальних рівнянь (5) за умов
(8) на лівому кінці. Спочатку знайдемо другу фазову координату x2 (t ) , 0 t T
шуканої траєкторії з другого рівняння (5):
1, 0 t , t С2 , 0 t ,
x2 t x2 t
1, t T t C2 , t T .
Для визначення сталої C 2 скористаємось відповідною граничною умовою (8):
x2 (0) C2 0 x2 t t , 0 t ,
а для визначення сталої C 2 умовою неперервності функції x2 (t ) у точці t :
x2 C2 C2 2 x2 t t 2, t T .
Отже, друга фазова координата шуканої траєкторії матиме вигляд
t, 0 t ,
x2 t (13)
t 2, t T .
Аналогічно знайдемо першу фазову координату x1 (t ) , 0 t T з першого
рівняння (5):
t2
C1 , 0 t ,
t, 0 t ,
x1 t x1 t 2 2
t 2, t T t 2t C , t T .
2 1
__________
Гарт Л.Л. 5
Для визначення сталої C1 скористаємось відповідною граничною умовою (8):
t2
x1 (0) C1 1 x1 t 1, 0 t ,
2
а для визначення C1 умовою неперервності функції x1 t у точці t :
2 2
x1 1 22 С1 С1 2 1 .
2 2
Отже, перша фазова координата шуканої траєкторії матиме вигляд
t2
1, 0 t ,
x1 t 2 2 (14)
2t 2 1, t T .
t
2
Як бачимо, функції керування u t у випадку в) відповідає траєкторія руху
x(t ) x1 (t ), x2 (t ) , 0 t T з фазовими координатами x1 t і x2 t , заданими
формулами (14) і (13) відповідно. Для відшукання кінцевого моменту часу T і
точки ( 0 T ) перемикання керування скористаємось умовами (9) на
правому кінці знайденої траєкторії:
T2
x1 T 2T 2 1 0 , x2 T T 2 0 .
2
Це система двох (нелінійних) алгебраїчних рівнянь відносно T і :
T2
2T 2 1 0, 2 4 1 0, 1,
2 2 2 2
2
T 2; T 2 ; T 2,
i, i ,
розв’язками якої є і . Очевидно, що отримані комплексні
T 2 i T 2 i
значення для і T суперечать фізичному сенсу задачі, оскільки час t є дійсна
змінна. Звідси випливає, що фазова траєкторія x(t ) x1 (t ), x2 (t ) вигляду (14),
1, 0 t ,
(13), яка виходить з точки 1,0 і відповідає керуванню u (t ) ,
1, t T
що змінює свій знак з «+» на «», через точку 0,0 також не проходить.
1, 0 t ,
Випадок г). Маємо кусково-стале керування u (t ) із
1, t T
точкою перемикання ( 0 T ), яка разом із T підлягає визначенню.
Відповідну траєкторію руху x(t ) x1 (t ), x2 (t ) , 0 t T знайдемо за тією
самою схемою, що й у випадку в). Спочатку знайдемо другу фазову координату
x2 (t ) , 0 t T шуканої траєкторії з другого рівняння (5):
1, 0 t , t С2 , 0 t ,
x2 t x2 t
1, t T t C2 , t T .
__________
Гарт Л.Л. 6
Для визначення C 2 скористаємось відповідною граничною умовою (8):
x2 (0) C2 0 x2 t t , 0 t ,
для визначення C 2 умовою неперервності функції x2 (t ) у точці t :
x2 C2 C2 2 .
Отже, друга фазова координата шуканої траєкторії матиме вигляд
t, 0 t ,
x2 t (15)
t 2 , t T .
Аналогічно знайдемо першу фазову координату x1 (t ) , 0 t T з першого
рівняння (5):
t2
C1 , 0 t ,
t, 0 t , 2
x1 t x1 t 2
t 2 , t T t 2t C , t T .
2
1
__________
Гарт Л.Л. 8