Professional Documents
Culture Documents
7 - Постановка ЗОК
7 - Постановка ЗОК
__________
Гарт Л.Л. 2
Співвідношення (4) являє собою інтегральне рівняння Вольтерри другого роду
відносно x(t ) , t0 t T .
Під розв’язком диференціального рівняння (3) розумітимемо неперервний
розв’язок інтегрального рівняння (4). Можна показати, що, якщо функція
f ( x, u, t ) неперервна за сукупністю аргументів разом із частинною похідною
f
( x, u, t ) за x E n , u (t ) V (t ) , t0 t T , то існує єдиний розв’язок
x
диференціального рівняння (3) із заданими початковими умовами x(t0 ) х (0) .
Лема. Якщо функція u (t ) кусково-неперервна на відрізку [t0 , T ] , то
неперервний розв’язок x(t ) інтегрального рівняння (4) кусково-
диференційований на [t0 , T ] і в точках неперервності похідної x(t ) задовольняє
рівняння (3).
Означення. Побудований в означеному вище сенсі розв’язок x(t ) ,
t0 t T рівняння (3) називають фазовою траєкторією керованого об'єкта,
що відповідає допустимому керуванню u (t ) U , і позначають через
x(t ) x(t , u (t )) , t0 t T . Пару (u (t ), x(t )) , t0 t T , де x(t ) – траєкторія, що
відповідає керуванню u (t ) , називають керованим процесом.
Означення. Точку x(t0 ) з E n називають лівим кінцем траєкторії, точку
x (Т ) з E n – правим кінцем траєкторії x(t ) x(t , u (t )) , t0 t T .
Метою керування є переведення керованого об'єкта із початкового
положення x(t0 ) S0 E n у деяку множину S1 E n в момент часу T , тобто
x(T ) S1 . Для вибору із множини допустимих керувань (2) якнайкращого, або
оптимального, керування необхідно визначити критерій якості процесу, який
дозволяє порівняти різні способи керування й обрати оптимальний.
Критерій оптимальності J (u ) J (u, х) – це функціонал, визначений на
множині допустимих керованих процесів (u (t ), x(t )) , де u (t ) U – допустиме
керування, а x(t ) x(t , u (t )) – відповідна траєкторія. Оскільки функціонал J (u )
набуває числових значень, то кожному керованому процесу (u (t ), x(t ))
відповідає число, за яким і судять про якість керування.
Отже, нехай у просторі E n задано лінійні різноманіття S0 (t ) і S1 (t ) ,
t0 t T початкових і кінцевих станів керованого об’єкту відповідно, а також
деяку множину G (t ) , t0 t T , і нехай задано функціонал якості
T
J (u) f0 x(t ), u(t ), t dt ( x(t0 ), x(T )) ,
t0
__________
Гарт Л.Л. 3
Задача оптимального керування полягає у пошуку такого допустимого
керування u u (t ) U , щоб відповідна траєкторія х x (t ) x(t , u )
задовольняла умови x* (t0 ) S0 (t0 ) , x* (T ) S1 (T ) ; x* (t ) G (t ) , t0 t T і
функціонал J (u ) досягав своєї точної нижньої грані:
J (u ) inf J (u ) J ,
uU
за умов:
x(t ) f x(t ), u (t ), t , t0 t T ; (6)
x(t0 ) S0 (t0 ) , x(T ) S1 (T ) ; (7)
x(t ) G (t ) , t0 t T ; (8)
u u (t ) U u (t ) : u (t ) V (t ), t0 t T ; u (t ) кусково-непeрервна на [t0 ,T ] . (9)
Означення. Множину G (t ) , t0 t T називають обмеженням на фазові
координати x(t ) x1 (t ), x2 (t ),, xn (t ) або просто фазовим обмеженням.
Якщо G (t ) E n за всіх t [t0 ,T ] , то задачу (5)–(9) називають задачею
оптимального керування без обмежень на фазові координати; у цьому разі
умову (8) у постановці задачі А не пишуть. Якщо ж G (t ) E n , то задачу (5)–(9)
називають задачею оптимального керування з обмеженнями на фазові
координати.
Множини S0 (t ), S1 (t ) , t0 t T мають сенс початкових і кінцевих
положень керованого об'єкта. Якщо множина S0 (t ) (множина S1 (t ) ) не залежить
від часу і включає в себе лише одну точку S0 (t0 ) {x (0) } (відповідно
S1 (T ) {x (1) } ), то задачу оптимального керування (5)–(9) називають задачею із
закріпленим лівим (правим) кінцем траєкторії. Якщо множина S0 (t ) (множина
S1 (t ) ), t0 t T збігається з усім простором E n , то маємо задачу з вільним
лівим (правим) кінцем траєкторії; у цьому разі умову x(t0 ) S0 (t0 )
__________
Гарт Л.Л. 4
( x(T ) S1 (T ) ) в (7) не пишуть. Нарешті, якщо множина S0 (t ) (множина S1 (t ) ),
t0 t T є деякий підпростір простору E n розмірності меншої або рівної n
(наприклад, гіперповерхня або крива в E n ), то задачу оптимального керування
(5)–(9) називають задачею з рухомим лівим (правим) кінцем.
У задачі оптимального керування (5)–(9) моменти часу t0 , T в загальному
випадку можуть бути нефіксованими. Тоді вони також залежать від керування
u (t ) і підлягають визначенню: проміжок [t0 , T ] включають в означення
допустимого керованого процесу і розглядають керовані процеси вигляду
(u(t ), x(t ), t0 , T ) , t0 t T . Зокрема, якщо f0 ( x, u, t ) 1, ( x(t0 ), x(T )) 0 , то
J (u) T t0 , і задачу А називають задачею швидкодії. Якщо ж моменти часу
t0 , T в задачі А відомі, то її називають задачею оптимального керування із
закріпленим часом.
Якщо f0 ( x, u, t ) f0 ( x, u) , f ( x, u, t ) f ( x, u ) і множини S0 (t ) , S1 (t ) , G (t )
не залежать від t , то задачу А називають автономною задачею оптимального
керування.
__________
Гарт Л.Л. 5