You are on page 1of 5

ОСНОВИ ТЕОРІЇ ОПТИМАЛЬНОГО КЕРУВАННЯ

Постановка задачі оптимального керування системами,


описуваними звичайними диференціальними рівняннями
Задачі оптимального керування (ЗОК) поширені у різних сферах науки,
техніки та виробництва. До задач оптимального керування процесами,
описуваними системами звичайних диференціальних рівнянь (ЗДР), приводять,
наприклад, задачі механіки космічних польотів.
Розглянемо конкретну задачу оптимального керування.
Приклад ЗОК. Відомо, що рух центра мас космічного апарата і витрату
його маси описують за певних умов системою звичайних диференціальних
рівнянь
P(t )
r(t )  v(t ) , v(t )  g  F (t ) , G(t )   g q(t ) , 0  t  T , (1)
G (t )
де t – час руху ( 0  t  T ); r (t )   r 1 (t ), r2 (t ), r3 (t )  – радіус-вектор центра мас
космічного апарата; v(t )   v1 (t ), v2 (t ), v3 (t )  – швидкість центра мас; G (t ) –
поточна вага апарата; P(t )   P1 (t ), P2  t  , P3 (t )  – вектор тяги двигуна; q (t ) –
масова витрата робочої речовини (палива); g  const – коефіцієнт
пропорційності між масою і вагою ( g  9,8 Н/кг); F (t )   F1 (t ), F2 (t ), F3 (t )  –
вектор прискорення від гравітаційних сил.
Змінні r (t ), v(t ), G (t ) є шукані на відрізку [0, T ] ; їх називають змінними
стану або фазовими координатами космічного апарата. Припустимо, що в
початковий момент часу t  0 значення фазових координат відомі:
r (0)  r0 , v(0)  v0 , G(0)  G0 . (2)
Величини P(t ), q(t ) ( 0  t  T ) є керувальні для руху апарата. Якщо
задавати їх по-різному, можна отримати різні фазові траєкторії (розв’язки)
задачі (1), (2). Конструктивні можливості апарата і обмеженість паливних
ресурсів накладають певні обмеження на керування, наприклад:
Pmin  | P(t ) |  Pmax , qmin  q(t )  qmax , 0  t  T , (3)
де qmin , qmax , Pmin , Pmax – відомі невід’ємні сталі.
На фазові траєкторії х(t )   r (t ), v(t ), G (t )  , 0  t  T також можуть
накладатися деякі обмеження, сенс яких полягає в тому, наприклад, щоб вага
апарата G (t ) була не меншою за певну величину або траєкторія польоту
проходила поза визначеними зонами космічного простору (зонами підвищеної
радіації) і т. ін. У результаті виникають задачi вибору таких керувань P(t ), q(t )
з умови (3), щоб відповідні траєкторії системи (1), (2) задовольняли задані
обмеження (якщо вони є) і, крім того, щоб деякий цільовий функціонал досягав
свого мінімального або максимального значення.
У зазначеній постановці можна розглядати такі задачі:
__________
 Гарт Л.Л.
 потрапити у задану точку або область космічного простору за
мінімальний час;
 потрапити у задану точку або область простору у заданий момент часу
із заданою швидкістю і з найбільшою вагою апарата (або з мінімальною
затратою енергії);
 розвинути певну швидкість за мінімальний час.
Усі ці задачі являють собою частинні випадки наступної, більш загальної,
задачі оптимального керування.
Нехай деякий керований процес описано системою ЗДР
xi (t )  fi  x1 (t ), x2 (t ),, xn (t ); u1, u2 ,, ur ; t  , t0  t  T , i  1, n ,
або у векторній формі:
x(t )  f ( x(t ), u, t ) , t0  t  T , (1)
де x(t )  ( x1 (t ),, xn (t )) – шукана векторна функція на [t0 , T ] , яка характеризує
процес у кожен момент часу t ( t0  t  T ) і компоненти якої називають
фазовими координатами керованого об'єкта; u  (u1,, ur ) – шуканий вектор
параметрів керування, що визначають хід процесу;
f ( x(t ), u , t )   f1 ( x(t ), u , t ),, f n ( x(t ), u , t )  – відома векторна функція, яка описує
внутрішній устрій керованого об'єкта і враховує вплив різних зовнішніх
факторів; [t0 , T ] – проміжок змінення часу t , межі якого можуть бути
нефіксовані.
Для того щоб хід керованого процесу був визначений на деякому
проміжку t0  t  T , необхідно задати параметри керування як функції часу:
u  u (t )   u1 (t ),, ur (t )  , t0  t  T .
Означення. Керування u  u (t ) називатимемо допустимим, якщо його
координати ui (t ) , i  1, r є кусково-неперервні функції на [t0 , T ] і u (t ) належить
деякій області керувань V (t )  E r у кожний момент часу t [t0 ,T ] .
Множину всіх допустимих керувань позначатимемо через U :

U  u (t )  E r : u (t ) V (t ), t0  t  T ; u (t ) – кусково-неперервна на [t0 ,T ] . (2) 
Візьмемо деяку функцію керування u (t ) U , t0  t  T і підставимо в (1):
x(t )  f  x(t ), u (t ), t  , t0  t  T . (3)
Визначимо поняття розв’язку x(t ) диференціального рівняння (3), що
відповідає даному допустимому керуванню u (t ) U . Зафіксуємо t [t0 ,T ] і
проінтегруємо рівняння (3) на відрізку [t0 , t ] :
t t

x()d    f  x(), u(),   d  ,


t0 t0
t [t0 ,T ] .

Скориставшись у лівій частині формулою Ньютона-Лейбніца, матимемо вираз


t
x(t )   f  x(), u (),   d   x(t0 ) , t [t0 ,T ] . (4)
t0

__________
 Гарт Л.Л. 2
Співвідношення (4) являє собою інтегральне рівняння Вольтерри другого роду
відносно x(t ) , t0  t  T .
Під розв’язком диференціального рівняння (3) розумітимемо неперервний
розв’язок інтегрального рівняння (4). Можна показати, що, якщо функція
f ( x, u, t ) неперервна за сукупністю аргументів разом із частинною похідною
f
( x, u, t ) за x  E n , u (t ) V (t ) , t0  t  T , то існує єдиний розв’язок
x
диференціального рівняння (3) із заданими початковими умовами x(t0 )  х (0) .
Лема. Якщо функція u (t ) кусково-неперервна на відрізку [t0 , T ] , то
неперервний розв’язок x(t ) інтегрального рівняння (4) кусково-
диференційований на [t0 , T ] і в точках неперервності похідної x(t ) задовольняє
рівняння (3).
Означення. Побудований в означеному вище сенсі розв’язок x(t ) ,
t0  t  T рівняння (3) називають фазовою траєкторією керованого об'єкта,
що відповідає допустимому керуванню u (t ) U , і позначають через
x(t )  x(t , u (t )) , t0  t  T . Пару (u (t ), x(t )) , t0  t  T , де x(t ) – траєкторія, що
відповідає керуванню u (t ) , називають керованим процесом.
Означення. Точку x(t0 ) з E n називають лівим кінцем траєкторії, точку
x (Т ) з E n – правим кінцем траєкторії x(t )  x(t , u (t )) , t0  t  T .
Метою керування є переведення керованого об'єкта із початкового
положення x(t0 )  S0  E n у деяку множину S1  E n в момент часу T , тобто
x(T )  S1 . Для вибору із множини допустимих керувань (2) якнайкращого, або
оптимального, керування необхідно визначити критерій якості процесу, який
дозволяє порівняти різні способи керування й обрати оптимальний.
Критерій оптимальності J (u )  J (u, х) – це функціонал, визначений на
множині допустимих керованих процесів (u (t ), x(t )) , де u (t ) U – допустиме
керування, а x(t )  x(t , u (t )) – відповідна траєкторія. Оскільки функціонал J (u )
набуває числових значень, то кожному керованому процесу (u (t ), x(t ))
відповідає число, за яким і судять про якість керування.
Отже, нехай у просторі E n задано лінійні різноманіття S0 (t ) і S1 (t ) ,
t0  t  T початкових і кінцевих станів керованого об’єкту відповідно, а також
деяку множину G (t ) , t0  t  T , і нехай задано функціонал якості
T
J (u)   f0  x(t ), u(t ), t  dt  ( x(t0 ), x(T )) ,
t0

де f0 ( x, u, t ) – відома функція, неперервна за сукупністю аргументів разом із


f
частинною похідною 0 ( x, u , t ) за x(t )  G(t ), u(t ) U , t [t0 , T ] ; ( x(t0 ), x(T ))
x
– відома функція, неперервна за x(t0 )  G(t0 ) S0 (t0 ), x(T )  G(T ) S1 (T ) .

__________
 Гарт Л.Л. 3
Задача оптимального керування полягає у пошуку такого допустимого
керування u  u  (t ) U , щоб відповідна траєкторія х  x (t )  x(t , u  )
задовольняла умови x* (t0 )  S0 (t0 ) , x* (T )  S1 (T ) ; x* (t )  G (t ) , t0  t  T і
функціонал J (u ) досягав своєї точної нижньої грані:
J (u  )  inf J (u )  J  ,
uU

де нижню грань беруть за всіма u U , для яких відповідні траєкторії x(t , u )


визначені за t0  t  T і такі, що задовольняють умови x(t0 ,u)  S0 (t0 ) ,
x(T , u)  S1 (T ) ; x(t , u )  G (t ) , t0  t  T . Таке керування u  (t )  U називають
оптимальним, відповідну траєкторію x (t )  x(t , u  ) ,
t0  t  T також
вважають оптимальною, а пару (u  (t ), x (t )) , t0  t  T називають
оптимальним розв’язком розглядуваної задачі керування.
Зазначимо, що задачу відшукання верхньої грані функціонала J (u ) легко
звести до сформульованої задачі, оскільки sup J (u )   inf ( J (u )) .
uU uU

Відтак користуватимемося такою формальною постановкою задачі


оптимального керування.
Задача А. Знайти нижню грань функціонала
T
J (u)   f0  x(t ), u(t ), t  dt  ( x(t0 ), x(T )) (5)
t0

за умов:
x(t )  f  x(t ), u (t ), t  , t0  t  T ; (6)
x(t0 )  S0 (t0 ) , x(T )  S1 (T ) ; (7)
x(t )  G (t ) , t0  t  T ; (8)
u  u (t ) U  u (t ) : u (t ) V (t ), t0  t  T ; u (t ) кусково-непeрервна на [t0 ,T ] . (9)
Означення. Множину G (t ) , t0  t  T називають обмеженням на фазові
координати x(t )   x1 (t ), x2 (t ),, xn (t )  або просто фазовим обмеженням.
Якщо G (t )  E n за всіх t [t0 ,T ] , то задачу (5)–(9) називають задачею
оптимального керування без обмежень на фазові координати; у цьому разі
умову (8) у постановці задачі А не пишуть. Якщо ж G (t )  E n , то задачу (5)–(9)
називають задачею оптимального керування з обмеженнями на фазові
координати.
Множини S0 (t ), S1 (t ) , t0  t  T мають сенс початкових і кінцевих
положень керованого об'єкта. Якщо множина S0 (t ) (множина S1 (t ) ) не залежить
від часу і включає в себе лише одну точку S0 (t0 )  {x (0) } (відповідно
S1 (T )  {x (1) } ), то задачу оптимального керування (5)–(9) називають задачею із
закріпленим лівим (правим) кінцем траєкторії. Якщо множина S0 (t ) (множина
S1 (t ) ), t0  t  T збігається з усім простором E n , то маємо задачу з вільним
лівим (правим) кінцем траєкторії; у цьому разі умову x(t0 )  S0 (t0 )
__________
 Гарт Л.Л. 4
( x(T )  S1 (T ) ) в (7) не пишуть. Нарешті, якщо множина S0 (t ) (множина S1 (t ) ),
t0  t  T є деякий підпростір простору E n розмірності меншої або рівної n
(наприклад, гіперповерхня або крива в E n ), то задачу оптимального керування
(5)–(9) називають задачею з рухомим лівим (правим) кінцем.
У задачі оптимального керування (5)–(9) моменти часу t0 , T в загальному
випадку можуть бути нефіксованими. Тоді вони також залежать від керування
u (t ) і підлягають визначенню: проміжок [t0 , T ] включають в означення
допустимого керованого процесу і розглядають керовані процеси вигляду
(u(t ), x(t ), t0 , T ) , t0  t  T . Зокрема, якщо f0 ( x, u, t )  1, ( x(t0 ), x(T ))  0 , то
J (u)  T  t0 , і задачу А називають задачею швидкодії. Якщо ж моменти часу
t0 , T в задачі А відомі, то її називають задачею оптимального керування із
закріпленим часом.
Якщо f0 ( x, u, t )  f0 ( x, u) , f ( x, u, t )  f ( x, u ) і множини S0 (t ) , S1 (t ) , G (t )
не залежать від t , то задачу А називають автономною задачею оптимального
керування.

__________
 Гарт Л.Л. 5

You might also like