You are on page 1of 17

‫بسم اهلل الرّحمن الرّحيم‬

‫فصل ششم ‪ :‬طراحی کنترلگر ‪LQR, LQG‬‬

‫دکتر سيد کمال حسينی ثانی‬

‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬


‫سیستم زیر را در نظر بگیرید‪.‬‬ ‫‪‬‬

‫‪x(k + 1) = Ax(k) + Bu(k), x(𝑘0 ) = 𝑋0‬‬

‫که در آن 𝑛𝑅‪ x(k)є‬و 𝑚𝑅‪ u(k)є‬و )‪ (A, B‬کنترل پذیر‬

‫هدف ‪ :‬طراحی کنترلگر فیدبک حالت پایدارساز )‪ u(k) = −Kx(k‬که تابع هزینه زیر‬
‫مینیمایز سازد‪)𝑢∗ ( .‬‬

‫∞‪J=σ‬‬
‫))‪𝑘=0(𝑥 𝑘 𝑄 𝑥(k)+𝑢 (k)R𝑢(k‬‬
‫𝑇‬ ‫𝑇‬

‫و داریم ‪ 𝑄 = 𝑄𝑇 ≥ 0 :‬و ‪𝑅 = 𝑅𝑇 > 0‬‬


‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬
‫با فرض وجود کنترلگر فیدبک حالت بهینه )‪ x(k + 1) = (A − BK)x(k‬که‬ ‫‪‬‬
‫سیستم حلقه بسته را پایدار مجانبی سازد‪.‬‬
‫فرض فوق نتیجه وجود تابع لیاپونف زیر است ‪:‬‬ ‫‪‬‬

‫)𝑘(𝑥𝑃 𝑘 𝑇 𝑥 = ) ‪V(x k‬‬

‫بنابراین باید ‪ Δ V(x(k)) = V(x(k + 1)) − V(x(k)) :‬منفی معین باشد‪.‬‬


‫ثابت می شود که این کنترلگر بهینه بفرم زیر است ‪:‬‬

‫‪𝑚𝑖𝑛𝑢 (Δ𝑉(𝑥 𝑘 ) + 𝑥 𝑇 𝑘 𝑄𝑥(k)+𝑢𝑇 (k)R𝑢(k))=0‬‬

‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬


‫ابتدا کنترلگر ∗𝑢 را می یابیم که تابع زیر را می نیمم سازد‪.‬‬ ‫‪‬‬

‫𝑘 𝑢 𝑓=𝑓‬ ‫)‪= Δ𝑉(𝑥 𝑘 ) + 𝑥 𝑇 𝑘 𝑄𝑥(k)+𝑢𝑇 (k)R𝑢(k‬‬

‫با جایگزینی ‪ ΔV‬در رابطه فوق ‪:‬‬ ‫‪‬‬


‫𝑘 𝑥 𝑓‬
‫𝑘 𝑥𝑄 𝑘 𝑇 𝑥 ‪= 𝑥 𝑇 𝑘 + 1 𝑃𝑥 𝑘 + 1 − 𝑥 𝑇 𝑘 𝑃𝑥 𝑘 +‬‬
‫𝑘 𝑢𝑅 𝑘 𝑇𝑢 ‪+‬‬

‫𝑘 𝑢 𝑓‬
‫𝑇‬
‫𝑘 𝑢𝐵 ‪= 𝐴𝑥 𝑘 + 𝐵𝑢 𝑘 𝑃 𝐴𝑥 𝑘 +‬‬
‫)𝑘(𝑅)‪− 𝑥 𝑇 𝑘 𝑃𝑥 𝑘 +𝑥 𝑇 𝑘 𝑄𝑥 𝑘 +𝑢𝑇 (k‬‬
‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬
‫با گرفتن مشتق نسبت به ‪: u‬‬ ‫‪‬‬

‫ماتریس 𝑅 ‪ B𝑇 𝑃𝐵 +‬معین مثبت است و بنابراین معکوس پذیر‪:‬‬ ‫‪‬‬

‫و‬

‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬


‫با فرض ‪S = B𝑇 𝑃𝐵 + 𝑅 :‬‬ ‫‪‬‬

‫‪ ‬مشتق دوم ‪:‬‬

‫بنابراین ∗𝑢 تابع ‪ f‬را می نیمم می سازد‪.‬‬ ‫‪‬‬

‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬


‫‪ ‬انتخاب ‪:P‬‬
‫‪ 𝑢∗ ‬و فیدبک بهینه زیر‬
‫را در تابع ‪ f‬زیر قرار می دهیم ‪:‬‬

‫داریم ‪:‬‬ ‫‪‬‬

‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬


‫برای هر )‪ x(k‬باید برقرار باشد ‪:‬‬

‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬


‫فرض تابع هزینه بصورت زیر باشد‪.‬‬

‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬


‫بنابراین‪:‬‬

‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬


‫معادله ریکاتی‪:‬‬

‫بنابراین‪:‬‬

‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬


‫مورد کاربرد در کنترل بهینه سیستمهای خطی که شامل نویز گوسی سفید جمع شونده‬ ‫‪‬‬
‫است‪)linear systems disturbed by additive white Gaussian noise( .‬‬

‫‪ ‬پاسخ یکتا است و شامل قانون فیدبک دینامیکی خطی است‪.‬‬


‫‪ LQG ‬اساس کنترل بهینه برای سیستمهای غیرخطی است‪perturbed non-( .‬‬
‫‪.)linear systems‬‬
‫‪ LQG ‬ترکیبی از فیلتر کالمن (یا تخمین گر مربعی خطی ‪ )LQE‬و ‪ LQR‬می باشد‪.‬‬
‫‪ ‬قانون جدا از همی ( ‪ )separation principle‬گارانتی می کند که هر دو مستقل‬
‫قابل انجام هستند‪.‬‬
‫‪ ‬کاربرد ‪ LQG‬برای هم سیستمهای ‪ LTI‬و هم ‪LTV‬‬
‫‪ ‬کنترلگر ‪ LQG‬به اندازه فرآیند بعد اضافه می کند‪.‬‬

‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬


‫سیستم زیر را در نظر بگیرید‪.‬‬ ‫‪‬‬

‫فرض 𝑖𝑣 و 𝑖𝑤 نمایش فرایندهای تویز سفید گوسی با ماتریس کوواریانس 𝑖𝑉 و 𝑖𝑊‬ ‫‪‬‬
‫تابع هزینه‬ ‫‪‬‬

‫‪ ‬کنترلگر ‪LQG‬‬

‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬


‫بهره کالمن ‪:‬‬ ‫‪‬‬

‫که در آن 𝑖𝑃 از رابطه زیر بدست می آید‪.‬‬ ‫‪‬‬

‫ماتریس بهره فیدبک ‪:‬‬ ‫‪‬‬

‫‪ ‬که در آن 𝑖𝑆 از رابطه زیر (ریکاتی) بدست می آید‪.‬‬

‫اگر همه ماتریسها مستقل از زمان و افق ‪ N‬بینهایت باشد آنگاه ‪ LQG‬مسقل از زمان‬ ‫‪‬‬
‫است‪.‬‬
‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬
‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬
‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬
‫دکتر سيد کمال حسيني ثاني‬ ‫رياضي مهندسي پيشرفته‬

You might also like