Professional Documents
Culture Documents
کنترل مدرن PDF
کنترل مدرن PDF
کنترل مدرن
مرجع
اصول کنترل مدرن ،تألیف دکتر علی خاکیصدیق ،انتشارات دانشگاه تهران
مقدمات
بارم بندی
کوییزها %10
میانترم %30
پایانترم %35
1
توضیحات تکمیلی:
پرسش و پاسخ کالسی شامل پرسش مستقیم یک سؤال از یک دانشجوی خاص و یا پاسخ به سؤال عمومی
برای شش جلسه غیبت به بعد ،مجوز حضور در امتحان پایانترم لغو میشود .برای دانشجویان بدون غیبت
کالسی و یا یک جلسه غیبت 0.5 ،نمره مثبت ،اضافه بر بارم حضور و غیاب منظور میشود.
تکالیف و حل تمرین ،شامل حل کامل و صحیح تمرینات منتخب هر فصل به همراه حضور فعال در کالس حل
در کنترل کالسیک ،تحلیل و طراحیها در حوزه فرکانس است حال آنکه در کنترل مدرن ،این کارها در
حوزه زمان انجام میشود .به بیان دیگر مدلها در کنترل کالسیک تابع تبدیل و در کنترل مدرن ،فضای
حالت است.
در کنترل کالسیک ،ابزار موجود برای ساختن سیگنال کنترلی فقط خروجی سیستم است ،اما در کنترل
مدرن حالتهای سیستم است .به دست آوردن حالتهای یک سیستم ،قابلیتی است که مدلسازی در
منظور از خروجیهای سیستم ،متغیرهایی است که توسط سنسورها اندازهگیری شدهاند ،حال آنکه منظور
مثالً در یک مخزن حاوی مخلوط دو ماده ،اگر از یک ترموکوپل استفاده کرده باشیم ،خروجی سیستم
دما است ،در حالیکه متغیرهای حالت آن فشار سیال ،غلظت (درصد جرمی) یک ماده ،دمای مخلوط و ...
است.
2
مثالً در یک سیستم سیلندر-پیستون هیدرولیکی اگر از یک پتانسیومتر استفاده کرده باشیم ،خروجی
سیستم موقعیت پیستون است ،در حالیکه متغیرهای حالت آن سرعت پیستون ،موقعیت پیستون ،اختالف
کنترل مدرن ،رسیدن به اهداف و الزامات از پیش تعیین شدهای را که توسط کنترل کالسیک غیرممکن
کنترل مدرن نسبت به کنترل کالسیک( ،معموالً) سادهتر به اهداف و الزامات کنترلی از پیش تعیینشده
میرسد.
مثال .با استفاده از فیدبک خروجی ،کنترلکننده پایدارسازی برای سیستم زیر طراحی نمایید.
)𝑠(𝑦 1
= 2
𝑢(𝑠) 𝑠 − 2𝑠 + 2
حل .فرض کنید در گام اولکنترلکننده را به صورت زیر انتخاب کنیم:
𝑦𝑘 𝑢 = 𝑟 −
با اعمال این ورودی کنترل به سیستم خواهیم داشت:
𝑦 1
⟹ 𝑦𝑘 (𝑠 2 − 2𝑠 + 2)𝑦 = 𝑟 − = 2
)𝑟 𝑠 − 2𝑠 + (𝑘 + 2
مشاهده میشود که به ازای هیچ مقداری از 𝑘 سیستم حلقهبسته پایدار نخواهد بود.
تفاوت ظریف را در اینجا ذکر میکنیم .در کنترل کالسیک فرض بر آن است که صرفاً اطالعات مربوط به 𝑦 از طریق
سنسور مربوطه در دسترس است و لذا برای پیادهسازی کنترلکننده گام دوم ،الزم است مشتق 𝑦 را نیز محاسبه کنیم .نویز
فرکانس باالی ناشی از سنسور که در اطالعات 𝑦 موجود است ،باعث میشود که هنگام مشتق گرفتن از 𝑦 ،یک سیگنال با
3
دامنه و فرکانس باال در آن ظاهر شود که مستقیماً در سیگنال کنترلی ظاهر شده و لذا در ورودی عملگر سیستم کنترل
ظاهر خواهد شد که نتیجه آن استهالک عملگر است و لذا استفاده از چنین رویه و سیگنال کنترلی در عمل به هیچ وجه
توصیه نمیشود.
در کنترل مدرن فرض بر آن است که اطالعات مربوط به ̇𝑦 نیز از طریق سنسور مربوطه یا یک روش تخمینی ،در دسترس
است و بنابراین مشکل حالت قبل در مورد پیادهسازی قانون کنترل مورد نظر وجود نخواهد داشت.
البته کنترل کالسیک در مورد این مسأله ،ناتوان نیست .برای تضعیف اثر نویز از یک فیلتر پایینگذر در خروجی ̇𝑦 استفاده
بنابراین ،اگرچه امکان پایدارسازی با کنترل کالسیک امکانپذیر است ،اما نسبت به کنترل مدرن مسیر دشوارتری
طی میشود.
مثال .با استفاده از فیدبک خروجی ،کنترلکنندهای برای سیستم زیر طراحی نمایید که سیستم حلقهبسته مرتبه دو
√2
= ζو .𝜔𝑛 = √2 استاندارد بوده و در آن
2
)𝑠(𝑦 1
= 2
𝑢(𝑠) 𝑠 + 𝑠 + 1
حل .باید داشته باشیم:
)𝑠(𝑦 2
= 2 𝑟⟹ (𝑠 2 + 2𝑠 + 2)𝑦 = 2𝑟 ⟹ (𝑠 2 + 𝑠 + 1)𝑦 + (𝑠 + 1)𝑦 = 2
𝑟(𝑠) 𝑠 + 2𝑠 + 2
𝑦𝑠 ⟹ 𝑢 = 2𝑟 − 𝑦 −
واضح است که پیادهسازی چنین ساختاری از طریق فیدبک خروجی منجر به استهالک عملگر سیستم کنترل شده و قابل
توصیه نیست .اما همانطور که قبالً گفته شد ،پیادهسازی این ساختار با کنترل مدرن مقدور است.
4
مشاهده میکنید که در این مسأله خاص ،رسیدن به هدف تعیین شده توسط کنترل کالسیک غیرممکن است.
در مورد مزایای کنترل مدرن صحبت شد .علت کارکرد بهتر کنترل مدرن چیست؟
اگر توجه کرده باشید ،این قابلیت به واسطه اضافه شدن ورودیهای سیستم کنترل به وجود آمده است .در کنترل کالسیک،
ورودیهای کنترلکننده ،خروجی سیستم تحت کنترل است در حالیکه در کنترل مدرن ،ورودیهای کنترلکننده ،حالتهای
به بیان دیگر ،در کنترل مدرن یا تعداد سنسورها اضافه میشود یا مکانیزمی برای تخمین حالتهای سیستم استفاده میشود
که در هر دو حالت به وضوح ورودیهای سیستم کنترل در قیاس با کنترل کالسیک ،افزایش یافته است و لذا قابلیت باالتر
5
فصل اول :مقدمات جبرخطی
میدان
مجموعهی 𝐹 از اسکالرها به همراه دو عمل جمع و ضرب میدان نامیده میشود اگر:
مثال .کدامیک از مجموعههای زیر با اعمال جمع و ضرب معمولی تشکیل میدان میدهد؟
6
.3مجموعه اعداد صحیح
فضای برداری
.3یک قاعده به نام جمع برداری ،به طوریکه به ازای هر αو βعضو 𝑉:
𝑉∈ 𝛽𝛼+
و:
د .به ازای هر 𝛼 عضو 𝑉 بردار یکتای 𝛼 −در 𝑉 وجود داشته باشد به طوریکهα + (−α) = 0 :
.4یک قاعده به نام ضرب اسکالری که به ازای هر اسکالر 𝑐 از میدان 𝐹 و هر بردار αاز 𝑉:
𝑉 ∈ 𝛼𝑐
و:
الف1α = α .
ب .به ازای هر اسکالر 𝑐1و 𝑐2از میدان 𝐹(𝑐1 𝑐2)𝛼 = 𝑐1 (𝑐2 𝛼) :
مثال .کدامیک از مجموعههای زیر یک فضای برداری است؟ (وقتی از میدان صحبتی نشده ،منظور میدان
اعداد حقیقی است و وقتی به جمع و ضرب خاصی اشاره نشده ،منظور جمع و ضرب معمولی است)
7
.1مجموعه 𝑛تاییهای 𝑛ℝ
قضیه :یک زیرمجموعه غیرتهی 𝑊 از فضای برداری 𝑉 ،زیرفضایی از 𝑉 است اگر و تنها اگر به ازای هر αو
.2مجموعه سهتاییهای ℝ3به صورت ) (𝑥1 , 𝑥2 , 𝑥3با شرط 𝑥1 = 0و 𝑥2 = 𝑥3 + 2
اگر 𝑛 ،𝑣𝑛 ،...،𝑣1بردار باشند ،کلیه ترکیبات خطی آنها تشکیل یک فضا میدهند.
استقالل خطی :یک مجموعه از بردارهای 𝑣𝑛 ،...،𝑣1مستقل خطی گفته میشود اگر از تساوی
پایه فضای برداری :فرض کنید 𝑉 یک فضای برداری باشد .یک پایه برای 𝑉 ،یک زیرمجموعه مستقل خطی از 𝑉
تذکر :منظور از پدیدآوردن ،آن است که هر عضو 𝑉 به صورت ترکیب خطی اعضای 𝐵 قابل بیان باشد.
8
قضیه :فرض کنید 𝑉 فضای برداری پدیدآمده توسط مجموعه بردارهای ،𝛽2 ،𝛽1تا 𝑚𝛽 باشد .در این صورت ،هر
نتیجه :اگر 𝑉 یک فضای برداری باشد ،هر دو پایه از 𝑉 به تعداد مساوی عضو دارند.
تخصیص بعد به فضای برداری :به تعداد اعضای پایه یک فضای برداری ،بعد آن فضا گفته میشود.
تذکر :پایه برای } {0مجموعه } { است و لذا بعد این فضای برداری ،صفر است.
قضیه :مجموعه 𝑚 بردار مستقل از فضایی با بعد 𝑛 ،بخشی از یک پایه برای آن فضاست.
نتیجه :مجموعه 𝑛 بردار مستقل از فضایی با بعد 𝑛 ،یک پایه برای آن فضاست.
پایه مرتب :به پایهای برای فضای برداری 𝑉 گفته میشود که در آن ترتیب عناصر مهم است.
اگر αیک بردار دلخواه از فضای𝑉 باشد و } 𝑛𝑣 𝐵 = {𝑣1 , … ,یک پایه مرتب برای این فضا باشد .بدیهی
9
تبدیل خطی
فرض کنید 𝑉 و 𝑊 دو فضای برداری روی میدان 𝐹 باشند .یک تبدیل خطی از 𝑉 به 𝑊 ،تابعی است از 𝑉 به 𝑊
این به بعد مفاهیم مربوط به تبدیل 𝑇 به ماتریس 𝐴 نسبت داده میشود .پس به جای )𝑋(𝑇 خواهیم گفت )𝑋(𝐴 که
زیرفضای سطری و ستونی یک ماتریس :به زیرفضای پدیدآمده توسط سطرهای ماتریس 𝐴 (ستونهای ماتریس
𝐴) زیرفضای سطری ماتریس 𝐴 گفته میشود .در حقیقت ،زیرفضای سطری یک ماتریس ،مجموعه کلیه ترکیبات
زیرفضای ستونی یک ماتریس مانند 𝐴 ،همان فضای تصویر ماتریس 𝐴 است.
10
همانطور که مشاهده میکنید تصویر ماتریس ،تمامی ترکیبات خطی ستونهای آن ماتریس یا همان زیرفضای ستونی آن
ماتریس است.
.1شرط (الزم و کافی) وجود همیشگی جواب برای دستگاه معادالت فوق آن است که 𝑚𝑅 = )𝐴(𝑚𝐼 یعنی تصویر
.2شرط (الزم و کافی) یکتایی جواب (در صورت وجود) دستگاه معادالت فوق آن است که }.𝐾𝑒𝑟(𝐴) = {0
اثبات مورد دوم .فرض نمایید } .𝐾𝑒𝑟(𝐴) = {0نشان میدهیم ،جواب معادله فوق ،یکتاست.
پس:
𝑦 = 𝑥𝐴
𝑦 = ∋ 𝑥1 ≠ 𝑥2 : {𝐴𝑥1 ⟹ 𝐴(𝑥1 − 𝑥2 ) = 0 ⟹ 𝑥1 − 𝑥2 ∈ 𝐾𝑒𝑟(𝐴) ⟹ 𝑥1 − 𝑥2 = 0
2
⟹ 𝑥1 = 𝑥2
که این تناقض است با .𝑥1 ≠ 𝑥2
حال فرض نمایید ،جواب دستگاه معادله فوق یکتاست .نشان میدهیم }𝐾𝑒𝑟(𝐴) = {0
پس:
11
بنابراین 𝑥 ′ + 𝑥1 ،جواب دیگری برای دستگاه معادله 𝑦 = 𝑥𝐴 است که این تناقض است با فرض یکتایی جواب دستگاه.
رتبه یک ماتریس و ارتباط بین دترمینان با بعد فضای پوچساز و فضای تصویر
در یک ماتریس 𝑛×𝑚𝐴 ،تعداد سطرهای مستقل با تعداد ستونهای مستقل برابر است.
رتبه یک ماتریس :به تعداد سطرهای (ستونهای) مستقل یک ماتریس ،رتبه آن ماتریس گفته میشود .رتبه یک
ماتریس رتبه کامل ( :)Full Rankبه ماتریس 𝑛×𝑚𝐴 Full Rank ،گفته میشود ،اگر بعد فضای سطری
میدانید که در مورد ماتریس مربعی 𝑛×𝑛𝐴 ،نتیجه Full Rankبودن ،آن است که 𝑑𝑒𝑡(𝐴) ≠ 0و بالعکس .در
تذکر :به بعد فضای پوچ ماتریس 𝐴 ،پوچی نیز گفته میشود.
به بردار ،𝑣 ≠ 0یک بردار ویژه برای ماتریس مربعی 𝐴 گفته میشود ،اگر نگاشت این بردار تحت ماتریس 𝐴 با
12
)∗( 𝑣𝜆 = 𝑣𝐴
در این صورت ،به ضریب توازی در رابطه فوق یعنی 𝜆 ،مقدار ویژه ماتریس 𝐴 (متناظر با بردار ویژه 𝑣) گفته میشود.
محاسبه همزمان 𝑣 و 𝜆 از رابطه (*) کمی مشکل است .روشی برای یافتن جداگانه این دو پارمتر ارائه میکنیم.
همانطور که از رابطه ( )1پیداست ،برای یافتن مقدار(های) ویژه ماتریس 𝐴 کافی است معادله 𝑑𝑒𝑡(𝐴 − 𝜆𝐼) = 0بر
حسب 𝜆 حل گردد.
واضح است که عبارت )𝐼𝜆 𝑑𝑒𝑡(𝐴 −بر حسب 𝜆 یک چندجملهای از درجه 𝑛 است که 𝑛 همان ابعاد ماتریس 𝐴 است.
بنابراین ،میتوان نتیجه گرفت که تعداد مقادیر ویژه یک ماتریس 𝑛 × 𝑛 ،برابر 𝑛 است.
گام دوم :حال که مقادیر ویژه ماتریس 𝐴 محاسبه شدند ،با جایگذاری هر یک از این مقادیر در رابطه (*) ،بردار ویژه متناظر
تذکر :موقع یافتن بردار ویژه 𝑣 متناظر با مقدار ویژه 𝜆 ،در حقیقت دستگاه معادله (𝐴 − 𝜆𝐼)𝑣 = 0را حل میکنیم .طبق
آنچه قبالً گفتهایم ،جواب این دستگاه یکتا نیست .به بیان دیگر ،متناظر با هر مقدار ویژه 𝜆 ،یک مجموعه جواب برای 𝑣
وجود خواهد داشت که همان )𝐼𝜆 𝑁(𝐴 −است( .البته به غیر از .)𝑣 = 0بنابراین جواب این دستگاه همواره به صورت
با توجه به آنکه مشخص شد متناظر با هر مقدار ویژه ،مجموعهای که خود یک فضای برداری است به عنوان
بردار ویژه موجود است ،از 𝑣 با نام فضای ویژه متناظر با مقدار ویژه 𝜆 نیز یاد میشود.
13
𝜆−3 −1 1
det(𝜆𝐼 − 𝐴) = | −2 𝜆−2 1| = (𝜆 − 1)(𝜆 − 2)2
−2 −2 𝜆
پس مقادیر ویژه این ماتریس ،عبارتند از:
𝜆1 = 1 , 𝜆2,3 = 2
محاسبه فضای ویژه متناظر با مقدار ویژه :𝜆1
2 1 −1 0 0 0 𝑣1
(𝐴 − 𝐼)𝑣 = 0 ⟹ [2 1 −1] 𝑣 = 0 ⟹ [2 1 −1] [𝑣2 ] = 0 ⟹ 𝑣2 = 0, 𝑣3 = 2𝑣1
2 2 −1 0 1 0 𝑣3
𝑣1
یعنی ،مجموعه جواب عبارت است از [ 0 ] :یا
2𝑣1
1
}]𝑣𝜆1 = 𝑠𝑝𝑎𝑛 {[0
2
محاسبه فضای ویژه متناظر با مقدار ویژه :𝜆2
1 1 −1 1 1 −1 𝑣𝑣 = 2
(𝐴 − 2𝐼)𝑣 = 0 ⟹ [2 0 −1] 𝑣 = 0 ⟹ [2 0 −1] 𝑣 = 0 ⟹ { 𝑣3 = 𝑣 1
2 1
2 2 −2 0 0 0
𝑣1
یعنی ،مجموعه جواب عبارت است از [ 𝑣1 ] :یا
2𝑣1
1
𝑣𝜆2 }]= 𝑠𝑝𝑎𝑛 {[1
2
مثال .مقادیر ویژه و فضاهای ویژه ماتریس زیر را تعیین نمایید.
5 −6 −6
𝐴 = [−1 4 ]2
3 −6 −4
14
محاسبه فضای ویژه متناظر با مقدار ویژه :𝜆2
2 2
(𝐴 − 2𝐼)𝑣 = 0 ⟹ 𝑣𝜆2 }]= 𝑠𝑝𝑎𝑛 {[1] , [0
0 1
ماتریس و دترمینان
چند رابطه مهم و کاربردی مربوط به ماتریس و دترمینان در ادامه ذکر شده است.
15
فصل دوم :نمايش سیستمهای خطی
مدل تابع تبدیل یک توصیف خارجی و مدل فضای حالت یک توصیف داخلی از رفتار سیستم ارائه مینمایند.
.1مدلسازی سیستمهای غیرخطی و تغییرپذیر با زمان به سادگی به وسیله آن قابل انجام است.
.2اتفاقات درونی سیستم و چگونگی تداخل متغیرها با استفاده از آن قابل نمایش است .عدم وجود این ویژگی در تابع
تبدیل ،باعث میشود که بخشی از زیرفضاهای یک سیستم در تابع تبدیل ظاهر نشده و لذا ،مدل تابع تبدیل
.3شرایط اولیه در مدلسازی سیستم لحاظ میشود .عدم وجود این ویژگی در مدل تابع تبدیل ،خود باعث ناقص
در حالت کلی ،مدل فضای حالت یک سیستم میتواند به صورت زیر نمایش داده شود:
)𝑡 𝑥̇ = 𝑓(𝑥(𝑡), 𝑢(𝑡),
که در آن 𝑡 متغیر زمان 𝑥 ،بردار حالت با بعد 𝑛 𝑢 ،بردار ورودی کنترل با بعد 𝑚 ،و 𝑓 نیز یک تابع غیرخطی توصیف کننده
حال فرض کنید 𝑦 متغیر دلخواهی با بعد 𝑙 از این سیستم باشد( .مثالً متغیری که توسط سنسور اندازهگیری شده است) .در
این صورت:
)𝑡 𝑦 = 𝑔(𝑥(𝑡), 𝑢(𝑡),
𝑔 یک تابع غیرخطی توصیف کننده خروجی سیستم است .به معادله فوق ،معادله خروجی سیستم میگویند.
16
در مورد یک سیستم خطی ،معادالت سیستم به صورت زیر در میآید:
)𝑡(𝑢)𝑡(𝐵 𝑥̇ = 𝐴(𝑡)𝑥(𝑡) +
)𝑡(𝑢)𝑡(𝐷 𝑦(𝑡) = 𝐶(𝑡)𝑥(𝑡) +
که در آن 𝐴 ماتریس حالت 𝐵 ،ماتریس ورودی 𝐶 ،ماتریس خروجی و 𝐷 ماتریس ارتباط مستقیم نامیده میشوند.
در مورد یک سیستم خطی تغییرناپذیر با زمان ،معادالت سیستم به صورت زیر در میآید:
)𝑡(𝑢𝐵 𝑥̇ = 𝐴𝑥(𝑡) +
)𝑡(𝑢𝐷 𝑦(𝑡) = 𝐶𝑥(𝑡) +
اگرچه دینامیک حاکم بر اکثر سیستمهای صنعتی و واقعی غیرخطی است ،اما با توجه به پیچیدگی تحلیل و
همینطور طراحی کنترلکننده برای سیستمهای غیرخطی ،معموالً تالش میشود تا با مشخص کردن یک نقطه
کار مناسب ،رفتار سیستم غیرخطی در حوالی آن نقطه با یک سیستم خطی تقریب زده شود ،تا فرایند تحلیل آن
سیستم و همچنین طراحی کنترلکننده برای آن ساده گردد .نتایج تجربی حاصل از این کار نیز نشان از موفقیت
یعنی:
⋯ 𝑓(𝑥) = 𝑓(𝑥0 ) + 𝑓 ′ (𝑥0 )(𝑥 − 𝑥0 ) +
به 𝑥0نقطه کار گفته میشود.
میتوان گفت:
) 𝑓(𝑥) ≈ 𝑓(𝑥0 ) + 𝑓 ′ (𝑥0 )(𝑥 − 𝑥0 )∗(
17
البته واضح است که تقریب فوق هر چقدر 𝑥 به 𝑥0نزدیکتر باشد ،دقیقتر است.
مشاهده میکنید که رابطه (*) ،یک تقریب خطی برای تابع )𝑥(𝑓 ارائه میدهد و دقت آن نیز زمانی که 𝑥 به 𝑥0نزدیک
باشد ،قابل قبول است .همین موضوع ،ایده خطیسازی یک سیستم با استفاده از بسط تیلور است.
با فرض آنکه رفتار این سیستم حوالی ) (𝒙0 , 𝒖0باشد ،یعنی:
𝑥 = 𝑥0 + 𝛿𝑥 , 𝑢𝛿 𝑢 = 𝑢0 +
𝜕𝑓1 𝜕𝑓1
𝑥1̇ (0) + 𝛿𝑥̇ 1 = 𝑓1 (𝑥0 , 𝑢0 ) + | 𝛿𝑥1 + | 𝛿𝑥 + ⋯ +
) 𝜕𝑥1 (𝑥, 𝑢) = (𝑥0 , 𝑢0 𝜕𝑥2 (𝑥, 𝑢) = (𝑥0 , 𝑢0 ) 2
𝜕𝑓1
| 𝑢𝛿
𝑚 ) 𝜕𝑢𝑚 (𝑥, 𝑢) = (𝑥0 , 𝑢0
و:
𝜕𝑓2 𝜕𝑓2
𝑥2̇ (0) + 𝛿𝑥̇ 2 = 𝑓2 (𝑥0 , 𝑢0 ) + | 𝛿𝑥1 + | 𝛿𝑥 + ⋯ +
) 𝜕𝑥1 (𝑥, 𝑢) = (𝑥0 , 𝑢0 𝜕𝑥2 (𝑥, 𝑢) = (𝑥0 , 𝑢0 ) 2
18
𝜕𝑓2 𝜕𝑓2 𝜕𝑓2
| 𝛿𝑥𝑛 + | 𝛿𝑢1 + | ⋯ 𝛿𝑢 +
) 𝜕𝑥𝑛 (𝑥, 𝑢) = (𝑥0 , 𝑢0 ) 𝜕𝑢1 (𝑥, 𝑢) = (𝑥0 , 𝑢0 𝜕𝑢2 (𝑥, 𝑢) = (𝑥0 , 𝑢0 ) 2
𝜕𝑓2
| 𝑢𝛿
𝑚 ) 𝜕𝑢𝑚 (𝑥, 𝑢) = (𝑥0 , 𝑢0
𝑛𝑓𝜕 𝑛𝑓𝜕
𝑥𝑛̇ (0) + 𝛿𝑥̇ 𝑛 = 𝑓𝑛 (𝑥0 , 𝑢0 ) + | 𝛿𝑥1 + | 𝛿𝑥 + ⋯ +
) 𝜕𝑥1 (𝑥, 𝑢) = (𝑥0 , 𝑢0 𝜕𝑥2 (𝑥, 𝑢) = (𝑥0 , 𝑢0 ) 2
𝑛𝑓𝜕
| 𝑢𝛿
𝑚 ) 𝜕𝑢𝑚 (𝑥, 𝑢) = (𝑥0 , 𝑢0
یا:
19
𝜕𝑓1 𝜕𝑓1 𝜕𝑓1 𝜕𝑓1 𝜕𝑓1 𝜕𝑓1
… …
𝜕𝑥1 𝜕𝑥2 𝑛𝑥𝜕 𝜕𝑢1 𝜕𝑢2 𝑚𝑢𝜕
𝜕𝑓2 𝜕𝑓2
. . . . . .
𝜕𝑥1 𝜕𝑢1
𝐴= . . . . , 𝐵= . . . .
. . . . . . . .
. . . . . . . .
𝑛𝑓𝜕 𝑛𝑓𝜕 𝑛𝑓𝜕 𝑛𝑓𝜕
. . . .
[𝜕𝑥1 𝒙(=)𝒖𝜕𝑥𝑛 ](𝒙, [𝜕𝑢1 𝒙(=)𝒖𝜕𝑢𝑚 ](𝒙,
) 𝟎𝒖𝟎 , ) 𝟎𝒖𝟎 ,
به همین ترتیب با استفاده از بسط تیلور در رابطه ( )2در نهایت خواهیم داشت:
که در آن:
𝜕𝑔1 𝜕𝑔1 𝜕𝑔1 𝜕𝑔1 𝜕𝑔1 𝜕𝑔1
… …
𝜕𝑥1 𝜕𝑥2 𝑛𝑥𝜕 𝜕𝑢1 𝜕𝑢2 𝑚𝑢𝜕
𝜕𝑔2 𝜕𝑔2
. . . . . .
𝜕𝑥1 𝜕𝑢1
𝐶= . . . . , 𝐷= . . . .
. . . . . . . .
. . . . . . . .
𝑙𝑔𝜕 𝑙𝑔𝜕 𝑙𝑔𝜕 𝑙𝑔𝜕
. . . .
[ 𝜕𝑥1 𝒙(=)𝒖𝜕𝑥𝑛 ](𝒙, [𝜕𝑢1 𝒙(=)𝒖𝜕𝑢𝑚 ](𝒙,
) 𝟎𝒖𝟎 , ) 𝟎𝒖𝟎 ,
تذکر .رابطه (*) به دلیل وجود ) ، 𝑓(𝑥0 , 𝑢0شرط خطی بودن را نقض مینماید .البته اگر 𝑥0و 𝑢0طوری انتخاب شوند که
) 𝑓(𝑥0 , 𝑢0برابر صفر باشد ،مشکل برطرف میشود .میدانید که نقطهای با این شرط ،همان نقطه تعادل سیستم است.
𝑥̇ 2 = 𝑥2 − 𝑢1 + 𝑥1 𝑒 −𝑥2
20
به سادگی خواهیم داشت:
𝜕𝑓1 𝜕𝑓1
𝜕𝑥1 𝜕𝑥2 2𝑥1 ) −3cos(𝑥2 0 −3
=𝐴 [= ] −𝑥2 [= ]
𝜕𝑓2 𝜕𝑓2 𝑒−𝑥2 𝑒 1 − 𝑥1 𝑥2 )𝟎(𝒙,𝒖)=(𝟎, 1 1
[𝜕𝑥1 )𝟎𝜕𝑥2 ](𝒙,𝒖)=(𝟎,
𝜕𝑓1 𝜕𝑓1
𝜕𝑢1 𝜕𝑢2 2 0 −1
=𝐵 = [3𝑢1 −1
] [= ]
𝜕𝑓2 𝜕𝑓2 −1 )𝟎0 (𝒙,𝒖)=(𝟎, −1 0
[𝜕𝑢1 )𝟎𝜕𝑢2 ](𝒙,𝒖)=(𝟎,
پس:
متغیرهای حالت ،متغیرهایی (معموالً مستقل) هستند که دینامیک سیستم بر حسب مشتق مرتبه اول آنها به فرم
مجموعه متغیرهای حالت برای توصیف داخلی یک سیستم ،منحصر به فرد نیست.
یک روش ،جهت اطمینان از صحت انتخاب متغیرهای حالت ،استفاده از متغیرهای فیزیکی مربوط به عناصر نگه-
مثالً در حوزه مدارهای الکتریکی،خازن و سلف به عنوان عناصر نگهدارنده انرژی و متغیرهای فیزیکی مربوطه
یعنی ولتاژ خازن و جریان سلف میتوانند به عنوان متغیر حالت انتخاب شوند.
مثالً در حوزه مکانیکی ،جرم ،ممان اینرسی و فنر به عنوان عناصر نگهدارنده انرژی تعمیمیافته و متغیرهای
فیزیکی مربوطه یعنی سرعت انتقالی ،سرعت چرخشی و جابجایی میتوانند به عنوان متغیر حالت انتخاب شوند.
21
مدل حالت مینیمال ،مدلی است که در آن تنها از متغیرهای حالت مستقل استفاده شده است .در غیر این صورت،
در مورد مدار الکتریکی زیر با انتخاب متغیرهای فیزیکی به عنوان متغیر حالت ،معادالت حالت مدار را بنویسید.
حل .متغیرهای حالت فیزیکی عبارتند از جریان سلفهای 1و 2و ولتاژ خازن .پس:
𝑣
𝑒1
] 𝑒[ = 𝑢 𝑥 = [𝑖1 ] ,
2
𝑖2
22
1 1
0 0 0
𝐶 𝐶 1
1 𝑅1 0
𝒙̇ = − − 0 𝒙 + 𝐿1 𝒖
𝐿1 𝐿1 1
1 0
− 0 0 [ ] 𝐿2
[ 𝐿2 ]
سؤال :آیا میتوان متغیرهای حالت را جریان خازن ،ولتاژ خازن و ولتاژ مقاومت انتخاب کرد؟ چرا؟
سؤال :آیا میتوان متغیرهای حالت را جریان خازن ،ولتاژ سلف اول و جریان سلف دوم انتخاب کرد؟ چرا؟
با فرض شرایط اولیه ) ،𝑥(0معادله حالت ورودی صفر به صورت زیر خواهد بود:
𝑥𝐴 = ̇𝑥
مشابه حالت اسکالر ،پاسخ این معادله دیفرانسیل برابر است با:
)𝑥(𝑡) = 𝑒 𝐴𝑡 𝑥(0
ماتریس انتقال حالت ،ماتریسی است که حالت سیستم را از لحظه 𝑡0به لحظه 𝑡 میبرد و با )𝑡 Φ(𝑡0 ,نمایش
داده میشود .با توجه به این تعریف ،ماتریس انتقال حالت یک سیستم خطی تغییرناپذیر با زمان (بدون ورودی)،
) Φ(𝑡0 , 𝑡) = 𝑒 𝐴(𝑡−𝑡0
که با توجه به بسط تیلور آن ،خود یک ماتریس مربعی با ابعاد ماتریس 𝐴 است.
23
Φ−1 (𝑡) = Φ(−𝑡) .2
Φ(0) = 𝐼 .3
با فرض شرایط اولیه ) ،𝑥(0معادله حالت به صورت زیر خواهد بود:
با استفاده از تبدیل الپالس طرفین ،این معادله را به صورت زیر حل میکنیم:
)𝑠(𝑈𝐵 𝑠𝑋(𝑠) − 𝑥(0) = 𝐴𝑋(𝑠) + 𝐵𝑈(𝑠) ⟹ 𝑋(𝑠) = (𝑠𝐼 − 𝐴)−1 𝑥(0) + (𝑠𝐼 − 𝐴)−1
} 𝑒 𝐴𝑡 = ℒ −1 {(𝑠𝐼 − 𝐴)−1
از طرفی:
که در آن:
24
𝑡
𝜏𝑑 )𝜏(𝑢𝐵 )𝜏𝑥(𝑡) = 𝑒 𝑥(0) + ∫ 𝑒 𝐴(𝑡−
𝑡𝐴
0
حال ،محاسبه خروجی سیستم خطی تغییرناپذیر با زمان نیز امکانپذیر بوده و عبارت خواهد بود از:
𝑡
)𝑡(𝑢𝐷 𝑦(𝑡) = 𝐶𝑥(𝑡) + 𝐷𝑢(𝑡) = 𝐶𝑒 𝑥(0) + 𝐶 ∫ 𝑒 𝐴(𝑡−𝜏) 𝐵𝑢(𝜏) 𝑑𝜏 +
𝑡𝐴
0
نکته :در حین حل معادالت حالت ،یک روش برای محاسبه ماتریس انتقال حالت نیز به دست آمد .دیدیم:
} 𝑒 𝐴𝑡 = ℒ −1 {(𝑠𝐼 − 𝐴)−1
25
تبدیل همانندی
فرض نمایید ،بعد از انتخاب یک مجموعه متغیر حالت به نام 𝑥 و استخراج معادالت حالت و خروجی به فرم
𝑢𝐷 𝑦 = 𝐶𝑥 +
از یک تغییر متغیر به فرم 𝑥𝑇 = 𝑧 استفاده کنیم که در آن 𝑇 مربعی و معکوسپذیر باشد .با توجه به معادالت باال ،میتوان
نوشت:
𝐷 𝑦 = 𝐶̂ 𝑧 +
𝑢̂
که در آن:
با توجه به آنچه گفته شد ،میتوان نتیجه گرفت ،برای یک سیستم بینهایت نمای فضای حالت میتوان نوشت.
زیرا بینهایت ماتریس مربعی معکوسپذیر 𝑇 وجود دارد .اما در عمل ،معموالً نمایشهایی انتخاب میشوند که
متغیرهای حالت آنها به صورت فیزیکی قابل حس بوده و یا فرایند طراحی در مورد آنها راحتتر باشد.
1
با تغییر متغیر 𝑧1 = 𝑥1و 𝑧2 = 𝑥1 − 𝑥2معادالت حالت و خروجی سیستم را بازنویسی نمایید.
حل.
داریم:
1 0
[=𝑧 𝑥]
1 −1
پس:
1 0 −1
[ ]𝑦 = [0 1 𝟏[ = 𝒚 ⟹ 𝑧 ] 𝒛]𝟏−
1 −1
یکی از مفیدترین نمایشهای معادالت حالت در تحلیل و طراحی ،نمایش قطری ،نرمال یا مدال است.
در این نمایش ،ماتریس حالت قطری است .در حقیقت ،در این نوع نمایش ،متغیرهای حالت به گونهای انتخاب
سؤال اینجاست که آیا هر سیستمی نمایش قطری دارد و اگر داشته باشد چگونه به دست می-
مقدمه :1
قضیه .فرض کنید ،ماتریس 𝑛×𝑛 Aدارای 𝑛 مقدار ویژه متمایز است .بردارهای ویژه متناظر با این مقادیر ویژه متمایز،
مستقلند.
اثبات .فرض کنیم 𝜆𝑛 ،... ،𝜆2 ،𝜆1مقادیر ویژه متمایز ماتریس 𝐴 و 𝑣𝑛 ،... ،𝑣2 ،𝑣1بردارهای ویژه متناظر باشند.
2
𝑐1 𝑣1 + 𝑐2 𝑣2 = 0 )(1
که نتیجه آن این است که .𝑐2 = 0و حال با استفاده از رابطه ( ،)1خواهیم داشت 𝑐1 = 0و این یعنی 𝑣1و 𝑣2مستقلند.
که نتیجه آن این است که 𝑐1 = 𝑐2 = 0و حال با استفاده از رابطه ( ،)4خواهیم داشت 𝑐3 = 0و این یعنی 𝑣2 ، 𝑣1و
𝑣3مستقلند.
با ادامه این روند ،میتوان نشان داد که 𝑣𝑛 ،... ،𝑣2 ،𝑣1مستقلند.
3
مقدمه :2
فرض کنید با استفاده از بردارهای 𝑣𝑛 ،... ،𝑣2 ،𝑣1ماتریسی به صورت زیر بسازیم.
𝑇 = [𝑣1 𝑣2 ] 𝑛𝑣 …
مقدمه :3
میدانیم:
… 𝐴𝑣1 = 𝜆1 𝑣1 , 𝐴𝑣2 = 𝜆2 𝑣2 , 𝑛𝑣 𝑛𝜆 = 𝑛𝑣𝐴 ,
پس:
𝐴𝑇 = 𝐴[𝑣1 𝑣2 … 𝑣𝑛 ] = [𝐴𝑣1 𝐴𝑣2 … 𝐴𝑣𝑛 ] = [𝜆1 𝑣1 𝜆2 𝑣2 … ] 𝑛𝑣 𝑛𝜆
با دقت به مبحث تبدیل همانندی ،میتوان گفت که اگر در معادالت حالت یک سیستم ،از تغییر متغیر
مشاهده میکنید ،که ماتریس حالت در معادله حالت فوق ،قطری است.
4
از آنچه تا اینجا گفته شد میتوان نتیجه گرفت که اگر مقادیر ویژه ماتریس حالت یک سیستم ،متمایز باشند ،آن
سیستم دارای نمایش قطری بوده و نحوه محاسبه این نمایش قطری نیز با استفاده از تغییر متغیر 𝑥 𝑧 = 𝑇 −1
پاسخ جامعتر و کاملتر به سؤال ابتدای بخش :اگر به ازای هر 𝑖 بعد فضای ویژه متناظر با مقدار ویژه مکرر 𝑖𝜆 با
مرتبه تکرار 𝑖𝑟 ،برابر 𝑖𝑟 باشد ،سیستم مورد نظر ،دارای نمایش قطری بوده و نحوه محاسبه این نمایش قطری نیز
با استفاده از تغییر متغیر 𝑥 𝑧 = 𝑇 −1است که 𝑛 ستون 𝑇 𝑛 ،بردار ویژه مستقل هستند.
یک مثال برای روشنتر شدن مطلب :فرض کنید 𝐴4×4و مقادیر ویژه آن عبارت باشند از } .{𝜆1 , 𝜆1 , 𝜆2 , 𝜆3
اگر بعد فضای ویژه متناظر با مقدار ویژه 𝜆1برابر 2باشد (دو بردار ویژه مستقل متناظر با 𝜆1موجود باشد) ،این سیستم
دارای نمایش قطری بوده و و نحوه محاسبه این نمایش قطری نیز با استفاده از تغییر متغیر 𝑥 𝑧 = 𝑇 −1است و
𝑇 = [𝑣1 𝑣2 𝑣3 ] 𝑣4
که 𝑣1و 𝑣2بردارهای ویژه متناظر با 𝑣3 ،𝜆1بردار ویژه متناظر با 𝜆2و 𝑣4بردار ویژه متناظر با 𝜆3است.
اگر سیستمی فرم قطری نداشته باشد ،نزدیکترین نمایش به فرم قطری ،تحت عنوان قطری بلوکی (کانونیکال
جردن) را حتماً خواهد داشت .منظور از فرم قطری بلوکی ،ماتریسهایی به صورت زیر است
5
طبعاً این حالت برای ماتریسهای پیش میآید که مقادیر ویژه آنها مکرر بوده و بعد فضای ویژه متناظر با یک یا
جالب اینجاست که تعداد بلوکهای متناظر با یک مقدار ویژه ،معرف بعد فضای ویژه متناظر با آن مقدار ویژه
است.
برای پاسخ به سؤال فوق ،مقدمهای تحت عنوان معرفی بردارهای ویژه تعمیمیافته نیاز است.
مقدمه :1
طبعاً در حالتی که ماتریس حالت ،قطری نمیشود ،ما نمیتوانیم 𝑛 بردار ویژه مستقل داشته باشیم تا با آن ماتریس مربعی
معکوسپذیر 𝑇 را بسازیم .برای کامل کردن تعداد ستونهای ماتریس 𝑇 از بردارهای ویژه تعمیمیافته کمک میگیریم.
مقدمه :2
فرض کنید 𝑣 بردار ویژه متناظر با مقدار ویژه λباشد .به بردار ،𝑣1 ≠ 0بردار ویژه تعمیمیافته متناظر با مقدار ویژه λگفته
میشود اگر
𝑣 𝐴𝑣1 = 𝜆𝑣1 +
یا
𝑣 = (𝐴 − 𝜆𝐼)𝑣1
حال ،فرض کنید 𝑣1بردار ویژه تعمیمیافته متناظر با مقدار ویژه λباشد .بردار ،𝑣2 ≠ 0نیز بردار ویژه تعمیمیافته متناظر با
6
از آنچه گفته شد ،میتوان نتیجه گرفت که برای یک مقدار ویژه 𝜆 بینهایت بردار ویژه تعمیمیافته میتوان
ساخت .ما برای کامل کردن ستونهای ماتریس 𝑇 به تعداد محدودی از این بردارها نیاز خواهیم داشت که از
یک مثال برای روشنتر شدن مطلب :فرض کنید 𝐴4×4و مقادیر ویژه آن عبارت باشند از } .{𝜆1 , 𝜆1 , 𝜆2 , 𝜆3
اگر بعد فضای ویژه متناظر با مقدار ویژه 𝜆1برابر 1باشد (یک بردار ویژه مستقل متناظر با 𝜆1موجود باشد) ،این
سیستم دارای نمایش قطری نبوده و و نحوه محاسبه نمایش قطری بلوکی آن با استفاده از تغییر متغیر 𝑥 𝑧 = 𝑇 −1
است و
𝑇 = [𝑣1 𝑣2 𝑣3 ] 𝑣4
که 𝑣1بردار ویژه متناظر با ،𝜆1و 𝑣2بردار ویژه تعمیمیافته متناظر با 𝑣3 ،𝜆1بردار ویژه متناظر با 𝜆2و 𝑣4بردار ویژه
متناظر با 𝜆3است.
مثال .فرض کنید ماتریس زیر ،ماتریس حالت یک سیستم است .آیا این سیستم ،دارای نمایش فضای حالت
قطری است؟ در صورت مثبت بودن پاسخ ،ماتریس تبدیل به فرم قطری را بیابید و در غیر اینصورت ،ماتریس
تبدیل به فرم قطری بلوکی (جردن) را یافته و فرم قطری بلوکی را نیز نمایش دهید.
7
با توجه به آنکه مقدار ویژه 𝜆 = 1مکرر از مرتبه 2بوده و بعد فضای ویژه متناظر با آن یک است ،لذا این سیستم دارای
نمایش فضای حالت قطری نخواهد بود .برای محاسبه فرم قطری بلوکی ،نیاز به یک بردار ویژه تعمیم یافته برای 𝜆 = 1
داریم.
و لذا:
8
از طرفی ،میدانید:
𝐴2 𝑡 2
𝑒 𝐴𝑡 = 𝐼 + 𝐴𝑡 + ⋯+
!2
با فرض قطری پذیر بودن ماتریس 𝐴 ،میتوان گفت:
𝐴 = 𝑇𝐽𝑇 −1
که در آن 𝐽 ماتریس قطری شامل مقادیر ویژه و 𝑇 ماتریس مربعی معکوسپذیری است که ستونهای آن بردارهای ویژه
ماتریس 𝐴 هستند.
پس:
𝑇 2 𝐽2 𝑇 −2 𝑡 2 𝐽2 𝑡 2
𝑒 𝐴𝑡 = 𝐼 + 𝑇𝐽𝑇 −1 𝑡 + + ⋯ = 𝑇 (𝐼 + 𝐽𝑡 + + ⋯ ) 𝑇 −1 = 𝑇𝑒 𝐽𝑡 𝑇 −1
!2 !2
به راحتی میتوان نشان داد که:
تمرین .در صورتی که ماتریس 𝐴 قطری پذیر نباشد ،با ایجاد تغییری در محاسبات فوق ،روش محاسبه ماتریس انتقال حالت
آن چه تا به حال در مورد بردار ویژه گفته شد ،در حقیقیت روش محاسبه بردار ویژه راست بود .به خاطر دارید که
9
از آنجا که در زمان محاسبه ،این بردار در سمت راست ماتریس 𝐴 قرار دارد ،به آن بردار ویژه راست میگویند .به طریق
نشان میدهیم که اگر ستونهای ماتریس 𝑇 بردارهای ویژه راست ماتریس 𝐴 باشند ،آنگاه سطرهای 𝑇 −1
𝐴𝑇 = 𝑇𝐽 ⟹ 𝑇 −1 𝐴𝑇 = 𝐽 ⟹ 𝑇 −1 𝐴 = 𝐽𝑇 −1
𝑇 𝑎1
𝑇
𝑇 −1نمایش دهیم ،رابطه فوق را میتوان به صورت زیر بازنویسی کرد: اگر ماتریس 𝑇 −1را به صورت = 𝑎2
…
] 𝑇 𝑛𝑎[
رابطه فوق نشان میدهد که 𝑖𝑎ها (سطرهای )𝑇 −1بردارهای ویژه چپ ماتریس 𝐴 هستند.
میدانیم:
بنابراین:
1 𝑗=𝑖
𝑇 𝑇
{ = 𝑗𝑤 𝑖𝑣 = 𝑗𝑣 𝑖𝑤 )∗(
0 𝑗≠𝑖
10
حال تحلیلی در مورد پاسخ ورودی صفر با توجه به این مفاهیم جدید ،انجام میدهیم .برای سادهتر شدن تحلیل،
فرض بر آن است که مقادیر ویژه سیستم ،متمایزند .میدانید پاسخ ورودی صفر یک سیستم خطی تغییر ناپذیر با
پس:
و از آنجا که بردارهای 𝑣2 ،𝑣1تا 𝑛𝑣 یک پایه برای 𝑛𝑅 است ،هر شرط اولیهای را میتوان به صورت ترکیب خطی این
الف -اگر شرایط اولیه سیستم ،موازی با یکی از بردارهای ویژه راست باشد (مثالً )𝑥(0) = 𝛼𝑣2در این صورت:
ب -اگر شرایط اولیه عمود بر یکی از بردارهای ویژه چپ باشد (مثالً 𝑥(0) ⊥ 𝑤2یا )𝑤2 𝑇 𝑥(0) = 0از رابطه ()2
خواهیم داشت:
و لذا:
11
𝑡 𝑛𝜆 𝑒 𝑛𝑣 𝑛𝑐 ⋯ 𝑥(𝑡) = 𝑐1 𝑣1 𝑒 𝜆1 𝑡 + 𝑐3 𝑣3 𝑒 𝜆3 𝑡 + 𝑐4 𝑣4 𝑒 𝜆4 𝑡 +
یعنی مد 𝜆2تحریک نخواهد شد.
از تحلیل فوق ،میتوان نتیجه گرفت که شرایط اولیه نقش تعیینکننده در تحریک هر یک از مودهای سیستم
داشته و با مشاهده و آنالیز شرایط اولیه میتوان در مورد تحریک یا عدم تحریک هر یک از مودهای سیستم اظهار
نظر کرد.
یک مثال برای روشنتر شدن مطلب :فرض نمایید که بردارهای ویژه یک سیستم مرتبه سه عبارتند از:
0 1 2
]𝑣1 = [1] , 𝑣2 = [ 0 ] , 𝑣3 = [−1
1 −1 1
و شرایط اولیه این سیستم به صورت زیر باشد:
3
]𝑥0 = [−2
3
در مورد پاسخ ورودی صفر این سیستم میتوان گفت ،مدهای 𝜆2و 𝜆3در پاسخ حالتها ظاهر خواهند شد ،ولی مد 𝜆1
کنترلپذیری و رؤیتپذیری از جمله مفاهیمی هستند که با ایده فضای حالت مطرح شدند و مختص تحلیل فضای
کالمن ،در اواسط دهه 50با استفاده از این دو مفهوم دالیل عدم موفقیت پایدارسازی یک سیستم ناپایدار را از
طریق جانمایی صفر کنترلکننده در محل قطب ناپایدار سیستم توضیح داد.
12
کنترلپذیری
را در نظر بگیرید .این سیستم را کنترلپذیر کامل حالت گوییم ،اگر سیگنال کنترل )𝑡(𝑢 وجود داشته باشد که بتواند
حالت سیستم را از هر حالت اولیه دلخواه ) 𝑥(𝑡0به هر حالت نهایی دلخواه ) 𝑥(𝑡1در زمان محدود 𝑡1 − 𝑡0منتقل کند.
استخراج یک روش بررسی کنترلپذیری :سیستم ( )1را به صورت تک ورودی و با شرایط اولیه ) 𝑥(0در
با توجه به رابطه مهم فوق ،شرط کنترلپذیری کامل حالت ،همان شرط وجود همیشگی جواب برای دستگاه معادله
𝑌 = 𝑋 𝐴′است .در فصل اول نشان دادیم که شرط وجود همیشگی جواب برای این دستگاه معادله آن است که
13
𝑛 𝑅 = ) 𝐼𝑚(𝐴′ 𝑛 = }) 𝑂𝑅 𝑑𝑖𝑚 {𝐼𝑚(𝐴′
پس ،شرط الزم و کافی برای کنترلپذیری کامل حالت ،آن است که ماتریس 𝐴′فولرنک باشد.
… 𝐵 Φ𝑐 = [𝐵 𝐴𝐵 𝐴2برابر است و لذا شرط حال نشان میدهیم که رنک (مرتبه) دو ماتریس 𝐴′و ] 𝐵 𝐴𝑛−1
الزم و کافی برای کنترلپذیری کامل حالت سیستم خطی تغییر ناپذیر با زمان ( ،)1آن است که ماتریس 𝑐 Φفولرنک باشد.
حال فرض کنید 𝐵 و 𝐵𝐴 مستقل باشند ،ولی 𝐵 و 𝐵𝐴 و 𝐵 𝐴2مستقل نباشند .در این صورت
𝐵𝐴 𝐴2 𝐵 = 𝑐1 𝐵 + 𝑐2
⋯ = 𝐵 𝐴4
به همین ترتیب میتوان تا مرحلهای پیش رفت که در آن 𝐵 𝐴𝑛−2 𝐵 ،... ،𝐴𝐵 ،مستقل باشند ،ولی 𝐵 𝐴𝑛−1 𝐵 ،... ،𝐴𝐵 ،
14
در این صورت 𝑛 = ) 𝑐.𝑅𝑎𝑛𝑘(Φ حال فرض کنید که 𝐵 𝐴𝑛−1 𝐵 ،... ،𝐴𝐵 ،مستقل باشند.
با توجه به آنکه در فضایی با بعد 𝑛 حداکثر 𝑛 بردار مستقل میتوان یافت ،پس:
شرط الزم و کافی برای کنترلپذیری کامل حالت سیستم خطی تغییر ناپذیر با زمان ( ،)1آن است که
𝑩𝑨 𝑩[ = 𝒄𝚽 فولرنک باشد و به بیان دیگر دارای رتبه 𝒏 باشد. 𝑩 𝟐𝑨 … ماتریس ]𝑩 𝟏𝑨𝒏−
رؤیتپذیری
را در نظر بگیرید .این سیستم را رؤیتپذیر کامل حالت گوییم ،اگر بتوان با داشتن اطالعات )𝑡(𝑢 و )𝑡(𝑦 در بازه
زمانی 𝑡0تا ،𝑡1حالت اولیه سیستم یعنی ) 𝑥(𝑡0را به صورت یکتا تعیین کنیم.
سیستم ( )1را به صورت تک خروجی با شرایط اولیه ) 𝑥(0در نظر بگیرید .میدانیم:
𝑡
𝜏𝑑 )𝜏(𝑢𝐵 )𝜏𝑦(𝑡) = 𝐶𝑥(𝑡) = 𝐶𝑒 𝐴𝑡 𝑥(0) + 𝐶 ∫ 𝑒 𝐴(𝑡−
0
بنابراین:
15
𝑡
)𝑦(𝑡) − 𝐶 ∫ 𝑒 𝐴(𝑡−𝜏) 𝐵𝑢(𝜏) 𝑑𝜏 = 𝐶𝑒 𝐴𝑡 𝑥(0
0
با توجه به داشتن اطالعات )𝑡(𝑢 و )𝑡(𝑦 در بازه زمانی صفر تا 𝑡 ،سمت چپ تساوی فوق معلوم بوده و میتوان آن را بعد
از محاسبه با )𝑡(𝑓 نمایش داد .با مشتقگیری ازدو طرف رابطه فوق ،خواهیم داشت:
)𝑡(𝑓 𝐶
𝑡𝐴 𝐴𝐶
)𝑡([ 𝑓′
′′
⏟ ]] = [ 2
)𝑒 𝑥(0
)𝑡( 𝑓 𝐴𝐶
𝑋
… ⏟ …⏟
𝑌 𝐴′
با توجه به رابطه مهم فوق ،شرط رؤیتپذیری کامل حالت ،همان شرط یکتایی جواب برای دستگاه معادله 𝑌 = 𝑋 𝐴′است.
در فصل اول نشان دادیم که شرط یکتایی جواب این دستگاه معادله آن است که
پس ،شرط الزم و کافی برای رؤیتپذیری کامل حالت ،آن است که ماتریس 𝐴′فولرنک باشد.
𝐶
𝐴𝐶
حال نشان میدهیم که رنک (مرتبه) دو ماتریس 𝐴′و Φ𝑜 = 𝐶𝐴2برابر است و لذا شرط الزم و کافی برای رؤیت-
…
] [𝐶𝐴𝑛−1
پذیری کامل حالت سیستم خطی تغییر ناپذیر با زمان ( ،)1آن است که ماتریس 𝑜 Φفولرنک باشد.
16
حال فرض کنید 𝐶 و 𝐴𝐶 مستقل باشند ،ولی 𝐶 و 𝐴𝐶 و 𝐶𝐴2مستقل نباشند .در این صورت
𝐴𝐶 𝐶𝐴2 = 𝑐1 𝐶 + 𝑐2
⋯ = 𝐶𝐴4
به همین ترتیب میتوان تا مرحلهای پیش رفت که در آن 𝐶 𝐶𝐴𝑛−2 ،... ،𝐶𝐴 ،مستقل باشند ،ولی 𝐶 𝐶𝐴𝑛−1 ،... ،𝐶𝐴 ،
𝐶 𝐶𝐴𝑛−1 ،... ،𝐶𝐴 ،مستقل باشند .در این صورت 𝑛 = ) 𝑜.𝑅𝑎𝑛𝑘(Φ حال فرض کنید که
با توجه به آنکه در فضایی با بعد 𝑛 حداکثر 𝑛 بردار مستقل میتوان یافت ،پس:
𝐶
𝐴𝐶
𝐶𝐴2
𝑛 = ) … (𝑘𝑛𝑎𝑅 = ) 𝑅𝑎𝑛𝑘(A′
𝐶𝐴𝑛−1
𝑛𝐴𝐶
] … [
17
شرط الزم و کافی برای رؤیتپذیری کامل حالت سیستم خطی تغییر ناپذیر با زمان ( ،)1آن است که
𝐶
𝐴𝐶
ماتریس 𝚽𝒐 = 𝐶𝐴2فولرنک باشد و به بیان دیگر دارای رتبه 𝒏 باشد.
…
] [𝐶𝐴𝑛−1
𝐴 𝑠𝐼 −
[ ]
𝐶
نتیجه قضایای فوق :کافی است مقادیر ویژه ماتریس 𝐴 را به جای 𝑠 قرار دهیم .اگر به ازای فقط یکی از مقادیر
ویژه ،ماتریس ]𝐵 | 𝐴 ) [𝑠𝐼 − 𝐴] ( [𝑠𝐼 −فولرنک نباشد ،سیستم ،کنترل پذیر کامل ( رؤیتپذیر کامل)،
𝐶
نخواهد بود.
18
برتری این روش بررسی کنترلپذیری (رؤیتپذیری) نسبت به روش استفاده از ماتریس کنترلپذیری (رؤیت-
پذیری) ،آن است که مودهای کنترلپذیر و کنترلناپذیر (رؤیتپذیر و رؤیتناپذیر) با استفاده از این روش قابل
عیب این روش بررسی کنترلپذیری (رؤیتپذیری) نسبت به روش استفاده از ماتریس کنترلپذیری (رؤیت-
پذیری) ،آن است که الزم است به تعداد مقادیر ویژه سیستم ،یک ماتریس تشکیل داده و رتبه آن بررسی گردد.
کنترلپذیر (رؤیتپذیر) کامل است ،اگر و تنها اگر پس از استخراج فرم قطری بلوکی آن (که فرم قطری نیز یک
-1آخرین (اولین) سطرهای (ستونهای) متناظر با بلوکهای مربوط به مقادیر ویژه یکسان از ماتریس 𝐵 ( 𝐶) مستقل
خطی باشند.
-2سطرهای (ستونهای) ماتریس 𝐵 ( 𝐶) که متناظر با مقادیر ویژه غیرمکرر هستند ،غیرصفر باشند.
نتیجه قضیه فوق :در مورد سیستمی که دارای مقادیر ویژه متمایز است ،میتوان گفت ،سیستم مورد نظر کنترل-
پذیر (رؤیتپذیر) کامل است اگر و تنها اگر ،سطرهای (ستونهای) ماتریس 𝐵 ( 𝐶) در فرم قطری غیرصفر باشند.
اگر یکی از سطرهای (ستونهای) ماتریس 𝐵 ( 𝐶) صفر باشند ،مقدار ویژه متناظر با آن سطر (ستون) کنترلناپذیر
یک مثال برای روشنتر شدن مطلب :فرض نمایید ،نمایش قطری یک سیستم به صورت زیر است.
19
−1 0 0 −1
𝑥̇ = [ 0 −2 𝑢] 0 ]𝑥 + [ 2
0 0 −3 0
واضح است که با استفاده از معادالت فوق ،امکان جا به جا کردن 𝑥1و 𝑥2با استفاده از ورودی 𝑢 وجود دارد ،ولی این
امکان در مورد 𝑥3نیست .پس حالت ( 𝑥3یا مقدار ویژه متناظر آن یعنی )−3کنترلناپذیر است.
همچنین مشخص است که اثر 𝑥2در خروجی سیستم ظاهر نشده است و لذا با داشتن خروجی ،امکان یافتن مقدار اولیه 𝑥2
وجود ندارد . .پس حالت ( 𝑥2یا مقدار ویژه متناظر آن یعنی )−2رؤیتناپذیر است.
یک مثال دیگر برای روشنتر شدن مطلب :تصور نمایید ماتریس حالت و ماتریس ورودی فرم قطری بلوکی یک
1 −2
3 1
….. …..
1 1
….. ……
0 1
= B′
….. …..
2 1
…. ……
1 2
…… …..
[ −1 ] −2
متناظر با 𝜆1دو بلوک داریم .آخرین سطرهای متناظر با هر بلوک از ماتریس B′عبارتند از ) (3,1و ) (1,1که مستقل
هستند.
متناظر با 𝜆2هم دو بلوک داریم .آخرین سطرهای متناظر با هر بلوک از ماتریس B′عبارتند از ) (0,1و ) (2,1که مستقل
هستند.
20
این سیستم دو مقدار ویژه غیرمکرر دارد.
حال فرض نمایید ماتریس حالت و ماتریس ورودی فرم قطری بلوکی به صورت زیر باشند.
1 −2
−1 1
….. …..
1 1
…… …..
3 1
= B′
….. …..
−6 −2
…… ….
1 2
…… …..
] [ −1 −2
متناظر با 𝜆1دو بلوک داریم .آخرین سطرهای متناظر با هر بلوک از ماتریس B′عبارتند از ) (−1,1و ) (1,1که مستقل
هستند.
متناظر با 𝜆2هم دو بلوک داریم .آخرین سطرهای متناظر با هر بلوک از ماتریس B′عبارتند از ) (3,1و ) (−6, −2که
وابسته هستند.
پس ،سیستم مورد نظر ،کنترلپذیر کامل حالت نیست و مود کنترلناپذیر آن 𝜆2است.
فرض نمایید ماتریس حالت و ماتریس خروجی فرم قطری بلوکی به صورت زیر باشند.
21
0 1 1 2 1 0 0
′
𝐶 =[ 1 1 ]1 1 −1 0 0
−1 2 2 −1 −1 1 1
متناظر با 𝜆1دو بلوک داریم .اولین ستونهای متناظر با هر بلوک از ماتریس C′عبارتند از ) (0,1, −1و ) (1,1,2که
مستقل هستند.
متناظر با 𝜆2هم دو بلوک داریم .اولین ستونهای متناظر با هر بلوک از ماتریس C′عبارتند از ) (2,1, −1و
مثال :سیستم مکانیکی زیر ،متشکل از دو ارابه است که توسط فنری به هم متصل شدهاند .به هر کدام از ارابهها
یک نیروی کنترلی در جهت مخالف هم ،ولی به طور مساوی وارد میشود .در مورد کنترلپذیری این سیستم
22
−𝑓 + 𝑘(𝑥2 − 𝑥1 ) = 𝑚1 𝑥̈ 1
دو معادله دیفرانسیل مرتبه دوم داریم که برای استخراج معادالت حالت ،باید تبدیل به چهار معادله دیفرانسیل مرتبه اول
شوند .با انتخاب 𝑋3 = 𝑥2 ،𝑋2 = 𝑥̇ 1 ،𝑋1 = 𝑥1و 𝑋4 = 𝑥̇ 2میتوان ،دو معادله دیفرانسیل فوق را به صورت زیر
بازنویسی کرد:
𝑋̇1 = 𝑋2
𝑋̇3 = 𝑋4
پس:
23
0 −1 0 2
−1 0 2 0
𝐵[ = 𝑐Φ 𝐵𝐴 𝐵 𝐴2 [ = ] 𝐵 𝐴3 ] ⟹ 𝑟𝑎𝑛𝑘(Φ𝑐 ) = 2
0 1 0 −2
1 0 −2 0
دستور متلب ctrb(A,B) :و )) Rank(ctrb(A,Bبرای محاسبه ماتریس کنترلپذیری و رتبه آن
پس این سیستم کنترلپذیر کامل حالت نیست .یعنی با استفاده از وروی کنترل ،نمیتوان حالتهای آن را با شروع از یک
یک سؤال میتواند این چنین مطرح شود که با شروع از حالت اولیه صفر ،با استفاده از ورودی کنترل ،به چه
طبیعتاً به زیرفضایی که توسط ستونهای اول و دوم ماتریس کنترلپذیری حاصل میشود .یعنی به نقاطی در فضای
زیرفضای کنترلپذیر ،زیرفضایی است که توسط ستونهای مستقل ماتریس کنترلپذیری تولید میشود.
مقادیر ویژه این سیستم با صفر قراردادن )𝐴 𝑑𝑒𝑡(𝜆𝐼 −به صورت زیر به دست میآید:
24
بنابراین ،مقدار ویژه صفر کنترلپذیر نبوده و لذا سیستم ،کنترلپذیر کامل حالت نیست .به بیان دیگر ،با استفاده از ورودی
کنترل ،مقدار ویژه صفر قابل جابجایی نبوده و لذا امکان پایدارسازی این سیستم ،وجود ندارد.
حال ،متغیرهای حالت سیستم را به صورت دیگری انتخاب میکنیم .فرض کنید ،به جای انتخاب جابجایی هر یک
از اجسام و مشتق آنها به عنوان متغیرهای حالت ،جابجایی مرکز ثقل و تغییر طول فنر و مشتقات آنها را به
پس:
به این معنا که سرعت مرکز ثقل و به تبع آن جابجایی مرکز ثقل سیستم از ورودی کنترلی اثر نمیپذیرد .یعنی با کم و زیاد
کردن ورودی کنترل ،سرعت (یا جابجایی) مرکز ثقل قابل تغییر نیستند.
همچنین ،معادالت سوم و چهارم فضای حالت جدید نشان میدهد که تغییر طول فنر و سرعت این تغییر ،متغیرهایی هستند
که از ورودی کنترل اثر میپذیرند .یعنی با کم و زیاد کردن ورودی کنترل ،طول فنر و سرعت تغییر طول ،تغییر میکنند.
25
ماتریس کنترلپذیری در این حالت به صورت زیر است:
و زیرفضایی که با استفاده از ورودی کنترل قابل دسترس است عبارت است از
نتیجه فوق ،مؤید این موضوع است که با شروع از نقطه صفر ،حالتهای اول و دوم توسط ورودی کنترل قابل جابجایی
نیستند ،در حالیکه حالتهای سوم و چهارم را میتوان در نقطه دلخواه جانمایی کرد.
26
ادامه فصل سوم
مثال :مدار الکتریکی زیر را در نظر بگیرید .با فرض آنکه ولتاژ دو سر مقاومت 𝑅3اندازهگیری شده باشد ،در مورد
1
𝑅1 = 𝑅2 = 2 , 𝑅3 = 1 , رؤیتپذیری سیستم بحث کنید𝐶1 = 𝐶2 = 1 , 𝑅0 = 0 .
𝑑 𝑥1
𝑢= −3𝑥1 + 𝑥2 + 2
𝑡𝑑
𝑑 𝑥2
𝑢= 𝑥1 − 3𝑥2 + 2
𝑡𝑑
𝑦 = 𝑥1 − 𝑥2
پس:
−3 1 2
[=𝐴 ] , ] [=𝐵 , ]𝐶 = [1 −1
1 −3 2
1
تشکیل ماتریس رؤیتپذیری:
𝐶 1 −1
[ = 𝑜Φ [=] ]
𝐴𝐶 −4 4
زیرفضای رؤیتناپذیر این سیستم عبارت است از ) 𝑜 𝐾𝑒𝑟(Φو واضح است که
1 𝑎
] [ = ) 𝑜𝐾𝑒𝑟(Φ𝑜 ) = 𝑠𝑝𝑎𝑛 {[ ]} 𝑂𝑅 𝐾𝑒𝑟(Φ
1 𝑎
بنابراین ،با استفاده از تغییر متغیر 𝑥 ،𝑧 = 𝑇 −1فرم فضای حالت ،قطری خواهد شد و خواهیم داشت:
𝑧]𝑦 = [0 2
گام اول :ستونهای (سطرهای) مستقل ماتریس کنترلپذیری (رؤیتپذیری) را جدا کرده و در ماتریس دیگری
قرار میدهیم .اگر 𝑒1تا 𝑚𝑒 ،ستونهای (سطرهای) مستقل ماتریس کنترلپذیری باشند:
2
گام دوم :با اضافه کردن 𝑚 𝑛 −ستون (سطر) دیگر به ماتریس 𝑇1ماتریس دیگری به نام 𝑇 میسازیم .البته به
گام سوم :با استفاده از تغییر متغیر 𝑥 )𝑧 = 𝑇𝑥( 𝑧 = 𝑇 −1فضای حالت سیستم را بازنویسی میکنیم .اگر مراحل
گفته شده به درستی انجام شده باشد ،فرم فضای حالت جدید برای سیستم کنترلناپذیر عبارت خواهد بود از:
و مقادیر ویژه ماتریس 𝐴11همان مودهای کنترلپذیر و مقادیر ویژه ماتریس 𝐴22همان مودهای کنترلناپذیر خواهند بود.
"طبق تعریف ،به سیستمی که مودهای کنترلناپذیر آن پایدار باشند (یا مودهای ناپایدار آن کنترلپذیر باشند) ،سیستم
پایدارپذیر ( )Stabilizableمیگویند".
یک نتیجه مهم :هر سیستم کنترلپذیری پایدارپذیر است ،اما ممکن است یک سیستم ،پایدارپذیر باشد ،ولی
کنترلپذیر نباشد.
اگر مراحل گفته شده به درستی انجام شده باشد ،فرم فضای حالت جدید برای سیستم رؤیتناپذیر عبارت خواهد بود از:
و مقادیر ویژه ماتریس 𝐴11همان مودهای رؤیتپذیر و مقادیر ویژه ماتریس 𝐴22همان مودهای رؤیتناپذیر خواهند بود.
"طبق تعریف ،به سیستمی که مودهای رؤیتناپذیر آن پایدار باشند (یا مودهای ناپایدار آن رؤیتپذیر باشند) ،سیستم
آشکارپذیر ( )Detectableمیگویند".
3
یک نتیجه مهم :هر سیستم رؤیتپذیری آشکارپذیر است ،اما ممکن است یک سیستم ،آشکارپذیر باشد ،ولی
رؤیتپذیر نباشد.
زیرفضای 𝑢𝑐𝑆 که کنترلپذیر و رؤیتناپذیر است ،زیرفضای 𝑜𝑐𝑆 که کنترلپذیر و رؤیتپذیر است ،زیرفضای 𝑜𝑢𝑆 که
کنترل ناپذیر و رؤیتپذیر است و زیرفضای 𝑢𝑢𝑆 که کنترل ناپذیر و رؤیتناپذیر است.
طبق تعریف تابع تبدیل ،که نسبت الپالس خروجی به الپالس ورودی با فرض شرایط اولیه صفر است ،انتظار
میرود که صرفاً زیر سیستم 𝑜𝑐𝑆 در تابع تبدیل ظاهر شود .از همینجاست که نتیجه میگیریم مدل تابع تبدیل ،در
حالت کلی ،مدل کاملی از رفتار یک سیستم ارائه نمیدهد ،مگر آنکه سیستم مورد نظر کنترلپذیر و رؤیتپذیر
بوده باشد.
همانطور که مشاهده شد ،تقارن جالبی بین دو مفهوم کنترلپذیری و رؤیتپذیری وجود دارد .این تقارن ،با معرفی
4
سیستم خطی تغییرناپذیر با زمان زیر را در نظر بگیرید:
کنترلپذیری خروجی
یک سیستم را کنترلپذیر خروجی گویند ،اگر بتوان با استفاده از ورودی کنترل ،خروجی سیستم را از مقدار اولیه
میدانیم:
پس:
5
= )𝑦(𝑡1 ) − 𝐶𝑒 𝐴𝑡1 𝑥(0
𝑡1
𝜏𝑑 )𝜏(𝑢 ∫
0
𝑡1
𝜏𝑑 )𝜏(𝑢)𝜏 ∫ (𝑡1 −
⏟ = )𝑦(𝑡1 ) − 𝐶𝑒 𝐴𝑡1 𝑥(0
⏟ 𝐵𝐶[ 𝐵𝐴𝐶 𝐵 𝐶𝐴2 ]𝐷 … 0 )∗(
𝑡( 𝑡1
𝑌 𝐴′ 1 − 𝜏)2
∫ 𝜏𝑑 )𝜏(𝑢
0 2
…
⏟[ ) 𝑢(𝑡1 ]
𝑋
با توجه به رابطه مهم فوق ،شرط کنترلپذیری خروجی ،همان شرط وجود همیشگی جواب برای دستگاه معادله 𝑌 = 𝑋 𝐴′
است .شرط وجود همیشگی جواب برای این دستگاه معادله آن است که
پس ،شرط الزم و کافی برای کنترلپذیری خروجی ،آن است که ماتریس 𝐴′فولرنک باشد.
… 𝐵 Φ𝑜𝑝 = [𝐶𝐵 𝐶𝐴𝐵 𝐶𝐴2برابر 𝐵 𝐶𝐴𝑛−1 میتوان نشان داد که رنک (رتبه) دو ماتریس 𝐴′و ]𝐷
است.
شرط الزم و کافی برای کنترلپذیری خروجی سیستم خطی تغییر ناپذیر با زمان ،آن است که
… 𝑩 𝟐𝑨𝑪 𝑩𝑨𝑪 𝑩𝑪[ = 𝒑𝒐𝚽 فولرنک باشد و به بیان دیگر دارای ماتریس ]𝑫 𝑩 𝟏𝑪𝑨𝒏−
رتبه 𝒍 باشد.
6
یک سیستم کنترلپذیر کامل حالت ،ممکن است کنترلپذیر خروجی نباشد .همچنین ،یک سیستم کنترل ناپذیر
مثالً در مسأله مدار الکتریکی ،سیستم کنترلپذیر کامل حالت نیست .اگر خروجی این سیستم را مجموع ولتاژ دو سر
کنترلپذیری تابعی
سیستمی که خروجی آن با تنظیم مناسب ورودی ،هر سیگنال مرجع از پیشتعیینشدهای را در هر گستره زمانی
میدانیم که رابطه بین ورودی-خروجی یک سیستم خطی تغییرناپذیر با زمان با 𝑚 ورودی و 𝑙 خروجی ،به صورت
فرض کنید میخواهیم خروجی سیستم ،سیگنال مرجع از پیشتعیینشده )𝑡(𝑟 را دنبال کند .به شرط معکوس
7
یعنی هدف ما محقق میشود .واضح است که شرط تحقق هدف مورد نظر آن است که )𝑠( 𝑇 𝐺)𝑠(𝐺 معکوسپذیر باشد.
پس میتوان گفت ،سیستم مورد نظر کنترلپذیر تابعی است اگر رتبه )𝑠(𝐺 برابر 𝑙 باشد یا ماتریس تابع تبدیل دارای 𝑙 سطر
مستقل باشد.
با توجه به تعاریف ارائه شده ،میتوان نتیجه گرفت که کنترلپذیری خروجی و کنترلپذیری تابعی بیانگر یک
فصل چهارم
تئوری تحقق
تئوری تبدیل نمایش سیستم از تابع تبدیل به فضای حالت را تئوری تحقق گویند.
با فرض آنکه معادالت فضای حالت سیستم به صورت زیر باشد:
𝑢𝐷 𝑦 = 𝐶𝑥 +
میدانید که با استفاده از تبدیل الپالس با فرض شرایط اولیه صفر خواهیم داشت:
)𝒔(𝒀
= )𝒔(𝑮 ⟹ )𝑠(𝑈𝐷 𝑌(𝑠) = 𝐶(𝑠𝐼 − 𝐴)−1 𝐵𝑈(𝑠) + | 𝑫 = 𝑪(𝒔𝑰 − 𝑨)−𝟏 𝑩 +
𝟎 = 𝟎𝒙 )𝒔(𝑼
طبق تعریف هر نمایش فضای حالت متشکل از ماتریسهای 𝐴 𝐶 ،𝐵 ،و 𝐷 که در معادله فوق صدق کند ،یک
𝐺(𝑠) در صورتی تحققپذیر است که سره باشد و ثانیاً تحقق آن منحصر به فرد نیست.
8
ویژگی اصلی یک تحقق مناسب ،مینیمال یا کاهشناپذیر بودن آن است .تحقق مینیمال ،تحققی است که حداقل
تحقق فضای حالت یک تابع تبدیل ،درصورتی مینیمال است که آن تحقق کنترلپذیر و رؤیتپذیر باشد.
اگر ) (𝐴1 , 𝐵1 , 𝐶1 , 𝐷1و ) (𝐴2 , 𝐵2 , 𝐶2 , 𝐷2دو تحقق مینیمال از )𝑠(𝐺 باشند ،توسط یک تبدیل همانندی به
𝑋2 = 𝑇 −1 𝑋1 𝑤ℎ𝑒𝑟𝑒 𝑇 = Φ𝑐1 Φ𝑐2 −1 𝑅𝑂 𝑇 = Φ𝑜1 −1 Φ𝑜2
یک راه ساده برای تشخیص مینیمال بودن یک تحقق آن است که مرتبه تحقق با درجه مخرج تابع تبدیل برابر
اگر )𝑠(𝐺 تحقق مرتبه 𝑛 کنترلپذیر و رؤیتپذیری داشته باشد ،هر تحقق مرتبه 𝑛 دیگر آن نیز کنترلپذیر و
رؤیتپذیر است.
در این بخش ،با چگونگی ایجاد چهار تحقق معروف به نامهای کانونیک کنترلکننده ،کانونیک رؤیتگر ،کانونیک رؤیت-
تحققی به فرم زیر ،به نام تحقق کانونیک کنترلکننده معروف است .چگونگی انتخاب متغیرهای حالت از دل تابع
9
مثال :تابع تبدیل یک سیستم به صورت زیر داده شده است .با انتخاب مناسب متغیرهای حالت ،به تحقق کانونیک
کنترلکننده آن برسید.
𝑠+4
= )𝑠(𝐺
𝑠 2 + 2𝑠 + 3
خواهیم داشت:
و:
10
حال معادالت ( )2( ،)1و ( )3را در حوزه زمان مینویسیم:
𝑥̇ 1 = 𝑥2
تحقق کانونیک کنترلکننده همواره کنترلپذیر است ،و اگر تابع تبدیل ،صفر و قطب مشترکی نداشته باشد ،رؤیتپذیر بوده
تحققی به فرم زیر ،به نام تحقق کانونیک رؤیتگر معروف است .چگونگی انتخاب متغیرهای حالت از دل تابع
11
مثال :تابع تبدیل یک سیستم به صورت زیر داده شده است .با انتخاب مناسب متغیرهای حالت ،به تحقق کانونیک
رؤیتگر آن برسید.
𝑠+4
= )𝑠(𝐺
𝑠2 + 2𝑠 + 3
یعنی:
و:
𝑌 = 𝑋2
𝑦 = 𝑥2
تحقق کانونیک رؤیتگر همواره رؤیتپذیر است ،و اگر تابع تبدیل ،صفر و قطب مشترکی نداشته باشد ،کنترلپذیر بوده و در
12
همانطور که مشاهده میشود ،تحقق رؤیتگر دوگان تحقق کنترلکننده است.
تحققی به فرم زیر ،به نام تحقق کانونیک کنترلپذیری معروف است .چگونگی انتخاب متغیرهای حالت از دل تابع
مثال :تابع تبدیل یک سیستم به صورت زیر داده شده است .با انتخاب مناسب متغیرهای حالت ،به تحقق کانونیک
کنترلپذیری آن برسید.
𝑠+4
= )𝑠(𝐺
𝑠 2 + 2𝑠 + 3
حل .میتوان نوشت:
𝑈 = (𝑠 2 + 2𝑠 + 3)𝑍 , 𝑍)𝑌 = (𝑠 + 4
بنابراین:
)𝑍𝑠 2 𝑍 + 2𝑠𝑍 + 3𝑍 = 𝑈 ⟹ 𝑠 2 𝑍 = −2𝑍𝑠 + (𝑈 − 3𝑍) ⟹ 𝑍 = 𝑠 −1 (−2𝑍) + 𝑠 −2 (𝑈 − 3
13
})𝑍⟹ 𝑍 = 𝑠 −1 {−2𝑍 + 𝑠⏟−1 (𝑈 − 3
⏟ 𝑋1
𝑋2
یعنی:
𝑥̇ 2 = 𝑥1 − 2𝑥2
𝑦 = 𝑥1 + 2𝑥2
تحقق کانونیک کنترلپذیری همواره کنترلپذیر است ،و اگر تابع تبدیل ،صفر و قطب مشترکی نداشته باشد ،رؤیتپذیر بوده
تحققی به فرم زیر ،به نام تحقق کانونیک رؤیتپذیری معروف است .چگونگی انتخاب متغیرهای حالت از دل تابع
14
مثال :تابع تبدیل یک سیستم به صورت زیر داده شده است .با انتخاب مناسب متغیرهای حالت ،به تحقق کانونیک
رؤیتپذیری آن برسید.
𝑠+4
= )𝑠(𝐺
𝑠 2 + 2𝑠 + 3
𝑌 (𝑠𝑌 − 𝑈) + 3
⏟𝑠 ⟹ ⏟ + 2𝑠𝑌 − 4𝑈 = 0
𝑋2 𝑋1
بنابراین:
𝑈 𝑠𝑋1 = 𝑠𝑌 = 𝑋2 +
𝑌 = 𝑋1
𝑢 𝑥̇ 1 = 𝑥2 +
𝑦 = 𝑥1
15
مشاهده میکنید که:
تحقق کانونیک رؤیتپذیری همواره رؤیتپذیر است ،و اگر تابع تبدیل ،صفر و قطب مشترکی نداشته باشد ،کنترلپذیر بوده
طبیعی است که در تحققهای کنترلپذیری و رؤیتپذیری ،مقادیر 𝛽𝑛−2 ،𝛽𝑛−1تا 𝛽0بیارتباط به تابع تبدیل
سیستم نباشند .میتوان نشان داد که این پارامترها ،همان پارامترهای مارکوف سیستم میباشند.
به )𝑖(ℎها پارامترهای مارکوف سیستم میگویند و در تحققهای کنترلپذیری و رؤیتپذیری داریم:
مثال .از آنچه در مورد تحقق کانونیک کنترلکننده گفته شد ،تحقق تابع تبدیل زیر را به دست آورید.
1
)(𝑠 2 + 1)(𝑠 + 1
[ = )𝑠(𝐺 𝑠 ]
)(𝑠 + 1)(𝑠 + 2
حل .ابتدا یک مخرج مشترک انتخاب کرده و میتوان نوشت:
16
1 𝑠+2 1 𝑠+2
= )𝑠(𝐺 [ 2 ]= 4 [ ]
(𝑠 2 )+ 1)(𝑠 + 1)(𝑠 + 2) 𝑠(𝑠 + 1 𝑠 𝑠 + 3𝑠 + 3𝑠 2 + 3𝑠 + 2 𝑠 3 +
3
1 𝑠+3
[ = )𝑠(𝐺 ]
𝑠2 )(𝑠 + 1)(𝑠 + 2
حل .ابتدا ترانهاده ماتریس تابع تبدیل فوق را به دست آورده و سپس تحقق کانونیک کنترلکننده را مشابه آنچه در
بخش قبل گفته شد ،برای آن مینویسیم .تحقق)𝑠(𝐺 دوگان تحقق )𝑠( 𝑇 𝐺 خواهد بود.
1
𝑠2 1 ]𝑠 2 + 3𝑠 + 2
= )𝑠( 𝑇 𝐺 𝑠+3 = [
4 3
𝑠𝑠 + 3𝑠 + 2 2 𝑠 3 + 3𝑠 2
])[(𝑠 + 1)(𝑠 + 2
17
0 0 0 0 2 0
1 0 0 0 3 0
[ = 𝑇𝐴 = 𝐴′ ] , [ = 𝑇𝐵 = 𝐶′ ] , 𝐶 = 𝐵′𝑇 = [0 0 ]0 1
0 1 0 −2 1 3
0 0 1 −3 0 1
1 2
𝐺(𝑠) = [𝑠 + 1 ]𝑠 + 3
1 1
𝑠+1 𝑠+1
1 2
1 1 1 2𝑠 + 2
= ]𝑤ℎ𝑒𝑟𝑒 𝐺1 = [𝑠 + 1 [ ] 𝑎𝑛𝑑 𝐺2 = [𝑠 + 3] = 2 [ ]
1 𝑠+1 1 1 𝑠 + 4𝑠 + 3 𝑠 + 3
𝑠+1 𝑠+1
حال تحقق هر یک از این سیستمها را مطابق آنچه قبال گفته شد مینویسیم .یعنی:
1
] [ = 𝐴1 = −1 , 𝐵1 = 1 , 𝐶1
1
از کنار هم قرار دادن این سیستمها به فرم زیر ،تحقق سیستم چندورودی-چندخروجی مورد نظر حاصل میشود:
پس:
18
−1 0 0 1 0
1 2 2
𝐴=[ 0 0 ]1 , 𝐵 = [0 ]0 , [=𝐶 ]
1 3 1
0 −3 −4 0 1
اگر بتوان تابع تبدیل را به صورت کسرهای جزئی بسط داده شده مانند
𝑔
𝑖𝜆𝐺(𝑠) = ∑𝑛𝑖=1 𝑠−
𝑖
نوشت ،در این صورت یک تحقق برای تابع تبدیل ،به صورت زیر است:
𝜆1 0 0 𝑏1
𝑥̇ = [ 0 𝑢 ]…[ … 0 ] 𝑥 +
0 𝑛𝜆 0 𝑛𝑏
𝑦 = [𝑐1 … 𝑥] 𝑛𝑐
با توجه به موضوع فوق ،نحوه استخراج تابع تبدیل از یک فضای حالت قطری نیز به سادگی قابل برداشت است.
19
فصل پنجم :تحلیل پایداری
قبالً بر مبنای تابع تبدیل به این نتیجه رسیده بودید که اگر قطبهای سیستم سمت چپ محور موهومی
بسط تحلیل پایداری در مورد سیستمهای غیرخطی و تغییرپذیر با زمان و همینطور ارائه روشهایی که
پایداری را بدون تعیین مقادیر ویژه مشخص میکنند ،اهمیت ویژهای دارد.
ایشان دو روش برای تحلیل پایداری سیستمهای غیرخطی ارائه میکنند .یکی مبتنی بر خطیسازی حول
نقطه تعادل و دیگری یک روش عام تحلیل پایداری .روش دوم یا روش مستقیم لیاپانوف کاربرد گستردهای
در تحلیل و به خصوص طراحی کنترلکننده طی دهههای گذشته پیدا کرده است.
تعریف .نقطه تعادل 𝑒𝑥 نقطهای است که اگر 𝑒𝑥 = ) 𝑥(𝑡0و 𝑢 = 0آنگاه )𝑡(𝑥 برای تمام 𝑡 ≥ 𝑡0همان 𝑒𝑥
خواهد بود.
برای محاسبه نقاط تعادل سیستم فوق کافی است قرار دهیم:
𝑓(𝑥, 𝑢 = 0, 𝑡) = 0
در حقیقت ،نقاط تعادل صفرهای 𝑓 هستند (وقتی ورودی صفر است).
مثال .نقاط تعادل سیستم غیر خطی 𝑢 𝑥̇ = −𝑠𝑖 𝑛(𝑥) +عبارت است از 𝜋𝑛 𝑥𝑒 = ±و … 𝑛 = 0,1,2,
20
واضح است که در یک سیستم خطی ،نقاط تعادل از معادله 𝐴𝑥 = 0به دست میآیند .بنابراین ،مبدأ همواره یک نقطه
میتوان نتیجه گرفت که اگر یک سیستم خطی بیش از یک نقطه تعادل داشته باشد ،بینهایت نقطه تعادل خواهد
داشت.
تعریف پایداری به مفهوم لیاپانوف ( )In the sense of Lyapunovنقطه تعادل 𝑒𝑥 پایدار به مفهوم
لیاپانوف است اگر برای هر ،ε > 0یک δ > 0وجود داشته باشد که اگر ‖𝑥(𝑡0 ) − 𝑥𝑒 ‖ < δبرای همه زمان-
وقتی سیستمی به مفهوم لیاپانوف پایدار است ،این اطیمنان وجود دارد که با انتخاب شرایط اولیه سیستم به اندازه
کافی نزدیک به نقطه تعادل میتوان مانع از دور شدن حالتها بیش از حد مشخصی از نقطه تعادل شد.
این نوع پایداری صورت ضعیفی از پایداری است و عالقمندی ما عالوه بر نزدیک ماندن حالت سیستم به نقطه
تعادل آن است که در انتها سیستم به حالت تعادل خود بازگردد .این عالقمندی به تعریف صورت قویتری از
تعریف پایداری مجانبی ( .)Asymptotic Stabilityنقطه تعادل 𝑒𝑥 پایدار مجانبی است اگر
ثانیاً :وجود داشته باشد یک ρ > 0که اگر ‖𝑥(𝑡0 ) − 𝑥𝑒 ‖ < ρداشته باشیم 𝑙𝑖𝑚𝑡⟶∞ ‖𝑥(𝑡) − 𝑥𝑒 ‖ = 0
فرض کنید 𝑚 ρبزرگترین مقدار ممکن برای ρاست که شرط باال را برآورده میکند .در این صورت به ناحیه
‖𝑥 − 𝑥𝑒 ‖ < ρحوزه جذب سیستم میگویند .ویژگی این ناحیه آن است که اگر حالت اولیه سیستم در
این ناحیه باشد ،حالت نهایی آن همان نقطه تعادل خواهد بود.
عالقمندی ما این است که حوزه جذب سیستم ،تمامی فضای حالت باشد .این عالقمندی به تعریف صورت
21
تعریف پایداری مجانبی جامع (.)Global Asymptotic Stability
از تعریف فوق نتیجه میشود که یک شرط الزم برای پایداری مجانبی جامع یک سیستم آن است که فقط یک
پایداریهای سه نوع فوق ،در حقیقت پایداریهای ورودی صفر یا پایداری از منظر شرایط اولیه میباشند.
تعریف ناپایداری نقطه تعادل :نقطه تعادل سیستم را ناپایدار گویند ،اگر پایدار به مفهوم لیاپانوف نباشد.
تعاریف ارائه شده از پایداری به پایداری داخلی نیز معروفند ،زیرا مبین محدود بودن متغیرهای حالت سیستم
میباشند.
تعریف پایداری ( BIBOورودی محدود-خروجی محدود) :سیستم بدون شرایط اولیه را پایدار BIBOگویند
اگر و فقط اگر به ازای هر ورودی محدود ،خروجی محدود داشته باشد.
پایداری نوع فوق ،در حقیقت پایداری حالت صفر یا پایداری از منظر ورودی میباشد.
تعریف پایدار :Tیک سیستم دینامیکی خطی را پایدار Tگویند ،اگر و فقط اگر برای هر شرط اولیه حالت و هر
دقت نمایید که در مورد سیستمهای غیرخطی به جهت پدیدههای پیچیدهای که ممکن است رخ دهد ،وقتی
صحبت از پایداری است ،در مورد پایداری نقاط تعادل مختلف صحبت میشود ،ولی در مورد سیستمهای
22
پایداری سیستمهای خطی تغییرناپذیر با زمان
به خاطر دارید که پاسخ ورودی صفر یک سیستم خطی تغییرناپذیر با زمان قطریپذیر عبارت بود از:
در صورتی که سیستم قطریپذیر نباشد ،عبارتهایی به صورت 𝑡𝑖𝜆 𝑒 𝑘 𝑡 در پاسخ ظاهر میشود.
الف -تمامی مقادیر ویژه سیستم قسمتهای حقیقی غیرمثبت داشته باشند و
ب -مرتبه بلوک های جردن متناظر با مقادیر ویژه ای که قسمت حقیقی آنها صفر است ،یک باشد.
قضیه .سیستم LTIپایدار مجانبی جامع است اگر و تنها اگر پایدار مجانبی باشد.
میدانید که:
)𝑠(𝑌 1
= 𝐷 = 𝐺(𝑠) = 𝐶(𝑠𝐼 − 𝐴)−1 𝐵 + 𝐵})𝐴 𝐶{𝐴𝑑𝑗(𝑠𝐼 −
)𝑠(𝑈 )𝐴 𝑑𝑒𝑡(𝑠𝐼 −
با توجه به رابطه فوق ،قطبهای یک سیستم ،زیر مجموعهای از مقادیر ویژه آن هستند .از آنجا که شرط پایداری (مجانبی)
BIBOسیستم فوق آن است که تمام قطبهای آن قسمتهای حقیقی منفی داشته باشند ،میتوان نتیجه گرفت که در
مورد سیستمهای LTIپایداری مجانبی ورودی صفر ،پایداری BIBOرا نیز نتیجه میدهد.
23
مثال .سیستم داده شده با معادالت زیر را در نظر بگیرید:
−1 0 0 −1
𝑥̇ = [ 0 −2 𝑢 ] 0] 𝑥 + [ 0
0 0 3 −2
در مورد ،پایداری ،BIBOپایداری از منظر شرایط اولیه ،کنترلپذیری ،رؤیتپذیری ،پایدارپذیری و آشکارپذیری سیستم فوق
بحث کنید.
در این روش ،پایداری نقطه تعادل یک سیستم غیرخطی از طریق خطیسازی سیستم ،حول نقطه تعادل مورد
فرض نمایید ،خطیشده این سیستم حول نقطه تعادل 𝑒𝑥 به صورت زیر باشد:
𝑥𝛿𝐴 = ̇𝑥δ
در این صورت اگر تمامی مقادیر ویژه 𝐴 قسمت حقیقی منفی داشته باشند (پایدار مجانبی باشد) ،نقطه تعادل 𝑒𝑥 مربوط به
oتذکر :1اگر بعضی از مقادیر ویژه 𝐴 روی محور موهومی باشند در حالیکه بقیه مقادیر ویژه ،قسمت حقیقی منفی
داشته باشند ،نمیتوان هیچ نتیجهای در مورد پایداری نقطه تعادل 𝑒𝑥 مربوط به سیستم غیرخطی گرفت.
oتذکر :2اگر 𝐴 تنها یک مقدار ویژه سمت راست محور موهومی داشته باشد ،نقطه تعادل 𝑒𝑥 مربوط به سیستم
24
مثال .به ازای مقادیر مختلف 𝜶 در مورد پایداری نقطه تعادل مبدأ برای سیستم غیرخطی زیر با استفاده از روش
−1 1
[ = 𝑥𝛿𝐴 = ̇𝑥𝛿 𝑥𝛿 ]
𝛼0 −
بنابراین به ازای 𝛼 > 0نقطه تعادل ،پایدار مجانبی بوده ،به ازای 𝛼 = 0نمیتوان نظری داد و به ازای 𝛼 < 0نقطه
25
ادامه فصل پنجم
در این روش ،خطیسازی معادالت غیرخطی صورت نمیگیرد و حتی تعیین مقادیر ویژه برای سیستمهای خطی
این روش برای سیستمهای غیرخطی تغییرپذیر با زمان نیز قابل اعمال است.
مقدمات ریاضی
یک رده از توابع اسکالر که نقش مهمی در تحلیل پایداری بر اساس روش دوم لیاپانوف دارند ،صورتهای درجه
همواره میتوان ،چند جملهای )𝑋(𝑉 را بر حسب ماتریس متقارن 𝑃 به صورت 𝑋𝑃 𝑇 𝑋 بیان کرد.
1
را یکبار به صورت 𝑋𝐴 𝑇 𝑋 که 𝐴 غیرمتقارن و یکبار به صورت 𝑋𝑃 𝑇 𝑋 که 𝑃 متقارن باشد ،بیان نمایید.
1
0 0
2
𝑉(𝑋) = 𝑋 𝑇 𝐴𝑋 = 𝑋 𝑇 0 −1 𝑋 1
2 2
[3 0 ] −
3
1 1
0
2 3
1
𝑉(𝑋) = 𝑋 𝑇 𝑃𝑋 = 𝑋 𝑇 0 −1 𝑋
2
1 1 2
][3 2 − 3
تعریف مثبت معین :تابع اسکالر )𝑋(𝑉 را در محدوده 𝑆 (مثالً محدود 𝑘 < ‖𝑋‖ که شامل مبدأ است) مثبت
2
تعریف نامعین :تابع اسکالر )𝑋(𝑉 را نامعین گویند اگر هر هر دو مقدار مثبت و منفی را در محدوده 𝑆 (مثالً
مثبت معین (مثبت نیمهمعین) است اگر مقادیر ویژه ماتریس متقارن 𝑃 در نمایش 𝑋𝑃 𝑇 𝑋 = )𝑋(𝑉 مثبت
(نامنفی) باشند.
منفی معین (منفی نیمهمعین) است اگر مقادیر ویژه ماتریس متقارن 𝑃 در نمایش 𝑋𝑃 𝑇 𝑋 = )𝑋(𝑉 منفی
(نامثبت) باشند.
نامعین است اگر تعدای از مقادیر ویژه ماتریس متقارن 𝑃 در نمایش 𝑋𝑃 𝑇 𝑋 = )𝑋(𝑉 مثبت و تعدادی منفی
باشند.
کهادهای اصلی مقدم ماتریس 𝑃 ،دترمینان ماتریسهایی هستند که با حذف آخرین 𝑖 𝑛 −ستون و 𝑖 𝑛 −
3
1 1
0
1 2 3
1 | | 1
= Δ1 | , Δ2 = | 2 0 , Δ3 = |𝑃| = 0 −1
2 | | 2
0 −1 1 1 2
−
3 2 3
بنابر قضیه سیلوستر ،با فرض آنکه )𝑋(𝑉 صورت درجه دوم باشد ،اگر
الف ... ،Δ2 > 0 ،Δ1 > 0 -و Δ𝑛 > 0آنگاه )𝑋(𝑉 مثبت معین است.
ب ... ، Δ3 < 0 ،Δ2 > 0 ،Δ1 < 0 -و (−1)𝑛 Δ𝑛 > 0آنگاه )𝑋(𝑉 منفی معین است.
ج 𝑃 -ویژه بوده و Δ𝑖 ≥ 0آنگاه )𝑋(𝑉 مثبت نیمهمعین است( .حداقل یک Δ𝑖 ≠ 0داشته باشیم)
د 𝑃 -ویژه بوده و (−1)𝑖 Δ𝑖 ≥ 0آنگاه )𝑋(𝑉 منفی نیمهمعین است( .حداقل یک Δ𝑖 ≠ 0داشته باشیم)
ه -برای هر 𝑖 داشته باشیم Δ𝑖 = 0آنگاه 𝑉(𝑋) ≠ 0ممکن است مثبت نیمهمعین یا منفی نیمهمعین باشد.
4
حالت (ب) و لذا )𝑋( 𝑉1منفی معین است.
حالت (ه) و لذا اظهار نظر قطعی از طریق قضیه سیلوستر امکانپذیر نیست .از طریق مقادیر ویژه 𝜆1 = 0 ،و 𝜆2 = 1و لذا،
آقای لیاپانوف با تکیه بر یک اصل مهم از تئوری مکانیک کالسیک ،به این نتیجه رسید که اگر حوالی نقاط تعادل
سیستم ،انرژی دخیره سیستم به طور پیوسته کاهشی باشد ،نقطه تعادل پایدار مجانبی است.
در حقیقت اگر انرژی ذخیره سیستم در حوالی نقطه تعادل آن به مرور زمان کاهش یافته تا اینکه سرانجام به
حداقل مقدار آن (صفر) در حالت تعادل برسد ،آن نقطه تعادل پایدار مجانبی است.
مشکل اصلی اینجا بود که تعریف تابع انرژی برای سیستمهای فیزیکی همیشه کار سادهای نیست .لیاپانوف نشان
داد که هر تابعی مشابه تابع انرژی نیز میتواند جایگزین تابع انرژی انتخاب شود .به بیان دیگر ،اگر تابع انرژی یا
5
شبه انرژی سیستم در حوالی نقطه تعادل آن به طور پیوسته کاهشی باشد ،آن نقطه تعادل پایدار مجانبی است .به
تابع شبه انرژی ،تابع اسکالری است که مقدار آن در نقطه تعادل صفر بوده و در بقیه نقاط پیرامون نقطه تعادل
مثبت باشد.
قضیه .نقطه تعادل مبدأ پایدار مجانبی است اگر تابع اسکالری مانند )𝑋(𝑉 وجود داشته باشد که در محدودهای
𝑥̇ 2 = 𝑥1 𝑥2 − 𝑥2 3
1 2
= )𝑋(𝑉 𝑥 + 𝑥2 2
2 1
𝑉̇ (𝑋) = 𝑥1 𝑥̇ 1 + 2𝑥2 𝑥̇ 2 = 𝑥1 (−𝑥1 − 2𝑥2 2 ) + 2𝑥2 (𝑥1 𝑥2 − 𝑥2 3 ) = −𝑥1 2 − 2𝑥2 4
مشاهده میشود که )𝑋(̇𝑉 منفی معین است و لذا نقطه تعادل مبدأ ،پایدار مجانبی است.
قضیه .نقطه تعادل مبدأ پایدار به مفهوم لیاپانوف است اگر تابع اسکالری مانند )𝑋(𝑉 وجود داشته باشد که در
6
قضیه .نقطه تعادل مبدأ پایدار مجانبی است اگر تابع اسکالری مانند )𝑋(𝑉 وجود داشته باشد که در محدودهای
ثالثاً 𝑉̇(𝑋) = 0 :با توجه به معادالت حالت سیستم ،صرفاً در نقطه تعادل اتفاق بیفتد.
𝑥̇ 1 = 𝑥2
) 𝑉̇ (𝑋) = 2𝑥1 3 𝑥̇ 1 + 2𝑥1 𝑥̇ 1 + 𝑥2 𝑥̇ 2 = 2𝑥1 3 (𝑥2 ) + 2𝑥1 (𝑥2 ) + 𝑥2 (−2𝑥1 − 3𝑥2 − 2𝑥1 3
مشاهده میشود که )𝑋(̇𝑉 منفینیمهمعین است و لذا طبق قضیه ،نقطه تعادل مبدأ ،پایدار به مفهوم لیاپانوف است.
از طرفی:
𝑥̇ 1 = 0
{
0 = −2𝑥1 − 2𝑥1 3
7
که نیتجه میدهد .𝑥1 = 0مشاهده میشود که 𝑉̇(𝑋) = 0با توجه به معادالت حالت سیستم ،صرفاً در نقطه تعادل اتفاق
میافتد و لذا نقطه تعادل مبدأ ،نوع قویتر پایداری ،یعنی پایداری مجانبی را نیز دارد.
قضیه .یک سیستم پایدار مجانبی جامع است اگر و فقط یک نقطه تعادل داشته و تابع اسکالری مانند )𝑋(𝑉
ثانیاً :مشتق زمانی آن یعنی )𝑋( ̇𝑉 منفی معین باشد( .یا مشتق زمانی آن منفی نیمهمعین باشد و 𝑉̇ (𝑋) = 0
با توجه به معادالت حالت سیستم ،صرفاً در نقطه تعادل اتفاق بیفتد).
مثال .در مورد پایداری نقطه تعادل مبدأ ،برای سیستم غیرخطی زیر بحث کنید.
𝑉(𝑋) = 𝑥1 2 + 𝑥2 2
خواهیم داشت:
8
مشتق تایع لیاپانوف منفی معین خواهد بود.
بنابراین ،نقطه تعادل مبدأ ،پایدار مجانبی بوده و ناحیه داخل دایره واحد ،بخشی از حوزه جذب این سیستم است.
قضیه .نقطه تعادل مبدأ یک سیستم (بدون ورودی) ناپایدار است ،اگر تابع اسکالری مانند )𝑋(𝑉 وجود داشته
مثال .در مورد پایداری نقطه تعادل مبدأ ،برای سیستم غیرخطی زیر بحث کنید.
نکته مهم :پیدا کردن یک تابع لیاپانوف که در شرایط پایداری صدق کند بدان معنی است که سیستم پایدار است،
اما عدم توانایی در پیدا کردن تابع مورد نظر به معنای عدم وجود آن یا به معنای ناپایداری سیستم نیست .به بیان
دیگر ،روش دوم لیاپانوف یک شرط کافی و نه الزم برای پایداری ارئه میدهد.
در اینجا برای سیستم خطی زیر ،روش دوم تحلیل پایداری ،به صورت پارامتری ارائه میشود.
𝑥𝐴 = ̇𝑥
9
تابع لیاپانوف کاندید را به صورت زیر انتخاب میکنیم:
𝑥𝑃 𝑇 𝑥 = )𝑥(𝑉
که در آن 𝑃 یک ماتریس متقارن مثبت معین باشد.
ب -اگر 𝑄 مثبت نیمهمعین باشد ،نقطه تعادل مبدأ پایدار به مفهوم لیاپانوف است.
ج -اگر 𝑄 مثبت نیمهمعین بوده و 𝑉̇(𝑋) = 0با توجه به معادالت حالت سیستم ،صرفاً در نقطه تعادل مبدأ اتفاق بیفتد،
جالب است بدانید که اگر روش دوم لیاپانوف را در مورد سیستمهای خطی تغییرناپذیر با زمان به صورت بر عکس
انجام دهیم ،به کمک یک قضیه ،میتوان شرط الزم و کافی برای پایداری مجانبی به دست آورد.
oمراحل ارائه تحلیل قطعی در مورد پایداری مجانبی یک سیستم LTIبا استفاده از تلفیق روش دوم لیاپانوف و یک
قضیه
گام دوم :حل معادله 𝑄 𝐴𝑇 𝑃 + 𝑃𝐴 = −برای 𝑃( .این معادله ،معروف به معادله لیاپانوف است)
قضیه .شرط الزم و کافی برای پایداری مجانبی سیستم آن است که پاسخ معادله لیاپانوف (𝑃) یکتا و مثبت معین باشد.
10
گام چهارم :نتیجهگیری در مورد پایداری مجانبی با استناد به قضیه فوق
مثال .در مورد پایداری سیستم خطی زیر با استفاده از روش دوم لیاپانوف اظهار نظر کنید.
−1 4
[ = ̇𝑥 𝑥]
0 −2
1
= )𝑋(𝑉 ) (𝑥 2 + 𝑥2 2
2 1
خواهیم داشت:
برای تعیین عالمت )𝑋(̇𝑉 کافی است عالمت کهادهای اصلی مقدم ماتریس زیر را بررسی نماییم.
−1 2
[=𝑀 ]
2 −2
داریم:
∆1 = −1 < 0 , ∆2 = −2 < 0
پس )𝑋(̇𝑉 نامعین بوده و لذا نمیتوان در مورد پایداری اظهار نظر کرد.
𝐼=𝑄
گام دوم :حل معادله 𝑄 𝐴𝑇 𝑃 + 𝑃𝐴 = −برای 𝑃
1 2
] ⟹ 𝑃 = [2 3
2 19
3 12
و:
11
1 25
= ∆1 = > 0 , ∆2 >0
2 72
پس 𝑃 مثبت معین بوده و لذا سیستم ،پایدار مجانبی است.
مقدمه
میدانیم که در حالت کلی ،اطالعات موجود در خروجیهای یک سیستم ،زیرمجموعهای از اطالعات موجود در
دیدیم که بر اساس تجزیه کالمن مربوط به فضای حالت ،تمام اطالعات جاری سیستم ،در متغیرهای حالت آن
موجودند و لذا هر هدف کنترلی که با بهرهگیری از متغیرهای حالت قابل انجام نباشد ،با روش دیگری مانند بهره-
به بیان دیگر ،ممکن است هدف کنترلی که با فیدبک خروجی و مشتقات باالتر آن در عمل قابل تحقق نیست ،با
کنترلکننده فیدبک حالت پایدارساز در حالت کلی به صورت )𝑥(𝑔 𝑢 = −و در حالت خطی که موضوع این
درس است به صورت 𝑥𝑘 𝑢 = −است .بدیهی است که 𝑘 برای یک سیستم تک ورودی یک بردار سطری است.
12
روشهای تعیین بردار بهره فیدبک حالت (سیستم تک ورودی)
روش سنتی :فرض کنید مقادیر ویژه سیستم زیر ،سمت راست محور موهومی بوده و یا در محلهایی قرار گرفته
اگر ورودی کنترل 𝑥𝑘 𝑢 = −به سیستم اعمال شود ،خواهیم داشت:
𝑥)𝑘𝐵 𝑥̇ = 𝐴𝑥 + 𝐵(−𝑘𝑥) = (𝐴 −
مقادیر ویژه سیستم حلقهبسته ریشههای چندجملهای })𝑘𝐵 𝑑𝑒𝑡{𝜆𝐼 − (𝐴 −میباشند .در حقیقت ،با انتخاب مناسب
بردار 𝑘 امکان قراردادن مقادیر ویژه سیستم حلقهبسته در نقاط مطلوب وجود دارد .اصطالح کنترلکننده جایاب مقادیر ویژه
(جایاب قطب) نیز به همین جهت به این نوع کنترلکننده اطالق میشود.
13
طبیعی است که اگر سیستم کنترلپذیر کامل حالت نباشد ،اثر گذاری روی بعضی از حالتها از طریق ورودی
کنترل و به بیان دیگر جابجایی بعضی از مودها یا مقادیر ویژه امکانپذیر نیست .به بیان دیگر ،ممکن است 𝑘ای
توجه دارید که اگر مودهای ناپایدار یک سیستم کنترلپذیر باشند (سیستم پایدار پذیر باشد) امکان پایدارسازی از
طریق فیدبک حالت وجود خواهد داشت .به بیان دیگر𝑘 ،ای برای رسیدن به پایداری وجود دارد.
مثالی برای روشن شدن مطلب :تصور نمایید مقادیر ویژه یک سیستم -2 ،-1و 3باشند .بررسی کنترلپذیری
نشان داده است که مود -1کنترلناپذیر است ،ولی مودهای -2و 3کنترلپذیرند .طبیعی است جایابی مقادیر ویژه
این سیستم در نقاط a ،-1و bامکانپذیر است .با انتخاب aو bدر سمت چپ ،میتوان این سیستم را از طریق
−1 ± 𝑗1.414قرار گیرند.
حل.
0 1
𝐵[ = 𝑐Φ [ = ] 𝐵𝐴 ]
1 0
بنابراین ،مسأله جواب دارد.
با توجه به محل مقادیر ویژه مطلوب ،چند جملهای مشخصه مطلوب سیستم حلقهبسته عبارت است از:
14
α(λ) = (𝜆 + 1 − 𝑗1.414) = (𝜆 + 1 + 𝑗1.414) = 𝜆2 + 2𝜆 + 3 )(2
قضیه .بهره فیدبک حالت 𝑘 در قانون کنترل 𝑥𝑘 𝑢 = −برای جایابی دلخواه مقادیر ویژه سیستم حلقهبسته از رابطه زیر
اوالً:
α = [𝛼𝑛−1 𝛼𝑛−2 … ] 𝛼0
و:
α(𝜆) = 𝜆𝑛 + 𝛼𝑛−1 𝜆𝑛−1 + 𝛼𝑛−2 𝜆𝑛−2 + ⋯ + 𝛼0
چند جملهای مشخصه مطلوب سیستم حلقهبسته است.
ثانیاً:
𝑎 = [𝑎𝑛−1 𝑎𝑛−2 … ] 𝑎0
و:
a(𝜆) = 𝜆𝑛 + 𝑎𝑛−1 𝜆𝑛−1 + 𝑎𝑛−2 𝜆𝑛−2 + ⋯ + 𝑎0
چند جملهای مشخصه سیستم حلقهباز است.
ثالثاً:
1 𝑎𝑛−1 𝑎𝑛−2 … 𝑎1
0 1 𝑎𝑛−1 … 𝑎2
Ψ= 0 1 … …
… ⋱ 𝑎𝑛−1
[0 0 … 0 ] 1
15
و 𝑐𝜑 هم ماتریس کنترلپذیری سیستم (حلقهباز) است.
از فرمول بسگیورا پیداست که اگر قصد جابجایی زیاد مقادیر ویژه را داشته باشیم ،سیگنال کنترلی یا همان تالش
کنترلی بزرگ خواهد شد .این بزرگی سیگنال کنترل ممکن است منجر به اشباع عملگرهای سیستم کنترل شود
که پیامد آن میتواند کاهش عملکرد سیستم حلقهبسته و حتی ناپایداری آن باشد.
از فرمول بسگیورا پیداست که هر چه کنترلپذیری سیستم ضعیفتر باشد ،تالش کنترلی بزرگ خواهد شد که
-2روش آکرمن
قضیه .بهره فیدبک حالت 𝑘 در قانون کنترل 𝑥𝑘 𝑢 = −برای جایابی دلخواه مقادیر ویژه سیستم حلقهبسته از رابطه زیر
از فرمول آکرمن پیداست که برای استفاده از این فرمول ،نیازی به دانستن چندجملهای مشخصه سیستم (حلقهباز)
نیست .هر چند یافتن )𝐴(𝛼 به صورت دستی کمی زمانبر است.
قضیه .بهره فیدبک حالت 𝑘 در قانون کنترل 𝑥𝑘 𝑢 = −برای جایابی دلخواه مقادیر ویژه سیستم حلقهبسته از رابطه زیر
16
و 𝑐𝑐 Φماتریس کنترلپذیری تحقق کانونیک کنترلکننده است.
و
24 48 −24
3 2
𝛼(𝐴) = 𝐴 + 6𝐴 + 11𝐴 + 6𝐼 = [−26 −28 ] 26
−52 −56 52
17
پس:
24 48 −24
𝑇
𝑘 = 𝑞3 𝛼(𝐴) = [0.0278 0.1111 ]
−0.1389 [−26 ]−28 26 ] = [5 6 −5
−52 −56 52
و لذا:
0 0 1
Φ𝑐𝑐 = [𝐵′ 𝐴′𝐵′ ]𝐴′2 𝐵′] = [0 1 0
1 0 3
و:
𝑘𝑐 = [𝛼0 − 𝑎0 𝛼1 − 𝑎1 𝛼2 − 𝑎2 ] = [4 14 ]6
پس:
فرمولهای ارائه شده ،صرفاً در زمانی که سیستم کنترلپذیر کامل حالت باشد ،قابل استفادهاند .اما این بدان معنی
نیست که اگر سیستم کنترلپذیر کامل حالت نباشد ،مسأله طراحی کنترلکننده جواب ندارد.
در شرایطی که سیستم کنترلپذیر کامل حالت نیست ،ولی مسأله طراحی جواب دارد ،میتوان از روش سنتی
استفاده کرد.
میتوان نشان داد در اثر فیدبک حالت صفرهای سیستم جابه جا نمیشوند .همچنین فیدبک حالت ،کنترل-
پذیری سیستم را تحت تأثیر قرار نمیدهد و رؤیتپذیری نیز مشروط به عدم جایابی مقادیر ویژه در محل
18
جالب است بدانید در سسیتمهای چندورودی ،فیدبک حالت برای جایابی مقادیر ویژه سیستم در مکانهای معین
(معموالً) یکتا نیست و به بیان دیگر ،در انتخاب مقادیر بهره فیدبک حالت ،درجه آزادی وجود دارد که از این درجه
آزادی به صورتهای مختلفی میتوان در جهت بهبود عملکرد سیستم حلقهبسته بهره جست که موضوع بحث ما
نیست.
−1 ± 𝑗1.414قرار گیرند.
حل.
با توجه به محل مقادیر ویژه مطلوب ،چند جملهای مشخصه مطلوب سیستم حلقهبسته عبارت است از:
𝑘 𝑘
با انتخاب ] 𝑘 = [𝑘1 𝑘2خواهیم داشت:
3 4
با مقایسه ( )1و ( )2دو درجه آزادی در حل مسأله وجود دارد و هر یک از ماتریسهای بهره حالت زیر ،جواب مسألهاند:
19
طراحی سیستمهای ردیاب با استفاده از فیدبک حالت
در برخی از کاربردهای صنعتی ،هدف اصلی از طراحی سیستم کنترل صرفاً پایدارسازی (بازگشت سیستم به نقطه
-1در سیستمهای قدرت معموالً هدف آن است که نوسانات ایجاد شده پس از بروز اغتشاش میرا گردند.
-2در برخی موشکها ،بخشی از سیستم کنترل موشک وظیفه میراکردن حرکات چرخشی موشک را که در اثر
-3در آونگ معکوس ،هدف از طراحی کنترلکننده ،پایدارسازی نقطه تعادل آونگ و به بیان دیگر بازگشت
سیستم به این نقطه بعد از انحرافات ایجاد شده توسط اغتشاشات احتمالی است.
به نمونههای ذکر شده و بسیاری از مثالهای دیگر ،سیستمهای رگوالتور یا پایدارساز گفته میشود .میتوان گفت،
سیستمهای صنعتی فراوانی میتوان نام برد که در آنها عالوه بر پایدارسازی هدف دیگری به نام ردیابی نیز وجود
-2در کورههای صنعتی ،درجه حرارت داخل کوره باید یک پروفایل حرارتی مشخص را به خوبی دنبال کند.
میدانیم که در یک سیستم ( )LTIپایدار (مجانبی) ،پاسخ ،در حالت ماندگار ،مشابه ورودی (ماندگار) است.
با استفاده از نکته فوق یک روش طراحی ردیاب مقدار ثابتی مانند 𝑟 آن است که ابتدا قانون کنترل به صورت
20
سپس 𝑘 به گونهای طراحی شود که سیستم حلقهبسته پایدار باشد و بعد از آن ،مقدار ثابت 𝐹 به گونهای طراحی
شود که شرط ردیابی محقق گردد .چرا با این ساختار امکان تحقق شرط ردیابی وجود دارد؟
چون سیستم فوق پایدار است (چرا؟) ،حالتها و خروجی سیستم در حالت ماندگار برابر یک مقدار ثابت خواهند بود (چرا؟)
کافی است 𝐹 به گونهای انتخاب شود که مقدار ثابت خروجی در حالت ماندگار همان 𝑟 باشد.
به این 𝐹 ،پیشجبرانساز استاتیکی نیز گفته میشود .علت این نامگذاری و توجیه نتیجه به دست آمده یعنی
21
𝒖′
تذکر اول :واضح است که اگر سیستم حلقهباز صفری در مبدأ داشته باشد ،این روش جوابگو نیست.
تذکر دوم :محاسبه انجام شده ،به سادگی قابل تعمیم به سیستمهای چندورودی-چندخروجی ،مشروط به برابری تعداد
ورودیها و خروجیها نیز میباشد .در آن شرایط 𝐺𝑐𝑙 ،ماتریس تابع تبدیل سیستم حلقهبسته بوده و همچنان:
ایده روش دوم ،برگرفته از این واقعیت است که اگر تابع تبدیل حلقهباز یک قطب در مبدأ داشته باشد
خطای ماندگار به ورودی مرجع ثابت ،نخواهیم داشت( .به شرط پایداری سیستم حلقهبسته)
ابتدا حالت جدیدی به نام حالت انتگرالی به صورت زیر تعریف میکنیم:
و لذا معادالت حالت سیستم افزوده ،به صورت زیر قابل بیان است:
22
̇𝑥 𝐴 𝑥 0 𝐵 0
[=] [ 𝑟 ] [ ] [𝑞 ] + [ ] 𝑢 +
̇𝑞 𝐶⏟− 0 ⏟
0 1
𝐴′ 𝐵′
𝑥
𝐶⏟[ = 𝑦 ] 𝑞[ ]0
𝐶′
میتوان نشان داد که سیستم فوق ،کنترلپذیر کامل حالت اگر رتبه ماتریس
𝐵 𝐴
[ ]
0 𝐶−
کامل باشد.
در حالت فوق ،طبعاً میتوان در قانون کنترل 𝑞 𝐾1 ،𝑢 = −𝐾𝑥̂ = −𝐾1 𝑥 + 𝐾2و 𝐾2را به گونهای یافت که
سیستم حلقهبسته پایدار باشد .با اعمال ورودی پایدارساز به سیستم ،خواهیم داشت:
̇𝑥 𝐴 − 𝐵𝐾1 𝑥 𝐵𝐾2 0
[=] [ 𝑟] [][ ] +
̇𝑞 𝐶⏟ − 𝑞 0 ⏟1
𝐴′′ 𝐵′′
طبق این اصل که در یک سیستم ( )LTIپایدار (مجانبی) ،پاسخ ،در حالت ماندگار ،مشابه ورودی (ماندگار) است
خواهیم داشت:
𝒓 = ∞𝒚 ⟹ 𝑞∞ = 𝑎 ⟹ 𝑞̇ ∞ = 𝑟 − 𝑦∞ = 0
23
مهمترین مزیت روش دوم ،مقاومت باالتر سیستم حلقهبسته در مقابل تغییر پارامترها و همچنین دفع
معادالت حالت سیستم در معرض اغتشاش ثابت dرا به صورت زیر در نظر بگیرید:
𝑑 𝑥̇ = 𝐴𝑥 + 𝐵𝑢 +
با اعمال کنترلکننده اول به سیستم خواهیم داشت:
𝑑 𝑥̇ = 𝐴𝑥 + 𝐵(𝐹𝑟 − 𝑘𝑥) + 𝑑 = (𝐴 − 𝐵𝑘)𝑥 + 𝐵𝐹𝑟 +
به دلیل پایداری خواهیم داشت:
𝑑 𝑥∞ = −(𝐴 − 𝐵𝑘)−1 𝐵𝐹𝑟 − (𝐴 − 𝐵𝑘)−1
و لذا:
مشاهده میشود که در روش دوم ،اثر اغتشاش ثابت 𝑑 در خروجی ماندگار مشاهده نمیشود.
سادهتر بودن طراحی و پیادهسازی را شاید بتوان به عنوان مزیت روش اول در قیاس با روش دوم برشمرد.
تمرین .یک ردیاب شیب 𝑡𝛼 = )𝑡(𝑟 با استفاده از ایده روش اول ،طراحی نمایید.
24
ادامه فصل ششم
مثال .معادالت حرکت طولی یک هواپیما به صورت زیر داده شده است:
که در آن
𝑣∆[ = 𝑥 𝛼 𝜃 ]𝑞 , 𝐸𝛿 = 𝑢
و:
𝑣∆ تغییر سرعت 𝛼 ،انحراف زاویه حمله (زاویه بردار سرعت با محور طولی) 𝜃 ،انحراف زاویه پیچ (زاویه محور طولی نسبت
به افق) ،و 𝑞 سرعت تغییر زاویه پیچ است 𝛿𝐸 .نیز انحراف باالبری است که به دم هواپیما متصل بوده و به عنوان عملگر
مقادیر پارامترها در شرایط عملیاتی موقعیت فرود در یک هواپیمای AFTI-16به قرار زیر است:
1
قطبهای سیستم حلقهباز در نقاط زیر قرار دارند.
برای محاسبه نرمافزاری محل قطبها به سادگی میتوان از دستور )𝐴(𝑔𝑖𝑒 استفاده کرد.
رتبه این ماتریس چهار بوده و لذا سیستم کنترلپذیر کامل حالت است.
برای محاسبه نرمافزاری این ماتریس و رتبه آن به سادگی میتوان از دستور )𝐵 𝑐𝑡𝑟𝑏(𝐴,و ))𝐵 𝑅𝑎𝑛𝑘(𝑐𝑡𝑟𝑏(𝐴,
استفاده کرد.
برای محاسبه نرمافزاری این بردار به سادگی میتوان از دستور )𝑃 𝑃𝑙𝑎𝑐𝑒(𝐴, 𝐵,استفاده کرد که 𝑃 باید قبل از دستور به
سپس ورودی کنترل 𝑥𝑘 𝑢 = −به سیستم اعمال شده و پاسخ سیستم حلقهبسته برای شرایط اولیه
𝑥(0) = [0 1 𝑇]0 0
در ادامه رسم شده است .مطابق انتظار بعد از گذشت زمانی ،تمامی متغیرهای حالت به صفر میرسند.
2
حال فرض نمایید ،بخواهیم سرعت طولی به میزان دلخواه 𝑟 تغییر کند .یعنی میخواهیم
𝑦 = [1ورودی مرجع 𝑟 را دنبال کند .با استفاده از روش اول طراحی ردیاب ،یعنی پیشجبران- 0 0 𝑥]0
و لذا:
𝒓𝟑𝟓𝟔𝟗 𝑢 = −𝑘𝑥 + 𝐺𝑐𝑙 −1 (0)𝑟 = −𝟎. 𝟗𝟐𝒙𝟏 + 𝟔. 𝟓𝟗𝟓𝒙𝟐 + 𝟐. 𝟑𝟓𝟏𝒙𝟑 + 𝟖. 𝟗𝟕𝟕𝒙𝟒 + 𝟎.
3
برای همین هواپیما ،قصد داریم کنترلکننده ردیاب انتگرالی را طراحی میکنیم.
شرط کنترلپذیری سیستم افزوده عبارت بود از رتبه کامل بودن ماتریس
که رتبه آن پنج بوده و لذا سیستم افزوده کنترلپذیر کامل حالت است.
4
}{−0.9, −1, −1.6, −2, −2.5
خواهیم داشت:
𝑥
𝑢 = [−𝐾1 𝑞𝐾2 ] [𝑞 ] = 1.3227𝑥1 − 11.5516𝑥2 − 3.7152𝑥3 − 15.3929𝑥4 − 0.4368
5
پاسخ پله سیستم حلقهبسته در حضور اغتشاش پلهای ] 𝑑 = [1 0 0 0در شکلهای زیر رسم شده است و
توانایی این سیستم در دفع اثر اغتشاش ثابت نمایش داده شده است.
6
فصل هفتم :طراحی رؤیتگر و تلفیق آن با سیستم کنترل
برای پیادهسازی قانون کنترل 𝑥𝑘 𝑢 = −در حالت کلی الزم است کلیه متغیرهای حالت برای فیدبک در دسترس
باشند.
در بسیاری از کاربردهای واقعی ممکن است به علت تعداد زیاد متغیرهای حالت ،اندازهگیری تمامی آنها دشوار
باشد و یا سنسور اندازهگیری متغیری خاص گرانقیمت بوده و لذا استفاده از سنسور صرفه اقتصادی نداشته باشد.
در چنین مواردی به دلیل عدم دسترسی به تمام متغیرهای حالت برای فیدبک ،تخمین آنها ضرورت پیدا میکند.
رؤیتگر ،سیستمی دینامیکی است که ورودیهای آن ورودی و خروجی سیستم اصلی و خروجی آن متغیرهای
لیونبرگر نشان داد که برای هر سیستم خطی رؤیتپذیر میتوان رؤیتگری طراحی نمود که خطای تخمین حالت
7
سؤال اینجاست که آیا با انتخاب مقادیر مناسب برای ̂𝐴 𝐵̂ ،و 𝐿 این امکان وجود دارد که حالتهای سیستم ( )1یعنی ̂𝑥 بعد
از گذشت زمانی محدود به سمت حالتهای سیستم اصلی یعنی 𝑥 میل کنند؟
اگر چنین انتخابی وجود داشته باشد ،سیستم دینامیکی ( )2به ازای آن انتخاب ،یک رؤیتگر حالت برای سیستم
برای تحقق هدف فوق ،کافی است ̂𝑥 𝑒 = 𝑥 −بعد از گذشت زمانی محدود صفر شود .با توجه به رابطه (*) و
( ،)2داریم:
یعنی:
𝑒)𝐶𝐿 𝑒̇ = (𝐴 −
و اگر 𝐿 به گونهای انتخاب شود که مقادیر ویژه 𝐶𝐿 𝐴 −سمت چپ محور موهومی باشند ،خطای تخمین با گذشت زمانی
محدود به صفر خواهد رسید و هدف مورد نظر محقق خواهد شد .بنابراین ،دینامیک رؤیتگر حالت خطی برای سیستم اصلی
که در آن 𝐿 باید به گونهای انتخاب شود که مقادیر ویژه 𝐶𝐿 𝐴 −سمت چپ محور موهومی باشند.
𝒙𝑨 = ̇̂
𝒙 𝒙𝑪 ̂ + 𝑩𝒖 + 𝑳(𝒚 −
)̂
8
شرط الزم و کافی برای وجود بهره 𝐿 به گونهای که مقادیر ویژه 𝐶𝐿 𝐴 −در نقاط دلخواه قرار گیرند آن است که
برای آنکه سرعت تخمین حالتها بیشتر شود ،باید 𝐿 را به گونهای انتخاب کرد که مقادیر ویژه 𝐶𝐿 𝐴 −خیلی
دور از محور موهومی باشند .البته باید توجه داشت که دور کردن مقادیر ویژه از محور موهومی ،رؤیتگر را به نویز
انداهگیری بسیار حساس میکند .لذا در کاربردهای عملی باید از فیلتری استفاده کرد که مصالحهای بین سرعت
تخمین و اثر نویز برقرار میکند .نمونهای از این دست رؤیتگرها ،فیلتر کالمن است که رؤیتگری بهینه بوده و در
𝐶 ⏟𝑇 −
𝐴( 𝑑𝑒𝑡(𝜆𝐼 − (𝐴 − 𝐿𝐶)) = 𝑑𝑒𝑡 (𝜆𝐼 − )) 𝑇⏟𝐿 𝑇⏟
𝐴′ 𝐵′ 𝐾′
میتوان به این نکته جالب رسید که طراحی بهره رؤیتگر 𝐿 برای یک سیستم همان طراحی بهره فیدبک حالت 𝑇𝐿 برای
9
همچنین میتوان گفت جفت )𝐶 (𝐴,رؤیتپذیر است ،اگر و تنها اگر جفت ) 𝑇 𝐶 (𝐴𝑇 ,کنترلپذیر باشند.
تذکر مهم :طبق تعریف ،سیستمی آشکارپذیر بود که مودهای ناپایدار آن رؤیتپذیر باشند .علت این نامگذاری در
اینجا قابل توضیح است .اگر سیستمی آشکارپذیر باشد ،میتوان بهره 𝐿 را به گونهای یافت که مقادیر ویژه
𝐶𝐿 𝐴 −سمت چپ محور موهومی قرار گیرند واین بدان معنی است که امکان تخمین حالتهای چنین سیستمی
وجود دارد.
بنابراین ،حتی اگر سیستمی رؤیتناپذیر باشد به شرط آشکارپذیری امکان تخمین حالتهای آن وجود دارد .نکته
اینجاست که سرعت تخمین حالتهای چنین سیستمی را نمیتوان به مقدار دلخواه باال برد ،در حالیکه در مورد
رؤیتگری که در بخش قبل طراحی شد به دلیل آنکه تمامی متغیرهای حالت را تخمین میزد ،رؤیتگر مرتبه کامل
نام داشت.
تخمین متغیرهای حالت میتواند با استفاده از رؤیتگر مرتبه پایینتر در کنار استفاده مستقیم از خروجی سیستم
انجام شود.
لینوبرگر پیشنهاد داد که در گام اول به جای تخمین 𝑥 که دارای nعنصر است ،یک ترکیب خطی از متغیرهای
حالت یعنی 𝑥𝐿 = 𝑧 که 𝐿 یک ماتریس 𝑛 × )𝑙 (𝑛 −است تخمین زده شود( .طبعاً 𝑧 دارای 𝑙 𝑛 −عنصر است
در گام دوم با توجه به آنکه 𝑥𝐶 = 𝑦 میتوان گفت بعد از گذشت زمانی:
𝑦 𝐶
𝑥] [ = ] [
𝑧 𝐿
و مشروط به آنکه 𝐿 به گونهای انتخاب شده باشد که ] 𝐶[ معکوسپذیر باشد ،میتوان گفت بعد از گذشت زمانی:
𝐿
𝑦 𝐶 −1
] [ ] [=𝑥
𝐿 𝑧
و اگر
10
𝐶 −1 ] 𝐹2
[ ] = [𝐹1
𝐿
میتوان گفت ،بعد از گذشت زمانی:
𝑧 𝑥 = 𝐹1 𝑦 + 𝐹2
یعنی 𝑥 ⟶ 𝑧 𝐹1 𝑦 + 𝐹2یا
𝒛 𝟐 𝑭 ̂ = 𝑭𝟏 𝒚 +
𝒙
معادله دینامیکی رؤیتگر مرتبه کاهشی لیونبرگر به صورت زیر است:
11
گام اول :ماتریس مربعی 𝑙 𝐷𝑛−با تعیین مقادیر ویژه رؤیتگر تعیین میکنیم( .معموالً به صورت قطری که عناصر
𝐷 = 𝐴̃11 + 𝐿̃𝐴̃21
گام پنجم :یافتن 𝑙 𝑇𝑛−𝑙,از رابطه زیر
12
تذکر :فرایند طراحی که گام های آن در باال اشاره شد ،باعث برقراری رابطه
𝐶𝑇 = 𝐿𝐷 𝐿𝐴 −
میگردد .چرایی برقرار شدن این رابطه را در ادامه بررسی میکنیم.
از طرفی:
𝑙𝑇𝐶𝑄 = 𝑇[0𝑙,𝑛− 𝐼𝑙 ] = [0 ]T )(2
با مقایسه ( )1و (:)2
𝐶𝑇 = 𝐿𝐷 (𝐿𝐴 − 𝐷𝐿)𝑄 = 𝑇𝐶𝑄 ⟹ 𝐿𝐴 −
13
مثال .برای سیستم آونگ معکوس موجود در کتاب فرایندهای زیر انجام شده است:
-2خطیسازی سیستم حول نقطه تعادل (وضعیتی که آونگ رو به باال با زاویه 90درجه نسبت به افق قرار گرفته
است)
-4طراحی کنترلکننده فیدبک حالت و پایدارسازی سیستم خطی و نتیجهگیری پایداری مجانبی سیستم غیرخطی با
همانطور که مشاهده میشود برای پیادهسازی این سیستم کنترل ،احتیاج به مقادیر موقعیت و سرعت ارابه و همچنین زاویه
حال سؤال اساسی اینجاست که آیا صرفاً با استفاده از یک سنسور موقعیت ارابه ،پیادهسازی این سیستم کنترل
امکانپذیر است؟
اگر این سیستم ،رؤیتپذیر باشد ،امکان تخمین حالتهای سیستم با سرعت دلخواه وجود خواهد داشت.
14
𝐶
𝐴𝐶
] Φ𝑜 = [ 2
𝐴𝐶
𝐶𝐴3
رتبه این ماتریس بررسی شده و کامل بوده است و این به معنای رؤیتپذیری این سیستم است.
بنابراین میتوان بهره 𝐿 را به گونهای یافت که مقادیر ویژه 𝐶𝐿 𝐴 −سمت چپ محور موهومی باشند .یک
شده است:
15
طراحی رؤیتگر مرتبه کاهشی برای سیستم آونگ
در اینجا فرض میکنیم موقعیت گاری و زاویه آونگ یعنی 𝑥1و 𝑥3اندازهگیری شدهاند .پس:
1 0 0 0
[=𝐶 ]
0 0 1 0
گام اول :انتخاب 𝐷
𝟎𝟏− 𝟎
[=𝑫 ]
𝟎 𝟎𝟏−
گام دوم :انتخاب 𝑄 به گونهای که
𝑙𝐶𝑄 = [0𝑙,𝑛− ] 𝑙𝐼
یک انتخاب به صورت زیر است:
0 0 1 0
1 0 0 0
[=𝑄 ]
0 0 0 1
0 1 0 0
گام سوم :محاسبه ماتریس ̃𝐴 از رابطه زیر
𝐷 = 𝐴̃11 + 𝐿̃𝐴̃21
پس:
−10 0
[ = ̃𝐿 ]
0 −10
16
𝑙𝐿 = [𝐼𝑛− 𝐿̃𝑛−𝑙,𝑙 ]𝑄 −1
𝐵𝐿 = 𝑅
پس:
−10 1 0 0
[=𝐿 ]
0 0 −10 1
0.923
[=𝑅 ]
−0.4473
گام هفتم :با یافتن 𝑙 {𝐹1 }𝑛,و {𝐹2 }𝑛,𝑛−𝑙,از رابطه زیر:
−1
𝐶 ] 𝐹2
] [ = [𝐹1
𝐿
پس:
1 0 1 0
10 0 10 0
[ = 𝐹1 ] , [ = 𝐹2 ]
0 1 0 1
0 10 0 10
و تخمین 𝑥 با رابطه:
𝑧 𝑥̂ = 𝐹1 𝑦 + 𝐹2
نتیجه استفاده از رؤیتگر برای این سیستم با شبیهسازی متغیرهای حالت واقعی و تخمینی در شکل های زیر نمایش داده
شده است:
17
تلفیق سیستم کنترل فیدبک حالت با رؤیتگر حالت مرتبه کامل
همانطور که گفتیم برای پیادهسازی کنترل فیدبک حالت در حالت کلی احتیاج به یک رؤیتگر حالت خواهیم
داشت .در حقیقت بلوک دیاگرام سیستم حلقهبسته به صورت شکل زیر خواهد بود:
حال سؤال اساسی اینجاست که طراحی 𝐾 و 𝐿 در ساختار فوق میتواند به صورت مجزای از هم انجام شود؟
و دیگر اینکه وجود رؤیتگر چه تأثیری روی دینامیک سیستم حلقهبسته دارد؟
برای پاسخ به سؤاالت فوق ،معادالت دینامیکی سیستم حلقهبسته فوق را به دست میآوریم .همانور که مشاهده میشود
این سیستم ،دارای 𝑛 2متغیر حالت است که میتواند در قالب بردار 𝑧 به صورت زیر نمایش داده شود:
𝑥
] [=𝑧
̂𝑥
پس کافی است 𝐴′را در معادله زیر بیابیم:
18
𝑧 𝑧̇ = 𝐴′
با توجه به معادله حالت پلنت ،میدانیم:
̂𝑥𝐾𝐵 𝑥̇ = 𝐴𝑥 + 𝐵𝑢 = 𝐴𝑥 + 𝐵(−𝐾𝑥̂) = 𝐴𝑥 − )(1
و با توجه به معادله دینامیکی رؤیتگر ،میدانیم:
معادله حالت فوق ،همان معادله حالت سیستم حلقهبسته است .مقادیر ویژه ،این ماتریس ،همان مقادیر ویژه سیستم حلقه-
بسته هستند .قبل از محاسبه مقادیر ویژه سیستم حلقهبسته از رابطه ( ،)3با انتخاب متغیرهای حالت سیستم حلقهبسته به
صورت
𝑥
] [ = 𝑧1
𝑒
که در آن ̂𝑥 ،𝑒 = 𝑥 −معادالت حالت سیستم حلقهبسته را باز نویسی میکنیم:
میدانیم که مقادیر ویژه سیستم حلقهبسته ،همان مقادیر ویژه ماتریس ̂𝐴 در رابطه ( )6است .از طرفی
𝐾𝐵 𝜆𝐼 − 𝐴 + 𝐾𝐵−
| = )̂𝐴 𝑑𝑒𝑡(𝜆𝐼 − |𝐶𝐿 | = |𝜆𝐼 − 𝐴 + 𝐵𝐾||𝜆𝐼 − 𝐴 +
0 𝐶𝐿 𝜆𝐼 − 𝐴 +
با توجه به رابطه فوق ،مجموعه مقادیر ویژه سیستم حلقهبسته متشکل از مقادیر ویژه 𝐾𝐵 𝐴 −و مقادیر ویژه 𝐶𝐿 𝐴 −
است.
19
از آنچه گفته شد نتیجه میگیریم که طراحی سیستم کنترل با رؤیتگر را میتوان به طور جداگانه انجام داد زیرا که ترکیب
آنها یک سیستم کنترل پایدار مجانبی را نتیجه خواهد داد .به این واقعیت که میتوان کنترل فیدبک حالت و رؤیتگر را به
تمرین .معادالت حالت سیستم حلقهبسته با رؤیتگر مرتبه کاهشی را بنویسید و نشان دهید که مجموعه مقادیر ویژه
سیستم حلقهبسته متشکل از مقادیر ویژه 𝐾𝐵 𝐴 −و مقادیر ویژه 𝐷 بوده و لذا اصل جداپذیری در آنجا نیز برقرار است.
مثال .برای مثال حرکت طولی هواپیمای فصل ششم 𝐾 با هدف قرارگیری مقادیر ویژه 𝐾𝐵 𝐴 −در نقاط
} {−2.5, −2, −1.5, −1و 𝐿 با هدف قرارگیری مقادیر ویژه 𝐶𝐿 𝐴 −در نقاط } {−3, −4.5, −6, −7.5با
فرض اندازهگیری متغیر حالت اول (سرعت طولی) به صورت زیر به دست آمدند:
𝐾 = [0.4116 −8.0975 −3.2578 ]−9.1956
𝑇]𝐿 = [19.93 −23.63 −49.02 −4.89
تذکر :کدهای متلب برای رسیدن به بردارهای فوق عبارتند از
𝐾 = 𝑝𝑙𝑎𝑐𝑒(𝐴, 𝐵, [−1 −1.5 −2 )]−2.5
)]𝐿𝑇 = 𝑝𝑙𝑎𝑐𝑒(𝐴𝑇 , 𝐶 𝑇 , [−3 −4.5 −6 −7.5
شکلهای زیر پاسخ سیستم حلقهبسته با رؤیتگر (ب) و بدون رؤیتگر (الف) را نمایش میدهد .مشاهده میشود که سیستم
20
یکی از نکات مهمی که قبل از پیادهسازی هر سیستم کنترل طراحی شده باید به آن توجه داشت ،میزان انرژی مورد نیاز
برای تحقق اهداف مسأله است .طبیعی است هر عملگری که در سیستم کنترل استفاده شود توان محدودی دارد و توجه به
توان و همچنین دینامیک عملگر (سرعت پاسخ دهی آن) باید پیش از پیادهسازی سیستم کنترل انجام شود .این کار معموالً
با بررسی سیگنال کنترل در فرایند شبیهسازی انجام میشود .برای مسأله فوق ،سیگنال کنترلی در دو حالت (الف) در
دسترس بودن تمام متغیرهای حالت و بدون استفاده از رؤیتگر و (ب) استفاده از رؤیتگر نمایش داده شده است.
21
22