Professional Documents
Culture Documents
4- جستجوی غیرکلاسیک
4- جستجوی غیرکلاسیک
دانشکده
مهندسی و علوم کامپیوتر توسط:
آرمین سلیمی بدر
a_salimibadr@sbu.ac.ir
1
مسائل از جنس بهینهسازی با رویکرد یافتن هدف
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 2
عدم اهمیت مسیر رسیدن به هدف در بسیاری از مسائل
داشتن توصیفی در قالب یک مسئله بهینهسازی بهجای اطالع از خود حالت هدف
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 3
جستجوی محلی :نگهداری یک (یا چندحالت) در هر زمان و تغییر
نامتناهی
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 4
جستجوی بهترین حالت
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 5
دزدی با یک کوله وارد انباری شده و میخواهد با محدودیت حجم
کوله بیشترین سود را نصیب خود کند
قیود مسئله:
قید تعداد niاز کاالی iام
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 6
𝑁
𝑃 ≥ 𝑖𝑥 𝑖𝑝
𝑖=1
𝑁
𝑆𝑢𝑏𝑗𝑒𝑐𝑡 𝑡𝑜:
𝐶 ≤ 𝑖𝑥 𝑖𝑐
𝑖=1
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 7
مکان ) :(Locationمبتنی بر حاالت
ارتفاعات ) :(Elevationمبتنی بر تابع هدف یا مکاشفهای
بهینه مطلق (سراسری) Global Extremum
بهینه محلی Local Extremum
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 8
در فضای گسسته
نگهداری صرفاً حالت فعلی
نام دیگر :الگوریتم جستجوی محلی حریصانه Greedy Local Search
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 9
f(A) = 60 A
در اینجا تابع ،fاز جنس سود و تابع هدف فرض شده است .قصد بیشینه
سازی این تابع هدف را داریم( .لزوماً با تابع fمربوط به * Aمرتبط نیست!)
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 10
f(A) = 60 A
با گسترش حالت Aبه سه گره بعدی میرسیم که باید از این میان
گرهای که دارای بیشترین مقدار fاست انتخاب شود.
اگر این گره خود گره والد(حالت فعلی) باشد جستجو متوقف
میشود.
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 11
f(A) = 60 A
گره Dدارای بیشترین مقدار تابع هدف در میان همه گرهها میباشد
و بهعنوان گره بعدی انتخاب میشود.
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 12
f(D) = 75 D
بقیه گرهها دور ریخته شده و فقط گره انتخابی در حافظه نگهداری
میشود .امکان بازگشت و اصالح از طریق انتخاب گره دیگر وجود ندارد
که مرتبط با دیدگاه جستجوی محلی و تفاوت آن با جستجوی کالسیک
است
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 13
f(D) = 75 D
انتخاب تصادفی حالت بعدی از میان حاالت بهتر از حالت فعلی بر
اساس احتمالی متناسب با مقدار تابع هدف
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 16
فرض کنیم بین سه حالت با احتمال انتخاب 0.5 ،0.2و 0.3میخواهیم یکی
را انتخاب کنیم
انتخاب حالت اول انتخاب حالت دوم انتخاب حالت سوم
0 1
روش انتخاب :یک عدد تصادفی با توزیع یکنواخت بین 0و 1تولید کرده و
بسته به قرار گرفتن این عدد در هر یک از بازههای مشخصشده آن حالت
انتخاب میشود
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 17
الگوریتم تپهنوردی تصادفی )(Stochastic
انتخاب یکی از حرکات منجر به پیشرفت بهصورت تصادفی
تناسب احتمال انتخاب و میزان شیب بهبود
همگرایی دیرتر؛ یافتن جوابهای بهتر
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 18
حالت نهایی
اجرای سوم
حالت اولیه
اجرای سوم
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 19
در فضای پیوسته
استفاده از نویز سفید یا نویز یکنواخت برای ایجاد حالت جدید
𝑋𝑡𝑚𝑝 𝑡 + 1 = 𝑋 𝑡 + 𝜎𝑁 0,1
𝑋𝑡𝑚𝑝 𝑡 + 1 = 𝑋 𝑡 + 𝜎𝑅 −1,1
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 20
شروع از یک حالت تصادفی X0
X ← X0
)Xtmp ← X + σN(0,1
خیر
خیر بررسی بله
)f(Xtmp) > f(X شرط پایان
خاتمه
بله
X ← Xtmp
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 21
اگر سیگما بزرگ باشد ممکن است از روی کمینه بپرد و یا در حلقه بیافتد
اگر سیگما کوچک باشد گامها بسیار کوچک میشود
امکان تغییر بصورت نمایی یا خطی
حالت ایدهآل :بر اساس نزدیکی و دوری به جواب
σ
گام بزرگ σ0
σ1 = .9σ0
گام کوچک
12 iter.
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 22
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 23
بهینه محلی )(Local Optimum
نقاطی که از تمامی همسایگان خود بهترند ولی بهینه سراسری نیستند
ممکن است خود بهینه سراسری یا محلی باشند و یا صرفاً «شانه» باشند
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 24
نواحی یال )(Ridge
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 25
مانند الگوریتم تپهنوردی
شروع همزمان از بیش از یک نقطه
در این روش اطالعات مفید اجراهای موازی در کنار هم مورد بررسی قرار میگیرند
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 26
f(x1) = 60 f(x2) = 45 f(x3) = 50
x1 x2 x3
از هر حالت اولیه تعداد bفرزند تصادفی با افزودن نویز تولید میکنیم
در اینجا b=2فرض شود
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 27
f(x1) = 60
f(x2) = 45 f(x3) = 50
x1 x2 x3
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 28
f(x1) = 60
f(x2) = 45 f(x3) = 50
x1 x2 x3
به تعداد K=3حالت که دارای بیشترین مقدار fهستند انتخاب میشوند و به
مرحله بعد میروند .امکان تکرار حاالت قبلی وجود دارد
امکان حفظ جستجو در بخشهای امیدوارکننده هر انشعاب وجود دارد .با ادامه
روند ،احتمال جذب کل فرایند جستجو توسط یک انشعاب وجود دارد
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 29
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 30
ایجاد تکانه
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 31
الهامگرفته از سردکردن فلزات و تولید فوالد
اگر بدتر باشد ،بهصورت احتمالی متناسب با میزان بدتر شدن قبول میشود
این احتمال بهمرور کاهش مییابد که به نوعی شبیهسازی دما در محیط است
خیر بررسی
شرط
)Xtmp ← X + σN(0,1 خاتمه
خیر
خیر 𝐅𝚫
)f(Xtmp )> f(X 𝒓𝒂𝒏𝒅 < 𝒆𝒙𝒑 −
𝐓
بله بله
X ← Xtmp
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 33
کاهش دما بهصورت نمایی
حالت ایدهآل :بر اساس نزدیکی و دوری به جواب
موازنه بین اکتشاف (جستجوی سراسری) و استخراج (جستجوی محلی)
T
T0
T1 = .9T0
12 iter.
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 34
الگوریتمهای مبتنی بر جمعیت ،تصادف و سعیوخطا
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 35
تکامل :بهبود شایستگی نسل بعد
انتقال اطالعات ژنتیکی بیشتر به نسل بعد از طریق تولید فرزندان بیشتر
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 36
الزمه تکامل :انتخاب و تنوع
انتخاب :انتخاب موجوداتی که میتوانند منجر به ایجاد تکامل شوند (همگرایی)
افزایش کیفیت
تنوع :وجود موجدات متنوع برای جستجوی بهتر محیط (واگرایی)
افزایش کمیت
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 37
کم هوش باهوش
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 39
کدگذاری پروتئینها در ساختار کروموزوم
R0c01cd
B0c01cd
G0c01cd
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 40
الگوریتم تکاملی :الگوریتم جستجوی محلی مبتنی بر جمعیت
اعمال تغییر
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 41
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 42
همگرایی زودرس
عدم تکامل از نسلی به نسل دیگر
گیرکردن در بهینه محلی و عدم امکان فرار از آن
دالیل:
فاصله زیاد شایستگی بهترین موجود جمعیت از سایرین
عدم امکان انتخاب سایر موجودات و جلوگیری از تکانه
سکون :از بین رفتن تنوع
همه موجودات شبیه هم بوده و تنوعی رخ نمیدهد
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 43
بازنمایی :نحوه کدکردن حاالت مسئله در قالب کروموزوم
تولید جمعیت اولیه :عموماً تصادفی یکنواخت
انتخاب والدین
تولید فرزندان بر اساس عملگرهای ایجاد تنوع
بازترکیبی و جهش
انتخاب بازماندگان
ارزیابی :تعریف تابع شایستگی (وابسته به مسئله)
شرط خاتمه
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 44
خطی (آرایهای) :مناسب برای بهینهسازی یک تابع
حقیقی و اعداد صحیح :آرایه متشکل از اعداد حقیقی یا اعداد صحیح
1 3 5 2 6 4 7 8
باینری :متشکل از صفر و یک
0 1 1 0 1 0 1 1
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 45
بازترکیبی Crossover
جهش Mutation
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 46
اعمال بر روی دو والد انتخابشده
وابسته به بازنمایی
روشهای مختلف برای بازنماییهای متفاوت
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 47
بازنمایی خطی:
چندنقطهای (بازنمایی باینری ،حقیقی و صحیح):
درنظرگیری یک نقطه تصادفی برای جابجایی ژنهای والدین
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 48
بازنمایی خطی:
چندنقطهای (بازنمایی باینری ،حقیقی و صحیح):
در مورد بازنمایی باینری میتواند منجر به شکلگیری مقادیر جدید شود
x1 x2 x3 x4 x1 x2 x3 x4
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 49
بازنمایی خطی:
میانگیری (مناسب برای بازنمایی حقیقی):
تولید میانگین وزندار والدین:
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 50
خطای تصادفی طبیعت با نرخ پایین
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 51
بازنمایی خطی:
جابجایی تصادفی :مناسب برای همه بازنماییها
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 52
بازنمایی خطی:
مقداردهی تصادفی یک عنصر :مناسب برای همه بازنماییها
)+ σN(0,1
1 3 5 2 6 4 7 8 1 3 5.2 2 6 4 7 8
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 53
جمعیت هر نسل ثابت میماندμ :
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 54
تصادفی یکنواخت ) :(Randomعدم درنظرگیری قانون بقای شایسته
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 55
رتبهبندی ) :(Reward-Basedشانس بیشتر به موجودات با شایستگی کمتر
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 56
هرکدام یک موجود مبتنی بر شایستگی
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 57
مبتنی بر رتبهبندی
= 6/21
P: 0.2381 0.1905 0.1429 0.0952 0.0476
0.2857
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 58
خطکش ) (Rulerیا چرخ رولت ) :(Roulette Wheelمراجعه به اسالید 17
0 1
1-1/N
1/N
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 59
تعداد نسلهای متناهی
حد شایستگی
نسل
رسم نودار تغییرات شایستگی بهترین موجود یا متوسط شایستگی نسبت به نسل
مشابه روش قبل با این تفاوت که کلیتر است :اگر تنوع نداشته باشیم شانسی
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 61
بررسی همگرایی:
میانگین یا بیشینه شایستگی نسل
θ
K
نسل
واریانس شایستگی نسل بررسی تنوع:
K
θ
نسل
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 62
تولید جمعیت اولیه :تصادفی یکنواخت
بعد از بازترکیبی
میانگیری میتواند محلی (همه ژنها یک واد) یا سراسری (برای هر ژن وادین متفوت) باشد
-1 با سیگمای ثابت یا متغیر با زمان -2 ،برای همه ابعاد یک سیگما یا برای هر بعد مجزا
بازنمایی :با توجه به حقیقی بودن فضای جستجو ،خطی حقیقی
جهش :نویز گاوسی (با توجه به حقیقی بودن فضا) با σ=0.1با احتمال Pm = 0.1
ابتدا عددی تصادفی بین صفر و یک تولید کرده ،در صورتی که این عدد از Pc
در غیر اینصورت والدین عیناً به فرزندان منتقل شده و یا جفت والد دیگری انتخاب میشود
پس از آن عددی تصادفی و صحیح بین 1و 4برای بازترکیبی انتخاب میکنیم
فرض کنیم برای هر دو جفت تولید فرزند مجاز و عدد تصادفی اول 2و
برای هر فرزند یک عدد تصادفی تولید کرده اگر کمتر از احتمال جهش Pmبود
با توجه به گاوسی بودن نویز ،آرایهای به سایز ( 5تعداد ویژگیها) از اعداد تصادفی
فرض کنیم در اینجا فقط برای فرزند دوم جهش اعمال شود
با تقسیم شایستگی هر موجود به مجموع شایستگی احتمال انتخابش را بدست میآوریم
موجود P1 P2 P3 P4 C1 C2 C3 C4 مجموع
شایستگی 0.023 0.012 0.03 0.009 0.020 0.040 0.022 0.006 0.1634
احتمال 0.1408 0.0734 0.1836 0.0551 0.1224 0.2448 0.1346 0.0367 1
موجودات بازمانده را از میان 4والد و 4فرزند انتخاب میکنیم .تکرار مجاز است
0.2142
0.1408 0.4529 0.8201 0.9547
انتخاب موجود دوم انتخاب موجود چهارم انتخاب موجود هشتم انتخاب موجود ششم
𝒇𝝏
𝟎=
𝟏𝒙𝝏
𝒇𝝏 با فرض اینکه fتابع هدف باشد
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 75
بردار گرادیان :جهت رشد تابع
اگر بهاندازه δxحول x0ایجاد کنیم بر اساس بسط تیلورمرتبه اول
خروجی تابع جقدر تغییر میکند؟
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 76
بردار گرادیان :جهت رشد تابع
بر اساس بسط تیلورمرتبه اول
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 77
بردار گرادیان :جهت رشد تابع
در حالت چندبعدی
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 78
حرکت در جهت عکس بردار گرادیان :کاهش تابع
|𝒇𝛁𝜶𝜹𝒙==−
𝒙𝚫 𝒙=𝒙|𝒇𝛁𝜶
𝒙=𝒙𝟎𝒕,, 𝜶
𝟎>𝜼
⇒𝒙 𝟐
𝒙𝒙=𝒇𝟏𝒕+ 𝒙(𝒇 <𝒙 𝒇𝟏+ 𝚫𝒙 ⇒ 𝒇 𝒙𝒕+
= 𝟎𝒙=𝒙|𝒇𝛁 𝟎 𝒕+ 𝜶𝟎 + 𝒙=𝒙|𝒇𝛁 ) 𝒕
𝟎
اگر کوچک باشد سرعت همگرایی پایینی خواهد داشت و در اولین کمینه
محلی گیر میافتد
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 79
مقدار پارامتر آلفا در تعیین میزان گام برداشتهشده در هر مرحله تعیینکننده است
اگر بزرگ باشد ،از روی نقطه بهینه میپرد
در حلقه گیر میکند
اگر کوچک باشد سرعت همگرایی پایینی خواهد داشت و در اولین کمینه محلی گیر میکند
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 80
تغییر تدریجی ابرپارامتر یادگیری (مانند قبل)
تغییر هدفمند :زمانی که تغییر مبتنی بر جهت عکس گرادیان با تغییرات قبلی
Δx1 Δx4
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 81
مقایسه گام فعلی و گام(های) قبلی
Δx1 Δx4
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 82
قراردادن سه فرودگاه با کمترین فاصله از شهرهای موجود
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 83
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 84
الگوریتم هوش ذرات (و نه تکاملی)
حرکت هر ذره یا پرنده در گروه :بهسمت ترکیبی از بهترین تجربه شخصی و گروهی
دو پارامتر برای هر پرنده یا ذره :موقعیت (راهحل) و سرعت (بزرگی و جهت حرکت)
𝟏𝑿𝒕+
𝒊 𝒊𝒕𝑽 = 𝑿𝒕𝒊 +
معادله بروزرسانی سرعت هر پرنده بر اساس بهترین تجربه شخصی و گروهی:
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 85
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 77
برگرفته از حرکت مورچهها و فرمنگذاری مسیر توسط آنها
مسیر بهینه بهدلیل عبور مورچههای بیشتر دارای فرمن بیشتر است
مناسب در زمانی که راهحل مناسبتری بر اثر تغییر محیط ایجاد شود و یا راهحل فعلی
مسدود شود
انتخاب تصادفی حالت بعدی از همسایگی حالت فعلی مبتنی بر:
)x ← x − g(x)/g′(x
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 88
عدم قطعیت :نتیجه هر عمل از پیش مشخص نیست
ممکن است انتخاب یک عمل منجر به انتقال به حاالت مختلف شود
نیاز به ادراک پس از اجرای هر عمل برای تعیین نتیجه اعمال عمل و
تشخیص حالت
گره :ANDمعرف حاالت مختلف حاصل از اجرای یک عمل در گره OR
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 90
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 91
راهکارهای متداخل :تعیین مسیر و اجرا بهطور همزمان
در صورت مشاهده حالت تکراری در یک مسیر الگوریتم ریکرسیو خروجی عدم
تکراری
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 92
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 93
عدم درک کامل محیط مبتنی بر ادراک بهوسیله حسگرها
گرانبودن حسگر ،خرابی حسگر ،عدم نیاز به آن بهدلیل محدودیت محیطی
انتخاب هر عمل :انتقال به یکی از حاالت ممکن بسته به واقعیت حالت قبل
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 94
بیان حالت محیط بهصورت مجموعه حاالت باور
در حالت کلی ،فضای دارای 2Nحالت باور به جای Nحالت فیزیکی
ممکن است همگی از حالت باور اولیه قابل دسترسی نباشند
حالت باور اولیه :شامل کلیه حاالت ممکن در فضای حالت
اعمال در هر حالت باور :اجتماع در صورت مجاز بودن و اشتراک درصورت غیرمجاز بودن
آزمون هدف :در صورت هدف بودن کلیه حاالت موجود در حالت باور
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 95
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه
شهیدبهشتی 96
هر دریافت تنها اطالعات بخشی از محیط را فراهم میکند
مانند حالت بدون حسگر ،درک کامل از محیط در اختیار نیست
پیشبینی حالت بعد بر اساس اعمال انتخابی و دریافت ادراکات بعدی
استفاده از درخت AND-OR
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 97
جستجو در فضای حاالت باور
گره ANDبرای نتایجی که توسط ادراک بعدی قابل تفکیک است
بدست آوردن راههای جایگزین
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 98
جستجوی برونخط ):(Offline
عامل با اطالعات کامل از محیط راهحل را پیش از اجرا بدست آورده و سپس وارد محیط
میشود
اجرا و جستجو مجزا هستند
قرارگیری عامل در هر زمان در یک حالت امکان ادامه کار فقط از همان حالت
یکی از چالشهای مهم حاالت بنبست و اعمال غیرقابل بازگشت ) (Irreversibleاست
که عامل قادر به ادامه کار و بازگشت نیست
در ادامه فرض میشود اعمال بازگشتپذیراند )(Safely Explorable
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 99
الگوریتم اولعمق برخط:
تپهنوردی با حافظه
تصمیمگیری اولیه بر اساس تابع مکاشفهای h
نگهداری و بروزرسانی بهترین تخمین برای حاالت مشاهدهشده H
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 100
بهدلیل خوشبینی در عدم قطعیت )(Optimism under Uncertainty
همواره اولویت اعمال انتخابنشده باالتر است ( hاز Hعموماً کمتر است)
امکان اکتشاف مؤثرتر محیط
آرمین سلیمی بدر -دانشکده مهندسی و علوم کامپیوتر -دانشگاه شهیدبهشتی 101