Professional Documents
Culture Documents
АГЕНТЕ
М. Божић,
МВИ- 2.
Садржај
• Агенти и окружења
• Типови окружења
• Типови агената
• Основне подобласти ВИ
• Стање и перспективе развоја
• Примјери
ВИ као ВИ агенти
• Инспирација за овај прилаз у ВИ су сами људи, тј. могућности
које они посједују: могућност перцепције врло сложеног свијета
и прављење довољног смисла о истом да би се у њему могло
манипулисати,
• ВИ је наука и инжењерство о прављењу “интелигентних”
агената
• Људи морају имати могућност перцепције свијета, што је
аналогно компјутерској визији, да извршавају акције у реалном
свијету што у данашњем времену преузимају роботи, и
комуницирају са другим агентима.
ВИ као ВИ агенти(1)
• Људи посједују неко знање о околном свијету (напримјер,
вожња бицикла или познавање неких општих чињеница и
појмова), и користећи то знање могу изводити закључивање и
правити одлуке.
• Није од мањег значаја способност људи да уче и да се током
времена адаптирају у датим околностима.
• Машинско учење је постало примарни покретач многих ВИ
апликација које су данас у употреби.
Мислити и дјеловати рационално
• Рационално понашање: чињењем правих ствари.
•Права ствар: за коју се очекује да максимализује постизање циља за
дате расположиве информације.
•При овоме није неопходно укључено размишљање – напримјер,
рефлекс трептаја – али размишљање треба да послужи рационалном
дјеловању.
сензори
перцепција
окружење
акције агент
актуатори
• Недостаци:
– Огромне табеле за сложене проблеме
– Потребно је дуго времена да се сачини
табела
– Нема аутономије
– Исто тако и у случају када постоји
обучавање, потребно је дуго времена да се
“науче” сви елементи табеле.
Типови агената
Како свијет
изгледа сада
Околина
Које акције треба
Правила: узроци-акције
чинити сада
Актуатори
Алгоритам рефлексног агента
• Псеудо код алгоритма за једноставног рефлексног агента који
генерише своје излазе према правилима која се активирају сагласно
текућим стањима околине која се добијају у виду сигнала на излазу
сензора.
Сензори
Стање
Како свијет
Како се свијет мијења
изгледа сада
Околина
Какав је ефекат акција
АГЕНТ Актуатори
Алгоритам рефлексног агента на
бази модела
• Алгоритам рефлексног агента на бази модела који “прати”
промјене стања околине, користећи унутрашњи опис вањског
свијета, је дат псеудо кодом на сљедећој слици.
Сензори
Стање
Како свијет
Како се свијет мијења
изгледа сада
Како ће изгледати
Какав је ефекат акција
Околина
ако се учини акција А
АГЕНТ Актуатори
Агенти на бази корисности
(“корист” у смислу “квалитета нечега корисног”)
Сензори
Стање
Како свијет Неизвјесност
Како се свијет мијења
изгледа сада
Како ће изгледати
Околина
Какав је ефекат акција
ако се учини акција А
АГЕНТ Актуатори
Агенти на бази корисности(1)
(“корист” у смислу “квалитета нечега корисног”)
Сензори
Стање
Како свијет Неизвјесност
Како се свијет мијења
изгледа сада
Како ће изгледати
Околина
Какав је ефекат акција
ако се учини акција А
АГЕНТ Актуатори
Агенти на бази корисности(2)
(“корист” у смислу “квалитета нечега корисног”)
Говор и визија
Сензори
Стање
Како свијет Неизвјесност
Како се свијет мијења
изгледа сада
Како ће изгледати
Околина
Какав је ефекат акција
ако се учини акција А
Критика Сензори
Повратна
спрега
промјене
Околина
Елеменат за Елеменат
обучавање перформансе
знање
Циљеви
обучавања
Генератор
проблема
АГЕНТ Актуатори
Агенти са обучавањем(1)
• Помоћу елемента за обучавање се могу правити промјене у
било којој од компоненти “знања” у напријед наведеним
архитектурама агената. Најједноставнији случај је да се на бази
излаза са сензора обучава “како се свијет мијења” или на бази
опсервација са сензора на одређене акције се побољшава
модел од “какав је ефекат акција”.
• Стандард перформансе издваја дио примљених сигнала који
се односи на награду (или казну) који обезбјеђује директну
повратну спрегу о квалитету рада (понашања) самог агента.
• Агенти могу имати много различитих компоненти које се могу
уградити на различите начине у оквиру програма агента. У том
смислу постоје различите методе обучавања.
• Обучавање у ВИ агентима се може представити као процес
модификација компоненти агента у смислу бољег слагања
тих компоненти са информацијама које се добијају помоћу
повратне спреге и тиме побољшају њихове укупне
перформансе.
Класификација система ВИ
Системи за рјешавање човјекових уобичајених
задатака:
– препознавање говора и слике;
– разумијевање, генерисање и превођење
природних језика;
– сналажење у свакодневним ситуацијама и
– примјена ових поступака у управљању роботима.
Системи за рјешавање формалних задатака:
– игре (шах, го);
– математичка логика, геометрија, интегрални
рачун;
– карактеристике програма.
Класификација система ВИ(1)
2. http://spectrum.ieee.org/automaton/robotics/artificial-
intelligence/whoa-quadrotors-play-catch-with-inverted-
pendulum/?utm_source=roboticsnews&
utm_medium=email&utm_campaign=030513