You are on page 1of 48

УВОД У ИНТЕЛИГЕНТНЕ

АГЕНТЕ
М. Божић,
МВИ- 2.
Садржај

• Агенти и окружења
• Типови окружења
• Типови агената
• Основне подобласти ВИ
• Стање и перспективе развоја
• Примјери
ВИ као ВИ агенти
• Инспирација за овај прилаз у ВИ су сами људи, тј. могућности
које они посједују: могућност перцепције врло сложеног свијета
и прављење довољног смисла о истом да би се у њему могло
манипулисати,
• ВИ је наука и инжењерство о прављењу “интелигентних”
агената
• Људи морају имати могућност перцепције свијета, што је
аналогно компјутерској визији, да извршавају акције у реалном
свијету што у данашњем времену преузимају роботи, и
комуницирају са другим агентима.
ВИ као ВИ агенти(1)
• Људи посједују неко знање о околном свијету (напримјер,
вожња бицикла или познавање неких општих чињеница и
појмова), и користећи то знање могу изводити закључивање и
правити одлуке.
• Није од мањег значаја способност људи да уче и да се током
времена адаптирају у датим околностима.
• Машинско учење је постало примарни покретач многих ВИ
апликација које су данас у употреби.
Мислити и дјеловати рационално
• Рационално понашање: чињењем правих ствари.
•Права ствар: за коју се очекује да максимализује постизање циља за
дате расположиве информације.
•При овоме није неопходно укључено размишљање – напримјер,
рефлекс трептаја – али размишљање треба да послужи рационалном
дјеловању.

Слично човјеку Рационално


Мислити Системи који мисле Системи који мисле
слично као људи рационално

Дјеловати Системи који дјелују Системи који дјелују


слично као људи рационално
Мислити као човјек: когнитивно
моделовање
• Шездесетих година прошлог вијека имамо појаву тзв.
“когнитивне револуције": психологије која полази од
претпоставке да се све може извести обрадом
(процесирањем) информација. Иста захтијева научне
теорије о унутрашњим активностима у мозгу.
• -- Како да се изврши валидација? Ово захтијева:
1) Предикцију и тестирање понашања људских субјеката
(top-down), или
2) Директну идентификацију на основу неуролошких
података (bottom-up).
• Оба приступа (угрубо, Cognitive Science and Cognitive
Neuroscience) су сада различите дисциплине од ВИ.
Мислити рационално: “закони мисли"
• Аристотел: који су то коректни аргументи/мисаони
процеси?
• Неколико школа старих Грка развило је различите
форме логике: нотација и правила извођења за
мисли; могуће или не провести од идеје до
механизације.
• Ово представља директну линију кроз математику
и филозофију до модерне ВИ.
• Проблеми:
1. Не може се свако интелигентно понашање постићи помоћу
логичког расуђивања;
2. Која је сврха размишљања? Које мисли бисмо требали
имати?
Дјеловати рационално: рационални
агенти
• Агент је ентитет који опажа (има перцепцију) и
дјелује.
• ВИ се може посматрати и као изучавање начина за
пројектовање рационалних агената.
• Апстрактно, агент је пресликавање перцептоване
историје (P*) у акције (дјеловања) А:
[f: P*  A]
• За дату класу окружења или послова, тражимо
агента (или класу агената) са најбољом
перформансом.
• Напомена: рачунарска ограничења чине перфектну
рационалност недостиживом.
• пројектовање најбољег програма за дате
рачунарске ресурсе.
Агенти и окружења

• Агенти су људи, роботи, софтботи, термостати итд.

сензори

перцепција

окружење
акције агент

актуатори

• Програм агента се ивршава на физичкој архитектури да би се


реализовало f.
• агент= архитектура + програм
Примјер усисивача у двије собе

• Мјерења: локација и стање у соби, нпр.,


[A,нечиста].
• Акције: Лијево, Десно, Усисај, НеРади
Алгоритам агента усисивача
• Псеудо код алгоритма овог агента, који за сваки примљени
сигнал о стању у соби и на основу садржаја табеле генерише
одговарајуће акције, приказан је на сљедећој слици.

• Ако би број могућих (различитих) стања околине био P, тада би


табела у неком тренутку Т требала да садржи
елемената, што онемогућава имплементацију ВИ агената
користећи овај приступ (Пр.).
Пр: Визуелни улаз из камере са 27 MB/s (30 оквира/сек., 640 x 480
пиксела са 24 бита информације за боју). Ово би резултовало у
табелу са преко 10250,000.000.000 елемената за један сат вожње.
Рационални агенти(1)
• Мјера перформансе: Критеријум за успјех
понашања агента.
Напримјер, мјера перформансе агента усисивача
може бити количина очишћеног смећа, вријеме
потрошено за чишћење, потрошена енергија, ниво
генерисаних сметњи, итд.
• Рационални агент: За сваки могући перцептовани
низ (низови мјерних сигнала са сензора), рационални
агент треба да изабере акцију за коју се очекује да
максимализује његову мјеру перформансе, када је
дат тај перцептовани низ и све оно од уграђеног
знања што га посједује агент.
Рационални агенти(2)

• Рационалност је различита од свезнања o (све-


знајуће са неограниченим знањем).
• Агенти могу извршавати акције у циљу да
модификују будуће опажаје тако да добију корисне
информације (прикупљање информација,
истраживање).
• Агент је аутономан ако је његово понашање
одређено помоћу његовог властитог искуства (има
могућност да се обучава и адаптира).
Перформанса, Окружење, Актуатори
и Сензори (ПОАС)
• ПОАС: Мјера перформансе, Окружење,
Актуатори, Сензори (PEAS: Performance,
Environment, Actuators, Sensors)
• Прво се мора специфицирати оквир за
пројектовање интелигентног агента.
• Посматрајмо, напримјер, посао пројектовања
аутоматизованог такси возача:
– Мјера перформансе
– Окружење
– Актуатори
– Сензори
ПОАС(1)

• Посао пројектовања аутоматизованог такси


возача:
– Мјера перформансе: сигуран, брз, легалан, и
удобан превоз максимализује профит;
– Окружење: цесте, остали промет, пјешаци,
муштерије;
– Актуатори: волан, папуча акцелератора, кочнице,
сигнали скретања, труба;
– Сензори: камере, сонар, мјерач брзине, ГПС
(GPS), мјерач пређеног пута, сензори на мотору и
др., тастатура.
ПОАС(2)

• Агент: медицински дијагностички систем


• Мјера перформансе: здравље пацијента,
минимизација трошкова, правни поступци;
• Окружење: пацијент, болница, особље;
• Актуатори: екрански дисплеј (питања,
тестови, дијагнозе, третмани, рецепти);
• Сензори: тастатура (уношење симптона,
налаза, одговора пацијента).
ПОАС(3)

• Агент: робот за разврставање дијелова


(Part-picking robot);
• Мјера перформансе: постотак дијелова у
коректним корпама;
• Окружење: текућа трака са дијеловима и
корпе;
• Актуатори: роботска рука и шака
• Сензори: камера, сензори углова сегмената.
ПОАС(4)

• Агент: Интерактивни тутор за енглески;


• Мјера перформансе: максимализација
студентског успјеха на тесту;
• Окружење: група студената;
• Актуатори: екрански монитори (вјежбања,
сугестије, корекције)
• Сензори: тастатуре.
Типови окружења
• Потпуно опсервабилно (vs. partially observable):
Сензори агента омогућавају приступ комплетном
стању окружења у сваком тренутку времена.
• Детерминистичко (vs. stochastic): будуће стање
окружења је потпуно одређено садашњим стањем и
акцијом коју изврши агент. Ако је окружење
детерминистичко, осим за акције других агената,
тада је окружење стратешко.
• Епизодно (vs. sequential): Искуство агента је
подијељено у ситне “епизоде" (свака епизода се
састоји од запажања агента па онда извршавања
једне акције). Избор акције у свакој епизоди
зависи само од саме епизоде.
Типови окружења(1)

• Статичко (vs. dynamic): Окружење је непромјенљиво


док агент “промишља”. (Окружење је семидинамичко
ако се само окружење не мијења са протоком
времена али се мијења мјера перформансе).
• Дискретно (vs. continuous): Ограничен број
различитих, јасно дефинисаних опажања и акција.
• Један агент (vs. multiagent): Агент који оперише сам у
неком окружењу.
Типови окружења(2)
Шах са Шах без Вожња
сатом сата таксијем
Потпуно опсерваб. Да Да Не
Детерминистичко Стратешко Стратешко Не
Епизодно Не Не Не
Статичко Семи Да Не
Дискретно Да Да Не
Један агент Не Не Не

• Тип окружења у највећој мјери одређује пројекат агента.


• Реални свијет је (свакако) парцијално опсервабилан,
стохастичан, секвенцијалан, динамичан, континуалан,
мултиагентан.
Функције и програми агената

• Агент је потпуно специфициран функцијом


агента која пресликава низове опажаја у
акције.
• Задатак: Једна функција агента (или мала
еквивалентна класа) је рационална.
• Циљ: пронаћи начин да се сажето
имплементира рационална функција агента!
Агент у облику табеле (lookup table)

• Недостаци:
– Огромне табеле за сложене проблеме
– Потребно је дуго времена да се сачини
табела
– Нема аутономије
– Исто тако и у случају када постоји
обучавање, потребно је дуго времена да се
“науче” сви елементи табеле.
Типови агената

• Имамо четири основна типа која су наведена


редом са повећањем општости:
• Једноставни рефлексни агенти;
• Рефлексни агенти на бази модела;
• Агенти на бази циља;
• Агенти на бази корисности (Utility-based
agents);
Једноставни рефлексни агенти
АГЕНТ Сензори

Како свијет
изгледа сада

Околина
Које акције треба
Правила: узроци-акције
чинити сада

Актуатори
Алгоритам рефлексног агента
• Псеудо код алгоритма за једноставног рефлексног агента који
генерише своје излазе према правилима која се активирају сагласно
текућим стањима околине која се добијају у виду сигнала на излазу
сензора.

Алгоритам једноставног рефлексног агента


Рефлексни агенти на бази модела

Сензори
Стање
Како свијет
Како се свијет мијења
изгледа сада

Околина
Какав је ефекат акција

Правила: узроци-акције Које акције треба


чинити сада

АГЕНТ Актуатори
Алгоритам рефлексног агента на
бази модела
• Алгоритам рефлексног агента на бази модела који “прати”
промјене стања околине, користећи унутрашњи опис вањског
свијета, је дат псеудо кодом на сљедећој слици.

• Управљачке акције се генеришу сагласно правилима као и код


једноставног рефлексног агента.
Агенти на бази циља

Сензори
Стање
Како свијет
Како се свијет мијења
изгледа сада

Како ће изгледати
Какав је ефекат акција

Околина
ако се учини акција А

Које акције треба


Циљеви
чинити сада

АГЕНТ Актуатори
Агенти на бази корисности
(“корист” у смислу “квалитета нечега корисног”)

Сензори
Стање
Како свијет Неизвјесност
Како се свијет мијења
изгледа сада

Како ће изгледати

Околина
Какав је ефекат акција
ако се учини акција А

Каква ће бити корист у


Корист таквом стању

Које акције треба


чинити сада

АГЕНТ Актуатори
Агенти на бази корисности(1)
(“корист” у смислу “квалитета нечега корисног”)

Сензори
Стање
Како свијет Неизвјесност
Како се свијет мијења
изгледа сада

Како ће изгледати

Околина
Какав је ефекат акција
ако се учини акција А

Динамика Каква ће бити корист у


Корист таквом стању

Које акције треба


чинити сада
Учење

АГЕНТ Актуатори
Агенти на бази корисности(2)
(“корист” у смислу “квалитета нечега корисног”)
Говор и визија
Сензори
Стање
Како свијет Неизвјесност
Како се свијет мијења
изгледа сада

Како ће изгледати

Околина
Какав је ефекат акција
ако се учини акција А

Динамика Каква ће бити корист у


Корист таквом стању

Које акције треба


чинити сада
Учење
Роботика
АГЕНТ Актуатори
Агенти са обучавањем (Learning
agents)
Стандард перформансе

Критика Сензори

Повратна
спрега

промјене

Околина
Елеменат за Елеменат
обучавање перформансе
знање
Циљеви
обучавања

Генератор
проблема

АГЕНТ Актуатори
Агенти са обучавањем(1)
• Помоћу елемента за обучавање се могу правити промјене у
било којој од компоненти “знања” у напријед наведеним
архитектурама агената. Најједноставнији случај је да се на бази
излаза са сензора обучава “како се свијет мијења” или на бази
опсервација са сензора на одређене акције се побољшава
модел од “какав је ефекат акција”.
• Стандард перформансе издваја дио примљених сигнала који
се односи на награду (или казну) који обезбјеђује директну
повратну спрегу о квалитету рада (понашања) самог агента.
• Агенти могу имати много различитих компоненти које се могу
уградити на различите начине у оквиру програма агента. У том
смислу постоје различите методе обучавања.
• Обучавање у ВИ агентима се може представити као процес
модификација компоненти агента у смислу бољег слагања
тих компоненти са информацијама које се добијају помоћу
повратне спреге и тиме побољшају њихове укупне
перформансе.
Класификација система ВИ
 Системи за рјешавање човјекових уобичајених
задатака:
– препознавање говора и слике;
– разумијевање, генерисање и превођење
природних језика;
– сналажење у свакодневним ситуацијама и
– примјена ових поступака у управљању роботима.
 Системи за рјешавање формалних задатака:
– игре (шах, го);
– математичка логика, геометрија, интегрални
рачун;
– карактеристике програма.
Класификација система ВИ(1)

• Системи за рјешавање експертских задатака:


– конструисање, налажење грешака, планирање
производње;
– научне анализе и дијагностика (медицина, хемија,
право);
– финансијска анализа;
– програми за развој оваквих система.
Основне подобласти ВИ

• Експертни системи (Expert systems)


• Процесирање природних језика (Natural
language processing)
• Рачунарска визија (Computer vision)
• Роботика (Robotics)
• Планирање и рјешавање проблема
(Problem solving and planning)
• Машинско учење (Machine learning)
Основне подобласти ВИ (1)

• Аутоматско доказивање теорема


• Аутоматско препознавање говора
• Фази системи (Fuzzy systems)
• Неуронске мреже
• Еволуциони алгоритми
• Трагање кроз податке (Data mining)
• Интелигентне претраге
Стање области и перспективе
развоја
 У достизању циља ВИ, предложено је више приступа
који се могу грубо категорисати у двије групе:
o симболички
o субсимболички
• Симболички приступ који је заснован на Њуел-
Сајмоновој хипотези (*). Често се овај приступ назива
класичним или GOFAI (Good-Old-Fashioned-AI)
• Класичан примјер овог приступа је примјена
логичких операција на базу декларативних
“знања”. Овдје се “знање” о проблемском домену
представља декларативним реченицама, а на основу
логичких метода закључивања изводе конзеквенце
овог “знања”.
(*) Њуел-Сајмоновa хипотезa
• Њуел-Сајмоновa хипотезa(Allen Newell, Herbert
Simon) су, након дефинисања система физичких
симбола као дијелова сложених ентитета (изрази или
симболичке структуре) и колекција процеса који
оперишу са структурама (креирају, модификују,
репродукују, уништавају) производећи нове
структуре, изнијели хипотезу која гласи:
“Систем физичких симбола има неопходне и
довољне способности за обављање интелигентних
акција.”
• Ова хипотеза се може подврћи сумњи и оповргнути
(или индуктивно доказати) експериментима. Али
треба имати на уму да су рачунари нарочито погодни
за експериментисање и симулације система
физичких симбола по жељи.
Стање области и перспективе
развоја(1)
• Када се овај приступ примијени на реалне проблеме
показује се да он захтијева огромно доменско знање
(експертско знање), па се овај приступ често назива и
приступом заснованим на знању (knowledge- based)
или одозго на доље (top down)
 Субсимболички је приступ одоздо на горе (bottom-up)
од сигнала ка вишим концептима (појмовима,
класама, исказима).
• Овај приступ прати основну људску перцептивно-
емпиријску (индуктивну) компоненту у којој
информације о окружењу добијамо преко
перцептивних подсистема и одговарајућих сигнала
као носиоца информација.
Стање области и перспективе
развоја(2)
 Најпознатији примјери овог приступа су:
––Аниматизам (Људска И је резултат еволутивног развоја , па се стога
у развоју интелигентних система мора ићи истим путем). Примјер за ово
је копирање система за обраду сигнала и управљање инсеката и затим
њихово стављање у услове еволутивног развоја.
--Интеракција између вјештачких система и окружења води ка
нечему што се назива понашање у настајању (emergent behavior).
--Неуронске мреже су инспирисане биолошким моделима централног
нервног система
--Генетички системи: инспирисани су процесима који стимулишу
еволуцију у биолошким системима као што су: укрштањe (crossover),
мутацијa и репродукцијa пропорционалнa степену прилагођености
јединкe.
Меметички алгоритми (Memetic
Algorithms)
• Меметички алгоритми (Memetic Algorithms) комбинују
генетичке/еволуционе алгоритме (population-based)
за глобално претраживање и неке од техника
индувидуалног локалног типа (individual-based local
search) који олакшавају истраживање (exploration) и
експлоатацију простора за налажење рјешења,
респективно.
Еволуциони прогрес
Живи организми Рачунари
Опажај и дјелуј: 10,000,000+ година 15+ година
Резон: 100,000+ година 30+ година
Рачунања: 1,000+ година 50+ година

• Еволуција резоновања је била тијесно повезана и под утицајем


сензорско-моторних могућности. Иначе би пропала!

• GOFAI системи су често у њиховим сопственим малим свијетовима,


правећи нерезонске претпоставке о независним сензорско-моторних
апаратурама.

• Да би се постигао научни циљ ВИ за разумијевање И код људи,


пут од опажај и дјелуј до резоновања путем симулације еволуције
може бити једини.

• Али, да би се постигли инжењерски циљеви ВИ, оба приступа


(симболички и субсимболички) се чине прихватљивим.
Примјери

• 2015 DARPA Robotics Challenge


Мај 1997: Deep Blue побјеђује
свјетског шампиона у шаху
Мај 1999: AI програм Remote Agent
преузео је управљање Deep Space 1 на
удаљености 60 000 000 миља од Земље
Примјери истраживања
1. http://www.youtube.com/watch?v=C4IJXAVXgIo

2. http://spectrum.ieee.org/automaton/robotics/artificial-
intelligence/whoa-quadrotors-play-catch-with-inverted-
pendulum/?utm_source=roboticsnews&
utm_medium=email&utm_campaign=030513

You might also like