Professional Documents
Culture Documents
SEMINARSKI RAD
OpenAI Five
Matej Lučić
1. Povijest...........................................................................................................................................3
2. Definicije.........................................................................................................................................4
3. Osnovna načela..................................................................................................................................5
4. Izazovi.............................................................................................................................................6
5. Pristupi i alati..................................................................................................................................7
6. Područja primjene umjetne inteligencije......................................................................................10
7. Primjere primjene OpenAI FIVE....................................................................................................11
PROJEKCIJE ZA BUDUĆNOST I ZAKLJUČAK............................................................................................15
POPIS LITERATURE................................................................................................................................16
POPIS SLIKA..........................................................................................................................................17
1. Povijest
Umjetna inteligencija ili UI je naziv koji pridajemo svakom neživom sustavu koji
pokazuje neke sposobnosti ramišljanja odnosno bilo kakav znat inteligencije. Prva pojava
umjetne inteligencije bila je 1943 gdje su McCulloch i Pitts pokušali razviti model mozga
zasnovan na Bulovim funkcijama.
Kada se dublje uđe u raspravljanje ove teme te dotaknemo i same robotike koja je u
bliskoj vezi sa umjetnom inteligencijom moramo si postaviti sljedeća pitanja.
Sve su to izazovi koji se stavljaju pred nas te se određena pitanja ne slažu s mnogo toga
kao vjera i osnovna prava ljudi.
Najveći izazov bi na kraju bio osobina ljudi koja nas tjera da uvijek budemo iznad svega
te upravljamo svime a sama pomisao da bi čovjeka u skorijoj budućnosti nešto moglo
nadmašiti u svim fazama života te postati nesto superiornije od nas samih je iznimno
zastrašujuće na veliku većinu.
5. Pristupi i alati
Kroz povijest je bilo zahtjevno dati konkretnu definiciju i opisati svu šarolikost umjetne
inteligencije. To je ponajprije zbog toga što umjetna inteligencija predstavlja širok pojam.
Kompjutorski znanstvenici S.J.Russel i P.Norvig su 1995. izdali knjigu pod nazivom: „Umjetna
inteligencija - Moderan pristup“ , gdje su skupili na jednom mjestu veći broj definicija umjetne
inteligencije. Međutim zbog razlike u malim detaljima odlučili su ju klasificirati u četiri
kategorije.
Ovaj pristup nazivamo još i „Mišljenjem oput ljudi“. Kao što i sam naziv govori, ne
temelji se samo na površinskim ljudskim osobinama već i na dubljoj razini gdje stroj počinje
poprimati ljudsko mišljenje. U ovom slučaju umjetna je inteligencija alat koji služi za
modeliranje uma, tj. za testiranje teorija uma. Znanost koja najbolje definira ovaj pristup
naziva se kognitivna znanost. Kognitivna znanost je jednostavno definirana kao znanstveno
proučavanje ili uma ili inteligencije. Ona je interdisciplinarno proučavanje uzimajući iz
relevantnih polja u koja spadaju antropologija, filozofija, lingvistika, neuroznanost,
psihologija i računarstvo. Jedna od prvih teorija kreirana u svrhu kognitivnoga modeliranja
bio je GPS ( General Problem Solver ). Razvijen je početkom 60-ih godina kao opći rješavač
problema koji pritom koristi algoritme kojima se koriste i ljudi i na taj način omogućava
stvaranje protokola vrlo sličnih ljudskima.
Pristup zakona mišljenja u velikoj mjeri znači i racionalno mišljenje. Takvi sustavi
zovu se još i sustavima automatskog rasuđivanja i temelj im čine logički sustavi. Programi
koji djeluju racionalno kreirani su na taj način da imaju što veću djelotvornost i da se koriste
što štedljivijim algoritmima. Prednost ovog logističkog pristupa je u tomu što se svaki logički
sustav može svesti na vrlo sažet skup pravila dok je glavni nedostatak taj što se ne može
primijeniti u svim realnim situacijama, osobito ako znanje na osnovu kojeg se treba donijeti
odluka nije potpuno ili je dvosmisleno.
Pristup racionalnih agenata
OpenAI Five naziv je projekta strojnog učenja koji djeluje kao tim botova za video igre
koji igraju protiv ljudskih igrača u konkurentnoj videoigri Dota 2. Sustav je razvio OpenAI,
američka umjetna inteligencija (AI) istraživačka i razvojna tvrtka osnovana s misijom razvoja
sigurnog AI na način koji koristi čovječanstvu. Prvi javni nastup OpenAI Five-a dogodio se
2017. godine, gdje je demonstriran u igri uživo jedan na jedan protiv profesionalnog igrača igre
poznatog kao Dendi, koji ga je izgubio. Sljedeće je godine sustav napredovao do potpunog
nastupa od petorice i počeo igrati protiv te pokazao sposobnost poraza profesionalnih timova.
Posljednja javna demonstracija robota dogodila se u travnju 2019., gdje su na live
događaju u San Franciscu pobijedili u najboljoj od tri serije protiv Internacionalnih prvaka 2018.
godine.
Četverodnevni internetski događaj koji se igra protiv botova, otvoren za javnost, dogodio
se istog mjeseca. Tamo su botovi igrali u 42.729 ukupnih mečeva, osvojivši sve osim 4.075 za
konačnih 99% pobjede. Što je i više nego uspješno ali također i zastrašujuće.
Sam sustav radi tako što igra sa protiv sebe. Počine sa slučajnim parametrima i ne koristi
pretrage za priručnicim i tutorijalima ili reporodukciju profesionalnih igrača. Krene doslovno kao
djete dok uči hodati te se kroz vrijeme razvija i napreduje u zadatcima gdje oni postaju sve
kompleksniji i teži. Prilikom prvog igranja sustav se ne zna kretati dok već kroz nekoliko idućih
je razvio algoritam za najefikasnije kretanje sa što boljim ishodom po njega kako bi dobio
partiju. Da bi izbjegao kolaps tj.kako ne bi došao u stanje da ne zna što raditi, agent trenira 80%
svojih igara protiv sebe, a ostalih 20% protiv sebe u prošlosti. U prvim igrama junaci se besciljno
kreću po karti. Nakon višesatnih treninga, pojavili su se pojmovi poput laninga, farming ili borbi
na mapi. Nakon nekoliko dana, oni dosljedno usvajaju osnovne ljudske strategije te se pojavljuju
prvi znakovi inteligencije.
OpenAI Five ne sadrži kanal komunikacije između heroja. Timski rad kontrolira
parametar koji se zove "timski duh". Timski duh kreće se od 0 do 1, pri čemu se uzima težina
koliko bi svaki od junaka OpenAI Five trebao brinuti o svojoj individualnoj nagradnoj funkciji u
odnosu na prosjek nagradnih funkcija tima. Njegovu vrijednost je od 0 do 1 i otkriva se tijekom
treninga i prilikom samog izbora heroja odnosno je li heroju potrebno više vrijednosti tj.koliko je
bitan u odnosu na druga 4 iz svog tima.
U osnovi sustav funkcionira tako što od nekoliko tisuća opcija u određenom trenutku on
bira onu koja je u tom trenutku statistički najpogodnija i najprofitabilnija po njega.
Osim primjene u Dota 2 igri, ovaj sustav je našao primjenu i u drugim igrama kao što su
StarCraft, šah te mnoge druge. Pored igara sustav je našao primjenu i u robotici gdje imamo
primjer upravljanja robotskom rukom u svakodnevnim situacijama konkretno rješavanje
rubikove kocke.
RoboSumo je još jedan u nizu projekta gdje vidimo korištenje OpenAI sustava gdje robot
uči hodati te snalaziti se u prostoru pri dinamičkim uvjetima kao vjetrovit okoliš, udari raznim
predmetima i slično.
Sustav trenira pomoću umanjene verzije Proximal Policy Optimization koja radi na 256
GPU-a(grafičkih jedinica) i 128.000 CPU jezgri(procesorskih jezgri). Koristeći LSTM – Long
Short Term Memory individualno za svakog heroja uči strategije i stil igre bez ikakvog
potrebnog predzanja. Programski jezik koji se koristi je Python.
Slika 2. Razlika korištenja resursa u 1v1 i 5v5
Rapid radi na principu tako da stvara kopije od OpenAI Five-a te igra sam protiv svojih
kopija kao što je prethodno navedeno. U svakom trenutku igre Rapid prepoznaje pozitivne i
negativne poteze te ih pamti odnosno uči kako bi u daljnjem radu mogao adekvatno prepoznati
koje akcije su uzrokovale pozitivne ili negativne posljedice.
PROJEKCIJE ZA BUDUĆNOST I ZAKLJUČAK
Dio filozofskih problema proizlazi iz teleološkog određenja tih bića. Postoje li ona jer su
stvorena sa svrhom kojoj moraju služiti ili se mogu u jednom dijelu vlastita postojanja odrediti
kao slobodna bića? Konačno, teologija i religijske institucije neće biti pošteđene vlastitih
polemika: Kako riješiti probleme tvorca, duše i spasitelja umjetnih bića? Zasad rješenja takvih
problema možemo pronaći uglavnim u znanstveno-fikcijskim djelima.
POPIS LITERATURE
7. Schreiner, T. A. (2009). Artificial Intelligence in Game Design. Tim Artificial Intelligence Depot.
Web. Dohvaćeno iz AI-depot.com.
11. Wilson, J. L., Brown, K., Lombardi, C., Weksler, M., & Coleman, T. (1994). The Designer's
Dilemma. The Eighth Computer Game Developers Conference, (str. 26-31).
12. World, C. G. (2014). "The 7th International Computer Game Developers Conference".
Computer Gaming World. July 1993. p. 34. Retrieved 12 July 2014. The 7th International
Computer Game Developers Conference (str. 34). 2014.