You are on page 1of 7

 

FILOZOFSKI FAKULTET SVEUČILIŠTA U ZAGREBU


ODSJEK ZA SOCIOLOGIJU

Izgradnja simulacijskih modela u sociologiji


prof. dr. Vjekoslav Afrić

Seminarski rad

Priredio: Matija Sinković, 3. god.

Amy Perfors: Simulated Evolution of Language


II dio

Evolucija sintakse

Model uspostavljenih parametara


Model uspostavljenih parametara evolucije sintakse baziran je na temeljima
Chomskyjevih uspostavljenih parametara. U njemu su agenti rođeni s ograničenim brojem
parametara s ograničenim vrijednostima, koji upravljaju različitim aspektima jezika. Učenje
podrazumijeva podešavanje tih parametara na temelju specifičnog jezika iz kojeg agent prima
unose. Dijete se prema tom modelu rađa s neuspostavljenim parametrom koji se kasnije
uspostavljaju prema količini primljenih unose.
Ovaj model kompjuterske simulacije ima četiri cilja. Prvi je pokazati da je moguće
stvoriti učenike koji efikasno upotrebljavaju gramatiku prema određenim «okidačima» u
unosu podataka. Drugi cilj je ispitati u kojoj mjeri vanjski čimbenici utječu na naučenu
gramatiku, a treći cilj je ispitati koliko je unos gramatike određen «biološki». Četvrti cilj je
ispitati kako pritisci izbora kao što su lakoća učenja jezika, njegova izražajnost i
interpretativnost, međusobno djeluju i stvaraju evoluciju jezika.
Agenti u radu Teda Briscoea su opremljeni LAD-om (language aqusition device;
uređaj za upotrebu jezika) koji sadrži 20 uspostavljenih parametara koji obuhvaćaju gotovo
300 gramatika i 70 različitih jezika. Agenti s definiranim parametrima imaju urođene neke
jezične mogućnosti dok ih oni s nedefiniranima nemaju. Parametri su podložni promjenama i
tako je moguće povećavanje kompleksnosti gramatike i LAD-a.
Uz LAD, agent posjeduje i parser algoritam koji se sastoji od tri koraka (primjeni,
ograniči, zaustavi) kojima modificira nakupinu kategorija koje prima unosom. Agent također
posjeduje i algoritam uspostavljanja parametara koji mijenja definicije parametara ako
algoritam parsiranja ne može obraditi neki unos. Kako prema programu svaki parametar može
biti promijenjen samo jednom, tako se promjene kreću hijerarhijskim redoslijedom
mijenjajući prvo najopćije parametre, a kasnije sve specifičnije. Interakcija između agenta je
uspješna ako su im parametri kompatibilni, a reproducuraju se crossoverom početnih
uspostavljenih parametara.
Osnovni zaključak ovog istraživanja je da je moguće razvijati učenike koji mogu
uspješno koristiti gramatiku uz određeni unos. Nedefinirani parametri prihvatili bi jezik nakon
otprilike 30 unesenih okidača.
Bricsoev rad pokazuje koevoluciju jezika i LAD-a. Iako su svi učenici bili u stanju
naučiti jezik, inicijalne definicije parametara su bile značajne: agenti s definiranim
parametrima su efikasnije učili uobičajene jezike dok su oni s nedefiniranim parametrima
lakše učili rijetke jezike. U slučajevima bez lingvističke promjenu u prednosti su bili agenti s
apsolutnim parametrima (parametri se ne mogu uopće mijenjati) dok su u situacijama
obilježenim lingvističkom promjenom u prednosti bili agenti s nedefiniranim parametrima i
agenti s inicijalno definiranim parametrima. U slučaju izuzetno velikih lingvističkih varijacija
prednost su imali apsolutni parametri iz čega se zaključuje da mehanizmi migracija pogoduju
apsolutnim principima raširenim u populaciji.
Briscoe identificira tri pritiska koji potiču evoluciju jezika. Prvi je lakoća učenja jezika
definirana brojem parametara potrebnih za upotrebu gramatike. Drugi je izražajnost, određena
brojem tipova okidača potrebnih za prelazak na jezik, a treći je interpretabilnost, izražena
troškovima memorije potrebnim za proces parsiranja.
Briscoevljev rad je važan jer demonstrira mogućnost upotrebe jezika koji su dio jezgre
univerzalne gramatike u modelu uspostavljenih parametara. Također pokazuje koevoluciju
jezika i LAD-a te nudi paradigmu za modeliranje evolucije jezika prema tri gore navedena
pritiska koji su u međusobnom sukobu. Mana model je pretpostavka postojanja parsera koji
funkcioniraju na temelju jezičnih unosa bez objašnjenja kako su nastali i parseri i prvi jezični
unosi. U modelu je također mala razlika između jezične i genetske evolucije (evolucije LAD-
a) koja je nerealna u stvarnom svijetu.

Model indukcije sintakse


Modeli evolucije sintakse putem indukcijskih algoritama tvrde da osobine sintakse
nastaju iz prirodnog procesa evolucije jezika. Agenti su opremljeni skupom značenja,
sposobnošću poimanja gramatike i indukcijskim algoritmom.
Kirby razlikuje I-jezik (skup značenja u mozgovima populacije) i E-jezik (vanjski
jezik izražen govorom). Pojedinci su opremljeni slučajno odabranim skupom značenja i
mogućnošću nekontekstualnog gramatičkog poimanja, ali bez kompozicioniranja i
povratnosti. Individue nemaju nikakvog početnog lingvističkog znanja, a mogu imati uloge
govornika i slušatelja. Govornik mora koristiti riječi za značenja koja sadrži njegov I-jezik i
ukoliko na temelju svog gramatičkog poimanja može proizvesti odgovarajući rečenicu to će
učiniti, a ukoliko ne, proizvest će najtočniju moguću. Slušatelj čuje rečenicu i komunikacija je
uspješna ako se mapa značenja i veza između njih poklapa kod slušatelja i govornika. Ta
usporedba se odvija pomoću indukcijskog algoritma koji se odvija putem dvije operacije. Prva
je inkorporiranje rečenice u gramatiku, a druga je brisanje dupliciranih pravila. Dodatna
operacija omogućuje generaliziranje zajedničkog pravila subsidirajući dva slična.
Agenti su uspjeli razviti jezik koji je u svojoj strukturi bio i kompozicijski i povratan.
Kirby je ustanovio da je razvoj tekao kroz tri stadija. U prvom stadiju gramatika je bila lista
riječi nastala agentovim smišljanjem izraza koji su mu nedostajali. Druga faza nastupa kada
broj pokrivenih značenja prijeđe broj gramatičkih pravila. Treća faza je potpuno stabilna. Broj
značenja je dostigao maksimum, a veličina gramatike je relativno mala. Jezik je postao
kompozicijski i povratan te omogućuje agentima da s relativno malim brojem pravila izraze
sva značenja.

Model neuralnih mreža


Dosadašnji modeli su se oslanjali na genetsko programiranje, dok Batalijev model
objašnjava evoluciju sintakse preko neuralnih mreža. Agenti s neuralnim mrežama
naizmjenično šalju i primaju poruke jedni drugima obnavljajući tako svoje mreže. Nakon
nekoliko takvih epizoda komunikacije razvijaju se visoko koordinirani komunikacijski sistemi
sa strukturalnim pravilima sličnim sintaksi.
Komunikacijski agenti imaju vektor značenja kojeg čini 10 realnih brojeva od 0.0 do
1.0. Neuralna mreža zadužena za slanje i primanje znakova sastoji se od tri sloja jedinica:
jedinice za unos svakog znaka, 30 jedinica za unos konteksta (skriveni sloj) i deset jedinica za
output koje odgovaraju vektorima značenja. Redoslijed poslanih znakova ovisi o vektoru
značenja kojeg agenti sami stvaraju karakter po karakter kako bi bio što sličniji značenju koje
žele izraziti. Agenti će također koristiti vlastiti odgovor kako bi predvidjeli odgovor drugog
agenta. Slušatelji moraju prilagoditi vlastiti vektor značenja nakon što su čuli redoslijed
znakova. Smatra se da su vrijednosti dobro klasificirane ako su unutar intervala od 0.5 od
zadane vrijednosti u slušateljevom vektoru. U svakom koraku simulacije agenti su
naizmjenično govornici i slušaoci. Dok je agent slušalac, trenira prepoznavanje redoslijeda
znakova poslanih od slučajno izabranog govornika, a zatim se oboje vraćaju u populaciju.
Na početku simulacije agenti skoro uvijek krivo interpretiraju redoslijede i tek nakon
15000 koraka postiže se točnost od oko 97 %. Redoslijedi znakova u komunikacijskom
sistemu su razvili neku pravilnost, ali dobivena sintaksa nije potpuno pravilna s čestim
devijacijama u redoslijedu znakova.

Diskusija o evoluciji sintakse


Svi dosadašnji pristupi simulaciji evolucije sintakse ostaju upitni ako ih pokušamo
generalizirati na evoluciju ljudskog jezika, jer imaju previše pretpostavki o učenju jezika koje
su zadane a priori. Tako Briscoe pretpostavlja da agenti imaju sposobnost uspostavljanja
parametara, sposobnost parsiranja rečenice i mentalnu gramatiku sposobnu za stvaranje
kontekstualno osjetljivih jezika. Kirby pretpostavlja da agenti poimaju značenja koja su
kompozicijske i hijerarhijske strukture, a algoritmi indukcije i invencije su pristrani stvaranju
kompozicijskih pravilnosti prilikom unosa. Batalijev je algoritam pak pristran otkrivanju u
stvaranju pravilnosti u govoru. Uz to, sva tri pristupa imaju zajedničku fundamentalnu
pretpostavku da su agenti spremni na komunikaciju i stvaranje jezika što u realnom životu ne
mora biti nužno.

Evolucija komunikacije

Evolucija procedure učenja


Simulacijski modeli su napravljeni i da bi se odgovorilo na pitanja o nastanku
komunikacije. Prvo istraživanje bavi se pitanjem kako je među životinjama, sposobnim za
produciranje i odgovaranje na jednostavne signale, nastala koordinirana komunikacija.
Analiza Oliphanta i Batalija temelji se na komunikacijskoj epizodi u kojoj jedan pripadnik
populacije proizvodi signal prilikom nekog događaja, a druge životinje prepoznaju signal i
odgovaraju na njega. Biranje signala i njegovo prepoznavanje temelji se na funkciji
vjerojatnosti, tako da je uspješna komunikacija definirana kao vjerojatnost prepoznavanja
signala. Najjednostavnija procedura učenja je «oponašaj-biraj». U njoj pojedinac šalje signal
koji najčešće koriste i drugi članovi populacije, a interpretira signal onako kako ga interpretira
većina. Druga metoda nazvana je «obverter» (naličje) i temelji se na pretpostavci da je za
uspješnu komunikaciju bolje koristiti onaj signal koji se najčešće prepoznaje, a ne onaj koji se
najčešće koristi. Ta se strategija pokazala uspješnijom postigavši 99 % točnosti u
komunikaciji u samo 600 koraka, dok «imitiraj-biraj» strategija prenaglašava komunikacijske
dispozicije populacije i ne pogoduje daljnjem razvoju. Ipak, i drugi model ostavlja
neodgovorenim pitanje o nastanku koordinirane komunikacije te ne pruža dokaze za nastanak
«observer» tehnika na početku.

Evolucija koordinacije
Da bi se razvila koordinirana komunikacija mora postojati određena motivacija za to. I
dok je motivacija slušaoca očigledna (skupljanje podataka), ostaje upitna motivacija
govornika. Agenti u Batalijevom modelu koji se bavi ovim pitanjem imaju dvije mape: jednu
za slanje koju čine značenja ograničenog broja signala i jednu za primanje koja djeluje
obrnuto. Komunikacija je uspješna kada se poklapaju mape slušaoca i govornika.
Koordinacija primanja se uzima jedinom važnom i definira se kao postotak signala iz
populacije koje pojedinac može razumjeti. Oliphantov model koristi agente s genetskim
algoritmom i dvobitnim sistemima transmisije i recepcije. Taj model također pozitivno
diskriminira primanje signale.
U oba modela uspostavljen je sistem koji nije u potpunosti stabilan već bistabilan,
naizmjence koristeći dva dominantna sistema. Primjenjujući na rezultate saznanja drugih
istraživanja o altruizmu Oliphant smatra da se u populaciji razvija koordinirana komunikacija
zbog reproduktivnih motiva i zaštite vlastitog genetskog materijala. To potvrđuje činjenica da
model bolje funkcionira na malim populacijama. Ova dva modela ipak ostavljaju pitanje kako
se razvijaju kompleksniji oblici komunikacije kao kod ljudske vrste.
Evolucija komunikacije među umjetnim životom
Osnovna ideja ovog istraživanja je simulacija okoliša koji prisiljava agente na
komunikaciju. Što je okoliš kompliciraniji trebali bi se razvijati to zanimljiviji oblici
komunikacije. Simulirane životinje su smještene u mrežu od 40000 mogućih lokacija, a
govornici u modelu su ženke koje vide muške primjerke i ispuštaju zvukove kako bi ih
primamile. Muške životinje su slijepe i moraju stvoriti uspješan oblik komunikacije kako bi
imali stalan uspjeh u parenju. Kada ženka ugleda mužjaka njena neuralna mreža proizvodi
zvuk koji dolazi kao unos do neuralne mreže mužjaka što kao rezultat daje njegovo kretanje.
Na početku modela ženke su ispuštale nasumične zvukove, a mužjaci se kretali
nasumično. Kad su uspostavili najefikasniji oblik kretanja (linearni), počeli su više
posvećivati pažnju ženkinim signalima što je navelo ženke na slanje signala za koje je
vjerojatnije da će ih mužjaci prepoznati. Najuspješniji mužjaci su bili dvojezični, poznavali su
jezike dvije dominantne subpopulacije ženki.
Ovaj model, iako nerealan u stvarnom svijetu, je bolji od prethodnih jer uzima u obzir
vanjske pritiske na stvaranje komunikacije, a agenti nisu unaprijed opremljeni nekim
sposobnostima kao prethodnim modelima. Mane su mu što ženke uvijek vrše funkciju
govornika, a mužjaci slušaoca i što se zaustavlja na razini komunikacije životinja. S razvojem
simulacije kompleksnijeg okoliša i kompleksnijih jedinki možda bi bilo moguće razviti i
ljudski jezik.

Pristup sintetske etologije


MacLennan i Burghardt su razvili simulaciju u kojoj se sposobnost temelji mjeri
nivoom suradnje individua. Individue imaju kodirane genome koji su uvršteni u genetski
algoritam, a koji su određeni unutarnjim stanjem organizma, globalnim stanjem simulacije,
lokalnim stanjem organizma i reakcijom organizma. Suradnja se u biti mjeri preko broja
akcija koje organizam poduzima na temelju lokalnog stanja druge individue. Kako je ono
nedostupno osim komunikacijom preko globalnog stanja, mjera sposobnosti je u biti mjera
komunikacije.
U uvjetima kada je komunikacija potisnuta zbog dodane buke u okoliš, kooperacija se
svodi na slučajnost. Kada je ta prepreka otklonjena, kooperacija značajno raste. Kada je
omogućeno i učenje, sposobnost individua dramatično raste. Pošto u ovom modelu nema
mogućnosti kooperacije, osim putem komunikacije, on ne objašnjava nastanak komunikacije
među ljudima.

Zaključak
Većinu radova o kompjuterskim simulacijama evolucije jezika možemo podijeliti na
radove o pojavi sintakse, radove o pojavi koordinirane komunikacije ili radove koji ispituju
urođenost jezika. Najveći nedostatak istraživanja o evoluciji jezika predstavlja rupa između
evolucije komunikacije i evolucije jezika koju simulacijski modeli nisu uspjeli premostiti.
Studije o nastanku koordinirane komunikacije pokazuju kako su se mogli razviti prvi koraci u
evoluciji jezika, ali ne pokazuju kako je došlo do nastanka ljudskog jezika za razliku od
životinjskog. S druge strane, studije o evoluciji sintakse uključuju fundamentalne
pretpostavke koje nisu dokazane tako da agenti u simulacijama imaju unaprijed razvijene
gramatičke strukture, algoritme učenja, značenja i algoritme parsiranja. Iako one govore puno
o utjecaju tih pretpostavki na razvoj sintakse, ostavljaju neriješenim pitanje inicijalnog
pokretača evolucije jezika.

You might also like