You are on page 1of 3

Mikrobiologija je nauka koja proučava mikroorganizme, sićušne životne forme koje nas

okružuju i premale su da bi se videle golim okom. Mikroorganizmi ili mikrobi, kao heterogena
grupa, obuhvataju organizme kao što su bakterije, virusi, alge, gljive, lišajevi i protozoe. Mogu se
naći u vodi, zemljištu i vazduhu, ali i ljudsko telo, takođe, predstavlja utočište za ogroman broj
mikroba. Neki od mikroba su veoma važni za zdravlje čoveka, dok neki od njih predstavljaju izvor
raznih zaraza i bolesti. Prema odnosu sa organizmom koji im je domaćin (čovek, životinja ili biljka),
mikrobi mogu biti paraziti, simbionti, komenzali ili slobodnoživeći organizmi. Mikrobiota
predstavlja ukupni sadržaj mikroba u određenom okruženju, a ljudsko telo sadrži 10-100 milijardi
ćelija raznih mikroorganizama koji su primarno smešteni u stomaku, odnosno crevima čoveka.
Iako mikrobi naseljavaju praktično sve delove ljudskog tela, zna se vrlo malo o njihovoj ulozi u
stanju organizma i zdravlju čoveka. U poslednje vreme mikrobi su postali aktuelna tema za
istraživanje, s obzirom na to da se povezuju sa mnoštvom bolesti i stanja organizma [1, 2]. Mikrobi
vrše većinu biohemijskih aktivnosti na planeti i imaju važnu ulogu u procesu metabolizma i imune
homeostaze u ljudskom organizmu. Odstupanja od normalne strukture zajednice mikroba nije
moguće odrediti bez prethodnog određivanja šta obuhvata normalna struktura zajednice
mikroba u ljudskom organizmu. Ukupan genetski materijal mikroba u ljudskom organizmu naziva
se mikrobiom. U proseku, na svaki ljudski gen dolazi oko 50 gena mikroba, čime se objašnjava i
značaj analize sprezanja na genetskom nivou. Nedavnim unapređivanjem tehnologija
sekvenciranja postalo je izvodljivo obrađivanje podataka dobijenih u velikim studijama o
mikrobiološkim zajednicama.
Revolucija u mikrobiološkim eksperimentima nastala je povećanjem brzine istraživanja i
otkrićima u vezi sa diverzitetom mikroorganizama i njihovim ulogama u ekološkim procesima [3].
Osnova razumevanja mikrobioma i njegove funkcije počinje sa otkrivanjem mikroba koji su
prisutni u uzorcima, a nastavlja se upoređivanjem različitih uzoraka i pronalaženjem sličnosti
baziranih na sastavu zajednica. Trenutna istraživanja zasnivaju se na mikrobiološkim zajednicama
ekstraktovanih direktno iz okruženja i obrađenih NGS (next-generation sequencing) tehnologijom
koja omogućava istraživačima da vrše ispitivanja koja dosad nisu bila moguća, kao što je brzo
sekvenciranje celog genoma, proučavanje miliona fragmenata 16S rRNK gena umesto nekoliko
stotina fragmenata ili proučavanje diverziteta mikrobioma kod ljudi ili u okruženju [4]. Te studije
omogućavaju razumevanje mikroorganizama koji postoje u različitim staništima, kao što su ljudi
(creva, koža, usta...), voda, zemljište itd. Postavlja se pitanje koji mikroorganizmi se tu nalaze,
stoga identifikacija prisutnih mikroba i određivanje količine njihove zastupljenosti omogućavaju
uvid u diverzitet posmatranog uzorka.
Trenutno najzastupljenija tehnika za proučavanje mikrobiološkog diverziteta jeste
sekvenciranje marker gena 16S rRNK kod prokariota ili 18S rRNK kod eukariota, s obzirom na to
da su ovi geni visoko-očuvani u okviru vrste i na taj način pogodni za filogenetsku taksonomiju.
Taksonomija se zasniva na klasterovanju, odnosno grupisanju sličnih vrsta u klastere.
Grupe mikrobioloških vrsta koje pokazuju određen nivo sličnosti predstavljaju OTU
(Operational Taxonomic Unit) jedinice. Nakon identifikacije OTU jedinica u uzorcima prilikom
analize, sledeći korak može uključivati međusobna upoređivanja uzoraka bazirana na određenim
merama udaljenosti, što se naziva analiza beta raznovrsnosti (beta diversity), i nakon toga može
se ponovo primeniti klasterovanje radi grupisanja taksonomski sličnih uzoraka. Klasterovanje sa
sobom nosi određene dileme, kao što su određivanje najpogodnijeg algoritma za rešavanje datog
problema, parametara, metrike sličnosti ili rastojanja, pragova, itd.
Iako je značaj studija kompleksnih mikrobioloških zajednica u prirodnom okruženju
prepoznat, studije koje priznaju pouzdanost izvedenih zaključaka zasnovanih na takvim
istraživanjima tek nedavno su počele da se publikuju. OTU struktura pojedinačnih uzoraka grupiše
se u tkz. OTU tabele, gde je za svaki uzorak naznačen kvantitiet vrsta iz određene OTU jedinice,
pri čemu je veliki broj jedinica poznat u praksi, ali nije sadržan u uzorcima, stoga su OTU tabele
retke. Analizom retkih OTU tabela, kombinovanjem raznih algoritama klasterizacije ili
klasifikacije, izbora jedne od mnogih mera sličnosti (diverziteta) mogu se dobiti i ne konzistentni
rezultati [5]. Ansambalsko klasterovanje, kao i ansambalska klasifikacija predstavljaju pristup za
povećanje robusnosti stabilnosti i preciznosti rešenja, detektovanih klastera [6].
Za analizu ogromnih količina složenih podataka koje su nam danas dostupne i koje se
stalno generišu potrebno je osmisliti nove algoritme za njihovu obradu i analizu. Mašinsko učenje
ima centralnu ulogu u analizi podataka, pružajući mogućnost da se podaci grupišu, otkriju
skrivene relacije i obuče modeli za predikciju. Integrativni pristupi u mašinskom učenju su
posebno značajni, jer se oslanjaju na više algoritama i ulaznih parametara, a motivisani su željom
za povećanjem tačnosti, robusnosti i stabilnosti. Algoritmi mašinskog učenja primenjuju se u
rešavanju problema iz oblasti bioinformatike, odabrane zbog eksponencijalnog rasta količine
genomskih podataka.
U ovom radu se primenjuje Mothur tok obrade podataka za analizu 16S rRNK sekvenci i
utvrđivanje taksonomskog sadržaja uzoraka mikrobioma, kao i naknadnu klasifikaciju uzoraka.
Cilj rada je da se izvrši poređenje sa nedavno objavljenim rezultatima nad istim skupom podataka
obrađenim u konkuretskom Qiime paketu obrada, koji je takođe utvrđen taksonomski sastav
uzoraka. Na raspolagnju nije bio čitav genom već samo 16S rRNK marker gen. Iako postoje
ograničenja u korišćenju ovih sekvenci, kao što su nizak stepen evolucije i manjak korelacije sa
funkcijama organizma, nije se pojavio nijedan drugi marker koji se može naći u svim organizmima,
koji ima nizak stepen rekombinacije gena i ima dovoljno genetskih informacija za razlikovanje vrlo
srodnih organizama. Čak i pre pojave NGS, 16S rRNK sekvence gena bile su najčešće prikazivane
u GenBank repozitorijumu, a metode i algoritmi koji su postojali evaluirani su pomoću 16S rRNK
sekvenci gena.
Milioni sekvenci dobijenih iz mikrobioloških uzoraka moraju se procesirati naprednim
tehnikama analize podataka uz korišćenje značajnih računarskih resursa. U ovim oblastima vrlo
često se koristi klasterovanje i klasifikacija podataka i stoga je od velike važnosti da se algoritmi
dalje razvijaju i unapređuju kako bi mogli da se koristi na sve većim količinama podataka.

You might also like