You are on page 1of 7

1.

UVOD U BIOINFORMATIKU
1.1. DEFINICIJA BIOINFORMATIKE I ISTORIJSKI RAZVOJ

Bioinformatika je interdisciplinarna naučna oblast koja se bavi razvijanjem metoda i


softverskih alata za bolje razumevanje bioloških podataka. Interdisciplinarnost podrazumeva
korišćenje postojećih i sticanje novih znanja iz oblasti informatike, statistike, matematike i
kompjuterskih nauka, kao i njihova praktična primena u tumačenju različitih tipova bioloških
podataka. Još preciznije, bioinformatika je nauka koja se u biologiji koristi za tzv. in
silico eksperimentalne postupke, kao i za analizu dobijenih podataka korišćenjem matematičkih i
statističkih metoda. In silico eksperimenti obuhvataju eksperimentalne postupke koji se izvode
pomoću kompjuterskih simulacija, za razliku od poznatih pristupa in vitro, za eksperimente koje
izvodimo u “epruveti” kao i in vivo za one koje izvodimo u živim organizmima.
Bioinformatika, terminološki gledano, podrazumeva čitav niz bioloških istraživanja koja
u svojoj metodologiji koriste kompjuterske programe, ali se odnosi i na specifične analize tzv.
“slivanja” koje se često koriste, posebno u oblasti genomike. Bioinformatika se koristi i pri
identifikaciji gena kandidata kao i u slučaju određivanja SNPova, tj. polimorfizma pojedinačnih
nukleotida (SNP – engl. single nucleotide polymorphism). Ovakva identifikacija se sprovodi da
bi se bolje razumela genetička osnova različitih tipova bolesti, jedinstveni način adaptacije
pojedinih organizama, željene karakteristike kod prirvredno važnih organizama ili za utvrđivanje
razlika između populacija na nivou gena ili proteina. U širem smislu možemo reći da se
bioinformatika primenjuje metodološki i u cilju boljeg razumevanja načina organizacije
nukleinskih kiselina i proteina odnosno nukleotidnih i aminokiselinskih sekvenci u okviru
proteomike.
Danas je bioinformatika postala važan deo mnogih oblasti biologije. U eksperimentalnoj
molekularnoj biologiji, bioinformatičke tehnike, kao što su obrada slika i signala, omogućavaju
dobijanje i izdvajanje vrlo korisnih rezultata iz ogromne količine sirovih podataka. U oblasti
genetike i genomike, bioinformatika pomaže u sekvenciranju i obeležavanju genoma i mutacija
koje se uočavaju u njemu. Ona ima značajnu ulogu i u tumačenju značenja biološke
terminologije, u razvoju biološke i genske ontologije pri organizaciji bioloških podataka koji se
ispituju. Bioinformatika se koristi i u analizi ekspresije i regulacije gena i proteina.
Bioinformatički alati pomažu u poređenju genetičkih i genomskih podataka i uopštenije govoreći
u razumevanju evolucionog aspekta molekularne biologije.
1
Na višem integrativnom nivou, bioinformatika pomaže analizi i katalogizaciji bioloških
puteva i mreža koje su važan deo sistemske biologije. U strukturalnoj biologiji, bioinformatika
pomaže u simulaciji i modelovanju DNA, RNA, proteina i biomolekularnih interakcija.
Bioinformatika počinje da se razvija tokom ranih 70ih godina prošlog veka. Na početku
je to bila nauka koja analizira informatičke procese različitih bioloških sistema. U to vreme,
istraživači veštačke inteligencije su koristili umreženost ljudskog mozga kao model za
konstrukciju novih algoritama. I upravo ova upotreba bioloških podataka u cilju razvijanja
drugih naučnih oblasti je istraživače “gurnula” nazad u oblast biologije i na ideju upotrebe
računara za procenu i poređenje velikog seta podataka. Istorijski gledano, sam termin
bioinformatika nije imao značenje koje ima danas. Naime, termin bioinformatika su osmislili
Polin Hodžveg i Ben Hasper 1970. godine u cilju imenovanja čitavog korpusa novonastalih
istraživanja koja su se odnosila na proučavanje informacionih procesa koji se dešavaju u
biološkim sistemima. Ova prvobitna definicija je bioinformatiku odredila kao nauku koja se bavi
informatičkim procesima u biologiji, slično kao što se biofizika smatra naukom koja proučava
fizičke fenomene u biološkim sistemima, ili kao što biohemija proučava hemijske procese u
biološkim sistemima.
Nastanak bioinformatike se vezuje za trenutak kada je naučnicima postala dostupna prva
proteinska sekvenca. Od tog trenutka kompjuter postaje neophodno sredstvo u molekularnoj
biologiji najpre. To se dogodilo nakon što je Frederik Sanger determinisao prvu proteinsku
sekvencu za insulin davnih 50ih godina XX veka. Od tog trenutka količina podataka se
progresivno povećavala do te mere da je manualno poređenje ogromnog broja sekvenci postalo
nepraktično i nemoguće. Pionir na ovom polju bila je Margaret Okli Dejhof, naučnica koju je
zaposlio Dejvid Lipman, direktor Nacionalnog centra za biotehnološke informacije. Dejhofova i
Lipman su praktično osnivači bioinformatike kao naučne discipline. Dejhofova je sastavila jednu
od prvih baza podataka za proteinske sekvence, koja je najpre objavljena kao knjiga. Takođe,
napravila je i prve, pionirske radove koji su se bavili razvojem metoda poravnanja sekvenci u
molekularnoj evoluciji. U kratkom istorijskom pregledu razvoja bioinformatike treba pomenuti i
Elvina A. Kabata koji je analizirao biološke sekvence još ranih 70ih godina XX veka. Kabat je
objavio nekoliko sveobuhvatnih tomova o sekvencama antitela zajedno sa Taj Te Vuom u period
od 1980. do 1991. godine.

2
1.2. CILJEVI BIOINFORMATIKE
Da bismo proučavali promene u ćelijskoj aktivnosti iz normalne u patološku, tokom
nastanka bolesti i razvoja različitih stadijuma bolesti, biološki podaci se moraju kombinovati
tako da se konstruiše celovita slika svih mogućih patoloških procesa koji se dešavaju u ćeliji.
Zato je oblast bioinformatike evoluirala u pravcu razvijanja različitih metodologija koje mogu da
analiziraju i interpretiraju različite tipove podataka. To uključuje nukleotidne i aminokiselinske
sekvence, proteinske domene i proteinske strukture. Aktuelni procesi analize i interpretacije
podataka se odnose na kompjutacionu biologiju, jedne od važnih poddisciplina bioinformatike, i
oni uključuju:
- Razvoj i implementaciju kompjuterskih programa koji omogućavaju efikasan pristup,
korišćenje i uređivanje različitih tipova bioloških informacija
- Razvoj novih algoritama (matematičkih formula) i statističkih merenja koji obezbeđuju
povezanost između članova velike baze podataka. Na primer, postoje metode koje mogu
da lociraju gen unutar sekvence, mogu da predvide proteinsku strukturu i/ili funkciju, i da
grupišu proteinske sekvence u familije povezanih (srodnih) sekvenci.
Primarni cilj bioinformatike je da poveća nivo razumevanja bioloških procesa. Ono što
taj cilj razlikuje od drugih pristupa, međutim, jeste njegov fokus na realizaciju ciljeva kroz razvoj
i primenu intezivnih kompjuterskih tehnika. Primeri uključuju načine prepoznavanja ciljanih
sekvenci, određivanje značenja dobijenih podataka, algoritme mehaničkog učenja i vizuelizaciju.
Glavni istraživački napori u ovoj oblasti usmereni su na poravnanje sekvenci, pronalaženje gena,
sastavljanje genoma, dizajn lekova, otkriće novih lekova, poravnanje proteinskih struktura,
predviđanje strukture proteina, predviđanje genske ekspresije i protein-protein interakcija, studije
svegenomskih asocijacija, modelovanje evolucije i ćelijske deobe (mitoze).
Bioinformatika danas podrazumeva stvaranje i razvoj baza podataka, algoritama,
kompjutacionih i statističkih tehnika i teorija koje rešavaju formalne i praktične probleme koji
nastaju tokom uređenja i analize bioloških podataka. Tokom poslednjih nekoliko decenija, brz
razvoj informatičkih, genomskih i molekularnih tehnologija koje se koriste u biološkim
istraživanjima omogućio je da se postojeća znanja objedine i iskombinuju u cilju dobijanja
ogromne količine informacija koje su povezane sa molekularnom biologijom. Dakle,
bioinformatika je zbirni naziv za sve matematičke i kompjuterske pristupe koji se koriste da bi se
sakupile informacije o različitim biološkim procesima i da bi se oni bolje razumeli. Česte

3
aktivnosti u bioinformatici uključuju mapiranje i analizu sekvenci DNA i proteina, poravnanje i
poređenje sekvenci DNA i proteina, kao i izrada trodimenzionalnih modela proteina i njihovo
proučavanje.

1.3. ODNOS BIOINFORMATIKE I DRUGIH NAUKA


Bioinformatika je naučna oblast koja je slična ali ipak različita od kompjutacione
biologije, iako se često smatraju sinonimima. Kompjutaciona biologija koristi znanja
bioinžinjeringa i biologije da bi konstruisala tzv. biološke kompjutere, dok bioinformatika koristi
kompjutere kako bi se bolje razumela biologija. Bioinformatika i kompjutaciona biologija
uključuju analizu bioloških podataka, posebno DNA, RNA i proteinskih sekvenci. Porast
količine informacija u bioinformatici, kao mladoj nauci, može se s pravom nazvati eksplozijom
informacija koja je počela od 1990. godine. To enormno povećanje količine informacija u
bioinformatici pomogli su i Projekat humanog genoma kao i brz razvoj tehnologija
sekvencioniranja DNA.
Analiza bioloških podataka u cilju dobijanja velike količine smislenih informacija
uključuje pisanje i pokretanje softverskih programa koji koriste algoritme iz teorije grafova,
veštačke inteligencije, soft kompjutinga, značenja podataka, obrade slika i kompjuterskih
simulacija. Algoritmi za uzvrat zavise od teorijskih osnova kao što su diskretna matematika,
teorija kontrole, sistemska teorija, informacioina teorija i statistika.
Bioinformatika je aplikativna disciplina koja koristi informatička znanja za obradu i
analizu bioloških podataka. U tom smislu, bioinformatika je najviše povezana sa genetikom,
molekularnom biologijom i evolucionom biologijom. Naime, ogromna količina podataka u
bankama gena se analizira zahvaljujući informatičkoj tehnologiji, rekonstrukcija filogenetskih
stabala za utvrđivanje evolucione srodnosti pojedinih taksona takođe se obavlja primenom
informatičkih tehnologija. Bioinformatika, kao što je već i rečeno, koristi se za poravnanje
sekvenci u DNA ili proteinima ali i za analizu nukleotidnih promena u različitim patološkim
stanjima te ima vezu i sa medicinom, farmacijom i drugim aplikativnim granama nauke. Deo
informatičkih alata se koristi i za obradu slika u histologiji i citologiji, dok fiziologija i ostale
oblasti za sada imaju skromniji upliv bioinformatičkih alata i znanja. Najintenzivniju tj.
najprisniju vezu bioinformatika ostvaruje sa matematičkom biologijom i komjutacionom
biologijom.

4
1.3.1. MATEMATIČKA BIOLOGIJA
Matematička biologija je interdisciplinarna nauka koja ima širok spektar primene u
različitim naučnim disciplinama. Sinonimi za matematičku biologiju su biomatematika, gde se
naglašava matematički pristup i matematička biologija što naglašava biološku stranu. Ipak, neki
smatraju da nije reč o sinonimima već da postoji suptilna razlika između biomatematičara i
matematičkih biologa koja se svodi na sledeće – biomatematičari su ipak više zainteresovani za
matematiku koja je inspirisana biologijom nego samim biološkim problemima i obrnuto. Dakle,
biomatematika se više fokusira na razvoj teorijskih matematičkih načela u biologiji, a
matematička biologija na korišćenje matematičkih alata za proučavanje bioloških sistema.
Matematička biologija se bavi matematičkim prezentacijama bioloških procesa, pokušava
da reši probleme ispravljanjem patoloških ili modelovanjem postojećih bioloških procesa i to
korišćenjem tehnika i alata primenjene matematike. Ona ima i teorijsku i praktičnu primenu u
biološkim, biomedicinskim i biotehnološkim istraživanjima. Opisivati biološke sisteme u
kvantitativnom smislu znači da se njihovo ponašanje može bolje simulirati, a time i bolje
predviđati njihove osobine koje možda neće biti vidljive prilikom eksperimentisanja. To zahteva
precizne matematičke modele. Matematička biologija uključuje mnoge oblasti klasične
matematike i njihova primena u biologiji ima dugu istoriju. Ipak, tek nedavnoje došlo do
ogromnog upliva matematike u biologiju primenom i razvojem novih tehnika i interes za ovu
oblast i dalje raste. Neki od razloga za to su:
- Enormno povećanje grupa različitih tipova informacija sa puno podataka, s obzirom na
revoluciju genomike, koju je teško shvatiti bez upotrebe analitičkih alata
- Skorašnji razvoj matematičkih alata, kao što je teorija haosa, koji pomažu shvatanje
složenih, nelinearnih mehanizama u biologiji
- Povećanje računarske moći, što olakšava kalkulacije i simulacije, koje prethodno nisu
bile moguće
- Sve veći interes za in silico eksperimente zbog etičkih razloga, rizika, nepouzdanosti i
drugih komplikacija koje su prisutne u istraživanjima na ljudima i životinjama.
Matematička biologija i biomatematika imaju nekoliko područja razvoja unutar kojih se
provode specijalizovana istraživanja, kao i veliki broj istraživačkih projekata širom sveta, na
različitim univerzitetima i naučnim ustanovama, u kojima učestvuje sve veći broj naučnika. Taj

5
povećan interes za ove naučne discipline je potpuno razumljiv ako se uzme u obzir sve veća
složenost naučne problematike koja zahteva interakciju i integraciju znanja korišćenjem
matematičkih, logičkih, fizičko/hemijskih, molekulskih i kompjuterskih modela. Zbog široke
raznolikosti uključenih specifičnih znanja, biomatematička istraživanja se često ostvaruju u
saradnji između stručnjaka u oblasti matematike, biologije, bioinformatike, matematičke
biologije, biostatistike, biofizike i drugih oblasti.

1.3.2. KOMPJUTACIONA BIOLOGIJA


Kompjutaciona biologija je interdisciplinarna nauka koja primenom analitičkih i
teorijskih metoda putem matematičkog modelovanja i tehnika kompjuterske simulacije, razvija i
primenjuje podatake u cilju proučavanja bioloških, etoloških i socijalnih sistema. Oblast
kompjutacione biologije je široko definisana i podrazumeva upotrebu znanja iz različitih domena
kompjuterske nauke, primenjene matematike, animacije i vizuelnih tehnologija, statistike ali i
biohemije, hemije, biofizike, molekularne biologije, genetike, genomike, ekologije, evolucije,
anatomije i neuronauka.
Kompjutaciona biologija se razlikuje od biološke kompjutacije, koja je subdisciplina
kompjuterske nauke i kompjuterskog inžinjeringa koji koriste bioinžinjering i biologiju za
izgradnju kompjutera, ali je slična bioinformatici, interdisciplinarnoj oblasti koja koristi
kompjutere da uskladišti i obrađuje biološke podatke. Kompjutaciona biologija uključuje mnoge
aspekte bioinformatike, i koristi biološke podatke da razvije algoritme ili modele za bolje
razumevanje različitih bioloških procesa i bioloških sistema i međusobnog odnosa između njih.
Do nedavno, biolozi generalno nisu imali lak pristup velikoj količini podataka koji su postali
opšta potreba, posebno u molekularnoj biologiji i genomici (banke sekvenci, banke gena itd).
Drugim rečima, istraživači su bili u stanju da razviju analitičke metode za interpretaciju
bioloških informacija, ali nisu bili u stanju da te informacije razmenjuju brzo između sebe.
Informacije su ipak počele da se razmenjuju počev od 1982. godine, pa je količina
podataka koji se razmenjuju počela da raste eksponencijalno sve do kraja 80ih godina. Ovo je
zahtevalo razvoj novih kompjutacionih metoda u cilju brže analize i interpretacije relevantnih
informacija. Tako je već od kasnih 90ih, kompjutaciona biologija postala važan deo sve
prisutnijih razvojnih tehnologija u oblasti biologije.

6
Treba napomenuti još jedan detalj. Naime, termin kompjutaciona biologija i evoluciona
kompjutacija imaju slične nazive ali ih ne treba poistovećivati. Za razliku od kompjutacione
biologije, evoluciona kompjutacija se ne bavi modelovanjem i analizom bioloških podataka, već
stvaranjem algoritama zasnovanih na teoriji evolucije i to za veliki broj vrsta. Takođe, nekada se
to može odnositi i na genetičke algoritme koje istraživači u ovoj oblasti mogu primeniti u
kompjutacionoj biologiji. Drugim rečima, dok evoluciona kompjutacija nije nužno deo
kompjutacione biologije, kompjutaciona evoluciona biologija je definitivno podoblast
kompjutacione biologije.
Kompjutaciona biologija se koristi u sekvenciranju humanog genoma, u kreiranju
preciznih modela ljudskog mozga, i pomaže u modelovanju bioloških sistema. Deli se na
kompjutacionu anatomiju, kompjutaciono biomodelovanje, kompjutacionu genetiku (genomiku),
kompjutacione neuronauke, kompjutacionu farmakologiju, kompjutacionu evolucionu biologiju,
kompjutacionu biologiju kancera itd. Kompjutaciona biologija koristi širok spektar različitih
softvera. Ovaj opseg se prostire od komandnih linijskih programa do grafičkih i veb-zasnovanih
programa.

You might also like