Professional Documents
Culture Documents
4 Poglavlje - Staniƒni Genomi
4 Poglavlje - Staniƒni Genomi
www.perpetuum-lab.com
se u duge DNA slijedove koji lee u prostorima izmeu gena (spacer sekvence ili
sekvence razmaka). Meutim, unutar veine eukariotskih gena takoer se nalaze velike
koliine nekodirajuih DNA sekvenci. Takvi geni imaju podijeljenu strukturu u kojima su
segmenti kodirajuih sekvenci (egzoni) razdvojeni pomou nekodirajuih sekvenci (introni)
(slika 4.2). itav gen se prepisuje u dugaku RNA molekulu, a onda se introni odstranjuju
procesom prekrajanja (prema engl. splicing) tako da samo egzoni ostaju ukljueni u
molekulu RNA. Iako introni nemaju nikakvu poznatu ulogu, oni predstavljaju znaajan dio
DNA u genomima viih eukariota.
Introni su po prvi put neovisno otkriveni 1977. godine u laboratorijima Phillipa Sharpa
i Richarda Robertsa prilikom istraivanja replikacije adenovirusa u kultiviranim humanim
stanicama. Adenovirus predstavlja koristan model za prouavanje genske ekspresije zato to
genom ovog virusa sadri samo oko 3,5x 104 parova baza kao i zato to se u zaraenim
stanicama proizvode velike koliine mRNA adenovirusa. Jedan od pristupa koritenih za
karakterizaciju adenovirusne mRNA iao je preko odreivanja smjetaja odgovarajuih
virusnih gena promatranjem RNA-DNA hibrida elektronskim mikroskopom. Budui da se
RNA-DNA hibridi mogu razlikovati od jednolanane DNA, mogu se odrediti poloaji RNA
prijepisa na DNA molekuli. Zaudo, ovakvi eksperimenti otkrili su da se adenovirusne mRNA
ne hibridiziraju samo sa jednim podrujem virusne DNA (Slika 4.3). Umjesto toga, pojedina
molekula mRNA hibridizira se s nekolicinom odvojenih podruja virusnog genoma. Iz toga
slijedi da adenovirusna mRNA ne odgovara neprekidnom prijepisu DNA kalupa; zapravo,
mRNA se sklapa iz nekolicine razliitih blokova sekvenci koji potjeu iz razliitih dijelova
virusne DNA. Kasnije se pokazalo da se to odvija uz pomo prekrajanja RNA (prema engl.
RNA splicing) o emu e se detaljno raspravljati u Poglavlju 6.
Ubrzo nakon otkria introna u adenovirusa, primjeena je slina pojava u kloniranim
genima eukariotskih stanica. Na primjer, elektronsko-mikroskopska analiza RNA-DNA
hibrida i naknadno sekvenciranje kloniranih genomskih DNA i cDNA ukazali su na to da je
kodirajua regija mijeg -globinskog gena (koji kodira podjedinicu hemoglobina)
prekinuta dvama intronima koji se odstranjuju prekrajanjem (Slika 4.4). Intronsko-egzonska
struktura mnogih eukariotskih gena prilino je komplicirana, a koliina DNA u intronskim
sekvencama esto je vea od one u egzonima. Sekvenca ljudskog genoma ukazuje na to da
prosjean humani gen sadri otprilike 9 egzona, da je isprekidan sa 8 introna i rasporeen na
oko 30.000 parova baza (30 kilobaza ili kb) genomske DNA. Openito egzoni ine samo oko
2 kb, pa prema tome vie od 90% prosjenog humanog gena ine introni.
Introni su prisutni u veini gena sloenih eukariota, iako ne predstavljaju univerzalnu
pojavu. Na primjer, introni nedostaju u skoro svim histonskim genima pa je prema tome
jasno da introni nisu potrebni za funkcioniranje gena u eukariotskim stanicama. Takoer treba
dodati da introni nisu naeni ni u veini gena jednostavnih eukariota kao to kvasci. Nasuprot
tome, introni jesu prisutni u nekim rijetkim genima prokariota. Prisutnost ili odsutnost introna
prema tome ne predstavlja apsolutnu razliku izmeu prokariotskih i eukariotskih gena iako su
introni daleko ei u viih eukariota (biljaka i ivotinja) gdje na njih otpada znatan dio
cjelokupne genomske DNA.
Veina introna ne odreuje sintezu nekog staninog proizvoda, iako postoji mali broj
introna koji kodiraju funkcionalne RNA ili proteine. Ipak, introni igraju vanu ulogu u
kontroli genskog izraaja. Na primjer, prisutnost introna omoguava da se egzoni nekog gena
mogu spajati u razliite kombinacije to rezultira sintezom razliitih proteina na temelju
jednog te istog gena. Ovaj proces naziva se alternativno prekrajanje (prema engl.
alternative splicing) (Slika 4.5.), a budui da se zbiva esto u genima sloenih eukariota,
smatra se vanim za poveanje repertoara funkcije 30.000- 40.000 gena ljudskog genoma.
Za introne se takoer misli da su odigrali vanu ulogu u evoluciji olakavajui
rekombinaciju izmeu regija za kodiranje proteina (egzona) razliitih gena- procesom koji je
www.perpetuum-lab.com
poznat pod imenom egzonsko mijeanje (prema engl. exon shuffling). Egzoni esto kodiraju
funkcionalno razliite proteinske domene, pa bi rekombinacija meu intronima razliitih gena
rezultirala novim genima koji sadre nove kombinacije sekvenci za kodiranje proteina.
U skladu s ovom hipotezom, prouavanja posveena sekvenciranju pokazala su da su neki
geni egzonske kimere izvedene od nekolicine gena, a to predstavlja direktni dokaz da novi
geni mogu nastati rekombinacijom izmeu intronskih sekvenci.
O evolucijskom porijeklu introna postoje kontroverzna stajalita. Postoji mogunost da
su introni bili prisutni rano u evoluciji, prije odvajanja prokariotskih i eukariotskih stanica.
Prema ovoj hipotezi, introni su igrali vanu ulogu u poetnom sklapanju sekvenci za
kodiranje proteina u drevnih predaka dananjih stanica. Nakon toga, introni su se postupno
gubili iz veine gena prokariota i jednostavnijih eukariota (npr. kvasaca) kao odgovor na
evolucijsku selekciju koja je davala prednost brzoj replikaciji, pa je to dovelo do bolje
protonosti u genomima tih organizama. Meutim, kako brza dioba ne predstavlja prednost u
viih organizama, introni su se zadrali u njihovim genomima. S druge strane, introni su
moda nastali kasnije tijekom evolucije kao rezultat ugradnje DNA sekvenci u gene koji su se
prethodno formirali kao kontinuirane sekvence za kodiranje proteina. Mijeanje gena je onda
vjerojatno moralo igrati vanu ulogu u daljnjoj evoluciji gena u viih eukariota iako nije bilo
vano za poetno sklapanje kodirajuih sekvenci prije evolucijskog odvajanja prokariotskih i
eukariotskih stanica.
Ponovljene DNA sekvence
Introni daju svoj veliki doprinos veliini genoma viih eukariota. U ljudi, na primjer, introni
iznose otprilike 25% ukupne genomske DNA. Ipak, jedan jo vei dio sloenih eukariotskih
genoma sastoji se od visoko ponovljenih nekodirajuih DNA sekvenci. Ove sekvence, koje su
ponekad zastupljene stotinama tisua kopija po genomu, prvi su pronali Roy Britten i David
Kohne za vrijeme prouavanja brzine reasocijacije denaturiranih fragmenata stanine DNA
(Slika 4.6). Denaturirani lanci DNA hibridiziraju se jedan s drugim (reasociraju) ponovo
stvarajui dvostruku uzvojnicu (vidi sliku 3.25). Budui da je reasocijacija DNA uzvojnice
bimolekularna reakcija (dva razdvojena lanca moraju se sudariti jedan s drugim ne bi li se
hibridizirali), brzina reasocijacije ovisi o koncentraciji DNA lanaca. Kada se pustilo
denaturirane fragmente DNA E. coli da se meusobno hibridiziraju, sva DNA jednoliko se
reasocirala kao to bi se i oekivalo da je u genomu svaka DNA sekvenca prisutna samo
jednom. Ipak, reasocijacija fragmenata DNA izdvojenih iz stanica sisavaca pokazala je posve
dugaiju sliku. Otprilike 50% DNA fragmenata reasociralo se brzinom predvienom za
sekvence koje su prisutne samo jednom u genomu, a ostatak se reasocirao puno bre nego to
bi se oekivalo. Ovi rezultati protumaili su se time da u genomu neke sekvence postoje u
vie kopija pa se zbog toga reasociraju puno bre od sekvenci koje su prisutne samo jednom.
Ovi pokusi su posebno ukazali na to da se priblino 50% DNA sisavaca sastoji od visoko
ponovljenih sekvenci, od kojih su neke ponovljene ak105 do 106 puta.
Daljnje analize, koje su svoj vrhunac doivjele sekvenciranjem itavih genoma,
identificirale su nekoliko vrsta ovakvih visoko ponovljenih sekvenci (Tablica 4.1). Jedna od
tih vrsti, koja spada meu repetitivne sekvence nazvane ponavljanja jednostavnih sekvenci
(prema engl. simple-sequence repeats), sastoji se od uzastopno ponovljenih nizova nekoliko
tisua kopija kratkih sekvenci duine od 1 do 500 nukleotida. Na primjer, jedan tip
ponavljanja jednostavnih sekvenci u Drosophilae sastoji se od uzastopnih ponavljanja
jedinice od sedam nukleotida ACAAACT. Zbog njihovog jedinstvenog sastava, mnoge
ponovljene jednostavne DNA mogu se izdvojiti iz ostatka genomske DNA ravnotenim
centrifugiranjem u gradijentima gustoe CsCl. Gustoa DNA odreena je sastavom baza, pa
sekvence bogate AT bazama posjeduju manju gustou nego li sekvence bogate GC bazama.
www.perpetuum-lab.com
www.perpetuum-lab.com
www.perpetuum-lab.com
www.perpetuum-lab.com
kromatosom koja se sastoji od 166 parova baza DNA omotanih oko histonske sri koje
zajedno dri H1 (vezni histon).
Pakiranje DNA pomou histona daje kromatinsko vlakno promjera od oko 10 nm, a
koje je sastavljeno od kromatosoma odvojenih veznom (prema engl. linker) DNA koja je duga
oko 80 parova baza (slika 4.13). Pod elektronskim mikroskopom ovo vlakno debljine 10 nm
ima izgled zrnate ogrlice to je i ukazalo na nukleosomski model. Pakiranje DNA u ovakva
kromatinska vlakna debljine 10 nm skrauje njegovu duljinu za oko est puta. Kromatin se
dalje moe kondenzirati namatanjem u vlakna debljine 30 nm ija struktura se tek mora
otkriti. Izgleda da u tom stadiju kondenzacije kromatina vanu ulogu igraju interakcije
izmeu molekula H1 histona.
Stupanj kondenzacije kromatina mijenja se tijekom ivotnog ciklusa stanice. U
interfaznim stanicama (stanicama koje se ne dijele) veina kromatina (nazvanog eukromatin)
relativno je dekondenzirana i proirena kroz cijelu jezgru (slika 4.14). Tijekom ove faze
staninog ciklusa, geni se prepisuju a DNA se udvostruava u sklopu pripreme za diobu
stanice. Veina kromatina interfazne jezgre izgleda da je prisutna u obliku vlakana debljine 30
nm te je organizirana u velike petlje koje sadre oko 50 do 100 kb DNA. Geni koji se aktivno
prepisuju dekondeniziraniji su to ini DNA pristupanijom transkripcijskoj maineriji. Prema
tome struktura kromatina blisko je vezana za kontrolu genske ekspresije u eukariota o emu
e se raspravljati u poglavlju 6.
Za razliku od eukromatina, otprilike 10% interfaznog kromatina (nazvanog
heterokromatin) nalazi se u posebno kondenziranom stanju nalik na ono u kojem se nalazi
kromatin tijekom mitoze stanice. Heterokromatin je transkripcijski neaktivan i sadri visoko
ponovljene DNA sekvence poput onih koje su prisutne u centromerima i telomerima.
Kako stanica ulazi u mitozu, njezini kromosomi postaju visoko kondenzirani kako bi
se mogli prenositi u stanice keri. Smatra se da se petlje kromatinskog vlakna debljine 30 nm
dalje presavijaju kako bi oblikovale zgusnute metafazne kromosome mitotikih stanica u
kojima se DNA kondenzira skoro 10.000 puta (slika 4.15). Ovako zgusnuti kromatin vie ne
moe posluiti kao kalup za sintezu RNA, pa transkripcija prestaje za vrijeme mitoze.
Elektronsko-mikroskopske slike ukazuju na to da je DNA metafaznih kromosoma
organizirana u velike ome koje su privrene za proteinski kostur (slika 4.16), ali trenutano
ne razumijemo niti detaljnu strukturu ovakvog visoko kondenziranog kromatina niti
mehanizam kondenzacije kromatina.
Metafazni kromosomi su toliko visoko kondenzirani da se njihova struktura moe
prouavati svjetlosnom mikroskopijom (slika 4.17). Nekoliko tehnika bojanja daju
karakteristine obrasce svijetlih i tamnih pruga koje se izmjenjuju, a rezultat su razlike u
vezanju obinih ili fluorescentnih boja na DNA sekvence bogatije AT ili GC bazama. Ove
pruge su specifine za svaki kromosom i izgleda da predstavljaju odreene kromosomske
regije. Geni se mogu lokalizirati unutar specifinih kromosomskih pruga in situ
hibridizacijom to ukazuje na to da je pakiranje DNA u kromosome jako uredan i
reproducibilan proces.
Centromeri
Centromer je specijalizirana regija kromosoma koja igra glavnu ulogu u osiguranju pravilne
raspodjele udvostruenih kromosoma stanicama keri tijekom mitoze (slika 4.18). Stanina
DNA se replicira za vrijeme interfaze to rezultira stvaranjem dvaju kopija svakog
kromosoma prije poetka mitoze. Kada stanica ue u mitozu, kondenzacijom kromatina
stvaraju se metafazni kromosomi koji se sastoje od dviju identinih sestrinskih kromatida. Te
sestrinske kromatide dre se zajedno na centromeru koji ima oblik konstrikcije na
kromosomu. Kako mitoza napreduje, mikrotubuli mitotikog vretena prihvaaju se na
www.perpetuum-lab.com
centromere, a zatim se dvije sestrinske kromatide razdvoje i kreu na suprotne polove vretena.
Na kraju mitoze jezgrine membrane se ponovo formiraju, kromosomi se dekondenziraju, a
kao rezultat toga stvaraju se dvije jezgre keri od kojih svaka sadri po jednu kopiju
roditeljskog kromosoma.
Centromeri zapravo imaju dvostruku ulogu, prvo kao mjesta udruivanja sestrinskih
kromatida i drugo kao mjesta na koja se prihvaaju mikrotubuli diobenog vretena. Sastoje se
od specifinih slijedova DNA na koje se vee odreeni broj centromeru pridruenih proteina
koji formiraju specijaliziranu strukturu koja se zove kinetohora (slika 4.19). Vezanje
mikrotubula na kinetohorne proteine posreduje vezanju kromosoma na mitotiko vreteno.
Proteini vezani na kinetohore tada djeluju kao molekularni motori koji upravljaju kretanjem
kromosoma du niti vretena razdvajajui tako kromosome u jezgre keri.
Centromerne DNA sekvencije prvo su definirane u kvasca gdje se njihova funkcija
moe prouavati praenjem segregacije plazmida u mitozi (slika 4.20). Plazmidi koji sadre
funkcionalne centromere razdvajaju se na isti nain kao i kromosomi i jednoliko se
rasporeuju u stanice keri nakon mitoze. U odsutnosti funkcionalnog cenromera ne
razdvajaju se pravilno, pa mnoge stanice keri ne naslijede plazmidnu DNA. Prouavanja
ovog tipa omoguila su da se odrede sekvencije potrebne za funkciju centromera. Ovakvi
pokusi prvo su pokazali da su centromerne sekvence dobro poznatog kvasca Saccharomyces
cerevisiae sadrane u otprilike 125 parova baza koji se sastoje od triju sekvencijskih
elemenata: dvije kratke sekvence od 8 i 25 parova baza odvojene meusobno sa 78 do 86
parova baza DNA koja je jako bogata AT bazama (slika 4.21A).
Izgleda da kratke centromerne sekvence definirane u S. Cerevisiae ipak ne odraavaju
situaciju u drugih eukariota. Slinim funkcionalnim pristupom, novije su studije definirale
centromere cijepajueg kvasca Schizosacharomyces pombe. Iako su i S. cerevisiae i S. pombe
kvasci, izgleda da meusobno divergiraju na isti nain kao to svaka od njih divergira od
ovjeka, pa su mnoge znaajke njihove stanine biologije prilino razliite. Tako ove dvije
vrste kvasca ine komplementarne modele za jednostavno i lagano prouavanje eukariotske
stanice. Centromeri S. pombe proteu se na 40 do 100 kb DNA; oni su priblino tisuu puta
dui od onih S. cerevisiae. Sastoje se od centralne sri od 4 do 7 kb jedne kopije DNA kojoj
se na bokovima nalaze ponovljene sekvence (slika 4.21B). Ne samo centralna sr nego
takoer i bone ponovljene sekvence potrebne su za funkciju centromera, pa izgleda da su
centromeri S. pombe daleko sloeniji nego oni S. cerevisiae.
Prouavanjem kromosoma Drosophilae napravljena je prva karakterizacija centromera
u viih eukariota (slika 4.21 C). Centromeri Drosophilae proteu se na preko 420 kb od kojih
se veina (vie od 85%) sastoji od dvaju visoko ponovljenih satelitnih DNA sa slijedom
AATAT i AAGAG. Ostatak centromera sastoji se od rasprenih transponirajuih elemenata,
koji se takoer nalaze i na drugim mjestima genoma Drosophilae, kao dodatak neponovljenoj
regiji DNA bogatoj AT bazama. Delecija satelitnih sekvenci i transponirajuih elemenata, kao
i neponovljene DNA, smanjila je aktivnost centromera u funkcionalnim esejima. Prema tome,
obje vrste sekvenci i ponovljene i neponovljene izgleda da doprinose stvaranju kinetohore i
funkciji centromera. Centromeri Arabidopsisa takoer izgleda da se proteu preko 500 do
1000 kb i sastoje se velikim dijelom od visoko ponovljenih slijedova.
Centromeri sisavaca karakterizirani su proirenim regijama heterokromatina koji se
sastoji od visoko ponovljenih satelitnih DNA sekencija. U ljudi i ostalih primata glavna
centomerika sekvenca je -satelitna DNA koja sadri 171 par baza i uzastopno se ponavlja
to se proteu na milijun parova baza. -satelitna DNA vezana je na proteine pridruene
centromeru, a nedavno su pokusi pokazali da je - satelitni niz ljudskog X kromosoma
dovoljan da poslui kao funkcionalni centromer. Ipak, opisani su i abnormalni ljudski
kromosomi sa funkcionalnim centromerom kojima nedostaje -satelitna DNA, pa ostaje i
dalje nejasno to je zapravo potrebno za funkciju centromere u viih eukariota.
www.perpetuum-lab.com
Telomeri
Sekvencije na krajevima eukariotskih kromosoma, nazvane telomeri, igraju znaajnu
ulogu u replikaciji i odranju kromosoma. Telomeri su rano prepoznati kao posebne strukture
jer su u eukariotskim stanicama nakon lomljenja kromosomi vrlo nestabilni, pa se
pretpostavilo da su neke specifine sekvence potrebne na normalnim krajevima kromosoma.
Ovo je zatim pokazano pokusima u kojima su telomeri protozoe Tetrahymena dodani
krajevima linearnih molekula DNA plazmida kvasca. Telomerne DNA omoguile su ovim
plazmidima da se repliciraju u kvascu kao linearne molekule nalik na kromosome, pa je to bio
izravan dokaz da su telomeri potrebni za replikaciju linearnih molekula DNA.
Telomerne DNA sekvence razliitih eukariota su sline i sadravaju ponovljene
slijedove jednostavnih sekvenci DNA sa nakupinama G ostataka u jednom lancu (tablica 4.4).
Na primjer, sekvenca telomernih ponavljanja u ovjeka i ostalih sisavaca je AGGGTT, a
telomerno ponavljanje u Tetrahymeni je GGGGTT. Ove sekvence su ponovljene stotinama ili
tisuama puta, pa zauzimaju nekoliko kilobaza i zavravaju sa jednim jednolananim repom.
Ponovljene sekvence telomernih DNA ine ome na krajevima kromosoma te ujedno veu
odreeni broj proteina koji uvaju kromosomske krajeve od razgradnje ili meusobnog
spajanja (slika 4.22).
Telomeri igraju glavnu ulogu u replikaciji krajeva linearne DNA molekule (vidi
poglavlje 5). DNA-polimeraza moe produiti rastui DNA lanac, ali ne moe zapoeti
sintezu novog lanca na kraju linearne DNA molekule. Prema tome, krajevi linearnih
kromosoma ne mogu se replicirati normalnom akcijom DNA-polimeraze. Taj problem rijeen
je evolucijom posebnog mehanizma koji ukljuuje aktivnost reverzne-transkriptaze za
replikaciju telomernih DNA sekvenci. Odranje telomera izgleda da je vaan faktor u
odreivanju duine ivota i reproduktivne sposobnosti stanice, pa prouavanje telomera i
telomeraze obeavaju nove uvide u procese starenja i nastanka raka.
Sekvence itavih genoma
Neka od najuzbudljivijih novih otkria u molekularnoj biologiji predstavljaju rezultate analize
kompletne nukleotidne sekvence humanog genoma i genoma nekolicine modelnih organizama
meu kojima su E. coli, Saccharomyces cerevisiae, Caenorhabditis elegans, Drosophila,
Arabidopsis i mi (tablica 4.5). Rezultati sekvenciranja itavih genoma odveli su nas dalje od
karakterizacije pojedinih gena sve do globalnog pogleda na organizaciju i genski sadraj
itavih genoma. Ovakav pristup potencijalno vodi do identifikacije svih gena nekog
organizma koji tada postaju pristupani istraivanju njihove strukture i funkcije. Pri tome je
zanimljivo da se, kako uimo objanjavati ogromnu koliinu podataka koju je generiralo
sekvenciranje itavih genoma, pojavljuju novi izazovi i novo podruje nazvano
bioinformatikom koje lei na granici izmeu biologije i kompjutorske znanosti, a usmjereno
je na razvoj raunalnih metoda potrebnih za analizu i izdvajanje korisnih biolokih podataka
iz sekvence milijardi bazi koje tvore genom veliine humanog. Iako jo puno toga ostaje za
nauiti, genomski redoslijedi koji su ve dostupni opskrbili su znanstvenike s jedinstvenom
bazom podataka koja se sastoji od nukleotidnih sekvenci itavog kompleta gena. Budui da
mnogi od tih gena nisu prije bili prepoznati, odreivanje njihove funkcije stvoriti e osnovu za
mnoga budua istraivanja u staninoj biologiji.
Prokariotski genomi
www.perpetuum-lab.com
Sada poznajemo potpuni genomski redoslijed vie od ezdeset razliitih bakterija, a jo vie
takvih redoslijeda je upravo u procesu odreivanja. Prvu potpunu sekvencu staninog genoma
objavila je 1995. godine grupa istraivaa pod vodstvom Craiga Ventera, a radilo se o
bakteriji Haemophilus influenzae koja je esti stanovnik dinog sustava. Genom H. influenzae
sadri oko 1,8x106 parova baza (1,8 megabaza ili Mb) to je malo manje od polovice veliine
genoma E. coli. Potpuna nukleotidna sekvenca ukazala je na to da je genom H. Influenzae
kruna molekula koja sadri 1.830.137 parova baza DNA. Sekvenca je tada analizirana na
gene koji kodiraju rRNA, tRNA i proteine. Potencijalna podruja za kodiranje proteina
identificirana su kompjutorskom analizom DNA redoslijedova kako bi se otkrili otvoreni
okviri itanja (prema engl. open-reading frames)- dugi nizovi nukleotidnih sekvenci koji
mogu kodirati polipeptide jer ne sadre ni jedan od stop kodona (UAA, UAG i UGA). Budui
da se ovi kodoni koji zaustavljaju prevoenje polipeptidnog lanca nasumce pojavljuju jednom
na svaki 21 kodon (3 stop kodona od ukupno 64 kodona), otvoreni okviri itanja koji se
proteu na vie od stotinu kodona obino predstavljaju funkcionalne gene.
Ovakvom analizom u genomu H. Influenzae otkriveno je est kopija gena za rRNA,
54 razliitih tRNA gena i 1743 potencijalnih regija za kodiranje proteina (slika 4.23). Na
temelju njihove podudarnosti sa poznatim proteinskim sekvencama, vie od tisuu ovih regija
povezano je odreenom biolokom ulogom (kao npr. enzim ciklusa limunske kiseline), ali
ostali predstavljaju gene nepoznate funkcije. Pretpostavljene kodirajue sekvence imaju
prosjenu veliinu od oko 900 parova baza, pa pokrivaju oko 1,6 Mb DNA to ini blizu 90%
genoma H. Influenzae.
Kompletna sekvenca genoma Mycoplasma genitalium posebno je zanimljiva jer su
mikoplazme najmanje dananje bakterije i od svih poznatih stanica sadre najmanje genome.
Genom M. genitalium duine je samo 580 kb (0,58 Mb) te vjerojatno predstavlja minimalni
komplet gena potreban za odranje organizma koji se sam razmnoava. Analiza DNA
sekvence M. genitalium ukazuje na to da ona sadri samo 470 sekvenci za kodiranje proteina,
a to ini otprilike 88% genomske DNA. Mnoge od tih sekvenci su identificirane kao geni koji
kodiraju proteine ukljuene u replikaciju DNA, transkripciju, translaciju, membranski
transport i energetski metabolizam. Ipak, M. genitalium
sadi mnogo manje gena za
enzime metabolizma od H. Influenzae to predstavlja odraz njenog ogranienijeg
metabolizma. Na primjer, mnogi geni za koje se zna da kodiraju komponente biosintetikih
puteva nedostaju u genomu M. genitalium, a to je u skladu s njezinom potrebom da uzima
aminokiseline i prekursore nukleotida iz domaina. Zanimljivo je da genom mikoplazme
takoer sadri otprilike 150 gena kojima je funkcija trenutno nepoznata. Tako ak i u
najjednostavnijoj stanici tek preostaje da se odredi bioloka funkcija mnogih gena.
Genomski redoslijed arhebakterije Methanococcus janaschii, objavljen 1996. godine,
omoguio je znaajan uvid u evolucijske odnose izmeu arhebakterija, eubakterija i eukariota.
Genom M. janaschii veliine je 1,7 Mb i predvia se da sadri 1.738 sekvenci za kodiranje
proteina- sline je veliine kao i genom H. influenzae. Ipak, samo oko treine sekvenci za
kodiranje proteina koje su otkrivene u M. janaschii srodne su poznatim genima eubakterija
ili eukariota to ukazuje na posebnost genetskog sastava arhebakterija. Geni za kodiranje
proteina M. janaschii ukljueni u proizvodnju energije i biosintezu staninih sastojaka srodni
su onima u eubakterija to namee pretpostavku da su se osnovni metaboliki procesi razvili u
zajednikom pretku arhebakterija i eubakterija. Znaajno je da su ipak geni za kodiranje
proteina potrebnih za udvostruavanje, prepisivanje i prevoenje DNA u bliem srodstvu sa
genima u eukariota nego li sa onima u eubakterija. Genomsko sekvenciranje ove
arhebakterije, dakle, ukazuje na to da arhebakterije i eukarioti dijele zajedniku evolucijsku
liniju i u bliem su srodstvu nego li to je bilo koji od njih sa eubakterijama (vidi sliku 1.8).
Iako su relativna jednostavnost i lakoa genetike E. coli od nje napravili omiljeni
organizam molekularnih biologa, genom E.coli od 4,6 Mb nije bio potpuno sekvenciran sve
www.perpetuum-lab.com
10
do 1997. godine. Analiza sekvence E. coli otkrila je ukupno 4.288 gena, a sekvence za
kodiranje proteina ine 88% njenog genoma. Od 4.288 gena otkrivenih sekvenciranjem, 1.835
gena bilo je ve prethodno identificirano, a funkcija dodatnih 821 mogla se izvui iz
usporedbi sa sekvencama gena karakteriziranih u drugim organizmima. Ipak, funkcija 1.632
gena E. coli (oko 40% genoma) nije se mogla odrediti. Tako nam genomsko sekvenciranje
pokazuje da se jo mnogo toga mora nauiti o staninoj biologiji prokariota, pa ak i u jednog
tako iscrpno istraivanog organizma poput E. coli.
Kvaev genom
Kao to je ve napomenuto, najjednostavniji eukariotski genom (1,2x 10 7 parova baza DNA)
pronaen je u kvasca Saccharomyes cerevisiae. tovie, kvasci rastu brzo i mogu se
podvrgnuti jednostavnim genetikim manipulacijama. Zbog toga kvasci na vie naina
predstavljaju model eukariotskih stanica koji se moe puno lake prouavati nego li stanice
sisavaca i ostalih viih eukariota. U skladu s time, potpuno sekvenciranje jednog itavog
kvaevog kromosoma 1992. godine (slika 4.24) te zatim odreivanje sekvence itavog
kvaevog genoma 1996.godine, predstavljalo je najvanije korake u razumijevanju
molekularne biologije eukariotskih stanica.
Genom S. cerevisiae sadri oko 6.000 gena, meu kojima se predvia da se nalazi
5.885 sekvenci za kodiranje proteina, 140 gena za ribosomsku RNA, 275 gena za transportnu
RNA i 40 gena koji kodiraju male jezgrine RNA (snRNA) ukljuenih u obradu RNA (vidi
raspravu u poglavlju 6). Prema tome, kvasci posjeduju veliku gustou sekvenci koje kodiraju
proteine to je slino bakterijskim genomima, a te sekvence ine oko 70% ukupne kvaeve
DNA. U skladu s time, samo 4% kvaevih gena sadre introne. tovie, geni S. cerevisiae
koji sadre introne obino imaju samo jedan mali intron blizu poetka gena.
Kompjutorskom analizom temeljenom na slinostima sa sekvencama poznatih gena
predviene su u S. cerevisiae funkcije za oko 3.000 sekvenci za kodiranje proteina. Temeljeno
na analizi ovih gena, izgleda da oko 11% proteina kvasca djeluju u metabolizmu, 3% u
proizvodnji i pohrani metabolike energije, 3% u replikaciji DNA, popravku i rekombinaciji,
7% u prepisivanju, 6% u prevoenju, a 14% u sortiranju proteina i transportu. Ipak, funkcije
mnogih od ovih gena opisuju se samo opim terminima (kao to je transkripcijski faktor), pa
tek treba odrediti njihovu tonu ulogu u stanici. tovie, budui da polovica proteina
kodiranih kvaevim genomom nije bila u nikakvoj vezi sa prethodno opisanim genima,
preostaje da se funkcija dodatnih 3.000 nepoznatih proteina rasvijetli genetikim i
biokemijskim analizama.
Sekvencu genoma S. cerevisiae nedavno je slijedila sekvenca genoma cijepajueg
kvasca S. pombe. Prema prethodnoj raspravi u ovom poglavlju, S. cerevisiae i S. pombe
prilino su divergentni i njihova biologija se razlikuje po mnogo emu, ukljuivi i strukturu
centromera (vidi sliku 4.21). Zanimljivo je da i njihovi genomi pokazuju priline razlike. Iako
obje, S. cerevisiae i S. pombe, posjeduju otprilike istu koliinu jedinstvenih DNA sekvenci
(12,5 Mb), S. pombe izgleda da sadri samo oko 4.800 gena. Introna ima mnogo vie u S.
pombe nego li u S. cerevisiae. Otprilike 43% gena S. pombe sadri introne, a introni S. pombe
su vei od onih u S. cerevisiae, pa sekvence za kodiranje proteina ine samo oko 60% genoma
S. pombe.
Veina gena S. pombe ima homologe u genomu S. cerevisiae, ali oko 700 gena jedinstveno je
za S. pombe.
Sada, kada su upotpunjene genomske sekvence kvasca, glavni cilj postaje odreivanje
funkcije mnogih novih gena S. cerevisiae i S. pombe. Na svu sreu, kvasci su naroito
pristupani funkcionalnoj analizi nepoznatih gena zbog lakoe sa kojom se normalni
kromosomi mogu inaktivirati homolognom rekombinacijom sa kloniranim sekvencama (vidi
www.perpetuum-lab.com
11
sliku 3.39). Prema tome, moe se sistematski provoditi izravna funkcionalna analiza
kvaevih gena koji su u poetku bili otkriveni samo na bazi svoje nukleotidne sekvence.
Tako je sekvenciranje kvaevih genoma otvorilo vrata prouavanju mnogih novih podruja
biologije jednostavnih eukariotskih stanica. Oekuje se od ovakvih studija da otkriju funkcije
mnogih novih gena koje ne bi bile ograniene samo na kvasce nego zajednike svim
eukariotima ukljuivi i ovjeka.
Genomi Caenorhabditis elegans i Drosophilae melanogaster
Genomi C. elegans i Drosophilae relativno su jednostavni animalni genomi, a po veliini i
sloenosti dolaze izmeu kvaevog i ljudskog genoma. Posebne karakteristike svakog od
ovih organizama ine ih vanim modelima za analizu genoma: C. elegans na veliko se koristi
za prouavanje animalnog razvoja, a Drosophila je posebno dobro istraena to se tie
genetike. Genomi ovih organizama su, ipak, oko deset puta vei od onih kvaevih to
predstavlja faktor koji unosi novi red veliine u teinu kartiranja i sekvenciranja genoma.
Prema tome, odreivanje sekvence C. elegans 1998. godine predstavljalo je vaan putokaz za
analizu genoma jer je proirilo sekvenciranje genoma sa jednostaninih organizama (bakterija
i kvasaca) na viestanine organizme koji su prihvaeni kao vaan model animalnog razvoja.
U poetnoj fazi analize genoma C. elegans koristili su se DNA ulomci klonirani u
kozmidima koji mogu prihvatiti DNA inserte od oko 40 kb (vidi tablicu 3.3). Ovim pristupom
se ipak nije mogao pokriti itavi genom, pa je to postignuto kloniranjem puno veih komada
DNA sa kvaevim umjetnim kromosomima (YAC- engl. yeast artificial chromosome) kao
vektorima. Kao to je napomenuto u poglavlju 3, jedinstveno svojstvo YAC-ova jest da sadre
centromere i telomere to im omoguuje replikaciju u kvascu u obliku lineranih molekula
nalik na kromosome. Prema tome, mogu se koristiti za kloniranje DNA fragmenata veliine
kvaeve kromosomske DNA, sve do tisua kilobaza duine. Veliki inserti DNA koji se mogu
klonirati s YAC-ovima i ostalim vektorima velikog kapaciteta od presudne su vanosti za
analizu sloenih genoma.
Genom C. elegans dug je 97x 106 parova baza, a prema predvianjima sadri oko
19.000 kodirajuih sekvenci za proteine to je po prilici tri puta vei broj od broja gena u
kvasca (slika 4.25). Za razliku od kompaktnog genoma u kvasca, geni C. elegans proteu se
na oko 5 kb i sadre prosjeno pet introna. Sekvence za kodiranje proteina tako iznose samo
oko 25% genoma C. elegans u usporedbi sa 60-70% u S. pombe i S. cerevisiae te blizu 90% u
bakterijskom genomu.
Otprilike 40% proteina predvienih u C. elegans pokazalo je znaajnu slinost sa
poznatim proteinima drugih organizama. Kao to se i oekivalo, postoje znaajno vee
slinosti izmeu proteina C. elegans i ovjeka nego izmeu proteina C. elegans i bilo kojeg
od kvasaca ili bakterija. Proteini koji su zajedniki C. elegans i kvascu moda djeluju u
osnovnim staninim procesima koje ti organizmi dijele poput metabolizma, udvostruavanja
DNA, prepisivanja, prevoenja i razvrstavanja proteina. Sama sr biolokih procesa izgleda
da se odvija pomou slinog broja gena u oba organizma, a mogue je da ove gene dijele sve
eukariotske stanice. Za razliku od toga, veina gena C. elegans nije pronaena u kvasca pa
moda djeluje u suptilnijim regulatornim aktivnostima koje su potrebne za razvoj
viestaninih organizama. Vjerojatno je da e rasvjetljavanje djelovanja ovih gena biti
posebno uzbudljivo obzirom na razumijevanje animalnog razvoja. Iako odrasla C. elegans
sadri samo 959 somatskih stanica u itavom svom tijelu, ona posjeduje sve specijalizirane
stanine tipove kao i sloenije ivotinje. tovie, opisan je kompletni uzorak odvijanja
staninih diobi prilikom razvoja C. elegans kao i analiza uspostavljanja veza svih 302 neurona
u odrasloj ivotinji. Ve se pronalo da su mnogi od ovih gena ukljuenih u razvoj i
diferencijaciju C. elegans srodni genima koji su ukljueni u kontrolu proliferacije i
www.perpetuum-lab.com
12
diferencijacije stanica sisavaca to daje pravi dokaz vrijednosti C. elegans kao modela za
sloenije ivotinje. Nema sumnje da e se preko prouavanja genomske sekvence C. elegans
razotkriti jo mnogo vie gena presudnih za kontrolu razvoja.
Drosophila predstavlja drugi kljuni model animalnog razvoja koji je naroito dobro
genetiki okarakteriziran. Prednosti Drosophilae za genetiku analizu ukljuuju njezin
relativno jednostavan genom kao i injenicu da se moe lako uzgajati i kriati u laboratoriju.
Uz to u Drosophili postoji posebno orue za genetiku analizu u vidu gorostasnih politenih
kromosoma koji se nalaze u nekim tkivima poput lijezda slinovnica larve. Ovi kromosomi
nastaju u stanicama koje se ne dijele kao posljedica ponovljenih replikacija DNA lanaca koji
se ne odvajaju jedan od drugoga. Tako svaki od politenih kromosoma sadri na stotine
identinih paralelnih molekula DNA. Zbog svoje veliine politeni kromosomi vidljivi su pod
svjetlosnim mikroskopom, a odreenim bojanjem otkrivaju se posebni uzorci pruganja (slika
4.26). Pruganje politenih kromosoma postie daleko vei stupanj rezolucije od onoga koji se
postie u metafaznim kromosomima (npr. vidi sliku 4.17). Politeni kromosomi su
dekondenzirani interfazni kromosomi koji sadre gene koji se aktivno prepisuju. Vidljivo je
vie od 5.000 pruga od kojih svaka odgovara srednjoj duljini od otprilike 20 kb DNA. Za
razliku od toga pruge identificirane u ljudskim metafaznim kromosomima sadre nekoliko
megabaza DNA.
Uzorak pruganja politenih kromosoma predstavlja fiziku kartu genoma Drosphilae
visoke rezolucije. Delecije gena esto se mogu povezati sa gubitkom specifine kromosomske
pruge, pa se na taj nain odreuje posebno fiziko mjesto gena na kromosomu. Dodatno se
mogu in situ hibridizacijom kartirati klonirane DNA na politene kromosome to esto daje
dostatnu rezoluciju za lokalizaciju kloniranih gena na specifinim prugama (slika 4.27). Tim
nainom mogu se lako odrediti pozicije kozmidnih ili YAC klonova (koji se proteu preko
vie pruga) na karti, te se tako dobije osnova za analizu genomske sekvence.
Radi moi Drosophiline genetike, sekvenciranje njezinog genoma poetkom 2000.
godine predstavljalo je vaan napredak za genomsku analizu. Genom Drosphilae sastoji se od
otprilike 180x106 parova baza, a od toga je po prilici jedna treina u obliku heterokromatina.
Heterokromatin se sastoji uglavnom od ponavljanja jednostavnih satelitnih sekvenci te
razbacanih transponirajuih elemenata to sve nije bilo ukljueno u genomsku sekvencu.
Ostatak od 120x106 parova baza eukromatina sekvencirano je upotrebom kombinacije
klonova bakterijskog umjetnog kromosoma (BAC- engl. bacterial artificial chromosome)
koji nose velike inserte DNA te metodom samarice (shotgun) u kojoj su mali fragmenti
DNA nasumino klonirani i sekvencirani u plazmidnim vektorima. Sekvence ovakvih malih
fragmenata DNA zatim su sastavljene u velike kontinuirane sekvence odreivanjem
preklapanja meu tim fragmentima te su im odreeni smjerovi pomou BAC klonova kako bi
se dobila potpuna sekvenca eukromatinskog dijela Drosophilinog genoma.
Drosophilin genom sadri oko 13.600 gena to je neto manje od broja gena u C.
elegans. Kao i u C. elegans i u Drosphilae geni sadre prosjeno 4 introna, a ukupna koliina
intronskih sekvenci slina je koliini egzonskih sekvenci. Ukupno 13% Drosophilinog
genoma sastoji se od sekvenci za kodiranje proteina. Iako Drosophila ima manje gena od C.
elegans, vano je napomenuti da su mnogi geni duplicirani u oba ova organizma. Kada se
uzmu u obzir duplikacije, izgleda da je broj jedinstvenih gena slian u Drosophile i C.
elegans- izmeu 8.000 i 9.000 gena. Otprilike 20% gena Drosophilae srodno je genima
prisutnima i u kvascu i u C. elegans- proteini kodirani ovim genima moda posjeduju funkcije
koje su zajednike svim eukariotskim stanicama. Ostali geni Drosophilae srodni su genima
koji su pronaeni u C. elegans , ali ne i u kvascu ili su jedinstveni za Drosophilu.
Ono to naroito upada u oi jest da kompleksna ivotinja poput Drosophilae
posjeduje samo dvostruko vei broj jedinstvenih gena od kvasca koji po svemu sudei spada u
mnogo jednostavnije organizme. Oito je da sloenost viestaninih organizama nije na
www.perpetuum-lab.com
13
jednostavan nain povezana sa veim brojem gena. Dio vee bioloke sloenosti Drosophilae
i C. elegans moda proizlazi iz injenice da su njihovi proteini openito vei te sadre vie
funkcionalnih domena nego proteini kvasca. Daljnja prouavanja i funkcionalna analiza gena
koji su otkriveni sekvenciranjem genoma Drosophilae i C. elegans bez svake sumnje e igrati
odlunu ulogu u razumijevaju naina na koje ovi geni djeluju prilikom usmjeravanja sloenog
procesa animalnog razvoja.
Biljni genomi
Zavretak sekvenciranja genoma Arabidopsis thaliana 2000. godine proirio je sekvenciranje
genoma sa ivotinja na biljke, pa je tako dolo do najvanijeg dogaaja u biljnoj biologiji.
Arabidopsis thaliana je jednostavna cvjetnica koja je na veliko koritena kao model za
prouavanje molekularne biologije i razvoja biljke. Ovaj organizam ima tu prednost da kao
model za prouavanje molekularne biologije i genetike ima relativno mali genom od otprilike
15x106 parova baza, to po veliini slino genomima C. elegans i Drosophilae. Kao i
Drosophilin genom i genom Arabidopsis thaliana uglavnom je sekvenciran koritenjem BAC
vektora za prihvat velikih umetaka DNA.
Iznenaujue je bilo kad je analiza genoma Arabidopsis thaliana ukazala na to da on
sadri 26.000 gena za kodiranje proteina to je znaajno vie gena nego to je pronaeno bilo
u C. elegans bilo u Drosophilae. Ipak, ovaj neoekivano velik broj gena ne odraava veu
raznolikost proteina kodiranih genomom Arabidopsisa. Umjesto toga, izgleda da je veliki broj
gena u Arabidopsisa rezultat duplikacija velikih komada genoma Arabidopsisa. Te duplikacije
ukljuuju otprilike 60% genoma, pa se procijenilo da je broj razliitih gena koji kodiraju
proteine oko 15.000 to je slino broju gena u C. elegans i Drosophilae.
Gustoa gena u Arabidopsisa slina je onoj u C. elegans, pa sekvence koje kodiraju
proteine ine oko 25% genoma Arabidopsisa. Geni Arabidopsisa imaju oko 4 introna, a
ukupna duina intronskih sekvenci priblino je jednaka ukupnoj duini egzonskih sekvenci.
Pokretni elementi sudjeluju sa oko 10% u genomu Arabidopsisa. Kao i u Drosophili
ponavljajui pokretni elementi skupljeni su na centromerima zajedno s satelitnim
ponavljajuim sekvencama.
Komparativna analiza funkcije gena Arabidopsisa otkrila je zanimljive slinosti kao i
razlike izmeu gena biljaka i ivotinja. Geni Arabidopsisa koji su ukljueni u osnovne
stanine procese kao to su udvostruavanje DNA, popravak, prepisivanje, prevoenje i
promet proteina slini su onima u kvasca, C. elegans i Drosophilae to odraava zajedniko
evolucijsko porijeklo svih eukariotskih stanica. Za razliku od toga geni Arabidopsisa koji
kodiraju proteine ukljuene u procese poput stanine signalizacije i membranskog transporta
prilino su razliiti od onih u ivotinja to je u skladu s velikim razlikama u fiziologiji i
razvoju izmeu biljaka i ivotinja. Oko treine svih gena Arabidopsisa izgleda da su
jedinstvene za biljke, budui da ih nema niti u kvaevim niti u ivotinjskim genomima.
Najvea funkcionalna skupina gena Arabidopsisa, koja zauzima 22% genoma, kodira
proteine ukljuene u metabolizam i fotosintezu (slika 4.28). Druga velika grupa gena (12%
genoma) kodira proteine ukljuene u obranu biljke. Takoer je vano napomenuti da
Arabidopsis kodira vie od 3.000 proteina koji reguliraju transkripciju (to iznosi 17%
genoma). Broj proteina koji reguliraju gensku aktivnost (tanskripcijski faktori) dva puta je
vei od onoga koji je pronaen u Drosophilae ili tri puta vei od onoga koji je pronaen u C.
elegans. Mnogi od transkripcijskih faktora Arabidopsisa jedinstveni su za biljke, to je
vjerojatno odraz posebnih oblika genske ekspresije tijekom razvoja biljke te odgovora biljke
na okoli.
www.perpetuum-lab.com
14
www.perpetuum-lab.com
15
sekvenci koriteno je da se izrade fizika i karta vezanih gena ljudskog genoma. Do 1996.
godine biljezi za oko 30.000 gena kartirani su na humane kromosome to je stvorilo pozadinu
za sekvenciranje genoma (slika 4.31).
Skice sekvenci humanog genoma objavljene 2001. godine proizvele su dvije nezavisne
istraivake grupe koje su koristile razliite pristupe. Jedna od njih, Internacionalni konzorcij
za sekvenciranje humanog genoma (International Human Genome Sequencing Consortium)
koristila je kao podlogu za sekvenciranje BAC klonove koji su kartirani na kromosomska
mjesta. Druga grupa, pod vodstvom Craiga Ventera iz Celera Genomics koristila je metodu
samarice u kojoj su mali fragmenti klonirani i sekvencirani, a onda su za sastavljanje
sekvence genoma koritena preklapanja u sekvencama meu tim fragmentima. Obje od ovih
sekvenci bile su u poetku nekompletne skice u kojima je po prilici 90% eukromatinskog
dijela genoma bilo sekvencirano i sastavljeno. Kontinuranim naporima zatvorene su pukotine
u sekvenci pa je to 2003. godine dovelo do kompletiranja visokokvalitetne sekvence humanog
genoma.
Sekvencirani eukromatinski dio genoma obuhvaa otprilike 2,9x 10 6 kb DNA (slika
4.32). Ukupna veliina genoma je oko 3,2x106 kb, a ostatak od 10% genoma otpada na visoko
ponovljene sekvence heterokromatina. Prema prethodnoj raspravi u ovom poglavlju,
razbacane ponovljene sekvence ija su veina pokretni elemeni koji su se kretali po genomu
pomou reverzne transkripcije RNA posrednika, ine oko 45% sekvence ljudskog
eukromatina. Ostalih 5% genoma sastoji se od dupliciranih dijelova DNA, pa se oko 60%
ljudskog genoma sastoji od ponovljenih DNA sekvenci.
Najvee iznenaenje proizalo iz genomskih sekenci bio je neoekivano mali broj
ljudskih gena. Ljudski genom izgleda da sadri samo 30.000-40.000 gena to je znatno manje
od prethodnih procjena od otprilike 100.000 gena u ljudskom genomu. Umjesto toga, izgleda
da ljudi imaju samo dvostruko vei broj gena nego jednostavnije ivotinje poput C. elegans i
Drosophila. Ustvari, ljudi moda imaju manje gena od rie, to naglaava jedan od
najznaajnijih zakljuaka koji je proizaao iz rezultata sekvenciranja genoma: bioloka
sloenost organizma jednostavno nije funkcija broja gena u njegovom genomu. S druge strane
izgleda da postoji velika koliina alternativnog prekrajanja u ljudskim genima, to omoguava
jednom genu da odredi vie od jednog proteina (vidi sliku 4.5). Analize do dananjeg dana su
pokazale da alternativno prekrajanje moe rezultirati stvaranjem triju ili vie razliitih mRNA
iz prosjenog ljudskog gena. Kao rezultat toga, procjenjuje se da 30.000-40.000 ljudskih gena
moe kodirati 100.000 ili vie razliitih proteina. Alternativno prekrajanje takoer se
pojavljuje i u C. elegans i Drosophilae , ali mnogo je rjea nego u ljudi. Prevalencija
alternativnog prekrajanja u ljudi prema tome moe voditi formiranju po prilici 5 puta veeg
broja razliitih proteina u ljudi nego li u C. elegans i Drosophilae.
Ljudski geni proireni su preko puno veih udaljenosti i sadre vie intronskih
sekvenci nego geni C. elegans i Drosophilae. Prosjena sekvenca za kodiranje proteina u
humanim genima iznosi oko 1.400 parova baza to je slino onome u C. elegans i
Drosophilae. Ipak, prosjeni ljudski gen zauzima 30% kb DNA pri emu vie od 90% gena
odgovara intronima. Prema tome oko 25% genoma sastoji se od introna, a samo 1 do 1.5%
ljudskog genoma odgovara sekvencama koje kodiraju proteine. Preko 40% pretpostavljenih
ljudskih proteina srodno je proteinima u ostalim sekvenciranim organizmima to ukljuuje
Drosophilae i C.elegans. Mnogi od ovih konzerviranih proteina djeluju u osnovnim staninim
procesima kao to je metabolizam, udvostruavanje i popravak DNA, prepisivanje,
prevoenje i prometovanje proteina. Veina proteina koji su jedinstveni za ljude napravljeni
su od proteinskih domena koje su takoer pronaene u drugim organizmima, ali te domene su
postavljene u nove odnose pa daju specifine proteine u ljudi. U usporedbi s Drosophilae i
C.elegans ljudski genom sadri poveani broj gena ukljuenih u funkcije povezane sa veom
sloenou kraljenjaka kao to je imuni odgovor, ivani sustav i zgruavanje krvi kao i
www.perpetuum-lab.com
16
SAETAK
Sloenost eukariotskih genoma
KLJUNI TERMINI
gen, spacer sekvenca,
www.perpetuum-lab.com
egzon, intron,
17
Introni i egzoni veina eukariotskih genoma ima prekrajanje RNA, kilobaza (kb), alternativno
rascijepljenu strukturu u kojoj su dijelovi prekrajanje.
kodirajuih sekvenci
(egzoni) prekinuti nekodirajuim
sekvencama (introni). U sloenih
eukariota introni zauzimaju vie od
deset puta toliko DNA koliko zauzimaju egzoni.
Ponavljanje
jednostavne
satelitna DNA, SINE, LINE,
retrotranspozon,
DNA transpozon
pseudogeni,
sekvence,
obraeni
18
Centromeri:
eukariotskih
povezivanja
prihvaanja
mitoze.
www.perpetuum-lab.com
19
duplikacije
velikih
segmenata
genoma
Arabidopsisa, tako da je broj jedinstvenih gena u
Arabidopsisa oko 15.000. Mnogi od tih gena
jedinstveni su za biljke, a tu se nalaze geni
ukljueni u biljnu fiziologiju, razvoj i obranu.
Sekvenca riinog genoma od posebnog je znaaja
za poljoprivredu jer ria hrani vie od polovice
svjetskog stanovnitva. Prema skici sekvence
riinog genoma procjenjuje se da taj genom sadri
30.000 - 50.000 gena od kojih su mnogi duplicirani
pa su moda nastali kao posljedica duplikacije
velikih segmenata genoma.
Ljudski genom: Humani genom izgleda da sadri
30.000-40.000 gena samo dvostruko vei broj
gena od onog pronaenog u jednostavnih ivotinja
poput Drosophilae i C. elegans. Ipak, budui da
izgleda da je alternativno prekrajanje esta pojava u
ovjeka, prosjean gen moe proizvesti tri ili vie
mRNA (i proteina). Preko 40% predvienih
ljudskih proteina srodno je proteinima koji su
pronaeni u ostalim sekvenciranim organizmima
meu kojima su i Drosophila i C. elegans. Osim
toga, humani genom sadri poveani broj gena
ukljuenih u ivani sustav, imuni sustav,
zgruavanje krvi, razvoj, staninu signalizaciju i
regulaciju genske ekspresije.
Pitanja
1. Veliina mnogih eukariotskih genoma je mnogo vea nego to bi se pretpostavilo
obzirom na njihovu sloenost. Objasni ovaj paradoks.
2. Na koji nain su otkriveni introni i egzoni za vrijeme prouavanja adenovirusnih
mRNA?
3. Koji je znaaj alternativnog prekrajanja?
www.perpetuum-lab.com
20
KLJUNI POKUS
Otkrie introna
Prekrajanje dijelova kasne mRNA adenovirusa 2 na 5' kraju Spliced segments at the 5' Terminus of Adenovirus 2 Late mRNA
Susan M. Berget, Claire Moore, and Phillip A. Sharp
Massachusetts Institute of Technology, Cambridge, Massachusetts
Proceedings of the National academy of Sciences USA, Volumen 74, 1977, stranice 31713175
Kontekst
Prije nego li se razvilo molekularno kloniranje malo se znalo o sintezi mRNA u eukariotskoj
stanici. Ipak, bilo je jasno da je ovaj proces puno sloeniji u eukariota nego u bakterija.
Izgledalo je da sinteza eukariotskih mRNA treba osim transkripcije takoer i reakcije obrade
koje modificiraju strukturu primarnih transkripata. Ono to je tu bilo najznaajnije jest da se
inilo kao da se eukariotske mRNA sintetiziraju u obliku dugakih primarnih transkripata u
jezgri, a onda cijepaju da se stvore puno krae mRNA molekule koje prelaze u citoplazmu.
Openito se smatralo da stupnjevi ovakve obrade ukljuuju odstranjenje sekvenci sa 5'
i 3' krajeva primarnog transkripta. Prema ovome modelu, mRNA uklopljene u dugake
primarne transkripte bile bi kodirane neprekinutim sekvencama DNA. Ovakav pogled na
eukariotsku mRNA radikalno je promijenilo otkrie prekrajanja do kojega su nezavisno doli
Berget, Moore i Sharp te Louise Chow, Richard Gelinas, Tom Broker i Richard Roberts (An
amazing sequence arrangement at the 5' ends of adenovirus 2 messenger RNA, Cell 12: 1-8,
1977).
Pokusi
www.perpetuum-lab.com
21
www.perpetuum-lab.com
22
Poetno sekvenciranje i analiza ljudskog genomaInitial Sequencing and Analysis of the Human Genome International Human Genome
Sequencing Consortium
Nature, Volumen 409, 2001, stranice 860-921
Sekvenca ljudskog genoma
The sequence of the Human Genome
J. Craig Venter i ostalih 273
Science, Volumen 291, 2001, stranice 1304-1351
Kontekst
Ideja o sekvenciranju itavog ljudskog genoma zaeta je po prvi put sredinom osamdesetih
godina prolog stoljea. U poetku je meu biolozima doekana s velikom skepsom jer je
veina smatrala da je to jednostavno neostvariv pothvat. U to vrijeme, najvei genom koji je u
potpunosti sekvenciran bio je genom Epstein-Barrovog virusa koji je imao ukupno oko
180.000 parova baza. Iz te perspektive mnogima je bilo nezamislivo sekvenciranje ljudskog
genoma koji je oko 20.000 puta vei. Ipak ideja o takvom ogromnom projektu za biologiju
oarala je ostale, meu kojima je bio i Charles DeLisi koji je tada vodio Ured za istraivanje
zdravlja i okolia u Odjelu za energetiku (Office of Health and Environmental Research,
Department of Energy). 1986. godine DeLisi uspio je lansirati Inicijativu ljudskog genoma
(Human Genome Initiative) kao projekt unutar Odjela za energetiku.
Projekt je dobio iru podrku 1988. godine kada ga je podupro odbor Nacionalnog
savjeta za istraivanja. Taj odbor preporuio proirenje nastojanja na tom podruju, ukljuivi
sekvenciranje genoma nekolicine modela organizama i usporedni razvoj detaljne karte
vezanih gena i fizike karte ljudskih kromosoma. Projekt je bio centraliziran u Nacionalnim
institutima za zdravlje (National Institutes of Health), a u poetku ga je vodio James Watson
(suotkriva strukture DNA) kojeg je kasnije naslijedio Frances Collins.
Prvo potpuno sekvenciranje genoma provedeno je u bakteriji Haemophilus influenzae,
a objavio ga je Craig Venter sa suradnicima 1995. godine. Venter je uestvovao u projektu
sekvenciranja genoma u Nacionalnim institutima za zdravlje, ali je napustio taj posao 1991.
godine da bi postao direktor neprofitne organizacije, Instituta za genomska istraivanja. U
meuvremenu, znaajan progres je postignut u kartiranju ljudskog genoma, a iza poetne
sekvence H. influenzae uslijedile su 1998. godine sekvence drugih bakterija, kvasca i C.
elegans.
1998. godine Venter je osnovao novu kompaniju, Celera Genomics, i objavio plan
upotrebe naprednih tehnologija sekvenciranja koji e mu omoguiti izradu cjelovite ljudske
genomske sekvence u roku od 3 godine. Collins i ostali voditelji javno financiranog projekta
genoma odgovorili su na taj izazov ubrzanjem svojih nastojanja, pa je to rezultiralo utrkom
koja je napokon dovela do objavljivanja dviju skica ljudskog genoma u veljai 2001. godine.
Pokusi
Dvije grupe znanstvenika koristile su razliite pristupe u izradi sekvence ljudskog genoma.
Javno financirana grupa Internacionalni konzorcij za sekvenciranje humanog genoma, pod
vodstvom Erica Landera, sekvencirala je fragmente DNA izvedene iz BAC klonova koji su
prethodno kartirani na humane kromosome to je bilo slino pristupu koji je koriten za
odreivanje sekvence genoma kvasca i C. elegans (vidi sliku). Za razliku od toga, grupa iz
www.perpetuum-lab.com
23
Genomska DNA
A target genome
BAC library
BAC biblioteka
resulting in a library pa je proizvedena biblioteka
vektora za kloniranje koji
nose velike fragmente (BAC).
Organized mapped
The genomic DNA
BAC sequenced
Sekvenciranje BACova
Shotgun clones
www.perpetuum-lab.com
24
Haemophilus influenzae
Mikoplazma
E. coli
Bakterije
Kvasac
Gljive
Arabidopsis
Lily
Plants
Arabidopsis
ljiljan
Biljke
Drosophila
Insects
Drosophila
Kukci
Frog
Salamander
Amphibians
aba
dadevnjak
Vodozemci
Chicken
Birds
Pile
Ptice
Human
Mammals
ovjek
Sisavci
Base pairs.
www.perpetuum-lab.com
25
RNA prijepis. Nakon toga se prilikom formiranja zrele mRNA prekrajanjem odstranjuju
introni.
Chromosomal DNA
Kromosomska DNA
Spacer sequence
intron1
intron2
spacer sequence
exon1
exon2
exon3
transcription
primary RNA transcript
splicing
Sekvenca razmaka
intron1
intron2
sekvenca razmaka
egzon1
egzon2
egzon3
transkripcija
primarni RNA prijepis
prekrajanje
mRNA
mRNA
adenovirusna DNA
introni
Single-stranded DNA
intron 3
5'end of RNA
exon2
exon2
RNA-DNA hybrid
Intron1
Exon 3
Exon 4
Intron2
3'end of RNA
jednolanana DNA
intron 3
5'kraj RNA
Egzon2
Egzon1
RNA-DNA hibrid
Intron1
Egzon3
Egzon4
Intron2
3'kraj RNA
www.perpetuum-lab.com
26
aminokiseline 105 do 146. Egzoni 1 i 3 takoer sadravaju neprevodive regije (UTR) prvi
na na 5' , a drugi na 3' kraju mRNA.
Exon1
Egzon1
Intron1
Intron1
Exon 2
Egzon2
Intron2
Intron2
Exon3
Egzon3
DNA
DNA
transcription
transkripcija
splicing
prekrajanje
Exon1
Exon2
Exon3
mRNA
5'UTR
Egzon1
Egzon2
Egzon3
mRNA
3'UTR
translation
protein
translacija
protein
Kromosomska DNA
transkripcija
primarni RNA prijepis
alternativno prekrajanje
molekule mRNA
translacija
protein1
protein2
protein3
protein1
protein2
protein3
www.perpetuum-lab.com
27
fragmenti govee DNA pokazuju dva razliita naina reasocijacije. Oko 60% DNA
fragmenata (neponovljene sekvence) reasociraju se sporije nego DNA E. coli kao to se i
oekuje za sekvence koje su prisutne u jednoj kopiji u veem goveem genomu (3x10 9
parova baza). Ipak, ostalih 40% fragmenata govee DNA (ponovljene sekvence)
reasociraju se bre od DNA E. coli to ukazuje na to da postoje viestruke kopije
pojedinih sekvenci.
Fraction DNA remaining. Frakcija preostale jednolanane DNA
Bovine repeated sequences Govei ponovljeni slijedovi
E.coli DNA
DNA E. coli
Bovine nonrepeated sequences Govei neponovljeni slijedovi
C0t (Mxsec)
C0t (Mxsec)
Koliina DNA
(glavna pruga)
-globinski lokus
kromosom 16
embrijski
pseudogeni
fetalni i odrasli
www.perpetuum-lab.com
28
spacer sequence
-globin locus
chromosome 11
pseudogene
embrionic
fetal
pseudogene
adult
sekvenca razmaka
-globinski lokus
kromosoma 11
pseudogen
embrijski
fetalni
pseudogen
odrasli
gen
exon1
intron 1
egzon2
intron2
exon3
transkripcija
prekrajanje
mRNA
reverzna transkripcija
integracija u novo kromosomsko mjesto
obraeni pseudogen
www.perpetuum-lab.com
29
Kromatosom sadri dva puna okreta DNA (166 parova baza) koje dri na mjestu
jedna molekula H1. (B) Model estice nukleosomske sri. DNA osi prikazane su
smeom i tirkiznom bojom. Histoni su prikazani plavom (H3), zelenom (H4),
utom (H2A) i crvenom (H2B) bojom (B, iz K. Luger i sur., 1997. Nature
389:251.)
2 molecules each of po dvije molekule H2A, H2B, H3 i H4
Slika 4.13 Kromatinska vlakna
Pakiranje DNA u nukleosome daje kromatinsko vlakno promjera otprilike 10 nm.
Kromatin se dalje kondenzira savijanjem u vlakno debljine 30 nm koje sadrava oko est
nukleosoma po navoju. (fotografije ljubaznou Ade L.Olins i Donalda E. Olinsa,
Nacionalni laboratorij Oak Ridge.)
Nucleosome core particle
proteinski kostur
DNA ome
www.perpetuum-lab.com
30
Metaphase
Interphase
Sister chromatids
Centromere
Spindle fibers
Centrosome
Decondensed chromatin
At anaphase..
metafaza
interfaza
sestrinske kromatide
centromer
niti diobenog vretena
centrosom
dekondenzirani kromatin
U anafazi, sestrinske kromatide
odvajaju se i kreu na suprotne
polove stanice.
Anafaza
Telofaza
Za vrijeme zadnje faze mitoze
(telofaza), jezgrina ovojnica
ponovo se formira, a
kromosomi se dekondenziraju.
Staninom diobom nastaju
dvije stanice keri.
Anaphase
Telophase
During the final.
transformacija kvasca
mitoza
plazmidi se nepravilno
segregiraju
Plazmidi se pravilno segregiraju
Neke stanice keri gube
plazmid pa im je za rast
potreban leucin
Sve stanice keri nasljeuju
plazmid i mogu rasti u mediju
bez leucina
www.perpetuum-lab.com
31
sekvenci (CDE I i CDE III) koje su razdvojene pomou DNA sekvence bogate ATbazama duine od 78 do 86 parova baza (CDE II). Prikazane sekvence su konsenzus
sekvence izvedene analizom centromerikih sekvenci pojedinih kvaevih kromosoma.
Pu= A ili G; x= A ili T; y= bilo koja baza. (B) Prikazan je ustroj centromerikih sekvenci
kromosoma II S. pombe. Centromer se sastoji od centralne sri (CC- prema engl. central
core) jedinstvene DNA sekvence, na ijem se boku nalaze ponovljeni slijedovi triju
repetitivnih elemenata (B, K i L). (C) Drosophilin centromer sastoji se od dviju satelitnih
sekvenci, transponirajuih elemenata i neponovljene DNA.
Transposons
AAGAG Satellite
AATAT Satellite
Nonrepetitive DNA
transpozoni
AAGAG satelit
AATAT satelit
neponovljena DNA
sekvence
predvieni geni
slino u kvascu
www.perpetuum-lab.com
32
Cellular communication
Protein trafficking
Intracellular transport
Cellular biogenesis
Transport
Energy
Protein synthesis
Ionic homeostasis
Unclassified
Slika 4.29 Ljudski kromosomi Shematski prikaz pruganja kromosoma nakon citogenetikog
bojanja.
Slika 4.30 Fluorescentna in situ hibridizacija Fluorescentna sonda za gen koji kodira
laminski B receptor hibridizirana je sa obojanim ljudskim metafaznim kromosomom (plavo).
Hibridizacijski signali na pojedinanim genima detektiraju se pomou crvene fluorescencije.
(Ljubaznou L. L. Wydnera i J. B. Lawrence, Medicinski centar Univerziteta Massachusetts.)
Slika 4.31 Transkripcijska karta kromosoma 1
Prikazana je reprezentativna karta cDNA klonova na ljudskom kromosomu 1. Histogram na
desnoj strani prikazuje raspodjelu gena du kromosoma. (Iz Genome Maps 7, 1966. Science
274:547.)
Centromere
centromer
Identified genes
identificirani geni
Chromosome1
kromosom1
Slika 4.32 Sekvenca ljudskog kromosoma 1
Prikazane su pozicije gena identificiranih u skici sekvence ljudskog kromosoma 1. (Iz
International Human Genome Sequencing Consortium, 2001. Nature 409: 860.)
Chromosome1
Genes
kromosom1
geni
Broj kromosomaa
16
33
Sluzava plijesan
(Dictyostelium)
Arabidopsis thaliana
Kukuruz
Crveni luk
Ljiljan
Nematoda
(Caenorhabditis elegans)
Vinska muica
(Drosophila)
aba (Xenopus laevis)
Slatkovodna riba dvodihalica
Pile
Mi
Krava
Pas
ovjek
70
125
5,000
15,000
50,000
7
5
10
8
12
97
180
3,000
50,000
4
18
17
1,200
3,000
3,000
3,000
3,000
39
20
30
39
23
Broj aminokiselina
244
129
125
135
102
Postotak lizina+arginina
30,8
20,2
22,4
22,9
24,5
34
Organizam
Sekvence
za
kodiranje proteina
0,58
1,8
4,6
470
1.743
4.288
88%
89%
88%
12
12
6.000
4.800
70%
60%
97
180
19.000
13.600
25%
13%
125
440
26.000
30.000- 50.000
25%
oko 10%
3.200
30.000- 40.000
1-5%
Bakterije
Mycoplasma genitalium
H. influenzae
E.coli
Kvasci
S. cerevisiae
S. pombe
Beskraljenjaci
C. elegans
Drosophila
Biljke
Arabidopsis Thaliana
Ria
Sisavci
ovjek
www.perpetuum-lab.com
35