You are on page 1of 165

Biotechnologie 2

| Deel DNA |

Biomedische laboratoriumtechnologie

Tweede deeltraject

Docent: Annelies Crabbe – Mede-auteur: Peter Kronenberger


Tweede semester

Departement Gezondheidszorg

Academiejaar 2022 - 2023


2

INHOUDSOPGAVE

INHOUDSOPGAVE ....................................................................................... 2
1. Mendeliaanse genetica ........................................................................... 6
1.1 Gregor Mendel (1822 - 1884) ........................................................... 6
1.2 De eerste wet van Mendel (segregatiewet) ......................................... 8
1.3 Dominantie en recessiviteit .............................................................. 9
1.4 Testkruising en terugkruising.......................................................... 10
1.5 Mendel's tweede wet: onafhankelijke sortering van kenmerken .......... 11
2. Structuur van DNA .............................................................................. 15
2.1 Mendeliaanse factoren en chromosomen .......................................... 15
2.2 Nucleïnezuren als drager van genetische informatie .......................... 16
2.3 Beknopte vroege geschiedenis ........................................................ 18
2.4 De nucleïnezuren DNA en RNA ........................................................ 18
2.5 Structuur van enkelstrengig DNA en RNA ......................................... 19
2.6 X-straal diffractie analyse............................................................... 22
2.7 De dubbele DNA helix .................................................................... 22
2.8 Alternatieve DNA conformaties ....................................................... 24
2.9 Baseparing in B-vorm DNA ............................................................. 25
2.10 Chargaff's werk ......................................................................... 26
2.11 Implicaties van het Watson-Crick model ....................................... 27
3. Structuur van chromosomen en epigenetica ........................................... 28
3.1 Genoomgrootte............................................................................. 28
3.2 Pro- en eukaryotische chromosomen ............................................... 30
3.3 Chromatinedynamiek..................................................................... 32
3.4 Wat is nu een eukaryotisch chromosoom ? ....................................... 34
3.5 Epigenetica .................................................................................. 35
4. Functie van DNA en genen ................................................................... 41
4.1 Wat zijn genen ? ........................................................................... 41
4.2 Fundamentele verschillen in genstructuur bij pro-en eukaryota ........... 42
4.3 Repetitieve sequenties ................................................................... 43
4.4 Hoog-repetitief DNA, satelliet-DNA, telomeren & centromeren ............ 45
4.5 Mobiel DNA ("jumping genes") ........................................................ 48
4.5.1 Bacteriële insertie sequenties en transposons ............................. 48
3

4.5.2 Ter info: Barbara McClintock en eukaryotische transposons. ......... 52


4.5.3 Eukaryotische retrotransposons. ............................................... 53
4.5.4 Mobiele elementen en evolutie.................................................. 57
5. DNA-replicatie .................................................................................... 58
5.1 DNA-replicatie is semi-conservatief ................................................. 58
5.2 Experimenten van Meselson & Stahl (1958) ..................................... 59
5.3 DNA-replicatie is bidirectioneel ....................................................... 60
DNA-replicatie onder de elektronenmicroscoop .......................................... 61
5.4 Replicatie-snelheid in E. coli en mens .............................................. 63
5.5 Drie ORI's van dichterbij bekeken ................................................... 63
5.6 Het probleem van de replicatie-initiatie ............................................ 65
5.7 Replicatie-initiatie in E. coli ............................................................ 65
5.8 Problemen in de replicatievork: Okazaki fragmenten ......................... 66
5.9 Over DNA polymerases .................................................................. 68
5.10 DNA-replicatie bij eukaryoten ...................................................... 71
5.11 Het probleem van de replicatie van telomeren ............................... 73
5.12 DNA replicatie en toposiomerases ................................................ 75
Replicatie van circulaire DNA moleculen .................................................... 79
6. Transcriptie ........................................................................................ 80
6.1 RNA polymerases .......................................................................... 80
6.2 Transcriptie bij E. coli .................................................................... 81
6.2.1 Initiatie ................................................................................. 81
6.2.2 Elongatie ............................................................................... 82
6.2.3 Terminatie ............................................................................. 84
6.3 Transcriptie bij eukaryoten ............................................................. 85
6.3.1 Transcriptie-initiatie bij eukaryoten ........................................... 85
6.3.2 Transcriptiefactoren ................................................................ 86
6.3.3 Elongatie en de CAP structuur .................................................. 89
6.3.4 Transcriptieterminatie en polyadenylatie .................................... 90
6.4 Posttranscriptionele modificaties bij eukaryota, RNA splicing .............. 92
7. Translatie ........................................................................................... 96
7.1 De drie functies van RNA tijdens translatie ....................................... 96
7.2 De genetische code ....................................................................... 97
7.3 De rol van tRNA .......................................................................... 100
7.4 Wobble ...................................................................................... 103
7.5 Nog meer fijnmechaniek: ribosomen ............................................. 105
7.6 Het startcodon AUG ..................................................................... 107
4

7.7 Translatie-initiatie bij E. coli ......................................................... 108


7.8 Translatie-initiatie bij eukaryota: .................................................. 110
7.9 Elongatie ................................................................................... 112
7.10 Terminatie van translatie .......................................................... 115
7.11 Inhibitie van translatie .............................................................. 116
7.11.1 Antibiotica............................................................................ 116
7.11.2 Difterie-toxine inhibeert translocatie-stap van translatie ............ 118
8. Mutaties en herstelmechanismen ........................................................ 119
8.1 Mutatiefrequentie ........................................................................ 119
8.2 Mutaties .................................................................................... 120
8.3 Ioniserende straling en ultraviolet licht .......................................... 121
8.4 Chemische mutagenese ............................................................... 123
8.5 De Ames test .............................................................................. 126
8.6 DNA-herstelmechanismen ............................................................ 127
8.6.1 Mismatch herstel door het E.coli MutHLS systeem. .................... 127
8.6.2 Excisie herstel: het E.coli UvrABC systeem ............................... 129
8.6.3 Herstel van dubbelstrengige breuken door Ku ........................... 131
8.6.4 Herstel van ds breuken door homologe recombinatie ................. 133
9. Restrictie-enzymen............................................................................ 136
9.1 Palindromen ............................................................................... 137
9.2 Tetra, hexa en octaknippers ......................................................... 137
9.3 Sticky / blunt.............................................................................. 137
9.4 Restrictie-enzyme families ........................................................... 139
9.5 Isoschizomeren .......................................................................... 139
9.6 Naamgeving restrictie-enzymen .................................................... 140
9.7 De katalytische activiteit .............................................................. 141
9.8 Gerelaxeerde specificiteit ............................................................. 141
9.9 Detectie van restrictiefragmenten ................................................. 141
9.9.1 Molmassa merkers ................................................................ 142
9.9.2 Agarose gel-electroforese van restrictiefragmenten ................... 143
9.9.3 Restrictiekaarten................................................................... 144
9.9.4 Een restrictie in praktijk ......................................................... 146
10. De polymerase ketting reactie (“polymerase chain reaction”, PCR) ....... 147
10.1 Traditionele PCR ...................................................................... 147
10.1.1 PCR principe ......................................................................... 148
10.1.2 Hot-start PCR ....................................................................... 151
10.1.3 Kritische PCR parameters ....................................................... 152
5

10.1.4 Primer design ....................................................................... 156


10.1.5 PCR: contaminatie ................................................................ 157
10.1.6 Nuttige controle stappen ........................................................ 157
10.1.7 Analyse van PCR producten .................................................... 157
10.1.8 Een toepassing van PCR......................................................... 158
10.2 Capillaire electroforese ............................................................. 160
10.3 qPCR ...................................................................................... 160
11. Methoden uit de moleculaire diagnostiek ........................................... 160
11.1 Cytogenetica ........................................................................... 160
11.2 FISH, CISH en SISH ................................................................. 160
11.3 Array CGH............................................................................... 160
11.4 NGS ....................................................................................... 160
12. DNA sequencing ............................................................................. 161
12.1 Sanger methode ...................................................................... 161
12.2 Next generation sequencing ...................................................... 161
12.3 Third generation sequencing...................................................... 164
13. Referenties .................................................................................... 165
6

DEEL I: KNOWLEDGE

1. Mendeliaanse genetica

1.1 Gregor Mendel (1822 - 1884)

Mendel werd geboren in 1822 in Hyncice in toenmalig Oostenrijk,


nu Tsjechië. Vanaf 1843 was hij Augustijner monnik in het
klooster van Brunn (Brno); vanaf 1868 was hij er Abt.

 publicatie in 1865 in de "Verhandlungen des


Naturforschenden Vereines in Brunn" (volledige tekst bvb. op
www.mendelweb.org/MWGerText.html)
 "Herontdekking" van zijn publicatie in 1900 door de
plantkundigen Correns en De Vries.

Mendel onderzocht de overerving van eigenschappen bij erwten (pisum sativum)


en andere planten. Hij deed dit op een voor die tijd ongewone kwantitatieve manier,
en verwerkte zijn resultaten statistisch. Mendel onderzocht volgende 7
eigenschappen van erwtplanten: vorm en kleur van de zaden, vorm en inhoud van
de zaaddoos, en eigenschappen van de stam.
7
8

1.2 De eerste wet van Mendel (segregatiewet)

Bij kruisingen tussen twee planten die slechts in 1 kenmerk verschillen zal de eerste
generatie uniform een kenmerk van één van beide ouders bezitten of uniform een
intermediair kenmerk bezitten. Bij de tweede generatie, die bekomen wordt door
zelfbestuiving van de eerste, komen de eigenschappen van de ouderplanten terug
tevoorschijn (ze segregeren).

Bijvoorbeeld:

Wanneer Mendel een plant met gladde zaden kruistte met een plant met
verimpelde zaden, bleek dat alle planten uit de eerste generatie gladde erwten
produceerden.

Waneer deze "gladde" nakomelingen vermenigvuldigd werden door


zelfbevruchting verschenen de eigenschappen van de ouders opnieuw: van de
7324 erwten uit de tweede generatie waren er 5474 met gladde erwten, en 1850
opnieuw met verimpelde erwten. Mendel meende een 3:1 verhouding te
herkennen.

De kruisingen werden herhaald met andere kenmerken. De aantallen wezen


consistent op een verhouding 3:1.

Mendel realiseerde zich dat het verschijnen (segregeren) van eigenschappen die in
de eerste generatie "verstopt" leken te zijn ("recessief zijn" ) een belangrijke stap
betekende in het begrijpen van erfelijkheid. Van waar die 3:1 verhouding ?

Na additionele experimenten kwam hij tot een model waarin elke plant 2 "factoren"
draagt, de gameten slechts 1 factor, en waarin bepaalde factoren dominant zijn,
en andere recessief (zie schema).

Mendel terminologie:

De ouderplanten = parentes = P1

De eerste,tweede,… generatie = filiale = F1,F2,…

Een dominant kenmerk wordt in hoofdletter geschreven.


9

De essentie van Mendel's segregatiewet:

1.3 Dominantie en recessiviteit

De verhouding 3:1 bij de F2 kon verklaard worden door aan te nemen dat de factor
"glad", G, een dominante factor is. De factor "verimpeld" komt in aanwezigheid
van "glad" niet tot uitdrukking: hij is recessief.

Soms komen twee factoren toch samen tot uitdrukking: ze zijn dan co-
dominant (denk aan de AB bloedgroep).

Per 3 gladde F2 nakomelingen (zie segregatie, tabel) is dus slechts 1 "zuivere"


("true bred") plant met een dubbel dominant kenmerk (GG): hij is homozygoot
voor het kenmerk "glad". De dubbel recessieve (vv) plant is ook homozygoot. De
(Gv) hybriden zijn heterozygoten.

De fenotypische 3:1 verhouding kan geschreven worden als een genotypische


1:2:1 verhouding.
10

In plaats van factoren spreken we nu over "genen" , maar de meeste factoren


worden door meer dan één gen bepaald. Vermits elk gen in dubbel voorkomt (één
van vader, één van moeder) spreken we ook over "allelen", ttz. varianten van een
gen. De verschillende varianten van een gen in een populatie noemen we ook
"allelen". We spreken dan van "multipele allelen" omdat er veel varianten in
omloop zijn.

Vb. histocompatibiliteits antigenen: de kinderen van H1H2 x H3H4 ouders hebben


één van volgende vier combinaties: H1H3, H2H3, H1H4, en H2H4 (de MHC-genen
zijn co-dominant).

Kinderen kunnen dus geen transplanten van hun ouders krijgen. Er is wel een kleine
kans van 1:4 dat de cellen en organen van een broer of zuster dezelfde
histocompatibiliteits-configuratie bezitten.

1.4 Testkruising en terugkruising

 testkruising: bepalen van het genotype van een organisme door kruising met
een dubbel-recessieve, homozygote testplant.

Vb. plant-? x aa  50% Aa + 50% aa

Aangezien het recessieve allel niet tot uitdrukking komt in


heterozygoten, kan de allelencompositie van het te testen organisme
rechtstreeks afgelezen worden op basis van de verhoudingen van de
fenotypes van de nakomelingen.

Plant-? heeft hier dus het genotype Aa.

Testkruisingen worden belangrijk bij dihybride kruisingen (zie verder).

 Terugkruising: een testkruising met één van de parentes.


11

1.5 Mendel's tweede wet: onafhankelijke


sortering van kenmerken

De eerste wet voorspelde dat in monohybride kruisingen (kruisingen van


organismen die slechts in 1 kenmerk verschillen), de F2 generatie volgens een
genotypische 1:2:1 verhouding zou segregeren.

Hoe gedragen genenparen zich dan in dihybride kruisingen ?

Vb. glad/geel x verimpeld/groen

 Zoals verwacht vond Mendel in de F1 alleen planten met gladde/gele zaden


 Na zelfbevruchting telde hij 556 F2 zaden met volgende eigenschappen:
 315 glad / geel
 108 glad / groen
 101 verimpeld / geel
 32 verimpeld / groen

Deze getallen zijn dicht bij een 9:3:3:1 verhouding. Van waar deze verhouding ?

 Oplossing: verhoudingen uitrekenen voor de allelen apart.

Glad x verimpeld

F1: glad

F2: 315 + 108 = 423 glad

101 + 32 = 133 verimpeld

verhouding = ~ 3 glad : 1 verimpeld

Geel x groen

F1: geel

F2: 315 + 101 = 416 geel

108 + 32 = 140 groen

verhouding = ~ 3 geel : 1 groen

= 3/4 geel : 1/4 groen

= 75 % geel : 25 % groen
12

 De F2 verhoudingen komen overeen met die van monohybride kruisingen.


Conclusie: De allelen in de dihybride kruising gedragen zich dus
onafhankelijk ("onafhankelijke sortering") van elkaar.

 De kans dat zaad glad + geel is = 3/4 x 3/4 = 9/16


De kans dat zaad glad + groen is = 3/4 x 1/4 = 3/16

De kans dat zaad verimpeld + geel is = 3/4 x 1/4 = 3/16

De kans dat zaad verimpeld + groen is = 1/4 x 1/4 = 1/16

De totale fenotypische verhoudingen zijn dus 9:3:3:1, wat Mendel ook


vaststelde.
13

Figuur: onafhankelijke sortering in een dihybride kruising

Glad (S) is dominant over verimpeld (s)

Geel (Y) is dominant over groen (y)


14

OMIM databank

Het Amerikaanse National Institutes of Health (NIH) en de Johns Hopkins


Universiteit van Baltimore beheren een databank over Mendeliaanse overerving bij
de mens, de Online Mendelian Inheritance in Men of OMIM databank:
www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM

Zoek bijvoorbeeld naar "MUCOVISCIDOSE" of "THALASSEMIE" (of "INDEX")


om een idee te krijgen van genen die in verband werden gebracht met deze
syndromen. Je kan er ook de chromosomale locaties opzoeken.
15

2. Structuur van DNA

2.1 Mendeliaanse factoren en chromosomen

Rond 1900 waren chromosomen (chromos: kleurig, soma: lichaampjes) en de


deling ervan tijdens de meiose door celbiologen reeds beschreven. De analogie met
de Mendeliaanse factoren, met name de ploïdie, was opvallend.

In deze pionierstijd schreven ook enkele Belgen geschiedenis:

Edouard Van Beneden (1846-1910), een zoöloog en


invloedrijk embryoloog aan de universiteit van Luik,
ontdekte dat elke geslachtscel slechts de helft van het
aantal chromosomen bevatte (ze waren haploïd), en dat
door de bevruchting diploïdie werd hersteld. Hij vond ook
dat het chromosomenaantal in alle cellen van een
organisme constant was.

Enige tijd later (rond 1909) ontdekte de Leuvense professor


Frans Janssens (1863-1924) dat chromosomenparen materiaal
konden uitwisselen door "crossing-over". Hij noemde dit
fenomeen "chiasmatypie". De overkruisingen zelf noemde hij
"chiasmata".

Anderen legden een verband tussen de segregatie van de "sex factor" en het
geslachtschromosoom (vb. McClung, 1902).
16

2.2 Nucleïnezuren als drager van genetische


informatie

De chromosomen werden verder onderzocht en nog voor de eeuwwisseling werd


duidelijk dat ze opgebouwd waren uit eiwitten en "nucleïne" zuren. Over de vraag
welke van de twee drager was van erfelijke eigenschappen ontstond een intens
debat dat enkele jaren zou aanhouden…

 Proeven van Griffith

…tot in 1928 de bacterioloog Fred Griffith een mysterieuze factor ontdekte die
avirulente pneumococcen kon transformeren naar pathogene bacteriën.

Pneumococcen zijn normaal omgeven door een slijmerige poly-saccharide capsule,


en de mutanten missen een enzyme om die capsule aan te maken. De capsule is
noodzakelijk voor de pathogeniciteit van de bacterie die longontsteking veroorzaakt
in dieren en mensen.

Mutanten die geen slijmlaag bezitten zijn dus niet pathogeen en vormen "ruwe" ,
kleine kolonies op agarplaten ("R" stammen"). De normale, pathogene bacterie
vormt gladde, grote kolonies ("S" van "smooth").

Griffith ontdekte dat een mengsel van R en hitte-geïnactiveerde S stammen muizen


kon doden. Het bloed van de gestorven muizen bevatte levende S stammen!

Het leek er dus op dat "iets" van de hitte-geïnactiveerde S pneumokokken de


levende R stammen had "getransformeerd".

Later vond Griffith dat de R-stammen in vitro konden getransformeerd worden door
een celvrij extract van S-stammen aan R stammen toe te voegen. Wát in dit
complexe extract was nu verantwoordelijk voor de transformatie?

Het zou nog meer dan 10 jaar duren voor het antwoord gepubliceerd werd! Na een
fractionatiestudie van het S-extract werd door Avery, MacLeod & McCarty
(1944) onomstotelijk bewezen dat deoxyribonucleïnezuur, DNA, het "transforming
principle" was. Enzymes die DNA afbreken (DNases) vernietigden de
transformerende factor, terwijl proteases en RNases dit niet konden.
17

 De experimenten van Hershey & Chase

De in 1953 gepubliceerde proeven van Fred


Hershey en Martha Chase van het nadien
beroemde Cold Spring Harbor Laboratorium
nabij New York, toonden de rol van DNA
definitief aan.

Ze demonstreerden dat het DNA dat verpakt zit


in het "hoofd" van bacteriofagen in de bacterie
geïnjecteerd wordt, terwijl de proteïnemantel
van het virus buiten achterblijft. Ze konden
aantonen dat het virale DNA, en niet de
proteïnen, de informatie bevatte om nieuwe
virussen aan te maken.

" the virus may act like a little hypodermic


needle full of transforming principles" , Herriott
1951

Hershey & Chase groeiden bacteriofagen in media met 32P of 35S isotopen. Na
isolatie hadden ze dus DNA-gemerkte fagen (32P), en proteïne gemerkte fagen
(35S).

Na een kort contact met de E. coli bacteriën, werd de suspensie in een mixer
gestopt (de sindsdien fameuze "Waring Blendor", nu nog altijd terug te vinden in
menig labo…), met de bedoeling de fagen van de bacteriën te scheiden. De coli's
ondergingen gedurende korte tijd een mix van 10.000 toeren per minuut. De
bacteriën werden vervolgens gecollecteerd als "pellet" (bezinksel) door
centrifugatie. Wat bleek ?

- Het meeste 32P faag DNA zat in het bacterieel pellet


- De meeste 35S faag proteïnen zaten nog in het supernatant (de bovenstaande
vloeistof)
- De behandeling was bovendien niet wild genoeg om te interfereren met de
infectie. De bacteriën produceerden nieuwe viruspartikels! Het virale DNA was
dus drager van de genetische informatie.

In 1957 toonde Heinz-Fraenkel Conrat aan dat genetische informatie ook kon
resideren op ribonucleïnezuur (RNA van het tabak mosaic virus, TMV).
18

2.3 Beknopte vroege geschiedenis

1869: Miescher isoleert een zure substantie uit celkernen: het bevat veel fosfaat

1869: Altman ontdekt dat nucleïnezuur bestaat uit fosfaat, suiker en organische
basen, en dat het een lineaire niet-vertakte polymeer is.

1924: Robert Feulgen vindt een methode om de hoeveelheid DNA te bepalen door
een kleurreactie

1951: Maurice Wilkins and Rosalind Franklin maken een eerste X-straal diffractie
analyse

1951 - Edwin Chargaff vindt dat in DNA de hoeveelheid A=T en C=G

1951 – 1953: op basis van Wilkins en Franklin's werk maken James Watson en
Francis Crick een DNA model: de dubbele helix

2.4 De nucleïnezuren DNA en RNA

 DNA
 Deoxyribo nucleïne zuur
 In celkern
 In mitochondria, chloroplasten,…
 Zeer lang: in onze cellen +/- 2 meter per celkern !!!
 Bevatten de basen Adenine, Thymidine, Guanine, en Cytosine
 dubbelstrengig

 RNA
 Ribo nucleïne zuur
 In cytoplasma
 Kleinere moleculen
 Bevat Uracil i.p.v. Thymidine
 enkelstrengig
19

2.5 Structuur van enkelstrengig DNA en RNA

 basis repeterende eenheid = fosforzuur - suiker - base (figuur; a)

 deze eenheid = een nucleotide

In cellen komen ook lage concentraties nucleosiden voor, combinaties van een
base en een suiker, maar zonder fosfaatgroep.

fosforzuur:

PO4-groepen verbinden de suikers (fosfo-diesterbindingen)

suiker, een pentose (figuur; b):

in DNA: 2'deoxyribose

in RNA: ribose

base:

ofwel een stikstofbase met 1 ring: een pyrimidine

Uracil "U"

Thymidine "T"

Cytosine "C"

ofwel een stikstofbase met 2 ringen: een purine

Adenine "A"

Guanine "G"

De letters U,T,C,A, en G worden zowel gebruikt voor de nucleotiden als voor de


bases afzonderlijk.
20
21

Een enkelstrengige DNA of RNA keten wordt opgebouwd door suikers met elkaar
te verbindingen via fosfodiëster bindingen. Een 5' koolstof van de ene suiker wordt
via een fosfaatgroep verbonden met de 3' groep van een andere suiker. Op die
manier ontstaat een fosfaat/suiker "geraamte", ttz. een lineaire streng waarop de
verschillende basen zijdelings uitsteken (a)

(b) Vermits de volgorde van de basen in DNA belangrijk is (zie later), is het
belangrijk referentiepunten te geven: een DNA sequentie wordt geschreven met
een 5'  3' oriëntatie.
22

2.6 X-straal diffractie analyse

De structuur van het DNA kon bepaald worden door de X-straal diffractiestudies
van Maurice Wilkins en Rosalind Franklin in 1951.

Wenst men informatie over kleine structuren met


afmetingen in de grootte orde van enkele
Angstrom dan zal men deze structuren moeten
laten interageren met golven met een zéér kleine
golflengte, in praktijk: X-stralen. X-stralen zijn in
zekere zin hoog energetische lichtgolven. Jammer
genoeg bezitten we (nog ?) geen lenzen om deze
stralen in een microscoop tot beelden te laten
focusseren. Het enige wat men kan doen is de X-
stralen op het staal richten en uit het gebroken =
gediffracteerde “licht” informatie over die
structuur afleiden. Bij X-straaldiffractie is het dus
noodzakelijk de te onderzoeken stof in kristallijne
vorm te bekomen, omdat anders het gediffracteerde beeld veel te complex is. Het
kristalliseren is echter dikwijls al een hele uitdaging! Door de regelmatige schikking
van het DNA in het kristal worden de X-stralen op een geordende manier verstrooid
zodat er diffractiepatronen ontstaan (denk aan de patronen die ontstaan wanneer
licht doorheen een fijn rooster schijnt). In het geval van X-stralen kan men deze
patronen detecteren op een fotografische plaat. Door gebruik te maken van zgn.
Fourier-analyse (een beetje wiskundig talent helpt) kan men op basis van de
diffractiepatronen de structuur van de moleculen in het kristal herberekenen. De
foto toont het diffractiepatroon van DNA: de dense bogen boven en onder ontstaan
door de regelmatige schikking van de baseparen, met 3.4 Angstrom (3.4 10-10 m)
tussen elk basepaar.

2.7 De dubbele DNA helix

In sommige virussen is het DNA enkelstrengig, maar DNA uit celkernen,


mitochondria of bacteriën komt meestal voor als een dubbelstrengige molecule. De
structuur van de dubbele helix, zoals gemodelleerd door Watson en Crick in 1953,
is interessant omdat de functie eruit kan afgeleid worden (zie verder).

 De suiker-fosfaat strengen zitten aan de buitenkant v.d. helix


 De basen zitten binnenin de helix
 De diameter van de helix is 20 Angstrom.
 Er is complementariteit van de basen.
Purines (A,G) paren alleen met pyrimidines (T,C):
23

 A vormt twee waterstofbruggen met T


 G vormt drie waterstofbruggen met C
De ene streng is complementair aan de andere streng.

De twee strengen zijn dus niet identiek !

 De dubbele helix is rechtsdraaiend

Moest je een rechtsdraaiende wenteltrap nemen dan zou bij het naar
boven gaan de trapleuning aan de rechterkant staan. Een dubbele-helix
wenteltrap is te vinden in het natuurhistorisch museum te Brussel
(tegenover de Iguanodons).

 De strengen maken een volledige omwenteling


 elke 10 bases
 elke 3.4 nm

 van opzij bekeken vormen de strengen twee groeven:

 een brede groef (major)


 een smalle groef (minor)

 de twee strengen lopen antiparallel

 de ene heeft een 5'3' orientatie


 de andere heeft een 3' 5' orientatie

 de associatie tussen de twee strengen is reversibel. De strengen


kunnen gedenatureerd en gerenatureerd worden zodanig dat de
correcte baseparen terug gevormd worden.
24

 Een conventie: een DNA


sequentie wordt geschreven van
5'3'

2.8 Alternatieve DNA


conformaties

De "normale" DNA configuratie zoals hierboven beschreven noemt men de "B"


conformatie.

 A-vorm DNA
 Compacter dan B-vorm: 11 bases / omwenteling
 Bases weggekanteld van helicale as
 "holte" in centrum van helix
 in RNA-DNA hybriden
 in RNA-RNA duplexen
 mogelijk aanwezig in cellen

 Z-vorm
 Linksdraaiende helix
 "z" van zig-zaggen van de bases
 mogelijk aanwezig in cellen
 staat op frontpagina van "principles of genetics" van Gardner,
Simmons & Snustad 1995

 Tripel helix
 Drie strengen
 Er is plaats voor een derde pyrimidine-streng als
25

 streng 1 allemaal purines


 streng 2 allemaal pyrimidines
 derde streng kan sequentie specifiek binden : "Hoogsteen" baseparing
 komt waarschijnlijk niet voor in cellen

2.9 Baseparing in B-vorm DNA

De AT en GC baseparen worden ook wel de "Watson-Crick" baseparen genoemd.


De specifieke complementariteit wordt gedicteerd door:

 plaats: purine-pyrimidine koppel past in de helix. Purine-purine


koppels zijn te groot
 de vorm van de complementaire bases
 de mogelijkheid tot vormen van waterstofbruggen

In theorie zou thymidine (een pyrimidine) waterstofbruggen kunnen vormen met


guanine (een purine). Dit kan men induceren in synthetische DNA's.

Het purine-purine koppel CT zou qua plaats ook passen in de helix.


26

CT en GT baseparen worden in praktijk niet gevonden in DNA, GU koppels


daarentegen wel in dubbelstrengig RNA.

Watson-Crick baseparing:

2.10 Chargaff's werk

In 1950 vond Erwin Chargaff dat de verhouding A/T en de verhouding G/C gelijk
waren aan 1 in het DNA van alle door hem onderzochte organismen.

Dus A/T = 1 en G/C = 1, of anders uitgedrukt:

aantal purines (A+G) = aantal pyrimidines (C+T)


27

Het model van Watson en Crick leverde een mooie verklaring op van deze
bevindingen: door complementariteit van de strengen bepaalt de hoeveelheid A in
de ene streng uiteraard de hoeveelheid T in de andere streng. Hetzelfde gaat op
voor G en C.

Chargaff's bevindingen gelden dus voor dubbelstrengig DNA.

Het percentage GC of AT koppels in DNA verschilt van organisme tot organisme.


Zo hebben prokaryoten GC percentages variërend van 25 tot 75%. Zoogieren
hebben een constante waarde, nl. ~40% GC.

2.11 Implicaties van het Watson-Crick model

 Het Watson & Crick model suggereerde hoe het genetisch materiaal kon
dupliceren: strengen gaan uit elkaar en elke streng wordt gekopieerd.

 Tevens suggereert het model hoe een mutatie kan ontstaan, nl. door
samenstelling of volgorde van de nucleotiden te veranderen.

 Het aantal verschillende sequenties dat kan gecodeerd worden door een stuk
DNA van n nucleotiden is dus 4n. Voor een stuk DNA van 10 nucleotiden is dat
reeds 410 = 1.048.576 mogelijkheden !

 Het menselijk genoom bestaat uit 3 miljard baseparen. Gezien het enorm
aantal mogelijkheden is een bepaalde sequentie met grote waarschijnlijkheid
uniek.

 Last-but-not-least: het model suggereert dat de genetische code bestaat uit


een bepaalde volgorde van de nucleotiden. Het ontrafelen van die genetische
code, en hoe ze uiteindelijk vertaald wordt naar proteïnen zal nog duren tot
1960.
28

3. Structuur van chromosomen en


epigenetica

3.1 Genoomgrootte
Er is een tendens dat het aantal baseparen per genoom stijgt naarmate het
organisme complexer wordt, maar analyse van verschillende organismen zorgt
voor enkele verrassingen:

Genoom Lengte Aantal Vorm


(x1000) genen

Virussen

MS2 4 4 .ssRNA

SV40 5 Circulair dsDNA

X174 5 11 Circulair dsDNA

M13 6 Circulair dsDNA

Polio 7.5 10 Lineair ssRNA

 50 Lineair dsDNA

T-even fagen 165 150 Lineair dsDNA

Bacteriën

Mycoplasma 760 Circulair dsDNA

E.coli 4700 ~3000 Circulair dsDNA

Eukaryota Haploïd aantal


chromosomen

Saccharomyces (gist) 13.000 16

Caenorhabditis (nematode) 100.000 6

Arabidopsis (zandraket) 1.000.000 5

Drosophila (fruitvlieg) 1.650.000 4

Homo sapiens 3.000.000 30.000 ? 23


29

Zea Mays 4.500.000 10

Amphiuma (salamander) 76.500.000 14

Bij hogere dieren correleert de genoomgrootte niet met het aantal genen die in dat
genoom aanwezig zijn. De mens heeft bijvoorbeeld 3 miljard baseparen, en dat zou
in principe genoeg zijn om 3 miljoen genen te bevatten (elk gen +/- 1000
baseparen). Er blijkt echter slechts een 4% van ons genoom te coderen voor
eiwitten. De functie van het overgrote deel van ons genoom is slechts gedeeltelijk
begrepen (zie verder).
30

3.2 Pro- en eukaryotische chromosomen

Het DNA van pro- en eukaryoten zit compact opgerold zodanig dat het in een
bacterie of celkern past. Bij de mens moet per cel een tweetal meter DNA verpakt
worden zodat het in een celkern van enkele micron diameter past (1 µ = 10 -6
meter, of een duizendste van een millimeter). De manier waarop bacteriën en
eukaryoten die verpakking bewerkstelligen verschilt echter grondig.

 Bij prokaryoten, zoals E. coli, moet het 1 mm lang DNA ingepakt worden in
een bacterie van 2 x 1 . Zonder speciale "verpakking" zou dat DNA een
volume innemen dat 1000x zo groot is! Het bacteriële DNA blijkt
geassocieerd:

 met polyamines (spermine, spermidine)


 met proteïnen: vooral H-NS (“Histone-like Nucleoid structuring)
dimeren (2 x 15,6 Kda)

Het spermidine, bijvoorbeeld, is een polyamine met 3 amines:

NH3+-(CH2)4-NH+-(CH2)3-NH3+. Spermine heeft 4 amines.

De positief geladen polyamines neutraliseren de fosfaatgroepen


van het DNA. De H-NS dimeren binden het DNA en compacteren
de lange molecule die sterk gewikkeld wordt, "supercoiled", om
niet te zeggen super-opgewonden. De energie voor al die
opwinding wordt geleverd door het enzyme DNA-gyrase, een
topoisomerase dat ATP hydrolyseert.

De foto toont een partieel gelyseerde bacterie.


Een deel van het bacteriële chromosoom is
vrijgekomen.
31

 Eukaryotische chromosomen zitten anders in elkaar. Het DNA is er


geassocieerd met histonen, een familie van 5 basische proteïnen: H1, H2A,
H2B, H3, en H4. Histonen zijn zeer conservatieve proteïnen: tussen het H3 van
zee-egels en dat van kalveren is slechts een verschil van 1 aminozuur. Een kalf
en een erwt zijn wat histon H3 betreft slechts 4 aminozuren van elkaar
verwijderd.

Het DNA-histonen complex noemt men chromatine. Afhankelijk van de


zoutconcentratie zal het chromatine een paternoster structuur aannemen (laag
zout) waarin het DNA-histon complex nucleosomen vormt ("bolletjes" van 10
nm = 10 10-9 m diameter) die van elkaar gescheiden zijn door een dunne DNA
"linker" van 15 tot 55 baseparen, al naargelang de species. In fysiologische
zoutconcentraties (~150 mM zout) is het chromatine een dense vezel met een
diameter van 30 nm.

De nucleosomen zijn cylindervormige complexen die bestaan uit een


histonenkern rond dewelke 146 nucleotiden DNA zich wikkelen in bijna 2
wentelingen. De nucleosoomkern ("core") bestaat uit een octameer waarin
telkens twee kopijen per histon (H2A,H2B,H3, en H4) aanwezig zijn. Histon H1
associeert zich met het nucleosoom en speelt een rol in het opwikkelen van de
paternoster tot een compacte "solenoïde": de 30 nm chromatinevezel. Het H1
komt dan binnenin de solenoïde te liggen.
32

3.3 Chromatinedynamiek

Het DNA dat actief wordt overgeschreven naar RNA (transcriptie, zie later) zit in
chromatine-domeinen die minder dens verpakt zijn, en die lokaal waarschijnlijk een
paternoster-configuratie aannemen.

Voorbeeld experiment

De toegankelijkheid van het DNA in de chromatine structuur kan nagegaan worden


door te trachten het DNA te knippen met het enzyme DNase-I. Daarna kan het DNA
geëxtraheerd worden uit het chromatine, en onderzocht via gel-electroforese. De
toestand van een bepaald gen kan men volgen door het totaal DNA te hybridiseren
met een radioactief gemerkt DNA fragment dat specifiek is voor dat gen.

In het voorbeeld hieronder werden celkernen van erythroblasten en gecultiveerde


stamcellen (MSB-cellen) behandeld met DNase-I. Het DNA werd vervolgens
geëxtraheerd en geknipt met het enzyme BamHI om het globine-gen uit het lang
chromosomaal DNA te halen. Het 4.6 kilobasepaar DNA fragment waarop het
myoglobine-gen ligt wordt vervolgens zichtbaar gemaakt door het DNA te
hybridiseren met een radioactief stukje DNA (de "probe") dat specifiek zal binden
aan het globine-gen. Uit de resultaten blijkt dat het 4.6 Kb fragment toegankelijk
is voor DNase-I in erythroblasten, maar niet in de stamcellen: het fragment wordt
nl. alleen bij erythroblasten kapot geknipt door DNase-I zodat de probe er niet
meer mee kan hybridiseren.

Het myoglobinegen wordt bij erythroblasten inderdaad actief overgeschreven, bij


stamcellen niet. De andere fragmenten zijn duidelijk niet transcriptioneel actief, en
zijn misschien pseudogenen (kopijen van een gen die door de cel nooit gebruikt
worden).
33

De combinatie van scheiding van het DNA op een gel, transfereren van het DNA
naar een filter, en hybridiseren met een probe werd in 1975 ontwikkeld door Ed
Southern. De techniek staat bekend als "Southern blotting":
34

3.4 Wat is nu een eukaryotisch chromosoom ?

Tijdens de celdeling condenseert chromatine zo sterk dat


"chromosomen" zichtbaar worden. Het blijken structuren te
zijn die essentieel een verdere wikkeling en compactering
inhouden van de 30 nm chromatinevezel. Het chromatine
wordt op regelmatige plaatsen ondersteund door een
chromosoom-stelling of steiger ("scaffold") die bestaat uit
non-histon proteïnen.

De foto toont een metafase-chromosoom van de mens. De


"haartjes" zijn de 30 nm. vezels.

Ter info: tijdens de metafase is het DNA verdubbeld en is de chromosoom-


condensatie maximaal. Een metafase chromosoom is dus opgebouwd uit twee
identieke DNA strengen verpakt in chromatiden (de "armen" van de X).

Een interfase celkern bevat nog steeds wat gecondenseerd chromatine dat
donkerder gekleurd wordt in histologische kleuringen: het heterochromatine.
Het is vooral repetitief DNA (zie verder) en bevat veel DNA uit de centrale
regio’s van de chromosomen (centromeren) en van de uiteinden (telomeren).
De transcriptioneel actieve regio’s zijn gelegen in het overige euchromatine
en vooral in de centraal gelegen nucleolus van de celkern.

De opeenvolgende "verpakkingen" van naakt DNA tot chromosoom zijn als volgt:

1. paternoster-configuratie van chromatine: wikkeling van DNA op histon-


octameren
2. condensering van paternosterstructuur: 30 nm vezel
3. 30 nm. chromatine in lussen van 1-4 miljoen baseparen gebonden op
chromosoom steiger: 300 nm vezel
4. verder wikkeling van 300 nm vezel tot 700 nm vezel (alleen tijdens
metafase)
35

3.5 Epigenetica

Epigenetische veranderingen zijn wijzigingen in fenotype of genexpressie die niet


het gevolg zijn van wijzigingen in de DNA sequentie. Merkwaardig genoeg kunnen
ook epigenetische wijzigingen doorgegeven worden van cel tot cel tijdens
opeenvolgende delingen, en zelfs aan andere generaties. Een van de belangrijkste
epigenetische wijzigingen, de vorming van heterochromatine, zal genen inactiveren
(“silencing”), en gebeurt door covalente wijzigingen aan DNA (vb. methylatie), door
de aanwezigheid van non-histon proteinen (vb. Swi6/HP-1), of door covalente
wijzigingen aan de N-terminale staarten van de histonen. Deze wijzigingen
omvatten acetylatie en methylatie, maar ook door fosforylatie, sumoylatie,
ubiquitinatie en ADP ribosylatie.

Hetero- en euchromatine

Constitutief heterochromatine is altijd gecondenseerd, zit typisch in centromeren


en telomeren, en werd altijd aanzien als transcriptioneel inactief. Dit beeld moet
men echter iets bijstellen: er is namelijk een kort moment in de celcyclus dat
transcriptie toegelaten wordt. De transcripts die ontstaan zullen daarna het
heterochromatine opnieuw het zwijgen opleggen via een recent ontdekt proces van
RNA interferentie (zie verder). Facultatief heterochromatine ontstaat in bepaalde
cellen, op bepaalde momenten. Euchromatine is alleen gecondenseerd tijdens de
mitose.

Heterochromatinepatronen blijken erfelijk te zijn. Tijdens de S-fase van de


celcyclus (Synthese van nieuw DNA), wordt het nieuw gerepliceerd DNA voorzien
van de oude histonen, en nieuwe, nog niet gemodifieerde histonen. Deze worden
nadien gemodifieerd naar het patroon van de bestaande, zodat men kan spreken
van een epigenetisch “geheugen”. Eenzelfde geheugen bestaat voor DNA
methylatiepatronen (zie hieronder).

A. Histone modificaties

Het blijkt dat elk van de histonen uit de octameer flexibele N-terminale uiteinden
hebben die uit het nucleosoom uitsteken. Deze aminotermini bevatten veel positief
geladen lysineresidu's die interageren met de fosfaatgroepen van DNA. De lysines
kunnen echter reversibel geacetyleerd worden door specifieke histon-acetylases
(HAT), zodat hun positieve ladingen afgeschermd worden. Hoe meer acetylatie, hoe
minder interactie met het DNA, hoe minder het chromatine gecondenseerd is. Het
DNA wordt dan toegankelijk voor RNA -polymerasen en transcriptiefactoren. Histon
deacetylasen (HDAC’s) doen het chromatine weer condenseren.
36

B. DNA methylatie

Genen kunnen ook epigenetisch uitgeschakeld worden door methylatie van cytosine
in DNA op CpG posities. De chromatineconfiguratie wordt compacter, en de
genexpressie wordt onderdrukt. In de loop van de evolutie zijn CpG rijke regio’s,
zgn. CpG eilandjes, uitgegroeid tot belangrijke onderdelen van promotorregio’s van
genen. Terwijl de meeste regio’s van het genoom permanent gemethyleerd zijn,
worden bepaalde CpG eilandjes vrijgehouden van methylatie, hetgeen resulteert in
een open chromatinestructuur en zodoende transcriptie bevordert. DNA methylatie
schakelt ook de activiteit van (retro) transposons uit, en schijnt verder ook
belangrijk voor de stabiliteit van het genoom. DNA methylatie wordt geregeld door
DNA methyltransferasen en methyl-CpG bindende proteinen.

Methyl-CpG bindende proteinen (blauw) zouden HDACs aantrekken (groen) zodat


het chromatine condenseert.
37

Cellen blijken een DNA methylatiepatroon te bezitten dat typisch is voor elk weefsel
/ orgaan. Kankercellen hebben een DNA methylatiepatroon dat sterk afwijkt van
het normale weefsel patroon. Bovendien zijn veel genen gehypermethyleerd zodat
hun functie onderdrukt wordt. Ook tumor-suppressor genen (degenen die
ongeoorloofde mitosen moeten onderdrukken) zijn in kankercellen epigenetisch
uitgeschakeld (“silenced”). Het leuvense biotechnologiebedrijf
www.oncomethylome.com (ondertussen hernoemt tot www.mdxhealth.com)
maakt gebruik van methylatie-specifieke PCR om de gewijzigde methylatie
patronen in kankercellen te detecteren. Deze wijzigingen zijn de vroegst
detecteerbare in kankercellen.

Naarmate we ouder worden ontstaat er progressief een globale hypomethylatie en


tegelijk een hypermethylatie op CpG eilandjes (zoals bij kanker). De epigenetische
wijzigingen in de genen die de lengte van de telomeren regelen, en de werking van
NAD+ afhankelijke deacetylasen (sirtuines) zijn echter tegenovergesteld bij “oude”
cellen versus kankercellen.

Histon methylatie

De N-terminale staarten van de histonen kunnen gewijzigd worden door acetylatie


en methylatie, maar ook door fosforylatie, sumoylatie, ubiquitinatie en ADP
ribosylatie. Sommige wijzigingen zijn echter “activerend” voor de transcriptie, vb.
de H3K4 methylatie (= methylatie op lysine 4 van histon 3). H3K9 methylatie,
bijvoorbeeld, is daarentegen weer repressief.
38

Zoals vermeld is er een kort moment in de celcyclus dat transcriptie in


heterochromatine toegelaten wordt. De transcripts die ontstaan zullen daarna het
heterochromatine opnieuw het zwijgen opleggen via RNA interferentie. Histon
fosforylatie en methylatie spelen hier een cruciale rol.

X-chromosoom inactivatie:

Vrouwen (XX) inactiveren in elke cel een volledig X-chromosoom, en bekomen zo


een gendosering vergelijkbaar met mannen (XY). De transcriptionele inactivering
van een volledig X chromosoom staat onder controle van één gen dat codeert voor
het Xist RNA (dat niet in een proteine vertaald wordt). De antisense partner Tsix
blokkeert inactivatie.

Ter info: Op het inactief chromosoon wordt Tsix onderdrukt, terwijl Xist wordt
opgereguleerd. Op het actief X chromosoom is de situatie omgekeerd. Hier
komt een recent ontdekte rol voor RNA interferentie bij kijken: vermits de
Xist en Tsix transcripts complementair zijn, kunnen ze dienen als dsRNA
substraat voor het enzyme dicer, dat hier ongewoon lange siRNA’s genereert
(25 – 40 bp). Deze siRNA’s inactiveren Xist op het actief X chromosoom, en
Tsix op het inactief X chromosoom.
39

C. Micro RNA’s, siRNA’s

Het centraal “dogma” luidt DNA  mRNA  proteinen, maar recent werd een
epigenetisch mechanisme ontdekt dat “roet in het eten gooit”: RNA interferentie.
De mRNA moleculen kunnen inderdaad “aangevallen” worden door microRNA’s of
“short interfering” siRNA’s.

Hoe werkt dit? Cellen blijken kleine enkelstrengige RNA moleculen te synthetiseren
die palindromische sequenties bevatten, zodat deze “hairpin” structuren vormen.
Vervolgens worden deze door een ribonuclease, Dicer, geklieft tot kleine
dubbelstrengige (ds) RNA moleculen (miRNA’s) van een 20-tal bp die binden met
bepaalde proteïnen en zgn. “silencing” complexen vormen. miRNA’s binden daarna
typisch in het 3’ niet-getransleerd gedeelte van de mRNA (de 3’ untranslated
region, UTR), en verminderen de genexpressie door de translatie te blokkeren. Het
is dus niet omdat een gen wordt overgeschreven (transcriptie), dat de expressie
ervan als proteine (translatie) automatisch volgt: epigenetica dus.

Iets drastischer gaat het er aan toe bij “small interfering “ RNA’s (siRNA). Deze
kleine RNA moleculen worden gevormd als verdediging bij o.a. virale infecties.
Doelwit mRNA’s die complementair zijn met één helft van de hairpin worden
herkend en vernietigd: de mRNA wordt niet alleen gekliefd, maar de RNA strengen
worden ook door exonucleasen volledig afgebroken. Dit mechanisme is bovendien
katalytisch: één siRNA-“silencing“ complex kan meerdere mRNA’s selectief
vernietigen.

Een interessante bevinding is dat het RNA interferentiesysteem ook werkt met
siRNA’s die door de onderzoeker aan de cel wordt toegediend (zie figuur linksboven:
“exogeen” RNA). Dit werd eerder spectaculair aangetoond door de succesvolle
blokkering van polio en HIV infecties (in vitro celcultuur) met dubbelstrengige
siRNA’s. Het blijkt bovendien dat cellen die het geschikte siRNA gen op voorhand
krijgen ingebouwd zo goed als “immuun” zijn voor een aankomende virale infectie.
siRNA’s beloven dus een nieuwe vorm van geneeskunde te worden, maar het
afleveren van de siRNA’s in het doelwit orgaan (of tumor) blijkt niet altijd even
efficient te verlopen. De eerste fase-1 klinische studies zijn gestart in 2004.

In 2006 ontvingen Craig Mello (University of Massachusetts Medical School) en


Andrew Fire (Stanford University) een Nobelprijs voor hun ontdekking van RNA
interferentie.
40

D. Transcriptie factoren

Zie ppt slides

Intermezzo: induced Pluripotent stem cells

Volgende artikels worden besproken (bijlage op Canvas):

Yamanaka S., et al. Induction of pluripotent stem cells from mouse embryonic and
adult fibroblast cultures by defined factors. Cell. 126, 663-676, August 25, 2006.

Melton D., et al. Generation of pluripotent stem cells from patients with type 1
diabetes. PNAS. 106(37):15768-73, September 15, 2009.
41

4. Functie van DNA en genen

4.1 Wat zijn genen ?

In moleculaire termen zou men een gen als volgt kunnen definiëren:

Een gen omvat álle DNA sequenties die nodig zijn voor de synthese van
een functioneel polypeptide.

De informatie die vervat zit in de coderende regio van het DNA wordt eerst
overgeschreven in RNA (transcriptie), en daarna vertaald in een co-lineaire
polypeptide (translatie).

De informatieflux van DNA  RNA  proteïne wordt dikwijls


omschreven als "het centrale dogma", een redelijk bombastische
benaming voor een belangrijk concept dat echter niets dogmatisch
heeft! Een echte "wet" is het ook niet vermits retrovirussen erin slagen
om de informatieflux om te draaien van RNA  DNA (vandaar ook hun
naam retro-viridae). Biotechnologen hebben er hun eigen grapje van
gemaakt: DNA  RNA  proteïne  geld.

De informatieflux is echter wel unidirectioneel in die zin dat proteïnen


een informatie "dead-end" zijn.

Een gen bevat dus sequenties die coderen voor de polypeptide, het cistron, en
sequenties nodig om transcriptie te starten of te moduleren. Dergelijke
controleregio's hoeven zelfs niet eens vlakbij de coderende sequenties gelegen te
zijn. Bij eukaryota liggen sommige sequenties (zoals transcriptie "enhancers", zie
later) wel 50 Kb verder dan de coderende regio!

Een taalkundige uitzondering zijn de "genen" die coderen voor RNA moleculen
(zoals transfer RNA's, zie later) en die dus nooit in proteïnen vertaald worden. Men
blijft deze echter gemakshalve ook "genen" noemen.

De term cistron werd door Seymour Benzer (1957) geïntroduceerd, en is afgeleid


van zijn cis / trans test ttz. als een heterozygoot die afgeleid is van twee
mutanten een “wild type” fenotype oplevert (complementerende mutanten), dan
liggen de mutaties in trans (nu: ze liggen in verschillende genen, zie X in
schema); als de heterozygoten een mutant fenotype opleveren (de mutaties
complementeren niet), dan liggen de mutaties in cis (nu: ze liggen in hetzelfde
gen, bvb. 2 keer in de A-genen).
42

Een algemenere, maar redelijk vage definitie van een gen klinkt dan als
volgt: een gen is een bepaalde sequentie in het genoom die op te vatten is
als een eenheid van erfelijkheid, geassocieerd met controle regio’s,
overgeschreven regio’s, en/of andere functionele regio’s.

4.2 Fundamentele verschillen in genstructuur bij


pro-en eukaryota

 mono- versus polycistronie: bij bacteria zijn de coderende regio's van


verschillende enzymes dikwijls gegroepeerd op het chromosoom, en onder
controle van één transcriptiepromotor. Een dergelijke structuur noet men een
operon. Een operon bevat dus meerdere coderende regio's (cistronen). De
genen bij prokaryoten zijn dus polycistronisch. Dit impliceert dat de cistronen
eerst in één lange RNA molecule worden overgeschreven, die uiteindelijk
verschillende proteïnen zal coderen (zie later).

De meeste genen bij eukaryoten zijn monocistronisch, ttz. de RNA's coderen


slechts voor één proteïne.

 Exons en introns: de coderende sequenties van eukaryota zijn dikwijls


"onderbroken" door niet-coderende sequenties, de introns, waarvan de
potentiële informatie dus niet in het uiteindelijk proteïne terug te vinden is. De
betekenis van deze soms erg grote introns is nog niet duidelijk. Er zijn
bovendien mechanismen nodig om de coderende delen, de exons, terug aan
mekaar te "plakken" op RNA niveau. Dit proces heet "splicing" (splitsen,
verbinden) en is essentieel een eukaryotische aangelegeheid (zie verder).
Sommige fagen van bacteria en archaea hebben echter ook introns.

 Exon "shuffling", "skipping": De complexiteit van eukaryotische genen blijkt


verder uit het feit dat bij sommige genen verschillende exonen gebruikt worden,
bijvoorbeeld al naar gelang het celtype. Een exon kan overgeslagen worden
("skipping"), of er kan een waar knip-en plakwerk gebeuren ("shuffling"), zoals
in de assemblage van immunoglobulines tijdens de B-cel ontwikkeling.

 Gen-families: meer dan de helft van de genen bij eukaryota behoort tot een
gen-familie met twee of meer gelijkaardige genen, waarschijnlijk ontstaan door
duplicatie. Wanneer door mutaties of door retrovirus insertie dergelijke genen
non-functioneel worden spreekt men van pseudogenen. Bij veel eukaryoten
43

komen RNA "genen" voor in een tandem gerepeteerde configuratie, ttz.


kop-aan-staart. Ook histon-genen zijn tandem gerepeteerd. Een evident
voordeel van het dupliceren van genen is het kunnen opdrijven van het aantal
transcripten. Ribosomale-RNA's (de RNA moleculen aanwezig in de ribosomen,
zie later) worden gecodeerd door verzamelingen van honderden genen. Kikkers
hebben zelfs 20.000 kopijen van het 5S rRNA gen.

4.3 Repetitieve sequenties

Slechts een klein deel (~4%) van ons genoom codeert voor proteïnen. Vermits er
tot hiertoe weinig of geen functie gevonden is voor het overige DNA spreekt men
dikwijls van "niet-functioneel DNA". Prokaryota hebben veel minder niet-
functioneel DNA, waarschijnlijk omdat het repliceren ervan teveel doorweegt in de
energiebalans van een eencellig organisme.

Behalve echte genen en hun familieleden, pseudogenen en tandem-gerepeteerde


genen, bevatten eukaryotische cellen repetitief DNA. Het bestaan van dit DNA
werd ontdekt door reassociatie-experimenten.

Ter info: Experimenteel: reassociatie experimenten en C0t grafieken.

Britten en Kohne (1968) wensten de renaturatie-snelheid van de twee DNA


strengen te bepalen voor verschillende organismen. Ze isoleerden genomisch DNA,
fragmenteerden het door ultrasonicatie tot stukjes van gemiddeld 1000 bp, en
lieten het DNA na verhitting terug renatureren tot dubbelstrengig DNA.

Ze ontdekten dat eukaryotisch DNA niet uniform renatureerde, ttz. een deel
reassocieerde veel vlugger dan het overgrote deel. Dit fenomeen kon verklaard
worden door aan te nemen dat bepaalde sequenties gerepeteerd voorkwamen
in het genoom, zodat deze sequenties een veel grotere kans hadden om tijdens
de renaturatie een complementaire streng te vinden.

 Ongeveer 55 % reassocieert langzaam: "single copy" genen (4%) of "single


copy" non-functioneel DNA (introns en "spacer" DNA)
44

 Ongeveer 30 % reassocieert gemiddeld snel: matig-repetitief DNA. Recent is


gebleken dat het gaat over DNA dat mobiel is in de genomen van alle
organismen: mobiele DNA elementen (zie verder)

 Ongeveer 15% reassocieert snel: blijkt hoog repetitief DNA te zijn van korte
sequenties (5-10 baseparen)

C0t curves:

De reassociatie-kinetiek van DNA kan gevolgd worden door de fractie


dubbelstrengig DNA (% op Y-as) uit te zetten in functie van de tijd. Wanneer voor
de tijdsas ook rekening gehouden wordt met de initiële concentratie aan
enkelstrengig DNA (de C0 waarde, die kan veranderen van staal tot staal), dan
geeft een grafiek met op de X-as het product van C0t (in mol/l * sec) een sigmoïdale
curve.

Wat blijkt uit die C0t curves ?

 Hoog-repetitief satelliet DNA reassocieert zeer snel in de grootte


orde van 10-3 sec (links op de grafiek). Niet-repetitief DNA veel
trager in de orde van 10.000 sec.

 Naarmate de complexiteit van het genoom toeneemt (zie lengte


in nucleotiden bovenaan grafiek) neemt de reassociatie-snelheid
af ( rechts).
45

4.4 Hoog-repetitief DNA, satelliet-DNA, telomeren


& centromeren

Wanneer partieel geknipt totaal cellulair DNA (geen chromatine!) tot evenwicht
gecentrifugeerd wordt in een dichtheidsgradient (vb. 6M CsCl) is bij prokaryoten
slechts 1 band te zien, terwijl er bij eukaryoten ook verschillende "satelliet"-banden
zijn waar te nemen. De densiteit van DNA wordt inderdaad bepaald door het %
G+C. Al naar gelang de species zijn satellietbanden zwaarder of lichter dan de
hoofdband.

Het satelliet DNA:

 Bestaat uit hoog-repetitief DNA


 Is bij zoogdieren gelokaliseerd bij de centromeren van chromosomen (het
centrum van de X van een metafase chromosoom). Waarschijnlijk speelt dit
DNA een rol in de vorming van de kinetochoor van metafase chromosomen.
 Bij de fruitvlieg zit satelliet-DNA ook nabij de telomeren (de chromosoom
uiteindes).

FISH

Sommige hoog-repetitieve sequenties zijn ook


gelokaliseerd in andere chromosoomregio's. Een
bepaalde simpele sequentie is bijvoorbeeld hoog-
gerepeteerd in een arm van chromosooom 16 bij
de mens.
De lokalisatie van dergelijke sequenties kan aan
de hand van "fluorescent in situ hybridisation",
FISH, waarbij een stukje DNA dat typisch is voor
een familie hoog-repetitief DNA fluorescent wordt
gemerkt. Na hybrisisatie van deze "probe" kan het
resultaat bekeken worden onder een fluorescentie
microscoop.

Mini-satellieten: bepaalde sequenties komen voor in slechts een zeer kleine regio
(1-5 kb) en bestaan uit 15 -100 nucleotiden die 20-50 keer herhaald worden. Dit
heeft men mini-satellieten genoemd om ze te onder-scheiden van de 100kb lange
satellieten. Het blijkt nu dat elk individu een lichtjes verschillende samenstelling
heeft van deze satellieten. Deze verschillen kunnen relatief gemakkelijk
gedetecteerd worden (project forensische technieken!) en zijn dus het moleculair
equivalent van onze vingerafdrukken. DNA "fingerprinting" is ondertussen zeer
populair in de forensische wetenschappen, vooral sedert de opkomst van de
polymerase ketting reactie (PCR, zie verder).
46

Over de rol van hoog-repetitief DNA is nog veel onduidelijkheid. Het DNA van
bepaalde primitieve vissoorten bevat tot 80% hoog-repetitief DNA. In sommige
diersoorten worden bepaalde korte sequenties (vb. ATAACT) tientallen miljoenen
keren herhaald!

Men denkt aan een structurele- en organisatierol bij chromosomen (zie hieronder),
maar ook aan een rol in bescherming van genen tegen mutaties, of aan een
stapelplaats voor ongebruikt DNA. Sommigen zien in bepaald repetitief DNA
helemaal geen functie en noemen het "junk" DNA.

De centromeren van gist bevatten hoog-repetitief DNA die men kan indelen in 4
regio's.

Ter info:

Regio 1: bevat korte sequenties type ATAAGTCACATG AT

Regio 2: bevat een ~80 bp 90 % AT-rijke sequentie.

Regio 3: bevat geconserveerde, korte sequenties type TGATTTCCGAA

Regio 4: bevat geen geconserveerde sequenties


47

Telomeren zijn een complex van proteïnen en repetitieve DNA sequenties aan de
chromosoomuiteinden. Nu weet men dat deze structuren een belangrijke rol spelen
in de replicatie van DNA aan de chromosoomuiteindes (zie later).

De telomeer sequenties zijn gelijkaardig van soort tot soort, en zijn repetities van
T1-4 A0-1 G1-8 sequenties:

Mens: TTA GGG

Tetrahymena: TTG GGG

Arabidopsis: TTA GGG

Het aantal herhalingen is verschillend per soort, per chromosoom, en varieert met
de stadia van de celcyclus.

Het aanbouwen van telomeersequenties gebeurt door het enzyme telomerase, en


gebeurt alleen in gameten en in snel-groeiende cellen zoals stamcellen. De
telomeren in onze somatische cellen worden bij gebrek aan telomerase dus elke
celcyclus een beetje korter (zie hoofdstuk DNA replicatie). Het volledig verliezen
van telomeren leidt tot chromosoom-fusies en celdood (en de dood?)

 Kanker: een interessante ontdekking was dat de meeste kankercellen


telomerase uitdrukken. De rol van het enzyme in immortalisatie wordt nu
uiteraard intensief onderzocht. Mogelijk is de activatie eerder een gevolg van
kanker. De farmaceutische industrie zoekt alvast naar telomerase inhibitoren.

 Veroudering: er bestaat een correlatie tussen de lengte van de telomeren en


het proces van veroudering. Zoals vermeld worden de telomeren van onze
somatische cellen per deling iets korter.
Zo lijden Progerias patienten onder vroegtijdige verouderings-verschijnselen.
Telomeren van dergelijke patienten blijken inderdaad korter dan normaal.

 De overexpressie van telomerase volstaat in ieder geval om veel cellen in


vitro te immortaliseren. Zo biedt de “American type culture collection” reeds
cellijnen aan die enkel geïmmortaliseerd werden (dus eeuwig kunnen delen)
na een behandeling met telomerase cDNA.
48

4.5 Mobiel DNA ("jumping genes")

Mobiele DNA elementen bestaan uit eenheden van 100 tot enkele 1000 bp die
verspreid in ons genoom aanwezig zijn (matig repetitief). Deze sequenties
verplaatsen zich in het genoom via een proces van transpositie. Men vindt ze ook
bij prokaryoten.

Het blijken een soort van moleculaire parasieten te zijn met als enige doel hun
eigen replicatie. Francis Crick noemde ze dan ook "selfish" DNA. Mobiele elementen
blijken in 2 klassen te vallen:

 Zij die direct als DNA transposeren: transposons

 Zij die via een RNA molecule transposeren en terug naar DNA
worden gekopieerd via reverse transcriptase:
retrotransposons. Deze mobiele elementen kunnen
beschouwd worden als een soort van retrovirussen, maar dan
zonder genen voor mantelproteïnen.

4.5.1 Bacteriële insertie sequenties en transposons

De eerste mobiele elementen, werden ontdekt bij eukaryoten (zie verder), maar
de eenvoudigsten vindt men bij bacteriën. De meeste mobiele elementen bij
bacteria zijn transposons. Bij bacteria maakt men echter het onderscheid tussen
Insertie elementen en transposons ss.

 Insertie-sequenties (IS): Dit zijn +/-1 kb lange sequenties die zich


spontaan insereren midden in een gen. Transpositie is een zeldzame
gebeurtenis: éénmaal per 105-107 cellen per generatie. IS blijken naar
willekeurige plaatsen te transposeren. In E. coli werden tot hiertoe een 20-tal
Insertie sequenties gevonden.
IS bestaan uit een tweetal genen die coderen voor enzymes nodig voor het
transposeren: transposases. De genen worden geflankeerd door twee
"inverted repeats" (elk ~50bp), maar ook twee "direct repeats" (elk 5-11 bp)
waarvan de sequentie afkomstig is van de insertieplaats.
49

Het rondspringen van IS elementen binnen een bacterieel genoom (of naar een
andere bacterie via een virus of plasmide) is niet afhankelijk van replicatie van
het bacterieel chromosoom: transpositie is (meestal) non-replicatief. Het
transposase orchestreert volgende stappen:
50

1. Excisie van IS uit DNA


resulterend in "stompe"
DNA uiteinden ("blunt
ends")

2. Openmaken van de
insertieplaats via
uitstekende DNA uiteindes
("sticky ends")

3. Ligeren = opnieuw
vormen van de fosfodiester
bindingen. Alleen de 3'
uiteindes worden geligeerd.

Het opvullen van de


resterende enkelstrengige
regio's gebeurt door een
bacterieel DNA polymerase.

Dit model verklaart duidelijk


het ontstaan van de twee
korte "direct repeats".
51

 Bacteriële transposons sensus stricto. Dit zijn IS-achtige elementen die


echter groter zijn en ook andere genen dragen buiten de transposases. Een
prototype transposon, Tn9, is opgebouwd uit een antibioticum-resistentiegen
(Chloramfenicol-resistentie), geflankeerd door twee kopijen van eenzelfde IS
element. Bij transpostie wordt een korte "direct repeat" gegenereerd, net
zoals bij IS.
52

4.5.2 Ter info: Barbara McClintock en eukaryotische


transposons.
Het allereerste mobiel element werd ontdekt door Barbara McClintock (1902-1992)
in de jaren 1940. Haar experimenten op de kleur van maïskorrels werden lang
genegeerd. Later waren haar theoriën over mobiele genetische elementen
controversiëel of onbegrepen… tot er gelijkaardige fenomenen werden ontdekt bij
bacteria.

McClintock bestudeerde bij Zea mays spontane


mutaties die verantwoordelijk zijn voor de
veelkleurige maïskolven: mutante korrels zijn
meestal wit, wild-type korrels zijn paars, en
andere mutaties zorgen voor allerlei variaties in
het kleurpatroon (“gespikkeld”). Ze vond dat
verschillende genen noodzakelijk zijn om de
paarse kleur (anthocyanine) te produceren, en
dat de gespikkelde korrels het resultaat waren
van transposons, eerder dan van puntmutaties.
Ook de chromosomen van de mutanten werden
aandachtig bestudeerd.

Ze definieerde een bepaald type mutatie, "controlerende elementen" die zeer


reversibel bleek te zijn en verschillende genen kon inactiveren: in McClintock taal
"activator elementen", Ac, (nu transposons genoemd). Simpel gezegd: Ac kon
zichzelf uit het geïnactiveerde gen verwijderen en insereren op een andere plaats
in het chromosoom. Ac kon bewegen!

Ze definieerde ook een tweede type, nl. "dissociatie elementen", Ds, die
geassocieerd waren met chromosoom beschadigingen. Deze mutaties reverteerden
niet tenzij ze voorkwamen in aanwezigheid van de activator elementen. Nu weten
we dat het defecte transposons zijn die een stuk van het transposase missen.

Hoe ontstaan nu de gespikkelde korrels ? Als de cellen in een korrel een wild-type
C gen bevatten ziet de korrel paars. Een Ds in een C gen, inactiveert het gen, en
de korrel blijft ongekleurd. Tijdens de ontwikkeling van de korrel reverteren
sommige transposons echter (in aanwezigheid van een Ac transposon), zodat een
paarse plek ontstaat. Hoe vroeger dit gebeurt in de ontwikkeling van de korrel, hoe
groter de plek zal zijn.
53

Het breken van chromosomen door Ds veroorzaakt bovendien defecte expressie


van genen in de nabijheid, resulterend in de kleurvariegatie van de volledige
maïskolven. Vermits Ac en Ds verschillende genen kon inactiveren stelde ze een
proces van "transpositie" voor. In 1983 verdiende ze de Nobelprijs.

Ter info:

"Efficient chromosomal transposition of a Tc1/mariner- like transposon


Sleeping Beauty in mice" , Horie et al. (PNAS Vol. 98, No. 16, July 31, 2001).

Sleeping Beauty is een defect transposon uit vissen dat door het wegnemen van
mutaties terug geactiveerd kon worden. Het blijkt te kunnen transposeren in
cellen van vertebraten, inclusief muis en mens. Het kan gebruikt worden als
vector voor gentherapie.

4.5.3 Eukaryotische retrotransposons.

Alle tot hiertoe onderzochte eukaryoten bevatten retrotransposons. Er zijn twee


klassen:

 Virale retrotransposons
 Non-virale retrotransposons

 Virale retrotransposons. Dit zijn mobiele elementen equivalent aan


retrovirussen, maar zonder genen voor mantelproteïnen. Men vindt ze veel in
gist (zoals de Ty elementen) en de fruitvlieg (vb. copia elementen). Bij
zoogdieren komen virale retrotransposons niet zo veel voor, maar hun aantal
wordt bij de mens toch nog altijd geschat op 4% van het totale genoom! De
basistructuur van een viraal retrotransposon is als volgt:

 Geflankeerd door korte "direct repeats"


 Geflankeerd door zeer lange ( 250-600 bp) direct repeats,
typisch voor retrovirussen: de "long terminal repeats of
LTR's)
 Een coderende regio van enkele duizenden bp.
54

Zoals reeds vermeld transposeert een viraal retrotransposon via een RNA
intermediair: DNA op plaats x  RNA  DNA op plaats y.

1. De linker LTR bevat een regio die dienst doet als promotor voor het starten
van transcriptie zodat RNA gesynthetiseerd wordt. Het RNA dat ontstaat loopt
over de rechter LTR. De rechter LTR (nu in RNA) dirigeert de 3' klieving van
het RNA in de LTR (en zorgt voor een poly A- "staart", zie later). Het RNA
bevat nu geen LTR’s meer.

2. De synthese van DNA door een retrotransposon-gecodeerd reverse


transcriptase is een relatief complex proces dat dsDNA genereert waarin de
LTR's terug aanwezig zijn. Een integrase insereert het dsDNA terug op een
nieuwe plaats in het genoom.

Een interessante waarneming is dat de Ac-elementen van McClintock introns


bevatten. Moesten het retrotransposons zijn, dan zouden introns inderdaad niet
aanwezig mogen zijn, vermits ze na transcriptie uit het RNA "gespliced" worden.
Ac elementen verplaatsen zich dus via DNA sequenties, en zijn dus geen
retrotransposons.

Humane Endogene RetroVirussen (HERV)

In homo sapiens noemt men virale retrotransposons ook Humane Endogene


RetroVirussen (HERV). HERV’s coderen dus wel voor reverse transcriptase, maar
niet voor virale capsiden (via het ENV gen), tenzij uitzonderlijk, niet-infectueuze
capsiden. Onderzoekers zijn er echter in geslaagd mutaties te verwijderen en op
die manier een “fossiel” retrovirus te recreëren: phoenix. Dit ondersteunt wel de
theorie dat de HERV’s van virale oorsprong zijn, maar het experiment deed stof
opwaaien, gelet op de potentiële risico’s.
55

HERV’s worden overgeërfd (ze zijn endogeen), en zijn dus gecodeerd in de


geslachtscellen (in het Engels spreekt men van een “germline” infectie). Ze worden
verdacht van alle kwaad, van schizofrenie over multipele sclerose (HERV-W) tot
kanker.

 Non-virale retrotransposons: LINES, SINES & "processed


pseudogenes".

Dit zijn de meest voorkomende mobiele elementen bij zoogdieren. Het is ook vooral
bij zoogdieren dat men ze vindt: waarom is nog niet duidelijk. De meesten behoren
tot twee grote klassen: LINES (Long interspersed elements) en SINES (short
interspersed elements). "Processed pseudogenen" vormen een minderheid en
worden apart besproken. LINES en SINES hebben volgende eigenschappen:

 Afwezigheid van LTR's


 LINES: 6-7 kb lang
 SINES: 300 bp lang
 Duizenden kopijen
 Transpositie via een RNA intermediair (hypothese)

L1-LINES

Dit is de meest voorkomende familie bij de mens en wordt vertegenwoordigd door


een 600.000 -tal kopijen (15% van het totaal menselijk DNA). Het gaat om
sequenties van enkele duizenden bp, geflankeerd met korte "direct repeats" en
zonder LTR's:

 Korte direct repeats


 Additionele flankerende regio's ~1 kb groot met LTR-
achtige functie. De rechter regio is een AT-rijk gebied
 2 genen ("Open Reading Frames"), ~1 en ~4 kb
 ORF 1 = RNA-bindend proteïne
 ORF 2 = reverse-transcriptase
56

SINES

De meeste SINES bevatten de sequentie AGCT die herkend wordt door het
restrictie-enzyme Alu I van de bacterie Arthrobacter luteus. De benaming SINES
en Alu-sequenties wordt daarom wel door elkaar gebruikt. Sommige SINES
bevatten deze sequenties echter niet.

Alu-sequenties van 300 nucleotiden komen een miljoen keer voor in het menselijk
genoom: +/- 10 % van het totaal DNA.

Eigenschappen van SINES:

 korte sequenties +/- 300 bp


 miljoen keer herhaald
 coderen niet voor proteïnen
 worden wel getranscribeerd naar RNA
 A/T regio analoog als L1 LINES
  retro-transpositie ?
 komen vooral voor naast genen
 komen voor tussen gedupliceerde genen
 komen voor in introns
 analogiën met 7SL RNA (zit in signaal-herkennings
partikel; cursus celbiologie 3°jaar)
 sommige ziekten als gevolg van Alu insertie:
 vb. neurofibromatose (zie artikel)
 functie ?

"Processed pseudogenes"

Dit zijn op alle vlakken defecte kopijen van genen:

 het zijn pseudogenen, dus niet-functionele kopijen van een gen


 het zijn de versies zonder introns, dus zeer waarschijnlijk ontstaan door
retrotranspositie
 ze zitten vol mutaties
 ze hebben korte "direct repeats"
57

4.5.4 Mobiele elementen en evolutie

Mobiele elementen zijn verantwoordelijk voor een groot deel van de "spontane
mutaties", en hebben op deze manier meer dan waarschijnlijk de evolutie
beïnvloed. Ze kunnen zich ook insereren nabij of in regulatorische regio's en de
expressie van genen op die manier beïnvloeden. Hun grootste impact komt wellicht
uit het feit dat ze ongelijke recombinatie tussen twee onverwante genen kunnen
mediëren. Dikwijls leidt dit tot gen-duplicatie. Sommige genen uit de -globine gen-
cluster zijn waarschijnlijk onder invloed van L1-SINE recombinatie ontstaan. Ook
introns kunnen gedupliceerd geraken, en dit kan dan weer leiden tot nieuwe exon-
combinaties ("exon schuifelen", "shuffling").

Het EGF "domein" is een voorbeeld van een exon dat terug te vinden is bij
verscheidene proteïnen bvb. in de weefsel plasminogen-activator (tPA, een
factor noodzakelijk voor het oplossen van fibrineklonters), in de Neu-receptor
(een groeifactor receptor), en uiteraard in de epidermale groeifactor zelf
(EGF).

Mobiele elementen hebben dus impact op de evolutie, door duplicatie-


mechanismen en het creëren van gewijzigde controles. Kan men ze dan wel
"selfish" noemen?
58

5. DNA-replicatie

Het Watson & Crick model suggereerde hoe DNA zich zou kunnen repliceren. Maar
hoe worden die bijzonder lange moleculen slechts éénmaal per celdeling
overgeschreven en liefst zonder fouten? En wáár in een chromosoom begint dit
proces? En hoe stopt het ? En hoe geraken de nieuwe chromosomen uit elkaar
zonder in elkaar te verstrengelen als in een gordiaanse knoop?

5.1 DNA-replicatie is semi-conservatief

De twee strengen van een DNA molecule worden gekopieerd. Indien deze nieuwe
strengen alletwee een nieuwe molecule vormen is de replicatie "conservatief",
want de oude molecule blijft intact.

Uit experimenten blijkt echter dat de replicatie bij pro- en eukaryoten semi-
consercatief is, ttz. elke streng wordt eerst gekopieerd, maar elke kopij blijft bij
het origineel. De oude molecule bevat nu de helft aan nieuw materiaal: "semi-
conservatief".

Pas in de tweede generatie ontstaan dus volledig nieuwe DNA moleculen.


59

5.2 Experimenten van Meselson & Stahl (1958)

Hoe ga je experimenteel na hoe DNA repliceert ?

Meselson & Stahl groeiden E. coli's lange tijd in


aanwezigheid van ammonium met de "zware"
stikstof-isotoop 15N, zodat het bacterieel DNA na
verloop van tijd radioactief gemerkt was. Daarna
werden de bacteriën naar een 14N milieu
overgeplaatst, waarna op regelmatige
tijdstippen stalen werden genomen uit de
cultuur. DNA werd geëxtraheerd en tot
evenwicht gecentrifugeerd in de voor deze proef
nieuw ontwikkelde CsCl2 gradiënten. De positie
van het DNA in de gradiënt (sedimentatie is van
links naar rechts) werd bepaald door UV-
absorptie fotografie (bij 260 nm., zwarte strepen
links). De grafiekjes rechts zijn densitometrische
metingen van de zwarting op de foto.

"Zwaar" 15N -gemerkt DNA equilibreert op een


lagere plaats (hier rechts) in de gradient dan 14N
-gemerkt DNA (niet getoond).

De waargenomen overgang van zwaar (generatie 0) naar licht (generatie 4.1) -


met een positie ertussen - kan alleen verklaard worden met semi-conservatieve
DNA-replicatie. Bij een conservatieve replicatie verwacht men inderdaad geen
hybride positie. De laatse twee foto's zijn controles die aantonen dat de
waarneming geen artefact van centrifugatie is.

De geschiedenis van het experiment werd recent gepubliceerd in boekvorm en


kreeg de ronkende titel “Meselson, Stahl, and the replication of DNA: A history of
“the most beautiful experiment in Biology”; auteur Frederick Holmes (Yale
University press), 2001.
60

Foto’s van Stahl (l) en Meselson (r)


in recentere tijden.

In 1957 toonden Taylor, Woods &


Hughes aan dat ook bij eukaryoten
DNA-replicatie semi-conservatief is.

5.3 DNA-replicatie is bidirectioneel

In theorie zou DNA replicatie van één streng kunnen starten ergens in de DNA
molecule, en replicatie van de andere streng ergens anders (2 origines). DNA-
replicatie van beide strengen zou ook op één plaats kunnen starten en in één
richting verder lopen (1 origine, unidirectioneel), of in beide richtingen (1 origine,
bi-directioneel).

Bi-directionele replicatie (een replicatie-"bubbel"):

De experimenten van Cairns (1963) of Huberman (1968) maakten gebruik van


autoradiografie ttz. een fotografische techniek waarbij geïncorporeerde isotopen
rechtsreeks een fotografische emulsie bestralen. Wanneer actief delende cellen een
"puls" van radioactief 3H-thymidine toegediend krijgen, en wat later een "chase"
(wegjagen) met lagere concentraties, zal de radioactiviteit zich vooral concentreren
in de buurt van replicatie origines (ORI's), de minder sterke merking wat verder.
Al naar gelang uni- of birectionele incorporatie verwacht men dus in een
autoradiografie andere patronen waar te nemen.

Na extractie van DNA bleken de autoradiografieën compatibel met bidirectionele


DNA synthese uit verscheidene ORI's.
61

Aan de hand van deze techniek is het mogelijk de replicatie-snelheid te berekenen


(zie verder).

DNA-replicatie onder de elektronenmicroscoop

DNA-replicatie kan rechtstreeks gevisualiseerd worden a.h.v. elektronen


microscopie. Opnamen van DNA geëxtraheerd uit replicerend SV40-virus ("simian
virus 40 ", een papovavirus geïsoleerd uit apen) tonen de "replicatie-bubbels".
SV40 heeft een circulair dsDNA genoom. Wanneer men dit DNA knipt op een
specifieke plaats a.h.v. een restrictie-enzyme (vb. het enzyme EcoRI van E. coli)
wordt het DNA gelineariseerd. De knipplaats levert een referentiepunt, zodat de
grootte van de "bubbel" kan gecorreleerd worden met de plaats in de molecule.
62
63

5.4 Replicatie-snelheid in E. coli en mens

 Het circulaire E. coli genoom heeft ~5 miljoen baseparen en is ~1.4 mm lang.


Het duurt ongeveer 42 minuten om dit genoom te repliceren. Er is slechts 1
ORI. De replicatiesnelheid bedraagt dus: 5.000.000 / 42 x 60 ~= 2000 bp
/seconde, maar aangezien de replicatie bidirectioneel is  1000 bp/s.
Autoradiografie-experimenten bevestigen de 1000 bp/s snelheid.

 Bij humane cellen meet men slechts 100 bp/s voor één replicatievork. Het
totale genoom van de mens is 3 miljard bp en repliceert in ~8 uur. Met twee
vorken aan 100 bp/s (een 'bubbel') zou de cel op 8 uur slechts 100 x 2 x 8 x
60 x 60= ~5,7.106 bp kunnen repliceren. Men kan dus vermoeden dat het
minimum aantal bubbels (= 'replicons' = eenheden van replicatie) om dit te
bewerkstelligen in de grootte-orde is van 3.109 / 5,7.106 =~ 500 bubbels en
dus ORI's. Experimentele gegevens wijzen echter op een veel groter aantal,
10.000-100.000, maar niemand heeft ze ooit geteld.

5.5 Drie ORI's van dichterbij bekeken

De cel moet het tijdstip en de plaats waar replicatie start onder controle houden.
Aberrante replicatieprocessen kunnen bijvoorbeeld tot kanker leiden.

Het initiëren blijkt bij pro-en eukaryoten altijd op een bepaalde sequentie te
starten: de replicatie-origine (ORI). ORI's blijken AT-rijke zones te bevatten wat
het openen van de strengen bevordert.

 De E. coli ORI (oriC) is een sequentie van 240 bp. Elk circulair stuk DNA (zoals
een plasmide) dat deze ORI draagt kan onafhankelijk repliceren in E. coli. De
structuur is als volgt:

 3 gelijkaardige AT rijke sequenties van 13 bp elk (13-


mers)
 daarna 4 gelijkaardige 9-mers als koppels "inverted
repeats"

Deze sequenties zijn de bindingsplaatsen voor de


replicatie-initiatie proteïnen (zie verder).
64

 Elk van de 17 gist-chromosomen heeft multipele ORI's (~400 in totaal). Van


een 6-tal van deze autonome replicatie sequenties (ARS) werd de
sequentie bepaald. Op basis van mutationeel onderzoek bij de 180~bp lange
ARS1 werd een essentiële 12-mer gedefinieerd: "element A". Wanneer deze
sequentie vergeleken wordt met die uit andere ARS sequenties, kan volgende
'consensus' sequentie gedefinieerd worden:

5' A/TTTTATA/GTTTA/T 3'

"Element A" bevat 10 van de 11 baseparen uit de consensus. Element A


wordt herkend door ORC proteïnen (origin recognition complex).

 In SV40 blijkt een ~65 bp regio 3 essentiële sequenties te bevatten (zie


verder).
65

5.6 Het probleem van de replicatie-initiatie

In pro- en eukaryoten wordt DNA gerepliceerd door DNA-polymerases. Een aantal


eigenschappen (of gebreken?) van deze enzymes maken de zaken er echter niet
eenvouder op:

1. De DNA-polymerases zijn niet in staat DNA te openen om de replicatie te


starten.

2. Een tweede probleem stelt zich doordat de polymerases de replicatie niet


kunnen starten op een "naakte" streng: ze hebben een reeds bestaand
dubbelstrengig stuk nodig die ze dan verder kunnen polymeriseren. De reeds
bestaande streng die verder wordt gepolymeriseerd, noemt men een een
"primer".

3. Tenslotte beperken DNA-polymerases hun activiteiten tot een aangroei in de 5'


 3' richting. Deze beperking zal aanleiding geven tot allerlei goocheltoeren om
een replicatievork toch te laten groeien (zie verder).

5.7 Replicatie-initiatie in E. coli

 Het openen van de DNA strengen nabij de OriC 13-mers wordt geïnitialiseerd
door het binden van 10 à 20 kopijen van het proteïne DnaA aan de 9-mers.
Twee hexamerische DnaB-helicases (geëscorteerd door DnaC-proteïne )
openen de dubbele helix (dit verbruikt ATP), waarop de hexameren zich
vervolgens verwoed rond de enkele strengen klampen. Dit is het "pre-
priming" complex. De DnaA proteïnen kunnen slechts binden na de actie van
DNA topoisomerases (zie verder).

 Primase-enzymes binden op de helicases en synthetiseren de primers die het


polymerase nodig heeft om replicatie te starten. Deze primers zijn korte RNA
(!) moleculen die complementair zijn aan beide strengen. Het complex gevormd
door de primases en de helicases wordt het primosoom genoemd.

 Proteïnen die enkelstrengig DNA binden ("single-strand-binding", SBB)


verhinderen het opnieuw hybridiseren van de strengen.
66

5.8 Problemen in de replicatievork: Okazaki


fragmenten

Na de vorming van het primosoom kunnen de DNA polymerases beginnen te


kopiëren. In een opengaande dubbele helix kan één streng moeiteloos continu in
de 5'3' richting gekopieerd worden (bovenaan de foto), terwijl dit niet kan in de
complementaire streng. In dit laatse geval zou de polymerisatie dus 3'  5' moeten
gaan (onderaan), en dat is teveel gevraagd van DNA-polymerases.

De oplossing van dit probleem blijkt zowel bij pro- als bij eukaryoten te zijn
opgelost door een proces van discontinue replicatie, waarin telkens kleine
stukjes DNA van de 3'5' streng gerepliceerd worden in de 5' 3' richting.

De schijnbare aangroei in de onderste streng is dus in de 3'  5' richting, maar


het detailbeeld is dus inderdaad 5'  3'. De bovenste streng wordt dikwijls de
leidinggevende streng genoemd ("leading strand"), terwijl de streng onderaan in
de tekening de achterblijvende streng is ("lagging strand").
67

Zoals reeds vermeld zijn de DNA-polymerases afhankelijk van een primer, in


praktijk korte RNA moleculen van maximaal 15 nucleotiden. De discontinue
replicatie impliceert de aanvoer van telkens nieuwe RNA primers.

De RNA primers blijken covalent gebonden te zijn aan de korte DNA fragmenten:
één van de vele ontdekkingen van Arthur Kornberg. De RNA-DNA moleculen
worden Okazaki fragmenten genoemd, naar hun ontdekker Reiji Okazaki &
collega's ("Mechanism of DNA replication: possible discontinuity of DNA chain
growth." Jpn. J. Med. Sci Biol. 1967 Jun;20(3):255-60.)

Bij prokaryoten zijn deze fragmenten 1000-2000 nucleotiden lang, bij eukaryoten
slechts 100-200 nucleotiden.

In E. coli worden de Okazaki fragmenten gesynthetiseerd door DNA-polymerase


III, één van de drie DNA-polymerases in E.coli.

Wat na Okazaki ?

Het opruimen van de RNA primers, en het "opvullen van de gaten" gebeurt door
het DNA-polymerase I. Dit gebeurt in één beweging waneer het polymerase
tegelijk in de 5' 3' richting polymeriseert, en in dezelfde richting de bestaande
RNA streng depolymeriseert door zijn 5'  3' exonuclease activiteit. Pol III heeft
geen exonuclease activiteit. Het aan elkaar "lijmen" van alle DNA fragmenten wordt
uiteindelijk gekatalyseerd door het DNA-ligase.
68

5.9 Over DNA polymerases

E. coli bezit 3 DNA-polymerases: I,II, en III. De Amerikaanse


arts, wetenschapper en Nobelprijswinnaar (1959) Arthur
Kornberg (°1918) wijdde er zijn leven aan.

DNA-polymerase II is een "SOS" herstel enzyme (zie later) en


heeft geen functie in replicatie.
Hier bekijken we de twee polymerases die betrokken zijn bij
DNA-replicatie:

 DNA-polymerase I:
Behalve als "gaatjesvuller" in de replicatievork herstelt Pol I ook enkelstrengige
gaten in beschadigd DNA.

De meest merkwaardige eigenschap is dat dit enzyme ook twee exonuclease


activiteiten bezit: één in 5'  3' richting, en één in 3'  5' richting. De drie
katalytische sites (1 polymerase + 2 exonucleases) in pol I zijn fysisch gescheiden.
Pol I valt gemakkelijk van de helix en synthetiseert daardoor slechts korte stukjes
DNA (~20 bp).

 3' 5' exonuclease: het enzyme is in staat foutief gepaarde


nucleotiden te verwijderen (te hydrolyseren), en daarna te herstellen
(te polymeriseren). Een gevolg van deze exonuclease activiteiten is
een accurate DNA-replicatie: na incorporatie van een nucleotide keert
het enzyme een stap terug; als het nucleotide foutief blijkt te zijn (het
polymerase van pol I incorporeert fouten met een kans van 1 op 104
nucleotiden), wordt de "mismatch" terug verwijderd. Dit resulteert dus
in een correctie of "proof-reading" -activiteit zodat de netto
foutfrequentie van pol I een respectabele 1 op 107 nucleotiden
bedraagt.

 5'3' nuclease: dit is de "sneeuwruimer"-activiteit waarmee pol I de


RNA-primers in de replicatievork verwijdert. Deze activiteit is ook in
staat fouten te verwijderen, zoals U.V. geïnduceerde pyrimidine-
dimeren (zie later).
69

 De DNA polymerase III sneltrein

Met DNA polymerase III zet E. coli de grote middelen in.

Pol III polymeriseert het gros van het DNA in de replicatievork in de 5'3' richting.
Het enzyme katalyseert de vorming van duizenden fosfodiester bindingen voor het
van de helix valt (vgl. met pol I slechts ~20). Het werkt ook 10 x zo snel als pol I.

De pol III-locomotief bestaat dan ook uit 10 polypeptide ketens met een
gezamelijke massa van ~900 Kda! Dit holo-enzyme is een assymetrische dimeer
die rond een DNA helix past. De dimeer zorgt ervoor dat de beide strengen van het
DNA tegelijk worden gerepliceerd: één streng in de 5'3' richting ("leading"), een
andere streng met Okazaki-stukjes ("lagging"). Vandaar ook de assymetrie in het
enzyme!

Ter info:

Schematische weergave van de assymetrische pol-III dimeer. Belangrijkste


eenheden van dit holo-enzyme zijn:

1) het "core" enzyme

- -eenheden: katalytische sites


- -eenheden: 2 dimerische DNA-bindende "klemmen"
- -eenheden: 3'5' exonuclease

2) het  complex

Deze proteïnen zorgen voor het "laden en lossen" van de -klemmen op het DNA.De
-klemmen zorgen ervoor dat het holo-enzyme niet van de DNA helix valt.
70

De structuur van de -"klemmen" kent men door X-straal diffractie analyse.

De -klemmen vormen een ringvormige structuur rondom het DNA. De


reconstructie toont één dimerische -klem. In een replicatie-vork zijn er dus 2
dimerische klemmen, één voor de "leading" streng, een andere voor de "lagging"
streng.

Onderstaande figuur geeft een overzicht van het replicatie-complex:


71

5.10 DNA-replicatie bij eukaryoten

Eukaryotische DNA-replicatie werd bestudeerd op modelsystemen, zoals het SV40


DNA. Op dit moment is het mogelijk SV40 DNA in-vitro te laten repliceren wanneer
7 cellulaire- en 1 viraal proteïne aanwezig zijn. De proteïnen zijn verschillend van
die van E. coli, maar hun functies zijn dezelfde.

Ter info:

In de replicatievork zijn wel 2 DNA polymerases aan het werk.

Replicatie start wanneer het viraal-gecodeerde "T-antigen" aan de SV40-ORI bindt,


als een hexameer, en vervolgens werkt als een DNA-helicase (1). De rol van de
SBB-proteïnen bij E. coli wordt overgenomen door het cellulaire proteïne RPA
(replicatie proteïne A) dat bindt aan enkelstrengig DNA. (2) Een complex van het
DNA-polymerase-, een primase, en replicatie factor C (RFC) synthetiseert de
eerste RNA primers en de eerste "leading" DNA fragmenten in 5'3' richting (3).
72

Het DNA-polymerase-/primase complex wordt vervolgens verplaatst door de


PCNA-factor (prolifererende cel nucleaire antigen), zodat polymerisatie even stilvalt
(4). Nu kan het DNA-polymerase- binden aan de 3' eindes en de polymerisatie van
de "leading" strengen in pol-III stijl verderzetten (5). De PCNA-factoren vormen
trimeren rond het DNA, en hebben dus functioneel veel weg van de -klemmen bij
E. coli.

Naarmate de vork verder open gaat komt de "lagging"-streng synthese nu ook op


gang door binding van een nieuw Pol-/primase/RFC complex (5, idem als in (3)),
met het ontstaan van Okazaki-fragmenten als gevolg.
73

5.11 Het probleem van de replicatie van telomeren

In tegenstelling tot de circulaire genomen van bacteriën of veel virussen, zijn de


chromosomen van eukaryoten lineair, en hebben -gespecialiseerde- uiteinden: de
telomeren (zie eerder). Wanneer een replicatie-vork aan een telomeer uiteinde
komt, stelt zich een probleem: de "leading"-streng kan gerepliceerd worden tot het
einde, maar voor de replicatie van het laatste fragment (nl. de vervanging van de
RNA primer door DNA) is er geen plaats om een primer te hybridiseren. Zonder
speciaal mechanisme zou het chromosoom elke replicatie dus een RNA-primer-
lengte korter worden.

Het blijkt nu dat eukaryotische cellen een telomerase bezitten dat de extra primer
levert, en dat het laatste DNA fragment synthetiseert.

Het telomerase is een bijzonder merkwaardig enzyme dat geassocieerd is met een
stukje RNA. Vermits het enzyme op basis van dit RNA een complementaire DNA-
streng zal synthetiseren is het telomerase een RNA-afhankelijk DNA-
polymerase = een reverse-transcriptase!

Het RNA van het telomerase neemt gedeeltelijk de plaats in van de laatste RNA-
primer, waarna het telomerase complementair DNA kan synthetiseren. De
sequentie van dit DNA is dus telomerase-specifiek en verandert van soort tot soort.

Door een bizar 'slip' mechanisme van het DNA (het plooit namelijk terug op zichzelf
met non-Watson-Crick base-paring), kan het telomerase een additionele DNA-
streng maken op basis van zijn eigen RNA "template" (een template = een "mal"
is een DNA of RNA streng waarop een complementaire streng zal gesynthetiseerd
worden).

Dit proces wordt herhaald zodat gerepeteerde enkelstrengige DNA-sequenties


ontstaan die uiteindelijk de primers zullen binden voor de synthese van de "lagging"
streng.

Zoals reeds vermeld repliceren de meeste somatische cellen in afwezigheid van


telomerase, zodat de telomerische repeats per celcyclus korter worden.

Het korter worden van deze telomeren heeft men in verband gebracht met celdood,
en er zijn zelfs hypothesen waarin onze levensverwachting bepaald wordt door het
aantal telomeer-repeats bij de geboorte. Zoals reeds eerder vermeld bestaat er
inderdaad een correlatie tussen leeftijd en telomeer lengte.
74
75

5.12 DNA replicatie en toposiomerases

Vooraleer de werking van topoisomerases kan uitgelegd worden is het nodig de


begrippen negatieve en positieve supercoiling uit te leggen.

Supercoiling: als bij de replicatie een DNA-helix lokaal wordt geopend door
helicases, zullen de overige helicale gebieden een zekere extra 'spanning'
ondergaan, tenminste als de DNA uiteinden zich niet kunnen draaien om de
spanning op te vangen. Dit gebeurt uiteraard in circulaire DNA-moleculen, waarin
de extra spanning zal resulteren in een kortere winding van de helix. De spanning
wordt m.a.w. weggewerkt doordat de helix om zichzelf wikkelt: "supercoiling".

Circulaire DNA moleculen zoals plasmides of viraal DNA zijn "supercoiled" (denk
aan een opgerold elastiekje of telefoondraad) wanneer ze door de isolatieprocedure
gescheiden worden van hun DNA-bindende proteïnen (foto boven). Indien een
fosfodiester-binding in één van de strengen verbroken wordt kan de molecule
ontspannen en ontstaat een gerelaxeerde vorm (nog steeds circulair, boven
rechts).

Ook in eukaryotische chromosomen komen supercoils voor: de chromosomen zijn


namelijk op verscheidene plaatsen, en zeker aan de telomeren, aan de "scaffold"
verbonden.

Negatieve versus positieve supercoil: DNA heeft een positieve supercoil als de
extra windingen in dezelfde zin gaan als de helix zelf, dus rechtsdraaiend. Hierdoor
“overwikkelt”de DNA helix zich en ontstaat een positieve supercoil ("overwound").
Omgekeerd "ont-wikkelt" de helix zich ("unwound" DNA). Negatieve supercoiling
vergemakkelijkt het scheiden van DNA -strengen tijdens replicatie, recombinatie
en transcriptie.
76

In vivo wordt de mate van supercoiling bepaald door enzymes: de


topoisomerasen.

Deze enzymen kunnen supercoiling herkennen en door klievingen de mate van


supercoiling bepalen.

 Klasse I topoisomerases klieven één DNA-streng, waarna ze de


streng terug sluiten.

 Klasse II topoisomerases kunnen beide DNA-strengen klieven, en


zijn in staat gekruiste DNA strengen van plaats te verwisselen.

Klasse I topoisomerasen:

Een enzyme zoals het E.coli topoisomerase I kan negatieve supercoils verwijderen
zonder een knip in de helix achter te laten. Dit gebeurt via een merkwaardig
tussenstadium waarbij een door topo I geknipte DNA-streng tijdelijk via een fosfo-
ester binding aan een tyrosine-residu van het enzyme gekoppeld wordt. De
geknipte streng wordt vervolgens hersteld onder de ongeknipte streng: het netto
resultaat is één negatieve supercoil minder.

Het E. coli topo I werkt enkel op negatieve supercoils. Topo I-enzymes bij
eukaryoten verwijderen zowel negatieve als positieve supercoils. Het verwijderen
van negatieve supercoils is energetisch voordelig; de reacties verlopen zonder
toevoeging van energie.

Men vermoed dat topo I enzymes een rol spelen in transcriptie, DNA-herstel, en
dat ze negatieve supercoils verwijderen die ontstaan door de actie van DNA -
gyrase, een topo II enzyme (zie verder).
77

Ter info:

Effect van E. coli topo-I op DNA, in vitro:

In dit experiment werd DNA uit SV40 virionen


geïsoleerd en op een agarose-gel geplaatst.

Laan 1: onbehandeld SV40 DNA bevat maximaal


supercoiled DNA dat compact is en daarom vlug
migreert in de gel (band onderaan). Door de
isolatieprocedure worden enkelstrengige knippingen
geïntroduceerd in het DNA zodat de supercoil
verdwijnt: er ontstaan volledig gerelaxeerde
cirkelvormige DNA moleculen (band bovenaan).
Moest een student de isolatie doen zouden er zelfs
dubbelstrengige knippingen ontstaan zodat een
derde band van gelineariseerde moleculen zou te
zien zijn.

Laan 2: incubatie van het DNA met E. coli topo I (3


min.)

Laan 3: incubatie met E. coli topo I (30 min.)

Klasse II topoisomerases:

Het eerste topo II enzyme dat ontdekt werd is het E. coli DNA gyrase. Dit enzyme
kan beide strengen klieven, in aanwezigheid van ATP.

Topo II enzymes kunnen een positieve supercoil wijzigen in een negatieve, of het
aantal negatieve supercoils vermeerderen met een factor 2.

Topo II enzymes kunnen ook cirkelvormige molecules in elkaar haken (cateneren)


of uit elkaar halen (decateneren).
78

DNA gyrase maakt negatieve supercoils nabij en in de oriC. Dna A kan replicatie
slechts initiëren indien het template negatief gesupercoiled is.

Bij E.coli is de mate van supercoiling dus bepaald door de tegenovergestelde acties
van de twee enzymes DNA gyrase en topo I.

DNA gyrase is het doelwit van verschillende antibiotica die dit enzyme veel meer
inhiberen dan onze eukaryotische topo II homoloog. Novobiocine blokkeert binding
van ATP aan het gyrase, nalidixinezuur en ciprofloxacine interfereren bij het
breken/vormen van de DNA strengen.
79

Replicatie van circulaire DNA moleculen

De ontwikkeling van de duplex tijdens de DNA replicatie (negatieve supercoiling)


resulteert bij circulaire moleculen in over-wikkeling of positieve supercoiling van de
duplex vóór de replicatievork.

DNA gyrase of eukaryotische topo I of II enzymes relaxeren deze situatie zodat de


DNA-replicatie kan doorgaan tot op het einde.

Replicatie eindigt vervolgens doordat de catenanen van elkaar gescheiden worden.

De scheiding van zuster-chromatiden in de metafase-chromosomen van


eukaryoten is waarschijnlijk ook afhankelijk van topo II enzymes.
80

6. Transcriptie

6.1 RNA polymerases

Het overschrijven van DNA naar RNA noemt men transcriptie. Het is het proces dat
alle organismen op deze planeet gebruiken om bepaalde genen uit hun DNA-
bibliotheek te kopiëren naar kleinere RNA moleculen, zodat ze het gen tot expressie
= tot uitdrukking brengen. Prokaryoten doen dit met één enkel type RNA-
polymerase, terwijl eukaryoten drie soorten RNA polymerases bezitten:

Eukaryotische RNA polymerases:

 RNA pol-I: voor transcriptie van ribosomale RNA’s (rRNA)


 RNA pol-II: voor transcriptie van mRNA en “small nuclear”, snRNA (zie
verder)
 RNA pol-III: voor transcriptie van tRNA en 5S-rRNA

Er zijn een aantal serieuze verschillen met DNA synthese:

 De cellen gebruiken slechts één DNA streng als template


 RNA synthese heeft geen primer nodig
 RNA polymerases gebruiken uracil (U) i.p.v. thymidine (T)
 RNA polymerases bezitten geen foutcorrectie

Het overgeschreven RNA is meestal enkelstrengig, maar dit moet enigszins worden
gerelativeerd: veel RNA moleculen bezitten sequenties die complementair zijn met
andere sequenties in dezelfde molecule, zodat het RNA ”op zichzelf” terugplooit in
dubbelstrengige regio’s. Sommige RNA virussen zoals Influenza of HIV bezitten
bovendien rasecht dubbelstrengig RNA.

Zowel bij pro- als bij eukaryoten kan men het transcriptieproces onderverdelen in
een initiatiefase, een elongatiefase, en een terminatiefase.

Het begin van een transcriptie-eenheid wordt aangegeven door een


transcriptiepromotor ttz. een relatief korte DNA-sequentie die herkend wordt door
het RNA-polymerase (bij prokaryoten) of door transcriptiefactoren (bij
eukaryoten). Transcriptie-initiatie bij eukaryoten is echter redelijk omslachtig (zie
verder), hetgeen meer dan waarschijnlijk het gevolg is van meercelligheid. Het tot
uitdrukking brengen van de juiste genen op het goede moment, in de juiste
hoeveelheden, en in het juiste weefsel vergt inderdaad een goede controle op de
initiatie van het proces.
81

6.2 Transcriptie bij E. coli

6.2.1 Initiatie
Het RNA polymerase van E. coli bestaat uit meerdere polypeptiden:

Subeenheid Aantal Massa Rol

 2 37 ?

 1 151 Fosfodiëster
bruggen

’ 1 155 Bindt DNA

 1 50 Binding aan
Promotor

De -eenheid herkent de promotorsequenties die altijd gesitueerd zijn aan de 5’


kant (“upstream”) van het gen. Op positie –10 van de transcriptiestart vinden we
meestal een TATA-achtige sequentie: de “Pribnow” box, waarvan de
consensussequentie gesteld werd op 5’ TATAAT 3’

De Pribnow of TATA-box is genoemd naar David Pribnow (vb.


“Bacteriophage T7 early promoters: nucleotide sequences of two RNA
polymerase binding sites”. J Mol Biol 1975 Dec 15;99(3):419-43).

Nog iets verder, op positie –35 van de transcriptiestart kan men nog een regelmatig
weerkerende sequentie definiëren, met consensus TTGACA.
82

De onderstaande tabel toont enkele sterke promotoren uit E. coli en zijn fagen ,
T7 en fd (a) en de eruit afgeleide “consensus” sequentie (b). De transcriptie zal dus
effectief starten op positie 1, en evolueren in de 5’  3’ richting (dus naar rechts).

6.2.2 Elongatie

Na binding van het RNA polymerase ontstaat er een lokale ontwikkeling van de
DNA helix, en wordt de 3’-5’ DNA streng gebruikt als template om er RNA op te
kopiëren in de 5’3’ richting.

Het RNA polymerase van E. coli synthetiseert vervolgens aan 50 nt/sec, en van 5’
 3’, een enkelstrengige RNA molecule (het transcript) die complementair is aan
de DNA template streng. De RNA streng omschrijft men dikwijls als de + streng
of “sense” streng, en de DNA template streng noemt men dan ook de - streng of
antisense streng. Artificieel antisense RNA hybridiseert uiteraard met de sense
RNA streng, en neutraliseert zo de genexpressie. Antisense technologie is wellicht
toepasbaar in de kliniek.
83

Tijdens de elongatie
worden
complementaire
nucleotiden (vb.
pppG) gepoly-
meriseerd tot een
nieuwe RNA streng.
Na vorming van de
fosfodiester binding
ontstaat
pyrofosfaat (PPi)
dat geklieft wordt
door een
pyrofosfatase.

De -eenheid (nu
technisch werkloos)
blijft geassocieerd
met het enzyme.

Er onstaat een zone


van ~17 baseparen
in het die DNA ont-
wikkeld is. Binnen
deze zone is een
DNA-RNA
Heteroduplexgebied aanwezig van ~12 baseparen.

Zoals vermeld hebben RNA polymerases geen “proofreading” of


correctiecapaciteit zoals de DNA polymerases. Maar dit is geen ramp: RNA
moleculen hebben slechts een korte levensduur, worden in grote hoeveelheden
aangemaakt, en moeten niet gebruikt worden om er een volgende generatie
organismen mee op te kweken. De ramp situeert zich alleen bij de RNA virussen
die er á volonté mutaties door accumuleren.
84

6.2.3 Terminatie

Een RNA polymerase doen stoppen is een verhaal op zich. Terminatie kan met
behulp van een zgn. rho-factor, maar hoe die werkt is nog niet geheel duidelijk.
Anderzijds zijn er bepaalde RNA sequenties die als stopsignaal fungeren, in een
rho-onafhankelijke manier. Deze sequenties zijn korte palindromen
(spiegelsymmetrische sequenties) die stam-lus (“stem-loop”) configuraties
kunnen aannemen. Het voorbeeld toont een terminator palindroom in het Trp
operon van E. coli.
85

6.3 Transcriptie bij eukaryoten

6.3.1 Transcriptie-initiatie bij eukaryoten


Het voornaamste verschil met prokaryotische initiatie is dat de drie eukaryotische
RNA-polymerases de promotorsequenties niet zelfstandig kunnen herkennen. Deze
functie is weggelegd voor het TATA-box bindend proteïne (TBP) en zijn
geassocieerde TAF factoren, en tesamen met een grote collectie weefsel-specifieke
en gereguleerde transcriptiefactoren die “upstream” aan de transcriptiestart en in
de promotor-proximale regio (positie -100 tot +/- -200) binden (bij gist noemt men
de proximale regio een upstream activating sequence). De eukaryotische
promotoren zijn bijgevolg complexer dan hun prokaryotische tegenhanger.

In zijn eenvoudigste vorm wordt de


transcriptie-initiatie bij eukaryoten
gedicteerd door het TATA-box
bindend proteïne, RNA pol-II, de
algemene transcriptiefactoren zoals
TF-II A, B, E, F, en H, al dan niet
bijgestaan door andere proteïnen:
zie schema.

Na de vorming van een pol-II


preinitiatiecomplex vormt zich een
transcriptie-initiatiecomplex dat na
hydrolyse van ATP de strengen van
de DNA helix doet “smelten”. Pol-II
begint RNA te synthetiseren, het
carboxy-terminale domein (CTD) van
pol-II wordt gefosforyleerd, en dit
signaleert de dissociatie van de
transcriptiefactoren. Nu kan de
elongatie beginnen.

In vivo is de initiatie nog een pak


complexer.
86

6.3.2 Transcriptiefactoren

Eukaryotische transcriptiefactoren bezitten typisch een DNA-bindend gebied, en


één of meerdere activator domeinen (“AD”) . Beide domeinen zijn fysisch
gescheiden door flexibele peptiden (dit heeft men kunnen exploiteren in de techniek
van “two-hybrid” detectie van proteïne-proteïne interacties (zie verder)).

Transcriptie-initiatie wordt echter ook positief of negatief gemoduleerd.

Activatorproteïnen binden aan verder gelegen enhancer sequenties, en bepalen


daarmee welke genen aangezet worden, alsook hun transcriptie-efficientie.

Enhancers zijn dikwijls weefselspecifieke sequenties van 50-200 baseparen


die tienduizenden bp upstream of downstream verwijderd zijn van de
promotor-proximale regio. Er zijn zelfs enhancers bekend die gesitueerd zijn
in introns (zie verder).

Omgekeerd binden repressor proteïnen dan weer aan silencers die interfereren
met de activatorproteïnen en die daardoor transcriptie vertragen.

Bepaalde “adaptermoleculen", de activatorproteïnen (AP’s) coördineren


signalen van activator en repressor proteïnen, en sturen deze informatie
door naar zgn. “basale factoren” die helpen het RNA polymerase te
positioneren aan de start van de coderende regio van het over te schrijven
gen.
87

Het schema onder toont een “enhancesome” van de -interferon enhancer:


verschillende transcriptiefactoren (c-jun, ATF, p50,…) associëren zich rondom de
enhancersequenties (bepaald door footprinting), en induceren een bocht in het
DNA. De TF’s binden coöperatief aan elkaar in de aanwezigheid van het kleine
HMGI, een chromatine-geassocieerd proteïne (HMG komt van “high mobility
group”, vanwege de snelle migratie in polyacrylamidegels).

Het effect van de DNA bocht wordt geïllustreerd in volgend schema van een
geactiveerd transcriptiecomplex van de TTR promotor in levercellen:
88

De activatoren C/EBP, HNF4 (hepatocyte nuclear factor) en de omnipresente AP1


factor komen ook voor in andere celtypes, maar alleen in levercellen wordt de hele
set uitgedrukt. Het transthyretine (TTR) gen zal dus alleen in levercellen tot
expressie komen. Merk op hoe de verschillende Activatie Domeinen (AD) van de
TF’s contact maken met het transcriptie-initiatiecomplex.

Ter info: het transthyretine gen wordt uitgedrukt in levercellen en in de


cellen van de choroid plexus die een actieve rol speelt in de bloed-hersen
barriere. Het TTR gen codeert voor een thyroid hormoon-bindend proteïne
dat o.a. thyroxine transporteert vanuit het bloed naar de hersenen.

De volledige eukaryotische promotor en geassocieerde regio’s kan dus als volgt


geschematiseerd worden: (merk op dat de gistpromotor (a) een pak simpeler is,
meer dan waarschijnlijk ten gevolge van eencelligheid).
89

6.3.3 Elongatie en de CAP structuur

Elongatie bij eukaryota verloopt essentieel op dezelfde wijze als bij prokaryoten.

Een belangrijk verschil met prokaryoten is


echter een modificatie van het 5’ uiteinde
van het RNA. Als het RNA ongeveer 30
nucleotiden lang is, wordt in een serie van
drie transferasestappen de eerste 5’
nucleotide van het RNA bekroond met een 7-
methyl-guanosine “CAP” (zie schema links).
Dit levert een bijzonder merkwaardige
trifosfaat binding op, bovendien gesitueerd
in een 5’  5’ koppeling tussen de twee
eerste suikers.

Het 7-methyl guanosine “kapje” speelt een


belangrijke rol in de stabilisatie van het RNA
en in de translatie (zie verder) voor de
herkenning door ribosomen.
90

6.3.4 Transcriptieterminatie en polyadenylatie

Transcriptieterminatie bij eukaryota schijnt afhankelijk te zijn van de RNA


polymerase klasse.

Pol-I: een DNA bindend proteïne herkend (samen met pol-I) een stopsignaal

Pol-II: terminatie is gekoppeld aan de additie van een poly-A staart

Pol-III: stopt na polymerisatie van een serie U residu’s (stem-loop niet nodig)

Wanneer het RNA polymerase II een zgn. “poly-A additie” sequentie synthetiseert
(consensus AAUAAA) stopt de elongatie enige tijd nadien nabij een serie
“terminatiesites”. Het RNA wordt nu 10-35 nt downstream van de poly-A additie
sequentie gekliefd door een endonuclease. Op dit nieuwe 3’ uiteinde worden
vervolgens een 100 à 200 adenine residu’s gesynthetiseerd (zie schema).

Deze 3’ poly-A staart komt voor op álle mRNA’s behalve op mRNA dat codeert voor
histonen. Een RNA molecule met een poly-A staart kan men dus bestempelen als
een boodschapper RNA, die echter nog modificaties kan ondergaan (zoals splicing,
zie verder). De poly-A staart is dus een gemakkelijke herkenning van mRNA, en
vormt tevens een aangename manier om mRNA’s op te zuiveren, nl. a.h.v. oligo-
dT kolommen (tenminste bij eukaryoten!).

De poly-A staart speelt een rol in de transit van het mRNA van de kern naar het
cytoplasma.
91

Pol-II transcriptieterminatie is gekoppeld aan polyadenylatie:

CPSF: “cleavage & poly-A specificity factor”

PAP: poly-A polymerase

PAB: poly-A binding protein


92

6.4 Posttranscriptionele modificaties bij


eukaryota, RNA splicing

 Introns ("intervening" sequences) zijn sequenties die aanwezig zijn in het


genomisch DNA, maar die niet terug te vinden zijn in het mRNA of proteïnen.
Introns zijn dus niet coderend.

 Exons (“expressed” sequences) zijn de sequenties die wél terug te vinden in


mRNA (of rRNA of tRNA). Het zijn de sequenties die uiteindelijk in
polypeptiden zullen vertaald worden

Het cellulair proces waarbij de introns uit een RNA molecule weggeknipt worden
noemt men “splicing” (in het Engels betekent dit zowel “splitsen” als “terug aan
elkaar voegen”). Splicing gebeurt dus op RNA niveau (bij pol-II transcripts ná
polyadenylatie), en in de celkern. Het eindresultaat is een “mature” RNA molecule.
Het waarom van introns is nog onbekend.
93

Introns worden na transcriptie als RNA uit het transcript wegge"spliced", hetzij
autokatalytisch (groep I en II) , hetzij door splice-o-somen (groep III) bij mRNA’s.
tRNA’s worden gespliced door endonucleasen en ligasen.

De ontdekking dat losgekomen introns een typische “lariaat” of lasso structuur


vertonen onder de electronenmicroscoop (ttz. een cirkel met een staartje eraan),
leidde tot de bevinding dat introns zich uit het RNA splicen door twee sequentiële
trans-esterificatiereacties:

In een eerste trans-esterificatiereactie


wordt de ester binding tussen 5’ intron
en exon1 uitgewisseld tegen een
esterbinding met de A van het
“vertakkings” punt. De lasso hangt nu
aan exon 2.

In een tweede transesterificatie wordt


de esterbinding tussen 3’ intron en
exon2 uitgewisseld met een
esterbinding van de 3’ zuurstof van
exon 1. De lasso komt los, en tegelijk
hangt exon 1 vast aan exon 2.

Groep I en II introns:

Zoals reeds vermeld gebeuren deze trans-esterificatiereacties autokatalytisch bij


groep I introns van rRNA genen bij protozoa. Het enige verschil met het schema is
dat deze introns een guanine nucleoside met een vrije OH groep vereisen i.p.v. het
adenineresidu uit het schema. Bij de protozoa zijn echter opmerkelijke
uitzonderingen: bij Trypanosoma en Euglena worden prefab RNA’s aan elkaar
geligeerd in een proces dat bekend staat als “trans-splicing”).
94

De groep II introns in mitochondria en chloroplasten doen aan self-splicing exact


volgens bovenstaand schema. Het proces wordt wel versneld door maturases.

Groep III introns:

De proteïne-coderende mRNA’s bij eukaryoten worden in de celkern gespliced door


gelijkaardige trans-esterificaties, maar deze reacties worden versneld door
enzymen. Meer dan honderd proteïnen nemen deel aan splicing van groep III
introns. De katalyserende eenheden zijn “spliceosomen” die bestaan uit
groeperingen van “small nuclear” snRNA’s, slechts een honder-tal nucleotiden klein
(U1,U2,U4,U5,en U6), en een 10-tal proteïnen gecomplexeerd in RNA+proteïne
partikels, de “snRNP’s” (small nuclear ribonucleoprotein particles, ook “snurps”
genoemd).

De assemblage van precursor mRNA + snRNP’s noemt men een spliceosoom: de


afmetingen ervan zijn te vergelijken met ribosomen (zie verder).

Ter info:

Tijdens de splicing van groep III introns nemen de snRNP’s positie in (onderstaand
schema): het U1 snRNA bezit een complementaire sequentie met de 5’ exon-intron
grens, zodat U1 specifiek bindt. Het U2 snRNA hybridiseert met een sequentie die
complementair is aan een UACUAAC sequentie downstream van de pyrimidine-rijke
regio (Py), maar zonder het vertakkingspunt A erbij. Het adenineresidu in kwestie
wordt op die manier “afgezonderd” en staat klaar voor de transesterificatie-reactie.
U2 induceert bovendien een bocht in het RNA (niet getoond in dit schema) zodat
exon 1 en exon 2 naast elkaar komen te liggen, klaar voor de splicingreacties. De
andere snRNP’s (U4, U5 en U6) hoeven nu maar sequentieel op het complex te
binden en de splicing te assisteren.
95

Samengevat kan men stellen dat groep I, II en, III introns zeer analoge
transesterificatiereacties gebruiken om zichzelf weg te splicen:
96

7. Translatie
In tegenstelling tot transcriptie is translatie – de vertaling van RNA in proteïnen-
een proces dat zich bij eukaryoten afspeelt in de cytosol. Maar ook dit "dogma" zal
misschien sneuvelen, vermits sommige onderzoekers recent beweren dat ~15%
van de translatie in de celkern zou gebeuren.

7.1 De drie functies van RNA tijdens translatie

 Het boodschapper-RNA is de kopij van een gen en speelt dus uiteraard een
centrale rol in de vertaling van informatie opgeslagen in nucleïnezuren naar
proteïnen.

 Transfer-RNA (tRNA) is in feite de sleutel tot de ontcijfering van de genetische


code: elk type aminozuur wordt inderdaad gedragen door bepaald type tRNA.
De tRNA's paren met 3 complementaire bases op de boodschapper-RNA, en
lezen op die manier een "3-letter" genetische code. Bepaalde RNA tripletten
zullen dus vertaald worden in bepaalde aminozuren.

 Ribosomale RNA's associeren zich met bepaalde proteïnen en vormen zo de


ribosomen. Ribosomen zijn complexe structuren die de uiteindelijke vertaling
van RNA-tripletten naar aminozuur-sequenties orchestreren. Men zou de
ribosomen kunnen vergelijken met bewegende videokoppen die de informatie
van de RNA "tape's" omzetten naar een proteïne "beeld".
97

De drie functies van RNA tijdens translatie:

Alle organismen op deze planeet gebruiken het samenspel van deze drie types RNA
om hun genetische informatie te "gebruiken" door vertaling naar proteïnen. Om het
romantisch uit te drukken: de ontwikkeling van de drie RNA functies is
waarschijnlijk de moleculaire sleutel tot de oorsprong van het aardse leven…

7.2 De genetische code

Er bestaan veel theoretische mogelijkheden om met de DNA of RNA bases iets te


coderen, maar de natuur is blijkbaar geëvolueerd naar een triplet code waarin drie
bases (een codon) één aminozuur definiëren.

Vb. AUG  Methionine

Met 4 verschillende bases in triplet codons kan je dan 43 = 64 verschillende


aminozuren coderen. Een genetische code met codons van twee bases zou slechts
voor 42 = 16 aminozuren kunnen coderen: te weinig voor het fenomeen leven?
98

Drie van de 64 codons worden in praktijk gebruikt als stop-code die het einde van
translatie signaleert:

UAA, UAG, UGA betekenen allemaal stop

De overige 61 codons coderen 20 aminozuren. De plaats waar translatie start is


altijd een codon voor methionine (zie verder). Bijna alle aminozuren worden dus
gecodeerd door meerdere codons. Alleen methionine en tryptofaan hebben een
uniek codon. Leucine, arginine en serine spannen de kroon met elk zes codons
(zgn. "synonieme" codons).
99

De ontcijfering van de genetische code was een belangrijke mijlpaal in de jaren


1960. Bekende vorsers waren Watson, Crick, Korana, Leder, en Nirenberg.

Enkele kleine variaties op de "universele" genetische code werden teruggevonden


bij mitochondria, sommige bacteriën en sommige eencelligen. Het gaat hier vooral
om herinterpretaties van een stopcode. In sommige gevallen wordt een leucine-
codon (CUG) of een valine-codon (GUG) geherinterpreteerd naar een methionine.

Codon Universele code Afwijking voorkomen

UCA Stop Trp Mycoplasma

Spiroplasma

Veel mitochondria

CUG Leu Thr Mitochondria in gist

UAA, UAG Stop Gln Tetrahymena

Paramecium

Acetabularia (een alg)

UGA Stop Cys Euplotes


100

7.3 De rol van tRNA

Elke transfer-RNA molecule moet specifiek "gekoppeld" worden aan twee


elementen:

 aan de complementaire bases van het boodschapper-RNA


Dit veronderstelt een nauwkeurige associatie van het boodschapper codon
met het tRNA anticodon. Hier spelen ribosomen een cruciale rol.

 aan een specifiek aminozuur


Dit veronderstelt dat slechts één type aminozuur mag gekoppeld worden aan
een tRNA met een bepaald anticodon. Dit is een nauwkeurig werkje voor
aminoacyl-tRNA-synthetases.

Schema: een amino-acyl tRNA synthase herkent een correct tRNA en koppelt er
een correct aminozuur aan vast (hier phe). Dit levert een amino-acyl-tRNA op.
Een tweede herkenningsstap is de codon-anticodon paring.
101

Hoe werkt deze fijnmechaniek?

Het blijkt dat de speciale "klaverblad"-structuur


van het tRNA (tenminste als alles wordt
platgedrukt in een vlak) de functie ervan
bepaalt. Alle tRNA's zijn slechts 70-80
nucleotiden klein. Ze hebben drie
"klaverblaadjes" bestaande uit korte
dubbelstrengige RNA regio's van een 4-tal
baseparen en kleine enkelstrengige lussen van
een 8-tal nucleotiden.

Het fameuze anticodon zit in de zgn. anticodon-


lus (onderaan de tekening). Het codon zélf is
uiteraard een sequentie in het boodschapper-
RNA.

De dubbelstrengige regio zonder lus (bovenaan


de tekening) is de "acceptor" stam waar het
aminozuur covalent aan verbonden is. Het
cruciale 3' einde bevat steeds de sequentie CCA. Zoals reeds vermeld wordt deze
sequentie pas ná de transcriptie aan het tRNA toegevoegd.

In elke tRNA molecule worden ook bizarre modificaties van bases aangetroffen:
dihydro-uridine (D), inosine (I), thymine (T), en pseudouridine (). Een aantal
bases worden gemethyleerd (m). Al deze gemodifieerde bases zitten duidelijk op
strategische plaatsen in het tRNA (oranje bollen, zie hierboven), en zijn
waarschijnlijk referentiepunten voor de amino-acyl-tRNA-synthetases.

In een realistischere 3D-reconstructie ziet een tRNA molecule er al minder


klaverblad-achtig uit:
102

Identiteit:

De aminoacyl-tRNA-synthetases moeten dus een bepaald tRNA kunnnen


herkennen. Een belangrijke factor in de identiteit van tRNA's blijkt niet onverwacht
het anticodon te zijn, en / of sequenties op de acceptor-arm. Zo is er het eenvoudig
geval van tRNAAla waarin een GU basepaar op een bepaalde positie in de acceptor-
arm noodzakelijk en voldoende is voor de herkenning van dit tRNA door een
specifiek amino-acyl-tRNA-synthetase.

Aminoacylatie:

De aminoacyl-tRNA-synthetases herkennen dus zowel een aminozuur als een tRNA


molecule. De koppeling van deze twee is een 2-staps proces dat ATP verbruikt.

 In een eerste stap wordt het aminozuur gefosforyleerd ("opgeladen"). Hierbij


ontstaat AMP + pyrofosfaat dat door een pyrofosfatase omgezet wordt tot
anorganisch fosfaat: het reactie-evenwicht verschuift.

 In een tweede stap wordt het gefosforyleerde aminozuur gekoppeld aan de


suikergroep behorend bij de adenosine in de CCA sequentie van het tRNA.
Het blijkt dat ~de helft van de synthetases het aminozuur koppelen aan de 2'
OH groep (klasse 1 synthetases), de andere helft verkiest de 3' OH groep
(klasse 2 synthetases).
103

Aminoacylatie van tRNA:

Niettegenstaande de amino-acyl-tRNA-synthetases hun tRNA's goed herkennen,


maken ze soms fouten bij de koppeling van aminozuren. Deze fouten blijken echter
door de enzymes zelf gecorrigeerd te worden door deacylatie. Het afleveren van
het correcte aminozuur bij het juiste codon is inderdaad van cruciaal belang.

7.4 Wobble

In principe moeten er 61 verschillende tRNA's bestaan die de verschillende codons


herkennen, en die 20 soorten aminozuren dragen.

Wat blijkt? Bij bacteria zijn er slechts een 40-tal, en bij dieren en planten wel 100
verschillende tRNA types. Veel aminozuren hebben hoe dan ook meer dan één tRNA
drager.

De situatie bij bacteria laat echter veronderstellen dat sommige tRNA's meer dan
één codon moeten herkennen (slechts 40 tRNA's voor 61 codons). Maar hoe kan
één tRNA molecule, met één anticodon, verschillende codons herkennen?
104

Het antwoord blijkt te liggen bij de paring


van de 3° base in het codon, met de eerste
base van het anticodon (de "wobble-
posities"). Het blijkt dat de eisen van
deze paring helemaal niet zo strikt zijn,
zodat non-Watson-Crick baseparing is
toegelaten (Engels "wobble" =
"waggelen","wiebelen", "twijfelen").

Het gevolg is niet alleen dat een tRNA


molecule meerdere codons kan herkennen
(situatie bovenaan de tekening), maar ook
dat een codon kan herkend worden door
meerdere tRNA's (situatie onderaan)!

De non-Watson-Crick combinaties in de
tabelletjes werden experimenteel
gevonden.

Een voorbeeld uit de realiteit zijn drie van


de zes codons voor leucine: CUA, CUC en
CUU. Deze codons worden herkend door
slechts één tRNA met anticodon 5'-IAG-3'.
105

7.5 Nog meer fijnmechaniek: ribosomen

Ribosomen zijn de meest voorkomende complexen van RNA en proteïnen in een


cel. Het zijn de machines waarin een RNA-sequentie uiteindelijk zal vertaald worden
naar een polypeptide met een snelheid van 3 à 5 aminozuren per seconde. Een
kleine proteïne van ~150 aminozuren zal dus al na minder dan een minuut voltooid
zijn. Zeer grote proteïnen hebben echter uren nodig.

Een ribosoom heeft zowel in pro- als in eukaryoten een analoge opbouw:

Verschillende ribosomale RNA (rRNA) moleculen zijn gecomplexeerd met meer dan
50 proteïnen in een grote en een kleine subeenheid, waarvan de "afmetingen"
uitgedrukt worden in "Svedberg" sedimentatie-eenheden

Ribosomen worden namelijk relatief gemakkelijk geïsoleerd ahv snelheids-


sedimentatie centrifugatie. Een Svedberg eenheid is een maat voor de
sedimentatiesnelheid onder bepaalde standaard condities (vb. 20°C). Het
is de snelheid in een centrifugaal veld, gedeeld door de centrifugaalkracht.
1 Svedberg = 10-13 sec. Ook de grootte van ribosomaal RNA wordt
(traditioneel) in S-eenheden uitgedrukt.

De ribosomen van pro-en eukaryoten verschillen in aantal RNA moleculen van de


grote subeenheid. De rRNA's zijn bij eukaryoten groter. De analogieën zijn echter
opmerkelijker dan de verschillen.

Overzicht samenstelling van pro-en eukaryotische ribosomen:


106

De rRNA's bezitten een extensieve collectie dubbelstrengige gebieden met korte


enkelstrengige lussen eraan ("stem-loops").

Onderstaand voorbeeld toont een 2-dimensionale kaart van de secundaire


structuur van het 16S rRNA van bacteria (de klein subeenheid). De grootte en vorm
van de lussen blijft constant van soort tot soort. Er zijn echter soort-afhankelijke
verschillen in sequentie. De meest conservatieve regio's zijn in het rood aangeduid.
De kaart werd opgesteld door Huysmans & De Wachter van de Universiteit
Antwerpen (UIA).
107

7.6 Het startcodon AUG

Het codon AUG in een mRNA fungeert als startsignaal in de meerderheid van de
mRNA's. Het initieert translatie en zorgt dat de vertaling van de codons naar
aminozuren gebeurt in het correcte leesraam.

De schets toont wat hiermee bedoeld wordt: stel dat bovenaan een correct
leesraam gelezen wordt (ttz. de GCU wordt vertaald in Ala &c.), dan is onderaan
het dramatisch effect van een leesraamverschuiving te zien ("frameshift"). Een
leesraamverschuiving van slechts één base produceert een compleet verschillend
proteïne (CUU wordt nu Leu &c) dat meer dan waarschijnlijk non-functioneel is.
Een leesraamverschuiving kan het gevolg zijn van een foutieve translatie-initiatie
en van deleties of inserties.

Cursus aandachtig gelezen? Dan heb je gemerkt dat het codon AUG zowel codeert
voor methionine, als dat het een startcodon is. Het eerste aminozuur in een
polypeptide zal dus altijd een methionine zijn.
108

7.7 Translatie-initiatie bij E. coli

Het positioneren van het ribosoom aan het begin van “de RNA boodschap” wordt
bij bacteria bepaald door een korte sequentie onmiddelijk upstream van de
translatiestart (AUG). Deze “Shine-Delgarno” sequentie met consensus AGGAGGU
blijkt complementair te zijn aan een sequentie aan het 3’ einde van het ribosomale
16S RNA.

Het gevolg van een dergelijke translatie initiatie is dat een translatiestart gelegen
middenin een RNA molecule perfect mogelijk is, zodat een lange RNA molecule kan
gebruikt worden om er meerdere polypeptiden op te synthetiseren (polycistronisch
RNA). Zoals zal blijken is dit een fundamenteel verschil met eukaryoten.

Positie van de Shine-delgarno sequentie in enkele prokaryotische genen:

Herkenning van de Shine-Delgarno sequentie door het ribosomaal RNA:


109

De initiatie van translatie bij E. coli:

Een complex van een kleine 30S ribosomale eenheid en enkele initiatiefactoren
associeren zich met de Shine-Delgarno sequentie, en “scannen” het RNA
downstream af tot het eerste AUG initiatiecodon. Als het tRNAifMet de AUG herkent,
kan de grote 50S eenheid binden, en is het ribosoom operationeel. Aangeduid zijn
de acceptorsite (A) waarin de tRNA’s zullen binnenkomen, de peptidylsite (P)
waarin de peptidebindingen zullen tot stand komen, en de exitsite (E) waarin de
“lege” tRNA’s klaarstaan om terug te dissociëren na de vorming van een
peptidebinding.
110

7.8 Translatie-initiatie bij eukaryota:


Een fundamenteel verschil bij de initiatie van translatie bij eukaryota is de
herkenning van het
startpunt.

Een complex van de kleine


ribosomale 40S eenheid en
enkele eukaryotische
initiatiefactoren (eIF’s)
herkend nl. de 5’ CAP
structuur van het mRNA (de
m7G modificatie) en begint
daarna het RNA te scannen
op zoek naar een initiator
AUG. Bepaalde sequenties,
de “Kozak” sequenties
(ontdekt door Marilyn Kozak),
helpen het ribosoom deze
AUG te vinden.

Het verder verloop van de


initiatie is analoog aan de
situatie bij E. coli.

De noodzakelijke herkenning
van de CAP structuur heeft
echter voor gevolg dat per
RNA molecule slechts één
polypeptide kan
gesynthetiseerd worden
(monocistronisch RNA).
111

Ter info: Interne translatie-initiatie bij eukaryoten ?

Onze cellen gebruiken alleen het monocistronisch type translatie zoals hierboven
beschreven, dus zonder interne translatie-initiatie zoals bij bacteria.

Het blijkt echter dat picornavirussen zoals polio of het hepatitis-A virus de
eukaryotische ribosomen dingen laten doen die ze anders nooit doen.
Picornavirussen bezitten nl. een lange ongetransleerde regio, de UTR, (tot zelfs een
duizend-tal nucleotiden in het gevreesde mond- en klauwzeer virus) aan de 5’ kant
van hun RNA genoom (dat ook een 5’ m7G CAP bezit), dat de translatie-start
voorafgaat. Eén van de overlevingsstrategieën van picornaviridae is het
uitschakelen van de gastceltranslatie. Dit doen ze door een cellulaire eIF
initiatiefactor proteolytisch te inactiveren. Maaien ze daarmee het gras onder hun
eigen voeten weg? Het blijkt van niet. De translatie van hun eigen RNA genoom
blijkt nl. CAP onafhankelijk! Picornavirussen gebruiken de ongekende eigenschap
van eukaryotische ribosomen om intern te binden op een virale IRES, een “internal
ribosome entry site”, gelegen na de UTR.

Een IRES is een picornavirussequentie van enkele tientallen nucleotiden met


een stabiele secundaire RNA structuur. De regio van de IRES die het dichtst
bij het AUG codon is gesitueerd (ttz. de 3’ kant van de IRES) is complementair
met de 3’ sequenties van het 18S rRNA, zeer analoog als bij de Shine-
Delgarno sequenties van bacteria.

Een IRES positioneert het eukaryotisch ribosoom dus netjes vóór intern gelegen
AUG codons, en verleent aan het virus de mogelijkheid om de translatie op een
CAP-onafhankelijke manier te starten. Vermits CAP-afhankelijke translatie-initiatie
in geïnfecteerde cellen niet meer functioneel is zal de cel zal dus alleen
virusgenomen synthetiseren.
112

Een eukaryotisch ribosoom kan dus op twee manieren de translatie initiëren. In


een normaal functionerende cel is echter alleen de m7G CAP-afhankelijke initiatie
operationeel.

Ter info: “eukaryotische” RNA virussen zoals polio of influenza staan voor een
serieus probleem, vermits ze als unieke RNA molecule in een eukaryotische
cel slechts één polypeptide zouden kunnen synthetiseren. En met één
polypeptide maak je geen nieuw virus! Dit soort virussen moest dus een
beetje inventief zijn: influenza bvb. evolueerde naar een gefragmenteerd RNA
genoom, terwijl picornavirussen een reusachtige polypeptide synthetiseren
die ze vervolgens autokatalytisch en in een ingewikkelde proteolytische
cascade verdelen in een geschikt aantal proteïnen.

7.9 Elongatie

De elongatie verloopt zeer analoog bij pro- en eukaryota. tRNA’s komen het
ribosoom binnen via de acceptor (A) site, petidebindingen ontstaan in de peptidyl
site (P) en de “lege” tRNA’s verlaten het ribosoom via de exit (E) site. De aan- en
afvoer van de correcte tRNA’s en de translocatie (schuiven) van het ribosoom
over het RNA wordt bijgestaan door elongatiefactoren (EF’s). Hierbij wordt GTP
gehydrolyseerd.
113

De vorming van een peptidebinding van dichterbij bekeken:

De peptidyltransferase activiteit is waarschijnlijk afkomstig uit de 50S


subeenheid, ttz. sequenties uit het 23S rRNA, maar ook de 3’ CCA sequentie in
het tRNA.
114

De traditionele visie op het ontstaan van een peolypeptide ziet er dan uit zoals in
het schema hieronder.

Recent kwan men echter tot het inzicht dat polyribosomen in eukaryota
waarschijnlijk “circuleren” op een RNA molecule die aaneengehouden wordt enkele
eIF’s en het recent ontdekte poly-A bindend proteïne PAB-I (zie
transcriptieterminatie):

Hiervoor pleiten een aantal experimentele waarnemingen:

1. De poly-A staart stimuleert in vitro translatie !


2. PAB-I vormt een complex met eIF4 (E en G)
3. EM-opnames tonen circulair geplaatse polyribosomen

Het model wordt dan als volgt:


115

7.10 Terminatie van translatie

Het beëindigen van


translatie wordt
gedicteerd door de
stopcodons UAA, UAG en
UGA. Hoe gaat dit in zijn
werk ? Het blijkt dat deze
stopcodons herkend
worden door tRNA-
achtige “release”
factoren, RF’s. Bij E. coli
herkend RFI de codons
UAA en UAG, terwijl de
factor RFII UAA en UGA
herkend. Voor één keer
moeten de eukaryoten het
met minder doen, nl
slechts één factor eRF1
die alle codons herkent.

Het binden van de release


factor induceert de
klieving van de
polypeptide met de
laatste tRNA. Het
ribosoom dissocieert.
116

7.11 Inhibitie van translatie

7.11.1 Antibiotica

Werking op prokaryota

Streptomycine  Inhibitie translatie-initiatie


 geen f-tRNAmet -binding op 30S eenheid
Kanamycine
 Frameshift
Gentamycine

andere aminoglycosiden

Tetracycline  Bindt op 30S eenheid


 inhibitie binding tRNA's

Chloramfenicol  Inhibeert peptidyl-transferase

Erythromycine  Bindt op 50S eenheid


 inhibeert translocatie

Puromycine  Trekt op uiteinde van een aminoacyl-tRNA


 zal mee ingebouwd worden

 prematuur einde van polypeptide

 Ook op eukaryota

Werking op eukaryota

Cycloheximide  Inhibeert peptidyl-transferase


117

Een voorbeeld van moleculaire mimicry (biologische nabootsing): puromycine (links) trekt als
twee druppels water op de laatse aminoacyladenine (rechts) aan de 3’ kant van het RNA (R’):
118

7.11.2 Difterie-toxine inhibeert translocatie-stap van translatie

Difterie wordt veroorzaakt door Corynebacterium diphteriae, een bacterie die groeit in de
bovenste luchtwegen. De aandoening evolueert naar een keel-aandoening, met de vorming
van een netwerk van fibrine en leukocyten, een zgn. "membraan" (Grieks. Diphthera: huid
/ membraan).

De bacterie synthetiseert een potent


proteïnetoxine: slechts 1 µg is voor ons al
lethaal!

Merkwaardig genoeg wordt het toxine


gecodeerd door een lysogene faag, niet door
het bacteriële chromosoom.

Het toxine wordt door onze cellen


geëndocyteerd, en in de endosomen
gekliefd naar twee fragmenten met massa’s
van 21kd (het A fragment) en 40kd (het B
fragment).

Het B fragment helpt vervolgens het A


fragment de endosomale membraan binnen
te dringen, zodat het A fragment in de
cytosol terechtkomt.

Het A fragment (de katalytische eenheid) is


een protease en inactiveert EF2. De
translocatiestap van de cellulaire translatie valt stil en de cel sterft.
119

8. Mutaties en herstelmechanismen

Replicerende DNA-polymerases kunnen fouten introduceren in de DNA sequentie. Ook


mutagene stoffen en straling kunnen fouten genereren. Zonder herstelmechanismen zou het
accumuleren van mutaties al vlug leiden tot genbeschadiging en tot kanker of celdood. Lees
dit hoofdstuk aandachtig, en je zal begrijpen waarom zonnen zo vermoeiend en zo gevaarlijk
is.

8.1 Mutatiefrequentie

Spontane mutatiefrequenties variëren van organisme tot organsime:

De kans dat een base gemuteerd wordt per replicatieronde is bvb:

T4 bacteriofaag 1 op 107 nucleotiden

E. coli 1 op 109 nc.

Drosophila 1 op 1010nc.

Dit wil dus zeggen dat bij E.coli met een mutatiefrequentie van 10-9 , een gen een
mutatiefrequentie heeft van 1 op 10-6, (veronderstel +/- 1000 nucleotiden per gen). Dus in
gen x zal er na een miljoen replicatierondes mogelijk een mutatie zijn ontstaan. Gezien de
snelheid waarmee bacteriën zich vermenigvuldigen (coli's delen zich in optimale
omstandigheden elke 20 min.) zal men begrijpen dat in een bacteriële populatie gemakkelijk
mutanten te isoleren zijn.

De relatief "lage" mutatiefrequentie bij bacteriën is essentieel te wijten aan de correctie-


activiteit van de DNA polymerases ("proofreading"). Maar bacteria en hogere organismen
corrigeren nog op andere manieren mutaties (zie verder).

De absolute kampioenen qua mutatiefrequentie zijn de RNA-virussen, vermits er voor de


replicatie van RNA geen herstelmechanismen bestaan. Een RNA virus heeft een
mutatiefrequentie van ~10-4, wat dus wil zeggen dat er een mutatie ontstaat elke 10.000
gekopieerde nucleotiden. Zo ontstaat er bij de picornavirussen (polio, hepatitis A, mond -en
klauwzeer, …) in praktijk ongeveer 1 mutatie per gerepliceerd genoom. Dus elk nieuw virus
is een mutant! Een dergelijke mutatiefrequentie is waarschijnlijk zeer dicht bij de maximaal
tolereerbare frequentie voor het behoud van een soort! Ook het AIDS virus is een RNA virus.
Een dergelijke productie van mutanten "a volonté" is één van de belangrijkste obstakels bij
het ontwikkelen van medicamenten of vaccins tegen RNA-virussen.
120

8.2 Mutaties

Mutaties kunnen ontstaan als gevolg van verschillende beschadigingen aan DNA of RNA, of
als gevolg van spontane foutieve baseparing ("mismatch"):

1. Verdwijnen van bases door enzymes (vb. uracil door glycosilases), zuren of door
warmte. Men schat dat er per cel ongeveer 10.000 bases per dag verdwijnen.
2. Chemische wijziging van bases door ioniserende straling of alkylerende stoffen
3. Verhoogde incorporatie van foutieve bases door mutaties in de 3'  5' exonuclease
sequenties.
4. Deleties of inserties van één of meerdere bases, vooral als gevolg van stoffen die tussen
de baseparen "intercaleren". Tijdens de replicatie kan dit in minder of meer bases
resulteren.
5. Pyrimidines die covalent verbonden worden onder invloed van UV bestraling ("pyrimidine
dimeren")
6. Breken van 1 of beide strengen onder invloed van ioniserende stralen of chemische
stoffen (vb. bleomycine). Een verbreking van beide strengen is gevaarlijk omdat de
breuk ofwel niet kan hersteld worden, ofwel omdat een herstelling gebeurt met een
verkeerd DNA fragment (translocaties).
7. Wijzigingen in de suiker-samenstelling (vb. geen 3' OH van deoxyribose) zodat replicatie
van DNA stopt.
8. Door zeldzame tautomerisatie is het mogelijk dat bvb een imino tautomeer van
adenine paart met een cytosine i.p.v. met een thymine. Amino (-NH2) en keto (-C=O)
groepen kunnen inderdaad tautomeriseren tot resp. imino (=NH) en enol (-C-OH)
groepen, met gewijzigde baseparing als gevolg.

Puntmutaties zijn wijzigingen van 1 basepaar (een basepaar wordt gesubstitueerd door een
ander basepaar).

Ze komen frequent voor, en geven soms aanleiding tot erfelijke ziekten wanneer ze in eicellen
of zaadcellen gebeuren. Transities zijn puntmutaties waarbij een purine door een purine
vervangen wordt, of een pyrimidine door een pyrimidine. Wanneer een purine door een
pyrimidine vervangen wordt, of omgekeerd, spreken we van een transversie.

Een nonsense mutatie vervangt een bepaalde DNA sequentie door een stopsignaal zodat
de proteïnesynthese voortijdig zal stoppen.
121

Een missense mutatie zorgt voor een wijziging in de aminozuursequentie van een proteïne
met een ander fenotype als gevolg. Dit is in tegenstelling tot:

 een stille ("silent") mutatie waarbij de wijziging van een basepaar géén
wijziging in aminozuursamenstelling tot gevolg heeft (door het "wobble" effect,
zie later).

 Een neutrale mutatie waarbij het nieuwe aminozuur de functie van het proteïne
intact laat en dus geen nieuw fenotype veroorzaakt.

Deleties of inserties kunnen soms drastische gevolgen hebben als ze binnen de coderende
sequentie van een proteïne de genetische triplet code uit fase brengen (een zgn. "frameshift"
mutatie). Dit resulteert in een nieuw "leesraam" zodat een totaal nieuw proteïne gecodeerd
wordt dat meer dan waarschijnlijk niet functioneel is (zie verder bij "genetische code").

8.3 Ioniserende straling en ultraviolet licht

Hoog energetische stralen (U.V., kosmische stralen, X-stralen, of radioactieve straling


gebruikt in medische diagnostiek) kunnen interageren met de atomen in het DNA, en
elektronen of vrije radicalen vrijstellen die op hun beurt DNA breuken kunnen induceren, of
DNA strengen covalent verbinden, allerlei chemische wijzigingen in de bases induceren met
mutaties als gevolg.

X-stralen gebruikt in de medische diagnostiek zijn hoog energetische "fotonen" met


mutagene effecten. De dosissen zijn tegenwoordig echter zo laag dat men zich niet bepaald
zorgen hoeft te maken.

Eigenschappen van enkele minder aggresieve isotopen frequent gebruikt in de moleculaire


biologie worden vermeld in onderstaande tabel. Behalve het zeer zwak stralende tritium (3H)
behoeven deze isotopen allemaal stralingsbescherming.

Alle isotopen zijn gevaarlijk bij inname vermits ze na incorporatie blijven verderstralen en
hun mutageen effect rechtsreeks in de weefsels uitoefenen. Vooral 32P is gevaarlijk vermits
het preferentieel in DNA wordt ingebouwd.
122

Isotoop Straling Energie Halverings Gebruik Opmerkingen


tijd (ht)
MeV

H
3
 0.08 12.3 jaar Proteïn + DNA + Relatief veilig

14
C  0.15 5715 jaar Proteïn + DNA + Te lange ht

22
Na  2.84 2.6 jaar Transportstudies z. gevaarlijk

32
P  1.71 14.3 dag DNA Gevaarlijk + te
korte ht

35
S  0.16 87.2 dag Proteïn + DNA Goede ht

36
Cl -+ 0.7/1.1 300.000 j Transportstudies Te lange ht!

125
I  0.17 59.9 dag Proteïn + DNA Gevaarlijk

131
I + 0.97 8 dagen Proteïn + DNA Gevaarlijk

Ultraviolet licht:

Eén van de best gekende mutagene stralingen is ultraviolet licht, een niet-ioniserende hoog-
energetische straling die niet ver in de weefsels doordringt (de huid dus), maar die wel
elektronen kan exciteren en daardoor mutaties veroorzaken. UV is zo gevaarlijk omdat het
absorptie maximum van DNA ligt op 254 nm., in het UV. Dit kortgolvig-UV is dan ook de
meest mutagene UV-straling.

Dat je van ondoordacht zonnen melanoma huidkanker krijgt is aan kortgolvig UV toe te
schrijven. Intensief UV-licht wordt zelfs gebruikt om microrganismen te doden: bvb
sterilisatie van laboratoria, laminaire luchtstroom werkbanken &c. Behalve het
mutageen effect is UV ook zeer destructief op de ogen, daarom nooit in een UV-lichtbron
kijken met onbeschermd gelaat! UV is des te gevaarlijk omdat de effecten zich meestal
pas de dag erna manifesteren (denk aan de zonnenbrand van vorige vakantie). Kortom:
opletten met UV!
123

Het bekendste effect van UV op DNA is de vorming


van pyrimidine dimeren, in praktijk dikwijls
thymine-dimeren.

Deze dimeren zijn covalente verbindingen (er


ontstaat een cyclobutaan-ring) tussen twee
thymines die zich boven elkaar in de helix
bevinden.

De aanwezigheid van thymine-dimeren is


problematisch voor DNA polymerases, zodat
replicatie op een dergelijke plaats stopt. Zowel pro-
als eukaryoten bezitten echter
herstelmechanismen om dergelijke dimeren te
verwijderen (zie verder), maar de dimeer wordt
dan vervangen door twee toevallig gekozen
nucleotiden, zodat mutaties kunnen ontstaan.

8.4 Chemische mutagenese

Stoffen die rechtstreeks mutageen en daardoor dikwijls ook carcinogeen zijn interageren
vooral met negatief geladen gebieden zoals N en O atomen van DNA: het zijn zgn. reactieve
electrofielen. Deze stoffen kunnen dus normale baseparing verstoren, met mutaties als
gevolg.

Veel kankers ontstaan door blootstelling aan toxische stoffen. Meestal zijn deze stoffen
mutageen. De begrippen carcinogeen en mutageen zijn dus niet identisch maar in praktijk
meestal overlappend.
124

Voorbeelden:

Ethylmethaansulfonaat, bijvoorbeeld, kan rechtstreeks guanine alkyleren (toevoegen van


methyl, ethyl, …groepen) op zuurstof positie 6 van de purine ring. Het resulterende O6-ethyl-
guanine kan nu paren met thymine.

De-aminatie: onder invloed van salpeterigzuur (HNO2) kunnen adenine, cytosine of guanine
gedeamineerd worden tot respectievelijk hypoxanthine (paart met C), uracyl (paart met A),
of xanthine (paart met C).

Hydroxylamine (NH2OH) reageert specifiek met de aminegroep van cytosine en converteerd


deze tot een OH groep.

Het gevolg is dat een CG basepaar uiteindelijk vervangen wordt door een AT koppel.

De meeste carcinogenen zijn echter onrechtsreekse mutagenen, en moeten eerst


gemetaboliseerd worden tot een ultiem carcinogen door de invoeging van electrofiele centra.
Meestal gebeurt deze activatie door leverenzymes die ironisch genoeg een detoxifiërende
functie hebben. Detoxifiëren houdt dikwijls in dat de schadelijke vet-oplosbare stoffen
omgezet worden in water-oplosbare componenten die vervolgens kunnen uitgescheiden
worden.

Ter info: Voorbeelden:

 Een eerste stap in de detoxificatie is een serie oxidatiereacties door membraan-


gebonden "cytochroom P-450" enzymes van het endoplasmatisch reticulum. Zelfs
polycyclische aromatische komponenten zoals benzopyreen kunnen geoxideerd
worden, met de vorming van een zeer reactieve electrofiele epoxide groep. Na oxidatie
ontstaat het ultiem carcinogen van benzopyreen: het 7,8-diol-9,10-oxide. Dit
carcinogen kan binden op de vier DNA basen en zo mutaties induceren.
Benzopyreen en andere polycyclische aromatische koolwaterstoffen (pac's) vindt men
o.a. terug in gerookte eetwaren en barbecue vlees, en bij hoge temperaturen
gebakken vlees of verhitte sausen. In de microgolfoven stelt het probleem zich niet.
Ze ontstaan ook in de uitlaat van voertuigen, vooral dan de slecht-afgestelde diesels
en olie-verbruikende motoren, en binden zich op kleine roetdeeltjes die kunnen
ingeademd worden.

Interessant is dat kruisbloemige groenten indolen bevatten die pac-geïnduceerde


colonkankers bij proefdieren kunnen remmen.

 Aflatoxines behoren tot de giftigste én meest potente indirecte carcinogenen. Deze


mycotoxines worden aangemaakt door Aspergillus flavus en andere schimmels
wanneer voedsel opgeslagen is bij warme en vochtige omstandigheden, bijvoorbeeld
bij import uit warme landen. Bijna alle voedsel kan door de schimmels aangetast
worden, maar het gebeurt dat mais, tarwe, rijst, aardnoten, pistachenoten &c.
onzichtbaar door schimmel is aangetast. In bulktransporten blijkt bovendien dat
slechts enkele noten of korrels (in zeer zware mate) aangetast kunnen zijn, zodat
125

routine opsporing zeer moeilijk is. Zelfs melk of yoghurt kan besmet geraken als het
veevoeder besmet was. Schimmelgroei op etenswaren kan dus wel degelijk zeer
gevaarlijk zijn.

 Sommige commerciële (vb. Agaricus bisporus) en eetbare wilde paddestoelen


bevatten mutagen stoffen. Jaarlijks sterven er mensen door het eten van de wilde
voorjaarskluifzwam. Deze "valse morel", Gyromitra esculenta (foto), bevat zeer veel
gyromitrine en andere mutagenen waarvan geweten is dat ze tumoren veroorzaken
bij proefdieren.
Zelfs gedroogde vruchten bevatten clastogene stoffen die chromosoomafwijkingen
kunnen veroorzaken. Tenslotte ontdekken we elke dag nieuwe
mutagenen die onze gezondheid kunnen schaden:
sigaretterook, nitraten, vinylchloride, pesticiden, en zelfs
estragol (in dragon), saffraan, zwarte peper, de quercitines
van rode wijn, … Zelfs de ooit zo gezond verklaarde
onverzadigde vetzuren zouden het ontstaan van kanker
kunnen bevorderen…

Intercalerende stoffen zijn meestal planaire verbindingen die zich kunnen nestelen tussen
opeenvolgende baseparen van de DNA helix. Voorbeelden zijn ethidiumbromide en acridine-
oranje, die door hun effect op de helixstructuur inserties of deleties in het DNA kunnen
veroorzaken.

Onder invloed van UV kunnen psoralenen zelfs de twee DNA strengen covalent verbinden.
126

8.5 De Ames test

Hoe te weten komen of een stof mutageen (carcinogeen) is of niet ? Eén van de meest
gebruikte testen werd ontwikkeld door Bruce Ames & collega's in 1975. De test staat ook
bekend als de Salmonella-test of in een recentere variant de Salmonella-microsoom test.

109 test-Salmonella's worden uitgeplaat op een petriplaat zonder histidine. De teststam heeft
een defect in een histidine gen en kan niet groeien in afwezigheid van histidine. Wanneer een
mutagen in het midden van de petriplaat wordt aangebracht ontstaan mutanten die
reverteren naar histidine auxotrofie. De teststammen zijn tegenwoordig genetisch gewijzigd
om ze nog gevoeliger te maken voor mutagenen.

De toevoeging van een leverhomogenaat of meer bepaald de microsoom fractie (de "S9-
activator fractie") die aangerijkt is met vesikels van het endoplasmatisch-reticulum, moet de
detectie mogelijk maken van indirecte mutagenen.

A: onbehandelde test-stam

B: test-stam met een mutagen op filterpapier


127

8.6 DNA-herstelmechanismen

DNA-beschadiging wordt zowel bij pro- als bij eukaryoten hersteld door verschillende
systemen. Bovenop de correctie-activiteit van DNA polymerases ("proofreading") zijn er in de
evolutie verschillende mechanismen ontstaan om allerlei DNA-insulten te herstellen. Vooral
bij meercellige organismen met lange generatietijden, moet het DNA inderdaad de genetische
informatie voor lange tijd bewaren zonder dat de cellen repliceren, dus met risico op
accumulatie van fouten.

Er bestaan ruwweg 3 categoriën herstelmechanismen:

 correctie van foutief gepaarde baseparen ("mismatch" herstel) tijdens DNA


replicatie. De template streng dient als basis voor de correctie. Een soortgelijk
mechanisme herstelt het spontane verlies van purines (A of G).

 Excisie van chemisch beschadigde regio's: het verwijderen van de regio door
gespecialiseerde nucleases. Dit systeem wordt gebruikt om thymine dimeren te
verwijderen na een UV-zonnebad.

 Het herstellen van dubbelstrengige breuken

8.6.1 Mismatch herstel door het E.coli MutHLS systeem.

Hoe bepaalt de cel welke de correcte base is en welke de foutieve? M.a.w. hoe wordt
bijvoorbeeld in een GT mismatch beslist of de G verkeerd is of de T ?

1. Bij E. coli blijkt dat DNA normaal gemethyleerd is op adenines in de sequentie GATC. Bij
de replicatie incorporeren de DNA polymerases echter adenine, niet methyl-adenine, zodat
de nieuw-gesynthetiseerde streng gedurende een zekere tijd kan onderscheiden worden
van de oude template streng (en dus de mismatchen van de correcte bases). Na enige
minuten worden de adenines gemethyleerd door Dam-methylases.

2. Het MutS proteïne herkent de plaats van de mismatch

3. Het E. coli proteïne MutH bindt specifiek aan de nieuwe, ge-hemimethyleerde streng op
GATC sequenties en verbindt zich met MutS met behulp van een "linking" proteïne, MutL.

4. Deze associatie activeert een endonuclease activiteit in MutH, zodat de ongemethyleerde


streng specifiek geklieft wordt, en een regio met de verkeerde base vervolgens vervangen
128

wordt door de opeenvolgende actie van helicase, enkelstrengige exonuclease en DNA


polymerase. De streng wordt uiteindelijk terug gesloten door DNA-ligase.

Het herstellen van apurine plaatsen (AP) die ontstaan door spontaan verlies van purines (door
spontane klieving van de glycoside-binding tussen suiker en base), gebeurt op gelijkaardige
wijze. AP-endonucleases herekennen de AP site en klieven de DNA-streng die de AP-plaats
bevat.
129

8.6.2 Excisie herstel: het E.coli UvrABC systeem

Wanneer bases chemisch gemodifieerd zijn zetten cellen een peperduur excisie-
herstelmechanisme in werking. Dit systeem is gebaseerd op proteïnen die DNA "aftasten" en
onregelmatigheden in de structuur detecteren. Dit "high-tech" snufje kost echter veel "geld":
het verbruikt nogal wat ATP.

Thymine-dimeren die ontstaan door UV, of bases die gewijzigd zijn door aanhechting met
grote zijgroepen (vb. het carcinogen van benzopyreen) worden met dit systeem verwijderd.

Het best gekende excisiesysteem is ook weer dat van E. Coli – het Uvr ABC systeem:

1. De proteïnen UvrA en UvrB vormen een complex (ATP nodig)


2. Het complex tast DNA af. Hiervoor is weer ATP nodig
3. Als een structurele onregelmatigheid wordt gedetecteerd, induceert UvrA/B een knik in
het DNA op de plaats van de modificatie (ATP nodig)
4. UvrA dissocieert (ATP nodig)
5. UvrC bindt
6. UvrC knipt op twee plaatsen, 12-13 bases van elkaar verwijderd (ATP nodig)
7. UvrB en C dissociëren.
helicase II ontwikkeld de beschadigde regio. De enkele streng die de modificatie bevat
gaat verloren

8. De resulterende opening wordt gevuld door DNA polymerase II, en vervolgens gesloten
door DNA ligase (ATP nodig).

Bij eukaryoten gebeurt dit excisie-herstel waarschijnlijk op gelijkaardige wijze. Een 10-tal
genen werden reeds gekarakteriseerd ("RAD"-genen). Een aantal van deze proteïnen blijkt
identisch te zijn aan bepaalde transcriptie-factoren (factoren nodig voor het opstarten of
reguleren van transcriptie). Dit verklaart meteen de observatie dat fouten gelegen in regio's
die actief overgeschreven worden, veel vlugger hersteld worden dan fouten gelegen in
transcriptioneel inactieve regio's. Slechts een klein percentage van ons DNA is transcriptioneel
actief.
130

Het Uvr ABC systeem van E. coli


131

8.6.3 Herstel van dubbelstrengige breuken door Ku

Een dubbelstrengige DNA-breuk ten gevolge van straling of sommige kanker geneesmiddelen
(vb. bleomycine) komt meestal niet alleen. Wanneer meerdere breuken aanwezig zijn, bestaat
het risico dat de verkeerde uiteinden aan elkaar geligeerd worden. In het ergste geval kan
een teveel aan dubbelstrengige breuken leiden tot de dood van snel-groeiende cellen, zoals
kankercellen. In minder aggresieve vorm kan een DNA fragment van het ene chromosoom
geligeerd worden aan een DNA van een ander chromosoom. Dit resulteert dan in een
translocatie waarbij genen onder de controle van vreemde promotoren kunnen
terechtkomen. Ironisch genoeg kan dit aanleiding geven tot kanker, bvb. wanneer een proto-
oncogen op die manier ongepast geactiveerd wordt.

Twee proteïnen binden aan elk DNA-uiteinde:

 Ku
 Een DNA-afhankelijk proteïne kinase (Een kinase is een enzyme dat
proteïnen fosforyleert door transfer van de eindstandige () fosfaatgroep van
ATP).

1.De Ku/kinase complexen binden aan elkaar (ze vormen een "synaps"), zodat
de gebroken DNA eindes elkaar overlappen.

2.Ku helicase activiteit ontwikkeld de eindes zodat enkelstrengige regio's


ontstaan

3.De 3' DNA eindes paren met elkaar via toevallig gevonden homologieën.

In de meeste gevallen zullen dus slechts kleine dubbelstrengige regio's ontstaan,


slechts enkele bases groot ("microhomologie-regio's").

4.De 5' eindes worden gedegradeerd (enzyme onbekend)

5.De strengen worden aan elkaar geligeerd door DNA ligase

Het netto resultaat is dat de breuk hersteld werd, maar dat een kleine deletie werd
geïntroduceerd. Onschuldig? Nee: het is een mutatie met mogelijk desastreuze gevolgen (vb.
een frameshift mutatie). Het is de prijs die de cel moet betalen om niet met een lethale breuk
te blijven zitten.
132

Herstel van DNA breuken door Ku + DNA-afhankelijk proteïne kinase


133

SOS herstel: vlug maar vuil

Bacteria en eukaryoten bezitten een additionele techniek om DNA-beschadigingen het hoofd


te bieden: het SOS herstel.

Het systeem schiet in gang wanneer de DNA beschadiging zo significant is dat de eerder
genoemde herstel-mechanismen de zaak niet meer aankunnen. Men noemt het SOS-systeem
induceerbaar, vermits het niet tot uitdrukking komt in onbeschadigde cellen. De keerzijde
van de medaille is dat het SOS systeem veel fouten maakt, waarschijnlijk omdat bij het herstel
gebruik gemaakt wordt van toevallig gekozen nucleotiden. Men zegt dat het systeem
"vatbaar is voor fouten" ("error-prone").

Eukaryotische cellen doen bovendien nóg speciale dingen: als de beschadiging aan het
DNA bijzonder significant is kan de cel beslissen om te stoppen met delen, teneinde op
die manier de mutaties niet nodeloos te vermenigvuldigen, en zichzelf bovendien de tijd
te geven om de beschadigingen te herstellen.

Als dat niet volstaat kan een cel tot harde actie overgaan: zelfmoord plegen door
geprogrammeerde celdood (apoptose). Een meercellig individu wordt op die manier
bespaard van veel miserie: gemuteerde cellen bezitten inderdaad mogelijk
kankereigenschappen.

8.6.4 Herstel van ds breuken door homologe recombinatie

Kort na de her-ontdekking van Mendel's wetten en het werk van Frans Janssens vond men
dat bij de fruitvlieg blokken van genen tussen homologe chromosomen konden uitgewisseld
worden door een proces van homologe recombinatie tijdens de meiose. Dit proces wordt nu
omschreven als "crossing over".

Onze cellen bevatten chromosomaal materiaal van vader en moeder (homologe


chromosomen) die elk een andere combinatie allelen bezitten, en tijdens de meiose ontstaan
dus nieuwe combinaties tussen die homologen. Deze recombinatie genereert méér genetische
diversiteit dan dat mogelijk is met onafhankelijke segregatie van genen zoals beschreven in
de wetten van Mendel. Er wordt algemeen aanvaard dat deze recombinatie een snelle en
grote genetische diversiteit creërt in een populatie. Deze diversiteit biedt aan een populatie
de mogelijkheid om mee te evolueren met een steeds veranderende omgeving. Dit verklaart
wellicht het succes van sexueel reproducerende organismen.
134

Homologe recombinatie door herstel van een dubbelstrengige breuk

Behalve het Ku / kinase systeem bestaat er nog een tweede herstelsysteem voor
dubbelstrengige breuken. Dit systeem geeft aanleiding tot homologe recombinatie.

Het model is gebaseerd op meiotische recombinatie in de gist Saccharomyces cerevisiae. De


achtereenvolgende stappen zijn gecontroleerd door enzymsystemen.

Ter info:

1. een dubbelstrengige breuk ontstaat in één van de twee zusterchromatides. De breuk wordt
geopend door 5'  3' exonucleases: er ontstaan dus "losse" enkelstrengige 3' eindes.

2. Een los 3' uiteinde kan nu de homologe chromatide "overvallen", waarbij lus-vorming
optreedt in de ongeknipte chromatide.

3. Dit 3' uiteinde is nu gepaard (ttz. is dubbelstrengig), en vormt een ideale primer voor het
DNA-polymerase, met streng D (zie vb) als template. De lus volgt.

4. Het andere 3' uiteinde ondergaat het zelfde lot ttz. extentie, maar met streng D' als
template.

5. Nadat "de gaten zijn gevuld", en gesloten door DNA ligase, moet de resulterende
intermediair met twee Holliday-verbindingen uit elkaar geraken. Dit kan door twee
enkelstrengige klievingen per Holliday intermediair.
135

Herstel van dubbelstrengige breuken leidt tot homologe recombinatie:


136

DEEL 2: TOOLBOX

9. Restrictie-enzymen

In de jaren 1970 ontdekt men enzymen die DNA op specifieke plaatsen kunnen knippen.
Restrictie-enzymen blijken deel uit te maken van een defensiesysteem bij bacteriën. Het
restrictie-modificatie systeem herkent vreemd (viraal) DNA en knipt het kapot op bepaalde
sequenties. In de bacteriologie spreekt men van "host-controlled restriction", vandaar
restrictie-enzymen.

De bacterie beschermt zichzelf tegen haar eigen restrictie-enzymen door dezelfde sequenties
te methyleren: 4-methylcytosine, 5-methylcytosine, 5-hydroxymethylcytosine, of 6-
methyladenine, aangebracht door een methylase.

De ontdekking van deze enzymen heeft de gentechnologie mogelijk gemaakt: het werd
mogelijk specifieke stukjes DNA (zeg maar “genen”) uit een organisme te isoleren, en deze
in te bouwen – met het enzyme DNA ligase – in een ander organisme.

De specifieke DNA endonucleasen (herkennen bepaalde DNA sequenties, en klieven in de DNA


streng, niet aan de uiteinden) worden onderverdeeld in vier klassen: type I, II, III restrictie-
enzymen en de "homing" endonucleasen.

In praktijk behoren de meest gebruikte restrictie-enzymen tot klasse II: deze herkennen
sequenties van 4, 5, 6 of 8 baseparen, en klieven in de onmiddelijke nabijheid van de
herkenningssequentie.

Ter info:

De "homing" endonucleasen zijn enzymen die worden gecodeerd door introns of door
inteïnes ("introns in proteïnen"). Het zijn dus geen "restrictie" enzymes. Homing
endonucleasen herkennen en knippen specifiek de sequentie rond hun eigen
insertiesite. Daardoor kunnen ze zich gedragen als mobiele elementen en zich op
intron-negatieve maar homologe plaatsen insereren elders in het genoom
("homing"), bvb. op de homologe chromosomen.
137

9.1 Palindromen

Veel restrictie-enzymen herkennen spiegelsymmetrische sequenties: palindromen. De


woorden “lepel” of “nepkoortsmeetsysteemstrookpen” zijn palindromen, i.e. men kan ze in
beide richtingen lezen. In de restrictie-enzyme wereld kan men in een palindroom lezen in de
ene DNA streng, en omgekeerd in de complementaire DNA streng. Een voorbeeld: het
prototype type II restrictie-enzyme EcoRI, geïsoleerd uit een Escherichia coli R stam, vb stam
RY13, herkend de sequentie 5' GAATTC 3'. De sequentie in de complementaire streng is dus
ook 5' GAATTC 3'. Het enzyme klieft vervolgens de streng tussen de G en de A: G AATTC,
idem in de complementaire streng.

De sequentie GAATTC vormt een palindroom met de symmetrie-as tussen de sequentie GAA
en TTC. Het is een spiegelsymmetrische sequentie met rotationele symmetrie. Opgelet: er
bestaan ook restrictie-enzymen die niet-palindromische sequenties herkennen. De knipplaats
is dus niet noodzakelijk de symmetrieas.

9.2 Tetra, hexa en octaknippers


Sommige restrictie-enzymen herkennen sequenties van 4 baseparen (tetraknippers of
tetra"cutters") en zullen DNA dus op veel plaatsen knippen. Andere enzymen zoals EcoRI
herkennen 6 baseparen (hexaknippers), en zullen veel minder frequent knippen. Slechts
enkele enzymen (een 20-tal) zoals NotI (zie verder) herkennen 8 baseparen. De kans dat dit
enzyme een DNA sequentie knipt is dus vrij klein.

9.3 Sticky / blunt


In het EcoRI voorbeeld worden twee DNA uiteinden gegenereerd met een uitstekende 5'
streng ("5' overhang"). EcoRI geeft dus aanleiding tot zgn. "sticky ends", in tegenstelling tot
andere enzymen die zowel in de ene als in de andere streng op dezelfde plaats knippen en
dus stompe eindes maken: "blunt ends": een voorbeeld is SmaI met CCCGGG. Een 3'
overhang is ook mogelijk: het enzyme KpnI bvb. herkent en klieft GGTACC.
138

Het al dan niet "sticky" knippen heeft zijn gevolgen voor ligatie-efficienties: compatibele sticky
uiteinden vinden elkaar, en kunnen dus makkelijk geligeerd worden. “Blunt “eindes vinden
elkaar niet, dus hier zal de efficientie afhangen van de concentratie aan uiteinden. De ligatie
efficienties bepalen dus de efficientie waarmee gentechnologische constructen kunnen
gemaakt worden.

Enkele van de vele "populaire" restrictie-enzymes:

Enzyme Organisme Herkenning + Blunt/sticky


knip

EcoRI Escherichia coli GAATTC S

BamHI Bacillus amyloliquefaciens GGATCC S

BglII Bacillus globigii AGATCT S

PvuI Proteus vulgaris CGATCG S

PvuII Proteus vulgaris CAGCTG B

HindIII Haemophilus influenzae Rd AAGCTT S

HaeIII Haemophilus aegyptius PuGGCCPy B

HinfI Haemophilus influenzae Rf GANTC S

Sau3A Staphylococcus aureus GATC S

AluI Arthrobacter aquaticus AGCT B

TaqI Thermus aquaticus TCGA S

NotI Nocardia otitidis caviarum GCGGCCGC S

Bijlage bij deze cursus:

Tabel van palindromische Tetra- , Penta- en Hexa-Nucleotide


Herkenningssequenties (downloadbaar op Canvas)
139

9.4 Restrictie-enzyme families


Dit zijn restrictie-enzymen die dezelfde sticky-ends of overhangs genereren.

Een voorbeeld:

De 5' overhang 5' GATC 3' wordt gegenereerd door een aantal enzymes die
verschillende sequenties herkennen:

Mbo I GATC

Bgl II AGATCT

BamHI GGATCC

BclI TGATCA

XhoII PuGATCPy

9.5 Isoschizomeren
Dit zijn restrictie-enzymen, geïsoleerd uit verschillende micro-organismen, die dezelfde
sequentie herkennen. Hun klievingssite kan echter verschillen. Voorbeelden zijn Aat I uit
Acetobacter aceti en Stu I uit Streptomyces tubercidicus. Beide herkennen de sequentie
AGGCCT en klieven op dezelfde plaats. Andere AGGCCT isoschizomeren zijn Eco147 I,
Pme55I, en SseB I.

Omdat de incubatiecondities van deze enzymes en zelfs hun prijs kan verschillen kan het
interessant zijn de catalogi te onderzoeken op het bestaan van isoschizomeren. Ze kunnen
tevens een verschillende sensitiviteit vertonen t.o.v. methylatie.
140

Tabel: Methylatiegevoeligheid van isoschizomeer / neoschizomeer paren

(McClelland et al. (1994) Effect of site-specific modification on restriction endonucleases and


DNA modification methyltransferases. Nucl. Acids Res. 22, 3640.)

Gemethyleerd
e Geklieft (/) Niet geklieft
Sequentie door: door:

m4
CCGG Msp I (C/CGG) Hpa II (C/CGG)

Cm5CGG Msp I (C/CGG) Hpa II (C/CGG)

Cm4CGG Msp I (C/CGG) Hpa II (C/CGG)

CCm5CGGG Xma I (C/CCGGG) Sma I (CCC/GGG)

Gm6ATC Sau3A I (/GATC) Mbo I, Nde II


(/GATC)

GATm5C Mbo I, Nde II Sau3A I (/GATC)


(/GATC)

GATm4C Mbo I (/GATC) Sau3A I (/GATC)

GGTACm5C Kpn I (GGTAC/C) Acc65 I


(G/GTACC)

Het gebruik van enzymes die methylatiegevoelig zijn is een envoudige manier om de
methylatietoestand van DNA na te gaan.

9.6 Naamgeving restrictie-enzymen


De naamgeving van die verschillende restrictie-enzymen werd gestandaardiseerd, men noemt
het enzyme naar het organisme waaruit het werd afgezonderd, eventueel gevolgd door een
romeins cijfer om het aantal enzymen te onderscheiden. Taq I is bevoorbeeld het eerste
endonuclease afkomstig uit Thermophilius aquaticus (niet te verwarren met het Taq
polymerase dat gebruikt wordt in PCR, zie verder). Met Hae II refereert men naar het tweede
restrictie-enzyme afkomstig uit Haemophilus aegyptius.
141

9.7 De katalytische activiteit


Deze wordt uitgedrukt in eenheden ('Units', U). Een eenheid is de hoeveelheid enzyme die
1 microgram lambda DNA volledig knipt in 1 uur onder optimale condities voor het enzyme.
Omdat restrictie-enzymen gecontamineerd kunnen zijn met andere nucleasen is het ten
sterkste aan te bevelen de juiste hoeveelheid enzyme te gebruiken, tot maximaal ~10 x
overmaat.

9.8 Gerelaxeerde specificiteit


Restrictie-enzymen (evenals de meeste andere DNA modificerende enzymen) worden
bewaard op -20°C in 50% glycerol. De aanwezigheid van meer dan 5% glycerol in het
uiteindelijke reactiemengsel interfereert echter dikwijls met de goede werking van de
enzymen. Het is dus af te raden om meer dan 1/10 volume aan enzyme te gebruiken in de
reacties. Het gebruik van restrictie-enzymen bij een te hoge glycerol concentratie of bij
andere sub-optimale condities kan aanleiding geven tot een gerelaxeerde specificiteit of "star"
activiteit ttz. het beginnen knippen na herkenning van kortere of andere sequenties. Een
hexaknipper (vb. EcoRI) zal dan in plaats van één keer te knippen het DNA fragment aan
flarden knippen door zich te gedragen als een tetraknipper (zie ook practicum).

9.9 Detectie van restrictiefragmenten

Nadat DNA geknipt is met restrictie-enzymen ontstaan er fragmenten van verschillende


grootte. Deze kunnen met hoge resolutie gescheiden worden op polyacrylamide gels, maar
voor het gewone labowerk worden de gemakkelijk te monteren horizontale agarose gels
gebruikt.

Door zijn negatieve lading migreert DNA naar de anode, terwijl door het agarosenetwerk als
een moleculaire zeef de kleine fragmenten vlugger doorlaat dan de grote.

Agar is een polysaccharide uit rode algen (in Maleisië extraheert men er "agar-agar" uit
voor culinaire doeleinden). Agar bevat galactose eenheden met +/- 1 sulfaatgroep erop
per 50 residu's. Het is anionisch en bindt ionen zoals Mg++ of Ca++. Agarose is de
sulfaat-vrije fractie.

Na de scheiding op grootte wordt het DNA gevisualiseerd door het te kleuren met Nancy.

Men kan Nancy ook mee in het gel ingieten om tijd te besparen. Sommige DNA
fragmenten (bvb. supercoiled DNA) gaan dan echter vlugger of trager migreren in
functie van de concentratie(zie practicum).
142

Nancy intercaleert tussen opeenvolgende baseparen en vormt een complex dat in het oranje
(590nm) fluoresceert na korte-golf UV bestraling (met lampen van bvb. 254, 300 of 366 nm).
De gel kan na kleuring getransfereerd worden naar een UV transilluminator waarna de DNA
fragmenten mits oogbescherming gewoon waargenomen kunnen worden en klassiek of
digitaal gefotografeerd.

Opgelet: ultraviolet licht (vooral het kortgolvig UV) is mutageen: huid en ogen dienen
zorgvuldig beschermd te worden. Gebruik een aangezichtsmasker dat het gelaat volledig
beschermd. Enkel een bril is niet OK!

9.9.1 Molmassa merkers


Dit zijn gekende nucleïnezuren die men knipt met een restrictie-enzyme om verschillende
DNA fragmenten te genereren waarvan men de grootte kent.

Voorbeelden zijn faag lambda geknipt met een enzyme zoals HindIII (zie foto
(negatief) links), of plasmide pBR322 geknipt met HaeIII. Men kiest een type DNA en
een geschikt restrictie-enzyme zodat de grootte van de merkerfragmenten zo goed
mogelijk overeenkomt met de te onderzoeken fragmenten. Dankzij het typisch patroon
van een dergelijke klassieke merker kan men meestal zonder probleem de grootte
correleren. Zo heeft Lambda-HindIII 7 zichtbare fragmenten: de vier grootste zijn
23000, 9400, 6500, en 4400 baseparen (afgeronde getallen), dan is er een
gemakkelijk herkenbaar doublet van 2027 en 2322 bp, en tenslotte is er een klein
fragmentje van 500 bp. Het fragmentje van 125 bp is meestal te zwak om te zien.

Er bestaan ook zgn. DNA "ladders". Dit zijn synthetische cocktails van DNA fragmenten
die van elkaar verschillen in een veelvoud van een aantal baseparen, bvb. een 123 bp
ladder bevat 34 fragmenten van 123 tot 4182 bp. Deze zijn echter niet altijd eenvoudig
te gebruiken vanwege te veel fragmenten. Kies dan een ladder met
referentiefragmenten. De foto (negatief) rechts is een 500 bp ladder twee sterker
geconcentreerde referentiebanden, nl. bij 6000 bp (helemaal bovenaan) , en bij 2000
bp (midden). De ladder leest dus vanaf onder: 500, 1000, 1500, 2000, 2500, 3000,
3500, 4000, 4500, 5000, 5500, en 6000 bp.
143

9.9.2 Agarose gel-electroforese van restrictiefragmenten


In dit voorbeeld worden verschillende bacteriële kloons (zie verder) onderzocht op hun
plasmideninhoud. De plasmide (= de vector) in de verschillende kloons bevat telkens een
insertie met een andere grootte. Dit kan bepaald worden door de plasmiden te knippen met
een restrictie-enzyme, zodat de insertie eruitgeknipt wordt.

Voor de duidelijkheid werden in dit voorbeeld de kloons gerangschikt naar stijgende insert-
grootte van de vector, van laan 1  5.

Lanen gemarkeerd "M": moleculaire gewichtsmerkers ( HindIII).

Lanen 1 t.e.m. 5: vector met steeds groter wordende insertie

Wat is de grootte van de insertie in lanen 1,2,3,4, en 5 ?


144

9.9.3 Restrictiekaarten
Men hoeft een DNA fragment niet noodzakelijk te onderwerpen aan een volledige
sequentiebepaling om het te karakteriseren. Wanneer men de knipplaats van een collectie
restrictie-enzymen bepaalt, bekomt men een restrictiekaart die typisch is voor een bepaald
DNA fragment. Wanneer men volledige genomen wenst in kaart te brengen (megabase
"mapping") zal men gebruik maken van hexaknippers of 8-knippers. Voor kleinere genomen
(plasmiden, fagen) zal men enzymen alleen en in combinatie per twee doen knippen en uit
de verschilllende fragmenten een kaart samen "puzzelen".

Restrictiekaarten worden weergegeven op verschillende manieren.

Hieronder wordt een circulaire kaart van colifaag x-174 (5386 bp) getoond. De genetische
kaart wordt weergegeven door de pijlen.
145

Hier wordt een deel getoond van een adenovirus-2 streepjeskaart (> 35.000 bp).

Een handig (gratis) internet programma dat van elke sequentie een mooie
restrictiekaart maakt: NEBcutter
146

9.9.4 Een restrictie in praktijk

Gegeven is bijvoorbeeld 2 µg van een oplossing van 125 µg/ml faag  DNA.

Opdracht: knip deze 2 µg met het enzyme Bgl II (4U/µl).

Ter info: het enzyme Bgl II uit Bacillus globigii herkend de palindroom AGATCT.

Eerst worden de correcte reactiecondities voor dit enzyme opgezocht:

 de optimale temperatuur is 37°C


 de optimale buffer bevat (finaal):
 50 mM Tris-HCl pH7.4
 10 mM MgCl2
 50 mM NaCl
 1 mM dithiothreitol (DTT)

Hiermee kan een reactiemengsel worden samengesteld in een Eppendorf buisje:

16 µl lambda DNA = 2 µg

2 µl 10x buffer

1 µl Bgl II = 4 U = 2x overmaat

1 µl H20 dest.

20 µl

Epje goed sluiten (!), en 1 uur incuberen in de voor het enzyme optimale condities, hier in
een waterbad of beter een droog warmteblok (of PCR cycler, zie later) bij 37°C. Fragmenten
analyseren met agarose-gel electroforese.
147

10. De polymerase ketting reactie


(“polymerase chain reaction”, PCR)

Referentie voor dit hoofdstuk: Orelio C., Plug M. (2019). Basisprincipes van de PCR. (Derde
druk). Syntax Media, Utrecht.

10.1 Traditionele PCR


In een polymerase ketting-reactie kan men uiterst kleine hoeveelheden DNA specifiek
vermenigvuldigen tot meetbare hoeveelheden. Een voorwaarde is wel dat men reeds enige
kennis van de sequenties heeft.

Het is op die manier mogelijk virussen en bacteriën op te sporen, en allerhande diagnoses uit
te voeren in situaties waar men weinig startmateriaal heeft (vb. forensisch onderzoek op basis
van één enkel haar). Door de combinatie van eenvoud en gevoeligheid is PCR razendsnel zeer
populair geworden in uiteenlopende domeinen. Men kan gerust spreken van een
technologische revolutie.

PCR is zowel een alternatief als een aanvulling op de "klassieke" kloneringstechnieken.

Het concept van de polymerase kettingreactie werd ontwikkeld door


Kary Mullis en Fred Faloona (Cetus corporation) in 1983 en werd
voor het eerst gepubliceerd in een Science artikel over globine-
genen in 1985. Het belang van de techniek werd echter pas duidelijk
na publicatie van een technisch artikel in 1987: "Specific synthesis
of DNA in vitro via a polymerase-catalyzed chain reaction." Methods
Enzymol. 155: 335-350 (1987).

Mullis kreeg voor de PCR reeds in 1993 de Nobelprijs chemie, slechts


10 jaar nadat het principe was ontdekt! Een interessant artikel van
Mullis over het merkwaardig verloop van de ontdekking verscheen
in Scientific American van april 1990:"The unusual origin of the polymerase chain
reaction". De eerste PCR cycler werd op de markt gebracht door de firma Perkin-Elmer.
148

10.1.1 PCR principe


In elke cyclus wordt het te kopiëren DNA door verhitting eerst enkelstrengig gemaakt. Na
hybridisatie met twee specifieke primers (kleine oligonucleotiden) kan een hitte-stabiel DNA-
polymerase (vb. Taq polymerase) de DNA strengen kopiëren en terug dubbelstrengig maken.

Het herhalen van deze cyclus levert een exponentiëel stijgende hoeveelheid gekopieerd DNA
op. Eén enkele DNA molecule kan op die manier na een 40-tal cycli geamplifieerd worden tot
microgram hoeveelheden.

Het te amplifiëren DNA wordt eerst enkelstrengig gemaakt door een korte verhitting bij 95°C
(denaturation), en na binding van de primers (annealing) kan een DNA polymerase de enkele
strengen kopiëren en dus terug dubbelstrengig maken (extension).

De kritische stap naar automatisatie van dit proces was de isolatie van het Taq
DNA polymerase. Initieel werd immers een DNA polymerase uit E. coli gebruikt,
maar dit enzyme denatureerde ook tijdens de 95°C stap, en moest dus telkens
weer opnieuw toegevoegd worden. Later werd een DNA polymerase geïsoleerd uit
de extremofiele warmwater Archaea Thermus aquaticus. Dit "Taq" DNA
polymerase bleek optimaal te werken bij 72°C, en bleef stabiel na de 95°C stap.
Een bonus was dat door de hogere extensietemperatuur de foutfrequentie fel
terugliep, m.a.w. de betrouwbaarheid of "fidelity" van dit enzyme was stukken
beter.
149

De eerste PCR cyclus:

De te amplifiëren regio noemt men het amplicon.

- Een reactiemengsel wordt alsvolgt samengesteld: het template DNA wordt in een
geschikte buffer gemengd met de enkelstrengige "forward" en "reverse" primers, de 4
nucleotiden, en het Taq polymerase. De primers zijn korte, enkelstrengige
oligonucleotiden enkele tientallen nucleotiden lang.

- Het mengsel wordt in een "cycler" geplaatst, ttz. een machine waarmee men het verloop
van de temperatuur in de reageerbuisjes cyclisch kan programmeren.

- Na verhitting bij 95°C laat men de cycler de buisjes afkoelen tot +/- 60°C om de primers
te laten hybridiseren. De exacte hybridisatietemperatuur hangt af van de grootte en de
GC inhoud van de primers (zie verder).
150

De primers zijn zo gekozen dat ze in de 5'3' richting naar elkaar toe wijzen, en
dat ze het amplicon omvatten.

Voor alle duidelijkheid: de primers liggen binnen het amplicon. De PCR


eindproducten zullen dus altijd primers bevatten. De linker primer wordt dikwijls
de Forward (FWD) of SENSE of UPSTREAM primer genoemd, de rechter de
Reverse (REV) of ANTISENSE of DOWNSTREAM primer.

- Vervolgens laat men de cycler op 72°C komen, zodat het Taq polymerase de strengen kan
kopiëren.

In deze eerste cyclus worden de strengen volledig doorgekopieerd, dus méér dan alleen de
te amplifëren regio (het amplicon). In de volgende cycli zal de amplificatie zich echter
beperken tot het amplicon zélf.

De tweede PCR cyclus.

dHet reactiemengsel wordt vervolgens voor de tweede maal verhit bij 95°C.

De figuur laat één PCR product zien uit de vorige figuur, het andere verloopt identisch.

De annealing stap verloopt nogmaals bij de voorbeeldtemperatuur van 60°C.

Nu wordt de cycler terug op 72°C geprogrammeerd zodat het Taq polymerase kan kopiëren.

In deze tweede cyclus ontstaan nu voor het eerst korte strengen (molecule B), maar nog
altijd geen dubbelstrengige moleculen die exact de lengte van het amplicon bezitten. Dit zal
slechts gebeuren in de derde cyclus.

De derde PCR cyclus.

Hier ontstaan voor het eerst dubbelstrengige DNA moleculen met exact dezelfde lengte als
het amplicon, door kopiëring van moleculen van het type "B" uit vorige figuur. Er ontstaan
dus 2 zulke moleculen in deze cyclus.

De verdere PCR cycli.

Naarmate de reacties verderlopen ontstaat een exponentieel stijgend aantal dubbelstrengige


moleculen met de exacte lengte van het amplicon. Na amper 22 cycli zijn er dan al ~1 miljoen
doelwitsequenties, en na 32 cycli reeds ~1 miljard.

Een PCR reactie levert voldoende materiaal op voor directe visualisatie van het amplicon na
gelelectroforese.
151

10.1.2 Hot-start PCR

De specificiteit van de PCR reactie is primordiaal, ttz. men wenst geen irrelevante DNA
sequenties amplifiëren. Niettegenstaande het gebruik van specifieke primers, is het risico op
aspecifieke amplificatie de achilleshiel van PCR. Hoe dit verklaren?

Wanneer allle PCR reagentia gemengd


worden (meestal op ijs), en men vervolgens
de reactie in de cycler laat opwarmen tot
95°C, ontstaan er lage temperatuurszones
(zie grafiek "suboptimal temperatures")
waarin de primers reeds aspecifiek kunnen
binden, zodat het polymerase ze nog vóór
het bereiken van de 95°C kan kopiëren.
Deze foutief geamplifieerde moleculen
worden op hun beurt in de volgende cycli
verder geamplifieerd, zodat het eindproduct
"besmet" geraakt met aspecifieke
amplicons. Dit is dan detecteerbaar als
additionele banden op een gel.

Dé oplossing bestaat er uiteraard in het Taq polymerase ( of een andere kritische parameter
zoals Mg++ ionen) pas toe te voegen als de temperatuur op 95°C komt: hot-start PCR. Er
ontstaan op die manier dus geen aspecifieke amplicons in de eerste cyclus, en hun kans op
ontstaan in de daaropvolgende cycli is veel kleiner omdat de hoge annealing-temperatuur
minder aspecifieke priming toelaat.

Het toevoegen van het enzyme of Mg++ op de 95°C stap is echter niet erg praktisch, zeker
niet voor grootschalige analyses ("high-throughput"). Het PCR buisje moet bovendien weer
geopend worden: kans op contaminatie!

"Hot-start" oplossingen:
 Manuele additie enzyme
 Manuele additie Mg++
 Was barrière: houdt polymerase gescheiden tot was smelt
 Was enzymbolletjes: idem

Wijzigingen aan het Taq polymerase:

 antilichaam-geblokkeerd Taq enzyme: Taq wordt pas actief na verhitting


 chemisch gemodifieerd Taq enzyme (covalente aminozuur modificatie: wordt actief na 2-
15 min verhitting
 fysisch gemodifieerd Taq enzyme: oligonucleotide of ligand adsorptie
152

Gemodifieerde Taq enzymes:

In de handel zijn reeds verschillende geblokkeerde of gemodifieerde Taq enzymes voorhanden


voor gebruik in een hot-start PCR.

10.1.3 Kritische PCR parameters

 Buffersamenstelling

De optimalisatie van de vrije magnesium-ion concentratie in PCR kan de specificiteit sterk


beïnvloeden.

Het is aan te bevelen de MgCl2 concentratie (tussen 0,5 en 2,5 mM) te titreren voor élke
nieuwe DNA / primer combinatie.

Bij concentraties kleiner dan 0,5 mM zal de enzymatische activiteit van het
polymerase sterk afnemen. Concentraties hoger dan 2,5 mM zal aanleiding
geven tot teveel ongewenste bijproducten.

De meest gebruikte buffer (10x) bevat meestal:

- 100 mM Tris-HCl (ph 8.3)


- 500 mM KCl
- 0.1% (g/v) gelatine
- MgCl2 (+/-15 mM MgCl2)

Mg2+ ionen neutraliseren de fosfaatgroepen van het DNA, ze vormen een oplosbaar complex
met de dNTP’s (essentieel voor dNTP incorporatie), en stimuleren ook DNA polymerase
activiteit. Ze verhogen de Tm van het ds DNA en de primer/template interactie.

te lage Mg2+ conc  onvoldoende rendement!

te hoge Mg2+ conc  accumulatie niet-specifieke producten!


153

 Primer en template concentraties

Primers worden opgebruikt tijdens de PCR, dus “overmaat” concentraties tussen 0,1 en 1,0
µM zijn OK. Een hogere concentratie primer is niet alleen duurder maar verhoogt eveneens
de kans op mis-priming en vorming van ongewenste bijproducten. De lagere concentraties
verminderen de vorming van primer-dimeren.

De 'template' concentratie zal variëren naargelang het type en zuiverheid van het DNA. Het
is het aantal kopijen dat telt, dus niet de absolute massa: voor plasmide DNA volstaan
picogrammen, terwijl voor genomisch DNA nanogrammen gebruikt worden voor het
amplificeren van een 'single copy' gen.

 Nucleotide concentratie

De deoxynucleotide trifosfaat (dNTP) concentratie moet ook getitreerd worden om een


maximale specificiteit en opbrengst te bekomen. Concentraties tussen 50 en 500 µM (meestal
200 µM) geven normaal gezien optimale resultaten. Lagere concentraties resulteren in een
verhoogde specificiteit van het geamplificeerd product, soms echter wel ten koste van een
dramatisch verlaagde opbrengst. In elk geval moeten de 4 dNTP's gebruikt worden aan
uitgebalanceerde hoeveelheden om verkeerde incorporaties te vermijden.

De optimale concentratie is afhankelijk van: MgCl2 conc, zoutconcentratie ("stringency"),


concentratie primers, lengte geamplificeerd product, aantal cycli etc...

Tegenwoordig worden al deze componenten aangeboden als 1 ‘mastermix’.

 Optimalisatie van de annealing temperatuur

De empirische formule van Wallace & Ikatura wordt dikwijls gebruikt om de annealing
temperatuur Ta te schatten. Ze steunt op het feit dat GC baseparen 3 waterstofbruggen
bezitten, en AT baseparen slechts twee. De smelttemperatuur Tm ("melting" temp.) zal vooral
toenemen naarmate er meer GC koppels zijn. Als regel neemt men een annealing temperatuur
die een 5-tal graden lager ligt dan de smelttemperatuur.

Tm = 2°C (aantal AT koppels) + 4°C (aantal GC koppels)

Ta = Tm - 5°C

De opbrengst aan PCR product is niet bijzonder gevoelig aan kleine verschillen in Ta (voor
zover ze beneden de Tm liggen!). De bepaling van een exacte Tm is echter belangrijker indien
men werkt met hybridisatieprobes (zie verder).
154

De annealing-temperatuur heeft echter wel


een effect op de specificiteit. Met sommige
PCR cyclers is het mogelijk een
temperatuursgradient te programmeren. Zo
wordt het dan heel eenvoudig om de beste Ta
empirisch te bepalen (zie foto hiernaast).

Programma’s om de Tm te bepalen (gratis) zijn er genoeg. Kijk bvb. eens op www.idtdna.com


bij “biotools”. De nauwkeurigste resultaten worden bekomen met thermodynamische
berekeningen (“nearest neighbour analysis”, Santalucia methode). Alle primer design
programma’s (zie verder) kunnen echter ook de Tm berekenen.

 PCR compatibele DNA polymerases

Verschillende thermostabiele enzymes (Taq, Vent, Tth, Pfu, Pwo..) zijn commercieel
verkrijgbaar. Deze enzymes kunnen er verschillende activiteiten op na houden
(progressiviteit, betrouwbaarheid ("fidelity"), proofreading activiteit, betere bestendigheid
tegen hogere temperaturen, terminaal deoxynucleotidyl activiteit). Het is dus mogelijk dat
een PCR lukt met het ene enzyme en totaal niets oplevert met een ander enzyme.

Recombinante enzymes worden meestal geproduceerd in E. coli. Vermits E.coli makkelijker


te groeien is dan de extremofielen zijn deze enzymes dikwijls goedkoper en bevatten ze
minder contaminanten.
155

ENZYME Natuurlijk/Recombinant Bron

Taq N Thermus aquaticus

Amplitaq R “

Amplitaq (Stoffelfragment) R “

HotTubTM N T. flavis

Pyrostase N “

Pfu N Pyrococcus furiosus

Pwo N P. woesei

Tbr N Thermus bronbranis

Tfl N T. flavis

Tgo (Roche, NEN) ? ?

Tli R Thermococcus litoralis

VentTM R “

DeepVentTM R Pyrococcus GB-D

Tth R Thermus thermophilus

Taq stoffelfragment DeepVent Vent Pfu Tth

Thermstabi- 40 80 400 1380 120 20


liteit half-
waardetijd
bij 95°C

5’3’ exo ja neen Neen neen neen Ja

3’5’ exo neen neen ja ja ja Ja

Verlengings- 75 >50 >80 ? 60 >33


snelheid in
nucl/sec

RT activ zwak zwak ? ? ? Ja

MG 94 61 ? ? 92 94
156

10.1.4 Primer design

Hiermee staat of valt je PCR !

Volgend lijstje vat samen aan welke eisen PCR primers moeten voldoen:

 Primerkoppels hebben liefst dezelfde annealing temperatuur Ta. “Forward”en


“Reverse” primers zitten in hetzelfde reactiemengsel, en er is maar één in te stellen
Ta in uw cycler. Dit betekent dat de primersequenties zo moeten gekozen worden
dat hun Ta vergelijkbaar is. Afwijkingen van 1°C zijn tolereerbaar.

 De primers mogen geen zelf-complementaire regio’s bevatten.

 De FWD en REV primer mogen niet aan elkaar binden.

 GC inhoud van de primer liefst 50% +/- 10% (Indien de primer bijzonder GC (AT)
rijk is kan men eventueel enkele A of T (G of C) residu's inbouwen aan de 5' zijde).

 GC of AT reeksen vermijden. Dit verhoogd kans op primer dimeren.

 Primerlengte is liefst 15 à 25 nucleotiden: minder = aspecifiek, meer = trage


annealing + duur

 De annealing temperatuur van de primers is liefst gelegen tussen de 55°C-65°C.


Veel labo’s ontwerpen hun primers zodanig dat ze allemaal een Ta = 60°C hebben:
praktisch + voorkomt fout-geprogrammeerde cycler !

 Blast but not least: de specificiteit van uw primers is zeer belangrijk. Er mogen geen
andere complementaire sequenties in het doelwit DNA aanwezig zijn. Dit is te
verifiëren met een homologie programma zoals BLAST. Je kan eventuele ongewenste
amplicons voorspellen met een online “in silico” PCR programma: hier wordt op basis
van je twee primers nagegaan welke amplicons ontstaan in een humaan, muis of rat
genoom.

Samengevat is primerdesign praktisch gezien niet manueel uit te voeren. Gratis primer design
programma’s kan je on-line gebruiken (vb. primer3, primerblast), gratis downloaden (vb.
FastPCR), of kopen (vb. Beacon designer, Roche probe design,...).
157

10.1.5 PCR: contaminatie

- reactieproducten van vorige PCR ("carry over")


- biologische achtergrond (patiënt, dier, ...)
- staalname
- labo personeel (haren, huidschilfers,…)
- labo omgeving, lucht
- vloeibare N2, ijs
- weefselhmogenisator
- pipetten, tips,...
- reagentia
- filters van de laminaire luchtstroom werkbank
- electroforese aparaat
- ...

10.1.6 Nuttige controle stappen

a) controle op contaminatie van de reagentia met het doelwit-DNA: PCR in afwezigheid


van exogeen toegevoegd DNA. Veruit de belangrijkste neg. controle. ("no
template control, NTC")
b) activiteit PCR mengsel: positieve controle met een gekend primer/template koppel.
c) betrouwbaarheid: herhalen PCR met alternatieve en verwante primers
d) reproduceerbaarheid en opsporen contaminaties: herhalen PCR met zelfde primers

10.1.7 Analyse van PCR producten

 Restrictie-enzyme digestie (PCR-RFLP): principe= inwerking van een restrictie-enzyme


op het amplicon en op gel klieving nagaan.

 AFLP: amplified fragment length polymorfism= amplificeren van specifieke set van
genomische restrictiefragmenten (dus eerst knippen, dan amplificeren)

 Directe sequentiebepaling: via inbouw van fluorescente dNTP’s (zie verder)

 Kwantitatieve PCR: hoeveelheid reactieproduct meten (zie verder)


158

10.1.8 Een toepassing van PCR


Analyse van “short tandem repeats” in het forensisch onderzoek (deze materie
maakt deel uit van het project forensische technieken).

Een variabel aantal tandemherhalingen (Variable Number of Tandem Repeats VNTR) is een
reeks (4-40x) opeenvolgende herhalingen van een DNA sequentie (14-100 bp), en komt
voor in mini-satelliet DNA. Het aantal herhalingen verschilt per individu, en kan ook
verschillend zijn voor dezelfde sequenties gelegen op een chromosomenpaar (“de allelen”)
binnen één individu.

Men kan met één PCR primerset dus elke kopij van een bepaald allel amplifiëren, zodat dit
bij ieder individu twee bandjes oplevert. De grootte van die bandjes kan verschillend zijn,
gelet op het variabel aantal tandemherhalingen. Deze techniek staat ook bekend als
“amplified fragment length polymorphisms”, AFLP.

Onderstaande electroforesegel (Wikipedia) toont amplificaties van het D1S80 allel, gelegen
op chromosoom 1, voor zes individuen. In dit voorbeeld zijn de individuen verschillend,
maar door toeval hoeft dit niet zo te zijn. Om deze test te gebruiken als moleculaire
“vingerafdruk” kan met het aantal onderzochte STR allelen verhogen, tot de kans op
toevallige gelijkenis uiterst klein is.

Elk allel kan dus geamplifieerd worden met een minimum en maximum grootte (afhankelijk
van het aantal herhalingen). Als men deze amplicongroottes zorgvuldig kiest, kan men ervoor
zorgen dat in een “multiplex” PCR met meerdere primersets, de amplicons elkaar niet
overlappen. Dit geeft dan aanleiding tot een voor elk individu zeer herkenbaar en uniek
ladderpatroon in een gel.
159

Het onderstaand schema toont het principe van een enkele PCR op de twee allelen van 1
persoon (bovenaan) , en de multiplex PCR analyse voor 3 VNTR loci (dus 6 allelen) op 4
personen A,B,C en F.
160

10.2 Capillaire electroforese

10.3 qPCR

10.4 dPCR

Voor de delen 10.2 – 10.4 verwijs ik naar de slides (Canvas). Verdere info kan ook gevonden
worden in het boek Orelio C., Plug M. (2019). Basisprincipes van de PCR. (Derde druk). Syntax
Media, Utrecht.

11. Methoden uit de moleculaire diagnostiek

11.1 Cytogenetica

11.2 FISH, CISH en SISH

11.3 Array CGH

11.4 SNP array

11.5 NGS

Voor deze onderdelen verwijs ik naar de slides tijdens de hoorcolleges.


161

12. DNA sequencing

De tekst uit dit hoofdstuk is aangepast uit de bachelorproef van Kitana Van Roy en Laure
Bogaerts (BMLT, 2019).

12.1 Sanger methode

First generation sequencing was de eerste sequencing methode. Hij is gelimiteerd tot het
bepalen van fragmenten van maximaal 1000 bp. De bekendste voorbeelden zijn Sanger
sequencing en Maxam-Gilbert sequencing. Sanger sequencing wordt hieronder besproken
omdat dit de basis is van het sequencen.

De Sanger sequencing methode is lang de gouden standaard methode geweest om de


nucleotide sequentie van DNA te bepalen. Deze methode vereist een enkelstrengige DNA
template, een primer, een DNA polymerase, deoxynucleotiden trifosfaat (dNTP’s) en in veel
lagere concentratie dideoxynucleotiden trifosfaat (ddNTP’s). De ddNTP’s missen een 3’-OH-
groep die nodig is voor de vorming van een fosfodiesterbinding tussen 2 nucleotiden,
waardoor extensie van het DNA stopt wanneer een ddNTP wordt ingebouwd. De concentratie
van deze ddNTP’s is 100 maal lager dan deze van de dNTP’s zodat ketenverlenging mogelijk
is en DNA-fragmenten van verschillende lengtes gegenereerd worden. Met behulp van
capillaire elektroforese zullen de verschillende DNA sequenties van elkaar gescheiden worden.
Vier verschillende ddNTP’s hebben elk een verschillend label dat door de laser van de
sequencer gedecteerd kan worden. Deze detecteren fluorescentie en outputgegevens en
zetten dit om in fluorescente piekchromatogrammen.

12.2 Next generation sequencing

Next Generation Sequencing (NGS), massively parallel of deep sequencing zijn verwante
termen die een DNA sequencing technologie beschrijven, waarmee in één dag het volledige
menselijke genoom gesequeneerd kan worden.

Het voordeel van NGS is de kostenreductie, de mogelijkheid voor grootschalige


genoomanalyses en het sequencen op elk organisme. Er kunnen grotere DNA-fragmenten
gesequeneerd worden dankzij massively parallel sequencing (MPS). Ook kan via deze
techniek whole genome sequencing (WGS) en whole exome sequencing (WES) uitgevoerd
worden. WGS is een techniek waarbij het volledige genoom (zowel exonen als intronen)
gesequeneerd wordt en bij WES worden alle proteïne-coderende regio’s, het exoom genoemd,
gesequeneerd. Er werden verschillende technieken ontwikkeld, zoals Ion Torrent, Roche
pyrosequencing techniek en sequencing by synthesis van Illumina.
162

Illumina: sequencing by synthesis (SBS)


Illumina is een bedrijf dat geïntegreerde systemen ontwikkelt, produceert en verkoopt voor
de analyse van genetische variatie en biologische functies. Illumina is op dit moment de
onbetwiste marktleider binnen de sequencing markt. Om sequencing van DNA fragmenten
mogelijk te maken moet een specifieke library preperation procedure gevolgd worden
bestaande uit klonale amplificatie en SBS om nauwkeurige en snelle sequencing mogelijk te
maken. Het principe van de techniek is als volgt:

1. Knippen van het DNA

Het fragmenteren van DNA kan op verschillende manieren gebeuren, de voornaamste zijn de
enzymatische en de mechanische techniek. Met de enzymatische methode worden enzymes
gebruikt die specifiek zullen knippen in de DNA-fragmenten. De mechanische methode maakt
gebruik van ultrasonische golven om het DNA te knippen.
Op onderstaande figuur is een schematische voorstelling van de fragmentatie van gDNA terug
te vinden.

Schematische voorstelling van de fragmentatie van gDNA. DNA-fragment wordt geknipt tot
kleinere stukken DNA waarop Library preperation uitgevoerd wordt. (BrightCore, 2015)

2. Library preparation

Library preparation is essentieel in NGS. In deze stap worden DNA-fragmenten herkenbaar


gemaakt voor het sequencing platform zodat deze gesequeneerd kunnen worden.
Na het fragmenteren zullen overhangs verkregen worden die via end repair gerepareerd
worden. Het DNA-fragment wordt blootgesteld aan 3 enzymes, namelijk: het 3’ exonuclease
dat ervoor zorgt dat de 3’overhangs verwijderd worden, DNA-polymerase dat de 5’ overhang
aanvult (zodat er blunt ends bekomen worden) en een polynucleotide kinase. Dit laatste
enzyme verplaatst fosfaat van de y-positie van adenine trifosfaat (ATP) naar het 5’ hydroxyl-
einde van het nucleotide. Deze stap wordt ‘fosforylering’ genoemd. Vervolgens vindt
adenylatie plaats. Tijdens dit proces wordt adenine toegevoegd om een TA ligatie met de y-
vormige adapter mogelijk te maken. De adapter bezit een 3’ T overhang en zal dus
complementair binden met het geadenyleerd DNA-fragment. Dit proces wordt gestart door
adaptoren en DNA-ligase toe te voegen. Op onderstaande figuur is het proces van end repair,
fosforylatie en adenylatie schematisch weergegeven.
163

Schematische voorstelling van end repair, fosforylatie en adenylatie. A 3’ nuclease verwijdert


de 3’ overhangs. B DNA-polymerase vult de 5’ overhang op. C Blunt ends bekomen door end
repair. Overdracht van fosfaat naar het 5’ hydroxyl-einde. D Adenine (weergegeven als een
groen blokje) wordt toegevoegd. (BrightCore,2015)

Het toevoegen van adaptoren is een belangrijke stap omdat deze een barcode of index
bevatten die de identificatie van verschillende biologische stalen mogelijk maakt. De DNA-
fragmenten kunnen vervolgens gepoold worden en na het sequeneren terug gescheiden
worden dankzij deze index. Meestal wordt er gebruik gemaakt van een dual indexed library,
dit wil zeggen dat er twee indexen aanwezig zijn (i7 en i5). Een single indexed library is ook
mogelijk, hier wordt er slechts gewerkt met 1 index. Een adaptor bevat ook een
herkenningssite voor de primers (zodat PCR amplificatie mogelijk is) en een flowcell
herkenningssite. Deze laatste maakt de binding aan de flowcell mogelijk via P5/P7 sites.

3. Bridge amplification
Tijdens dit proces vindt isothermische amplificatie van een library fragment plaats op een
specifieke zone op een flowcell. Door deze isothermische amplificatie worden clusters
gegenereerd die bestaan uit identieke DNA fragmenten. Een flowcell is een kleine glasplaat
waar biljoenen welletjes in zitten en die probes bevatten die complementair zijn aan de p7 en
p5 sites van de adaptoren van de libraryfragmenten.

Het template DNA komt in een welletje terecht en zal een monoclonale cluster vormen.
Bridge amplification bestaat uit verschillende stappen. Na het toevoegen van het template zal
het enkelstrengig (ssDNA) binden m.b.v. een adapter aan het oppervlak van de flowcell. De
P5 binding site bindt aan de flowcell en de P7 binding site is vrij. Nadien worden er
(ongelabelde) nucleotiden en enzymen toegevoegd om de vorming van de tweede streng te
initiëren, het flowcell oppervlak zal zich gedragen als PCR primer.
De rol van het enzyme is om er voor zorgen dat de nucleotiden gebonden worden aan het
ssDNA om via de verlenging van de keten dsDNA te vormen. Vervolgens denatureert het
dsDNA en het bekomen ssDNA bindt met de complementaire p7 binding site (brug-vorming).
De keten wordt opnieuw verlengd (= bridge amplification) en vervolgens weer gedenatureerd.
Beide strengen ontvouwen en vormen op zich weer een brug op de flowcell omdat de p7 en
p5 sites vrij zijn voor de complementaire probes op de flowcell. Opnieuw vindt er
ketenverlenging plaats, dit proces wordt herhaald tot er clusters gevormd zijn. Aan het einde
van het proces worden de P5 adapter aangehechte strengen verwijderd m.b.v. een restrictie-
enzyme zodat enkel de P7 adapter gehechte strengen overblijven en de p5 aangehechte
strengen niet kunnen interfereren tijdens de sequencing bepaling. Nu zijn er clonale clusters
164

gevormd (die uitsluitend uit p7 aangehechte strengen bestaan) die dus gesequeneerd kunnen
worden. Bovenstaand proces staat beschreven voor de sequencing bepaling voor de p7
aangehechte strengen maar bestaat uiteraard ook omgekeerd voor de p5 aangehechte
strengen.

4. Sequeneren en signaal
Na clustervorming volgt SBS. Door middel van deze techniek zullen de clusters gesequeneerd
worden. Tijdens elke sequencingcyclus worden de vier verschillende gelabelde nucleotiden
één voor één toegevoegd. Het complementaire nucleotide bindt en de rest wordt
weggewassen. Het gebonden nucleotide zal via fluorescentie bepaald kunnen worden. Dit
fluorescent signaal zal worden vastgelegd met een camera. Vooraleer de volgende cyclus
begint wordt het fluorofoor weg-gekliefd. Door het herhalen van deze sequentiecylcus zal de
volledige sequentie bepaald kunnen worden. Van elke cyclus worden camera-opnamen
gemaakt voor de vier mogelijke fluorescentiesignalen. Aan de hand van deze foto’s kan de
DNA-sequentie per cluster bepaald worden. Vervolgens worden de verkregen sequenties
geanalyseerd.
De data worden verwerkt en vergeleken met referenties, hierdoor kunnen veranderingen
en/of afwijkingen opgespoord worden.

12.3 Third generation sequencing

Er is een derde generatie technologieën, third generation sequencing (TGS), opgestart voor
het sequeneren van DNA. Het grote voordeel van TGS tegenover second generation
sequencing is dat er geen brugamplificatie nodig is omdat er nu één enkel molecule kan
gesequeneerd worden i.p.v. een cluster.
Er zijn 2 grote spelers op de markt die TGS aanbieden, namelijk Pacific Biosciences (PacBio)
en Oxford Nanopore Technologies.
De Nanoporetechniek bepaalt via een potentiaalverschil de baseopeenvolging. De nucleotiden
passeren door een nanoporie in een membraam waardoor ze de stroom gedeeltelijk
verstoren. Elk nucleotide veroorzaakt een verschillende verstoring in de stroom waardoor ze
een verschillend signaal geven.
Pacbio gebruikt een andere techniek om de basevolgorde te bepalen. Hier wordt er gebruik
gemaakt van zero mode waveguides en een geïmmobiliseerd polymerase die in staat zijn om
gelabelde nucleotiden te detecteren van één enkel DNA molecule.

Verder kan er gebruik gemaakt worden van circulair DNA; hiervoor worden adaptoren aan
het dsDNA gehangen zodanig dat het DNA circulair is. Het circulair DNA wordt herhaaldelijk
afgelezen en de uitkomsten van de reads worden per cyclus vergeleken. Op deze manier kan
een hogere accuraatheid bekomen worden.
165

13. Referenties

Geuens E., Van doorslaer E., Dewilde S., Moens L. (2010)., Experimentele vaardigheden:
biochemische vaardigheden. (1ste druk). Gent: Academia Press.

Klug W.S., Cummings M.R., Spencer C.A., Palladino M.A. (2014). Concepts of genetics. (11de
druk). Essex: Pearson

Lodish H, et al. (2016). Molecular Cell Biology. (8ste druk). Freeman and Company, New York.

Orelio C., Plug M. (2019). Basisprincipes van de PCR. (3de druk). Syntax Media, Utrecht.

Thieman, Palladino. (2017). Introduction to biotechnology. Essex: Pearson. (e-book)

Van der Leij F., Princen J. (2015). Bouwstenen van het leven. (2de druk). Wageningen
Academic Publishers.

Watson J, et al. (2014). Molecular Biology of the Gene. (7de druk). Essex: Pearson

Wilson K., Walker J. (2005). Principles and techniques of practical biochemistry. (6de druk).
Cambridge University Press.

You might also like