Professional Documents
Culture Documents
Bioinformatics
Bioinformatics
------------|-------------------------|---------
5'-UTR coderend RNA 3'-UTR
Vanuit het PTEN-gen kunnen twee varianten mRNA worden getranscribeerd. Zo kunnen twee isomeren
van het PTEN-eiwit worden geproduceerd vanaf één mRNA variant. Vanuit een ander mRNA variant kan
een andere vorm van het PTEN-eiwit worden geproduceerd. Deze drie varianten worden als volgt
genoemd:
- Transcript variant 1: PTEN (NM_000314.8, NP_000305.3),
- Transcript variant 1: PTEN-L (NM_001304717.5, NP_001291646.4),
- Transcript variant 2: PTEN isovorm 3 (NM_001304718.2 , NP_001291647.1).
Onderstaand worden een aantal primaire verschillen opgesomd:
i. Transcript variant 2 heeft meer basenparen dan variant 1, 8628 bp versus 8514 bp.
ii. Het CDS dat gebruikt wordt voor eiwitproductie is kleiner in variant 2 (1550…2170) in
vergelijking met variant 1 (846…2057 bp). Het eiwit geproduceerd door variant 2 heeft
minder aminozuren dan variant 1.
iii. Transcript variant 2 heeft een stroomopwaarts in-frame stopcodon (1397…1399 bp). Variant
1 heeft dit niet.
Van deze twee transcript varianten komt variant 1 het meest voor (?%). Deze variant is in staat om twee
isomeren van het PTEN-eiwit te produceren, PTEN (NM_000314.8, NP_000305.3) en PTEN-L
(NM_001304717.5, NP_001291646.4). De meest voorkomende is PTEN-L (NM_001304717.5,
NP_001291646.4). De bijbehorende nucleotidesequentie heeft negen verschillende exonen. Deze exonen
samen vormen de gehele nucleotidesequentie. Deze exonen en de locatie op het mRNA en op het
chromosoom zijn als volgt:
i. Exon-1: Locatie 1…924 bp,
chromosoomlocatie: 87863625…87864548 bp.
ii. Exon-2: Locatie 925…1009 bp,
chromosoomlocatie: 87894025...87894109 bp.
iii. Exon-3: Locatie 1010…1054 bp,
chromosoomlocatie: 87925513..87925557 bp.
iv. Exon-4: Locatie 1055…1098 bp,
chromosoomlocatie: 87931046…87931089 bp.
v. Exon-5: Locatie 1099…1337 bp,
chromosoomlocatie: 87933013..87933251 bp.
vi. Exon-6: Locatie 1338…1479 bp,
chromosoomlocatie: 87952118..87952259 bp.
vii. Exon-7: Locatie 1480…1646 bp,
chromosoomlocatie: 87957853..87958019 bp.
viii. Exon-8: Locatie 1647…1871 bp,
chromosoomlocatie: 87960894..87961118 bp.
ix. Exon-9: Locatie 1872…8515 bp,
chromosoomlocatie: 87965287..87971930 bp.
De niet-getransleerde regionen zijn verkort als volgt:
5’ UTR: 5’-GTT…GAC-3’ (positie: 1-843)
3’ UTR: 5’-ATT…CTA-3’ (positie: 8003-8515)
Voor de complete nucleotidesequentie wordt verwezen naar de bijlage.
Het mRNA van het PTEN-gen begint in exon-1 en eindigt in exon-9. Het coderende RNA heeft een
lengte van 403 bp. Translatie wordt gestart met een stroomafwaarts AUG startcodon en wordt
getermineerd met een stroomopwaarts UGA stopcodon. Na translatie is de volgende aminozuursequentie
geproduceerd:
MTAIIKEIVSRNKRRYQEDGFDLDLTYIYPNIIAMGFPAERLEGVYRNNIDDVVRFLDSKHKNHYKIYNL
CAERHYDTAKFNCRVAQYPFEDHNPPQLELIKPFCEDLDQWLSEDDNHVAAIHCKAGKGRTGVMICA
YLLHRGKFLKAQEALDFYGEVRTRDKKGVTIPSQRRYVYYYSYLLKNHLDYRPVALLFHKMMFETIPM
FSGGTCNPQFVVCQLKVKIYSSNSGPTRREDKFMYFEFPQPLPVCGDIKVEFFHKQNKMLKKDKMF
HFWVNTFFIPGPEETSEKVENGSLCDQEIDSICSIERADNDKEYLVLTLTKNDLDKANKDKANRYFSPN
FKVKLYFTKTVEEPSNPEASSSTSVTPDVSDNEPDHYRYSDTTDSDPENEPFDEDQHTQITKV
De aminozuursequentie die door de verschillende exonen gecodeerd worden zijn als volgt:
i. Exon-1: MTAIIKEIVSRNKRRYQEDGFDLDLT
ii. Exon-2: IYPNIIAMGFPAERLEGVYRNNIDDVV
iii. Exon-3: FLDSKHKNHYKIYN
iv. Exon-4: CAERHYDTAKFNCR
v. Exon-5: AQYPFEDHNPPQLELIKPFCEDLDQWLSEDDNHVAAIHCKAGKGRTGVMICAYLL
HRGKFLKAQEALDFYGEVRTRDKK
vi. Exon-6: GVTIPSQRRYVYYYSYLLKNHLDYRPVALLFHKMMFETIPMFSGGTC
vii. Exon-7: PQFVVCQLKVKIYSSNSGPTRREDKFMYFEFPQPLPVCGDIKVEFFHKQNKMLKK
viii. Exon-8: DKMFHFWVNTFFIPGPEETSEKVENGSLCDQEIDSICSIERADNDKEYLVLTLTKNDL
DKANKDKANRYFSPNFK
ix. Exon-9: VKLYFTKTVEEPSNPEASSSTSVTPDVSDNEPDHYRYSDTTDSDPENEPFDEDQH
TQITKV
Deze sequentie is onderstaand weergegeven:
MTAIIKEIVSRNKRRYQEDGFDLDLTYIYPNIIAMGFPAERLEGVYRNNIDDVVRFLDSKHKNHYKIYNL
CAERHYDTAKFNCRVAQYPFEDHNPPQLELIKPFCEDLDQWLSEDDNHVAAIHCKAGKGRTGVMICA
YLLHRGKFLKAQEALDFYGEVRTRDKKGVTIPSQRRYVYYYSYLLKNHLDYRPVALLFHKMMFETIPM
FSGGTCNPQFVVCQLKVKIYSSNSGPTRREDKFMYFEFPQPLPVCGDIKVEFFHKQNKMLKKDKMF
HFWVNTFFIPGPEETSEKVENGSLCDQEIDSICSIERADNDKEYLVLTLTKNDLDKANKDKANRYFSPN
FKVKLYFTKTVEEPSNPEASSSTSVTPDVSDNEPDHYRYSDTTDSDPENEPFDEDQHTQITKV
Y, R, L en V geven aminozuren aan die worden gecodeerd over een splice junction.
De PTEN-L variant gebruikt een ander startcodon, CTG, wat stroomopwaarts ligt van het startcodon van
het PTEN isovorm. De aminozuursequentie van PTEN-L is dus langer dan bij PTEN. Dit verschil is
onderstaand in het rood geaccentueerd, in vergelijking met de blauw geaccentueerde eerder genoemde
aminozuursequentie:
LERGGEAAAAAAAAAAAPGRGSESPVTISRAGNAGELVSPLLLPPTRRRRRRHIQGPGPVLNLPSAAAAP
PVARAPEAAGGGSRSEDYSSSPHSAAAAARPLAAEEKQAQSLQPSSSRRSSHYPAAVQSQAAAERGASAT
AKSRAISILQKKPRHQQLLPSLSSFFFSHRLPDMTAIIKEIVSRNKRRYQEDGFDLDLTYIYPNIIAMGFP
AERLEGVYRNNIDDVVRFLDSKHKNHYKIYNLCAERHYDTAKFNCRVAQYPFEDHNPPQLELIKPFCE
DLDQWLSEDDNHVAAIHCKAGKGRTGVMICAYLLHRGKFLKAQEALDFYGEVRTRDKKGVTIPSQRR
YVYYYSYLLKNHLDYRPVALLFHKMMFETIPMFSGGTCNPQFVVCQLKVKIYSSNSGPTRREDKFMYF
EFPQPLPVCGDIKVEFFHKQNKMLKKDKMFHFWVNTFFIPGPEETSEKVENGSLCDQEIDSICSIERA
DNDKEYLVLTLTKNDLDKANKDKANRYFSPNFKVKLYFTKTVEEPSNPEASSSTSVTPDVSDNEPDHYR
YSDTTDSDPENEPFDEDQHTQITKV
De PTEN isovorm 3 variant produceert een eiwit dat korter is dan de twee isovormen van variant 1,
doordat het een startcodon gebruikt dat stroomafwaarts is van de startcodons van de isovormen van
variant 1. Dit fenomeen vindt plaats door leaky scanning van het mRNA transcript. Hierdoor is het CDS
korter dan bij variant 1. Hetgeen dat mist in de aminozuursequentie van PTEN isovorm 3 t.o.v. PTEN is
rood geaccentueerd. Hetgeen dat wel onderdeel is van de aminozuursequentie van PTEN isovorm 3 is
blauw geaccentueerd:
MTAIIKEIVSRNKRRYQEDGFDLDLTYIYPNIIAMGFPAERLEGVYRNNIDDVVRFLDSKHKNHYKIYNL
CAERHYDTAKFNCRVAQYPFEDHNPPQLELIKPFCEDLDQWLSEDDNHVAAIHCKAGKGRTGVMICA
YLLHRGKFLKAQEALDFYGEVRTRDKKGVTIPSQRRYVYYYSYLLKNHLDYRPVALLFHKMMFETIPM
FSGGTCNPQFVVCQLKVKIYSSNSGPTRREDKFMYFEFPQPLPVCGDIKVEFFHKQNKMLKKDKMF
HFWVNTFFIPGPEETSEKVENGSLCDQEIDSICSIERADNDKEYLVLTLTKNDLDKANKDKANRYFSPN
FKVKLYFTKTVEEPSNPEASSSTSVTPDVSDNEPDHYRYSDTTDSDPENEPFDEDQHTQITKV
Met behulp van het CNNPromoter_e programma op de webserver http://www.softberry.com zijn
verschillende promotors voorspelt. Dit is gedaan door de FASTA-sequentie van PTEN(NM_000314.8) in
te voeren in het programma. De output is onderstaand weergegeven:
CNNPromoter: Identification of promoter in eukaryotic sequences by CNN models
Softberry Inc. 2016 Cite article at: https://arxiv.org/abs/1610.00121
Model: /home/wrun/cnnprom/hu_trained_model_1
>NC_000010.11:87863625-87971930 Homo sapiens chromosome 10, GRCh38.p13 Primary
Assembly
Length of sequence- 108306
Number of predicted promoters - 199
Promoter Pos: 536 Score- 1.000
Promoter Pos: 58568 Score- 0.999
Promoter Pos: 71054 Score- 0.999
…
Vanuit de 199 voorspelde promotors zijn degene die in of na de 5’-UTR liggen verwijdert. Met de
overgeblevene is een voorspelling gemaakt van de meest waarschijnlijke promotor. Dit is gedaan door de
promotor positie te vermenigvuldigen met de score. Hoe hoger de promotor positie hoe dichterbij de
promotor bij de mRNA sequentie ligt en hoe waarschijnlijker de promotor daar invloed op heeft. Hoe
hoger de score hoe hoger de mate van waarschijnlijkheid van het bestaan van de promotor. Vervolgens is
uitgekomen op de volgende promotor:
Promoter Pos: 75081 Score- 0.983
232 T ROCK1
240 Y Lck
315 Y Lck
383 T Onbekend
Tabel …: Voorspelde fosforylatie sites voor PTEN, voorspeld met behulp van
http://phospho.elm.eu.org/
Zoals te zien is in tabel… komt post-translationele fosforylatie ook voor bij het PTEN eiwit.
Fosforylatie van het PTEN eiwit heeft verscheidene effecten waaronder geremde activiteit
tegenover PIP3. lagere of hogere affiniteit voor PDZ domeinen en het stabiliseren van PTEN.
Zo wordt aminozuur 336 van het PTEN eiwit gefosforyleerd door FRK wat het eiwit beschermd
tegen ubiquitine gemedieerde afbraak van het PTEN eiwit. Fosforylatie door middel van PLK3,
wat resulteert in een stabieler PTEN eiwit en de afbraak door middel van een protease
voorkomt. Is nog een voorbeeld van hoe fosforylatie het PTEN eiwit en zijn stabiliteit beïnvloed.
Alle aminozuren waarvan het bekend is dat ze gefosforyleerd kunnen worden zijn aangegeven
in tabel….. Naast fosforylatie is er ook een aminozuur in het PTEN eiwit wat acetylering kan
ondergaan Thr-2, echter door welk enzym dit wordt gekatalyseerd en wat voor een effect dit
heeft is onbekend.
Aminozuur Aminozuur Soort PTM
Nr.
2 Threonine Acetylering
Naast fosforylatie sites waren er ook mogelijke glycosylatie sites voorspeld. Glycosylering is een
enzymatisch proces waarbij suikergroepen worden toegevoegd aan een eiwit. Een groot deel van de
eiwitten gesynthetiseerd op het ruw endoplasmatisch reticulum ondergaan glycosylering. Deze
gekoppelde suikergroepen vervullen verschillende structurele en functionele rollen in eiwitten. De
voorspelling voor mogelijke plekken in het PTEN eiwit die glycosylering ondergaan werd gemaakt met
behulp van het NetNGlyc programma op de webserver http://www.cbs.dtu.dk/services/NetNGlyc/ .
NetNGlyc is instaat om N-glycosylatie sites te voorspellen voor humane eiwitten. Het algoritme heeft
maar één positie gevonden die mogelijk glycosylering kan ondergaan, echter de website gaf ook aan dat
het PTEN eiwit geen signaal peptide bevat en dat hierdoor de kans heel klein is dat deze glycosylering
ondergaat ook al bevat het eiwit een motief hiervoor. Er is ook geen experimentele data gevonden die
aantoont dat glycosylering voorkomt bij het PTEN eiwit als vorm van post translationele modificatie.
Ook al was er geen experimentele data gevonden voor de glycosylering van PTEN er is wel
experimentele data gevonden die ondersteund dat PTEN wel een andere post translationele modificatie
ondergaat, namelijk acetylering. Uit experimentele data is er gevonden dat er acetylering plaatsvindt bij
het tweede aminozuur, threonine, van het eiwit PTEN. Er was een poging gedaan om mogelijke
voorspelde data te vergelijken met experimenteel gevonden data over de post translationele modificatie
acetylering voor het PTEN eiwit. Echter online is er geen programma of website gevonden die instaat is
om deze voorspelling voor acetylering uit te voeren.
MicroRNA (miRNA) is een vorm van niet-coderend RNA van 20 tot 25 nucleotiden lang en is
onderdeel van de epigenetische mechanismen die de expressie van genen reguleren.
RNAi of RNA interferentie is een biologisch process waarbij RNA moleculen gen expressie of
mRNA translatie remmen door middel van het neutraliseren van mRNA moleculen. Dit kan
bijvoorbeeld door het blokkeren van het mRNA molecuul waardoor translatie niet mogelijk is of
door het afbreken van het mRNA molecuul. Er zijn geen RNA moleculen bekend die de
genexpressie van PTEN beïnvloeden. Echter er zijn wel meerdere micro RNA - en RNA –
moleculen betrokken bij de translatie van PTEN mRNA. MicroRNAs: miR-17, miR19a, miR-19b,
miR-20a, miR-20b, miR-21, miR-22, miR-25, miR 26A1, miR 26A2, miR-93, miR-106a, miR-
106b, miR 205, en miR 214 zijn in staat om te binden aan PTEN mRNa en remmen hierdoor de
translatie van het mRNA na het eiwit. De binding van de bovenstaande microRNAs aan het
PTEN mRNA kunnen worden geblokkeerd door non-coding en coding RNAs zoals SERINC1,
VAPA, CNOT6L en PTENP1. Dit voorkomt dus dat de translatie van PTEN mRNA wordt
geremd door deze microRNAs.
Weefsels.
Komt op een relatief hoog niveau tot uiting in alle volwassen weefsels, inclusief hart, hersenen,
placenta, long, lever, spieren, nieren en pancreas…
Literatuur: "Identification of a candidate tumour suppressor gene, MMAC1, at chromosome
10q23.3 that is mutated in multiple advanced cancers.
PTEN is een eiwit dat voorkomt in praktisch alle weefsels van het lichaam. Dit komt omdat
PTEN een lichaamswijd doel en effect heeft. Er is echter aangetoond dat het voornamelijk
voorkomt in …
Tsou, H., Ping, X., Xie, X. et al. The genetic basis of Cowden’s syndrome: three novel mutations in
PTEN/MMAC1/TEP1. Hum Genet 102, 467–473 (1998).
https://doi-org.saxion.idm.oclc.org/10.1007/s004390050723
Zo hebben veel mutaties als consequentie het verlies van fosfatase activiteit. Aangezien fosfatase zorgt
voor de hydrolyse van het substraat heeft het verlies van deze activiteit een verminderd katalytische
werking tot gevolg. Het verlies van de katalytische werking van het eiwit heeft als gevolg dat PTEN zo
goed als onschadelijk gemaakt wordt. Hierdoor kan PTEN niet zijn remmende werking op de AKT-PKB
signaleringsroute hebben. Zoals eerder genoemd kan snel gezien worden dat door het ontbreken van de
regulerende functie van PTEN de cel cyclus en het metabolisme ongeremd werken en zullen zorgen voor
tumoren.
Voor de precieze puntmutaties wordt verwezen naar de bijlage.
ENKELE IN REGIO 2.
De volgende genen zijn gevonden als vermeende homologen via het programma HomoloGene via de
webserver https://www.ncbi.nlm.nih.gov/.
- PTEN, H.sapiens: NP_000305.3
- PTEN, P.troglodytes: XP_521544.3
- PTEN, M.mulatta: XP_001102542.1
- PTEN, C.lupus: NP_001003192.1
- PTEN, B.taurus: XP_002698416.1
- Pten, M.musculus: NP_032986.1
- Pten, R.norvegicus: NP_113794.1
- PTEN, G.gallus: XP_421555.2
- pten, X.tropicalis: NP_001116943.1
- ptenb, D.rerio: NP_001001822.1
- Pten, D.melanogaster: NP_001162933.1
- AgaP_AGAP009628, A.gambiae: XP_553421.2