Professional Documents
Culture Documents
Tríc thÕ kû 19, c¸c vÊn ®Ò c¬ b¶n cña sù sèng mang tÝnh siªu h×nh, thuéc ph¹m vi gi¶i
quyÕt cña thÇn häc vµ triÕt häc.
Nöa sau thÕ kû 19, thuyÕt tiÕn ho¸ vµ thuyÕt tÕ bµo ra ®êi ®· ®Æt nÒn mãng cho sù ra ®êi
cña sinh häc víi t c¸ch lµ mét ngµnh khoa häc thùc nghiÖm.
- ThuyÕt tiÕn ho¸ ph¸t sinh tõ quan s¸t cña c¸c nhµ tù nhiªn häc. Theo J.B. Lamarck,
nhµ ®éng vËt häc ngêi Ph¸p, gi¶i thÝch c¬ chÕ tiÕn ho¸ cña c¸c loµi cao cÊp tõ c¸c loµi ®¬n gi¶n
h¬n. ¤ng cho r»ng: (1) c¸c c¬ quan cña c¬ thÓ cã thÓ ®îc ph¸t triÓn vµ c¶i tiÕn khi ®îc sö
dông mét c¸ch lÆp ®i lÆp l¹i, cßn nã sÏ bÞ yÕu dÇn nÕu kh«ng ®îc sö dông. (2) Nh÷ng biÕn ®æi
vÒ cÊu tróc thu ®îc trong ®êi sèng cña sinh vËt ®îc truyÒn l¹i cho con c¸i. VÝ dô Lamarck tin
r»ng cæ dµi vµ ch©n tríc cña h¬u cao cæ ®îc h×nh thµnh do tËp qu¸n vÆt l¸ c©y. ¤ng cho r»ng
tæ tiªn cña h¬u cao cæ lµ lo¹i ng¾n cæ nhng do ph¶i thêng xuyªn v¬n cæ ra ®Ó h¸i l¸ c©y
nªn qua nhiÒu thÕ hÖ cæ cña chóng dµi thªm ra. ë mét khÝa c¹nh nµo ®ã thuyÕt nµy cã vÎ ®óng
nhng cha cã b»ng chøng thùc nghiÖm nµo chøng minh. C¸c ®Æc tÝnh di truyÒn cña sinh vËt
®îc kiÓm tra bëi c¸c gen vµ ngêi ta thÊy kh«ng cã c¸ch nµo ®Ó cÊu tróc cña DNA t¹o nªn c¸c
gen l¹i bÞ thay ®æi ®Ó ph¶n ¸nh c¸c ho¹t ®éng cña mét c¸ thÓ.
1
- Darwin vµ Wallace: Sau khi nghiªn cøu vµ quan s¸t sù ph©n bè ®Þa lý cña c¸c ®éng thùc
vËt ®ång thêi ghi nhËn c¸c ®iÓm sai kh¸c vµ gièng nhau gi÷a c¸c nhãm ®éng thùc vËt th©n cËn
(vÝ dô: loµi chim sÎ), hai «ng ®· nhËn thÊy r»ng thÕ giíi sèng kh«ng bÊt biÕn vµ c¸c loµi sinh
vËt biÕn ®æi khi xem xÐt chóng trong mét kho¶ng thêi gian ®ñ dµi. Tõ ®ã hä ®· nªu ra gi¶ thiÕt
lµ do mét sè ¸p lùc cña m«i trêng xung quanh (thiªn tai, biÕn ®éng nhiÖt ®é vµ ®é ma...) ®·
¸p ®Æt mét sù chän läc tù nhiªn lªn c¸c thÕ hÖ nèi tiÕp nhau. ë mçi thÕ hÖ cã thÓ xuÊt hiÖn
nh÷ng biÕn ®æi cho phï hîp víi m«i trêng xung quanh vµ c¸c biÕn ®æi ®ã ®îc truyÒn cho thÕ
hÖ sau.
H×nh 2. Charles Darwin (ph¶i), Alfred Wallace (tr¸i) cïng víi c¸c loµi sÎ Darwin vµ vÞ trÝ
quÇn ®¶o Galapagos
- ThuyÕt tÕ bµo: "Mçi sinh vËt ®îc cÊu t¹o tõ mét tËp hîp c¸c ®¬n vÞ sèng, mçi ®¬n vÞ
mang trong nã tÊt c¶ c¸c ®Æc tÝnh cña sù sèng".
ThuyÕt tÕ bµo ra ®êi cïng víi sù hoµn thiÖn kü thuËt kÝnh hiÓn vi, ®Æc biÖt viÖc thõa nhËn
c¸c tÕ bµo bÞ c« lËp cã thÓ t¨ng trëng vµ ph©n chia ®· ®ãng mét vai trß hÕt søc quan träng trong
sù h×nh thµnh thuyÕt nµy.
Nöa sau thÕ kû 17, A. Leeuwenhoek ®· quan s¸t thÊy nh÷ng sinh vËt li ti trong mét giät
níc ao nhê kÝnh phãng ®¹i, tiÕp theo sau Leeuwenhoek, R. Hoek m« t¶ cÊu tróc hiÓn vi cña sîi
bÇn vµ gäi chóng lµ "tÕ bµo" (cell).
Nhng m·i ®Õn hai thÕ kû sau, sù hoµn thiÖn cña kÝnh hiÓn vi cïng víi c¸c kü thuËt b¶o
qu¶n c¾t l¸t m« míi cho phÐp c¸c nhµ nghiªn cøu thÊy r»ng m« sèng h×nh thµnh tõ tÕ bµo. N¨m
1838, nhµ thùc vËt häc J. Schleiden vµ nhµ ®éng vËt häc T. Schwann (1839) c«ng bè häc thuyÕt
tÕ bµo ë §øc víi néi dung "tÊt c¶ c¸c sinh vËt ®Òu ®îc cÊu t¹o tõ tÕ bµo". N¨m 1858, R. Virchov
(ngêi §øc) ®· ph¸t triÓn thªm thuyÕt tÕ bµo víi néi dung "tÊt c¶ c¸c tÕ bµo ®Òu b¾t nguån tõ
nh÷ng tÕ bµo sèng tríc nã vµ kh«ng cã sù h×nh thµnh tÕ bµo ngÉu nhiªn tõ chÊt v« sinh".
Tríc thÕ kû 19, hÇu hÕt c¸c nhµ khoa häc vµ triÕt häc ®Òu c«ng nhËn thuyÕt sinh lùc luËn
vµ thuyÕt tù sinh. Nhng sù ra ®êi cña thuyÕt tÕ bµo, ®Æc biÖt lµ c¸c thÝ nghiÖm cæ ®iÓn cña
Pasteur ®· chøng minh sù sèng chØ cã thÓ sinh ra tõ sù sèng, ®· ®¸nh ®æ hai häc thuyÕt trªn vµ
x©y dùng nÒn mãng v÷ng ch¾c cho sinh häc hiÖn ®¹i. §Æc biÖt, thuyÕt tÕ bµo ®· ®ãng gãp quan
träng cho sù ph¸t triÓn cña khoa häc nu«i cÊy tÕ bµo: tÕ bµo riªng lÎ cã kh¶ n¨ng t¨ng trëng vµ
ph©n chia ®éc lËp, do ®ã, nã cã thÓ ®îc sö dông lµm ®èi tîng cho nghiªn cøu vËt chÊt sèng,
kü thuËt nu«i cÊy tÕ bµo trong in vitro lµ mét kü thuËt kh«ng thÓ thiÕu trong nhiÒu nghiªn cøu
hiÖn nay.
2
2. Sinh ho¸ häc cæ ®iÓn vµ di truyÒn häc cæ ®iÓn
- Sinh häc thùc nghiÖm ph¸t triÓn dùa trªn nÒn t¶ng cña thuyÕt tÕ bµo vµ thuyÕt tiÕn ho¸
víi hai ngµnh häc lín: sinh ho¸ häc chuyªn c« lËp vµ x¸c ®Þnh tÝnh chÊt c¸c thµnh phÇn tÕ bµo
cßn di truyÒn häc nghiªn cøu sù di truyÒn c¸c ®Æc tÝnh ë c¸c c¬ thÓ sèng nguyªn vÑn.
- Sinh ho¸ häc: ®îc h×nh thµnh khi ngêi ta chøng minh ®îc r»ng c¸c biÕn ®æi ho¸ häc
cña c¬ thÓ sèng nguyªn vÑn cã thÓ x¶y ra trong dÞch chiÕt tÕ bµo, vÝ dô: dÞch chiÕt tÕ bµo nÊm
men lªn men rîu vang.
- Di truyÒn häc: Tríc Mendel (thÕ kû 19), c¸c nhµ khoa häc cho r»ng c¶ cha vµ mÑ ®Òu
gãp phÇn vµo sù h×nh thµnh tÝnh tr¹ng cña hËu thÕ. Tuy nhiªn, c¸c quan niÖm phæ biÕn hiÖn thêi
lµ sù di truyÒn hoµ hîp, tøc lµ c¸c tÝnh tr¹ng cña cha vµ mÑ trén lÉn vµo nhau t¹o nªn c¸c tÝnh
tr¹ng trung gian ë con c¸i. §Õn giai ®o¹n cña Mendel: Mendel lµ ngêi ®Çu tiªn ph¸t hiÖn ra
quy luËt di truyÒn, lµ mét bíc tiÕn khæng lå so víi tr×nh ®é khoa häc lóc bÊy giê c¶ vÒ ph¬ng
ph¸p luËn lÉn mÆt nhËn thøc, cho nªn nh÷ng quy luËt di truyÒn cña «ng m·i ®Õn n¨m 1900 míi
®îc ®¸nh gi¸ ®óng gi¸ trÞ cña nã còng nh sù ®ãng gãp cña «ng cho sù ph¸t triÓn cña di truyÒn
häc. Theo Mendel c¸c tÝnh tr¹ng ®îc ph©n ly ®éc lËp kh«ng hoµ lÉn vµo nhau vµ «ng ®· sö
dông ph¬ng ph¸p thèng kª to¸n häc ®Ó ph©n tÝch kÕt qu¶.
H×nh 3. G. Mendel vµ khu vên thÝ nghiÖm cña «ng, hiÖn nay lµ mét phÇn cña b¶o tµng Mendel.
- N¨m 1900 ®îc coi lµ n¨m khai sinh vµ thÕ kû 20 lµ thÕ kû ph¸t triÓn cña di truyÒn häc.
N¨m 1902, W. Baterson vµ L. CuÐnot chøng minh c¸c quy luËt Mendel ë ®éng vËt vµ trong
nh÷ng n¨m nµy c¸c hiÖn tîng t¬ng t¸c gen còng ®· ®îc ph¸t hiÖn. Cïng thêi gian nµy kh¸i
niÖm vÒ nhiÔm s¾c thÓ ®îc nªu ra: nhiÔm s¾c thÓ chÝnh lµ gi¸ thÓ mang c¸c nh©n tè di truyÒn.
ë ®éng vËt bËc cao, mét c¸ thÓ míi ®îc ph¸t sinh tõ sù kÕt hîp cña trøng vµ tinh trïng. C¶
trøng, víi mét lîng tÕ bµo chÊt lín, lÉn tinh trïng, chØ chøa nh©n lµ chñ yÕu, ®Òu cã ®ãng gãp
®ång ®Òu vÒ mÆt di truyÒn cho hîp tö. ChÝnh ®iÒu nµy cho thÊy ý nghÜa quyÕt ®Þnh cña nh©n
trong hiÖn tîng di truyÒn. Khi quan s¸t nh©n díi kÝnh hiÓn vi, ngêi ta ph¸t hiÖn thÊy nh÷ng
cÊu tróc d¹ng sîi vµ gäi ®ã lµ nhiÔm s¾c thÓ. W. Sutton (1903) khi nghiªn cøu sù ph©n chia tÕ
bµo ®Ó h×nh thµnh giao tö, nhËn thÊy r»ng c¸c nhiÔm s¾c thÓ ®îc ph©n chia sao cho mçi giao
tö chØ nhËn ®îc mét nhiÔm s¾c thÓ cña bè hoÆc cña mÑ. Liªn hÖ víi c«ng tr×nh cña Mendel ®·
3
®Ò cËp tríc ®ã; giao tö ®ùc (tinh trïng) cña bè vµ giao tö c¸i (trøng) cña mÑ ®ãng gãp mçi bªn
mét nhiÔm s¾c thÓ vµo sù h×nh thµnh c¸ thÓ con.
H×nh 4: S¬ ®å di truyÒn tÝnh tr¹ng mµu m¾t ë ruåi giÊm qua c¸c phÐp lai kh¸c nhau
NhiÔm s¾c thÓ chøa mét chuçi c¸c gen cã kh¶ n¨ng thay ®æi chç. Vµo ®Çu nh÷ng n¨m
1900, Thomas Hunt Morgan b¾t ®Çu nghiªn cøu sù ph©n li c¸c nh©n tè di truyÒn hay gen (tªn
do Wilhelm Johannsen ®Æt n¨m 1909) vµ mèi liªn hÖ gi÷a sù ph©n li nµy víi cÊu tróc nhiÔm s¾c
thÓ trªn ®èi tîng lµ ruåi giÊm (Drosophila melanogaster). §Çu tiªn, «ng nhËn thÊy sù x¸c ®Þnh
giíi tÝnh phô thuéc vµo mét nhiÔm s¾c thÓ ®Æc biÖt: nhiÔm s¾c thÓ giíi tÝnh. Sau ®ã, khi nghiªn
cøu nh÷ng con ruåi mang nhiÒu ®Æc tÝnh di truyÒn kh¸c nhau, Morgan ph¸t hiÖn r»ng c¸c gen ë
ruåi ®îc ph©n bè thµnh bèn nhãm mµ «ng gäi lµ nhãm liªn kÕt. ¤ng liªn hÖ 4 nhãm nµy víi
sù tån t¹i cña 4 nhiÔm s¾c thÓ ë ruåi. C¸c c«ng tr×nh vÒ sau trªn b¾p, ®Ëu ®· x¸c nhËn sù ®ång
nhÊt gi÷a sè lîng c¸c nhãm liªn kÕt vµ c¸c nhiÔm s¾c thÓ. C¸c nhµ di truyÒn häc ruåi giÊm ®·
cã mét ®ãng gãp c¬ b¶n khi chøng minh ®îc r»ng c¸c gen ®îc ph©n bè thµnh chuçi trªn
nhiÔm s¾c thÓ ë c¸c vÞ trÝ x¸c ®Þnh. Tuy nhiªn, Barbara McClintock (1931) ®· cho thÊy r»ng vÞ
trÝ c¸c gen cã thÓ thay ®æi khi chøng minh mèi liªn hÖ gi÷a sù s¾p xÕp l¹i c¸c ®o¹n nhiÔm s¾c
thÓ víi sù s¾p xÕp l¹i c¸c ®Æc tÝnh di truyÒn ë b¾p (Zea mais). C¸c nghiªn cøu di truyÒn cæ ®iÓn
trªn nªu râ b¶n chÊt vËt lÝ cña gen vµ tõ gi÷a nh÷ng n¨m 30 gen kh«ng cßn lµ kh¸i niÖm trõu
tîng mµ trë thµnh thùc thÓ ®o ®Õm ®îc. Sù kÕt hîp gi÷a di truyÒn häc vµ sinh ho¸ häc ®·
chøng minh ®îc b¶n chÊt ho¸ häc cña gen.
4
3. Sù phèi hîp gi÷a di truyÒn häc vµ sinh ho¸ häc
ViÖc nghiªn cøu mét c¨n bÖnh ë ngêi lÇn ®Çu tiªn ®· cho thÊy mét bÊt
thêng sinh ho¸ lµ do mét thiÕu sãt di truyÒn. Archibald Garrod (1909) nhËn thÊy
r»ng bÖnh alcaptonurie lµ kÕt qu¶ cña mét ®ét biÕn lÆn hiÕm, di truyÒn theo c¸c
quy luËt Mendel. ¤ng nghi ngê nguyªn nh©n cña bÖnh lµ do ë bÖnh nh©n bÞ thiÕu
mét enzyme cña chuçi chuyÓn ho¸ c¬ b¶n. §iÒu nµy ®· ®îc chøng minh sau ®ã,
enzyme thiÕu lµ mét oxydase cã kh¶ n¨ng ph©n huû c¸c hîp chÊt cã vßng phenol,
nªn trong níc tiÓu bÖnh nh©n cã hµm lîng homogentisic acid (mét hîp chÊt cã
vßng phenol) rÊt cao. Nhng lóc bÊy giê ngêi ta cha thÓ biÕt r»ng chÝnh gen quy
®Þnh cÊu tróc enzyme míi lµ nguån gèc thËt sù cña hiÖn tîng nµy.
H×nh 5: ThÝ nghiÖm ®ét biÕn mµu m¾t ruåi giÊm (Beadle vµ Ephrussi)
C¸c nghiªn cøu trªn ruåi giÊm gióp x¸c lËp mèi t¬ng quan gi÷a ho¹t ®éng
cña mét gen víi mét ph¶n øng ho¸ häc. ë ruåi giÊm hoang d¹i m¾t cã mµu ®á
sÉm do sù kÕt hîp hai s¾c tè ®á, nh÷ng con mang ®ét biÕn mµu m¾t ë mét trong
hai gen cinnabar vµ vermillon cã m¾t ®á t¬i. George W. Beadle vµ Boris Ephrussi
khi tiÕn hµnh thÝ nghiÖm trªn c¸c chñng ruåi giÊm ®ét biÕn nµy, ®· kÕt luËn r»ng
hai gen cinnabar vµ vermillon quy ®Þnh hai enzyme thuéc chuçi chuyÓn ho¸
5
tryptophan, mét gen ®ét biÕn sÏ dÉn ®Õn sù kh«ng h×nh thµnh ®îc enzyme t¬ng
øng vµ tryptophan kh«ng ®îc chuyÓn ho¸ thµnh mét trong hai s¾c tè ®á khiÕn
cho m¾t nh¹t mµu. C«ng tr×nh nµy ®· më mµn cho sù hîp nhÊt hai ngµnh Di truyÒn
häc vµ Sinh ho¸ häc.
HiÖn tîng mét gen quy ®Þnh ho¹t tÝnh mét enzyme th× ®îc x¸c ®Þnh nhê
c¸c thÝ nghiÖm trªn nÊm mèc Neurospora crassa. Mét hÖ thèng di truyÒn cßn ®¬n
gi¶n h¬n c¶ ruåi giÊm ®îc Beadle vµ Edward L. Tatum sö dông ®ã lµ nÊm mèc
Neurospora crassa. ë nÊm nµy mét c¸ thÓ con h×nh thµnh tõ sù phèi hîp cña bè
vµ mÑ nh ë c¸c sinh vËt thîng ®¼ng, do ®ã cã thÓ sö dông nã lµm ®èi tîng cho
c¸c thÝ nghiÖm lai. §iÓm ®Æc biÖt quý lµ ngêi ta cã thÓ nu«i cÊy chóng in vitro
trªn m«i trêng rÊt th« s¬ (gåm níc, ®êng, vµi muèi vµ mét sè chÊt ®¬n gi¶n
kh¸c). Bµo tö hoang d¹i cña nÊm mäc ®îc trªn m«i trêng th« s¬ kÓ trªn, nhng
mét sè Ýt ®ét biÕn chØ mäc ®îc khi bæ sung mét amino acid hay mét vitamin. C¸c
t¸c gi¶ kÕt luËn r»ng mét tÕ bµo ®ét biÕn chØ mäc ®îc khi cã bæ sung mét chÊt
nhÊt ®Þnh chøng tá nã cã mang mét biÕn ®æi di truyÒn lµm ¶nh hëng ®Õn sù s¶n
xuÊt mét enzyme cÇn cho tiÕn triÓn cña mét chuçi chuyÓn ho¸ t¹o thµnh chÊt ®ã.
Nãi kh¸c ®i, mét gen quy ®Þnh mét enzyme nhÊt ®Þnh.
H×nh 6: ThÝ nghiÖm chøng minh vËt chÊt di truyÒn lµ DNA ë vi khuÈn S, pneumoniae
ViÖc x¸c ®Þnh DNA chÝnh lµ vËt chÊt di truyÒn ®· më mµn cho nh÷ng nghiªn
cøu ph©n tö vÒ cÊu tróc vµ chøc n¨ng cña gen. N¨m 1944, Oswald Avery, Colin
MacLeod vµ MacLyn McCarty nghiªn cøu Streptococcus pneumoniae, mét vi
khuÈn g©y viªm phæi. C¸c chñng cã ®éc tÝnh cao ®îc gäi lµ S (Smooth nghÜa lµ
6
tr¬n l¸ng), cßn R (rough nghÜa lµ sÇn sïi) lµ chñng cã ®éc tÝnh thÊp, tªn gäi nµy
dùa vµo ®Æc tÝnh bÒ mÆt cña khuÈn l¹c tr¬n hay sÇn. Dùa vµo quan s¸t tríc ®ã cña
b¸c sÜ ngêi Anh Fred Griffiths cho thÊy chñng R cã thÓ biÕn thµnh chñng S trong
c¬ thÓ chuét bÞ nhiÔm, Avery vµ c¸c céng sù ®· t¸ch chiÕt DNA cña chñng S ®em
cho vµo c¸c tÕ bµo nu«i cÊy chñng R. KÕt qu¶ lµ mét sè khuÈn l¹c biÕn thµnh tr¬n
l¸ng: chóng ®· ®îc biÕn n¹p. C¸c t¸c gi¶ ®· chøng minh ®îc r»ng DNA chÝnh
lµ nh©n tè biÕn n¹p lµm thay ®æi kiÓu di truyÒn ë c¸c phÕ cÇu khuÈn
(pneumococcus). Alfred Hershey vµ Martha Chase (1952) cñng cè thªm ph¸t hiÖn
trªn b»ng c¸c thÝ nghiÖm trªn thùc khuÈn thÓ (phage), ®ã lµ c¸c virus cã kh¶ n¨ng
x©m nhiÔm vµo vi khuÈn. C¸c t¸c gi¶ cho thÊy chØ cã DNA cña virus x©m nhËp
vµo vi khuÈn, ë ®ã th«ng tin di truyÒn chøa trong DNA sÏ ®îc dïng ®Ó tæng hîp
nh÷ng phÇn tö virus míi.
H×nh 7: M« h×nh cÊu tróc DNA vµ s¬ ®å liªn kÕt ho¸ häc cña DNA
Sù ph¸t hiÖn cÊu tróc xo¾n kÐp cña DNA bëi James D. Watson vµ Francis
H.C. Crick (1953) chÝnh thøc khëi ®Çu cho thêi kú hiÖn ®¹i cña Sinh häc ph©n tö.
Cã hai nh©n tè quan träng ®· gióp Watson vµ Crick x©y dùng m« h×nh cÊu tróc
ph©n tö DNA. Thø nhÊt, ®ã lµ c«ng tr×nh cña Edwin Chargaff cho thÊy DNA lÊy
tõ nhiÒu nguån kh¸c nhau ®Òu cã mét hµm lîng adenine b»ng víi hµm lîng
thymine vµ mét hµm lîng guanine b»ng víi cytosine. KÕ ®Õn, c¸c nghiªn cøu sîi
DNA b»ng t¸n x¹ tia X (X-ray diffraction) cña Maurice Wilkins vµ céng sù c«ng
bè nhiÒu chi tiÕt quan träng vÒ cÊu tróc ph©n tö DNA nh: d¹ng xo¾n, ®êng kÝnh
2nm, kho¶ng c¸ch gi÷a hai base liªn tiÕp lµ 0,34nm, sè lîng base trªn mçi vßng
xo¾n lµ 10. ChÝnh tõ sù so s¸nh c¸c sè liÖu trªn mµ m« h×nh ph©n tö DNA ra ®êi.
7
CÊu tróc ®¬n gi¶n vµ mang tÝnh tù bæ sung cña ph©n tö DNA gîi ý cho c¬
chÕ tù sao chÐp DNA ë mçi thÕ hÖ tÕ bµo còng nh c¬ chÕ tæng hîp RNA tõ khu«n
DNA.
8
Vµo cuèi nh÷ng n¨m 70, sù xuÊt hiÖn mét lo¹t kü thuËt míi ®· t¹o ra cuéc
c¸ch m¹ng trong sinh häc ph©n tö. Víi c¸c enzyme c¾t h¹n chÕ ngêi ta cã thÓ c¾t
ph©n tö DNA ë nh÷ng vÞ trÝ x¸c ®Þnh thµnh nh÷ng ®o¹n cã kÝch thíc mong muèn,
g¾n chóng vµo c¸c vector, råi chuyÓn vµo tÕ bµo vi khuÈn. ViÖc nu«i cÊy c¸c tÕ
bµo vi khuÈn nµy cho phÐp thu håi l¹i mét lîng lín DNA cÇn. §ã lµ ph¬ng ph¸p
t¹o dßng. Sau ®ã, ngêi ta ®· hoµn thiÖn c¸c ph¬ng ph¸p x¸c ®Þnh nhanh tr×nh tù
DNA. Nh vËy, c¸c nhµ sinh häc b©y giê kh«ng chØ ngåi ®Õm nhiÔm s¾c thÓ hay
thiÕt lËp b¶n ®å gen dùa vµo ®ét biÕn vµ lai, hä cßn n¾m ®Õn tõng nucleotide cña
®o¹n DNA. H¬n thÕ n÷a, hä cßn cã thÓ tuú ý t¹o c¸c ®ét biÕn trªn ®o¹n DNA råi
chuyÓn chóng trë vµo tÕ bµo ®Ó nghiªn cøu chøc n¨ng cña mét gen trªn mét lo¹i
tÕ bµo x¸c ®Þnh.
Cïng víi sù thùc hiÖn mét kú c«ng: X¸c ®Þnh tr×nh tù toµn bé bé gen ngêi,
Sinh häc ph©n tö cßn híng ®Õn gi¶i quyÕt nhiÒu vÊn ®Ò lín: bÖnh ung th, sù
ph¸t triÓn ph«i vµ biÖt ho¸ m«.
1875 Vai trò của nhân trong thụ tinh và phân chia tế bào – O. Hertwig
1902 Lần đầu tiên công bố các bệnh di truyền ở người – A. Garod
9
1902 Thuyết di truyền nhiễm sắc thể – W. Sutton, T. Boveri
1903 Lần đầu công bố mối quan hệ giữa allen và gen – W.E. Castle
1950 Thí nghiệm về sự biểu hiện của gen nhảy ở bắp, nay gọi là nhân tố
chuyển vị – B. McClintock
1952 Chứng minh vật chất di truyền ở bacteriophage T2 là DNA –
A.Hershey, M. Chase
1953 Công bố mô hình DNA xoắn kép – J. Waston, F. Crick
1958 Chứng minh mô hình sao chép DNA là sao chép bán bảo tồn – M.
Meselson, F. Stahl
Phân lập DNA polymerase I từ E.coli – A.Kornberg
1959 - Phát hiện RNA polymerase, mRNA, cấu trúc operon ở vi khuẩn, giải
1966 mã hoàn toàn bảng mã bộ ba
1972 - Tạo DNA tái tổ hợp trong ống nghiệm, sử dụng DNA plasmid nhân
1975 dòng DNA, phát triển các phương pháp phân lập các tRNA, RNA sử
dụng trong các kỹ thuật nhân dòng gen
Năm Sự kiện lịch sử
công bố
1977 Phát triển kỹ thuật giải trình tự gene – W.Gilbert, F. Sanger
Phát hiện intron trong gen của eukaryote – P.Sharp etc.
1983 Phát hiện khả năng tự cắt của RNA intron – T.Cech, S. Altman
1986 Hoàn thiện kỹ thuật PCR khuếch đại đoạn DNA xác định – K. Mullis
etc.
10
1990 Dự án giải trình tự gen người (Human Genome Project) – J.Waston
…
… 1997 Nhân bản vô tính động vật có vú đầu tiên, cừu Dolly – Viện NC
Roslin
1999 Human Genome Project hoàn thiện giải trình tự đến NST 22
11
2012 Nhân dòng tế bào động vật, và tái lập trình nhân
Tái lập trình tế bào
Vai trò của cặp Protein G-receptor
2013 Vai trò bộ máy điều hoà gen của bóng vận chuyển
2014 Vai trò của protein GPS nội bào trong não
2015 Liệu pháp mới trong điều trị nhiễm ký sinh trùng
2016 Cellular autophagy (cơ chế tự chết của tế bào ngăn ngừa bệnh)
2017 Nhịp ngày đêm trong quá trình trao đổi chất của tế bào
2018 Liệu pháp miễn dịch trong điều trị ung thư
12
+ RNA được tổng hợp ngay ở trong nhân có chứa DNA, sau đó nó đi vào tế bào
chất cho tổng hợp protein.
+ Những tế bào giàu RNA tổng hợp protein nhiều hơn.
+ Về phương diện hóa học RNA gần giống DNA: chuỗi polyribo- nucleotide
thẳng cũng chứa 4 loại ribonucleotide A, G, C và uracil (U). Nó có thể nhận
được thông tin từ DNA qua bắt cặp bổ sung.
Nói chung, trong tế bào không thể tìm thấy chất nào khác ngoài RNA có thể đóng
vai trò trung gian cho tổng hợp protein. Mối quan hệ này chính là thông tin di
truyền đi từ DNA qua RNA rồi đến protein và được biểu diễn ở hình 3.3. Mối
quan hệ này còn được gọi là lý thuyết trung tâm (central dogma), được Crick đưa
ra từ 1956 đến nay về căn bản vẫn đúng.
Vào những năm 1970, người ta đã phát hiện quá trình phiên mã ngược từ RNA
tổng hợp nên DNA nhờ enzyme reverse transcriptase. Đến nay, việc sao chép
(tổng hợp) RNA trên khuôn mẫu RNA cũng đã được chứng minh ở nhiều loại
virus. Ngoài ra, thông tin từ protein cũng có thể được truyền sang protein (prion
của bệnh bò điên). Riêng dòng thông tin từ protein ngược về mRNA/DNA thì
chưa được tìm thấy (Hình 1).
Ba nhóm cơ chế truyền thông tin được đề xuất bởi học thuyết trung tâm
13
Hình 8. Những bổ sung mới vào lý thuyết trung tâm của Crick
14
Ch¬ng 1
C¸c ®¹i ph©n tö sinh häc vµ c¸c liªn kÕt yÕu
trong hÖ thèng sèng
1. C¸c ®¹i ph©n tö sinh häc
1.1. Polysaccharide
C¸c polysaccharide cã nhiÒu chøc n¨ng quan träng trong tÕ bµo, chóng tham
gia vµo cÊu t¹o tÕ bµo vµ lµ nguån dù tr÷ n¨ng lîng chñ yÕu. C¸c polysaccharide
®îc h×nh thµnh tõ nhiÒu monomer lµ c¸c ®êng ®¬n gi¶n, c¸c monosaccharide
(thêng lµ glucose) nèi víi nhau b»ng liªn kÕt glycosidic. Liªn kÕt nµy ®îc h×nh
thµnh tõ sù kÕt hîp gi÷a C 1 cña mét ph©n tö ®êng víi nhãm hydroxyl cña ph©n
tö kÕ tiÕp (h×nh 1.1).
H×nh 1.1. Ph¶n øng t¹o liªn kÕt gi÷a c¸c ph©n tö ®êng ®¬n ®Ó h×nh thµnh nªn ph©n
tö ®êng ®«i
Nguån dù tr÷ ë c¸c tÕ bµo ®éng vËt lµ glycogen, trong khi tinh bét ®ãng vai
trß t¬ng tù ë tÕ bµo thùc vËt. Mét polymer kh¸c cña glucose lµ cellulose th× t¹o
nªn v¸ch tÕ bµo thùc vËt vµ lµ hîp chÊt h÷u c¬ hiÖn diÖn nhiÒu nhÊt trong sinh
quyÓn.
1.2. Lipid
MÆc dï kh«ng mang ho¹t tÝnh sinh häc cao nh c¸c protein, lipid còng ®ãng
mét vai trß ®Æc biÖt trong hÖ thèng sèng. Chóng lµ nh©n tè chÝnh h×nh thµnh c¸c
mµng sinh häc mµ nÕu thiÕu th× mäi ho¹t ®éng cña protein sÏ kh«ng thÓ phèi hîp
15
nhÞp nhµng. ChÝnh c¸c mµng sinh häc nµy ng¨n c¸ch tÕ bµo víi m«i trêng xung
quanh, t¹o ®iÓm b¸m cho mét sè protein vµ ph©n chia c¸c khoang néi bµo ë
eukaryote.
H×nh 1.2. CÊu tróc cña mét sè lipid cã trong c¬ thÓ sinh vËt
§¬n vÞ cÊu tróc c¬ b¶n cña lipid lµ c¸c acid bÐo vµ alcol. Mçi acid bÐo ®îc
cÊu t¹o tõ mét m¹ch hydrocarbon (gåm c¸c nguyªn tö C vµ H) g¾n víi mét nhãm
carboxyl cã tÝnh acid. C¸c acid bÐo kh¸c nhau bëi ®é dµi cña chóng, sè lîng vµ
vÞ trÝ liªn kÕt ®«i. C¸c acid bÐo kh«ng mang liªn kÕt ®«i ®îc gäi lµ b·o hoµ, c¸c
acid bÐo kh«ng b·o hoµ cã mang Ýt nhÊt mét liªn kÕt ®«i.
B¶ng 1.1: CÊu tróc vµi acid bÐo tiªu biÓu trong hÖ thèng sèng
C¸c lipid mµng ®îc h×nh thµnh tõ mét chuçi dµi acid bÐo nèi víi nh÷ng
nhãm cã ®Æc tÝnh thÝch níc cao vµ ®îc gäi lµ nh÷ng ph©n tö lìng cùc v× cã mét
®Çu t¬ng t¸c víi níc, chóng kh«ng hîp thµnh giät mµ xÕp sao cho ®Çu thÝch
níc cña ph©n tö tiÕp xóc víi níc. C¸c phospholipid lµ c¸c lipid mµng chñ yÕu
(h×nh 1.3).
16
H×nh 1.3. CÊu t¹o cña phospholipid vµ mµng phospholipid kÐp
1.3. Protein
1.3.1. CÊu tróc cña protein
Amino acid lµ ®¬n vÞ c¬ së (monomer) cÊu thµnh protein. TÊt c¶ 20 amino
acid ®Òu ®îc x©y dùng theo mét kiÓu chung:
R
Trong ®ã R lµ nh¸nh bªn còng lµ phÇn kh¸c nhau duy nhÊt gi÷a 20 lo¹i amino
acid, quy ®Þnh tÝnh chÊt cña tõng lo¹i. Dùa vµo ®iÖn tÝch cña chóng, c¸c amino
acid cã thÓ ®îc chia lµm 4 nhãm:
- Nhãm 1: C¸c amino acid cã tÝnh kiÒm: Lys, Arg, His
- Nhãm 2: C¸c amino acid cã tÝnh acid: Asp vµ Glu
- Nhãm 3: C¸c amino acid trung tÝnh kÞ níc (kh«ng mang ®iÖn tÝch):
Ala, Val, Leu, ... cã nh¸nh bªn mang nhãm kÞ níc.
- Nhãm 4: C¸c amino acid trung tÝnh ph©n cùc cã nh¸nh bªn mang
nhãm OH dÔ t¹o c¸c liªn kÕt hydro víi níc.
C¸c amino acid ®îc nèi víi nhau bëi c¸c liªn kÕt peptide. Liªn kÕt nµy ®îc
h×nh thµnh do sù kÕt hîp nhãm amine cña mét amino acid nµy víi mét nhãm
carboxyl cña amino acid kÕ tiÕp (h×nh 1.4).
Oligopeptide lµ mét chuçi nèi tiÕp nhiÒu amino acid (sè lîng Ýt h¬n 30); víi
mçi sè lîng amino acid lín h¬n chuçi ®îc gäi lµ polypeptide. Mçi polypeptide
cã hai ®Çu tËn cïng, mét ®Çu mang nhãm amine tù do (®Çu N), ®Çu kia mang nhãm
carboxyl tù do (®Çu C). Cßn tõ "protein" dïng ®Ó chØ mét ®¬n vÞ chøc n¨ng nghÜa
lµ mét cÊu tróc phøc t¹p trong kh«ng gian chø kh«ng chØ ®¬n thuÇn lµ mét tr×nh
tù amino acid. ThËt vËy, polypeptide cã thÓ uèn thµnh cÊu tróc h×nh gËy nh trong
c¸c protein h×nh sîi, hay cÊu tróc khèi cÇu nh trong c¸c protein h×nh cÇu hay mét
17
cÊu tróc bao gåm c¶ hai d¹ng trªn. Mét protein cßn cã thÓ ®îc h×nh thµnh tõ
nhiÒu chuçi polypeptide (h×nh 1.5).
Protein bao hµm bèn møc ®é tæ chøc: CÊu tróc bËc mét lµ tr×nh tù s¾p xÕp
c¸c amino acid trong chuçi polypeptide, cÊu tróc bËc hai ph¸t sinh tõ sù uèn c¸c
phÇn cña chuçi polypeptide thµnh nh÷ng cÊu tróc ®Òu ®Æn trong kh«ng gian (d¹ng
xo¾n α hay líp máng β), cÊu tróc bËc ba quy ®Þnh sù kÕt hîp c¸c chuçi xo¾n hay
líp máng ®ã thµnh h×nh d¹ng ba chiÒu trong kh«ng gian vµ sau cïng cÊu tróc bËc
bèn lµ sù tæ chøc nhiÒu chuçi polypeptide thµnh mét ph©n tö protein.
1.3.2. Mét sè chøc n¨ng quan träng cña protein
Protein chiÕm phÇn lín khèi lîng kh« cña tÕ bµo vµ tham gia vµo hÇu hÕt
c¸c qu¸ tr×nh sinh häc:
§Çu tiªn ph¶i kÓ ®Õn lµ c¸c enzyme cã chøc n¨ng xóc t¸c cho hÇu hÕt c¸c
ph¶n øng sinh ho¸ häc trong hÖ thèng sèng. Hai ®Æc trng c¬ b¶n cho enzyme lµ
kh¶ n¨ng xóc t¸c rÊt lín vµ tÝnh ®Æc hiÖu cao. C¸c ®Æc tÝnh nµy kh«ng nh÷ng phô
thuéc vµo cÊu tróc bËc mét mµ cßn ®îc quy ®Þnh bëi sù s¾p xÕp trong kh«ng gian
cña ph©n tö enzyme ®Ó h×nh thµnh c¸c vÞ trÝ ho¹t ®éng (gåm vÞ trÝ nhËn biÕt, vÞ trÝ
g¾n c¬ chÊt vµ xóc t¸c ph¶n øng). C¬ chÊt t¬ng t¸c víi enzyme theo hai c¬ chÕ:
- C¬ chÕ 1: §iÖn tÝch hay h×nh d¹ng bæ sung cña hai ph©n tö nµy phï
hîp hoµn toµn víi nhau ®Ó h×nh thµnh nªn mét phøc hîp bÒn v÷ng.
18
- C¬ chÕ 2: Sù g¾n c¬ chÊt vµo enzyme lµm thay ®æi cÊu h×nh cña
enzyme vµ ®Æt toµn bé phøc hîp vµo mét tr¹ng th¸i thuËn lîi cho ph¶n øng xóc
t¸c.
Tripsin vµ chymotripsin lµ nh÷ng enzyme thuû ph©n protein ®îc nghiªn cøu
têng tËn nhÊt. Ho¹t tÝnh xóc t¸c cña chymotripsin do ba amino acid quyÕt ®Þnh:
His 57, Asp 102 vµ Ser 195. Ba amino acid nµy n»m c¸ch xa nhau trong cÊu tróc
bËc mét, chóng ®îc kÐo gÇn l¹i víi nhau ®Ó h×nh thµnh vÞ trÝ ho¹t ®éng do sù uèn
khóc cña enzyme.
TiÕp theo, kh¶ n¨ng nhËn biÕt c¸c lo¹i ph©n tö kh¸c nhau cña protein cßn ®Æc
biÖt tinh tÕ h¬n trong trêng hîp c¸c kh¸ng thÓ. Chóng cã thÓ nhËn biÕt hai ph©n
tö chØ kh¸c nhau vµi amino acid, vÝ dô: khi tiªm insulin bß cho ngêi ®«i khi l¹i
g©y ra ph¶n øng s¶n sinh kh¸ng thÓ kh¸ng insulin bß mÆc dï hai lo¹i insulin nµy
chØ kh¸c nhau ba amino acid. BÊt kú mét t¸c nh©n nµo khi x©m nhËp vµo c¬ thÓ
®éng vËt cã x¬ng sèng còng sÏ kÝch thÝch sù s¶n sinh kh¸ng thÓ thÝch øng, t¸c
nh©n g©y miÔn dÞch ®îc gäi lµ kh¸ng nguyªn.
C¸c protein vËn ®éng, ®iÓn h×nh lµ miosin, chÞu tr¸ch nhiÖm vÒ sù chuyÓn
®éng ë ®éng vËt c¶ ë møc tÕ bµo vµ c¬ thÓ. Khi trît trªn sîi actin, mét protein
kh¸c tham gia vµo qu¸ tr×nh vËn ®éng, miosin g©y ra c¸c chuyÓn ®éng néi bµo
còng nh sù co c¬.
19
Acid nucleic gåm hai lo¹i ph©n tö cã cÊu t¹o rÊt gièng nhau lµ: Acid
Desoxyribonucleic (DNA) vµ Acid Ribonucleic (RNA).
1.4.1. DNA (DesoxyriboNucleic Acid)
Ph©n tö DNA lµ mét chuçi xo¾n kÐp gåm hai m¹ch ®¬n, mçi m¹ch ®¬n lµ
mét chuçi nucleotide. Mçi nucleotide gåm nhãm phosphate, ®êng desoxyribose
vµ mét trong 4 base (A, T, G vµ C). Hai m¹ch ®¬n kÕt hîp víi nhau nhê c¸c liªn
kÕt hydro h×nh thµnh gi÷a c¸c base bæ sung n»m trªn hai m¹ch; A bæ sung cho T
vµ C bæ sung cho G. Mçi m¹ch ®¬n lµ mét tr×nh tù cã ®Þnh híng víi mét ®Çu 5'
phosphate tù do, ®Çu kia lµ ®Çu 3' OH tù do (híng quy íc lµ 5' ®Õn 3'). Híng
cña hai m¹ch ®¬n trong chuçi xo¾n kÐp ngîc nhau, ngêi ta gäi chóng lµ hai
m¹ch ®èi song song (h×nh 1.7).
H×nh 1.8. Häc thuyÕt trung t©m cña sinh häc ph©n tö
• C¸c RNA vËn chuyÓn (tRNA) ®ãng vai trß vËn chuyÓn c¸c amino
acid cÇn thiÕt ®Õn bé m¸y dÞch m· ®Ó tæng hîp protein tõ mRNA t¬ng øng. C¸c
21
tRNA cã cÊu tróc d¹ng cá ba l¸. CÊu tróc nµy ®îc æn ®Þnh nhê c¸c liªn kÕt bæ
sung (gièng liªn kÕt bæ sung nèi hai sîi ®¬n DNA) hiÖn diÖn ë nhiÒu vïng cña
ph©n tö tRNA. Hai vÞ trÝ kh«ng cã liªn kÕt bæ sung ®ãng vai trß ®Æc biÖt quan
träng ®èi víi chøc n¨ng cña tRNA: (1) tr×nh tù anticodon gåm 3 nucleotide bæ
sung cho codon tøc bé ba m· ho¸ trªn mRNA, (2) tr×nh tù CCA cã kh¶ n¨ng nèi
céng ho¸ trÞ víi mét amino acid ®Æc trng.
• C¸c RNA cña ribosome (rRNA) chiÕm ®Õn 80% tæng sè RNA tÕ bµo.
C¸c rRNA kÕt hîp víi c¸c protein chuyªn biÖt t¹o thµnh ribosome, mét thµnh phÇn
cña bé m¸y dÞch m· cña tÕ bµo. Tuú theo hÖ sè l¾ng (S-sedimentation), rRNA
®îc chia thµnh nhiÒu lo¹i: ë eukaryote cã rRNA: 28S, 18S, 5,8S vµ 5S; cßn c¸c
rRNA t¬ng øng ë prokaryote lµ: 23S, 16S vµ 5S (h×nh 1.9).
Ribosome cña mäi tÕ bµo ®Òu gåm mét tiÓu ®¬n vÞ nhá vµ mét tiÓu ®¬n vÞ
lín. Mçi tiÓu ®¬n vÞ cã mang nhiÒu protein vµ rRNA cã kÝch thíc kh¸c nhau.
H×nh 1.9.CÊu tróc cña c¸c RNA chÝnh trong c¬ thÓ sinh vËt
§Æc biÖt, mét sè RNA cßn cã chøc n¨ng xóc t¸c nh mét protein. N¨m 1981,
ngêi ta ph¸t hiÖn thÊy ë mét loµi nguyªn sinh ®éng vËt Tetrahymina, qu¸ tr×nh
h×nh thµnh mét rRNA trëng thµnh tõ mét ph©n tö tiÒn th©n th«ng thêng cÇn sù
xóc t¸c cña mét enzyme, l¹i cã thÓ tiÕn hµnh ë ®iÒu kiÖn in vitro hoµn toµn kh«ng
22
cã sù hiÖn diÖn cña protein. ChÝnh tr×nh tù intron trong ph©n tö RNA ®· xóc t¸c
cho qu¸ tr×nh ®ã. GÇn ®©y, nhiÒu nhãm RNA cã chøc n¨ng xóc t¸c ®· ®îc ph¸t
hiÖn trong nhiÒu qu¸ tr×nh trëng thµnh cña tRNA, trong chu tr×nh sèng cña mét
sè viroid thùc vËt ...
2. C¸c liªn kÕt yÕu trong hÖ thèng sèng
2.1. §Þnh nghÜa vµ ®Æc ®iÓm chung cña c¸c liªn kÕt
ho¸ häc
Liªn kÕt ho¸ häc lµ mét lùc hót gi÷a hai nguyªn tö l¹i víi nhau. C¸c tæ hîp
nguyªn tö cã kÝch thíc x¸c ®Þnh ®îc gäi lµ ph©n tö. Sù liªn l¹c cña c¸c nguyªn
tö trong mét ph©n tö ®îc ®¶m b¶o bëi c¸c liªn kÕt céng ho¸ trÞ. Nhng lùc hót
yÕu h¬n l¹i ®ãng vai trß quan träng trong cÊu tróc cña c¸c ®¹i ph©n tö, vÝ dô nh
cÊu tróc bèn chuçi polypeptide cña ph©n tö hemoglobin ®îc b¶o ®¶m bëi ho¹t
®éng phèi hîp cña nhiÒu liªn kÕt ho¸ häc yÕu.
C¸c liªn kÕt ho¸ häc ®îc xÕp lo¹i dùa vµo nhiÒu tÝnh chÊt. §Æc trng thø
nhÊt cña mét liªn kÕt ho¸ häc lµ lùc liªn kÕt. C¸c liªn kÕt m¹nh nh liªn kÕt céng
ho¸ trÞ rÊt bÒn v÷ng. C¸c liªn kÕt yÕu, ngîc l¹i rÊt dÔ bÞ ph¸ vì, chØ tån t¹i trong
mét thêi gian rÊt ng¾n. ChØ khi tËp hîp thµnh nhãm cã trËt tù, chóng míi tån t¹i
®îc l©u dµi. Sù h×nh thµnh hay ph¸ vì mét liªn kÕt céng ho¸ trÞ bao giê còng ®ßi
hái mét n¨ng lîng lín. VÝ dô n¨ng lîng cÇn ®Ó ph¸ vì liªn kÕt C-C cña ph©n tö
ethane lµ 83kcal/mol, trong khi n¨ng lîng gi¶i phãng tõ sù h×nh thµnh c¸c liªn
kÕt yÕu chØ trong kho¶ng 1-5kcal/mol. NÕu biÕt r»ng ®éng n¨ng trung b×nh cña
c¸c ph©n tö ë nhiÖt ®é m«i trêng (250C) lµ 0,6kcal/mol th× ë nhiÖt ®é sinh lý
(370C) n¨ng lîng chøa trong mét tËp hîp ph©n tö sÏ d søc ph¸ vì c¸c liªn kÕt
ho¸ häc yÕu. C¸c liªn kÕt nµy bÞ ph¸ vì vµ ®îc t¸i lËp liªn tôc.
§Æc trng thø hai lµ sè lîng liªn kÕt ho¸ häc tèi ®a cña mét nguyªn tö. Sè
lîng liªn kÕt céng ho¸ trÞ mµ mét nguyªn tö cã thÓ tham gia ®îc gäi lµ ho¸ trÞ.
VÝ dô O 2 cã ho¸ trÞ hai, chØ cã thÓ t¹o tèi ®a hai nèi céng ho¸ trÞ. Trong khi ®ã,
c¸c liªn kÕt ho¸ häc yÕu kh«ng ph¶i chÞu nh÷ng h¹n chÕ kh¾t khe nh vËy. §èi
víi liªn kÕt Van der Walls ch¼ng h¹n, nh©n tè h¹n chÕ chØ thuÇn tuý lµ nh©n tè
kh«ng gian: sè lîng liªn kÕt tuú thuéc vµo sè nguyªn tö cã thÓ ®ång tiÕp xóc víi
nhau.
Mét ®Æc trng kh¸c lµ gãc liªn kÕt. Gãc gi÷a hai liªn kÕt céng ho¸ trÞ thêng
cè ®Þnh trong khi gãc hîp thµnh bëi nh÷ng liªn kÕt yÕu hay thay ®æi. Ngoµi ra,
23
trong trêng hîp c¸c liªn kÕt yÕu, kh¶ n¨ng quay tù do cña c¸c nguyªn tö trong
liªn kÕt còng Ýt bÞ h¹n chÕ h¬n so víi ë liªn kÕt céng ho¸ trÞ.
2.2. Bèn lo¹i liªn kÕt ho¸ häc yÕu c¬ b¶n
2.2.1. Liªn kÕt hydro
Liªn kÕt hydro lµ t¬ng t¸c yÕu h×nh thµnh gi÷a mét nguyªn tö mang ®iÖn
tÝch ©m (gäi lµ nguyªn tö nhËn A-acceptor) vµ mét nguyªn tö hydro ®ang n»m
trong mét nèi céng ho¸ trÞ víi mét nguyªn tö kh¸c (gäi lµ nguyªn tö cho D-
donnor). Nèi céng ho¸ trÞ gi÷a D vµ hydro ph¶i lµ nèi ph©n cùc vµ ®¸m m©y ®iÖn
tö cña A ph¶i mang nh÷ng ®iÖn tö kh«ng liªn kÕt cã kh¶ n¨ng thu hót ®iÖn tÝch δ+
cña hydro.
D-H + A D-H ... A
24
2.2.3. Liªn kÕt Van der Waals
Liªn kÕt Van der Waals lµ c¸c t¬ng t¸c kh«ng ®Æc hiÖu xuÊt hiÖn gi÷a hai
ph©n tö khi chóng tiÕn ®Õn gÇn nhau. T¬ng t¸c nµy kh«ng do sù ph©n phèi lÖch
cña c¸c ®iÖn tö gi÷a hai ph©n tö mµ do c¸c biÕn ®éng tho¸ng qua cña ®¸m m©y
®iÖn tö g©y ra sù ph©n cùc nhÊt thêi trªn ph©n tö. Liªn kÕt Van der Waals kh«ng
phô thuéc tÝnh ph©n cùc cña c¸c ph©n tö mµ chØ phô thuéc vµo kho¶ng c¸ch gi÷a
chóng. Lùc Van der Waals lµ kÕt qu¶ cña lùc hót vµ lùc ®Èy. Hai lùc nµy c©n b»ng
ë mét kho¶ng c¸ch nhÊt ®Þnh, ®Æc trng cho tõng lo¹i nguyªn tö. Kho¶ng c¸ch nµy
®îc gäi lµ b¸n kÝnh Van der Waals. §©y lµ lùc liªn kÕt yÕu nhÊt, víi gi¸ trÞ chØ
kho¶ng 1kcal/mol. §Ó liªn kÕt nµy thùc sù cã ý nghÜa, nã ph¶i tån t¹i víi sè lîng
lín. NghÜa lµ bÒ mÆt tiÕp xóc cña hai ph©n tö ph¶i cùc ®¹i. §iÓn h×nh lµ khi mét
ph©n tö cã mang mét hèc cã h×nh d¹ng phï hîp víi chç låi cña ph©n tö kia, nh
trêng hîp t¬ng t¸c gi÷a kh¸ng nguyªn-kh¸ng thÓ, enzyme-c¬ chÊt ....
H×nh 1.10. Nh÷ng t¬ng t¸c yÕu gi÷a hai protein ®Ó h×nh thµnh nªn mét phøc hÖ æn ®Þnh
25
trong viÖc æn ®Þnh c¸c protein, c¸c phøc hîp protein víi c¸c ph©n tö kh¸c còng
nh sù ph©n bè c¸c protein trong mµng sinh häc.
2.3. Vai trß cña c¸c liªn kÕt ho¸ häc yÕu
Vai trß quyÕt ®Þnh cña c¸c liªn kÕt yÕu trong hÖ thèng sèng thÓ hiÖn mét c¸ch
®a d¹ng, trong c¸c t¬ng t¸c enzyme - c¬ chÊt, trong viÖc h×nh thµnh cÊu h×nh
kh«ng gian cña c¸c ph©n tö sinh häc, trong qu¸ tr×nh ®iÒu hoµ c¸c ho¹t ®éng sèng.
2.3.1. T¬ng t¸c enzyme - c¬ chÊt
Trong c¸c ph¶n øng xóc t¸c, c¸c enzyme kh«ng g¾n lªn mét ph©n tö bÊt kú,
chóng cã ¸i lùc ®Æc biÖt víi chÝnh c¬ chÊt cña chóng. N¨ng lîng liªn kÕt cña
t¬ng t¸c enzyme-c¬ chÊt thêng cã gi¸ trÞ 5-10kcal/mol cho thÊy nã thuéc lo¹i
liªn kÕt ho¸ häc yÕu, nghÜa lµ c¸c phøc hîp enzyme-c¬ chÊt ®îc h×nh thµnh vµ
ph¸ vì rÊt nhanh díi ¶nh hëng cña chuyÓn ®éng nhiÖt. §iÒu nµy gi¶i thÝch v×
sao c¸c enzyme cã kh¶ n¨ng ho¹t ®éng víi vËn tèc ®«i khi ®¹t ®Õn 106 lÇn trong
mét gi©y. Mét lùc liªn kÕt m¹nh h¬n gi÷a enzyme vµ c¬ chÊt hay gi÷a enzyme vµ
s¶n phÈm sÏ lµm cho enzyme chËm h¬n rÊt nhiÒu.
2.3.2. CÊu h×nh kh«ng gian cña c¸c ph©n tö
Khã cã thÓ tiªn ®o¸n cÊu h×nh cña nh÷ng ®¹i ph©n tö nh protein vµ nucleic
acid nÕu chØ dùa vµo cÊu tróc céng ho¸ trÞ cña chóng. CÊu h×nh nµy phô thuéc chñ
yÕu vµo sè lîng vµ b¶n chÊt c¸c liªn kÕt yÕu tån t¹i trªn c¸c ®¹i ph©n tö ®ã.
C¸c t¬ng t¸c kÞ níc cã chøc n¨ng æn ®Þnh ph©n tö protein nhng chÝnh c¸c
liªn kÕt hydro míi quy ®Þnh cÊu h×nh ®Æc trng cña nã. C¸c liªn kÕt hydro ®ßi hái
mét kho¶ng c¸ch nhÊt ®Þnh vµ sù s¾p xÕp cã ®Þnh híng c¸c nguyªn tö cho vµ
nhËn trong kh«ng gian. §Ó tho¶ m·n yªu cÇu cña c¸c nguyªn tö cho vµ nhËn trªn
bé khung polypeptide, trong ph©n tö protein thêng h×nh thµnh nh÷ng cÊu tróc bËc
hai ®Òu ®Æn, c¸c chuçi xo¾n α hay nh÷ng cÊu tróc d¹ng líp máng β. C¸c cÊu tróc
®èi xøng ®Òu ®Æn nµy cã tÝnh æn ®Þnh rÊt cao.
Mét ph©n tö protein thêng bao gåm c¶ hai lo¹i cÊu tróc trªn, bªn c¹nh ®ã
cã nh÷ng vïng cÊu tróc kh«ng ®Òu ®Æn cÇn cho sù cuén gÊp cña chuçi polypeptide.
Ph©n tö DNA thêng cã d¹ng xo¾n kÐp, d¹ng xo¾n kÐp nµy xuÊt ph¸t tõ nhiÒu
nguyªn nh©n:
- Hai m¹ch ®¬n b¾t cÆp víi nhau nhê c¸c liªn kÕt bæ sung. Trong c¸c
liªn kÕt bæ sung nµy, mét bªn bao giê còng lµ mét purine (A vµ G cã cïng kÝch
thíc) vµ bªn kia lµ pyrimidine (C vµ T cã cïng kÝch thíc). §iÒu nµy ®¶m b¶o
26
kho¶ng c¸ch ®Òu ®Æn gi÷a hai m¹ch ®¬n tøc lµ tæng kÝch thíc cña mét purine vµ
mét pyrimidine.
- Chuçi xo¾n kÐp cho phÐp c¸c base purine vµ pyrimidine cã cÊu tróc
ph¼ng xÕp chång khÝt lªn nhau ë bªn trong ph©n tö DNA, h¹n chÕ sù tiÕp xóc cña
chóng víi níc.
- C¸c nguyªn tö ®êng vµ c¸c nhãm phosphate xoay ra ngoµi h×nh
thµnh liªn kÕt víi níc ®¶m b¶o tÝnh æn ®Þnh cho ph©n tö.
CÊu h×nh chuçi xo¾n kÐp cho ph©n tö DNA lµ mét cÊu tróc æn ®Þnh v× hai lÝ
do: (1) nÕu hai m¹ch ®¬n t¸ch rêi nhau, c¸c base purine vµ pyrimidine kÞ níc sÏ
ph¶i tiÕp xóc víi níc, ®iÒu nµy ®Æt chóng vµo t×nh thÕ bÊt lîi, kh«ng æn ®Þnh, (2)
mçi ph©n tö DNA mang mét sè lîng liªn kÕt hydro rÊt lín, nªn dï chuyÓn ®éng
nhiÖt cã ph¸ vì c¸c liªn kÕt n»m ë hai ®Çu cña ph©n tö, hai m¹ch ®¬n vÉn g¾n ®îc
víi nhau bëi c¸c liªn kÕt ë vïng gi÷a. ChØ trong nh÷ng ®iÒu kiÖn rÊt kh¾c nghiÖt
(vÝ dô nhiÖt ®é cao h¬n h¼n nhiÖt ®é sinh lý) míi cã sù ph¸ vì ®ång thêi qu¸ nhiÒu
liªn kÕt hydro khiÕn ph©n tö kh«ng cßn gi÷ ®îc cÊu h×nh ban ®Çu, ph©n tö bÞ biÕn
tÝnh.
2.3.3. Liªn kÕt yÕu ®¶m b¶o mèi liªn l¹c gi÷a protein vµ DNA
C¸c protein ®ãng vai trß nÐn chÆt cÊu tróc DNA trong nh©n nh c¸c histone,
liªn kÕt víi DNA nhê c¸c liªn kÕt ion. C¸c liªn kÕt ion nµy ®îc h×nh thµnh gi÷a
c¸c nh¸nh bªn mang ®iÖn tÝch d¬ng cña c¸c histone víi c¸c nhãm phosphate
mang ®iÖn tÝch ©m cña DNA. DNA quÊn quanh lâi cÊu t¹o tõ nhiÒu histone nªn
mÆc dï ®îc nÐn l¹i nhng phÇn lín bÒ mÆt cña ph©n tö DNA vÉn cã kh¶ n¨ng
tiÕp xóc víi nhiÒu protein kh¸c.
§ã lµ c¸c protein ®ãng vai trß quan träng trong sù sao chÐp nh c¸c DNA
polymerase, trong sù phiªn m· nh c¸c RNA polymerase hay c¸c protein cã chøc
n¨ng ®iÒu hoµ ho¹t ®éng cña c¸c gen, ... C¸c protein nµy nhËn biÕt mét tr×nh tù
x¸c ®Þnh trªn DNA vµ g¾n vµo ®ã ë vÞ trÝ c¸c nhãm cÆp base ®Æc trng nhê liªn
kÕt ion. Sù nhËn biÕt tr×nh tù nµy phÇn lín lµ kÕt qu¶ cña sù bæ sung h×nh d¹ng
gi÷a protein vµ DNA.
27
Nãi chung, n¨ng lîng cña liªn kÕt ho¸ häc yÕu (2-5kcal/mol) thêng ®¶m
b¶o cho mét ph©n tö g¾n mét c¸ch u tiªn lªn mét ph©n tö kh¸c. §iÒu quan träng
h¬n lµ n¨ng lîng ®ã l¹i kh«ng ®ñ lín ®Ó t¹o ra nh÷ng m¹ng líi cøng nh¾c bªn
trong tÕ bµo, chÝnh nhê ®ã mµ bªn trong tÕ bµo sèng kh«ng bao giê ®Æc l¹i.
H¬n n÷a, nÕu n¨ng lîng liªn kÕt qu¸ lín th× tÇn sè ph¸ vì c¸c liªn kÕt nµy
gi¶m xuèng, kÕt qu¶ lµ hiÖn tîng khuÕch t¸n yÕu ®i. HiÖn tîng khuÕch t¸n x¶y
ra khi chuyÓn ®éng nhiÖt ®Èy c¸c ph©n tö di chuyÓn theo mäi híng; trong qu¸
tr×nh di chuyÓn ®ã, khi c¸c ph©n tö ®Õn ®ñ gÇn nhau, chóng sÏ t¬ng t¸c víi nhau.
Trong tÕ bµo hiÖn tîng khuÕch t¸n gióp c¸c ph©n tö sinh häc t¬ng t¸c víi nhau
h×nh thµnh mäi qu¸ tr×nh chuyÓn ho¸ thiÕt yÕu cho sù sèng. Nh vËy, sù tån t¹i
cña tÕ bµo sÏ bÞ ®e do¹ khi hiÖn tîng khuÕch t¸n yÕu ®i. Tãm l¹i, sù hiÖn diÖn
cña mét sè lîng lín c¸c liªn kÕt yÕu võa ®¶m b¶o tÝnh liÒn l¹c hµi hoµ cña hÖ
thèng sèng ®ång thêi gi÷ ®îc sù linh ®éng mÒm dÎo lµ mét ®Æc trng cña sù
sèng.
2.4. CÊu tróc bé gen ë prokaryote vµ eukaryote
§Õn nay, c¸c nghiªn cøu cho thÊy tÊt c¶ c¸c sinh vËt cã cÊu t¹o tÕ bµo, ti thÓ
vµ lôc l¹p ®Òu cã bé gen lµ DNA m¹ch kÐp. C¸c virus cã bé gen ®a d¹ng gåm
RNA vµ DNA m¹ch ®¬n hay m¹ch kÐp. ChiÒu dµi bé gen ®¬n béi c¨n cø theo sè
cÆp base cña c¸c nhãm sinh vËt chñ yÕu nh sau:
B¶ng 1.2: ChiÒu dµi cña bé gen ®¬n béi ë mét sè sinh vËt
Sinh vËt ChiÒu dµi bé gen ®¬n béi (sè cÆp base)
E. coli 4,5.106
Drosophila 1,5.108
28
Ngêi 3.109
Tõ sè liÖu trªn cho thÊy, sè lîng base kh«ng ph¶n ¸nh møc ®é tiÕn ho¸. Gi÷a
c¸c sinh vËt prokaryote vµ eukaryote cã sù kh¸c nhau ®¸ng kÓ vÒ thµnh phÇn cÊu
t¹o vµ tæ chøc cña DNA trong tÕ bµo. Nhng tÊt c¶ sinh vËt ®Òu cã chung cÊu tróc
DNA xo¾n kÐp.
2.4.1. Bé gen cña prokaryote (genome cña prokaryote)
2.4.1.1. C¸c gen trong bé gen prokaryote
MÆc dï cã kÝch thíc nhá h¬n nhiÒu so víi bé gen eukaryote nhng bé gen
prokaryote cã mËt ®é ph©n bè c¸c gen cao h¬n kho¶ng 85-90% bé gen chøa c¸c
gen. Nh vËy, sè ®o¹n DNA kh«ng chøa m· di truyÒn Ýt h¬n, tøc lµ kho¶ng c¸ch
gi÷a c¸c gen ng¾n h¬n. VÝ dô kho¶ng c¸ch trung b×nh gi÷a hai gen ë E.coli lµ
118bp. C¸c gen vµ khung ®äc më (ORFs) chiÕm 87,8%. C¸c gen m· cho RNAs
chiÕm 0,8%, cßn thµnh phÇn DNA lÆp l¹i kh«ng chøa gen chØ chiÕm 0,7%. MÆt
kh¸c, hÇu hÕt c¸c gen ë prokaryote ®Òu tån t¹i ®¬n b¶n (single copy gene) vµ c¸c
gen kh«ng bÞ gi¸n ®o¹n bëi c¸c ®o¹n kh«ng chøa m· di truyÒn (c¸c intron).
Trong bé gen prokaryote, mét sè gen ph©n bè c¹nh nhau vµ chÞu sù ®iÒu
khiÓn chung cña mét promoter, tøc lµ chóng ®îc phiªn m· sang cïng mét ph©n
tö mRNA. CÊu tróc nµy ®îc gäi lµ operon. Nh vËy mét operon gåm hai hay
nhiÒu gen n»m c¹nh nhau trªn cïng mét ®o¹n nhiÔm s¾c thÓ. Th«ng thêng ®ã lµ
c¸c gen cïng tham gia vµo mét con ®êng chuyÓn ho¸, vÝ dô gen m· cho c¸c
enzyme cÇn thiÕt cho qu¸ tr×nh chuyÓn ho¸ glucose.
Hộp Pribnov
5’
DNA TTGACA TATAAT
-35 +1
29
-10
Do cã chung mét promoter ®iÒu khiÓn cho mäi gen n»m trong mét operon,
chØ cã mét lo¹i ph©n tö mRNA ®îc tæng hîp tõ mét operon (mang th«ng tin di
truyÒn cña tÊt c¶ c¸c gen n»m trong ®ã). Nãi c¸ch kh¸c, qu¸ tr×nh phiªn m· cña
c¸c gen trong mét operon x¶y ra ®ång thêi vµ ph©n tö mRNA ®Æc trng cho operon
®îc gäi lµ mRNA-polycistronic. Tuy nhiªn, ®iÒu cÇn ghi nhí lµ qu¸ tr×nh dÞch
m· trªn ph©n tö mRNA polycistronic x¶y ra hoµn toµn ®éc lËp víi nhau. Mét ®o¹n
t¬ng øng víi mét gen trªn ph©n tö nµy ®Òu cã vÞ trÝ b¸m cña ribosome, cã m· b¾t
®Çu vµ kÕt thóc tæng hîp chuçi polypeptide riªng biÖt. Do ®ã, tèc ®é tæng hîp c¸c
protein trªn mét ph©n tö mRNA polycistronic hoµn toµn kh¸c nhau.
Điểm khác so với sinh vật nhân chuẩn là genome sinh vật tiền nhân thường
nhỏ, chủ yếu là mạch vòng, hoạt động gen theo kiểu operon, nhiều gen chung một
promoter, trong gen không có hoặc có ít intron, không có tín hiệu nhận poly A và
mRNA không có đầu 5’ mang mũ 7 methyl Gppp. Chúng thường phải sống ký
sinh vào ký chủ, phụ thuộc vào ký chủ và có khả năng tự tái bản độc lập với tế
bào ký chủ
2.4.1.2. “NhiÔm s¾c thÓ” cña prokaryote
DNA của vi khuẩn nằm trong nhiễm sắc thể sơ khai. Phần lớn các vi khuẩn
chỉ có một nhiễm sắc thể/tế bào. DNA của vi khuẩn cũng ở dạng vòng, chuỗi kép.
Trên DNA có chứa các gen mã hóa cho một protein đặc thù. Ngoài nhiễm sắc thể
chính, vi khuẩn còn chứa dạng DNA khác được gọi là plasmid có kích thước bé
hơn, dạng vòng, có khả năng tự nhân bản. Các plasimd thường chứa một số gen
có tính đặc thù cao.
TËp hîp cña tÊt c¶ vËt liÖu di truyÒn cã mÆt trong tÕ bµo ®¶m b¶o sù tån t¹i
vµ ph©n chia tÕ bµo ®îc gäi lµ bé gen. TÕ bµo prokaryote kh«ng cã mµng nh©n
nªn bé gen tån t¹i trong tÕ bµo chÊt. Ngîc l¹i hÇu hÕt bé gen trong tÕ bµo
eukaryote ph©n bè trong nh©n c¸ch biÖt víi tÕ bµo chÊt bëi mét mµng nh©n, cßn
mét phÇn nhá th× ®îc ph©n bè trong c¸c bµo quan nh ty thÓ vµ l¹p thÓ.
Dï sao, mét trong nh÷ng ®iÓm gièng nhau gi÷a hai lo¹i tÕ bµo lµ bé gen
(DNA) ®Òu liªn kÕt víi protein ®Ó t¹o nªn cÊu tróc kh«ng gian ®Æc thï cho tõng
lo¹i tÕ bµo. Trong tÕ bµo prokaryote DNA n»m trong cÊu tróc h¹ch nh©n (nucleoid)
cßn trong tÕ bµo eukaryote DNA n»m trong cÊu tróc sîi nhiÔm s¾c (chromatin).
30
H×nh 1.12. CÊu tróc bé gen cña E. coli
Kho¶ng 80% DNA cã mÆt trong tÕ bµo vi khuÈn ®îc ph©n bè trong h¹ch
nh©n (nucleoid). H¹ch nh©n kh«ng cã mµng nh©n bao bäc. DNA n»m trong h¹ch
nh©n liªn kÕt víi protein ®Ó h×nh thµnh nªn cÊu tróc kh«ng gian ®Æc thï. Mét sè
protein nh HU hoÆc H1 cã chøc n¨ng t¬ng tù nh c¸c protein histone tham gia
vµo viÖc ®ãng gãi DNA trong cÊu tróc h¹ch nh©n. H¹ch nh©n cã thÓ ph©n chia
thµnh 50-100 vïng kh¸c nhau, mçi vïng ®îc gäi lµ domain. CÊu tróc cña mét
domain gåm kho¶ng 40kb ë d¹ng siªu xo¾n. C¸c domain ®Ýnh kÕt víi nhau ë
nh÷ng ®o¹n DNA nhÊt ®Þnh. §iÒu ®ã gióp cho toµn bé bé gen (h¹ch nh©n) cã cÊu
tróc gièng nh mét b«ng hoa gåm 50-100 c¸nh hoa ®Ýnh kÕt víi nhau t¹i nhÞ hoa
(h×nh 1.12). Sù më xo¾n cña mét c¸nh (do ®øt g·y hoÆc do phiªn m· tæng hîp
RNA) kh«ng lµm ¶nh hëng tíi c¸c c¸nh kh¸c. Hai enzyme DNA gyrase vµ DNA
topoisomerase gi÷ vai trß chÝnh cïng phèi hîp víi phøc protein lµm nhiÖm vô t¹o
c¸nh hoa cho DNA vi khuÈn.
2.4.2. Bé gen cña eukaryote
Đặc điểm cấu trúc: Genome của nhân được cấu trúc nên từ một bộ các cặp
nhiễm sắc thể tương đồng (nhị bội khác so với prokaryote đơn bội). Mỗi nhiễm
sắc thể thường chứa một phân tử DNA, trừ nhiễm sắc thể khổng lồ của ruồi dấm
và một số vi khuẩn. Genome ở nhân của các loài khác nhau chứa hàm lượng DNA
khác nhau. Bộ nhiễm sắc thể trong nhân có số lượng, kích thước và hình dạng xác
định khác nhau đặc trưng theo từng loài.
Các loại DNA trong genome nhân:
(1) Loại DNA lặp lại ở mức độ cao: thường chiếm khoảng 10% DNA của
mỗi tế bào, là các trình tự ngắn dưới 10 cặp bazơ và có từ 105 – 107 bản sao cho
mỗi genome. Những trình tự này thường không mã hoá và thường gắn các vùng
31
chuyên biệt trên nhiễm sắc thể như centromere hay telomere. Các tụ điểm
(domain) của các DNA lặp lại nhiều lần tạo nên các vùng nhiễm sắc thể đậm đặc
khác nhau trong chu kỳ tế bào, so với những vùng khác nhau của nhiễm sắc thể
và được gọi là thể dị sắc.
(2) Loại DNA có trình tự lặp lại thấp hoặc trung bình: chiếm khoảng 20%.
Loại này chứa các đoạn lặp lại có kích thước lớn hơn (100 cặp bazơ, được lặp lại
từ một vài đến hàng ngàn lần và thường xen kẽ với các trình tự chỉ lặp lại một lần
dọc theo nhiễm sắc thể. Một số trong chúng có chức năng mã hoá tạo ra rRNA,
mRNA hay rRNA 5S. Ví dụ 2 gen tạo histone và RNA ribosome là các gen lặp
lại nhiều lần trong genome nhân. Genome nhân của V.faba có khoảng 4750 gen
tạo ra rRNA trong khi đó genome của V.sativa chỉ có khoảng 1875.
(3) Loại DNA chứa trình tự duy nhất: chiếm khoảng 70%. Chỉ có một bản
và những trình tự này chỉ lặp lại đôi lần, mã hoá cho các protein. Trong hầu hết
các cây trồng, chỉ có khoảng 20 - 40% của bộ genome là có chứa trình tự DNA
chỉ lặp lại một lần.
+ Genome ty thể: Phần lớn các tế bào. Độ lớn rất biến động và không
tương ứng với tính phức tạp của sinh. Genome ty thể động vật thường nhỏ với tổ
chức di truyền được gói gọn, các gen sắp xếp sát nhau với ít khoảng trống ở giữa.
Genome ty thể ở thực vật lớn hơn genome ty thể ở động vật có vú và nấm men.
Kích thước genome ty thể khác nhau rất lớn giữa các loài. Ví dụ: genome
ty thể của Brassica campestris có độ lớn 218 kb, còn của Cucumis melo là 2400
kb, nhỏ hơn nhiêu so với genome nhân.
+ Genome thể sống ký sinh, ngoài các thành phần genome kể trên có một số tế
bào, mô ở một số sinh vật có thể còn có các thể sống ký sinh bên trong. Thể sống
ký sinh có thể có lợi nhưng đa phần là có hại đó là virus, viroid, nấm, sán, giun,
vi khuẩn…và chúng cũng có genome riêng và cũng có chứa các gen mang thông
tin di truyền tạo ra polypeptide. Nếu các gen hoạt động thì cũng biểu hiện hoặc
đóng góp vào sự biểu hiện nên tính trạng của sinh vật.
Genome của người dài khoảng 3200Mb, 1/3 DNA trong đó có liên quan
đến gen. Trong DNA của một gen lại bao gồm vùng mã hóa và không mã hóa,
vùng không mã hóa lại bao gồm Pseudogene, các đoạn trong gen, các intron và
vùng leader. Theo Strachan & Read (1996) thì Pseudogene là gen rất giống với
một gen đã biết ở locus khác nhưng không có chức năng do đột biến thêm hoặc
mất một cấu trúc làm mất khả năng phiên hoặc dịch mã gen. Còn phần lớn các
DNA còn lại (chiếm 2/3) là trình tự DNA giữa các gen gồm trình tự lặp lại (420
Mb): liền kề và phân bố rải rác. Trong trình tự lặp lại liền kề lại bao gồm trình tự
DNA satellite, microsatellite và minisatellite. Còn trình tự phân bố rải rác bao
gồm các LTRs, SINE, LINE và DNA transposon. Trình tự linh tinh khác
(miscellaneous) chiếm 25% gồm: SD (Shine-Dalgano Sequence) là một phần
32
hoặc tất cả trình tự vùng leader của mRNA vi khuẩn AGGAGG nằm trước codon
khởi đầu AUG, trình tự này bổ sung với đầu 3 của 16S rRNA vì thế là vị trí bọc
của ribosome. Vùng 16S rRNA này theo Shine và Dalgano (1974) có thể đóng vai
trò ghép cặp bazơ trong việc kết thúc và khởi đầu quá trình tổng hợp protein của
mRNA. SSR (Simple sequence repeats) trình tự lặp lại đơn giản nằm rải rắc trong
genome. Số còn lại 17% DNA genome đến nay vẫn chưa rõ thuộc loại cấu trúc
nào. Mô hình sau đây minh họa tỷ lệ % DNA giữa các thành phần trong hệ
genome nhân của người đã được phát hiện
\ Genome người
3000 Mb
DNA mã DNA không DNA lặp lại Trình tự lặp lại duy
mã hóa
hóa 90 Mb 420 Mb nhất và có bản sao
810Mb
thấp
mini-satellite
LINEs DNA
transposon
33
Hình 4 - 16. Tổ chức hệ genome của người
Gen là đơn vị di truyền, chiếm một vị trí nhất định (locus) trong genome
hoặc trên nhiễm sắc thể, quyết định hoặc đóng góp vào việc hình một hoặc một
số tính trạng của cơ thể sinh vật. Gen có thể đột biến thành nhiều dạng alen khác
nhau. Gen có thể tái tổ hợp với những gen khác hình thành nên liên kết mới. Có
3 nhóm gen được phát hiện là: 1) gen cấu trúc phiên mã tạo ra các mRNA sau đó
dịch mã thành chuỗi polypeptide, 2) gen cấu trúc phiên mã tạo thành phân tử
rRNA hoặc tRNA được sử dụng trực tiếp và 3) gen điều hòa không phiên mã
nhưng làm nhiệm vụ là nơi nhận biết cho enzyme hoặc protein liên quan đến tái
bản và phiên mã DNA. Seymour Benzer đưa ra một số thuật ngữ: Gen là một
cistron là lượng vật chất di truyền mã hóa cho một tRNA, rRNA hay một chuỗi
polypeptide, nó bao gồm cả vùng phiên mã, trước và sau vùng phiên mã và cả các
intron. Gen là một muton là đơn vị nhỏ nhất khi bị biến đổi, thay đổi mã di truyền
tương ứng với một nucleotide. Gen là một recon là đơn vị nhỏ nhất có thể trải qua
tái tổ hợp tương ứng với cặp nucleotide kề cạnh ở vị trí cis.
Thông tin di truyền của gen được mã hoá trong DNA dựa trên trình tự đặc
hiệu của các nucleotide. Gen có chức năng sản xuất ra phân tử RNA hoặc một
chuỗi polypeptide. Gen mã hoá tạo ra polypeptide thông qua hai quá trình: Thứ
nhất, gen cấu trúc hoạt động làm khuôn để sản sinh ra một phân tử mRNA (quá
trình phiên mã). Thứ hai, phân tử mRNA riêng biệt tương tác với các cấu tử khác
như: ribosome, RNA vận chuyển mang amino acid (tRNA) và thông qua phản
ứng của một số enzyme để sản sinh ra một phân tử protein (quá trình dịch mã).
Sơ đồ hoạt động của gen từ DNA đến protein như sau: DNA gen phiên mã
tạo thành mRNA sau đó dịch mã tạo thành polypeptide, có thể phối hợp tạo thành
protein hoạt động trong nội tại tế bào hoặc vận chuyển đi các tế bào và mô nơi
khác.
b. Cấu trúc gen của sinh vật nhân chuẩn
Gen là một đơn vị di truyền trong sinh vật nhân chuẩn gồm: các exon và
intron.
Exon là trình tự mang thông tin di truyền, nằm ở 3 vùng nhất định của gen,
thường được mã hóa sang protein. Vùng một, không dịch mã thành protein, làm
tín hiệu bắt đầu phiên mã tạo RNA và chứa trình tự định hướng mRNA vào
ribosome để dịch mã tạo protein. Vùng hai gồm các exon chứa thông tin di truyền
dịch mã thành trình tự amino acid của protein. Các exon vùng ba được phiên mã
thành một phần của mRNA chứa tín hiệu để kết thúc dịch mã và cho phép gắn
thêm đuôi poly A vào mRNA.
34
Intron hay trình tự ‘câm’’, nằm xen kẽ và không mang thông tin di truyền.
Chúng được phiên mã đến tiền mRNA ở trong nhân, sau đó bị cắt bỏ trong quá
trình biến đổi tiền mRNA thành mRNA chín và nhanh chóng bị phân rã và tất
nhiên không được dịch mã thành protein. Số lượng các intron của gen biến động
rất lớn từ có một intron ở gen tạo ra rRNA đến hơn 30 intron có ở gen tạo ra
protein lòng đỏ trứng con Xenopus. Kích thước cũng rất biến động từ ngắn dưới
100 bp đến dài hơn 10.000 bp. Có rất ít trình tự tương đồng giữa các intron của
một gen và của các gen khác nhau, nhưng chúng đều có một số nucleotide nằm ở
2 đầu các intron rất giống nhau, các nucleotide này tham gia vào quá trình cắt
intron.
Khung đọc mã
Promoter
5’ 3’
35
ra mRNA, ở đó hình thành nên cấu trúc kiểu kẹp tóc (hairpin) làm dừng quá trình
phiên mã.
- Vùng khởi động (promoter) của nhiều gen sinh vật eukaryote đều có
chung một số trình tự ở hộp CAAT (- 75) và TATA (-25).
-75 -25 +1
- Mỗi gen có thể có một trình tự promoter nhất định, cũng có thể có nhiều
gen có một trình tự promoter giống nhau. Hoạt động của promoter có thể đặc thù
theo gen, theo sinh vật và thậm trí theo cả mô, cho nên khi thiết kế gen chuyển
nạp thì cần đặc biệt chú ý đến đặc điểm này.
- Các dấu hiệu gắn chuỗi poly A của mRNA có trình tự 5’- AAUAAA-3’.
5’ ----------- AAUAAA----------CA-------CA---GU-----
3’
Hình 4 - 4. Sơ đồ cấu tạo vùng tín hiệu gắn poly A và tham gia hoạt động
của các protein và enzyme polymerase A.
Trước hết nhân tố cắt và đặc thù poly A (CPSF) gắn vào trình tự AAUAAA, sau
đó Poly(A) polymerase gắn vào vùng có trình tự CA và cắt bỏ đi một đoạn tính
36
từ sau trình tự CA nhờ sự hỗ trợ của nhân tố kích thích cắt (CstF) gắn vào vùng
giầu GU, sau đó protein bọc enzyme polyadenylate rời ra thì poly A được nhập
vào chuỗi mRNA.
Vùng này nằm ở ngay trước đầu 3’nơi bắt đầu gắn polyA, dài từ 10 đến 30
nu, tiếp theo là vùng CA, rồi đến vùng giầu GU (hình 4-4). Trình tự vùng tín
hiệu gắn poly A và vùng giầu GU là vị trí bọc của nhiều protein lần lượt là yếu tố
cắt và gắn polyA (Cleavage and polyadenylation specificity factor, CPSF), nhân
tố kích thích cắt (cleavage stimulation factor, CstF), hai nhân tố này hoạt động
như là những enzyme endonuclease và ít nhất có thêm 2 yếu tố protein khác nữa
cùng phối hợp với CPSF và CstF để cho phép quá trình gắn poly A vào mRNA
được tiến hành. Các yếu tố này kết hợp với protein bọc lấy chuỗi polyA giúp
enzyme polymerase trùng phân các adenosine và ảnh hưởng đến chiều dài đuôi
polyA và duy trì đuôi A sau tổng hợp. Poly A được đính vào tiền mRNA vào lúc
sau phiên mã và trước quá trình cắt nối các exon xảy ra.
- Khung đọc mở hay khung đọc mã (open reading frame, ORF):
Phần DNA của gen mã hóa tạo chuỗi polypeptide được gọi là khung đọc
mở, bắt đầu bằng một codon khởi đầu AUG hoặc GUG và kết thúc bằng một trong
3 mã kết thúc là UAA/UAG/UGA. Mỗi bộ 3 nucleotide của khung đọc mở tương
ứng với một codon mã hóa cho một amino acid. Khung đọc mở được đọc từ đầu
5’ - 3’ dọc theo phân tử mRNA, đọc từng mã
một, đọc không chồng chéo và đọc cho đến tận
mã kết thúc thì dừng lại.
c. Chức năng của gen
Chức năng của gen thể hiện ở 3 quá trình:
- Tái bản DNA.
- Phiên mã tạo ra mRNA, hoặc rRNA hay
tRNA.
- Dịch mã hoặc sinh tổng hợp protein dựa trên
khuôn mRNA xuyên qua ribosome để lắp ráp
các amino acid nhờ các tRNA vận chuyển
đến.
37
. Hoạt động của gen
Một gen đơn vị DNA tái bản, muốn hoạt động trước hết phải sinh ra mRNA,
rồi từ mRNA dịch mã thành polypeptide, các polypeptide có thể phải kết hợp lại
với nhau mới tạo thành một protein chức năng hay một enzyme, xúc tác cho một
công đoạn quyết định hoặc tạo nên tính trạng.
2.4.2.2. NhiÔm s¾c thÓ eukaryote gåm c¸c vïng dÞ nhiÔm s¾c vµ nhiÔm s¾c
thùc
DNA eukaryote cã kÝch thíc rÊt lín (vÝ dô ë ngêi DNA cã thÓ dµi ®Õn 1m)
nªn tÕ bµo cÇn ph¶i gi¶i quyÕt ®îc vÊn ®Ò nÐn chÆt ph©n tö nµy vµo thÓ tÝch h¹n
chÕ cña nh©n. ViÖc nÐn chÆt ®îc thùc hiÖn ë nhiÒu møc ®é, møc ®é thÊp nhÊt lµ
nucleosome vµ møc ®é cao nhÊt lµ cÊu tróc nhiÔm s¾c chÊt. ThËt vËy, sîi nhiÔm
s¾c chÊt khi quan s¸t díi kÝnh hiÓn vi ®iÖn tö cã ®êng kÝnh 100A0 ®«i khi ®¹t
300A0, trong khi ®êng kÝnh cña chuçi xo¾n kÐp DNA chØ lµ 20A0. §iÒu nµy
chøng tá ph©n tö DNA tham gia h×nh thµnh nh÷ng cÊu tróc phøc t¹p h¬n (h×nh
1.13).
- Sîi cã ®êng kÝnh 100A0 lµ mét chuçi nhiÒu nucleosome. §ã lµ nh÷ng cÊu
tróc h×nh thµnh tõ mét sîi DNA quÊn quanh mét lâi gåm 8 ph©n tö histone.
- Sîi 100A0 nµy cã thÓ ®îc tæ chøc thµnh cÊu tróc phøc t¹p h¬n lµ sîi cã
®êng kÝnh 300A0: c¸c solenoid.
- Trong nh©n, c¸c sîi võa kÓ trªn kÕt hîp chÆt chÏ víi nhiÒu protein kh¸c
nhau t¹o thµnh nhiÔm s¾c chÊt, møc ®é tæ chøc cao nhÊt cña DNA. Cuèi cïng, khi
nhiÔm s¾c chÊt ®¹t ®é nÐn cùc ®¹i, nã trë thµnh nhiÔm s¾c thÓ. §ã lµ khi tÕ bµo
ph©n chia.
Th«ng thêng, nhiÔm s¾c thÓ ®îc quan s¸t thÊy râ nhÊt vµo trung kú. Lóc
®ã, mçi nhiÔm s¾c thÓ ®îc nh©n ®«i thµnh hai nhiÔm s¾c tö (chromatide) gièng
hÖt nhau, dÝnh víi nhau ë t©m ®éng, mçi nhiÔm s¾c tö lµ mét ph©n tö DNA.
38
C¸c DNA ë eukaryote kh¸c víi DNA ë prokaryote lµ toµn bé ph©n tö DNA
cña prokaryote ®Òu mang th«ng tin m· ho¸, trong khi DNA cña eukaryote bao
gåm nh÷ng tr×nh tù m· ho¸ (exon) xen kÏ víi nh÷ng tr×nh tù kh«ng m· ho¸
(intron). §óng h¬n lµ c¸c tr×nh tù m· ho¸ ë eukaryote ch×m ngËp trong mét khèi
lîng lín DNA mµ hiÖn nay cßn cha râ t¸c dông. Tuy nhiªn, ®iÒu ®¸ng lu ý lµ
sè lîng gen vµ kÝch thíc DNA ë eukaryote hoµn toµn kh«ng cã mèi liªn quan
g× tíi kÝch thíc vµ møc ®é tiÕn ho¸ cña sinh vËt: vÝ dô mét sè thùc vËt vµ ®éng
vËt lìng thª cã DNA lín gÊp tr¨m lÇn so víi DNA ë ngêi. Tuú møc ®é hiÖn diÖn
cña chóng trong nh©n, c¸c tr×nh tù DNA ®îc chia lµm ba lo¹i:
- C¸c tr×nh tù lÆp l¹i nhiÒu lÇn chiÕm 10 - 15% bé gen ®éng vËt cã vó.
§ã lµ nh÷ng tr×nh tù DNA ng¾n (10 - 20kb), kh«ng m· ho¸, thêng tËp trung ë
nh÷ng vïng chuyªn biÖt trªn nhiÔm s¾c thÓ nh ë vïng t©m ®éng (tr×nh tù CEN)
hay ë ®Çu c¸c nhiÔm s¾c thÓ (tr×nh tù TEL). Chøc n¨ng cña chóng cha râ, dêng
nh chóng tham gia vµo qu¸ tr×nh di chuyÓn cña DNA trªn thoi v« s¾c (tr×nh tù
CEN) hay tham gia vµo qu¸ tr×nh sao chÐp toµn vÑn cña phÇn DNA n»m ë ®Çu mót
nhiÔm s¾c thÓ (tr×nh tù TEL).
- C¸c tr×nh tù cã sè lÇn lÆp l¹i trung b×nh chiÕm kho¶ng 25 - 40% bé
gen ngêi. Chóng cã kÝch thíc lín h¬n (100 - 1000kb) vµ ®a d¹ng h¬n c¸c tr×nh
tù lÆp l¹i nhiÒu lÇn. C¸c tr×nh tù nµy kh«ng tËp trung mµ ph©n t¸n trªn toµn bé bé
39
gen. Chóng cã thÓ lµ nh÷ng tr×nh tù kh«ng m· ho¸ víi chøc n¨ng cha râ mµ còng
cã thÓ lµ nh÷ng tr×nh tù m· ho¸: c¸c gen m· ho¸ cho rRNA, tRNA vµ RNA 5S.
- C¸c tr×nh tù duy nhÊt lµ c¸c gen m· ho¸ cho c¸c protein, cã tr×nh tù
®Æc trng cho tõng gen.
Quan s¸t díi kÝnh hiÓn vi ®iÖn tö cho thÊy sîi nhiÔm s¾c gåm c¸c vïng co
®Ëm ®Æc hoÆc kh«ng co ®Ëm ®Æc xen kÏ lÉn nhau. Vïng ®Ëm ®Æc ®îc gäi lµ vïng
dÞ nhiÔm s¾c (heterochromatin). PhÇn lín c¸c vïng dÞ nhiÔm s¾c hÇu nh kh«ng
thay ®æi ngay c¶ khi tÕ bµo bíc vµo ph©n chia, chóng ®îc gäi lµ vïng dÞ nhiÔm
s¾c b¶o thñ (constitutive heterochromatin). Mét sè vïng dÞ nhiÔm s¾c cã thÓ xuÊt
hiÖn míi hoÆc cã thÓ biÕn mÊt khi tÕ bµo tr¶i qua c¸c giai ®o¹n sinh trëng, biÖt
ho¸, chóng ®îc gäi lµ vïng dÞ nhiÔm s¾c bÊt æn (facultative heterochromatin).
NhiÔm s¾c thùc chØ co ®Æc khi tÕ bµo chuÈn bÞ ph©n chia. Trong giai ®o¹n gian kú,
vïng nhiÔm s¾c thùc ph©n bè r¶i r¸c kh¾p trong nh©n. HÇu hÕt c¸c gen ph©n bè
trong vïng nhiÔm s¾c thùc, trong khi c¸c ®o¹n DNA lÆp l¹i vµ mét sè rÊt Ýt gen
(c¸c gen nµy ë tr¹ng th¸i kh«ng ho¹t ®éng) ph©n bè trong vïng dÞ nhiÔm s¾c b¶o
thñ. Ngoµi ra,vïng dÞ nhiÔm s¾c sao chÐp chËm h¬n c¸c vïng nhiÔm s¾c thùc trong
qu¸ tr×nh t¸i b¶n nhiÔm s¾c thÓ. §Æc biÖt, trao ®æi chÐo hÇu nh kh«ng x¶y ra ë
vïng dÞ nhiÔm s¾c gi÷a hai nhiÔm s¾c thÓ t¬ng ®ång.
Nh÷ng tÝnh chÊt ®Æc biÖt trªn vïng dÞ nhiÔm s¾c ®îc sinh häc hiÖn ®¹i quan
t©m ®Õn vµo nh÷ng n¨m cuèi thËp kû 20 cña thÕ kû XX. Sù h×nh thµnh vµ duy tr×
cÊu tróc dÞ nhiÔm s¾c phô thuéc vµo møc ®é methyl ho¸ cña cytosine vµ histone,
møc ®é khö acetyl cña histone. Thùc nghiÖm cho thÊy, khi khö bá c¸c nhãm
methyl trªn ph©n tö DNA vµ histone th× vïng dÞ nhiÔm s¾c gi·n ra vµ mét sè gen
ph©n bè trong ®ã ®îc phiªn m·.
B»ng kü thuËt lµm tiªu b¶n tÕ bµo nhuém víi chÊt mµu Giemsa, chóng ta cã
thÓ quan s¸t ®îc nhiÔm s¾c thÓ gåm c¸c b¨ng cã mµu nhuém ë møc ®é kh¸c
nhau. Chóng ph©n bè n»m ngang trªn nhiÔm s¾c thÓ vµ ®îc gäi lµ b¨ng G (G
band). Sè lîng b¨ng G còng nh ®é réng cña tõng b¨ng ®Æc trng cho tõng nhiÔm
s¾c thÓ. V× vËy, c¸c b¨ng G ®îc sö dông trong ph©n biÖt kiÓu nh©n (karyotype).
§iÒu thó vÞ lµ ë c¸c vïng n»m gi÷a c¸c b¨ng G cã thµnh phÇn G-C lín h¬n so víi
b¨ng G. VÝ dô ë ®éng vËt cã vó cã thµnh phÇn G-C trung b×nh kho¶ng 40% trong
®ã 30% ph©n bè trong b¨ng G cßn kho¶ng 65% ph©n bè trong vïng n»m gi÷a b¨ng
G. T¬ng tù nh ë vïng nhiÔm s¾c thùc, hÇu hÕt c¸c gen ph©n bè ë vïng n»m gi÷a
c¸c b¨ng G (vïng cã mµu rÊt nh¹t).
40
. DNA có trình tự lặp lại liền kề (Tandemly repeated DNA)
Các DNA có trình tự lặp lại liền kề hay còn gọi là các DNA vệ tinh. Gọi là
các DNA vệ tinh vì các đoạn DNA này có chứa những trình tự DNA được lặp lại
liền nhau hình thành nên các băng vệ tinh khi phân tích DNA của genome bằng
phương pháp ly tâm chênh lệch tỷ trọng (density gradient centrifugation).
Một genome có thể chứa nhiều loại DNA vệ tinh với đơn vị lặp lại khác
nhau. Đơn vị lặp lại của các DNA vệ tinh thay đổi từ vài (<5 bp) đến hàng trăm
cặp bazơ (>200 bp). DNA vệ tinh thường tìm thấy ở tâm động hoặc vùng dị nhiễm
sắc trên nhiễm sắc thể. Chúng thuộc nhóm các DNA có trình tự lặp lại cao.
a. Khái niệm
Cơ chế phổ biến nhất đối với những trình tự này đó là sự di chuyển vị trí
(transposition).
Chính các yếu tố di truyền có khả năng di động (mobile genetic
eleenzymets) giữa các vị trí khác nhau trong một hay nhiều genome đã tạo ra các
trình tự lặp lại phân bố rải rác trong genome và góp phần làm đa dạng di truyền
giữa các cá thể trong loài.
Cơ chế di chuyển: Dựa vào cơ chế di chuyển, các yếu tố có khả năng di
động (còn gọi là các yếu tố chuyển vị) có thể xếp thành hai nhóm:
- Nhóm các yếu tố di chuyển thông qua trung gian RNA (RNA transposons
hay retroeleenzymets).
- Nhóm các yếu tố di chuyển không qua trung gian RNA là các DNA
transposons.
b. Nhóm các yếu tố di chuyển thông qua trung gian RNA (RNA transposons).
Từ đoạn retroposon tổng hợp một bản sao RNA thông qua hoạt động phiên
mã, sau đó tổng hợp thành DNA từ bản RNA được phiên mã. Quá trình này có sự
tham gia của enzyme phiên mã ngược (reverse transcriptase). Thường enzyme
này được mã hoá bởi gen nằm ngay trong đoạn retroposon.
41
Bản sao DNA của retroposon được tổ hợp vào genome. Chúng có thể được
tổ hợp lại trong cùng một nhiễm sắc thể trên đó đang mang đơn vị lặp lại nguyên
thuỷ hoặc cũng có thể được chèn vào một nhiễm sắc thể khác.
Chúng di chuyển thông qua sơ đồ sau:
Retroposon
Phiên mã
Phiên mã ngược
RNA
cDNA
Tái tổ hợp
42
eleenzymet), được gọi tắt la RTVLs và có khoảng 20.000 bản trong genome của
người.
43
Ch¬ng 2
tÝnh æn ®Þnh vµ biÕn ®éng cña dna
Trong chu tr×nh tÕ bµo, sù ph©n chia tÕ bµo chØ x¶y ra sau khi cã sù nh©n ®«i
th«ng tin di truyÒn sao cho hai tÕ bµo con s¾p h×nh thµnh ®Òu nhËn ®îc mét lîng
th«ng tin di truyÒn gièng hÖt tÕ bµo mÑ. Sù nh©n ®«i nµy ®îc ®¶m b¶o bëi mét
qu¸ tr×nh gäi lµ sù sao chÐp DNA, trong ®ã mét ph©n tö DNA s¶n sinh ra hai ph©n
tö con gièng hÖt ph©n tö ban ®Çu. ChÝnh cÊu tróc xo¾n kÐp cña ph©n tö DNA ®·
gîi ý cho viÖc gi¶i thÝch c¬ chÕ cña hiÖn tîng nµy. Bªn c¹nh viÖc ®¶m b¶o lu tr÷
vµ truyÒn ®¹t th«ng tin mét c¸ch trung thùc, tÕ bµo ph¶i tù trang bÞ mét hÖ thèng
b¶o vÖ vµ söa ch÷a c¸c sai lÇm trong khi sao chÐp DNA. Tuy nhiªn th«ng tin kh«ng
ph¶i lóc nµo còng ®îc truyÒn ®¹t mét c¸ch bÊt di bÊt dÞch. Qu¸ tr×nh tiÕn ho¸ cña
sinh giíi ®· lÊy nguyªn liÖu tõ nh÷ng biÕn ®éng cña th«ng tin di truyÒn hay nãi
mét c¸ch kh¸c lµ tõ nh÷ng thay ®æi cña DNA. Sù thay ®æi nµy ph¸t sinh do c¸c
®ét biÕn, do c¸c gen nh¶y hay do t¸i tæ hîp trªn ph©n tö DNA.
1. TÝnh æn ®Þnh cña DNA lµ kÕt qu¶ cña hai qu¸ tr×nh: sao
chÐp vµ söa sai
1.1. Qu¸ tr×nh sao chÐp
1.1.1. C¬ chÕ sao chÐp DNA
Mét trong nh÷ng tÝnh chÊt c¨n b¶n cña di truyÒn DNA lµ kh¶ n¨ng tù sao
chÐp (replication) chÝnh x¸c hay tù nh©n ®«i (self duplication). ¦u ®iÓm næi bËt
cña m« h×nh Watson - Crick lµ cho phÐp dù ®o¸n ®îc ph©n tö DNA sao chÐp nh
thÕ nµo. NÕu nh m« h×nh ®Ò ra lµ ®óng th× mçi ph©n tö chÞ em cã chøa mét sîi
nucleotide cña bè mÑ vµ mét sîi míi ®îc tæng hîp, ®©y lµ c¬ chÕ sao chÐp b¸n
b¶o tån. MÆc dï vËy bªn c¹nh ®ã vÉn cã c¸c gi¶ thiÕt kh¸c vÒ c¬ chÕ sao chÐp cña
DNA, c¸c gi¶ thiÕt ®ã lµ c¬ chÕ b¸n b¶o tån (m« h×nh cña Watson vµ Crick), c¬
chÕ sao chÐp b¶o tån vµ ph©n t¸n. Trong c¬ chÕ sao chÐp b¶o, ph©n tö DNA bè mÑ
®îc b¶o tån vµ ph©n tö chÞ em ®îc t¹o ra cã chøa hai sîi míi ®îc tæng hîp.
Cßn ë c¬ chÕ sao chÐp ph©n t¸n, c¸c ph©n tö DNA chÞ em cã chøa c¸c sîi
nucleotide cã c¶ c¸c ®o¹n DNA cña bè mÑ lÉn ®o¹n DNA míi tæng hîp. Ngay sau
khi m« h×nh cÊu tróc ®îc nªu ra, nhiÒu thÝ nghiÖm ®îc tiÕn hµnh ®Ó x¸c nhËn
c¸c dù ®o¸n.
Ngay khi nªu ra m« h×nh, Watson vµ Crick ®· cho r»ng nÕu hai m¹ch cña
ph©n tö DNA ®îc t¸ch ra do c¸c liªn kÕt hydro gi÷a c¸c cÆp base bÞ ®øt, mçi
44
m¹ch sÏ lµm khu«n cÇn thiÕt cho viÖc tæng hîp m¹ch cÆp míi t¬ng tù víi m¹ch
cÆp tríc ®ã. V× A ph¶i b¾t cÆp víi T vµ G ph¶i lu«n b¾t cÆp víi C nªn tr×nh tù
nucleotide trªn mét m¹ch sÏ x¸c ®Þnh chÝnh x¸c tr×nh tù ®Æc hiÖu c¸c nucleotide
trªn m¹ch bæ sung víi nã. Nãi c¸ch kh¸c, nÕu tÕ bµo t¸ch rêi hai m¹ch cña ph©n
tö DNA ra, nã cã thÓ xÕp c¸c nucleotide cña m¹ch míi thµnh m¹ch bæ sung. Nh
vËy, hai m¹ch cò cña ph©n tö DNA ban ®Çu ®îc t¸ch ra, mçi c¸i lµm khu«n ®Ó
tæng hîp m¹ch míi. KÕt qu¶, tõ mét ph©n tö DNA ban ®Çu t¹o ra hai ph©n tö con
gièng hÖt nhau. Mçi ph©n tö con ®Òu mang mét m¹ch cò vµ mét m¹ch míi. KiÓu
sao chÐp nµy gäi lµ sao chÐp b¸n b¶o tån.
§Ó x¸c ®Þnh ®îc c¬ chÕ sao chÐp cña DNA lµ theo c¬ chÕ sao chÐp b¸n b¶o
tån, b¶o tån hay ph©n t¸n cÇn ph¶i cã nh÷ng kÕt qu¶ thùc nghiÖm chøng minh.
N¨m 1958, M. Meselson vµ Stahl ®· chøng minh kiÓu sao chÐp cña DNA lµ sao
chÐp b¸n b¶o tån. Hai «ng ®· nu«i E. coli nhiÒu thÕ hÖ trªn m«i trêng cã nguån
N ®ång vÞ nÆng (N15). Nh vËy, tÊt c¶ DNA cña vi khuÈn ®Òu mang ®ång vÞ nÆng
N15 thay thÕ cho N14 b×nh thêng. Sau ®ã, tÕ bµo ®îc chuyÓn sang m«i trêng chØ
chøa N14 nhÑ, mÉu c¸c tÕ bµo ®îc lÊy ra theo nh÷ng kho¶ng thêi gian ®Òu ®Æn vµ
t¸ch chiÕt DNA. B»ng ph¬ng ph¸p li t©m trªn thang nång ®é CsCl, c¸c lo¹i DNA
nÆng, nhÑ vµ lai ®îc t¸ch ra.
KÕt qu¶ cho thÊy DNA nÆng ban ®Çu (thÕ hÖ 0) chøa N15, sau mét lÇn ph©n
chia cho thÕ hÖ I víi DNA lai cã tØ träng n»m gi÷a DNA nÆng N15 vµ DNA nhÑ
N14. Nãi c¸ch kh¸c, sau mét lÇn sao chÐp ph©n tö DNA míi chøa mét nöa mang
N15 vµ mét nöa mang N14. ë thÕ hÖ II, mét nöa sè ph©n tö DNA lµ lai, nöa cßn l¹i
lµ DNA nhÑ N14 (h×nh 2.1). ThÝ nghiÖm nµy kh¼ng ®Þnh gi¶ thuyÕt cña Watson vµ
Crick lµ ®óng, tøc hai m¹ch mÑ t¸ch ra, mçi c¸i lµm khu«n ®Ó tæng hîp nªn m¹ch
míi bæ sung.
H×nh 2.1. ThÝ nghiÖm sao chÐp DNA theo c¬ chÕ b¸n b¶o tån
45
1.1.2. Qu¸ tr×nh sao chÐp DNA ë prokaryote
Nh÷ng nghiªn cøu tiÕp theo ®· t×m ra c¸c c¬ chÕ ph©n tö cña qu¸ tr×nh sao
chÐp DNA. §ã lµ mét qu¸ tr×nh phøc t¹p, nhng ph¶i tr¶i qua c¸c c¬ chÕ chung
nh:
- C¸c liªn kÕt hydro æn ®Þnh cÊu tróc xo¾n vµ g¾n hai m¹ch víi nhau ph¶i bÞ
ph¸ vì vµ t¸ch rêi hai m¹ch.
- Ph¶i cã ®o¹n måi (primer) tøc ®o¹n DNA hay RNA m¹ch ®¬n ng¾n b¾t cÆp
víi m¹ch ®¬n khu«n.
- §ñ bèn lo¹i nucleoside triphosphate (dATP, dTTP, dCTP vµ dGTP) b¾t cÆp
bæ sung víi c¸c nucleotide m¹ch khu«n.
- M¹ch míi tæng hîp theo híng 5'P 3' OH.
- C¸c nucleotide míi ®îc nèi l¹i víi nhau b»ng liªn kÕt céng ho¸ trÞ ®Ó t¹o
m¹ch míi.
Mçi bíc ®îc ®iÒu khiÓn bëi enzyme ®Æc hiÖu vµ ®îc thùc hiÖn mét c¸ch
nhanh chãng, chÝnh x¸c.
ë prokaryote lÉn eukaryote, tõng m¹ch riªng lÎ ®îc sao chÐp chØ theo mét
híng: c¸c enzyme sao chÐp di chuyÓn däc theo m¹ch mÑ tõ ®Çu 3' ®Õn 5' ®Ó t¹o
nªn m¹ch míi bæ sung theo híng 5' ®Õn 3'. Ph©n tö DNA gåm hai m¹ch ®èi song
song, khi t¸ch hai m¹ch ë mét ®Çu ®Ó sao chÐp, t¹o ra ch¹c ba sao chÐp (replication
fork). M¹ch míi ®îc tæng hîp theo híng 5' ®Õn 3', nªn trªn mét m¹ch khu«n
qu¸ tr×nh tæng hîp sÏ híng tõ ngoµi vµo ch¹c ba, cßn ë m¹ch khu«n kia sÏ tæng
hîp theo chiÒu tõ ch¹c ba híng ra ngoµi, b»ng c¸ch t¹o ra c¸c ®o¹n ng¾n råi nèi
l¹i víi nhau.
Sau ®©y lµ diÔn biÕn sao chÐp ë nhiÔm s¾c thÓ vßng trßn DNA cña E. coli.
Chi tiÕt qu¸ tr×nh ®îc m« t¶ trªn h×nh 2.2, gåm c¸c giai ®o¹n: khëi ®Çu (initiation),
nèi dµi (elongation) vµ kÕt thóc (termination).
46
H×nh 2.2. Qu¸ tr×nh sao chÐp DNA
1.1.2.1. C¸c thµnh phÇn tham gia trong qu¸ tr×nh sao chÐp
♦ Oligonucleotide måi vµ RNA primase trong qu¸ tr×nh tæng hîp DNA
Do DNA polymerase chØ tæng hîp sîi DNA theo mét chiÒu duy nhÊt tõ 5'3'
nªn mét sîi DNA ®îc tæng hîp liªn tôc, cßn sîi kia do nhiÒu ®o¹n Okazaki ®îc
tæng hîp råi nèi víi nhau. Kho¶ng c¸ch gi÷a hai sîi Okazaki kho¶ng 2000 base
vµ thêi gian trung b×nh ®Ó tæng hîp mét sîi chiÕm kho¶ng 4 gi©y.
Tæng hîp bÊt cø ®o¹n Okazaki nµo còng ®ßi hái oligonucleotide måi. B¶n
chÊt cña måi nµy lµ c¸c ribonucleoside triphosphate ®îc nèi víi nhau nhê enzyme
DNA primase. Do ®ã, c¸c oligonucleotide nµy cßn ®îc gäi lµ c¸c måi RNA
(RNA primer). Chóng dµi kho¶ng 10 nucleotide, bÞ ph©n huû sau khi ®o¹n Okazaki
®îc tæng xong. C¬ chÕ söa ch÷a DNA sÏ thay thÕ chóng bëi c¸c
desoxyribonucleotide theo nguyªn t¾c t¹o cÆp bæ sung. Cuèi cïng, DNA ligase sÏ
nèi c¸c ®o¹n Okazaki víi nhau t¹o sîi DNA míi (h×nh 2.2).
§Ó trë thµnh khu«n cho ph¶n øng nh©n ®«i DNA, ph©n tö DNA sîi ®«i nhÊt
thiÕt ph¶i më xo¾n, tøc lµ liªn kÕt bæ sung gi÷a c¸c base bÞ ®øt g·y vµ hai sîi ®¬n
®îc t¸ch nhau. Më xo¾n vµ gi÷ hai sîi ®¬n ë d¹ng tù do kh«ng cã cÊu tróc bËc
hai ®îc thùc hiÖn nhê mét sè enzyme vµ protein ®Æc hiÖu.
♦ DNA helicase
DNA helicase lµ protein cã kh¶ n¨ng ph©n huû ATP mét khi ®· b¸m vµo sîi
®¬n DNA. Nhê ph¶n øng nµy DNA helicase cã thÓ di chuyÓn däc theo chiÒu dµi
sîi ®¬n lµm cho sîi ®«i ph¶i tiÕp tôc më xo¾n t¸ch thµnh hai sîi ®¬n (h×nh 2.3).
Th«ng thêng, t¹i ch¹c sao chÐp ch÷ Y cã hai ph©n tö DNA helicase di chuyÓn
47
trªn hai sîi ®¬n theo hai híng ngîc nhau. Chóng cã thÓ thuéc hai lo¹i helicase
kh¸c nhau do tÝnh chÊt di chuyÓn ngîc chiÒu nµy.
H×nh 2.3. Vai trß cña helicase vµ topoisomerase (gyrase) trong viÖc gi¶i xo¾n DNA
48
biÖt tr¸nh ®îc liªn kÕt t¹o cÊu tróc vßng cña sîi ®¬n khu«n khi tæng hîp c¸c ®o¹n
Okazaki.
♦ Vai trß cña c¸c DNA polymerase trong t¸i b¶n DNA
ë E.coli cã 5 lo¹i polymerase, nhng chØ cã mét lo¹i DNA polymerase lµ
enzyme sao chÐp, nh÷ng enzyme cßn l¹i chñ yÕu cã chøc n¨ng söa ch÷a nh÷ng sai
háng trªn DNA nh: khëi ®Çu ch¹c sao chÐp DNA, khi qu¸ tr×nh nµy bÞ c¶n do
nh÷ng sai háng trªn DNA, vît qua nh÷ng sai háng trªn DNA
B¶ng 2.1. Tãm t¾t nh÷ng ®Æc ®iÓm c¬ b¶n cña c¸c DNA polymerase ë E.coli
49
♦ Protein cã cÊu tróc vßng gi÷ DNA polymerase chuyÓn ®éng trªn sîi
DNA
HÇu hÕt c¸c ph©n tö DNA polymerase cã xu híng tæng hîp mét ®o¹n ng¾n
c¸c nucleotide råi t¸ch ra khái khu«n. §iÒu nµy gióp cho enzyme nhanh chãng rêi
khái ®o¹n Okazaki ®· tæng hîp xong vµ quay vßng rÊt nhanh ®Ó tæng hîp ®o¹n
tiÕp theo ngay trªn mét sîi khu«n. Tuy nhiªn, xu thÕ t¸ch khái sîi khu«n g©y bÊt
lîi cho enzyme khi tæng hîp sîi DNA dµi liªn tôc. §Ó kh¾c phôc ®iÒu nµy, ph©n
tö enzyme ®îc gi÷ l¹i trªn sîi khu«n nhê mét cÊu tróc ®Æc biÖt gièng nh chiÕc
kÑp. KÑp nµy cho phÐp enzyme b¸m v÷ng ch¾c khi chuyÓn ®éng trªn sîi khu«n,
nhng ®ång thêi còng ®¶m b¶o cho enzyme rêi khái khu«n nhanh chãng khi qu¸
tr×nh tæng hîp kÕt thóc (h×nh 2.6).
♦ DNA ligase
DNA ligase lµ protein cã kh¶ n¨ng ph©n huû ATP ®Ó hµn kÝn m¹ch cña DNA
sîi muén b»ng liªn kÕt phosphodiester trong qu¸ tr×nh sao chÐp.
1.1.2.2. Giai ®oạn khëi ®Çu sao chÐp
§ã lµ giai ®o¹n nhËn diÖn ®iÓm më ®Çu. C¸c protein tham gia vµo giai ®o¹n
nµy gäi lµ nh÷ng protein më ®Çu vµ gióp cho viÖc g¾n enzyme primase vµo khu«n
DNA. C¸c protein më ®Çu gåm:
- §o¹n ori C chøa 245 cÆp base trong ®ã cã ®o¹n ch×a kho¸ g¾n DNA vµo
phøc hîp më ®Çu.
- Protein DnaA t¹o phøc hîp më
- Dna B vµ Dna C t¹o phøc hîp måi
Nh vËy hµng ngh×n cÆp base ®îc th¸o xo¾n díi t¸c dông cña c¸c protein
nãi trªn thuéc helicase vµ gyrase. §ång thêi th¸o xo¾n cã protein liªn kÕt víi sîi
®¬n ®Ó æn ®Þnh cÊu tróc kh«ng bÞ xo¾n l¹i vµ cã sù tham gia cña n¨ng lîng th¸o
xo¾n qua thuû ph©n ATP.
RNA primase g¾n vµo phøc hîp trªn t¹o thµnh primosome vµ b¾t ®Çu tæng
hîp RNA måi kho¶ng 10 - 60 nucleotide. C¸c ®o¹n måi nµy còng cÇn cho viÖc
tæng hîp ®o¹n Okazaki.
50
H×nh 2.5. DiÔn tiÕn cña giai ®o¹n khëi ®Çu sao chÐp ë E.coli
ë E.coli qu¸ tr×nh b¾t ®Çu sao chÐp khi protein DnaA ®Æc hiÖu nhËn biÕt ®iÓm
khëi ®Çu sao chÐp (replication origine gäi t¾t lµ ori) vµ g¾n vµo tr×nh tù base ®Æc
biÖt ®ã. TiÕp theo enzyme gyrase (mét lo¹i enzyme topoisomerase) c¾t DNA lµm
th¸o xo¾n ë hai phÝa cña protein DnaA. Trong khi hai ph©n tö enzyme gyrase
chuyÓn ®éng ngîc chiÒu nhau so víi ®iÓm ori th× hai ph©n tö A cña enzyme
helicase (cßn gäi lµ rep) tham gia t¸ch m¹ch t¹o ch¹c ba sao chÐp. Helicase sö
dông n¨ng lîng ATP lµm ®øt c¸c liªn kÕt hydro gi÷a hai base b¾t cÆp víi nhau.
C¸c protein lµm c¨ng m¹ch SSB (single strand binding protein = SSB protein) g¾n
vµo c¸c m¹ch ®¬n DNA lµm chóng t¸ch nhau th¼ng ra vµ kh«ng chËp l¹i m«t c¸ch
ngÉu nhiªn hoÆc xo¾n l¹i ®Ó viÖc sao chÐp ®îc dÔ dµng.
Qóa tr×nh sao chÐp cña E.coli b¾t ®Çu tõ mét ®iÓm cè ®Þnh gäi lµ oriC vµ sau
®ã di chuyÓn theo hai híng (nh ë h×nh 2.2) cho ®Õn khi ch¹c sao chÐp ®îc më
ra. DiÔn tiÕn diÔn ra nh h×nh 2.5. Bíc ®Çu tiªn lµ sù kÕt hîp cña mét protein gäi
lµ DnaA víi tr×nh tù lÆp l¹i 9bp, sau ®ã DnaA liªn kÕt víi c¸c ®o¹n tr×nh tù lÆp
l¹i 13bp. Khi c¸c tr×nh tù lÆp l¹i 9bp vµ 13bp ®· liªn kÕt víi DnaA ®îc bÎ cong
bëi c¸c ®¬n ph©n DnaA ë hai vïng tr×nh tù nµy g¾n l¹i víi nhau, tiÕp theo sau ®ã
sîi DNA xo¾n kÐp ®îc th¸o xo¾n t¹i vïng tr×nh tù lÆp l¹i 13bp giµu AT.
Sau khi DNA b¾t ®Çu ®îc th¸o xo¾n c¸c ph©n tö DnaA tù do ®îc liªn kÕt
víi vïng sîi ®¬n míi th¸o xo¾n. Vïng khëi ®Çu ®îc bao phñ bëi DnaA, hai
51
helicase (protein DnaB) ®îc DnaC vËn chuyÓn ®Õn vïng oriC ®· ®îc th¸o xo¾n,
liªn kÕt víi sîi ®¬n DNA vµ tiÕp tôc th¸o xo¾n DNA ®Ó h×nh thµnh ch¹c sao chÐp.
TiÕp theo sau ®ã, primase vµ DNA polymerase III ®îc kÕt hîp vµo ch¹c sao chÐp
bëi c¸c t¬ng t¸c gi÷a protein – protein vµ qu¸ tr×nh tæng hîp DNA b¾t ®Çu.
DnaA lµ mét thµnh phÇn cña thÓ sao chÐp (lµ mét bé m¸y cã thÓ kiÓm so¸t
qu¸ tr×nh sao chÐp gåm c¸c enzyme DNA polymerase, primase, helicase vµ c¸c
protein phô trî kh¸c cã mÆt trong qu¸ tr×nh sao chÐp DNA), cã chøc n¨ng mang
c¸c thµnh phÇn cña thÓ sao chÐp DNA ®Õn ®óng n¬i khëi ®Çu sao chÐp cña nhiÔm
s¾c thÓ vßng trßn.
1.1.2.3. Giai ®o¹n nèi dµi
DNA-polymerase III lµ mét phøc hîp gåm nhiÒu enzyme g¾n víi nhau b¾t
®Çu sao chÐp mét trong hai m¹ch b»ng c¸ch g¾n vµo m¹ch khu«n vµ l¾p c¸c
nucleotide bæ sung vµo vÞ trÝ t¬ng øng. Mét phøc hîp lµ cÇn thiÕt v× DNA
polymerase ph¶i xóc t¸c nhiÒu bíc ph¶n øng kh¸c nhau vµ ph¶i cã kh¶ n¨ng sö
dông bèn lo¹i nucleotide nh chÊt ph¶n øng phô thuéc vµo chç ®îc "®äc" trªn
m¹ch khu«n. Ýt nhÊt nã ph¶i cã bèn trung t©m ho¹t ®éng, mçi trung t©m øng víi
mét lo¹i nucleotide (A, T, C, G). Ngoµi chøc n¨ng polymer ho¸ theo híng 5' ®Õn
3', DNA polymerase III cßn cã kh¶ n¨ng söa sai nhê ho¹t tÝnh exonuclease
(exonuclease lµ ho¹t tÝnh enzyme c¾t DNA tõ ®Çu mót mét m¹ch) theo híng 3'
5'.
Khi phøc hîp DNA polymerase ®äc theo m¹ch khu«n vµ kÐo c¸c nucleotide
bæ sung vµo ®óng chç, nã g¾n c¸c nucleotide l¹i lµm m¹ch míi bæ sung mäc dµi
ra. Trªn ®êng di chuyÓn ®Ó tæng hîp DNA, nÕu DNA polymerase III gÆp chç mµ
nucleotide míi l¾p sai vÞ trÝ nã sö dông ho¹t tÝnh exonuclease 3'5' c¾t lïi l¹i bá
nucleotide sai, ®Ó råi l¾p c¸i ®óng vµo tiÕp tôc sao chÐp. C¸c nucleotide tríc khi
®îc g¾n vµo ®Çu 3' OH ®· ®îc ho¹t ho¸ do ATP ®Ó thµnh nucleoside triphosphate
cã mang n¨ng lîng. DNA polymerase cã tÝnh ®Æc hiÖu cao, nã chØ thªm
nucleotide vµo ®Çu 3' OH cña m¹ch ®ang ®îc tæng hîp.
52
H×nh 2.6. Ch¹c ba sao chÐp vµ c¸c thµnh phÇn tham gia trong qu¸ tr×nh sao chÐp
M¹ch khu«n cã ®Çu 3' ®îc DNA polymerase III g¾n vµo vµ tæng hîp ngay
m¹ch bæ sung 5'3' híng vµo ch¹c ba sao chÐp. M¹ch khu«n nµy ®îc gäi lµ
m¹ch khu«n tríc, cßn m¹ch míi ®îc tæng hîp gäi lµ m¹ch tríc (leading strand)
(h×nh 2.6).
Trong khi ®ã, ë m¹ch khu«n sau cã ®Çu 5' viÖc tæng hîp phøc t¹p h¬n vµ thùc
hiÖn tõ ch¹c ba sao chÐp híng ra ngoµi ®Ó ®¶m b¶o ®óng híng 5'3'. Khi m¹ch
kÐp t¸ch ra, ë gÇn ch¹c ba sao chÐp, enzyme primase g¾n måi (primer) RNA
kho¶ng 10 nucleotide, cã tr×nh tù bæ sung víi m¹ch khu«n. DNA polymerase III
nèi theo måi RNA, theo híng ngîc víi ch¹c ba sao chÐp, tæng hîp c¸c ®o¹n
ng¾n 1000 - 2000 nucleotide, ®îc gäi lµ c¸c ®o¹n Okazaki. DNA polymerase nèi
dµi ®o¹n Okazaki cho ®Õn khi gÆp RNA måi phÝa tríc th× dõng l¹i, råi lïi ra sau
tiÕp tôc tæng hîp tõ RNA måi míi ®îc t¹o nªn gÇn ch¹c ba sao chÐp. TiÕp theo,
DNA polymerase I nhê ho¹t tÝnh exonuclease 5' 3' c¾t bá måi RNA, l¾p c¸c
nucleotide cña DNA vµo chç trèng vµ thùc hiÖn polymer ho¸ híng 5'3'. §o¹n
DNA ng¾n 10 nucleotide nµy cßn hë hai ®Çu, ®îc nèi liÒn chç hë nhê enzyme
ligase cña DNA. M¹ch ®îc tæng hîp tõ ch¹c ba sao chÐp híng ra ngoµi ®îc
tæng hîp chËm h¬n nªn gäi lµ m¹ch sau (lagging strand).
53
H×nh 2.7. Sù chuyÓn ®éng cña DNA polymerase III trong qu¸ tr×nh sao chÐp
KiÓm so¸t ®Çu tiªn cña qu¸ tr×nh sao chÐp lµ tÝnh chÝnh x¸c vÒ tr×nh tù cña sîi
DNA míi ®îc tæng hîp. KiÓu kiÓm so¸t thø hai ®ã lµ tèc ®é sao chÐp DNA.
Chóng ta biÕt r»ng thêi gian cÇn thiÕt ®Ó E.coli sao chÐp nhiÔm s¾c thÓ cña nã víi
thêi gian ng¾n nhÊt lµ kho¶ng 20 phót. Do ®ã, bé gen cña nã kho¶ng 5 triÖu cÆp
base ph¶i ®îc sao chÐp víi tèc ®é 2000 nucleotide/gi©y. Tõ thÝ nghiÖm cña J.
Cairns, chóng ta cã thÓ biÕt r»ng E.coli chØ sö dông hai ch¹c sao chÐp ®Ó t¸i b¶n
toµn bé bé gen cña nã. Do ®ã, mçi ch¹c sao chÐp ph¶i cã kh¶ n¨ng di chuyÓn víi
tèc ®é kho¶ng 1000 nucleotide/gi©y. §Ó ®¶m b¶o tèc ®é vµ ®é chÝnh x¸c cña ph¶n
øng tæng hîp DNA, DNA polymerase thùc sù lµ mét phÇn cña phøc hîp lín
“nucleoprotein”, phøc hîp nµy ®ång ho¹t ®éng t¹i ch¹c sao chÐp (h×nh 2.7). Phøc
hîp nµy ®îc gäi lµ thÓ sao chÐp, lµ mét vÝ dô vÒ bé m¸y ph©n tö.
Mét sè hîp phÇn t¬ng t¸c cña thÓ sao chÐp ë E.coli ®îc biÓu hiÖn ë h×nh 2.7.
T¹i ch¹c sao chÐp lâi DNA polymerase III, lµ mét phÇn cña phøc hîp lín h¬n gäi
lµ holoenzyme polymerase III cã chøa hai lâi DNA polymerase III vµ nhiÒu protein
phô trî, xóc t¸c ph¶n øng tæng hîp DNA. Trong ®ã, mét lâi DNA polymerase III
tæng hîp sîi tríc, lâi enzyme cßn l¹i tæng hîp sîi muén. Mét sè protein phô trî
lµm cÇu nèi hai lâi enzyme, do ®ã nã cïng ho¹t ®éng ®Ó tæng hîp sîi tríc vµ sîi
muén, b»ng c¸ch uèn vßng sîi khu«n tæng hîp sîi muén t¹o thuËn lîi cho lâi
enzyme tæng hîp sîi muén cïng híng víi híng di chuyÓn cña ch¹c sao chÐp vµ
híng tæng hîp sîi tríc. ë h×nh 2.7, chóng ta còng quan s¸t thÊy mét protein
phô trî kh¸c ®îc gäi lµ protein kÑp, nã kÑp DNA nh mét chiÕc b¸nh kÑp. Sù
54
kÕt hîp gi÷a protein kÑp víi DNA polymerase III gióp cho DNA polymerase III
trît liªn tôc trªn sîi DNA. Do ®ã, DNA polymerase III, mét enzyme chØ cã kh¶
n¨ng tæng hîp liªn tôc 10 nucleotide råi rêi khái khu«n DNA (cßn gäi lµ enzyme
tæng hîp ng¾t qu·ng), trë nªn cã kh¶ n¨ng tæng hîp liªn tôc hµng chôc ngµn
nucleotide (gäi lµ enzyme tæng hîp liªn tôc).
Tãm l¹i, sîi tríc vµ sîi muén ®îc tæng hîp ®ång thêi mét c¸ch nhanh chãng
vµ chÝnh x¸c. Nhng còng cÇn ph¶i chó ý r»ng primase lµ mét enzym tæng hîp
måi RNA, kh«ng ®îc g¾n víi protein kÑp vµ còng kh«ng cã ho¹t tÝnh söa sai. Do
®ã, primase ho¹t ®éng nh mét enzyme tæng hîp ng¾t qu·ng – cã nghÜa nã chØ
tæng hîp vµi ribonucleotide tríc khi rêi khái khu«n vµ ®o¹n måi nµy sÏ ®îc lo¹i
bá vµ thay thÕ b»ng nucleotide bëi ho¹t ®éng cña DNA polymerase I.
VÊn ®Ò cÇn gi¶i quyÕt tiÕp theo trong qu¸ tr×nh sao chÐp, ®ã lµ gi¶i xo¾n sîi kÐp
DNA t¹i ch¹c sao chÐp vµ th¸o xo¾n c¸c vßng siªu xo¾n phÝa tríc ch¹c sao chÐp,
do sù di chuyÓn cña ch¹c sao chÐp g©y ra. Chóng ta biÕt r»ng thÓ sao chÐp cã chøa
hai lo¹i protein cã kh¶ n¨ng më xo¾n lµ: helicase vµ topoisomerase. Helicase ph¸
vì c¸c liªn kÕt hydro gi÷a hai sîi DNA, gièng nh protein kÑp, helicase nh lµ
mét vßng bao quanh sîi DNA vµ nã di chuyÓn ®Ó th¸o xo¾n sîi DNA kÐp. C¸c sîi
DNA ®¬n võa ®îc th¸o ra khái sîi kÐp DNA ®îc æn ®Þnh bëi c¸c protein c¨ng
m¹ch ®¬n (SSB protein), ng¨n kh«ng cho c¸c sîi ®¬n nµy h×nh thµnh sîi kÐp trë
l¹i.
Topoisomerase th¸o xo¾n vïng siªu xo¾n b»ng c¸ch bÎ g·y mét hoÆc c¶ hai sîi
DNA, råi cho phÐp sîi DNA quay ®Ó th¸o xo¾n. Sau khi th¸o xo¾n xong,
topoisomerase nèi liÒn hai ®Çu DNA l¹i nh cò.
1.1.2.4. Giai ®o¹n kÕt thóc
Qu¸ tr×nh sao chÐp DNA ë E.coli diÔn ra víi tèc ®é rÊt nhanh, cã thÓ ®¹t ®îc
®Õn 50.000 nucleotide/phót, cßn ë ®éng vËt lµ 50 nucleotide/ gi©y (kho¶ng 3000
nucleotide/phót). §èi víi vi khuÈn, nÊm men vµ mét sè virus ký sinh trªn ®éng
vËt, hÖ gen cña chóng thêng chØ cã mét t©m sao chÐp vµ dµi kho¶ng 300bp. Khi
qu¸ tr×nh nh©n ®«i DNA b¾t ®Çu, hai ch¹c sao chÐp h×nh thµnh t¹i t©m vµ tiÕn vÒ
hai phÝa ngîc nhau.
§Ó theo dâi qu¸ tr×nh sao chÐp DNA, n¨m 1963 J. Cairns sö dông thymidine
– nucleotide thymine cã chøa ®ång vÞ phãng x¹ cña hydro lµ tritium, tiÒn chÊt ®Æc
hiÖu cho DNA sö dông. Qu¸ tr×nh xuÊt ph¸t tõ mét ®iÓm ori gäi lµ ®iÓm xuÊt ph¸t
vµ triÓn khai vÒ hai phÝa (h×nh 2.9). Khi DNA vßng trßn ®ang sao chÐp, quan s¸t
55
thÊy d¹ng DNA h×nh "con m¾t" (eye replication) (h×nh 2.8). Ch¹c ba sao chÐp lan
dÇn, cuèi cïng t¹o ra hai ph©n tö DNA lai: mét m¹ch cã mang dÊu phãng x¹ T-H3
(thymine H3). Cã trêng hîp sao chÐp chØ x¶y ra vÒ mét phÝa.
E. coli chØ cã mét ®iÓm xuÊt ph¸t sao chÐp t¹i ori nªn c¶ DNA thµnh mét ®¬n
vÞ sao chÐp thèng nhÊt ®îc gäi lµ replicon. Replicon ®îc hiÓu lµ ®¬n vÞ sao chÐp.
Bé gen cña c¸c sinh vËt tiÒn nh©n thêng chØ cã mét replicon.
NÕu cã hai ch¹c sao chÐp xuÊt ph¸t tõ hai phÝa cña t©m sao chÐp th× qu¸ tr×nh
sao chÐp ®îc coi lµ sao chÐp hai chiÒu (bidirectional replication). Hai ch¹c sao
chÐp nµy di chuyÓn víi tèc ®é nh nhau trªn ph©n tö DNA khu«n d¹ng vßng. Mçi
ch¹c sao chÐp sÏ cã ®iÓm dõng t¸i b¶n. §iÒu thó vÞ lµ ch¹c sao chÐp nµy ph¶i ®i
qua ®iÓm dõng cña ch¹c sao chÐp kia tríc khi hai ch¹c gÆp nhau vµ kÕt thóc qu¸
tr×nh t¸i b¶n (h×nh 2.9).
V× lý do nµo ®ã mét ch¹c di chuyÓn nhanh h¬n ch¹c kia th× nã sÏ ®i qua ®iÓm
dõng chung nhng bÞ chÆn l¹i ë ®iÓm kÕt thóc cña riªng m×nh. T¹i ®©y ch¹c di
chuyÓn nhanh sÏ dõng l¹i ®îi ®Ó gÆp ch¹c di chuyÓn chËm. C¸ch thøc s¾p xÕp c¸c
vÞ trÝ dõng sao chÐp nh ë bé gen vi khuÈn ®îc gäi lµ "bÉy ch¹c" (replication fork
trap).
56
H×nh 2.9. C¬ chÕ dõng sao chÐp cña DNA vßng
57
polymerase ε vµ δ, c¸c nh©n tè sao chÐp A vµ C (Replication Factor, RF-A, RF-
C) cÇn cho ho¹t ®éng cña c¸c polymerase α vµ δ, ...
1.1.3.2. C¸c giai ®o¹n cña qu¸ tr×nh sao chÐp
Chóng ta biÕt r»ng sù tæng hîp DNA diÔn ra trong phase S cña chu kú tÕ bµo.
ë nÊm men ngêi ta t×m thÊy 3 protein ®îc cÇn cho sù khëi ®Çu sao chÐp, ®ã lµ
Cdc6, Cdt1 vµ ORC (phøc hîp nhËn biÕt ®iÓm khëi ®Çu sao chÐp – origin
recognition complex). ORC nhËn biÕt ®iÓm khëi ®Çu sao chÐp gièng nh DnaA
cña E.coli, sau ®ã kÕt hîp víi hai protein Cdc6 vµ Cdt1. Sù kÕt hîp cña hai protein
nµy gióp cho phøc hîp l«i kÐo ®îc helicase vµo ®iÓm khëi ®Çu sao chÐp vµ th¸o
xo¾n DNA t¹i tr×nh tù giµu AT cña ori. Mét m« h×nh sao chÐp chung cho
eukaryote ®îc ®Ò xuÊt nh sau:
♣ §Çu tiªn, DNA ®îc th¸o xo¾n nhê mét topoisomerase vµ nh©n tè
sao chÐp A (RF-A).
♣ Trªn m¹ch chËm, polymerase α/primer t¬ng t¸c víi RF-A tæng hîp
måi RNA (dµi ®é 10 nucleotide). Måi nµy ®îc nèi dµi thªm ®é 20
desoxynucleotide, nhê polymerase α kÕt hîp víi nh©n tè sao chÐp C (RF-C). Lóc
®ã, sù phèi hîp PCNA-ATP chËn polymerase α l¹i, gióp cho polymerase δ g¾n
vµo vµ tæng hîp ®o¹n Okazaki.
♣ Polymerase α ®îc gi¶i phãng sÏ ®îc chuyÓn lªn m¹ch ®èi diÖn vµ
tæng hîp liªn tôc m¹ch míi.
H×nh 2.10. Sù kÕt hîp cña c¸c nucleosome trong qu¸ tr×nh sao chÐp DNA
VÇn ®Ò ®Æt ra cho sù sao chÐp ë eukaryote lµ cÊu tróc cña nhiÔm s¾c chÊt.
NhiÒu nghiªn cøu sö dông c¸c phÇn tö ®¸nh dÊu b»ng ®ång vÞ phãng x¹ cho thÊy
c¸c ph©n tö DNA ngay sau khi ®îc sao chÐp sÏ ®îc tæ chøc l¹i thµnh nucleosome
(trong vßng vµi phót) nhê sù kÕt hîp c¸c histone vµo DNA bëi proteinCAF – 1
(nh©n tè kÕt hîp nhiÔm s¾c chÊt 1 – chromatin assembly factor 1). CAF – 1 liªn
58
kÕt víi c¸c histone, vËn chuyÓn chóng ®Õn ch¹c sao chÐp vµ kÕt hîp víi PCNA (lµ
mét phiªn b¶n cña protein kÑp nh ë E.coli), t¹i ®©y c¸c histone liªn kÕt víi sîi
DNA kÐp võa ®îc tæng hîp xong t¹o ra c¸c nucleosome (h×nh 2.10). C¸c
nucleosome míi h×nh thµnh chØ chøa c¸c histone míi tæng hîp. Tuy nhiªn, ®iÒu
cha râ lµ c¸c nucleosome míi h×nh thµnh n»m hoµn toµn trªn mét m¹ch vµ c¸c
nucleosome cò trªn m¹ch kia hay cã sù ph©n bè ngÉu nhiªn trªn c¶ hai m¹ch.
1.1.3.3. Sao chÐp nhiÔm s¾c thÓ ë eukaryote
§èi víi sinh vËt eukaryote, trªn mçi nhiÔm s¾c thÓ cã nhiÒu t©m sao chÐp.
C¸c t©m nµy (20 ®Õn 80) thêng tËp trung trªn mét ®o¹n DNA t¹o nªn ®¬n vÞ sao
chÐp (replication units). Kho¶ng c¸ch gi÷a c¸c t©m sao chÐp trªn mét ®¬n vÞ thay
®æi tõ 30 ®Õn 300kb. Ngoµi ra, kh«ng ph¶i mäi ®¬n vÞ sao chÐp ®Òu ho¹t ®éng
cïng mét lóc. Ngay trªn cïng mét nhiÔm s¾c thÓ, c¸c vïng kh¸c nhau ®îc t¸i b¶n
ë c¸c thêi ®iÓm kh¸c nhau. Mét ®iÒu lý thó lµ ho¹t ®éng cña chóng kh«ng x¶y ra
mét c¸ch ngÉu nhiªn mµ theo mét trËt tù nhÊt ®Þnh. Trong phase S, c¸c vïng DNA
dÞ nhiÔm s¾c ®îc nh©n ®«i muén h¬n trong khi vïng chøa gen ®îc nh©n ®«i sím
h¬n. H¬n n÷a, c¸c gen ho¹t ®éng trong mäi lo¹i m« tÕ bµo (®îc gäi lµ gen qu¶n
gia - "housekeeping genes") ®îc nh©n ®«i rÊt sím trong khi c¸c gen chØ ho¹t
®éng trong mét sè m« tÕ bµo nhÊt ®Þnh sÏ nh©n ®«i sím trong tÕ bµo ®ã nhng l¹i
®îc nh©n ®«i rÊt muén trong tÕ bµo mµ gen kh«ng ho¹t ®éng.
TÕ bµo eukaryote cã sè lîng DNA lín h¬n nhiÒu so víi tÕ bµo tiÒn nh©n, t¹o
nªn nhiÒu nhiÔm s¾c thÓ, mµ mçi c¸i gåm mét sîi DNA th¼ng cã kÕt hîp víi
protein. Do ®ã sao chÐp DNA cña tÕ bµo eukaryote cã phøc t¹p h¬n vµ cã tèc ®é
chËm h¬n (kho¶ng 50 nucleotide/gi©y).
59
§iÓm kh¸c c¨n b¶n lµ DNA tÕ bµo eukaryote cã nhiÒu replicon. VÝ dô: nÊm
men b¸nh m× Saccharomyces cerevisiae cã tíi 500 replicon tøc lµ cã 500 ®iÓm ori
xuÊt ph¸t sao chÐp. Qu¸ tr×nh sao chÐp còng b¾t ®Çu tõ ori råi lan vÒ hai phÝa nh
h×nh 2.11. TÕ bµo cã c¬ chÕ kiÓm so¸t nghiªm ngÆt qu¸ tr×nh sao chÐp, ®iÓm ori
nµo ®· sao chÐp mét lÇn råi th× kh«ng lÆp l¹i tríc khi toµn bé DNA ®îc sao chÐp
xong hoµn toµn.
Sau khi sao chÐp xong tÕ bµo cã c¬ chÕ ph©n chia DNA ®Òu ®Æn vÒ c¸c tÕ bµo
con.
1.1.3.4 . Sao chÐp ®Çu telomere
§Ó tæng hîp ®îc trän vÑn c¸c ®Çu telomere tËn cïng cña ph©n tö DNA d¹ng
th¼ng, enzyme telomerase nhËn biÕt ®îc ®o¹n ng¾n DNA giµu nucleotide G t¹i
®Çu telomere vµ kÐo dµi ®Çu ®ã theo híng 5' 3' (nh vËy ®Çu telomere dµi thªm
ra). B¶n th©n telomerase cã chøa ph©n tö RNA ®îc dïng lµm khu«n ®Ó tæng hîp
nªn ®o¹n kÐo dµi ®ã. Sau ®Êy ®o¹n míi nµy ®îc dïng lµm khu«n ®Ó DNA
polymerase hoµn thiÖn c¸c ®Çu tËn cïng cña sîi DNA míi (h×nh 2.12).
H×nh 2.12: Sù sao chÐp c¸c ®Çu telomere cña NST nhê enzyme telomerase
60
Ph©n tö DNA d¹ng vßng cña vi khuÈn ®îc sao chÐp theo c¬ chÕ con m¾t (®·
m« t¶ ë trªn), trong ®ã liªn kÕt gi÷a hai sîi ®¬n bÞ ph¸ vì t¹i t©m sao chÐp. Tuy
nhiªn, ph©n tö DNA vßng cña thùc khuÈn thÓ (bacteriophage) ®îc sao chÐp theo
c¸ch thøc kh¸c víi DNA vi khuÈn. Qu¸ tr×nh tæng hîp sîi DNA míi ®îc b¾t ®Çu
t¹i mét vÕt c¾t thuéc t©m sao chÐp trªn mét sîi ®¬n khu«n, gi¶i phãng ®Çu 3'OH
tù do, ®Çu nµy ®îc sö dông nh måi ®Ó DNA polymerase tæng hîp sîi míi t¹o
cÆp bæ sung víi sîi khu«n kh«ng bÞ c¾t. Nh thÕ, ch¹c sao chÐp sÏ di chuyÓn liªn
tôc vßng quanh sîi khu«n, mçi lÇn ch¹c sao chÐp di chuyÓn hÕt mét vßng th× mét
sîi ®¬n DNA ®îc tæng hîp xong. Sîi míi t¸ch khái sîi khu«n ®Ó ch¹c sao chÐp
di chuyÓn vßng tiÕp theo. C¸ch thøc tæng hîp nh thÕ t¹o ra sîi ®¬n DNA dµi gåm
c¸c b¶n sao kÕ tiÕp nhau liªn tôc (h×nh 2.13), c¸ch thøc nµy ®îc gäi lµ sao chÐp
theo vßng trßn l¨n (rolling cycle replication).
H×nh 2.13. Sao chÐp DNA theo c¬ chÕ vßng trßn l¨n
§èi víi nhiÒu virus còng nh ë mét sè trêng hîp kh¸c, sè lîng cña gen
trong bé gen ®îc t¨ng lªn rÊt nhiÒu t¹i c¸c thêi ®iÓm ®Æc biÖt. Ph©n tö DNA
thêng ®îc nh©n ®«i theo c¬ chÕ vßng trßn l¨n. Qu¸ tr×nh tæng hîp sîi DNA míi
®îc b¾t ®Çu t¹i mét vÕt c¾t thuéc t©m sao chÐp trªn mét sîi ®¬n khu«n - sîi nµy
®îc gäi lµ sîi d¬ng. T¹i vÕt c¾t, ®Çu 5' ®îc th¸o dÇn vµ trë thµnh khu«n ®Ó tæng
hîp c¸c sîi Okazaki. §Çu 3' t¹i vÕt c¾t ®îc thªm c¸c nucleotide míi t¹o cÆp bæ
sung víi c¸c nucleotide trªn sîi ®¬n kia. Nhê ®ã hai ph©n tö DNA ®îc tæng hîp
vµ lu«n tu©n theo c¬ chÕ b¸n b¶o toµn.
61
Sîi DNA tæng hîp theo c¬ chÕ vßng trßn l¨n gåm nhiÒu b¶n sao liªn tiÕp, cã
thÓ ®îc c¾t rêi nhau thµnh tõng b¶n riªng biÖt; mçi b¶n gièng hÖt ph©n tö khu«n
ban ®Çu. TiÕp ®Õn, mçi b¶n ®¬n lÎ cã thÓ t¹o thµnh ph©n tö d¹ng vßng. Sao chÐp
theo c¬ chÕ vßng trßn l¨n thêng ®îc sö dông ®Ó nh©n b¶n mét bé gen víi sè
lîng nhiÒu trong thêi gian ng¾n. VÝ dô, trøng Õch sau khi thô tinh ph¸t triÓn rÊt
nhanh nªn yªu cÇu rÊt nhiÒu rRNA cho bé m¸y tæng hîp protein. Sè lîng rRNA
®îc ®¸p øng ®Çy ®ñ do gen m· cho rRNA ®îc sao chÐp theo c¬ chÕ vßng trßn
l¨n t¹o ra mét sè lîng gen rÊt lín trong mét kho¶ng thêi gian nhÊt ®Þnh trong qu¸
tr×nh ph¸t triÓn ph«i.
1.2. Sù söa sai cña DNA trong qu¸ tr×nh sao chÐp vµ
khi kh«ng sao chÐp
1.2.1. §¶m b¶o tæng hîp DNA chÝnh x¸c nhê c¬ chÕ "®äc söa"
(proofreading)
Sai sãt x¶y ra trong qu¸ tr×nh tæng hîp DNA chØ kho¶ng 10-9 (cø 109
nucleotide t¸i b¶n th× cã mét sai sãt x¶y ra). TÇn sè nµy nhá h¬n rÊt nhiÒu tÇn sè
t¹o liªn kÕt sai lÖch gi÷a c¸c base. VÝ dô nh liªn kÕt gi÷a A-C hay G-T cã tÇn sè
kho¶ng 10-5. §ã lµ do c¸c nucleotide khi g¾n vµo sîi DNA ®ang tæng hîp ph¶i
chÞu sù kiÓm tra theo c¬ chÕ ®äc söa. Nhê ®ã bÊt k× mét nucleotide nµo t¹o liªn
kÕt kh«ng ®óng nguyªn t¾c bæ sung ®Òu bÞ ph¸t hiÖn vµ lo¹i bá.
C¬ chÕ ®äc söa phô thuéc vµo tÝnh chÊt ®Æc biÖt cña enzyme DNA
polymerase. Kh¸c víi RNA polymerase, DNA polymerase kh«ng cã kh¶ n¨ng nèi
hai nucleotide víi nhau ®Ó b¾t ®Çu tæng hîp sîi míi. Enzyme nµy ®ßi hái ph¶i cã
mét ®o¹n nucleotide ng¾n cã ®Çu tËn cïng mang nhãm OH ë vÞ trÝ 3'. §o¹n nµy
®îc gäi lµ sîi måi (primer strand). C¸c nucleotide t¹o cÆp theo nguyªn t¾c bæ
sung víi c¸c base trªn sîi khu«n ®îc g¾n vµo vÞ trÝ 3' nhê liªn kÕt phosphodiester
gi÷a nhãm OH ë vÞ trÝ 3' víi nhãm phosphate ë vÞ trÝ 5' cña hai nucleotide liªn tiÕp
nhau. Ph¶n øng nµy do DNA polymerase ®¶m nhiÖm. Mäi sai sãt kh«ng tu©n theo
nguyªn t¾c bæ sung ®Òu bÞ enzyme ph¸t hiÖn vµ lo¹i bá. TÝnh chÊt nµy cña enzyme
chØ x¶y ra theo híng 3'5' trªn sîi ®ang tæng hîp gióp cho enzyme cã kh¶ n¨ng
tù söa sai (self correcting), do ®ã tÇn sè ®ét biÕn rÊt nhá.
Liªn kÕt theo nguyªn t¾c bæ sung cña nucleotide cuèi cïng t¹i ®Çu 3' cña måi
víi khu«n ®ãng vai trß quyÕt ®Þnh gióp enzyme tù söa c¸c sai háng. Ngîc l¹i,
enzyme RNA polymerase xóc t¸c qu¸ tr×nh tæng hîp mRNA kh«ng cã tÝnh chÊt
tù "®äc söa". §iÒu may m¾n lµ c¸c sai sãt trong ph©n tö mRNA kh«ng cã vai trß
quyÕt ®Þnh c¸c hËu qu¶ di truyÒn. RNA polymerase cã thÓ tæng hîp nhiÒu ph©n tö
62
mRNA tõ mét gen mµ kh«ng cÇn ®o¹n oligonucleotide lµm måi ban ®Çu. TÇn sè
®ét biÕn tù ph¸t x¶y ra trong c¶ hai qu¸ tr×nh tæng hîp mRNA vµ tæng hîp protein
kho¶ng 10-4.
ë vi khuÈn E.coli, mét sè ®ét biÕn lµm t¨ng m¹nh tÇn sè biÕn ®æi tù ph¸t c¸c
nucleotide trªn sîi DNA míi. §ã lµ c¸c ®ét biÕn x¶y ra ë gen quy ®Þnh tÝnh chÊt
®äc söa exonuclease 3'5' cña DNA polymerase. V× vËy, rÊt nhiÒu sai sãt x¶y ra
mµ kh«ng bÞ ph¸t hiÖn ®Ó söa ch÷a theo c¬ chÕ ®äc söa cña enzyme. Tuy nhiªn,
chóng cã thÓ ®îc söa theo mét c¬ chÕ kh¸c gäi lµ c¬ chÕ ®äc söa c¸c liªn kÕt t¹o
cÆp sai (mismatch proofreading hoÆc mismatch repair) v× nã kh«ng phô thuéc vµo
viÖc nhËn biÕt nucleotide l¹ mµ dùa vµo sù mÐo mã cÊu tróc sîi kÐp do c¸c liªn
kÕt t¹o cÆp sai gi÷a c¸c base kh«ng bæ sung víi nhau. §iÒu ®Æc biÖt lý thó lµ tÝnh
chÊt ®äc söa theo c¬ chÕ thø hai lµ chØ c¾t bá nucleotide kh«ng bæ sung ë sîi míi
mµ kh«ng ®éng ch¹m ®Õn nucleotide trªn sîi khu«n (tøc nhËn biÕt ®îc nucleotide
ghÐp ®«i sai lÖch trªn sîi võa tæng hîp).
GÇn ®©y mét sè protein cã vai trß t¬ng tù c¸c protein tham gia c¬ chÕ ®äc
söa t¹o cÆp sai ë vi khuÈn ®îc ph¸t hiÖn ë sinh vËt eukaryote. ë nÊm men, khi
c¸c gen m· cho protein nµy bÞ ®ét biÕn, tû lÖ sai sãt trong t¸i b¶n DNA cã thÓ t¨ng
h¬n 100 lÇn. Tuy nhiªn, c¸c base A cña DNA eukaryote kh«ng chøa gèc methyl,
do ®ã ph©n biÖt gi÷a sîi míi vµ sîi cò cã lÏ dùa vµo c¸c vÕt ®øt g·y hay cã ë sîi
míi võa ®îc tæng hîp. V× sao c¸c vÕt ®øt g·y nµy l¹i xuÊt hiÖn lµ mét vÊn ®Ò cÇn
lµm s¸ng tá. Tuy nhiªn, thùc nghiÖm cho thÊy chóng gièng nh c¸c tÝn hiÖu gióp
cho c¬ chÕ ®äc söa nhËn ra sîi DNA míi.
1.2.2. Tæng hîp c¸c enzyme söa ch÷a DNA
C¸c enzyme tham gia söa ch÷a DNA ®îc tæng hîp ngay sau khi ®ét biÕn
x¶y ra cho thÊy tÝnh chÝnh x¸c cña th«ng tin di truyÒn lu«n ®îc b¶o toµn ®Ó duy
tr× ho¹t ®éng sèng cña tÕ bµo. C¬ chÕ tr¶ lêi c¸c tÝn hiÖu cÊp cøu (SOS response)
ë E.coli ®îc nghiªn cøu kh¸ chi tiÕt. ë loµi vi khuÈn nµy, qu¸ tr×nh tæng hîp
DNA bÞ dõng do sai háng trªn ph©n tö khu«n ®Òu t¹o ra c¸c tÝn hiÖu lµm t¨ng
cêng ho¹t ®éng cña h¬n 15 gen bao gåm c¸c gen tham gia söa ch÷a DNA. §Çu
tiªn c¸c tÝn hiÖu ho¹t ho¸ protein RecA. ë d¹ng ho¹t ®éng, RecA ph©n huû protein
øc chÕ c¸c gen thuéc c¬ chÕ SOS, gióp qu¸ tr×nh tæng hîp mRNA trªn c¸c gen nµy
®îc t¨ng cêng. C¸c protein ®îc tæng hîp cã hai t¸c dông, thø nhÊt, t¨ng sè
lîng enzyme cÇn cho qu¸ tr×nh söa ch÷a DNA nªn sè tÕ bµo sèng sãt t¨ng. Thø
hai, khi nång ®é sè protein thuéc c¬ chÕ SOS t¨ng t¹m thêi sÏ kÐo theo tû lÖ ®ét
biÕn t¨ng (do b¶n th©n c¸c gen nµy còng chÞu c¸c ®ét biÕn). §iÒu nµy kh«ng cã
63
lîi cho tríc m¾t. Tuy nhiªn, trong l©u dµi nã t¹o ra nh÷ng thuËn lîi lµm t¨ng tÝnh
®a d¹ng trong quÇn thÓ c¸c tÕ bµo vi khuÈn. Nhê ®ã c¬ héi t¹o ra c¸c tÕ bµo mang
®ét biÕn nhng khoÎ m¹nh vµ thÝch øng víi m«i trêng còng t¨ng theo.
1.2.3. Söa sai khi kh«ng sao chÐp
Ph©n tö DNA cã thÓ bÞ biÕn ®æi ngay c¶ khi kh«ng sao chÐp. C¸c biÕn ®æi
®ét biÕn nµy x¶y ra víi tÇn sè kh¸ cao. Nhê c¸c c¬ chÕ söa sai nªn tÇn sè ®ét biÕn
®îc duy tr× ë møc thÊp.
ChiÕn lîc söa sai trªn nhiÔm s¾c thÓ vÒ c¬ b¶n gièng nhau khi söa sai trong
sao chÐp vµ khi bÞ ®ét biÕn: c¸c enzyme nhËn biÕt g¾n vµo c¸c tr×nh tù sai vµ c¾t
rêi ®o¹n sai, råi m¹ch ®¬n ®óng lµm khu«n ®Ó tæng hîp l¹i chç bÞ c¾t cho ®óng.
Hµng lo¹t enzyme ®Æc hiÖu lµm nhiÖm vô dß t×m vµ söa sai. Cã kho¶ng 20 enzyme
rµ so¸t däc c¸c nhiÔm s¾c thÓ dß t×m c¸c base cã biÕn ®æi ho¸ häc, mçi enzym cã
chøc n¨ng chuyªn biÖt cho mét lo¹i sai háng. Kho¶ng 5 enzyme kh¸c ®Æc hiÖu
cho c¸c liªn kÕt céng ho¸ trÞ sai gi÷a base víi c¸c chÊt ho¸ häc kh¸c hoÆc gi÷a c¸c
base kÒ nhau trªn mét m¹ch. Mét sè enzyme ®Æc hiÖu kh¸c ph¸t hiÖn sù b¾t cÆp
sai, nh trêng hîp mÊt purine. Tæng céng cã kho¶ng 50 enzyme chuyªn ph¸t hiÖn
vµ söa c¸c sai háng trªn ph©n tö DNA.
64
®éc lËp vµ ®îc xem lµ ë d¹ng kh«ng ho¹t ®éng (inactive). Trong bé gen cña
ngêi, transposon ho¹t ®éng hoÆc kh«ng ho¹t ®éng chiÕm ®Õn 45%.
Khi di chuyÓn, c¸c transposon g©y ra viÖc s¾p xÕp, tæ chøc l¹i bé gen cña
tõng c¸ thÓ, nh t¹o ra c¸c ®o¹n DNA míi, hoÆc thay ®æi chøc n¨ng ho¹t ®éng cña
c¸c ®o¹n DNA ë vÞ trÝ chóng ghÐp vµo vµ t¸ch ra. Chóng cã thÓ di chuyÓn tíi vÞ
trÝ bÊt kú vµ hoµn toµn kh«ng yªu cÇu mèi quan hÖ nµo gi÷a hai vÞ trÝ míi vµ cò.
Khi t¸ch ra khái vÞ trÝ cò, transposon cã thÓ mang theo c¸c ®o¹n DNA phô cËn,
g©y sù mÊt ®o¹n t¹i vÞ trÝ cò. Ngîc l¹i khi ghÐp vµo vÞ trÝ míi, chóng g©y ra hiÖn
tîng thªm ®o¹n hoÆc chuyÓn ®o¹n ë vÞ trÝ míi. Do ®ã, transposon gièng nh c¸c
vector chuyªn chë DNA tõ n¬i nµy sang n¬i kh¸c trong mét bé gen, hoÆc tõ bé
gen nµy sang bé gen kh¸c. Ngoµi ra, trao ®æi chÐo gi÷a c¸c transposon t¬ng ®ång
ë hai vÞ trÝ kh¸c nhau trªn mét nhiÔm s¾c thÓ còng t¹o ra nh÷ng biÕn ®æi t¬ng tù.
Nh÷ng biÕn ®æi ®ã dÉn ®Õn sù s¾p xÕp l¹i bé gen, t¹o tÝnh ®a d¹ng gi÷a chóng vµ
t¹o nªn tÝnh ®Æc thï riªng cña tõng c¸ thÓ. §Æc biÖt, sù thay ®æi vÞ trÝ cña
transposon cßn cã thÓ g©y ¶nh hëng ®Õn ho¹t ®éng cña c¸c gen ph©n bè xung
quanh ngay c¶ khi chóng kh«ng lµm thay ®æi trËt tù c¸c nucleotide ë nh÷ng gen
nµy. Do ®ã, ho¹t ®éng cña c¸c gen liªn quan ®Õn sù di chuyÓn cña transposon
(thêng lµ c¸c gen n»m trong transposon) ®îc kiÓm so¸t rÊt chÆt chÏ.
§Çu thËp kû 1930, nh÷ng nghiªn cøu di truyÒn vÒ n¨ng suÊt cña b¾p ®· thu
®îc kÕt qu¶ vÒ mét bøc tranh ph©n lo¹i di truyÒn cña gen n»m cè ®Þnh trªn c¸c
locus cña NST. C¸c nghiªn cøu nµy ®· chØ ra r»ng cã mét sè nh©n tè di truyÒn cã
thÓ b»ng mét c¸ch nµo ®ã cã thÓ di chuyÓn tõ vÞ trÝ nµy sang vÞ trÝ kh¸c cña NST
hoÆc tõ NST nµy sang NST kh¸c. HiÖn tîng nµy ®· ®îc nghiªn cøu trong nhiÒu
n¨m, vµ gÇn ®©y nã ®· ®îc lµm s¸ng tá lµ c¸c gen nh¶y (transposon hoÆc mobile
gene, jumping genes) ®îc thÊy phæ biÕn trong tù nhiªn. Cã rÊt nhiÒu c¸ch ®Ó gäi
tªn cña c¸c nh©n tè nµy: nh©n tè ®iÒu khiÓn (controlling element), gen nh¶y
(jumping gene), gen di ®éng (mobile gene) vµ transposon, ë ®©y chóng ta sö dông
thuËt ng÷ transposon cho c¸c nh©n tè chuyÓn vÞ hay gen nh¶y. Nh©n tè chuyÓn vÞ
(transposon) ®îc t×m thÊy ë nhiÒu lo¹i sinh vËt: vi khuÈn (E.coli), thùc vËt (b¾p,
lóa, ®Ëu), ë ®éng vËt (ruåi giÊm, ngêi....) vµ nÊm th«ng qua c¸c ®ét biÕn mµ
chóng t¹o ra khi lµm thay ®æi sù ho¹t ®éng cña c¸c gen mµ chóng chÌn vµo.
Tr×nh tù DNA cña bé gen rÊt kh¸c nhau ë vi sinh vËt, thùc vËt vµ ®éng vËt ®·
cho thÊy r»ng gen nh¶y tån t¹i ë tÊt c¶ c¸c sinh vËt sèng. §iÒu ®¸ng ng¹c nhiªn lµ
ë bé gen ngêi cña chóng ta, gen nh¶y chiÕm gÇn 45% bé gen nhng vai trß di
truyÒn cña chóng vÉn cha ®îc hiÓu râ.
65
C¸ch thøc di chuyÓn vµ ghÐp vµo bé gen cña c¸c transposon tu©n theo hai
c¸ch liªn quan ®Õn d¹ng trung gian cña DNA lµ RNA. Nh÷ng ®o¹n DNA nµo mµ
sù di chuyÓn cña chóng g¾n liÒn víi d¹ng trung gian RNA ®îc gäi lµ
retroelement, hoÆc DNA retrotransposon. ViÖc di chuyÓn cña retrotransposon
t¬ng tù nh c¸ch thøc x©m nhiÔm cña virus mµ bé gen cña chóng lµ ph©n tö RNA
(retrovirus). Mét khi ®· x©m nhiÔm vµo tÕ bµo, RNA cña retrovirus ®îc sao chÐp
bëi mét enzyme phiªn m· ngîc (reverse transcriptase) t¹o ra DNA. Ph©n tö DNA
nµy sÏ ®îc ghÐp vµo bé gen cña tÕ bµo chñ. Khi virus sinh s«i, phÇn DNA ®ã l¹i
®îc dïng ®Ó phiªn m· t¹o ra c¸c ph©n tö RNA míi cÇn thiÕt cho viÖc ®ãng gãi
t¹o virus míi. C¸c transposon DNA cã kh¶ n¨ng thay ®æi vÞ trÝ trong bé gen
eukaryote kh«ng qua d¹ng trung gian RNA chiÕm tû lÖ Ýt h¬n so víi c¸c
retrotransposon. VÝ dô, bé gen ngêi, chØ cã kho¶ng 100 lo¹i DNA transposon.
Tuy nhiªn DNA transposon cã mét ý nghÜa ®Æc biÖt quan träng ®èi víi sù ®a d¹ng
ho¸ bé gen. §Æc ®iÓm cña transposon lµ cã hai tr×nh tù nucleotide víi ®é t¬ng
®ång cao nhng lÆp l¹i ngîc chiÒu nhau ë hai ®Çu transposon.
Dùa vµo c¸ch thøc sao chÐp khi di chuyÓn, transposon ®îc chia lµm ba kiÓu
chÝnh:
- Transposon kh«ng sao chÐp: PhÇn tö chuyÓn vÞ ®îc c¾t khái DNA cho vµ
®îc g¾n vµo ph©n tö DNA ®Ých. Thuéc lo¹i nµy gåm: Tn10, Tn5, Tn7.
- Transposon sao chÐp: DNA ®îc nh©n ®«i vµ b¶n sao ®îc xen vµo vÞ trÝ
míi t¹o ra phøc hîp céng g¾n. Thuéc lo¹i nµy gåm: Tn3, Mu.
- Retrotransposon: Sù di chuyÓn qua trung gian RNA, nhê enzyme phiªn m·
ngîc t¹o thµnh cDNA vµ xen ®o¹n cDNA vµo vÞ trÝ míi.
2.1.1. Transposon trong bé gen vi khuÈn
Sù kh¸m ph¸ vÒ di truyÒn cña c¸c nh©n tè chuyÓn vÞ (transposon) dÉn tíi nhu
cÇu t×m hiÓu vÒ tr×nh tù DNA cña c¸c nh©n tè nµy vµ c¬ chÕ chuyÓn vÞ cña chóng.
Ph©n tö transposon tù nhiªn lÇn ®Çu tiªn ®îc ®äc tr×nh tù lµ c¸c transposon cña
vi khuÈn. C¸c transposon ®¬n gi¶n nhÊt ë vi khuÈn ®îc gäi lµ ®o¹n ng¾n IS
(insertion sequences). Chóng cã thÓ n»m trªn nhiÔm s¾c thÓ hoÆc trªn c¸c plasmid.
Tr×nh tù nucleotide ë mét ®Çu IS thêng lÆp l¹i nhng ngîc chiÒu so víi ®Çu kia,
®îc gäi lµ tr×nh tù lÆp l¹i ngîc chiÒu (inverted repeat) (h×nh 2.10). Ngoµi c¸c IS,
ë vi khuÈn cßn cã c¸c ®o¹n DNA cã kh¶ n¨ng di chuyÓn víi kÝch thíc dµi h¬n
(transposon: Tn). C¸c Tn thêng ph©n bè trªn plasmid (ph©n tö DNA d¹ng vßng,
kÝch thíc thêng kh«ng lín) vµ cã kh¶ n¨ng ghÐp xen vµo bÊt kú vÞ trÝ nµo trong
bé gen. Chóng thêng mang th«ng tin di truyÒn m· cho c¸c protein chèng chÞu
66
kh¸ng sinh. Gi÷a IS vµ Tn cã mèi quan hÖ vÒ tr×nh tù nucleotide. C¸c Tn thêng
®îc giíi h¹n ë hai ®Çu bëi mét IS nµo ®ã. Hai IS ë hai ®Çu cña mét transposon
cã thÓ cïng chiÒu nhau.
Sù di chuyÓn cña nh©n tè IS vµo c¸c gen thêng ng¨n c¶n sù biÓu hiÖn cña
c¸c gen nµy. VÒ kÝch thíc vµ sù hiÖn diÖn cña c¸c nh©n tè nµy cã thÓ khãa sù
biÓu hiÖn cña mét operon khi nã chÌn vµo vïng promoter (vïng ®iÒu khiÓn sù
biÓu hiÖn gen cña vi khuÈn). Chóng ta thÊy râ h¬n ë trêng hîp operon lac cña
E.coli (lµ operon m· hãa cho 3 protein cña chuçi chuyÓn hãa ®êng galactose).
Ta nhí l¹i trêng hîp phage λ ®ãng gãi nhÇm operon gal, gäi lµ phage λdgal+
. Khi IS chÌn vµo operon gal, nã lµm cho operon nµy kh«ng ®îc biÓu hiÖn (d¹ng
gal-) vµ khi ®îc ®ãng gãi vµo trong phage λ, gäi lµ phage λdgal- . Hai chñng
phage λ nµy ®îc trén lÉn víi nhau vµ ®em ly t©m b»ng gradient Xesi Clorua
(CsCl) kÕt qu¶ nh h×nh 2.14. H×nh 2.14 cho thÊy DNA cña phage λdgal+ nhÑ h¬n
DNA cña phage λdgal-, nguyªn nh©n lµ do operon gal ®ét biÕn cã chøa thªm mét
®o¹n DNA dµi h¬n operon gal b×nh thêng, ®o¹n DNA thõa nµy sau ®ã ®îc x¸c
®Þnh lµ ®o¹n chÌn IS.
H×nh 2.14. Sù kh¸c biÖt gi÷a phage λdgal b×nh thêng víi phage λdgal ®ét biÕn
Mét sè chñng E.coli ®ét biÕn gal- ®îc t×m thÊy cã chøa c¸c ®o¹n DNA chÌn
lín vµo trong operon gal. VËy nh÷ng ®o¹n DNA ®îc chÌn vµo trong gen nµy ®¬n
thuÇn lµ c¸c ®o¹n DNA ngÉu nhiªn hay chóng lµ nh÷ng thùc thÓ di truyÒn kh¸c
nhau. Dùa vµo nh÷ng b»ng chøng vÒ thùc nghiÖm, c¸c nhµ khoa häc ®· chøng
minh ®îc chóng lµ nh÷ng tr×nh tù DNA chÌn cã kh¶ n¨ng di chuyÓn. Tr×nh tù
chÌn (IS) ®Çu tiªn ®îc t×m thÊy trong operon gal- lµ ®o¹n DNA cã chiÒu dµi
800bp, ®îc gäi lµ IS1. TiÕp theo sau ®ã lµ IS2, IS3, IS4 ..., nh÷ng tr×nh tù chÌn
nµy cã chøc n¨ng nh nhau nhng chØ kh¸c nhau vÒ chiÒu dµi, tr×nh tù (vÝ dô IS2
cã chiÒu dµi lµ 1350bp, IS3 lµ 1400bp ...) vµ sè lîng b¶n sao cña chóng trong bé
gen còng kh¸c nhau.
67
MÆc dï c¸c IS kh¸c nhau vÒ tr×nh tù, nhng chóng cã mét sè ®Æc ®iÓm chung.
VÝ dô nh, tÊt c¶ c¸c nh©n tè IS m· hãa cho mét protein, gäi lµ transposase, lµ
enzyme cÇn thiÕt cho viÖc di chuyÓn cña nh©n tè IS tõ vÞ trÝ nµy ®Õn vÞ trÝ kh¸c
trong NST hoÆc tõ NST nµy ®Õn NST kh¸c. Thªm vµo ®ã, tÊt c¶ c¸c nh©n tè IS b¾t
®Çu vµ kÕt thóc víi c¸c tr×nh tù lÆp l¹i ngîc chiÒu ng¾n, mµ nh÷ng tr×nh tù nµy
cÇn thiÕt cho sù di chuyÓn cña IS. Trong bé gen cña chñng E.coli hoang d¹i cã
chøa rÊt nhiÒu nh©n tè IS, vµ t¹i nh÷ng vÞ trÝ cña IS nµy lµ n¬i x¶y ra trao ®æi chÐo.
VÝ dô, sù t¸i tæ hîp gi÷a plasmid nh©n tè F víi NST cña E.coli t¹o thµnh nh÷ng
chñng Hfr ®îc t¹o ra do sù trao ®æi chÐo gi÷a mét nh©n tè IS n»m trªn plasmid
víi mét nh©n tè IS n»m trªn NST.
H×nh 2.15. CÊu tróc vµ c¬ chÕ ho¹t ®éng cña c¸c IS vµ Transposon
ë häc phÇn vi sinh vËt, c¸c b¹n ®· häc vÒ nh©n tè R, lµ nh÷ng plasmid cã mang
c¸c gen kh¸ng l¹i mét sè kh¸ng sinh. C¸c nh©n tè R nµy (vÒ tÝnh kh¸ng thuèc)
®îc chuyÓn mét c¸ch nhanh chãng tõ tÕ bµo nµy sang tÕ bµo kh¸c qua cÇu tiÕp
hîp, gièng nh nh©n tè F ë E.coli. TÝnh di chuyÓn vµ thu thËp c¸c gen kh¸ng thuèc
cña nh©n tè R ®îc t¹o ra do c¸c Tn. ë vi khuÈn cã hai lo¹i transposon ®ã lµ:
Transposon phøc hîp vµ transposon ®¬n gi¶n. Transposon phøc hîp cã chøa c¸c
gen m· cho mét sè tÝnh tr¹ng kh¸c nhau n»m ë phÝa trong cña hai nh©n tè IS ®îc
®Þnh híng ngîc chiÒu nhau, vµ v× thÕ chóng t¹o thµnh tr×nh tù lÆp l¹i ngîc
chiÒu nhau (inverted repeat sequence – IR). Tn kiÓu nµy cÇn cã hai IS chøc n¨ng
68
xóc t¸c cho sù di chuyÓn cña chóng, vÝ dô nh Tn10. Transposon ®¬n gi¶n ®îc
¸p s¸t bëi c¸c tr×nh tù lÆp l¹i ngîc chiÒu ng¾n (< 50bp) vµ tr×nh tù nµy kh«ng m·
hãa cho enzyme cÇn cho sù chuyÓn vÞ cña Tn. Do ®ã, nh÷ng Tn ®¬n gi¶n nµy cÇn
thªm mét gen m· hãa cho c¸c protein cÇn thiÕt cho di chuyÓn (vÝ dô nh Tn3 ë
h×nh 2.16).
H×nh 2.16. §Æc ®iÓm cÊu tróc vµ sao chÐp cña Tn phøc hîp vµ Tn ®¬n gi¶n
B¶ng 2.2 : CÊu tróc thêng gÆp cña transposon (IS* kh«ng cã chøc n¨ng)
69
sao chÐp vµ c¬ chÕ chuyÓn vÞ b¶o tån ®îc m« t¶ ë h×nh 2.16. ë c¬ chÕ sao chÐp
(®îc thÊy ë Tn3), mét b¶n sao míi ®îc t¹o ra trong khi b¶n gèc vÉn cßn ë vÞ trÝ
cò. KÕt qu¶ t¹o ra mét b¶n sao ë vÞ trÝ míi vµ mét b¶n gèc vÉn ë vÞ trÝ cò. Ngîc
l¹i, ë c¬ chÕ b¶o tån, kh«ng cã sù sao chÐp cã nghÜa lµ khi b¶n gèc ®îc chuyÓn
vÞ vµo vÞ trÝ míi th× ë vÞ trÝ cò kh«ng cßn nh©n tè chuyÓn vÞ n÷a. Hay nãi mét c¸ch
kh¸c, c¬ chÕ chuyÓn vÞ b¶o tån cßn gäi lµ “c¾t vµ d¸n”.
C¬ chÕ chuyÓn vÞ sao chÐp ®îc m« t¶ chi tiÕt ë h×nh 2.17, cho thÊy viÖc
chuyÓn vÞ cña Tn3 tõ plasmid nµy ®Õn plasmid kh¸c th«ng qua mét bíc trung
gian. Bíc chuyÓn vÞ trung gian nµy cã chøa mét vßng plasmid kÐp (vßng hîp
nhÊt cña plasmid cho vµ plasmid nhËn). Sù h×nh thµnh d¹ng trung gian nµy ®îc
xóc t¸c bëi transposase ®îc m· hãa bëi Tn3 , mµ nã t¹o ra c¸c vÕt c¾t sîi ®¬n t¹i
hai ®Çu cña Tn3 vµ c¸c vÕt c¾t so le ë tr×nh tù ®Ých (h×nh 2.17) vµ nèi hai ®Çu tù do
víi nhau ®Ó h×nh thµnh nªn mét vßng hîp nhÊt. Transposon ®îc sao chÐp trong
suèt qu¸ tr×nh hîp nhÊt. Vßng hîp nhÊt sau ®ã ®îc c¾t thµnh hai vßng nhá h¬n,
mçi vßng cã chøa mét Tn3. KÕt qu¶ mét b¶n sao cña Tn3 vÉn n»m ë vÞ trÝ ban
®Çu, trong khi b¶n sao kia ®îc chuyÓn ®Õn vÞ trÝ míi trong bé gen.
H×nh 2.17. Sù chuyÓn vÞ theo c¬ chÕ sao chÐp cña Tn3 th«ng qua bíc trung giang hîp nhÊt
hai vßng lµm mét
Mét sè transposon nh lµ Tn10 di chuyÓn trong NST theo c¬ chÕ chuyÓn vÞ
b¶o tån. Trong trêng hîp nµy, sù sao chÐp DNA cña nh©n tè chuyÓn vÞ kh«ng
x¶y ra, vµ c¸c nh©n tè chuyÓn vÞ nµy khi chuyÓn vÞ bÞ lo¹i bá khái vÞ trÝ ban ®Çu
(h×nh 2.16). Gièng nh chuyÓn vÞ sao chÐp, ph¶n øng nµy còng ®îc xóc t¸c bëi
transposase cña chÝnh nh÷ng transposon nµy m· hãa. Tuy nhiªn, kh¸c víi chuyÓn
vÞ sao chÐp, c¸c transposase nµy c¾t transposon ra khái vÞ trÝ cho. Sau ®ã, enzyme
nµy t¹o c¸c vÕt c¾t so le ë vÞ trÝ gen ®Ých vµ chÌn nh©n tè chuyÓn vÞ vµo trong gen
®Ých.
70
ITR Transposase ITR
+ Yếu tố IS
~0,3k
+ Composite transposon
IS Gen tổng hợp IS
2,5~10 kb
Resolvase
+ Transposon dạng Tn3
Transposase
Gen kháng kháng
~5 kb
ITR ITR
ITR ITR
Enzyme resolvase là enzyme xúc tác cho quá trình tái tổ hợp đặc thù vị trí
giữa 2 transposon tồn tại trình tự lặp lại trực tiếp trong cấu trúc đồng kết gắn.
+ IS (insertion sequence) hay các trình tự đoạn gắn xen: Các IS là những
đơn vị độc lập, chúng chỉ mã hoá cho một hoặc hai gen mã hoá cho enzyme
transposase cần thiết cho sự chuyển vị của chúng. Ở E. coli, người ta tìm thấy
khoảng 20 yếu tố IS với các dạng khác nhau. Điển hình là yếu tố IS1, IS2 và
IS10R. IS1 có chiều dài 786bp với 4 -9 bản sao trên nhiễm sắc thể của E.coli.
71
IS
5’ 5’
ACAGTTC CTGAACT
3’ IR IR 3’
chèn
vị trí mục tiêu
cắt
5’ TCGAT
5’
DNA nhiễm sắc thể
AGCTA
3’ 3’
cắt
IS chèn
5’ 5’
TCGA ACAGTTCA CTGAACTGT AGCTA
G GACTACACA 3’
3’
TGTCAAGTC
IR IR
3’
Chuỗi nucleotide lặp lại trực tiếp
(direct repeat) ở vị trí IS được chèn vào
72
được tìm thấy ở nhiều vị trí trong genome. Trong genome của người, những trình
tự như vậy có khoảng 1000 bản sao. Phổ biến hơn là những phiên bản được rút
ngắn của chúng hay gọi là các yếu tố giống retroviruss (retrovirus-like
eleenzymet), được gọi tắt la RTVLs và có khoảng 20.000 bản trong genome của
người.
a b
H×nh 2.18. (a) So s¸nh cÊu tróc bé gen cña retrovirus víi cÊu tróc cña c¸c retrotransposon
®îc t×m thÊy trong bé gen cña eukaryote. (b) C¬ chÕ chuyÓn vÞ cña retrotransposon
Phßng thÝ nghiÖm cña Gerry Fink ®· sö dông nÊm men nh lµ sinh vËt m«
h×nh ®Ó nghiªn cøu sù ®iÒu hßa gen cña eukaryote. Qua nhiÒu n¨m, G. Fink vµ
céng sù ®· ph©n lËp hµng ngµn ®ét kiÓu ®ét biÕn cña gen HIS4, lµ mét gen m· hãa
cho enzyme thuéc con ®êng tæng hîp amino acid histidine.
Hä ®· ph©n lËp ®îc h¬n 1500 ®ét biÕn ph¸t sinh cña gen HIS4 vµ cã hai
trong sè nh÷ng ®ét biÕn nµy cã kiÓu h×nh ®ét biÕn kh«ng æn ®Þnh. Nh÷ng ®ét biÕn
kh«ng æn ®Þnh nµy cã tÇn sè ®¶o ngîc (phôc håi l¹i d¹ng his+, lµ d¹ng cã kh¶
n¨ng tæng hîp ®îc histidine) cao gÊp 1000 lÇn so víi c¸c ®ét biÕn HIS4 kh¸c.
Gièng nh nh÷ng ®ét biÕn gal- cña E.coli, nh÷ng ®ét biÕn nµy cña nÊm men ®îc
t×m thÊy cã chøa mét ®o¹n chÌn DNA lín ë trong gen HIS4. Nh÷ng ®o¹n chÌn
nµy cã ®Æc ®iÓm gièng nhau ®îc gäi lµ nh©n tè Ty (nh©n tè chuyÓn vÞ cña nÊm
men) ë nÊm men. Chóng cã kho¶ng 35 b¶n sao cña nh©n tè chÌn, ®îc gäi lµ Ty1,
trong bé gen cña nÊm men.
B»ng nh÷ng nghiªn cøu thùc nghiÖm, G. Fink vµ céng sù nhËn thÊy cÊu tróc
cña c¸c retrotransposon t¬ng tù víi cÊu tróc gen cña retrovirus (h×nh 2.18a), chØ
cã mét ®iÓm kh¸c biÖt lµ retrotransposon kh«ng cã gen env, lµ gen gióp cho
retrovirus rêi khái tÕ bµo cò vµ x©m nhiÔm vµo tÕ bµo míi. V× thÕ, retrotransposon
73
khi chuyÓn vÞ nhê d¹ng RNA trung gian phiªn m· ngîc t¹o l¹i DNA kÐp vµ chÌn
vµo NST cña cïng mét tÕ bµo, c¸c bíc thùc hiÖn ®îc s¬ ®å hãa ë h×nh 2.18b.
- Retrotransposon
Là các đoạn có trình tự tương tự như các ERV tuy nhiên chúng được tìm
thấy chủ yếu trong các eukaryote như thực vật, nấm và động vật không xương
sống. Các retrotransposon thường có số lượng bản sao lớn và tồn tại ở nhiều dạng
khác nhau. Ví dụ ở ngô, hầu hết các trình tự lặp lại phân bố rộng trong genome là
các retrotransposon và các yếu tố này chiếm đến gần một nửa genome. Nhóm này
được chia thành hai nhóm phụ là :
+ Nhóm Ty3/gypsy (Ty3 đặc trưng ở nấm men và gypsy đặc trưng ở ruồi
giấm. Nhóm này cũng chứa một nhóm các gen giống như ERV.
+ Nhóm Ty1/copia. Nhóm này thiếu gen env mã hoá protein vỏ của retrovirus. Sự
vắng mặt của gen env làm cho chúng không thể hình thành các thể giống với virus
ban đầu được ví dụ như:
Các retroeleenzymet
Các yếu tố lặp lại tận cùng dài (LTRs, long terminal repeats): là những vùng
chứa vài trăm cặp bazơ lặp lại, nằm ở đầu các phân tử DNA của retrovirus. LTRs
có thể có chức năng làm cơ sở để nhiều gen của sinh vật nhân chuẩn biểu hiện, ví
dụ có chức năng kích hoạt, khởi đầu và nhập poly A vào các mRNA Các dạng
yếu tố là LTR, LT và poly, chúng đều đóng vai trò quan trọng trong quá trính di
chuyển vị trí của chúng trong genome. Kích thước phân tử của các LTR từ dưới
vài trăm đến 10 kb.
- Các yếu tố khác không chứa LTR được gọi là retroposon và chúng đặc trưng ở
động vật có vú. Nhóm này bao gồm: LINEs và SINEs.
+ Các yếu tố chèn, xen dài (LINEs -long interspersed nuclear eleenzymets):
Các yếu tố LINE có chứa gen mã hoá cho gag protein và enzyme polymerase có
chức năng giống như enzyme phiên mã ngược. Gen mã hoá cho endonuclease env
cũng được mã hoá bởi yếu tố này và enzyme này có nhiệm vụ thúc đẩy sự tổ hợp
của các yếu tố chuyển vị ‘retro” vào gen. Sự xen đoạn của LINE được lặp đi lặp
lại bởi quá trình tái bản trực tiếp và gắn của DNA mục tiêu. Hình 4 - 10 mô tả yếu
tố LINE1 của người có chiều dài 6,1 kb và có 3.500 bản sao với độ dài nguyên
vẹn. Với các trình tự được rút ngắn hơn thì có tới hàng trăm nghìn bản sao của
LINE1 trong tế bào của người.
+ Các yếu tố chèn, xen ngắn (SINEs - short interspersed nuclear
eleenzymets): Yếu tố này không có gen mã hoá tạo enzyme phiên mã ngược
nhưng vẫn có khả năng chuyển vị. Có thể chúng di chuyển bằng cách “mượn”
enzyme phiên mã ngược được tổng hợp bởi một retrotransposon khác.
SINE có độ lớn từ 100 đến 300 bp. SINE rất phổ biến ở động vật. Ví dụ như chuỗi
Alu ở người có mặt tới hàng triệu bản sao. Alu có thể có nguồn gốc từ các gen mã
hoá cho 7SL RNA có vai trò điều khiển sự di chuyển của protein xung quanh tế
74
bào. Yếu tố Alu có thể được tạo ra ban đầu bởi quá trình phiên mã ngược ngẫu
nhiên của 7SL RNA sau đó DNA tạo ra tái tổ hợp vào genome của người. Do Alu
được phiên mã một cách chủ động nên thường xuất hiện một lượng lớn Alu RNA
trong tế bào, tạo ra khả năng lớn để khuyếch đại yếu tố này. Trong thực vật SINE
tương đối hiếm.
Ac là yếu tố di động. Ac có độ dài 4563 bp, được giới hạn hai đầu bởi hai IR có
chiều dài 11 bp, trình tự ngược chiều nhau. Yếu tố Ac mã hoá cho một mRNA có
độ dài 3.5 kb, có một đầu 5’ UTR 650 bazơ (UTR – vùng không dịch mã-
untranslated region) và một khung đọc mở dịch mã tạo một protein có 807 amino
acid, enzyme transposase, là enzyme xúc tác cho quá trình gắn xen của các
transposon. Đoạn Ac có chứa 4 intron (a,b,c,d) và chia trình tự đó thành 5 exon.
75
Ac a b c d
4563bp
1 2 3 4 5
11bp 11bp
Ds: là yếu tố nhảy có nguồn gốc từ Ac bị đột biến mất đoạn, có trình tự hai đầu là
IR giống hệt Ac. Hầu hết các Ds đều có tính tương đồng với Ac nhưng thường
ngắn hơn, doAcđột biến mất đoạn. Hiện đã phát hiện thấy một số loaị Ds ở ngô.
4563bp
11bp 11bp
Mét sè nh©n tè chuyÓn vÞ (gen nh¶y) ®îc t×m thÊy ë eukaryote cã ch¬ chÕ
chuyÓn vÞ t¬ng tù nh nh÷ng nh©n tè chuyÓn vÞ ë vi khuÈn. Nh chóng ta thÊy ë
h×nh 2.15 vµ 2.16 c¸c IS vµ transposon ®îc chÌn vµo vÞ trÝ míi trong bé gen lµ
b¶n th©n nh©n tè ®ã hoÆc b¶n sao cña nã. C¸c nh©n tè mµ sù chuyÓn vÞ cña nã cÇn
sù xóc t¸c cña transposase ®îc gäi lµ c¸c nh©n tè líp 2 hoÆc c¸c transposon DNA.
Chóng ta ®· biÕt r»ng nh©n tè chuyÓn vÞ ®îc McClintock t×m thÊy ®Çu tiªn ë b¾p
vµ hiÖn nay ®îc biÕt nh nh÷ng transposon DNA.
Transposon DNA cña eukaryote ®îc nghiªn cøu kh¸ chi tiÕt ®èi víi b¾p vµ
ruåi giÊm. ë b¾p, hai transposon Ac vµ Ds ®îc xem lµ vÝ dô kinh ®iÓn vÒ
transposon. Chóng cïng thuéc vµo mét nhãm transposon DNA, ®Òu cã hai tr×nh
tù lÆp l¹i ngîc chiÒu gièng nhau. Di chuyÓn cña c¸c Ac gåm 4563bp (5 exon),
®îc giíi h¹n hai ®Çu bëi 11bp lÆp l¹i ngîc chiÒu. Mäi Ds ®Òu cã ®o¹n lÆp l¹i
ngîc chiÒu gièng nhau mÆc dï chiÒu dµi chóng cã thay ®æi. Gièng nh c¸c Tn
cña vi khuÈn, Ac cã c¸c ®Çu lÆp l¹i ngîc chiÒu vµ m· hãa cho protein transposase,
gióp cho sù chuyÓn chç cña Ac. Nhng khi nghiªn cøu cÊu tróc cña Ds, c¸c nhµ
khoa häc thÊy nã thiÕu h¼n ®o¹n tr×nh tù DNA m· hãa cho transposase, do ®ã nã
kh«ng thÓ tù di chuyÓn ®îc. V× vËy khi Ac cã trong bé gen, transposase cña nã
cã thÓ liªn kÕt víi c¶ Ac hoÆc Ds vµ ®iÒu khiÓn sù chuyÓn vÞ cña chóng.
Sù t¬ng t¸c gi÷a Ac, Ds víi gen C ®îc sö dông nh lµ mét vÝ dô vÒ
transposon (h×nh 2.19). ë ®©y Ds, ®îc coi nh lµ mét m¶nh DNA, lµm bÊt ho¹t
gen C (allele nµy ®îc gäi lµ c-bÞ ®ét biÕn bëi (Ds) hoÆc kÝ hiÖu lµ c-m(Ds)) b»ng
c¸ch chÌn vµo vïng m· hãa cña gen C. Mét chñng cã chøa ®ét biÕn c-m(Ds) vµ
kh«ng cã nh©n tè Ac cã kiÓu h×nh kh«ng mµu v× nh©n tè Ds kh«ng thÓ chuyÓn vÞ
®îc; cã nghÜa lµ nã kh«ng thÓ tù rêi khái gen C. Chñng cã chøa ®ét biÕn c-m(Ds)
76
vµ cã nh©n tè Ac cã kiÓu h×nh lµ nh÷ng ®èm mµu v× ë mét sè tÕ bµo Ac ho¹t hãa
Ds lµm cho Ds nh¶y ra khái gen C, do ®ã gen C phôc håi l¹i chøc n¨ng ban ®Çu.
Mét sè chñng kh¸c ®îc ph©n lËp mµ cã nh©n tè Ac chÌn vµo gen C g©y ra
®ét biÕn c-m(Ac). Kh«ng gièng nh ®ét biÕn c-m(Ds), chØ kh«ng æn ®Þnh khi trong
bé gen cã nh©n tè Ac, ®ét biÕn c-m(Ac) lu«n kh«ng æn ®Þnh. H¬n thÕ n÷a,
McClintock ®· t×m thÊy nh÷ng trêng hîp hiÕm gÆp cña c¸c allele cña Ac cã thÓ
®îc chuyÓn thµnh kiÓu allele Ds. Sù chuyÓn ®æi nµy lµ do mét ®ét biÕn tù ph¸t
t¹o ra nh©n tè Ds tõ nh©n tè chÌn Ac. Nãi c¸ch kh¸c, ë hÇu hÕt c¸c trêng hîp, Ds
lµ mét phiªn b¶n kh«ng hoµn chØnh cña nh©n tè Ac.
C¸c transposon ë b¾p thêng ghÐp vµo gÇn c¸c gen, lµm rèi lo¹n ho¹t ®éng
cña chóng dÉn ®Õn xuÊt hiÖn tÝnh tr¹ng míi nhng kh«ng g©y ®ét biÕn chÕt. Sù di
chuyÓn cña transposon ghÐp vµo vÞ trÝ cña mét allele cña mét gen bÊt kú trªn nhiÔm
s¾c thÓ x¶y ra ë tÕ bµo soma sÏ t¸c ®éng ®Õn sù biÓu hiÖn cña allele ®ã trong qu¸
tr×nh ph¸t triÓn cña c©y. Tr¶i qua ph©n bµo nguyªn nhiÔm, con ch¸u cña tÕ bµo
chøa allele ®ét biÕn ®ã sÏ cã biÓu hiÖn tÝnh tr¹ng míi (thêng quan s¸t ®îc ë h×nh
d¹ng, mµu s¾c cña h¹t ng«). Thay ®æi nµy x¶y ra trong qu¸ tr×nh ph¸t triÓn soma
®îc gäi lµ "variegation" hay cßn gäi lµ hiÖn tîng mosaic (xuÊt hiÖn c¸c ®èm)
(h×nh 2.19).
H×nh 2.19: BiÓu hiÖn cña b¾p khi c¸c transposon g¾n vµo DNA
Các yếu tố Ds không có đoạn ORF đầy đủ, nên không tạo được enzyme
transposase, vì thế không tự di chuyển được. Ds có thể di chuyển được nếu Ac
77
cùng có mặt trong genome vì Ac sinh ra enzyme transposase giúp dịch chuyển
các yếu tố Ds.
Ac 4563bp
11bp 11bp
Ds9 4369bp
∇ 194 bp
11bp 11bp
Ds 2042bp
∇ 2521 bp
11bp 11bp
Hình 4 - 12. So sánh cấu trúc yếu tố Ac với Ds ở ngô do mất
đoạn
78
HiÖn tîng transposon di chuyÓn tõ bé gen prokaryote sang bé gen eukaryote
®îc nghiªn cøu chi tiÕt ®èi víi trêng hîp T-DNA di chuyÓn tõ Agrobacterium
sang thùc vËt hai l¸ mÇm. C¸c gen cña vi khuÈn cã kh¶ n¨ng di chuyÓn vµ ho¹t
®éng trong tÕ bµo thùc vËt n»m trªn plasmid Ti (tumor inducing) cña A.
tumefaciens g©y bÖnh nèt sÇn. C¸c biÓu hiÖn bÖnh cña c©y g©y ra do ho¹t ®éng
cña mét sè gen vi khuÈn ®· ®îc chuyÓn vµo bé gen c©y chñ. Còng gièng nh c¸c
khèi u ë ®éng vËt, c¸c tÕ bµo thùc vËt cã DNA vi khuÈn ghÐp vµo bé gen bÞ chuyÓn
sang tr¹ng th¸i míi, ë ®ã sù ph¸t triÓn vµ biÖt ho¸ chóng hoµn toµn kh¸c víi c¸c
tÕ bµo b×nh thêng.
T-DNA lµ mét ®o¹n DNA cã chiÒu dµi kho¶ng 23kb (tuú thuéc vµo tõng lo¹i
A. tumefaciens) n»m trªn plasmid Ti. Hai ®Çu cña ®o¹n DNA nµy cã chøa 25bp
lÆp ®i lÆp l¹i gièng nhau hoµn toµn chØ sai kh¸c nhau ë hai nucleotide. C¸c
nucleotide ®Çu bªn ph¶i gi÷ vai trß quan träng trong viÖc c¾t T-DNA. C¸c
nucleotide ®Çu bªn tr¸i ®ãng vai trß trong viÖc ghÐp T-DNA vµo bé gen c©y chñ.
T-DNA gåm hai nhãm gen. Nhãm thø nhÊt gåm c¸c oncogen m· cho c¸c
enzyme tham gia vµo ph¶n øng tæng hîp c¸c hormon sinh trëng auxin vµ
cytokinin. ChØ khi T-DNA ®îc ghÐp vµo bé gen thùc vËt, c¸c oncogen n»m trªn
T-DNA míi ho¹t ®éng. Do ®ã tÕ bµo c©y chñ nµo cã T-DNA ghÐp vµo bé gen lËp
tøc ph¸t triÓn kh«ng b×nh thêng do rèi lo¹n hormon sinh trëng mµ T-DNA m·
cho. T¹i vÞ trÝ c©y nhiÔm A. tumerfacien xuÊt hiÖn c¸c nèt sÇn lµ tËp hîp cña c¸c
tÕ bµo b×nh thêng vµ tÕ bµo cã bé gen bÞ biÕn ®æi.
Nhãm gen thø hai cã mÆt trªn ®o¹n T-DNA gåm c¸c gen m· ho¸ cho c¸c
enzyme tham gia tæng hîp nh÷ng phøc chÊt dinh dìng cÇn thiÕt cho sinh trëng
vµ ph¸t triÓn cña vi khuÈn. Chóng ®îc gäi chung lµ opines. Vi khuÈn sö dông
opines nh nguån carbon vµ nit¬. §Æc biÖt, khi T-DNA mang gen m· cho mét lo¹i
opine nµo ®ã th× ngay trªn plasmid Ti, n»m ë ngoµi ®o¹n T-DNA, cã c¸c gen kh¸c
tham gia qu¸ tr×nh chuyÓn ho¸ lo¹i opine nµy, gióp cho vi khuÈn sinh trëng vµ
ph¸t triÓn. §iÒu ®¸ng lu ý lµ opine ®îc tæng hîp l¹i trë thµnh tÝn hiÖu kÝch thÝch
ho¹t ®éng cña operon chøa c¸c gen ®ång ho¸ opine ®ã n»m trªn plasmid Ti. V×
opine lµ protein ®îc m· ho¸ bëi c¸c gen vi khuÈn, sù cã mÆt cña chóng trong tÕ
bµo thùc vËt ®îc xem lµ chØ thÞ ®Ó ph¸t hiÖn sù chuyÓn ghÐp thµnh c«ng cña T-
DNA vµo hÖ gen thùc vËt.
Argobacterium cã kh¶ n¨ng ®a c¸c gen l¹ vµo bé gen thùc vËt. V× vËy, chóng
®îc sö dông nh c¸c vector chuyªn chë gen mét khi c¸c gen g©y nèt sÇn trªn T-
DNA bÞ thay thÕ bëi gen nghiªn cøu. Ngoµi ra, promoter cña c¸c gen trªn T-DNA
79
®Òu lµ nh÷ng promoter ho¹t ®éng m¹nh trªn c¸c tÕ bµo nhËn. V× vËy chóng ®îc
sö dông lµm promoter b¸o c¸o, hoÆc promoter ®iÒu khiÓn gen l¹ trong kü thuËt
chuyÓn gen. Kü thuËt nµy ®îc øng dông rÊt réng r·i trong n«ng nghiÖp. VÝ dô,
®a c¸c gen chèng chÞu s©u bÖnh, gen chÞu ®îc m«i trêng trång trät kh¾c nghiÖt
... vµo c¸c c©y trång quý hiÕm hoÆc cho n¨ng suÊt cao.
2.2. C¸c ®ét biÕn ®iÓm vµ c¬ chÕ söa ch÷a
2.2.1. §ét biÕn gen hay ®ét biÕn ®iÓm
§ét biÕn ®iÓm lµ nh÷ng biÕn ®æi rÊt nhá trªn DNA, thêng liªn quan ®Õn sù
biÕn ®æi cña mét nucleotide hoÆc mét cÆp nucleotide hoÆc cña mét sè lîng rÊt
nhá c¸c cÆp base liÒn kÒ nhau – mµ khi nh×n trªn b¶n ®å gen nh÷ng thay ®æi nµy
nh mét “®iÓm” bªn trong gen. §ét biÕn ®iÓm ®îc chia lµm hai lo¹i ®ã lµ ®ét
biÕn thay thÕ vµ ®ét biÕn chÌn thªm hoÆc xãa bá base. C¸c ®ét biÕn thay thÕ ®îc
ph©n lµm hai lo¹i: ®ét biÕn ®ång chuyÓn vµ ®¶o chuyÓn. §ét biÕn ®ång chuyÓn lµ
sù thay thÕ mét pyrimidine nµy b»ng mét pyrimidine kh¸c (vÝ dô C thµnh T hoÆc
T chuyÓn thµnh C) hoÆc purine nµy b»ng purine kh¸c (A thµnh G hoÆc G thµnh
A). §ét biÕn ®¶o chuyÓn ngîc h¼n so víi ®ång chuyÓn, cã nghÜa lµ ®ét biÕn nµy
lµ sù thay thÕ cña mét purine b»ng mét pyrimidine vµ ngîc l¹i (vÝ dô A chuyÓn
thµnh C hoÆc ngîc l¹i C thµnh A, ...). §Ó m« t¶ ®ét biÕn ®îc râ rµng, chóng ta
ph¶i m« t¶ sù hiÖn diÖn cña c¶ cÆp base trªn hai sîi DNA víi c¸c vÞ trÝ t¬ng øng
cña chóng. Do ®ã, mét vÝ dô vÒ ®ång chuyÓn cã thÓ ®îc viÕt nh sau: G.C A.T,
®¶o chuyÓn: G.C T.A.
§ét biÕn thªm hoÆc xãa base thùc sù lµ nh÷ng ®ét biÕn thªm hoÆc xãa bá c¸c
cÆp nucleotide, ngoµi ra chóng cßn ®îc gäi lµ ®ét biÕn chÌn-xãa. D¹ng ®¬n gi¶n
nhÊt cña lo¹i ®ét biÕn nµy lµ chÌn thªm hoÆc xãa bá mét cÆp nucleotide. HËu qu¶
ph©n tö cña nh÷ng ®ét biÕn ®iÓm vÒ cÊu tróc vµ sù biÓu hiÖn gen ®îc ph©n lµm
bèn lo¹i nh sau:
• §ét biÕn ®ång nghÜa (same sense) cßn gäi lµ ®ét biÕn trung tÝnh (neutral)
hay im lÆng (silent), khi mét codon m· ho¸ cho mét amino acid bÞ biÕn ®æi thêng
ë base thø ba nªn vÉn m· ho¸ cho mét amino acid ®ã (do tÝnh tho¸i ho¸ cña m· di
truyÒn).
80
H×nh 2.20. C¸c lo¹i ®ét biÕn ®iÓm
• §ét biÕn v« nghÜa (non-sense) khi codon m· ho¸ cho mét amino acid biÕn
thµnh mét trong ba codon UAA, UAG vµ UGA lµ c¸c codon kÕt thóc kh«ng m·
ho¸ cho amino acid nµo.
• §ét biÕn sai nghÜa (mis-sense) khi codon cña amino acid nµy biÕn thµnh
codon m· ho¸ cho amino acid kh¸c, lµm thay ®æi amino acid t¬ng øng trªn ph©n
tö protein.
• §ét biÕn lÖch khung: sù thªm mét base hay lµm mÊt mét base dÉn ®Õn c¸c
codon sai nghÜa hay v« nghÜa so víi codon t¬ng øng ban ®Çu tõ ®iÓm biÕn ®æi vÒ
sau, sù dÞch m· bÞ lÖch khung cã tÝnh d©y chuyÒn tõ bé ba bÞ sai.
Ngoµi ra, ®ét biÕn ®iÓm cßn x¶y ra ë vïng kh«ng m· hãa cña gen, lµ vïng
®iÒu hßa cña gen vµ c¸c tr×nh tù kh«ng m· hãa kh¸c (h×nh 2.20). PhÇn nµy cña
gen kh«ng trùc tiÕp m· hãa cho mét protein nµo, nhng nã l¹i cã tÝnh quyÕt ®Þnh
cho sù biÓu hiÖn cña gen. V× nh÷ng tr×nh tù nµy chøa c¸c vÞ trÝ liªn kÕt víi RNA
polymerase vµ c¸c nh©n tè ®iÒu hßa sù biÓu hiÖn gen.
81
2.2.2. C¸c sai háng trong sao chÐp
Chóng ta biÕt c¸c sai háng trªn ph©n tö DNA cã thÓ x¶y ra c¸c biÕn ®æi, ®a
sè c¸c biÕn ®æi ®îc söa sai. Tuy nhiªn, trªn ph©n tö DNA vÉn cã c¸c ®ét biÕn x¶y
ra. C¸c ®ét biÕn cã thÓ x¶y ra do sai lÇm khi sao chÐp DNA.
Mçi base tån t¹i ë hai d¹ng cÊu tróc tautomer. VÝ dô b×nh thêng mang nhãm
NH 2 cung cÊp nguyªn tö H cho sù b¾t cÆp bæ sung víi d¹ng keto (C=O) cña
thymine. Khi cã biÕn ®æi tautomer, adenine chuyÓn sang cÊu tróc d¹ng hiÕm lµ
d¹ng imino NH sÏ b¾t cÆp bæ sung víi cytosine. Thymine cã thÓ chuyÓn sang d¹ng
enol (COH) kh«ng cã trong DNA b×nh thêng vµ b¾t cÆp víi Guanidine. Kh¶ n¨ng
b¾t cÆp sai cña base víi d¹ng tautomer kh«ng ®óng ®· ®îc Watson vµ Crick nªu
lªn khi x©y dùng m« h×nh chuçi xo¾n kÐp. Sù b¾t cÆp sai nµy cã thÓ lµ c¸c ®ét
biÕn ®ång chuyÓn, trong ®ã purine thay b»ng purine kh¸c vµ pyrimidine thay b»ng
pyrimidine kh¸c. MÆc dï, c¸c DNA polymerase III víi ho¹t tÝnh söa sai cã kh¶
n¨ng nhËn biÕt nh÷ng chç b¾t cÆp sai vµ c¾t bá, lµm gi¶m ®¸ng kÓ c¸c sai háng
nhng vÉn kh«ng hÕt.
C¸c sai háng trªn cã thÓ dÉn ®Õn hai kiÓu biÕn ®æi ®ång chuyÓn (T thay cho
C vµ ngîc l¹i hoÆc A thay cho G vµ ngîc l¹i) hay ®¶o chuyÓn (T hay C thay
cho A hay G vµ ngîc l¹i).
C¸c biÕn ®æi trªn, ngoµi viÖc thay thÕ c¸c nucleotide trªn m¹ch DNA cßn cã
thÓ lµm t¨ng hay khuyÕt c¸c nucleotide kh¸c g©y nªn c¸c kiÓu ®ét biÕn cã ¶nh
hëng ®Õn sinh tæng hîp protein.
2.2.3. Sai háng ngÉu nhiªn
Ngoµi c¸c sai háng trong sao chÐp, ph©n tö DNA cßn chÞu c¸c sai háng ngÉu
nhiªn cã thÓ dÉn ®Õn ®ét biÕn. Hai kiÓu sai háng ngÉu nhiªn thêng gÆp lµ mÊt
purine (depurination) vµ mÊt amin (desamination). MÊt purine lµ kiÓu sai háng
thêng gÆp h¬n, x¶y ra khi liªn kÕt glycosidic gi÷a C 1 cña pentose víi base bÞ ®øt
vµ lµm mÊt A hoÆc G. TÕ bµo ®éng vËt cã vó cã thÓ mÊt 10.000 purine trong vßng
20 giê cña mét thÕ hÖ tÕ bµo ë 370C. Sù mÊt purine nµy dÉn ®Õn kh«ng cã b¾t cÆp
bæ sung ë ®iÓm mÊt nªn dÔ t¹o ra ®ét biÕn qua sao chÐp.
Sù mÊt amin cña C t¹o ra U. C¸c gèc U kh«ng ®îc söa sai sÏ b¾t cÆp bæ sung
víi A trong sao chÐp, g©y ra ®ét biÕn ®ång chuyÓn GC AT.
Trong c¸c enzyme söa sai, Uracil DNA-glycosylase nhËn biÕt ®Æc hiÖu U trªn
DNA vµ c¾t rêi t¹o lç hæng, sau ®ã tæng hîp l¹i ®óng theo m¹ch bæ sung. Trªn
ph©n tö DNA, mét sè cytosine ®îc methyl ho¸ thµnh 5-methyl-cytosine, chÊt nµy
mÊt nhãm amin biÕn thµnh thymine. Sai háng nµy kh«ng bÞ Uracil DNA-
82
glycosylase ph¸t hiÖn nªn kh«ng ®îc söa l¹i. Sù chuyÓn C T do mÊt amin
thêng x¶y ra ë c¸c ®iÓm cã 5-methyl-cytosine kiÓu biÕn ®æi nµy cã ë c¶ vi khuÈn
lÉn tÕ bµo cña sinh vËt bËc cao.
2.2.4. ¶nh hëng cña c¸c ®ét biÕn gen ®Õn sinh tæng hîp protein
83
ngo¹i. NhiÒu ho¸ chÊt lµ t¸c nh©n g©y ®ét biÕn nh c¸c ®ång ®¼ng cña c¸c base
nitric, HNO 2 , c¸c chÊt alkyl ho¸ m¹ch... C¸c ®ét biÕn nµy ®îc gäi lµ ®ét biÕn
nh©n t¹o hay ®ét biÕn c¶m øng (induced mutation).
2.2.6.1. T¸c ®éng g©y ®ét biÕn cña bøc x¹ ion ho¸
Tia X, c¸c tia phãng x¹ α, β, γ, c¸c neutron vµ c¶ tia tö ngo¹i ®Òu lµ c¸c t¸c
nh©n g©y ®ét biÕn. Trõ tia tö ngo¹i cã kh¶ n¨ng xuyªn thÊu yÕu nªn chØ t¸c ®éng
lªn c¸c sinh vËt ®¬n bµo vµ giao tö, c¸c tia kh¸c ®Òu cã t¸c dông g©y ®ét biÕn lªn
tÊt c¶ c¸c d¹ng sinh vËt. T¸c dông g©y ®ét biÕn cña phãng x¹ cã hai ®Æc ®iÓm:
- Kh«ng cã ngìng t¸c dông, tøc lµ kh«ng cã liÒu lîng v« h¹i.
- Sè lîng ®ét biÕn tØ lÖ víi liÒu lîng phãng x¹ kh«ng phô thuéc cêng ®é
vµ thêi gian chiÕu x¹.
2.2.6.2. T¸c ®éng cña tia tö ngo¹i
Tia tö ngo¹i cã bíc sãng dµi (10-5 - 10-6 cm) nªn khã t¹o ion, cã lÏ chØ t¸c
®éng ®Õn nh÷ng chÊt hÊp thu nã trùc tiÕp. Trong tÕ bµo, c¸c chÊt h÷u c¬ cã m¹ch
vßng chñ yÕu nh purine vµ pyrimidine hÊp thu trùc tiÕp tia tö ngo¹i. DNA hÊp
thu tia tö ngo¹i m¹nh nhÊt ë bíc sãng 2537 A0, ®©y chÝnh lµ bíc sãng lµm t¨ng
tÇn sè ®ét biÕn ë h¹t phÊn c©y b¾p.
Díi t¸c ®éng cña tia tö ngo¹i, cytosine g¾n thªm ph©n tö níc vµo liªn kÕt
C=C cña m¹ch vßng vµ thymine bÞ ®øt liªn kÕt C=C m¹ch vßng nèi hai ph©n tö
thµnh thymine dimer.
Stone vµ c¸c céng sù ®· nhËn thÊy tÇn sè ®ét biÕn t¨ng lªn ë Staphylococcus
aureus khi m«i trêng nu«i cÊy chóng ®îc chiÕu tia UV trong thêi gian ng¾n
tríc khi cÊy vµo. §©y lµ t¸c ®éng gi¸n tiÕp cña tia tö ngo¹i.
HiÖn tîng quang phôc håi (photoreactivation) lµ mét ®Æc ®iÓm trong t¸c
®éng cña tia UV. Sau khi chiÕu tia tö ngo¹i lªn tÕ bµo, nÕu ®Ó ngoµi ¸nh s¸ng, th×
c¸c sai háng phÇn lín ®îc phôc håi. ¸nh s¸ng cã t¸c ®éng ho¹t ho¸ enzyme söa
sai, c¾t ®øt c¸c thymine dimer.
2.2.6.3. C¸c ho¸ chÊt g©y ®ét biÕn
Ngay tõ ®Çu nh÷ng n¨m 1930, Xakharov vµ Lobashov (Liªn x«) ®· tiÕn hµnh
thö nghiÖm g©y ®ét biÕn b»ng ho¸ chÊt, nhng cha râ hiÖu qu¶. Vµo nh÷ng n¨m
40, trong thÕ chiÕn thø hai ë Anh, Auerbach vµ Robson ®· chøng minh h¬i ng¹t
nit¬ vµ sulfur cã kh¶ n¨ng g©y ®ét biÕn ë Drosophila (thêi ®iÓm nµy §øc b¾n h¬i
ng¹t sang Anh, nªn hä ph¶i nghiªn cøu t¸c ®éng sinh häc cña c¸c chÊt ®éc nµy).
VÒ sau, nhiÒu nhãm ho¸ chÊt g©y ®ét biÕn ®· ®îc t×m ra.
84
Cã nhiÒu ho¸ chÊt g©y biÕn dÞ di truyÒn, ®Õn nay t×m ra nh÷ng ho¸ chÊt cho
hiÖu qu¶ g©y ®ét biÕn cßn cao h¬n c¶ phãng x¹. C¸c ho¸ chÊt g©y ®ét biÕn cã ®Æc
®iÓm lµ cã thÓ chØ g©y hiÖu qu¶ ®ét biÕn ®èi víi mét sè Ýt ®èi tîng. VÝ dô
Streptomycine chØ g©y ®ét biÕn ë t¶o ®¬n bµo vµ mét sè vi sinh vËt, kh«ng g©y ®ét
biÕn trªn nhiÒu ®èi tîng kh¸c. C¸c t¸c nh©n g©y ®ét biÕn ho¸ häc cã thÓ chia
thµnh c¸c nhãm sau:
- Nhãm 1: C¸c chÊt øc chÕ tæng hîp c¸c base nit¬ trong cÊu tróc DNA nh
coffein, ethyl uretan .....
- Nhãm 2: C¸c chÊt ®ång ®¼ng víi base nit¬ nh coffein, 5-bromuracil, c¸c
chÊt gÇn gièng víi base nit¬, nªn nã lµm DNA g¾n nhÇm khi tæng hîp.
- Nhãm 3: C¸c chÊt alkyl ho¸ lµm ®øt m¹ch DNA nh ethyl
methanesulfonate (EMS), methy methanesulfonate (MMS), ethylene imine (EI),
nitrosoguanidine (NG)... C¸c t¸c nh©n alkyl ho¸ nh khÝ ng¹t nit¬ vµ ethyl
methane sulfonate cã thÓ g©y ®ét biÕn Ýt nhÊt b»ng ba c¸ch:
+ Thªm nhãm methyl (CH 3 ) hay ethyl (-C 2 H 5 ) vµo guanine t¹o ra base ®ång
®¼ng cña adenine dÉn ®Õn b¾t cÆp bæ sung sai.
+ MÊt guanine ®· bÞ alkyl ho¸ (mÊt purine) t¹o lç hæng trªn DNA, khi sao
chÐp cã thÓ lµm ®øt m¹ch.
+ Liªn kÕt chÐo gi÷a c¸c m¹ch cña mét hoÆc c¸c ph©n tö DNA kh¸c nhau
lµm mÊt nucleotide.
- Nhãm 4: C¸c chÊt kh¸c nh nhãm oxy ho¸, khö
Ngîc víi sai háng sao chÐp, c¸c t¸c nh©n g©y ®ét biÕn nh nitrous acid vµ
khÝ ng¹t nit¬ cã thÓ g©y biÕn ®æi trùc tiÕp trªn DNA. Theo Schuster vµ mét sè
kh¸c, nitrous acid t¸c ®éng tríc hÕt t¸ch nhãm amino (desamination) khái
adenine vµ cytosine råi biÕn chóng thµnh hypoxanthin (H) vµ uracil (U) t¬ng øng.
Sau biÕn ®æi, hypoxanthine cã thÓ b¾t cÆp víi C vµ U víi A, c¸c vßng sao chÐp
tiÕp theo lµm cho G thay chç A vµ T thay chç C.
C¸c chÊt kh¸c nh hydroxygenlamine (H 2NOH) vµ c¸c chÊt cho nhãm OH
cã thÓ g©y nªn ®ét biÕn ®ång chuyÓn. Theo Freese vµ c¸c céng sù,
hydroxygenlamine cã lÏ lµ chÊt cã tÝnh ®Æc hiÖu cao nhÊt trong c¸c t¸c nh©n g©y
®ét biÕn, nhê ®ã cã thÓ chuyÓn cytosine sang d¹ng b¾t cÆp ®îc víi adenine.
- Nhãm 5: C¸c chÊt chªm vµo DNA
Nhãm c¸c chÊt gåm proflavin, mµu acridine vµ c¸c chÊt ®îc gäi lµ ICR (ICR
compound), aflatoxin B1 lµ nh÷ng chÊt cã ph©n tö mÆt ph¼ng t¬ng tù cÆp base.
85
Chóng cã thÓ chªm vµo ph©n tö DNA lµm thªm hoÆc mÊt base. Chóng thêng g©y
®ét biÕn lÖch khung do thªm hay mÊt base.
Trong ®ã chÊt aflatoxin B1 lµ chÊt g©y ung th, ®îc t¸ch ra tõ h¹t ®Ëu bÞ
nhiÔm nÊm. Aflatoxin g¾n vµo vÞ trÝ N-7 cña guanine, s¶n phÈm t¹o ra lµm bÎ g·y
liªn kÕt gi÷a base vµ khung ®êng. Do ®ã, t¸c nh©n nµy g©y ra mÊt purin t¹i vÞ trÝ
cña guanin vµ cã xu híng t¹o ra ®ét biÕn ®¶o chuyÓn G.CT.A.
TÊt c¶ c¸c t¸c nh©n g©y ®ét biÕn ®Òu lµ t¸c nh©n g©y ung th (carcinogen),
nhng c¸c t¸c nh©n g©y ung th kh«ng ph¶i ®Òu g©y ®ét biÕn. HiÖn nay nhiÒu t¸c
nh©n g©y ®ét biÕn ®îc sö dông trong chän gièng nh»m t¨ng nguån biÕn dÞ. Bªn
c¹nh ®ã víi n¹n « nhiÔm trªn thÕ giíi ngêi ta ph¸t hiÖn nhiÒu t¸c nh©n g©y ®ét
biÕn ho¸ häc míi xuÊt hiÖn trong m«i trêng.
2.2.7. C¸c c¬ chÕ söa sai
2.2.7.1. Söa sai trùc tiÕp
a. Quang t¸i ho¹t ho¸ nhê enzyme photolyase
Sau khi xö lÝ tia tö ngo¹i g©y ®ét biÕn, nÕu ®a ra ¸nh s¸ng th× phÇn lín sai
háng ®îc phôc håi. HiÖn tîng nµy ®îc gäi lµ quang phôc håi hay quang t¸i
ho¹t ho¸ (photoreactivation) (h×nh 2.21). N¨ng lîng cña ¸nh s¸ng nh×n thÊy (300
®Õn 600nm) ho¹t ho¸ enzyme photolyase (gen phr ë E.coli) c¾t c¸c vßng
cyclobutyl pyrimidine dimer (thêng lµ thymine).
H×nh 2.21. C¬ chÕ söa sai cña enzyme photolyase nhê ¸nh s¸ng
C¸c enzyme nµy ho¹t ®éng trong c¸c tÕ bµo ë nhiÒu loµi kh¸c nhau tõ
mycoplasma, ®éng vËt vµ ë c¶ b¹ch cÇu cña ngêi; riªng nÊm men cã hai enzyme
86
kh¸c nhau. Vµo ban ngµy, c¸c sinh vËt thêng chÞu t¸c ®éng cña ¸nh s¸ng, nªn c¬
chÕ quang phôc håi cã vai trß quan träng trong söa sai DNA. VÝ dô, c¸c
mycoplasma, sinh vËt ®¬n bµo ®¬n gi¶n nhÊt hiÖn nay, chØ cã vµi gen, nhng ®·
dµnh mét trong sè ®ã cho quang t¸i ho¹t ho¸.
Quang phôc håi lµ c¬ chÕ söa sai ngoµi ¸nh s¸ng, kh¸c víi söa sai trong tèi.
Trong giai ®o¹n ®Çu, enzyme nhËn biÕt vµ g¾n ®Æc hiÖu vµo dimer trong tèi. C¸c
oligothimidilate lµ c¬ chÊt rÊt tèt cho enzyme. Oligo (dT) 18 víi trung b×nh lµ 3,5
dimer ®îc g¾n nhÑ víi hai ph©n tö enzyme. TÊt c¶ c¸c photolyase ®Òu cã hai
chromophore (chÊt b¾t mµu), lµ FADH 2 (1,5 dihydroflavin adenine dinucleotide).
B¶n chÊt cña chromophore thø hai chia photolyase thµnh hai nhãm:
+ Enzyme cña nÊm men vµ E. coli sö dông pterin (folate coenzyme)
+ Nhãm kia dïng deazaflavin
Khi chç sai háng hÊp thô ¸nh s¸ng (theo bíc sãng ®Æc hiÖu), n¨ng lîng
®îc sö dông nhê phøc hîp enzyme-DNA æn ®Þnh biÕn thymine dimer thµnh
monomer. Sau ®ã enzyme t¸ch khái DNA.
b. Söa sai b»ng c¸ch lµm mÊt nhãm alkyl (Dealkylation)
Mét vÝ dô kh¸c vÒ viÖc söa trùc tiÕp c¸c sai háng lµ sù chuyÓn nhãm methyl
tõ chÊt cã kh¶ n¨ng g©y ung th lµ O6-methylguanine sang gèc cysteine cña
enzyme O6-methylguanine-DNA methyltransferase (MTase). Enzyme t¸ch nhãm
alkyl khái phosphodiester b»ng alkyl ho¸ cysteine kh¸c. Sau khi enzyme nµy nhËn
nhãm alkyl th× nã sÏ bÞ mÊt ho¹t tÝnh khö alkyl mét c¸ch kh«ng thuËn nghÞch. C¸c
MTase hiÖn diÖn ë E. coli, nÊm men vµ tÕ bµo ngêi.
2.2.7.2. Söa sai gi¸n tiÕp ( Söa sai c¾t bá)
PhÇn lín c¸c c¬ chÕ söa sai kh¸c thùc hiÖn trong tèi, nhê c¸c nuclease b»ng
c¾t bá chç sai háng theo nhiÒu c¸ch (h×nh 2.22):
- C¾t c¸c base: Sù lo¹i bá chç sai ®îc thùc hiÖn nhê mét hoÆc vµi enzyme
N-glycosylase. N-glycosylase nhËn biÕt base biÕn ®æi hay mÊt amin hoÆc sù biÕn
d¹ng cÊu tróc xo¾n do sai lÖch t¹o ra vµ thuû gi¶i liªn kÕt N-glycosilic nèi base
víi ®êng pentose. Lç hæng võa ®îc t¹o ra do c¾t bá ®îc DNA polymerase chÐp
®Çy l¹i dùa vµo khu«n lµ sîi DNA bæ sung ®èi diÖn vµ ligase nèi liÒn l¹i.
87
A B
H×nh 2.22. C¸c c¬ chÕ söa sai, (A) c¾t bá base, (B) c¾t bá ®o¹n oligonucleotide
88
- NÕu sù söa sai thÊt b¹i, tÝnh liªn tôc cña bé gen vÉn cã thÓ duy tr× nhê sao
chÐp "óp sÊp sai háng" ("error-prone" replication), khi DNA polymerase bá qua
chç sai ®Ó sao chÐp tiÕp.
2.2.7.3. §äc söa ®èi víi c¸c base b¾t cÆp sai
C¬ chÕ ®äc söa ®èi víi c¸c base b¾t cÆp sai (proofreading for base-pair
matching) ®îc thùc hiÖn trong sao chÐp DNA. Sù b¾t cÆp cÈn thËn cña DNA
polymerase ®¶m b¶o cho sù chÝnh x¸c cña sao chÐp. Tríc khi thùc hiÖn ph¶n øng
polymer ho¸ nèi c¸c nucleotide, nucleotide triphosphate míi ph¶i b¾t cÆp víi base
bæ sung trªn m¹ch khu«n. NÕu sù b¾t cÆp sai x¶y ra, DNA polymerase lo¹i bá
nucleotide b¾t cÆp sai (h×nh 2.23).
H×nh 2.23. Ho¹t tÝnh exonuclease 3'5' cña DNA polymerase III
ThËm chÝ, tríc khi nucleotide míi r¸p vµo, enzyme dß l¹i cÆp base cuèi, nÕu
chóng kh«ng b¾t cÆp th× sù polymer ho¸ tiÕp theo bÞ dõng. CÆp nucleotide ë ®Çu
cuèi 3' b¾t cÆp sai sÏ bÞ lo¹i bá bëi ho¹t tÝnh exonuclease 3'5' cña DNA
polymerase. Khi sù b¾t cÆp cña cÊu tróc m¹ch kÐp ®· ®óng, qu¸ tr×nh polymer ho¸
míi ®îc tiÕp tôc. Ho¹t tÝnh ®äc söa ®èi víi c¸c base b¾t cÆp sai lµ ®Æc tÝnh cña
nhiÒu DNA polymerase ®¶m b¶o cho sù mäc dµi chÝnh x¸c cña m¹ch ®ang ®îc
tæng hîp. Tuy nhiªn, trong trêng hîp cÇn thiÕt, DNA polymerase cã thÓ bá qua
chç sai vµ chÐp tiÕp nhê c¬ chÕ sao chÐp "óp sÊp sai háng".
2.2.7.4. Söa sai kh«ng xøng ®«i
Sù nhËn biÕt vµ söa ch÷a c¸c sai lÖch do b¾t cÆp base trªn DNA ®îc ph¸t
hiÖn ë E.coli, cã ba hÖ thèng enzyme kh¸c nhau ®îc sö dông ®Ó:
- Lo¹i bá chç sai trong sao chÐp (errors in replication).
- Lo¹i bá b¾t cÆp kh«ng xøng ®«i bªn trong c¸c ®o¹n trung gian cña t¸i tæ
hîp (mismatch within recombination intermediates).
89
- Lo¹i bá thymine cña cÆp GT trong trêng hîp 5-methylcytosine bÞ mÊt
nhãm amine (-NH 2 ) thµnh thymine.
Sù thÊt b¹i trong t¸i tæ hîp gi÷a E.coli víi Salmonella typhimurium lµ do tr×nh
tù nucleotide cña DNA kh¸c nhau ®Õn 20%. Rµo c¶n t¸i tæ hîp nµy ®îc vît qua
ë c¸c thÓ ®ét biÕn sai háng trong hÖ thèng mismatch repair. §iÒu nµy chøng tá
mismatch repair cã ý nghÜa quan träng trong kiÓm tra sù chÝnh x¸c cña c¸c ®o¹n
tham gia t¸i tæ hîp (recombination intermediates).
2.2.7.5. Söa sai theo c¬ chÕ "error-prone"
Khi ph©n tö DNA chÞu c¸c ®ét biÕn, mét sè protein ®Æc biÖt lµm nhiÖm vô
dõng qu¸ tr×nh tæng hîp DNA ®Ó söa ch÷a theo c¸c c¬ chÕ kh¸c nhau. Mét ®iÒu
dÔ hiÓu lµ nÕu nh tÕ bµo tiÕp tôc ph©n chia (tøc lµ DNA tiÕp tôc ®îc nh©n lªn)
th× tØ lÖ ®ét biÕn cao khiÕn sè tÕ bµo sèng sãt gi¶m. Nh÷ng c¬ chÕ söa ch÷a sai
háng ë nh÷ng phÇn trªn dùa trªn ®îc thùc hiÖn qua hai giai ®o¹n: (1) giai ®o¹n
lo¹i bá base sai háng n»m trªn mét trong hai sîi cña DNA xo¾n kÐp, (2) giai ®o¹n
söa ch÷a b»ng c¸ch sö dông mét sîi DNA cßn nguyªn lµm khu«n ®Ó tæng hîp
DNA ®iÒn ®Çy vµo chç trèng trªn sîi ®¬n bÞ sai háng. Tuy nhiªn, sai háng nghiªm
träng kh¸c kh«ng thÓ söa ch÷a ®îc b»ng nh÷ng c¬ chÕ söa ch÷a sai háng tù do
nh ë trªn, ®ã lµ sai háng ®øt g·y c¶ hai sîi cña DNA xo¾n kÐp. Do c¶ hai sîi ®Òu
bÞ ®øt g·y nªn kh«ng cã sîi nµo lµm khu«n ®Ó söa ch÷a sai háng nµy, do ®ã, ®Ó
tån t¹i tÕ bµo sö dông mét hÖ thèng söa ch÷a ®îc gäi lµ “error – prone”. TÕ bµo
sinh vËt cã hai c¬ chÕ ®Ó söa ch÷a sai háng ®øt g·y c¶ hai sîi DNA kÐp nµy ®ã lµ
c¬ chÕ nèi c¸c ®Çu DNA kh«ng t¬ng ®ång vµ c¬ chÕ t¸i tæ hîp t¬ng ®ång
• Söa sai DNA ®øt g·y b»ng c¸ch nèi c¸c ®Çu DNA ®øt g·y theo c¬ chÕ
error-prone:
ViÖc söa ch÷a c¸c sai háng trªn DNA ®ãng vai trß quan träng trong viÖc ng¨n
c¶n c¸c ®ét biÕn tiÒn ung th x¶y ra ë tÕ bµo kh«ng ph©n chia cña sinh vËt ®a bµo.
Tuy nhiªn, khi mét sîi ®«i bÞ ®øt g·y x¶y ra trong c¸c tÕ bµo ®· ngõng ph©n chia,
th× viÖc söa ch÷a c¸c sai háng nµy b»ng nh÷ng ph¬ng thøc söa sai nh ®· m« t¶
ë phÇn tríc cña ch¬ng lµ kh«ng thùc hiÖn ®îc v× nã kh«ng cã khu«n ®Ó söa
ch÷a sai háng. Sù bæ sung kh«ng cßn v× c¶ hai sîi cña DNA xo¾n kÐp ®Òu bÞ h
h¹i vµ kh«ng cã sù t¸i b¶n, do ®ã nã kh«ng cã nhiÔm s¾c tö chÞ em ®Ó dïng lµm
khu«n söa ch÷a lo¹i bá sai háng. MÆc dï vËy vÉn cã mét sè trêng hîp söa ch÷a
b»ng sao chÐp óp sÊp sai háng “error-prone” (bao gåm c¶ hÖ thèng SOS cña E.coli)
mµ qu¸ tr×nh söa sai nµy sÏ ®îc ®Ò cËp tiÕp theo ngay trong phÇn nµy cña ch¬ng.
HËu qu¶ cña viÖc söa sai kh«ng hoµn thiÖn nµy cã thÓ Ýt tæn h¹i ®Õn tÕ bµo h¬n lµ
90
nh÷ng th¬ng tæn nµy kh«ng ®îc söa ch÷a. Trong trêng hîp söa sai c¸c sîi
DNA bÞ ®øt g·y nµy, tÕ bµo ®· sö dông mét c¬ chÕ söa ch÷a gäi lµ c¬ chÕ nèi c¸c
®Çu kh«ng t¬ng ®ång, ®îc m« t¶ chi tiÕt ë h×nh 2.24. Theo m« t¶ ë h×nh 2.24,
c¬ chÕ nµy thùc hiÖn söa sai theo ba bíc bao gåm sù liªn kÕt cña c¸c ®Çu ®øt g·y
víi ba protein (KU70, KU80 vµ mét protein kinase lín phô thuéc DNA). Sau khi
®· liªn kÕt víi c¸c ®Çu DNA bÞ ®øt g·y, c¸c protein nµy c¾t tØa c¸c ®Çu vµ ®em
nèi c¸c ®Çu nµy l¹i víi nhau. ë ®éng vËt cã vó, mét vµi protein trong con ®êng
söa ch÷a nµy còng tham gia vµo c¸c ph¶n øng nèi c¸c ®Çu trong viÖc s¾p xÕp l¹i
tr×nh tù cña c¸c gen kh¸ng thÓ theo ch¬ng tr×nh.
• Söa sai c¸c DNA ®øt g·y b»ng c¬ chÕ t¸i tæ hîp error - prone
C¬ chÕ t¸i tæ hîp t¬ng ®ång sö dông c¸c nhiÔm s¾c tö chÞ em ®Ó söa ch÷a
sîi ®«i bÞ ®øt g·y trong tÕ bµo ph©n chia. C¬ chÕ t¸i tæ hîp t¬ng ®ång error-prone
®îc biÓu diÔn nh h×nh 2.25. C¸c bíc chñ yÕu lµ viÖc nèi c¸c ®Çu ®øt g·y b»ng
nh÷ng protein vµ enzyme ®Æc biÖt. ViÖc c¾t tØa c¸c ®Çu 5’ ®Ó lé ra nh÷ng vïng sîi
®¬n, c¸c vïng nµy sau ®ã ®îc bao phñ bëi c¸c protein, nh lµ protein t¬ng tù
nh RecA lµ RAD51. H·y nhí r»ng, trong qu¸ tr×nh ®¸p øng SOS, nh÷ng ®¬n ph©n
RecA liªn kÕt víi vïng sîi ®¬n ®Ó h×nh thµnh mét sîi xo¾n m¶nh dµi. T¬ng tù
nh RecA, RAD51 còng liªn kÕt víi vïng DNA sîi ®¬n t¹o thµnh sîi m¶nh
RAD51-DNA. Sîi m¶nh RAD51-DNA dß t×m vïng tr×nh tù t¬ng ®ång víi nã
trªn nhiÔm s¾c tö chÞ em kh«ng bÞ sai háng lµm khu«n ®Ó tæng hîp lÊp ®Çy chç
trèng, phôc håi l¹i tr×nh tù ®· mÊt.
H×nh 2.25. Söa ch÷a sîi ®«i ®øt g·y b»ng t¸i tæ hîp t¬ng ®ång
91
• Söa sai theo c¬ chÕ sao chÐp óp sÊp sai háng (h×nh 2.26 )
Ph©n tö DNA cã thÓ ph¶i chÞu nh÷ng thiÖt h¹i sai háng nÆng nÒ nh khi bÞ
chiÕu tia tö ngo¹i (UV) hoÆc khi chÞu t¸c ®éng cña c¸c chÊt g©y ung th
(carcinogenes). Lóc ®ã kh«ng ph¶i chØ mét sîi ®¬n DNA bÞ háng mµ c¶ hai sîi bÞ
®øt g·y mÊt ®i mét sè nucleotide. Th«ng tin di truyÒn cña ®o¹n bÞ háng mÊt ®i
hoµn toµn nªn kh«ng cã sîi khu«n ®Ó söa ch÷a theo c¸c c¬ chÕ th«ng thêng.
Trong trêng hîp nµy, tÕ bµo cßn mét gi¶i ph¸p duy nhÊt ®Ó t¨ng kh¶ n¨ng sèng
sãt: ®ã lµ söa ch÷a DNA theo mét c¸ch ngÉu nhiªn víi tØ lÖ sai sãt, ®ét biÕn cao
nhng dï sao vÉn duy tr× ®îc sù sèng. §ã chÝnh lµ c¬ chÕ söa ch÷a DNA "error-
prone". Râ rµng r»ng chÊp nhËn c¸c nucleotide sai ®a vµo trong ph©n tö DNA ®Ó
qu¸ tr×nh nh©n ®«i DNA vÉn ®îc duy tr× cßn h¬n lµ bÞ ngõng hoµn toµn. Nh vËy
söa ch÷a DNA theo c¬ chÕ nµy còng chÝnh lµ mét trong nh÷ng nguyªn nh©n g©y
nªn tÝnh ®a d¹ng cña DNA.
B»ng c¸c thÝ nghiÖm di truyÒn, vai trß quan träng cña hai protein UmuC vµ
UmuD trong c¬ chÕ söa ch÷a "error-prone" ®îc ph¸t hiÖn. Chóng cã kh¶ n¨ng
g¾n c¸c nucleotide vµo sîi DNA bÊt chÊp kh«ng tån t¹i sîi khu«n. Nh vËy hai
protein nµy cã thÓ øc chÕ ho¹t tÝnh tù söa ch÷a exonuclease 3'5' cña DNA
polymerase hoÆc chÝnh chóng lµ mét lo¹i DNA polymerase ®Æc biÖt. Khi ®ét biÕn
x¶y ra trªn gen m· ho¸ cho hai protein ®ã, c¸c tÕ bµo vi khuÈn sèng sãt Ýt h¬n c¸c
tÕ bµo b×nh thêng díi t¸c dông cña tia tö ngo¹i.
H×nh 2.26. C¬ chÕ söa sai sao chÐp óp sÊp bá qua sai háng
92
2.2.7.7. HÖ thèng SOS (cÊp cøu)
C¸c c¬ chÕ söa sai cã nhiÒu ph¶n øng kh¸c nhau víi m«i trêng vµ ®îc ®iÒu
hoµ do c¸c gen cña Ýt nhÊt 4 operon, mµ hÖ thèng SOS lµ mét.
HÖ thèng nµy ho¹t ®éng khi tÕ bµo bÞ t¸c ®éng m¹nh bëi c¸c t¸c nh©n g©y
®ét biÕn t¹o nhiÒu sai háng trªn DNA. Trong trêng hîp DNA bÞ lµm háng ngõng
sao chÐp, ph¶n øng SOS håi phôc sao chÐp vµ chuyÓn sai háng thµnh söa sai óp
sÊp (error-prone replication). ë E. coli ®· quan s¸t thÊy sù ph¸ huû DNA lµm më
ra kho¶ng 20 gen cña hÖ thèng SOS, ®îc kiÓm so¸t ©m bëi chÊt k×m h·m lexA
(lexA repressor). ChÊt nµy g¾n vµo hép SOS chång lÊp c¸c promoter cña c¸c gen
SOS.
Trong trêng hîp cÊp b¸ch cã nhiÒu sai háng cÇn cÊp cøu, lexA bÞ kÝch thÝch,
thay ®æi cÊu h×nh (configuration) tù c¾t vµ mÊt ho¹t tÝnh k×m h·m. Lóc ®ã c¸c gen
SOS ®îc më ra. NÕu söa sai kh«ng kÞp tÕ bµo ph¶i chÊp nhËn hoÆc bÞ ®ét biÕn
hoÆc chÕt.
2.3. T¸i tæ hîp
S¾p xÕp l¹i bé gen liªn quan chÆt chÏ ®Õn qu¸ tr×nh t¸i tæ hîp di truyÒn
(genetic recombination). T¸i tæ hîp lµ t¹o ra mét trËt tù cÊu tróc míi cña bé gen
tõ c¸c vËt liÖu di truyÒn cã s½n. Khi qu¸ tr×nh ®ã phô thuéc vµo c¸c enzyme ®Ó c¾t
nèi ph©n tö DNA th× ®îc gäi lµ t¸i tæ hîp néi ph©n (intramolecular
recombination). C¸c kiÓu c¸ch kh¸c nhau cña h×nh thøc t¸i tæ hîp nµy gåm cã:
* T¸i tæ hîp t¬ng ®ång (homologous recombination): ®ßi hái tr×nh tù
nucleotide t¬ng ®ång gi÷a hai ®o¹n DNA. HiÖn tîng nµy cßn ®îc gäi lµ t¸i tæ
hîp chung (general recombination).
* T¸i tæ hîp ®Æc hiÖu (site-specific recombination): x¶y ra ë nh÷ng vÞ trÝ ®Æc
hiÖu trªn hai ph©n tö DNA. Trao ®æi chÐo lo¹i nµy ®ßi hái c¸c enzyme tham gia
nhËn biÕt ®îc ®o¹n nucleotide ng¾n ®Æc biÖt ë vÞ trÝ ®ã. Nh vËy t¸i tæ hîp kiÓu
nµy cã thÓ x¶y ra gi÷a hai ®o¹n nucleotide bÊt kú kh«ng yªu cÇu tÝnh t¬ng ®ång
gi÷a chóng.
* Sù chuyÓn chç cña c¸c ®o¹n DNA (transposon): liªn quan ®Õn sù di chuyÓn
cña c¸c yÕu tè DNA cã kh¶ n¨ng vËn ®éng gi÷a hai vÞ trÝ t¸ch ra vµ ghÐp vµo n»m
trªn mét hoÆc hai ph©n tö DNA.
* T¸i tæ hîp sai lÖch (illegitimate recombination): liªn quan ®Õn sù thªm
®o¹n, mÊt ®o¹n hoÆc nèi kh«ng ®óng c¸c ®o¹n DNA víi nhau trong qu¸ tr×nh t¸i
93
b¶n hoÆc trao ®æi chÐo kh«ng c©n b»ng (unequal crossing over) gi÷a c¸c nhiÔm
s¾c thÓ.
Lo¹i t¸i tæ hîp cuèi cïng liªn quan ®Õn viÖc mÊt hay g¾n ®o¹n DNA vµo
nh÷ng ®iÓm kh«ng t¬ng ®ång nh trêng hîp mÊt ®o¹n vµ chuyÓn ®o¹n, mµ ®Õn
nay c¬ chÕ ph©n tö cha râ.
CÇn ph©n biÖt râ rµng gi÷a t¸i tæ hîp vµ ®ét biÕn. §ét biÕn lµ t¹o ra th«ng tin
di truyÒn míi trong bé gen. Tuy nhiªn, ®ét biÕn vµ t¸i tæ hîp thêng ®i ®«i víi
nhau. VÝ dô nh sù chuyÓn chç cña c¸c yÕu tè DNA cã kh¶ n¨ng di chuyÓn
(transposon) hoÆc sai lÖch trong trao ®æi chÐo cã thÓ g©y ra nh÷ng ®ét biÕn lµm
cho cÊu tróc gen thay ®æi. Ngîc l¹i, t¸i tæ hîp lµ mét trong nh÷ng c¬ chÕ söa
ch÷a DNA khi x¶y ra c¸c ®ét biÕn nghiªm träng nh»m duy tr× sù sèng cßn cho tÕ
bµo.
2.3.1. T¸i tæ hîp t¬ng ®ång
T¸i tæ hîp t¬ng ®ång ®îc ph¸t hiÖn ®Çu tiªn ngay trong c¸c thÝ nghiÖm cña
Morgan ë Drosophila. C¬ chÕ cña nã dÉn ®Õn sù ho¸n ®æi thuËn nghÞch (reciprocal
exchange) c¸c ®o¹n t¬ng øng gi÷a hai nhiÔm s¾c thÓ t¬ng ®ång vµ kh«ng lµm
mÊt th«ng tin di truyÒn. MÆc dï ®· ph©n lËp ®îc nhiÒu ®ét biÕn sai háng t¸i tæ
hîp (®Æc biÖt ë phage, E.coli vµ nÊm men) vµ nhËn ®îc nhiÒu s¶n phÈm protein
tinh s¹ch ®Æc hiÖu cho qu¸ tr×nh nµy, nhng t¸i tæ hîp t¬ng ®ång cha ®îc tiÕn
hµnh in vitro vµ nhiÒu chi tiÕt cha biÕt râ. HiÖn nay, ®a sè ngêi cho r»ng t¸i tæ
hîp ë prokaryote vµ eukaryote liªn quan ®Õn ®øt vµ nèi c¸c ®o¹n DNA.
2.3.1.1. C¸c m« h×nh trao ®æi ®o¹n
C¸c m« h×nh gi¶i thÝch c¬ chÕ ph©n tö cña t¸i tæ hîp t¬ng ®ång c¨n cø vµo
sù tham gia cña c¸c ®o¹n ®øt m¹ch ®¬n hay m¹ch kÐp (single or double stranded
break).
• Sù trao ®æi ®o¹n khëi sù b»ng m¹ch ®¬n
Sù trao ®æi ®o¹n khëi sù b»ng m¹ch ®¬n (single strand initiated exchange)
®îc m« t¶ trªn h×nh 2.27. DiÔn biÕn nh sau:
94
H×nh 2.27. C¬ chÕ t¸i tæ hîp t¬ng ®ång
95
- Tæng hîp DNA ®îc khëi sù ë ®Çu 3'OH cña m¹ch x©m lÊn. ViÖc nµy thay
thÕ tr×nh tù mÊt do sù ph©n huû cña exonuclease vµ phñ kÝn ®iÓm c¾t ban ®Çu.
M¹ch ®îc t¹o vßng ch÷ D cã thÓ b¾t cÆp víi phÝa kia cña chç ®øt, t¹o primer cho b
a
m¹ch tæng hîp DNA cña m¹ch ®èi.
H×nh 2.28. C¬ chÕ phôc håi chç trèng m¹ch kÐp d¹ng vßng ch÷ D (Dloop) (a), m« h×nh
- Sù xÕp th¼ng haiHolliday
ph©n töt¹oDNA
ra hait¬ng ®ång.
ph©n tö t¸i tæ hîp (b)
- Sù ph©n huû bëi exonuclease chç ®øt t¹o chç trèng (gap) víi sù c¨ng m¹ch
®¬n.
- Sù x©m lÊn cña mét trong c¸c ®Çu mót ®o¹n m¹ch ®¬n vµo thÓ kÐp (duplex)
t¹o vßng D (D-loop).
- Sù ph©n t¸ch cña cÊu tróc Holliday t¹o ra hai ph©n tö t¸i tæ hîp, trong ®ã
chç g·y ban ®Çu ®îc lµm liÒn l¹i.
C¸c m« h×nh trªn vµ nh÷ng biÕn d¹ng cña chóng ®· ®îc nªu ra ®Ó gi¶i thÝch
c¸c sè liÖu thu nhËn ®îc vµ cung cÊp d÷ liÖu cho viÖc t×m ra c¸c enzym cña qu¸
tr×nh t¸i tæ hîp.
2.3.1.2. RecA protein cña E.coli vµ c¸c protein kh¸c tham gia trao ®æi
m¹ch
Qu¸ tr×nh c¾t, trao ®æi, nèi vµ t¸ch c¸c m¹ch trong t¸i tæ hîp t¬ng ®ång phøc
t¹p nªn cÇn cã sù tham gia cña nhiÒu protein. Gen RecA, m· ho¸ cho protein thùc
hiÖn trao ®æi m¹ch, gi÷ vai trß trung t©m hÇu nh trong tÊt c¶ c¸c qu¸ tr×nh t¸i tæ
hîp t¬ng ®ång ë E.coli. C¸c ®ét biÕn sai háng ë gen RecA kh«ng thùc hiÖn ®îc
t¸i tæ hîp t¬ng ®ång, söa sai sau sao chÐp vµ bÊt kú chøc n¨ng nµo cña hÖ thèng
SOS.
96
Protein RecA tinh s¹ch g¾n phèi hîp víi DNA m¹ch ®¬n t¹o phøc hîp
nucleoprotein lµ phÇn cã ho¹t tÝnh trong trao ®æi m¹ch DNA. RecA cßn cã c¸c
ho¹t tÝnh kh¸c nh sù thuû gi¶i ATP vµ c¾t repressor còng ®îc ho¹t ho¸ bëi sù
g¾n RecA vµo DNA m¹ch ®¬n. RecA cßn g¾n vµo DNA m¹ch kÐp, mÆc dï chËm
h¬n so víi DNA m¹ch ®¬n vµ cã thÓ lµm chuçi xo¾n kÐp th¸o xo¾n mét phÇn.
RecA xóc t¸c sù trao ®æi m¹ch gi÷a nhiÒu lo¹i ph©n tö DNA víi cÊu h×nh
(conformation) kh¸c nhau. C¸c ®ßi hái vÒ mÆt cÊu tróc ®èi víi c¬ chÊt DNA lµ:
- Cã vïng DNA m¹ch ®¬n ®Ó r¸p sîi RecA.
- Sù t¬ng ®ång DNA-DNA gi÷a hai cÆp.
- §Çu tù do bªn trong vïng t¬ng ®ång cho phÐp m¹ch xoay vßng.
- Sù hiÖn diÖn topoisomerase gióp nèi chÐo c¸c m¹ch.
Trong c¸c ®iÒu kiÖn cÇn thiÕt cho t¸i tæ hîp in vitro, SSB protein (single strand
binding) tham gia hç trî RecA, nã cã vai trß quan träng trong viÖc duy tr× sù æn
®Þnh vÒ ho¹t tÝnh cña phøc hîp RecA-DNA m¹ch ®¬n trong suèt ph¶n øng trao
®æi m¹ch.
Trong c¸c m« h×nh vÒ t¸i tæ hîp t¬ng ®ång c¸c nuclease gi÷ vai trß quan
träng trong giai ®o¹n khëi sù vµ t¸ch m¹ch ®¬n. Ngoµi chóng ra, c¸c enzyme c¾t
c¸c cÊu tróc nèi trung gian Holliday trong c¸c giai ®o¹n cuèi cña qu¸ tr×nh trao
®æi m¹ch t¬ng ®ång.
2.3.2. T¸i tæ hîp ®iÓm chuyªn biÖt
§Ó t¸i tæ hîp x¶y ra ë mét vÞ trÝ nhÊt ®Þnh, cÇn ph¶i cã c¸c enzyme ®Æc biÖt
nhËn biÕt ®îc vÞ trÝ ®ã trªn mét hoÆc c¶ hai ph©n tö DNA. Kh¸c víi t¸i tæ hîp
chung (t¬ng ®ång), trong qu¸ tr×nh nµy kh«ng ®ßi hái sù t¹o cÆp bæ sung gi÷a
c¸c sîi ®¬n cña hai ph©n tö DNA hoÆc nÕu cã th× chØ cÇn ®o¹n dÞ hîp dµi vµi
nucleotide.
T¸i tæ hîp ë vÞ trÝ ®Æc hiÖu ®îc t×m thÊy lÇn ®Çu tiªn khi nghiªn cøu hiÖn
tîng ghÐp vµo hoÆc t¸ch ra cña DNA bacteriophage trªn bé gen tÕ bµo E.coli.
Khi x©m nhËp vµo tÕ bµo chñ, enzyme integrase cña bacteriophage vµ protein IFH
cña tÕ bµo chñ liªn kÕt víi vÞ trÝ ®Æc biÖt trªn ph©n tö λ DNA d¹ng vßng. Phøc
protein-DNA sÏ b¸m vµo bé gen E.coli vµ trao ®æi chÐo x¶y ra gi÷a hai bé gen λ
vµ vi khuÈn (h×nh 2.29) Lóc nµy phage chØ cã thÓ tån t¹i ë d¹ng tiÒm tan.
97
H×nh 2.29. M« h×nh t¸i tæ hîp chuyªn biÖt cña phageλ g¾n chÌn vµo bé gen vi khuÈn E.coli
Tuú thuéc vµo chiÒu s¾p xÕp ph©n bè cña c¸c vÞ trÝ ®Æc hiÖu trªn ph©n tö DNA mµ trao
®æi chÐo ®Æc hiÖu cã thÓ x¶y ra theo ba c¸ch thøc kh¸c nhau. Thø nhÊt lµ trao ®æi chÐo ®Æc hiÖu
gi÷a hai ph©n tö DNA liªn quan ®Õn viÖc ghÐp vµo hoÆc t¸ch ra (intermolecular site-specific
recombination). VÝ dô nh bé gen bacteriophage λ ghÐp vµo nhiÔm s¾c thÓ E. coli. H×nh thøc
thø hai vµ thø ba (intramolecular site-specific recombination) liªn quan ®Õn trao ®æi chÐo x¶y
ra ngay trªn mét ph©n tö DNA gi÷a c¸c ®o¹n nucleotide lÆp l¹i cïng chiÒu hoÆc ngîc chiÒu.
VÝ dô nh giíi h¹n tÕ bµo chñ bÞ x©m nhiÔm bëi phage Mu phô thuéc vµo sù trao ®æi chÐo ®Æc
hiÖu t¹i mét vïng 3000bp trªn bé gen Mu. Bé gen Mu cã chøa mét ®o¹n DNA 3000bp (®îc
gäi lµ ®o¹n G) cã kh¶ n¨ng ®æi chiÒu ngay t¹i vÞ trÝ cña m×nh. Do ®ã, trong ph¶n øng biÕn tÝnh
vµ phôc håi bé gen Mu ®«i khi quan s¸t ®îc ®o¹n G kh«ng t¹o cÆp hoÆc cã hiÖn tîng chØ x¶y
ra liªn kÕt bæ sung t¹i ®o¹n G nµy. Sù ®æi chiÒu cña ®o¹n G phô thuéc vµo 34 nucleotide lÆp l¹i
ngîc chiÒu ë hai ®Çu ®o¹n G vµ s¶n phÈm do gen gin m· cho. Protein GIN ho¹t ho¸ trao ®æi
chÐo gi÷a hai ®o¹n lÆp l¹i ngîc chiÒu nµy.
Ph©n tÝch cÊu tróc vïng DNA liªn quan ®Õn ®o¹n G cho thÊy sù ®æi chiÒu cña ®o¹n nµy
lµm thay ®æi ho¹t ®éng cña c¸c gen S, S' vµ U, U'. Gen S vµ S' cã phÇn gièng nhau (phÇn Sc)
®îc m· ho¸ bëi ®o¹n DNA n»m ngoµi ®o¹n G. PhÇn kh¸c biÖt gi÷a hai gen nµy (phÇn Sv vµ
phÇn Sv') do c¸c nucleotide n»m trong ®o¹n G quy ®Þnh. Gen S vµ gen U ho¹t ®éng khi ®o¹n G
cã chiÒu d¬ng (+). Ngîc l¹i, hai gen S' vµ U' sÏ bËt më khi G ®æi chiÒu ngîc l¹i -chiÒu ©m
(-). S¶n phÈm cña c¸c gen S vµ U cÇn thiÕt ®Ó phage Mu t¬ng t¸c ®Æc hiÖu víi thô thÓ trªn bÒ
mÆt cña mét sè tÕ bµo E.coli nh K12. Tuy nhiªn, khi gen S' vµ U' ho¹t ®éng, phage Mu x©m
nhiÔm ®îc mét sè vi khuÈn kh¸c nh Shigella sonnei, Serratia marcescens. Râ rµng sù ®æi
chiÒu ®o¹n G do trao ®æi chÐo x¶y ra t¹i hai vïng lÆp l¹i ngîc chiÒu gixL vµ gixR quyÕt ®Þnh
giíi h¹n tÕ bµo chñ cña phage Mu. HiÖn tîng ®æi chiÒu x¶y ra kh¸ phæ biÕn ë tr¹ng th¸i tiÒm
tan. Do ®ã, tÕ bµo vi khuÈn nhiÔm phage Mu tr¶i qua nhiÒu thÕ hÖ ph©n chia sÏ cã mét nöa sè
phage chøa ®o¹n G theo chiÒu d¬ng vµ nöa kia theo chiÒu ©m.
98
Hai lo¹i tÕ bµo lympho B vµ T cã vai trß rÊt quan träng trong hÖ miÔn dÞch ë ®éng vËt cã
x¬ng sèng. TÕ bµo lympho T tiÕt ra c¸c thô thÓ (TCR-T-Cell Receptor) ph©n bè trªn bÒ mÆt tÕ
bµo, cßn tÕ bµo lympho B tiÕt ra c¸c protein immunoglobulin (Igs). C¸c Igs cã thÓ ph©n bè trªn
bÒ mÆt tÕ bµo nh c¸c thô thÓ hoÆc ®îc tiÕt ra khái tÕ bµo nh c¸c kh¸ng thÓ (antibody). TÊt c¶
c¸c lo¹i protein do hai lo¹i tÕ bµo tiÕt ra ®Òu cã cÊu tróc gåm hai chuçi nÆng (heavy chain) vµ
hai chuçi nhÑ (light chain). §èi víi c¸c protein Igs, chØ cã mét lo¹i chuçi nÆng IgH vµ hai lo¹i
chuçi nhÑ IgL κ vµ IgL λ . Protein TCR gåm cã αβ-TCR vµ δγ-TCR.
C¸c chuçi tham gia Igs vµ TCR cã cÊu tróc t¬ng tù nhau: phÇn ®Çu COOH lµ vïng b¶o
thñ (constant region) g¾n liÒn víi c¸c chøc n¨ng cÊu tróc (kh«ng liªn quan ®Õn tÝnh nhËn biÕt
®Æc hiÖu ®èi víi kh¸ng nguyªn). PhÇn ®Çu NH 2 lµ vïng siªu biÕn (hypervariable region) liªn
quan ®Õn nhËn biÕt kh¸ng nguyªn.
C¸c kh¸ng thÓ cã kh¶ n¨ng nhËn biÕt tõ 106 ®Õn 108 ph©n tö kh¸ng nguyªn kh¸c nhau.
Kh¶ n¨ng nµy ®îc quyÕt ®Þnh bëi hai yÕu tè: sù ®a d¹ng cña c¸c gen liªn quan cã s½n trong tÕ
bµo (germline diversity) vµ sù t¸i tæ hîp ®Æc hiÖu gi÷a c¸c gen ®ã t¹o ra c¸c tæ hîp gen míi
(somatic diversity). YÕu tè thø hai phô thuéc hoµn toµn vµo tõng lo¹i tÕ bµo lympho trong c¬
thÓ, tøc lµ cã tÝnh ®Æc trng riªng biÖt cho tõng c¸ thÓ. §Æc biÖt vïng siªu biÕn ®îc m· bëi tæ
hîp cña ba lo¹i DNA kh¸c nhau: ®o¹n V (variable), ®o¹n D (diversity) vµ ®o¹n J (junctional).
Sè lîng c¸c ®o¹n nµy còng nh sù ph©n bè cña chóng trªn nh÷ng vïng (locus) nhiÔm s¾c thÓ
lµ kh¸c nhau. ViÖc s¾p xÕp c¸c ®o¹n nµy x¶y ra theo c¸ch thøc trao ®æi chÐo ®Æc hiÖu ®Ó t¹o ra
kh¸ng thÓ ®Æc hiÖu x¶y ra trong tõng lo¹i tÕ bµo lympho. §iÒu ®ã quyÕt ®Þnh tÝnh ®Æc hiÖu vµ
®a d¹ng cña c¸c kh¸ng thÓ trong ph¶n øng miÔn dÞch cña c¬ thÓ.
C¸c nghiªn cøu sinh häc ph©n tö cho thÊy t¸i tæ hîp ®iÓm chuyªn biÖt lµ hiÖn tîng rÊt
phæ biÕn vµ cã nhiÒu hÖ thèng kh¸c nhau nh m« t¶ ë b¶ng 2.3.
B¶ng 2.3.. C¸c hÖ thèng t¸i tæ hîp ë ®iÓm chuyªn biÖt
Sù g¾n vµo vµ c¾t rêi ra cña λ Int HÖ thèng ®îc nghiªn cøu
phage (phage integration tèt nhÊt; C¸c phage t¬ng
and excision) tù λ nh P 22 , P 2 vµ P 4 sö
dông c¸c hÖ thèng t¬ng tù.
Sù ph©n t¸ch c¸c ®a ph©n Tn vµ γ δ resolvase ChÕ biÕn c¸c s¶n phÈm
vßng trßn (resolution of cïng kÕt hîp víi sù chuyÓn
circular multimers) vÞ (processing of cointegrat
products of transposition).
99
P 1 lox-cre Sù h×nh thµnh vßng trßn
trong nhiÔm phage; Sù
ph©n t¸ch c¸c ®a ph©n lµm
t¨ng tÝnh æn ®Þnh cña
plasmid
C¸c ®¶o ®o¹n cho sù biÓu Hin C¸c gen cña tiªm mao ë
hiÖn cña c¸c gen theo c¸ch Salmonella
kh¸c (inversions for
Gin Sîi ®u«i cña phage µ u
expression of alternate
gene) Pin Sîi ®u«i cña phage P 1
100
nucleotide cofactor. C¸c protein phô g¾n víi DNA thêng hç trî sù l¾p r¸p cña
recombinase vµo c¸c ®iÓm t¸i tæ hîp.
- C¸c ph¶n øng cã thÓ x¶y ra gi÷a c¸c ph©n tö (intermolecular) nh sù g¾n
cña bé gen λ vµo nhiÔm s¾c thÓ tÕ bµo chñ hay bªn trong ph©n tö (intramolecular)
nh ph©n t¸ch c¸c ®a ph©n vßng trßn (circular multimers).
- C¸c ph¶n øng trong ph©n tö cã thÓ hoÆc do ®¶o ®o¹n (inversion), trong ®ã
sù ®Þnh híng cña ®o¹n DNA gi÷a c¸c ®iÓm t¸i tæ hîp ®¶o ngîc so víi hai ®o¹n
bªn, hoÆc do mÊt ®o¹n (deletion) do ®o¹n DNA bÞ c¾t rêi. C¸c s¶n phÈm ®îc t¹o
ra phô thuéc vµo sù ®Þnh híng cña c¸c ®iÓm t¸i tæ hîp: c¾t ®øt ®o¹n do t¸i tæ hîp
gi÷a c¸c ®o¹n lÆp l¹i trùc tiÕp (direct repeat) trong khi ®ã c¸c ®¶o ®o¹n h×nh thµnh
sù ®Þnh híng cña c¸c ®iÓm ®¶o ngîc. Mét sè recombinase xóc t¸c chØ mét trong
c¸c sù kiÖn, trong khi mét sè kh¸c thùc hiÖn c¶ hai.
2.4. HiÖn tîng chuyÓn vËt liÖu di truyÒn ë vi khuÈn
Trong mét thêi gian dµi, c¸c nghiªn cøu di truyÒn häc ®îc tiÕn hµnh ë c¸c
sinh vËt nh©n thùc (Eukaryote), cßn ë vi khuÈn th× cha, v× ngêi ta cho r»ng nh÷ng
sinh vËt nh©n s¬ (Prokaryote) kh«ng cã sinh s¶n h÷u tÝnh. Tuy nhiªn vµo nh÷ng
n¨m 40, hiÖn tîng t¸i tæ hîp ë vi khuÈn ®îc chøng minh. Nh÷ng nghiªn cøu vÒ
biÕn n¹p, t¶i n¹p vµ giap n¹p cã ý nghÜa quan träng cho sù ph¸t triÓn cña di truyÒn
häc ph©n tö vµ gãp phÇn x©y dùng lªn kü thuËt l¾p ghÐp gen.
C¸c sinh vËt nh©n s¬ (prokaryote) nh vi khuÈn, virus còng cã c¸c qu¸ tr×nh
sinh s¶n t¬ng ®¬ng sinh s¶n h÷u tÝnh, ®îc gäi lµ cËn h÷u tÝnh (parasexuality).
Sù di truyÒn nhê c¸c qu¸ tr×nh cËn h÷u tÝnh nµy ë vi khuÈn cã nh÷ng ®Æc ®iÓm:
- Sù truyÒn th«ng tin mét chiÒu tõ tÕ bµo cho (donor) sang tÕ bµo nhËn
(recipient).
- Sù t¹o thµnh hîp tö tõng phÇn (merozygote). ThÓ cho (donor) chØ chuyÓn
mét ®o¹n cña bé gen sang thÓ nhËn (recipient) nªn chØ lìng béi ë mét phÇn, c¸c
phÇn kh¸c ®¬n béi.
- Bé gen thêng chØ lµ mét DNA trÇn nªn chØ cã mét nhãm liªn kÕt gen vµ
t¸i tæ hîp thùc chÊt lµ lai ph©n tö.
101
H×nh 2.30: Bèn con ®êng chuyÓn DNA tõ tÕ bµo nµy sang tÕ bµo kh¸c cña vi khuÈn
102
nhËn biÕt mét ®o¹n DNA m¹ch kÐp cã c¸c cÆp base tr×nh tù nh sau: 5'-
AAGTGCGGTCA-3' ®îc gäi lµ "®iÓm hÊp thô" (uptake site). §iÓm ®Æc biÖt lµ
®iÓm hÊp thô DNA nµy cña Haemophillus chØ ®Æc trng cho nã (v× trªn bé gen cña
nã cã kho¶ng 600 ®iÓm nh vËy vµ t¬ng ®èi hiÕm ë DNA cña c¸c loµi kh¸c), ®iÒu
nµy gi¶i thÝch t¹i sao Haemophillus chØ biÕn n¹p giíi h¹n víi c¸c vi khuÈn trong
loµi.
PhÇn lín c¸c vi khuÈn chØ dung n¹p trong mét giai ®o¹n giíi h¹n cña chu
tr×nh sèng. Trong giai ®o¹n dung n¹p, tÕ bµo tæng hîp mét hay nhiÒu protein ®îc
gäi lµ "c¸c nh©n tè dung n¹p", chóng biÕn ®æi mµng tÕ bµo ®Ó cã thÓ g¾n víi DNA
ngo¹i lai. Nh vËy, c¸c ®iÓm thô thÓ chØ hiÖn diÖn trong giai ®o¹n dung hîp.
• KÝch thíc cña tÕ bµo nhËn vµ nång ®é cña DNA
§iÒu quan träng thø hai ®Ó thùc hiÖn ®îc biÕn n¹p lµ DNA ph¶i cã m¹ch
kÐp vµ ®o¹n biÕn n¹p ph¶i cã khèi lîng ph©n tö tèi thiÓu kho¶ng 400kDa (chiÕm
kho¶ng 1/200 bé gen vi khuÈn), dÜ nhiªn ®©y kh«ng ph¶i lµ giíi h¹n cao nhÊt. Sè
lîng tÕ bµo ®îc biÕn n¹p (transformant- thÓ biÕn n¹p) t¨ng tØ lÖ thuËn víi nång
®é cña DNA cho ®Õn lóc mµ c¸c tÕ bµo b·o hoµ do c¸c ®o¹n DNA g¾n vµo (thêng
kho¶ng 10 ®o¹n/tÕ bµo). DNA ®îc hÊp thô vµo tÕ bµo vµ bÞ enzyme c¾t lµm gi¶m
khèi lîng ph©n tö.
• §o¹n ngo¹i lai vµ ®o¹n néi t¹i
Khi DNA m¹ch kÐp x©m nhËp vµo tÕ bµo, mét m¹ch bÞ ph©n huû. BÊt kú ®o¹n
DNA nµo tõ tÕ bµo cho x©m nhËp vµo tÕ bµo nhËn, ®îc gäi lµ DNA ngo¹i lai
(exogenote) DNA cña tÕ bµo nhËn gäi lµ ®o¹n néi t¹i (endogenote). TÕ bµo vi
khuÈn nhËn ®o¹n ngo¹i lai sÏ lìng béi ë mét phÇn bé gen, ®îc gäi lµ hîp tö tõng
phÇn (merozygote). Tuy nhiªn, ®o¹n ngo¹i lai m¹ch ®¬n kh«ng bÒn v÷ng vµ bÞ
ph©n huû nÕu kh«ng ®îc g¾n vµo bé gen cña thÓ nhËn.
Qu¸ tr×nh trao ®æi th«ng tin di truyÒn b»ng c¸ch chØ chuyÓn mét phÇn vËt liÖu
di truyÒn tõ tÕ bµo nµy sang tÕ bµo kh¸c ®îc gäi lµ sù giao n¹p tõng phÇn
(meromixis). Cã ngêi cho r»ng ®o¹n ngo¹i lai m¹ch ®¬n ®îc g¾n víi protein
(nh protein Rec A ë E. coli), protein nµy hç trî t×m vïng bæ sung trªn ®o¹n néi
t¹i, lµm ®øt m¹ch vµ g¾n ®o¹n ngo¹i lai. C¸c enzyme sÏ c¾t c¸c ®Çu tù do cña c¶
thÓ cho vµ thÓ nhËn, ligase hµn kÝn chç trèng. Khi ®o¹n ngo¹i lai ®· g¾n vµo ®o¹n
néi t¹i th× tÕ bµo kh«ng cßn lµ hîp tö tõng phÇn n÷a.
NÕu ®o¹n ngo¹i lai chøa mét allele víi ®o¹n néi t¹i, th× m¹ch kÐp t¸i tæ hîp
sÏ cã mét hay nhiÒu chç b¾t cÆp sai (mismatch base pairs) vµ ®o¹n DNA nµy ®îc
gäi lµ heteroduplex. NÕu c¸c tÕ bµo con nhËn allele míi, chç b¾t cÆp sai ®îc söa
103
b»ng c¸ch c¾t ®o¹n néi t¹i vµ dïng m¹ch ngo¹i lai lµm khu«n thay thÕ. Sù g¾n
®o¹n ngo¹i lai vµo DNA tÕ bµo nhËn ®îc thùc hiÖn nhê t¸i tæ hîp t¬ng ®ång.
Hai hoÆc nhiÒu h¬n c¸c gen liªn kÕt chÆt cã thÓ n»m trong ®o¹n DNA biÕn
n¹p. NÕu sù x©m nhËp cña hai hay nhiÒu h¬n c¸c gen vµo ®o¹n néi t¹i, th× tÕ bµo
nhËn sÏ ®îc ®ång biÕn n¹p (cotransformed). TÇn sè cña ®ång biÕn n¹p tØ lÖ nghÞch
t¬ng øng víi kho¶ng c¸ch gi÷a c¸c gen cïng biÕn n¹p.
2.4.1. 2. C¬ chÕ ph©n tö
• Th©m nhËp cña DNA
Sîi DNA m¹ch kÐp cña dßng vi khuÈn S sau khi chui qua mµng tÕ bµo cña
dßng R th× mét m¹ch S sÏ bÞ nuclease cña tÕ bµo R c¾t, cßn l¹i mét m¹ch nguyªn
(h×nh 2.31).
H×nh 2.31. Qu¸ tr×nh biÕn n¹p cña DNA trÇn vµo trong tÕ bµo vi khuÈn
104
H×nh 2.32: ThÝ nghiÖm vÒ t¶i n¹p, sù t¶i n¹p ®îc thùc hiÖn b»ng c¸ch thay thÕ toµn bé hoÆc
mét phÇn bé gen cña phage b»ng DNA vi khuÈn
ThÝ nghiÖm ®îc tiÕn hµnh trong èng h×nh ch÷ u, ë ®¸y èng ®îc ng¨n c¸ch
b»ng mµng läc vi khuÈn (h×nh 2.32). Mµng cã lç nhá, vi khuÈn kh«ng ®i qua ®îc
nhng phage ®i qua ®îc. Nh¸nh A cña èng chøa vi khuÈn cã kh¶ n¨ng tæng hîp
tryptophan (mang gen trp+) cßn nh¸nh B nu«i c¸c vi khuÈn mÊt kh¶ n¨ng tæng hîp
tryptophan (mang gen trp-). Sau mét thêi gian nu«i cÊy, bªn nh¸nh B xuÊt hiÖn vi
khuÈn cã kh¶ n¨ng tæng hîp Trp. Qua nhiÒu lÇn thÝ nghiÖm viÖc phage t¶i gen trp+
tõ nh¸nh A sang nh¸nh B ®· ®îc chøng minh.
2.4.2. 2. T¶i n¹p chung (General transduction)
T¶i n¹p chung x¶y ra khi phage mang bÊt kú gen nµo cña vi khuÈn A sang vi
khuÈn B.
T¶i n¹p chung cã c¸c ®Æc ®iÓm sau:
- Thêng do phage kiÓu P1 thùc hiÖn
- BÊt kú gen nµo cña vi khuÈn còng ®îc t¶i n¹p
- T¶i n¹p cã ®îc lµ do gãi nhÇm DNA cña tÕ bµo chñ khi phage trëng thµnh
- C¸c thÓ t¸i tæ hîp ®¬n béi ®îc t¹o ra
Do kh«ng cã sù t¬ng ®ång gi÷a tr×nh tù DNA trªn c¸c phage víi tr×nh tù
DNA ë tÕ bµo chñ, nªn kh«ng cã ®iÓm g¾n nµo ®Æc hiÖu cho prophage. BÊt kú gen
nµo còng ®îc t¶i n¹p v× ®Çu cña phage cã thÓ gãi nhÇm vµo mét ®o¹n DNA cña
tÕ bµo chñ.
Sù ®ång t¶i n¹p (cotransduction) lµ qu¸ tr×nh t¶i n¹p ®ång thêi hai gen. Qu¸
tr×nh phage x©m nhËp vµo vi khuÈn ®îc m« t¶ ë h×nh 2.33. §Çu tiªn phage b¸m
vµo trªn bÒ mÆt cña vi khuÈn, sau 4 phót b¬m DNA cña nã ®i vµo trong tÕ bµo chñ,
105
sau ®ã chóng sinh s¶n vµ ®é nöa giê sau th× lµm tan vi khuÈn vµ gi¶i phãng c¸c
phage con (chu tr×nh tan).
Khi DNA cña phage x©m nhËp vµo tÕ bµo vi khuÈn A chóng c¾t DNA vi
khuÈn A thµnh nhiÒu ®o¹n, ®ång thêi DNA cña phage ®îc sao chÐp thµnh nhiÒu
ph©n tö con vµ c¸c vá cña phage còng ®îc t¹o thµnh. Sau ®ã, c¸c vá ®îc l¾p ruét
DNA vµo, ph¸ vì tÕ bµo vi khuÈn ra ngoµi vµ tiÕp tôc x©m nhËp vµo c¸c tÕ bµo vi
khuÈn míi.
Trong qu¸ tr×nh l¾p r¸p kho¶ng 1-2% phage v« t×nh mang ®o¹n DNA cña vi
khuÈn cã chøa gen. Phage mang gen cña vi khuÈn A x©m nhËp vµo vi khuÈn B,
qu¸ tr×nh t¸i tæ hîp diÔn ra lµm cho gen A g¾n vµo bé gen cña vi khuÈn B (h×nh
2.33).
2.4.2. 3. T¶i n¹p chuyªn biÖt (Special trans, duction)
T¶i n¹p chuyªn biÖt hay h¹n chÕ (restricted transduction) lµ trêng hîp chØ
mang mét vµi gen nhÊt ®Þnh, nã cã 4 ®Æc ®iÓm:
- Nh÷ng gen ®îc chuyÓn n»m s¸t chç prophage g¾n vµo
- ChØ cã prophage λ thùc hiÖn
- Do kÕt qu¶ c¾t sai cña prophage khi t¸ch khái nhiÔm s¾c thÓ cña tÕ bµo chñ
- C¸c vi khuÈn t¸i tæ hîp cã thÓ lìng béi mét phÇn
VÝ dô phage λ chØ mang gen gal (tiªu ho¸ ®êng galactose) tõ vi khuÈn nµy
chuyÓn sang vi khuÈn kh¸c.
§iÓm g¾n cña phage λ vµo bé gen cña vi khuÈn n»m gi÷a hai gen gal
(galactose) vµ bio (tæng hîp biotin). §Çu cña phage chØ cã thÓ chøa lîng DNA
106
giíi h¹n, nªn khi prophage t¸ch ra tõ DNA cña vi khuÈn, nã chØ t¶i n¹p ®îc gen
gal hoÆc bio. Phage λ t¶i n¹p c¸c gen galactose ®îc gäi lµ λgal hay λdg (d-
defective, g-galactose). NÕu tÕ bµo gal- ®îc nhiÔm bëi λdg (mang gen gal+), sù
r¸p vµo cña phage biÕn d¹ng vµo tÕ bµo chñ sÏ t¹o ra thÓ lìng béi mét phÇn. Sù
c¾t sai cña phage λ rÊt hiÕm nªn sù t¶i n¹p h¹n chÕ cã tÇn sè thÊp. Tuy nhiªn, t¶i
n¹p cã tÇn sè cao cã thÓ nhËn ®îc trong ®iÒu kiÖn thÝ nghiÖm. NÕu tÕ bµo vi khuÈn
®îc g©y nhiÔm kÐp víi phage λ hoang d¹i vµ phage λdg, phage λ hoang d¹i sÏ
hç trî chøc n¨ng sai sãt ë phage biÕn d¹ng, vµ thÕ hÖ con sÏ cã hai kiÓu víi sè
lîng b»ng nhau. Khi dÞch tan ®îc dïng ®Ó t¶i n¹p, qu¸ tr×nh nµy sÏ ®îc gäi lµ
t¶i n¹p tÇn sè cao (high frequency transduction).
Trong nhiÒu trêng hîp, do bé gen biÕn d¹ng cña phage λdg kh«ng g¾n ®îc
vµo bé gen cña tÕ bµo chñ (nªn kh«ng sao chÐp ®îc). Sau mçi lÇn ph©n bµo, chØ
cã mét trong hai tÕ bµo cã bé gen cña phage biÕn d¹ng, qu¸ tr×nh nµy gäi lµ t¶i
n¹p sÈy (abortive transduction).
2.4.3. Giao n¹p (conjugation)
H×nh 2.34. Qu¸ tr×nh chuyÓn DNA qua cÇu tiÕp hîp tõ tÕ bµo cho sang tÕ bµo nhËn
Giao n¹p ë vi khuÈn lµ sù kÕt hîp nhÊt thêi cña hai tÕ bµo cã kiÓu b¾t cÆp ®èi
nhau, ®îc tiÕp nèi b»ng sù chuyÓn mét phÇn vËt chÊt di truyÒn tõ tÕ bµo cho sang
tÕ bµo nhËn qua cÇu tÕ bµo chÊt, sau ®ã t¸ch nhau ra (exconjugants). KiÓu sao chÐp
sigma (σ) ®îc tÕ bµo vi khuÈn sö dông trong giao n¹p ®Ó truyÒn ph©n tö DNA
d¹ng th¼ng sang tÕ bµo kh¸c (h×nh 2.34).
2.4.3. 1. Chøng minh cã hiÖn tîng lai ë vi khuÈn
N¨m 1946, J. Lederberg vµ E. Tatum ®· sö dông c¸c dßng ®ét biÕn khuyÕt
dìng kh¸c nhau ë E. coli ®Ó chøng minh cã t¸i tæ hîp gi÷a c¸c dßng vi khuÈn
kh¸c nhau. Cô thÓ lµ dßng A cã kiÓu gen met-bio-thr+leu+thi+ (cã kh¶ n¨ng tæng
hîp ®îc Thr, Leu, vit B1, kh«ng tæng hîp ®îc Met vµ Biotin), cßn ë d¹ng B th×
ngîc l¹i cã kiÓu gen met+bio+thr-leu-thi-. Trén A vµ B trong èng nghiÖm sau ®ã
cÊy lªn m«i trêng tèi thiÓu, c¸c khuÈn l¹c mäc ®îc trªn m«i trêng tèi thiÓu,
107
chøng tá cã c¸c d¹ng lai, chóng chØ mäc ®îc nhê sù bï ®¾p cho nhau c¸c nhu cÇu
dinh dìng. D¹ng lai cã kiÓu gen met+bio+thr+leu+thi+. Trong khi ®ã tõng d¹ng A
hoÆc B riªng lÎ th× kh«ng mäc ®îc trªn m«i trêng tèi thiÓu (h×nh 2.35).
H×nh 2.35. Khi hai ®ét biÕn ®îc ®Æt trong mét m«i trêng tèi thiÓu, sù sinh trëng chØ x¶y ra
khi sù t¸i tæ hîp t¹o ra mét chñng cã chøa c¸c allele hoang d¹i ë c¶ hai locus
2.4.3. 2. Sù ph©n ho¸ giíi tÝnh ë vi khuÈn
N¨m 1953, Hayes ®· ph¸t hiÖn ë vi khuÈn cã c¸c d¹ng kh¸c nhau t¬ng tù
gièng ®ùc vµ gièng c¸i ë sinh vËt bËc cao. C¸c d¹ng ®ã ®îc ký hiÖu F+ vµ F- (F:
fertility), F+ t¬ng tù gièng ®ùc ë sinh vËt bËc cao, nã truyÒn gen sang F-. TÇn sè
lai F+xF- kho¶ng 10-6 tøc lai mét triÖu tÕ bµo th× sÏ cã mét tÕ bµo lai.
• Episome vµ plasmid
Khi tiÕp xóc víi tÕ bµo F+ mét thêi gian, tÕ bµo F- trë thµnh tÕ bµo F+. VÒ sau
d¹ng Hfr (high frequency of recombination) ®îc ph¸t hiÖn, d¹ng nµy cã tÇn sè
lai cao víi F- h¬n F+ cã thÓ lªn ®Õn 104 lÇn. Khi F+ tiÕp xóc víi F- mét thêi gian,
F- biÕn thµnh F+ do nã nhËn ®îc mét ph©n tö di truyÒn gäi lµ episome. Episome
F+ lµ phÇn tö di truyÒn ngoµi nhiÔm s¾c thÓ, cã thÓ tån t¹i hoÆc ë d¹ng ph©n tö
DNA vßng trßn tù sao chÐp hoÆc g¾n vµo tõng ph©n tö DNA cña tÕ bµo vËt chñ
(phage λ ...). Episome F+ ®îc gäi lµ nh©n tè giíi tÝnh (sex-factor).
Plasmid lóc ®Çu ®îc ®Þnh nghÜa lµ ph©n tö DNA vßng trßn nhá cã kh¶ n¨ng
sao chÐp ®éc lËp víi nhiÔm s¾c thÓ tÕ bµo chñ vµ kh«ng cã kh¶ n¨ng g¾n vµo nhiÔm
s¾c thÓ tÕ bµo chñ. Plasmid cã thÓ mang mét sè gen kh¸c nhau nh ®Ò kh¸ng thuèc
108
(plasmid R kh¸ng nhiÒu thuèc kh¸ng sinh) .... HiÖn nay, "plasmid" ®îc dïng cho
c¶ hai nghÜa episome vµ plasmid. C¸c plasmid cã thÓ tån t¹i ®éc lËp hoÆc g¾n vµo
bé gen vi khuÈn. VÒ sau ngêi ta ph¸t hiÖn ë vi khuÈn cßn cã nhiÒu lo¹i plasmid
kh¸c n÷a. B¶n chÊt di truyÒn cña c¸c dßng F+ , F- , Hfr ®îc x¸c ®Þnh do c¸c
plasmid nh sau:
- F- kh«ng chøa plasmid
- F+ chøa plasmid ë d¹ng ®éc lËp
- Hfr chøa plamid ®îc g¾n vµo bé gen vi khuÈn
• C¸c nh©n tè F' vµ tÝnh n¹p
Sù c¾t rêi nh©n tè F tõ nhiÔm s¾c thÓ cña dßng Hfr nhiÒu khi kh«ng chÝnh
x¸c vµ lóc ®ã mét ®o¹n bé gen cña vi khuÈn thay thÕ mét phÇn cña F. Trong trêng
hîp nµy, nh©n tè F' ®îc t¹o thµnh vµ nã cã kh¶ n¨ng chuyÓn gen cña vi khuÈn
mét c¸c ®éc lËp, nhng víi c¸c tÝnh tr¹ng cña tÕ bµo cho. HiÖn tîng nµy gäi lµ
tÝnh n¹p (sexduction), cã nghÜa lµ sù chuyÓn gen kÌm theo nh©n tè giíi tÝnh. Nhê
tÝnh n¹p cã thÓ nhËn ®îc c¸c thÓ lìng béi tõng phÇn (merodiploid) theo c¸c gen
®îc g¾n vµo F+. Do vËy cã thÓ nghiªn cøu ®îc mèi t¬ng quan allele vµ c¸c hiÖu
qu¶ do sù gia t¨ng liÒu lîng gen ë vi khuÈn.
H×nh 2.36. Sù tiÕp hîp vµ t¸i tæ hîp ë vi khuÈn. Sù chuyÓn mét ®o¹n sîi ®¬n cña nhiÔm s¾c thÓ
2.3.3.
tÕ bµo T¸i
cho vµ sù tæ
t¸ihîp
tæ hîp víi nhiÔm s¾c thÓ tÕ bµo nhËn (sù giao n¹p gi÷a tÕ bµo Hfr víi F-).
Muèn x¶y ra t¸i tæ hîp th× hai dßng vi khuÈn ph¶i tiÕp xóc víi nhau (F+x F-)
hoÆc (Hfrx F-). Dßng tÕ bµo mang nh©n tè F+ ®îc coi lµ tÕ bµo ®ùc vµ cã kh¶ n¨ng
t¹o ra protein pilin, tõ protein nµy t¹o èng giao n¹p gäi lµ pilus. Sù co l¹i cña pilus
®ang nèi hai tÕ bµo lµm chóng tiÕp xóc gÇn nhau (h×nh 2.36). TÕ bµo F- ®îc coi
lµ c¸i (female). Sau khi giao n¹p tÕ bµo F- thµnh F+.
109
ViÖc chuyÓn gen chØ thùc hiÖn khi plasmid g¾n vµo bé gen cña vi khuÈn.
Trong qu¸ tr×nh chuyÓn vËt chÊt di truyÒn sang F- th× DNA cña tÕ bµo chñ sao chÐp
vµ t¹o m¹ch míi cã ®Çu ori ®i ®Çu vµ F ë cuèi. Qu¸ tr×nh chuyÓn DNA tõ F+ sang
F- cã thÓ bÞ ng¾t qu·ng. C¸c gen a, b, c ®îc chuyÓn mét chiÒu tõ Hfr sang F-.
Dßng Hfr cã tÇn sè lai cao h¬n nhiÒu v× plasmid ®· n»m s½n trong bé gen, cßn F+
ph¶i quan giai ®o¹n plasmid g¾n vµo bé gen råi míi chuyÓn gen.
Trong ®iÒu kiÖn phßng thÝ nghiÖm ë 370C, toµn bé bé gen cña tÕ bµo E.coli
®îc chuyÓn sang cho tÕ bµo nhËn trong vßng 90 phót. Thêng sù giao n¹p bÞ ng¾t
qu·ng gi÷a chõng do c¸c pilus bÞ g·y, nªn Ýt khi bé gen ®îc chuyÓn nguyªn vÑn
vµo tÕ bµo nhËn. Lóc ®ã tÕ bµo F- vÉn lµ F-. B»ng c¸ch ng¾t qu·ng qu¸ tr×nh giao
n¹p mµ b¶n ®å di truyÒn cña E.coli ®îc x©y dùng nªn cã d¹ng mét vßng trßn.
2.4.4. LËp b¶n ®å di truyÒn nhiÔm s¾c thÓ cña vi khuÈn
2.4.4. 1. Giao n¹p ng¾t qu·ng (interrupted conjugation)
Khi trén dÞch tÕ bµo Hfr víi F-, sù tiÕp hîp cã thÓ bÞ ng¾t qu·ng vµo tõng thêi
®iÓm tuú ý b»ng c¸ch rung l¾c m¹nh. MÉu ®îc pha lo·ng nhanh vµ cÊy lªn m«i
trêng chän läc. Ngoµi ra, dßng F- ph¶i cã gen ®¸nh dÊu hay gen khuyÕt dìng
®Ó chóng kh«ng thÓ mäc ®îc trªn m«i trêng chän läc vµ chØ cã c¸c d¹ng t¸i tæ
hîp mäc lªn. Sù truyÒn DNA cña Hfr sang F- cã tÝnh ph©n cùc, c¸c gen ë ®Çu sang
tríc vµ lÇn lît c¸c gen kh¸c theo sau. Nhê ng¾t qu·ng cã thÓ x¸c ®Þnh ®îc thêi
gian mµ mét gen ®îc truyÒn sang F- vµ kho¶ng c¸ch gi÷a chóng.
VÝ dô: dßng Hfr cã mang c¸c gen nguyªn dìng ®¸nh dÊu a+b+c+ ®îc trén
víi dßng F- mang c¸c allele khuyÕt dìng a, b, c. Sù tiÕp hîp ®îc ng¾t qu·ng víi
kho¶ng c¸ch 5 phót vµ pha lo·ng trªn m«i trêng chän läc (m«i trêng tèi thiÓu).
KÕt qu¶ thu ®îc nh sau:
5 ab+c
10 Ab+c+
15 a+b+c+
Tr×nh tù gen ë dßng Hfr lµ b+ - c+ -a+, b c¸ch ®Çu mót truyÒn sang Ýt h¬n 5
phót, c Ýt h¬n 10 phót, a Ýt h¬n 15 phót, ë ®©y ®¬n vÞ ®o lµ phót.
110
H×nh 2.37. ThÝ nghiÖm lËp b¶n ®å gen cña vi khuÈn b»ng giao n¹p ng¾t qu·ng, c¸c tÕ bµo F-
kh¸ng streptomycin víi c¸c gen ®ét biÕn azi, ton, lac vµ gal ®îc ñ víi c¸c tÕ bµo Hfr trong
kho¶ng thêi gian kh¸c nhau.
111
vµo nhiÔm s¾c thÓ nhËn th× míi ®îc sao chÐp vµ chia vÒ c¸c tÕ bµo trong dßng.
ChØ mét ®o¹n ng¾n DNA thêng ®îc g¾n vµo nhê biÕn n¹p vµ t¶i n¹p. Nh vËy
nÕu hai gen cïng biÕn n¹p (cotransformation) th× hai locus ph¶i liªn kÕt chÆt.
T¬ng tù nh vËy, hai gen cïng ®îc t¶i n¹p vµo phage sÏ ë gÇn nhau. Møc ®é
liªn kÕt gi÷a c¸c gen cã chøc n¨ng kh¸c nhau (intercistronic) hay gi÷a c¸c ®ét biÕn
bªn trong mét gen chøc n¨ng (intracistronic) cã thÓ ®îc ®¸nh gi¸ tõ kÕt qu¶ lai
chuyªn biÖt.
ë hÖ thèng hîp tö mét phÇn (merozygote), gen ngo¹i lai (exogenote) muèn
g¾n vµo gen néi t¹i (endogenote) ph¶i x¶y ra hai trao ®æi chÐo ë hai ®Çu (h×nh
2.25), v× nÕu chØ cã mét trao ®æi chÐo th× c¶ hai s¶n phÈm nhËn ®îc ®Òu mÊt c©n
b»ng. Trong c¸c hÖ thèng nµy tæng c¸ thÓ tham gia t¸i tæ hîp kh«ng biÕt ®îc, nªn
tÇn sè t¸i tæ hîp kh«ng thÓ tÝnh nh ë ruåi giÊm (trªn tæng sè c¸ thÓ). Do ®ã, tÇn
sè t¸i tæ hîp ®îc tr×nh bµy t¬ng ®èi theo mét sè tiªu chuÈn chung cho tÊt c¶ c¸c
tæ hîp lai. VÝ dô sè lîng c¸c c¸ thÓ t¸i tæ hîp nguyªn dìng ®îc t¹o ra khi lai
hai dßng ®ét biÕn cã so s¸nh víi kÕt qu¶ khi lai d¹ng hoang d¹i víi tõng lo¹i ®ét
biÕn. Tuy nhiªn, cã nhiÒu sai lÖch vµ cÇn chØnh lý.
X¸c ®Þnh tr×nh tù gen ë vi sinh vËt thêng phøc t¹p v× cã thÓ x¶y ra hiÖn tîng
nhiÔu ©m côc bé (localized negative interference). Ph¬ng ph¸p x¸c ®Þnh tr×nh tù
gen thêng dïng lµ lai ba ®iÓm ho¸n ®æi (three-factor-reciprocall crosses). Ngoµi
ra, cã thÓ x©y dùng b¶n ®å di truyÒn b»ng c¸ch sö dông c¸c mÊt ®o¹n ë phage.
H×nh 2.38. B¶n ®å gen cña vi khuÈn E. coli dùa vµo tiÕp hîp ng¾t qu·ng víi ®¬n vÞ ®o lµ phót
112
ch¬ng 3
qu¸ tr×nh phiªn m· vµ dÞch m·
1. qu¸ tr×nh phiªn m·
Qu¸ tr×nh phiªn m· - sinh tæng hîp RNA - lµ nh÷ng qu¸ tr×nh chuyÓn th«ng
tin di truyÒn tõ ph©n tö DNA sang ph©n tö RNA. B¶n chÊt ho¸ häc cña qu¸ tr×nh
nµy vµ qu¸ tr×nh sinh tæng hîp DNA rÊt gièng nhau nhng chóng l¹i mang mét ý
nghÜa sinh häc kh¸c biÖt. Trong phÇn nµy, chóng ta häc vÒ bíc ®Çu tiªn cña qu¸
tr×nh chuyÓn th«ng tin tõ c¸c gen ®Õn s¶n phÈm cña gen. BÊt kú mét tr×nh tù DNA
nµo trong bé gen cña bÊt kú mét sinh vËt nµo ®ã còng cã thÓ m· hãa cho c¸c s¶n
phÈm gen mµ nã cã thÓ t¹o ra. §Ó sö dông th«ng tin di truyÒn, mét b¶n sao trung
gian cña gen ®îc t¹o ra b»ng c¸ch sö dông tr×nh tù cña DNA. Ph©n tö trung gian
nµy lµ RNA vµ qu¸ tr×nh tæng hîp t¹o ra nã lµ qu¸ tr×nh phiªn m·. Sù truyÒn th«ng
tin x¶y ra theo nhiÒu bíc, bíc ®Çu tiªn lµ phiªn m· DNA thµnh RNA, bíc thø
hai lµ chuyÓn th«ng tin m· hãa trong RNA thµnh chuçi amino acid (polypeptide)
b»ng mét qu¸ tr×nh dÞch m·. Hai bíc chuyÓn th«ng tin nµy ®îc thùc hiÖn trong
cïng mét kh«ng gian vµ thêi gian ë prokaryote, cßn ë eukaryote th× l¹i x¶y ra ë
c¸c kh«ng gian riªng biÖt, cã nghÜa lµ qu¸ tr×nh phiªn m· x¶y ra ë trong nh©n vµ
qu¸ tr×nh dÞch m· x¶y ra ë tÕ bµo chÊt. Gièng nh ë sao chÐp, qu¸ tr×nh phiªn m·
®îc thùc hiÖn bëi mét bé m¸y, mµ ë eukaryote nã kÕt hîp qu¸ tr×nh tæng hîp vµ
biÕn ®æi mRNA, ë mét sè gen s¶n phÈm cuèi cïng cña qu¸ tr×nh chuyÓn th«ng tin
lµ RNA. B¶ng 3.1 cho thÊy sù gièng vµ kh¸c nhau cña qu¸ tr×nh sao chÐp víi qu¸
tr×nh phiªn m·.
B¶ng 3.1: So s¸nh sù gièng vµ kh¸c nhau cña hai qu¸ tr×nh phiªn m· vµ sao chÐp
Qu¸ tr×nh phiªn m· Qu¸ tr×nh sao chÐp
Kh¸c nhau - Khu«n DNA ®îc b¶o tån - Khu«n DNA ®îc b¸n b¶o
trong qu¸ tr×nh tæng hîp. tån trong qu¸ tr×nh sao chÐp.
- RNA polymerase kh«ng cã - DNA polymerase cã ho¹t
ho¹t tÝnh nuclease. tÝnh nuclease.
- Qu¸ tr×nh tæng hîp RNA - Qu¸ tr×nh sao chÐp cÇn sù
kh«ng cÇn sù cã mÆt cña måi. cã mÆt cña måi
- Liªn quan ®Õn tÝnh ®a d¹ng vµ - Qu¸ tr×nh sao chÐp cã tÝnh
biÕn ®éng trong sù biÓu hiÖn c¸c æn ®Þnh cao, ®¶m b¶o viÖc
tÝnh tr¹ng di truyÒn .
113
truyÒn ®¹t nguyªn vÑn bé
gen.
Gièng nhau - ChiÒu tæng hîp lµ 5'3'
- N¨ng lîng tæng hîp nhê thuû gi¶i ATP
Gi÷a tÕ bµo eukaryote vµ prokaryote, qu¸ tr×nh phiªn m· còng cã kh¸c nhau.
Tuy ®Òu gåm ba giai ®o¹n: khëi ®Çu, kÐo dµi vµ kÕt thóc, nhng sù kh¸c nhau l¹i
lµ:
- Bé gen cña prokaryote n»m tù do trong tÕ bµo chÊt, cßn bé gen cña
eukaryote th× n»m trong nh©n ®îc bao bäc bëi mµng nh©n.
- C¸c yÕu tè tham gia vµo qu¸ tr×nh khëi ®Çu, kÐo dµi vµ kÕt thóc ë c¸c tÕ bµo
kh¸c nhau.
- Enzyme tæng hîp ë tÕ bµo prokaryote chØ lµ mét lo¹i enzyme lµ RNA
polymerase, cßn ë eukaryote cã tíi ba lo¹i enzyme.
- mRNA cña eukaryote t¹o ra kh«ng ho¹t ®éng ngay nh mRNA cña
prokaryote, mµ ph¶i tr¶i qua mét lo¹t biÕn ®æi míi thÓ hiÖn chøc n¨ng ho¹t ®éng
cña m×nh.
- mRNA cña eukaryote chØ m· ho¸ cho mét protein cßn mRNA cña
prokaryote cã nhiÒu ®o¹n tr×nh tù vµ mçi ®o¹n tr×nh tù l¹i m· ho¸ cho mét protein.
1.1. PROMOTER Vµ C¸C PROTEIN THAM GIA KHëI §éNG
PHI£N M·
1.1.1. Promoter
H×nh 3.1. Tr×nh tù khëi ®Çu cña qu¸ tr×nh phiªn m· ë prokaryote
114
CÊu tróc cña mét gen gåm hai phÇn chÝnh: phÇn mang c¸c m· di truyÒn vµ
phÇn chøa c¸c nucleotide liªn quan ®Õn chøc n¨ng ®iÒu khiÓn phiªn m· tõ DNA
(gen) sang sîi RNA. VÞ trÝ nucleotide ®Çu tiªn trªn DNA ®îc phiªn m· sang
RNA ®îc kÝ hiÖu lµ +1. Víi quy ®Þnh nµy, c¸c nucleotide n»m trong phÇn ®iÒu
khiÓn (ë vïng 5' phÝa tríc vÞ trÝ +1) sÏ ®îc kÝ hiÖu lµ vÞ trÝ (-). Vïng ®iÒu khiÓn
gen bao gåm promoter vµ c¸c tr×nh tù ®Æc biÖt (response element) ®îc nhËn biÕt
bëi c¸c yÕu tè phiªn m· (transcription factor).
Promoter lµ tr×nh tù nucleotide cÇn thiÕt ®Ó RNA polymerase b¸m vµo b¾t
®Çu phiªn m·. Tr×nh tù nµy n»m ngay tríc vÞ trÝ +1 (h×nh 3.1) ë c¸c gen
prokaryote. Tuy nhiªn, promoter cña gen eukaryote thêng ®îc xem xÐt gåm vÞ
trÝ nhËn biÕt bëi RNA polymerase vµ c¸c tr×nh tù ®Æc biÖt nhËn biÕt bëi yÕu tè
phiªn m·. §ã lµ do phiªn m· trªn gen prokaryote cã thÓ x¶y ra ngay khi mét m×nh
RNA polymerase b¸m vµo promoter trong khi ®iÒu nµy hÇu nh kh«ng x¶y ra víi
gen eukaryote.
Khi tiÕn hµnh thÝ nghiÖm g©y ®ét biÕn thay thÕ hoÆc mÊt ®o¹n c¸c nucleotide
cña promoter cho phÐp x¸c ®Þnh chÝnh x¸c c¸c nucleotide kh«ng thÓ thiÕu ®èi víi
khëi ®Çu phiªn m·. KÕt qu¶ cho thÊy promoter cña gen m· cho protein thêng
gåm hai tr×nh tù riªng biÖt ph©n bè ngay tríc ®iÓm khëi ®Çu phiªn m·. Tr×nh tù
c¬ b¶n cña promoter (core promoter) thêng gåm c¸c nucleotide ë vÞ trÝ -10 ®Õn
vµi nucleotide sau +1 ®èi víi gen vi khuÈn, hoÆc gåm c¸c nucleotide ë vÞ trÝ -40
®Õn +20 ®èi víi gen eukaryote. HÇu hÕt tr×nh tù c¬ b¶n ë gen prokaryote vµ
eukaryote ®Òu chøa mét ®o¹n ng¾n giµu A-T gäi lµ hép TATA. Hép TATA ë vÞ
trÝ -10 cña promoter vi khuÈn, nhng l¹i ph©n bè ë vÞ trÝ -25 trªn promoter
eukaryote. Khi promoter chØ cã tr×nh tù c¬ b¶n th× møc ®é phiªn m· x¶y ra rÊt
thÊp. Møc ®é phiªn m· t¨ng lªn rÊt nhiÒu khi promoter cã thªm tr×nh tù n»m phÝa
tríc tr×nh tù c¬ b¶n. Tr×nh tù thø hai nµy thêng n»m ë vÞ trÝ -35 ®èi víi gen vi
khuÈn, hoÆc vÞ trÝ -70 ®Õn -90 ë gen eukaryote. RNA polymerase vi khuÈn cã thÓ
tù nã nhËn biÕt promoter vµ khëi ®Çu phiªn m·. Tuy nhiªn, RNA polymerase II
kh«ng thÓ tù m×nh khëi ®Çu phiªn m· nÕu nh kh«ng cã sù trî gióp cña c¸c yÕu
tè phiªn m·.
§iÒu cÇn lu ý lµ mét sè gen kh«ng cã cÊu tróc promoter ®iÓn h×nh, hoÆc c¸c
gen ho¹t ®éng ë nh÷ng ®iÒu kiÖn kh¸c nhau ®ßi hái RNA polymerase ph¶i liªn kÕt
víi c¸c yÕu tè kh¸c nhau. §èi víi vi khuÈn chØ cã mét lo¹i RNA polymerase,
nhng lâi enzyme cã thÓ liªn kÕt víi c¸c yÕu tè sigma (σ) kh¸c nhau ®Ó phiªn m·
(sÏ thÊy râ ë ch¬ng sau).
115
Promoter cña gen eukaryote m· cho protein ®îc nhËn biÕt bëi RNA
polymerase II. Tuy nhiªn, enzyme chØ t¬ng t¸c víi promoter sau khi hÇu hÕt c¸c
yÕu tè phiªn m· (h×nh 3.5). Ngoµi ra, phiªn m· ë eukaryote cßn ®ßi hái c¸c tr×nh
tù t¨ng cêng (enhancer). Tr×nh tù t¨ng cêng thêng ®Æc thï cho tõng gen hoÆc
nhãm gen, tr×nh tù nµy cã thÓ ph©n bè phÝa tríc, sau hoÆc ngay trong gen. Tr×nh
tù t¨ng cêng lµ vÞ trÝ t¬ng t¸c víi yÕu tè ho¹t hãa. §iÒu nµy cã thÓ dÉn tíi thay
®æi côc bé cÊu tróc ®o¹n DNA chøa promoter, hoÆc lµm t¨ng nång ®é c¸c yÕu tè
ho¹t hãa t¹i promoter. Nh vËy, vai trß cña tr×nh tù t¨ng cêng lµ t¨ng møc ®é
phiªn m· trªn promoter.
1.1.2. C¸c protein tham gia khëi ®Çu phiªn m·
Qu¸ tr×nh phiªn m· trªn c¸c gen eukaryote ®îc kiÓm so¸t chñ yÕu ë giai
®o¹n khëi ®Çu. Giai ®o¹n nµy phô thuéc vµo sù t¬ng t¸c gi÷a c¸c yÕu tè phiªn m·
víi nhau, hoÆc víi c¸c tr×nh tù nucleotide ®Æc biÖt. KÕt qu¶ cña nh÷ng t¬ng t¸c
®an chÐo dÉn ®Õn t¨ng cêng hoÆc øc chÕ RNA polymerase tæng hîp RNA. C¸c
yÕu tè cã chøc n¨ng t¨ng cêng ho¹t ®éng phiªn m· ®îc gäi lµ yÕu tè ho¹t hãa
(activator). C¸c yÕu tè cã chøc n¨ng øc chÕ ho¹t ®éng phiªn m· gäi lµ yÕt tè k×m
h·m (repressor). C¸c yÕu tè ho¹t hãa vµ k×m h·m ®Òu cã thÓ liªn kÕt víi c¸c protein
kh¸c nhau ®Ó ®iÒu chØnh ho¹t tÝnh cña m×nh. Protein liªn kÕt víi yÕu tè ho¹t hãa
gióp yÕu tè ho¹t hãa thùc thi nhiÖm vô ®îc gäi lµ yÕu tè ®ång ho¹t hãa (co-
activator). T¬ng tù, protein liªn kÕt víi yÕu tè k×m h·m ®Ó øc chÕ phiªn m· th×
®îc gäi lµ yÕu tè ®ång k×m h·m (co-repressor). HÇu hÕt c¸c yÕu tè phiªn m· cã
nhiÒu vïng (domain). Mçi vïng cã vai trß ®Æc hiÖu ®¶m b¶o t¬ng t¸c víi RNA
polymerase, víi DNA, hoÆc víi c¸c protein kh¸c.
YÕu tè ho¹t hãa cã kh¶ n¨ng nhËn biÕt vµ t¬ng t¸c víi tr×nh tù nucleotide
®Æc biÖt nh promoter (n»m trong vïng ®iÒu khiÓn phÝa tríc vïng mang m· di
truyÒn cña gen), hoÆc t¬ng t¸c víi tr×nh tù t¨ng cêng n»m c¸ch xa gen (phÝa
tríc, phÝa sau hoÆc ngay trong gen). Sù cã mÆt cña yÕu tè ho¹t hãa gióp RNA
polymerase II dÔ dµng t¬ng t¸c víi promoter vµ b¾t ®Çu ph¶n øng tæng hîp RNA.
Nh vËy, chøc n¨ng cña yÕu tè ho¹t hãa lµ t¨ng cêng tèc ®é khëi ®Çu phiªn m·
t¹i promoter. Mét sè yÕu tè ho¹t hãa ho¹t ®éng liªn tôc. Tuy nhiªn, cã rÊt nhiÒu
yÕu tè ho¹t hãa chØ ho¹t ®éng t¹i nh÷ng thêi ®iÓm vµ chØ cã mÆt trong mét sè m«,
tæ chøc nhÊt ®Þnh. §Æc biÖt, nh÷ng yÕu tè ho¹t hãa kÝch ho¹t c¸c gen mµ s¶n phÈm
cña chóng cÇn thiÕt trong giai ®o¹n sinh trëng ph¸t triÓn cña c¬ thÓ. HÇu hÕt c¸c
yÕu tè ho¹t hãa ho¹t ®éng theo thêi gian vµ kh«ng gian sÏ nhËn biÕt vµ t¬ng t¸c
víi nh÷ng tr×nh tù ®Æc hiÖu cña riªng tõng nhãm gen hoÆc tõng gen riªng biÖt.
116
Kh¸c víi yÕu tè ho¹t hãa, yÕu tè k×m h·m lu«n lu«n t¬ng t¸c víi tr×nh tù
®Æc hiÖu trªn ph©n tö DNA. T¹i vÞ trÝ ®ã, yÕu tè k×m h·m cã thÓ t¬ng t¸c víi RNA
polymerase ®Ó ng¨n c¶n enzyme khëi ®Çu phiªn m·. VÝ dô, yÕu tè k×m h·m t¬ng
t¸c víi vÞ trÝ operator n»m gèi lªn promoter cña operon lac ë E.coli. YÕu tè k×m
h·m t¸ch khái DNA khi cã mÆt yÕu tè c¶m øng hay cßn gäi lµ yÕu tè kÝch thÝch
(inducer). Mét promoter cã thÓ cã nhiÒu vÞ trÝ cho yÕu tè ho¹t hãa còng nh nhiÒu
vÞ trÝ cho yÕu tè k×m h·m. Tïy thuéc vµo vÞ trÝ trªn DNA, hoÆc sù cã mÆt cña c¸c
yÕu tè kÝch thÝch mµ yÕu tè k×m h·m øc chÕ ë c¸c møc ®é kh¸c nhau.
1.2. qu¸ tr×nh phiªn m· ë prokaryote
1.2.1. Mét sè ®Æc ®iÓm cña qu¸ tr×nh phiªn m· ë prokaryote
1.2.1.1. Qu¸ tr×nh phiªn m· lµ mét ph¶n øng enzyme tæng hîp RNA tõ
khu«n DNA
Qu¸ tr×nh phiªn m· lµ bíc ®Çu tiªn truyÒn th«ng tin tõ gen ®Õn protein, t¹o
ra mét sîi RNA cã tr×nh tù bæ sung víi tr×nh tù cña mét ®o¹n DNA. RNA ®îc
tæng hîp tõ khu«n DNA theo c¬ chÕ bæ sung t¬ng tù nh sù sao chÐp mét sîi
DNA míi tõ khu«n DNA ®· cã. Theo c¬ chÕ nµy, hai m¹ch cña ph©n tö DNA sÏ
t¸ch rêi nhau vµ mét m¹ch ®¬n ®îc dïng lµm khu«n. ChÝnh sù hiÖn diÖn cña mét
enzyme chuyªn biÖt: RNA polymerase sÏ quyÕt ®Þnh viÖc sö dông khu«n nµy vµo
sinh tæng hîp RNA thay v× sao chÐp mét sîi DNA míi. HiÖn tîng phiªn m· dï
mang tÝnh chÝnh x¸c cao, nhng do kh«ng cã c¬ chÕ söa sai ®i kÌm nªn ®é chÝnh
x¸c kÐm xa ë qu¸ tr×nh sao chÐp. Tuy nhiªn, v× c¸c RNA ®îc phiªn m· kh«ng
bao giê ®îc sao chÐp l¹i nªn c¸c sai sãt cã thÓ x¶y ra kh«ng ¶nh hëng ®Õn viÖc
truyÒn ®¹t th«ng tin di truyÒn l¹i cho thÕ hÖ sau.
1.2.1.2. ChØ mét trong hai m¹ch ®¬n cña ph©n tö DNA ®îc dïng lµm
khu«n
ë møc ®é tõng gen riªng biÖt, RNA polymerase quyÕt ®Þnh viÖc chän m¹ch
khu«n b»ng c¸ch g¾n vµo mét tr×nh tù ®Æc biÖt trªn m¹ch ®îc chän lµm khu«n,
tr×nh tù ®ã ®îc gäi lµ promoter. ë møc ®é nhiÔm s¾c thÓ, sù viÖc phøc t¹p h¬n,
c¶ hai nhiÔm s¾c thÓ ®Òu ®îc dïng lµm khu«n. §èi víi mét sè gen, sù phiªn m·
x¶y ra trªn mét nhiÔm s¾c thÓ, ®èi víi mét sè gen kh¸c, sù phiªn m· l¹i x¶y ra ë
nhiÔm s¾c thÓ kia. Sù phiªn m· x¶y ra theo mét chiÒu x¸c ®Þnh (5' 3'), gièng
nh trong qu¸ tr×nh sao chÐp. ChiÒu di chuyÓn cña RNA polymerase sÏ quyÕt ®Þnh
m¹ch ®¬n nµo ®îc sö dông lµm khu«n.
117
Qu¸ tr×nh phiªn m· ®îc thùc hiÖn dùa vµo tÝnh b¾t cÆp bæ sung cña c¸c base.
§Çu tiªn, hai sîi DNA xo¾n kÐp ®îc t¸ch ra vµ mét sîi ®îc sö dông lµm khu«n
®Ó tæng hîp RNA. TiÕp theo, c¸c ribonucleotide ®îc ®Þnh vÞ b¾t cÆp bæ sung ®èi
diÖn víi c¸c base trªn khu«n DNA ®îc thùc hiÖn bëi RNA polymerase, mµ
enzyme nµy tiÕp xóc vµ di chuyÓn däc theo DNA, sù liªn kÕt s¾p hµng cña c¸c
ribonucleotide lµm cho RNA mäc dµi ra nh h×nh 3.2. Trong qu¸ tr×nh tæng hîp,
RNA ®îc kÐo dµi theo chiÒu 5’ 3’, hay nãi c¸ch kh¸c c¸c ribonucleotide lu«n
®îc thªm vµo ë ®Çu 3’OH. §iÒu nµy cã nghÜa lµ khu«n DNA ph¶i lµ híng 3’
5’. Trong qu¸ tr×nh phiªn m·, RNA polymerase di chuyÓn trªn DNA, th¸o xo¾n ë
mét ®Çu vµ ®ãng xo¾n ë ®Çu kia. §Çu 5’ cña RNA míi ®îc tæng hîp ®îc ®Èy ra
khái khu«n khi bãng phiªn m· ®ãng l¹i ë phÝa bªn kia RNA polymerase. “Con
tµu” RNA polymerase tæng hîp RNA vµ di chuyÓn däc theo khu«n, t¹o ra sîi
RNA cã tr×nh tù gièng víi sîi DNA kh«ng ®îc sö dông lµm khu«n.
1.2.1.3. Enzyme RNA polymerase ®îc cÊu t¹o tõ nhiÒu tiÓu ®¬n vÞ
ë prokaryote, RNA polymerase cã cÊu tróc bËc 4 rÊt phøc t¹p, bao gåm n¨m
chuçi polypeptide β', β, σ, α vµ σ nèi víi nhau bëi c¸c liªn kÕt ho¸ häc yÕu. CÊu
tróc phøc t¹p nµy cã lÏ liªn quan ®Õn sù phøc t¹p vµ ®a d¹ng cña c¸c c¬ chÕ kiÓm
tra qu¸ tr×nh phiªn m·.
1.2.2. C¸c giai ®o¹n cña qu¸ tr×nh phiªn m·: Khëi ®Çu, kÐo dµi vµ kÕt thóc
H×nh 3.2. C¸c giai ®o¹n cña qu¸ tr×nh phiªn m· ë prokaryote
(a) giai ®o¹n RNA polymerase liªn kÕt víi promoter, (b) khëi ®Çu phiªn m·, (c) kÐo dµi, (d)
kÕt thóc phiªn m·
118
1.2.2.1. Giai ®o¹n khëi ®Çu
ë prokaryote, RNA polymerase thêng liªn kÕt víi mét tr×nh tù ®Æc biÖt gäi
lµ promoter, n»m gÇn vÞ trÝ b¾t ®Çu phiªn m·. Promoter lµ mét phÇn quan träng
cña vïng ®iÒu hßa gen. V× ë prokaryote chØ cã mét RNA polymerase liªn kÕt víi
c¸c tr×nh tù promoter cña c¸c gen kh¸c nhau, do ®ã kh«ng cã g× ®¸ng ng¹c nhiªn
khi cã sù t¬ng ®ång vÒ tr×nh tù cña c¸c promoter. Nh×n chung, c¸c promoter cã
hai vïng lín t¬ng tù nhau lµ vïng -35 vµ -10, v× chóng n»m ë phÝa cÆp tr×nh tù
cÆp base 35 vµ 10 ë phÝa thîng nguån c¸ch base ®Çu tiªn ®îc phiªn m·. Enzyme
RNA polymerase lµ mét holoenzyme liªn kÕt víi DNA ë vïng tr×nh tù nµy, sau
®ã th¸o xo¾n DNA vµ b¾t ®Çu phiªn m· RNA. Nh÷ng base ®îc phiªn m· ®Çu tiªn
lu«n ë cïng mét vÞ trÝ, gäi lµ vÞ trÝ +1, chó ý r»ng RNA ®îc b¾t ®Çu phiªn m· ë
tríc vïng m· hãa cho protein cña gen (thêng lµ tr×nh tù ATG, lµ n¬i b¾t ®Çu
dÞch m·), do ®ã b¶n phiªn m· nµy cã mét vïng gäi lµ vïng 5’ kh«ng dÞch m· (viÕt
t¾t lµ 5’ UTR – 5’ untranslated region).
Díi ®¬n vÞ σ liªn kÕt ®Æc hiÖu víi vïng -10 vµ -35, do ®ã nã ®Þnh vÞ
holoenzyme ®Ó khëi ®Çu phiªn m· chÝnh x¸c t¹i vÞ trÝ b¾t ®Çu phiªn m·. Ngoµi ra,
díi ®¬n vÞ σ còng ®ãng vai trß t¸ch sîi DNA ë vïng tr×nh tù -10. V× thÕ mµ lâi
enzyme cã thÓ liªn kÕt chÆt víi DNA ®Ó chuÈn bÞ tæng hîp RNA.
RNA polymerase nhËn biÕt tr×nh tù khëi ®Çu trªn sîi DNA (promoter), nhê
tiÓu ®¬n vÞ σ. NhiÒu thÝ nghiÖm cho thÊy nÕu thiÕu nh©n tè σ, RNA polymerase
sÏ b¾t ®Çu khëi ®Çu phiªn m· mét c¸ch tuú tiÖn trong khi víi sù hiÖn diÖn cña σ,
enzyme cã kh¶ n¨ng g¾n chuyªn biÖt vµo ®óng promoter. Nh©n tè σ nhËn biÕt
®îc promoter lµ nhê cÊu tróc ®Æc trng cña nã. §Æc ®iÓm cÊu tróc cña promoter
lµ hai tr×nh tù gåm 6 nucleotide, mét tr×nh tù n»m c¸ch ®iÓm vÞ trÝ b¾t ®Çu sinh
tæng hîp RNA 10 cÆp base (tr×nh tù -10), tr×nh tù kia c¸ch 35 cÆp base (tr×nh tù -
35).
RNA polymerase g¾n vµo promoter theo hai bíc: Tríc hÕt, enzyme nhËn
biÕt vµ g¾n mét c¸ch láng lÎo vµo tr×nh tù -35 h×nh thµnh mét phøc hîp "®ãng".
Sau ®ã, phøc hîp nµy chuyÓn thµnh phøc hîp "më", trong giai ®o¹n nµy mét vïng
DNA b¾t ®Çu tõ tr×nh tù -10 sÏ ®îc th¸o xo¾n vµ mét sîi ®¬n DNA ph¬i ra díi
d¹ng tù do lµm khu«n cho sù sinh tæng hîp RNA.
1.2.2.2. Giai ®o¹n kÐo dµi
Khi ph©n tö RNA ®¹t chiÒu dµi kho¶ng 8 nucleotide th× nh©n tè σ t¸ch khái
phøc hîp enzyme. Lóc bÊy giê σ l¹i cã thÓ g¾n vµo mét promoter kh¸c ®Ó khëi
119
®Çu mét qu¸ tr×nh phiªn m· míi. Sù t¸ch rêi cña nh©n tè σ cÇn thiÕt cho giai ®o¹n
kÐo dµi v× sù cã mÆt tiÕp tôc cña nã sÏ g¾n chÆt phøc hîp enzyme vµo promoter
khiÕn cho enzyme kh«ng thÓ trît dµi theo sîi khu«n DNA ®Ó tiÕn hµnh qu¸ tr×nh
sinh tæng hîp. Nh©n tè σ ®îc thay thÕ b»ng c¸c nh©n tè kÐo dµi (elongation
factors).
RNA polymerase th¸o xo¾n liªn tôc ph©n tö DNA trªn mét chiÒu dµi kho¶ng
17 nucleotide theo tiÕn triÓn cña qu¸ tr×nh sinh tæng hîp. Sîi RNA míi sÏ t¸ch
dÇn khái m¹ch khu«n DNA trõ mét ®o¹n dµi 12 nucleotide b¾t ®Çu tõ ®iÓm t¨ng
trëng vÉn liªn kÕt víi DNA. PhÇn DNA ®îc th¸o xo¾n sÏ ®îc RNA polymerase
xo¾n trë l¹i sau ®ã.
Khi RNA polymerase di chuyÓn däc theo khu«n DNA, nã th¸o xo¾n ë mét
®Çu vµ ®ãng xo¾n ë vïng DNA ®· ®îc phiªn m· (h×nh 3.2). Bªn trong bãng phiªn
m·, sîi khu«n ®îc lé ra, RNA polymerase ®iÒu khiÓn sù liªn kÕt cña c¸c
ribonucleotide tù do víi c¸c base kÕ tiÕp lé ra trªn khu«n DNA vµ nÕu nã b¾t cÆp
bæ sung víi khu«n th× nã ®îc thªm vµo chuçi. N¨ng lîng ®îc sö dông trong
trêng hîp nµy lµ qu¸ tr×nh ph©n c¾t n¨ng lîng liªn kÕt cao n¨ng cña ATP, kÕt
qu¶ gi¶i phãng ra mét phosphat h÷u c¬, theo c«ng thøc sau:
NTP + (NMP) n (NMP) n+1 + P i
Trong giai ®o¹n kÐo dµi, cã Ýt nhÊt 10 nucleotide ®îc thªm vµo chuçi RNA
h×nh thµnh nªn d¹ng lai RNA:DNA b»ng liªn kÕt bæ sung víi c¸c base cña khu«n
trong bãng phiªn m·.
1.2.2.3. Giai ®o¹n kÕt thóc
Qu¸ tr×nh phiªn m· cña tõng gen ®îc kÕt thóc ë phÝa bªn kia vïng m· hãa
cho protein cña gen, t¹o ra vïng 3’ kh«ng m· hãa (3’UTR – 3’ untranslated
region) t¹i ®u«i cña b¶n phiªn m· (RNA). Giai ®o¹n kÐo dµi tiÕp tôc cho tíi khi
RNA polymerase nhËn biÕt nh÷ng tr×nh tù nucleotide ®Æc biÖt, mµ nã ho¹t ®éng
nh lµ mét tÝn hiÖu kÕt thóc chuçi. Nh÷ng tÝn hiÖu nµy cho phÐp RNA polymerase
ngõng qu¸ tr×nh sinh tæng hîp, nh¶ sîi DNA khu«n ra vµ l¹i cã thÓ b¾t ®Çu ho¹t
®éng ë n¬i kh¸c. ë E.coli vµ c¸c vi khuÈn kh¸c cã hai c¬ chÕ chÝnh cho giai ®o¹n
kÕt thóc ®îc gäi lµ: giai ®o¹n kÕt thóc kh«ng phô thuéc Rho vµ giai ®o¹n kÕt thóc
phô thuéc Rho (ρ).
Giai ®o¹n kÕt thóc kh«ng phô thuéc ρ lµ giai ®o¹n kÕt thóc phiªn m· trùc
tiÕp. Tr×nh tù kÕt thóc kho¶ng 40bp, phÝa ®u«i giµu GC vµ theo sau lµ mét ®o¹n
tr×nh tù dµi kho¶ng 6bp (chøa toµn A). V× GC trªn khu«n sÏ t¹o ra tr×nh tù CG trªn
120
RNA vµ sù b¾t cÆp gi÷a C-G t¹o ra cÊu tróc kÑp tãc bÒn v÷ng (v× sù b¾t cÆp gi÷a
C-G æn ®Þnh h¬n gi÷a U-A). Theo sau cÊu tróc kÑp tãc lµ ®u«i kho¶ng 6U liªn kÕt
víi 6A trªn khu«n DNA.
B×nh thêng trong giai ®o¹n kÐo dµi RNA, RNA polymerase sÏ dõng l¹i nÕu
®o¹n lai RNA:DNA trong bãng phiªn m· liªn kÕt víi nhau yÕu vµ sÏ thay ®æi ®Ó
lµm æn ®Þnh ®o¹n lai. Trong c¬ chÕ nµy, RNA polymerase ®îc cho lµ bÞ dõng l¹i
sau khi ®· tæng hîp c¸c U (h×nh thµnh nªn ®o¹n lai RNA:DNA liªn kÕt yÕu) vµ sù
tiÕp xóc gi÷a cÊu tróc kÑp tãc víi RNA polymerase, ng¨n c¶n enzyme t¹o ra sù æn
®Þnh l¹i cho sîi lai. Rµo ch¾n nµy khiÕn cho RNA polymerase nh¶ sîi RNA míi
tæng hîp ra khái khu«n vµ kÕt thóc qu¸ tr×nh phiªn m·.
KiÓu kÕt thóc phiªn m· thø hai lµ giai ®o¹n kÕt thóc phô thuéc Rho (ρ): nh©n
tè ρ gióp cho RNA polymerase nhËn biÕt tÝn hiÖu kÕt thóc phiªn m·. C¸c RNA cã
tÝn hiÖu kÕt thóc phiªn m· phô thuéc nh©n tè ρ kh«ng b¾t buéc ph¶i cã ®u«i U ë
phÝa ®u«i RNA vµ thêng kh«ng cã vßng kÑp tãc. Thay v× ®ã, chóng cã mét tr×nh
tù kho¶ng 40 ®Õn 60bp giµu C vµ Ýt G n»m ë vïng thîng nguån (phÝa ®Çu 5’) cã
vÞ trÝ rut, lµ vÞ trÝ liªn kÕt víi nh©n tè ρ. Rho, lµ mét protein hexamer gåm 6 ®¬n
ph©n, cã kh¶ n¨ng liªn kÕt víi RNA míi tæng hîp t¹i vÞ trÝ rut. VÞ trÝ nµy n»m ë
phÝa ®Çu 5’ n¬i mµ RNA cã xu híng tæng hîp RNA chËm l¹i. Sau khi liªn kÕt,
nh©n tè ρ dÔ dµng gi¶i phãng sîi RNA ra khái bãng phiªn m·. Do ®ã, giai ®o¹n
kÕt thóc phiªn m· phô thuéc ρ ®îc t¹o ra do sù liªn kÕt cña ρ víi vÞ trÝ rut, ®Ó
ngõng qu¸ tr×nh phiªn m·, ρ gi¸n tiÕp t¸ch RNA ra khái RNA polymerase.
b
a H×nh 3.3. KÕt thóc phiªn m· kh«ng phô thuéc ρ (a), kÕt thóc phiªn m· phô thuéc ρ (b)
121
1.3. qu¸ tr×nh phiªn m· ë eukaryote
1.3.1. Qu¸ tr×nh phiªn m· ë eukaryote cã mét sè ®Æc ®iÓm kh¸c biÖt so
víi ë prokaryote
Nh chóng ta ®· häc ë ch¬ng 2, qu¸ tr×nh sao chÐp DNA ë eukaryote mÆc
dï rÊt phøc t¹p, nhng nh×n chung nã còng t¬ng tù nh qu¸ tr×nh sao chÐp DNA
ë prokaryote. Còng gièng nh vËy, qu¸ tr×nh phiªn m· ë eukaryote còng bao gåm
c¸c giai ®o¹n nh: khëi ®Çu, kÐo dµi vµ kÕt thóc nh ë prokaryote, nhng phøc t¹p
h¬n. Sù phøc t¹p cña qu¸ tr×nh phiªn m· ë eukaryote lµ do ba lÝ do sau:
LÝ do ®Çu tiªn lµ do bé gen cña eukaryote cã nhiÒu gen h¬n, vi khuÈn chØ cã
kho¶ng vµi ngµn gen cßn eukaryote cã kho¶ng hµng chôc ngµn gen. H¬n thÕ n÷a,
mËt ®é ph©n bè gen ë prokaryote cao h¬n ë eukaryote. VÝ dô nh ë E.coli mËt ®é
gen lµ 900gen/1triÖu cÆp base, trong khi ®ã ruåi giÊm chØ cã kho¶ng 110gen vµ
thËm chÝ ë ngêi cßn Ýt h¬n, chØ cã kho¶ng 9gen/1triÖu cÆp base. Do ®ã, mËt ®é
ph©n bè gen nµy lµm cho qu¸ tr×nh phiªn m·, ®Æc biÖt lµ giai ®o¹n khëi ®Çu phiªn
m· ë eukaryote lµ mét giai ®o¹n phøc t¹p h¬n ë prokaryote. V× thÕ ë eukaryote cã
mét sè ®Æc ®iÓm sau:
- §Çu tiªn chóng ph©n chia c«ng viÖc phiªn m· cho ba lo¹i RNA polymerase
kh¸c nhau: RNA polymerase lo¹i I cho c¸c RNA cña ribosome (ngo¹i trõ rRNA
5S). RNA polymerase lo¹i II phiªn m· cho tÊt c¶ c¸c gen m· hãa cho protein, b¶n
phiªn m· nã t¹o ran lµ c¸c RNA th«ng tin, bªn c¹nh ®ã nã cßn phiªn m· cho mét
sè RNA nhá cña nh©n. RNA polymerase lo¹i III dµnh cho c¸c RNA kÝch thíc
nhá nh c¸c RNA vËn chuyÓn, rRNA 5S vµ mét sè RNA nhá trong nh©n. Trong
ch¬ng nµy chóng ta chØ ®Ò cËp ®Õn RNA polymerase II.
- Thø hai chóng cÇn kÕt hîp nhiÒu protein ë promoter tríc khi RNA
polymerase cã thÓ b¾t ®Çu tæng hîp RNA. Mét sè protein nµy ®îc gäi lµ nh©n tè
phiªn m· chung (gäi t¾t lµ GTFs – general transcription factors), liªn kÕt víi
promoter tríc khi RNA polymerase II liªn kÕt víi promoter. Mét sè protein kh¸c
th× liªn kÕt víi promoter sau khi RNA polymerase II ®· liªn kÕt vµo. Vai trß cña
GTFs vµ sù t¬ng t¸c cña chóng víi RNA polymerase II sÏ ®îc m« t¶ ë phÇn
khëi ®Çu phiªn m· cña eukaryote.
LÝ do thø hai, sù kh¸c nhau râ rÖt gi÷a eukaryote vµ prokaryote lµ sù hiÖn
diÖn cña nh©n trong tÕ bµo eukaryote. RNA ®îc tæng hîp trong nh©n, n¬i mµ
DNA ®îc ®Þnh vÞ trong ®ã, vµ ph¶i ®îc biÕn ®æi tríc khi ®îc vËn chuyÓn ra
ngoµi tÕ bµo chÊt ®Ó dÞch m·. Sù biÕn ®æi nµy ®îc gäi lµ qu¸ tr×nh trëng thµnh
cña RNA. Nh b¹n sÏ thÊy ë phÇn sau, phÝa ®Çu 5’ ®îc biÕn ®æi trong khi phÝa
122
®Çu 3’ vÉn ®îc tiÕp tôc phiªn m· bëi RNA polymerase II. Bëi lý do nµy nªn RNA
polymerase II lµ mét ®a ph©n phøc t¹p h¬n nhiÒu so víi RNA polymerase cña
prokaryote. Sù kÕt hîp qu¸ tr×nh tæng hîp víi qu¸ tr×nh biÕn ®æi RNA cña RNA
polymerase II sÏ ®îc tr×nh bµy ë phÇn kÐo dµi phiªn m· cña eukaryote.
LÝ do cuèi cïng lµ khu«n cho qu¸ tr×nh phiªn m·, DNA trong nhiÔm s¾c thÓ,
®îc tæ chøc thµnh nhiÔm s¾c chÊt ë eukaryote, trong khi ë prokaryote DNA lµ
trÇn. Nh b¹n sÏ ®îc häc ë ch¬ng 4, cÊu tróc nhiÔm s¾c chÊt cã thÓ ng¨n c¶n sù
liªn kÕt gi÷a RNA polymerase víi khu«n DNA, ®©y lµ mét c¬ chÕ ®iÒu hßa biÓu
hiÖn gen rÊt tinh tÕ ë eukaryote. Tuy nhiªn ë ch¬ng nµy chóng ta chØ quan t©m
®Õn sù t¸c ®éng cña nhiÔm s¾c chÊt lªn kh¶ n¨ng khëi ®Çu phiªn m· cña RNA
polymerase II ngay sau khi nã ®îc kÕt hîp víi khu«n DNA.
H×nh 3.4. So s¸nh sù kh¸c nhau trong qu¸ tr×nh phiªn m· vµ dÞch m· ë prokaryote víi
eukaryote, sù phiªn m· vµ dÞch m· ë prokaryote x¶y ra ®ång thêi cßn ë eukaryote qu¸
tr×nh phiªn m· vµ dÞch m· kh¸c nhau vÒ kh«ng gian vµ thêi gian.
123
- Intron ®îc phiªn m· nhng bÞ lo¹i bá trong qu¸
tr×nh hoµn thiÖn sîi mRNA
- Exon ®îc phiªn m· vµ t¹o thµnh mRNA ë trong
nh©n vµ ®îc dÞch thµnh protein ë trong tÕ bµo chÊt
Vïng 3' Cha râ chøc n¨ng, cã mét gen vïng nµy mang tÝnh
®iÒu hoµ chuyªn biÖt
Tríc khi ph©n tÝch qu¸ tr×nh phiªn m· ë eukaryote, chóng ta h·y xem xÐt
cÊu tróc mét gen m· ho¸ cho mét protein (gen ®îc phiªn m· thµnh mRNA). CÊu
tróc nµy kh«ng mang tÝnh ®¹i diÖn tuyÖt ®èi nhng lµ cÊu tróc thêng gÆp nhÊt.
Trong cÊu tróc nµy, gen bao gåm ba vïng: (1) vïng 5' lµ vïng mang c¸c tr×nh tù
®iÒu hoµ biÓu hiÖn cña gen vµ c¸c tr×nh tù ho¹t ho¸ sù phiªn m·, (2) vïng ®îc
phiªn m· bao gåm c¸c intron vµ exon; exon lµ tr×nh tù cã mÆt trong mRNA ë tÕ
bµo chÊt, thêng t¬ng øng víi phÇn m· ho¸ cña gen sÏ ®îc dÞch m· thµnh
protein, intron lµ tr×nh tù ®îc phiªn m· nhng sÏ bÞ lo¹i bá trong qu¸ tr×nh trëng
thµnh cña mRNA, kh«ng cã mÆt trong mRNA tÕ bµo chÊt, (3) vïng 3' cã chøc
n¨ng cha râ, ë mét sè gen vïng nµy mang c¸c tr×nh tù ®iÒu hoµ chuyªn biÖt. Vïng
5' vµ 3' kh«ng ®îc phiªn m·.
Mét ®Æc ®iÓm cña c¸c mRNA ë eukaryote lµ mçi mRNA m· ho¸ cho mét
chuçi polypeptide (monocistronic) trong khi ë prokaryote mçi mRNA m· ho¸ cho
nhiÒu chuçi polypeptide (polycistronic).
1.3.2. C¸c giai ®o¹n cña qu¸ tr×nh phiªn m· ë eukaryote
1.3.2.1. Giai ®o¹n khëi ®Çu
Nh ë phÇn trªn giai ®o¹n khëi ®Çu phiªn m· cña prokaryote x¶y ra khi díi
®¬n vÞ σ cña holoenzyme RNA polymerase nhËn biÕt vïng tr×nh tù -10 vµ -35 cña
promoter. Sau ®ã sù phiªn m· b¾t ®Çu, díi ®¬n vÞ σ t¸ch ra vµ lâi enzyme tiÕp tôc
tæng hîp RNA bªn trong bãng phiªn m·, di chuyÓn däc theo khu«n DNA. T¬ng
tù nh vËy ë eukaryote, lâi enzyme RNA polymerase II còng kh«ng thÓ tù nhËn
biÕt tr×nh tù promoter. Tuy nhiªn, kh«ng gièng nh ë vi khuÈn, nh©n tè σ lµ mét
cÊu phÇn cña holoenzyme polymerase, c¸c nh©n tè phiªn m· chung (GTFs) chØ
®îc cÇn ®Ó liªn kÕt víi c¸c vïng cña promoter tríc khi nã liªn kÕt víi lâi
enzyme.
Sù khëi ®Çu phiªn m· ë eukaryote cã mét sè ®Æc ®iÓm lµm cho ta liªn tëng
®Õn sù khëi ®Çu sao chÐp DNA, t¹i ®iÓm khëi ®Çu sao chÐp cã mét sè protein
(DnaA ë E.coli, ORC ë nÊm men) lµ chÊt ®Çu tiªn nhËn biÕt vµ g¾n vµo ®iÓm khëi
124
®Çu sao chÐp. C¸c protein nµy t¹o ra sù kÕt hîp gi÷a c¸c protein sao chÐp, bao gåm
c¶ DNA polymerase III, th«ng qua t¬ng t¸c protein-protein, t¬ng tù nh vËy, ë
giai ®o¹n khëi ®Çu phiªn m·, GTFs còng t¸c ®éng lªn lâi enzyme vµ ®Þnh vÞ nã
vµo vÞ trÝ ®óng ®Ó b¾t ®Çu phiªn m·. GTFs bao gåm c¸c protein nh TFII A , TFII B ,
... (TFII- Transcription factor for RNA polymerase II, lµ kÝ hiÖu t¾t cña nh©n tè
phiªn m· cña RNA polymerase II).
GTFs vµ lâi RNA polymerase II kÕt hîp víi nhau t¹o thµnh phøc hîp tiÒn
khëi ®Çu. Phøc hîp nµy t¬ng ®èi lín, nã cã chøa 6 nh©n tè phiªn m· chung, mçi
nh©n tè lµ mét phøc hîp protein ®a ph©n, céng thªm lâi RNA polymerase II ®îc
t¹o thµnh bëi kho¶ng mét t¸ díi ®¬n vÞ. Tr×nh tù c¸c amino acid cña mét sè díi
®¬n vÞ ®îc b¶o tån tõ nÊm men cho ®Õn ngêi. Gièng nh promoter ë prokaryote,
promoter cña eukaryote còng ®îc ®Þnh vÞ ë c¹nh 5’ cña vÞ trÝ b¾t ®Çu phiªn m·.
Sù kÐo th¼ng cña vïng promoter ®Ó lé ra tr×nh tù TATA thêng ®îc ®Þnh vÞ ë vÞ
trÝ -30 (30bp) tõ vÞ trÝ b¾t ®Çu phiªn m· (h×nh 3.5). Tr×nh tù nµy ®îc gäi lµ hép
TATA.
H×nh 3.5. Giai ®o¹n khëi ®Çu phiªn m· cña RNA polymerase II ë eukaryote
125
T¹i hép TATA x¶y ra sù kiÖn ®Çu tiªn cña qu¸ tr×nh phiªn m· ®ã lµ: sù liªn
kÕt cña protein liªn kÕt víi hép TATA (®îc viÕt t¾t lµ TBP - TATA binding
protein), lµ mét phÇn cña phøc TFII D (mét trong 6 GTFs), víi hép TATA. Khi
TBP liªn kÕt víi hép TATA, nã kÕt hîp c¸c GTFs kh¸c vµ lâi RNA polymerase II
víi promoter, do ®ã h×nh thµnh nªn phøc hîp tiÒn khëi ®Çu. Sau ®ã, sù phiªn m·
®îc b¾t ®Çu, RNA polymerase II t¸ch khái hÇu hÕt c¸c GTFs ®Ó kÐo dµi b¶n phiªn
m·, lµ tiÒn th©n cña RNA. Mét sè GTFs vÉn cßn ë promoter ®Ó tiÕp tôc kÕt hîp
víi lâi RNA polymerase II kÕ tiÕp, theo c¸ch nµy, nhiÒu RNA polymerase II cã
thÓ tæng hîp nhiÒu b¶n phiªn m· tõ mét gen t¹i cïng mét thêi ®iÓm.
MÆc dï chi tiÕt cña giai ®o¹n khëi ®Çu nµy vÉn cha ®îc lµm s¸ng tá, nhng
cã mét chi tiÕt quan träng ®· ®îc kh¸m ph¸, ®ã lµ mét ®u«i cña díi ®¬n vÞ β
cña RNA polymerase II, ®îc gäi lµ vïng ®u«i carboxyl (viÕt t¾t lµ CTD –
Carboxyl tail domain), tham gia vµo sù khëi ®Çu vµ mét sè pha quan träng kh¸c
cña qu¸ tr×nh phiªn m·. §u«i CTD ®îc ®Þnh vÞ gÇn vÞ trÝ mµ RNA míi ®îc tæng
hîp sÏ thß ra khái bãng phiªn m·.
Giai ®o¹n khëi ®Çu kÕt thóc vµ giai ®o¹n kÐo dµi ®îc b¾t ®Çu khi ®u«i CTD
®îc phosphoryl hãa bëi mét GTFs. Sù phosphoryl hãa nµy ®îc cho lµ b»ng c¸ch
nµo ®ã lµm yÕu ®i mèi liªn kÕt cña RNA polymerase II víi mét sè protein cña
phøc hîp tiÒn khëi ®Çu vµ cho phÐp kÐo dµi phiªn m·.
1.3.2.2. Giai ®o¹n kÐo dµi
Giai ®o¹n kÐo dµi phiªn m· x¶y ra trong bãng phiªn m· gièng nh giai ®o¹n
kÐo dµi phiªn m· ë prokaryote. Tuy nhiªn, RNA míi ®îc tæng hîp cã nhiÒu ®iÓm
kh¸c biÖt so víi RNA míi ®îc t¹o ra ë prokaryote. ë prokaryote, qu¸ tr×nh dÞch
m· b¾t ®Çu ë ®Çu 5’ cña RNA míi ®îc t¹o ra, trong khi ë phÝa ®Çu 3’ vÉn tiÕp tôc
phiªn m·, qu¸ tr×nh dÞch m· sÏ ®îc m« t¶ chi tiÕt ë phÇn sau cña ch¬ng. Ngîc
l¹i, RNA ë eukaryote ph¶i tr¶i qua c¸c qu¸ tr×nh biÕn ®æi tríc khi nã ®îc dÞch
m·. Qu¸ tr×nh nµy bao gåm: (1) g¾n mò ë ®Çu 5’, (2) thªm chuçi poly A ë ®Çu 3’
vµ (3) c¾t vµ lo¹i bá c¸c intron.
Gièng nh qu¸ tr×nh sao chÐp DNA, qu¸ tr×nh tæng hîp vµ biÕn ®æi tiÒn
mRNA thµnh mRNA cÇn tr¶i qua nhiÒu bíc mét c¸ch nhanh chãng vµ chÝnh x¸c.
Tríc ®©y hÇu hÕt c¸c qu¸ tr×nh biÕn ®æi ®îc cho lµ x¶y ra sau khi RNA ®îc
phiªn m· xong, qu¸ tr×nh nµy ®îc gäi lµ qu¸ tr×nh biÕn ®æi sau phiªn m·. Nhng
nhiÒu b»ng chøng thùc nghiÖm ®· chØ ra r»ng qu¸ tr×nh biÕn ®æi nµy thùc sù diÔn
ra trong suèt qu¸ tr×nh phiªn m· vµ nã ®îc gäi lµ qu¸ tr×nh ®ång phiªn m· (h×nh
3.6). Do ®ã, phÇn RNA míi ®îc phiªn m· ph¶i tr¶i qua qu¸ tr×nh biÕn ®æi ngay
126
sau khi nã thß ra khái bãng phiªn m·. §u«i CTD cña RNA polymerase II ®ãng
vai trß trung t©m trong viÖc kÕt hîp víi tÊt c¶ nh÷ng sù kiÖn cña qu¸ tr×nh biÕn
®æi. §u«i CTD ®îc cÊu t¹o bëi tr×nh tù lÆp l¹i nhiÒu lÇn cña 7 amino acid. Sù lÆp
l¹i nµy gióp cho nã t¹o ra vÞ trÝ liªn kÕt víi mét sè protein vµ mét sè enzyme mµ
nã cÇn cho viÖc g¾n mò chôp, c¾t nèi vµ thªm ®u«i poly A.
§u«i CTD ®îc ®Þnh vÞ gÇn vÞ trÝ n¬i mµ RNA míi ®îc t¹o ra thß ra khái
bãng phiªn m·, v× thÕ nã trë thµnh n¬i lý tëng ®Ó tæ chøc liªn kÕt vµ gi¶i phãng
c¸c protein cÇn thiÕt cho qu¸ tr×nh biÕn ®æi RNA míi sinh, trong khi RNA vÉn
®îc tiÕp tôc tæng hîp. ë c¸c giai ®o¹n kh¸c nhau cña qu¸ tr×nh phiªn m·, c¸c
amino acid cña ®u«i CTD biÕn ®æi thuËn nghÞch – thêng lµ qu¸ tr×nh thªm vµo
vµ mÊt ®i cña c¸c nhãm phosphate (gäi lµ qu¸ tr×nh phosphoryl hãa vµ
dephosphoryl hãa t¬ng øng). Tr¹ng th¸i phosphoryl hãa cña ®u«i CTD, nã cã thÓ
liªn kÕt víi c¸c protein cña qu¸ tr×nh biÕn ®æi RNA. Do ®ã theo c¸ch nµy, ®u«i
CTD cã thÓ thùc hiÖn c¸c ph¶n øng biÕn ®æi RNA ngay khi nã võa lã ra khái bãng
phiªn m·, qu¸ tr×nh nµy ®îc m« t¶ nh ë h×nh 3.6.
Qu¸ tr×nh g¾n mò chôp (capping): lµ bíc ®Çu tiªn, ngay khi RNA míi
®îc tæng hîp thß ra khái bãng phiªn m·, mét cÊu tróc ®Æc biÖt gäi lµ mò ®îc
thªm vµo ë ®Çu 5’ bëi mét sè protein t¬ng t¸c víi ®u«i CTD. Mò cã chøa gèc 7-
methyl guanine ®îc g¾n vµo ®Çu 5' cña mRNA nhê liªn kÕt 5'-5' triphosphate.
"Mò chôp" lµ tèi cÇn thiÕt cho qu¸ tr×nh dÞch m· sau nµy. Mò cã hai chøc n¨ng
chÝnh: thø nhÊt lµ b¶o vÖ RNA kh«ng bÞ ph©n hñy lµ bíc quan träng ®Ó kÐo dµi
hµnh tr×nh cña RNA tríc khi nã ®îc dÞch m·. Thø hai, b¹n sÏ thÊy ë phÇn dÞch
m·, mò cÇn cho qu¸ tr×nh dÞch m· mRNA.
Qu¸ tr×nh thªm ®u«i poly A: Giai ®o¹n kÐo dµi tiÕp tôc cho ®Õn khi RNA
polymerase II gÆp tr×nh tù b¶o tån lµ AAUAAA hoÆc AUUAAA gÇn ®Çu 3’.
127
mRNA bÞ c¾t kho¶ng 20 nucleotide n»m tríc mét tr×nh tù nµy bëi mét enzyme,
®©y chÝnh lµ tr×nh tù nhËn biÕt cho ph¶n øng c¾t. Sau ®ã, mét enzyme cã trong
nh©n - polyA polymerase sÏ g¾n mét sè lîng adenine nhÊt ®Þnh (kho¶ng 250 ë
®éng vËt cã vó, 100 ë eukaryote bËc thÊp) vµo ®Çu 3' cña mRNA ë eukaryote trõ
c¸c mRNA cña histone ®Òu cã g¾n ®u«i polyA. Do ®ã, tr×nh tù AAUAAA cña
vïng m· hãa cho protein ®îc gäi lµ tÝn hiÖu poly A.
Mét protein, PABP (polyA binding protein-protein liªn kÕt víi polyA) sÏ g¾n
vµo ®u«i polyA. Protein nµy cÇn thiÕt cho sù sèng cßn vµ sinh trëng cña tÕ bµo.
§u«i polyA kÕt hîp víi PABP cã vai trß trong sù æn ®Þnh c¸c mRNA vµ viÖc khëi
sù dÞch m·.
§Õn giai ®o¹n nµy, tiÒn mRNA ®· ®îc h×nh thµnh, nhng ®Ó chuyÓn thµnh
d¹ng ho¹t ®éng, ph©n tö nµy cßn ph¶i tr¶i qua mét bíc biÕn ®æi míi: qu¸ tr×nh
c¾t nèi.
Qu¸ tr×nh c¾t nèi (splicing)
PhÇn lín c¸c gen cña eukaryote ®Òu cã chøa c¸c intron, lµ c¸c ®o¹n vÉn cha
râ chøc n¨ng, kh«ng m· hãa cho polypeptide. C¸c intron kh«ng nh÷ng cã mÆt
trong gen m· hãa cho protein cßn cã trong c¸c gen m· hãa cho c¸c rRNA, thËm
chÝ cßn cã trong c¶ c¸c gen tRNA. C¸c intron bÞ lo¹i bá khái b¶n phiªn m· ban
®Çu, trong khi nã vÉn ®îc tiÕp tôc tæng hîp vµ sau khi mò chôp ®îc g¾n vµo
®Çu 5’, nhng bíc c¾t nèi nµy ph¶i x¶y ra tríc khi b¶n phiªn m· ®îc vËn
chuyÓn vµo tÕ bµo chÊt. ViÖc lo¹i bá c¸c intron vµ nèi c¸c exon ®îc gäi lµ qu¸
tr×nh c¾t nèi. V× qu¸ tr×nh nµy gièng víi c¸ch c¾t nèi phim, cã thÓ c¾t nèi ®Ó t¹o
ra mét ®o¹n cã hiÖu øng ®Æc biÖt, ®iÒu nµy ®Æc biÖt gièng víi qu¸ tr×nh c¾t nèi
kh¸c biÖt ®Ó t¹o ra nh÷ng mRNA m· hãa cho c¸c protein chuyªn biÖt cho tõng
128
m«, tÕ bµo. ViÖc c¾t nèi mang c¸c ®o¹n exon l¹i gÇn nhau, kÕt qu¶ t¹o ra mRNA
chøa mét vïng m· hãa lµ mét ®êng th¼ng liªn tôc m· hãa cho protein.
H×nh 3.7. Qu¸ tr×nh c¾t nèi exon-intron víi sù tham gian cña c¸c phÇn tö ghÐp nèi
C¬ chÕ c¾t nèi: §©y lµ qu¸ tr×nh lo¹i bá c¸c intron vµ nèi c¸c exon l¹i víi
nhau, ë h×nh 3.7 cho thÊy sù c¾t intron vµ nèi exon cña tiÒn mRNA. Trong qu¸
tr×nh nµy, cã ba tr×nh tù n»m trong intron ®ãng vai trß quan träng: tr×nh tù "cho"
GU ë ®Çu 5' cña intron, tr×nh tù "tÏ nh¸nh" giµu c¸c base pyrimidine bao quanh
mét A ë gÇn ®Çu 3' vµ tr×nh tù "nhËn" AG ë ®Çu 3'.T¹i nh÷ng ®iÓm nèi, cã c¸c
nucleotide ®Æc biÖt hiÖn diÖn trong gen vµ c¸c loµi lµ gièng nhau, chóng ®îc b¶o
tån v× nã ®Æc trng cho c¸c ph¶n øng c¾t nèi. Mçi intron sÏ bÞ c¾t ë mçi ®Çu, c¸c
®Çu cho nµy hÇu hÕt ®Òu cã chøa GU ë ®Çu 5’, ®Çu nhËn lµ AG ë ®Çu 3’ (gäi lµ
quy luËt GU-AG) vµ mét vÞ trÝ kh«ng ®æi kh¸c (lµ tr×nh tù tÏ nh¸nh) n»m ë gi÷a
kho¶ng c¸ch 15 ®Õn 45 base ngîc dßng tõ vÞ trÝ c¾t nèi 3’. T¹i gèc nµy x¶y ra
mét ph¶n øng trung gian cÇn thiÕt cho viÖc lo¹i bá intron, mÆt kh¸c c¸c nucleotide
Ýt ®îc b¶o tån ®îc t×m thÊy ë phÝa cña c¸c tr×nh tù ®îc b¶o tån cao. C¸c
nucleotide ®îc b¶o tån nµy trong b¶n phiªn m· ®îc nhËn biÕt bëi c¸c tiÓu phÇn
riboprotein nhá cña nh©n (snRNPs) lµ mét d¹ng protein phøc hîp víi c¸c RNA
nhá cña nh©n. Mét ®¬n vÞ chøc n¨ng c¾t nèi gäi lµ thÓ c¾t nèi. Hîp phÇn nµy liªn
kÕt víi ®u«i CTD vµ tÊn c«ng vµo c¸c tr×nh tù intron vµ exon nh h×nh 3.7, gióp
cho viÖc l¾p ghÐp c¸c vÞ trÝ c¾t nèi b»ng c¸ch h×nh thµnh liªn kÕt hydro víi c¸c
tr×nh tù b¶o tån cña intron. TiÕp theo, thÓ c¾t nèi xóc t¸c viÖc lo¹i bá intron qua
hai bíc c¾t nèi liªn tôc gäi lµ bíc 1 vµ 2 (nh trªn h×nh 3.7). Bíc 1 tÊn c«ng
129
vµo mét ®Çu cña intron t¹i tr×nh tù Adenine ®îc b¶o tån trong intron ®Ó h×nh
thµnh nªn mét cÊu tróc gièng nh d©y thßng läng. Bíc 2 gi¶i phãng d©y thßng
läng vµ nèi hai ®Çu exon liÒn kÒ nhau. mRNA trëng thµnh sÏ ®i ra tÕ bµo chÊt
qua c¸c lç trªn mµng nh©n ®Ó tham gia vµo qu¸ tr×nh dÞch m·.
Ph¶n øng tù c¾t nèi c¸c intron: Mét trêng hîp kú l¹ cña sù tù c¾t nèi
RNA dÉn tíi sù kh¸m ph¸ ra vai trß cña RNA. N¨m 1981, Cech vµ céng sù ®·
ph¸t hiÖn thÊy b¶n phiªn m· ban ®Çu cña rRNA ë ®éng vËt nguyªn sinh
Tetrahymena cã thÓ tù c¾t bá mét intron dµi 413 nucleotide, mµ kh«ng cÇn thªm
bÊt cø mét protein nµo kh¸c. TiÕp theo sau ®ã, c¸c intron kh¸c còng cho thÊy cã
nh÷ng ®Æc tÝnh t¬ng tù, ®îc gäi lµ c¸c intron tù c¾t nèi. Sù kh¸m ph¸ cña Cech
®· cho thÊy sù khai ph¸ míi trong lÜnh vùc sinh häc, v× nã ®¸nh dÊu lÇn ®Çu tiªn
mét ph¶n øng sinh häc kh«ng ph¶i do protein xóc t¸c. Sù kh¸m ph¸ nµy ®· ®Æt nÒn
t¶ng cho thuyÕt thÕ giíi RNA, theo thuyÕt nµy cho r»ng vËt chÊt di truyÒn cña tÕ
bµo ®Çu tiªn lµ RNA. V× chØ cã RNA míi cã c¶ hai thuéc tÝnh: m· hãa cho th«ng
tin di truyÒn vµ xóc t¸c cho c¸c ph¶n øng sinh häc.
Sù kh¸m ph¸ ra c¸c intron tù c¾t nèi ®· dÉn tíi mét thÝ nghiÖm chøng minh
l¹i vai trß cña c¸c snRNA (RNA nhá cña nh©n) trong thÓ c¾t nèi. Tõ c¸c thÝ nghiÖm
®ã ®· chøng minh ®îc r»ng chÝnh c¸c snRNA ®ãng vai trß chÝnh trong qu¸ tr×nh
c¾t nèi vµ c¸c rRNA trong ribosome ®ãng vai trß trung t©m trong qu¸ tr×nh dÞch
m· (®iÒu nµy chóng ta sÏ ®îc häc ë phÇn dÞch m·).
1.3.2.3. Giai ®o¹n kÕt thóc
C¸c hiÓu biÕt vÒ giai ®o¹n nµy cßn rÊt h¹n chÕ. Sù phiªn m· kÕt thóc tríc
®iÓm g¾n ®u«i poly A rÊt xa. Sù kÕt thóc phiªn m· cã liªn quan ®Õn nh÷ng cÊu
tróc d¹ng "kÑp tãc" tiÕp ngay sau lµ mét tr×nh tù giµu GC.
1.3.2.3. Sù hoµn thiÖn RNA ribosome
ë tÕ bµo eukaryote sau khi phiªn m· t¹o thµnh preribosome RNA 45S. Ph©n
tö nµy ®îc methyl ho¸ tíi h¬n 100 nhãm t¹o ra c¸c rRNA 18S, 5,8S, vµ 28S. C¸c
rRNA nµy sÏ ghÐp l¹i víi nhau t¹o nªn cÊu tróc bËc 4 phøc t¹p. PhÇn c¸c nucleotide
kh«ng ®îc methyl ho¸ sÏ bÞ ph©n huû. ë tÕ bµo prokaryote preribosome RNA lµ
RNA 30S. Ph©n tö nµy ®îc methyl ho¸ mét sè base vµ t¹o nªn rRNA 16S, 23S,
5S vµ tRNA, phÇn kh«ng methyl ho¸ còng bÞ thuû ph©n ®Ó lo¹i bá.
130
CHƯƠNG 4. QUÁ TRÌNH DỊCH MÃ
Theo thuyÕt trung t©m cña sinh häc ph©n tö, qu¸ tr×nh dÞch m· lµ bíc cuèi
cïng cña con ®êng truyÒn th«ng tin, dÞch m· lµ qu¸ tr×nh tæng hîp polypeptide
theo tr×nh tù cña mRNA.
RNA th«ng tin chØ lµ giai ®o¹n trung gian gi÷a DNA vµ protein. ë eukaryote,
mRNA gióp chuyÓn th«ng tin m· ho¸ trªn DNA n»m trong nh©n ra ®Õn bé m¸y
dÞch m· t¹o protein ngoµi tÕ bµo chÊt. Nhng vai trß cña mRNA kh«ng chØ dõng
ë ®ã; sù phiªn m· cßn cho phÐp tæng hîp nhiÒu b¶n sao mRNA tõ mét gen. Mçi
b¶n sao sÏ ®îc dÞch m· thµnh mét ph©n tö protein. Nh vËy, th«ng tin cña mét
gen duy nhÊt sÏ ®îc khuÕch ®¹i thµnh mét sè lîng lín ph©n tö protein. Ngoµi
ra, ë ch¬ng sau, chóng ta sÏ thÊy r»ng sù tån t¹i cña giai ®o¹n phiªn m· tæng hîp
mRNA cßn cho phÐp më réng kh¶ n¨ng ®iÒu hoµ sù biÓu hiÖn cña gen.
Qu¸ tr×nh sinh tæng hîp protein còng nh qu¸ tr×nh sinh tæng hîp nucleic
acid (DNA vµ RNA) tu©n theo mét sè nguyªn t¾c chung:
- C¸c protein vµ nucleic acid ®Òu ®îc h×nh thµnh tõ mét sè lîng giíi h¹n
c¸c ®¬n vÞ c¬ b¶n kh¸c nhau. C¸c ®¬n vÞ c¬ b¶n kh¸c nhau ë nucleic acid lµ bèn
lo¹i base (A, T (U ë RNA), G, C) cßn ë protein ®ã lµ 20 lo¹i amino acid.
- C¶ hai nhãm ®¹i ph©n tö sinh häc nµy ®Òu ®îc h×nh thµnh do sù kÕt nèi
dÇn dÇn c¸c ®¬n vÞ thµnh phÇn, c¸i nä sau c¸i kia.
- Sù sinh tæng hîp b¾t ®Çu t¹i mét ®iÓm nhÊt ®Þnh, kÐo dµi theo mét híng
duy nhÊt vµ kÕt thóc còng t¹i mét ®iÓm nhÊt ®Þnh. C¬ chÕ nµy ®ßi hái mét dÊu hiÖu
b¾t ®Çu vµ mét dÊu hiÖu kÕt thóc.
Tuy nhiªn, qu¸ tr×nh dÞch m· (sinh tæng hîp protein) phøc t¹p h¬n nhiÒu so
víi sù sao chÐp vµ phiªn m· (sinh tæng hîp DNA vµ RNA). Së dÜ nh vËy lµ v×,
nh ta ®· thÊy ë phÇn tríc, c¬ chÕ cña sù sao chÐp hay phiªn m· chñ yÕu dùa vµo
¸i lùc gi÷a c¸c base thµnh phÇn cÊu t¹o ph©n tö míi víi c¸c base cña khu«n, biÓu
hiÖn qua c¸c liªn kÕt hydro gi÷a chóng. Cßn trong qu¸ tr×nh dÞch m·, c¸c amino
acid nèi kÕt víi nhau theo khu«n RNA nhng chóng l¹i hoµn toµn kh«ng cã ¸i lùc
víi ph©n tö RNA. Kh«ng nh÷ng thÕ, nhiÒu nh¸nh bªn cña c¸c amino acid cßn bÞ
®Èy bëi nhiÒu nhãm cña c¸c base. Do ®ã, trong sù sinh tæng hîp protein, ngoµi
khu«n mRNA vµ c¸c ®¬n vÞ thµnh phÇn cÊu t¹o nªn ph©n tö míi (c¸c amino acid),
cßn cÇn sù hiÖn diÖn cña nh÷ng nh©n tè tiÕp hîp (adaptor). C¸c nh©n tè tiÕp hîp
nµy lµm vËt trung gian gióp cho amino acid kh«ng ph¶i tiÕp xóc víi khu«n RNA,
®ã chÝnh lµ c¸c RNA vËn chuyÓn (tRNA). Qu¸ tr×nh dÞch m· ®îc tiÕn hµnh theo
mét c¬ chÕ chung cho tÊt c¶ c¸c lo¹i tÕ bµo.
131
2.1. vai trß cña ba lo¹i rna (mRNA, tRNA vµ rRNA) trong
qu¸ tr×nh dÞch m·
2.1.1. mRNA vµ m· di truyÒn
Mçi ph©n tö mRNA mang th«ng tin di truyÒn x¸c ®Þnh tr×nh tù cña mét
polypeptide. Th«ng tin nµy ®îc chÐp tõ ph©n tö DNA sang ph©n tö mRNA trong
qu¸ tr×nh phiªn m·.
Nh ta ®· biÕt, DNA vµ RNA ®îc cÊu t¹o tõ 4 lo¹i nucleotide trong khi
protein ®îc h×nh thµnh tõ 20 lo¹i amino acid kh¸c nhau. Nh vËy, th«ng tin di
truyÒn m· ho¸ trong DNA vµ RNA díi d¹ng tæ hîp cña bèn lo¹i nucleotide cÇn
®îc gi¶i m· thµnh 20 lo¹i amino acid cÊu thµnh protein. NÕu tÕ bµo sö dông tæ
hîp 2 nucleotide ®Ó m· ho¸ cho mét amino acid th× chØ t¹o ®îc (42)=16 m·, con
sè nµy nhá h¬n nhu cÇu thùc tÕ. Cßn nÕu sö dông ba nucleotide ®Ó m· ho¸ cho
mét amino acid th× sè lîng m· cã thÓ t¨ng lªn ®Õn (43) = 64. C¸c c«ng tr×nh
nghiªn cøu nh÷ng n¨m 60 ®· thiÕt lËp ®îc hÖ thèng t¬ng øng gi÷a mét tæ hîp
nucleotide víi mét amino acid; hÖ thèng nµy cã tªn lµ m· di truyÒn. Trong bé m·
di truyÒn, mét m· t¬ng øng víi mét bé ba nucleotide vµ ®îc gäi lµ codon.
V× sè lîng codon lín h¬n nhiÒu so víi sè lîng c¸c amino acid nªn vÊn ®Ò
®Æt ra lµ c¸c codon nµy ®îc sö dông nh thÕ nµo? N¨m 1961, c¸c nhµ khoa häc
®· chng minh ®îc r»ng m· di truyÒn lµ m· kh«ng chång lÊp vµ cã tÝnh "suy
tho¸i" (degenerated), nghÜa lµ mét amino acid cã thÓ ®îc m· ho¸ bëi nhiÒu codon
kh¸c nhau. TÝnh suy tho¸i cña m· di truyÒn cã ý nghÜa tÝch cùc ®èi víi sù sèng
cßn cña tÕ bµo. ThËt vËy trong mét sè trêng hîp, dï codon cã mét nucleotide
thay ®æi (do ®ét biÕn ®iÓm) th× amino acid do nã m· ho¸ còng kh«ng bÞ biÕn ®æi
vµ protein cã mang amino acid nµy vÉn gi÷ ®îc cÊu tróc vµ chøc n¨ng nguyªn
vÑn. Trong thùc tÕ, sè lîng codon m· ho¸ cho mét amino acid cµng nhiÒu khi
amino acid ®ã cµng xuÊt hiÖn thêng xuyªn trong thµnh phÇn c¸c protein. Ngoµi
c¸c codon m· ho¸ lÆp l¹i, mét sè codon kh«ng m· ho¸ cho protein mµ nã ®ãng vai
trß "dÊu chÊm c©u" - codon AUG lµ dÊu hiÖu b¾t ®Çu dÞch m·, cßn UAA, UGA,
UAG lµ c¸c dÊu hiÖu kÕt thóc. M· di truyÒn cã tÝnh "phæ qu¸t" (universal) cho
toµn bé sinh giíi trõ vµi codon sai kh¸c kh«ng ®¸ng kÓ ë vµi ®éng vËt nguyªn sinh.
Codon AUG võa lµ dÊu hiÖu b¾t ®Çu dÞch m· võa m· ho¸ cho methionin; do ®ã,
tÊt c¶ c¸c chuçi protein ë prokaryote vµ eukaryote ®Òu b¾t ®Çu b»ng amino acid
®ã.
132
Nãi tãm l¹i m· di truyÒn cã c¸c ®Æc tÝnh sau: ba base m· hãa cho mét amino
acid ®îc gäi lµ m· bé ba, m· kh«ng chång lÊp, cã tÝnh tho¸i hãa vµ ®îc ®äc liªn
tôc tõ mét ®iÓm khëi ®Çu ë ®Çu 5’ ®Õn ®iÓm kÕt thóc ë ®Çu 3’ cña tr×nh tù m· hãa.
♣ Gi¶i m· di truyÒn
BiÕt ®îc bé ba nucleotide x¸c ®Þnh mét amino acid vµ ph¶i ®i liÒn nhau theo
mét híng cha ®ñ, mµ cßn ph¶i biÕt bé ba nucleotide nµo x¸c ®Þnh amino acid
nµo.
C«ng viÖc nµy ®îc hoµn thµnh nhê vµo thµnh tùu cña Ochoa (1955) chiÕt
xuÊt ®îc enzyme polynucleotide phosphorylase tõ vi khuÈn nªn ®· gióp
M.Nirenberg vµ Mathae (1961) dïng enzyme nµy tæng hîp ®îc mRNA toµn
polyU trong èng nghiÖm. VÒ sau M. Nirenberg ®· sö dông mét hÖ thèng tæng hîp
v« bµo (kh«ng cã cÊu tróc tÕ bµo) ®Ó gi¶i m· di truyÒn (h×nh 3.8). HÖ thèng ®ã lµ
dÞch chiÕt tÕ bµo E.coli cã chøa c¸c ribosome, c¸c tRNA, c¸c enzyme aminoacyl
synthetase, mRNA, c¸c amino acid vµ mét sè phô gia kh¸c. Trong hÖ thèng v«
bµo c¸c amino acid cã thÓ dÝnh l¹i víi nhau ®Ó t¹o thµnh protein. Ph¶n øng nµy chØ
diÔn ra trong vßng vµi phót råi dõng l¹i, nhng nÕu bæ sung thªm mRNA míi th×
viÖc tæng hîp protein l¹i tiÕp diÔn.
H×nh 3.8. ThÝ nghiÖm gi¶i m· di truyÒn cña Marshall Nirenber vµ céng sù
Ph¶n øng nµy lµ mét ph¸t minh cùc k× quan träng, v× sau khi mRNA tù nhiªn
cã s½n trong dÞch v« bµo ®îc sö dông hÕt th× cã thÓ ®a mRNA nh©n t¹o cã thµnh
phÇn ®Þnh tríc vµo hÖ thèng v« bµo vµ x¸c ®Þnh xem protein nµo ®îc tæng hîp.
C¸c t¸c gi¶ nhËn thÊy r»ng, khi ®a mRNA toµn uraxin (U) vµo th× protein ®îc
133
tæng hîp chØ toµn acid phenylalanin. T¬ng tù nh vËy, nÕu mRNA ®a vµo chØ
chøa toµn adenine (A) th× protein ®îc tæng hîp chØ toµn lysine, nÕu mRNA mang
toµn C th× protein t¬ng øng chØ cã prolin. VËy UUU m· ho¸ cho phenylalanine,
AAA m· ho¸ cho lysine, CCC m· ho¸ cho prolin.
TiÕp sau ®ã c¸c t¸c gi¶ ®· tæng hîp c¸c mRNA cã thµnh phÇn nh
UCUCUCUCUCUCUCUCUCU..., AAGAAGAAGAAG.... vµ ®· t×m ra c¸c bé ba
m· ho¸ amino acid nh: serine lµ UCU, leucine lµ CUC, lysine lµ AAG, arginine
lµ AGA vµ acid glutamic lµ GAA. Cø tiÕp tôc thÝ nghiÖm nh vËy vµ kÕt hîp víi
mét vµi kü thuËt kh¸c, ngêi ta ®· t×m ra toµn bé 61 bé ba m· ho¸ c¸c amino acid
(h×nh 3.9). Ba bé ba cßn l¹i (UAA, UAG, vµ UGA) nh ngµy nay chóng ta ®· biÕt,
lµ nh÷ng dÊu hiÖu kÕt thóc chuçi, cßn gäi lµ bé ba v« nghÜa v× chóng kh«ng x¸c
®Þnh amino acid nµo.
134
cßn gióp gi¶i quyÕt trë ng¹i vÒ kh«ng gian trong qu¸ tr×nh dÞch m·. Sè lîng c¸c
tRNA biÕn ®éng theo loµi: 30 hay 40 ë vi khuÈn (prokaryote), 50 ë tÕ bµo ®éng
thùc vËt (eukaryote) - nhng cÊu tróc cña chóng rÊt gièng nhau. Mét ®Æc ®iÓm
®¸ng chó ý ë tRNA lµ mét tRNA cã thÓ kÕt hîp víi hai codon kh¸c nhau cïng m·
ho¸ cho mét amino acid liªn kÕt theo kiÓu wobble (h×nh 3.10).
H×nh 3.10. CÊu tróc cña tRNA (a,b) vµ thuyÕt Wobble vÒ sù b¾t cÆp linh ho¹t cña tRNA vµ
mRNA trong dÞch m· (c)
135
NhËn ®Þnh ®Çu tiªn cña c¸c nhµ khoa häc vÒ c¸ch liªn kÕt gi÷a c¸c amino
acid víi c¸c bé ba, lµ do c¸c m· bé ba trªn mRNA cã thÓ uèn cong l¹i t¹o thµnh
c¸c hèc kh¸c nhau ®Ó liªn kÕt trùc tiÕp víi c¸c amino acid, mµ nã m· cho theo thø
tù. Tuy nhiªn ®Õn n¨m 1958 Crick ®· nhËn ra r»ng: gi¶ thiÕt trong tù nhiªn c¸c
amino acid ®îc vËn chuyÓn ®Õn khu«n bëi mét ph©n tö tiÕp hîp (adapter) vµ ph©n
tö nµy cã mét phÇn thËt sù phï hîp víi RNA. Theo gi¶ thiÕt, trong h×nh d¹ng ®¬n
gi¶n nhÊt cña nã, cã thÓ cÇn tíi 20 lo¹i ph©n tö tiÕp hîp, mçi c¸i ®îc dµnh riªng
cho mét amino acid. Crick ®o¸n r»ng ph©n tö tiÕp hîp nµy “cã thÓ cã chøa c¸c
nucleotide”, ®iÒu nµy cho phÐp nã kÕt hîp víi RNA khu«n, bëi sù b¾t cÆp cña c¸c
“base” nh ë DNA. H¬n thÕ n÷a, “viÖc t¸ch enzyme cã thÓ cÇn thiÕt cho viÖc g¾n
mçi ph©n tö tiÕp hîp víi amino acid cña nã”.
Trªn thùc tÕ, c¸c amino acid ®îc g¾n víi c¸c ph©n tö tiÕp hîp (c¸c ph©n tö
nµy chÝnh lµ mét lo¹i RNA æn ®Þnh ®îc gäi lµ tRNA). Mçi amino acid ®îc g¾n
vµo tRNA chuyªn biÖt, sau ®ã ®îc ®a ®Õn ribosome, mét ph©n tö phøc t¹p g¾n
c¸c amino acid vµo chuçi polypeptide ®ang mäc dµi ra.
Sù dÞch m· c¸c codon bëi tRNA
CÊu tróc cña tRNA lµ mét bÝ mËt vÒ sù ®Æc hiÖu gi÷a mét codon trªn ph©n tö
mRNA víi mét amino acid mµ nã m· hãa. Ph©n tö tRNA cã d¹ng cá ba l¸, chøa
bèn vïng xo¾n kÐp vµ ba vßng sîi ®¬n. Vßng ë gi÷a ®îc gäi lµ vßng ®èi m·
(anticodon), v× nã cã mang mét bé ba nucleotide liªn kÕt bæ sung víi bé ba m·
hãa trªn mRNA. Tr×nh tù bæ sung nµy cho phÐp tRNA g¾n vµo mRNA theo liªn
kÕt ®Æc hiÖu RNA:RNA. V× c¸c codon trªn mRNA ®îc ®äc theo híng 5’3’,
do ®ã c¸c anticodon ph¶i ®îc ®äc theo híng 3’5’ (h×nh 3.10). C¸c amino acid
®îc g¾n vµo tRNA bëi c¸c enzyme aminoacyl-tRNA synthetase, c¸c tRNA ®·
®îc g¾n víi c¸c amino acid ®îc gäi lµ tRNA ®· ®îc tÝch ®iÖn.
H×nh 3.11. Ph¶n øng g¾n amino acid vµo tRNA cña nã ®îc xóc t¸c bëi enzym
aminoacyl tRNA synthetase
136
Chøc n¨ng trung gian cña tRNA ®îc thùc hiÖn nhê nh÷ng enzyme ®Æc hiÖu
lµ c¸c aminoacyl-tRNA synthetase. Cã 20 lo¹i aminoacyl-tRNA synthetase t¬ng
øng víi 20 lo¹i amino acid. C¸c enzyme nµy cã kh¶ n¨ng nhËn biÕt amino acid
®Æc hiÖu vµ c¶ tRNA t¬ng øng. Qu¸ tr×nh g¾n amino acid vµo tRNA víi sù tham
gia cña c¸c enzyme nµy lµ mét qu¸ tr×nh tiªu tèn n¨ng lîng vµ tr¶i qua hai bíc:
Bíc 1: enzyme nhËn biÕt vµ g¾n víi mét amino acid ®Æc hiÖu Enzyme +
ATP Enzyme-aminoacyl-AMP + P.P
Bíc 2: amino acid ®îc chuyÓn tõ phøc hîp enzyme-aminoacyl sang tRNA
t¬ng øng Enzyme-aminoacyl-AMP + tRNA tRNA-aminoacyl + AMP +
enzyme
Mét sè tRNA chuyªn biÖt cã thÓ mang c¸c amino acid chuyªn biÖt cña chóng
®Õn mét vµi codon m· cho c¸c amino acid nµy. tRNA nµy nhËn biÕt vµ liªn kÕt víi
mét sè codon biÕn ®æi, kh«ng chØ b»ng c¸ch liªn kÕt b¾t cÆp bæ sung, th«ng qua
viÖc lµm mÊt kiÓu b¾t cÆp bæ sung t¹i ®Çu 3’ cña codon vµ 5’ cña anticodon. ViÖc
lµm mÊt b¾t cÆp nµy gäi lµ b¾t cÆp kiÓu wobble (b¾t cÆp khÊp khÓnh).
B¾t cÆp kiÓu wobble lµ tr¹ng th¸i mµ nucleotide thø ba cña anticodon (ë ®Çu
5’) cã thÓ h×nh thµnh hai hµng (h×nh 3.10). Nucleotide thø ba nµy cã thÓ h×nh thµnh
liªn kÕt hydro kh«ng chØ víi d¹ng nucleotide b¾t cÆp bæ sung b×nh thêng ë vÞ trÝ
nucleotide thø 3 cña codon mµ cßn víi c¸c nucleotide kh¸c ë vÞ trÝ nµy. “Quy luËt
wobble” chØ ra r»ng c¸c nucleotide cã thÓ hoÆc kh«ng thÓ h×nh thµnh c¸c liªn kÕt
hydro víi c¸c nucleotide kh¸c nhau qua wobble nh b¶ng 3.3. ë b¶ng nµy ta thÊy
kÝ tù I lµ inosine, mét base hiÕm ®îc t×m thÊy ë tRNA, thêng lµ ë vïng
anticodon.
B¶ng 3.3. B¾t cÆp cña c¸c nucleotide theo quy luËt wobble
§Çu 5’ cña anticodon §Çu 3’ cña codon
G C hoÆc U
C G
A U
U A hoÆc G
I A,C hoÆc U
Theo b¶ng trªn cho thÊy lµm thÕ nµo ®Ó ba tRNA cña serine cã thÓ b¾t cÆp
víi c¸c codon m· hãa cho amino acid nµy (h×nh 3.10). C¸c tRNA nµy ®îc gäi lµ
137
®ång ph©n nhËn, v× nã nhËn cïng mét amino acid nhng l¹i ®îc phiªn m· tõ c¸c
gen tRNA kh¸c nhau.
2.1.3. RNA ribosome (rRNA)
Sù tæng hîp protein x¶y ra khi c¸c ph©n tö tRNA vµ mRNA kÕt hîp víi
ribosome. NhiÖm vô cña c¸c tRNA vµ ribosome lµ dÞch m· c¸c tr×nh tù codon trªn
mRNA thµnh tr×nh tù amino acid trong protein. Tªn gäi bé m¸y sinh häc ®îc sö
dông ®Ó m« t¶ ®Æc ®iÓm cña phøc hîp ®a ph©n thùc hiÖn c¸c chøc n¨ng trong tÕ
bµo. VÝ dô nh thÓ sao chÐp lµ mét bé m¸y sinh häc cã thÓ sao chÐp DNA mét
c¸ch chÝnh x¸c vµ nhanh chãng. Trong qu¸ tr×nh dÞch m·, ribosome lµ mét bé m¸y
lín h¬n vµ phøc t¹p h¬n c¸c bé m¸y ®· m« t¶ tríc ®ã (bé m¸y sao chÐp, bé m¸y
phiªn m·). Do phøc hîp nµy thùc hiÖn mét sè c«ng viÖc víi sù chÝnh x¸c cao vµ
víi tèc ®é nhanh. Víi lÝ do nµy, ribosome ®îc vÝ nh mét nhµ m¸y cã chøa nhiÒu
bé m¸y ho¹t ®éng mét c¸ch nhÞp nhµng vµ ®ång bé.
ë tÊt c¶ c¸c sinh vËt, ribosome cã chøa mét díi ®¬n vÞ nhá vµ mét díi ®¬n
vÞ lín, mçi díi ®¬n vÞ lµ phøc hîp cña mét sè lo¹i c¸c rRNA vµ kho¶ng 50 protein.
C¸c díi ®¬n vÞ ®îc ®Æc trng bëi tèc ®é l¾ng cña chóng khi t¸ch chóng ë m¸y
siªu li t©m, v× tªn cña chóng ®îc b¾t nguån tõ nh÷ng h»ng sè l¾ng trong ®¬n vÞ
Svedberg (S), mµ nã chØ ®Þnh cho kÝch thíc ph©n tö. ë prokaryote, díi ®¬n vÞ
nhá vµ díi ®¬n vÞ lín gäi lµ 30S vµ 50S t¬ng øng, khi chóng kÕt hîp víi nhau
t¹o thµnh ribosome 70S. Cßn ë eukaryote, lµ 40S vµ 50S, víi ph©n tö ribosome
hoµn thiÖn lµ 80S. MÆc dï ribosome cña eukaryote lín h¬n vµ phøc t¹p h¬n do
thµnh phÇn vµ sè lîng protein vµ rRNA cña chóng lín h¬n cña prokaryote (h×nh
3.12a), nhng nh÷ng thµnh phÇn vµ c¸c bíc tæng hîp protein nh×n chung lµ gièng
víi prokaryote. Sù gièng nhau trong qu¸ tr×nh dÞch m· ë prokaryote vµ eukaryote
®· chØ ra r»ng qu¸ tr×nh dÞch m· lµ mét qu¸ tr×nh cæ, mµ nã ®îc xuÊt hiÖn ë tæ
tiªn chung cña prokaryote vµ eukaryote.
§iÒu ®¸ng ng¹c nhiªn khi nghiªn cøu thµnh phÇn cña ribosome lµ 2/3 khèi
lîng cña nã lµ RNA vµ protein chØ chiÕm 1/3. Do ®ã, c¸c rRNA lµ nh÷ng ph©n
tö uèn khóc bëi sù b¾t cÆp cña c¸c base néi ph©n t¹o thµnh cÊu tróc bËc hai æn
®Þnh, ®îc cho lµ phï hîp víi chøc n¨ng nh mét dµn m¸y cÇn thiÕt cho viÖc kÕt
hîp chÝnh x¸c víi c¸c protein cña ribosome (h×nh 3.12c). Theo m« h×nh nµy, c¸c
protein cña ribosome cã thÓ phï hîp cho viÖc thùc hiÖn c¸c bíc quan träng trong
tæng hîp protein. Nhng hiÖn nay quan ®iÓm nµy ®· ®îc thay ®æi khi ngêi ta
kh¸m ph¸ ra ho¹t tÝnh xóc t¸c cña RNA, vµ ngêi ta tin r»ng c¸c rRNA ®îc kÕt
138
hîp l¹i víi nhau bëi c¸c protein ribosome, thùc hiÖn hÇu hÕt c¸c bíc quan träng
trong tæng hîp protein.
c
b
H×nh 3.12. Thµnh phÇn cÊu t¹o cña ribosome ë prokaryote vµ eukaryote (a). C¸c vÞ trÝ t¬ng t¸c
cña ribosome trong qu¸ tr×nh dÞch m· (b) vµ cÊu tróc bËc 2 cña rRNA 16S cña prokaryote (c)
139
VÞ trÝ liªn kÕt cho mRNA hoµn toµn n»m trong díi ®¬n vÞ nhá, cã ba vÞ trÝ
liªn kÕt cho c¸c ph©n tö tRNA. Mçi ph©n tö tRNA, ®îc liªn kÕt vµo trong
ribosome, t¹o thµnh cÇu nèi gi÷a díi ®¬n vÞ 30S vµ 50S, víi ®Çu anticodon n»m
ë díi ®¬n vÞ 30, ®Çu aminoacyl n»m trong díi ®¬n vÞ 50S. VÞ trÝ A (cho
aminoacyl) liªn kÕt víi aminoacyl tRNA ®i vµo, mµ ®Çu anticodon cña tRNA nµy
b¾t cÆp víi codon ë vÞ trÝ A cña díi ®¬n vÞ 30S (cßn gäi lµ trung t©m m· hãa) cßn
®Çu g¾n aminoacyl t¬ng t¸c víi trung t©m peptidyl transferase cña díi ®¬n vÞ
50S. Khi ribosome di chuyÓn theo híng 5’, tRNA nµy ®îc chuyÓn sang vÞ trÝ P
cña díi ®¬n vÞ 30S vµ ®Çu aminoacyl chøa chuçi peptide ®ang mäc dµi ra n»m
trong cÊu tróc ®êng hÇm cña díi ®¬n vÞ 50S. VÞ trÝ E (exit-lèi ra) chøa c¸c tRNA
®· bÞ deacyl hãa, gi¶i phãng chóng ra khái ribosome, mÆc dï t¹i vÞ trÝ nµy nh÷ng
t¬ng t¸c gi÷a anticodon-codon vÉn cßn nhng nã kh«ng ®ñ m¹nh ®Ó duy tr×.
Hai vïng trong ribosome ®ãng vai trß quan träng trong tæng hîp protein, ®ã
lµ trung t©m m· hãa ë díi ®¬n vÞ 30S ®¶m b¶o r»ng chØ cã c¸c tRNA mang c¸c
anticodon b¾t cÆp víi codon sÏ ®îc chÊp nhËn vµo vÞ trÝ A. Vïng thø hai lµ trung
t©m peptidyl transferase n»m trong díi ®¬n vÞ 50S lµ n¬i xóc t¸c ®Ó h×nh thµnh
liªn kÕt peptide gi÷a c¸c amino acid. GÇn ®©y, cÊu tróc cña ribosome vµ sù kÕt hîp
víi c¸c tRNA ®· ®îc x¸c ®Þnh ë møc nguyªn tö b»ng nhiÒu kü thuËt, bao gåm c¶
kü thuËt tinh thÓ tia X. Nh÷ng kÕt qu¶ nµy ®· chØ ra r»ng, c¶ hai trung t©m cña
ribosome ®îc cÊu t¹o hoµn toµn bëi c¸c vïng cña rRNA, mµ t¬ng t¸c quan
träng trong hai trung t©m nµy lµ t¬ng t¸c tRNA-rRNA. Sù h×nh thµnh liªn kÕt
peptide thËm chÝ cßn ®îc cho lµ ®îc xóc t¸c bëi mét vÞ trÝ ho¹t ®éng trong
rRNA vµ ®îc kÕt hîp víi nh÷ng protein ribosome.
2.2. c¸c giai ®o¹n cña qu¸ tr×nh dÞch m·
Qu¸ tr×nh dÞch m· cã thÓ ®îc chia thµnh ba giai ®o¹n, ®ã lµ c¸c giai ®o¹n:
khëi ®Çu, kÐo dµi vµ kÕt thóc. Ngoµi ribosome, c¸c tRNA vµ mRNA, cßn cã c¸c
protein cÇn thiÕt cho viÖc hoµn thµnh c¸c giai ®o¹n. V× c¸c bíc chÝnh trong giai
®o¹n khëi ®Çu dÞch m· lµ kh¸c nhau râ rÖt ë prokaryote vµ eukaryote. Do ®ã, sù
khëi ®Çu ®îc t¸ch lµm hai nhãm. Giai ®o¹n kÐo dµi vµ kÕt thóc ®îc m« t¶ gièng
nh ë vi khuÈn, mµ hai giai ®o¹n nµy ®· ®îc lµm s¸ng tá trong thêi gian gÇn ®©y.
2.2.1. Giai ®o¹n khëi ®Çu
Khëi ®Çu dÞch m· lµ mét giai ®o¹n cùc k× phøc t¹p víi sù tham gia cña hµng
lo¹t nh©n tè protein: c¸c nh©n tè khëi ®Çu (IF- initiation factor). Ngêi ta ®· x¸c
®Þnh ®îc ba nh©n tè IF ë prokaryote vµ 6 nh©n tè IF ë eukaryote (eIF).
140
C«ng viÖc chÝnh cña giai ®o¹n khëi ®Çu dÞch m· lµ ®Þnh vÞ aminoacyl tRNA
®Çu tiªn vµo vÞ trÝ P cña ribosome, b»ng c¸ch nµy sù khëi ®Çu dÞch m· chÝnh x¸c
t¹i vÞ trÝ m· khëi ®Çu trªn khung ®äc. ë hÇu hÕt sinh vËt prokaryote vµ tÊt c¶
eukaryote, amino acid ®Çu tiªn cña bÊt kú chuçi polypeptide míi ®îc tæng hîp
®Òu lµ methionine, ®îc m· hãa bëi bé ba AUG. Amino acid khëi ®Çu nµy kh«ng
g¾n víi tRNA cña methionine, mµ nã g¾n víi mét tRNA ®Æc biÖt gäi lµ tRNAMet i
(tRNA vËn chuyÓn methionine khëi ®Çu). ë vi khuÈn, mét nhãm formyl ®îc g¾n
vµo methionine khi amino acid nµy ®îc g¾n vµo chÊt khëi ®Çu, h×nh thµnh nªn
N-formylmethionine (nhãm formyl trong N-formylmethionine sau ®ã bÞ lo¹i bá).
H·y nhí l¹i r»ng, ë c¶ prokaryote vµ eukaryote, mRNA cã vïng 5’ kh«ng
dÞch m· bao gåm c¶ tr×nh tù cña vÞ trÝ b¾t ®Çu phiªn m· vµ vÞ trÝ b¾t ®Çu dÞch m·.
ë prokaryote, c¸c codon khëi ®Çu ®îc ®øng tríc bëi tr×nh tù ®Æc biÖt gäi lµ tr×nh
tù Shine-Dalgarno, mµ nã b¾t cÆp víi ®Çu 3’ cña rRNA 16S trong díi ®¬n vÞ 30S.
Sù b¾t cÆp chÝnh x¸c nµy ®· ®Þnh vÞ c¸c codon khëi ®Çu ë vÞ trÝ P n¬i tRNA khëi
®Çu sÏ liªn kÕt vµo (h×nh 3.13). mRNA cã thÓ chØ b¾t cÆp víi díi ®¬n vÞ 30S, chó
ý r»ng rRNA ®ãng vai trß chñ ®¹o ®Ó ch¾c ch¾n r»ng ribosome ®îc ®Æt vµo ®óng
vÞ trÝ khëi ®Çu dÞch m·.
H×nh 3.13. Sù b¾t cÆp gi÷a tr×nh tù Shine-Dalgarno víi rRNA 16S cña díi
®¬n vÞ ribosome 30S
Vi khuÈn cã ba lo¹i protein-IF1, IF2 vµ IF3 (IF lµ viÕt t¾t cña nh©n tè khëi
®Çu-initation factor) ®îc cÇn cho sù khëi ®Çu dÞch m· mét c¸ch chÝnh x¸c. Trong
khi IF3 cÇn thiÕt cho viÖc gi÷ díi ®¬n vÞ 30S ph©n ly khái díi ®¬n vÞ 50S, th×
IF1 vµ IF2 ho¹t ®éng ®Ó ®¶m b¶o r»ng chØ cã tRNA khëi ®Çu ®i vµo vÞ trÝ P (h×nh
3.14a). Díi ®¬n vÞ 30S, mRNA vµ tRNA khëi ®Çu t¹o thµnh phøc hîp khëi ®Çu
30S. Ribosome 70S hoµn chØnh ®îc h×nh thµnh b»ng c¸ch kÕt hîp phøc hîp khëi
®Çu 30S víi díi ®¬n vÞ 50S vµ gi¶i phãng c¸c nh©n tè khëi ®Çu.
141
V× prokaryote kh«ng cã khoang nh©n ®Ó ph©n t¸ch qu¸ tr×nh phiªn m· vµ
dÞch m·, do ®ã phøc hîp khëi ®Çu cã thÓ h×nh thµnh t¹i tr×nh tù Shine-Dalgarno
gÇn ®Çu 5’ cña mét mRNA ®ang ®îc phiªn m·. Ngîc l¹i, qu¸ tr×nh phiªn m· vµ
dÞch m· ë eukaryote x¶y ra ë hai kh«ng gian riªng biÖt trong tÕ bµo. Nh ë phÇn
tríc ®· ®Ò cËp c¸c mRNA cña tÕ bµo eukaryote ®îc biÕn ®æi trong nh©n tríc
khi ®îc vËn chuyÓn ra tÕ bµo chÊt ®Ó dÞch m·. Trong tÕ bµo chÊt, mRNA thêng
®îc bao phñ bëi c¸c protein vµ c¸c vïng cã thÓ xo¾n kÐp do sù b¾t cÆp cña c¸c
base néi ph©n. C¸c vïng cÊu tróc bËc hai nµy cÇn ®îc lo¹i bá, ®Ó lé ra codon khëi
®Çu lµ AUG. Sù lo¹i bá nµy ®îc thùc hiÖn bëi c¸c nh©n tè khëi ®Çu (gäi lµ eIF4A,
B vµ G), lµ phøc hîp liªn kÕt víi cÊu tróc mò (lµ cÊu tróc cã ë ®Çu 5’ cña tÊt c¶
mRNA ë eukaryote) vµ víi díi ®¬n vÞ 40S ®· g¾n tRNA khëi ®Çu (h×nh 3.14b).
Trong cïng thêi ®iÓm nµy, viÖc quÐt c¸c tr×nh tù ®Ó lé ra codon khëi ®Çu, sau ®ã
phøc hîp khëi ®Çu 40S nµy kÕt hîp víi díi ®¬n vÞ 60S, ®Ó h×nh thµnh nªn mét
ribosome 80S hoµn chØnh. Gièng nh ë prokaryote, khi phøc hîp khëi ®Çu 80S
®îc h×nh thµnh, nã sÏ gi¶i phãng c¸c nh©n tè khëi ®Çu tríc khi nã bíc vµo giai
®o¹n kÐo dµi dÞch m·.
a b
H×nh 3.14. Giai ®o¹n khëi ®Çu dÞch m· ë prokaryote (a) vµ giai ®o¹n khëi ®Çu dÞch m·
ë eukaryote (b)
142
2.2.2. Giai ®o¹n kÐo dµi
Trong suèt giai ®o¹n kÐo dµi nµy, ribosome ®îc h×nh dung nh mét nhµ
m¸y. mRNA ho¹t ®éng nh mét b¶n ®å chuyªn biÖt cho c¸c tRNA, mçi tRNA
thùc hiÖn chøc n¨ng vËn chuyÓn amino acid. Mçi amino acid ®îc thªm vµo chuçi
polypeptide ®ang mäc dµi trong khi tRNA bÞ deacyl hãa ®îc quay vßng b»ng
c¸ch g¾n thªm mét amino acid kh¸c (h×nh 3.15). H×nh 3.15 m« t¶ chi tiÕt c¸c bíc
thùc hiÖn giai ®o¹n kÐo dµi dÞch m·, trong giai ®o¹n nµy cã thªm hai protein tham
gia thùc hiÖn giai ®o¹n kÐo dµi, ®îc gäi lµ nh©n tè kÐo dµi Tu ( viÕt t¾t lµ EF-Tu-
elongation factor Tu) vµ G (EF-G).
H×nh 3.15. C¸c bíc thùc hiÖn trong giai ®o¹n kÐo dµi dÞch m·
ë phÇn tríc cña ch¬ng, chóng ta thÊy r»ng aminoacyl tRNA ®îc h×nh
thµnh b»ng liªn kÕt céng hãa trÞ víi amino acid ë ®Çu 3’ cña tRNA mµ cã chøa
anticodon cña amino acid ®ã. Tríc khi aminoacyl tRNA ®îc sö dông ®Ó tæng
hîp protein, chóng ®îc kÕt hîp víi protein EF-Tu ®Ó t¹o thµnh phøc hîp tam
ph©n (®îc hîp thµnh bëi amino acid, tRNA vµ EF-Tu). Chu kú kÐo dµi sÏ ®îc
më ®Çu b»ng mét tRNA khëi ®Çu ®· liªn kÕt ë vÞ trÝ P vµ vÞ trÝ A s½n sµng ®Ó nhËn
mét phøc hîp tam ph©n (h×nh 3.15), mµ c¸c codon ®îc b¾t cÆp ®óng víi anticodon
143
cña tRNA ë trung t©m m· hãa trong díi ®¬n vÞ nhá. Khi sù b¾t cÆp ®óng ®îc
t¹o ra, ribosome sÏ thay ®æi h×nh d¹ng vµ EF-Tu rêi khái phøc hîp tam ph©n. Hai
®Çu cña aminoacyl ®îc ®Æt c¹nh nhau ë trung t©m peptidyl transferase trong díi
®¬n vÞ lín. T¹i ®©y, mét liªn kÕt peptide ®îc h×nh thµnh bëi sù di chuyÓn cña
methionine ë vÞ trÝ P ®Õn amino acid ë vÞ trÝ A. Th«ng qua ho¹t ®éng cña protein
thø hai lµ EF-G, mµ nã cã h×nh d¹ng phï hîp víi vÞ trÝ A, c¸c tRNA ë vÞ trÝ A vµ
P bÞ ®Èy ®Õn vÞ trÝ P vµ E t¬ng øng. Khi nµy, mRNA ®îc dÞch chuyÓn th«ng qua
ribosome, v× thÕ codon tiÕp theo ®îc ®Þnh vÞ ë vÞ trÝ A. Khi EF-G rêi khái
ribosome, vÞ trÝ A ®îc më ra ®Ó nhËn mét phøc hîp tam ph©n tiÕp theo. C¸c chu
kú tiÕp theo, vÞ trÝ A ®îc lÊp ®Çy víi mét phøc hîp tam ph©n khi tRNA bÞ deacyl
hãa rêi khái vÞ trÝ E. Trong giai ®o¹n kÐo dµi, sè lîng amino acyl trong peptidyl
tRNA ë vÞ trÝ P t¨ng lªn vµ ®Çu tËn cïng amino cña chuçi peptide ®ang mäc dµi ra
cuèi cïng còng sÏ thß ra khái ®êng hÇm cña díi ®¬n vÞ 50S vµ lã ra khái
ribosome. Qu¸ tr×nh ®îc lÆp l¹i cho ®Õn khi xuÊt hiÖn dÊu hiÖu kÕt thóc dÞch m·.
Nh©n tè EF-Tu ®Ó vËn chuyÓn aminoacyl tRNA ®Õn vÞ trÝ A cña ribosome
b»ng c¸ch thñy ph©n n¨ng lîng cña GTP, díi d¹ng phøc EF-Tu/GTP, khi EF-
Tu ®îc lo¹i ra khái vÞ trÝ A nã cã d¹ng EF-Tu/GDP. GDP bÞ ®Èy ra khái phøc
hîp EF-Tu/GDP bëi mét nh©n tè kÐo dµi Ts (EF-Ts) t¹o thµnh phøc hîp EF-
Tu/EF-Ts. Phøc hîp nµy dÔ dµng nhËn ph©n tö GTP míi ®Ó h×nh thµnh nªn EF-
Tu/GTP cã kh¶ n¨ng vËn chuyÓn aminoacyl tRNA ®Õn vÞ trÝ A cña ribosome. C¸c
bíc nµy ®îc gäi lµ chu kú chuyÓn vÞ cña nh©n tè EF-Tu.
2.2.3. Giai ®o¹n kÕt thóc
Chu kú kÐo dµi tiÕp diÔn cho ®Õn khi vÞ trÝ A cña ribosome lµ mét trong ba
bé ba kÕt thóc (UGA, UAA hoÆc UAG). H·y nhí l¹i r»ng kh«ng cã mét tRNA
nµo nhËn biÕt ®îc c¸c codon nµy, thay vµo ®ã lµ c¸c protein ®îc gäi lµ nh©n tè
gi¶i phãng (release factor – RF), ë vi khuÈn cã ba nh©n tè gi¶i phãng ®ã lµ RF1,
RF2 vµ RF3, nhËn biÕt ®îc c¸c codon kÕt thóc. ë vi khuÈn, nh©n tè RF1 nhËn
biÕt codon UGA hoÆc UAG, RF2 th× nhËn biÕt ®îc c¸c codon kÕt thóc UAA hoÆc
UGA. C¶ hai nh©n tè nµy ®îc hç trî bëi nh©n tè RF3. Sù t¬ng t¸c gi÷a RF1 vµ
RF2 ë vÞ trÝ A kh¸c víi sù t¬ng t¸c cña phøc hîp tam ph©n ë hai ph¬ng thøc:
- §Çu tiªn c¸c codon kÕt thóc ®îc nhËn biÕt bëi c¸c bé ba peptide trong c¸c
nh©n tè gi¶i phãng (RF) chø kh«ng ph¶i b»ng anticodon.
- Thø hai c¸c nh©n tè gi¶i phãng phï hîp víi vÞ trÝ A cña díi ®¬n vÞ 30S
nhng kh«ng cã sù h×nh thµnh liªn kÕt peptide, thay vµo ®ã lµ mét ph©n tö níc
®i vµo trung t©m peptidyl transferase vµ dÉn ®Õn sù gi¶i phãng polypeptide khái
144
tRNA ë vÞ trÝ P vµ rêi khái ribosome. C¸c díi ®¬n vÞ 30S vµ 50S cña ribosome
ph©n t¸ch vµ s½n sµng cho viÖc h×nh thµnh mét phøc hîp khëi ®Çu míi.
Khi so s¸nh cÊu tróc kh«ng gian cña phøc hîp tam ph©n víi c¸c nh©n tè EF-G,
RF1 vµ RF2 b»ng ph¬ng ph¸p tinh thÓ tia X. EF-G cã h×nh d¹ng t¬ng tù nh
phøc hîp tam ph©n, cßn h×nh d¹ng cña c¸c nh©n tè gi¶i phãng gièng nh c¸c
tRNA bÞ deacyl hãa.
2.3. tÝnh chÝnh x¸c cña ph¶n øng tæng hîp protein
TÇn sè sai sãt x¶y ra trong ph¶n øng tæng hîp protein thÊp, chØ kho¶ng 10-5 -
10-4. §iÒu nµy cho thÊy ph¶n øng tæng hîp protein ®îc kiÓm so¸t chÆt chÏ tõ ph¶n
øng g¾n amino acid vµo tRNA ®Õn ba giai ®o¹n trong qu¸ tr×nh tæng hîp. Ph¶n
øng g¾n amino acid vµo tRNA ®îc xóc t¸c bëi enzyme aminoacyl-tRNA
synthetase. CÊu tróc ph©n tö cña enzyme gåm nhiÒu vïng víi chøc n¨ng kh¸c nhau
(h×nh 3.17). Mét enzyme ®Æc hiÖu cho mét amino acid vµ mét tRNA vËn chuyÓn
amino acid ®ã.
Sai sãt x¶y ra khi enzyme g¾n nhÇm amino acid vµo tRNA hoÆc ngîc l¹i.
VÝ dô nh, cysteine cã thÓ bÞ g¾n nhÇm vµo tRNA cña alanine (cystein-tRNAAla).
Tuy nhiªn, nh÷ng sai sãt nµy ®îc ph¸t hiÖn vµ lo¹i bá nhê sù kh«ng t¬ng thÝch
145
vÒ cÊu tróc khi phøc aminoacyl-tRNA ®i vµo ribosome. §©y lµ ho¹t tÝnh ®äc söa
(proofreading) cña enzyme sythetase. Mét khi ®· ®äc söa xong th× tRNA cã nhiÖm
vô mang ®óng amino acid ®ã vµo ribosome; ®èi m· trªn tRNA t¬ng t¸c víi m·
trªn mRNA vµ amino acid ®îc chuyÓn sang chuçi peptide. B»ng con ®êng hãa
häc, cã thÓ thay thÕ amino acid ®óng b»ng amino acid sai trong phøc aminoacyl-
tRNA. VÝ dô, cysteyl-tRNACys (tRNA mang cystein ë tr¹ng th¸i ho¹t hãa) cã thÓ
®îc thay thµnh alanyl-tRNACys. Trong ph¶n øng tæng hîp protein in vitro, alanine
(amino acid sai) ®îc chuyÓn tõ phøc alanyl-tRNACys vµo chuçi peptide, mÆc dï
®èi m· trªn tRNACys t¹o cÆp víi m· bé ba cho cystein trªn mRNA. §iÒu nµy cho
thÊy tÝnh chÝnh x¸c cña c¸c amino acid trong chuçi peptide phô thuéc vµo ph¶n
øng g¾n amino acid víi tRNA. NÕu sai sãt kh«ng bÞ ph¸t hiÖn th× amino acid sai
vÉn nèi vµo chuçi peptide ngay khi ®èi m· cña tRNA vµ m· bé ba cña mRNA
hoµn toµn t¬ng xøng víi nhau.
Sai sãt x¶y ra trong qu¸ tr×nh tæng hîp ë ribosome chñ yÕu do ribosome trît
lÖch kh«ng ®óng 3 nucleotide (mét codon) hoÆc bá qua m· bé ba trªn ph©n tö
mRNA. §iÒu nµy g©y sai sãt t¬ng tù nh ®ét biÕn lÖch khung ®äc hoÆc ®ét biÕn
lµm mÊt vµi amino acid (h×nh 3.18). HiÖn tîng trît phô thuéc chñ yÕu vµo cÊu
tróc ph©n tö mRNA. Ngoµi ra, ribosome cã thÓ chÊp nhËn amino acid kh«ng ®óng
víi m· bé ba trªn mRNA. §iÒu nµy x¶y ra khi tRNA bÞ ®ét biÕn hoÆc cã thay ®æi
trong cÊu tróc kh«ng gian. VÝ dô: mét vµi tRNA cã kh¶ n¨ng nhËn biÕt m· dõng
tæng hîp nh mét codon cña amino acid nµo ®ã. Thùc nghiÖm cho thÊy, tÇn suÊt
t¬ng t¸c khi chØ cã 2 nucleotide cña codon vµ anticodon bæ sung víi nhau chØ sai
kh¸c kho¶ng 10-1 ®Õn 10-2 lÇn so víi khi c¶ 3 nucleotide cña codon vµ anticodon
®Òu bæ sung víi nhau. Nh vËy, t¬ng t¸c gi÷a codon trªn mRNA vµ anticodon
trªn tRNA kh«ng ph¶i lµ ®iÒu kiÖn duy nhÊt quyÕt ®Þnh tÝnh chÝnh x¸c. Thùc tÕ,
t¬ng t¸c t¹o cÆp bæ sung t¹o ®iÒu kiÖn ®Ó mRNA aminoacyl-tRNA t¬ng t¸c víi
146
rRNA. NÕu kh«ng x¶y ra t¬ng t¸c gi÷a rRNA 16S vµ aminoacyl-tRNA, phøc
aminoacyl-tRNA sÏ bÞ ®µo th¶i ra khái vÞ trÝ A trªn ribosome.
H×nh 3.18. Mét sè sai sãt trong qu¸ tr×nh dÞch m· tæng hîp protein g©y ra do hiÖn tîng
ribosome di chuyÓn lÖch m· trªn sîi mRNA
HiÖn tîng ribosome trît m· di truyÒn trªn sîi mRNA ®îc virus, nÊm men
sö dông ®Ó kiÓm so¸t dÞch m· t¹o ra c¸c polyprotein. Khi ®ã, c¬ chÕ kiÓm so¸t
®îc gäi lµ dÞch m· lu©n phiªn (alternative translation). Trong tÕ bµo nÊm men,
hai gen tya vµ tyb n»m c¹nh nhau. HiÖn tîng dÞch m· lu©n phiªn cho phÐp tõ mét
sîi mRNA tæng hîp ®îc c¸c protein Tya vµ polyprotein Tya-Tyb.
147
CHƯƠNG 5 ĐIỀU HÒA BIỂU HIỆN GEN
Trong c¸c ch¬ng võa qua, chóng ta ®· xem xÐt c¬ chÕ ho¹t ®éng cña ba qu¸
tr×nh thiÕt yÕu cho sù tån t¹i cña tÕ bµo, ®ã lµ sù sao chÐp, phiªn m· vµ dÞch m·.
Nhng tÕ bµo kh«ng thÓ tån t¹i ®éc lËp t¸ch rêi khái m«i trêng xung quanh. Sù
trao ®æi chÊt liªn tôc gi÷a tÕ bµo vµ m«i trêng ngoµi lµ mét trong nh÷ng ®Æc tÝnh
c¬ b¶n cña sù sèng. §èi víi tÕ bµo prokaryote, m«i trêng nµy lµ tËp hîp c¸c nh©n
tè lý ho¸ bao quanh tÕ bµo; cßn ®èi víi tÕ bµo eukaryote ®ã lµ tËp hîp c¸c tÕ bµo
l©n cËn. Nh vËy n¶y sinh mét vÊn ®Ò lín: b»ng c¸ch nµo tÕ bµo ®iÒu chØnh ho¹t
®éng cña m×nh cho phï hîp víi c¸c biÕn ®æi cña m«i trêng ngoµi ®Ó cã thÓ tån
t¹i thÝch øng?
Tríc khi ®Ò cËp ®Õn c¸c ph¬ng thøc mµ tÕ bµo prokaryote vµ eukaryote sö
dông ®Ó tù ®iÒu chØnh, chóng ta h·y thö ®iÓm l¹i mét sè kh¸c biÖt gi÷a hai lo¹i tÕ
bµo, v× chÝnh nh÷ng sù sai kh¸c nµy quy ®Þnh c¸c ph¬ng thøc ®iÒu chØnh sÏ ®îc
sö dông. ë ®©y, ®Ó ®¬n gi¶n ho¸ vÊn ®Ò, chóng t«i dïng tõ "eukaryote" ®Ó chØ c¸c
sinh vËt ®a bµo vµ "prokaryote" ®Ó chØ c¸c sinh vËt ®¬n bµo v× mÆc dï cã mét sè
eukaryote lµ ®¬n bµo nh nÊm men nhng sè nµy hoµn toµn kh«ng ®¸ng kÓ.
§éng c¬ cña sù ®iÒu hoµ biÓu hiÖn gen:
- ë prokaryote, môc ®Ých cña sù ®iÒu hoµ biÓu hiÖn gen lµ nh»m ®iÒu chØnh
hÖ enzyme cho phï hîp víi c¸c t¸c nh©n dinh dìng vµ lÝ ho¸ cña m«i trêng,
®¶m b¶o ®îc hai yªu cÇu chÝnh cña tÕ bµo: t¨ng trëng vµ sinh s¶n. Sù ®iÒu hoµ
ë ®©y rÊt linh ®éng vµ cã tÝnh thuËn nghÞch, nghÜa lµ tuú thuéc vµo ®iÒu kiÖn m«i
trêng, c¸c gen m· ho¸ cho c¸c enzyme cã thÓ ®îc biÓu hiÖn hay ngng biÓu
hiÖn vµo bÊt k× thêi ®iÓm nµo cña ®êi sèng tÕ bµo, mét enzyme cã thÓ ®îc s¶n
xuÊt, ngõng s¶n xuÊt råi ®îc t¸i s¶n xuÊt sau ®ã.
- ë eukaryote, do tÕ bµo kh«ng tiÕp xóc trùc tiÕp víi m«i trêng, sù ®iÒu hoµ
ë ®©y kh«ng cßn nh»m môc ®Ých ®èi phã víi c¸c biÕn ®éng ngo¹i bµo. Lµ mét
thµnh phÇn cña c¬ thÓ sèng, mçi tÕ bµo ph¶i tu©n thñ nghiªm ngÆt mét ch¬ng
tr×nh ph¸t triÓn chuyªn biÖt tõ khi c¬ thÓ cßn lµ ph«i thai cho ®Õn lóc trëng thµnh.
Sù ®iÒu hoµ ë ®©y híng ®Õn viÖc chuyªn biÖt ho¸ tõng lo¹i tÕ bµo vµo tõng cÊu
tróc, chøc n¨ng riªng vµ kh«ng mang tÝnh thuËn nghÞch. ThËt vËy, mét tÕ bµo ®·
®i vµo con ®êng chuyªn biÖt ho¸, nã kh«ng cßn kh¶ n¨ng quay trë l¹i tr¹ng th¸i
ban ®Çu hay chuyÓn sang mét híng kh¸c n÷a. VÝ dô nh tÕ bµo ph«i thai khi ®·
biÖt ho¸ thµnh tÕ bµo gan th× kh«ng thÓ trë thµnh tÕ bµo ruét.
CÊu tróc tÕ bµo prokaryote vµ eukaryote
148
Sù kh¸c biÖt trong cÊu tróc tÕ bµo prokaryote vµ eukaryote dÉn ®Õn nh÷ng
kh¸c biÖt trong ®iÒu hoµ biÓu hiÖn gen. ë tÕ bµo prokaryote, do kh«ng cã mµng
nh©n, mRNA võa ®îc phiªn m· tõ DNA cã thÓ tiÕp xóc ngay víi bé m¸y dÞch
m· ®Ó lµm khu«n cho sù tæng hîp protein, sù phiªn m· vµ dÞch m· x¶y ra ®ång
thêi. Do ®ã, sù ®iÒu hoµ biÓu hiÖn gen chñ yÕu ®îc thùc hiÖn ë giai ®o¹n phiªn
m·. Trong khi ®ã, ë tÕ bµo eukaryote, sù phiªn m· x¶y ra trong nh©n vµ sù dÞch
m· ngoµi tÕ bµo chÊt lµ hai qu¸ tr×nh kh«ng x¶y ra ®ång thêi; sù ®iÒu hoµ biÓu
hiÖn gen phøc t¹p h¬n, ®îc tiÕn hµnh ë nhiÒu giai ®o¹n.
Ba thµnh phÇn cña sù ®iÒu hoµ biÓu hiÖn gen
C¸c ®Æc ®iÓm sinh häc cña tÕ bµo ®îc x¸c ®Þnh bëi lîng lín protein cã ho¹t
tÝnh ®îc biÓu hiÖn trong tÕ bµo ®ã. Tuy nhiªn ë bÊt kú thêi ®iÓm nµo trong thêi
gian sèng cña tÕ bµo, chØ cã mét sè ®o¹n RNA vµ c¸c protein ®îc m· hãa trong
bé gen ®îc biÓu hiÖn. T¹i c¸c thêi ®iÓm kh¸c nhau, c¸c s¶n phÈm ®îc biÓu hiÖn
®Æc trng cña gen cã thÓ kh¸c nhau ë c¶ hai ph¬ng diÖn ®ã lµ c¸c protein ®îc
biÓu hiÖn vµ møc ®é biÓu hiÖn cña protein nµy.
Sù ®iÒu hßa tæng hîp c¸c b¶n phiªn m· cña gen ®Ó t¹o ra protein cña nã
thêng ®îc gäi lµ sù ®iÒu hßa biÓu hiÖn gen. Khi gen ®îc biÓu hiÖn, nÕu s¶n
phÈm cuèi cïng lµ protein (®iÒu nµy ®óng víi hÇu hÕt c¸c gen), sù ®iÒu hßa cã thÓ
®¹t ®îc b»ng c¸ch ®iÒu chØnh sù phiªn m· DNA thµnh RNA hoÆc dÞch m· tõ
mRNA thµnh protein. Trong thùc tÕ, sù ®iÒu hßa gen x¶y ra ë nhiÒu møc ®é kh¸c
nhau bao gåm c¶ sù æn ®Þnh mRNA vµ biÕn ®æi protein sau dÞch m·. Tuy nhiªn,
hÇu hÕt sù ®iÒu hßa ®îc cho lµ chØ ho¹t ®éng ë møc ®é phiªn m· gen. V× thÕ ë
ch¬ng nµy, träng ®iÓm ®Çu tiªn lµ sù ®iÒu hßa phiªn m·.
C¬ chÕ ®iÒu hßa c¬ b¶n, mµ c¸c ph©n tö bªn ngoµi hoÆc bªn trong dÉn tíi viÖc
liªn kÕt víi c¸c protein ®iÒu hßa, t¸c ®éng ®Õn vÞ trÝ DNA ®Æc biÖt liÒn kÒ víi vïng
m· hãa cho protein vµ sù liªn kÕt nµy ®iÒu khiÓn tèc ®é phiªn m·. C¸c protein nµy
cã thÓ hç trî mét c¸ch trùc tiÕp hay gi¸n tiÕp lªn RNA polymerase b»ng c¸ch liªn
kÕt víi vÞ trÝ khëi ®Çu phiªn m·-promoter-hoÆc chóng cã thÓ lµm dõng qu¸ tr×nh
phiªn m· b»ng c¸ch ng¨n c¶n sù liªn kÕt cña RNA polymerase. §Ó ®iÒu khiÓn sù
phiªn m·, c¸c protein ®iÒu hßa ph¶i cã mét hay nhiÒu vïng cã c¸c chøc n¨ng sau:
• Vïng cã kh¶ n¨ng nhËn biÕt nh©n tè ®iÒu hßa ®óng (vïng b¸m vµo DNA)
• Vïng t¬ng t¸c víi Ýt nhÊt lµ mét protein cña bé m¸y phiªn m· (RNA
polymerase hoÆc mét protein kÕt hîp víi RNA polymerase).
• Vïng cã kh¶ n¨ng t¸c ®éng trùc tiÕp hay gi¸n tiÕp lªn nhiÔm s¾c chÊt thùc
149
• Vïng t¬ng t¸c víi c¸c protein liªn kÕt víi DNA ë gÇn vÞ trÝ ®iÒu hßa ®Ó
phèi hîp víi nhau ®iÒu hßa qu¸ tr×nh phiªn m·.
• Vïng ho¹t ®éng nh mét c¶m biÕn cña nh÷ng ®iÒu kiÖn sinh lý bªn trong
tÕ bµo.
H×nh 4.1. Tæng quan vÒ ®iÒu hßa biÓu hiÖn gen ë prokaryote vµ eukaryote
Sù c¶i biªn qu¸ tr×nh ®iÒu hßa cho phÐp tÕ bµo ®iÒu hßa mét c¸ch chñ ®éng
vÒ kh¶ n¨ng dinh dìng, k×m h·m sù x©m nhËp cña c¸c t¸c nh©n g©y bÖnh ... hay
nh÷ng t¸c ®éng cña m«i trêng xung quanh, nh÷ng thay ®æi cña c¸c giai ®o¹n ph¸t
triÓn cña tÕ bµo. Do ®ã, ph©n tö ®iÒu hßa - ®Æc biÖt lµ protein ®iÒu hßa ph¶i cã mét
vïng c¶m biÕn ®Ó t¬ng t¸c víi c¸c t¸c nh©n thÝch hîp trong m«i trêng tÕ bµo, ®Ó
vai trß ®iÒu hßa cña nã cã thÓ ®¸p øng víi nh÷ng nhu cÇu cña tÕ bµo ë thêi ®iÓm
hiÖn t¹i.
Nh×n chung, mÆc dï prokaryote vµ eukaryote cã nhiÒu c¬ chÕ ®iÒu hßa gen
gièng nhau, nhng cã mét sè ®Æc ®iÓm kh¸c nhau trong c¸c bíc thùc hiÖn. H×nh
4.1 tãm t¾t nh÷ng ®Æc ®iÓm gièng vµ kh¸c nhau. Gièng nhau lµ c¶ hai ®Òu sö dông
nh÷ng protein ®iÒu hßa, mµ nã liªn kÕt gÇn víi vïng m· hãa cho protein ®Ó ®iÒu
khiÓn qu¸ tr×nh phiªn m·. Tuy nhiªn, v× bé gen cña eukaryote lín h¬n vµ c¸ch s¾p
xÕp c¸c ®iÓm liªn kÕt còng nhiÒu h¬n, cho nªn møc ®é ®iÒu hßa cña eukaryote
phøc t¹p h¬n prokaryote. Sù kh¸c biÖt quan träng nhÊt lµ DNA cña eukaryote ®îc
®ãng gãi thµnh c¸c nucleosome h×nh thµnh nªn chÊt nhiÔm s¾c. ChÊt nµy lµ ®¬n
150
vÞ c¬ së cña nhiÔm s¾c thÓ, cÊu tróc nhiÔm s¾c thÓ cã tÝnh c¬ ®éng vµ lµ mét phÇn
cña ®iÒu hßa gen. Trong khi ®ã ë prokaryote, DNA kh«ng cã nucleosome.
- Nh÷ng tÝn hiÖu nµo g©y ra ®¸p øng lµm thay ®æi biÓu hiÖn cña mét gen?
- Sù ®iÒu hoµ biÓu hiÖn gen ®îc thùc hiÖn ë giai ®o¹n nµo trong chuçi ph¶n
øng ®i tõ qu¸ tr×nh sao chÐp ®Õn sù dÞch m·?
- C¬ chÕ ph©n tö cña sù ®iÒu hoµ biÓu hiÖn gen: sù ®iÒu hoµ ®îc tiÕn hµnh
ra sao? víi sù tham gia cña nh÷ng thµnh phÇn nµo?
Ta thö xem xÐt c¸c yÕu tè nµy qua hai m« h×nh ®iÒu hoµ ë prokaryote vµ
eukaryote.
151
H×nh 4.1. Hai kiÓu ®iÒu hoµ ho¹t ®éng gen ë prokaryote
1.1. operon c¶m øng m· ho¸ cho c¸c enzyme cña con
®êng dÞ ho¸
Qu¸ tr×nh dÞ ho¸ lµ qu¸ tr×nh trong ®ã c¸c chÊt h÷u c¬ phøc t¹p ®îc biÕn ®æi
thµnh c¸c thµnh phÇn ®¬n gi¶n dïng cho ho¹t ®éng tÕ bµo. §iÓn h×nh cho kiÓu
operon c¶m øng lµ operon lactose. TÝn hiÖu ®iÒu hoµ ë ®©y lµ ®êng lactose. Khi
kh«ng cã ®êng lactose, c¸c gen m· ho¸ cho c¸c enzyme chuyÓn ho¸ cho lactose
kh«ng ®îc biÓu hiÖn; chØ khi nguån hydrat carbon duy nhÊt trong m«i trêng lµ
®êng lactose, vi khuÈn míi thÝch øng b»ng c¸ch s¶n sinh c¸c enzyme cÇn cho sù
x©m nhËp vµ biÕn ®æi cña lactose trong tÕ bµo. Sù ®iÒu hoµ biÓu hiÖn gen x¶y ra
hoµn toµn ë møc ®é phiªn m·.
1.1.1. C¬ chÕ ®iÒu hoµ cña Operon lac
1.1.1.1. KiÓm so¸t tiªu cùc - vai trß cña yÕu tè k×m h·m
Operon lac ë E.coli lµ operon ®Çu tiªn ®îc ph¸t hiÖn vµ nghiªn cøu kh¸ chi
tiÕt tõ n¨m 1961 bëi Jacob vµ Monod. Ho¹t ®éng cña operon nµy ®îc kiÓm so¸t
theo c¬ chÕ tiªu cùc, tøc lµ phiªn m· trªn operon lac bÞ øc chÕ bëi yÕu tè k×m h·m:
protein lacI. Protein nµy lµ s¶n phÈm cña gen lacI n»m ngay phÝa tríc operon lac.
Protein LacI chØ cã ho¹t tÝnh khi tån t¹i ë d¹ng tetramer. CÊu tróc vµ c¬ chÕ kiÓm
so¸t operon lac ®îc tr×nh bµy ë h×nh 4.2.
152
Khi tån t¹i ë d¹ng tetramer, protein LacI cã hai vÞ trÝ t¬ng t¸c. VÞ trÝ thø
nhÊt t¬ng t¸c víi ®o¹n nucleotide thuéc vïng promoter cña operon lac. §o¹n nµy
chÝnh lµ operator (O). VÞ trÝ thø hai cã thÓ t¬ng t¸c víi c¬ chÊt β-galactosides,
hoÆc c¸c chÊt cã cÊu tróc ho¸ häc t¬ng tù c¬ chÊt, hoÆc mét sè ph©n tö ®Æc biÖt
nh isopropyl-thiogalactoside (IPTG). Thùc nghiÖm nhËn thÊy ho¹t ®éng cña
operon lac t¨ng rÊt m¹nh khi cã mÆt cña nh÷ng chÊt cã kh¶ n¨ng t¬ng t¸c víi vÞ
trÝ thø hai trªn protein LacI. C¸c chÊt cã ®Æc tÝnh kÝch thÝch ho¹t ®éng cña c¸c gen
®îc gäi chung lµ chÊt c¶m øng (inducer). Khi kh«ng cã chÊt c¶m øng trong m«i
trêng, qu¸ tr×nh phiªn m· trªn operon lac bÞ k×m h·m do protein LacI b¸m vµo
operator. Tuy nhiªn, khi cã mÆt chÊt c¶m øng, protein LacI t¬ng t¸c víi chÊt c¶m
øng nªn bÞ thay ®æi cÊu tróc kh«ng gian. Do ®ã, mét khi ®· t¬ng t¸c víi c¸c chÊt
c¶m øng th× protein LacI kh«ng cßn kh¶ n¨ng b¸m vµo vÞ trÝ øc chÕ n÷a. Lóc nµy
khëi ®Çu phiªn m· trªn operon lac kh«ng cßn bÞ k×m h·m nªn sè lîng ph©n tö
mRNA t¨ng nhanh.
1.1.1.2. KiÓm so¸t tÝch cùc - vai trß cña yÕu tè ho¹t ho¸
KiÓm so¸t biÓu hiÖn cña operon lac ë E.coli khi trong m«i trêng kh«ng cã
glucose ®îc xem lµ vÝ dô ®iÓn h×nh cho vai trß cña yÕu tè ho¹t ho¸ tham gia khëi
®Çu phiªn m·. Glucose lµ mét trong c¸c ®êng cÇn thiÕt cho tÕ bµo vi khuÈn ph¸t
triÓn. Nã ®îc tÕ bµo sö dông trùc tiÕp, nhanh chãng vµ ®¬n gi¶n nhÊt mµ kh«ng
yªu cÇu tæng hîp míi bÊt kú enzyme nµo. Khi glucose cïng víi mét sè ®êng
kh¸c nh lactose, arabinose cïng cã mÆt trong m«i trêng, tÕ bµo chØ sö dông
glucose vµ k×m h·m ho¹t ®éng cña c¸c operon liªn quan ®Õn chuyÓn ho¸ c¸c lo¹i
®êng kh¸c. HiÖn tîng nµy ®îc gäi lµ øc chÕ qu¸ tr×nh dÞ ho¸ (catabolite
reppression).
C¸c nhµ ho¸ häc ph¸t hiÖn r»ng, khi vi khuÈn thiÕu glucose, chóng sÏ t¨ng
cêng tæng hîp nucleotide cyclic adenosine monophosphate (cAMP). Sè lîng
cAMP t¨ng lªn gièng nh tÝn hiÖu b¸o ®éng vÒ nguy c¬ chuyÓn ho¸. H¬n n÷a, khi
bæ sung cAMP vµo m«i trêng cã chøa glucose vµ c¸c ®êng kh¸c th× ho¹t ®éng
cña c¸c operon liªn quan ®Õn chuyÓn ho¸ c¸c ®êng nµy kh«ng bÞ øc chÕ mµ ngîc
l¹i ®îc ho¹t ho¸. Nh vËy cAMP ®ãng vai trß quan träng bËt më ho¹t ®éng cña
mét sè gen ngay khi chóng ®ang ë tr¹ng th¸i bÞ k×m h·m.
Ph©n tÝch c¸c dßng tÕ bµo ®ét biÕn chØ cã kh¶ n¨ng sö dông glucose cho thÊy
cAMP cÇn t¬ng t¸c víi mét protein ®ång ho¹t ho¸ kh¸c. Thùc nghiÖm ®· ph©n
lËp ®îc protein nµy vµ gäi lµ protein ho¹t ho¸ qu¸ tr×nh dÞ ho¸ (catabolite activator
protein - CAP). Trong thÝ nghiÖm tæng hîp mRNA invitro ®èi víi operon lac, sè
153
lîng mRNA t¨ng rÊt nhiÒu khi thªm cAMP vµ CAP vµo ph¶n øng. NÕu chØ thªm
mét trong hai chÊt ®ã, sè lîng mRNA chØ chiÕm 5% so víi khi cã mÆt c¶ hai.
Nh vËy ngoµi viÖc bÞ ®iÒu khiÓn theo c¬ chÕ tiªu cùc bëi protein LacI, operon lac
cßn chÞu sù kiÓm so¸t theo c¬ chÕ tÝch cùc nhê phøc chÊt cAMP-CAP. Phøc nµy
t¬ng t¸c víi promoter g©y uèn cong sîi DNA, béc lé vÞ trÝ b¸m cho RNA
polymerase. Nh vËy operon lac chÞu sù kiÓm so¸t cña hai c¬ chÕ. Qu¸ tr×nh
chuyÓn ®æi gi÷a hai c¬ chÕ nµy phô thuéc vµo ®iÒu kiÖn trong tÕ bµo vµ m«i trêng.
H×nh 4.3. Sù ®iÒu hoµ cña operon lac theo c¬ chÕ tÝch cùc
Môc tiªu cña sù ®iÒu hoµ biÓu hiÖn gen ë ®©y lµ nh»m tiÕt kiÖm tèi ®a n¨ng
lîng. Th«ng thêng tÕ bµo sÏ sö dông nguån ®êng ®¬n gi¶n, cÇn Ýt n¨ng lîng
®Ó "tiªu ho¸" tríc nh ®êng glucose; chØ khi nµo kh«ng cã glucose, tÕ bµo míi
chuyÓn sang tiªu ho¸ lactose.
1.1.2. C¬ chÕ ®iÒu hoµ cña operon arabinose
C¬ chÕ ®iÒu hoµ d¬ng, c¶m øng ®îc t×m thÊy ë operon arabinose cña E.coli.
Arabinose lµ chÊt ®êng, cÇn ba enzyme (®îc m· ho¸ do c¸c gen araB, araA vµ
araD) cho sù biÕn dìng. Hai gen kh¸c n»m xa operon gãp phÇn ®a arabinose
vµo tÕ bµo. Gen ®iÒu hoµ araC n»m gÇn c¸c gen BAD. S¶n phÈm cña gen araC lµ
chÊt øc chÕ (repressor) cña operon khi kh«ng cã ®êng arabinose.
Tuy nhiªn, khi cã ®êng arabinose trong tÕ bµo, nã g¾n víi repressor (protein
araC) h×nh thµnh nªn phøc hîp activator (ho¹t ho¸) t¹o thuËn tiÖn cho sù phiªn m·
cña RNA polymerase.
154
Trªn thùc tÕ, c¸c nghiªn cøu cho thÊy c¬ chÕ ®iÒu hoµ nµy rÊt phøc t¹p. VÝ
dô: cAMP (cyclic adenosine monophosphate) vµ protein ho¹t ho¸ qu¸ tr×nh dÞ hãa
(catabolite gen activator protein) cßn ®îc gäi lµ CRP (cyclic AMP receptor
protein - protein thÓ nhËn cAMP) ®Òu tham gia vµo sù ®iÒu hoµ cña hÖ thèng
arabinose.
H×nh 4.4. C¬ chÕ ®iÒu hoµ cña operon arabinose. (a) khi cã mÆt arobinose, AraC liªn kÕt
víi vïng aral, phøc hîp CAP-cAMP liªn kÕt víi vïng aral ë phÝa ®èi diÖn víi AraC. §iÒu
nµy ®· kÝch thÝch qu¸ tr×nh phiªn m· araB, araA vµ araD. (b) khi kh«ng cã arabinose trong
m«i trêng, AraC liªn kÕt víi c¶ hai vïng aral vµ araO lµm cho DNA bÞ xo¾n chÆt h¬n, khi
®ã qu¸ tr×nh phiªn m· bÞ øc chÕ
1.2. operon k×m h·m liªn quan ®Õn con ®êng ®ång
ho¸
Qu¸ tr×nh ®ång ho¸ ngîc víi qu¸ tr×nh dÞ ho¸, lµ qu¸ tr×nh trong ®ã tÕ bµo
tæng hîp c¸c hîp chÊt phøc t¹p tõ c¸c thµnh phÇn ®¬n gi¶n. Do ®ã, vÊn ®Ò tiÕt
kiÖm n¨ng lîng ë ®©y ®îc ®¶o ngîc so víi trªn. §iÓn h×nh cña kiÓu operon
k×m h·m lµ operon tryptophan.
155
Hình 4.5. Cơ chế điều hoà phiên mã operon tryptophan.
a) khi có mặt acid amin tryptophan, protein ức chế được hoạt hoá. Protein ức chế bám vào vùng
operator, kìm hãm giai đoạn khởi đầu phiên mã. b) Khi nồng độ tryptophan giảm/không có
trong tế bào, protein ức chế không được hoạt hoá và không liên kết được với operator. Giai
đoạn khởi đầu phiên mã diễn ra bình thường.
* KiÓm so¸t khëi ®Çu phiªn m· theo c¬ chÕ suy gi¶m - vai trß cña cÊu
tróc kÑp tãc
Operon trytophan gåm 5 gen m· cho c¸c enzyme liªn quan ®Õn viÖc tæng hîp
Trp. Khi m«i trêng thiÕu amino acid nµy, ho¹t ®éng cña operon t¨ng gÊp 10 lÇn.
Nh vËy, sù cã mÆt cña Trp trong m«i trêng k×m h·m operon trp. Tuy nhiªn, Trp
kh«ng ph¶i lµ t¸c nh©n g©y øc chÕ biÓu hiÖn cña operon. Chóng gi÷ vai trß cña
chÊt ®ång øc chÕ (co-repressor) khi t¬ng t¸c víi repressor ®Ó ng¨n c¶n ho¹t ®éng
cña operon trp. Nh vËy, operon nµy ®îc ®iÒu khiÓn theo c¬ chÕ tiªu cùc do chÝnh
s¶n phÈm cuèi cïng cña operon. C¬ chÕ kiÓm so¸t ®Æc biÖt nµy ®îc gäi lµ øc chÕ
ph¶n håi (feedback inhibition). Ngoµi ra, operon trp cßn chÞu sù kiÓm so¸t ngay
khi phiªn m· ®· b¾t ®Çu theo c¬ chÕ suy gi¶m (h×nh 4.5).
Ph©n tÝch tr×nh tù nucleotide trªn ph©n tö mRNA polycistronic cña operon
trp cho thÊy ®o¹n nucleotide gåm 160 base n»m tríc ®iÓm dÞch m· ®Çu tiªn (m·
cho Methyonine) ®ãng vai trß ®iÒu khiÓn qu¸ tr×nh phiªn m· t¹o mRNA trªn
operon trp. §o¹n nµy ®îc gäi lµ ®o¹n g©y suy gi¶m "attenuator" cã chøa 4 chuçi
156
nucleotide ng¾n cã tr×nh tù t¬ng ®ång nhng ngîc chiÒu. Do ®ã, 4 chuçi nµy cã
thÓ liªn kÕt t¹o cÆp víi nhau, cÊu tróc "hairpin" (t¹m dÞch lµ cÊu tróc kÑp tãc). Tuy
nhiªn, do møc ®é t¬ng ®ång kh¸c nhau nªn khi x¶y ra liªn kÕt t¹o cÆp gi÷a chóng
th× tÝnh bÒn cña tõng cÆp kh¸c nhau. Tuú thuéc vµo sù cã mÆt cña Trp trong m«i
trêng mµ x¶y ra c¸c kiÓu liªn kÕt t¹o cÆp gi÷a hai chuçi t¹o ra c¸c cÊu tróc kÑp
tãc kh¸c nhau. Nhê ®ã, sù tæng hîp c¸c enzyme cÇn thiÕt cho ph¶n øng t¹o ra Trp
®îc kiÓm so¸t phï hîp víi sù ®ßi hái cña tÕ bµo ®èi víi lo¹i amino acid nµy.
157
Hình 4.7 Cơ chế điều hoà suy giảm phiên mã (attenuator). a. Cấu trúc operon
tryptophan. b) cấu trúc vùng trình tự điều hoà suy giảm phiên mã. a. cấu trúc bậc
2 của vùng attenuator khi được phiên mã. b. cơ chế điều hoà của attenuator khi
tryptophan trong tế bào không đáp ứng đủ nồng độ yêu cầu. c) cơ chế điều hoà
phiên mã của attenuator khi tryptophan trong tế bào đáp ứng đủ yêu cầu.
1.3. ®iÒu hßa phiªn m· b»ng nh©n tè sigma
158
ë mét sè gen kh«ng cã cÊu tróc promoter ®iÓn h×nh, hoÆc c¸c gen ho¹t ®éng
ë nh÷ng ®iÒu kiÖn kh¸c nhau, ®ßi hái RNA polymerase liªn kÕt víi c¸c yÕu tè
kh¸c nhau. Prokaryote chØ cã mét lo¹i RNA polymerase, nhng lâi enzyme cã thÓ
liªn kÕt víi c¸c yÕu tè sigma kh¸c nhau ®Ó phiªn m· trong nh÷ng ®iÒu kiÖn m«i
trêng kh¸c nhau. VÝ dô, ë ®iÒu kiÖn b×nh thêng, RNA polymerase liªn kÕt víi
yÕu tè σ 70 ®Ó thùc hiÖn qu¸ tr×nh phiªn m·. Khi nhiÖt ®é m«i trêng t¨ng cao,
RNA polymerase sÏ liªn kÕt víi yÕu tè σ 32 ®Ó nhËn biÕt promoter cña c¸c gen ho¹t
®éng khi nhiÖt ®é t¨ng bÊt thêng (c¸c gen chÞu shock nhiÖt).
Khi m«i trêng thiÕu nguån dinh dìng nit¬ th× yÕu tè σ 54 ®îc sö dông ®Ó phiªn
m·. §Æc biÖt RNA polymerase chøa σ 54 nhËn biÕt promoter tõ vÞ trÝ -24 ®Õn -12;
trong khi víi c¸c yÕu tè σ kh¸c, enzyme nhËn biÕt promoter tõ vÞ trÝ -35 vµ -10.
Dêng nh yÕu tè σ 54 cã vai trß nh yÕu tè phiªn m· ®èi víi gen eukaryote. C¸c
yÕu tè sigma tham gia cÊu tróc cña RNA polymerase ®Ó nhËn biÕt c¸c promoter
kh¸c nhau ®îc tr×nh bµy ë b¶ng 4.1.
B¶ng 4.1. C¸c yÕu tè sigma cña E.coli tham gia RNA polymerase khëi ®Çu
phiªn m· trong c¸c ®iÒu kiÖn m«i trêng kh¸c nhau.
Gen YÕu tè sigma §iÒu kiÖn sö dông
rpoD σ 70 B×nh thêng
rpoE σE Sèc nhiÖt
rpoH σ 32 Sèc nhiÖt
rpoN σ 54 ThiÕu nit¬
rpoS σS Stress
fliA σ 28 (σ F ) T¹o roi
159
Sù ®iÒu hoµ ë eukaryote cã nh÷ng kh¸c biÖt lín so víi ë prokaryote c¶ vÒ tÝn
hiÖu còng nh c¬ chÕ ®iÒu hoµ.
TÝn hiÖu ®iÒu hoµ ë c¸c c¬ thÓ ®a bµo lµ nh÷ng ph©n tö do nh÷ng tÕ bµo
chuyªn biÖt s¶n sinh, theo thÓ dÞch lu chuyÓn kh¾p c¬ thÓ. C¸c ph©n tö nµy t¸c
®éng lªn nh÷ng nhãm tÕ bµo "®Ých", ®iÒu chØnh sù biÓu hiÖn gen ë nh÷ng tÕ bµo
nµy theo ®óng ch¬ng tr×nh ®· ®Þnh s½n cho phï hîp víi sù ph¸t triÓn cña toµn c¬
thÓ. Cã hai nhãm ph©n tö ®iÒu hoµ chÝnh: c¸c hormone vµ c¸c nh©n tè t¨ng trëng
(Growth Factors - GF).
Bé gen eukaryote cã mét sè ®Æc thï: (1) kÝch thíc bé gen rÊt lín, (2) ph©n
tö DNA ®îc nÐn chÆt trong nh©n. Do vËy mµ hÖ thèng ®iÒu hoµ ®¬n gi¶n cña
prokaryote dùa vµo sù nhËn biÕt mét tr×nh tù DNA ng¾n bëi mét protein duy nhÊt
chØ trong giai ®o¹n phiªn m· kh«ng cßn phï hîp. Sù ®iÒu hoµ biÓu hiÖn gen ë
eukaryote thÓ hiÖn trong mäi giai ®o¹n tõ tríc lóc sao chÐp ®Õn sau khi dÞch m·.
C¬ chÕ ®iÒu hoµ còng thay ®æi theo tõng giai ®o¹n.
2.1. ®iÒu hoµ b»ng c¸ch biÕn ®æi cÊu tróc nhiÔm s¾c
chÊt hay cÊu tróc cña ph©n tö DNA
NhiÔm s¾c chÊt lµ cÊu tróc liªn kÕt cña DNA vµ protein trong thêi k× gi÷a hai
lÇn ph©n bµo. Khi sù ph©n chia nh©n b¾t ®Çu (k× tríc cña ph©n bµo), nhiÔm s¾c
chÊt xo¾n chÆt l¹i, cã d¹ng h×nh que ®Æc trng vµ ®îc gäi lµ nhiÔm s¾c thÓ. NhiÒu
c«ng tr×nh nghiªn cøu cho thÊy cã sù tån t¹i cña nh÷ng vïng "nh¹y c¶m" trong
nhiÔm s¾c chÊt. C¸c vïng nµy t¬ng øng víi c¸c gen ho¹t ®éng trong tÕ bµo. Chóng
cã cÊu tróc ®Æc trng khiÕn cho chóng trë nªn dÔ tiÕp cËn ®èi víi nhiÒu nh©n tè
nh c¸c enzyme thuû gi¶i hay c¸c enzyme sao chÐp vµ phiªn m·. Nh vËy møc ®é
®iÒu hoµ ®Çu tiªn lµ sù s¾p xÕp c¸c gen cÇn biÓu hiÖn vµo mét cÊu tróc nhiÔm s¾c
chÊt ®Æc trng thuËn lîi cho qu¸ tr×nh sao chÐp vµ phiªn m·.
160
Mét vÝ dô ®iÓn h×nh cho kiÓu ®iÒu hoµ nµy lµ gia ®×nh c¸c gen β-globine. C¸c
polypeptide β-globine lµ thµnh phÇn cña hemoglobine (huyÕt s¾c tè) trong hång
cÇu. C¸c gen m· ho¸ cho chóng (gåm α, β, γ, δ) ®îc s¾p xÕp liÒn nhau trong mét
cÊu tróc nhiÔm s¾c chÊt ®Æc trng. BiÓu hiÖn cña c¸c gen nµy ®îc ®iÒu chØnh phï
hîp víi tõng thêi k× ph¸t triÓn cña c¬ thÓ. ë ®Çu 5' cña cÊu tróc nhiÔm s¾c chÊt cã
mét tr×nh tù tªn lµ LCR (locus control region-vïng kiÓm so¸t c¸c locus); tr×nh tù
nµy chÞu tr¸ch nhiÖm ®iÒu hoµ biÓu hiÖn cña c¸c gen β-globine. Nã cã mang bèn
vÞ trÝ "nh¹y c¶m" cã kh¶ n¨ng tiÕp nhËn víi nhiÒu protein ®iÒu hoµ. Khi c¸c protein
®iÒu hoµ g¾n vµo LCR, cÊu tróc nhiÔm s¾c chÊt thay ®æi lµm cho c¸c promoter cña
c¸c gen t¬ng øng ®îc ph¬i bµy t¹o thuËn lîi cho sù ho¹t ®éng cña c¸c enzyme
phiªn m·.
Ngoµi ra b¶n th©n ph©n tö DNA cã thÓ chÞu nh÷ng biÕn ®æi ho¸ häc hoÆc
thËm chÝ nhiÒu ®o¹n cña nã cã thÓ ®îc s¾p xÕp l¹i:
- Sù methyl ho¸ tøc sù g¾n mét nhãm methyl lªn c¸c base cña nucleotide lµ
mét biÕn ®æi ho¸ häc tù nhiªn cña ph©n tö DNA x¶y ra ngay sau khi DNA ®îc
sao chÐp. ë eukaryote, sù methyl ho¸ cã thÓ x¶y ra trªn c¸c cytosine n»m trong
cÆp CG. NhiÒu nghiªn cøu cho thÊy sù methyl ho¸ c¸c cytosine trong vïng 5'
kh«ng phiªn m· cña c¸c gen sÏ lµm gi¶m ho¹t ®éng phiªn m· cña chóng. Nãi
chung, sù methyl ho¸ cßn ®ång nghÜa víi viÖc k×m h·m biÓu hiÖn cña c¸c gen.
KiÓu ®iÒu hoµ nµy mang tÝnh bæ sung, chØ thÊy ë c¸c ®éng vËt cã x¬ng vµ kh«ng
cã t¸c dông trªn mét sè gen.
161
- Mét sè gen chØ cã thÓ biÓu hiÖn khi cã sù s¾p xÕp l¹i tr×nh tù DNA. §iÓn
h×nh lµ c¸c gen cña "kiÓu giíi tÝnh" ë nÊm men.
ë nÊm men Saccharomyces cervisiae, tån t¹i hai d¹ng sèng: d¹ng lìng béi
vµ d¹ng bµo tö ®¬n béi. Cã hai lo¹i bµo tö ®¬n béi MATα vµ MATa h×nh thµnh
nªn ba lo¹i tÕ bµo lìng béi MATα/ MATα, MATα/MATa vµ MATa/MATa. ChØ
riªng lo¹i tÕ bµo MATα/MATa do sù kÕt hîp cña hai lo¹i bµo tö MATα vµ MATa
míi cã kh¶ n¨ng t¹o bµo tö trë l¹i. C¸c nghiªn cøu cho thÊy MATα vµ MATa lµ
hai allele cïng mét gen mµ lµ hai gen n»m trªn cïng mét nhiÔm s¾c thÓ. C¸c gen
nµy kh«ng ho¹t ®éng khi chóng n»m ë vÞ trÝ "chê" vµ chØ ®îc biÓu hiÖn khi chóng
®îc nh©n lªn vµ chuyÓn ®Õn mét vÞ trÝ ®Æc biÖt lµ locus MAT. Nh vËy bµo tö cã
kiÓu h×nh α hay a tuú thuéc kiÓu gen n»m ë locus MAT. Do ®ã, ë ®©y sù biÓu hiÖn
cña gen ®îc quy ®Þnh bëi sù s¾p xÕp l¹i c¸c tr×nh tù DNA trªn nhiÔm s¾c thÓ.
2.2. §iÒu hoµ ë møc ®é phiªn m·
162
KiÓu ®iÒu hoµ nµy c¬ b¶n gièng sù ®iÒu hoµ ë prokaryote, còng dùa trªn sù
t¬ng t¸c gi÷a c¸c protein ®iÒu hoµ víi c¸c tr×nh tù DNA chuyªn biÖt nhng phøc
t¹p h¬n rÊt nhiÒu. C¸c tr×nh tù DNA chuyªn biÖt ë ®©y ®îc gäi lµ c¸c tr×nh tù CIS
vµ c¸c protein ®iÒu hoµ t¬ng t¸c víi chóng lµ c¸c nh©n tè TRANS.
2.2.1. C¸c tr×nh tù DNA tham gia vµo qu¸ tr×nh ®iÒu hoµ biÓu hiÖn gen-
tr×nh tù CIS
Còng gièng nh ë prokaryote, vïng 5' cña gen kh«ng phiªn m· cña gen ®îc
gäi lµ promoter chÞu tr¸ch nhiÖm ®iÒu khiÓn sù phiªn m· cña gen. Tuy nhiªn, c¸c
tr×nh tù ®iÒu hoµ sù phiªn m· l¹i n»m tríc ®ã rÊt xa (cã thÓ c¸ch hµng ngµn cÆp
base). ChÝnh c¸c tr×nh tù nµy quyÕt ®Þnh sù biÓu hiÖn ®Æc trng cña gen, nghÜa lµ
gen ®îc biÓu hiÖn trong lo¹i tÕ bµo nµo, vµo thêi ®iÓm nµo, díi t¸c ®éng cña
nh÷ng nh©n tè ®iÒu hoµ nµo. Mét ®Æc ®iÓm chung cho c¸c tr×nh tù nµy lµ chóng
thêng cã cÊu tróc gåm hai phÇn ®èi xøng nhau, vÝ dô nh tr×nh tù ®¸p øng víi
hormone tuyÕn gi¸p (TRE - Thyroid hormone response element) díi ®©y:
AGGTCATGACCT
TCCAGTACTGGA
Së dÜ nh vËy lµ v× c¸c tr×nh tù nµy thêng tiÕp nhËn c¸c protein ®iÒu hoµ
(nh©n tè TRANS) díi d¹ng dimer (cÊu t¹o tõ hai tiÓu ®¬n vÞ). C¸c tr×nh tù nµy
gäi chung lµ c¸c tr×nh tù CIS.
Bªn c¹nh ®ã cßn cã mét nhãm tr×nh tù kh¸c còng tham gia vµo qu¸ tr×nh ®iÒu
hoµ biÓu hiÖn cña gen, ®ã lµ c¸c nhãm tr×nh tù khuÕch ®¹i (enhancer). C¸c
enhancer nµy cã t¸c dông lµm t¨ng biÓu hiÖn cña gen t¬ng øng. Kh¸c biÖt c¬ b¶n
cña nhãm nµy so víi c¸c tr×nh tù CIS lµ ho¹t tÝnh khuÕch ®¹i biÓu hiÖn cña chóng
kh«ng phô thuéc vµo (1) vÞ trÝ, chóng kh«ng nhÊt thiÕt ph¶i n»m ë ®Çu 5' cña c¸c
gen mµ cã thÓ hiÖn diÖn ë ®Çu 5', ®Çu 3' hay ngay trong intron cña gen; (2) híng,
sù ®¶o ngîc híng cña chóng (tõ 5'3' sang 3'5') kh«ng lµm mÊt ho¹t tÝnh
163
khuÕch ®¹i. Víi cïng c¸c ®Æc tÝnh ®ã nhng cã t¸c dông ngîc l¹i lµ nhãm c¸c
tr×nh tù dËp t¾t (silencer). C¬ chÕ ho¹t ®éng cña hai nhãm nµy cha ®îc biÕt râ.
2.2.2. C¸c nh©n tè protein tham gia vµo qu¸ tr×nh ®iÒu hoµ biÓu hiÖn
gen: c¸c nh©n tè TRANS
§Æc ®iÓm chung cña c¸c nh©n tè nµy lµ chóng bao gåm Ýt nhÊt hai vïng cÊu
tróc -chøc n¨ng chÝnh: (1) vïng chÞu tr¸ch nhiÖm g¾n nh©n tè TRANS vµo DNA;
(2) vïng t¸c ®éng lªn sù phiªn m·. C¸c vïng cÊu tróc-chøc n¨ng nµy ®éc lËp víi
nhau. Ngêi ta cã thÓ ghÐp hai tr×nh tù DNA cã nguån gèc kh¸c nhau: vïng t¸c
®éng phiªn m· lÊy tõ mét nh©n tè TRANS ë ®éng vËt cã vó vµ vïng g¾n vµo DNA
lÊy tõ nh©n tè TRANS ë nÊm men. KÕt qu¶ cuèi cïng lµ mét nh©n tè "lai" cã kh¶
n¨ng ho¹t ho¸ c¸c gen ®Ých t¬ng øng ë nÊm men (gen ®Ých lµ gen cã mang tr×nh
tù tiÕp nhËn ®Æc hiÖu nh©n tè TRANS). Ngoµi hai vïng võa kÓ, nhiÒu nh©n tè
TRANS cßn mang mét sè vïng phô kh¸c: nh vïng g¾n c¸c hormone, c¸c ion ....
T¬ng t¸c ®Æc hiÖu gi÷a tr×nh tù CIS vµ nh©n tè TRANS lµ kÕt qu¶ nh÷ng liªn kÕt
yÕu h×nh thµnh gi÷a c¸c nucleotide cña nh©n tè TRANS víi c¸c base cña tr×nh tù
CIS. Do cÊu tróc xo¾n kÐp cè ®Þnh trong kh«ng gian cña ph©n tö DNA nªn ®Ó ®¹t
®îc t¬ng t¸c t¬ng ®èi bÒn v÷ng, c¸c nh©n tè TRANS còng ph¶i cã cÊu tróc
kh«ng gian cè ®Þnh t¬ng øng. C¸c kÕt qu¶ nghiªn cøu cho thÊy c¸c nh©n tè
TRANS cã thÓ ph©n bè vµo bèn nhãm cÊu tróc:
- "Ngãn tay kÏm" (zinc-finger)
- "Xo¾n vßng xo¾n" (helix-turn-helix)
- "Xo¾n nót xo¾n" (helix-loop-helix)
- "D©y kÐo leucine" (leucine-zipper)
§Æc tÝnh chung cña c¸c cÊu tróc võa kÓ chóng lu«n g¾n lªn c¸c tr×nh tù CIS
díi d¹ng dimer (gåm hai monomer).
164
a b
c d
H×nh 4.8. Bèn lo¹i liªn kÕt gi÷a tr×nh tù cis víi nh©n tè trans, (a) ngãn tay kÏm, (b) xo¾n vßng
xo¾n, (c) xo¾n nót xo¾n, (d) d©y kÐo leucine
Mét vÝ dô ®iÓn h×nh lµ ®¹i gia ®×nh c¸c thô thÓ hormone trong nh©n (nuclear
hormone receptor), gåm hai nhãm: thô thÓ hormone tuyÕn gi¸p vµ thô thÓ hormone
steroid. Nh ta ®· thÊy, c¸c hormone lµ tÝn hiÖu ®iÒu hoµ ë eukaryote. Chóng t¸c
®éng lªn c¸c tÕ bµo ®Ých (tÕ bµo cã mang thô thÓ cña hormone t¬ng øng), lµm
biÕn ®æi biÓu hiÖn mét sè gen ®Æc trng ë c¸c tÕ bµo ®ã. T¸c ®éng cña chóng ®îc
thùc hiÖn th«ng qua thô thÓ cña hormone (hormone receptor). CÊu tróc thô thÓ bao
gåm nhiÒu vïng, trong ®ã ®Æc biÖt cã hai vïng ®îc biÕt râ nhÊt: vïng g¾n vµo
DNA víi cÊu tróc "ngãn tay kÏm", vµ vïng n¬i hormone g¾n vµo. C¬ chÕ t¸c ®éng
cña hormone cã thÓ ®îc m« t¶ nh sau: c¸c thô thÓ g¾n vµo tr×nh tù CIS cña c¸c
gen ®Ých; khi hormone ®Õn g¾n vµo vïng tiÕp nhËn hormone cña thô thÓ sÏ lµm
thay ®æi cÊu h×nh thô thÓ dÉn dÕn sù ho¹t ho¸ c¸c gen ®Ých. nh vËy trong vÝ dô
nµy, vïng t¸c ®éng phiªn m· cha ®îc x¸c ®Þnh râ, t¸c ®éng ®iÒu hoµ biÓu hiÖn
gen lµ kÕt qu¶ cña sù thay ®æi cÊu h×nh kh«ng gian cña thô thÓ nãi chung.
C¬ chÕ ®iÒu hoµ biÓu hiÖn gen ë eukaryote trong giai ®o¹n phiªn m· ®· b¾t
®Çu s¸ng tá. Kh«ng ®¬n gi¶n nh ë prokaryote chØ dùa vµo t¬ng t¸c CIS - TRANS,
sù ®iÒu hoµ ë eukaryote ngoµi t¬ng t¸c CIS - TRANS cßn dùa vµo c¸c t¬ng t¸c
protein - protein. Cã thÓ h×nh dung sù viÖc nh sau: protein TRANS mét mÆt g¾n
165
vµo tr×nh tù CIS ë ®Çu 5' cña gen ®Ých, mÆt kh¸c sÏ t¬ng t¸c víi nh÷ng protein
®iÒu hoµ kh¸c. C¸c protein ®iÒu hoµ nµy gåm hai lo¹i: lo¹i cã thÓ g¾n vµo c¸c tr×nh
tù DNA n»m c¸ch xa gen ®Ých vµ ®îc ®a l¹i ®ñ gÇn ®Ó t¬ng t¸c víi protein
TRANS nhê sù gÊp l¹i cña c¸c nhiÔm s¾c chÊt; lo¹i thø hai ®øng ®éc lËp, kh«ng
cã bÊt cø t¬ng t¸c nµo víi DNA.T¬ng t¸c gi÷a protein TRANS vµ c¸c protein
®iÒu hoµ kh¸c cïng víi sù gÊp l¹i cña nhiÔm s¾c chÊt sÏ t¹o nªn mét cÊu tróc thuËn
lîi cho sù g¾n enzyme RNA polymerase vµo promoter cña gen ®Ých. Lóc ®ã sù
phiªn m· cña gen ®Ých míi b¾t ®Çu.
Mét kiÓu ®iÒu hoµ kh¸c ë eukaryote còng dùa vµo t¬ng t¸c CIS - TRANS
nhng c¬ chÕ h¬i kh¸c lµ sù ®iÒu hoµ b»ng chän läc promoter. VÝ dô ®iÓn h×nh lµ
gen α-amilase, gen nµy cã hai promoter, mçi promoter cã ho¹t tÝnh phiªn m· kh¸c
nhau vµ chÞu tr¸ch nhiÖm phiªn m· mét lo¹i mRNA nhÊt ®Þnh, ®Æc trng cho m«.
Cßn sù chän läc promoter ho¹t ®éng l¹i tuú thuéc c¸c nh©n tè TRANS hiÖn diÖn
trong tõng lo¹i m« Êy. Nh vËy, chÝnh sù t¬ng t¸c gi÷a tr×nh tù CIS vµ nh©n tè
TRANS ®Æc trng cho m« sÏ quy ®Þnh lo¹i mRNA ®îc phiªn m· ë m« ®ã.
2.2.3. §iÒu hoµ ë møc ®é sau phiªn m·
Nh ta ®· thÊy ë ch¬ng tríc, mRNA võa ®îc phiªn m· kh«ng ®îc dÞch
m· ngay mµ cßn tr¶i qua mét giai ®o¹n "trëng thµnh". ë giai ®o¹n nµy tån t¹i
nhiÒu c¬ chÕ cho phÐp ®iÒu hoµ tÝnh chÊt còng nh sè lîng c¸c mRNA sÏ ®îc
dÞch m·.
2.2.3.1. HiÖn tîng "ghÐp nèi" kh¸c biÖt (alternative splicing)
HÖ thèng lo¹i bá intron vµ nèi exon cña mRNA s¬ cÊp ®Ó h×nh thµnh mRNA
trëng thµnh kh¸c nhau tuú thuéc tõng lo¹i tÕ bµo, m«. ViÖc ghÐp - nèi kh¸c biÖt
c¸c exon sÏ dÉn ®Õn sù h×nh thµnh c¸c mRNA kh¸c nhau. Th«ng thêng c¸c
mRNA nµy m· ho¸ cho c¸c protein cã chøc n¨ng t¬ng tù nhng ®«i khi chóng
l¹i cã chøc n¨ng hoµn toµn kh¸c nhau. Mét vÝ dô ®iÓn h×nh lµ kiÓu ®iÒu hoµ ë gen
calcitonine. Hai lo¹i protein ®îc dÞch m· tõ gen nµy lµ calcitonine ®îc t×m thÊy
trong tÕ bµo C cña tuyÕn gi¸p vµ CGRP lµ mét chÊt trung gian thÇn kinh ®îc t×m
thÊy trong n·o. Hai protein trªn lµ s¶n phÈm cña hai mRNA h×nh thµnh do sù ghÐp
nèi t¹o hai tæ hîp exon kh¸c nhau.
2.2.3.2. §iÒu hoµ biÓu hiÖn gen b»ng c¸ch t¨ng gi¶m thêi gian sèng cña
c¸c mRNA
KiÓu ®iÒu hoµ nµy mang tÝnh sè lîng mRNA cµng tån t¹i l©u trong tÕ bµo
th× cµng ®îc dÞch m· thµnh nhiÒu protein. HiÖn tîng nµy thÊy râ trong trêng
166
hîp mét sè tÕ bµo ung th. Qu¸ tr×nh tæng hîp protein tõ mét sè mRNA bÒn v÷ng
t¹o ra mét sè lîng rÊt cao c¸c protein t¬ng øng. §iÒu nµy gi¶i thÝch ®îc phÇn
nµo kh¶ n¨ng sinh s«i v« tËn cña c¸c tÕ bµo ung th.
2.2.3.3. Sù dù tr÷ c¸c mRNA trong tÕ bµo còng lµ mét ph¬ng tiÖn ®iÒu
hoµ
RÊt nhiÒu gen ®îc phiªn m· nhng kh«ng bao giê ®îc dÞch m·. Khi cã
mét tÝn hiÖu xuÊt hiÖn (hormone ch¼ng h¹n), bé m¸y dÞch m· lËp tøc ho¹t ®éng
tæng hîp protein tõ c¸c mRNA ®· tr÷ s½n.
Bªn c¹nh c¸c kiÓu ®iÒu hoµ gen th«ng dông võa kÓ, c¸c tÕ bµo eukaryote ®«i
khi cßn sö dông nhiÒu kiÓu ®iÒu hoµ kh¸c kh«ng ®Ò cËp ë ®©y v× hiÕm gÆp.
2.2.3.4. §iÒu hoµ trong giai ®o¹n dÞch m·
Sù ®iÒu hoµ biÓu hiÖn gen trong giai ®o¹n nµy cha ®îc biÕt râ. Dêng nh
nã cã liªn quan ®Õn giai ®o¹n dù tr÷ mRNA ®· ®Ò cËp ë trªn, v× sù dÞch m· chÝnh
lµ mét d¹ng tiªu thô dù tr÷ mRNA. Trong phÇn nµy chØ nªu mét vµi trêng hîp cô
thÓ ®· ®îc lµm s¸ng tá, trêng hîp ferritine vµ thô thÓ cña transferrine lµ c¸c
protein chÞu tr¸ch nhiÖm dù tr÷ vµ thu hót s¾t vµo tÕ bµo. Khi tÕ bµo gan ®îc ñ
víi s¾t, sù dÞch m· mRNA cña ferritine t¨ng cao trong khi thô thÓ transferrine
kh«ng ®îc dÞch m· (hay nãi ®óng h¬n nã bÞ ph©n huû). Ph©n tÝch cÊu tróc cña
hai lo¹i mRNA nµy cho thÊy chóng cã mang mét tr×nh tù cã tªn lµ IRE (iron
responsive element - nh©n tè ®¸p øng víi s¾t) n»m ë ®Çu 5' ®èi víi ferritine vµ ®Çu
3' ®èi víi thô thÓ transferrine. IRE cã kh¶ n¨ng tiÕp nhËn mét protein ®iÒu hoµ tuú
thuéc vµo sù hiÖn diÖn cña s¾t. Khi kh«ng cã s¾t, protein ®iÒu hoµ g¾n vµo c¸c IRE
ng¨n c¶n sù dÞch m· cña mRNA ferritine ®ång thêi l¹i gióp æn ®Þnh mRNA
transferrine. Ngîc l¹i, khi cã s¾t, protein ®iÒu hoµ t¸ch khái IRE, lóc ®ã, mRNA
ferritine ®îc dÞch m· cßn mRNA transferrine bÞ ph©n huû. §iÒu nµy gióp tÕ bµo
®¸p øng nhanh víi nång ®é s¾t ngo¹i bµo.
2.2.3.5. Møc ®é ®iÒu hoµ biÓu hiÖn gen cuèi cïng lµ trong giai ®o¹n sau
dÞch m·.
C¸c protein sau dÞch m· cã thÓ tr¶i qua nhiÒu biÕn ®æi ho¸ häc nh glycosyl
ho¸, phosphoryl ho¸, acetyl ho¸, ... Sù ®iÒu hoµ trong giai ®o¹n nµy lµ mét vÊn ®Ò
rÊt lín vµ phøc t¹p, vît qu¸ giíi h¹n cña quyÓn s¸ch nµy.
167
CHƯƠNG 6. CÁC KỸ THUẬT CƠ BẢN TRONG SINH HỌC
PHÂN TỬ
Việc tách chiết DNA bao gồm các bước cơ bản sau: (1) phá màng tế bào, (2) loại
protein, (3) tủa DNA. Để thu nhận DNA tinh sạch, người ta cần loại bỏ những thành phần
tạp nhiễm, mà quan trọng nhất là protein. Sự tách chiết dựa trên nguyên tắc hòa tan khác
nhau của các phân tử khác nhau (nucleic acid/protein) trong hai pha không hòa tan
(phenol, chloroform/nước). Các hóa chất dùng trong quy trình tách chiết là : (1) phenol,
guanidine thiocyanate có trong thành phần dung dịch Trizol là những chất biến tính
protein mạnh (trong đó có Dnase là enzyme phân hủy DNA và các protein khác ảnh
hưởng đến phản ứng PCR), phenol không hòa tan nucleic acid, khi xử lí với hai hóa chất
này, tế bào sẽ bị phá vỡ và giải phóng các thành phần nội bào: DNA, RNA, protein… (2)
chloroform: thường đi kèm với phenol, có tác dụng bổ sung và loại bỏ hoàn toàn dấu vết
phenol, chloroform cũng làm biến tính protein nhưng yếu hơn phenol. Sau khi ly tâm,
mẫu xử lí với Trizol sẽ phân tách thành hai lớp: Lớp dưới là phenol, lớp trên là nước
chứa DNA, phần protein bị biến tính sẽ nằm ở bề mặt phân cách hai lớp này và bị loại
bỏ. DNA trong phần dịch nổi ở trên sẽ được thu nhận bằng cách tủa với isopropanol có
bổ sung chất trợ tủa. Chất trợ tủa là 1 loại polymer có cấu trúc mạng lưới nên dễ dàng
bắt được các phân tử DNA, nhưng không ức chế phản ứng PCR. Trong điều kiện có chất
trợ tủa, quá trình tủa có thể xảy ra ở nhiệt độ phòng với thời gian ngắn (khoảng 10 phút),
nếu không có chất trợ tủa, quá trình tủa phải được thực hiện ở -200C hoặc -700C trong ít
nhất 1 giờ. DNA sau khi tủa sẽ được tủa và rửa lại 1 lần nữa với ethenol 70% và cuối
169
cùng sẽ được bảo quản trong TE 1X (Tris trong TE có vai trò ổn định pH và EDTA bắt
các ion Mg2+ làm cho Dnase không có khả năng hoạt động).
• Tủa bằng ethanol: Được thực hiện ở nồng độ muối cao, nồng độ ethanol cao (2-
2.5 thể tích ethanol/thể tích dung dịch cần tủa), nhiệt độ thấp thúc đẩy sự tủa.
• Tủa bằng isopropanol: Khác kiểu tủa trên là không cần muối, có thể sử dụng 0.8-
1 thể tích isopropanol/thể tích dung dịch cần tủa, những đoạn DNA thật ngắn dù ở
nồng độ cao cũng không tủa bằng cách này nên có thể loại bỏ chúng dễ dàng.
6.2.1. Phương pháp tách chiết acid nucleic bằng hệ dung môi
6.2.2. Phương pháp tách chiết acid nucleic bằng sắc ký cột.
6.2.3. Phương pháp tinh sạch acid nucleic
Lai phân tử axit nucleic và sử dụng các mẩu dò
Người ta lợi dụng khả năng nói trên của ADN để tạo ra các phân tử ADN lai bằng cách
làm lạnh từ từ hỗn hợp các ADN biến tính từ hai loài khác nhau. Kỹ thuật lai phân tử
(Hình 8.1) này đã được ứng dụng rộng rãi để xác định mức độ tương đồng ADN của
các nhóm phân loại khác nhau. Trên nguyên tắc, nếu mức độ tương đồng càng lớn thì
số lượng các đoạn lai càng lớn và ngược lại. Ví dụ, các thực nghiệm cho thấy có khoảng
25% tổng số ADN người và chuột có thể lai với nhau. Thông thường, mức độ lai được
xác định bằng các phương pháp sắc ký hoặc ly tâm, trong đó một loại ADN được đánh
dấu bằng đồng vị phóng xạ. Hiện giờ các kỹ thuật này được áp dụng khá rộng rãi trong
170
các nghiên cứu sinh học phân tử cũng như trong các lĩnh vực điều tra hình sự hoặc
phát hiện sớm một số bệnh phân tử để điều trị kịp thời.
171
Hình 8.12. Đại cương về quy trình tạo dòng gen (sản xuất protein) ở vi khuẩn.
Bây giờ ta xét quy trình kỹ thuật tạo dòng mà việc phát hiện ADN tái tổ hợp dựa
trên khả năng kháng thuốc do vector plasmid mang lại.
• Bước 1: Tinh chiết ADN
Giả sử đã tinh chiết được plasmid có chứa hai gen kháng ampicillin và tetracyclin, ký
hiệu là AmpR và TetR; và cũng giả thiết rằng gen TetR có chứa điểm cắt của EcoRI,
và phân tử ADN người có mang gen insulin.
172
Hình 8.13. Sơ đồ thí nghiệm tạo dòng vi khuẩn mang ADN tái tổ hợp, ở đây là gen insulin
người.
• Bước 2: Kiến tạo phân tử ADN tái tổ hợp in vitro
Trước tiên, dùng enzyme giới hạn đầu dính EcoRI (xem Bảng 8.1) để cắt vòng plasmid
tại giữa gen TetR và cho cắt ADN người, trong số các đoạn bị cắt có một đoạn mang
gen insulin. Sau đó đem trộn lẫn hai loại ADN trên trong ống nghiệm với ADN ligase.
Kết quả là có thể xảy ra ba trường hợp: (1) Plasmid tự nối lại thành mạch vòng như
lúc đầu; (2) Đoạn ADN tự nối lại thành mạch vòng; và (3) Plasmid tái tổ hợp có mang
gen insulin, và có thể mang một đoạn ADN không phải gen đó.
• Bước 3: Biến nạp và phát hiện dòng ADN tái tổ hợp chung
Đưa các ADN được xử lý vào các tế bào E. coli. Nếu phân tử có kích thước lớn người
ta phải xử lý vi khuẩn 'thể nhận' bằng chlorid calcium (CaCl2) để làm cho màng trở nên
thấm được dễ dàng. Sau đó đem cấy riêng rẽ các vi khuẩn trên môi trường có ampicillin
và theo dõi.
+ Nếu có xuất hiện khuẩn lạc, chứng tỏ vi khuẩn có mang gen AmpR, tức là chúng có
mang plasmid ban đầu (trường hợp 1) hoặc plasmid tái tổ hợp (trường hợp 3). Ngược
lại, nếu chỗ cấy không xuất hiện khuẩn lạc, chứng tỏ vi khuẩn mang ADN tự nối (trường
hợp 2).
+ Kế đó, đem cấy riêng rẽ các vi khuẩn thu được sang môi trường có tetracyclin. Nếu
có xuất hiện khuẩn lạc, chứng tỏ vi khuẩn có mang gen TetR nguyên vẹn (trường hợp
1). Nếu không có khuẩn lạc, chứng tỏ vi khuẩn đem cấy có mang ADN tái tổ hợp
(trường hợp 3); vì gen TetR bị bất hoạt do đoạn ADN xen vào. Bằng cách theo dõi
như vậy cho phép xác định được dòng vi khuẩn mang ADN tái tổ hợp, nhưng vẫn
chưa biết được đâu là các dòng đặc hiệu, nghĩa là có mang gen insulin.
• Bước 4: Chọn dòng ADN tái tổ hợp đặc hiệu
Về nguyên tắc, trong cả triệu phép thử mới có một tế bào mang gen mong muốn. Với
trường hợp trên, người ta có thể sử dụng phương pháp miễn dịch học bằng cách dùng
kháng thể chống lại protein được sinh ra bởi dòng vi khuẩn tương ứng (tức huyết thanh
tìm gen kháng insulin).
Hình 8.14 minh họa một công đoạn của quy trình thí nghiệm ADN tái tổ hợp ở vi
khuẩn E. coli khi sử dụng môi trường nuôi cấy có bổ sung ampicillin đối với ba kiểu
tế bào: tế bào có mang plasmid tái tổ hợp, tế bào chỉ mang plasmid pUC19 không tái
tổ hợp, và tế bào không biến nạp được (Hình 8.14a). Qua đêm sinh trưởng, các tế
bào nào có mang plasmid tái tổ hợp và plasmid không tái tổ hợp sẽ mọc thành các
khuẩn lạc (màu sắc tương ứng ở đây là trắng và xanh; Hình 8.14b). Sau khi chọn ra
các dòng có xen plasmid tái tổ hợp, đưa lên màng lọc và cho tiến hành lai hóa giữa
173
ARN và ADN (gen) của nó bằng các vật dò phóng xạ như đã nói ở trên. Sau đó đưa
sản phẩm lai phân tử này lên tấm phim X quang để định vị gen quan tâm từ dòng
tái tổ hợp (Hình 8.14c).
Nói chung, để tìm dòng lai đặc hiệu người ta sử dụng các mẫu dò là mARN hoặc rARN
đặc hiệu. Chẳng hạn, trong trường hợp nếu cần chọn dòng lai mang đoạn mARN cụ
thể, người ta đem cấy đều các dòng vi khuẩn có chứa ADN tái tổ hợp lên trên mặt
thạch của hộp petri chứa môi trường nuôi cấy. Sau đó đóng dấu lên màng lọc
nitrocellulose, và thu được bản sao. Việc xử lý bản sao bằng NaOH sẽ làm cho các tế
bào vi khuẩn tan vỡ tại chỗ (in situ), và các ADN thoát ra từ chúng sẽ bị biến tính
(các sợi đơn tách rời nhau) và dính vào màng lọc. Sau đó đem nhúng màng lọc này vào
mẫu mARN tương ứng đã được tinh khiết và đánh dấu phóng xạ (P32); mẫu ARN này
được gọi là vật dò phóng xạ (radioactive probe). Nếu dòng nào có chứa ADN mã hoá
cho mARN thì sẽ xảy ra hiện tượng lai giữa mARN và vùng sợi đơn tương ứng trên
ADN đó. Sau khi loại bỏ các mARN không lai được, người ta đặt một miếng phim
ảnh lên trên màng lọc; những vết ảnh xuất hiện trên ảnh phóng xạ tự ghi cho thấy vị
trí của dòng mang ADN bổ trợ với mẫu ARN. Từ đây có thể tách riêng các dòng lai đặc
hiệu để sử dụng cho các nghiên cứu tiếp theo.
6.3.1. Nhân dòng phân tử DNA/RNA trong ống nghiệm (các loại phản ứng PCR)
PCR: phương pháp nhân bản phân tử acid nucleic
Phản ứng chuỗi polymerase (PCR) là một kỹ thuật in vitro được sử dụng để sao
chép hoặc khuếch đại hàng tỉ lần của một vùn DNA đặc biệt chỉ với vài giờ. Sự khuếch
đại này là sự khởi đầu việc gắn trực tiếp đoạn oligonucleotide mồi vào sườn của vùng
DNA cần được khuếch đại. PCR được sử dụng trong chẩn đoán và nghiên cứu ở các
phòng thí nghiệm để tạo ra một lượng DNA đủ chất lượng đáp ứng cho các kiểm tra,
phân tích hoặc các thao tác kế tiếp. Độ nhạy của phản ứng cực kỳ cao, do vậy, PCR là
một phương pháp tiêu chuẩn sử dụng để chẩn đoán nhanh vi sinh vật. Trong thời gian
gần đây, các kit hoá chất và sự đa dạng về mặt bằng thiết bị làm tăng tốc độ, tính linh
hoạt và đơn giản hoá quy trình PCR. Tuy nhiên, vai trò quan trọng của kỹ thuật PCR
đóng góp bao nhiêu cho ngành Y Sinh? Câu trả lời tốt nhất có lẽ là những kết quả tìm
kiếm trên PubMed với từ khoá “PCR” hoặc “PCR” và “diagnosis”.
Kỹ thuật PCR được phát minh năm 1983 bởi Kary B. Mullis, với phát minh này,
Mullis đã được trao giải Nobel trong lĩnh vực hoá học năm 1993. Ứng dụng đầu tiên của
kỹ thuật PCR được Saiki và cộng sự thực hiện vào năm 1985, và khoảng 10 năm sau Cục
quản lý thực phẩm và thuốc của Mỹ sử dụng trong chẩn đoán các bệnh nhiễm trùng.
174
Những năm 1990 là thập kỷ của sự cải tiến hàng loạt các phương pháp khuếch đại acid
nucleic như: Qβ replicase, chuỗi phản ứng ligase, khuếch đại các sợi DNA thay thế,
khuếch đại các sợi RNA (các phân tử liên quan đến sự phiên mã), … Các ứng dụng của
PCR trong nghiên cứu và chẩn đoán cũng tiếp tục phát triển và cải tiến trong những năm
này. Trong khoảng thời gian ngắn, kỹ thuật PCR tạo ra cuộc cách mạng và trở thành một
kỹ thuật chuẩn mực/ thiết yếu trong menu các kỹ thuật của ngành vi sinh vật lâm sàng.
Mặc dù vậy, các chẩn đoán phân tử hiện nay được công nhận như một chuyên ngành
riêng trong ngành vi sinh vật lâm sàng.
2.2.2.1. Khuếch đại DNA bằng enzyme: các thành phần của phản ứng PCR
Hai cải tiến mới nhất để biến đổi kỹ thuật PCR thành công cụ sử dụng trong nghiên
cứu và chẩn đoán là DNA polymerse ổn nhiệt và thiết bị chu trình nhiệt. Về thiết bị,
chúng ta sẽ thảo luận ở phần kế tiếp. Kỹ thuật PCR đầu tiên sử dụng DNA polymerase
không chịu nhiệt. Vì vậy, sau mỗi một chu kỳ của phản ứng, cần phải bổ sung thêm một
lượng enzyme mới vào ống phản ứng. Với các enzyme DNA polymerase bền nhiệt (nhóm
enzyme được tách ra từ vi khuẩn suối nước nóng Thermus aquaticus) hoạt tính của
enzyme không bị ảnh hưởng khi nhiệt độ vượt trên 900C. Những enzyme này được gọi
là enzyme Taq DNA polymerase, hiện nay được sử dụng phổ biến trong các phản ứng
PCR.
Hình 2.6. Các bước thực hiện của phản ứng PCR
Tiến trình cơ bản của phản ứng PCR được mô tả tóm tắt ở hình 2.6. Vai trò của
DNA polymerase là một thành phần cơ bản của phản ứng PCR, bên cạnh các thành phần
175
khác gồm: các đoạn mồi oligonucleotide, các deoxynucleotide triphosphate (dNTPs), các
cation hoá trị 2 (như MgCl 2 ), DNA khuôn (hay thường gọi DNA đích) và dung dịch đệm
(thường là dung dịch Tris). Các mồi phản ứng thường là các đoạn oligonucleotide có
chiều dài khoảng 20 đến 25 base (nucleotide). Chúng được thiết kế để nhận diện trình tự
đặc hiệu của vùng trình tự đích (mong muốn) và xác định vùng cần nhân lên. Trong
khoảng nhiệt độ bắt cặp của mồi, hai mồi liên kết với các đầu đối diện trong vùng nhân
lên này, mỗi mồi bắt cặp bổ sung với sợi DNA đích. Các mồi phải được thiết kế một cách
cẩn thận để tránh mồi tự bắt cặp hoặc tạo cấu trúc dimer. Chiều dài và trình tự của mồi
sẽ quy định nhiệt độ biến tính (nóng chảy) và nhiệt độ bắt cặp của chúng. Khi bắt cặp với
DNA đích, các mồi sẽ tạo ra vị trí liên kết cho enzyme DNA polymerase, là enzyme cần
thiết cho quá trình nhân đôi sợi DNA khuôn. Đoạn DNA kép ngắn trên sợi khuôn khởi
động phản ứng sao chép DNA hoặc quá trình khuếch đại DNA. Trong bước tổng hợp,
enzyme Taq polymerase bổ sụng các nucleotide mới vào đầu 3’OH của mồi để tạo ra sợi
mới cho phân tử DNA. Hỗn hợp dNTPs có chứa đủ 4 loại nucleotide dATP, dGTP,
dTTP, dCTP có nồng độ của các nucleotide bằng nhau. Nếu trong phản ứng PCR sử dụng
enzyme uracil-N-glycosylase (UNG), nhằm tránh hiện tượng bội nhiễm, nguyên liệu
nucleotide sử dụng dUTP thay thế hoặc kết hợp với dTTP. Magie là một cofactor sử dụng
phổ biến trong các phản ứng PCR và cần thiết cho sự hoạt động của Taq DNA
polymerase. Nồng độ của Magie nên được tối ưu hoá cho từng phản ứng khi cần tối ưu
hoá các điều kiện phản ứng PCR.
Phản ứng PCR bao gồm 3 bước: biến tính, bắt cặp của mồi và kéo dài. Mỗi một
lần nhân lên cần thực hiện 3 bước như trên và thường được gọi là chu kỳ PCR. Quá trình
thực hiện này đòi hỏi các nhiệt độ khác nhau ở mỗi bước. Với các thiết bị gia nhiệt cho
phản ứng một cách tự động, các bước làm nóng và làm lạnh ở ống phản ứng thường diễn
ra trong thời gian ngắn. Hầu hết các quy trình (protocol) PCR sử dụng 3 mức nhiệt độ
khác nhau cho từng bước, ngoài ra còn có một số quy trình PCR sử dụng 2 mức nhiệt độ
khi nhiệt độ bắt cặp của mồi và kéo dài có mức nhiệt độ giống nhau. Số lượng chu kỳ
trong phản ứng PCR thường dao động trong khoảng 30-40 chu kỳ, đáp ứng cho việc tạo
ra đủ lượng bản sao để nghiên cứu và chẩn đoán.
Bước biến tính: ở nhiệt độ từ 930C đến 950C, hai sợi của phân tử DNA đích bị
tách ra, hoặc bị biến tính. Ở mức nhiệt độ này, tất cả các phản ứng enzyme xúc tác, như
phản ứng kéo dài chuỗi của chu kỳ trước, bị dừng lại.
176
Bước bắt cặp của mồi: là bước kế tiếp ngay sau bước biến tính, nhiệt độ của phản
ứng bị giảm xuống cho phép các sợi DNA có trình tự bổ sung bắt cặp với nhau. Nhiệt độ
bắt cặp rất đa dạng, phụ thuộc vào trình tự và nhiệt độ biến tính của các mồi
oligonucleotide, nhưng thường dao động trong khoảng 500C đến 600C. Ở mức nhiệt độ
bắt cặp này, các mồi thường ở trạng thái di động do hiệu ứng Brownian (là sự chuyển
động của các phân tử trong môi trường lỏng). Các liên kết ion được hình thành một cách
ổn định và phá vỡ trạng thái sợi đơn của mồi và DNA đích. Khi các mồi liên kết bổ sung
hoàn toàn với trình tự đích, tạo ra dạng liên kết ổn định đủ để cho DNA polymerase bám
vào và khởi động việc tổng hợp DNA tại đầu 3’OH của mỗi mồi.
Bước kéo dài (tổng hợp DNA): Sự kéo dài các mồi thường xảy ra ở nhiệt độ
720C. Taq DNA polymerase có nhiệt độ hoạt động tối ưu ở nhiệt độ này. Khi thêm các
base vào đầu 3’OH của mỗi mồi nhằm kéo dài đoạn sợi kép trên DNA, là kết quả của lực
liên kết ion giữa các base lớn hơn lực bẻ gẫy. Theo lý thuyết, sau mỗi chu kỳ nhân số
lượng DNA sẽ tăng gấp đôi. Do đó sau một vài chu kỳ nhiệt đầu tiên, sản phẩm đoạn
DNA đích của phản ứng thường có số lượng nhiều hơn phân tử DNA khuôn ban đầu và
có thể dự tính được sản phẩm DNA tạo ra sau khi thực hiện 30-40 chu kỳ phản ứng PCR
(hình 2.7). Tuy nhiên trong thực tế, do sự tác động của một số chất ức chế phản ứng PCR
và một số nhân tố khác, hiệu suất phản ứng có thể không bao giờ đạt 100%. Ngoài ra độ
chính xác của phản ứng PCR thường không được tin tưởng khi có hiệu suất khuếch đại
thấp và độ sai số DNA mẫu cao.
177
Hình 2.7. Kết quả nhân bản DNA của phản ứng PCR
Toàn bộ quá trình của phản ứng PCR được thực hiện trên một máy luân nhiệt –
thường được điều khiển bằng một chương trình trên máy tính/chương trình luân nhiệt với
các thông số gia tăng nhiệt độ và giảm nhiệt độ. Các máy luân nhiệt được hoàn thiện về
thiết kế bằng nhiều kỹ thuật mới, các thiết kế thiết bị gia nhiệt mới chủ yếu dựa trên hiệu
ứng Peltier. Trong các thiết kế này, sự biến thiên nhiệt độ dựa vào các chất bán dẫn được
làm nóng nhờ luống khí hoặc chất lỏng hoặc kết hợp Peltier và các công nghệ đối lưu.
Khi lựa chọn các thiết bị luân nhiệt mới cần chú ý các thông số chức năng gia nhiệt, khả
năng cập nhật các kỹ thuật PCR, việc đáp ứng các thay đổi block/module bên trong máy.
2.2.2.3. Xác định và phân tích sản phẩm của phản ứng PCR
Sản phẩm của phản ứng PCR thường là 1 đoạn hoặc nhiều đoạn DNA có chiều dài
xác định. Trước khi sản phẩm PCR được sử dụng cho các ứng dụng kế tiếp, nó nên được
178
phân tích. Trong các ứng dụng chẩn đoán, sự phân tích sản phẩm này thường được thực
hiện dựa trên các mẫu lấy từ từng bệnh nhân bằng cách xác định trực tiếp hoặc gián tiếp
trên mẫu bệnh phẩm. Trước tiên, các phản ứng được kiểm tra để xác định các sản phẩm
thực sự được tạo ra. Các kiểm tra này có thể sử dụng các mẫu dò (probe), hoặc các kỹ
thuật khác để xác định các thông số thiết kế cho phản ứng là phù hợp (mồi, trình tự đích,
điều kiện phản ứng tối ưu…) để tạo ra kích thước chính xác của sản phẩm mong muốn,
giảm thiểu tối đa sản phẩm phụ, hiệu quả hoạt động của mồi phải tối ưu … Sản phẩm
PCR cũng nên được đánh giá để đảm bảo chính xác sự khác biệt giữa đoạn được tạo ra.
Thường các phản ứng PCR áp dụng trong chẩn đoán thường sử dụng 1 cặp mồi. Vì vậy,
khi sản phẩm PCR tạo ra những đoạn có kích thước không mong muốn (sản phẩm phụ)
thường do các điều kiện phản ứng chưa được tối ưu (như thiết kế mồi chưa chính xác,
Taq hoặc MgCl 2 có nồng độ quá cao, nhiệt độ bắt cặp của mồi chưa được tối ưu). Sản
phẩm PCR được phân tích bằng kỹ thuật điện di agarose và nhuộm bằng ethidium
bromide hoặc chất nhuộm hữu cơ (Gelred, Sybrgreen …). Kích thước của các đoạn DNA
được xác định dựa trên thang phân tử của DNA. Kỹ thuật điện di agarose cũng được sử
dụng để xác định sản phẩm PCR nhưng nó không phải là phương pháp tiêu chuẩn để xác
định trình tự khuếch đại. Việc xác định các định dạng sản phẩm PCR được mô tả trong
các phương pháp xác định trình tự.
2.2.3. Các kỹ thuật PCR sử dụng trong in vitro để khuếch đại DNA
Hot-Start PCR là kỹ thuật PCR được phát minh bởi Kary Mullis xuất bản 1991,
được ứng dụng trong thực hành vào năm 1992. Các kỹ thuật Hot-start PCR tập trung vào
việc ức chế enzyme DNA polymerase hoạt động trong việc cài đặt phản ứng. Bằng cách
giới hạn hoạt tính polymerase trước khi gia tăng nhiệt độ của phản ứng PCR, sự khuếch
đại không đặc hiệu được giảm xuống và tăng hiệu suất khuếch đại gen đích. Điều này
được thực hiện bằng phân tách vật lý hoặc ức chế hoá học cho một hoặc nhiều hơn 1
thành phần phản ứng cho đến khi nhiệt độ cao khởi động hỗn hợp hoặc hoạt hoá để tạo
ra một hỗn hợp hoàn chỉnh.
Kỹ thuật hot-start PCR thủ công, các phản ứng thiều một thành phần cơ bản
(thường là DNA polymerase) được chuẩn bị và ủ ở nhiệt độ cao hơn 3 lần nhiệt độ bắt
cặp không đặc hiệu của mồi với khuôn. Chỉ trước khi hoàn thành chu kỳ, thành phần bị
thiếu sẽ được bổ sung vào phản ứng để cho phản ứng được thực hiện ở nhiệt độ cao hơn.
Quy trình này hạn chế sự bắt cặp không đặc hiệu của mồi và thường cải thiện hiệu suất
179
khuếch đại gen mong muốn. Phương pháp thủ công này thường gây mệt mỏi và nhàm
chán, khi các ống phải luôn được giữ ở 95-1000C. Ở nhiệt độ này, các ống rất khó cho
việc thao tác. Bên cạnh đó, việc mở ống để thêm các thành phần cuối cùng làm tăng nguy
cơ lây nhiễm bên ngoài hoặc nhiễm chéo giữa các ống. Để đơn giản hoá quy trình, các
ống được giữ trong thiết bị làm ấm theo chu kỳ (thiết bị gia nhiệt) trước khi bổ sung
thành phần cuối cùng.
Hot-start PCR cũng được thực hiện bằng cách tạo ra một rào cản vật lý giữa các
thành phần cơ bản, ví dụ như các mồi và khuôn hoặc enzyme và MgCl 2 . Rào cản này có
thể được tạo ra khi thêm sáp ong hoặc paraffin lên trên hỗn hợp chưa hoàn chỉnh của
phản ứng. Các thành phần còn lại của phản ứng PCR được đặt lên trên lớp sáp ong. Trong
bước biến tính đầu tiên, lớp sáp ong bị tan chảy, các dòng đối lưu trong dung dịch trộn
các thành phần cơ bản của phản ứng PCR với nhau.
Thêm vào đó, các phương pháp hot-start PCR bao gồm việc thay đổi hoá học của
Taq DNA polymerase và kháng thể ức chế Taq DNA polymerase. Kháng thể này liên kết
trực tiếp vào vị trí hoạt động của Taq DNA polymerase, ngăn cản enzyme này sao chép
DNA cho đến khi nhiệt độ tăng lên đến mức biến tính của chu kỳ (950C), tách kháng thể
ra khỏi enzyme. Những biến đổi về enzyme cần thiết cho chu kỳ biến tính khởi đầu kéo
dài hơn so với các Taq DNA polymerase ban đầu.
Tương tự với việc kiếm soát nhiệt độ và phân tách vật lý của các thành phần phản
ứng PCR, việc sử dụng đồng thời các dung môi và các enzyme cũng làm giảm hoặc hạn
chế sự bắt cặp không đặc hiệu của mồi. Sử dụng các đồng dung môi như là việc bổ sung
thêm dimethyl sulfoxide (DMSO) và formamide làm tăng độ chính xác bởi việc thay đổi
nhiệt độ nóng chảy của đoạn lai mồi-DNA khuôn. Glycerol cũng được cho là có chức
năng tương tự như các chất trên. Các đồng dung môi có nhiều tác động khác nhau lên
enzyme polymerase. Glycerol làm tăng sự bền nhiệt của Taq DNA polymerase, trong khi
formamide hạ thấp khả năng bền nhiệt của enzyme này. Enzyme uracil N-glycosylase
(UNG) được sử dụng trong phản ứng PCR như là một phần của hệ thống khử các sản
phẩm nhiễm dUTP trước khi chuyển sang thực hiện các bước trong quy trình PCR. Ưu
điểm khác của UNG là phân huỷ các sản phẩm được tạo ra trong các chu kỳ đầu của phản
ứng PCR, nhìn chung UNG hỗ trợ cho hoạt động của enzyme trong hot-start PCR.
PCR suy biến là phương pháp làm giảm sự đặc hiệu trong phân tích với các trình
tự khác nhau để xác định mặc dù có sự khác nhau về trình tự trong vùng bắt cặp với mồi.
Thay vì sử dụng một cặp mồi đơn bắt cặp với một trình tự đặc hiệu trên khuôn, tập hợp
các mồi suy biến mà có chứa một vài cặp mồi được thay đổi một hoặc nhiều hơn một
nucleotide, hoặc là các mồi này có chứa các base không đặc hiệu, như là inosine ở vị trí
suy biến (divergent). Trong chẩn đoán vi sinh, sự cần thiết cho việc chẩn đoán mở rộng
có lợi hơn. Ví dụ, chi Norovirus có hàng tá các chủng chỉ khác biệt nhau tương đối ở
vùng biến đổi cao. Nếu chỉ sử dụng 1 cặp mồi đơn, việc bắt cặp của mồi với khuôn sẽ
thiếu sự bắt cặp bổ sung đáp ứng hết cho các chủng, và giá trị chẩn đoán bị thu hẹp. RT-
PCR suy biến cũng được sử dụng thành công để xác định một dãy mở rộng các Norovirus.
Vì các virus thường thiếu các vùng bảo tồn cao như là các gen rDNA, các PCR suy biến
thường được sử dụng trong chẩn đoán các nhân tố gây bệnh.
Nested và heminested PCR được thiết kế để tăng độ nhạy của phản ứng PCR thông
qua việc sử dụng trực tiếp sản phẩm PCR đầu tiên để tạo ra sản phẩm PCR thứ hai. Nested
PCR sử dụng hai dãy mồi khuếch đại và hai chương trình PCR độc lập. Các mồi trong
dãy mồi thứ 2 (nested) bắt cặp với vùng trình tự bên trong của các sản phẩm PCR được
tạo ra do các mồi trong dãy mồi thứ nhất. Trong kỹ thuật heminested PCR, vòng PCR
thứ 2 sử dụng 1 trong các mồi của vòng thứ nhất và một mồi mới, là mồi bên trong/nội
tại. Vòng khuếch đại thứ 2 này thường ngắn hơn vòng khuếch đại thứ nhất (hình 2.8).
Ưu điểm của nested PCR làm tăng độ nhạy và tính đặc hiệu của phản ứng, vì các mồi nội
tại chỉ bắt cặp khi có sự khuếch đại sản phẩm tương ứng với các trình tự mong muốn.
Nhược điểm của nested PCR là kéo dài thời gian và chi phí cho xét nghiệm, thêm vào đó
181
tăng nguy cơ nhiễm khi chuyển sản phẩm vòng khuếch đại đầu tiên sang ống thứ hai. Để
giảm thiểu các nguy cơ nhiễm mẫu, thêm sáp ong hoặc dầu khoáng vào hỗn hợp phản
ứng PCR thứ 2 và thiết kế nhiệt độ bắt cặp của dãy mồi thứ 2 với nhiệt độ cao hơn dãy
thứ nhất thường là 2 cải tiến được sử dụng nhiều nhất.
Hình 2.8. Các đặc điểm của phản ứng nested PCR
Trong kỹ thuật multiplex PCR, hai hoặc nhiều hơn hai trình tự DNA đặc trưng có
trong cùng một mẫu được nhân lên đồng thời. Các mồi sử dụng trong các phản ứng
multiplex phải được thiết kế tỉ mỉ cho các nhiệt độ bắt cặp của mồi phải tương tự nhau
và tránh trường hợp bắt cặp bổ sung không đặc hiệu và tạo cấu trúc dimer. Phản ứng
multiplex PCR cần các điều kiện tối ưu cho bắt cặp giữa mồi và khuôn tạo ra hiệu suất
khuếch đại cao nhất. Một số kit thương mại có hiệu quả khuếch đại thường ít khác nhau
giữa các trình tự khác nhau hoặc không cần các điều kiện tối ưu cho mồi. Điều này là do
các thành phần trong đệm của phản ứng có khả năng mở rộng dãy nhiệt độ bắt cặp tối ưu
cho mồi. Các kiểm nghiệm chẩn đoán bằng multiplex PCR được sử dụng ngày càng phổ
biến ở các phòng thí nghiệm để khuếch đại DNA đích với một nội đối chứng sử dụng sử
dụng một dãy mồi và các trình tự DNA quan tâm sử dụng với một dãy mồi thứ hai. Các
mồi nội đối chứng được sử dụng để xác định sự hoạt động của phản ứng PCR. Kết quả
dương tính với các mồi đối chứng nội được xác định là các điều kiện tối ưu cho phản ứng
PCR hoạt động (mồi, khuôn, các nhân tố khác). Multiplex PCR cũng được sử dụng trong
các phòng thí nghiệm lâm sàng để xác định nhanh chóng các trình tự DNA của hai hoặc
nhiều hơn của một vài sinh vật khác nhau trong cùng một phản ứng PCR. Các mồi được
182
thiết kế để khuếch đại một sản phẩm DNA có kích thước duy nhất, có nhiệt độ biến tính
đặc trưng hoặc có trình tự liên kết đặc trưng cho mẫu dò. Điều này cho phép xác định và
phân lập được các vi sinh vật khác nhau trong cùng một mẫu. Sự thất bại của phản ứng
multiplex PCR có thể là do độ nhạy thấp, không đặc trưng cho đích nhân lên.
Reverse Transcription (RT) –PCR là một kỹ thuật khuếch đại phân tử đích RNA.
Vì các DNA polymerase cần sử dụng sợi DNA kép làm khuôn, RNA phải được phiên
mã thành sợi DNA bổ sung (c-DNA) ở vòng PCR đầu tiên bởi enzyme phiên mã ngược.
Kế tiếp cDNA được sử dụng làm khuôn cho chu kỳ PCR tạm thời đầu tiên để tạo khuôn
cDNA sợi kép (hình 2.9). Việc sử dụng kết hợp giữa RT và PCR để khuếch đại RNA
đích được mô tả lần đầu năm 1987. Những nghiên cứu đầu tiên gọi phản ứng này là RT-
PCR, RNA-PCR, RNA phenotyping, và phản ứng khuếch đại kiểu hình thông tin. RT-
PCR là một kỹ thuật quan trọng trong chẩn đoán nhiễm trùng và các bệnh di truyền, là
kỹ thuật chủ chốt được sử dụng trong xác định và định lượng RNA như việc đo lường sự
biểu hiện của gen.
Hai enzyme phiên mã ngược được sử dụng phổ biến nhất là Moloney murine
leukemia virus (M-MuLV) reverse trancriptase và avian myeloblastosis virus (AMV)
reverse trancriptase. Cả hai enzyme này đều giống nhau về chức năng cơ bản nhưng khác
nhau ở một số đặc điểm, như nhiệt độ và pH tối ưu. Ngoài 2 enzyme này, các biến thể
khác của chúng cũng được sử dụng trong phòng thí nghiệm chẩn đoán. Những enzyme
này được tối ưu hoá trước trong các kit RT-PCR thương mại.
Việc phiên mã ngược trong in vitro sử dụng các mồi trực tiếp. Một mồi đơn được
sử dụng để tạo ra cDNA, và có thể là một mồi trong cặp mồi của phản ứng PCR kế tiếp
(trình tự đặc hiệu) hoặc có thể sử dụng đoạn oligonucleotide ngẫu nhiên (mồi ngẫu
nhiên). Sự đặc hiệu không cần thiết cho phản ứng phiên mã ngược. Các oligonucleotide
ngẫu nhiên được sử dụng phổ biến trong các kit RT-PCR hoặc được sử dụng cho tất cả
RNA đích.
Thông thường, bước RT được thực hiện trong một ống phản ứng độc lập chỉ chứa
các thành phần cần thiết cho sự phiên mã ngược. Sau khi thực hiện RT, một phần nhỏ
được chuyển vào ống phản ứng PCR, và ống này được thực hiện PCR để khuếch đại.
Nhìn chung việc phân tách hai giai đoạn vào 2 ống riêng biệt thường tạo ra sự bất tiện và
nguy cơ lây nhiễm chéo. Hiện này, các thí nghiệm RT-PCR thường được thiết kế trong
183
một ống với hai enzyme hoặc 1 enzyme. Thuật ngữ RT-PCR thường được sử dụng để
mô tả cho phản ứng PCR phiên mã ngược (reverse transcription PCR) hoặc real-time
PCR.
Hình 2.9. Kết quả nhân bản DNA của phản ứng RT-PCR
PCR định lượng là phản ứng PCR xác định chính xác số lượng phân tử acid nucleic
có trong mẫu. Khuôn được sử dụng trong phản ứng có thể là DNA hoặc RNA. Kết quả
định lượng của phản ứng PCR là công cụ hữu ích cho việc đánh giá các liệu pháp điều
trị nhiễm virus, kiểm soát các triệu chứng lâm sàng hoặc dự đoán sự bùng nổ của các
bệnh nhiễm trùng. Các test định lượng PCR thương mại được sử dụng chẩn đoán các
nhiễm trùng virus như: HIV, viêm gan C, viêm gan B, … Việc định lượng acid nucleic
của phản ứng có thể sử dụng giá trị tuyệt đối hoặc giá trị tương quan dựa vào đường
chuẩn. Việc định lượng bằng giá trị tương quan thường dựa vào dãy pha loãng mẫu, và
được khuếch đại đồng thời với mẫu. Kết quả được biểu diễn bằng tỉ số của các tín hiệu
các trình tự đặc trưng với mẫu đối chứng nội. Với các giá trị tương quan đại diện cho giá
trị của từng sản phẩm khuếch đại từ trình tự đặc biệt của mẫu. PCR tương đối sử dụng
các cặp mồi cho mẫu nội đối chứng mà nó được trộn lẫn trong cùng một phản ứng PCR
với các trình tự mồi đặc biệt. Mồi đối chứng nội và các mồi trình tự đặc trưng phải phù
184
hợp với nhau, không tạo ra các band phụ hoặc lai với nhau. Các tìn hiệu từ đối chứng đội
được sử dụng để chuẩn hoá dữ liệu của mẫu thành các giá trị cho hiệu suất khuếch đại
hoặc biến thể của phản ứng RT. Các đối chứng nội thường được sử dụng nhiều nhất là
các gen hoặc các mRNA của nhóm gen quản gia (housekeeping genes) β-actin, GAPDH
và 18S rDNA.
RT-PCR cung cấp giá trị định lượng tuyệt đối của acid nucleic đích trong mẫu.
Một đối chứng nội hoặc đường chuẩn được thêm vào với nồng độ đã biết trước và được
khuếch đại đồng thời với các trình tự đích trong mẫu. Sau khi khuếch đại và được phân
tích, số lượng của sản phẩm hoặc tín hiệu được tạo ra bởi đối chứng nội được quy thành
phương trình chuẩn cho số lượng bản sao của trình tự. Phương trình của đối chứng nội
này được sử dụng để xác định số lượng bản sao của các vùng trình tự đích.
Các giá trị được định lượng trong phản ứng real-time PCR cho phép so sánh với
các đường cong chuẩn bên ngoài để định lượng bản sao của mẫu. Các đối chứng nội
thường không cần thiết sử dụng trong trường hợp này. Bởi vì việc định lượng mẫu được
thực hiện ở từng chu kỳ, trong quá trình tích luỹ theo hằng số mũ của PCR, hiệu suất ổn
định giữa các mẫu. Các phản ứng PCR thông thường định lượng sản phẩm sau khi kết
thúc phản ứng. Vì các sản phẩm PCR được định lượng trong quá trình khuếch đại, việc
định lượng này thường chính xác hơn so với các PCR truyền thống. Với những đặc điểm
này, các mẫu đối chứng ngoại – các acid nucleic được xác định sẵn số lượng bản sao –
được sử dụng thay thế cho mẫu đối chứng nội. Các mẫu đối chứng ngoại được sử dụng
để tạo ra đường cong chuẩn cho phản ứng PCR. Real-time PCR tạo ra điểm ngưỡng chu
kỳ (C T ) hoặc điểm giao nhau (C P ) cho mỗi mẫu. Điểm ngưỡng C T của các mẫu từ bệnh
nhân sẽ được phân tích lại một lần nữa với các đường cong chuẩn để xác định số lượng
bản sao từ DNA hoặc RNA đích.
185
thường bằng nhau trong master Mix nhằm ngăn
cản các base bắt cặp sai.
0.2 - 0.1 Mồi Là những đoạn DNA ngắn (20 – 30 base) có khả
µM năng liên kết với DNA khuôn để tạo điều kiện cho
Taq DNA polymerase tổng hợp sợi DNA. Các mồi
đặc hiệu và phổ biến đều được sử dụng.
1.5 – 2.5 Taq polymerase Enzyme chịu nhiệt, được sử dụng để tổng hợp
µU DNA.
< 1.0 µg DNA khuôn Là phân tử DNA được khuếch đại bởi phản ứng
PCR
Master mix buffer thường được lữu giữ ở dung dịch có độ đặc 10X (100mM Tris-HCl,
pH 8.3, 500mM KCl, 1.5mM MgCl 2 ) khi sử dụng thường được pha loãng thành 1X.
Nước cất và đệm Master mix thường được bảo quản ở nhiệt độ phòng. Các thành phần
khác (dNTPs, mồi, enzyme, … ) phải được bảo quản ở -200C hoặc theo khuyến cáo của
công ti cung cấp.
187
Hình 8.13. Sơ đồ thí nghiệm tạo dòng vi khuẩn mang ADN tái tổ hợp, ở đây là gen insulin
người.
• Bước 2: Kiến tạo phân tử ADN tái tổ hợp in vitro
Trước tiên, dùng enzyme giới hạn đầu dính EcoRI (xem Bảng 8.1) để cắt vòng plasmid
tại giữa gen TetR và cho cắt ADN người, trong số các đoạn bị cắt có một đoạn mang
gen insulin. Sau đó đem trộn lẫn hai loại ADN trên trong ống nghiệm với ADN ligase.
Kết quả là có thể xảy ra ba trường hợp: (1) Plasmid tự nối lại thành mạch vòng như
lúc đầu; (2) Đoạn ADN tự nối lại thành mạch vòng; và (3) Plasmid tái tổ hợp có mang
gen insulin, và có thể mang một đoạn ADN không phải gen đó.
• Bước 3: Biến nạp và phát hiện dòng ADN tái tổ hợp chung
Đưa các ADN được xử lý vào các tế bào E. coli. Nếu phân tử có kích thước lớn người
ta phải xử lý vi khuẩn 'thể nhận' bằng chlorid calcium (CaCl2) để làm cho màng trở nên
thấm được dễ dàng. Sau đó đem cấy riêng rẽ các vi khuẩn trên môi trường có ampicillin
và theo dõi.
+ Nếu có xuất hiện khuẩn lạc, chứng tỏ vi khuẩn có mang gen AmpR, tức là chúng có
mang plasmid ban đầu (trường hợp 1) hoặc plasmid tái tổ hợp (trường hợp 3). Ngược
lại, nếu chỗ cấy không xuất hiện khuẩn lạc, chứng tỏ vi khuẩn mang ADN tự nối (trường
hợp 2).
+ Kế đó, đem cấy riêng rẽ các vi khuẩn thu được sang môi trường có tetracyclin. Nếu
có xuất hiện khuẩn lạc, chứng tỏ vi khuẩn có mang gen TetR nguyên vẹn (trường hợp
1). Nếu không có khuẩn lạc, chứng tỏ vi khuẩn đem cấy có mang ADN tái tổ hợp
(trường hợp 3); vì gen TetR bị bất hoạt do đoạn ADN xen vào. Bằng cách theo dõi
188
như vậy cho phép xác định được dòng vi khuẩn mang ADN tái tổ hợp, nhưng vẫn
chưa biết được đâu là các dòng đặc hiệu, nghĩa là có mang gen insulin.
• Bước 4: Chọn dòng ADN tái tổ hợp đặc hiệu
Về nguyên tắc, trong cả triệu phép thử mới có một tế bào mang gen mong muốn. Với
trường hợp trên, người ta có thể sử dụng phương pháp miễn dịch học bằng cách dùng
kháng thể chống lại protein được sinh ra bởi dòng vi khuẩn tương ứng (tức huyết thanh
tìm gen kháng insulin).
Hình 8.14 minh họa một công đoạn của quy trình thí nghiệm ADN tái tổ hợp ở vi
khuẩn E. coli khi sử dụng môi trường nuôi cấy có bổ sung ampicillin đối với ba kiểu
tế bào: tế bào có mang plasmid tái tổ hợp, tế bào chỉ mang plasmid pUC19 không tái
tổ hợp, và tế bào không biến nạp được (Hình 8.14a). Qua đêm sinh trưởng, các tế
bào nào có mang plasmid tái tổ hợp và plasmid không tái tổ hợp sẽ mọc thành các
khuẩn lạc (màu sắc tương ứng ở đây là trắng và xanh; Hình 8.14b). Sau khi chọn ra
các dòng có xen plasmid tái tổ hợp, đưa lên màng lọc và cho tiến hành lai hóa giữa
ARN và ADN (gen) của nó bằng các vật dò phóng xạ như đã nói ở trên. Sau đó đưa
sản phẩm lai phân tử này lên tấm phim X quang để định vị gen quan tâm từ dòng
tái tổ hợp (Hình 8.14c).
Nói chung, để tìm dòng lai đặc hiệu người ta sử dụng các mẫu dò là mARN hoặc rARN
đặc hiệu. Chẳng hạn, trong trường hợp nếu cần chọn dòng lai mang đoạn mARN cụ
thể, người ta đem cấy đều các dòng vi khuẩn có chứa ADN tái tổ hợp lên trên mặt
thạch của hộp petri chứa môi trường nuôi cấy. Sau đó đóng dấu lên màng lọc
nitrocellulose, và thu được bản sao. Việc xử lý bản sao bằng NaOH sẽ làm cho các tế
bào vi khuẩn tan vỡ tại chỗ (in situ), và các ADN thoát ra từ chúng sẽ bị biến tính
(các sợi đơn tách rời nhau) và dính vào màng lọc. Sau đó đem nhúng màng lọc này vào
mẫu mARN tương ứng đã được tinh khiết và đánh dấu phóng xạ (P32); mẫu ARN này
được gọi là vật dò phóng xạ (radioactive probe). Nếu dòng nào có chứa ADN mã hoá
cho mARN thì sẽ xảy ra hiện tượng lai giữa mARN và vùng sợi đơn tương ứng trên
ADN đó. Sau khi loại bỏ các mARN không lai được, người ta đặt một miếng phim
ảnh lên trên màng lọc; những vết ảnh xuất hiện trên ảnh phóng xạ tự ghi cho thấy vị
trí của dòng mang ADN bổ trợ với mẫu ARN. Từ đây có thể tách riêng các dòng lai đặc
hiệu để sử dụng cho các nghiên cứu tiếp theo.
Ứng dụng
Ứng dụng trong nghiên cứu các bộ gen
Việc tách dòng tái tổ hợp cho phép nhận được một số lượng lớn bất kỳ gen hoặc vùng
điều hoà nào để tiến hành phân tích trình tự nucleotide, xác định các vùng chức năng và
chỉ ra các cơ chế hoạt động của chúng. Nhờ đó đã đưa lại những hiểu biết mới về tổ
189
chức và hoạt động của các bộ gen prokaryote (như các khởi điểm tái bản, các vùng điều
hoà phiên mã, các gen nhảy v.v.) và ở các bộ gen eukaryote (như các centromere,
telomere, các gen phân đoạn, các gen giả, ADN lặp lại v.v.) như đã được thảo luận ở
các chương trước.
Bằng các thí nghiệm tạo dòng plasmid tái tổ hợp kinh điển ở vi khuẩn E. coli, và bằng
cách cải tiến sử dụng nhiễm sắc thể nấm men nhân tạo này (YAC), người ta đã thành
lập các thư viện gen (gene library) hay thư viện bộ gen (genomic library) để trên cơ sở
đó tiến hành lập bản đồ vật lý và xác định trình tự ADN bộ gen của nhiều sinh vật khác
nhau, kể cả bộ gen người. Nếu như vào năm 1977, F.Sanger xác định đầy đủ các trình
tự phage φX174 (5386 nucleotide, 9 gen) và phage G4 (5577 nucleotide, 10 gen), thì
đến nay người ta xác định và lập bản đồ cho các ADN có kích thước lớn hơn nhiều;
ví dụ: bộ gen phage lambda gồm 48.502 cặp bazơ với khoảng 61 gen (1983) v.v...
Đáng kể là, Dự án Bộ gen Người (HGP) đã chính thức đi vào hoạt động từ 1990 do
J.Watson chủ trì cùng với sự cộng tác của nhiều nhà khoa học trên thế giới. Việc phân
tích trình tự bộ gen người hoàn thành vào 4/2003, cho thấy bộ gen của chúng ta có
trình tự đầy đủ gồm 3.164.700.000 cặp bazơ, chứa đựng khoảng 25.000 gen mã hóa
protein chịu trách nhiệm xây dựng nên một bộ protein (proteome) gồm khoảng 35.000
protein khác nhau trong các tế bào.
Ứng dụng trong y-dược học
Sản xuất các chế phẩm y-sinh học
Nếu như vào năm 1972, Giáo sư Roger Guillemin (Pháp) đã phải dùng tới
500.000 não cừu mới tinh chiết được vài miligram somatostatin, một hormone sinh
trưởng của vùng dưới đồi thị (với công trình này ông đã được trao giải Nobel năm
1980), thì vào 10/1977 Hebert Boyer (Mỹ) đã chế tạo thành công hormone này từ E.
coli bằng phương pháp ADN tái tổ hợp. Đến 8/1978 chính Boyer lại là người đầu tiên
cho sản xuất thành công insulin người từ E. coli. Các thành tựu đầu tiên này đã mở ra
một kỷ nguyên mới phát triển rực rỡ nhất trong lịch sử công nghệ sinh học, công nghệ
ADN tái tổ hợp.
Sau đó là hàng loạt các chế phẩm khác như các hormone tăng trưởng của người (HGH),
bò (BGH), lợn (PGH), các vaccine và các interferon phòng chống các căn bệnh nan ở
người y như ung thư, viêm gan v.v. và một số bệnh quan trọng ở gia súc như hiện
tượng 'lở mồm-long móng' do virus gây ra... tất cả đều được sản xuất từ E. coli. Đặc
biệt là, sự ra đời của các hãng, các công ty lớn đã đầu tư mạnh mẽ cho sự phát triển
của kỹ nghệ này. Nhờ vậy góp phần giải quyết có hiệu quả nhiều vấn đề thực tiễn đặt ra
trong y học, trong chăn nuôi-thú y, và nông nghiệp nói chung ...
190
Một số sản phẩm được tạo dòng ở vi khuẩn liên quan đến các ứng dụng khác nhau trong
điều trị bệnh ở người được giới thiệu ở Bảng 8
Bảng 8. Các sản phẩm của người được tạo dòng từ vi khuẩn
Bên cạnh việc sản xuất các hormone, vaccine... nói trên, người ta còn sản xuất được
các kháng thể đơn dòng (monocloning antibodies) dùng để: (i) xác định vi khuẩn gây
bệnh (như thương hàn chẳng hạn); (ii) xác định mức hormone từ đó đánh giá chức năng
tuyến nội tiết hoặc sự thay đổi trong quá trình tổng hợp hormone do khối u gây ra; (iii)
phát hiện một số protein có ý nghĩa trong chẩn đoán khối u hoặc một số tình trạng
trước khi sinh; (iv) phát hiện các thuốc bị cấm có trong máu, hoặc kiểm tra nồng độ
thuốc trong máu và tổ chức nhằm đảm bảo liều thuốc sử dụng sao cho không vượt quá
ngưỡng gây độc v.v. Nhờ có tính đặc hiệu và chính xác cao và sử dụng dễ dàng, việc
sản xuất các kháng thể đơn dòng đã tạo nên một nhánh phát triển mau lẹ nhất của công
nghệ sinh học, và cùng với việc sản xuất các vaccine chúng đã trở thành những phương
191
tiện quan trọng nhất trong chính sách y tế cộng đồng của các nước đang phát triển và
xét về lâu dài, việc ứng dụng các kháng thể đơn dòng có triển vọng chữa được nhiều
bệnh trong đó có các khối u ác tính.
Ứng dụng trong chẩn đoán và điều trị gen
Trong chẩn đoán bệnh ở mức phân tử, thành tựu nổi bật nhất là vào năm 1981, lần đầu
tiên bệnh thiếu máu hồng cầu hình liềm được chẩn đoán trước sinh ở mức độ gen nhờ
phân tích ADN bằng enzyme giới hạn. Từ đây đã mở ra hai hướng chính trong chẩn
đoán gen là: chẩn đoán các bất thường bẩm sinh và chẩn đoán các bất thường ADN
soma. Một số thành tựu khác đạt được theo hướng đầu gồm có: bệnh hemophilia A,
rối loạn dưỡng cơ Duchenne, hội chứng X-fragile, bệnh retinoblastoma - một dạng
ung thư võng mạc...Theo hướng sau, người ta đã áp dụng đối với một số dạng ung thư
máu như các lympho Burkitt, lympho nang, bệnh bạch cầu...Đáng kể là gần đây,
người ta đã xác định được nhiều gen gây bệnh quan trọng ở người, như: gen gây bệnh
hóa xơ nang (cystic fibrosis) năm 1990, gen gây bệnh Huntington năm 1993...
Liệu pháp gen (gene therapy) cũng là một phương thức sản xuất và điều trị mới bằng
các phân tử trị liệu. Đây là hướng có nhiều triển vọng nhất nhưng khó thực hiện nhất vì
nó có liên quan đến cả vấn đề phương pháp luận lẫn khía cạnh đạo lý. Sự kiện nổi
bật nhất là vào năm 1990-91, W.F.Anderson, R.M.Blaese và Ken Cuver thực hiện
thành công ca liệu pháp gen đầu tiên trên một bé gái bốn tuổi mắc bệnh suy giảm
miễn dịch phối hợp (SCID) với sự thiếu hụt adenosine deaminase (ADA), một
enzyme cần thiết cho sản xuất các kháng thể trong các tế bào hệ miễm dịch, gọi là hội
chứng “bubble-boy” (bệnh do gen ở gần đầu mút vai ngắn nhiễm sắc thể số 20 gây
ra). Mặt khác, liệu pháp gen cũng đã mở ra những triển vọng to lớn trong chữa trị các
căn bệnh phổ biến nhất, tác động tới hàng triệu triệu người trên hành tinh như: ung
thư, SIDA/AIDS, viêm gan do virus, các bệnh tim mạch, các bệnh thoái hóa thần
kinh (bệnh Parkinson, bệnh Huntington, bệnh Alzheimer...) hay cả những bệnh mạn
tính như đa thấp khớp.
Ứng dụng trong nông nghiệp
Kỹ thuật di truyền với các sinh vật biến đổi gen (GMO)
• Đối với ngành chăn nuôi, công nghệ sinh học nói chung và công nghệ sinh học
nói riêng đã đạt nhiều thành tựu đáng kể, chẳng hạn các kỹ thuật chuyển ghép gen áp
dụng cho hợp tử và phôi ở các gia súc nhằm tăng cường khả năng chống bệnh và cải
thiện giống nói chung; cũng như các kỹ thuật mới trong xác định giới tính của phôi...
192
Hình 8.16. Mô hình tổng quát về thí nghiệm truyền gen ở động vật.
Hình 8.16 cho thấy khả năng ứng dụng kỹ thuật cấy ghép gen trên trứng chuột đã được
thụ tinh. Sau đó đem phôi đã ghép gen cấy vào trong tử cung của con chuột làm mẹ
khác. Kết quả là tạo ra được chuột con có bộ lông dạng khảm như mong muốn. Điển
hình cho các thí nghiệm truyền gene ở động vật là vào năm 1982,R.D.Palmiter,
R.L.Brinster và các đồng sự ở Đại học Seatle (Philadelphia, USA) bằng cách truyền
gen xác định hormone sinh trưởng của chuột cống vào trứng đã thụ tịnh của chuột bình
thường, rồi cấy trở lại các tế bào đã được biến đổi gen vào vòi trứng của các chuột cái
có thể mang thai cho đến cùng. Và kết quả là, các tác giả này đã thu được dạng chuột
nhắt có kích thước lớn gấp 2-3 lần chuột bình thường, gọi là chuột khổng lồ.
• Đối với trồng trọt, việc sử dụng các phương pháp chuyển ghép gen đã đạt được
nhiều thành tựu to lớn. Chẳng hạn, hãng Biogen (USA) năm 1984 đã chuyển thành
công plasmid Ti vào tế bào thực vật; hãng Calgen và Phytogen (USA, 1984) đã ghép
thành công gen kháng glyphosate để bảo vệ cây bông; năm 1985 hãng Molecular
Genetics (USA) đã tạo được giống ngô mới cho nhiều tryptophan. Năm 1993, bằng
kỹ thuật súng bắn gen vào tế bào thực vật người ta đã đưa được gen sản xuất protein
diệt sâu vào cây ngô, và kết quả là đã tạo ra được giống ngô chống chịu cao đối với sâu
đục thân. Điều thú vị là việc tách các gen cố định đạm, gen Nif (Nif = nitrogen fixation)
từ các vi khuẩn nốt sần cây họ đậu và đưa vào bộ gen của các cây trồng khác để tạo ra
các giống cây trồng mới có khả năng cố định nitơ và cho năng suất cao (Hình 8.17).
193
Hình 8.17. Mô hình chuyển gen ở cây trồng
• Trong chọn giống vi sinh vật, người ta đã thực hiện thành công việc chuyển gen
cellulase vào vi khuẩn (J.P.Aubert, 1/1983), cải biến E. coli để sản xuất L-aspartat (hãng
Tanabe, Nhật 1985), ghép gen vào xạ khuẩn S. violacconiger để cải tiến việc sản sinh
enzyme glucoisomerase (hãng Roquette và Cayla, 1985), ngoài ra còn tạo được các
giống vi sinh vật biến đổi gen có khả năng ăn cặn dầu dùng trong xử lý các phế thải có
độc tố nhằm bảo vệ môi sinh. Bên cạnh việc tạo ra giống nấm men mới có thể giết chết
các vi khuẩn xuất hiện trong bia (hãng Suntory, 1985), còn tạo được chủng nấm men sản
xuất insulin và interferon (Kimura, 1986) v.v.
Ứng dụng trong khoa học hình sự và các vấn đề xã hội khác
Kỹ thuật di truyền còn được ứng dụng rất hiệu quả trong các ngành hình pháp học, chẳng
hạn bằng cách sử dụng kỹ thuật 'dấu vân ADN' (ADN fingerprinting) thay cho 'dấu
vân tay' trước đây cho phép các ngành cảnh sát hình sự xác định chính xác các tội phạm
hoặc nhận dạng xác nạn nhân trong chiến tranh hoặc do tai nạn gây ra (Hình 8.18).
194
Hình 8.18. Dấu vân DNA (DNA finger-printing) có thể giúp các nhà nghiên
cứu xác định khả nghi trong trường hợp tội phạm.
6.4. CÁC CÔNG CỤ SỬ DỤNG TRONG LĨNH VỰC SINH HỌC PHÂN
TỬ
19
Danh pháp và tính chất của các enzyme giới hạn:
- Các enzyme giới hạn chỉ phát hiện được ở các vi khuẩn vì vậy, tên gọi
của các enzyme giới hạn được biểu thị bằng ba hoặc bốn chữ cái viết tắt của vi
khuẩn mà từ đó enzyme được chiết xuất. Chữ cái đầu tiên được viết hoa để
chỉ chi (genus) và hai chữ cái tiếp theo viết thường để chỉ loài (species), và
nếu cần thêm chữ cái thứ tư để chỉ nòi hoặc chủng (strain, type). Ngoài ra, để
phân biệt các enzyme của cùng một nòi dùng thêm số La Mã kèm theo sau (xem
Bảng 8.1).
- Tính chất quan trọng nhất của các enzyme giới hạn là tính đặc hiệu vị trí,
nghĩa là chúng có thể nhận biết và cắt tại trình tự ADN đặc thù.
- Đoạn đích là có kích thước ngắn 4-8 cặp bazơ và có tính đối xứng xuôi
ngược (palindrome; Hình 8.5).
Các enzyme giới hạn khác nhau có hai kiểu cắt: cắt lệch và cắt thẳng
(Hình 8.6). Với kiểu cắt lệch, tạo ra các đoạn ADN có các đầu sợi đơn bổ
sung gọi là các đầu dính (cohesive/sticky ends); ví dụ EcoRI. Với kiểu cắt
thẳng, tức cắt cùng vị trí trên cả hai sợi của ADN sợi kép, tạo ra các đoạn ADN
có các đầu bằng (blunt ends); ví dụ AluI. 19
Vị trí nhận Thường vùng trình Trình tự bất đối Phân đôi và bất đối
biết (trình tự tự đối xứng dài 4- xứng dài 5-7bp xứng
nhận biết) 6bp
Vị trí cắt Gần hoặc Ở ngay Cắt ngẫu nhiên Không đặc hiệu có
tại vị trí nhận biết một khoảng 24- thể cách vị trí nhận
26bp ra khỏi vị biết > 1000bp
trí nhận biết
Khả năng cắt Hai kiểu phản ứng Xảy ra đồng thời Xảy ra đồng thời
giới hạn và độc lập
methyl hoá
19
Hình 8.7A. Cấu trúc của các plasmid pBR322 và pUC19. Lưu ý các vùng chứa
khởi điểm tái bản (Ori), các gen kháng thuốc (ampicillin, tetracyclin) và các
marker chọn lọc; đặc biệt đối với vector pUC19 cho thấy vị trí đa tạo dòng
(chứa nhiều vị trí cắt của các enzyme giới hạn – xem thêm ở Hình 8.7B). Với
vector pUC19, lacZ′ = gen β-galactosidase; lacI = gen ức chế của operon Lac.
Trong số các vector, các plasmid của vi khuẩn được sử dụng rộng rãi hơn cả,
nhờ có các đặc điểm sau: (i) Mỗi plasmid là một phân tử ADN sợi kép thường
ở dạng vòng và chỉ có một khởi điểm tái bản riêng; (ii) Có khả năng xâm nhập
vào tế bào vật chủ và hoạt động bình thường; (iii) Có kích thước bé, thường chỉ
vài ngàn cặp bazơ nên dễ dàng tinh chiết; (iv) Số bản sao trong mỗi tế bào vi
khuẩn thường khá cao; (v) Một số plasmid có chứa các gen kháng thuốc tiện
lợi cho việc theo dõi và phát hiện sự có mặt của plasmid tái tổ hợp trong vi khuẩn
chủ.
19
Hình 8.8. Các đầu dính của ADN lambda (a) và vector lambda có xen một vùng
ADN miễn dịch gt10 thông qua vết cắt của EcoRI.
Hình 8.9 Cấu trúc và sử dụng của nhiễm sắc thể nhân tạo của nấm men (YAC).
Chú thích: trp1, ura3 = các marker chọn lọc; cen/ars = centromere và trình tự
tái bản tự trị (autonomously replicating sequence = ARS), cho phép tái bản ở
S. cerevisiae; tel = telomere; để đơn giản, khởi điểm tái bản của E. coli và các
marker chọn lọc đối với E. coli không nêu ra ở đây.
c¸c polymerase
C¸c polymerase gåm hai nhãm:
- C¸c DNA polymerase xóc t¸c sù tæng hîp DNA, theo chiÒu 5'3'. PhÇn
lín c¸c DNA polymerase dïng mét b¶n mÉu lµ DNA ®Ó lµm khu«n cho sù tæng
hîp (DNA polymerase I, T4 DNA polymerase, Taq polymerase). Mét DNA
polymerase ®Æc biÖt lµ enzyme phiªn m· ngîc (reverse transcriptase) l¹i sö dông
khu«n RNA ®Ó tæng hîp DNA. Sau cïng ph¶i kÓ ®Õn mét DNA polymerase kh«ng
tæng hîp m¹ch míi tõ khu«n mµ chØ thªm c¸c nucleotide vµo ®Çu cña mét ph©n
tö DNA cã s½n, ®ã lµ Termial transferase. C¸c DNA polymerase, ®Ó ho¹t ®éng,
cÇn mét måi (primer). Måi lµ mét ®o¹n DNA hay RNA ng¾n b¾t cÆp bæ sung víi
phÇn ®Çu cña khu«n, ®Ó tõ ®ã c¸c polymerase míi nèi dµi t¹o thµnh m¹ch bæ sung.
- C¸c RNA polymerase tham gia tæng hîp RNA, th«ng dông nhÊt lµ SP6, T7
vµ T3 RNA polymerase. 19
3'TGCCATTA GCGGT5'