You are on page 1of 207

TRƯỜNG ĐẠI HỌC TÂY NGUYÊN

KHOA KHOA HỌC TỰ NHIÊN VÀ CÔNG NGHỆ

BÀI GIẢNG Y SINH HỌC PHÂN TỬ


NGƯỜI SOẠN: NGUYỄN THỊ THANH

ĐĂK LĂK 2019


L­îc sö h×nh thµnh vµ ph¸t triÓn cña sinh
häc ph©n tö
N¨m 1953: viÖc c«ng bè m« h×nh chuçi xo¾n kÐp cña ph©n tö DNA ®· chÝnh
thøc ®¸nh dÊu sù ra ®êi cña Sinh häc ph©n tö, nh­ng c¬ së cña nã ®· ®­îc h×nh
thµnh tõ tr­íc trong mét qu¸ tr×nh ph¸t triÓn l©u dµi víi sù phèi hîp cña nhiÒu
ngµnh khoa häc cæ ®iÓn nh­ TÕ bµo häc, Sinh ho¸ häc, Di truyÒn häc...
1. Häc thuyÕt tiÕn ho¸ vµ thuyÕt tÕ bµo

H×nh 1. C©y tiÕn ho¸

Tr­íc thÕ kû 19, c¸c vÊn ®Ò c¬ b¶n cña sù sèng mang tÝnh siªu h×nh, thuéc ph¹m vi gi¶i
quyÕt cña thÇn häc vµ triÕt häc.
Nöa sau thÕ kû 19, thuyÕt tiÕn ho¸ vµ thuyÕt tÕ bµo ra ®êi ®· ®Æt nÒn mãng cho sù ra ®êi
cña sinh häc víi t­ c¸ch lµ mét ngµnh khoa häc thùc nghiÖm.
- ThuyÕt tiÕn ho¸ ph¸t sinh tõ quan s¸t cña c¸c nhµ tù nhiªn häc. Theo J.B. Lamarck,
nhµ ®éng vËt häc ng­êi Ph¸p, gi¶i thÝch c¬ chÕ tiÕn ho¸ cña c¸c loµi cao cÊp tõ c¸c loµi ®¬n gi¶n
h¬n. ¤ng cho r»ng: (1) c¸c c¬ quan cña c¬ thÓ cã thÓ ®­îc ph¸t triÓn vµ c¶i tiÕn khi ®­îc sö
dông mét c¸ch lÆp ®i lÆp l¹i, cßn nã sÏ bÞ yÕu dÇn nÕu kh«ng ®­îc sö dông. (2) Nh÷ng biÕn ®æi
vÒ cÊu tróc thu ®­îc trong ®êi sèng cña sinh vËt ®­îc truyÒn l¹i cho con c¸i. VÝ dô Lamarck tin
r»ng cæ dµi vµ ch©n tr­íc cña h­¬u cao cæ ®­îc h×nh thµnh do tËp qu¸n vÆt l¸ c©y. ¤ng cho r»ng
tæ tiªn cña h­¬u cao cæ lµ lo¹i ng¾n cæ nh­ng do ph¶i th­êng xuyªn v­¬n cæ ra ®Ó h¸i l¸ c©y
nªn qua nhiÒu thÕ hÖ cæ cña chóng dµi thªm ra. ë mét khÝa c¹nh nµo ®ã thuyÕt nµy cã vÎ ®óng
nh­ng ch­a cã b»ng chøng thùc nghiÖm nµo chøng minh. C¸c ®Æc tÝnh di truyÒn cña sinh vËt
®­îc kiÓm tra bëi c¸c gen vµ ng­êi ta thÊy kh«ng cã c¸ch nµo ®Ó cÊu tróc cña DNA t¹o nªn c¸c
gen l¹i bÞ thay ®æi ®Ó ph¶n ¸nh c¸c ho¹t ®éng cña mét c¸ thÓ.

1
- Darwin vµ Wallace: Sau khi nghiªn cøu vµ quan s¸t sù ph©n bè ®Þa lý cña c¸c ®éng thùc
vËt ®ång thêi ghi nhËn c¸c ®iÓm sai kh¸c vµ gièng nhau gi÷a c¸c nhãm ®éng thùc vËt th©n cËn
(vÝ dô: loµi chim sÎ), hai «ng ®· nhËn thÊy r»ng thÕ giíi sèng kh«ng bÊt biÕn vµ c¸c loµi sinh
vËt biÕn ®æi khi xem xÐt chóng trong mét kho¶ng thêi gian ®ñ dµi. Tõ ®ã hä ®· nªu ra gi¶ thiÕt
lµ do mét sè ¸p lùc cña m«i tr­êng xung quanh (thiªn tai, biÕn ®éng nhiÖt ®é vµ ®é m­a...) ®·
¸p ®Æt mét sù chän läc tù nhiªn lªn c¸c thÕ hÖ nèi tiÕp nhau. ë mçi thÕ hÖ cã thÓ xuÊt hiÖn
nh÷ng biÕn ®æi cho phï hîp víi m«i tr­êng xung quanh vµ c¸c biÕn ®æi ®ã ®­îc truyÒn cho thÕ
hÖ sau.

H×nh 2. Charles Darwin (ph¶i), Alfred Wallace (tr¸i) cïng víi c¸c loµi sÎ Darwin vµ vÞ trÝ
quÇn ®¶o Galapagos

- ThuyÕt tÕ bµo: "Mçi sinh vËt ®­îc cÊu t¹o tõ mét tËp hîp c¸c ®¬n vÞ sèng, mçi ®¬n vÞ
mang trong nã tÊt c¶ c¸c ®Æc tÝnh cña sù sèng".
ThuyÕt tÕ bµo ra ®êi cïng víi sù hoµn thiÖn kü thuËt kÝnh hiÓn vi, ®Æc biÖt viÖc thõa nhËn
c¸c tÕ bµo bÞ c« lËp cã thÓ t¨ng tr­ëng vµ ph©n chia ®· ®ãng mét vai trß hÕt søc quan träng trong
sù h×nh thµnh thuyÕt nµy.
Nöa sau thÕ kû 17, A. Leeuwenhoek ®· quan s¸t thÊy nh÷ng sinh vËt li ti trong mét giät
n­íc ao nhê kÝnh phãng ®¹i, tiÕp theo sau Leeuwenhoek, R. Hoek m« t¶ cÊu tróc hiÓn vi cña sîi
bÇn vµ gäi chóng lµ "tÕ bµo" (cell).
Nh­ng m·i ®Õn hai thÕ kû sau, sù hoµn thiÖn cña kÝnh hiÓn vi cïng víi c¸c kü thuËt b¶o
qu¶n c¾t l¸t m« míi cho phÐp c¸c nhµ nghiªn cøu thÊy r»ng m« sèng h×nh thµnh tõ tÕ bµo. N¨m
1838, nhµ thùc vËt häc J. Schleiden vµ nhµ ®éng vËt häc T. Schwann (1839) c«ng bè häc thuyÕt
tÕ bµo ë §øc víi néi dung "tÊt c¶ c¸c sinh vËt ®Òu ®­îc cÊu t¹o tõ tÕ bµo". N¨m 1858, R. Virchov
(ng­êi §øc) ®· ph¸t triÓn thªm thuyÕt tÕ bµo víi néi dung "tÊt c¶ c¸c tÕ bµo ®Òu b¾t nguån tõ
nh÷ng tÕ bµo sèng tr­íc nã vµ kh«ng cã sù h×nh thµnh tÕ bµo ngÉu nhiªn tõ chÊt v« sinh".
Tr­íc thÕ kû 19, hÇu hÕt c¸c nhµ khoa häc vµ triÕt häc ®Òu c«ng nhËn thuyÕt sinh lùc luËn
vµ thuyÕt tù sinh. Nh­ng sù ra ®êi cña thuyÕt tÕ bµo, ®Æc biÖt lµ c¸c thÝ nghiÖm cæ ®iÓn cña
Pasteur ®· chøng minh sù sèng chØ cã thÓ sinh ra tõ sù sèng, ®· ®¸nh ®æ hai häc thuyÕt trªn vµ
x©y dùng nÒn mãng v÷ng ch¾c cho sinh häc hiÖn ®¹i. §Æc biÖt, thuyÕt tÕ bµo ®· ®ãng gãp quan
träng cho sù ph¸t triÓn cña khoa häc nu«i cÊy tÕ bµo: tÕ bµo riªng lÎ cã kh¶ n¨ng t¨ng tr­ëng vµ
ph©n chia ®éc lËp, do ®ã, nã cã thÓ ®­îc sö dông lµm ®èi t­îng cho nghiªn cøu vËt chÊt sèng,
kü thuËt nu«i cÊy tÕ bµo trong in vitro lµ mét kü thuËt kh«ng thÓ thiÕu trong nhiÒu nghiªn cøu
hiÖn nay.

2
2. Sinh ho¸ häc cæ ®iÓn vµ di truyÒn häc cæ ®iÓn
- Sinh häc thùc nghiÖm ph¸t triÓn dùa trªn nÒn t¶ng cña thuyÕt tÕ bµo vµ thuyÕt tiÕn ho¸
víi hai ngµnh häc lín: sinh ho¸ häc chuyªn c« lËp vµ x¸c ®Þnh tÝnh chÊt c¸c thµnh phÇn tÕ bµo
cßn di truyÒn häc nghiªn cøu sù di truyÒn c¸c ®Æc tÝnh ë c¸c c¬ thÓ sèng nguyªn vÑn.
- Sinh ho¸ häc: ®­îc h×nh thµnh khi ng­êi ta chøng minh ®­îc r»ng c¸c biÕn ®æi ho¸ häc
cña c¬ thÓ sèng nguyªn vÑn cã thÓ x¶y ra trong dÞch chiÕt tÕ bµo, vÝ dô: dÞch chiÕt tÕ bµo nÊm
men lªn men r­îu vang.
- Di truyÒn häc: Tr­íc Mendel (thÕ kû 19), c¸c nhµ khoa häc cho r»ng c¶ cha vµ mÑ ®Òu
gãp phÇn vµo sù h×nh thµnh tÝnh tr¹ng cña hËu thÕ. Tuy nhiªn, c¸c quan niÖm phæ biÕn hiÖn thêi
lµ sù di truyÒn hoµ hîp, tøc lµ c¸c tÝnh tr¹ng cña cha vµ mÑ trén lÉn vµo nhau t¹o nªn c¸c tÝnh
tr¹ng trung gian ë con c¸i. §Õn giai ®o¹n cña Mendel: Mendel lµ ng­êi ®Çu tiªn ph¸t hiÖn ra
quy luËt di truyÒn, lµ mét b­íc tiÕn khæng lå so víi tr×nh ®é khoa häc lóc bÊy giê c¶ vÒ ph­¬ng
ph¸p luËn lÉn mÆt nhËn thøc, cho nªn nh÷ng quy luËt di truyÒn cña «ng m·i ®Õn n¨m 1900 míi
®­îc ®¸nh gi¸ ®óng gi¸ trÞ cña nã còng nh­ sù ®ãng gãp cña «ng cho sù ph¸t triÓn cña di truyÒn
häc. Theo Mendel c¸c tÝnh tr¹ng ®­îc ph©n ly ®éc lËp kh«ng hoµ lÉn vµo nhau vµ «ng ®· sö
dông ph­¬ng ph¸p thèng kª to¸n häc ®Ó ph©n tÝch kÕt qu¶.

H×nh 3. G. Mendel vµ khu v­ên thÝ nghiÖm cña «ng, hiÖn nay lµ mét phÇn cña b¶o tµng Mendel.

- N¨m 1900 ®­îc coi lµ n¨m khai sinh vµ thÕ kû 20 lµ thÕ kû ph¸t triÓn cña di truyÒn häc.
N¨m 1902, W. Baterson vµ L. CuÐnot chøng minh c¸c quy luËt Mendel ë ®éng vËt vµ trong
nh÷ng n¨m nµy c¸c hiÖn t­îng t­¬ng t¸c gen còng ®· ®­îc ph¸t hiÖn. Cïng thêi gian nµy kh¸i
niÖm vÒ nhiÔm s¾c thÓ ®­îc nªu ra: nhiÔm s¾c thÓ chÝnh lµ gi¸ thÓ mang c¸c nh©n tè di truyÒn.
ë ®éng vËt bËc cao, mét c¸ thÓ míi ®­îc ph¸t sinh tõ sù kÕt hîp cña trøng vµ tinh trïng. C¶
trøng, víi mét l­îng tÕ bµo chÊt lín, lÉn tinh trïng, chØ chøa nh©n lµ chñ yÕu, ®Òu cã ®ãng gãp
®ång ®Òu vÒ mÆt di truyÒn cho hîp tö. ChÝnh ®iÒu nµy cho thÊy ý nghÜa quyÕt ®Þnh cña nh©n
trong hiÖn t­îng di truyÒn. Khi quan s¸t nh©n d­íi kÝnh hiÓn vi, ng­êi ta ph¸t hiÖn thÊy nh÷ng
cÊu tróc d¹ng sîi vµ gäi ®ã lµ nhiÔm s¾c thÓ. W. Sutton (1903) khi nghiªn cøu sù ph©n chia tÕ
bµo ®Ó h×nh thµnh giao tö, nhËn thÊy r»ng c¸c nhiÔm s¾c thÓ ®­îc ph©n chia sao cho mçi giao
tö chØ nhËn ®­îc mét nhiÔm s¾c thÓ cña bè hoÆc cña mÑ. Liªn hÖ víi c«ng tr×nh cña Mendel ®·

3
®Ò cËp tr­íc ®ã; giao tö ®ùc (tinh trïng) cña bè vµ giao tö c¸i (trøng) cña mÑ ®ãng gãp mçi bªn
mét nhiÔm s¾c thÓ vµo sù h×nh thµnh c¸ thÓ con.

H×nh 4: S¬ ®å di truyÒn tÝnh tr¹ng mµu m¾t ë ruåi giÊm qua c¸c phÐp lai kh¸c nhau

NhiÔm s¾c thÓ chøa mét chuçi c¸c gen cã kh¶ n¨ng thay ®æi chç. Vµo ®Çu nh÷ng n¨m
1900, Thomas Hunt Morgan b¾t ®Çu nghiªn cøu sù ph©n li c¸c nh©n tè di truyÒn hay gen (tªn
do Wilhelm Johannsen ®Æt n¨m 1909) vµ mèi liªn hÖ gi÷a sù ph©n li nµy víi cÊu tróc nhiÔm s¾c
thÓ trªn ®èi t­îng lµ ruåi giÊm (Drosophila melanogaster). §Çu tiªn, «ng nhËn thÊy sù x¸c ®Þnh
giíi tÝnh phô thuéc vµo mét nhiÔm s¾c thÓ ®Æc biÖt: nhiÔm s¾c thÓ giíi tÝnh. Sau ®ã, khi nghiªn
cøu nh÷ng con ruåi mang nhiÒu ®Æc tÝnh di truyÒn kh¸c nhau, Morgan ph¸t hiÖn r»ng c¸c gen ë
ruåi ®­îc ph©n bè thµnh bèn nhãm mµ «ng gäi lµ nhãm liªn kÕt. ¤ng liªn hÖ 4 nhãm nµy víi
sù tån t¹i cña 4 nhiÔm s¾c thÓ ë ruåi. C¸c c«ng tr×nh vÒ sau trªn b¾p, ®Ëu ®· x¸c nhËn sù ®ång
nhÊt gi÷a sè l­îng c¸c nhãm liªn kÕt vµ c¸c nhiÔm s¾c thÓ. C¸c nhµ di truyÒn häc ruåi giÊm ®·
cã mét ®ãng gãp c¬ b¶n khi chøng minh ®­îc r»ng c¸c gen ®­îc ph©n bè thµnh chuçi trªn
nhiÔm s¾c thÓ ë c¸c vÞ trÝ x¸c ®Þnh. Tuy nhiªn, Barbara McClintock (1931) ®· cho thÊy r»ng vÞ
trÝ c¸c gen cã thÓ thay ®æi khi chøng minh mèi liªn hÖ gi÷a sù s¾p xÕp l¹i c¸c ®o¹n nhiÔm s¾c
thÓ víi sù s¾p xÕp l¹i c¸c ®Æc tÝnh di truyÒn ë b¾p (Zea mais). C¸c nghiªn cøu di truyÒn cæ ®iÓn
trªn nªu râ b¶n chÊt vËt lÝ cña gen vµ tõ gi÷a nh÷ng n¨m 30 gen kh«ng cßn lµ kh¸i niÖm trõu
t­îng mµ trë thµnh thùc thÓ ®o ®Õm ®­îc. Sù kÕt hîp gi÷a di truyÒn häc vµ sinh ho¸ häc ®·
chøng minh ®­îc b¶n chÊt ho¸ häc cña gen.

4
3. Sù phèi hîp gi÷a di truyÒn häc vµ sinh ho¸ häc
ViÖc nghiªn cøu mét c¨n bÖnh ë ng­êi lÇn ®Çu tiªn ®· cho thÊy mét bÊt
th­êng sinh ho¸ lµ do mét thiÕu sãt di truyÒn. Archibald Garrod (1909) nhËn thÊy
r»ng bÖnh alcaptonurie lµ kÕt qu¶ cña mét ®ét biÕn lÆn hiÕm, di truyÒn theo c¸c
quy luËt Mendel. ¤ng nghi ngê nguyªn nh©n cña bÖnh lµ do ë bÖnh nh©n bÞ thiÕu
mét enzyme cña chuçi chuyÓn ho¸ c¬ b¶n. §iÒu nµy ®· ®­îc chøng minh sau ®ã,
enzyme thiÕu lµ mét oxydase cã kh¶ n¨ng ph©n huû c¸c hîp chÊt cã vßng phenol,
nªn trong n­íc tiÓu bÖnh nh©n cã hµm l­îng homogentisic acid (mét hîp chÊt cã
vßng phenol) rÊt cao. Nh­ng lóc bÊy giê ng­êi ta ch­a thÓ biÕt r»ng chÝnh gen quy
®Þnh cÊu tróc enzyme míi lµ nguån gèc thËt sù cña hiÖn t­îng nµy.

H×nh 5: ThÝ nghiÖm ®ét biÕn mµu m¾t ruåi giÊm (Beadle vµ Ephrussi)
C¸c nghiªn cøu trªn ruåi giÊm gióp x¸c lËp mèi t­¬ng quan gi÷a ho¹t ®éng
cña mét gen víi mét ph¶n øng ho¸ häc. ë ruåi giÊm hoang d¹i m¾t cã mµu ®á
sÉm do sù kÕt hîp hai s¾c tè ®á, nh÷ng con mang ®ét biÕn mµu m¾t ë mét trong
hai gen cinnabar vµ vermillon cã m¾t ®á t­¬i. George W. Beadle vµ Boris Ephrussi
khi tiÕn hµnh thÝ nghiÖm trªn c¸c chñng ruåi giÊm ®ét biÕn nµy, ®· kÕt luËn r»ng
hai gen cinnabar vµ vermillon quy ®Þnh hai enzyme thuéc chuçi chuyÓn ho¸

5
tryptophan, mét gen ®ét biÕn sÏ dÉn ®Õn sù kh«ng h×nh thµnh ®­îc enzyme t­¬ng
øng vµ tryptophan kh«ng ®­îc chuyÓn ho¸ thµnh mét trong hai s¾c tè ®á khiÕn
cho m¾t nh¹t mµu. C«ng tr×nh nµy ®· më mµn cho sù hîp nhÊt hai ngµnh Di truyÒn
häc vµ Sinh ho¸ häc.
HiÖn t­îng mét gen quy ®Þnh ho¹t tÝnh mét enzyme th× ®­îc x¸c ®Þnh nhê
c¸c thÝ nghiÖm trªn nÊm mèc Neurospora crassa. Mét hÖ thèng di truyÒn cßn ®¬n
gi¶n h¬n c¶ ruåi giÊm ®­îc Beadle vµ Edward L. Tatum sö dông ®ã lµ nÊm mèc
Neurospora crassa. ë nÊm nµy mét c¸ thÓ con h×nh thµnh tõ sù phèi hîp cña bè
vµ mÑ nh­ ë c¸c sinh vËt th­îng ®¼ng, do ®ã cã thÓ sö dông nã lµm ®èi t­îng cho
c¸c thÝ nghiÖm lai. §iÓm ®Æc biÖt quý lµ ng­êi ta cã thÓ nu«i cÊy chóng in vitro
trªn m«i tr­êng rÊt th« s¬ (gåm n­íc, ®­êng, vµi muèi vµ mét sè chÊt ®¬n gi¶n
kh¸c). Bµo tö hoang d¹i cña nÊm mäc ®­îc trªn m«i tr­êng th« s¬ kÓ trªn, nh­ng
mét sè Ýt ®ét biÕn chØ mäc ®­îc khi bæ sung mét amino acid hay mét vitamin. C¸c
t¸c gi¶ kÕt luËn r»ng mét tÕ bµo ®ét biÕn chØ mäc ®­îc khi cã bæ sung mét chÊt
nhÊt ®Þnh chøng tá nã cã mang mét biÕn ®æi di truyÒn lµm ¶nh h­ëng ®Õn sù s¶n
xuÊt mét enzyme cÇn cho tiÕn triÓn cña mét chuçi chuyÓn ho¸ t¹o thµnh chÊt ®ã.
Nãi kh¸c ®i, mét gen quy ®Þnh mét enzyme nhÊt ®Þnh.

H×nh 6: ThÝ nghiÖm chøng minh vËt chÊt di truyÒn lµ DNA ë vi khuÈn S, pneumoniae
ViÖc x¸c ®Þnh DNA chÝnh lµ vËt chÊt di truyÒn ®· më mµn cho nh÷ng nghiªn
cøu ph©n tö vÒ cÊu tróc vµ chøc n¨ng cña gen. N¨m 1944, Oswald Avery, Colin
MacLeod vµ MacLyn McCarty nghiªn cøu Streptococcus pneumoniae, mét vi
khuÈn g©y viªm phæi. C¸c chñng cã ®éc tÝnh cao ®­îc gäi lµ S (Smooth nghÜa lµ

6
tr¬n l¸ng), cßn R (rough nghÜa lµ sÇn sïi) lµ chñng cã ®éc tÝnh thÊp, tªn gäi nµy
dùa vµo ®Æc tÝnh bÒ mÆt cña khuÈn l¹c tr¬n hay sÇn. Dùa vµo quan s¸t tr­íc ®ã cña
b¸c sÜ ng­êi Anh Fred Griffiths cho thÊy chñng R cã thÓ biÕn thµnh chñng S trong
c¬ thÓ chuét bÞ nhiÔm, Avery vµ c¸c céng sù ®· t¸ch chiÕt DNA cña chñng S ®em
cho vµo c¸c tÕ bµo nu«i cÊy chñng R. KÕt qu¶ lµ mét sè khuÈn l¹c biÕn thµnh tr¬n
l¸ng: chóng ®· ®­îc biÕn n¹p. C¸c t¸c gi¶ ®· chøng minh ®­îc r»ng DNA chÝnh
lµ nh©n tè biÕn n¹p lµm thay ®æi kiÓu di truyÒn ë c¸c phÕ cÇu khuÈn
(pneumococcus). Alfred Hershey vµ Martha Chase (1952) cñng cè thªm ph¸t hiÖn
trªn b»ng c¸c thÝ nghiÖm trªn thùc khuÈn thÓ (phage), ®ã lµ c¸c virus cã kh¶ n¨ng
x©m nhiÔm vµo vi khuÈn. C¸c t¸c gi¶ cho thÊy chØ cã DNA cña virus x©m nhËp
vµo vi khuÈn, ë ®ã th«ng tin di truyÒn chøa trong DNA sÏ ®­îc dïng ®Ó tæng hîp
nh÷ng phÇn tö virus míi.

4. Sù ra ®êi cña sinh häc ph©n tö

H×nh 7: M« h×nh cÊu tróc DNA vµ s¬ ®å liªn kÕt ho¸ häc cña DNA

Sù ph¸t hiÖn cÊu tróc xo¾n kÐp cña DNA bëi James D. Watson vµ Francis
H.C. Crick (1953) chÝnh thøc khëi ®Çu cho thêi kú hiÖn ®¹i cña Sinh häc ph©n tö.
Cã hai nh©n tè quan träng ®· gióp Watson vµ Crick x©y dùng m« h×nh cÊu tróc
ph©n tö DNA. Thø nhÊt, ®ã lµ c«ng tr×nh cña Edwin Chargaff cho thÊy DNA lÊy
tõ nhiÒu nguån kh¸c nhau ®Òu cã mét hµm l­îng adenine b»ng víi hµm l­îng
thymine vµ mét hµm l­îng guanine b»ng víi cytosine. KÕ ®Õn, c¸c nghiªn cøu sîi
DNA b»ng t¸n x¹ tia X (X-ray diffraction) cña Maurice Wilkins vµ céng sù c«ng
bè nhiÒu chi tiÕt quan träng vÒ cÊu tróc ph©n tö DNA nh­: d¹ng xo¾n, ®­êng kÝnh
2nm, kho¶ng c¸ch gi÷a hai base liªn tiÕp lµ 0,34nm, sè l­îng base trªn mçi vßng
xo¾n lµ 10. ChÝnh tõ sù so s¸nh c¸c sè liÖu trªn mµ m« h×nh ph©n tö DNA ra ®êi.

7
CÊu tróc ®¬n gi¶n vµ mang tÝnh tù bæ sung cña ph©n tö DNA gîi ý cho c¬
chÕ tù sao chÐp DNA ë mçi thÕ hÖ tÕ bµo còng nh­ c¬ chÕ tæng hîp RNA tõ khu«n
DNA.

5. Quan niÖm hiÖn ®¹i vÒ cÊu tróc tÕ bµo


Sù hoµn thiÖn kÝnh hiÓn vi ®iÖn tö (víi ®é phãng ®¹i hµng ngµn lÇn h¬n kÝnh
hiÓn vi quang häc) vµo nh÷ng n¨m 50 ®· ®ãng gãp mét phÇn kh«ng nhá vµo viÖc
h×nh thµnh mét quan niÖm míi vÒ tÕ bµo. LÇn ®Çu tiªn ng­êi ta kh¸m ph¸ mét thÕ
giíi nh÷ng cÊu tróc ch­a hÒ ngê ®Õn tr­íc ®©y, ®ã lµ c¸c bµo quan (nh©n, ti thÓ,
lôc l¹p, ...).
Vµo cuèi nh÷ng n¨m 50, sù tÝch luü c¸c quan s¸t c¬ b¶n tõ c¸c nhµ di truyÒn
häc, sinh ho¸ häc vµ tÕ bµo häc ®ßi hái ph¶i cã sù tËp hîp toµn bé thµnh mét hÖ
thèng chÆt chÏ. §ã còng chÝnh lµ b¶n chÊt s©u xa cña sinh häc ph©n tö. Hai ph­¬ng
ph¸p thùc nghiÖm kh¸c nhau còng cã nh÷ng ®ãng gãp quan träng cho ®iÒu nµy.
Trong ph­¬ng ph¸p thø nhÊt, ng­êi ta ph¸ vì tÕ bµo vµ thu nhËn riªng rÏ tõng
thµnh phÇn. Mçi thµnh phÇn ®­îc nghiªn cøu d­íi kÝnh hiÓn vi ®iÖn tö vµ qua
nh÷ng ph©n tÝch sinh ho¸ ®Ó xem xÐt mèi t­¬ng quan gi÷a cÊu tróc vµ ho¹t tÝnh
sinh ho¸. §©y chñ yÕu lµ c«ng tr×nh cña Albert Claude, Christian de Duve, George
Palade vµ Keith Porter.
Ph­¬ng ph¸p thø hai lµ ph©n tÝch di truyÒn do Francois Jacob vµ Jacques
Monod (1961) thùc hiÖn. Theo hai «ng, s¶n phÈm protein cña mét sè gen nµy ®iÒu
hoµ ho¹t ®éng cña nh÷ng gen kh¸c. KÕt luËn nµy cuèi cïng ®· kÕt hîp nhiÒu ngµnh
khoa häc kh¸c nhau vµo mét ngµnh míi.

6. ¸p dông c¸ch tiÕp cËn ph©n tö vµo nghiªn cøu tÕ bµo


Eukaryote
C¸c nhµ sinh ho¸ häc vµ di truyÒn häc ph©n tö nh÷ng n¨m 60 còng ®· ®ãng
gãp vµo ba kh¸m ph¸ quan träng: (1) RNA th«ng tin (mRNA) truyÒn th«ng tin tõ
DNA sang bé m¸y dÞch m· ®Ó s¶n xuÊt protein, (2) m· di truyÒn tøc lµ d¹ng th«ng
tin ghi trong nucleic acid ®· ®­îc gi¶i m·, (3) protein ®­îc s¶n xuÊt nhê RNA vËn
chuyÓn (tRNA) vµ c¸c ribosome.
§Æc biÖt cã hai ph¸t minh vµo nh÷ng n¨m 60 ®· thu hót nhiÒu nhµ nghiªn
cøu ®Õn víi tÕ bµo eukaryote. §ã lµ viÖc nu«i cÊy thµnh c«ng tÕ bµo ®éng vËt cã
vó in vitro nhê c«ng cña Harry Eagle vµ Theodore Puck. Sù ra ®êi cña ngµnh virus
häc ®éng vËt do sù ®ãng gãp cña Renato Dulbecco vµ c¸c céng sù.

8
Vµo cuèi nh÷ng n¨m 70, sù xuÊt hiÖn mét lo¹t kü thuËt míi ®· t¹o ra cuéc
c¸ch m¹ng trong sinh häc ph©n tö. Víi c¸c enzyme c¾t h¹n chÕ ng­êi ta cã thÓ c¾t
ph©n tö DNA ë nh÷ng vÞ trÝ x¸c ®Þnh thµnh nh÷ng ®o¹n cã kÝch th­íc mong muèn,
g¾n chóng vµo c¸c vector, råi chuyÓn vµo tÕ bµo vi khuÈn. ViÖc nu«i cÊy c¸c tÕ
bµo vi khuÈn nµy cho phÐp thu håi l¹i mét l­îng lín DNA cÇn. §ã lµ ph­¬ng ph¸p
t¹o dßng. Sau ®ã, ng­êi ta ®· hoµn thiÖn c¸c ph­¬ng ph¸p x¸c ®Þnh nhanh tr×nh tù
DNA. Nh­ vËy, c¸c nhµ sinh häc b©y giê kh«ng chØ ngåi ®Õm nhiÔm s¾c thÓ hay
thiÕt lËp b¶n ®å gen dùa vµo ®ét biÕn vµ lai, hä cßn n¾m ®Õn tõng nucleotide cña
®o¹n DNA. H¬n thÕ n÷a, hä cßn cã thÓ tuú ý t¹o c¸c ®ét biÕn trªn ®o¹n DNA råi
chuyÓn chóng trë vµo tÕ bµo ®Ó nghiªn cøu chøc n¨ng cña mét gen trªn mét lo¹i
tÕ bµo x¸c ®Þnh.
Cïng víi sù thùc hiÖn mét kú c«ng: X¸c ®Þnh tr×nh tù toµn bé bé gen ng­êi,
Sinh häc ph©n tö cßn h­íng ®Õn gi¶i quyÕt nhiÒu vÊn ®Ò lín: bÖnh ung th­, sù
ph¸t triÓn ph«i vµ biÖt ho¸ m«.

Bảng 1. Tóm tắt lịch sử nghiên cứu về di truyền học

Năm Sự kiện lịch sử


công bố

1856 – Các định luật di truyền – G. Mendel


1866
1859 Sự phát sinh loài – Học thuyết tiến hóa – C. Darwin

1868 Tinh sạch chất nhân từ nhân tế bào – F. Meischer

1875 Vai trò của nhân trong thụ tinh và phân chia tế bào – O. Hertwig

1882- Nhân tế bào chứa nhiễm sắc thể – E. Strasburger, W. Flemming


1885
1900 Xác nhận lại các định luật di truyền của Mendel – H. de Vries, C.
Corens, E. von Tschermak-Seysenegg

1902 Lần đầu tiên công bố các bệnh di truyền ở người – A. Garod

9
1902 Thuyết di truyền nhiễm sắc thể – W. Sutton, T. Boveri

1903 Lần đầu công bố mối quan hệ giữa allen và gen – W.E. Castle

1905 Định nghĩa khoa học di truyền là “genetics”- W.Bateson

1941 Giả thiết 1gen-1enzyme – G. Beadle, E. Tatum

1944 Nguyên lý biến nạp của Griffith – O.Avery, C. MacLeod, M.


McCarty
1946 Khám phá quá trình tiếp hợp ở vi khuẩn – J. Lederberg, E. Tatum

1950 Thí nghiệm về sự biểu hiện của gen nhảy ở bắp, nay gọi là nhân tố
chuyển vị – B. McClintock
1952 Chứng minh vật chất di truyền ở bacteriophage T2 là DNA –
A.Hershey, M. Chase
1953 Công bố mô hình DNA xoắn kép – J. Waston, F. Crick

1958 Chứng minh mô hình sao chép DNA là sao chép bán bảo tồn – M.
Meselson, F. Stahl
Phân lập DNA polymerase I từ E.coli – A.Kornberg
1959 - Phát hiện RNA polymerase, mRNA, cấu trúc operon ở vi khuẩn, giải
1966 mã hoàn toàn bảng mã bộ ba
1972 - Tạo DNA tái tổ hợp trong ống nghiệm, sử dụng DNA plasmid nhân
1975 dòng DNA, phát triển các phương pháp phân lập các tRNA, RNA sử
dụng trong các kỹ thuật nhân dòng gen
Năm Sự kiện lịch sử
công bố
1977 Phát triển kỹ thuật giải trình tự gene – W.Gilbert, F. Sanger
Phát hiện intron trong gen của eukaryote – P.Sharp etc.
1983 Phát hiện khả năng tự cắt của RNA intron – T.Cech, S. Altman

1986 Hoàn thiện kỹ thuật PCR khuếch đại đoạn DNA xác định – K. Mullis
etc.

10
1990 Dự án giải trình tự gen người (Human Genome Project) – J.Waston

… 1997 Nhân bản vô tính động vật có vú đầu tiên, cừu Dolly – Viện NC
Roslin
1999 Human Genome Project hoàn thiện giải trình tự đến NST 22

1990s RNAi công cụ điều tra chức năng của gen

2000 Công bố trình tự genome ruồi giấm D. melanogaster, trình tự genome


lớn nhất được giải mã
NST số 21 là NST bé nhất của người
2001- Human Genome project hoàn thiện bản sơ thảo về trình tự DNA của
2002 bộ gen người.
Các cơ chế điều hoà gene và lập trình tế bào
Phát triển kỹ thuật điều khiển chu kỳ tế bào
2004 Dự án giải trình tự Genome người đi đến giai đoạn gần hoàn thiện,
xác định được khoảng 20,000 đến 25000 gen mã hóa cho protein
2005 Công bố bản sơ thảo giải trình tự genome của tinh linh chỉ tương ứng
với trình tự ở người
2006 Khởi động dự án Cancer Genome Project để xác định các gen tiến
triển thành bệnh ung thư
- Phát hiện và sử dụng các RNAi
2007 Khởi động dự án Human Microbiome: xác định mối liên hệ giữa vi
sinh vật với sức khỏe và bệnh tật ở người
Trình tự genome của J.Watson đã được giải mã hoàn thiện
Hoàn thiện các kỹ thuật knockout mice và gene targeting
2008 Khởi động dự án 1000 Genome: giải mã trình tự toàn bộ genome của
hàn ngàn người trên thế giới và cung cấp biến thể bản đồ di truyền
chi tiết của người để bổ sung cho các nghiên cứu các bệnh tật ở người.
- Xác định các cơ chế hoạt động virus HIV
- Vai trò virus HPV là nguyên nhân gây đến ung thư
2009 Xác định cấu trúc và chức năng của ribosome
Xác định vai trò của Telomere và enzyme Telomerase trong bảo vệ
cấu trúc nhiễm sắc thể
2011 Miễn dịch bẩm sinh
Tế bào dendritic (tế bào bạch tuộc) và miễn dịch đáp ứng

11
2012 Nhân dòng tế bào động vật, và tái lập trình nhân
Tái lập trình tế bào
Vai trò của cặp Protein G-receptor
2013 Vai trò bộ máy điều hoà gen của bóng vận chuyển

2014 Vai trò của protein GPS nội bào trong não

2015 Liệu pháp mới trong điều trị nhiễm ký sinh trùng

2016 Cellular autophagy (cơ chế tự chết của tế bào ngăn ngừa bệnh)

2017 Nhịp ngày đêm trong quá trình trao đổi chất của tế bào

2018 Liệu pháp miễn dịch trong điều trị ung thư

Lý thuyết trung tâm của sinh học phân tử


Tổng hợp protein trong tế bào có các đặc điểm sau:
- Các phân tử thông tin như nucleic acid và protein được tổng hợp theo khuôn.
Tổng hợp theo khuôn vừa chính xác vừa ít tốn enzyme. Tuy nhiên, căn cứ vào
hàng loạt tính chất hóa học các protein không thể làm khuôn mẫu cho sự tổng
hợp của chính chúng. Vì vậy, khuôn mẫu để tổng hợp nên protein không phải là
protein.
- Sinh tổng hợp protein tách rời về không gian với chỗ chứa DNA.
Nhiều nghiên cứu cho thấy tổng hợp protein có thể xảy ra khi không có mặt DNA.
Sự kiện này thể hiện rõ ràng nhất ở những tế bào eukaryote. Trong những tế
bào này, hầu như toàn bộ DNA tập trung ở nhiễm sắc thể trong nhân, còn tổng
hợp protein chủ yếu diễn ra ở tế bào chất. Tảo xanh đơn bào Acetabularia khi bị
cắt mất phần chứa nhân vẫn tổng hợp được protein và sống vài tháng nhưng
mất khả năng sinh sản. Rõ ràng, nơi chứa DNA mang thông tin di truyền và chỗ
sinh tổng hợp protein tách rời nhau về không gian.
- DNA không phải là khuôn mẫu trực tiếp để tổng hợp protein, do đó phải
có chất trung gian chuyển thông tin từ DNA ra tế bào chất và làm khuôn để
tổng hợp protein. Chất đó phải có cả trong nhân và tế bào chất với số lượng phụ
thuộc vào mức độ tổng hợp protein.
- Chất trung gian đó được xem chính là RNA nhờ các đặc điểm sau:

12
+ RNA được tổng hợp ngay ở trong nhân có chứa DNA, sau đó nó đi vào tế bào
chất cho tổng hợp protein.
+ Những tế bào giàu RNA tổng hợp protein nhiều hơn.
+ Về phương diện hóa học RNA gần giống DNA: chuỗi polyribo- nucleotide
thẳng cũng chứa 4 loại ribonucleotide A, G, C và uracil (U). Nó có thể nhận
được thông tin từ DNA qua bắt cặp bổ sung.
Nói chung, trong tế bào không thể tìm thấy chất nào khác ngoài RNA có thể đóng
vai trò trung gian cho tổng hợp protein. Mối quan hệ này chính là thông tin di
truyền đi từ DNA qua RNA rồi đến protein và được biểu diễn ở hình 3.3. Mối
quan hệ này còn được gọi là lý thuyết trung tâm (central dogma), được Crick đưa
ra từ 1956 đến nay về căn bản vẫn đúng.
Vào những năm 1970, người ta đã phát hiện quá trình phiên mã ngược từ RNA
tổng hợp nên DNA nhờ enzyme reverse transcriptase. Đến nay, việc sao chép
(tổng hợp) RNA trên khuôn mẫu RNA cũng đã được chứng minh ở nhiều loại
virus. Ngoài ra, thông tin từ protein cũng có thể được truyền sang protein (prion
của bệnh bò điên). Riêng dòng thông tin từ protein ngược về mRNA/DNA thì
chưa được tìm thấy (Hình 1).

Ba nhóm cơ chế truyền thông tin được đề xuất bởi học thuyết trung tâm

Nhóm phổ biến được đề


Nhóm đặc biệt Nhóm chưa rõ
xuất bởi Watson (1965)

DNA → DNA RNA → DNA protein → DNA

DNA → RNA RNA → RNA protein → RNA

RNA → protein DNA → protein protein → protein

13
Hình 8. Những bổ sung mới vào lý thuyết trung tâm của Crick

14
Ch­¬ng 1
C¸c ®¹i ph©n tö sinh häc vµ c¸c liªn kÕt yÕu
trong hÖ thèng sèng
1. C¸c ®¹i ph©n tö sinh häc

1.1. Polysaccharide
C¸c polysaccharide cã nhiÒu chøc n¨ng quan träng trong tÕ bµo, chóng tham
gia vµo cÊu t¹o tÕ bµo vµ lµ nguån dù tr÷ n¨ng l­îng chñ yÕu. C¸c polysaccharide
®­îc h×nh thµnh tõ nhiÒu monomer lµ c¸c ®­êng ®¬n gi¶n, c¸c monosaccharide
(th­êng lµ glucose) nèi víi nhau b»ng liªn kÕt glycosidic. Liªn kÕt nµy ®­îc h×nh
thµnh tõ sù kÕt hîp gi÷a C 1 cña mét ph©n tö ®­êng víi nhãm hydroxyl cña ph©n
tö kÕ tiÕp (h×nh 1.1).

H×nh 1.1. Ph¶n øng t¹o liªn kÕt gi÷a c¸c ph©n tö ®­êng ®¬n ®Ó h×nh thµnh nªn ph©n
tö ®­êng ®«i

Nguån dù tr÷ ë c¸c tÕ bµo ®éng vËt lµ glycogen, trong khi tinh bét ®ãng vai
trß t­¬ng tù ë tÕ bµo thùc vËt. Mét polymer kh¸c cña glucose lµ cellulose th× t¹o
nªn v¸ch tÕ bµo thùc vËt vµ lµ hîp chÊt h÷u c¬ hiÖn diÖn nhiÒu nhÊt trong sinh
quyÓn.

1.2. Lipid
MÆc dï kh«ng mang ho¹t tÝnh sinh häc cao nh­ c¸c protein, lipid còng ®ãng
mét vai trß ®Æc biÖt trong hÖ thèng sèng. Chóng lµ nh©n tè chÝnh h×nh thµnh c¸c
mµng sinh häc mµ nÕu thiÕu th× mäi ho¹t ®éng cña protein sÏ kh«ng thÓ phèi hîp

15
nhÞp nhµng. ChÝnh c¸c mµng sinh häc nµy ng¨n c¸ch tÕ bµo víi m«i tr­êng xung
quanh, t¹o ®iÓm b¸m cho mét sè protein vµ ph©n chia c¸c khoang néi bµo ë
eukaryote.

H×nh 1.2. CÊu tróc cña mét sè lipid cã trong c¬ thÓ sinh vËt

§¬n vÞ cÊu tróc c¬ b¶n cña lipid lµ c¸c acid bÐo vµ alcol. Mçi acid bÐo ®­îc
cÊu t¹o tõ mét m¹ch hydrocarbon (gåm c¸c nguyªn tö C vµ H) g¾n víi mét nhãm
carboxyl cã tÝnh acid. C¸c acid bÐo kh¸c nhau bëi ®é dµi cña chóng, sè l­îng vµ
vÞ trÝ liªn kÕt ®«i. C¸c acid bÐo kh«ng mang liªn kÕt ®«i ®­îc gäi lµ b·o hoµ, c¸c
acid bÐo kh«ng b·o hoµ cã mang Ýt nhÊt mét liªn kÕt ®«i.
B¶ng 1.1: CÊu tróc vµi acid bÐo tiªu biÓu trong hÖ thèng sèng

C«ng thøc ho¸ häc Tªn th«ng th­êng

Acid bÐo b·o hoµ


CH 3 (CH 2 ) 10 COOH Lauric
CH 3 (CH 2 ) 12 COOH Palmitic
Acid bÐo kh«ng b·o hoµ
CH 3 (CH 2 ) 5 CH=CH(CH 2 ) 7 COOH Palmitoleic
CH 3 (CH 2 ) 7 CH=CH(CH 2 ) 7 COOH Oleic

C¸c lipid mµng ®­îc h×nh thµnh tõ mét chuçi dµi acid bÐo nèi víi nh÷ng
nhãm cã ®Æc tÝnh thÝch n­íc cao vµ ®­îc gäi lµ nh÷ng ph©n tö l­ìng cùc v× cã mét
®Çu t­¬ng t¸c víi n­íc, chóng kh«ng hîp thµnh giät mµ xÕp sao cho ®Çu thÝch
n­íc cña ph©n tö tiÕp xóc víi n­íc. C¸c phospholipid lµ c¸c lipid mµng chñ yÕu
(h×nh 1.3).

16
H×nh 1.3. CÊu t¹o cña phospholipid vµ mµng phospholipid kÐp

1.3. Protein
1.3.1. CÊu tróc cña protein
Amino acid lµ ®¬n vÞ c¬ së (monomer) cÊu thµnh protein. TÊt c¶ 20 amino
acid ®Òu ®­îc x©y dùng theo mét kiÓu chung:
R

Trong ®ã R lµ nh¸nh bªn còng lµ phÇn kh¸c nhau duy nhÊt gi÷a 20 lo¹i amino
acid, quy ®Þnh tÝnh chÊt cña tõng lo¹i. Dùa vµo ®iÖn tÝch cña chóng, c¸c amino
acid cã thÓ ®­îc chia lµm 4 nhãm:
- Nhãm 1: C¸c amino acid cã tÝnh kiÒm: Lys, Arg, His
- Nhãm 2: C¸c amino acid cã tÝnh acid: Asp vµ Glu
- Nhãm 3: C¸c amino acid trung tÝnh kÞ n­íc (kh«ng mang ®iÖn tÝch):
Ala, Val, Leu, ... cã nh¸nh bªn mang nhãm kÞ n­íc.
- Nhãm 4: C¸c amino acid trung tÝnh ph©n cùc cã nh¸nh bªn mang
nhãm OH dÔ t¹o c¸c liªn kÕt hydro víi n­íc.
C¸c amino acid ®­îc nèi víi nhau bëi c¸c liªn kÕt peptide. Liªn kÕt nµy ®­îc
h×nh thµnh do sù kÕt hîp nhãm amine cña mét amino acid nµy víi mét nhãm
carboxyl cña amino acid kÕ tiÕp (h×nh 1.4).
Oligopeptide lµ mét chuçi nèi tiÕp nhiÒu amino acid (sè l­îng Ýt h¬n 30); víi
mçi sè l­îng amino acid lín h¬n chuçi ®­îc gäi lµ polypeptide. Mçi polypeptide
cã hai ®Çu tËn cïng, mét ®Çu mang nhãm amine tù do (®Çu N), ®Çu kia mang nhãm
carboxyl tù do (®Çu C). Cßn tõ "protein" dïng ®Ó chØ mét ®¬n vÞ chøc n¨ng nghÜa
lµ mét cÊu tróc phøc t¹p trong kh«ng gian chø kh«ng chØ ®¬n thuÇn lµ mét tr×nh
tù amino acid. ThËt vËy, polypeptide cã thÓ uèn thµnh cÊu tróc h×nh gËy nh­ trong
c¸c protein h×nh sîi, hay cÊu tróc khèi cÇu nh­ trong c¸c protein h×nh cÇu hay mét

17
cÊu tróc bao gåm c¶ hai d¹ng trªn. Mét protein cßn cã thÓ ®­îc h×nh thµnh tõ
nhiÒu chuçi polypeptide (h×nh 1.5).

H×nh 1.5. C¸c bËc cÊu tróc cña protein (hemoglobin)

Protein bao hµm bèn møc ®é tæ chøc: CÊu tróc bËc mét lµ tr×nh tù s¾p xÕp
c¸c amino acid trong chuçi polypeptide, cÊu tróc bËc hai ph¸t sinh tõ sù uèn c¸c
phÇn cña chuçi polypeptide thµnh nh÷ng cÊu tróc ®Òu ®Æn trong kh«ng gian (d¹ng
xo¾n α hay líp máng β), cÊu tróc bËc ba quy ®Þnh sù kÕt hîp c¸c chuçi xo¾n hay
líp máng ®ã thµnh h×nh d¹ng ba chiÒu trong kh«ng gian vµ sau cïng cÊu tróc bËc
bèn lµ sù tæ chøc nhiÒu chuçi polypeptide thµnh mét ph©n tö protein.
1.3.2. Mét sè chøc n¨ng quan träng cña protein
Protein chiÕm phÇn lín khèi l­îng kh« cña tÕ bµo vµ tham gia vµo hÇu hÕt
c¸c qu¸ tr×nh sinh häc:
§Çu tiªn ph¶i kÓ ®Õn lµ c¸c enzyme cã chøc n¨ng xóc t¸c cho hÇu hÕt c¸c
ph¶n øng sinh ho¸ häc trong hÖ thèng sèng. Hai ®Æc tr­ng c¬ b¶n cho enzyme lµ
kh¶ n¨ng xóc t¸c rÊt lín vµ tÝnh ®Æc hiÖu cao. C¸c ®Æc tÝnh nµy kh«ng nh÷ng phô
thuéc vµo cÊu tróc bËc mét mµ cßn ®­îc quy ®Þnh bëi sù s¾p xÕp trong kh«ng gian
cña ph©n tö enzyme ®Ó h×nh thµnh c¸c vÞ trÝ ho¹t ®éng (gåm vÞ trÝ nhËn biÕt, vÞ trÝ
g¾n c¬ chÊt vµ xóc t¸c ph¶n øng). C¬ chÊt t­¬ng t¸c víi enzyme theo hai c¬ chÕ:
- C¬ chÕ 1: §iÖn tÝch hay h×nh d¹ng bæ sung cña hai ph©n tö nµy phï
hîp hoµn toµn víi nhau ®Ó h×nh thµnh nªn mét phøc hîp bÒn v÷ng.

18
- C¬ chÕ 2: Sù g¾n c¬ chÊt vµo enzyme lµm thay ®æi cÊu h×nh cña
enzyme vµ ®Æt toµn bé phøc hîp vµo mét tr¹ng th¸i thuËn lîi cho ph¶n øng xóc
t¸c.
Tripsin vµ chymotripsin lµ nh÷ng enzyme thuû ph©n protein ®­îc nghiªn cøu
t­êng tËn nhÊt. Ho¹t tÝnh xóc t¸c cña chymotripsin do ba amino acid quyÕt ®Þnh:
His 57, Asp 102 vµ Ser 195. Ba amino acid nµy n»m c¸ch xa nhau trong cÊu tróc
bËc mét, chóng ®­îc kÐo gÇn l¹i víi nhau ®Ó h×nh thµnh vÞ trÝ ho¹t ®éng do sù uèn
khóc cña enzyme.
TiÕp theo, kh¶ n¨ng nhËn biÕt c¸c lo¹i ph©n tö kh¸c nhau cña protein cßn ®Æc
biÖt tinh tÕ h¬n trong tr­êng hîp c¸c kh¸ng thÓ. Chóng cã thÓ nhËn biÕt hai ph©n
tö chØ kh¸c nhau vµi amino acid, vÝ dô: khi tiªm insulin bß cho ng­êi ®«i khi l¹i
g©y ra ph¶n øng s¶n sinh kh¸ng thÓ kh¸ng insulin bß mÆc dï hai lo¹i insulin nµy
chØ kh¸c nhau ba amino acid. BÊt kú mét t¸c nh©n nµo khi x©m nhËp vµo c¬ thÓ
®éng vËt cã x­¬ng sèng còng sÏ kÝch thÝch sù s¶n sinh kh¸ng thÓ thÝch øng, t¸c
nh©n g©y miÔn dÞch ®­îc gäi lµ kh¸ng nguyªn.
C¸c protein vËn ®éng, ®iÓn h×nh lµ miosin, chÞu tr¸ch nhiÖm vÒ sù chuyÓn
®éng ë ®éng vËt c¶ ë møc tÕ bµo vµ c¬ thÓ. Khi tr­ît trªn sîi actin, mét protein
kh¸c tham gia vµo qu¸ tr×nh vËn ®éng, miosin g©y ra c¸c chuyÓn ®éng néi bµo
còng nh­ sù co c¬.

1.4 acid Nucleic


Acid nucleic, vËt chÊt mang th«ng tin di truyÒn cña c¸c hÖ thèng sèng, lµ mét
polymer h×nh thµnh tõ c¸c monomer lµ nucleotide. Mçi nucleotide gåm ba thµnh
phÇn: nhãm phosphate, ®­êng pentose (5C) vµ mét base h÷u c¬ (v× c¸c nucleotide
chØ kh¸c nhau ë base nªn ng­êi ta th­êng dïng tõ "base" thay cho tõ "nucleotide").
C¸c base h÷u c¬ thuéc hai nhãm: c¸c purine gåm Adenine vµ Guanine, c¸c
pyrimidine gåm Thymine, Cytosine vµ Uracil. C¸c nucleotide ®­îc nèi víi nhau
b»ng liªn kÕt phosphodiester t¹o thµnh chuçi dµi (h×nh 1.6).

19
Acid nucleic gåm hai lo¹i ph©n tö cã cÊu t¹o rÊt gièng nhau lµ: Acid
Desoxyribonucleic (DNA) vµ Acid Ribonucleic (RNA).
1.4.1. DNA (DesoxyriboNucleic Acid)
Ph©n tö DNA lµ mét chuçi xo¾n kÐp gåm hai m¹ch ®¬n, mçi m¹ch ®¬n lµ
mét chuçi nucleotide. Mçi nucleotide gåm nhãm phosphate, ®­êng desoxyribose
vµ mét trong 4 base (A, T, G vµ C). Hai m¹ch ®¬n kÕt hîp víi nhau nhê c¸c liªn
kÕt hydro h×nh thµnh gi÷a c¸c base bæ sung n»m trªn hai m¹ch; A bæ sung cho T
vµ C bæ sung cho G. Mçi m¹ch ®¬n lµ mét tr×nh tù cã ®Þnh h­íng víi mét ®Çu 5'
phosphate tù do, ®Çu kia lµ ®Çu 3' OH tù do (h­íng quy ­íc lµ 5' ®Õn 3'). H­íng
cña hai m¹ch ®¬n trong chuçi xo¾n kÐp ng­îc nhau, ng­êi ta gäi chóng lµ hai
m¹ch ®èi song song (h×nh 1.7).

H×nh 1.7. M« h×nh chuçi DNA xo¾n kÐp


20
Tõ c¸c d÷ kiÖn trªn n¶y sinh hai kh¸i niÖm c¬ b¶n:
• Mçi m¹ch ®¬n lµ mét tr×nh tù c¸c base kh¸c nhau, nh­ vËy mçi m¹ch
®¬n mang th«ng tin kh¸c víi m¹ch kia.
• Hai m¹ch ®¬n liªn kÕt víi nhau bëi mét quan hÖ bæ sung. ChÝnh quan
hÖ nµy gi¶i thÝch ®­îc cÊu tróc chÆt chÏ cña ph©n tö DNA vµ ®Æc biÖt lµ ph­¬ng
c¸ch tù sao chÐp ®Ó t¹o ra hai ph©n tö con tõ mét ph©n tö mÑ.
1.4.2. RNA (RiboNucleic Acid)
Ph©n tö RNA cã cÊu tróc t­¬ng tù DNA víi ba ®iÓm kh¸c biÖt sau:
- Ph©n tö RNA lµ chuçi ®¬n
- Pentose cña ph©n tö RNA lµ ribose thay v× lµ desoxyribose
- Thymine, mét trong bèn lo¹i base h×nh thµnh nªn ph©n tö DNA, ®­îc thay
thÕ b»ng Uracil trong ph©n tö RNA.
Trong tÕ bµo cã ba lo¹i RNA chÝnh, víi c¸c vai trß kh¸c nhau (h×nh 1.9)
• C¸c RNA th«ng tin (mRNA) lµ c¸c b¶n sao cña nh÷ng tr×nh tù nhÊt
®Þnh trªn ph©n tö DNA, ®ãng vai trß trung gian chuyÓn th«ng tin m· ho¸ trªn ph©n
tö DNA ®Õn bé m¸y gi¶i m· thµnh ph©n tö protein t­¬ng øng. C¸c RNA nµy cã
cÊu tróc ®a d¹ng, kÝch th­íc nhá so víi DNA, v× chØ chøa th«ng tin m· ho¸ cho
mét hoÆc mét vµi protein, chiÕm kho¶ng 2-5% tæng sè RNA tÕ bµo. Qu¸ tr×nh
chuyÓn th«ng tin ®­îc thÓ hiÖn trong chñ thuyÕt trung t©m cña sinh häc ph©n tö:

H×nh 1.8. Häc thuyÕt trung t©m cña sinh häc ph©n tö

• C¸c RNA vËn chuyÓn (tRNA) ®ãng vai trß vËn chuyÓn c¸c amino
acid cÇn thiÕt ®Õn bé m¸y dÞch m· ®Ó tæng hîp protein tõ mRNA t­¬ng øng. C¸c

21
tRNA cã cÊu tróc d¹ng cá ba l¸. CÊu tróc nµy ®­îc æn ®Þnh nhê c¸c liªn kÕt bæ
sung (gièng liªn kÕt bæ sung nèi hai sîi ®¬n DNA) hiÖn diÖn ë nhiÒu vïng cña
ph©n tö tRNA. Hai vÞ trÝ kh«ng cã liªn kÕt bæ sung ®ãng vai trß ®Æc biÖt quan
träng ®èi víi chøc n¨ng cña tRNA: (1) tr×nh tù anticodon gåm 3 nucleotide bæ
sung cho codon tøc bé ba m· ho¸ trªn mRNA, (2) tr×nh tù CCA cã kh¶ n¨ng nèi
céng ho¸ trÞ víi mét amino acid ®Æc tr­ng.
• C¸c RNA cña ribosome (rRNA) chiÕm ®Õn 80% tæng sè RNA tÕ bµo.
C¸c rRNA kÕt hîp víi c¸c protein chuyªn biÖt t¹o thµnh ribosome, mét thµnh phÇn
cña bé m¸y dÞch m· cña tÕ bµo. Tuú theo hÖ sè l¾ng (S-sedimentation), rRNA
®­îc chia thµnh nhiÒu lo¹i: ë eukaryote cã rRNA: 28S, 18S, 5,8S vµ 5S; cßn c¸c
rRNA t­¬ng øng ë prokaryote lµ: 23S, 16S vµ 5S (h×nh 1.9).
Ribosome cña mäi tÕ bµo ®Òu gåm mét tiÓu ®¬n vÞ nhá vµ mét tiÓu ®¬n vÞ
lín. Mçi tiÓu ®¬n vÞ cã mang nhiÒu protein vµ rRNA cã kÝch th­íc kh¸c nhau.

H×nh 1.9.CÊu tróc cña c¸c RNA chÝnh trong c¬ thÓ sinh vËt

§Æc biÖt, mét sè RNA cßn cã chøc n¨ng xóc t¸c nh­ mét protein. N¨m 1981,
ng­êi ta ph¸t hiÖn thÊy ë mét loµi nguyªn sinh ®éng vËt Tetrahymina, qu¸ tr×nh
h×nh thµnh mét rRNA tr­ëng thµnh tõ mét ph©n tö tiÒn th©n th«ng th­êng cÇn sù
xóc t¸c cña mét enzyme, l¹i cã thÓ tiÕn hµnh ë ®iÒu kiÖn in vitro hoµn toµn kh«ng

22
cã sù hiÖn diÖn cña protein. ChÝnh tr×nh tù intron trong ph©n tö RNA ®· xóc t¸c
cho qu¸ tr×nh ®ã. GÇn ®©y, nhiÒu nhãm RNA cã chøc n¨ng xóc t¸c ®· ®­îc ph¸t
hiÖn trong nhiÒu qu¸ tr×nh tr­ëng thµnh cña tRNA, trong chu tr×nh sèng cña mét
sè viroid thùc vËt ...
2. C¸c liªn kÕt yÕu trong hÖ thèng sèng
2.1. §Þnh nghÜa vµ ®Æc ®iÓm chung cña c¸c liªn kÕt
ho¸ häc
Liªn kÕt ho¸ häc lµ mét lùc hót gi÷a hai nguyªn tö l¹i víi nhau. C¸c tæ hîp
nguyªn tö cã kÝch th­íc x¸c ®Þnh ®­îc gäi lµ ph©n tö. Sù liªn l¹c cña c¸c nguyªn
tö trong mét ph©n tö ®­îc ®¶m b¶o bëi c¸c liªn kÕt céng ho¸ trÞ. Nh­ng lùc hót
yÕu h¬n l¹i ®ãng vai trß quan träng trong cÊu tróc cña c¸c ®¹i ph©n tö, vÝ dô nh­
cÊu tróc bèn chuçi polypeptide cña ph©n tö hemoglobin ®­îc b¶o ®¶m bëi ho¹t
®éng phèi hîp cña nhiÒu liªn kÕt ho¸ häc yÕu.
C¸c liªn kÕt ho¸ häc ®­îc xÕp lo¹i dùa vµo nhiÒu tÝnh chÊt. §Æc tr­ng thø
nhÊt cña mét liªn kÕt ho¸ häc lµ lùc liªn kÕt. C¸c liªn kÕt m¹nh nh­ liªn kÕt céng
ho¸ trÞ rÊt bÒn v÷ng. C¸c liªn kÕt yÕu, ng­îc l¹i rÊt dÔ bÞ ph¸ vì, chØ tån t¹i trong
mét thêi gian rÊt ng¾n. ChØ khi tËp hîp thµnh nhãm cã trËt tù, chóng míi tån t¹i
®­îc l©u dµi. Sù h×nh thµnh hay ph¸ vì mét liªn kÕt céng ho¸ trÞ bao giê còng ®ßi
hái mét n¨ng l­îng lín. VÝ dô n¨ng l­îng cÇn ®Ó ph¸ vì liªn kÕt C-C cña ph©n tö
ethane lµ 83kcal/mol, trong khi n¨ng l­îng gi¶i phãng tõ sù h×nh thµnh c¸c liªn
kÕt yÕu chØ trong kho¶ng 1-5kcal/mol. NÕu biÕt r»ng ®éng n¨ng trung b×nh cña
c¸c ph©n tö ë nhiÖt ®é m«i tr­êng (250C) lµ 0,6kcal/mol th× ë nhiÖt ®é sinh lý
(370C) n¨ng l­îng chøa trong mét tËp hîp ph©n tö sÏ d­ søc ph¸ vì c¸c liªn kÕt
ho¸ häc yÕu. C¸c liªn kÕt nµy bÞ ph¸ vì vµ ®­îc t¸i lËp liªn tôc.
§Æc tr­ng thø hai lµ sè l­îng liªn kÕt ho¸ häc tèi ®a cña mét nguyªn tö. Sè
l­îng liªn kÕt céng ho¸ trÞ mµ mét nguyªn tö cã thÓ tham gia ®­îc gäi lµ ho¸ trÞ.
VÝ dô O 2 cã ho¸ trÞ hai, chØ cã thÓ t¹o tèi ®a hai nèi céng ho¸ trÞ. Trong khi ®ã,
c¸c liªn kÕt ho¸ häc yÕu kh«ng ph¶i chÞu nh÷ng h¹n chÕ kh¾t khe nh­ vËy. §èi
víi liªn kÕt Van der Walls ch¼ng h¹n, nh©n tè h¹n chÕ chØ thuÇn tuý lµ nh©n tè
kh«ng gian: sè l­îng liªn kÕt tuú thuéc vµo sè nguyªn tö cã thÓ ®ång tiÕp xóc víi
nhau.
Mét ®Æc tr­ng kh¸c lµ gãc liªn kÕt. Gãc gi÷a hai liªn kÕt céng ho¸ trÞ th­êng
cè ®Þnh trong khi gãc hîp thµnh bëi nh÷ng liªn kÕt yÕu hay thay ®æi. Ngoµi ra,

23
trong tr­êng hîp c¸c liªn kÕt yÕu, kh¶ n¨ng quay tù do cña c¸c nguyªn tö trong
liªn kÕt còng Ýt bÞ h¹n chÕ h¬n so víi ë liªn kÕt céng ho¸ trÞ.
2.2. Bèn lo¹i liªn kÕt ho¸ häc yÕu c¬ b¶n
2.2.1. Liªn kÕt hydro
Liªn kÕt hydro lµ t­¬ng t¸c yÕu h×nh thµnh gi÷a mét nguyªn tö mang ®iÖn
tÝch ©m (gäi lµ nguyªn tö nhËn A-acceptor) vµ mét nguyªn tö hydro ®ang n»m
trong mét nèi céng ho¸ trÞ víi mét nguyªn tö kh¸c (gäi lµ nguyªn tö cho D-
donnor). Nèi céng ho¸ trÞ gi÷a D vµ hydro ph¶i lµ nèi ph©n cùc vµ ®¸m m©y ®iÖn
tö cña A ph¶i mang nh÷ng ®iÖn tö kh«ng liªn kÕt cã kh¶ n¨ng thu hót ®iÖn tÝch δ+
cña hydro.
D-H + A D-H ... A

liªn kÕt hydro


N¨ng l­îng ®Ó ph¸ vì mét liªn kÕt hydro lµ kho¶ng 5kcal/mol. Mét ®Æc ®iÓm
quan träng cña c¸c liªn kÕt hydro lµ H, nguyªn tö nhËn A, nguyªn tö cho D ®Òu
xÕp trªn mét ®­êng th¼ng. Nguyªn tö N trong liªn kÕt N-H còng nh­ O trong liªn
kÕt O-H ®Òu lµ nh÷ng nguyªn tö cho chÝnh. Trong hÖ thèng sèng ®ã lµ c¸c nhãm
amine (-NH 2 ) vµ hydroxyl (-OH). Sù hiÖn diÖn cña c¸c nhãm nµy khiÕn cho c¸c
ph©n tö cã mang chóng dÔ hoµ tan trong n­íc, do cã sù h×nh thµnh cña c¸c liªn
kÕt hydro gi÷a chóng víi c¸c ph©n tö n­íc. §Æc biÖt, c¸c ph©n tö n­íc - nh©n tè
chñ yÕu cña vËt chÊt sèng lu«n h×nh thµnh mét m¹ng l­íi ®Òu ®Æn nh÷ng h×nh tø
diÖn dï ë thÓ láng hay thÓ r¾n.
2.2.2. Liªn kÕt ion
Liªn kÕt ion lµ t­¬ng t¸c tÜnh ®iÖn gi÷a hai nhãm cã ®iÖn tÝch ng­îc dÊu.
Trong nhiÒu tr­êng hîp chÊt v« c¬, ®iÖn tö liªn kÕt lu«n lu«n bÞ hót vÒ phÝa nguyªn
tö cã ®é ©m ®iÖn cao h¬n g©y ra sù ph©n ly cation (nguyªn tö tÝch ®iÖn ©m) vµ
anion (nguyªn tö tÝch ®iÖn d­¬ng). VÝ dô NaCl  Na+ + Cl-. V× ®iÖn tö kh«ng
®­îc ph©n chia ®ång ®Òu cho hai nguyªn tö nªn liªn kÕt nµy kh«ng ®­îc xÕp vµo
lo¹i c¸c liªn kÕt céng ho¸ trÞ. Kh¸c víi c¸c liªn kÕt céng ho¸ trÞ hay liªn kÕt hydro,
c¸c liªn kÕt ion kh«ng cã ®Þnh h­íng trong kh«ng gian v× ®iÖn tr­êng lµ ®ång ®Òu
quanh ion. Trong m«i tr­êng n­íc, c¸c anion vµ cation lu«n lu«n ®­îc v©y bäc
bëi c¸c ph©n tö n­íc t¹o thµnh mét líp vá ngoµi, nªn kh«ng thÓ liªn kÕt trùc tiÕp
víi c¸c cation vµ anion kh¸c. Do ®ã ng­êi ta cho r»ng t­¬ng t¸c tÜnh ®iÖn nµy
kh«ng ®ãng vai trß trong quyÕt ®Þnh cÊu h×nh kh«ng gian cña c¸c ph©n tö h÷u c¬.

24
2.2.3. Liªn kÕt Van der Waals
Liªn kÕt Van der Waals lµ c¸c t­¬ng t¸c kh«ng ®Æc hiÖu xuÊt hiÖn gi÷a hai
ph©n tö khi chóng tiÕn ®Õn gÇn nhau. T­¬ng t¸c nµy kh«ng do sù ph©n phèi lÖch
cña c¸c ®iÖn tö gi÷a hai ph©n tö mµ do c¸c biÕn ®éng tho¸ng qua cña ®¸m m©y
®iÖn tö g©y ra sù ph©n cùc nhÊt thêi trªn ph©n tö. Liªn kÕt Van der Waals kh«ng
phô thuéc tÝnh ph©n cùc cña c¸c ph©n tö mµ chØ phô thuéc vµo kho¶ng c¸ch gi÷a
chóng. Lùc Van der Waals lµ kÕt qu¶ cña lùc hót vµ lùc ®Èy. Hai lùc nµy c©n b»ng
ë mét kho¶ng c¸ch nhÊt ®Þnh, ®Æc tr­ng cho tõng lo¹i nguyªn tö. Kho¶ng c¸ch nµy
®­îc gäi lµ b¸n kÝnh Van der Waals. §©y lµ lùc liªn kÕt yÕu nhÊt, víi gi¸ trÞ chØ
kho¶ng 1kcal/mol. §Ó liªn kÕt nµy thùc sù cã ý nghÜa, nã ph¶i tån t¹i víi sè l­îng
lín. NghÜa lµ bÒ mÆt tiÕp xóc cña hai ph©n tö ph¶i cùc ®¹i. §iÓn h×nh lµ khi mét
ph©n tö cã mang mét hèc cã h×nh d¹ng phï hîp víi chç låi cña ph©n tö kia, nh­
tr­êng hîp t­¬ng t¸c gi÷a kh¸ng nguyªn-kh¸ng thÓ, enzyme-c¬ chÊt ....

H×nh 1.10. Nh÷ng t­¬ng t¸c yÕu gi÷a hai protein ®Ó h×nh thµnh nªn mét phøc hÖ æn ®Þnh

2.2.4. T­¬ng t¸c kÞ n­íc


C¸c ph©n tö kh«ng ph©n cùc, tøc lµ c¸c ph©n tö kh«ng chøa nhãm ion ho¸
lÉn liªn kÕt ph©n cùc, ®Òu kh«ng hoµ tan trong n­íc, chóng lµ nh÷ng ph©n tö kÞ
n­íc. Lùc thóc ®Èy c¸c ph©n tö hay c¸c vïng kh«ng ph©n cùc cña c¸c ph©n tö liªn
kÕt víi nhau thay v× c¸c ph©n tö n­íc ®­îc gäi lµ liªn kÕt kÞ n­íc. §©y kh«ng ph¶i
lµ mét lùc liªn kÕt ®óng nghÜa mµ lµ mét khuynh h­íng lo¹i trõ c¸c nhãm kh«ng
ph©n cùc ra khái m¹ng n­íc. Cßn liªn kÕt thËt sù tån t¹i gi÷a c¸c ph©n tö kh«ng
ph©n cùc lµ liªn kÕt Van der Waals. C¸c t­¬ng t¸c kÞ n­íc ®ãng vai trß quan träng

25
trong viÖc æn ®Þnh c¸c protein, c¸c phøc hîp protein víi c¸c ph©n tö kh¸c còng
nh­ sù ph©n bè c¸c protein trong mµng sinh häc.
2.3. Vai trß cña c¸c liªn kÕt ho¸ häc yÕu
Vai trß quyÕt ®Þnh cña c¸c liªn kÕt yÕu trong hÖ thèng sèng thÓ hiÖn mét c¸ch
®a d¹ng, trong c¸c t­¬ng t¸c enzyme - c¬ chÊt, trong viÖc h×nh thµnh cÊu h×nh
kh«ng gian cña c¸c ph©n tö sinh häc, trong qu¸ tr×nh ®iÒu hoµ c¸c ho¹t ®éng sèng.
2.3.1. T­¬ng t¸c enzyme - c¬ chÊt
Trong c¸c ph¶n øng xóc t¸c, c¸c enzyme kh«ng g¾n lªn mét ph©n tö bÊt kú,
chóng cã ¸i lùc ®Æc biÖt víi chÝnh c¬ chÊt cña chóng. N¨ng l­îng liªn kÕt cña
t­¬ng t¸c enzyme-c¬ chÊt th­êng cã gi¸ trÞ 5-10kcal/mol cho thÊy nã thuéc lo¹i
liªn kÕt ho¸ häc yÕu, nghÜa lµ c¸c phøc hîp enzyme-c¬ chÊt ®­îc h×nh thµnh vµ
ph¸ vì rÊt nhanh d­íi ¶nh h­ëng cña chuyÓn ®éng nhiÖt. §iÒu nµy gi¶i thÝch v×
sao c¸c enzyme cã kh¶ n¨ng ho¹t ®éng víi vËn tèc ®«i khi ®¹t ®Õn 106 lÇn trong
mét gi©y. Mét lùc liªn kÕt m¹nh h¬n gi÷a enzyme vµ c¬ chÊt hay gi÷a enzyme vµ
s¶n phÈm sÏ lµm cho enzyme chËm h¬n rÊt nhiÒu.
2.3.2. CÊu h×nh kh«ng gian cña c¸c ph©n tö
Khã cã thÓ tiªn ®o¸n cÊu h×nh cña nh÷ng ®¹i ph©n tö nh­ protein vµ nucleic
acid nÕu chØ dùa vµo cÊu tróc céng ho¸ trÞ cña chóng. CÊu h×nh nµy phô thuéc chñ
yÕu vµo sè l­îng vµ b¶n chÊt c¸c liªn kÕt yÕu tån t¹i trªn c¸c ®¹i ph©n tö ®ã.
C¸c t­¬ng t¸c kÞ n­íc cã chøc n¨ng æn ®Þnh ph©n tö protein nh­ng chÝnh c¸c
liªn kÕt hydro míi quy ®Þnh cÊu h×nh ®Æc tr­ng cña nã. C¸c liªn kÕt hydro ®ßi hái
mét kho¶ng c¸ch nhÊt ®Þnh vµ sù s¾p xÕp cã ®Þnh h­íng c¸c nguyªn tö cho vµ
nhËn trong kh«ng gian. §Ó tho¶ m·n yªu cÇu cña c¸c nguyªn tö cho vµ nhËn trªn
bé khung polypeptide, trong ph©n tö protein th­êng h×nh thµnh nh÷ng cÊu tróc bËc
hai ®Òu ®Æn, c¸c chuçi xo¾n α hay nh÷ng cÊu tróc d¹ng líp máng β. C¸c cÊu tróc
®èi xøng ®Òu ®Æn nµy cã tÝnh æn ®Þnh rÊt cao.
Mét ph©n tö protein th­êng bao gåm c¶ hai lo¹i cÊu tróc trªn, bªn c¹nh ®ã
cã nh÷ng vïng cÊu tróc kh«ng ®Òu ®Æn cÇn cho sù cuén gÊp cña chuçi polypeptide.
Ph©n tö DNA th­êng cã d¹ng xo¾n kÐp, d¹ng xo¾n kÐp nµy xuÊt ph¸t tõ nhiÒu
nguyªn nh©n:
- Hai m¹ch ®¬n b¾t cÆp víi nhau nhê c¸c liªn kÕt bæ sung. Trong c¸c
liªn kÕt bæ sung nµy, mét bªn bao giê còng lµ mét purine (A vµ G cã cïng kÝch
th­íc) vµ bªn kia lµ pyrimidine (C vµ T cã cïng kÝch th­íc). §iÒu nµy ®¶m b¶o

26
kho¶ng c¸ch ®Òu ®Æn gi÷a hai m¹ch ®¬n tøc lµ tæng kÝch th­íc cña mét purine vµ
mét pyrimidine.
- Chuçi xo¾n kÐp cho phÐp c¸c base purine vµ pyrimidine cã cÊu tróc
ph¼ng xÕp chång khÝt lªn nhau ë bªn trong ph©n tö DNA, h¹n chÕ sù tiÕp xóc cña
chóng víi n­íc.
- C¸c nguyªn tö ®­êng vµ c¸c nhãm phosphate xoay ra ngoµi h×nh
thµnh liªn kÕt víi n­íc ®¶m b¶o tÝnh æn ®Þnh cho ph©n tö.
CÊu h×nh chuçi xo¾n kÐp cho ph©n tö DNA lµ mét cÊu tróc æn ®Þnh v× hai lÝ
do: (1) nÕu hai m¹ch ®¬n t¸ch rêi nhau, c¸c base purine vµ pyrimidine kÞ n­íc sÏ
ph¶i tiÕp xóc víi n­íc, ®iÒu nµy ®Æt chóng vµo t×nh thÕ bÊt lîi, kh«ng æn ®Þnh, (2)
mçi ph©n tö DNA mang mét sè l­îng liªn kÕt hydro rÊt lín, nªn dï chuyÓn ®éng
nhiÖt cã ph¸ vì c¸c liªn kÕt n»m ë hai ®Çu cña ph©n tö, hai m¹ch ®¬n vÉn g¾n ®­îc
víi nhau bëi c¸c liªn kÕt ë vïng gi÷a. ChØ trong nh÷ng ®iÒu kiÖn rÊt kh¾c nghiÖt
(vÝ dô nhiÖt ®é cao h¬n h¼n nhiÖt ®é sinh lý) míi cã sù ph¸ vì ®ång thêi qu¸ nhiÒu
liªn kÕt hydro khiÕn ph©n tö kh«ng cßn gi÷ ®­îc cÊu h×nh ban ®Çu, ph©n tö bÞ biÕn
tÝnh.
2.3.3. Liªn kÕt yÕu ®¶m b¶o mèi liªn l¹c gi÷a protein vµ DNA
C¸c protein ®ãng vai trß nÐn chÆt cÊu tróc DNA trong nh©n nh­ c¸c histone,
liªn kÕt víi DNA nhê c¸c liªn kÕt ion. C¸c liªn kÕt ion nµy ®­îc h×nh thµnh gi÷a
c¸c nh¸nh bªn mang ®iÖn tÝch d­¬ng cña c¸c histone víi c¸c nhãm phosphate
mang ®iÖn tÝch ©m cña DNA. DNA quÊn quanh lâi cÊu t¹o tõ nhiÒu histone nªn
mÆc dï ®­îc nÐn l¹i nh­ng phÇn lín bÒ mÆt cña ph©n tö DNA vÉn cã kh¶ n¨ng
tiÕp xóc víi nhiÒu protein kh¸c.
§ã lµ c¸c protein ®ãng vai trß quan träng trong sù sao chÐp nh­ c¸c DNA
polymerase, trong sù phiªn m· nh­ c¸c RNA polymerase hay c¸c protein cã chøc
n¨ng ®iÒu hoµ ho¹t ®éng cña c¸c gen, ... C¸c protein nµy nhËn biÕt mét tr×nh tù
x¸c ®Þnh trªn DNA vµ g¾n vµo ®ã ë vÞ trÝ c¸c nhãm cÆp base ®Æc tr­ng nhê liªn
kÕt ion. Sù nhËn biÕt tr×nh tù nµy phÇn lín lµ kÕt qu¶ cña sù bæ sung h×nh d¹ng
gi÷a protein vµ DNA.

27
Nãi chung, n¨ng l­îng cña liªn kÕt ho¸ häc yÕu (2-5kcal/mol) th­êng ®¶m
b¶o cho mét ph©n tö g¾n mét c¸ch ­u tiªn lªn mét ph©n tö kh¸c. §iÒu quan träng
h¬n lµ n¨ng l­îng ®ã l¹i kh«ng ®ñ lín ®Ó t¹o ra nh÷ng m¹ng l­íi cøng nh¾c bªn
trong tÕ bµo, chÝnh nhê ®ã mµ bªn trong tÕ bµo sèng kh«ng bao giê ®Æc l¹i.
H¬n n÷a, nÕu n¨ng l­îng liªn kÕt qu¸ lín th× tÇn sè ph¸ vì c¸c liªn kÕt nµy
gi¶m xuèng, kÕt qu¶ lµ hiÖn t­îng khuÕch t¸n yÕu ®i. HiÖn t­îng khuÕch t¸n x¶y
ra khi chuyÓn ®éng nhiÖt ®Èy c¸c ph©n tö di chuyÓn theo mäi h­íng; trong qu¸
tr×nh di chuyÓn ®ã, khi c¸c ph©n tö ®Õn ®ñ gÇn nhau, chóng sÏ t­¬ng t¸c víi nhau.
Trong tÕ bµo hiÖn t­îng khuÕch t¸n gióp c¸c ph©n tö sinh häc t­¬ng t¸c víi nhau
h×nh thµnh mäi qu¸ tr×nh chuyÓn ho¸ thiÕt yÕu cho sù sèng. Nh­ vËy, sù tån t¹i
cña tÕ bµo sÏ bÞ ®e do¹ khi hiÖn t­îng khuÕch t¸n yÕu ®i. Tãm l¹i, sù hiÖn diÖn
cña mét sè l­îng lín c¸c liªn kÕt yÕu võa ®¶m b¶o tÝnh liÒn l¹c hµi hoµ cña hÖ
thèng sèng ®ång thêi gi÷ ®­îc sù linh ®éng mÒm dÎo lµ mét ®Æc tr­ng cña sù
sèng.
2.4. CÊu tróc bé gen ë prokaryote vµ eukaryote
§Õn nay, c¸c nghiªn cøu cho thÊy tÊt c¶ c¸c sinh vËt cã cÊu t¹o tÕ bµo, ti thÓ
vµ lôc l¹p ®Òu cã bé gen lµ DNA m¹ch kÐp. C¸c virus cã bé gen ®a d¹ng gåm
RNA vµ DNA m¹ch ®¬n hay m¹ch kÐp. ChiÒu dµi bé gen ®¬n béi c¨n cø theo sè
cÆp base cña c¸c nhãm sinh vËt chñ yÕu nh­ sau:
B¶ng 1.2: ChiÒu dµi cña bé gen ®¬n béi ë mét sè sinh vËt

Sinh vËt ChiÒu dµi bé gen ®¬n béi (sè cÆp base)

Virus 103 ®Õn 105

E. coli 4,5.106

NÊm men 5.107

Caenorabditis elegans 8.107

Drosophila 1,5.108

§éng vËt cã x­¬ng sèng 108 ®Õn 1010

28
Ng­êi 3.109

Thùc vËt 1010 ®Õn 1011

Tõ sè liÖu trªn cho thÊy, sè l­îng base kh«ng ph¶n ¸nh møc ®é tiÕn ho¸. Gi÷a
c¸c sinh vËt prokaryote vµ eukaryote cã sù kh¸c nhau ®¸ng kÓ vÒ thµnh phÇn cÊu
t¹o vµ tæ chøc cña DNA trong tÕ bµo. Nh­ng tÊt c¶ sinh vËt ®Òu cã chung cÊu tróc
DNA xo¾n kÐp.
2.4.1. Bé gen cña prokaryote (genome cña prokaryote)
2.4.1.1. C¸c gen trong bé gen prokaryote
MÆc dï cã kÝch th­íc nhá h¬n nhiÒu so víi bé gen eukaryote nh­ng bé gen
prokaryote cã mËt ®é ph©n bè c¸c gen cao h¬n kho¶ng 85-90% bé gen chøa c¸c
gen. Nh­ vËy, sè ®o¹n DNA kh«ng chøa m· di truyÒn Ýt h¬n, tøc lµ kho¶ng c¸ch
gi÷a c¸c gen ng¾n h¬n. VÝ dô kho¶ng c¸ch trung b×nh gi÷a hai gen ë E.coli lµ
118bp. C¸c gen vµ khung ®äc më (ORFs) chiÕm 87,8%. C¸c gen m· cho RNAs
chiÕm 0,8%, cßn thµnh phÇn DNA lÆp l¹i kh«ng chøa gen chØ chiÕm 0,7%. MÆt
kh¸c, hÇu hÕt c¸c gen ë prokaryote ®Òu tån t¹i ®¬n b¶n (single copy gene) vµ c¸c
gen kh«ng bÞ gi¸n ®o¹n bëi c¸c ®o¹n kh«ng chøa m· di truyÒn (c¸c intron).
Trong bé gen prokaryote, mét sè gen ph©n bè c¹nh nhau vµ chÞu sù ®iÒu
khiÓn chung cña mét promoter, tøc lµ chóng ®­îc phiªn m· sang cïng mét ph©n
tö mRNA. CÊu tróc nµy ®­îc gäi lµ operon. Nh­ vËy mét operon gåm hai hay
nhiÒu gen n»m c¹nh nhau trªn cïng mét ®o¹n nhiÔm s¾c thÓ. Th«ng th­êng ®ã lµ
c¸c gen cïng tham gia vµo mét con ®­êng chuyÓn ho¸, vÝ dô gen m· cho c¸c
enzyme cÇn thiÕt cho qu¸ tr×nh chuyÓn ho¸ glucose.

Gen điều hòa Gen operator

Promoter Các gen cấu trúc


I P O Y A
5’ Z 3’
DNA
3’ 5’

Cấu trúc gen của operon lactose ở E.coli

Bắt đầu phiên mã

Hộp Pribnov
5’
DNA TTGACA TATAAT

-35 +1
29
-10
Do cã chung mét promoter ®iÒu khiÓn cho mäi gen n»m trong mét operon,
chØ cã mét lo¹i ph©n tö mRNA ®­îc tæng hîp tõ mét operon (mang th«ng tin di
truyÒn cña tÊt c¶ c¸c gen n»m trong ®ã). Nãi c¸ch kh¸c, qu¸ tr×nh phiªn m· cña
c¸c gen trong mét operon x¶y ra ®ång thêi vµ ph©n tö mRNA ®Æc tr­ng cho operon
®­îc gäi lµ mRNA-polycistronic. Tuy nhiªn, ®iÒu cÇn ghi nhí lµ qu¸ tr×nh dÞch
m· trªn ph©n tö mRNA polycistronic x¶y ra hoµn toµn ®éc lËp víi nhau. Mét ®o¹n
t­¬ng øng víi mét gen trªn ph©n tö nµy ®Òu cã vÞ trÝ b¸m cña ribosome, cã m· b¾t
®Çu vµ kÕt thóc tæng hîp chuçi polypeptide riªng biÖt. Do ®ã, tèc ®é tæng hîp c¸c
protein trªn mét ph©n tö mRNA polycistronic hoµn toµn kh¸c nhau.
Điểm khác so với sinh vật nhân chuẩn là genome sinh vật tiền nhân thường
nhỏ, chủ yếu là mạch vòng, hoạt động gen theo kiểu operon, nhiều gen chung một
promoter, trong gen không có hoặc có ít intron, không có tín hiệu nhận poly A và
mRNA không có đầu 5’ mang mũ 7 methyl Gppp. Chúng thường phải sống ký
sinh vào ký chủ, phụ thuộc vào ký chủ và có khả năng tự tái bản độc lập với tế
bào ký chủ
2.4.1.2. “NhiÔm s¾c thÓ” cña prokaryote
DNA của vi khuẩn nằm trong nhiễm sắc thể sơ khai. Phần lớn các vi khuẩn
chỉ có một nhiễm sắc thể/tế bào. DNA của vi khuẩn cũng ở dạng vòng, chuỗi kép.
Trên DNA có chứa các gen mã hóa cho một protein đặc thù. Ngoài nhiễm sắc thể
chính, vi khuẩn còn chứa dạng DNA khác được gọi là plasmid có kích thước bé
hơn, dạng vòng, có khả năng tự nhân bản. Các plasimd thường chứa một số gen
có tính đặc thù cao.
TËp hîp cña tÊt c¶ vËt liÖu di truyÒn cã mÆt trong tÕ bµo ®¶m b¶o sù tån t¹i
vµ ph©n chia tÕ bµo ®­îc gäi lµ bé gen. TÕ bµo prokaryote kh«ng cã mµng nh©n
nªn bé gen tån t¹i trong tÕ bµo chÊt. Ng­îc l¹i hÇu hÕt bé gen trong tÕ bµo
eukaryote ph©n bè trong nh©n c¸ch biÖt víi tÕ bµo chÊt bëi mét mµng nh©n, cßn
mét phÇn nhá th× ®­îc ph©n bè trong c¸c bµo quan nh­ ty thÓ vµ l¹p thÓ.
Dï sao, mét trong nh÷ng ®iÓm gièng nhau gi÷a hai lo¹i tÕ bµo lµ bé gen
(DNA) ®Òu liªn kÕt víi protein ®Ó t¹o nªn cÊu tróc kh«ng gian ®Æc thï cho tõng
lo¹i tÕ bµo. Trong tÕ bµo prokaryote DNA n»m trong cÊu tróc h¹ch nh©n (nucleoid)
cßn trong tÕ bµo eukaryote DNA n»m trong cÊu tróc sîi nhiÔm s¾c (chromatin).

30
H×nh 1.12. CÊu tróc bé gen cña E. coli

Kho¶ng 80% DNA cã mÆt trong tÕ bµo vi khuÈn ®­îc ph©n bè trong h¹ch
nh©n (nucleoid). H¹ch nh©n kh«ng cã mµng nh©n bao bäc. DNA n»m trong h¹ch
nh©n liªn kÕt víi protein ®Ó h×nh thµnh nªn cÊu tróc kh«ng gian ®Æc thï. Mét sè
protein nh­ HU hoÆc H1 cã chøc n¨ng t­¬ng tù nh­ c¸c protein histone tham gia
vµo viÖc ®ãng gãi DNA trong cÊu tróc h¹ch nh©n. H¹ch nh©n cã thÓ ph©n chia
thµnh 50-100 vïng kh¸c nhau, mçi vïng ®­îc gäi lµ domain. CÊu tróc cña mét
domain gåm kho¶ng 40kb ë d¹ng siªu xo¾n. C¸c domain ®Ýnh kÕt víi nhau ë
nh÷ng ®o¹n DNA nhÊt ®Þnh. §iÒu ®ã gióp cho toµn bé bé gen (h¹ch nh©n) cã cÊu
tróc gièng nh­ mét b«ng hoa gåm 50-100 c¸nh hoa ®Ýnh kÕt víi nhau t¹i nhÞ hoa
(h×nh 1.12). Sù më xo¾n cña mét c¸nh (do ®øt g·y hoÆc do phiªn m· tæng hîp
RNA) kh«ng lµm ¶nh h­ëng tíi c¸c c¸nh kh¸c. Hai enzyme DNA gyrase vµ DNA
topoisomerase gi÷ vai trß chÝnh cïng phèi hîp víi phøc protein lµm nhiÖm vô t¹o
c¸nh hoa cho DNA vi khuÈn.
2.4.2. Bé gen cña eukaryote
Đặc điểm cấu trúc: Genome của nhân được cấu trúc nên từ một bộ các cặp
nhiễm sắc thể tương đồng (nhị bội khác so với prokaryote đơn bội). Mỗi nhiễm
sắc thể thường chứa một phân tử DNA, trừ nhiễm sắc thể khổng lồ của ruồi dấm
và một số vi khuẩn. Genome ở nhân của các loài khác nhau chứa hàm lượng DNA
khác nhau. Bộ nhiễm sắc thể trong nhân có số lượng, kích thước và hình dạng xác
định khác nhau đặc trưng theo từng loài.
Các loại DNA trong genome nhân:
(1) Loại DNA lặp lại ở mức độ cao: thường chiếm khoảng 10% DNA của
mỗi tế bào, là các trình tự ngắn dưới 10 cặp bazơ và có từ 105 – 107 bản sao cho
mỗi genome. Những trình tự này thường không mã hoá và thường gắn các vùng

31
chuyên biệt trên nhiễm sắc thể như centromere hay telomere. Các tụ điểm
(domain) của các DNA lặp lại nhiều lần tạo nên các vùng nhiễm sắc thể đậm đặc
khác nhau trong chu kỳ tế bào, so với những vùng khác nhau của nhiễm sắc thể
và được gọi là thể dị sắc.
(2) Loại DNA có trình tự lặp lại thấp hoặc trung bình: chiếm khoảng 20%.
Loại này chứa các đoạn lặp lại có kích thước lớn hơn (100 cặp bazơ, được lặp lại
từ một vài đến hàng ngàn lần và thường xen kẽ với các trình tự chỉ lặp lại một lần
dọc theo nhiễm sắc thể. Một số trong chúng có chức năng mã hoá tạo ra rRNA,
mRNA hay rRNA 5S. Ví dụ 2 gen tạo histone và RNA ribosome là các gen lặp
lại nhiều lần trong genome nhân. Genome nhân của V.faba có khoảng 4750 gen
tạo ra rRNA trong khi đó genome của V.sativa chỉ có khoảng 1875.
(3) Loại DNA chứa trình tự duy nhất: chiếm khoảng 70%. Chỉ có một bản
và những trình tự này chỉ lặp lại đôi lần, mã hoá cho các protein. Trong hầu hết
các cây trồng, chỉ có khoảng 20 - 40% của bộ genome là có chứa trình tự DNA
chỉ lặp lại một lần.
+ Genome ty thể: Phần lớn các tế bào. Độ lớn rất biến động và không
tương ứng với tính phức tạp của sinh. Genome ty thể động vật thường nhỏ với tổ
chức di truyền được gói gọn, các gen sắp xếp sát nhau với ít khoảng trống ở giữa.
Genome ty thể ở thực vật lớn hơn genome ty thể ở động vật có vú và nấm men.
Kích thước genome ty thể khác nhau rất lớn giữa các loài. Ví dụ: genome
ty thể của Brassica campestris có độ lớn 218 kb, còn của Cucumis melo là 2400
kb, nhỏ hơn nhiêu so với genome nhân.
+ Genome thể sống ký sinh, ngoài các thành phần genome kể trên có một số tế
bào, mô ở một số sinh vật có thể còn có các thể sống ký sinh bên trong. Thể sống
ký sinh có thể có lợi nhưng đa phần là có hại đó là virus, viroid, nấm, sán, giun,
vi khuẩn…và chúng cũng có genome riêng và cũng có chứa các gen mang thông
tin di truyền tạo ra polypeptide. Nếu các gen hoạt động thì cũng biểu hiện hoặc
đóng góp vào sự biểu hiện nên tính trạng của sinh vật.
Genome của người dài khoảng 3200Mb, 1/3 DNA trong đó có liên quan
đến gen. Trong DNA của một gen lại bao gồm vùng mã hóa và không mã hóa,
vùng không mã hóa lại bao gồm Pseudogene, các đoạn trong gen, các intron và
vùng leader. Theo Strachan & Read (1996) thì Pseudogene là gen rất giống với
một gen đã biết ở locus khác nhưng không có chức năng do đột biến thêm hoặc
mất một cấu trúc làm mất khả năng phiên hoặc dịch mã gen. Còn phần lớn các
DNA còn lại (chiếm 2/3) là trình tự DNA giữa các gen gồm trình tự lặp lại (420
Mb): liền kề và phân bố rải rác. Trong trình tự lặp lại liền kề lại bao gồm trình tự
DNA satellite, microsatellite và minisatellite. Còn trình tự phân bố rải rác bao
gồm các LTRs, SINE, LINE và DNA transposon. Trình tự linh tinh khác
(miscellaneous) chiếm 25% gồm: SD (Shine-Dalgano Sequence) là một phần

32
hoặc tất cả trình tự vùng leader của mRNA vi khuẩn AGGAGG nằm trước codon
khởi đầu AUG, trình tự này bổ sung với đầu 3 của 16S rRNA vì thế là vị trí bọc
của ribosome. Vùng 16S rRNA này theo Shine và Dalgano (1974) có thể đóng vai
trò ghép cặp bazơ trong việc kết thúc và khởi đầu quá trình tổng hợp protein của
mRNA. SSR (Simple sequence repeats) trình tự lặp lại đơn giản nằm rải rắc trong
genome. Số còn lại 17% DNA genome đến nay vẫn chưa rõ thuộc loại cấu trúc
nào. Mô hình sau đây minh họa tỷ lệ % DNA giữa các thành phần trong hệ
genome nhân của người đã được phát hiện
\ Genome người
3000 Mb

Gen và trình tự liên Trình tự DNA giữa


quan đến gen 900 các gen 2100Mb
Mb

DNA mã DNA không DNA lặp lại Trình tự lặp lại duy
mã hóa
hóa 90 Mb 420 Mb nhất và có bản sao
810Mb
thấp

Pseudo- Các Intron DNA lặp


Gene DNA lặp
đoạn và lại liền lại phân bố
gen leader, kề rải rác

DNA Micro- LTRs SINEs


satellite satellite

mini-satellite
LINEs DNA
transposon

Hình 4 - 15. Các thành phần của genome người

33
Hình 4 - 16. Tổ chức hệ genome của người

2.4.2.1. C¸c gen trong bé gen eukaryote


Khái niệm

Gen là đơn vị di truyền, chiếm một vị trí nhất định (locus) trong genome
hoặc trên nhiễm sắc thể, quyết định hoặc đóng góp vào việc hình một hoặc một
số tính trạng của cơ thể sinh vật. Gen có thể đột biến thành nhiều dạng alen khác
nhau. Gen có thể tái tổ hợp với những gen khác hình thành nên liên kết mới. Có
3 nhóm gen được phát hiện là: 1) gen cấu trúc phiên mã tạo ra các mRNA sau đó
dịch mã thành chuỗi polypeptide, 2) gen cấu trúc phiên mã tạo thành phân tử
rRNA hoặc tRNA được sử dụng trực tiếp và 3) gen điều hòa không phiên mã
nhưng làm nhiệm vụ là nơi nhận biết cho enzyme hoặc protein liên quan đến tái
bản và phiên mã DNA. Seymour Benzer đưa ra một số thuật ngữ: Gen là một
cistron là lượng vật chất di truyền mã hóa cho một tRNA, rRNA hay một chuỗi
polypeptide, nó bao gồm cả vùng phiên mã, trước và sau vùng phiên mã và cả các
intron. Gen là một muton là đơn vị nhỏ nhất khi bị biến đổi, thay đổi mã di truyền
tương ứng với một nucleotide. Gen là một recon là đơn vị nhỏ nhất có thể trải qua
tái tổ hợp tương ứng với cặp nucleotide kề cạnh ở vị trí cis.
Thông tin di truyền của gen được mã hoá trong DNA dựa trên trình tự đặc
hiệu của các nucleotide. Gen có chức năng sản xuất ra phân tử RNA hoặc một
chuỗi polypeptide. Gen mã hoá tạo ra polypeptide thông qua hai quá trình: Thứ
nhất, gen cấu trúc hoạt động làm khuôn để sản sinh ra một phân tử mRNA (quá
trình phiên mã). Thứ hai, phân tử mRNA riêng biệt tương tác với các cấu tử khác
như: ribosome, RNA vận chuyển mang amino acid (tRNA) và thông qua phản
ứng của một số enzyme để sản sinh ra một phân tử protein (quá trình dịch mã).
Sơ đồ hoạt động của gen từ DNA đến protein như sau: DNA gen phiên mã
tạo thành mRNA sau đó dịch mã tạo thành polypeptide, có thể phối hợp tạo thành
protein hoạt động trong nội tại tế bào hoặc vận chuyển đi các tế bào và mô nơi
khác.
b. Cấu trúc gen của sinh vật nhân chuẩn
Gen là một đơn vị di truyền trong sinh vật nhân chuẩn gồm: các exon và
intron.
Exon là trình tự mang thông tin di truyền, nằm ở 3 vùng nhất định của gen,
thường được mã hóa sang protein. Vùng một, không dịch mã thành protein, làm
tín hiệu bắt đầu phiên mã tạo RNA và chứa trình tự định hướng mRNA vào
ribosome để dịch mã tạo protein. Vùng hai gồm các exon chứa thông tin di truyền
dịch mã thành trình tự amino acid của protein. Các exon vùng ba được phiên mã
thành một phần của mRNA chứa tín hiệu để kết thúc dịch mã và cho phép gắn
thêm đuôi poly A vào mRNA.

34
Intron hay trình tự ‘câm’’, nằm xen kẽ và không mang thông tin di truyền.
Chúng được phiên mã đến tiền mRNA ở trong nhân, sau đó bị cắt bỏ trong quá
trình biến đổi tiền mRNA thành mRNA chín và nhanh chóng bị phân rã và tất
nhiên không được dịch mã thành protein. Số lượng các intron của gen biến động
rất lớn từ có một intron ở gen tạo ra rRNA đến hơn 30 intron có ở gen tạo ra
protein lòng đỏ trứng con Xenopus. Kích thước cũng rất biến động từ ngắn dưới
100 bp đến dài hơn 10.000 bp. Có rất ít trình tự tương đồng giữa các intron của
một gen và của các gen khác nhau, nhưng chúng đều có một số nucleotide nằm ở
2 đầu các intron rất giống nhau, các nucleotide này tham gia vào quá trình cắt
intron.

Khung đọc mã
Promoter

Bắt đầu phiên


Kết thúc

dịch mã
Bắt đầu Kết thúc
Hộp
AGGA/CAAT dịch mã UAA, UAG,
Intron UGA
AUG

5’ 3’

Tín hiệu Exon


Hộp chuyển peptit AATAAA Tín hiệu
TATA
Vị trí gắn poly A hóa
riboxom
Vùng upstream Vùng downstream

Sơ đồ cấu trúc gen ở sinh vật nhân chuẩn

- Trình tự không dịch mã đầu 5’ UTR (untranslation region) được tính từ


nucleotide phiên mã đầu tiên đến bộ 3 nucleotide khởi đầu dịch mã AUG hoặc
GUG. Trình tự không dịch mã đầu 3’ UTR được tính từ một trong 3 codon dừng
dịch mã đến hết trình tự kết thúc phiên mã.
- Trình tự kết thúc phiên mã của nhiều gen có trình tự như sau:
5’-CCCAGCCCGCCTAATGAGCGGGCTTTTTTT- 3’ trong đó chứa 2 đoạn
dài 7 nucleotide (phần gạch chân) có trình tự bổ sung nhau, khi phiên mã sẽ tạo

35
ra mRNA, ở đó hình thành nên cấu trúc kiểu kẹp tóc (hairpin) làm dừng quá trình
phiên mã.
- Vùng khởi động (promoter) của nhiều gen sinh vật eukaryote đều có
chung một số trình tự ở hộp CAAT (- 75) và TATA (-25).

Bắt đầu phiên mã


Vùng trình tự của
gen điều khiển
Hộp CAAT Hộp TATA
5’ 3’
DNA GGCCAATCT TATAAAA

-75 -25 +1

- Mỗi gen có thể có một trình tự promoter nhất định, cũng có thể có nhiều
gen có một trình tự promoter giống nhau. Hoạt động của promoter có thể đặc thù
theo gen, theo sinh vật và thậm trí theo cả mô, cho nên khi thiết kế gen chuyển
nạp thì cần đặc biệt chú ý đến đặc điểm này.

- Các dấu hiệu gắn chuỗi poly A của mRNA có trình tự 5’- AAUAAA-3’.

5’ ----------- AAUAAA----------CA-------CA---GU-----
3’

Hình 4 - 4. Sơ đồ cấu tạo vùng tín hiệu gắn poly A và tham gia hoạt động
của các protein và enzyme polymerase A.
Trước hết nhân tố cắt và đặc thù poly A (CPSF) gắn vào trình tự AAUAAA, sau
đó Poly(A) polymerase gắn vào vùng có trình tự CA và cắt bỏ đi một đoạn tính

36
từ sau trình tự CA nhờ sự hỗ trợ của nhân tố kích thích cắt (CstF) gắn vào vùng
giầu GU, sau đó protein bọc enzyme polyadenylate rời ra thì poly A được nhập
vào chuỗi mRNA.

Vùng này nằm ở ngay trước đầu 3’nơi bắt đầu gắn polyA, dài từ 10 đến 30
nu, tiếp theo là vùng CA, rồi đến vùng giầu GU (hình 4-4). Trình tự vùng tín
hiệu gắn poly A và vùng giầu GU là vị trí bọc của nhiều protein lần lượt là yếu tố
cắt và gắn polyA (Cleavage and polyadenylation specificity factor, CPSF), nhân
tố kích thích cắt (cleavage stimulation factor, CstF), hai nhân tố này hoạt động
như là những enzyme endonuclease và ít nhất có thêm 2 yếu tố protein khác nữa
cùng phối hợp với CPSF và CstF để cho phép quá trình gắn poly A vào mRNA
được tiến hành. Các yếu tố này kết hợp với protein bọc lấy chuỗi polyA giúp
enzyme polymerase trùng phân các adenosine và ảnh hưởng đến chiều dài đuôi
polyA và duy trì đuôi A sau tổng hợp. Poly A được đính vào tiền mRNA vào lúc
sau phiên mã và trước quá trình cắt nối các exon xảy ra.
- Khung đọc mở hay khung đọc mã (open reading frame, ORF):
Phần DNA của gen mã hóa tạo chuỗi polypeptide được gọi là khung đọc
mở, bắt đầu bằng một codon khởi đầu AUG hoặc GUG và kết thúc bằng một trong
3 mã kết thúc là UAA/UAG/UGA. Mỗi bộ 3 nucleotide của khung đọc mở tương
ứng với một codon mã hóa cho một amino acid. Khung đọc mở được đọc từ đầu
5’ - 3’ dọc theo phân tử mRNA, đọc từng mã
một, đọc không chồng chéo và đọc cho đến tận
mã kết thúc thì dừng lại.
c. Chức năng của gen
Chức năng của gen thể hiện ở 3 quá trình:
- Tái bản DNA.
- Phiên mã tạo ra mRNA, hoặc rRNA hay
tRNA.
- Dịch mã hoặc sinh tổng hợp protein dựa trên
khuôn mRNA xuyên qua ribosome để lắp ráp
các amino acid nhờ các tRNA vận chuyển
đến.

37
. Hoạt động của gen
Một gen đơn vị DNA tái bản, muốn hoạt động trước hết phải sinh ra mRNA,
rồi từ mRNA dịch mã thành polypeptide, các polypeptide có thể phải kết hợp lại
với nhau mới tạo thành một protein chức năng hay một enzyme, xúc tác cho một
công đoạn quyết định hoặc tạo nên tính trạng.
2.4.2.2. NhiÔm s¾c thÓ eukaryote gåm c¸c vïng dÞ nhiÔm s¾c vµ nhiÔm s¾c
thùc
DNA eukaryote cã kÝch th­íc rÊt lín (vÝ dô ë ng­êi DNA cã thÓ dµi ®Õn 1m)
nªn tÕ bµo cÇn ph¶i gi¶i quyÕt ®­îc vÊn ®Ò nÐn chÆt ph©n tö nµy vµo thÓ tÝch h¹n
chÕ cña nh©n. ViÖc nÐn chÆt ®­îc thùc hiÖn ë nhiÒu møc ®é, møc ®é thÊp nhÊt lµ
nucleosome vµ møc ®é cao nhÊt lµ cÊu tróc nhiÔm s¾c chÊt. ThËt vËy, sîi nhiÔm
s¾c chÊt khi quan s¸t d­íi kÝnh hiÓn vi ®iÖn tö cã ®­êng kÝnh 100A0 ®«i khi ®¹t
300A0, trong khi ®­êng kÝnh cña chuçi xo¾n kÐp DNA chØ lµ 20A0. §iÒu nµy
chøng tá ph©n tö DNA tham gia h×nh thµnh nh÷ng cÊu tróc phøc t¹p h¬n (h×nh
1.13).
- Sîi cã ®­êng kÝnh 100A0 lµ mét chuçi nhiÒu nucleosome. §ã lµ nh÷ng cÊu
tróc h×nh thµnh tõ mét sîi DNA quÊn quanh mét lâi gåm 8 ph©n tö histone.
- Sîi 100A0 nµy cã thÓ ®­îc tæ chøc thµnh cÊu tróc phøc t¹p h¬n lµ sîi cã
®­êng kÝnh 300A0: c¸c solenoid.
- Trong nh©n, c¸c sîi võa kÓ trªn kÕt hîp chÆt chÏ víi nhiÒu protein kh¸c
nhau t¹o thµnh nhiÔm s¾c chÊt, møc ®é tæ chøc cao nhÊt cña DNA. Cuèi cïng, khi
nhiÔm s¾c chÊt ®¹t ®é nÐn cùc ®¹i, nã trë thµnh nhiÔm s¾c thÓ. §ã lµ khi tÕ bµo
ph©n chia.
Th«ng th­êng, nhiÔm s¾c thÓ ®­îc quan s¸t thÊy râ nhÊt vµo trung kú. Lóc
®ã, mçi nhiÔm s¾c thÓ ®­îc nh©n ®«i thµnh hai nhiÔm s¾c tö (chromatide) gièng
hÖt nhau, dÝnh víi nhau ë t©m ®éng, mçi nhiÔm s¾c tö lµ mét ph©n tö DNA.

38
C¸c DNA ë eukaryote kh¸c víi DNA ë prokaryote lµ toµn bé ph©n tö DNA
cña prokaryote ®Òu mang th«ng tin m· ho¸, trong khi DNA cña eukaryote bao
gåm nh÷ng tr×nh tù m· ho¸ (exon) xen kÏ víi nh÷ng tr×nh tù kh«ng m· ho¸
(intron). §óng h¬n lµ c¸c tr×nh tù m· ho¸ ë eukaryote ch×m ngËp trong mét khèi
l­îng lín DNA mµ hiÖn nay cßn ch­a râ t¸c dông. Tuy nhiªn, ®iÒu ®¸ng l­u ý lµ
sè l­îng gen vµ kÝch th­íc DNA ë eukaryote hoµn toµn kh«ng cã mèi liªn quan
g× tíi kÝch th­íc vµ møc ®é tiÕn ho¸ cña sinh vËt: vÝ dô mét sè thùc vËt vµ ®éng
vËt l­ìng thª cã DNA lín gÊp tr¨m lÇn so víi DNA ë ng­êi. Tuú møc ®é hiÖn diÖn
cña chóng trong nh©n, c¸c tr×nh tù DNA ®­îc chia lµm ba lo¹i:
- C¸c tr×nh tù lÆp l¹i nhiÒu lÇn chiÕm 10 - 15% bé gen ®éng vËt cã vó.
§ã lµ nh÷ng tr×nh tù DNA ng¾n (10 - 20kb), kh«ng m· ho¸, th­êng tËp trung ë
nh÷ng vïng chuyªn biÖt trªn nhiÔm s¾c thÓ nh­ ë vïng t©m ®éng (tr×nh tù CEN)
hay ë ®Çu c¸c nhiÔm s¾c thÓ (tr×nh tù TEL). Chøc n¨ng cña chóng ch­a râ, d­êng
nh­ chóng tham gia vµo qu¸ tr×nh di chuyÓn cña DNA trªn thoi v« s¾c (tr×nh tù
CEN) hay tham gia vµo qu¸ tr×nh sao chÐp toµn vÑn cña phÇn DNA n»m ë ®Çu mót
nhiÔm s¾c thÓ (tr×nh tù TEL).
- C¸c tr×nh tù cã sè lÇn lÆp l¹i trung b×nh chiÕm kho¶ng 25 - 40% bé
gen ng­êi. Chóng cã kÝch th­íc lín h¬n (100 - 1000kb) vµ ®a d¹ng h¬n c¸c tr×nh
tù lÆp l¹i nhiÒu lÇn. C¸c tr×nh tù nµy kh«ng tËp trung mµ ph©n t¸n trªn toµn bé bé

39
gen. Chóng cã thÓ lµ nh÷ng tr×nh tù kh«ng m· ho¸ víi chøc n¨ng ch­a râ mµ còng
cã thÓ lµ nh÷ng tr×nh tù m· ho¸: c¸c gen m· ho¸ cho rRNA, tRNA vµ RNA 5S.
- C¸c tr×nh tù duy nhÊt lµ c¸c gen m· ho¸ cho c¸c protein, cã tr×nh tù
®Æc tr­ng cho tõng gen.
Quan s¸t d­íi kÝnh hiÓn vi ®iÖn tö cho thÊy sîi nhiÔm s¾c gåm c¸c vïng co
®Ëm ®Æc hoÆc kh«ng co ®Ëm ®Æc xen kÏ lÉn nhau. Vïng ®Ëm ®Æc ®­îc gäi lµ vïng
dÞ nhiÔm s¾c (heterochromatin). PhÇn lín c¸c vïng dÞ nhiÔm s¾c hÇu nh­ kh«ng
thay ®æi ngay c¶ khi tÕ bµo b­íc vµo ph©n chia, chóng ®­îc gäi lµ vïng dÞ nhiÔm
s¾c b¶o thñ (constitutive heterochromatin). Mét sè vïng dÞ nhiÔm s¾c cã thÓ xuÊt
hiÖn míi hoÆc cã thÓ biÕn mÊt khi tÕ bµo tr¶i qua c¸c giai ®o¹n sinh tr­ëng, biÖt
ho¸, chóng ®­îc gäi lµ vïng dÞ nhiÔm s¾c bÊt æn (facultative heterochromatin).
NhiÔm s¾c thùc chØ co ®Æc khi tÕ bµo chuÈn bÞ ph©n chia. Trong giai ®o¹n gian kú,
vïng nhiÔm s¾c thùc ph©n bè r¶i r¸c kh¾p trong nh©n. HÇu hÕt c¸c gen ph©n bè
trong vïng nhiÔm s¾c thùc, trong khi c¸c ®o¹n DNA lÆp l¹i vµ mét sè rÊt Ýt gen
(c¸c gen nµy ë tr¹ng th¸i kh«ng ho¹t ®éng) ph©n bè trong vïng dÞ nhiÔm s¾c b¶o
thñ. Ngoµi ra,vïng dÞ nhiÔm s¾c sao chÐp chËm h¬n c¸c vïng nhiÔm s¾c thùc trong
qu¸ tr×nh t¸i b¶n nhiÔm s¾c thÓ. §Æc biÖt, trao ®æi chÐo hÇu nh­ kh«ng x¶y ra ë
vïng dÞ nhiÔm s¾c gi÷a hai nhiÔm s¾c thÓ t­¬ng ®ång.
Nh÷ng tÝnh chÊt ®Æc biÖt trªn vïng dÞ nhiÔm s¾c ®­îc sinh häc hiÖn ®¹i quan
t©m ®Õn vµo nh÷ng n¨m cuèi thËp kû 20 cña thÕ kû XX. Sù h×nh thµnh vµ duy tr×
cÊu tróc dÞ nhiÔm s¾c phô thuéc vµo møc ®é methyl ho¸ cña cytosine vµ histone,
møc ®é khö acetyl cña histone. Thùc nghiÖm cho thÊy, khi khö bá c¸c nhãm
methyl trªn ph©n tö DNA vµ histone th× vïng dÞ nhiÔm s¾c gi·n ra vµ mét sè gen
ph©n bè trong ®ã ®­îc phiªn m·.
B»ng kü thuËt lµm tiªu b¶n tÕ bµo nhuém víi chÊt mµu Giemsa, chóng ta cã
thÓ quan s¸t ®­îc nhiÔm s¾c thÓ gåm c¸c b¨ng cã mµu nhuém ë møc ®é kh¸c
nhau. Chóng ph©n bè n»m ngang trªn nhiÔm s¾c thÓ vµ ®­îc gäi lµ b¨ng G (G
band). Sè l­îng b¨ng G còng nh­ ®é réng cña tõng b¨ng ®Æc tr­ng cho tõng nhiÔm
s¾c thÓ. V× vËy, c¸c b¨ng G ®­îc sö dông trong ph©n biÖt kiÓu nh©n (karyotype).
§iÒu thó vÞ lµ ë c¸c vïng n»m gi÷a c¸c b¨ng G cã thµnh phÇn G-C lín h¬n so víi
b¨ng G. VÝ dô ë ®éng vËt cã vó cã thµnh phÇn G-C trung b×nh kho¶ng 40% trong
®ã 30% ph©n bè trong b¨ng G cßn kho¶ng 65% ph©n bè trong vïng n»m gi÷a b¨ng
G. T­¬ng tù nh­ ë vïng nhiÔm s¾c thùc, hÇu hÕt c¸c gen ph©n bè ë vïng n»m gi÷a
c¸c b¨ng G (vïng cã mµu rÊt nh¹t).

40
. DNA có trình tự lặp lại liền kề (Tandemly repeated DNA)
Các DNA có trình tự lặp lại liền kề hay còn gọi là các DNA vệ tinh. Gọi là
các DNA vệ tinh vì các đoạn DNA này có chứa những trình tự DNA được lặp lại
liền nhau hình thành nên các băng vệ tinh khi phân tích DNA của genome bằng
phương pháp ly tâm chênh lệch tỷ trọng (density gradient centrifugation).
Một genome có thể chứa nhiều loại DNA vệ tinh với đơn vị lặp lại khác
nhau. Đơn vị lặp lại của các DNA vệ tinh thay đổi từ vài (<5 bp) đến hàng trăm
cặp bazơ (>200 bp). DNA vệ tinh thường tìm thấy ở tâm động hoặc vùng dị nhiễm
sắc trên nhiễm sắc thể. Chúng thuộc nhóm các DNA có trình tự lặp lại cao.

. Tiểu vệ tinh (Minisatellite) và vi vệ tinh (microsatellite)


Minisatellite và microsatellite cũng được gọi là các DNA vệ tinh dù chúng
không xuất hiện các băng vệ tinh khi phân tích tỉ trọng DNA. Minisatellite là các
đoạn DNA có nhiều đơn vị lặp lại dưới 25 bp, có chiều dài khoảng 20 kb.
Microsatellite thường dùng để chỉ DNA có đơn vị lặp lại ngắn, thường là 4 bp
hoặc ngắn hơn và có chiều dài thường nhỏ hơn 150 bp.
Ví dụ: Motif 5’-TTAGGG-3’ được lặp lại hàng trăm lần ở đầu cuối của
NST người là một dạng Minisatellite điển hình, Microsatellite còn được gọi là
SSR. Ở cây lúa, các dạng SSR là (GA)n, (GT)n, (AT)n, (GGT)n.

. Trình tự lặp lại phân bố rải rác trong genome

a. Khái niệm
Cơ chế phổ biến nhất đối với những trình tự này đó là sự di chuyển vị trí
(transposition).
Chính các yếu tố di truyền có khả năng di động (mobile genetic
eleenzymets) giữa các vị trí khác nhau trong một hay nhiều genome đã tạo ra các
trình tự lặp lại phân bố rải rác trong genome và góp phần làm đa dạng di truyền
giữa các cá thể trong loài.
Cơ chế di chuyển: Dựa vào cơ chế di chuyển, các yếu tố có khả năng di
động (còn gọi là các yếu tố chuyển vị) có thể xếp thành hai nhóm:
- Nhóm các yếu tố di chuyển thông qua trung gian RNA (RNA transposons
hay retroeleenzymets).
- Nhóm các yếu tố di chuyển không qua trung gian RNA là các DNA
transposons.
b. Nhóm các yếu tố di chuyển thông qua trung gian RNA (RNA transposons).
Từ đoạn retroposon tổng hợp một bản sao RNA thông qua hoạt động phiên
mã, sau đó tổng hợp thành DNA từ bản RNA được phiên mã. Quá trình này có sự
tham gia của enzyme phiên mã ngược (reverse transcriptase). Thường enzyme
này được mã hoá bởi gen nằm ngay trong đoạn retroposon.

41
Bản sao DNA của retroposon được tổ hợp vào genome. Chúng có thể được
tổ hợp lại trong cùng một nhiễm sắc thể trên đó đang mang đơn vị lặp lại nguyên
thuỷ hoặc cũng có thể được chèn vào một nhiễm sắc thể khác.
Chúng di chuyển thông qua sơ đồ sau:
Retroposon

Phiên mã

Phiên mã ngược
RNA

cDNA
Tái tổ hợp

Retroposon (cũ) Retroposon(mới)

Hình 4 - 8. Sơ đồ tạo bản sao của Retroposon


Kết quả của quá trình trên sẽ có hai hoặc nhiều bản sao của retroposon ở
các vị trí khác nhau trong genome. Thuộc nhóm này gồm các virus sau:
- Retrovirus:
Là những virus có genome là phân tử RNA. Khi xâm nhiễm vào tế bào ký
chủ, genome RNA của virus được sao chép thành DNA bởi enzyme phiên mã
ngược reverse transcriptase được mã hoá bởi gen pol của virus, rồi sau đó bản sao
DNA được tổ hợp vào genome của tế bào ký chủ, khi đó chúng cùng tái bản với
nhiễm sắc thể ký chủ. Tế bào chủ không bị phá hại trừ khi virus mang gen tiền
ung thư, sẽ biến tế bào thành tế bào ung thư. Thuộc loại virus mang gen tiền ung
thư có virus Rous gây bướu thịt ở chim, virus Maloney và Rauscher gây bệnh
bạch cầu ở loài gặm nhấm và gây khối u cho động vật có vú. Nguyên nhân gây
bệnh AIDS cho người cũng thuộc loại virus này. Các virus mới có thể được tạo
thành bằng việc sao chép đoạn DNA mới được tổ hợp vào genome thành RNA,
dịch mã RNA của gen env thành các protein vỏ để bọc gói thành một thể virus
hoàn chỉnh, đi xâm nhiễm sang tế bào khác.
Các retrovirus nội sinh: (Endogenous retrovirus, ERVs) là genome của
retrovirus khi được tổ hợp vào nhiễm sắc thể của tế bào ký chủ, chủ yếu là động
vật có xương sống. Một số trong chúng vần còn hoạt tính, thậm chí ở một giai
đoạn phát triển nào đó của tế bào, chúng có thể tổng hợp nên các virus nội sinh.
Tuy nhiên, điều này hầu như không xảy ra. Các trình tự này hầu như không còn
hoạt động và được tìm thấy ở nhiều vị trí trong genome. Trong genome của người,
những trình tự như vậy có khoảng 1000 bản sao. Phổ biến hơn là những phiên bản
được rút ngắn của chúng hay gọi là các yếu tố giống retroviruss (retrovirus-like

42
eleenzymet), được gọi tắt la RTVLs và có khoảng 20.000 bản trong genome của
người.

2.4.3. BiÕn tÝnh vµ håi tÝnh cña DNA


Mét ®Æc ®iÓm cña ph©n tö DNA cã ý nghÜa rÊt quan träng trong nghiªn cøu,
®­îc sö dông vµo ph­¬ng ph¸p lai ph©n tö. §ã lµ kh¶ n¨ng biÕn tÝnh (denaturation)
vµ håi tÝnh (renaturation). Sù biÕn tÝnh lµ hiÖn t­îng hai sîi ®¬n cña ph©n tö DNA
t¸ch rêi nhau, ®iÒu nµy x¶y ra khi c¸c liªn kÕt hydro gi÷a c¸c base bæ sung n»m
trªn hai sîi bÞ c¾t ®øt do nh÷ng t¸c nh©n vËt lÝ (nhiÖt) hay ho¸ häc (dung dÞch
kiÒm, formamid, ure). Sau ®ã, nÕu ®iÒu chØnh nång ®é muèi vµ nhiÖt ®é thÝch hîp
(h¹ nhiÖt ®é dÇn dÇn), c¸c sîi ®¬n l¹i cã thÓ b¾t cÆp trë l¹i theo nguyªn t¾c bæ sung
(A=T, G=C) ®Ó h×nh thµnh trë l¹i ph©n tö DNA ban ®Çu, ®ã lµ sù håi tÝnh.

43
Ch­¬ng 2
tÝnh æn ®Þnh vµ biÕn ®éng cña dna
Trong chu tr×nh tÕ bµo, sù ph©n chia tÕ bµo chØ x¶y ra sau khi cã sù nh©n ®«i
th«ng tin di truyÒn sao cho hai tÕ bµo con s¾p h×nh thµnh ®Òu nhËn ®­îc mét l­îng
th«ng tin di truyÒn gièng hÖt tÕ bµo mÑ. Sù nh©n ®«i nµy ®­îc ®¶m b¶o bëi mét
qu¸ tr×nh gäi lµ sù sao chÐp DNA, trong ®ã mét ph©n tö DNA s¶n sinh ra hai ph©n
tö con gièng hÖt ph©n tö ban ®Çu. ChÝnh cÊu tróc xo¾n kÐp cña ph©n tö DNA ®·
gîi ý cho viÖc gi¶i thÝch c¬ chÕ cña hiÖn t­îng nµy. Bªn c¹nh viÖc ®¶m b¶o l­u tr÷
vµ truyÒn ®¹t th«ng tin mét c¸ch trung thùc, tÕ bµo ph¶i tù trang bÞ mét hÖ thèng
b¶o vÖ vµ söa ch÷a c¸c sai lÇm trong khi sao chÐp DNA. Tuy nhiªn th«ng tin kh«ng
ph¶i lóc nµo còng ®­îc truyÒn ®¹t mét c¸ch bÊt di bÊt dÞch. Qu¸ tr×nh tiÕn ho¸ cña
sinh giíi ®· lÊy nguyªn liÖu tõ nh÷ng biÕn ®éng cña th«ng tin di truyÒn hay nãi
mét c¸ch kh¸c lµ tõ nh÷ng thay ®æi cña DNA. Sù thay ®æi nµy ph¸t sinh do c¸c
®ét biÕn, do c¸c gen nh¶y hay do t¸i tæ hîp trªn ph©n tö DNA.

1. TÝnh æn ®Þnh cña DNA lµ kÕt qu¶ cña hai qu¸ tr×nh: sao
chÐp vµ söa sai
1.1. Qu¸ tr×nh sao chÐp
1.1.1. C¬ chÕ sao chÐp DNA
Mét trong nh÷ng tÝnh chÊt c¨n b¶n cña di truyÒn DNA lµ kh¶ n¨ng tù sao
chÐp (replication) chÝnh x¸c hay tù nh©n ®«i (self duplication). ¦u ®iÓm næi bËt
cña m« h×nh Watson - Crick lµ cho phÐp dù ®o¸n ®­îc ph©n tö DNA sao chÐp nh­
thÕ nµo. NÕu nh­ m« h×nh ®Ò ra lµ ®óng th× mçi ph©n tö chÞ em cã chøa mét sîi
nucleotide cña bè mÑ vµ mét sîi míi ®­îc tæng hîp, ®©y lµ c¬ chÕ sao chÐp b¸n
b¶o tån. MÆc dï vËy bªn c¹nh ®ã vÉn cã c¸c gi¶ thiÕt kh¸c vÒ c¬ chÕ sao chÐp cña
DNA, c¸c gi¶ thiÕt ®ã lµ c¬ chÕ b¸n b¶o tån (m« h×nh cña Watson vµ Crick), c¬
chÕ sao chÐp b¶o tån vµ ph©n t¸n. Trong c¬ chÕ sao chÐp b¶o, ph©n tö DNA bè mÑ
®­îc b¶o tån vµ ph©n tö chÞ em ®­îc t¹o ra cã chøa hai sîi míi ®­îc tæng hîp.
Cßn ë c¬ chÕ sao chÐp ph©n t¸n, c¸c ph©n tö DNA chÞ em cã chøa c¸c sîi
nucleotide cã c¶ c¸c ®o¹n DNA cña bè mÑ lÉn ®o¹n DNA míi tæng hîp. Ngay sau
khi m« h×nh cÊu tróc ®­îc nªu ra, nhiÒu thÝ nghiÖm ®­îc tiÕn hµnh ®Ó x¸c nhËn
c¸c dù ®o¸n.
Ngay khi nªu ra m« h×nh, Watson vµ Crick ®· cho r»ng nÕu hai m¹ch cña
ph©n tö DNA ®­îc t¸ch ra do c¸c liªn kÕt hydro gi÷a c¸c cÆp base bÞ ®øt, mçi

44
m¹ch sÏ lµm khu«n cÇn thiÕt cho viÖc tæng hîp m¹ch cÆp míi t­¬ng tù víi m¹ch
cÆp tr­íc ®ã. V× A ph¶i b¾t cÆp víi T vµ G ph¶i lu«n b¾t cÆp víi C nªn tr×nh tù
nucleotide trªn mét m¹ch sÏ x¸c ®Þnh chÝnh x¸c tr×nh tù ®Æc hiÖu c¸c nucleotide
trªn m¹ch bæ sung víi nã. Nãi c¸ch kh¸c, nÕu tÕ bµo t¸ch rêi hai m¹ch cña ph©n
tö DNA ra, nã cã thÓ xÕp c¸c nucleotide cña m¹ch míi thµnh m¹ch bæ sung. Nh­
vËy, hai m¹ch cò cña ph©n tö DNA ban ®Çu ®­îc t¸ch ra, mçi c¸i lµm khu«n ®Ó
tæng hîp m¹ch míi. KÕt qu¶, tõ mét ph©n tö DNA ban ®Çu t¹o ra hai ph©n tö con
gièng hÖt nhau. Mçi ph©n tö con ®Òu mang mét m¹ch cò vµ mét m¹ch míi. KiÓu
sao chÐp nµy gäi lµ sao chÐp b¸n b¶o tån.
§Ó x¸c ®Þnh ®­îc c¬ chÕ sao chÐp cña DNA lµ theo c¬ chÕ sao chÐp b¸n b¶o
tån, b¶o tån hay ph©n t¸n cÇn ph¶i cã nh÷ng kÕt qu¶ thùc nghiÖm chøng minh.
N¨m 1958, M. Meselson vµ Stahl ®· chøng minh kiÓu sao chÐp cña DNA lµ sao
chÐp b¸n b¶o tån. Hai «ng ®· nu«i E. coli nhiÒu thÕ hÖ trªn m«i tr­êng cã nguån
N ®ång vÞ nÆng (N15). Nh­ vËy, tÊt c¶ DNA cña vi khuÈn ®Òu mang ®ång vÞ nÆng
N15 thay thÕ cho N14 b×nh th­êng. Sau ®ã, tÕ bµo ®­îc chuyÓn sang m«i tr­êng chØ
chøa N14 nhÑ, mÉu c¸c tÕ bµo ®­îc lÊy ra theo nh÷ng kho¶ng thêi gian ®Òu ®Æn vµ
t¸ch chiÕt DNA. B»ng ph­¬ng ph¸p li t©m trªn thang nång ®é CsCl, c¸c lo¹i DNA
nÆng, nhÑ vµ lai ®­îc t¸ch ra.
KÕt qu¶ cho thÊy DNA nÆng ban ®Çu (thÕ hÖ 0) chøa N15, sau mét lÇn ph©n
chia cho thÕ hÖ I víi DNA lai cã tØ träng n»m gi÷a DNA nÆng N15 vµ DNA nhÑ
N14. Nãi c¸ch kh¸c, sau mét lÇn sao chÐp ph©n tö DNA míi chøa mét nöa mang
N15 vµ mét nöa mang N14. ë thÕ hÖ II, mét nöa sè ph©n tö DNA lµ lai, nöa cßn l¹i
lµ DNA nhÑ N14 (h×nh 2.1). ThÝ nghiÖm nµy kh¼ng ®Þnh gi¶ thuyÕt cña Watson vµ
Crick lµ ®óng, tøc hai m¹ch mÑ t¸ch ra, mçi c¸i lµm khu«n ®Ó tæng hîp nªn m¹ch
míi bæ sung.

H×nh 2.1. ThÝ nghiÖm sao chÐp DNA theo c¬ chÕ b¸n b¶o tån
45
1.1.2. Qu¸ tr×nh sao chÐp DNA ë prokaryote
Nh÷ng nghiªn cøu tiÕp theo ®· t×m ra c¸c c¬ chÕ ph©n tö cña qu¸ tr×nh sao
chÐp DNA. §ã lµ mét qu¸ tr×nh phøc t¹p, nh­ng ph¶i tr¶i qua c¸c c¬ chÕ chung
nh­:
- C¸c liªn kÕt hydro æn ®Þnh cÊu tróc xo¾n vµ g¾n hai m¹ch víi nhau ph¶i bÞ
ph¸ vì vµ t¸ch rêi hai m¹ch.
- Ph¶i cã ®o¹n måi (primer) tøc ®o¹n DNA hay RNA m¹ch ®¬n ng¾n b¾t cÆp
víi m¹ch ®¬n khu«n.
- §ñ bèn lo¹i nucleoside triphosphate (dATP, dTTP, dCTP vµ dGTP) b¾t cÆp
bæ sung víi c¸c nucleotide m¹ch khu«n.
- M¹ch míi tæng hîp theo h­íng 5'P  3' OH.
- C¸c nucleotide míi ®­îc nèi l¹i víi nhau b»ng liªn kÕt céng ho¸ trÞ ®Ó t¹o
m¹ch míi.
Mçi b­íc ®­îc ®iÒu khiÓn bëi enzyme ®Æc hiÖu vµ ®­îc thùc hiÖn mét c¸ch
nhanh chãng, chÝnh x¸c.
ë prokaryote lÉn eukaryote, tõng m¹ch riªng lÎ ®­îc sao chÐp chØ theo mét
h­íng: c¸c enzyme sao chÐp di chuyÓn däc theo m¹ch mÑ tõ ®Çu 3' ®Õn 5' ®Ó t¹o
nªn m¹ch míi bæ sung theo h­íng 5' ®Õn 3'. Ph©n tö DNA gåm hai m¹ch ®èi song
song, khi t¸ch hai m¹ch ë mét ®Çu ®Ó sao chÐp, t¹o ra ch¹c ba sao chÐp (replication
fork). M¹ch míi ®­îc tæng hîp theo h­íng 5' ®Õn 3', nªn trªn mét m¹ch khu«n
qu¸ tr×nh tæng hîp sÏ h­íng tõ ngoµi vµo ch¹c ba, cßn ë m¹ch khu«n kia sÏ tæng
hîp theo chiÒu tõ ch¹c ba h­íng ra ngoµi, b»ng c¸ch t¹o ra c¸c ®o¹n ng¾n råi nèi
l¹i víi nhau.
Sau ®©y lµ diÔn biÕn sao chÐp ë nhiÔm s¾c thÓ vßng trßn DNA cña E. coli.
Chi tiÕt qu¸ tr×nh ®­îc m« t¶ trªn h×nh 2.2, gåm c¸c giai ®o¹n: khëi ®Çu (initiation),
nèi dµi (elongation) vµ kÕt thóc (termination).

46
H×nh 2.2. Qu¸ tr×nh sao chÐp DNA

1.1.2.1. C¸c thµnh phÇn tham gia trong qu¸ tr×nh sao chÐp
♦ Oligonucleotide måi vµ RNA primase trong qu¸ tr×nh tæng hîp DNA
Do DNA polymerase chØ tæng hîp sîi DNA theo mét chiÒu duy nhÊt tõ 5'3'
nªn mét sîi DNA ®­îc tæng hîp liªn tôc, cßn sîi kia do nhiÒu ®o¹n Okazaki ®­îc
tæng hîp råi nèi víi nhau. Kho¶ng c¸ch gi÷a hai sîi Okazaki kho¶ng 2000 base
vµ thêi gian trung b×nh ®Ó tæng hîp mét sîi chiÕm kho¶ng 4 gi©y.
Tæng hîp bÊt cø ®o¹n Okazaki nµo còng ®ßi hái oligonucleotide måi. B¶n
chÊt cña måi nµy lµ c¸c ribonucleoside triphosphate ®­îc nèi víi nhau nhê enzyme
DNA primase. Do ®ã, c¸c oligonucleotide nµy cßn ®­îc gäi lµ c¸c måi RNA
(RNA primer). Chóng dµi kho¶ng 10 nucleotide, bÞ ph©n huû sau khi ®o¹n Okazaki
®­îc tæng xong. C¬ chÕ söa ch÷a DNA sÏ thay thÕ chóng bëi c¸c
desoxyribonucleotide theo nguyªn t¾c t¹o cÆp bæ sung. Cuèi cïng, DNA ligase sÏ
nèi c¸c ®o¹n Okazaki víi nhau t¹o sîi DNA míi (h×nh 2.2).
§Ó trë thµnh khu«n cho ph¶n øng nh©n ®«i DNA, ph©n tö DNA sîi ®«i nhÊt
thiÕt ph¶i më xo¾n, tøc lµ liªn kÕt bæ sung gi÷a c¸c base bÞ ®øt g·y vµ hai sîi ®¬n
®­îc t¸ch nhau. Më xo¾n vµ gi÷ hai sîi ®¬n ë d¹ng tù do kh«ng cã cÊu tróc bËc
hai ®­îc thùc hiÖn nhê mét sè enzyme vµ protein ®Æc hiÖu.
♦ DNA helicase
DNA helicase lµ protein cã kh¶ n¨ng ph©n huû ATP mét khi ®· b¸m vµo sîi
®¬n DNA. Nhê ph¶n øng nµy DNA helicase cã thÓ di chuyÓn däc theo chiÒu dµi
sîi ®¬n lµm cho sîi ®«i ph¶i tiÕp tôc më xo¾n t¸ch thµnh hai sîi ®¬n (h×nh 2.3).
Th«ng th­êng, t¹i ch¹c sao chÐp ch÷ Y cã hai ph©n tö DNA helicase di chuyÓn

47
trªn hai sîi ®¬n theo hai h­íng ng­îc nhau. Chóng cã thÓ thuéc hai lo¹i helicase
kh¸c nhau do tÝnh chÊt di chuyÓn ng­îc chiÒu nµy.

H×nh 2.3. Vai trß cña helicase vµ topoisomerase (gyrase) trong viÖc gi¶i xo¾n DNA

♦ Vai trß cña DNA topoisomerase trong t¸i b¶n DNA


Do ph©n tö DNA cã cÊu tróc d¹ng xo¾n nªn trong qu¸ tr×nh nh©n ®«i cø 10
base më xo¾n ®Ó tæng hîp t¹i ch¹c ba sao chÐp th× sîi ®«i ë phÝa tr­íc ch¹c l¹i bÞ
xo¾n mét vßng. Nh­ vËy, khi ch¹c chuyÓn ®éng däc theo sîi khu«n sÏ khiÕn sîi
nµy xo¾n l¹i rÊt nhanh. HiÖn t­îng ®ã còng x¶y ra t­¬ng tù khi më xo¾n ®Ó tæng
hîp RNA. ChÝnh enzyme DNA topoisomerase ®ãng vai trß më xo¾n ®Ó kh¾c phôc
sù xo¾n tÝt l¹i cña ph©n tö DNA khu«n. DNA topoisomerase lµ mét lo¹i nuclease
®Æc biÖt bÎ g·y liªn kÕt phosphodiester gi÷a c¸c base trªn mét sîi ®¬n t¹o ra mét
vÕt ®øt, gi¶i phãng hai ®Çu sîi ë d¹ng tù do. C¸c ®Çu ®ã sÏ quay ®Ó më xo¾n. Sau
®ã, liªn kÕt phosphodiester l¹i ®­îc phôc håi vµ enzyme ®­îc t¸ch khái ph©n tö
DNA. Cã hai lo¹i DNA topoisomerase, lo¹i I chØ t¹o vÕt ®øt trªn mét sîi ®¬n, lo¹i
II t¹o vÕt ®øt trªn c¶ hai sîi cña ph©n tö DNA kÐp.
♦ Protein c¨ng m¹ch ®¬n (SSB protein - Single Strand Binding protein)
Chøc n¨ng cña c¸c protein nµy lµ gi÷ cho sîi ®¬n DNA ë d¹ng th¼ng kh«ng
cã kh¶ n¨ng t¹o cÆp bæ sung víi sîi ®¬n kh¸c hoÆc kh«ng t¹o liªn kÕt ngay gi÷a
c¸c base cña mét sîi.
Nhê ®ã, DNA polymerase di chuyÓn trªn sîi ®¬n lµm khu«n kh«ng gÆp trë
ng¹i g× trong qu¸ tr×nh tæng hîp sîi míi. MÆc dï, c¸c SSB protein kh«ng cã kh¶
n¨ng më xo¾n nh­ng chóng gióp cho helicase gi÷ ®­îc tr¹ng th¸i më xo¾n vµ ®Æc

48
biÖt tr¸nh ®­îc liªn kÕt t¹o cÊu tróc vßng cña sîi ®¬n khu«n khi tæng hîp c¸c ®o¹n
Okazaki.
♦ Vai trß cña c¸c DNA polymerase trong t¸i b¶n DNA
ë E.coli cã 5 lo¹i polymerase, nh­ng chØ cã mét lo¹i DNA polymerase lµ
enzyme sao chÐp, nh÷ng enzyme cßn l¹i chñ yÕu cã chøc n¨ng söa ch÷a nh÷ng sai
háng trªn DNA nh­: khëi ®Çu ch¹c sao chÐp DNA, khi qu¸ tr×nh nµy bÞ c¶n do
nh÷ng sai háng trªn DNA, v­ît qua nh÷ng sai háng trªn DNA
B¶ng 2.1. Tãm t¾t nh÷ng ®Æc ®iÓm c¬ b¶n cña c¸c DNA polymerase ë E.coli

Enzyme Gen Chøc n¨ng

I polA Chøc n¨ng chñ yÕu lµ söa ch÷a

II polB Enzyme khëi ®Çu l¹i qu¸ tr×nh sao chÐp

III polC Sao chÐp

IV dinB Sao chÐp bá qua sai háng

V umuD’2C Sao chÐp bá qua sai háng

H×nh 2.4. CÊu tróc chung cña DNA polymerase


B¶ng 2.1 tãm t¾t c¸c ®Æc tr­ng cña c¸c DNA polymerase ë E.coli. DNA
polymerase III, lµ mét protein ®a ph©n, mét enzyme sao chÐp chÞu tr¸ch nhiÖm
cho viÖc tæng hîp c¸c sîi DNA míi. DNA polymerase I (polA) chÞu tr¸ch nhiÖm
söa ch÷a nh÷ng sai háng trªn DNA vµ cã vai trß phô trong qu¸ tr×nh sao chÐp b¸n
b¶o tån. DNA polymerase II cÇn thiÕt cho viÖc b¾t ®Çu l¹i mét ch¹c sao chÐp khi
qu¸ tr×nh sao chÐp bÞ dõng l¹i do sai háng trªn DNA. DNA polymerase IV vµ V
chÞu tr¸ch nhiÖm cho phÐp sù sao chÐp bá qua c¸c kiÓu sai háng nµo ®ã.

49
♦ Protein cã cÊu tróc vßng gi÷ DNA polymerase chuyÓn ®éng trªn sîi
DNA
HÇu hÕt c¸c ph©n tö DNA polymerase cã xu h­íng tæng hîp mét ®o¹n ng¾n
c¸c nucleotide råi t¸ch ra khái khu«n. §iÒu nµy gióp cho enzyme nhanh chãng rêi
khái ®o¹n Okazaki ®· tæng hîp xong vµ quay vßng rÊt nhanh ®Ó tæng hîp ®o¹n
tiÕp theo ngay trªn mét sîi khu«n. Tuy nhiªn, xu thÕ t¸ch khái sîi khu«n g©y bÊt
lîi cho enzyme khi tæng hîp sîi DNA dµi liªn tôc. §Ó kh¾c phôc ®iÒu nµy, ph©n
tö enzyme ®­îc gi÷ l¹i trªn sîi khu«n nhê mét cÊu tróc ®Æc biÖt gièng nh­ chiÕc
kÑp. KÑp nµy cho phÐp enzyme b¸m v÷ng ch¾c khi chuyÓn ®éng trªn sîi khu«n,
nh­ng ®ång thêi còng ®¶m b¶o cho enzyme rêi khái khu«n nhanh chãng khi qu¸
tr×nh tæng hîp kÕt thóc (h×nh 2.6).
♦ DNA ligase
DNA ligase lµ protein cã kh¶ n¨ng ph©n huû ATP ®Ó hµn kÝn m¹ch cña DNA
sîi muén b»ng liªn kÕt phosphodiester trong qu¸ tr×nh sao chÐp.
1.1.2.2. Giai ®oạn khëi ®Çu sao chÐp
§ã lµ giai ®o¹n nhËn diÖn ®iÓm më ®Çu. C¸c protein tham gia vµo giai ®o¹n
nµy gäi lµ nh÷ng protein më ®Çu vµ gióp cho viÖc g¾n enzyme primase vµo khu«n
DNA. C¸c protein më ®Çu gåm:
- §o¹n ori C chøa 245 cÆp base trong ®ã cã ®o¹n ch×a kho¸ g¾n DNA vµo
phøc hîp më ®Çu.
- Protein DnaA t¹o phøc hîp më
- Dna B vµ Dna C t¹o phøc hîp måi
Nh­ vËy hµng ngh×n cÆp base ®­îc th¸o xo¾n d­íi t¸c dông cña c¸c protein
nãi trªn thuéc helicase vµ gyrase. §ång thêi th¸o xo¾n cã protein liªn kÕt víi sîi
®¬n ®Ó æn ®Þnh cÊu tróc kh«ng bÞ xo¾n l¹i vµ cã sù tham gia cña n¨ng l­îng th¸o
xo¾n qua thuû ph©n ATP.
RNA primase g¾n vµo phøc hîp trªn t¹o thµnh primosome vµ b¾t ®Çu tæng
hîp RNA måi kho¶ng 10 - 60 nucleotide. C¸c ®o¹n måi nµy còng cÇn cho viÖc
tæng hîp ®o¹n Okazaki.

50
H×nh 2.5. DiÔn tiÕn cña giai ®o¹n khëi ®Çu sao chÐp ë E.coli

ë E.coli qu¸ tr×nh b¾t ®Çu sao chÐp khi protein DnaA ®Æc hiÖu nhËn biÕt ®iÓm
khëi ®Çu sao chÐp (replication origine gäi t¾t lµ ori) vµ g¾n vµo tr×nh tù base ®Æc
biÖt ®ã. TiÕp theo enzyme gyrase (mét lo¹i enzyme topoisomerase) c¾t DNA lµm
th¸o xo¾n ë hai phÝa cña protein DnaA. Trong khi hai ph©n tö enzyme gyrase
chuyÓn ®éng ng­îc chiÒu nhau so víi ®iÓm ori th× hai ph©n tö A cña enzyme
helicase (cßn gäi lµ rep) tham gia t¸ch m¹ch t¹o ch¹c ba sao chÐp. Helicase sö
dông n¨ng l­îng ATP lµm ®øt c¸c liªn kÕt hydro gi÷a hai base b¾t cÆp víi nhau.
C¸c protein lµm c¨ng m¹ch SSB (single strand binding protein = SSB protein) g¾n
vµo c¸c m¹ch ®¬n DNA lµm chóng t¸ch nhau th¼ng ra vµ kh«ng chËp l¹i m«t c¸ch
ngÉu nhiªn hoÆc xo¾n l¹i ®Ó viÖc sao chÐp ®­îc dÔ dµng.
Qóa tr×nh sao chÐp cña E.coli b¾t ®Çu tõ mét ®iÓm cè ®Þnh gäi lµ oriC vµ sau
®ã di chuyÓn theo hai h­íng (nh­ ë h×nh 2.2) cho ®Õn khi ch¹c sao chÐp ®­îc më
ra. DiÔn tiÕn diÔn ra nh­ h×nh 2.5. B­íc ®Çu tiªn lµ sù kÕt hîp cña mét protein gäi
lµ DnaA víi tr×nh tù lÆp l¹i 9bp, sau ®ã DnaA liªn kÕt víi c¸c ®o¹n tr×nh tù lÆp
l¹i 13bp. Khi c¸c tr×nh tù lÆp l¹i 9bp vµ 13bp ®· liªn kÕt víi DnaA ®­îc bÎ cong
bëi c¸c ®¬n ph©n DnaA ë hai vïng tr×nh tù nµy g¾n l¹i víi nhau, tiÕp theo sau ®ã
sîi DNA xo¾n kÐp ®­îc th¸o xo¾n t¹i vïng tr×nh tù lÆp l¹i 13bp giµu AT.
Sau khi DNA b¾t ®Çu ®­îc th¸o xo¾n c¸c ph©n tö DnaA tù do ®­îc liªn kÕt
víi vïng sîi ®¬n míi th¸o xo¾n. Vïng khëi ®Çu ®­îc bao phñ bëi DnaA, hai

51
helicase (protein DnaB) ®­îc DnaC vËn chuyÓn ®Õn vïng oriC ®· ®­îc th¸o xo¾n,
liªn kÕt víi sîi ®¬n DNA vµ tiÕp tôc th¸o xo¾n DNA ®Ó h×nh thµnh ch¹c sao chÐp.
TiÕp theo sau ®ã, primase vµ DNA polymerase III ®­îc kÕt hîp vµo ch¹c sao chÐp
bëi c¸c t­¬ng t¸c gi÷a protein – protein vµ qu¸ tr×nh tæng hîp DNA b¾t ®Çu.
DnaA lµ mét thµnh phÇn cña thÓ sao chÐp (lµ mét bé m¸y cã thÓ kiÓm so¸t
qu¸ tr×nh sao chÐp gåm c¸c enzyme DNA polymerase, primase, helicase vµ c¸c
protein phô trî kh¸c cã mÆt trong qu¸ tr×nh sao chÐp DNA), cã chøc n¨ng mang
c¸c thµnh phÇn cña thÓ sao chÐp DNA ®Õn ®óng n¬i khëi ®Çu sao chÐp cña nhiÔm
s¾c thÓ vßng trßn.
1.1.2.3. Giai ®o¹n nèi dµi
DNA-polymerase III lµ mét phøc hîp gåm nhiÒu enzyme g¾n víi nhau b¾t
®Çu sao chÐp mét trong hai m¹ch b»ng c¸ch g¾n vµo m¹ch khu«n vµ l¾p c¸c
nucleotide bæ sung vµo vÞ trÝ t­¬ng øng. Mét phøc hîp lµ cÇn thiÕt v× DNA
polymerase ph¶i xóc t¸c nhiÒu b­íc ph¶n øng kh¸c nhau vµ ph¶i cã kh¶ n¨ng sö
dông bèn lo¹i nucleotide nh­ chÊt ph¶n øng phô thuéc vµo chç ®­îc "®äc" trªn
m¹ch khu«n. Ýt nhÊt nã ph¶i cã bèn trung t©m ho¹t ®éng, mçi trung t©m øng víi
mét lo¹i nucleotide (A, T, C, G). Ngoµi chøc n¨ng polymer ho¸ theo h­íng 5' ®Õn
3', DNA polymerase III cßn cã kh¶ n¨ng söa sai nhê ho¹t tÝnh exonuclease
(exonuclease lµ ho¹t tÝnh enzyme c¾t DNA tõ ®Çu mót mét m¹ch) theo h­íng 3'
 5'.
Khi phøc hîp DNA polymerase ®äc theo m¹ch khu«n vµ kÐo c¸c nucleotide
bæ sung vµo ®óng chç, nã g¾n c¸c nucleotide l¹i lµm m¹ch míi bæ sung mäc dµi
ra. Trªn ®­êng di chuyÓn ®Ó tæng hîp DNA, nÕu DNA polymerase III gÆp chç mµ
nucleotide míi l¾p sai vÞ trÝ nã sö dông ho¹t tÝnh exonuclease 3'5' c¾t lïi l¹i bá
nucleotide sai, ®Ó råi l¾p c¸i ®óng vµo tiÕp tôc sao chÐp. C¸c nucleotide tr­íc khi
®­îc g¾n vµo ®Çu 3' OH ®· ®­îc ho¹t ho¸ do ATP ®Ó thµnh nucleoside triphosphate
cã mang n¨ng l­îng. DNA polymerase cã tÝnh ®Æc hiÖu cao, nã chØ thªm
nucleotide vµo ®Çu 3' OH cña m¹ch ®ang ®­îc tæng hîp.

52
H×nh 2.6. Ch¹c ba sao chÐp vµ c¸c thµnh phÇn tham gia trong qu¸ tr×nh sao chÐp

M¹ch khu«n cã ®Çu 3' ®­îc DNA polymerase III g¾n vµo vµ tæng hîp ngay
m¹ch bæ sung 5'3' h­íng vµo ch¹c ba sao chÐp. M¹ch khu«n nµy ®­îc gäi lµ
m¹ch khu«n tr­íc, cßn m¹ch míi ®­îc tæng hîp gäi lµ m¹ch tr­íc (leading strand)
(h×nh 2.6).
Trong khi ®ã, ë m¹ch khu«n sau cã ®Çu 5' viÖc tæng hîp phøc t¹p h¬n vµ thùc
hiÖn tõ ch¹c ba sao chÐp h­íng ra ngoµi ®Ó ®¶m b¶o ®óng h­íng 5'3'. Khi m¹ch
kÐp t¸ch ra, ë gÇn ch¹c ba sao chÐp, enzyme primase g¾n måi (primer) RNA
kho¶ng 10 nucleotide, cã tr×nh tù bæ sung víi m¹ch khu«n. DNA polymerase III
nèi theo måi RNA, theo h­íng ng­îc víi ch¹c ba sao chÐp, tæng hîp c¸c ®o¹n
ng¾n 1000 - 2000 nucleotide, ®­îc gäi lµ c¸c ®o¹n Okazaki. DNA polymerase nèi
dµi ®o¹n Okazaki cho ®Õn khi gÆp RNA måi phÝa tr­íc th× dõng l¹i, råi lïi ra sau
tiÕp tôc tæng hîp tõ RNA måi míi ®­îc t¹o nªn gÇn ch¹c ba sao chÐp. TiÕp theo,
DNA polymerase I nhê ho¹t tÝnh exonuclease 5'  3' c¾t bá måi RNA, l¾p c¸c
nucleotide cña DNA vµo chç trèng vµ thùc hiÖn polymer ho¸ h­íng 5'3'. §o¹n
DNA ng¾n 10 nucleotide nµy cßn hë hai ®Çu, ®­îc nèi liÒn chç hë nhê enzyme
ligase cña DNA. M¹ch ®­îc tæng hîp tõ ch¹c ba sao chÐp h­íng ra ngoµi ®­îc
tæng hîp chËm h¬n nªn gäi lµ m¹ch sau (lagging strand).

53
H×nh 2.7. Sù chuyÓn ®éng cña DNA polymerase III trong qu¸ tr×nh sao chÐp

KiÓm so¸t ®Çu tiªn cña qu¸ tr×nh sao chÐp lµ tÝnh chÝnh x¸c vÒ tr×nh tù cña sîi
DNA míi ®­îc tæng hîp. KiÓu kiÓm so¸t thø hai ®ã lµ tèc ®é sao chÐp DNA.
Chóng ta biÕt r»ng thêi gian cÇn thiÕt ®Ó E.coli sao chÐp nhiÔm s¾c thÓ cña nã víi
thêi gian ng¾n nhÊt lµ kho¶ng 20 phót. Do ®ã, bé gen cña nã kho¶ng 5 triÖu cÆp
base ph¶i ®­îc sao chÐp víi tèc ®é 2000 nucleotide/gi©y. Tõ thÝ nghiÖm cña J.
Cairns, chóng ta cã thÓ biÕt r»ng E.coli chØ sö dông hai ch¹c sao chÐp ®Ó t¸i b¶n
toµn bé bé gen cña nã. Do ®ã, mçi ch¹c sao chÐp ph¶i cã kh¶ n¨ng di chuyÓn víi
tèc ®é kho¶ng 1000 nucleotide/gi©y. §Ó ®¶m b¶o tèc ®é vµ ®é chÝnh x¸c cña ph¶n
øng tæng hîp DNA, DNA polymerase thùc sù lµ mét phÇn cña phøc hîp lín
“nucleoprotein”, phøc hîp nµy ®ång ho¹t ®éng t¹i ch¹c sao chÐp (h×nh 2.7). Phøc
hîp nµy ®­îc gäi lµ thÓ sao chÐp, lµ mét vÝ dô vÒ bé m¸y ph©n tö.
Mét sè hîp phÇn t­¬ng t¸c cña thÓ sao chÐp ë E.coli ®­îc biÓu hiÖn ë h×nh 2.7.
T¹i ch¹c sao chÐp lâi DNA polymerase III, lµ mét phÇn cña phøc hîp lín h¬n gäi
lµ holoenzyme polymerase III cã chøa hai lâi DNA polymerase III vµ nhiÒu protein
phô trî, xóc t¸c ph¶n øng tæng hîp DNA. Trong ®ã, mét lâi DNA polymerase III
tæng hîp sîi tr­íc, lâi enzyme cßn l¹i tæng hîp sîi muén. Mét sè protein phô trî
lµm cÇu nèi hai lâi enzyme, do ®ã nã cïng ho¹t ®éng ®Ó tæng hîp sîi tr­íc vµ sîi
muén, b»ng c¸ch uèn vßng sîi khu«n tæng hîp sîi muén t¹o thuËn lîi cho lâi
enzyme tæng hîp sîi muén cïng h­íng víi h­íng di chuyÓn cña ch¹c sao chÐp vµ
h­íng tæng hîp sîi tr­íc. ë h×nh 2.7, chóng ta còng quan s¸t thÊy mét protein
phô trî kh¸c ®­îc gäi lµ protein kÑp, nã kÑp DNA nh­ mét chiÕc b¸nh kÑp. Sù

54
kÕt hîp gi÷a protein kÑp víi DNA polymerase III gióp cho DNA polymerase III
tr­ît liªn tôc trªn sîi DNA. Do ®ã, DNA polymerase III, mét enzyme chØ cã kh¶
n¨ng tæng hîp liªn tôc 10 nucleotide råi rêi khái khu«n DNA (cßn gäi lµ enzyme
tæng hîp ng¾t qu·ng), trë nªn cã kh¶ n¨ng tæng hîp liªn tôc hµng chôc ngµn
nucleotide (gäi lµ enzyme tæng hîp liªn tôc).
Tãm l¹i, sîi tr­íc vµ sîi muén ®­îc tæng hîp ®ång thêi mét c¸ch nhanh chãng
vµ chÝnh x¸c. Nh­ng còng cÇn ph¶i chó ý r»ng primase lµ mét enzym tæng hîp
måi RNA, kh«ng ®­îc g¾n víi protein kÑp vµ còng kh«ng cã ho¹t tÝnh söa sai. Do
®ã, primase ho¹t ®éng nh­ mét enzyme tæng hîp ng¾t qu·ng – cã nghÜa nã chØ
tæng hîp vµi ribonucleotide tr­íc khi rêi khái khu«n vµ ®o¹n måi nµy sÏ ®­îc lo¹i
bá vµ thay thÕ b»ng nucleotide bëi ho¹t ®éng cña DNA polymerase I.
VÊn ®Ò cÇn gi¶i quyÕt tiÕp theo trong qu¸ tr×nh sao chÐp, ®ã lµ gi¶i xo¾n sîi kÐp
DNA t¹i ch¹c sao chÐp vµ th¸o xo¾n c¸c vßng siªu xo¾n phÝa tr­íc ch¹c sao chÐp,
do sù di chuyÓn cña ch¹c sao chÐp g©y ra. Chóng ta biÕt r»ng thÓ sao chÐp cã chøa
hai lo¹i protein cã kh¶ n¨ng më xo¾n lµ: helicase vµ topoisomerase. Helicase ph¸
vì c¸c liªn kÕt hydro gi÷a hai sîi DNA, gièng nh­ protein kÑp, helicase nh­ lµ
mét vßng bao quanh sîi DNA vµ nã di chuyÓn ®Ó th¸o xo¾n sîi DNA kÐp. C¸c sîi
DNA ®¬n võa ®­îc th¸o ra khái sîi kÐp DNA ®­îc æn ®Þnh bëi c¸c protein c¨ng
m¹ch ®¬n (SSB protein), ng¨n kh«ng cho c¸c sîi ®¬n nµy h×nh thµnh sîi kÐp trë
l¹i.
Topoisomerase th¸o xo¾n vïng siªu xo¾n b»ng c¸ch bÎ g·y mét hoÆc c¶ hai sîi
DNA, råi cho phÐp sîi DNA quay ®Ó th¸o xo¾n. Sau khi th¸o xo¾n xong,
topoisomerase nèi liÒn hai ®Çu DNA l¹i nh­ cò.
1.1.2.4. Giai ®o¹n kÕt thóc
Qu¸ tr×nh sao chÐp DNA ë E.coli diÔn ra víi tèc ®é rÊt nhanh, cã thÓ ®¹t ®­îc
®Õn 50.000 nucleotide/phót, cßn ë ®éng vËt lµ 50 nucleotide/ gi©y (kho¶ng 3000
nucleotide/phót). §èi víi vi khuÈn, nÊm men vµ mét sè virus ký sinh trªn ®éng
vËt, hÖ gen cña chóng th­êng chØ cã mét t©m sao chÐp vµ dµi kho¶ng 300bp. Khi
qu¸ tr×nh nh©n ®«i DNA b¾t ®Çu, hai ch¹c sao chÐp h×nh thµnh t¹i t©m vµ tiÕn vÒ
hai phÝa ng­îc nhau.
§Ó theo dâi qu¸ tr×nh sao chÐp DNA, n¨m 1963 J. Cairns sö dông thymidine
– nucleotide thymine cã chøa ®ång vÞ phãng x¹ cña hydro lµ tritium, tiÒn chÊt ®Æc
hiÖu cho DNA sö dông. Qu¸ tr×nh xuÊt ph¸t tõ mét ®iÓm ori gäi lµ ®iÓm xuÊt ph¸t
vµ triÓn khai vÒ hai phÝa (h×nh 2.9). Khi DNA vßng trßn ®ang sao chÐp, quan s¸t

55
thÊy d¹ng DNA h×nh "con m¾t" (eye replication) (h×nh 2.8). Ch¹c ba sao chÐp lan
dÇn, cuèi cïng t¹o ra hai ph©n tö DNA lai: mét m¹ch cã mang dÊu phãng x¹ T-H3
(thymine H3). Cã tr­êng hîp sao chÐp chØ x¶y ra vÒ mét phÝa.
E. coli chØ cã mét ®iÓm xuÊt ph¸t sao chÐp t¹i ori nªn c¶ DNA thµnh mét ®¬n
vÞ sao chÐp thèng nhÊt ®­îc gäi lµ replicon. Replicon ®­îc hiÓu lµ ®¬n vÞ sao chÐp.
Bé gen cña c¸c sinh vËt tiÒn nh©n th­êng chØ cã mét replicon.

H×nh 2.8. C¬ chÕ sao chÐp DNA vßng

NÕu cã hai ch¹c sao chÐp xuÊt ph¸t tõ hai phÝa cña t©m sao chÐp th× qu¸ tr×nh
sao chÐp ®­îc coi lµ sao chÐp hai chiÒu (bidirectional replication). Hai ch¹c sao
chÐp nµy di chuyÓn víi tèc ®é nh­ nhau trªn ph©n tö DNA khu«n d¹ng vßng. Mçi
ch¹c sao chÐp sÏ cã ®iÓm dõng t¸i b¶n. §iÒu thó vÞ lµ ch¹c sao chÐp nµy ph¶i ®i
qua ®iÓm dõng cña ch¹c sao chÐp kia tr­íc khi hai ch¹c gÆp nhau vµ kÕt thóc qu¸
tr×nh t¸i b¶n (h×nh 2.9).
V× lý do nµo ®ã mét ch¹c di chuyÓn nhanh h¬n ch¹c kia th× nã sÏ ®i qua ®iÓm
dõng chung nh­ng bÞ chÆn l¹i ë ®iÓm kÕt thóc cña riªng m×nh. T¹i ®©y ch¹c di
chuyÓn nhanh sÏ dõng l¹i ®îi ®Ó gÆp ch¹c di chuyÓn chËm. C¸ch thøc s¾p xÕp c¸c
vÞ trÝ dõng sao chÐp nh­ ë bé gen vi khuÈn ®­îc gäi lµ "bÉy ch¹c" (replication fork
trap).

56
H×nh 2.9. C¬ chÕ dõng sao chÐp cña DNA vßng

1.1.3. Qu¸ tr×nh sao chÐp DNA ë tÕ bµo eukaryote


1.1.3.1. C¸c thµnh phÇn tham gia trong qu¸ tr×nh sao chÐp
C¬ chÕ sao chÐp nªu trªn ®­îc rót ra tõ c¸c nghiªn cøu trªn prokaryote. Sù
sao chÐp DNA ë eukaryote cßn ch­a ®­îc hiÓu t­êng tËn, nh­ng c¸c d÷ kiÖn thu
nhËn ®­îc cho thÊy hÖ thèng nµy kh¸ gÇn víi hÖ thèng sao chÐp ë prokaryote. C¸c
kh¸c biÖt chñ yÕu lµ ë c¸c lo¹i DNA polymerase tham gia vµo c¸c qu¸ tr×nh.
C¸c DNA polymerase gåm cã:
♦ Polymerase α/primer: cã chøc n¨ng tæng hîp måi RNA cho m¹ch chËm, c¸c
chøc n¨ng kh¸c ch­a ®­îc râ. Enzyme nµy kh«ng cã kh¶ n¨ng söa sai (kh«ng cã
ho¹t tÝnh exonuclease) nªn kh«ng ph¶i lµ thµnh phÇn duy nhÊt tham gia vµo qu¸
tr×nh sao chÐp.
♦ Polymerase β: cã chøc n¨ng gièng DNA polymerase I ë prokaryote, nghÜa lµ
tæng hîp ®i kÌm víi söa sai vµ hoµn chØnh m¹ch míi sau khi c¸c måi RNA ®­îc
lo¹i bá.
♦ Polymerase γ: ®­îc t×m thÊy ë ti thÓ, chøc n¨ng ch­a râ.
♦ Polymerase δ: d­êng nh­ cã chøc n¨ng gÇn víi DNA polymerase III ë
prokaryote.
♦ Polymerase ε: míi ®­îc ph¸t hiÖn gÇn ®©y, cã vai trß ch­a râ.
Ngoµi c¸c polymerase kÓ trªn, hÖ thèng sao chÐp ë eukaryote cßn cã sù tham
gia cña nhiÒu protein chuyªn biÖt nh­: PCNA (Proliferating Cell Nuclear Antigen
- kh¸ng nguyªn trong nh©n tÕ bµo ®ang ph©n chia) cã chøc n¨ng ho¹t hãa c¸c

57
polymerase ε vµ δ, c¸c nh©n tè sao chÐp A vµ C (Replication Factor, RF-A, RF-
C) cÇn cho ho¹t ®éng cña c¸c polymerase α vµ δ, ...
1.1.3.2. C¸c giai ®o¹n cña qu¸ tr×nh sao chÐp
Chóng ta biÕt r»ng sù tæng hîp DNA diÔn ra trong phase S cña chu kú tÕ bµo.
ë nÊm men ng­êi ta t×m thÊy 3 protein ®­îc cÇn cho sù khëi ®Çu sao chÐp, ®ã lµ
Cdc6, Cdt1 vµ ORC (phøc hîp nhËn biÕt ®iÓm khëi ®Çu sao chÐp – origin
recognition complex). ORC nhËn biÕt ®iÓm khëi ®Çu sao chÐp gièng nh­ DnaA
cña E.coli, sau ®ã kÕt hîp víi hai protein Cdc6 vµ Cdt1. Sù kÕt hîp cña hai protein
nµy gióp cho phøc hîp l«i kÐo ®­îc helicase vµo ®iÓm khëi ®Çu sao chÐp vµ th¸o
xo¾n DNA t¹i tr×nh tù giµu AT cña ori. Mét m« h×nh sao chÐp chung cho
eukaryote ®­îc ®Ò xuÊt nh­ sau:
♣ §Çu tiªn, DNA ®­îc th¸o xo¾n nhê mét topoisomerase vµ nh©n tè
sao chÐp A (RF-A).
♣ Trªn m¹ch chËm, polymerase α/primer t­¬ng t¸c víi RF-A tæng hîp
måi RNA (dµi ®é 10 nucleotide). Måi nµy ®­îc nèi dµi thªm ®é 20
desoxynucleotide, nhê polymerase α kÕt hîp víi nh©n tè sao chÐp C (RF-C). Lóc
®ã, sù phèi hîp PCNA-ATP chËn polymerase α l¹i, gióp cho polymerase δ g¾n
vµo vµ tæng hîp ®o¹n Okazaki.
♣ Polymerase α ®­îc gi¶i phãng sÏ ®­îc chuyÓn lªn m¹ch ®èi diÖn vµ
tæng hîp liªn tôc m¹ch míi.

H×nh 2.10. Sù kÕt hîp cña c¸c nucleosome trong qu¸ tr×nh sao chÐp DNA

VÇn ®Ò ®Æt ra cho sù sao chÐp ë eukaryote lµ cÊu tróc cña nhiÔm s¾c chÊt.
NhiÒu nghiªn cøu sö dông c¸c phÇn tö ®¸nh dÊu b»ng ®ång vÞ phãng x¹ cho thÊy
c¸c ph©n tö DNA ngay sau khi ®­îc sao chÐp sÏ ®­îc tæ chøc l¹i thµnh nucleosome
(trong vßng vµi phót) nhê sù kÕt hîp c¸c histone vµo DNA bëi proteinCAF – 1
(nh©n tè kÕt hîp nhiÔm s¾c chÊt 1 – chromatin assembly factor 1). CAF – 1 liªn

58
kÕt víi c¸c histone, vËn chuyÓn chóng ®Õn ch¹c sao chÐp vµ kÕt hîp víi PCNA (lµ
mét phiªn b¶n cña protein kÑp nh­ ë E.coli), t¹i ®©y c¸c histone liªn kÕt víi sîi
DNA kÐp võa ®­îc tæng hîp xong t¹o ra c¸c nucleosome (h×nh 2.10). C¸c
nucleosome míi h×nh thµnh chØ chøa c¸c histone míi tæng hîp. Tuy nhiªn, ®iÒu
ch­a râ lµ c¸c nucleosome míi h×nh thµnh n»m hoµn toµn trªn mét m¹ch vµ c¸c
nucleosome cò trªn m¹ch kia hay cã sù ph©n bè ngÉu nhiªn trªn c¶ hai m¹ch.
1.1.3.3. Sao chÐp nhiÔm s¾c thÓ ë eukaryote
§èi víi sinh vËt eukaryote, trªn mçi nhiÔm s¾c thÓ cã nhiÒu t©m sao chÐp.
C¸c t©m nµy (20 ®Õn 80) th­êng tËp trung trªn mét ®o¹n DNA t¹o nªn ®¬n vÞ sao
chÐp (replication units). Kho¶ng c¸ch gi÷a c¸c t©m sao chÐp trªn mét ®¬n vÞ thay
®æi tõ 30 ®Õn 300kb. Ngoµi ra, kh«ng ph¶i mäi ®¬n vÞ sao chÐp ®Òu ho¹t ®éng
cïng mét lóc. Ngay trªn cïng mét nhiÔm s¾c thÓ, c¸c vïng kh¸c nhau ®­îc t¸i b¶n
ë c¸c thêi ®iÓm kh¸c nhau. Mét ®iÒu lý thó lµ ho¹t ®éng cña chóng kh«ng x¶y ra
mét c¸ch ngÉu nhiªn mµ theo mét trËt tù nhÊt ®Þnh. Trong phase S, c¸c vïng DNA
dÞ nhiÔm s¾c ®­îc nh©n ®«i muén h¬n trong khi vïng chøa gen ®­îc nh©n ®«i sím
h¬n. H¬n n÷a, c¸c gen ho¹t ®éng trong mäi lo¹i m« tÕ bµo (®­îc gäi lµ gen qu¶n
gia - "housekeeping genes") ®­îc nh©n ®«i rÊt sím trong khi c¸c gen chØ ho¹t
®éng trong mét sè m« tÕ bµo nhÊt ®Þnh sÏ nh©n ®«i sím trong tÕ bµo ®ã nh­ng l¹i
®­îc nh©n ®«i rÊt muén trong tÕ bµo mµ gen kh«ng ho¹t ®éng.
TÕ bµo eukaryote cã sè l­îng DNA lín h¬n nhiÒu so víi tÕ bµo tiÒn nh©n, t¹o
nªn nhiÒu nhiÔm s¾c thÓ, mµ mçi c¸i gåm mét sîi DNA th¼ng cã kÕt hîp víi
protein. Do ®ã sao chÐp DNA cña tÕ bµo eukaryote cã phøc t¹p h¬n vµ cã tèc ®é
chËm h¬n (kho¶ng 50 nucleotide/gi©y).

H×nh 2.11. Sao chÐp DNA ë Eukaryote

59
§iÓm kh¸c c¨n b¶n lµ DNA tÕ bµo eukaryote cã nhiÒu replicon. VÝ dô: nÊm
men b¸nh m× Saccharomyces cerevisiae cã tíi 500 replicon tøc lµ cã 500 ®iÓm ori
xuÊt ph¸t sao chÐp. Qu¸ tr×nh sao chÐp còng b¾t ®Çu tõ ori råi lan vÒ hai phÝa nh­
h×nh 2.11. TÕ bµo cã c¬ chÕ kiÓm so¸t nghiªm ngÆt qu¸ tr×nh sao chÐp, ®iÓm ori
nµo ®· sao chÐp mét lÇn råi th× kh«ng lÆp l¹i tr­íc khi toµn bé DNA ®­îc sao chÐp
xong hoµn toµn.
Sau khi sao chÐp xong tÕ bµo cã c¬ chÕ ph©n chia DNA ®Òu ®Æn vÒ c¸c tÕ bµo
con.
1.1.3.4 . Sao chÐp ®Çu telomere
§Ó tæng hîp ®­îc trän vÑn c¸c ®Çu telomere tËn cïng cña ph©n tö DNA d¹ng
th¼ng, enzyme telomerase nhËn biÕt ®­îc ®o¹n ng¾n DNA giµu nucleotide G t¹i
®Çu telomere vµ kÐo dµi ®Çu ®ã theo h­íng 5' 3' (nh­ vËy ®Çu telomere dµi thªm
ra). B¶n th©n telomerase cã chøa ph©n tö RNA ®­îc dïng lµm khu«n ®Ó tæng hîp
nªn ®o¹n kÐo dµi ®ã. Sau ®Êy ®o¹n míi nµy ®­îc dïng lµm khu«n ®Ó DNA
polymerase hoµn thiÖn c¸c ®Çu tËn cïng cña sîi DNA míi (h×nh 2.12).

H×nh 2.12: Sù sao chÐp c¸c ®Çu telomere cña NST nhê enzyme telomerase

1.1.4. Sao chÐp theo c¬ chÕ vßng trßn l¨n


Trong qu¸ tr×nh sao chÐp DNA, sîi DNA khu«n cã thÓ tån t¹i d­íi d¹ng
th¼ng hoÆc d¹ng vßng, ë d¹ng sîi ®«i hoÆc sîi ®¬n. Nh÷ng d¹ng khu«n nµy ®­îc
sö dông ®Ó tæng hîp nªn b¶n sao gièng hÖt chóng vÒ h×nh d¹ng (trßn hoÆc th¼ng)
vµ cÊu tróc (®¬n hoÆc ®«i). Tuy nhiªn, ph©n tö DNA sîi ®«i cã thÓ lµm khu«n ®Ó
tæng hîp sîi ®¬n hoÆc ng­îc l¹i. Do ®ã, cã nhiÒu c¸ch thøc sao chÐp DNA kh¸c
nhau. Mèi liªn hÖ gi÷a h×nh d¹ng cÊu tróc cña sîi khu«n vµ sîi cÇn nh©n ®«i lµ
yÕu tè quyÕt ®Þnh c¸ch thøc sao chÐp cña DNA.

60
Ph©n tö DNA d¹ng vßng cña vi khuÈn ®­îc sao chÐp theo c¬ chÕ con m¾t (®·
m« t¶ ë trªn), trong ®ã liªn kÕt gi÷a hai sîi ®¬n bÞ ph¸ vì t¹i t©m sao chÐp. Tuy
nhiªn, ph©n tö DNA vßng cña thùc khuÈn thÓ (bacteriophage) ®­îc sao chÐp theo
c¸ch thøc kh¸c víi DNA vi khuÈn. Qu¸ tr×nh tæng hîp sîi DNA míi ®­îc b¾t ®Çu
t¹i mét vÕt c¾t thuéc t©m sao chÐp trªn mét sîi ®¬n khu«n, gi¶i phãng ®Çu 3'OH
tù do, ®Çu nµy ®­îc sö dông nh­ måi ®Ó DNA polymerase tæng hîp sîi míi t¹o
cÆp bæ sung víi sîi khu«n kh«ng bÞ c¾t. Nh­ thÕ, ch¹c sao chÐp sÏ di chuyÓn liªn
tôc vßng quanh sîi khu«n, mçi lÇn ch¹c sao chÐp di chuyÓn hÕt mét vßng th× mét
sîi ®¬n DNA ®­îc tæng hîp xong. Sîi míi t¸ch khái sîi khu«n ®Ó ch¹c sao chÐp
di chuyÓn vßng tiÕp theo. C¸ch thøc tæng hîp nh­ thÕ t¹o ra sîi ®¬n DNA dµi gåm
c¸c b¶n sao kÕ tiÕp nhau liªn tôc (h×nh 2.13), c¸ch thøc nµy ®­îc gäi lµ sao chÐp
theo vßng trßn l¨n (rolling cycle replication).

H×nh 2.13. Sao chÐp DNA theo c¬ chÕ vßng trßn l¨n

§èi víi nhiÒu virus còng nh­ ë mét sè tr­êng hîp kh¸c, sè l­îng cña gen
trong bé gen ®­îc t¨ng lªn rÊt nhiÒu t¹i c¸c thêi ®iÓm ®Æc biÖt. Ph©n tö DNA
th­êng ®­îc nh©n ®«i theo c¬ chÕ vßng trßn l¨n. Qu¸ tr×nh tæng hîp sîi DNA míi
®­îc b¾t ®Çu t¹i mét vÕt c¾t thuéc t©m sao chÐp trªn mét sîi ®¬n khu«n - sîi nµy
®­îc gäi lµ sîi d­¬ng. T¹i vÕt c¾t, ®Çu 5' ®­îc th¸o dÇn vµ trë thµnh khu«n ®Ó tæng
hîp c¸c sîi Okazaki. §Çu 3' t¹i vÕt c¾t ®­îc thªm c¸c nucleotide míi t¹o cÆp bæ
sung víi c¸c nucleotide trªn sîi ®¬n kia. Nhê ®ã hai ph©n tö DNA ®­îc tæng hîp
vµ lu«n tu©n theo c¬ chÕ b¸n b¶o toµn.

61
Sîi DNA tæng hîp theo c¬ chÕ vßng trßn l¨n gåm nhiÒu b¶n sao liªn tiÕp, cã
thÓ ®­îc c¾t rêi nhau thµnh tõng b¶n riªng biÖt; mçi b¶n gièng hÖt ph©n tö khu«n
ban ®Çu. TiÕp ®Õn, mçi b¶n ®¬n lÎ cã thÓ t¹o thµnh ph©n tö d¹ng vßng. Sao chÐp
theo c¬ chÕ vßng trßn l¨n th­êng ®­îc sö dông ®Ó nh©n b¶n mét bé gen víi sè
l­îng nhiÒu trong thêi gian ng¾n. VÝ dô, trøng Õch sau khi thô tinh ph¸t triÓn rÊt
nhanh nªn yªu cÇu rÊt nhiÒu rRNA cho bé m¸y tæng hîp protein. Sè l­îng rRNA
®­îc ®¸p øng ®Çy ®ñ do gen m· cho rRNA ®­îc sao chÐp theo c¬ chÕ vßng trßn
l¨n t¹o ra mét sè l­îng gen rÊt lín trong mét kho¶ng thêi gian nhÊt ®Þnh trong qu¸
tr×nh ph¸t triÓn ph«i.
1.2. Sù söa sai cña DNA trong qu¸ tr×nh sao chÐp vµ
khi kh«ng sao chÐp
1.2.1. §¶m b¶o tæng hîp DNA chÝnh x¸c nhê c¬ chÕ "®äc söa"
(proofreading)
Sai sãt x¶y ra trong qu¸ tr×nh tæng hîp DNA chØ kho¶ng 10-9 (cø 109
nucleotide t¸i b¶n th× cã mét sai sãt x¶y ra). TÇn sè nµy nhá h¬n rÊt nhiÒu tÇn sè
t¹o liªn kÕt sai lÖch gi÷a c¸c base. VÝ dô nh­ liªn kÕt gi÷a A-C hay G-T cã tÇn sè
kho¶ng 10-5. §ã lµ do c¸c nucleotide khi g¾n vµo sîi DNA ®ang tæng hîp ph¶i
chÞu sù kiÓm tra theo c¬ chÕ ®äc söa. Nhê ®ã bÊt k× mét nucleotide nµo t¹o liªn
kÕt kh«ng ®óng nguyªn t¾c bæ sung ®Òu bÞ ph¸t hiÖn vµ lo¹i bá.
C¬ chÕ ®äc söa phô thuéc vµo tÝnh chÊt ®Æc biÖt cña enzyme DNA
polymerase. Kh¸c víi RNA polymerase, DNA polymerase kh«ng cã kh¶ n¨ng nèi
hai nucleotide víi nhau ®Ó b¾t ®Çu tæng hîp sîi míi. Enzyme nµy ®ßi hái ph¶i cã
mét ®o¹n nucleotide ng¾n cã ®Çu tËn cïng mang nhãm OH ë vÞ trÝ 3'. §o¹n nµy
®­îc gäi lµ sîi måi (primer strand). C¸c nucleotide t¹o cÆp theo nguyªn t¾c bæ
sung víi c¸c base trªn sîi khu«n ®­îc g¾n vµo vÞ trÝ 3' nhê liªn kÕt phosphodiester
gi÷a nhãm OH ë vÞ trÝ 3' víi nhãm phosphate ë vÞ trÝ 5' cña hai nucleotide liªn tiÕp
nhau. Ph¶n øng nµy do DNA polymerase ®¶m nhiÖm. Mäi sai sãt kh«ng tu©n theo
nguyªn t¾c bæ sung ®Òu bÞ enzyme ph¸t hiÖn vµ lo¹i bá. TÝnh chÊt nµy cña enzyme
chØ x¶y ra theo h­íng 3'5' trªn sîi ®ang tæng hîp gióp cho enzyme cã kh¶ n¨ng
tù söa sai (self correcting), do ®ã tÇn sè ®ét biÕn rÊt nhá.
Liªn kÕt theo nguyªn t¾c bæ sung cña nucleotide cuèi cïng t¹i ®Çu 3' cña måi
víi khu«n ®ãng vai trß quyÕt ®Þnh gióp enzyme tù söa c¸c sai háng. Ng­îc l¹i,
enzyme RNA polymerase xóc t¸c qu¸ tr×nh tæng hîp mRNA kh«ng cã tÝnh chÊt
tù "®äc söa". §iÒu may m¾n lµ c¸c sai sãt trong ph©n tö mRNA kh«ng cã vai trß
quyÕt ®Þnh c¸c hËu qu¶ di truyÒn. RNA polymerase cã thÓ tæng hîp nhiÒu ph©n tö

62
mRNA tõ mét gen mµ kh«ng cÇn ®o¹n oligonucleotide lµm måi ban ®Çu. TÇn sè
®ét biÕn tù ph¸t x¶y ra trong c¶ hai qu¸ tr×nh tæng hîp mRNA vµ tæng hîp protein
kho¶ng 10-4.
ë vi khuÈn E.coli, mét sè ®ét biÕn lµm t¨ng m¹nh tÇn sè biÕn ®æi tù ph¸t c¸c
nucleotide trªn sîi DNA míi. §ã lµ c¸c ®ét biÕn x¶y ra ë gen quy ®Þnh tÝnh chÊt
®äc söa exonuclease 3'5' cña DNA polymerase. V× vËy, rÊt nhiÒu sai sãt x¶y ra
mµ kh«ng bÞ ph¸t hiÖn ®Ó söa ch÷a theo c¬ chÕ ®äc söa cña enzyme. Tuy nhiªn,
chóng cã thÓ ®­îc söa theo mét c¬ chÕ kh¸c gäi lµ c¬ chÕ ®äc söa c¸c liªn kÕt t¹o
cÆp sai (mismatch proofreading hoÆc mismatch repair) v× nã kh«ng phô thuéc vµo
viÖc nhËn biÕt nucleotide l¹ mµ dùa vµo sù mÐo mã cÊu tróc sîi kÐp do c¸c liªn
kÕt t¹o cÆp sai gi÷a c¸c base kh«ng bæ sung víi nhau. §iÒu ®Æc biÖt lý thó lµ tÝnh
chÊt ®äc söa theo c¬ chÕ thø hai lµ chØ c¾t bá nucleotide kh«ng bæ sung ë sîi míi
mµ kh«ng ®éng ch¹m ®Õn nucleotide trªn sîi khu«n (tøc nhËn biÕt ®­îc nucleotide
ghÐp ®«i sai lÖch trªn sîi võa tæng hîp).
GÇn ®©y mét sè protein cã vai trß t­¬ng tù c¸c protein tham gia c¬ chÕ ®äc
söa t¹o cÆp sai ë vi khuÈn ®­îc ph¸t hiÖn ë sinh vËt eukaryote. ë nÊm men, khi
c¸c gen m· cho protein nµy bÞ ®ét biÕn, tû lÖ sai sãt trong t¸i b¶n DNA cã thÓ t¨ng
h¬n 100 lÇn. Tuy nhiªn, c¸c base A cña DNA eukaryote kh«ng chøa gèc methyl,
do ®ã ph©n biÖt gi÷a sîi míi vµ sîi cò cã lÏ dùa vµo c¸c vÕt ®øt g·y hay cã ë sîi
míi võa ®­îc tæng hîp. V× sao c¸c vÕt ®øt g·y nµy l¹i xuÊt hiÖn lµ mét vÊn ®Ò cÇn
lµm s¸ng tá. Tuy nhiªn, thùc nghiÖm cho thÊy chóng gièng nh­ c¸c tÝn hiÖu gióp
cho c¬ chÕ ®äc söa nhËn ra sîi DNA míi.
1.2.2. Tæng hîp c¸c enzyme söa ch÷a DNA
C¸c enzyme tham gia söa ch÷a DNA ®­îc tæng hîp ngay sau khi ®ét biÕn
x¶y ra cho thÊy tÝnh chÝnh x¸c cña th«ng tin di truyÒn lu«n ®­îc b¶o toµn ®Ó duy
tr× ho¹t ®éng sèng cña tÕ bµo. C¬ chÕ tr¶ lêi c¸c tÝn hiÖu cÊp cøu (SOS response)
ë E.coli ®­îc nghiªn cøu kh¸ chi tiÕt. ë loµi vi khuÈn nµy, qu¸ tr×nh tæng hîp
DNA bÞ dõng do sai háng trªn ph©n tö khu«n ®Òu t¹o ra c¸c tÝn hiÖu lµm t¨ng
c­êng ho¹t ®éng cña h¬n 15 gen bao gåm c¸c gen tham gia söa ch÷a DNA. §Çu
tiªn c¸c tÝn hiÖu ho¹t ho¸ protein RecA. ë d¹ng ho¹t ®éng, RecA ph©n huû protein
øc chÕ c¸c gen thuéc c¬ chÕ SOS, gióp qu¸ tr×nh tæng hîp mRNA trªn c¸c gen nµy
®­îc t¨ng c­êng. C¸c protein ®­îc tæng hîp cã hai t¸c dông, thø nhÊt, t¨ng sè
l­îng enzyme cÇn cho qu¸ tr×nh söa ch÷a DNA nªn sè tÕ bµo sèng sãt t¨ng. Thø
hai, khi nång ®é sè protein thuéc c¬ chÕ SOS t¨ng t¹m thêi sÏ kÐo theo tû lÖ ®ét
biÕn t¨ng (do b¶n th©n c¸c gen nµy còng chÞu c¸c ®ét biÕn). §iÒu nµy kh«ng cã

63
lîi cho tr­íc m¾t. Tuy nhiªn, trong l©u dµi nã t¹o ra nh÷ng thuËn lîi lµm t¨ng tÝnh
®a d¹ng trong quÇn thÓ c¸c tÕ bµo vi khuÈn. Nhê ®ã c¬ héi t¹o ra c¸c tÕ bµo mang
®ét biÕn nh­ng khoÎ m¹nh vµ thÝch øng víi m«i tr­êng còng t¨ng theo.
1.2.3. Söa sai khi kh«ng sao chÐp
Ph©n tö DNA cã thÓ bÞ biÕn ®æi ngay c¶ khi kh«ng sao chÐp. C¸c biÕn ®æi
®ét biÕn nµy x¶y ra víi tÇn sè kh¸ cao. Nhê c¸c c¬ chÕ söa sai nªn tÇn sè ®ét biÕn
®­îc duy tr× ë møc thÊp.
ChiÕn l­îc söa sai trªn nhiÔm s¾c thÓ vÒ c¬ b¶n gièng nhau khi söa sai trong
sao chÐp vµ khi bÞ ®ét biÕn: c¸c enzyme nhËn biÕt g¾n vµo c¸c tr×nh tù sai vµ c¾t
rêi ®o¹n sai, råi m¹ch ®¬n ®óng lµm khu«n ®Ó tæng hîp l¹i chç bÞ c¾t cho ®óng.
Hµng lo¹t enzyme ®Æc hiÖu lµm nhiÖm vô dß t×m vµ söa sai. Cã kho¶ng 20 enzyme
rµ so¸t däc c¸c nhiÔm s¾c thÓ dß t×m c¸c base cã biÕn ®æi ho¸ häc, mçi enzym cã
chøc n¨ng chuyªn biÖt cho mét lo¹i sai háng. Kho¶ng 5 enzyme kh¸c ®Æc hiÖu
cho c¸c liªn kÕt céng ho¸ trÞ sai gi÷a base víi c¸c chÊt ho¸ häc kh¸c hoÆc gi÷a c¸c
base kÒ nhau trªn mét m¹ch. Mét sè enzyme ®Æc hiÖu kh¸c ph¸t hiÖn sù b¾t cÆp
sai, nh­ tr­êng hîp mÊt purine. Tæng céng cã kho¶ng 50 enzyme chuyªn ph¸t hiÖn
vµ söa c¸c sai háng trªn ph©n tö DNA.

2. TÝnh biÕn ®éng cña DNA


2.1. C¸c gen nh¶y
Nh­ ®· tr×nh bµy trong phÇn bé gen vµ gen, chóng ta biÕt r»ng hÇu hÕt bé gen
prokaryote chøa c¸c gen ®¬n b¶n, cã nghÜa lµ ®Æc ®iÓm cña bé gen prokaryote lµ
bao gåm chñ yÕu c¸c ®o¹n DNA kh«ng lÆp l¹i. Ng­îc l¹i, tæng sè gen eukaryote
kÓ c¶ intron chiÕm mét phÇn rÊt nhá trong bé gen. H¬n n÷a, kh«ng ph¶i c¸c gen
ph©n bè mét c¸ch ®Òu ®Æn trong bé gen. Cã nh÷ng vïng réng (~ 500kb) trªn nhiÔm
s¾c thÓ kh«ng chøa mét gen nµo. C©u hái thó vÞ ®Æt ra lµ DNA kh«ng chøa gen cã
®Æc ®iÓm vµ chøc n¨ng nh­ thÕ nµo trong bé gen, trong qu¸ tr×nh tiÕn ho¸?
§Æc ®iÓm cña nh÷ng vïng DNA kh«ng chøa gen lµ cã chøa nh÷ng tr×nh tù
nucleotide lÆp l¹i. Chóng cã thÓ lÆp l¹i liªn tôc trªn mét vïng nhiÔm s¾c thÓ, hoÆc
ph©n bè r¶i r¸c kh¾p trong bé gen. ChiÒu dµi cña ®o¹n lÆp l¹i cã thÓ chØ tõ mét ®Õn
hai nucleotide ®Õn vµi kb. §Æc biÖt mét sè ®o¹n DNA lÆp l¹i cã kh¶ n¨ng di chuyÓn
tõ vÞ trÝ nµy sang vÞ trÝ kh¸c, ®­îc gäi lµ transposon. Transposon cã kh¶ n¨ng di
chuyÓn ®éc lËp vµ ®­îc xem lµ ë d¹ng ho¹t ®éng (active). Sè l­îng transposon ë
d¹ng ho¹t ®éng cã rÊt Ýt trong bé gen. Tuy nhiªn, sè l­îng c¸c tr×nh tù t­¬ng ®ång
víi d¹ng ho¹t ®éng chiÕm tû lÖ rÊt lín; hÇu hÕt chóng kh«ng cã kh¶ n¨ng di chuyÓn

64
®éc lËp vµ ®­îc xem lµ ë d¹ng kh«ng ho¹t ®éng (inactive). Trong bé gen cña
ng­êi, transposon ho¹t ®éng hoÆc kh«ng ho¹t ®éng chiÕm ®Õn 45%.
Khi di chuyÓn, c¸c transposon g©y ra viÖc s¾p xÕp, tæ chøc l¹i bé gen cña
tõng c¸ thÓ, nh­ t¹o ra c¸c ®o¹n DNA míi, hoÆc thay ®æi chøc n¨ng ho¹t ®éng cña
c¸c ®o¹n DNA ë vÞ trÝ chóng ghÐp vµo vµ t¸ch ra. Chóng cã thÓ di chuyÓn tíi vÞ
trÝ bÊt kú vµ hoµn toµn kh«ng yªu cÇu mèi quan hÖ nµo gi÷a hai vÞ trÝ míi vµ cò.
Khi t¸ch ra khái vÞ trÝ cò, transposon cã thÓ mang theo c¸c ®o¹n DNA phô cËn,
g©y sù mÊt ®o¹n t¹i vÞ trÝ cò. Ng­îc l¹i khi ghÐp vµo vÞ trÝ míi, chóng g©y ra hiÖn
t­îng thªm ®o¹n hoÆc chuyÓn ®o¹n ë vÞ trÝ míi. Do ®ã, transposon gièng nh­ c¸c
vector chuyªn chë DNA tõ n¬i nµy sang n¬i kh¸c trong mét bé gen, hoÆc tõ bé
gen nµy sang bé gen kh¸c. Ngoµi ra, trao ®æi chÐo gi÷a c¸c transposon t­¬ng ®ång
ë hai vÞ trÝ kh¸c nhau trªn mét nhiÔm s¾c thÓ còng t¹o ra nh÷ng biÕn ®æi t­¬ng tù.
Nh÷ng biÕn ®æi ®ã dÉn ®Õn sù s¾p xÕp l¹i bé gen, t¹o tÝnh ®a d¹ng gi÷a chóng vµ
t¹o nªn tÝnh ®Æc thï riªng cña tõng c¸ thÓ. §Æc biÖt, sù thay ®æi vÞ trÝ cña
transposon cßn cã thÓ g©y ¶nh h­ëng ®Õn ho¹t ®éng cña c¸c gen ph©n bè xung
quanh ngay c¶ khi chóng kh«ng lµm thay ®æi trËt tù c¸c nucleotide ë nh÷ng gen
nµy. Do ®ã, ho¹t ®éng cña c¸c gen liªn quan ®Õn sù di chuyÓn cña transposon
(th­êng lµ c¸c gen n»m trong transposon) ®­îc kiÓm so¸t rÊt chÆt chÏ.
§Çu thËp kû 1930, nh÷ng nghiªn cøu di truyÒn vÒ n¨ng suÊt cña b¾p ®· thu
®­îc kÕt qu¶ vÒ mét bøc tranh ph©n lo¹i di truyÒn cña gen n»m cè ®Þnh trªn c¸c
locus cña NST. C¸c nghiªn cøu nµy ®· chØ ra r»ng cã mét sè nh©n tè di truyÒn cã
thÓ b»ng mét c¸ch nµo ®ã cã thÓ di chuyÓn tõ vÞ trÝ nµy sang vÞ trÝ kh¸c cña NST
hoÆc tõ NST nµy sang NST kh¸c. HiÖn t­îng nµy ®· ®­îc nghiªn cøu trong nhiÒu
n¨m, vµ gÇn ®©y nã ®· ®­îc lµm s¸ng tá lµ c¸c gen nh¶y (transposon hoÆc mobile
gene, jumping genes) ®­îc thÊy phæ biÕn trong tù nhiªn. Cã rÊt nhiÒu c¸ch ®Ó gäi
tªn cña c¸c nh©n tè nµy: nh©n tè ®iÒu khiÓn (controlling element), gen nh¶y
(jumping gene), gen di ®éng (mobile gene) vµ transposon, ë ®©y chóng ta sö dông
thuËt ng÷ transposon cho c¸c nh©n tè chuyÓn vÞ hay gen nh¶y. Nh©n tè chuyÓn vÞ
(transposon) ®­îc t×m thÊy ë nhiÒu lo¹i sinh vËt: vi khuÈn (E.coli), thùc vËt (b¾p,
lóa, ®Ëu), ë ®éng vËt (ruåi giÊm, ng­êi....) vµ nÊm th«ng qua c¸c ®ét biÕn mµ
chóng t¹o ra khi lµm thay ®æi sù ho¹t ®éng cña c¸c gen mµ chóng chÌn vµo.
Tr×nh tù DNA cña bé gen rÊt kh¸c nhau ë vi sinh vËt, thùc vËt vµ ®éng vËt ®·
cho thÊy r»ng gen nh¶y tån t¹i ë tÊt c¶ c¸c sinh vËt sèng. §iÒu ®¸ng ng¹c nhiªn lµ
ë bé gen ng­êi cña chóng ta, gen nh¶y chiÕm gÇn 45% bé gen nh­ng vai trß di
truyÒn cña chóng vÉn ch­a ®­îc hiÓu râ.

65
C¸ch thøc di chuyÓn vµ ghÐp vµo bé gen cña c¸c transposon tu©n theo hai
c¸ch liªn quan ®Õn d¹ng trung gian cña DNA lµ RNA. Nh÷ng ®o¹n DNA nµo mµ
sù di chuyÓn cña chóng g¾n liÒn víi d¹ng trung gian RNA ®­îc gäi lµ
retroelement, hoÆc DNA retrotransposon. ViÖc di chuyÓn cña retrotransposon
t­¬ng tù nh­ c¸ch thøc x©m nhiÔm cña virus mµ bé gen cña chóng lµ ph©n tö RNA
(retrovirus). Mét khi ®· x©m nhiÔm vµo tÕ bµo, RNA cña retrovirus ®­îc sao chÐp
bëi mét enzyme phiªn m· ng­îc (reverse transcriptase) t¹o ra DNA. Ph©n tö DNA
nµy sÏ ®­îc ghÐp vµo bé gen cña tÕ bµo chñ. Khi virus sinh s«i, phÇn DNA ®ã l¹i
®­îc dïng ®Ó phiªn m· t¹o ra c¸c ph©n tö RNA míi cÇn thiÕt cho viÖc ®ãng gãi
t¹o virus míi. C¸c transposon DNA cã kh¶ n¨ng thay ®æi vÞ trÝ trong bé gen
eukaryote kh«ng qua d¹ng trung gian RNA chiÕm tû lÖ Ýt h¬n so víi c¸c
retrotransposon. VÝ dô, bé gen ng­êi, chØ cã kho¶ng 100 lo¹i DNA transposon.
Tuy nhiªn DNA transposon cã mét ý nghÜa ®Æc biÖt quan träng ®èi víi sù ®a d¹ng
ho¸ bé gen. §Æc ®iÓm cña transposon lµ cã hai tr×nh tù nucleotide víi ®é t­¬ng
®ång cao nh­ng lÆp l¹i ng­îc chiÒu nhau ë hai ®Çu transposon.
Dùa vµo c¸ch thøc sao chÐp khi di chuyÓn, transposon ®­îc chia lµm ba kiÓu
chÝnh:
- Transposon kh«ng sao chÐp: PhÇn tö chuyÓn vÞ ®­îc c¾t khái DNA cho vµ
®­îc g¾n vµo ph©n tö DNA ®Ých. Thuéc lo¹i nµy gåm: Tn10, Tn5, Tn7.
- Transposon sao chÐp: DNA ®­îc nh©n ®«i vµ b¶n sao ®­îc xen vµo vÞ trÝ
míi t¹o ra phøc hîp céng g¾n. Thuéc lo¹i nµy gåm: Tn3, Mu.
- Retrotransposon: Sù di chuyÓn qua trung gian RNA, nhê enzyme phiªn m·
ng­îc t¹o thµnh cDNA vµ xen ®o¹n cDNA vµo vÞ trÝ míi.
2.1.1. Transposon trong bé gen vi khuÈn
Sù kh¸m ph¸ vÒ di truyÒn cña c¸c nh©n tè chuyÓn vÞ (transposon) dÉn tíi nhu
cÇu t×m hiÓu vÒ tr×nh tù DNA cña c¸c nh©n tè nµy vµ c¬ chÕ chuyÓn vÞ cña chóng.
Ph©n tö transposon tù nhiªn lÇn ®Çu tiªn ®­îc ®äc tr×nh tù lµ c¸c transposon cña
vi khuÈn. C¸c transposon ®¬n gi¶n nhÊt ë vi khuÈn ®­îc gäi lµ ®o¹n ng¾n IS
(insertion sequences). Chóng cã thÓ n»m trªn nhiÔm s¾c thÓ hoÆc trªn c¸c plasmid.
Tr×nh tù nucleotide ë mét ®Çu IS th­êng lÆp l¹i nh­ng ng­îc chiÒu so víi ®Çu kia,
®­îc gäi lµ tr×nh tù lÆp l¹i ng­îc chiÒu (inverted repeat) (h×nh 2.10). Ngoµi c¸c IS,
ë vi khuÈn cßn cã c¸c ®o¹n DNA cã kh¶ n¨ng di chuyÓn víi kÝch th­íc dµi h¬n
(transposon: Tn). C¸c Tn th­êng ph©n bè trªn plasmid (ph©n tö DNA d¹ng vßng,
kÝch th­íc th­êng kh«ng lín) vµ cã kh¶ n¨ng ghÐp xen vµo bÊt kú vÞ trÝ nµo trong
bé gen. Chóng th­êng mang th«ng tin di truyÒn m· cho c¸c protein chèng chÞu

66
kh¸ng sinh. Gi÷a IS vµ Tn cã mèi quan hÖ vÒ tr×nh tù nucleotide. C¸c Tn th­êng
®­îc giíi h¹n ë hai ®Çu bëi mét IS nµo ®ã. Hai IS ë hai ®Çu cña mét transposon
cã thÓ cïng chiÒu nhau.
Sù di chuyÓn cña nh©n tè IS vµo c¸c gen th­êng ng¨n c¶n sù biÓu hiÖn cña
c¸c gen nµy. VÒ kÝch th­íc vµ sù hiÖn diÖn cña c¸c nh©n tè nµy cã thÓ khãa sù
biÓu hiÖn cña mét operon khi nã chÌn vµo vïng promoter (vïng ®iÒu khiÓn sù
biÓu hiÖn gen cña vi khuÈn). Chóng ta thÊy râ h¬n ë tr­êng hîp operon lac cña
E.coli (lµ operon m· hãa cho 3 protein cña chuçi chuyÓn hãa ®­êng galactose).
Ta nhí l¹i tr­êng hîp phage λ ®ãng gãi nhÇm operon gal, gäi lµ phage λdgal+
. Khi IS chÌn vµo operon gal, nã lµm cho operon nµy kh«ng ®­îc biÓu hiÖn (d¹ng
gal-) vµ khi ®­îc ®ãng gãi vµo trong phage λ, gäi lµ phage λdgal- . Hai chñng
phage λ nµy ®­îc trén lÉn víi nhau vµ ®em ly t©m b»ng gradient Xesi Clorua
(CsCl) kÕt qu¶ nh­ h×nh 2.14. H×nh 2.14 cho thÊy DNA cña phage λdgal+ nhÑ h¬n
DNA cña phage λdgal-, nguyªn nh©n lµ do operon gal ®ét biÕn cã chøa thªm mét
®o¹n DNA dµi h¬n operon gal b×nh th­êng, ®o¹n DNA thõa nµy sau ®ã ®­îc x¸c
®Þnh lµ ®o¹n chÌn IS.

H×nh 2.14. Sù kh¸c biÖt gi÷a phage λdgal b×nh th­êng víi phage λdgal ®ét biÕn

Mét sè chñng E.coli ®ét biÕn gal- ®­îc t×m thÊy cã chøa c¸c ®o¹n DNA chÌn
lín vµo trong operon gal. VËy nh÷ng ®o¹n DNA ®­îc chÌn vµo trong gen nµy ®¬n
thuÇn lµ c¸c ®o¹n DNA ngÉu nhiªn hay chóng lµ nh÷ng thùc thÓ di truyÒn kh¸c
nhau. Dùa vµo nh÷ng b»ng chøng vÒ thùc nghiÖm, c¸c nhµ khoa häc ®· chøng
minh ®­îc chóng lµ nh÷ng tr×nh tù DNA chÌn cã kh¶ n¨ng di chuyÓn. Tr×nh tù
chÌn (IS) ®Çu tiªn ®­îc t×m thÊy trong operon gal- lµ ®o¹n DNA cã chiÒu dµi
800bp, ®­îc gäi lµ IS1. TiÕp theo sau ®ã lµ IS2, IS3, IS4 ..., nh÷ng tr×nh tù chÌn
nµy cã chøc n¨ng nh­ nhau nh­ng chØ kh¸c nhau vÒ chiÒu dµi, tr×nh tù (vÝ dô IS2
cã chiÒu dµi lµ 1350bp, IS3 lµ 1400bp ...) vµ sè l­îng b¶n sao cña chóng trong bé
gen còng kh¸c nhau.

67
MÆc dï c¸c IS kh¸c nhau vÒ tr×nh tù, nh­ng chóng cã mét sè ®Æc ®iÓm chung.
VÝ dô nh­, tÊt c¶ c¸c nh©n tè IS m· hãa cho mét protein, gäi lµ transposase, lµ
enzyme cÇn thiÕt cho viÖc di chuyÓn cña nh©n tè IS tõ vÞ trÝ nµy ®Õn vÞ trÝ kh¸c
trong NST hoÆc tõ NST nµy ®Õn NST kh¸c. Thªm vµo ®ã, tÊt c¶ c¸c nh©n tè IS b¾t
®Çu vµ kÕt thóc víi c¸c tr×nh tù lÆp l¹i ng­îc chiÒu ng¾n, mµ nh÷ng tr×nh tù nµy
cÇn thiÕt cho sù di chuyÓn cña IS. Trong bé gen cña chñng E.coli hoang d¹i cã
chøa rÊt nhiÒu nh©n tè IS, vµ t¹i nh÷ng vÞ trÝ cña IS nµy lµ n¬i x¶y ra trao ®æi chÐo.
VÝ dô, sù t¸i tæ hîp gi÷a plasmid nh©n tè F víi NST cña E.coli t¹o thµnh nh÷ng
chñng Hfr ®­îc t¹o ra do sù trao ®æi chÐo gi÷a mét nh©n tè IS n»m trªn plasmid
víi mét nh©n tè IS n»m trªn NST.

H×nh 2.15. CÊu tróc vµ c¬ chÕ ho¹t ®éng cña c¸c IS vµ Transposon

ë häc phÇn vi sinh vËt, c¸c b¹n ®· häc vÒ nh©n tè R, lµ nh÷ng plasmid cã mang
c¸c gen kh¸ng l¹i mét sè kh¸ng sinh. C¸c nh©n tè R nµy (vÒ tÝnh kh¸ng thuèc)
®­îc chuyÓn mét c¸ch nhanh chãng tõ tÕ bµo nµy sang tÕ bµo kh¸c qua cÇu tiÕp
hîp, gièng nh­ nh©n tè F ë E.coli. TÝnh di chuyÓn vµ thu thËp c¸c gen kh¸ng thuèc
cña nh©n tè R ®­îc t¹o ra do c¸c Tn. ë vi khuÈn cã hai lo¹i transposon ®ã lµ:
Transposon phøc hîp vµ transposon ®¬n gi¶n. Transposon phøc hîp cã chøa c¸c
gen m· cho mét sè tÝnh tr¹ng kh¸c nhau n»m ë phÝa trong cña hai nh©n tè IS ®­îc
®Þnh h­íng ng­îc chiÒu nhau, vµ v× thÕ chóng t¹o thµnh tr×nh tù lÆp l¹i ng­îc
chiÒu nhau (inverted repeat sequence – IR). Tn kiÓu nµy cÇn cã hai IS chøc n¨ng

68
xóc t¸c cho sù di chuyÓn cña chóng, vÝ dô nh­ Tn10. Transposon ®¬n gi¶n ®­îc
¸p s¸t bëi c¸c tr×nh tù lÆp l¹i ng­îc chiÒu ng¾n (< 50bp) vµ tr×nh tù nµy kh«ng m·
hãa cho enzyme cÇn cho sù chuyÓn vÞ cña Tn. Do ®ã, nh÷ng Tn ®¬n gi¶n nµy cÇn
thªm mét gen m· hãa cho c¸c protein cÇn thiÕt cho di chuyÓn (vÝ dô nh­ Tn3 ë
h×nh 2.16).

H×nh 2.16. §Æc ®iÓm cÊu tróc vµ sao chÐp cña Tn phøc hîp vµ Tn ®¬n gi¶n

B¶ng 2.2 : CÊu tróc th­êng gÆp cña transposon (IS* kh«ng cã chøc n¨ng)

Transposon IS tr¸i (ISL) Gen chØ thÞ cña IS ph¶i


Transposon (ISL)

Tn903 IS903 kanR (kh¸ng kanamicine) IS903

Tn10 IS10L* tetR (kh¸ng tetraciline) IS10

Tn50 IS50L* kanR(kh¸ng kanamicine) IS50R


B¶ng trªn m« t¶ cÊu tróc cña mét sè transposon, c¸c transposon nµy ®Òu mang
gen m· ho¸ cho tÝnh chèng chÞu kh¸ng sinh vµ hai ®Çu ®Òu ®­îc giíi h¹n bëi tr×nh
tù nucleotide cña hai IS s¾p xÕp ng­îc chiÒu nhau. §iÒu ®¸ng l­u ý ë ®©y lµ hai
tr×nh tù ë hai ®Çu cã thÓ cã chøc n¨ng hoÆc kh«ng cã chøc n¨ng IS.
C¬ chÕ di chuyÓn cña c¸c Tn tõ vÞ trÝ nµy sang vÞ trÝ kh¸c trong NST hoÆc tõ
NST ®Õn plasmid vµ ng­îc l¹i ®­îc xóc t¸c bëi transposase. B­íc ®Çu tiªn cña sù
chuyÓn vÞ, transposase t¹o vÕt c¾t trªn tr×nh tù ®¶o ®o¹n cña DNA ®Ých (gièng nh­
sù nhËn biÕt vµ c¾t tr×nh tù lÆp l¹i ®¶o ®o¹n cña enzyme giíi h¹n) (h×nh 2.15).
Gièng nh­ sù chuyÓn vÞ cña IS ë h×nh 2.15 cho thÊy sù chuyÓn vÞ cña Tn nhê sù
xóc t¸c cña transposase b»ng c¸ch t¹o vÕt c¾t so le t¹i tr×nh tù 5bp lÆp l¹i ®¶o chiÒu
vµ chÌn Tn vµo gi÷a hai ®Çu lÆp l¹i ng­îc chiÒu nµy. Sau ®ã, c¸c ®Çu so le ®­îc
lÊp ®Çy nhê bé m¸y sao chÐp cña vËt chñ. HÇu hÕt c¸c Tn cña prokaryote (vµ ë c¶
eukaryote) ®Òu sö dông mét trong hai c¬ chÕ chuyÓn vÞ, gäi lµ c¬ chÕ chuyÓn vÞ

69
sao chÐp vµ c¬ chÕ chuyÓn vÞ b¶o tån ®­îc m« t¶ ë h×nh 2.16. ë c¬ chÕ sao chÐp
(®­îc thÊy ë Tn3), mét b¶n sao míi ®­îc t¹o ra trong khi b¶n gèc vÉn cßn ë vÞ trÝ
cò. KÕt qu¶ t¹o ra mét b¶n sao ë vÞ trÝ míi vµ mét b¶n gèc vÉn ë vÞ trÝ cò. Ng­îc
l¹i, ë c¬ chÕ b¶o tån, kh«ng cã sù sao chÐp cã nghÜa lµ khi b¶n gèc ®­îc chuyÓn
vÞ vµo vÞ trÝ míi th× ë vÞ trÝ cò kh«ng cßn nh©n tè chuyÓn vÞ n÷a. Hay nãi mét c¸ch
kh¸c, c¬ chÕ chuyÓn vÞ b¶o tån cßn gäi lµ “c¾t vµ d¸n”.
C¬ chÕ chuyÓn vÞ sao chÐp ®­îc m« t¶ chi tiÕt ë h×nh 2.17, cho thÊy viÖc
chuyÓn vÞ cña Tn3 tõ plasmid nµy ®Õn plasmid kh¸c th«ng qua mét b­íc trung
gian. B­íc chuyÓn vÞ trung gian nµy cã chøa mét vßng plasmid kÐp (vßng hîp
nhÊt cña plasmid cho vµ plasmid nhËn). Sù h×nh thµnh d¹ng trung gian nµy ®­îc
xóc t¸c bëi transposase ®­îc m· hãa bëi Tn3 , mµ nã t¹o ra c¸c vÕt c¾t sîi ®¬n t¹i
hai ®Çu cña Tn3 vµ c¸c vÕt c¾t so le ë tr×nh tù ®Ých (h×nh 2.17) vµ nèi hai ®Çu tù do
víi nhau ®Ó h×nh thµnh nªn mét vßng hîp nhÊt. Transposon ®­îc sao chÐp trong
suèt qu¸ tr×nh hîp nhÊt. Vßng hîp nhÊt sau ®ã ®­îc c¾t thµnh hai vßng nhá h¬n,
mçi vßng cã chøa mét Tn3. KÕt qu¶ mét b¶n sao cña Tn3 vÉn n»m ë vÞ trÝ ban
®Çu, trong khi b¶n sao kia ®­îc chuyÓn ®Õn vÞ trÝ míi trong bé gen.

H×nh 2.17. Sù chuyÓn vÞ theo c¬ chÕ sao chÐp cña Tn3 th«ng qua b­íc trung giang hîp nhÊt
hai vßng lµm mét

Mét sè transposon nh­ lµ Tn10 di chuyÓn trong NST theo c¬ chÕ chuyÓn vÞ
b¶o tån. Trong tr­êng hîp nµy, sù sao chÐp DNA cña nh©n tè chuyÓn vÞ kh«ng
x¶y ra, vµ c¸c nh©n tè chuyÓn vÞ nµy khi chuyÓn vÞ bÞ lo¹i bá khái vÞ trÝ ban ®Çu
(h×nh 2.16). Gièng nh­ chuyÓn vÞ sao chÐp, ph¶n øng nµy còng ®­îc xóc t¸c bëi
transposase cña chÝnh nh÷ng transposon nµy m· hãa. Tuy nhiªn, kh¸c víi chuyÓn
vÞ sao chÐp, c¸c transposase nµy c¾t transposon ra khái vÞ trÝ cho. Sau ®ã, enzyme
nµy t¹o c¸c vÕt c¾t so le ë vÞ trÝ gen ®Ých vµ chÌn nh©n tè chuyÓn vÞ vµo trong gen
®Ých.

So sánh về cấu trúc các yếu tố chuyển vị của prokaryote

70
ITR Transposase ITR
+ Yếu tố IS
~0,3k

+ Composite transposon
IS Gen tổng hợp IS
2,5~10 kb

Resolvase
+ Transposon dạng Tn3
Transposase
Gen kháng kháng

~5 kb
ITR ITR

+ Transposable phage Gen tổ hợp Gen Gen protein


và tái bản
~38 kb

ITR ITR
Enzyme resolvase là enzyme xúc tác cho quá trình tái tổ hợp đặc thù vị trí
giữa 2 transposon tồn tại trình tự lặp lại trực tiếp trong cấu trúc đồng kết gắn.

+ Yếu tố vận động hỗn hợp (Transposon Tn - Composite transposon): Yếu


tố này về cơ bản chính là một đoạn DNA có gắn đoạn IS ở hai đầu và mang một
hoặc vài gen thường mã hoá cho khả năng kháng lại kháng sinh. Sự chuyển vị của
composite transposon được hoạt hoá bởi enzyme transposase mã hoá bởi 1 hoặc
cả hai đoạn IS ở hai đầu. Yếu tố thuộc nhóm này chuyển vị theo cơ chế bảo thủ.

+ IS (insertion sequence) hay các trình tự đoạn gắn xen: Các IS là những
đơn vị độc lập, chúng chỉ mã hoá cho một hoặc hai gen mã hoá cho enzyme
transposase cần thiết cho sự chuyển vị của chúng. Ở E. coli, người ta tìm thấy
khoảng 20 yếu tố IS với các dạng khác nhau. Điển hình là yếu tố IS1, IS2 và
IS10R. IS1 có chiều dài 786bp với 4 -9 bản sao trên nhiễm sắc thể của E.coli.

71
IS
5’ 5’
ACAGTTC CTGAACT
3’ IR IR 3’
chèn
vị trí mục tiêu
cắt
5’ TCGAT
5’
DNA nhiễm sắc thể
AGCTA
3’ 3’
cắt
IS chèn
5’ 5’
TCGA ACAGTTCA CTGAACTGT AGCTA
G GACTACACA 3’
3’
TGTCAAGTC
IR IR

DNA polymerase và DNA ligase


sửa chữa khoảng trống

TCGAT ACAGTTCAG CTGAACTGT TCGAT 5’


5’ AGCTA GACTACACA
TGTCAÂGTC AGCTA

3’
Chuỗi nucleotide lặp lại trực tiếp
(direct repeat) ở vị trí IS được chèn vào

Hình 4 - 13. Sơ đồ quá trình tổ hợp của nguyên tố IS vào DNA


nhiễm sắc thể

2.1.2. Transposon trong bé gen eukaryote


MÆc dï c¸c nh©n tè chuyÓn vÞ ®­îc ph¸t hiÖn ®Çu tiªn ë b¾p, nh­ng nh©n tè
chuyÓn vÞ ®Çu tiªn ®­îc ph©n lËp vÒ mÆt ph©n tö lµ nh÷ng gen bÞ ®ét biÕn ë nÊm
men vµ ruåi giÊm. Transposon cña eukaryote ®­îc chia lµm hai líp: líp 1 lµ nh÷ng
retrotransposon vµ líp 2 lµ nh÷ng transposon DNA. Líp ®Çu tiªn ®­îc ph©n lËp,
lµ retrotransposon, kh«ng gièng nh­ tÊt c¶ nh÷ng IS vµ c¸c transposon cña
prokaryote.
• Líp 1: c¸c retrotransposon
Các retrovirus nội sinh: (Endogenous retrovirus, ERVs) là genome của retrovirus
khi được tổ hợp vào nhiễm sắc thể của tế bào ký chủ, chủ yếu là động vật có
xương sống. Một số trong chúng vần còn hoạt tính, thậm chí ở một giai đoạn phát
triển nào đó của tế bào, chúng có thể tổng hợp nên các virus nội sinh. Tuy nhiên,
điều này hầu như không xảy ra. Các trình tự này hầu như không còn hoạt động và

72
được tìm thấy ở nhiều vị trí trong genome. Trong genome của người, những trình
tự như vậy có khoảng 1000 bản sao. Phổ biến hơn là những phiên bản được rút
ngắn của chúng hay gọi là các yếu tố giống retroviruss (retrovirus-like
eleenzymet), được gọi tắt la RTVLs và có khoảng 20.000 bản trong genome của
người.

a b
H×nh 2.18. (a) So s¸nh cÊu tróc bé gen cña retrovirus víi cÊu tróc cña c¸c retrotransposon
®­îc t×m thÊy trong bé gen cña eukaryote. (b) C¬ chÕ chuyÓn vÞ cña retrotransposon

Phßng thÝ nghiÖm cña Gerry Fink ®· sö dông nÊm men nh­ lµ sinh vËt m«
h×nh ®Ó nghiªn cøu sù ®iÒu hßa gen cña eukaryote. Qua nhiÒu n¨m, G. Fink vµ
céng sù ®· ph©n lËp hµng ngµn ®ét kiÓu ®ét biÕn cña gen HIS4, lµ mét gen m· hãa
cho enzyme thuéc con ®­êng tæng hîp amino acid histidine.
Hä ®· ph©n lËp ®­îc h¬n 1500 ®ét biÕn ph¸t sinh cña gen HIS4 vµ cã hai
trong sè nh÷ng ®ét biÕn nµy cã kiÓu h×nh ®ét biÕn kh«ng æn ®Þnh. Nh÷ng ®ét biÕn
kh«ng æn ®Þnh nµy cã tÇn sè ®¶o ng­îc (phôc håi l¹i d¹ng his+, lµ d¹ng cã kh¶
n¨ng tæng hîp ®­îc histidine) cao gÊp 1000 lÇn so víi c¸c ®ét biÕn HIS4 kh¸c.
Gièng nh­ nh÷ng ®ét biÕn gal- cña E.coli, nh÷ng ®ét biÕn nµy cña nÊm men ®­îc
t×m thÊy cã chøa mét ®o¹n chÌn DNA lín ë trong gen HIS4. Nh÷ng ®o¹n chÌn
nµy cã ®Æc ®iÓm gièng nhau ®­îc gäi lµ nh©n tè Ty (nh©n tè chuyÓn vÞ cña nÊm
men) ë nÊm men. Chóng cã kho¶ng 35 b¶n sao cña nh©n tè chÌn, ®­îc gäi lµ Ty1,
trong bé gen cña nÊm men.
B»ng nh÷ng nghiªn cøu thùc nghiÖm, G. Fink vµ céng sù nhËn thÊy cÊu tróc
cña c¸c retrotransposon t­¬ng tù víi cÊu tróc gen cña retrovirus (h×nh 2.18a), chØ
cã mét ®iÓm kh¸c biÖt lµ retrotransposon kh«ng cã gen env, lµ gen gióp cho
retrovirus rêi khái tÕ bµo cò vµ x©m nhiÔm vµo tÕ bµo míi. V× thÕ, retrotransposon

73
khi chuyÓn vÞ nhê d¹ng RNA trung gian phiªn m· ng­îc t¹o l¹i DNA kÐp vµ chÌn
vµo NST cña cïng mét tÕ bµo, c¸c b­íc thùc hiÖn ®­îc s¬ ®å hãa ë h×nh 2.18b.
- Retrotransposon
Là các đoạn có trình tự tương tự như các ERV tuy nhiên chúng được tìm
thấy chủ yếu trong các eukaryote như thực vật, nấm và động vật không xương
sống. Các retrotransposon thường có số lượng bản sao lớn và tồn tại ở nhiều dạng
khác nhau. Ví dụ ở ngô, hầu hết các trình tự lặp lại phân bố rộng trong genome là
các retrotransposon và các yếu tố này chiếm đến gần một nửa genome. Nhóm này
được chia thành hai nhóm phụ là :
+ Nhóm Ty3/gypsy (Ty3 đặc trưng ở nấm men và gypsy đặc trưng ở ruồi
giấm. Nhóm này cũng chứa một nhóm các gen giống như ERV.
+ Nhóm Ty1/copia. Nhóm này thiếu gen env mã hoá protein vỏ của retrovirus. Sự
vắng mặt của gen env làm cho chúng không thể hình thành các thể giống với virus
ban đầu được ví dụ như:
Các retroeleenzymet
Các yếu tố lặp lại tận cùng dài (LTRs, long terminal repeats): là những vùng
chứa vài trăm cặp bazơ lặp lại, nằm ở đầu các phân tử DNA của retrovirus. LTRs
có thể có chức năng làm cơ sở để nhiều gen của sinh vật nhân chuẩn biểu hiện, ví
dụ có chức năng kích hoạt, khởi đầu và nhập poly A vào các mRNA Các dạng
yếu tố là LTR, LT và poly, chúng đều đóng vai trò quan trọng trong quá trính di
chuyển vị trí của chúng trong genome. Kích thước phân tử của các LTR từ dưới
vài trăm đến 10 kb.
- Các yếu tố khác không chứa LTR được gọi là retroposon và chúng đặc trưng ở
động vật có vú. Nhóm này bao gồm: LINEs và SINEs.
+ Các yếu tố chèn, xen dài (LINEs -long interspersed nuclear eleenzymets):
Các yếu tố LINE có chứa gen mã hoá cho gag protein và enzyme polymerase có
chức năng giống như enzyme phiên mã ngược. Gen mã hoá cho endonuclease env
cũng được mã hoá bởi yếu tố này và enzyme này có nhiệm vụ thúc đẩy sự tổ hợp
của các yếu tố chuyển vị ‘retro” vào gen. Sự xen đoạn của LINE được lặp đi lặp
lại bởi quá trình tái bản trực tiếp và gắn của DNA mục tiêu. Hình 4 - 10 mô tả yếu
tố LINE1 của người có chiều dài 6,1 kb và có 3.500 bản sao với độ dài nguyên
vẹn. Với các trình tự được rút ngắn hơn thì có tới hàng trăm nghìn bản sao của
LINE1 trong tế bào của người.
+ Các yếu tố chèn, xen ngắn (SINEs - short interspersed nuclear
eleenzymets): Yếu tố này không có gen mã hoá tạo enzyme phiên mã ngược
nhưng vẫn có khả năng chuyển vị. Có thể chúng di chuyển bằng cách “mượn”
enzyme phiên mã ngược được tổng hợp bởi một retrotransposon khác.
SINE có độ lớn từ 100 đến 300 bp. SINE rất phổ biến ở động vật. Ví dụ như chuỗi
Alu ở người có mặt tới hàng triệu bản sao. Alu có thể có nguồn gốc từ các gen mã
hoá cho 7SL RNA có vai trò điều khiển sự di chuyển của protein xung quanh tế

74
bào. Yếu tố Alu có thể được tạo ra ban đầu bởi quá trình phiên mã ngược ngẫu
nhiên của 7SL RNA sau đó DNA tạo ra tái tổ hợp vào genome của người. Do Alu
được phiên mã một cách chủ động nên thường xuất hiện một lượng lớn Alu RNA
trong tế bào, tạo ra khả năng lớn để khuyếch đại yếu tố này. Trong thực vật SINE
tương đối hiếm.

• Líp 2: nh÷ng transposon DNA


Một số yếu tố chuyển vị có khả năng di chuyển một cách trực tiếp hơn mà không
cần qua trung gian RNA. Chúng di chuyển bằng cách cắt và tổ hợp trực tiếp cấc
đoạn DNA. Có hai cơ chế giải thích cho sự chuyển vị của các yếu tố này, đó là:
+Sự di chuyển có tính tự tái bản (replicative transposition): Phiên bản của
các yếu tố chuyển vị được sao chép từ vị trí ban đầu và tái tổ hợp vào vị trí mới
mục tiêu. Sau mỗi lần di chuyển thì số lượng bản sao được tăng lên.
+ Sự di chuyển có tính bảo thủ (conservative transposition) các yếu tố chuyển vị
có thể tách ra khỏi vị trí ban đầu và sau đó là tái tổ hợp lại ở một vị trí mới. Trong
trường hợp này, số lượng của các transposon là không thay đổi.

Vị trí cho Vị trí nhận

Cơ chế tự tái bản, số lượng


transposon tăng lên sau mỗi lần
sao chép
Cơ chế bảo tồn, số
Vị trí cho Vị trí nhận
lượng transposon
không tăng lên

Vị trí cho Vị trí nhận


Hình 4 - 11. Cơ chế chuyển vị các DNA transposon

d. Cấu trúc Ac và Ds ở ngô

Ac là yếu tố di động. Ac có độ dài 4563 bp, được giới hạn hai đầu bởi hai IR có
chiều dài 11 bp, trình tự ngược chiều nhau. Yếu tố Ac mã hoá cho một mRNA có
độ dài 3.5 kb, có một đầu 5’ UTR 650 bazơ (UTR – vùng không dịch mã-
untranslated region) và một khung đọc mở dịch mã tạo một protein có 807 amino
acid, enzyme transposase, là enzyme xúc tác cho quá trình gắn xen của các
transposon. Đoạn Ac có chứa 4 intron (a,b,c,d) và chia trình tự đó thành 5 exon.

75
Ac a b c d
4563bp
1 2 3 4 5
11bp 11bp

Ds: là yếu tố nhảy có nguồn gốc từ Ac bị đột biến mất đoạn, có trình tự hai đầu là
IR giống hệt Ac. Hầu hết các Ds đều có tính tương đồng với Ac nhưng thường
ngắn hơn, doAcđột biến mất đoạn. Hiện đã phát hiện thấy một số loaị Ds ở ngô.
4563bp

11bp 11bp

Mét sè nh©n tè chuyÓn vÞ (gen nh¶y) ®­îc t×m thÊy ë eukaryote cã ch¬ chÕ
chuyÓn vÞ t­¬ng tù nh­ nh÷ng nh©n tè chuyÓn vÞ ë vi khuÈn. Nh­ chóng ta thÊy ë
h×nh 2.15 vµ 2.16 c¸c IS vµ transposon ®­îc chÌn vµo vÞ trÝ míi trong bé gen lµ
b¶n th©n nh©n tè ®ã hoÆc b¶n sao cña nã. C¸c nh©n tè mµ sù chuyÓn vÞ cña nã cÇn
sù xóc t¸c cña transposase ®­îc gäi lµ c¸c nh©n tè líp 2 hoÆc c¸c transposon DNA.
Chóng ta ®· biÕt r»ng nh©n tè chuyÓn vÞ ®­îc McClintock t×m thÊy ®Çu tiªn ë b¾p
vµ hiÖn nay ®­îc biÕt nh­ nh÷ng transposon DNA.
Transposon DNA cña eukaryote ®­îc nghiªn cøu kh¸ chi tiÕt ®èi víi b¾p vµ
ruåi giÊm. ë b¾p, hai transposon Ac vµ Ds ®­îc xem lµ vÝ dô kinh ®iÓn vÒ
transposon. Chóng cïng thuéc vµo mét nhãm transposon DNA, ®Òu cã hai tr×nh
tù lÆp l¹i ng­îc chiÒu gièng nhau. Di chuyÓn cña c¸c Ac gåm 4563bp (5 exon),
®­îc giíi h¹n hai ®Çu bëi 11bp lÆp l¹i ng­îc chiÒu. Mäi Ds ®Òu cã ®o¹n lÆp l¹i
ng­îc chiÒu gièng nhau mÆc dï chiÒu dµi chóng cã thay ®æi. Gièng nh­ c¸c Tn
cña vi khuÈn, Ac cã c¸c ®Çu lÆp l¹i ng­îc chiÒu vµ m· hãa cho protein transposase,
gióp cho sù chuyÓn chç cña Ac. Nh­ng khi nghiªn cøu cÊu tróc cña Ds, c¸c nhµ
khoa häc thÊy nã thiÕu h¼n ®o¹n tr×nh tù DNA m· hãa cho transposase, do ®ã nã
kh«ng thÓ tù di chuyÓn ®­îc. V× vËy khi Ac cã trong bé gen, transposase cña nã
cã thÓ liªn kÕt víi c¶ Ac hoÆc Ds vµ ®iÒu khiÓn sù chuyÓn vÞ cña chóng.
Sù t­¬ng t¸c gi÷a Ac, Ds víi gen C ®­îc sö dông nh­ lµ mét vÝ dô vÒ
transposon (h×nh 2.19). ë ®©y Ds, ®­îc coi nh­ lµ mét m¶nh DNA, lµm bÊt ho¹t
gen C (allele nµy ®­îc gäi lµ c-bÞ ®ét biÕn bëi (Ds) hoÆc kÝ hiÖu lµ c-m(Ds)) b»ng
c¸ch chÌn vµo vïng m· hãa cña gen C. Mét chñng cã chøa ®ét biÕn c-m(Ds) vµ
kh«ng cã nh©n tè Ac cã kiÓu h×nh kh«ng mµu v× nh©n tè Ds kh«ng thÓ chuyÓn vÞ
®­îc; cã nghÜa lµ nã kh«ng thÓ tù rêi khái gen C. Chñng cã chøa ®ét biÕn c-m(Ds)

76
vµ cã nh©n tè Ac cã kiÓu h×nh lµ nh÷ng ®èm mµu v× ë mét sè tÕ bµo Ac ho¹t hãa
Ds lµm cho Ds nh¶y ra khái gen C, do ®ã gen C phôc håi l¹i chøc n¨ng ban ®Çu.
Mét sè chñng kh¸c ®­îc ph©n lËp mµ cã nh©n tè Ac chÌn vµo gen C g©y ra
®ét biÕn c-m(Ac). Kh«ng gièng nh­ ®ét biÕn c-m(Ds), chØ kh«ng æn ®Þnh khi trong
bé gen cã nh©n tè Ac, ®ét biÕn c-m(Ac) lu«n kh«ng æn ®Þnh. H¬n thÕ n÷a,
McClintock ®· t×m thÊy nh÷ng tr­êng hîp hiÕm gÆp cña c¸c allele cña Ac cã thÓ
®­îc chuyÓn thµnh kiÓu allele Ds. Sù chuyÓn ®æi nµy lµ do mét ®ét biÕn tù ph¸t
t¹o ra nh©n tè Ds tõ nh©n tè chÌn Ac. Nãi c¸ch kh¸c, ë hÇu hÕt c¸c tr­êng hîp, Ds
lµ mét phiªn b¶n kh«ng hoµn chØnh cña nh©n tè Ac.
C¸c transposon ë b¾p th­êng ghÐp vµo gÇn c¸c gen, lµm rèi lo¹n ho¹t ®éng
cña chóng dÉn ®Õn xuÊt hiÖn tÝnh tr¹ng míi nh­ng kh«ng g©y ®ét biÕn chÕt. Sù di
chuyÓn cña transposon ghÐp vµo vÞ trÝ cña mét allele cña mét gen bÊt kú trªn nhiÔm
s¾c thÓ x¶y ra ë tÕ bµo soma sÏ t¸c ®éng ®Õn sù biÓu hiÖn cña allele ®ã trong qu¸
tr×nh ph¸t triÓn cña c©y. Tr¶i qua ph©n bµo nguyªn nhiÔm, con ch¸u cña tÕ bµo
chøa allele ®ét biÕn ®ã sÏ cã biÓu hiÖn tÝnh tr¹ng míi (th­êng quan s¸t ®­îc ë h×nh
d¹ng, mµu s¾c cña h¹t ng«). Thay ®æi nµy x¶y ra trong qu¸ tr×nh ph¸t triÓn soma
®­îc gäi lµ "variegation" hay cßn gäi lµ hiÖn t­îng mosaic (xuÊt hiÖn c¸c ®èm)
(h×nh 2.19).

H×nh 2.19: BiÓu hiÖn cña b¾p khi c¸c transposon g¾n vµo DNA

Các yếu tố Ds không có đoạn ORF đầy đủ, nên không tạo được enzyme
transposase, vì thế không tự di chuyển được. Ds có thể di chuyển được nếu Ac

77
cùng có mặt trong genome vì Ac sinh ra enzyme transposase giúp dịch chuyển
các yếu tố Ds.

Ac 4563bp

11bp 11bp

Ds9 4369bp
∇ 194 bp

11bp 11bp

Ds 2042bp
∇ 2521 bp

11bp 11bp
Hình 4 - 12. So sánh cấu trúc yếu tố Ac với Ds ở ngô do mất
đoạn

ë ruåi giÊm Drosophila melanogaster, transposon P cã kh¶ n¨ng di chuyÓn


®­îc ph¸t hiÖn khi tiÕn hµnh lai gi÷a con ®ùc dßng P víi con c¸i dßng M. HÇu hÕt
con lai F1 bÞ bÊt dôc, nhiÔm s¾c thÓ bÞ ®øt g·y, ®ét biÕn. HiÖn t­îng rèi lo¹n di
truyÒn nµy chØ x¶y ra theo mét chiÒu, tøc lµ phÐp lai gi÷a con c¸i dßng P víi con
®ùc dßng M vÉn t¹o ra c¸c con lai b×nh th­êng. Nguyªn nh©n cña hiÖn t­îng nµy
lµ do bé gen cña c¸c c¸ thÓ dßng P cã chøa transposon P. C¬ chÕ kiÓm so¸t sù di
chuyÓn cña P phô thuéc vµo yÕu tè tån t¹i trong tÕ bµo chÊt cña trøng (di truyÒn
theo mÑ). Khi yÕu tè nµy cã mÆt th× nã k×m h·m sù di chuyÓn cña P, do ®ã tÕ bµo
trøng cña con c¸i dßng P thô tinh víi con ®ùc dßng M vÉn cho con lai b×nh th­êng.
Khi cho trøng cña dßng M thô tinh víi con ®ùc dßng P, cho phÐp P di chuyÓn g©y
ra nh÷ng rèi lo¹n bÊt th­êng trong cÊu tróc cña bé gen, ®iÒu nµy khiÕn cho con lai
bÞ bÊt dôc hoÆc cã c¸c tÝnh tr¹ng l¹.
Quan s¸t quÇn thÓ ruåi giÊm trong thiªn nhiªn cho thÊy sè l­îng P thay ®æi
tõ vµi b¶n sao ®Õn 50 b¶n sao/bé gen. H¬n n÷a, nh÷ng loµi ruåi giÊm ®­îc ph¸t
hiÖn tr­íc n¨m 1950 ®Òu kh«ng cã P trong bé gen. Ph¶i ch¨ng m·i ®Õn nh÷ng n¨m
cuèi thÕ kû XX, P míi xuÊt hiÖn trong bé gen ruåi? VËy sù cã mÆt cña chóng cã
ph¶i lµ do virus x©m nhiÔm ruåi giÊm g©y nªn? HiÖn t­îng t­¬ng tù còng ®­îc
quan s¸t thÊy ë vi khuÈn bÞ nhiÔm bacteriophage mang IS. YÕu tè IS xuÊt hiÖn
trong bé gen vi khuÈn th«ng qua qu¸ tr×nh tiÕp hîp (transduction).
2.1.3. T-DNA di chuyÓn tõ bé gen prokaryote ®Õn bé gen eukaryote

78
HiÖn t­îng transposon di chuyÓn tõ bé gen prokaryote sang bé gen eukaryote
®­îc nghiªn cøu chi tiÕt ®èi víi tr­êng hîp T-DNA di chuyÓn tõ Agrobacterium
sang thùc vËt hai l¸ mÇm. C¸c gen cña vi khuÈn cã kh¶ n¨ng di chuyÓn vµ ho¹t
®éng trong tÕ bµo thùc vËt n»m trªn plasmid Ti (tumor inducing) cña A.
tumefaciens g©y bÖnh nèt sÇn. C¸c biÓu hiÖn bÖnh cña c©y g©y ra do ho¹t ®éng
cña mét sè gen vi khuÈn ®· ®­îc chuyÓn vµo bé gen c©y chñ. Còng gièng nh­ c¸c
khèi u ë ®éng vËt, c¸c tÕ bµo thùc vËt cã DNA vi khuÈn ghÐp vµo bé gen bÞ chuyÓn
sang tr¹ng th¸i míi, ë ®ã sù ph¸t triÓn vµ biÖt ho¸ chóng hoµn toµn kh¸c víi c¸c
tÕ bµo b×nh th­êng.
T-DNA lµ mét ®o¹n DNA cã chiÒu dµi kho¶ng 23kb (tuú thuéc vµo tõng lo¹i
A. tumefaciens) n»m trªn plasmid Ti. Hai ®Çu cña ®o¹n DNA nµy cã chøa 25bp
lÆp ®i lÆp l¹i gièng nhau hoµn toµn chØ sai kh¸c nhau ë hai nucleotide. C¸c
nucleotide ®Çu bªn ph¶i gi÷ vai trß quan träng trong viÖc c¾t T-DNA. C¸c
nucleotide ®Çu bªn tr¸i ®ãng vai trß trong viÖc ghÐp T-DNA vµo bé gen c©y chñ.
T-DNA gåm hai nhãm gen. Nhãm thø nhÊt gåm c¸c oncogen m· cho c¸c
enzyme tham gia vµo ph¶n øng tæng hîp c¸c hormon sinh tr­ëng auxin vµ
cytokinin. ChØ khi T-DNA ®­îc ghÐp vµo bé gen thùc vËt, c¸c oncogen n»m trªn
T-DNA míi ho¹t ®éng. Do ®ã tÕ bµo c©y chñ nµo cã T-DNA ghÐp vµo bé gen lËp
tøc ph¸t triÓn kh«ng b×nh th­êng do rèi lo¹n hormon sinh tr­ëng mµ T-DNA m·
cho. T¹i vÞ trÝ c©y nhiÔm A. tumerfacien xuÊt hiÖn c¸c nèt sÇn lµ tËp hîp cña c¸c
tÕ bµo b×nh th­êng vµ tÕ bµo cã bé gen bÞ biÕn ®æi.
Nhãm gen thø hai cã mÆt trªn ®o¹n T-DNA gåm c¸c gen m· ho¸ cho c¸c
enzyme tham gia tæng hîp nh÷ng phøc chÊt dinh d­ìng cÇn thiÕt cho sinh tr­ëng
vµ ph¸t triÓn cña vi khuÈn. Chóng ®­îc gäi chung lµ opines. Vi khuÈn sö dông
opines nh­ nguån carbon vµ nit¬. §Æc biÖt, khi T-DNA mang gen m· cho mét lo¹i
opine nµo ®ã th× ngay trªn plasmid Ti, n»m ë ngoµi ®o¹n T-DNA, cã c¸c gen kh¸c
tham gia qu¸ tr×nh chuyÓn ho¸ lo¹i opine nµy, gióp cho vi khuÈn sinh tr­ëng vµ
ph¸t triÓn. §iÒu ®¸ng l­u ý lµ opine ®­îc tæng hîp l¹i trë thµnh tÝn hiÖu kÝch thÝch
ho¹t ®éng cña operon chøa c¸c gen ®ång ho¸ opine ®ã n»m trªn plasmid Ti. V×
opine lµ protein ®­îc m· ho¸ bëi c¸c gen vi khuÈn, sù cã mÆt cña chóng trong tÕ
bµo thùc vËt ®­îc xem lµ chØ thÞ ®Ó ph¸t hiÖn sù chuyÓn ghÐp thµnh c«ng cña T-
DNA vµo hÖ gen thùc vËt.
Argobacterium cã kh¶ n¨ng ®­a c¸c gen l¹ vµo bé gen thùc vËt. V× vËy, chóng
®­îc sö dông nh­ c¸c vector chuyªn chë gen mét khi c¸c gen g©y nèt sÇn trªn T-
DNA bÞ thay thÕ bëi gen nghiªn cøu. Ngoµi ra, promoter cña c¸c gen trªn T-DNA

79
®Òu lµ nh÷ng promoter ho¹t ®éng m¹nh trªn c¸c tÕ bµo nhËn. V× vËy chóng ®­îc
sö dông lµm promoter b¸o c¸o, hoÆc promoter ®iÒu khiÓn gen l¹ trong kü thuËt
chuyÓn gen. Kü thuËt nµy ®­îc øng dông rÊt réng r·i trong n«ng nghiÖp. VÝ dô,
®­a c¸c gen chèng chÞu s©u bÖnh, gen chÞu ®­îc m«i tr­êng trång trät kh¾c nghiÖt
... vµo c¸c c©y trång quý hiÕm hoÆc cho n¨ng suÊt cao.
2.2. C¸c ®ét biÕn ®iÓm vµ c¬ chÕ söa ch÷a
2.2.1. §ét biÕn gen hay ®ét biÕn ®iÓm
§ét biÕn ®iÓm lµ nh÷ng biÕn ®æi rÊt nhá trªn DNA, th­êng liªn quan ®Õn sù
biÕn ®æi cña mét nucleotide hoÆc mét cÆp nucleotide hoÆc cña mét sè l­îng rÊt
nhá c¸c cÆp base liÒn kÒ nhau – mµ khi nh×n trªn b¶n ®å gen nh÷ng thay ®æi nµy
nh­ mét “®iÓm” bªn trong gen. §ét biÕn ®iÓm ®­îc chia lµm hai lo¹i ®ã lµ ®ét
biÕn thay thÕ vµ ®ét biÕn chÌn thªm hoÆc xãa bá base. C¸c ®ét biÕn thay thÕ ®­îc
ph©n lµm hai lo¹i: ®ét biÕn ®ång chuyÓn vµ ®¶o chuyÓn. §ét biÕn ®ång chuyÓn lµ
sù thay thÕ mét pyrimidine nµy b»ng mét pyrimidine kh¸c (vÝ dô C thµnh T hoÆc
T chuyÓn thµnh C) hoÆc purine nµy b»ng purine kh¸c (A thµnh G hoÆc G thµnh
A). §ét biÕn ®¶o chuyÓn ng­îc h¼n so víi ®ång chuyÓn, cã nghÜa lµ ®ét biÕn nµy
lµ sù thay thÕ cña mét purine b»ng mét pyrimidine vµ ng­îc l¹i (vÝ dô A chuyÓn
thµnh C hoÆc ng­îc l¹i C thµnh A, ...). §Ó m« t¶ ®ét biÕn ®­îc râ rµng, chóng ta
ph¶i m« t¶ sù hiÖn diÖn cña c¶ cÆp base trªn hai sîi DNA víi c¸c vÞ trÝ t­¬ng øng
cña chóng. Do ®ã, mét vÝ dô vÒ ®ång chuyÓn cã thÓ ®­îc viÕt nh­ sau: G.C A.T,
®¶o chuyÓn: G.C  T.A.
§ét biÕn thªm hoÆc xãa base thùc sù lµ nh÷ng ®ét biÕn thªm hoÆc xãa bá c¸c
cÆp nucleotide, ngoµi ra chóng cßn ®­îc gäi lµ ®ét biÕn chÌn-xãa. D¹ng ®¬n gi¶n
nhÊt cña lo¹i ®ét biÕn nµy lµ chÌn thªm hoÆc xãa bá mét cÆp nucleotide. HËu qu¶
ph©n tö cña nh÷ng ®ét biÕn ®iÓm vÒ cÊu tróc vµ sù biÓu hiÖn gen ®­îc ph©n lµm
bèn lo¹i nh­ sau:
• §ét biÕn ®ång nghÜa (same sense) cßn gäi lµ ®ét biÕn trung tÝnh (neutral)
hay im lÆng (silent), khi mét codon m· ho¸ cho mét amino acid bÞ biÕn ®æi th­êng
ë base thø ba nªn vÉn m· ho¸ cho mét amino acid ®ã (do tÝnh tho¸i ho¸ cña m· di
truyÒn).

80
H×nh 2.20. C¸c lo¹i ®ét biÕn ®iÓm

• §ét biÕn v« nghÜa (non-sense) khi codon m· ho¸ cho mét amino acid biÕn
thµnh mét trong ba codon UAA, UAG vµ UGA lµ c¸c codon kÕt thóc kh«ng m·
ho¸ cho amino acid nµo.
• §ét biÕn sai nghÜa (mis-sense) khi codon cña amino acid nµy biÕn thµnh
codon m· ho¸ cho amino acid kh¸c, lµm thay ®æi amino acid t­¬ng øng trªn ph©n
tö protein.
• §ét biÕn lÖch khung: sù thªm mét base hay lµm mÊt mét base dÉn ®Õn c¸c
codon sai nghÜa hay v« nghÜa so víi codon t­¬ng øng ban ®Çu tõ ®iÓm biÕn ®æi vÒ
sau, sù dÞch m· bÞ lÖch khung cã tÝnh d©y chuyÒn tõ bé ba bÞ sai.
Ngoµi ra, ®ét biÕn ®iÓm cßn x¶y ra ë vïng kh«ng m· hãa cña gen, lµ vïng
®iÒu hßa cña gen vµ c¸c tr×nh tù kh«ng m· hãa kh¸c (h×nh 2.20). PhÇn nµy cña
gen kh«ng trùc tiÕp m· hãa cho mét protein nµo, nh­ng nã l¹i cã tÝnh quyÕt ®Þnh
cho sù biÓu hiÖn cña gen. V× nh÷ng tr×nh tù nµy chøa c¸c vÞ trÝ liªn kÕt víi RNA
polymerase vµ c¸c nh©n tè ®iÒu hßa sù biÓu hiÖn gen.

81
2.2.2. C¸c sai háng trong sao chÐp
Chóng ta biÕt c¸c sai háng trªn ph©n tö DNA cã thÓ x¶y ra c¸c biÕn ®æi, ®a
sè c¸c biÕn ®æi ®­îc söa sai. Tuy nhiªn, trªn ph©n tö DNA vÉn cã c¸c ®ét biÕn x¶y
ra. C¸c ®ét biÕn cã thÓ x¶y ra do sai lÇm khi sao chÐp DNA.
Mçi base tån t¹i ë hai d¹ng cÊu tróc tautomer. VÝ dô b×nh th­êng mang nhãm
NH 2 cung cÊp nguyªn tö H cho sù b¾t cÆp bæ sung víi d¹ng keto (C=O) cña
thymine. Khi cã biÕn ®æi tautomer, adenine chuyÓn sang cÊu tróc d¹ng hiÕm lµ
d¹ng imino NH sÏ b¾t cÆp bæ sung víi cytosine. Thymine cã thÓ chuyÓn sang d¹ng
enol (COH) kh«ng cã trong DNA b×nh th­êng vµ b¾t cÆp víi Guanidine. Kh¶ n¨ng
b¾t cÆp sai cña base víi d¹ng tautomer kh«ng ®óng ®· ®­îc Watson vµ Crick nªu
lªn khi x©y dùng m« h×nh chuçi xo¾n kÐp. Sù b¾t cÆp sai nµy cã thÓ lµ c¸c ®ét
biÕn ®ång chuyÓn, trong ®ã purine thay b»ng purine kh¸c vµ pyrimidine thay b»ng
pyrimidine kh¸c. MÆc dï, c¸c DNA polymerase III víi ho¹t tÝnh söa sai cã kh¶
n¨ng nhËn biÕt nh÷ng chç b¾t cÆp sai vµ c¾t bá, lµm gi¶m ®¸ng kÓ c¸c sai háng
nh­ng vÉn kh«ng hÕt.
C¸c sai háng trªn cã thÓ dÉn ®Õn hai kiÓu biÕn ®æi ®ång chuyÓn (T thay cho
C vµ ng­îc l¹i hoÆc A thay cho G vµ ng­îc l¹i) hay ®¶o chuyÓn (T hay C thay
cho A hay G vµ ng­îc l¹i).
C¸c biÕn ®æi trªn, ngoµi viÖc thay thÕ c¸c nucleotide trªn m¹ch DNA cßn cã
thÓ lµm t¨ng hay khuyÕt c¸c nucleotide kh¸c g©y nªn c¸c kiÓu ®ét biÕn cã ¶nh
h­ëng ®Õn sinh tæng hîp protein.
2.2.3. Sai háng ngÉu nhiªn
Ngoµi c¸c sai háng trong sao chÐp, ph©n tö DNA cßn chÞu c¸c sai háng ngÉu
nhiªn cã thÓ dÉn ®Õn ®ét biÕn. Hai kiÓu sai háng ngÉu nhiªn th­êng gÆp lµ mÊt
purine (depurination) vµ mÊt amin (desamination). MÊt purine lµ kiÓu sai háng
th­êng gÆp h¬n, x¶y ra khi liªn kÕt glycosidic gi÷a C 1 cña pentose víi base bÞ ®øt
vµ lµm mÊt A hoÆc G. TÕ bµo ®éng vËt cã vó cã thÓ mÊt 10.000 purine trong vßng
20 giê cña mét thÕ hÖ tÕ bµo ë 370C. Sù mÊt purine nµy dÉn ®Õn kh«ng cã b¾t cÆp
bæ sung ë ®iÓm mÊt nªn dÔ t¹o ra ®ét biÕn qua sao chÐp.
Sù mÊt amin cña C t¹o ra U. C¸c gèc U kh«ng ®­îc söa sai sÏ b¾t cÆp bæ sung
víi A trong sao chÐp, g©y ra ®ét biÕn ®ång chuyÓn GC  AT.
Trong c¸c enzyme söa sai, Uracil DNA-glycosylase nhËn biÕt ®Æc hiÖu U trªn
DNA vµ c¾t rêi t¹o lç hæng, sau ®ã tæng hîp l¹i ®óng theo m¹ch bæ sung. Trªn
ph©n tö DNA, mét sè cytosine ®­îc methyl ho¸ thµnh 5-methyl-cytosine, chÊt nµy
mÊt nhãm amin biÕn thµnh thymine. Sai háng nµy kh«ng bÞ Uracil DNA-

82
glycosylase ph¸t hiÖn nªn kh«ng ®­îc söa l¹i. Sù chuyÓn C T do mÊt amin
th­êng x¶y ra ë c¸c ®iÓm cã 5-methyl-cytosine kiÓu biÕn ®æi nµy cã ë c¶ vi khuÈn
lÉn tÕ bµo cña sinh vËt bËc cao.
2.2.4. ¶nh h­ëng cña c¸c ®ét biÕn gen ®Õn sinh tæng hîp protein

• §ét biÕn lÖch khung


Sau khi t×m hiÓu qu¸ tr×nh dÞch m· vµ m· di truyÒn, cÇn l­u ý ®Õn biÕn ®æi
cã ¶nh h­ëng ®Õn nghÜa cña codon vµ vÞ trÝ biÕn ®æi ë ®Çu hay ë cuèi m¹ch
polypeptide. Hai kiÓu ®ét biÕn cã ¶nh h­ëng nÆng lµ thªm base (addition) vµ mÊt
base (deletion). C¸c biÕn ®æi nµy th­êng lµm enzyme mÊt ho¹t tÝnh. Sù thªm mét
base dÉn ®Õn sù dÞch m· lÖch khung. Tõ ®iÓm biÕn ®æi vÒ sau, tõ bé ba bÞ sai, c¸i
sai sÏ kÐo dµi liªn tôc ®Õn cuèi m¹ch polypeptide. Sù tæng hîp m¹ch polypeptide
cã thÓ bÞ kÕt thóc sím, nÕu sù lÖch khung dÉn ®Õn codon kÕt thóc.
• §ét biÕn thay thÕ
§ét biÕn thay thÕ nÕu lµ ®ét biÕn sai nghÜa (mis-sense) sÏ cã hiÖu qu¶ thay
®æi tõ amino acid nµy sang amino acid kh¸c trong mét polypeptide, cßn nÕu lµ ®ét
biÕn v« nghÜa (non-sense) sÏ kh«ng cã ¶nh h­ëng ®Õn m¹ch polypeptide.

2.2.5. C¸c ®ét biÕn ¶nh h­ëng ®Õn kiÓu h×nh


• C¸c ®ét biÕn h×nh th¸i: c¸c biÕn ®æi ¶nh h­ëng ®Õn h×nh d¹ng, mµu s¾c vµ
kÝch th­íc.
• §ét biÕn sinh ho¸: §ét biÕn khuyÕt d­ìng lµm mÊt kh¶ n¨ng tæng hîp c¸c
chÊt. C¸c ®ét biÕn cã ®iÒu kiÖn, sù biÓu hiÖn cña ®ét biÕn trong nh÷ng ®iÒu kiÖn
giíi h¹n nhÊt ®Þnh (restrictive condition). VÝ dô c¸c ®ét biÕn nh¹y c¶m víi nhiÖt
®é cao cã biÓu hiÖn ë nhiÖt ®é t­¬ng øng. §ét biÕn ®Ò kh¸ng lµ c¸c ®ét biÕn sinh
ho¸ gióp kh¸ng l¹i c¸c t¸c nh©n bÊt lîi.
• Søc sèng: C¸c ®ét biÕn kÐm søc sèng (subvital), søc sèng cña dßng ®ét biÕn
kÐm h¬n dßng hoang d¹i, kho¶ng tõ 10-90% søc sèng cña dßng hoang d¹i. §ét
biÕn nöa g©y chÕt (semi-lethal) g©y hiÖu qu¶ chÕt cao h¬n 90% nh­ng thÊp h¬n
100%. §ét biÕn g©y chÕt (lethal) kh«ng cã c¸ thÓ nµo sèng ®Õn giai ®o¹n tr­ëng
thµnh.
2.2.6. Mét sè t¸c nh©n g©y ®ét biÕn
C¸c t¸c nh©n lµm t¨ng tÇn sè ®ét biÕn cao h¬n møc tù nhiªn ®­îc gäi lµ c¸c
t¸c nh©n g©y ®ét biÕn (mutagen). C¸c t¸c nh©n vËt lý nh­ phãng x¹, tia X, tia tö

83
ngo¹i. NhiÒu ho¸ chÊt lµ t¸c nh©n g©y ®ét biÕn nh­ c¸c ®ång ®¼ng cña c¸c base
nitric, HNO 2 , c¸c chÊt alkyl ho¸ m¹ch... C¸c ®ét biÕn nµy ®­îc gäi lµ ®ét biÕn
nh©n t¹o hay ®ét biÕn c¶m øng (induced mutation).
2.2.6.1. T¸c ®éng g©y ®ét biÕn cña bøc x¹ ion ho¸
Tia X, c¸c tia phãng x¹ α, β, γ, c¸c neutron vµ c¶ tia tö ngo¹i ®Òu lµ c¸c t¸c
nh©n g©y ®ét biÕn. Trõ tia tö ngo¹i cã kh¶ n¨ng xuyªn thÊu yÕu nªn chØ t¸c ®éng
lªn c¸c sinh vËt ®¬n bµo vµ giao tö, c¸c tia kh¸c ®Òu cã t¸c dông g©y ®ét biÕn lªn
tÊt c¶ c¸c d¹ng sinh vËt. T¸c dông g©y ®ét biÕn cña phãng x¹ cã hai ®Æc ®iÓm:
- Kh«ng cã ng­ìng t¸c dông, tøc lµ kh«ng cã liÒu l­îng v« h¹i.
- Sè l­îng ®ét biÕn tØ lÖ víi liÒu l­îng phãng x¹ kh«ng phô thuéc c­êng ®é
vµ thêi gian chiÕu x¹.
2.2.6.2. T¸c ®éng cña tia tö ngo¹i
Tia tö ngo¹i cã b­íc sãng dµi (10-5 - 10-6 cm) nªn khã t¹o ion, cã lÏ chØ t¸c
®éng ®Õn nh÷ng chÊt hÊp thu nã trùc tiÕp. Trong tÕ bµo, c¸c chÊt h÷u c¬ cã m¹ch
vßng chñ yÕu nh­ purine vµ pyrimidine hÊp thu trùc tiÕp tia tö ngo¹i. DNA hÊp
thu tia tö ngo¹i m¹nh nhÊt ë b­íc sãng 2537 A0, ®©y chÝnh lµ b­íc sãng lµm t¨ng
tÇn sè ®ét biÕn ë h¹t phÊn c©y b¾p.
D­íi t¸c ®éng cña tia tö ngo¹i, cytosine g¾n thªm ph©n tö n­íc vµo liªn kÕt
C=C cña m¹ch vßng vµ thymine bÞ ®øt liªn kÕt C=C m¹ch vßng nèi hai ph©n tö
thµnh thymine dimer.
Stone vµ c¸c céng sù ®· nhËn thÊy tÇn sè ®ét biÕn t¨ng lªn ë Staphylococcus
aureus khi m«i tr­êng nu«i cÊy chóng ®­îc chiÕu tia UV trong thêi gian ng¾n
tr­íc khi cÊy vµo. §©y lµ t¸c ®éng gi¸n tiÕp cña tia tö ngo¹i.
HiÖn t­îng quang phôc håi (photoreactivation) lµ mét ®Æc ®iÓm trong t¸c
®éng cña tia UV. Sau khi chiÕu tia tö ngo¹i lªn tÕ bµo, nÕu ®Ó ngoµi ¸nh s¸ng, th×
c¸c sai háng phÇn lín ®­îc phôc håi. ¸nh s¸ng cã t¸c ®éng ho¹t ho¸ enzyme söa
sai, c¾t ®øt c¸c thymine dimer.
2.2.6.3. C¸c ho¸ chÊt g©y ®ét biÕn
Ngay tõ ®Çu nh÷ng n¨m 1930, Xakharov vµ Lobashov (Liªn x«) ®· tiÕn hµnh
thö nghiÖm g©y ®ét biÕn b»ng ho¸ chÊt, nh­ng ch­a râ hiÖu qu¶. Vµo nh÷ng n¨m
40, trong thÕ chiÕn thø hai ë Anh, Auerbach vµ Robson ®· chøng minh h¬i ng¹t
nit¬ vµ sulfur cã kh¶ n¨ng g©y ®ét biÕn ë Drosophila (thêi ®iÓm nµy §øc b¾n h¬i
ng¹t sang Anh, nªn hä ph¶i nghiªn cøu t¸c ®éng sinh häc cña c¸c chÊt ®éc nµy).
VÒ sau, nhiÒu nhãm ho¸ chÊt g©y ®ét biÕn ®· ®­îc t×m ra.

84
Cã nhiÒu ho¸ chÊt g©y biÕn dÞ di truyÒn, ®Õn nay t×m ra nh÷ng ho¸ chÊt cho
hiÖu qu¶ g©y ®ét biÕn cßn cao h¬n c¶ phãng x¹. C¸c ho¸ chÊt g©y ®ét biÕn cã ®Æc
®iÓm lµ cã thÓ chØ g©y hiÖu qu¶ ®ét biÕn ®èi víi mét sè Ýt ®èi t­îng. VÝ dô
Streptomycine chØ g©y ®ét biÕn ë t¶o ®¬n bµo vµ mét sè vi sinh vËt, kh«ng g©y ®ét
biÕn trªn nhiÒu ®èi t­îng kh¸c. C¸c t¸c nh©n g©y ®ét biÕn ho¸ häc cã thÓ chia
thµnh c¸c nhãm sau:
- Nhãm 1: C¸c chÊt øc chÕ tæng hîp c¸c base nit¬ trong cÊu tróc DNA nh­
coffein, ethyl uretan .....
- Nhãm 2: C¸c chÊt ®ång ®¼ng víi base nit¬ nh­ coffein, 5-bromuracil, c¸c
chÊt gÇn gièng víi base nit¬, nªn nã lµm DNA g¾n nhÇm khi tæng hîp.
- Nhãm 3: C¸c chÊt alkyl ho¸ lµm ®øt m¹ch DNA nh­ ethyl
methanesulfonate (EMS), methy methanesulfonate (MMS), ethylene imine (EI),
nitrosoguanidine (NG)... C¸c t¸c nh©n alkyl ho¸ nh­ khÝ ng¹t nit¬ vµ ethyl
methane sulfonate cã thÓ g©y ®ét biÕn Ýt nhÊt b»ng ba c¸ch:
+ Thªm nhãm methyl (CH 3 ) hay ethyl (-C 2 H 5 ) vµo guanine t¹o ra base ®ång
®¼ng cña adenine dÉn ®Õn b¾t cÆp bæ sung sai.
+ MÊt guanine ®· bÞ alkyl ho¸ (mÊt purine) t¹o lç hæng trªn DNA, khi sao
chÐp cã thÓ lµm ®øt m¹ch.
+ Liªn kÕt chÐo gi÷a c¸c m¹ch cña mét hoÆc c¸c ph©n tö DNA kh¸c nhau
lµm mÊt nucleotide.
- Nhãm 4: C¸c chÊt kh¸c nh­ nhãm oxy ho¸, khö
Ng­îc víi sai háng sao chÐp, c¸c t¸c nh©n g©y ®ét biÕn nh­ nitrous acid vµ
khÝ ng¹t nit¬ cã thÓ g©y biÕn ®æi trùc tiÕp trªn DNA. Theo Schuster vµ mét sè
kh¸c, nitrous acid t¸c ®éng tr­íc hÕt t¸ch nhãm amino (desamination) khái
adenine vµ cytosine råi biÕn chóng thµnh hypoxanthin (H) vµ uracil (U) t­¬ng øng.
Sau biÕn ®æi, hypoxanthine cã thÓ b¾t cÆp víi C vµ U víi A, c¸c vßng sao chÐp
tiÕp theo lµm cho G thay chç A vµ T thay chç C.
C¸c chÊt kh¸c nh­ hydroxygenlamine (H 2NOH) vµ c¸c chÊt cho nhãm OH
cã thÓ g©y nªn ®ét biÕn ®ång chuyÓn. Theo Freese vµ c¸c céng sù,
hydroxygenlamine cã lÏ lµ chÊt cã tÝnh ®Æc hiÖu cao nhÊt trong c¸c t¸c nh©n g©y
®ét biÕn, nhê ®ã cã thÓ chuyÓn cytosine sang d¹ng b¾t cÆp ®­îc víi adenine.
- Nhãm 5: C¸c chÊt chªm vµo DNA
Nhãm c¸c chÊt gåm proflavin, mµu acridine vµ c¸c chÊt ®­îc gäi lµ ICR (ICR
compound), aflatoxin B1 lµ nh÷ng chÊt cã ph©n tö mÆt ph¼ng t­¬ng tù cÆp base.

85
Chóng cã thÓ chªm vµo ph©n tö DNA lµm thªm hoÆc mÊt base. Chóng th­êng g©y
®ét biÕn lÖch khung do thªm hay mÊt base.
Trong ®ã chÊt aflatoxin B1 lµ chÊt g©y ung th­, ®­îc t¸ch ra tõ h¹t ®Ëu bÞ
nhiÔm nÊm. Aflatoxin g¾n vµo vÞ trÝ N-7 cña guanine, s¶n phÈm t¹o ra lµm bÎ g·y
liªn kÕt gi÷a base vµ khung ®­êng. Do ®ã, t¸c nh©n nµy g©y ra mÊt purin t¹i vÞ trÝ
cña guanin vµ cã xu h­íng t¹o ra ®ét biÕn ®¶o chuyÓn G.CT.A.
TÊt c¶ c¸c t¸c nh©n g©y ®ét biÕn ®Òu lµ t¸c nh©n g©y ung th­ (carcinogen),
nh­ng c¸c t¸c nh©n g©y ung th­ kh«ng ph¶i ®Òu g©y ®ét biÕn. HiÖn nay nhiÒu t¸c
nh©n g©y ®ét biÕn ®­îc sö dông trong chän gièng nh»m t¨ng nguån biÕn dÞ. Bªn
c¹nh ®ã víi n¹n « nhiÔm trªn thÕ giíi ng­êi ta ph¸t hiÖn nhiÒu t¸c nh©n g©y ®ét
biÕn ho¸ häc míi xuÊt hiÖn trong m«i tr­êng.
2.2.7. C¸c c¬ chÕ söa sai
2.2.7.1. Söa sai trùc tiÕp
a. Quang t¸i ho¹t ho¸ nhê enzyme photolyase
Sau khi xö lÝ tia tö ngo¹i g©y ®ét biÕn, nÕu ®­a ra ¸nh s¸ng th× phÇn lín sai
háng ®­îc phôc håi. HiÖn t­îng nµy ®­îc gäi lµ quang phôc håi hay quang t¸i
ho¹t ho¸ (photoreactivation) (h×nh 2.21). N¨ng l­îng cña ¸nh s¸ng nh×n thÊy (300
®Õn 600nm) ho¹t ho¸ enzyme photolyase (gen phr ë E.coli) c¾t c¸c vßng
cyclobutyl pyrimidine dimer (th­êng lµ thymine).

H×nh 2.21. C¬ chÕ söa sai cña enzyme photolyase nhê ¸nh s¸ng

C¸c enzyme nµy ho¹t ®éng trong c¸c tÕ bµo ë nhiÒu loµi kh¸c nhau tõ
mycoplasma, ®éng vËt vµ ë c¶ b¹ch cÇu cña ng­êi; riªng nÊm men cã hai enzyme

86
kh¸c nhau. Vµo ban ngµy, c¸c sinh vËt th­êng chÞu t¸c ®éng cña ¸nh s¸ng, nªn c¬
chÕ quang phôc håi cã vai trß quan träng trong söa sai DNA. VÝ dô, c¸c
mycoplasma, sinh vËt ®¬n bµo ®¬n gi¶n nhÊt hiÖn nay, chØ cã vµi gen, nh­ng ®·
dµnh mét trong sè ®ã cho quang t¸i ho¹t ho¸.
Quang phôc håi lµ c¬ chÕ söa sai ngoµi ¸nh s¸ng, kh¸c víi söa sai trong tèi.
Trong giai ®o¹n ®Çu, enzyme nhËn biÕt vµ g¾n ®Æc hiÖu vµo dimer trong tèi. C¸c
oligothimidilate lµ c¬ chÊt rÊt tèt cho enzyme. Oligo (dT) 18 víi trung b×nh lµ 3,5
dimer ®­îc g¾n nhÑ víi hai ph©n tö enzyme. TÊt c¶ c¸c photolyase ®Òu cã hai
chromophore (chÊt b¾t mµu), lµ FADH 2 (1,5 dihydroflavin adenine dinucleotide).
B¶n chÊt cña chromophore thø hai chia photolyase thµnh hai nhãm:
+ Enzyme cña nÊm men vµ E. coli sö dông pterin (folate coenzyme)
+ Nhãm kia dïng deazaflavin
Khi chç sai háng hÊp thô ¸nh s¸ng (theo b­íc sãng ®Æc hiÖu), n¨ng l­îng
®­îc sö dông nhê phøc hîp enzyme-DNA æn ®Þnh biÕn thymine dimer thµnh
monomer. Sau ®ã enzyme t¸ch khái DNA.
b. Söa sai b»ng c¸ch lµm mÊt nhãm alkyl (Dealkylation)
Mét vÝ dô kh¸c vÒ viÖc söa trùc tiÕp c¸c sai háng lµ sù chuyÓn nhãm methyl
tõ chÊt cã kh¶ n¨ng g©y ung th­ lµ O6-methylguanine sang gèc cysteine cña
enzyme O6-methylguanine-DNA methyltransferase (MTase). Enzyme t¸ch nhãm
alkyl khái phosphodiester b»ng alkyl ho¸ cysteine kh¸c. Sau khi enzyme nµy nhËn
nhãm alkyl th× nã sÏ bÞ mÊt ho¹t tÝnh khö alkyl mét c¸ch kh«ng thuËn nghÞch. C¸c
MTase hiÖn diÖn ë E. coli, nÊm men vµ tÕ bµo ng­êi.
2.2.7.2. Söa sai gi¸n tiÕp ( Söa sai c¾t bá)
PhÇn lín c¸c c¬ chÕ söa sai kh¸c thùc hiÖn trong tèi, nhê c¸c nuclease b»ng
c¾t bá chç sai háng theo nhiÒu c¸ch (h×nh 2.22):
- C¾t c¸c base: Sù lo¹i bá chç sai ®­îc thùc hiÖn nhê mét hoÆc vµi enzyme
N-glycosylase. N-glycosylase nhËn biÕt base biÕn ®æi hay mÊt amin hoÆc sù biÕn
d¹ng cÊu tróc xo¾n do sai lÖch t¹o ra vµ thuû gi¶i liªn kÕt N-glycosilic nèi base
víi ®­êng pentose. Lç hæng võa ®­îc t¹o ra do c¾t bá ®­îc DNA polymerase chÐp
®Çy l¹i dùa vµo khu«n lµ sîi DNA bæ sung ®èi diÖn vµ ligase nèi liÒn l¹i.

87
A B

H×nh 2.22. C¸c c¬ chÕ söa sai, (A) c¾t bá base, (B) c¾t bá ®o¹n oligonucleotide

- Sù c¾t bá oligonucleotide: Sù c¾t bá vïng cã nhiÒu thymine dimer (do UV)


hoÆc vïng nèi chÐo gi÷a c¸c m¹ch, ®­îc thùc hiÖn nhê incision nuclease (nuclease
r¹ch m¹ch hay t¹o khÊc trªn DNA) nh­ phøc hîp Uvr ABC cña E.coli, phøc hîp
nµy c¾t c¸c ®o¹n 12-13 nucleotide tõ mét m¹ch. Sù thuû gi¶i ®­îc thùc hiÖn ë liªn
kÕt phosphodiester thø 8 ®Çu 5' ®Õn chç háng vµ phÝa 3' liªn kÕt thø t­ hay thø 5.
CÊu tróc m¹ch kÐp bæ sung cho nhau cña DNA cho phÐp, nÕu th«ng tin bÞ mÊt do
c¾t bá sai háng trªn mét m¹ch cã thÓ chÐp l¹i ®­îc dùa vµo m¹ch ®¬n nguyªn bæ
sung kia. Tuy nhiªn, mét sè sai háng liªn quan cïng lóc c¶ hai m¹ch còng cã thÓ
®­îc söa ch÷a. C¸c mÊt ®o¹n hay xen ®o¹n nucleotide, hay nèi chÐo gi÷a c¸c m¹ch
cã thÓ ®­îc phôc håi nhê sù thay thÕ ®o¹n t­¬ng øng b»ng t¸i tæ hîp. ThËm chÝ sù
®øt ®«i c¶ hai m¹ch cïng chç, ®­îc coi lµ nÆng nhÊt trong c¸c sai háng, cã thÓ
®­îc g¾n liÒn l¹i nhê ligase hay t¸i tæ hîp.
C¸c c¬ chÕ söa sai ë møc ph©n tö cã thÓ chia thµnh:
- Sù phôc håi d¹ng sai háng trë vÒ t×nh tr¹ng ban ®Çu (quang t¸i ho¹t ho¸,
lµm mÊt alkyl ho¸ (dealkylation).
- C¾t bá vµ thay thÕ: chç sai háng bÞ c¾t bá vµ thay thÕ nhê sao chÐp, t¸i tæ
hîp hay håi phôc b¾t cÆp sai (mismatch repair).

88
- NÕu sù söa sai thÊt b¹i, tÝnh liªn tôc cña bé gen vÉn cã thÓ duy tr× nhê sao
chÐp "óp sÊp sai háng" ("error-prone" replication), khi DNA polymerase bá qua
chç sai ®Ó sao chÐp tiÕp.
2.2.7.3. §äc söa ®èi víi c¸c base b¾t cÆp sai
C¬ chÕ ®äc söa ®èi víi c¸c base b¾t cÆp sai (proofreading for base-pair
matching) ®­îc thùc hiÖn trong sao chÐp DNA. Sù b¾t cÆp cÈn thËn cña DNA
polymerase ®¶m b¶o cho sù chÝnh x¸c cña sao chÐp. Tr­íc khi thùc hiÖn ph¶n øng
polymer ho¸ nèi c¸c nucleotide, nucleotide triphosphate míi ph¶i b¾t cÆp víi base
bæ sung trªn m¹ch khu«n. NÕu sù b¾t cÆp sai x¶y ra, DNA polymerase lo¹i bá
nucleotide b¾t cÆp sai (h×nh 2.23).

H×nh 2.23. Ho¹t tÝnh exonuclease 3'5' cña DNA polymerase III

ThËm chÝ, tr­íc khi nucleotide míi r¸p vµo, enzyme dß l¹i cÆp base cuèi, nÕu
chóng kh«ng b¾t cÆp th× sù polymer ho¸ tiÕp theo bÞ dõng. CÆp nucleotide ë ®Çu
cuèi 3' b¾t cÆp sai sÏ bÞ lo¹i bá bëi ho¹t tÝnh exonuclease 3'5' cña DNA
polymerase. Khi sù b¾t cÆp cña cÊu tróc m¹ch kÐp ®· ®óng, qu¸ tr×nh polymer ho¸
míi ®­îc tiÕp tôc. Ho¹t tÝnh ®äc söa ®èi víi c¸c base b¾t cÆp sai lµ ®Æc tÝnh cña
nhiÒu DNA polymerase ®¶m b¶o cho sù mäc dµi chÝnh x¸c cña m¹ch ®ang ®­îc
tæng hîp. Tuy nhiªn, trong tr­êng hîp cÇn thiÕt, DNA polymerase cã thÓ bá qua
chç sai vµ chÐp tiÕp nhê c¬ chÕ sao chÐp "óp sÊp sai háng".
2.2.7.4. Söa sai kh«ng xøng ®«i
Sù nhËn biÕt vµ söa ch÷a c¸c sai lÖch do b¾t cÆp base trªn DNA ®­îc ph¸t
hiÖn ë E.coli, cã ba hÖ thèng enzyme kh¸c nhau ®­îc sö dông ®Ó:
- Lo¹i bá chç sai trong sao chÐp (errors in replication).
- Lo¹i bá b¾t cÆp kh«ng xøng ®«i bªn trong c¸c ®o¹n trung gian cña t¸i tæ
hîp (mismatch within recombination intermediates).

89
- Lo¹i bá thymine cña cÆp GT trong tr­êng hîp 5-methylcytosine bÞ mÊt
nhãm amine (-NH 2 ) thµnh thymine.
Sù thÊt b¹i trong t¸i tæ hîp gi÷a E.coli víi Salmonella typhimurium lµ do tr×nh
tù nucleotide cña DNA kh¸c nhau ®Õn 20%. Rµo c¶n t¸i tæ hîp nµy ®­îc v­ît qua
ë c¸c thÓ ®ét biÕn sai háng trong hÖ thèng mismatch repair. §iÒu nµy chøng tá
mismatch repair cã ý nghÜa quan träng trong kiÓm tra sù chÝnh x¸c cña c¸c ®o¹n
tham gia t¸i tæ hîp (recombination intermediates).
2.2.7.5. Söa sai theo c¬ chÕ "error-prone"
Khi ph©n tö DNA chÞu c¸c ®ét biÕn, mét sè protein ®Æc biÖt lµm nhiÖm vô
dõng qu¸ tr×nh tæng hîp DNA ®Ó söa ch÷a theo c¸c c¬ chÕ kh¸c nhau. Mét ®iÒu
dÔ hiÓu lµ nÕu nh­ tÕ bµo tiÕp tôc ph©n chia (tøc lµ DNA tiÕp tôc ®­îc nh©n lªn)
th× tØ lÖ ®ét biÕn cao khiÕn sè tÕ bµo sèng sãt gi¶m. Nh÷ng c¬ chÕ söa ch÷a sai
háng ë nh÷ng phÇn trªn dùa trªn ®­îc thùc hiÖn qua hai giai ®o¹n: (1) giai ®o¹n
lo¹i bá base sai háng n»m trªn mét trong hai sîi cña DNA xo¾n kÐp, (2) giai ®o¹n
söa ch÷a b»ng c¸ch sö dông mét sîi DNA cßn nguyªn lµm khu«n ®Ó tæng hîp
DNA ®iÒn ®Çy vµo chç trèng trªn sîi ®¬n bÞ sai háng. Tuy nhiªn, sai háng nghiªm
träng kh¸c kh«ng thÓ söa ch÷a ®­îc b»ng nh÷ng c¬ chÕ söa ch÷a sai háng tù do
nh­ ë trªn, ®ã lµ sai háng ®øt g·y c¶ hai sîi cña DNA xo¾n kÐp. Do c¶ hai sîi ®Òu
bÞ ®øt g·y nªn kh«ng cã sîi nµo lµm khu«n ®Ó söa ch÷a sai háng nµy, do ®ã, ®Ó
tån t¹i tÕ bµo sö dông mét hÖ thèng söa ch÷a ®­îc gäi lµ “error – prone”. TÕ bµo
sinh vËt cã hai c¬ chÕ ®Ó söa ch÷a sai háng ®øt g·y c¶ hai sîi DNA kÐp nµy ®ã lµ
c¬ chÕ nèi c¸c ®Çu DNA kh«ng t­¬ng ®ång vµ c¬ chÕ t¸i tæ hîp t­¬ng ®ång
• Söa sai DNA ®øt g·y b»ng c¸ch nèi c¸c ®Çu DNA ®øt g·y theo c¬ chÕ
error-prone:
ViÖc söa ch÷a c¸c sai háng trªn DNA ®ãng vai trß quan träng trong viÖc ng¨n
c¶n c¸c ®ét biÕn tiÒn ung th­ x¶y ra ë tÕ bµo kh«ng ph©n chia cña sinh vËt ®a bµo.
Tuy nhiªn, khi mét sîi ®«i bÞ ®øt g·y x¶y ra trong c¸c tÕ bµo ®· ngõng ph©n chia,
th× viÖc söa ch÷a c¸c sai háng nµy b»ng nh÷ng ph­¬ng thøc söa sai nh­ ®· m« t¶
ë phÇn tr­íc cña ch­¬ng lµ kh«ng thùc hiÖn ®­îc v× nã kh«ng cã khu«n ®Ó söa
ch÷a sai háng. Sù bæ sung kh«ng cßn v× c¶ hai sîi cña DNA xo¾n kÐp ®Òu bÞ h­
h¹i vµ kh«ng cã sù t¸i b¶n, do ®ã nã kh«ng cã nhiÔm s¾c tö chÞ em ®Ó dïng lµm
khu«n söa ch÷a lo¹i bá sai háng. MÆc dï vËy vÉn cã mét sè tr­êng hîp söa ch÷a
b»ng sao chÐp óp sÊp sai háng “error-prone” (bao gåm c¶ hÖ thèng SOS cña E.coli)
mµ qu¸ tr×nh söa sai nµy sÏ ®­îc ®Ò cËp tiÕp theo ngay trong phÇn nµy cña ch­¬ng.
HËu qu¶ cña viÖc söa sai kh«ng hoµn thiÖn nµy cã thÓ Ýt tæn h¹i ®Õn tÕ bµo h¬n lµ

90
nh÷ng th­¬ng tæn nµy kh«ng ®­îc söa ch÷a. Trong tr­êng hîp söa sai c¸c sîi
DNA bÞ ®øt g·y nµy, tÕ bµo ®· sö dông mét c¬ chÕ söa ch÷a gäi lµ c¬ chÕ nèi c¸c
®Çu kh«ng t­¬ng ®ång, ®­îc m« t¶ chi tiÕt ë h×nh 2.24. Theo m« t¶ ë h×nh 2.24,
c¬ chÕ nµy thùc hiÖn söa sai theo ba b­íc bao gåm sù liªn kÕt cña c¸c ®Çu ®øt g·y
víi ba protein (KU70, KU80 vµ mét protein kinase lín phô thuéc DNA). Sau khi
®· liªn kÕt víi c¸c ®Çu DNA bÞ ®øt g·y, c¸c protein nµy c¾t tØa c¸c ®Çu vµ ®em
nèi c¸c ®Çu nµy l¹i víi nhau. ë ®éng vËt cã vó, mét vµi protein trong con ®­êng
söa ch÷a nµy còng tham gia vµo c¸c ph¶n øng nèi c¸c ®Çu trong viÖc s¾p xÕp l¹i
tr×nh tù cña c¸c gen kh¸ng thÓ theo ch­¬ng tr×nh.
• Söa sai c¸c DNA ®øt g·y b»ng c¬ chÕ t¸i tæ hîp error - prone
C¬ chÕ t¸i tæ hîp t­¬ng ®ång sö dông c¸c nhiÔm s¾c tö chÞ em ®Ó söa ch÷a
sîi ®«i bÞ ®øt g·y trong tÕ bµo ph©n chia. C¬ chÕ t¸i tæ hîp t­¬ng ®ång error-prone
®­îc biÓu diÔn nh­ h×nh 2.25. C¸c b­íc chñ yÕu lµ viÖc nèi c¸c ®Çu ®øt g·y b»ng
nh÷ng protein vµ enzyme ®Æc biÖt. ViÖc c¾t tØa c¸c ®Çu 5’ ®Ó lé ra nh÷ng vïng sîi
®¬n, c¸c vïng nµy sau ®ã ®­îc bao phñ bëi c¸c protein, nh­ lµ protein t­¬ng tù
nh­ RecA lµ RAD51. H·y nhí r»ng, trong qu¸ tr×nh ®¸p øng SOS, nh÷ng ®¬n ph©n
RecA liªn kÕt víi vïng sîi ®¬n ®Ó h×nh thµnh mét sîi xo¾n m¶nh dµi. T­¬ng tù
nh­ RecA, RAD51 còng liªn kÕt víi vïng DNA sîi ®¬n t¹o thµnh sîi m¶nh
RAD51-DNA. Sîi m¶nh RAD51-DNA dß t×m vïng tr×nh tù t­¬ng ®ång víi nã
trªn nhiÔm s¾c tö chÞ em kh«ng bÞ sai háng lµm khu«n ®Ó tæng hîp lÊp ®Çy chç
trèng, phôc håi l¹i tr×nh tù ®· mÊt.

H×nh 2.25. Söa ch÷a sîi ®«i ®øt g·y b»ng t¸i tæ hîp t­¬ng ®ång
91
• Söa sai theo c¬ chÕ sao chÐp óp sÊp sai háng (h×nh 2.26 )
Ph©n tö DNA cã thÓ ph¶i chÞu nh÷ng thiÖt h¹i sai háng nÆng nÒ nh­ khi bÞ
chiÕu tia tö ngo¹i (UV) hoÆc khi chÞu t¸c ®éng cña c¸c chÊt g©y ung th­
(carcinogenes). Lóc ®ã kh«ng ph¶i chØ mét sîi ®¬n DNA bÞ háng mµ c¶ hai sîi bÞ
®øt g·y mÊt ®i mét sè nucleotide. Th«ng tin di truyÒn cña ®o¹n bÞ háng mÊt ®i
hoµn toµn nªn kh«ng cã sîi khu«n ®Ó söa ch÷a theo c¸c c¬ chÕ th«ng th­êng.
Trong tr­êng hîp nµy, tÕ bµo cßn mét gi¶i ph¸p duy nhÊt ®Ó t¨ng kh¶ n¨ng sèng
sãt: ®ã lµ söa ch÷a DNA theo mét c¸ch ngÉu nhiªn víi tØ lÖ sai sãt, ®ét biÕn cao
nh­ng dï sao vÉn duy tr× ®­îc sù sèng. §ã chÝnh lµ c¬ chÕ söa ch÷a DNA "error-
prone". Râ rµng r»ng chÊp nhËn c¸c nucleotide sai ®­a vµo trong ph©n tö DNA ®Ó
qu¸ tr×nh nh©n ®«i DNA vÉn ®­îc duy tr× cßn h¬n lµ bÞ ngõng hoµn toµn. Nh­ vËy
söa ch÷a DNA theo c¬ chÕ nµy còng chÝnh lµ mét trong nh÷ng nguyªn nh©n g©y
nªn tÝnh ®a d¹ng cña DNA.
B»ng c¸c thÝ nghiÖm di truyÒn, vai trß quan träng cña hai protein UmuC vµ
UmuD trong c¬ chÕ söa ch÷a "error-prone" ®­îc ph¸t hiÖn. Chóng cã kh¶ n¨ng
g¾n c¸c nucleotide vµo sîi DNA bÊt chÊp kh«ng tån t¹i sîi khu«n. Nh­ vËy hai
protein nµy cã thÓ øc chÕ ho¹t tÝnh tù söa ch÷a exonuclease 3'5' cña DNA
polymerase hoÆc chÝnh chóng lµ mét lo¹i DNA polymerase ®Æc biÖt. Khi ®ét biÕn
x¶y ra trªn gen m· ho¸ cho hai protein ®ã, c¸c tÕ bµo vi khuÈn sèng sãt Ýt h¬n c¸c
tÕ bµo b×nh th­êng d­íi t¸c dông cña tia tö ngo¹i.

H×nh 2.26. C¬ chÕ söa sai sao chÐp óp sÊp bá qua sai háng

92
2.2.7.7. HÖ thèng SOS (cÊp cøu)
C¸c c¬ chÕ söa sai cã nhiÒu ph¶n øng kh¸c nhau víi m«i tr­êng vµ ®­îc ®iÒu
hoµ do c¸c gen cña Ýt nhÊt 4 operon, mµ hÖ thèng SOS lµ mét.
HÖ thèng nµy ho¹t ®éng khi tÕ bµo bÞ t¸c ®éng m¹nh bëi c¸c t¸c nh©n g©y
®ét biÕn t¹o nhiÒu sai háng trªn DNA. Trong tr­êng hîp DNA bÞ lµm háng ngõng
sao chÐp, ph¶n øng SOS håi phôc sao chÐp vµ chuyÓn sai háng thµnh söa sai óp
sÊp (error-prone replication). ë E. coli ®· quan s¸t thÊy sù ph¸ huû DNA lµm më
ra kho¶ng 20 gen cña hÖ thèng SOS, ®­îc kiÓm so¸t ©m bëi chÊt k×m h·m lexA
(lexA repressor). ChÊt nµy g¾n vµo hép SOS chång lÊp c¸c promoter cña c¸c gen
SOS.
Trong tr­êng hîp cÊp b¸ch cã nhiÒu sai háng cÇn cÊp cøu, lexA bÞ kÝch thÝch,
thay ®æi cÊu h×nh (configuration) tù c¾t vµ mÊt ho¹t tÝnh k×m h·m. Lóc ®ã c¸c gen
SOS ®­îc më ra. NÕu söa sai kh«ng kÞp tÕ bµo ph¶i chÊp nhËn hoÆc bÞ ®ét biÕn
hoÆc chÕt.
2.3. T¸i tæ hîp
S¾p xÕp l¹i bé gen liªn quan chÆt chÏ ®Õn qu¸ tr×nh t¸i tæ hîp di truyÒn
(genetic recombination). T¸i tæ hîp lµ t¹o ra mét trËt tù cÊu tróc míi cña bé gen
tõ c¸c vËt liÖu di truyÒn cã s½n. Khi qu¸ tr×nh ®ã phô thuéc vµo c¸c enzyme ®Ó c¾t
nèi ph©n tö DNA th× ®­îc gäi lµ t¸i tæ hîp néi ph©n (intramolecular
recombination). C¸c kiÓu c¸ch kh¸c nhau cña h×nh thøc t¸i tæ hîp nµy gåm cã:
* T¸i tæ hîp t­¬ng ®ång (homologous recombination): ®ßi hái tr×nh tù
nucleotide t­¬ng ®ång gi÷a hai ®o¹n DNA. HiÖn t­îng nµy cßn ®­îc gäi lµ t¸i tæ
hîp chung (general recombination).
* T¸i tæ hîp ®Æc hiÖu (site-specific recombination): x¶y ra ë nh÷ng vÞ trÝ ®Æc
hiÖu trªn hai ph©n tö DNA. Trao ®æi chÐo lo¹i nµy ®ßi hái c¸c enzyme tham gia
nhËn biÕt ®­îc ®o¹n nucleotide ng¾n ®Æc biÖt ë vÞ trÝ ®ã. Nh­ vËy t¸i tæ hîp kiÓu
nµy cã thÓ x¶y ra gi÷a hai ®o¹n nucleotide bÊt kú kh«ng yªu cÇu tÝnh t­¬ng ®ång
gi÷a chóng.
* Sù chuyÓn chç cña c¸c ®o¹n DNA (transposon): liªn quan ®Õn sù di chuyÓn
cña c¸c yÕu tè DNA cã kh¶ n¨ng vËn ®éng gi÷a hai vÞ trÝ t¸ch ra vµ ghÐp vµo n»m
trªn mét hoÆc hai ph©n tö DNA.
* T¸i tæ hîp sai lÖch (illegitimate recombination): liªn quan ®Õn sù thªm
®o¹n, mÊt ®o¹n hoÆc nèi kh«ng ®óng c¸c ®o¹n DNA víi nhau trong qu¸ tr×nh t¸i

93
b¶n hoÆc trao ®æi chÐo kh«ng c©n b»ng (unequal crossing over) gi÷a c¸c nhiÔm
s¾c thÓ.
Lo¹i t¸i tæ hîp cuèi cïng liªn quan ®Õn viÖc mÊt hay g¾n ®o¹n DNA vµo
nh÷ng ®iÓm kh«ng t­¬ng ®ång nh­ tr­êng hîp mÊt ®o¹n vµ chuyÓn ®o¹n, mµ ®Õn
nay c¬ chÕ ph©n tö ch­a râ.
CÇn ph©n biÖt râ rµng gi÷a t¸i tæ hîp vµ ®ét biÕn. §ét biÕn lµ t¹o ra th«ng tin
di truyÒn míi trong bé gen. Tuy nhiªn, ®ét biÕn vµ t¸i tæ hîp th­êng ®i ®«i víi
nhau. VÝ dô nh­ sù chuyÓn chç cña c¸c yÕu tè DNA cã kh¶ n¨ng di chuyÓn
(transposon) hoÆc sai lÖch trong trao ®æi chÐo cã thÓ g©y ra nh÷ng ®ét biÕn lµm
cho cÊu tróc gen thay ®æi. Ng­îc l¹i, t¸i tæ hîp lµ mét trong nh÷ng c¬ chÕ söa
ch÷a DNA khi x¶y ra c¸c ®ét biÕn nghiªm träng nh»m duy tr× sù sèng cßn cho tÕ
bµo.
2.3.1. T¸i tæ hîp t­¬ng ®ång
T¸i tæ hîp t­¬ng ®ång ®­îc ph¸t hiÖn ®Çu tiªn ngay trong c¸c thÝ nghiÖm cña
Morgan ë Drosophila. C¬ chÕ cña nã dÉn ®Õn sù ho¸n ®æi thuËn nghÞch (reciprocal
exchange) c¸c ®o¹n t­¬ng øng gi÷a hai nhiÔm s¾c thÓ t­¬ng ®ång vµ kh«ng lµm
mÊt th«ng tin di truyÒn. MÆc dï ®· ph©n lËp ®­îc nhiÒu ®ét biÕn sai háng t¸i tæ
hîp (®Æc biÖt ë phage, E.coli vµ nÊm men) vµ nhËn ®­îc nhiÒu s¶n phÈm protein
tinh s¹ch ®Æc hiÖu cho qu¸ tr×nh nµy, nh­ng t¸i tæ hîp t­¬ng ®ång ch­a ®­îc tiÕn
hµnh in vitro vµ nhiÒu chi tiÕt ch­a biÕt râ. HiÖn nay, ®a sè ng­êi cho r»ng t¸i tæ
hîp ë prokaryote vµ eukaryote liªn quan ®Õn ®øt vµ nèi c¸c ®o¹n DNA.
2.3.1.1. C¸c m« h×nh trao ®æi ®o¹n
C¸c m« h×nh gi¶i thÝch c¬ chÕ ph©n tö cña t¸i tæ hîp t­¬ng ®ång c¨n cø vµo
sù tham gia cña c¸c ®o¹n ®øt m¹ch ®¬n hay m¹ch kÐp (single or double stranded
break).
• Sù trao ®æi ®o¹n khëi sù b»ng m¹ch ®¬n
Sù trao ®æi ®o¹n khëi sù b»ng m¹ch ®¬n (single strand initiated exchange)
®­îc m« t¶ trªn h×nh 2.27. DiÔn biÕn nh­ sau:

94
H×nh 2.27. C¬ chÕ t¸i tæ hîp t­¬ng ®ång

- Sù xÕp th¼ng c¸c ®o¹n kÐp t­¬ng ®ång (homologous duplexes).


- Sù x©m lÊn (invasion) cña c¸c m¹ch bÞ ®øt vµo ®o¹n kÐp ®èi t¸c. Sù nèi c¸c
m¹ch vµo c¸c ®o¹n t­¬ng ®ång t¹o ra cÊu tróc nèi trung gian Holliday (Holliday
tªn ng­êi ph¸t hiÖn ra cÊu tróc nµy), trong ®ã hai sîi kÐp kÕt hîp víi nhau nhê
trao ®æi chÐo m¹ch ®¬n. Nghiªn cøu cÊu tróc cho thÊy cã sù b¾t cÆp hoµn toµn cña
c¸c m¹ch DNA trong cÊu tróc trung gian. C¸c m¹ch tõ c¶ hai sîi kÐp ban ®Çu cã
thÓ x©m lÊn cïng ®iÓm hay chØ mét m¹ch x©m lÊn trong tr­êng hîp sau, sao chÐp
cã thÓ ®­îc thùc hiÖn nh»m lÊp chç trèng do m¹ch x©m lÊn ®Ó l¹i.
- Sù di chuyÓn nh¸nh (branch migration) cña cÊu tróc nèi lµm t¨ng chiÒu dµi
cña ®o¹n trao ®æi.
- Ph©n t¸ch (resolution) c¸c ph©n tö nèi. Nh­ lóc khëi sù, ®iÒu nµy ®ßi hái
c¾t m¹ch vµ vÞ trÝ cña c¸c ®iÓm c¾t nµy x¸c ®Þnh s¶n phÈm cña t¸i tæ hîp. NÕu
®iÓm c¾t cuèi cïng ë trªn mét m¹ch nh­ chç khëi sù th× s¶n phÈm nh­ cò, trong
khi ®ã sù c¾t ë m¹ch ®èi diÖn t¹o ra c¸c ®o¹n t¸i tæ hîp.
• M« h×nh håi phôc chç trèng m¹ch kÐp
M« h×nh håi phôc chç trèng m¹ch kÐp (double stranded gap repair) lµ c¬ chÕ
t¸i tæ hîp ë phage λ vµ T4, ë nÊm men vµ trong mét sè tr­êng hîp ë E.coli. Qu¸
tr×nh thùc hiÖn nh­ sau (h×nh 2.28):

95
- Tæng hîp DNA ®­îc khëi sù ë ®Çu 3'OH cña m¹ch x©m lÊn. ViÖc nµy thay
thÕ tr×nh tù mÊt do sù ph©n huû cña exonuclease vµ phñ kÝn ®iÓm c¾t ban ®Çu.
M¹ch ®­îc t¹o vßng ch÷ D cã thÓ b¾t cÆp víi phÝa kia cña chç ®øt, t¹o primer cho b
a
m¹ch tæng hîp DNA cña m¹ch ®èi.
H×nh 2.28. C¬ chÕ phôc håi chç trèng m¹ch kÐp d¹ng vßng ch÷ D (Dloop) (a), m« h×nh
- Sù xÕp th¼ng haiHolliday
ph©n töt¹oDNA
ra hait­¬ng ®ång.
ph©n tö t¸i tæ hîp (b)
- Sù ph©n huû bëi exonuclease chç ®øt t¹o chç trèng (gap) víi sù c¨ng m¹ch
®¬n.
- Sù x©m lÊn cña mét trong c¸c ®Çu mót ®o¹n m¹ch ®¬n vµo thÓ kÐp (duplex)
t¹o vßng D (D-loop).
- Sù ph©n t¸ch cña cÊu tróc Holliday t¹o ra hai ph©n tö t¸i tæ hîp, trong ®ã
chç g·y ban ®Çu ®­îc lµm liÒn l¹i.
C¸c m« h×nh trªn vµ nh÷ng biÕn d¹ng cña chóng ®· ®­îc nªu ra ®Ó gi¶i thÝch
c¸c sè liÖu thu nhËn ®­îc vµ cung cÊp d÷ liÖu cho viÖc t×m ra c¸c enzym cña qu¸
tr×nh t¸i tæ hîp.
2.3.1.2. RecA protein cña E.coli vµ c¸c protein kh¸c tham gia trao ®æi
m¹ch
Qu¸ tr×nh c¾t, trao ®æi, nèi vµ t¸ch c¸c m¹ch trong t¸i tæ hîp t­¬ng ®ång phøc
t¹p nªn cÇn cã sù tham gia cña nhiÒu protein. Gen RecA, m· ho¸ cho protein thùc
hiÖn trao ®æi m¹ch, gi÷ vai trß trung t©m hÇu nh­ trong tÊt c¶ c¸c qu¸ tr×nh t¸i tæ
hîp t­¬ng ®ång ë E.coli. C¸c ®ét biÕn sai háng ë gen RecA kh«ng thùc hiÖn ®­îc
t¸i tæ hîp t­¬ng ®ång, söa sai sau sao chÐp vµ bÊt kú chøc n¨ng nµo cña hÖ thèng
SOS.

96
Protein RecA tinh s¹ch g¾n phèi hîp víi DNA m¹ch ®¬n t¹o phøc hîp
nucleoprotein lµ phÇn cã ho¹t tÝnh trong trao ®æi m¹ch DNA. RecA cßn cã c¸c
ho¹t tÝnh kh¸c nh­ sù thuû gi¶i ATP vµ c¾t repressor còng ®­îc ho¹t ho¸ bëi sù
g¾n RecA vµo DNA m¹ch ®¬n. RecA cßn g¾n vµo DNA m¹ch kÐp, mÆc dï chËm
h¬n so víi DNA m¹ch ®¬n vµ cã thÓ lµm chuçi xo¾n kÐp th¸o xo¾n mét phÇn.
RecA xóc t¸c sù trao ®æi m¹ch gi÷a nhiÒu lo¹i ph©n tö DNA víi cÊu h×nh
(conformation) kh¸c nhau. C¸c ®ßi hái vÒ mÆt cÊu tróc ®èi víi c¬ chÊt DNA lµ:
- Cã vïng DNA m¹ch ®¬n ®Ó r¸p sîi RecA.
- Sù t­¬ng ®ång DNA-DNA gi÷a hai cÆp.
- §Çu tù do bªn trong vïng t­¬ng ®ång cho phÐp m¹ch xoay vßng.
- Sù hiÖn diÖn topoisomerase gióp nèi chÐo c¸c m¹ch.
Trong c¸c ®iÒu kiÖn cÇn thiÕt cho t¸i tæ hîp in vitro, SSB protein (single strand
binding) tham gia hç trî RecA, nã cã vai trß quan träng trong viÖc duy tr× sù æn
®Þnh vÒ ho¹t tÝnh cña phøc hîp RecA-DNA m¹ch ®¬n trong suèt ph¶n øng trao
®æi m¹ch.
Trong c¸c m« h×nh vÒ t¸i tæ hîp t­¬ng ®ång c¸c nuclease gi÷ vai trß quan
träng trong giai ®o¹n khëi sù vµ t¸ch m¹ch ®¬n. Ngoµi chóng ra, c¸c enzyme c¾t
c¸c cÊu tróc nèi trung gian Holliday trong c¸c giai ®o¹n cuèi cña qu¸ tr×nh trao
®æi m¹ch t­¬ng ®ång.
2.3.2. T¸i tæ hîp ®iÓm chuyªn biÖt
§Ó t¸i tæ hîp x¶y ra ë mét vÞ trÝ nhÊt ®Þnh, cÇn ph¶i cã c¸c enzyme ®Æc biÖt
nhËn biÕt ®­îc vÞ trÝ ®ã trªn mét hoÆc c¶ hai ph©n tö DNA. Kh¸c víi t¸i tæ hîp
chung (t­¬ng ®ång), trong qu¸ tr×nh nµy kh«ng ®ßi hái sù t¹o cÆp bæ sung gi÷a
c¸c sîi ®¬n cña hai ph©n tö DNA hoÆc nÕu cã th× chØ cÇn ®o¹n dÞ hîp dµi vµi
nucleotide.
T¸i tæ hîp ë vÞ trÝ ®Æc hiÖu ®­îc t×m thÊy lÇn ®Çu tiªn khi nghiªn cøu hiÖn
t­îng ghÐp vµo hoÆc t¸ch ra cña DNA bacteriophage trªn bé gen tÕ bµo E.coli.
Khi x©m nhËp vµo tÕ bµo chñ, enzyme integrase cña bacteriophage vµ protein IFH
cña tÕ bµo chñ liªn kÕt víi vÞ trÝ ®Æc biÖt trªn ph©n tö λ DNA d¹ng vßng. Phøc
protein-DNA sÏ b¸m vµo bé gen E.coli vµ trao ®æi chÐo x¶y ra gi÷a hai bé gen λ
vµ vi khuÈn (h×nh 2.29) Lóc nµy phage chØ cã thÓ tån t¹i ë d¹ng tiÒm tan.

97
H×nh 2.29. M« h×nh t¸i tæ hîp chuyªn biÖt cña phageλ g¾n chÌn vµo bé gen vi khuÈn E.coli
Tuú thuéc vµo chiÒu s¾p xÕp ph©n bè cña c¸c vÞ trÝ ®Æc hiÖu trªn ph©n tö DNA mµ trao
®æi chÐo ®Æc hiÖu cã thÓ x¶y ra theo ba c¸ch thøc kh¸c nhau. Thø nhÊt lµ trao ®æi chÐo ®Æc hiÖu
gi÷a hai ph©n tö DNA liªn quan ®Õn viÖc ghÐp vµo hoÆc t¸ch ra (intermolecular site-specific
recombination). VÝ dô nh­ bé gen bacteriophage λ ghÐp vµo nhiÔm s¾c thÓ E. coli. H×nh thøc
thø hai vµ thø ba (intramolecular site-specific recombination) liªn quan ®Õn trao ®æi chÐo x¶y
ra ngay trªn mét ph©n tö DNA gi÷a c¸c ®o¹n nucleotide lÆp l¹i cïng chiÒu hoÆc ng­îc chiÒu.
VÝ dô nh­ giíi h¹n tÕ bµo chñ bÞ x©m nhiÔm bëi phage Mu phô thuéc vµo sù trao ®æi chÐo ®Æc
hiÖu t¹i mét vïng 3000bp trªn bé gen Mu. Bé gen Mu cã chøa mét ®o¹n DNA 3000bp (®­îc
gäi lµ ®o¹n G) cã kh¶ n¨ng ®æi chiÒu ngay t¹i vÞ trÝ cña m×nh. Do ®ã, trong ph¶n øng biÕn tÝnh
vµ phôc håi bé gen Mu ®«i khi quan s¸t ®­îc ®o¹n G kh«ng t¹o cÆp hoÆc cã hiÖn t­îng chØ x¶y
ra liªn kÕt bæ sung t¹i ®o¹n G nµy. Sù ®æi chiÒu cña ®o¹n G phô thuéc vµo 34 nucleotide lÆp l¹i
ng­îc chiÒu ë hai ®Çu ®o¹n G vµ s¶n phÈm do gen gin m· cho. Protein GIN ho¹t ho¸ trao ®æi
chÐo gi÷a hai ®o¹n lÆp l¹i ng­îc chiÒu nµy.
Ph©n tÝch cÊu tróc vïng DNA liªn quan ®Õn ®o¹n G cho thÊy sù ®æi chiÒu cña ®o¹n nµy
lµm thay ®æi ho¹t ®éng cña c¸c gen S, S' vµ U, U'. Gen S vµ S' cã phÇn gièng nhau (phÇn Sc)
®­îc m· ho¸ bëi ®o¹n DNA n»m ngoµi ®o¹n G. PhÇn kh¸c biÖt gi÷a hai gen nµy (phÇn Sv vµ
phÇn Sv') do c¸c nucleotide n»m trong ®o¹n G quy ®Þnh. Gen S vµ gen U ho¹t ®éng khi ®o¹n G
cã chiÒu d­¬ng (+). Ng­îc l¹i, hai gen S' vµ U' sÏ bËt më khi G ®æi chiÒu ng­îc l¹i -chiÒu ©m
(-). S¶n phÈm cña c¸c gen S vµ U cÇn thiÕt ®Ó phage Mu t­¬ng t¸c ®Æc hiÖu víi thô thÓ trªn bÒ
mÆt cña mét sè tÕ bµo E.coli nh­ K12. Tuy nhiªn, khi gen S' vµ U' ho¹t ®éng, phage Mu x©m
nhiÔm ®­îc mét sè vi khuÈn kh¸c nh­ Shigella sonnei, Serratia marcescens. Râ rµng sù ®æi
chiÒu ®o¹n G do trao ®æi chÐo x¶y ra t¹i hai vïng lÆp l¹i ng­îc chiÒu gixL vµ gixR quyÕt ®Þnh
giíi h¹n tÕ bµo chñ cña phage Mu. HiÖn t­îng ®æi chiÒu x¶y ra kh¸ phæ biÕn ë tr¹ng th¸i tiÒm
tan. Do ®ã, tÕ bµo vi khuÈn nhiÔm phage Mu tr¶i qua nhiÒu thÕ hÖ ph©n chia sÏ cã mét nöa sè
phage chøa ®o¹n G theo chiÒu d­¬ng vµ nöa kia theo chiÒu ©m.

98
Hai lo¹i tÕ bµo lympho B vµ T cã vai trß rÊt quan träng trong hÖ miÔn dÞch ë ®éng vËt cã
x­¬ng sèng. TÕ bµo lympho T tiÕt ra c¸c thô thÓ (TCR-T-Cell Receptor) ph©n bè trªn bÒ mÆt tÕ
bµo, cßn tÕ bµo lympho B tiÕt ra c¸c protein immunoglobulin (Igs). C¸c Igs cã thÓ ph©n bè trªn
bÒ mÆt tÕ bµo nh­ c¸c thô thÓ hoÆc ®­îc tiÕt ra khái tÕ bµo nh­ c¸c kh¸ng thÓ (antibody). TÊt c¶
c¸c lo¹i protein do hai lo¹i tÕ bµo tiÕt ra ®Òu cã cÊu tróc gåm hai chuçi nÆng (heavy chain) vµ
hai chuçi nhÑ (light chain). §èi víi c¸c protein Igs, chØ cã mét lo¹i chuçi nÆng IgH vµ hai lo¹i
chuçi nhÑ IgL κ vµ IgL λ . Protein TCR gåm cã αβ-TCR vµ δγ-TCR.
C¸c chuçi tham gia Igs vµ TCR cã cÊu tróc t­¬ng tù nhau: phÇn ®Çu COOH lµ vïng b¶o
thñ (constant region) g¾n liÒn víi c¸c chøc n¨ng cÊu tróc (kh«ng liªn quan ®Õn tÝnh nhËn biÕt
®Æc hiÖu ®èi víi kh¸ng nguyªn). PhÇn ®Çu NH 2 lµ vïng siªu biÕn (hypervariable region) liªn
quan ®Õn nhËn biÕt kh¸ng nguyªn.
C¸c kh¸ng thÓ cã kh¶ n¨ng nhËn biÕt tõ 106 ®Õn 108 ph©n tö kh¸ng nguyªn kh¸c nhau.
Kh¶ n¨ng nµy ®­îc quyÕt ®Þnh bëi hai yÕu tè: sù ®a d¹ng cña c¸c gen liªn quan cã s½n trong tÕ
bµo (germline diversity) vµ sù t¸i tæ hîp ®Æc hiÖu gi÷a c¸c gen ®ã t¹o ra c¸c tæ hîp gen míi
(somatic diversity). YÕu tè thø hai phô thuéc hoµn toµn vµo tõng lo¹i tÕ bµo lympho trong c¬
thÓ, tøc lµ cã tÝnh ®Æc tr­ng riªng biÖt cho tõng c¸ thÓ. §Æc biÖt vïng siªu biÕn ®­îc m· bëi tæ
hîp cña ba lo¹i DNA kh¸c nhau: ®o¹n V (variable), ®o¹n D (diversity) vµ ®o¹n J (junctional).
Sè l­îng c¸c ®o¹n nµy còng nh­ sù ph©n bè cña chóng trªn nh÷ng vïng (locus) nhiÔm s¾c thÓ
lµ kh¸c nhau. ViÖc s¾p xÕp c¸c ®o¹n nµy x¶y ra theo c¸ch thøc trao ®æi chÐo ®Æc hiÖu ®Ó t¹o ra
kh¸ng thÓ ®Æc hiÖu x¶y ra trong tõng lo¹i tÕ bµo lympho. §iÒu ®ã quyÕt ®Þnh tÝnh ®Æc hiÖu vµ
®a d¹ng cña c¸c kh¸ng thÓ trong ph¶n øng miÔn dÞch cña c¬ thÓ.
C¸c nghiªn cøu sinh häc ph©n tö cho thÊy t¸i tæ hîp ®iÓm chuyªn biÖt lµ hiÖn t­îng rÊt
phæ biÕn vµ cã nhiÒu hÖ thèng kh¸c nhau nh­ m« t¶ ë b¶ng 2.3.
B¶ng 2.3.. C¸c hÖ thèng t¸i tæ hîp ë ®iÓm chuyªn biÖt

Chøc n¨ng HÖ thèng §Æc ®iÓm

Sù g¾n vµo vµ c¾t rêi ra cña λ Int HÖ thèng ®­îc nghiªn cøu
phage (phage integration tèt nhÊt; C¸c phage t­¬ng
and excision) tù λ nh­ P 22 , P 2 vµ P 4 sö
dông c¸c hÖ thèng t­¬ng tù.

Sù ph©n t¸ch c¸c ®a ph©n Tn vµ γ δ resolvase ChÕ biÕn c¸c s¶n phÈm
vßng trßn (resolution of cïng kÕt hîp víi sù chuyÓn
circular multimers) vÞ (processing of cointegrat
products of transposition).

Col E 1 Cer Sù ph©n t¸ch c¸c ®a ph©n


lµm t¨ng tÝnh æn ®Þnh cña
plasmid, cÇn cho sù tham
gia cña 3 protein tÕ bµo chñ

99
P 1 lox-cre Sù h×nh thµnh vßng trßn
trong nhiÔm phage; Sù
ph©n t¸ch c¸c ®a ph©n lµm
t¨ng tÝnh æn ®Þnh cña
plasmid

2µ FLP Sù ®¶o ®o¹n (inversion)


cho phÐp khuÕch ®¹i
plasmid b»ng t¹o vßng trßn
quay kÐp (double rolling
circle) trung gian.

C¸c ®¶o ®o¹n cho sù biÓu Hin C¸c gen cña tiªm mao ë
hiÖn cña c¸c gen theo c¸ch Salmonella
kh¸c (inversions for
Gin Sîi ®u«i cña phage µ u
expression of alternate
gene) Pin Sîi ®u«i cña phage P 1

Sù l¾p r¸p (assembly) cña Nh©n tè σ cña tÕ bµo mÑ


c¸c gen trong ph¸t triÓn c¸ chuyªn biÖt (mother-cell-
thÓ specific σ factor) ë
B.subtilis.
C¸c gen cè ®Þnh nit¬ ë
Anabaena.
Immuloglobin vµ c¸c gen
thô thÓ cña tÕ bµo T (T-cell
receptor genes) ë ®éng vËt
cã vó.
Qu¸ tr×nh t¸i tæ hîp cã c¸c ®Æc tÝnh chung nh­ sau:
- T¸i tæ hîp cã tÝnh b¶o tån (conservative), kh«ng ®ßi hái tæng hîp DNA vµ
c¸c tr×nh tù kh«ng bÞ mÊt còng nh­ kh«ng nhËn thªm qua ph¶n øng.
- Sù trao ®æi thùc hiÖn gi÷a c¸c ®iÓm t­¬ng ®èi nhá cña DNA cña nh÷ng tr×nh
tù gÇn gièng nhau. Mét sè ph¶n øng ®ßi hái tr×nh tù DNA cã t¸c ®éng CIS ®Ó ®¹t
hiÖu qu¶ cao.
- Mét recombinase protein chÞu tr¸ch nhiÖm chÝnh cho viÖc nhËn biÕt c¸c
®iÓm t¸i tæ hîp (recombination site) vµ cho viÖc t¸ch vµ nèi DNA. C¸c tæ hîp trung
gian protein-DNA gi÷ n¨ng l­îng c¾t dïng cho ph¶n øng nèi, nªn kh«ng cÇn

100
nucleotide cofactor. C¸c protein phô g¾n víi DNA th­êng hç trî sù l¾p r¸p cña
recombinase vµo c¸c ®iÓm t¸i tæ hîp.
- C¸c ph¶n øng cã thÓ x¶y ra gi÷a c¸c ph©n tö (intermolecular) nh­ sù g¾n
cña bé gen λ vµo nhiÔm s¾c thÓ tÕ bµo chñ hay bªn trong ph©n tö (intramolecular)
nh­ ph©n t¸ch c¸c ®a ph©n vßng trßn (circular multimers).
- C¸c ph¶n øng trong ph©n tö cã thÓ hoÆc do ®¶o ®o¹n (inversion), trong ®ã
sù ®Þnh h­íng cña ®o¹n DNA gi÷a c¸c ®iÓm t¸i tæ hîp ®¶o ng­îc so víi hai ®o¹n
bªn, hoÆc do mÊt ®o¹n (deletion) do ®o¹n DNA bÞ c¾t rêi. C¸c s¶n phÈm ®­îc t¹o
ra phô thuéc vµo sù ®Þnh h­íng cña c¸c ®iÓm t¸i tæ hîp: c¾t ®øt ®o¹n do t¸i tæ hîp
gi÷a c¸c ®o¹n lÆp l¹i trùc tiÕp (direct repeat) trong khi ®ã c¸c ®¶o ®o¹n h×nh thµnh
sù ®Þnh h­íng cña c¸c ®iÓm ®¶o ng­îc. Mét sè recombinase xóc t¸c chØ mét trong
c¸c sù kiÖn, trong khi mét sè kh¸c thùc hiÖn c¶ hai.
2.4. HiÖn t­îng chuyÓn vËt liÖu di truyÒn ë vi khuÈn
Trong mét thêi gian dµi, c¸c nghiªn cøu di truyÒn häc ®­îc tiÕn hµnh ë c¸c
sinh vËt nh©n thùc (Eukaryote), cßn ë vi khuÈn th× ch­a, v× ng­êi ta cho r»ng nh÷ng
sinh vËt nh©n s¬ (Prokaryote) kh«ng cã sinh s¶n h÷u tÝnh. Tuy nhiªn vµo nh÷ng
n¨m 40, hiÖn t­îng t¸i tæ hîp ë vi khuÈn ®­îc chøng minh. Nh÷ng nghiªn cøu vÒ
biÕn n¹p, t¶i n¹p vµ giap n¹p cã ý nghÜa quan träng cho sù ph¸t triÓn cña di truyÒn
häc ph©n tö vµ gãp phÇn x©y dùng lªn kü thuËt l¾p ghÐp gen.
C¸c sinh vËt nh©n s¬ (prokaryote) nh­ vi khuÈn, virus còng cã c¸c qu¸ tr×nh
sinh s¶n t­¬ng ®­¬ng sinh s¶n h÷u tÝnh, ®­îc gäi lµ cËn h÷u tÝnh (parasexuality).
Sù di truyÒn nhê c¸c qu¸ tr×nh cËn h÷u tÝnh nµy ë vi khuÈn cã nh÷ng ®Æc ®iÓm:
- Sù truyÒn th«ng tin mét chiÒu tõ tÕ bµo cho (donor) sang tÕ bµo nhËn
(recipient).
- Sù t¹o thµnh hîp tö tõng phÇn (merozygote). ThÓ cho (donor) chØ chuyÓn
mét ®o¹n cña bé gen sang thÓ nhËn (recipient) nªn chØ l­ìng béi ë mét phÇn, c¸c
phÇn kh¸c ®¬n béi.
- Bé gen th­êng chØ lµ mét DNA trÇn nªn chØ cã mét nhãm liªn kÕt gen vµ
t¸i tæ hîp thùc chÊt lµ lai ph©n tö.

101
H×nh 2.30: Bèn con ®­êng chuyÓn DNA tõ tÕ bµo nµy sang tÕ bµo kh¸c cña vi khuÈn

2.4.1. BiÕn n¹p (transformation)


2.4.1. 1. HiÖn t­îng vµ ®iÒu kiÖn
BiÕn n¹p lµ hiÖn t­îng truyÒn th«ng tin di truyÒn b»ng DNA. Trong biÕn n¹p,
c¸c DNA trÇn tõ mét tÕ bµo vi khuÈn nµy (thÓ cho) ®­îc truyÒn sang tÕ bµo vi
khuÈn kh¸c (thÓ nhËn). Khi tÕ bµo vi khuÈn bÞ ph¸ vì do bÞ lµm tan (lysis), DNA
vßng cña chóng tho¸t ra m«i tr­êng thµnh c¸c ®o¹n th¼ng víi chiÒu dµi kh¸c nhau,
cã kh¶ n¨ng g©y biÕn n¹p cho c¸c tÕ bµo nhËn kh¸c.
HiÖn t­îng biÕn n¹p ®­îc nghiªn cøu kü ë c¸c vi khuÈn Streptococcus
pneumoniae, Bacillus subtilis, Haemophillus influenzae vµ ë mét sè nhãm vi
khuÈn kh¸c.
HiÖu qu¶ biÕn n¹p phô thuéc vµo ba yÕu tè: TÝnh dung n¹p cña tÕ bµo nhËn,
kÝch th­íc cña tÕ bµo nhËn vµ nång ®é cña DNA.
• TÝnh dung n¹p cña tÕ bµo nhËn
Mét ®iÒu kiÖn quan träng cña biÕn n¹p lµ tÕ bµo nhËn ph¶i cã tr¹ng th¸i sinh
lý ®Æc biÖt ®­îc gäi lµ kh¶ n¨ng dung n¹p (competence). Cã thÓ g©y ra sù dung
n¹p b»ng c¸ch t¹o ra nh÷ng ®iÒu kiÖn nhÊt ®Þnh cho sù t¨ng tr­ëng cña tÕ bµo.
Nh÷ng tÕ bµo dung n¹p trªn bÒ mÆt cã c¸c nh©n tè dung n¹p (competence factor).
ë Streptococcus (tr­íc ®©y lµ Diplococcus) pneumoniae lµ tÕ bµo kh¶ n¹p cã
kho¶ng 30 ®Õn 80 ®iÓm nhËn biÕt trªn tÕ bµo cã kh¶ n¨ng g¾n víi DNA m¹ch kÐp
hÇu nh­ cña bÊt kú nguån nµo. MÆt kh¸c, Haemophillus influenzae cã mét sè
l­îng h¹n chÕ tõ 4 ®Õn 8 ®iÓm nhËn biÕt (receptor), mµ mçi ®iÓm nµy tr­íc tiªn

102
nhËn biÕt mét ®o¹n DNA m¹ch kÐp cã c¸c cÆp base tr×nh tù nh­ sau: 5'-
AAGTGCGGTCA-3' ®­îc gäi lµ "®iÓm hÊp thô" (uptake site). §iÓm ®Æc biÖt lµ
®iÓm hÊp thô DNA nµy cña Haemophillus chØ ®Æc tr­ng cho nã (v× trªn bé gen cña
nã cã kho¶ng 600 ®iÓm nh­ vËy vµ t­¬ng ®èi hiÕm ë DNA cña c¸c loµi kh¸c), ®iÒu
nµy gi¶i thÝch t¹i sao Haemophillus chØ biÕn n¹p giíi h¹n víi c¸c vi khuÈn trong
loµi.
PhÇn lín c¸c vi khuÈn chØ dung n¹p trong mét giai ®o¹n giíi h¹n cña chu
tr×nh sèng. Trong giai ®o¹n dung n¹p, tÕ bµo tæng hîp mét hay nhiÒu protein ®­îc
gäi lµ "c¸c nh©n tè dung n¹p", chóng biÕn ®æi mµng tÕ bµo ®Ó cã thÓ g¾n víi DNA
ngo¹i lai. Nh­ vËy, c¸c ®iÓm thô thÓ chØ hiÖn diÖn trong giai ®o¹n dung hîp.
• KÝch th­íc cña tÕ bµo nhËn vµ nång ®é cña DNA
§iÒu quan träng thø hai ®Ó thùc hiÖn ®­îc biÕn n¹p lµ DNA ph¶i cã m¹ch
kÐp vµ ®o¹n biÕn n¹p ph¶i cã khèi l­îng ph©n tö tèi thiÓu kho¶ng 400kDa (chiÕm
kho¶ng 1/200 bé gen vi khuÈn), dÜ nhiªn ®©y kh«ng ph¶i lµ giíi h¹n cao nhÊt. Sè
l­îng tÕ bµo ®­îc biÕn n¹p (transformant- thÓ biÕn n¹p) t¨ng tØ lÖ thuËn víi nång
®é cña DNA cho ®Õn lóc mµ c¸c tÕ bµo b·o hoµ do c¸c ®o¹n DNA g¾n vµo (th­êng
kho¶ng 10 ®o¹n/tÕ bµo). DNA ®­îc hÊp thô vµo tÕ bµo vµ bÞ enzyme c¾t lµm gi¶m
khèi l­îng ph©n tö.
• §o¹n ngo¹i lai vµ ®o¹n néi t¹i
Khi DNA m¹ch kÐp x©m nhËp vµo tÕ bµo, mét m¹ch bÞ ph©n huû. BÊt kú ®o¹n
DNA nµo tõ tÕ bµo cho x©m nhËp vµo tÕ bµo nhËn, ®­îc gäi lµ DNA ngo¹i lai
(exogenote) DNA cña tÕ bµo nhËn gäi lµ ®o¹n néi t¹i (endogenote). TÕ bµo vi
khuÈn nhËn ®o¹n ngo¹i lai sÏ l­ìng béi ë mét phÇn bé gen, ®­îc gäi lµ hîp tö tõng
phÇn (merozygote). Tuy nhiªn, ®o¹n ngo¹i lai m¹ch ®¬n kh«ng bÒn v÷ng vµ bÞ
ph©n huû nÕu kh«ng ®­îc g¾n vµo bé gen cña thÓ nhËn.
Qu¸ tr×nh trao ®æi th«ng tin di truyÒn b»ng c¸ch chØ chuyÓn mét phÇn vËt liÖu
di truyÒn tõ tÕ bµo nµy sang tÕ bµo kh¸c ®­îc gäi lµ sù giao n¹p tõng phÇn
(meromixis). Cã ng­êi cho r»ng ®o¹n ngo¹i lai m¹ch ®¬n ®­îc g¾n víi protein
(nh­ protein Rec A ë E. coli), protein nµy hç trî t×m vïng bæ sung trªn ®o¹n néi
t¹i, lµm ®øt m¹ch vµ g¾n ®o¹n ngo¹i lai. C¸c enzyme sÏ c¾t c¸c ®Çu tù do cña c¶
thÓ cho vµ thÓ nhËn, ligase hµn kÝn chç trèng. Khi ®o¹n ngo¹i lai ®· g¾n vµo ®o¹n
néi t¹i th× tÕ bµo kh«ng cßn lµ hîp tö tõng phÇn n÷a.
NÕu ®o¹n ngo¹i lai chøa mét allele víi ®o¹n néi t¹i, th× m¹ch kÐp t¸i tæ hîp
sÏ cã mét hay nhiÒu chç b¾t cÆp sai (mismatch base pairs) vµ ®o¹n DNA nµy ®­îc
gäi lµ heteroduplex. NÕu c¸c tÕ bµo con nhËn allele míi, chç b¾t cÆp sai ®­îc söa

103
b»ng c¸ch c¾t ®o¹n néi t¹i vµ dïng m¹ch ngo¹i lai lµm khu«n thay thÕ. Sù g¾n
®o¹n ngo¹i lai vµo DNA tÕ bµo nhËn ®­îc thùc hiÖn nhê t¸i tæ hîp t­¬ng ®ång.
Hai hoÆc nhiÒu h¬n c¸c gen liªn kÕt chÆt cã thÓ n»m trong ®o¹n DNA biÕn
n¹p. NÕu sù x©m nhËp cña hai hay nhiÒu h¬n c¸c gen vµo ®o¹n néi t¹i, th× tÕ bµo
nhËn sÏ ®­îc ®ång biÕn n¹p (cotransformed). TÇn sè cña ®ång biÕn n¹p tØ lÖ nghÞch
t­¬ng øng víi kho¶ng c¸ch gi÷a c¸c gen cïng biÕn n¹p.
2.4.1. 2. C¬ chÕ ph©n tö
• Th©m nhËp cña DNA
Sîi DNA m¹ch kÐp cña dßng vi khuÈn S sau khi chui qua mµng tÕ bµo cña
dßng R th× mét m¹ch S sÏ bÞ nuclease cña tÕ bµo R c¾t, cßn l¹i mét m¹ch nguyªn
(h×nh 2.31).

H×nh 2.31. Qu¸ tr×nh biÕn n¹p cña DNA trÇn vµo trong tÕ bµo vi khuÈn

• B¾t cÆp (synapsis)


DNA thÓ nhËn R sÏ biÕn tÝnh t¸ch rêi hai m¹ch ë mét ®o¹n ®Ó b¾t cÆp víi
®o¹n DNA thÓ cho S võa chui vµo.
• Sao chÐp
Sau khi b¾t cÆp t¹o ®o¹n lai R-S, ph©n tö DNA sao chÐp t¹o ra hai sîi mét sîi
kÐp R-R vµ mét sîi kÐp kh¸c cã mang mét ®o¹n DNA thÓ cho S-S.
2.4.2. T¶i n¹p (transduction)
ViÖc t×m ra biÕn n¹p ®· thóc ®Èy nghiªn cøu dÉn ®Õn ph¸t minh ra t¶i n¹p, lµ
hiÖn t­îng truyÒn DNA qua trung gian virus tõ tÕ bµo cho ®Õn tÕ bµo nhËn. Cã hai
kiÓu t¶i n¹p: t¶i n¹p chung vµ t¶i n¹p chuyªn biÖt.
2.4.2. 1. Phage lµ nh©n tè chuyÓn gen

104
H×nh 2.32: ThÝ nghiÖm vÒ t¶i n¹p, sù t¶i n¹p ®­îc thùc hiÖn b»ng c¸ch thay thÕ toµn bé hoÆc
mét phÇn bé gen cña phage b»ng DNA vi khuÈn
ThÝ nghiÖm ®­îc tiÕn hµnh trong èng h×nh ch÷ u, ë ®¸y èng ®­îc ng¨n c¸ch
b»ng mµng läc vi khuÈn (h×nh 2.32). Mµng cã lç nhá, vi khuÈn kh«ng ®i qua ®­îc
nh­ng phage ®i qua ®­îc. Nh¸nh A cña èng chøa vi khuÈn cã kh¶ n¨ng tæng hîp
tryptophan (mang gen trp+) cßn nh¸nh B nu«i c¸c vi khuÈn mÊt kh¶ n¨ng tæng hîp
tryptophan (mang gen trp-). Sau mét thêi gian nu«i cÊy, bªn nh¸nh B xuÊt hiÖn vi
khuÈn cã kh¶ n¨ng tæng hîp Trp. Qua nhiÒu lÇn thÝ nghiÖm viÖc phage t¶i gen trp+
tõ nh¸nh A sang nh¸nh B ®· ®­îc chøng minh.
2.4.2. 2. T¶i n¹p chung (General transduction)
T¶i n¹p chung x¶y ra khi phage mang bÊt kú gen nµo cña vi khuÈn A sang vi
khuÈn B.
T¶i n¹p chung cã c¸c ®Æc ®iÓm sau:
- Th­êng do phage kiÓu P1 thùc hiÖn
- BÊt kú gen nµo cña vi khuÈn còng ®­îc t¶i n¹p
- T¶i n¹p cã ®­îc lµ do gãi nhÇm DNA cña tÕ bµo chñ khi phage tr­ëng thµnh
- C¸c thÓ t¸i tæ hîp ®¬n béi ®­îc t¹o ra
Do kh«ng cã sù t­¬ng ®ång gi÷a tr×nh tù DNA trªn c¸c phage víi tr×nh tù
DNA ë tÕ bµo chñ, nªn kh«ng cã ®iÓm g¾n nµo ®Æc hiÖu cho prophage. BÊt kú gen
nµo còng ®­îc t¶i n¹p v× ®Çu cña phage cã thÓ gãi nhÇm vµo mét ®o¹n DNA cña
tÕ bµo chñ.
Sù ®ång t¶i n¹p (cotransduction) lµ qu¸ tr×nh t¶i n¹p ®ång thêi hai gen. Qu¸
tr×nh phage x©m nhËp vµo vi khuÈn ®­îc m« t¶ ë h×nh 2.33. §Çu tiªn phage b¸m
vµo trªn bÒ mÆt cña vi khuÈn, sau 4 phót b¬m DNA cña nã ®i vµo trong tÕ bµo chñ,

105
sau ®ã chóng sinh s¶n vµ ®é nöa giê sau th× lµm tan vi khuÈn vµ gi¶i phãng c¸c
phage con (chu tr×nh tan).

H×nh 2.33. C¬ chÕ t¶i n¹p chung

Khi DNA cña phage x©m nhËp vµo tÕ bµo vi khuÈn A chóng c¾t DNA vi
khuÈn A thµnh nhiÒu ®o¹n, ®ång thêi DNA cña phage ®­îc sao chÐp thµnh nhiÒu
ph©n tö con vµ c¸c vá cña phage còng ®­îc t¹o thµnh. Sau ®ã, c¸c vá ®­îc l¾p ruét
DNA vµo, ph¸ vì tÕ bµo vi khuÈn ra ngoµi vµ tiÕp tôc x©m nhËp vµo c¸c tÕ bµo vi
khuÈn míi.
Trong qu¸ tr×nh l¾p r¸p kho¶ng 1-2% phage v« t×nh mang ®o¹n DNA cña vi
khuÈn cã chøa gen. Phage mang gen cña vi khuÈn A x©m nhËp vµo vi khuÈn B,
qu¸ tr×nh t¸i tæ hîp diÔn ra lµm cho gen A g¾n vµo bé gen cña vi khuÈn B (h×nh
2.33).
2.4.2. 3. T¶i n¹p chuyªn biÖt (Special trans, duction)
T¶i n¹p chuyªn biÖt hay h¹n chÕ (restricted transduction) lµ tr­êng hîp chØ
mang mét vµi gen nhÊt ®Þnh, nã cã 4 ®Æc ®iÓm:
- Nh÷ng gen ®­îc chuyÓn n»m s¸t chç prophage g¾n vµo
- ChØ cã prophage λ thùc hiÖn
- Do kÕt qu¶ c¾t sai cña prophage khi t¸ch khái nhiÔm s¾c thÓ cña tÕ bµo chñ
- C¸c vi khuÈn t¸i tæ hîp cã thÓ l­ìng béi mét phÇn
VÝ dô phage λ chØ mang gen gal (tiªu ho¸ ®­êng galactose) tõ vi khuÈn nµy
chuyÓn sang vi khuÈn kh¸c.
§iÓm g¾n cña phage λ vµo bé gen cña vi khuÈn n»m gi÷a hai gen gal
(galactose) vµ bio (tæng hîp biotin). §Çu cña phage chØ cã thÓ chøa l­îng DNA

106
giíi h¹n, nªn khi prophage t¸ch ra tõ DNA cña vi khuÈn, nã chØ t¶i n¹p ®­îc gen
gal hoÆc bio. Phage λ t¶i n¹p c¸c gen galactose ®­îc gäi lµ λgal hay λdg (d-
defective, g-galactose). NÕu tÕ bµo gal- ®­îc nhiÔm bëi λdg (mang gen gal+), sù
r¸p vµo cña phage biÕn d¹ng vµo tÕ bµo chñ sÏ t¹o ra thÓ l­ìng béi mét phÇn. Sù
c¾t sai cña phage λ rÊt hiÕm nªn sù t¶i n¹p h¹n chÕ cã tÇn sè thÊp. Tuy nhiªn, t¶i
n¹p cã tÇn sè cao cã thÓ nhËn ®­îc trong ®iÒu kiÖn thÝ nghiÖm. NÕu tÕ bµo vi khuÈn
®­îc g©y nhiÔm kÐp víi phage λ hoang d¹i vµ phage λdg, phage λ hoang d¹i sÏ
hç trî chøc n¨ng sai sãt ë phage biÕn d¹ng, vµ thÕ hÖ con sÏ cã hai kiÓu víi sè
l­îng b»ng nhau. Khi dÞch tan ®­îc dïng ®Ó t¶i n¹p, qu¸ tr×nh nµy sÏ ®­îc gäi lµ
t¶i n¹p tÇn sè cao (high frequency transduction).
Trong nhiÒu tr­êng hîp, do bé gen biÕn d¹ng cña phage λdg kh«ng g¾n ®­îc
vµo bé gen cña tÕ bµo chñ (nªn kh«ng sao chÐp ®­îc). Sau mçi lÇn ph©n bµo, chØ
cã mét trong hai tÕ bµo cã bé gen cña phage biÕn d¹ng, qu¸ tr×nh nµy gäi lµ t¶i
n¹p sÈy (abortive transduction).
2.4.3. Giao n¹p (conjugation)

H×nh 2.34. Qu¸ tr×nh chuyÓn DNA qua cÇu tiÕp hîp tõ tÕ bµo cho sang tÕ bµo nhËn
Giao n¹p ë vi khuÈn lµ sù kÕt hîp nhÊt thêi cña hai tÕ bµo cã kiÓu b¾t cÆp ®èi
nhau, ®­îc tiÕp nèi b»ng sù chuyÓn mét phÇn vËt chÊt di truyÒn tõ tÕ bµo cho sang
tÕ bµo nhËn qua cÇu tÕ bµo chÊt, sau ®ã t¸ch nhau ra (exconjugants). KiÓu sao chÐp
sigma (σ) ®­îc tÕ bµo vi khuÈn sö dông trong giao n¹p ®Ó truyÒn ph©n tö DNA
d¹ng th¼ng sang tÕ bµo kh¸c (h×nh 2.34).
2.4.3. 1. Chøng minh cã hiÖn t­îng lai ë vi khuÈn
N¨m 1946, J. Lederberg vµ E. Tatum ®· sö dông c¸c dßng ®ét biÕn khuyÕt
d­ìng kh¸c nhau ë E. coli ®Ó chøng minh cã t¸i tæ hîp gi÷a c¸c dßng vi khuÈn
kh¸c nhau. Cô thÓ lµ dßng A cã kiÓu gen met-bio-thr+leu+thi+ (cã kh¶ n¨ng tæng
hîp ®­îc Thr, Leu, vit B1, kh«ng tæng hîp ®­îc Met vµ Biotin), cßn ë d¹ng B th×
ng­îc l¹i cã kiÓu gen met+bio+thr-leu-thi-. Trén A vµ B trong èng nghiÖm sau ®ã
cÊy lªn m«i tr­êng tèi thiÓu, c¸c khuÈn l¹c mäc ®­îc trªn m«i tr­êng tèi thiÓu,

107
chøng tá cã c¸c d¹ng lai, chóng chØ mäc ®­îc nhê sù bï ®¾p cho nhau c¸c nhu cÇu
dinh d­ìng. D¹ng lai cã kiÓu gen met+bio+thr+leu+thi+. Trong khi ®ã tõng d¹ng A
hoÆc B riªng lÎ th× kh«ng mäc ®­îc trªn m«i tr­êng tèi thiÓu (h×nh 2.35).

H×nh 2.35. Khi hai ®ét biÕn ®­îc ®Æt trong mét m«i tr­êng tèi thiÓu, sù sinh tr­ëng chØ x¶y ra
khi sù t¸i tæ hîp t¹o ra mét chñng cã chøa c¸c allele hoang d¹i ë c¶ hai locus
2.4.3. 2. Sù ph©n ho¸ giíi tÝnh ë vi khuÈn
N¨m 1953, Hayes ®· ph¸t hiÖn ë vi khuÈn cã c¸c d¹ng kh¸c nhau t­¬ng tù
gièng ®ùc vµ gièng c¸i ë sinh vËt bËc cao. C¸c d¹ng ®ã ®­îc ký hiÖu F+ vµ F- (F:
fertility), F+ t­¬ng tù gièng ®ùc ë sinh vËt bËc cao, nã truyÒn gen sang F-. TÇn sè
lai F+xF- kho¶ng 10-6 tøc lai mét triÖu tÕ bµo th× sÏ cã mét tÕ bµo lai.
• Episome vµ plasmid
Khi tiÕp xóc víi tÕ bµo F+ mét thêi gian, tÕ bµo F- trë thµnh tÕ bµo F+. VÒ sau
d¹ng Hfr (high frequency of recombination) ®­îc ph¸t hiÖn, d¹ng nµy cã tÇn sè
lai cao víi F- h¬n F+ cã thÓ lªn ®Õn 104 lÇn. Khi F+ tiÕp xóc víi F- mét thêi gian,
F- biÕn thµnh F+ do nã nhËn ®­îc mét ph©n tö di truyÒn gäi lµ episome. Episome
F+ lµ phÇn tö di truyÒn ngoµi nhiÔm s¾c thÓ, cã thÓ tån t¹i hoÆc ë d¹ng ph©n tö
DNA vßng trßn tù sao chÐp hoÆc g¾n vµo tõng ph©n tö DNA cña tÕ bµo vËt chñ
(phage λ ...). Episome F+ ®­îc gäi lµ nh©n tè giíi tÝnh (sex-factor).
Plasmid lóc ®Çu ®­îc ®Þnh nghÜa lµ ph©n tö DNA vßng trßn nhá cã kh¶ n¨ng
sao chÐp ®éc lËp víi nhiÔm s¾c thÓ tÕ bµo chñ vµ kh«ng cã kh¶ n¨ng g¾n vµo nhiÔm
s¾c thÓ tÕ bµo chñ. Plasmid cã thÓ mang mét sè gen kh¸c nhau nh­ ®Ò kh¸ng thuèc

108
(plasmid R kh¸ng nhiÒu thuèc kh¸ng sinh) .... HiÖn nay, "plasmid" ®­îc dïng cho
c¶ hai nghÜa episome vµ plasmid. C¸c plasmid cã thÓ tån t¹i ®éc lËp hoÆc g¾n vµo
bé gen vi khuÈn. VÒ sau ng­êi ta ph¸t hiÖn ë vi khuÈn cßn cã nhiÒu lo¹i plasmid
kh¸c n÷a. B¶n chÊt di truyÒn cña c¸c dßng F+ , F- , Hfr ®­îc x¸c ®Þnh do c¸c
plasmid nh­ sau:
- F- kh«ng chøa plasmid
- F+ chøa plasmid ë d¹ng ®éc lËp
- Hfr chøa plamid ®­îc g¾n vµo bé gen vi khuÈn
• C¸c nh©n tè F' vµ tÝnh n¹p
Sù c¾t rêi nh©n tè F tõ nhiÔm s¾c thÓ cña dßng Hfr nhiÒu khi kh«ng chÝnh
x¸c vµ lóc ®ã mét ®o¹n bé gen cña vi khuÈn thay thÕ mét phÇn cña F. Trong tr­êng
hîp nµy, nh©n tè F' ®­îc t¹o thµnh vµ nã cã kh¶ n¨ng chuyÓn gen cña vi khuÈn
mét c¸c ®éc lËp, nh­ng víi c¸c tÝnh tr¹ng cña tÕ bµo cho. HiÖn t­îng nµy gäi lµ
tÝnh n¹p (sexduction), cã nghÜa lµ sù chuyÓn gen kÌm theo nh©n tè giíi tÝnh. Nhê
tÝnh n¹p cã thÓ nhËn ®­îc c¸c thÓ l­ìng béi tõng phÇn (merodiploid) theo c¸c gen
®­îc g¾n vµo F+. Do vËy cã thÓ nghiªn cøu ®­îc mèi t­¬ng quan allele vµ c¸c hiÖu
qu¶ do sù gia t¨ng liÒu l­îng gen ë vi khuÈn.

H×nh 2.36. Sù tiÕp hîp vµ t¸i tæ hîp ë vi khuÈn. Sù chuyÓn mét ®o¹n sîi ®¬n cña nhiÔm s¾c thÓ
2.3.3.
tÕ bµo T¸i
cho vµ sù tæ
t¸ihîp
tæ hîp víi nhiÔm s¾c thÓ tÕ bµo nhËn (sù giao n¹p gi÷a tÕ bµo Hfr víi F-).
Muèn x¶y ra t¸i tæ hîp th× hai dßng vi khuÈn ph¶i tiÕp xóc víi nhau (F+x F-)
hoÆc (Hfrx F-). Dßng tÕ bµo mang nh©n tè F+ ®­îc coi lµ tÕ bµo ®ùc vµ cã kh¶ n¨ng
t¹o ra protein pilin, tõ protein nµy t¹o èng giao n¹p gäi lµ pilus. Sù co l¹i cña pilus
®ang nèi hai tÕ bµo lµm chóng tiÕp xóc gÇn nhau (h×nh 2.36). TÕ bµo F- ®­îc coi
lµ c¸i (female). Sau khi giao n¹p tÕ bµo F- thµnh F+.

109
ViÖc chuyÓn gen chØ thùc hiÖn khi plasmid g¾n vµo bé gen cña vi khuÈn.
Trong qu¸ tr×nh chuyÓn vËt chÊt di truyÒn sang F- th× DNA cña tÕ bµo chñ sao chÐp
vµ t¹o m¹ch míi cã ®Çu ori ®i ®Çu vµ F ë cuèi. Qu¸ tr×nh chuyÓn DNA tõ F+ sang
F- cã thÓ bÞ ng¾t qu·ng. C¸c gen a, b, c ®­îc chuyÓn mét chiÒu tõ Hfr sang F-.
Dßng Hfr cã tÇn sè lai cao h¬n nhiÒu v× plasmid ®· n»m s½n trong bé gen, cßn F+
ph¶i quan giai ®o¹n plasmid g¾n vµo bé gen råi míi chuyÓn gen.
Trong ®iÒu kiÖn phßng thÝ nghiÖm ë 370C, toµn bé bé gen cña tÕ bµo E.coli
®­îc chuyÓn sang cho tÕ bµo nhËn trong vßng 90 phót. Th­êng sù giao n¹p bÞ ng¾t
qu·ng gi÷a chõng do c¸c pilus bÞ g·y, nªn Ýt khi bé gen ®­îc chuyÓn nguyªn vÑn
vµo tÕ bµo nhËn. Lóc ®ã tÕ bµo F- vÉn lµ F-. B»ng c¸ch ng¾t qu·ng qu¸ tr×nh giao
n¹p mµ b¶n ®å di truyÒn cña E.coli ®­îc x©y dùng nªn cã d¹ng mét vßng trßn.
2.4.4. LËp b¶n ®å di truyÒn nhiÔm s¾c thÓ cña vi khuÈn
2.4.4. 1. Giao n¹p ng¾t qu·ng (interrupted conjugation)
Khi trén dÞch tÕ bµo Hfr víi F-, sù tiÕp hîp cã thÓ bÞ ng¾t qu·ng vµo tõng thêi
®iÓm tuú ý b»ng c¸ch rung l¾c m¹nh. MÉu ®­îc pha lo·ng nhanh vµ cÊy lªn m«i
tr­êng chän läc. Ngoµi ra, dßng F- ph¶i cã gen ®¸nh dÊu hay gen khuyÕt d­ìng
®Ó chóng kh«ng thÓ mäc ®­îc trªn m«i tr­êng chän läc vµ chØ cã c¸c d¹ng t¸i tæ
hîp mäc lªn. Sù truyÒn DNA cña Hfr sang F- cã tÝnh ph©n cùc, c¸c gen ë ®Çu sang
tr­íc vµ lÇn l­ît c¸c gen kh¸c theo sau. Nhê ng¾t qu·ng cã thÓ x¸c ®Þnh ®­îc thêi
gian mµ mét gen ®­îc truyÒn sang F- vµ kho¶ng c¸ch gi÷a chóng.
VÝ dô: dßng Hfr cã mang c¸c gen nguyªn d­ìng ®¸nh dÊu a+b+c+ ®­îc trén
víi dßng F- mang c¸c allele khuyÕt d­ìng a, b, c. Sù tiÕp hîp ®­îc ng¾t qu·ng víi
kho¶ng c¸ch 5 phót vµ pha lo·ng trªn m«i tr­êng chän läc (m«i tr­êng tèi thiÓu).
KÕt qu¶ thu ®­îc nh­ sau:

Thêi gian (phót) C¸c thÓ t¸i tæ hîp

5 ab+c

10 Ab+c+

15 a+b+c+
Tr×nh tù gen ë dßng Hfr lµ b+ - c+ -a+, b c¸ch ®Çu mót truyÒn sang Ýt h¬n 5
phót, c Ýt h¬n 10 phót, a Ýt h¬n 15 phót, ë ®©y ®¬n vÞ ®o lµ phót.

110
H×nh 2.37. ThÝ nghiÖm lËp b¶n ®å gen cña vi khuÈn b»ng giao n¹p ng¾t qu·ng, c¸c tÕ bµo F-
kh¸ng streptomycin víi c¸c gen ®ét biÕn azi, ton, lac vµ gal ®­îc ñ víi c¸c tÕ bµo Hfr trong
kho¶ng thêi gian kh¸c nhau.

2.4.4. 2. Giao n¹p kh«ng ng¾t qu·ng


NÕu kh«ng rung m¹nh ®Ó ng¾t qu·ng nh©n t¹o, cÇu tÕ bµo chÊt gi÷a hai gen
cµng gÇn ori (ë ®Çu cña DNA thÓ cho), x¸c suÊt ®­îc chuyÓn sang tÕ bµo nhËn
cµng lín. TÇn sè cña c¸c gen xuÊt hiÖn ë d¹ng t¸i tæ hîp trong thÓ nhËn ®­îc ph¸t
hiÖn trªn m«i tr­êng chän läc, tØ lÖ nghÞch víi kho¶ng c¸ch so víi gen ®¸nh dÊu ë
®Çu. C¸c gen cã nhiÒu d¹ng t¸i tæ hîp xuÊt hiÖn th× cµng n»m gÇn phÝa ®Çu tÕ bµo
®­îc chuyÓn sang tÕ bµo nhËn. Kho¶ng c¸ch gi÷a c¸c gen cã thÓ tÝnh b»ng ba lo¹i
®¬n vÞ t¸i tæ hîp: ®¬n vÞ thêi gian, ®¬n vÞ t¸i tæ hîp vµ ®¬n vÞ cÆp base.
VÝ dô: NÕu mét phót giao n¹p t­¬ng ®­¬ng 20 ®¬n vÞ t¸i tæ hîp ë E. coli vµ
nguyªn nhiÔm s¾c thÓ (DNA) ®­îc chuyÓn sang trong 100 phót, th× tæng chiÒu dµi
lµ 2000 ®¬n vÞ t¸i tæ hîp. NÕu DNA cã 107 cÆp nucleotide, th× mét ®¬n vÞ t¸i tæ
hîp b»ng 500bp.
2.4.4.3. LËp b¶n ®å b»ng t¸i tæ hîp
§Æc ®iÓm cña t¸i tæ hîp ë vi khuÈn lµ chØ mét phÇn bé gen ®­îc chuyÓn sang
tÕ bµo nhËn. Mét hay nhiÒu gen cã thÓ ®­îc g¾n vµo nhiÔm s¾c thÓ tÕ bµo nhËn
nhê giao n¹p vµ phô thuéc vµo ®é dµi ®o¹n truyÒn sang. Exogenote ph¶i ®­îc g¾n

111
vµo nhiÔm s¾c thÓ nhËn th× míi ®­îc sao chÐp vµ chia vÒ c¸c tÕ bµo trong dßng.
ChØ mét ®o¹n ng¾n DNA th­êng ®­îc g¾n vµo nhê biÕn n¹p vµ t¶i n¹p. Nh­ vËy
nÕu hai gen cïng biÕn n¹p (cotransformation) th× hai locus ph¶i liªn kÕt chÆt.
T­¬ng tù nh­ vËy, hai gen cïng ®­îc t¶i n¹p vµo phage sÏ ë gÇn nhau. Møc ®é
liªn kÕt gi÷a c¸c gen cã chøc n¨ng kh¸c nhau (intercistronic) hay gi÷a c¸c ®ét biÕn
bªn trong mét gen chøc n¨ng (intracistronic) cã thÓ ®­îc ®¸nh gi¸ tõ kÕt qu¶ lai
chuyªn biÖt.
ë hÖ thèng hîp tö mét phÇn (merozygote), gen ngo¹i lai (exogenote) muèn
g¾n vµo gen néi t¹i (endogenote) ph¶i x¶y ra hai trao ®æi chÐo ë hai ®Çu (h×nh
2.25), v× nÕu chØ cã mét trao ®æi chÐo th× c¶ hai s¶n phÈm nhËn ®­îc ®Òu mÊt c©n
b»ng. Trong c¸c hÖ thèng nµy tæng c¸ thÓ tham gia t¸i tæ hîp kh«ng biÕt ®­îc, nªn
tÇn sè t¸i tæ hîp kh«ng thÓ tÝnh nh­ ë ruåi giÊm (trªn tæng sè c¸ thÓ). Do ®ã, tÇn
sè t¸i tæ hîp ®­îc tr×nh bµy t­¬ng ®èi theo mét sè tiªu chuÈn chung cho tÊt c¶ c¸c
tæ hîp lai. VÝ dô sè l­îng c¸c c¸ thÓ t¸i tæ hîp nguyªn d­ìng ®­îc t¹o ra khi lai
hai dßng ®ét biÕn cã so s¸nh víi kÕt qu¶ khi lai d¹ng hoang d¹i víi tõng lo¹i ®ét
biÕn. Tuy nhiªn, cã nhiÒu sai lÖch vµ cÇn chØnh lý.
X¸c ®Þnh tr×nh tù gen ë vi sinh vËt th­êng phøc t¹p v× cã thÓ x¶y ra hiÖn t­îng
nhiÔu ©m côc bé (localized negative interference). Ph­¬ng ph¸p x¸c ®Þnh tr×nh tù
gen th­êng dïng lµ lai ba ®iÓm ho¸n ®æi (three-factor-reciprocall crosses). Ngoµi
ra, cã thÓ x©y dùng b¶n ®å di truyÒn b»ng c¸ch sö dông c¸c mÊt ®o¹n ë phage.

H×nh 2.38. B¶n ®å gen cña vi khuÈn E. coli dùa vµo tiÕp hîp ng¾t qu·ng víi ®¬n vÞ ®o lµ phót

112
ch­¬ng 3
qu¸ tr×nh phiªn m· vµ dÞch m·
1. qu¸ tr×nh phiªn m·
Qu¸ tr×nh phiªn m· - sinh tæng hîp RNA - lµ nh÷ng qu¸ tr×nh chuyÓn th«ng
tin di truyÒn tõ ph©n tö DNA sang ph©n tö RNA. B¶n chÊt ho¸ häc cña qu¸ tr×nh
nµy vµ qu¸ tr×nh sinh tæng hîp DNA rÊt gièng nhau nh­ng chóng l¹i mang mét ý
nghÜa sinh häc kh¸c biÖt. Trong phÇn nµy, chóng ta häc vÒ b­íc ®Çu tiªn cña qu¸
tr×nh chuyÓn th«ng tin tõ c¸c gen ®Õn s¶n phÈm cña gen. BÊt kú mét tr×nh tù DNA
nµo trong bé gen cña bÊt kú mét sinh vËt nµo ®ã còng cã thÓ m· hãa cho c¸c s¶n
phÈm gen mµ nã cã thÓ t¹o ra. §Ó sö dông th«ng tin di truyÒn, mét b¶n sao trung
gian cña gen ®­îc t¹o ra b»ng c¸ch sö dông tr×nh tù cña DNA. Ph©n tö trung gian
nµy lµ RNA vµ qu¸ tr×nh tæng hîp t¹o ra nã lµ qu¸ tr×nh phiªn m·. Sù truyÒn th«ng
tin x¶y ra theo nhiÒu b­íc, b­íc ®Çu tiªn lµ phiªn m· DNA thµnh RNA, b­íc thø
hai lµ chuyÓn th«ng tin m· hãa trong RNA thµnh chuçi amino acid (polypeptide)
b»ng mét qu¸ tr×nh dÞch m·. Hai b­íc chuyÓn th«ng tin nµy ®­îc thùc hiÖn trong
cïng mét kh«ng gian vµ thêi gian ë prokaryote, cßn ë eukaryote th× l¹i x¶y ra ë
c¸c kh«ng gian riªng biÖt, cã nghÜa lµ qu¸ tr×nh phiªn m· x¶y ra ë trong nh©n vµ
qu¸ tr×nh dÞch m· x¶y ra ë tÕ bµo chÊt. Gièng nh­ ë sao chÐp, qu¸ tr×nh phiªn m·
®­îc thùc hiÖn bëi mét bé m¸y, mµ ë eukaryote nã kÕt hîp qu¸ tr×nh tæng hîp vµ
biÕn ®æi mRNA, ë mét sè gen s¶n phÈm cuèi cïng cña qu¸ tr×nh chuyÓn th«ng tin
lµ RNA. B¶ng 3.1 cho thÊy sù gièng vµ kh¸c nhau cña qu¸ tr×nh sao chÐp víi qu¸
tr×nh phiªn m·.
B¶ng 3.1: So s¸nh sù gièng vµ kh¸c nhau cña hai qu¸ tr×nh phiªn m· vµ sao chÐp
Qu¸ tr×nh phiªn m· Qu¸ tr×nh sao chÐp
Kh¸c nhau - Khu«n DNA ®­îc b¶o tån - Khu«n DNA ®­îc b¸n b¶o
trong qu¸ tr×nh tæng hîp. tån trong qu¸ tr×nh sao chÐp.
- RNA polymerase kh«ng cã - DNA polymerase cã ho¹t
ho¹t tÝnh nuclease. tÝnh nuclease.
- Qu¸ tr×nh tæng hîp RNA - Qu¸ tr×nh sao chÐp cÇn sù
kh«ng cÇn sù cã mÆt cña måi. cã mÆt cña måi
- Liªn quan ®Õn tÝnh ®a d¹ng vµ - Qu¸ tr×nh sao chÐp cã tÝnh
biÕn ®éng trong sù biÓu hiÖn c¸c æn ®Þnh cao, ®¶m b¶o viÖc
tÝnh tr¹ng di truyÒn .

113
truyÒn ®¹t nguyªn vÑn bé
gen.
Gièng nhau - ChiÒu tæng hîp lµ 5'3'
- N¨ng l­îng tæng hîp nhê thuû gi¶i ATP
Gi÷a tÕ bµo eukaryote vµ prokaryote, qu¸ tr×nh phiªn m· còng cã kh¸c nhau.
Tuy ®Òu gåm ba giai ®o¹n: khëi ®Çu, kÐo dµi vµ kÕt thóc, nh­ng sù kh¸c nhau l¹i
lµ:
- Bé gen cña prokaryote n»m tù do trong tÕ bµo chÊt, cßn bé gen cña
eukaryote th× n»m trong nh©n ®­îc bao bäc bëi mµng nh©n.
- C¸c yÕu tè tham gia vµo qu¸ tr×nh khëi ®Çu, kÐo dµi vµ kÕt thóc ë c¸c tÕ bµo
kh¸c nhau.
- Enzyme tæng hîp ë tÕ bµo prokaryote chØ lµ mét lo¹i enzyme lµ RNA
polymerase, cßn ë eukaryote cã tíi ba lo¹i enzyme.
- mRNA cña eukaryote t¹o ra kh«ng ho¹t ®éng ngay nh­ mRNA cña
prokaryote, mµ ph¶i tr¶i qua mét lo¹t biÕn ®æi míi thÓ hiÖn chøc n¨ng ho¹t ®éng
cña m×nh.
- mRNA cña eukaryote chØ m· ho¸ cho mét protein cßn mRNA cña
prokaryote cã nhiÒu ®o¹n tr×nh tù vµ mçi ®o¹n tr×nh tù l¹i m· ho¸ cho mét protein.
1.1. PROMOTER Vµ C¸C PROTEIN THAM GIA KHëI §éNG
PHI£N M·
1.1.1. Promoter

H×nh 3.1. Tr×nh tù khëi ®Çu cña qu¸ tr×nh phiªn m· ë prokaryote

114
CÊu tróc cña mét gen gåm hai phÇn chÝnh: phÇn mang c¸c m· di truyÒn vµ
phÇn chøa c¸c nucleotide liªn quan ®Õn chøc n¨ng ®iÒu khiÓn phiªn m· tõ DNA
(gen) sang sîi RNA. VÞ trÝ nucleotide ®Çu tiªn trªn DNA ®­îc phiªn m· sang
RNA ®­îc kÝ hiÖu lµ +1. Víi quy ®Þnh nµy, c¸c nucleotide n»m trong phÇn ®iÒu
khiÓn (ë vïng 5' phÝa tr­íc vÞ trÝ +1) sÏ ®­îc kÝ hiÖu lµ vÞ trÝ (-). Vïng ®iÒu khiÓn
gen bao gåm promoter vµ c¸c tr×nh tù ®Æc biÖt (response element) ®­îc nhËn biÕt
bëi c¸c yÕu tè phiªn m· (transcription factor).
Promoter lµ tr×nh tù nucleotide cÇn thiÕt ®Ó RNA polymerase b¸m vµo b¾t
®Çu phiªn m·. Tr×nh tù nµy n»m ngay tr­íc vÞ trÝ +1 (h×nh 3.1) ë c¸c gen
prokaryote. Tuy nhiªn, promoter cña gen eukaryote th­êng ®­îc xem xÐt gåm vÞ
trÝ nhËn biÕt bëi RNA polymerase vµ c¸c tr×nh tù ®Æc biÖt nhËn biÕt bëi yÕu tè
phiªn m·. §ã lµ do phiªn m· trªn gen prokaryote cã thÓ x¶y ra ngay khi mét m×nh
RNA polymerase b¸m vµo promoter trong khi ®iÒu nµy hÇu nh­ kh«ng x¶y ra víi
gen eukaryote.
Khi tiÕn hµnh thÝ nghiÖm g©y ®ét biÕn thay thÕ hoÆc mÊt ®o¹n c¸c nucleotide
cña promoter cho phÐp x¸c ®Þnh chÝnh x¸c c¸c nucleotide kh«ng thÓ thiÕu ®èi víi
khëi ®Çu phiªn m·. KÕt qu¶ cho thÊy promoter cña gen m· cho protein th­êng
gåm hai tr×nh tù riªng biÖt ph©n bè ngay tr­íc ®iÓm khëi ®Çu phiªn m·. Tr×nh tù
c¬ b¶n cña promoter (core promoter) th­êng gåm c¸c nucleotide ë vÞ trÝ -10 ®Õn
vµi nucleotide sau +1 ®èi víi gen vi khuÈn, hoÆc gåm c¸c nucleotide ë vÞ trÝ -40
®Õn +20 ®èi víi gen eukaryote. HÇu hÕt tr×nh tù c¬ b¶n ë gen prokaryote vµ
eukaryote ®Òu chøa mét ®o¹n ng¾n giµu A-T gäi lµ hép TATA. Hép TATA ë vÞ
trÝ -10 cña promoter vi khuÈn, nh­ng l¹i ph©n bè ë vÞ trÝ -25 trªn promoter
eukaryote. Khi promoter chØ cã tr×nh tù c¬ b¶n th× møc ®é phiªn m· x¶y ra rÊt
thÊp. Møc ®é phiªn m· t¨ng lªn rÊt nhiÒu khi promoter cã thªm tr×nh tù n»m phÝa
tr­íc tr×nh tù c¬ b¶n. Tr×nh tù thø hai nµy th­êng n»m ë vÞ trÝ -35 ®èi víi gen vi
khuÈn, hoÆc vÞ trÝ -70 ®Õn -90 ë gen eukaryote. RNA polymerase vi khuÈn cã thÓ
tù nã nhËn biÕt promoter vµ khëi ®Çu phiªn m·. Tuy nhiªn, RNA polymerase II
kh«ng thÓ tù m×nh khëi ®Çu phiªn m· nÕu nh­ kh«ng cã sù trî gióp cña c¸c yÕu
tè phiªn m·.
§iÒu cÇn l­u ý lµ mét sè gen kh«ng cã cÊu tróc promoter ®iÓn h×nh, hoÆc c¸c
gen ho¹t ®éng ë nh÷ng ®iÒu kiÖn kh¸c nhau ®ßi hái RNA polymerase ph¶i liªn kÕt
víi c¸c yÕu tè kh¸c nhau. §èi víi vi khuÈn chØ cã mét lo¹i RNA polymerase,
nh­ng lâi enzyme cã thÓ liªn kÕt víi c¸c yÕu tè sigma (σ) kh¸c nhau ®Ó phiªn m·
(sÏ thÊy râ ë ch­¬ng sau).

115
Promoter cña gen eukaryote m· cho protein ®­îc nhËn biÕt bëi RNA
polymerase II. Tuy nhiªn, enzyme chØ t­¬ng t¸c víi promoter sau khi hÇu hÕt c¸c
yÕu tè phiªn m· (h×nh 3.5). Ngoµi ra, phiªn m· ë eukaryote cßn ®ßi hái c¸c tr×nh
tù t¨ng c­êng (enhancer). Tr×nh tù t¨ng c­êng th­êng ®Æc thï cho tõng gen hoÆc
nhãm gen, tr×nh tù nµy cã thÓ ph©n bè phÝa tr­íc, sau hoÆc ngay trong gen. Tr×nh
tù t¨ng c­êng lµ vÞ trÝ t­¬ng t¸c víi yÕu tè ho¹t hãa. §iÒu nµy cã thÓ dÉn tíi thay
®æi côc bé cÊu tróc ®o¹n DNA chøa promoter, hoÆc lµm t¨ng nång ®é c¸c yÕu tè
ho¹t hãa t¹i promoter. Nh­ vËy, vai trß cña tr×nh tù t¨ng c­êng lµ t¨ng møc ®é
phiªn m· trªn promoter.
1.1.2. C¸c protein tham gia khëi ®Çu phiªn m·
Qu¸ tr×nh phiªn m· trªn c¸c gen eukaryote ®­îc kiÓm so¸t chñ yÕu ë giai
®o¹n khëi ®Çu. Giai ®o¹n nµy phô thuéc vµo sù t­¬ng t¸c gi÷a c¸c yÕu tè phiªn m·
víi nhau, hoÆc víi c¸c tr×nh tù nucleotide ®Æc biÖt. KÕt qu¶ cña nh÷ng t­¬ng t¸c
®an chÐo dÉn ®Õn t¨ng c­êng hoÆc øc chÕ RNA polymerase tæng hîp RNA. C¸c
yÕu tè cã chøc n¨ng t¨ng c­êng ho¹t ®éng phiªn m· ®­îc gäi lµ yÕu tè ho¹t hãa
(activator). C¸c yÕu tè cã chøc n¨ng øc chÕ ho¹t ®éng phiªn m· gäi lµ yÕt tè k×m
h·m (repressor). C¸c yÕu tè ho¹t hãa vµ k×m h·m ®Òu cã thÓ liªn kÕt víi c¸c protein
kh¸c nhau ®Ó ®iÒu chØnh ho¹t tÝnh cña m×nh. Protein liªn kÕt víi yÕu tè ho¹t hãa
gióp yÕu tè ho¹t hãa thùc thi nhiÖm vô ®­îc gäi lµ yÕu tè ®ång ho¹t hãa (co-
activator). T­¬ng tù, protein liªn kÕt víi yÕu tè k×m h·m ®Ó øc chÕ phiªn m· th×
®­îc gäi lµ yÕu tè ®ång k×m h·m (co-repressor). HÇu hÕt c¸c yÕu tè phiªn m· cã
nhiÒu vïng (domain). Mçi vïng cã vai trß ®Æc hiÖu ®¶m b¶o t­¬ng t¸c víi RNA
polymerase, víi DNA, hoÆc víi c¸c protein kh¸c.
YÕu tè ho¹t hãa cã kh¶ n¨ng nhËn biÕt vµ t­¬ng t¸c víi tr×nh tù nucleotide
®Æc biÖt nh­ promoter (n»m trong vïng ®iÒu khiÓn phÝa tr­íc vïng mang m· di
truyÒn cña gen), hoÆc t­¬ng t¸c víi tr×nh tù t¨ng c­êng n»m c¸ch xa gen (phÝa
tr­íc, phÝa sau hoÆc ngay trong gen). Sù cã mÆt cña yÕu tè ho¹t hãa gióp RNA
polymerase II dÔ dµng t­¬ng t¸c víi promoter vµ b¾t ®Çu ph¶n øng tæng hîp RNA.
Nh­ vËy, chøc n¨ng cña yÕu tè ho¹t hãa lµ t¨ng c­êng tèc ®é khëi ®Çu phiªn m·
t¹i promoter. Mét sè yÕu tè ho¹t hãa ho¹t ®éng liªn tôc. Tuy nhiªn, cã rÊt nhiÒu
yÕu tè ho¹t hãa chØ ho¹t ®éng t¹i nh÷ng thêi ®iÓm vµ chØ cã mÆt trong mét sè m«,
tæ chøc nhÊt ®Þnh. §Æc biÖt, nh÷ng yÕu tè ho¹t hãa kÝch ho¹t c¸c gen mµ s¶n phÈm
cña chóng cÇn thiÕt trong giai ®o¹n sinh tr­ëng ph¸t triÓn cña c¬ thÓ. HÇu hÕt c¸c
yÕu tè ho¹t hãa ho¹t ®éng theo thêi gian vµ kh«ng gian sÏ nhËn biÕt vµ t­¬ng t¸c
víi nh÷ng tr×nh tù ®Æc hiÖu cña riªng tõng nhãm gen hoÆc tõng gen riªng biÖt.

116
Kh¸c víi yÕu tè ho¹t hãa, yÕu tè k×m h·m lu«n lu«n t­¬ng t¸c víi tr×nh tù
®Æc hiÖu trªn ph©n tö DNA. T¹i vÞ trÝ ®ã, yÕu tè k×m h·m cã thÓ t­¬ng t¸c víi RNA
polymerase ®Ó ng¨n c¶n enzyme khëi ®Çu phiªn m·. VÝ dô, yÕu tè k×m h·m t­¬ng
t¸c víi vÞ trÝ operator n»m gèi lªn promoter cña operon lac ë E.coli. YÕu tè k×m
h·m t¸ch khái DNA khi cã mÆt yÕu tè c¶m øng hay cßn gäi lµ yÕu tè kÝch thÝch
(inducer). Mét promoter cã thÓ cã nhiÒu vÞ trÝ cho yÕu tè ho¹t hãa còng nh­ nhiÒu
vÞ trÝ cho yÕu tè k×m h·m. Tïy thuéc vµo vÞ trÝ trªn DNA, hoÆc sù cã mÆt cña c¸c
yÕu tè kÝch thÝch mµ yÕu tè k×m h·m øc chÕ ë c¸c møc ®é kh¸c nhau.
1.2. qu¸ tr×nh phiªn m· ë prokaryote
1.2.1. Mét sè ®Æc ®iÓm cña qu¸ tr×nh phiªn m· ë prokaryote
1.2.1.1. Qu¸ tr×nh phiªn m· lµ mét ph¶n øng enzyme tæng hîp RNA tõ
khu«n DNA
Qu¸ tr×nh phiªn m· lµ b­íc ®Çu tiªn truyÒn th«ng tin tõ gen ®Õn protein, t¹o
ra mét sîi RNA cã tr×nh tù bæ sung víi tr×nh tù cña mét ®o¹n DNA. RNA ®­îc
tæng hîp tõ khu«n DNA theo c¬ chÕ bæ sung t­¬ng tù nh­ sù sao chÐp mét sîi
DNA míi tõ khu«n DNA ®· cã. Theo c¬ chÕ nµy, hai m¹ch cña ph©n tö DNA sÏ
t¸ch rêi nhau vµ mét m¹ch ®¬n ®­îc dïng lµm khu«n. ChÝnh sù hiÖn diÖn cña mét
enzyme chuyªn biÖt: RNA polymerase sÏ quyÕt ®Þnh viÖc sö dông khu«n nµy vµo
sinh tæng hîp RNA thay v× sao chÐp mét sîi DNA míi. HiÖn t­îng phiªn m· dï
mang tÝnh chÝnh x¸c cao, nh­ng do kh«ng cã c¬ chÕ söa sai ®i kÌm nªn ®é chÝnh
x¸c kÐm xa ë qu¸ tr×nh sao chÐp. Tuy nhiªn, v× c¸c RNA ®­îc phiªn m· kh«ng
bao giê ®­îc sao chÐp l¹i nªn c¸c sai sãt cã thÓ x¶y ra kh«ng ¶nh h­ëng ®Õn viÖc
truyÒn ®¹t th«ng tin di truyÒn l¹i cho thÕ hÖ sau.
1.2.1.2. ChØ mét trong hai m¹ch ®¬n cña ph©n tö DNA ®­îc dïng lµm
khu«n
ë møc ®é tõng gen riªng biÖt, RNA polymerase quyÕt ®Þnh viÖc chän m¹ch
khu«n b»ng c¸ch g¾n vµo mét tr×nh tù ®Æc biÖt trªn m¹ch ®­îc chän lµm khu«n,
tr×nh tù ®ã ®­îc gäi lµ promoter. ë møc ®é nhiÔm s¾c thÓ, sù viÖc phøc t¹p h¬n,
c¶ hai nhiÔm s¾c thÓ ®Òu ®­îc dïng lµm khu«n. §èi víi mét sè gen, sù phiªn m·
x¶y ra trªn mét nhiÔm s¾c thÓ, ®èi víi mét sè gen kh¸c, sù phiªn m· l¹i x¶y ra ë
nhiÔm s¾c thÓ kia. Sù phiªn m· x¶y ra theo mét chiÒu x¸c ®Þnh (5'  3'), gièng
nh­ trong qu¸ tr×nh sao chÐp. ChiÒu di chuyÓn cña RNA polymerase sÏ quyÕt ®Þnh
m¹ch ®¬n nµo ®­îc sö dông lµm khu«n.

117
Qu¸ tr×nh phiªn m· ®­îc thùc hiÖn dùa vµo tÝnh b¾t cÆp bæ sung cña c¸c base.
§Çu tiªn, hai sîi DNA xo¾n kÐp ®­îc t¸ch ra vµ mét sîi ®­îc sö dông lµm khu«n
®Ó tæng hîp RNA. TiÕp theo, c¸c ribonucleotide ®­îc ®Þnh vÞ b¾t cÆp bæ sung ®èi
diÖn víi c¸c base trªn khu«n DNA ®­îc thùc hiÖn bëi RNA polymerase, mµ
enzyme nµy tiÕp xóc vµ di chuyÓn däc theo DNA, sù liªn kÕt s¾p hµng cña c¸c
ribonucleotide lµm cho RNA mäc dµi ra nh­ h×nh 3.2. Trong qu¸ tr×nh tæng hîp,
RNA ®­îc kÐo dµi theo chiÒu 5’  3’, hay nãi c¸ch kh¸c c¸c ribonucleotide lu«n
®­îc thªm vµo ë ®Çu 3’OH. §iÒu nµy cã nghÜa lµ khu«n DNA ph¶i lµ h­íng 3’ 
5’. Trong qu¸ tr×nh phiªn m·, RNA polymerase di chuyÓn trªn DNA, th¸o xo¾n ë
mét ®Çu vµ ®ãng xo¾n ë ®Çu kia. §Çu 5’ cña RNA míi ®­îc tæng hîp ®­îc ®Èy ra
khái khu«n khi bãng phiªn m· ®ãng l¹i ë phÝa bªn kia RNA polymerase. “Con
tµu” RNA polymerase tæng hîp RNA vµ di chuyÓn däc theo khu«n, t¹o ra sîi
RNA cã tr×nh tù gièng víi sîi DNA kh«ng ®­îc sö dông lµm khu«n.
1.2.1.3. Enzyme RNA polymerase ®­îc cÊu t¹o tõ nhiÒu tiÓu ®¬n vÞ
ë prokaryote, RNA polymerase cã cÊu tróc bËc 4 rÊt phøc t¹p, bao gåm n¨m
chuçi polypeptide β', β, σ, α vµ σ nèi víi nhau bëi c¸c liªn kÕt ho¸ häc yÕu. CÊu
tróc phøc t¹p nµy cã lÏ liªn quan ®Õn sù phøc t¹p vµ ®a d¹ng cña c¸c c¬ chÕ kiÓm
tra qu¸ tr×nh phiªn m·.
1.2.2. C¸c giai ®o¹n cña qu¸ tr×nh phiªn m·: Khëi ®Çu, kÐo dµi vµ kÕt thóc

H×nh 3.2. C¸c giai ®o¹n cña qu¸ tr×nh phiªn m· ë prokaryote

(a) giai ®o¹n RNA polymerase liªn kÕt víi promoter, (b) khëi ®Çu phiªn m·, (c) kÐo dµi, (d)
kÕt thóc phiªn m·

118
1.2.2.1. Giai ®o¹n khëi ®Çu
ë prokaryote, RNA polymerase th­êng liªn kÕt víi mét tr×nh tù ®Æc biÖt gäi
lµ promoter, n»m gÇn vÞ trÝ b¾t ®Çu phiªn m·. Promoter lµ mét phÇn quan träng
cña vïng ®iÒu hßa gen. V× ë prokaryote chØ cã mét RNA polymerase liªn kÕt víi
c¸c tr×nh tù promoter cña c¸c gen kh¸c nhau, do ®ã kh«ng cã g× ®¸ng ng¹c nhiªn
khi cã sù t­¬ng ®ång vÒ tr×nh tù cña c¸c promoter. Nh×n chung, c¸c promoter cã
hai vïng lín t­¬ng tù nhau lµ vïng -35 vµ -10, v× chóng n»m ë phÝa cÆp tr×nh tù
cÆp base 35 vµ 10 ë phÝa th­îng nguån c¸ch base ®Çu tiªn ®­îc phiªn m·. Enzyme
RNA polymerase lµ mét holoenzyme liªn kÕt víi DNA ë vïng tr×nh tù nµy, sau
®ã th¸o xo¾n DNA vµ b¾t ®Çu phiªn m· RNA. Nh÷ng base ®­îc phiªn m· ®Çu tiªn
lu«n ë cïng mét vÞ trÝ, gäi lµ vÞ trÝ +1, chó ý r»ng RNA ®­îc b¾t ®Çu phiªn m· ë
tr­íc vïng m· hãa cho protein cña gen (th­êng lµ tr×nh tù ATG, lµ n¬i b¾t ®Çu
dÞch m·), do ®ã b¶n phiªn m· nµy cã mét vïng gäi lµ vïng 5’ kh«ng dÞch m· (viÕt
t¾t lµ 5’ UTR – 5’ untranslated region).
D­íi ®¬n vÞ σ liªn kÕt ®Æc hiÖu víi vïng -10 vµ -35, do ®ã nã ®Þnh vÞ
holoenzyme ®Ó khëi ®Çu phiªn m· chÝnh x¸c t¹i vÞ trÝ b¾t ®Çu phiªn m·. Ngoµi ra,
d­íi ®¬n vÞ σ còng ®ãng vai trß t¸ch sîi DNA ë vïng tr×nh tù -10. V× thÕ mµ lâi
enzyme cã thÓ liªn kÕt chÆt víi DNA ®Ó chuÈn bÞ tæng hîp RNA.
RNA polymerase nhËn biÕt tr×nh tù khëi ®Çu trªn sîi DNA (promoter), nhê
tiÓu ®¬n vÞ σ. NhiÒu thÝ nghiÖm cho thÊy nÕu thiÕu nh©n tè σ, RNA polymerase
sÏ b¾t ®Çu khëi ®Çu phiªn m· mét c¸ch tuú tiÖn trong khi víi sù hiÖn diÖn cña σ,
enzyme cã kh¶ n¨ng g¾n chuyªn biÖt vµo ®óng promoter. Nh©n tè σ nhËn biÕt
®­îc promoter lµ nhê cÊu tróc ®Æc tr­ng cña nã. §Æc ®iÓm cÊu tróc cña promoter
lµ hai tr×nh tù gåm 6 nucleotide, mét tr×nh tù n»m c¸ch ®iÓm vÞ trÝ b¾t ®Çu sinh
tæng hîp RNA 10 cÆp base (tr×nh tù -10), tr×nh tù kia c¸ch 35 cÆp base (tr×nh tù -
35).
RNA polymerase g¾n vµo promoter theo hai b­íc: Tr­íc hÕt, enzyme nhËn
biÕt vµ g¾n mét c¸ch láng lÎo vµo tr×nh tù -35 h×nh thµnh mét phøc hîp "®ãng".
Sau ®ã, phøc hîp nµy chuyÓn thµnh phøc hîp "më", trong giai ®o¹n nµy mét vïng
DNA b¾t ®Çu tõ tr×nh tù -10 sÏ ®­îc th¸o xo¾n vµ mét sîi ®¬n DNA ph¬i ra d­íi
d¹ng tù do lµm khu«n cho sù sinh tæng hîp RNA.
1.2.2.2. Giai ®o¹n kÐo dµi
Khi ph©n tö RNA ®¹t chiÒu dµi kho¶ng 8 nucleotide th× nh©n tè σ t¸ch khái
phøc hîp enzyme. Lóc bÊy giê σ l¹i cã thÓ g¾n vµo mét promoter kh¸c ®Ó khëi

119
®Çu mét qu¸ tr×nh phiªn m· míi. Sù t¸ch rêi cña nh©n tè σ cÇn thiÕt cho giai ®o¹n
kÐo dµi v× sù cã mÆt tiÕp tôc cña nã sÏ g¾n chÆt phøc hîp enzyme vµo promoter
khiÕn cho enzyme kh«ng thÓ tr­ît dµi theo sîi khu«n DNA ®Ó tiÕn hµnh qu¸ tr×nh
sinh tæng hîp. Nh©n tè σ ®­îc thay thÕ b»ng c¸c nh©n tè kÐo dµi (elongation
factors).
RNA polymerase th¸o xo¾n liªn tôc ph©n tö DNA trªn mét chiÒu dµi kho¶ng
17 nucleotide theo tiÕn triÓn cña qu¸ tr×nh sinh tæng hîp. Sîi RNA míi sÏ t¸ch
dÇn khái m¹ch khu«n DNA trõ mét ®o¹n dµi 12 nucleotide b¾t ®Çu tõ ®iÓm t¨ng
tr­ëng vÉn liªn kÕt víi DNA. PhÇn DNA ®­îc th¸o xo¾n sÏ ®­îc RNA polymerase
xo¾n trë l¹i sau ®ã.
Khi RNA polymerase di chuyÓn däc theo khu«n DNA, nã th¸o xo¾n ë mét
®Çu vµ ®ãng xo¾n ë vïng DNA ®· ®­îc phiªn m· (h×nh 3.2). Bªn trong bãng phiªn
m·, sîi khu«n ®­îc lé ra, RNA polymerase ®iÒu khiÓn sù liªn kÕt cña c¸c
ribonucleotide tù do víi c¸c base kÕ tiÕp lé ra trªn khu«n DNA vµ nÕu nã b¾t cÆp
bæ sung víi khu«n th× nã ®­îc thªm vµo chuçi. N¨ng l­îng ®­îc sö dông trong
tr­êng hîp nµy lµ qu¸ tr×nh ph©n c¾t n¨ng l­îng liªn kÕt cao n¨ng cña ATP, kÕt
qu¶ gi¶i phãng ra mét phosphat h÷u c¬, theo c«ng thøc sau:
NTP + (NMP) n  (NMP) n+1 + P i
Trong giai ®o¹n kÐo dµi, cã Ýt nhÊt 10 nucleotide ®­îc thªm vµo chuçi RNA
h×nh thµnh nªn d¹ng lai RNA:DNA b»ng liªn kÕt bæ sung víi c¸c base cña khu«n
trong bãng phiªn m·.
1.2.2.3. Giai ®o¹n kÕt thóc
Qu¸ tr×nh phiªn m· cña tõng gen ®­îc kÕt thóc ë phÝa bªn kia vïng m· hãa
cho protein cña gen, t¹o ra vïng 3’ kh«ng m· hãa (3’UTR – 3’ untranslated
region) t¹i ®u«i cña b¶n phiªn m· (RNA). Giai ®o¹n kÐo dµi tiÕp tôc cho tíi khi
RNA polymerase nhËn biÕt nh÷ng tr×nh tù nucleotide ®Æc biÖt, mµ nã ho¹t ®éng
nh­ lµ mét tÝn hiÖu kÕt thóc chuçi. Nh÷ng tÝn hiÖu nµy cho phÐp RNA polymerase
ngõng qu¸ tr×nh sinh tæng hîp, nh¶ sîi DNA khu«n ra vµ l¹i cã thÓ b¾t ®Çu ho¹t
®éng ë n¬i kh¸c. ë E.coli vµ c¸c vi khuÈn kh¸c cã hai c¬ chÕ chÝnh cho giai ®o¹n
kÕt thóc ®­îc gäi lµ: giai ®o¹n kÕt thóc kh«ng phô thuéc Rho vµ giai ®o¹n kÕt thóc
phô thuéc Rho (ρ).
Giai ®o¹n kÕt thóc kh«ng phô thuéc ρ lµ giai ®o¹n kÕt thóc phiªn m· trùc
tiÕp. Tr×nh tù kÕt thóc kho¶ng 40bp, phÝa ®u«i giµu GC vµ theo sau lµ mét ®o¹n
tr×nh tù dµi kho¶ng 6bp (chøa toµn A). V× GC trªn khu«n sÏ t¹o ra tr×nh tù CG trªn

120
RNA vµ sù b¾t cÆp gi÷a C-G t¹o ra cÊu tróc kÑp tãc bÒn v÷ng (v× sù b¾t cÆp gi÷a
C-G æn ®Þnh h¬n gi÷a U-A). Theo sau cÊu tróc kÑp tãc lµ ®u«i kho¶ng 6U liªn kÕt
víi 6A trªn khu«n DNA.
B×nh th­êng trong giai ®o¹n kÐo dµi RNA, RNA polymerase sÏ dõng l¹i nÕu
®o¹n lai RNA:DNA trong bãng phiªn m· liªn kÕt víi nhau yÕu vµ sÏ thay ®æi ®Ó
lµm æn ®Þnh ®o¹n lai. Trong c¬ chÕ nµy, RNA polymerase ®­îc cho lµ bÞ dõng l¹i
sau khi ®· tæng hîp c¸c U (h×nh thµnh nªn ®o¹n lai RNA:DNA liªn kÕt yÕu) vµ sù
tiÕp xóc gi÷a cÊu tróc kÑp tãc víi RNA polymerase, ng¨n c¶n enzyme t¹o ra sù æn
®Þnh l¹i cho sîi lai. Rµo ch¾n nµy khiÕn cho RNA polymerase nh¶ sîi RNA míi
tæng hîp ra khái khu«n vµ kÕt thóc qu¸ tr×nh phiªn m·.
KiÓu kÕt thóc phiªn m· thø hai lµ giai ®o¹n kÕt thóc phô thuéc Rho (ρ): nh©n
tè ρ gióp cho RNA polymerase nhËn biÕt tÝn hiÖu kÕt thóc phiªn m·. C¸c RNA cã
tÝn hiÖu kÕt thóc phiªn m· phô thuéc nh©n tè ρ kh«ng b¾t buéc ph¶i cã ®u«i U ë
phÝa ®u«i RNA vµ th­êng kh«ng cã vßng kÑp tãc. Thay v× ®ã, chóng cã mét tr×nh
tù kho¶ng 40 ®Õn 60bp giµu C vµ Ýt G n»m ë vïng th­îng nguån (phÝa ®Çu 5’) cã
vÞ trÝ rut, lµ vÞ trÝ liªn kÕt víi nh©n tè ρ. Rho, lµ mét protein hexamer gåm 6 ®¬n
ph©n, cã kh¶ n¨ng liªn kÕt víi RNA míi tæng hîp t¹i vÞ trÝ rut. VÞ trÝ nµy n»m ë
phÝa ®Çu 5’ n¬i mµ RNA cã xu h­íng tæng hîp RNA chËm l¹i. Sau khi liªn kÕt,
nh©n tè ρ dÔ dµng gi¶i phãng sîi RNA ra khái bãng phiªn m·. Do ®ã, giai ®o¹n
kÕt thóc phiªn m· phô thuéc ρ ®­îc t¹o ra do sù liªn kÕt cña ρ víi vÞ trÝ rut, ®Ó
ngõng qu¸ tr×nh phiªn m·, ρ gi¸n tiÕp t¸ch RNA ra khái RNA polymerase.

b
a H×nh 3.3. KÕt thóc phiªn m· kh«ng phô thuéc ρ (a), kÕt thóc phiªn m· phô thuéc ρ (b)

121
1.3. qu¸ tr×nh phiªn m· ë eukaryote
1.3.1. Qu¸ tr×nh phiªn m· ë eukaryote cã mét sè ®Æc ®iÓm kh¸c biÖt so
víi ë prokaryote
Nh­ chóng ta ®· häc ë ch­¬ng 2, qu¸ tr×nh sao chÐp DNA ë eukaryote mÆc
dï rÊt phøc t¹p, nh­ng nh×n chung nã còng t­¬ng tù nh­ qu¸ tr×nh sao chÐp DNA
ë prokaryote. Còng gièng nh­ vËy, qu¸ tr×nh phiªn m· ë eukaryote còng bao gåm
c¸c giai ®o¹n nh­: khëi ®Çu, kÐo dµi vµ kÕt thóc nh­ ë prokaryote, nh­ng phøc t¹p
h¬n. Sù phøc t¹p cña qu¸ tr×nh phiªn m· ë eukaryote lµ do ba lÝ do sau:
 LÝ do ®Çu tiªn lµ do bé gen cña eukaryote cã nhiÒu gen h¬n, vi khuÈn chØ cã
kho¶ng vµi ngµn gen cßn eukaryote cã kho¶ng hµng chôc ngµn gen. H¬n thÕ n÷a,
mËt ®é ph©n bè gen ë prokaryote cao h¬n ë eukaryote. VÝ dô nh­ ë E.coli mËt ®é
gen lµ 900gen/1triÖu cÆp base, trong khi ®ã ruåi giÊm chØ cã kho¶ng 110gen vµ
thËm chÝ ë ng­êi cßn Ýt h¬n, chØ cã kho¶ng 9gen/1triÖu cÆp base. Do ®ã, mËt ®é
ph©n bè gen nµy lµm cho qu¸ tr×nh phiªn m·, ®Æc biÖt lµ giai ®o¹n khëi ®Çu phiªn
m· ë eukaryote lµ mét giai ®o¹n phøc t¹p h¬n ë prokaryote. V× thÕ ë eukaryote cã
mét sè ®Æc ®iÓm sau:
- §Çu tiªn chóng ph©n chia c«ng viÖc phiªn m· cho ba lo¹i RNA polymerase
kh¸c nhau: RNA polymerase lo¹i I cho c¸c RNA cña ribosome (ngo¹i trõ rRNA
5S). RNA polymerase lo¹i II phiªn m· cho tÊt c¶ c¸c gen m· hãa cho protein, b¶n
phiªn m· nã t¹o ran lµ c¸c RNA th«ng tin, bªn c¹nh ®ã nã cßn phiªn m· cho mét
sè RNA nhá cña nh©n. RNA polymerase lo¹i III dµnh cho c¸c RNA kÝch th­íc
nhá nh­ c¸c RNA vËn chuyÓn, rRNA 5S vµ mét sè RNA nhá trong nh©n. Trong
ch­¬ng nµy chóng ta chØ ®Ò cËp ®Õn RNA polymerase II.
- Thø hai chóng cÇn kÕt hîp nhiÒu protein ë promoter tr­íc khi RNA
polymerase cã thÓ b¾t ®Çu tæng hîp RNA. Mét sè protein nµy ®­îc gäi lµ nh©n tè
phiªn m· chung (gäi t¾t lµ GTFs – general transcription factors), liªn kÕt víi
promoter tr­íc khi RNA polymerase II liªn kÕt víi promoter. Mét sè protein kh¸c
th× liªn kÕt víi promoter sau khi RNA polymerase II ®· liªn kÕt vµo. Vai trß cña
GTFs vµ sù t­¬ng t¸c cña chóng víi RNA polymerase II sÏ ®­îc m« t¶ ë phÇn
khëi ®Çu phiªn m· cña eukaryote.
 LÝ do thø hai, sù kh¸c nhau râ rÖt gi÷a eukaryote vµ prokaryote lµ sù hiÖn
diÖn cña nh©n trong tÕ bµo eukaryote. RNA ®­îc tæng hîp trong nh©n, n¬i mµ
DNA ®­îc ®Þnh vÞ trong ®ã, vµ ph¶i ®­îc biÕn ®æi tr­íc khi ®­îc vËn chuyÓn ra
ngoµi tÕ bµo chÊt ®Ó dÞch m·. Sù biÕn ®æi nµy ®­îc gäi lµ qu¸ tr×nh tr­ëng thµnh
cña RNA. Nh­ b¹n sÏ thÊy ë phÇn sau, phÝa ®Çu 5’ ®­îc biÕn ®æi trong khi phÝa

122
®Çu 3’ vÉn ®­îc tiÕp tôc phiªn m· bëi RNA polymerase II. Bëi lý do nµy nªn RNA
polymerase II lµ mét ®a ph©n phøc t¹p h¬n nhiÒu so víi RNA polymerase cña
prokaryote. Sù kÕt hîp qu¸ tr×nh tæng hîp víi qu¸ tr×nh biÕn ®æi RNA cña RNA
polymerase II sÏ ®­îc tr×nh bµy ë phÇn kÐo dµi phiªn m· cña eukaryote.
 LÝ do cuèi cïng lµ khu«n cho qu¸ tr×nh phiªn m·, DNA trong nhiÔm s¾c thÓ,
®­îc tæ chøc thµnh nhiÔm s¾c chÊt ë eukaryote, trong khi ë prokaryote DNA lµ
trÇn. Nh­ b¹n sÏ ®­îc häc ë ch­¬ng 4, cÊu tróc nhiÔm s¾c chÊt cã thÓ ng¨n c¶n sù
liªn kÕt gi÷a RNA polymerase víi khu«n DNA, ®©y lµ mét c¬ chÕ ®iÒu hßa biÓu
hiÖn gen rÊt tinh tÕ ë eukaryote. Tuy nhiªn ë ch­¬ng nµy chóng ta chØ quan t©m
®Õn sù t¸c ®éng cña nhiÔm s¾c chÊt lªn kh¶ n¨ng khëi ®Çu phiªn m· cña RNA
polymerase II ngay sau khi nã ®­îc kÕt hîp víi khu«n DNA.

H×nh 3.4. So s¸nh sù kh¸c nhau trong qu¸ tr×nh phiªn m· vµ dÞch m· ë prokaryote víi
eukaryote, sù phiªn m· vµ dÞch m· ë prokaryote x¶y ra ®ång thêi cßn ë eukaryote qu¸
tr×nh phiªn m· vµ dÞch m· kh¸c nhau vÒ kh«ng gian vµ thêi gian.

B¶ng 3.2. Chøc n¨ng cña ba vïng gen trong phiªn m·


Vïng gen Chøc n¨ng
Vïng 5' Cã ®o¹n ®iÒu hoµ ho¹t ®éng gen vµ ®o¹n ho¹t ho¸ sù
phiªn m· (vïng promoter cã hép TATA)
Vïng ®­îc phiªn m· Cã c¸c intron vµ exon:

123
- Intron ®­îc phiªn m· nh­ng bÞ lo¹i bá trong qu¸
tr×nh hoµn thiÖn sîi mRNA
- Exon ®­îc phiªn m· vµ t¹o thµnh mRNA ë trong
nh©n vµ ®­îc dÞch thµnh protein ë trong tÕ bµo chÊt
Vïng 3' Ch­a râ chøc n¨ng, cã mét gen vïng nµy mang tÝnh
®iÒu hoµ chuyªn biÖt
Tr­íc khi ph©n tÝch qu¸ tr×nh phiªn m· ë eukaryote, chóng ta h·y xem xÐt
cÊu tróc mét gen m· ho¸ cho mét protein (gen ®­îc phiªn m· thµnh mRNA). CÊu
tróc nµy kh«ng mang tÝnh ®¹i diÖn tuyÖt ®èi nh­ng lµ cÊu tróc th­êng gÆp nhÊt.
Trong cÊu tróc nµy, gen bao gåm ba vïng: (1) vïng 5' lµ vïng mang c¸c tr×nh tù
®iÒu hoµ biÓu hiÖn cña gen vµ c¸c tr×nh tù ho¹t ho¸ sù phiªn m·, (2) vïng ®­îc
phiªn m· bao gåm c¸c intron vµ exon; exon lµ tr×nh tù cã mÆt trong mRNA ë tÕ
bµo chÊt, th­êng t­¬ng øng víi phÇn m· ho¸ cña gen sÏ ®­îc dÞch m· thµnh
protein, intron lµ tr×nh tù ®­îc phiªn m· nh­ng sÏ bÞ lo¹i bá trong qu¸ tr×nh tr­ëng
thµnh cña mRNA, kh«ng cã mÆt trong mRNA tÕ bµo chÊt, (3) vïng 3' cã chøc
n¨ng ch­a râ, ë mét sè gen vïng nµy mang c¸c tr×nh tù ®iÒu hoµ chuyªn biÖt. Vïng
5' vµ 3' kh«ng ®­îc phiªn m·.
Mét ®Æc ®iÓm cña c¸c mRNA ë eukaryote lµ mçi mRNA m· ho¸ cho mét
chuçi polypeptide (monocistronic) trong khi ë prokaryote mçi mRNA m· ho¸ cho
nhiÒu chuçi polypeptide (polycistronic).
1.3.2. C¸c giai ®o¹n cña qu¸ tr×nh phiªn m· ë eukaryote
1.3.2.1. Giai ®o¹n khëi ®Çu
Nh­ ë phÇn trªn giai ®o¹n khëi ®Çu phiªn m· cña prokaryote x¶y ra khi d­íi
®¬n vÞ σ cña holoenzyme RNA polymerase nhËn biÕt vïng tr×nh tù -10 vµ -35 cña
promoter. Sau ®ã sù phiªn m· b¾t ®Çu, d­íi ®¬n vÞ σ t¸ch ra vµ lâi enzyme tiÕp tôc
tæng hîp RNA bªn trong bãng phiªn m·, di chuyÓn däc theo khu«n DNA. T­¬ng
tù nh­ vËy ë eukaryote, lâi enzyme RNA polymerase II còng kh«ng thÓ tù nhËn
biÕt tr×nh tù promoter. Tuy nhiªn, kh«ng gièng nh­ ë vi khuÈn, nh©n tè σ lµ mét
cÊu phÇn cña holoenzyme polymerase, c¸c nh©n tè phiªn m· chung (GTFs) chØ
®­îc cÇn ®Ó liªn kÕt víi c¸c vïng cña promoter tr­íc khi nã liªn kÕt víi lâi
enzyme.
Sù khëi ®Çu phiªn m· ë eukaryote cã mét sè ®Æc ®iÓm lµm cho ta liªn t­ëng
®Õn sù khëi ®Çu sao chÐp DNA, t¹i ®iÓm khëi ®Çu sao chÐp cã mét sè protein
(DnaA ë E.coli, ORC ë nÊm men) lµ chÊt ®Çu tiªn nhËn biÕt vµ g¾n vµo ®iÓm khëi

124
®Çu sao chÐp. C¸c protein nµy t¹o ra sù kÕt hîp gi÷a c¸c protein sao chÐp, bao gåm
c¶ DNA polymerase III, th«ng qua t­¬ng t¸c protein-protein, t­¬ng tù nh­ vËy, ë
giai ®o¹n khëi ®Çu phiªn m·, GTFs còng t¸c ®éng lªn lâi enzyme vµ ®Þnh vÞ nã
vµo vÞ trÝ ®óng ®Ó b¾t ®Çu phiªn m·. GTFs bao gåm c¸c protein nh­ TFII A , TFII B ,
... (TFII- Transcription factor for RNA polymerase II, lµ kÝ hiÖu t¾t cña nh©n tè
phiªn m· cña RNA polymerase II).
GTFs vµ lâi RNA polymerase II kÕt hîp víi nhau t¹o thµnh phøc hîp tiÒn
khëi ®Çu. Phøc hîp nµy t­¬ng ®èi lín, nã cã chøa 6 nh©n tè phiªn m· chung, mçi
nh©n tè lµ mét phøc hîp protein ®a ph©n, céng thªm lâi RNA polymerase II ®­îc
t¹o thµnh bëi kho¶ng mét t¸ d­íi ®¬n vÞ. Tr×nh tù c¸c amino acid cña mét sè d­íi
®¬n vÞ ®­îc b¶o tån tõ nÊm men cho ®Õn ng­êi. Gièng nh­ promoter ë prokaryote,
promoter cña eukaryote còng ®­îc ®Þnh vÞ ë c¹nh 5’ cña vÞ trÝ b¾t ®Çu phiªn m·.
Sù kÐo th¼ng cña vïng promoter ®Ó lé ra tr×nh tù TATA th­êng ®­îc ®Þnh vÞ ë vÞ
trÝ -30 (30bp) tõ vÞ trÝ b¾t ®Çu phiªn m· (h×nh 3.5). Tr×nh tù nµy ®­îc gäi lµ hép
TATA.

H×nh 3.5. Giai ®o¹n khëi ®Çu phiªn m· cña RNA polymerase II ë eukaryote

125
T¹i hép TATA x¶y ra sù kiÖn ®Çu tiªn cña qu¸ tr×nh phiªn m· ®ã lµ: sù liªn
kÕt cña protein liªn kÕt víi hép TATA (®­îc viÕt t¾t lµ TBP - TATA binding
protein), lµ mét phÇn cña phøc TFII D (mét trong 6 GTFs), víi hép TATA. Khi
TBP liªn kÕt víi hép TATA, nã kÕt hîp c¸c GTFs kh¸c vµ lâi RNA polymerase II
víi promoter, do ®ã h×nh thµnh nªn phøc hîp tiÒn khëi ®Çu. Sau ®ã, sù phiªn m·
®­îc b¾t ®Çu, RNA polymerase II t¸ch khái hÇu hÕt c¸c GTFs ®Ó kÐo dµi b¶n phiªn
m·, lµ tiÒn th©n cña RNA. Mét sè GTFs vÉn cßn ë promoter ®Ó tiÕp tôc kÕt hîp
víi lâi RNA polymerase II kÕ tiÕp, theo c¸ch nµy, nhiÒu RNA polymerase II cã
thÓ tæng hîp nhiÒu b¶n phiªn m· tõ mét gen t¹i cïng mét thêi ®iÓm.
MÆc dï chi tiÕt cña giai ®o¹n khëi ®Çu nµy vÉn ch­a ®­îc lµm s¸ng tá, nh­ng
cã mét chi tiÕt quan träng ®· ®­îc kh¸m ph¸, ®ã lµ mét ®u«i cña d­íi ®¬n vÞ β
cña RNA polymerase II, ®­îc gäi lµ vïng ®u«i carboxyl (viÕt t¾t lµ CTD –
Carboxyl tail domain), tham gia vµo sù khëi ®Çu vµ mét sè pha quan träng kh¸c
cña qu¸ tr×nh phiªn m·. §u«i CTD ®­îc ®Þnh vÞ gÇn vÞ trÝ mµ RNA míi ®­îc tæng
hîp sÏ thß ra khái bãng phiªn m·.
Giai ®o¹n khëi ®Çu kÕt thóc vµ giai ®o¹n kÐo dµi ®­îc b¾t ®Çu khi ®u«i CTD
®­îc phosphoryl hãa bëi mét GTFs. Sù phosphoryl hãa nµy ®­îc cho lµ b»ng c¸ch
nµo ®ã lµm yÕu ®i mèi liªn kÕt cña RNA polymerase II víi mét sè protein cña
phøc hîp tiÒn khëi ®Çu vµ cho phÐp kÐo dµi phiªn m·.
1.3.2.2. Giai ®o¹n kÐo dµi
Giai ®o¹n kÐo dµi phiªn m· x¶y ra trong bãng phiªn m· gièng nh­ giai ®o¹n
kÐo dµi phiªn m· ë prokaryote. Tuy nhiªn, RNA míi ®­îc tæng hîp cã nhiÒu ®iÓm
kh¸c biÖt so víi RNA míi ®­îc t¹o ra ë prokaryote. ë prokaryote, qu¸ tr×nh dÞch
m· b¾t ®Çu ë ®Çu 5’ cña RNA míi ®­îc t¹o ra, trong khi ë phÝa ®Çu 3’ vÉn tiÕp tôc
phiªn m·, qu¸ tr×nh dÞch m· sÏ ®­îc m« t¶ chi tiÕt ë phÇn sau cña ch­¬ng. Ng­îc
l¹i, RNA ë eukaryote ph¶i tr¶i qua c¸c qu¸ tr×nh biÕn ®æi tr­íc khi nã ®­îc dÞch
m·. Qu¸ tr×nh nµy bao gåm: (1) g¾n mò ë ®Çu 5’, (2) thªm chuçi poly A ë ®Çu 3’
vµ (3) c¾t vµ lo¹i bá c¸c intron.
Gièng nh­ qu¸ tr×nh sao chÐp DNA, qu¸ tr×nh tæng hîp vµ biÕn ®æi tiÒn
mRNA thµnh mRNA cÇn tr¶i qua nhiÒu b­íc mét c¸ch nhanh chãng vµ chÝnh x¸c.
Tr­íc ®©y hÇu hÕt c¸c qu¸ tr×nh biÕn ®æi ®­îc cho lµ x¶y ra sau khi RNA ®­îc
phiªn m· xong, qu¸ tr×nh nµy ®­îc gäi lµ qu¸ tr×nh biÕn ®æi sau phiªn m·. Nh­ng
nhiÒu b»ng chøng thùc nghiÖm ®· chØ ra r»ng qu¸ tr×nh biÕn ®æi nµy thùc sù diÔn
ra trong suèt qu¸ tr×nh phiªn m· vµ nã ®­îc gäi lµ qu¸ tr×nh ®ång phiªn m· (h×nh
3.6). Do ®ã, phÇn RNA míi ®­îc phiªn m· ph¶i tr¶i qua qu¸ tr×nh biÕn ®æi ngay

126
sau khi nã thß ra khái bãng phiªn m·. §u«i CTD cña RNA polymerase II ®ãng
vai trß trung t©m trong viÖc kÕt hîp víi tÊt c¶ nh÷ng sù kiÖn cña qu¸ tr×nh biÕn
®æi. §u«i CTD ®­îc cÊu t¹o bëi tr×nh tù lÆp l¹i nhiÒu lÇn cña 7 amino acid. Sù lÆp
l¹i nµy gióp cho nã t¹o ra vÞ trÝ liªn kÕt víi mét sè protein vµ mét sè enzyme mµ
nã cÇn cho viÖc g¾n mò chôp, c¾t nèi vµ thªm ®u«i poly A.
§u«i CTD ®­îc ®Þnh vÞ gÇn vÞ trÝ n¬i mµ RNA míi ®­îc t¹o ra thß ra khái
bãng phiªn m·, v× thÕ nã trë thµnh n¬i lý t­ëng ®Ó tæ chøc liªn kÕt vµ gi¶i phãng
c¸c protein cÇn thiÕt cho qu¸ tr×nh biÕn ®æi RNA míi sinh, trong khi RNA vÉn
®­îc tiÕp tôc tæng hîp. ë c¸c giai ®o¹n kh¸c nhau cña qu¸ tr×nh phiªn m·, c¸c
amino acid cña ®u«i CTD biÕn ®æi thuËn nghÞch – th­êng lµ qu¸ tr×nh thªm vµo
vµ mÊt ®i cña c¸c nhãm phosphate (gäi lµ qu¸ tr×nh phosphoryl hãa vµ
dephosphoryl hãa t­¬ng øng). Tr¹ng th¸i phosphoryl hãa cña ®u«i CTD, nã cã thÓ
liªn kÕt víi c¸c protein cña qu¸ tr×nh biÕn ®æi RNA. Do ®ã theo c¸ch nµy, ®u«i
CTD cã thÓ thùc hiÖn c¸c ph¶n øng biÕn ®æi RNA ngay khi nã võa lã ra khái bãng
phiªn m·, qu¸ tr×nh nµy ®­îc m« t¶ nh­ ë h×nh 3.6.

H×nh 3.6. Qu¸ tr×nh ®ång phiªn m· RNA ë eukaryote

Qu¸ tr×nh g¾n mò chôp (capping): lµ b­íc ®Çu tiªn, ngay khi RNA míi
®­îc tæng hîp thß ra khái bãng phiªn m·, mét cÊu tróc ®Æc biÖt gäi lµ mò ®­îc
thªm vµo ë ®Çu 5’ bëi mét sè protein t­¬ng t¸c víi ®u«i CTD. Mò cã chøa gèc 7-
methyl guanine ®­îc g¾n vµo ®Çu 5' cña mRNA nhê liªn kÕt 5'-5' triphosphate.
"Mò chôp" lµ tèi cÇn thiÕt cho qu¸ tr×nh dÞch m· sau nµy. Mò cã hai chøc n¨ng
chÝnh: thø nhÊt lµ b¶o vÖ RNA kh«ng bÞ ph©n hñy lµ b­íc quan träng ®Ó kÐo dµi
hµnh tr×nh cña RNA tr­íc khi nã ®­îc dÞch m·. Thø hai, b¹n sÏ thÊy ë phÇn dÞch
m·, mò cÇn cho qu¸ tr×nh dÞch m· mRNA.
Qu¸ tr×nh thªm ®u«i poly A: Giai ®o¹n kÐo dµi tiÕp tôc cho ®Õn khi RNA
polymerase II gÆp tr×nh tù b¶o tån lµ AAUAAA hoÆc AUUAAA gÇn ®Çu 3’.

127
mRNA bÞ c¾t kho¶ng 20 nucleotide n»m tr­íc mét tr×nh tù nµy bëi mét enzyme,
®©y chÝnh lµ tr×nh tù nhËn biÕt cho ph¶n øng c¾t. Sau ®ã, mét enzyme cã trong
nh©n - polyA polymerase sÏ g¾n mét sè l­îng adenine nhÊt ®Þnh (kho¶ng 250 ë
®éng vËt cã vó, 100 ë eukaryote bËc thÊp) vµo ®Çu 3' cña mRNA ë eukaryote trõ
c¸c mRNA cña histone ®Òu cã g¾n ®u«i polyA. Do ®ã, tr×nh tù AAUAAA cña
vïng m· hãa cho protein ®­îc gäi lµ tÝn hiÖu poly A.

H×nh 3.7. Qu¸ tr×nh g¾n ®u«i polyA ë mRNA

Mét protein, PABP (polyA binding protein-protein liªn kÕt víi polyA) sÏ g¾n
vµo ®u«i polyA. Protein nµy cÇn thiÕt cho sù sèng cßn vµ sinh tr­ëng cña tÕ bµo.
§u«i polyA kÕt hîp víi PABP cã vai trß trong sù æn ®Þnh c¸c mRNA vµ viÖc khëi
sù dÞch m·.
§Õn giai ®o¹n nµy, tiÒn mRNA ®· ®­îc h×nh thµnh, nh­ng ®Ó chuyÓn thµnh
d¹ng ho¹t ®éng, ph©n tö nµy cßn ph¶i tr¶i qua mét b­íc biÕn ®æi míi: qu¸ tr×nh
c¾t nèi.
Qu¸ tr×nh c¾t nèi (splicing)
PhÇn lín c¸c gen cña eukaryote ®Òu cã chøa c¸c intron, lµ c¸c ®o¹n vÉn ch­a
râ chøc n¨ng, kh«ng m· hãa cho polypeptide. C¸c intron kh«ng nh÷ng cã mÆt
trong gen m· hãa cho protein cßn cã trong c¸c gen m· hãa cho c¸c rRNA, thËm
chÝ cßn cã trong c¶ c¸c gen tRNA. C¸c intron bÞ lo¹i bá khái b¶n phiªn m· ban
®Çu, trong khi nã vÉn ®­îc tiÕp tôc tæng hîp vµ sau khi mò chôp ®­îc g¾n vµo
®Çu 5’, nh­ng b­íc c¾t nèi nµy ph¶i x¶y ra tr­íc khi b¶n phiªn m· ®­îc vËn
chuyÓn vµo tÕ bµo chÊt. ViÖc lo¹i bá c¸c intron vµ nèi c¸c exon ®­îc gäi lµ qu¸
tr×nh c¾t nèi. V× qu¸ tr×nh nµy gièng víi c¸ch c¾t nèi phim, cã thÓ c¾t nèi ®Ó t¹o
ra mét ®o¹n cã hiÖu øng ®Æc biÖt, ®iÒu nµy ®Æc biÖt gièng víi qu¸ tr×nh c¾t nèi
kh¸c biÖt ®Ó t¹o ra nh÷ng mRNA m· hãa cho c¸c protein chuyªn biÖt cho tõng

128
m«, tÕ bµo. ViÖc c¾t nèi mang c¸c ®o¹n exon l¹i gÇn nhau, kÕt qu¶ t¹o ra mRNA
chøa mét vïng m· hãa lµ mét ®­êng th¼ng liªn tôc m· hãa cho protein.

H×nh 3.7. Qu¸ tr×nh c¾t nèi exon-intron víi sù tham gian cña c¸c phÇn tö ghÐp nèi

C¬ chÕ c¾t nèi: §©y lµ qu¸ tr×nh lo¹i bá c¸c intron vµ nèi c¸c exon l¹i víi
nhau, ë h×nh 3.7 cho thÊy sù c¾t intron vµ nèi exon cña tiÒn mRNA. Trong qu¸
tr×nh nµy, cã ba tr×nh tù n»m trong intron ®ãng vai trß quan träng: tr×nh tù "cho"
GU ë ®Çu 5' cña intron, tr×nh tù "tÏ nh¸nh" giµu c¸c base pyrimidine bao quanh
mét A ë gÇn ®Çu 3' vµ tr×nh tù "nhËn" AG ë ®Çu 3'.T¹i nh÷ng ®iÓm nèi, cã c¸c
nucleotide ®Æc biÖt hiÖn diÖn trong gen vµ c¸c loµi lµ gièng nhau, chóng ®­îc b¶o
tån v× nã ®Æc tr­ng cho c¸c ph¶n øng c¾t nèi. Mçi intron sÏ bÞ c¾t ë mçi ®Çu, c¸c
®Çu cho nµy hÇu hÕt ®Òu cã chøa GU ë ®Çu 5’, ®Çu nhËn lµ AG ë ®Çu 3’ (gäi lµ
quy luËt GU-AG) vµ mét vÞ trÝ kh«ng ®æi kh¸c (lµ tr×nh tù tÏ nh¸nh) n»m ë gi÷a
kho¶ng c¸ch 15 ®Õn 45 base ng­îc dßng tõ vÞ trÝ c¾t nèi 3’. T¹i gèc nµy x¶y ra
mét ph¶n øng trung gian cÇn thiÕt cho viÖc lo¹i bá intron, mÆt kh¸c c¸c nucleotide
Ýt ®­îc b¶o tån ®­îc t×m thÊy ë phÝa cña c¸c tr×nh tù ®­îc b¶o tån cao. C¸c
nucleotide ®­îc b¶o tån nµy trong b¶n phiªn m· ®­îc nhËn biÕt bëi c¸c tiÓu phÇn
riboprotein nhá cña nh©n (snRNPs) lµ mét d¹ng protein phøc hîp víi c¸c RNA
nhá cña nh©n. Mét ®¬n vÞ chøc n¨ng c¾t nèi gäi lµ thÓ c¾t nèi. Hîp phÇn nµy liªn
kÕt víi ®u«i CTD vµ tÊn c«ng vµo c¸c tr×nh tù intron vµ exon nh­ h×nh 3.7, gióp
cho viÖc l¾p ghÐp c¸c vÞ trÝ c¾t nèi b»ng c¸ch h×nh thµnh liªn kÕt hydro víi c¸c
tr×nh tù b¶o tån cña intron. TiÕp theo, thÓ c¾t nèi xóc t¸c viÖc lo¹i bá intron qua
hai b­íc c¾t nèi liªn tôc gäi lµ b­íc 1 vµ 2 (nh­ trªn h×nh 3.7). B­íc 1 tÊn c«ng

129
vµo mét ®Çu cña intron t¹i tr×nh tù Adenine ®­îc b¶o tån trong intron ®Ó h×nh
thµnh nªn mét cÊu tróc gièng nh­ d©y thßng läng. B­íc 2 gi¶i phãng d©y thßng
läng vµ nèi hai ®Çu exon liÒn kÒ nhau. mRNA tr­ëng thµnh sÏ ®i ra tÕ bµo chÊt
qua c¸c lç trªn mµng nh©n ®Ó tham gia vµo qu¸ tr×nh dÞch m·.
Ph¶n øng tù c¾t nèi c¸c intron: Mét tr­êng hîp kú l¹ cña sù tù c¾t nèi
RNA dÉn tíi sù kh¸m ph¸ ra vai trß cña RNA. N¨m 1981, Cech vµ céng sù ®·
ph¸t hiÖn thÊy b¶n phiªn m· ban ®Çu cña rRNA ë ®éng vËt nguyªn sinh
Tetrahymena cã thÓ tù c¾t bá mét intron dµi 413 nucleotide, mµ kh«ng cÇn thªm
bÊt cø mét protein nµo kh¸c. TiÕp theo sau ®ã, c¸c intron kh¸c còng cho thÊy cã
nh÷ng ®Æc tÝnh t­¬ng tù, ®­îc gäi lµ c¸c intron tù c¾t nèi. Sù kh¸m ph¸ cña Cech
®· cho thÊy sù khai ph¸ míi trong lÜnh vùc sinh häc, v× nã ®¸nh dÊu lÇn ®Çu tiªn
mét ph¶n øng sinh häc kh«ng ph¶i do protein xóc t¸c. Sù kh¸m ph¸ nµy ®· ®Æt nÒn
t¶ng cho thuyÕt thÕ giíi RNA, theo thuyÕt nµy cho r»ng vËt chÊt di truyÒn cña tÕ
bµo ®Çu tiªn lµ RNA. V× chØ cã RNA míi cã c¶ hai thuéc tÝnh: m· hãa cho th«ng
tin di truyÒn vµ xóc t¸c cho c¸c ph¶n øng sinh häc.
Sù kh¸m ph¸ ra c¸c intron tù c¾t nèi ®· dÉn tíi mét thÝ nghiÖm chøng minh
l¹i vai trß cña c¸c snRNA (RNA nhá cña nh©n) trong thÓ c¾t nèi. Tõ c¸c thÝ nghiÖm
®ã ®· chøng minh ®­îc r»ng chÝnh c¸c snRNA ®ãng vai trß chÝnh trong qu¸ tr×nh
c¾t nèi vµ c¸c rRNA trong ribosome ®ãng vai trß trung t©m trong qu¸ tr×nh dÞch
m· (®iÒu nµy chóng ta sÏ ®­îc häc ë phÇn dÞch m·).
1.3.2.3. Giai ®o¹n kÕt thóc
C¸c hiÓu biÕt vÒ giai ®o¹n nµy cßn rÊt h¹n chÕ. Sù phiªn m· kÕt thóc tr­íc
®iÓm g¾n ®u«i poly A rÊt xa. Sù kÕt thóc phiªn m· cã liªn quan ®Õn nh÷ng cÊu
tróc d¹ng "kÑp tãc" tiÕp ngay sau lµ mét tr×nh tù giµu GC.
1.3.2.3. Sù hoµn thiÖn RNA ribosome
ë tÕ bµo eukaryote sau khi phiªn m· t¹o thµnh preribosome RNA 45S. Ph©n
tö nµy ®­îc methyl ho¸ tíi h¬n 100 nhãm t¹o ra c¸c rRNA 18S, 5,8S, vµ 28S. C¸c
rRNA nµy sÏ ghÐp l¹i víi nhau t¹o nªn cÊu tróc bËc 4 phøc t¹p. PhÇn c¸c nucleotide
kh«ng ®­îc methyl ho¸ sÏ bÞ ph©n huû. ë tÕ bµo prokaryote preribosome RNA lµ
RNA 30S. Ph©n tö nµy ®­îc methyl ho¸ mét sè base vµ t¹o nªn rRNA 16S, 23S,
5S vµ tRNA, phÇn kh«ng methyl ho¸ còng bÞ thuû ph©n ®Ó lo¹i bá.

130
CHƯƠNG 4. QUÁ TRÌNH DỊCH MÃ
Theo thuyÕt trung t©m cña sinh häc ph©n tö, qu¸ tr×nh dÞch m· lµ b­íc cuèi
cïng cña con ®­êng truyÒn th«ng tin, dÞch m· lµ qu¸ tr×nh tæng hîp polypeptide
theo tr×nh tù cña mRNA.
RNA th«ng tin chØ lµ giai ®o¹n trung gian gi÷a DNA vµ protein. ë eukaryote,
mRNA gióp chuyÓn th«ng tin m· ho¸ trªn DNA n»m trong nh©n ra ®Õn bé m¸y
dÞch m· t¹o protein ngoµi tÕ bµo chÊt. Nh­ng vai trß cña mRNA kh«ng chØ dõng
ë ®ã; sù phiªn m· cßn cho phÐp tæng hîp nhiÒu b¶n sao mRNA tõ mét gen. Mçi
b¶n sao sÏ ®­îc dÞch m· thµnh mét ph©n tö protein. Nh­ vËy, th«ng tin cña mét
gen duy nhÊt sÏ ®­îc khuÕch ®¹i thµnh mét sè l­îng lín ph©n tö protein. Ngoµi
ra, ë ch­¬ng sau, chóng ta sÏ thÊy r»ng sù tån t¹i cña giai ®o¹n phiªn m· tæng hîp
mRNA cßn cho phÐp më réng kh¶ n¨ng ®iÒu hoµ sù biÓu hiÖn cña gen.
Qu¸ tr×nh sinh tæng hîp protein còng nh­ qu¸ tr×nh sinh tæng hîp nucleic
acid (DNA vµ RNA) tu©n theo mét sè nguyªn t¾c chung:
- C¸c protein vµ nucleic acid ®Òu ®­îc h×nh thµnh tõ mét sè l­îng giíi h¹n
c¸c ®¬n vÞ c¬ b¶n kh¸c nhau. C¸c ®¬n vÞ c¬ b¶n kh¸c nhau ë nucleic acid lµ bèn
lo¹i base (A, T (U ë RNA), G, C) cßn ë protein ®ã lµ 20 lo¹i amino acid.
- C¶ hai nhãm ®¹i ph©n tö sinh häc nµy ®Òu ®­îc h×nh thµnh do sù kÕt nèi
dÇn dÇn c¸c ®¬n vÞ thµnh phÇn, c¸i nä sau c¸i kia.
- Sù sinh tæng hîp b¾t ®Çu t¹i mét ®iÓm nhÊt ®Þnh, kÐo dµi theo mét h­íng
duy nhÊt vµ kÕt thóc còng t¹i mét ®iÓm nhÊt ®Þnh. C¬ chÕ nµy ®ßi hái mét dÊu hiÖu
b¾t ®Çu vµ mét dÊu hiÖu kÕt thóc.
Tuy nhiªn, qu¸ tr×nh dÞch m· (sinh tæng hîp protein) phøc t¹p h¬n nhiÒu so
víi sù sao chÐp vµ phiªn m· (sinh tæng hîp DNA vµ RNA). Së dÜ nh­ vËy lµ v×,
nh­ ta ®· thÊy ë phÇn tr­íc, c¬ chÕ cña sù sao chÐp hay phiªn m· chñ yÕu dùa vµo
¸i lùc gi÷a c¸c base thµnh phÇn cÊu t¹o ph©n tö míi víi c¸c base cña khu«n, biÓu
hiÖn qua c¸c liªn kÕt hydro gi÷a chóng. Cßn trong qu¸ tr×nh dÞch m·, c¸c amino
acid nèi kÕt víi nhau theo khu«n RNA nh­ng chóng l¹i hoµn toµn kh«ng cã ¸i lùc
víi ph©n tö RNA. Kh«ng nh÷ng thÕ, nhiÒu nh¸nh bªn cña c¸c amino acid cßn bÞ
®Èy bëi nhiÒu nhãm cña c¸c base. Do ®ã, trong sù sinh tæng hîp protein, ngoµi
khu«n mRNA vµ c¸c ®¬n vÞ thµnh phÇn cÊu t¹o nªn ph©n tö míi (c¸c amino acid),
cßn cÇn sù hiÖn diÖn cña nh÷ng nh©n tè tiÕp hîp (adaptor). C¸c nh©n tè tiÕp hîp
nµy lµm vËt trung gian gióp cho amino acid kh«ng ph¶i tiÕp xóc víi khu«n RNA,
®ã chÝnh lµ c¸c RNA vËn chuyÓn (tRNA). Qu¸ tr×nh dÞch m· ®­îc tiÕn hµnh theo
mét c¬ chÕ chung cho tÊt c¶ c¸c lo¹i tÕ bµo.

131
2.1. vai trß cña ba lo¹i rna (mRNA, tRNA vµ rRNA) trong
qu¸ tr×nh dÞch m·
2.1.1. mRNA vµ m· di truyÒn
Mçi ph©n tö mRNA mang th«ng tin di truyÒn x¸c ®Þnh tr×nh tù cña mét
polypeptide. Th«ng tin nµy ®­îc chÐp tõ ph©n tö DNA sang ph©n tö mRNA trong
qu¸ tr×nh phiªn m·.
Nh­ ta ®· biÕt, DNA vµ RNA ®­îc cÊu t¹o tõ 4 lo¹i nucleotide trong khi
protein ®­îc h×nh thµnh tõ 20 lo¹i amino acid kh¸c nhau. Nh­ vËy, th«ng tin di
truyÒn m· ho¸ trong DNA vµ RNA d­íi d¹ng tæ hîp cña bèn lo¹i nucleotide cÇn
®­îc gi¶i m· thµnh 20 lo¹i amino acid cÊu thµnh protein. NÕu tÕ bµo sö dông tæ
hîp 2 nucleotide ®Ó m· ho¸ cho mét amino acid th× chØ t¹o ®­îc (42)=16 m·, con
sè nµy nhá h¬n nhu cÇu thùc tÕ. Cßn nÕu sö dông ba nucleotide ®Ó m· ho¸ cho
mét amino acid th× sè l­îng m· cã thÓ t¨ng lªn ®Õn (43) = 64. C¸c c«ng tr×nh
nghiªn cøu nh÷ng n¨m 60 ®· thiÕt lËp ®­îc hÖ thèng t­¬ng øng gi÷a mét tæ hîp
nucleotide víi mét amino acid; hÖ thèng nµy cã tªn lµ m· di truyÒn. Trong bé m·
di truyÒn, mét m· t­¬ng øng víi mét bé ba nucleotide vµ ®­îc gäi lµ codon.
V× sè l­îng codon lín h¬n nhiÒu so víi sè l­îng c¸c amino acid nªn vÊn ®Ò
®Æt ra lµ c¸c codon nµy ®­îc sö dông nh­ thÕ nµo? N¨m 1961, c¸c nhµ khoa häc
®· ch­ng minh ®­îc r»ng m· di truyÒn lµ m· kh«ng chång lÊp vµ cã tÝnh "suy
tho¸i" (degenerated), nghÜa lµ mét amino acid cã thÓ ®­îc m· ho¸ bëi nhiÒu codon
kh¸c nhau. TÝnh suy tho¸i cña m· di truyÒn cã ý nghÜa tÝch cùc ®èi víi sù sèng
cßn cña tÕ bµo. ThËt vËy trong mét sè tr­êng hîp, dï codon cã mét nucleotide
thay ®æi (do ®ét biÕn ®iÓm) th× amino acid do nã m· ho¸ còng kh«ng bÞ biÕn ®æi
vµ protein cã mang amino acid nµy vÉn gi÷ ®­îc cÊu tróc vµ chøc n¨ng nguyªn
vÑn. Trong thùc tÕ, sè l­îng codon m· ho¸ cho mét amino acid cµng nhiÒu khi
amino acid ®ã cµng xuÊt hiÖn th­êng xuyªn trong thµnh phÇn c¸c protein. Ngoµi
c¸c codon m· ho¸ lÆp l¹i, mét sè codon kh«ng m· ho¸ cho protein mµ nã ®ãng vai
trß "dÊu chÊm c©u" - codon AUG lµ dÊu hiÖu b¾t ®Çu dÞch m·, cßn UAA, UGA,
UAG lµ c¸c dÊu hiÖu kÕt thóc. M· di truyÒn cã tÝnh "phæ qu¸t" (universal) cho
toµn bé sinh giíi trõ vµi codon sai kh¸c kh«ng ®¸ng kÓ ë vµi ®éng vËt nguyªn sinh.
Codon AUG võa lµ dÊu hiÖu b¾t ®Çu dÞch m· võa m· ho¸ cho methionin; do ®ã,
tÊt c¶ c¸c chuçi protein ë prokaryote vµ eukaryote ®Òu b¾t ®Çu b»ng amino acid
®ã.

132
Nãi tãm l¹i m· di truyÒn cã c¸c ®Æc tÝnh sau: ba base m· hãa cho mét amino
acid ®­îc gäi lµ m· bé ba, m· kh«ng chång lÊp, cã tÝnh tho¸i hãa vµ ®­îc ®äc liªn
tôc tõ mét ®iÓm khëi ®Çu ë ®Çu 5’ ®Õn ®iÓm kÕt thóc ë ®Çu 3’ cña tr×nh tù m· hãa.
♣ Gi¶i m· di truyÒn
BiÕt ®­îc bé ba nucleotide x¸c ®Þnh mét amino acid vµ ph¶i ®i liÒn nhau theo
mét h­íng ch­a ®ñ, mµ cßn ph¶i biÕt bé ba nucleotide nµo x¸c ®Þnh amino acid
nµo.
C«ng viÖc nµy ®­îc hoµn thµnh nhê vµo thµnh tùu cña Ochoa (1955) chiÕt
xuÊt ®­îc enzyme polynucleotide phosphorylase tõ vi khuÈn nªn ®· gióp
M.Nirenberg vµ Mathae (1961) dïng enzyme nµy tæng hîp ®­îc mRNA toµn
polyU trong èng nghiÖm. VÒ sau M. Nirenberg ®· sö dông mét hÖ thèng tæng hîp
v« bµo (kh«ng cã cÊu tróc tÕ bµo) ®Ó gi¶i m· di truyÒn (h×nh 3.8). HÖ thèng ®ã lµ
dÞch chiÕt tÕ bµo E.coli cã chøa c¸c ribosome, c¸c tRNA, c¸c enzyme aminoacyl
synthetase, mRNA, c¸c amino acid vµ mét sè phô gia kh¸c. Trong hÖ thèng v«
bµo c¸c amino acid cã thÓ dÝnh l¹i víi nhau ®Ó t¹o thµnh protein. Ph¶n øng nµy chØ
diÔn ra trong vßng vµi phót råi dõng l¹i, nh­ng nÕu bæ sung thªm mRNA míi th×
viÖc tæng hîp protein l¹i tiÕp diÔn.

H×nh 3.8. ThÝ nghiÖm gi¶i m· di truyÒn cña Marshall Nirenber vµ céng sù

Ph¶n øng nµy lµ mét ph¸t minh cùc k× quan träng, v× sau khi mRNA tù nhiªn
cã s½n trong dÞch v« bµo ®­îc sö dông hÕt th× cã thÓ ®­a mRNA nh©n t¹o cã thµnh
phÇn ®Þnh tr­íc vµo hÖ thèng v« bµo vµ x¸c ®Þnh xem protein nµo ®­îc tæng hîp.
C¸c t¸c gi¶ nhËn thÊy r»ng, khi ®­a mRNA toµn uraxin (U) vµo th× protein ®­îc

133
tæng hîp chØ toµn acid phenylalanin. T­¬ng tù nh­ vËy, nÕu mRNA ®­a vµo chØ
chøa toµn adenine (A) th× protein ®­îc tæng hîp chØ toµn lysine, nÕu mRNA mang
toµn C th× protein t­¬ng øng chØ cã prolin. VËy UUU m· ho¸ cho phenylalanine,
AAA m· ho¸ cho lysine, CCC m· ho¸ cho prolin.
TiÕp sau ®ã c¸c t¸c gi¶ ®· tæng hîp c¸c mRNA cã thµnh phÇn nh­
UCUCUCUCUCUCUCUCUCU..., AAGAAGAAGAAG.... vµ ®· t×m ra c¸c bé ba
m· ho¸ amino acid nh­: serine lµ UCU, leucine lµ CUC, lysine lµ AAG, arginine
lµ AGA vµ acid glutamic lµ GAA. Cø tiÕp tôc thÝ nghiÖm nh­ vËy vµ kÕt hîp víi
mét vµi kü thuËt kh¸c, ng­êi ta ®· t×m ra toµn bé 61 bé ba m· ho¸ c¸c amino acid
(h×nh 3.9). Ba bé ba cßn l¹i (UAA, UAG, vµ UGA) nh­ ngµy nay chóng ta ®· biÕt,
lµ nh÷ng dÊu hiÖu kÕt thóc chuçi, cßn gäi lµ bé ba v« nghÜa v× chóng kh«ng x¸c
®Þnh amino acid nµo.

H×nh 3.9. B¶ng m· di truyÒn

2.1.2. RNA vËn chuyÓn (tRNA) - nh©n tè tiÕp hîp (adapter)


tRNA chÝnh lµ nh©n tè tiÕp hîp (adapter) trong qu¸ tr×nh dÞch m·. Do kÝch
th­íc cña codon lín h¬n nhiÒu so víi amino acid nªn nÕu mét amino acid nhËn
biÕt vµ g¾n trùc tiÕp lªn mét codon trªn mRNA th× nã sÏ c¸ch qu¸ xa amino acid
t­¬ng øng víi codon kÕ tiÕp ®Ó cã thÓ t¹o ®­îc mét liªn kÕt. Nh­ vËy, ngoµi chøc
n¨ng lµm trung gian gi÷a amino acid vµ khu«n RNA nh­ ®· ®Ò cËp ë trªn, tRNA

134
cßn gióp gi¶i quyÕt trë ng¹i vÒ kh«ng gian trong qu¸ tr×nh dÞch m·. Sè l­îng c¸c
tRNA biÕn ®éng theo loµi: 30 hay 40 ë vi khuÈn (prokaryote), 50 ë tÕ bµo ®éng
thùc vËt (eukaryote) - nh­ng cÊu tróc cña chóng rÊt gièng nhau. Mét ®Æc ®iÓm
®¸ng chó ý ë tRNA lµ mét tRNA cã thÓ kÕt hîp víi hai codon kh¸c nhau cïng m·
ho¸ cho mét amino acid liªn kÕt theo kiÓu wobble (h×nh 3.10).

H×nh 3.10. CÊu tróc cña tRNA (a,b) vµ thuyÕt Wobble vÒ sù b¾t cÆp linh ho¹t cña tRNA vµ
mRNA trong dÞch m· (c)

135
NhËn ®Þnh ®Çu tiªn cña c¸c nhµ khoa häc vÒ c¸ch liªn kÕt gi÷a c¸c amino
acid víi c¸c bé ba, lµ do c¸c m· bé ba trªn mRNA cã thÓ uèn cong l¹i t¹o thµnh
c¸c hèc kh¸c nhau ®Ó liªn kÕt trùc tiÕp víi c¸c amino acid, mµ nã m· cho theo thø
tù. Tuy nhiªn ®Õn n¨m 1958 Crick ®· nhËn ra r»ng: gi¶ thiÕt trong tù nhiªn c¸c
amino acid ®­îc vËn chuyÓn ®Õn khu«n bëi mét ph©n tö tiÕp hîp (adapter) vµ ph©n
tö nµy cã mét phÇn thËt sù phï hîp víi RNA. Theo gi¶ thiÕt, trong h×nh d¹ng ®¬n
gi¶n nhÊt cña nã, cã thÓ cÇn tíi 20 lo¹i ph©n tö tiÕp hîp, mçi c¸i ®­îc dµnh riªng
cho mét amino acid. Crick ®o¸n r»ng ph©n tö tiÕp hîp nµy “cã thÓ cã chøa c¸c
nucleotide”, ®iÒu nµy cho phÐp nã kÕt hîp víi RNA khu«n, bëi sù b¾t cÆp cña c¸c
“base” nh­ ë DNA. H¬n thÕ n÷a, “viÖc t¸ch enzyme cã thÓ cÇn thiÕt cho viÖc g¾n
mçi ph©n tö tiÕp hîp víi amino acid cña nã”.
Trªn thùc tÕ, c¸c amino acid ®­îc g¾n víi c¸c ph©n tö tiÕp hîp (c¸c ph©n tö
nµy chÝnh lµ mét lo¹i RNA æn ®Þnh ®­îc gäi lµ tRNA). Mçi amino acid ®­îc g¾n
vµo tRNA chuyªn biÖt, sau ®ã ®­îc ®­a ®Õn ribosome, mét ph©n tö phøc t¹p g¾n
c¸c amino acid vµo chuçi polypeptide ®ang mäc dµi ra.
Sù dÞch m· c¸c codon bëi tRNA
CÊu tróc cña tRNA lµ mét bÝ mËt vÒ sù ®Æc hiÖu gi÷a mét codon trªn ph©n tö
mRNA víi mét amino acid mµ nã m· hãa. Ph©n tö tRNA cã d¹ng cá ba l¸, chøa
bèn vïng xo¾n kÐp vµ ba vßng sîi ®¬n. Vßng ë gi÷a ®­îc gäi lµ vßng ®èi m·
(anticodon), v× nã cã mang mét bé ba nucleotide liªn kÕt bæ sung víi bé ba m·
hãa trªn mRNA. Tr×nh tù bæ sung nµy cho phÐp tRNA g¾n vµo mRNA theo liªn
kÕt ®Æc hiÖu RNA:RNA. V× c¸c codon trªn mRNA ®­îc ®äc theo h­íng 5’3’,
do ®ã c¸c anticodon ph¶i ®­îc ®äc theo h­íng 3’5’ (h×nh 3.10). C¸c amino acid
®­îc g¾n vµo tRNA bëi c¸c enzyme aminoacyl-tRNA synthetase, c¸c tRNA ®·
®­îc g¾n víi c¸c amino acid ®­îc gäi lµ tRNA ®· ®­îc tÝch ®iÖn.

H×nh 3.11. Ph¶n øng g¾n amino acid vµo tRNA cña nã ®­îc xóc t¸c bëi enzym
aminoacyl tRNA synthetase

136
Chøc n¨ng trung gian cña tRNA ®­îc thùc hiÖn nhê nh÷ng enzyme ®Æc hiÖu
lµ c¸c aminoacyl-tRNA synthetase. Cã 20 lo¹i aminoacyl-tRNA synthetase t­¬ng
øng víi 20 lo¹i amino acid. C¸c enzyme nµy cã kh¶ n¨ng nhËn biÕt amino acid
®Æc hiÖu vµ c¶ tRNA t­¬ng øng. Qu¸ tr×nh g¾n amino acid vµo tRNA víi sù tham
gia cña c¸c enzyme nµy lµ mét qu¸ tr×nh tiªu tèn n¨ng l­îng vµ tr¶i qua hai b­íc:
B­íc 1: enzyme nhËn biÕt vµ g¾n víi mét amino acid ®Æc hiÖu Enzyme +
ATP  Enzyme-aminoacyl-AMP + P.P
B­íc 2: amino acid ®­îc chuyÓn tõ phøc hîp enzyme-aminoacyl sang tRNA
t­¬ng øng Enzyme-aminoacyl-AMP + tRNA  tRNA-aminoacyl + AMP +
enzyme
Mét sè tRNA chuyªn biÖt cã thÓ mang c¸c amino acid chuyªn biÖt cña chóng
®Õn mét vµi codon m· cho c¸c amino acid nµy. tRNA nµy nhËn biÕt vµ liªn kÕt víi
mét sè codon biÕn ®æi, kh«ng chØ b»ng c¸ch liªn kÕt b¾t cÆp bæ sung, th«ng qua
viÖc lµm mÊt kiÓu b¾t cÆp bæ sung t¹i ®Çu 3’ cña codon vµ 5’ cña anticodon. ViÖc
lµm mÊt b¾t cÆp nµy gäi lµ b¾t cÆp kiÓu wobble (b¾t cÆp khÊp khÓnh).
B¾t cÆp kiÓu wobble lµ tr¹ng th¸i mµ nucleotide thø ba cña anticodon (ë ®Çu
5’) cã thÓ h×nh thµnh hai hµng (h×nh 3.10). Nucleotide thø ba nµy cã thÓ h×nh thµnh
liªn kÕt hydro kh«ng chØ víi d¹ng nucleotide b¾t cÆp bæ sung b×nh th­êng ë vÞ trÝ
nucleotide thø 3 cña codon mµ cßn víi c¸c nucleotide kh¸c ë vÞ trÝ nµy. “Quy luËt
wobble” chØ ra r»ng c¸c nucleotide cã thÓ hoÆc kh«ng thÓ h×nh thµnh c¸c liªn kÕt
hydro víi c¸c nucleotide kh¸c nhau qua wobble nh­ b¶ng 3.3. ë b¶ng nµy ta thÊy
kÝ tù I lµ inosine, mét base hiÕm ®­îc t×m thÊy ë tRNA, th­êng lµ ë vïng
anticodon.
B¶ng 3.3. B¾t cÆp cña c¸c nucleotide theo quy luËt wobble
§Çu 5’ cña anticodon §Çu 3’ cña codon
G C hoÆc U
C G
A U
U A hoÆc G
I A,C hoÆc U
Theo b¶ng trªn cho thÊy lµm thÕ nµo ®Ó ba tRNA cña serine cã thÓ b¾t cÆp
víi c¸c codon m· hãa cho amino acid nµy (h×nh 3.10). C¸c tRNA nµy ®­îc gäi lµ

137
®ång ph©n nhËn, v× nã nhËn cïng mét amino acid nh­ng l¹i ®­îc phiªn m· tõ c¸c
gen tRNA kh¸c nhau.
2.1.3. RNA ribosome (rRNA)
Sù tæng hîp protein x¶y ra khi c¸c ph©n tö tRNA vµ mRNA kÕt hîp víi
ribosome. NhiÖm vô cña c¸c tRNA vµ ribosome lµ dÞch m· c¸c tr×nh tù codon trªn
mRNA thµnh tr×nh tù amino acid trong protein. Tªn gäi bé m¸y sinh häc ®­îc sö
dông ®Ó m« t¶ ®Æc ®iÓm cña phøc hîp ®a ph©n thùc hiÖn c¸c chøc n¨ng trong tÕ
bµo. VÝ dô nh­ thÓ sao chÐp lµ mét bé m¸y sinh häc cã thÓ sao chÐp DNA mét
c¸ch chÝnh x¸c vµ nhanh chãng. Trong qu¸ tr×nh dÞch m·, ribosome lµ mét bé m¸y
lín h¬n vµ phøc t¹p h¬n c¸c bé m¸y ®· m« t¶ tr­íc ®ã (bé m¸y sao chÐp, bé m¸y
phiªn m·). Do phøc hîp nµy thùc hiÖn mét sè c«ng viÖc víi sù chÝnh x¸c cao vµ
víi tèc ®é nhanh. Víi lÝ do nµy, ribosome ®­îc vÝ nh­ mét nhµ m¸y cã chøa nhiÒu
bé m¸y ho¹t ®éng mét c¸ch nhÞp nhµng vµ ®ång bé.
ë tÊt c¶ c¸c sinh vËt, ribosome cã chøa mét d­íi ®¬n vÞ nhá vµ mét d­íi ®¬n
vÞ lín, mçi d­íi ®¬n vÞ lµ phøc hîp cña mét sè lo¹i c¸c rRNA vµ kho¶ng 50 protein.
C¸c d­íi ®¬n vÞ ®­îc ®Æc tr­ng bëi tèc ®é l¾ng cña chóng khi t¸ch chóng ë m¸y
siªu li t©m, v× tªn cña chóng ®­îc b¾t nguån tõ nh÷ng h»ng sè l¾ng trong ®¬n vÞ
Svedberg (S), mµ nã chØ ®Þnh cho kÝch th­íc ph©n tö. ë prokaryote, d­íi ®¬n vÞ
nhá vµ d­íi ®¬n vÞ lín gäi lµ 30S vµ 50S t­¬ng øng, khi chóng kÕt hîp víi nhau
t¹o thµnh ribosome 70S. Cßn ë eukaryote, lµ 40S vµ 50S, víi ph©n tö ribosome
hoµn thiÖn lµ 80S. MÆc dï ribosome cña eukaryote lín h¬n vµ phøc t¹p h¬n do
thµnh phÇn vµ sè l­îng protein vµ rRNA cña chóng lín h¬n cña prokaryote (h×nh
3.12a), nh­ng nh÷ng thµnh phÇn vµ c¸c b­íc tæng hîp protein nh×n chung lµ gièng
víi prokaryote. Sù gièng nhau trong qu¸ tr×nh dÞch m· ë prokaryote vµ eukaryote
®· chØ ra r»ng qu¸ tr×nh dÞch m· lµ mét qu¸ tr×nh cæ, mµ nã ®­îc xuÊt hiÖn ë tæ
tiªn chung cña prokaryote vµ eukaryote.
§iÒu ®¸ng ng¹c nhiªn khi nghiªn cøu thµnh phÇn cña ribosome lµ 2/3 khèi
l­îng cña nã lµ RNA vµ protein chØ chiÕm 1/3. Do ®ã, c¸c rRNA lµ nh÷ng ph©n
tö uèn khóc bëi sù b¾t cÆp cña c¸c base néi ph©n t¹o thµnh cÊu tróc bËc hai æn
®Þnh, ®­îc cho lµ phï hîp víi chøc n¨ng nh­ mét dµn m¸y cÇn thiÕt cho viÖc kÕt
hîp chÝnh x¸c víi c¸c protein cña ribosome (h×nh 3.12c). Theo m« h×nh nµy, c¸c
protein cña ribosome cã thÓ phï hîp cho viÖc thùc hiÖn c¸c b­íc quan träng trong
tæng hîp protein. Nh­ng hiÖn nay quan ®iÓm nµy ®· ®­îc thay ®æi khi ng­êi ta
kh¸m ph¸ ra ho¹t tÝnh xóc t¸c cña RNA, vµ ng­êi ta tin r»ng c¸c rRNA ®­îc kÕt

138
hîp l¹i víi nhau bëi c¸c protein ribosome, thùc hiÖn hÇu hÕt c¸c b­íc quan träng
trong tæng hîp protein.

C¸c ®Æc ®iÓm cña ribosome


Ribosome thùc hiÖn c¶ hai vai trß quan träng trong tæng hîp protein: kÕt hîp
c¸c ph©n tö tRNA víi ph©n tö mRNA, ®Ó dÞch m· tr×nh tù nucleotide trªn mRNA
thµnh tr×nh tù amino acid cña protein. C¸c ph©n tö tRNA vµ mRNA ®­îc ®Þnh vÞ
trong ribosome, v× thÕ c¸c codon cña mRNA cã thÓ t­¬ng t¸c víi anticodon cña
tRNA, c¸c vÞ trÝ t­¬ng t¸c nµy ®­îc m« t¶ ë h×nh 3.12b.

c
b
H×nh 3.12. Thµnh phÇn cÊu t¹o cña ribosome ë prokaryote vµ eukaryote (a). C¸c vÞ trÝ t­¬ng t¸c
cña ribosome trong qu¸ tr×nh dÞch m· (b) vµ cÊu tróc bËc 2 cña rRNA 16S cña prokaryote (c)

139
VÞ trÝ liªn kÕt cho mRNA hoµn toµn n»m trong d­íi ®¬n vÞ nhá, cã ba vÞ trÝ
liªn kÕt cho c¸c ph©n tö tRNA. Mçi ph©n tö tRNA, ®­îc liªn kÕt vµo trong
ribosome, t¹o thµnh cÇu nèi gi÷a d­íi ®¬n vÞ 30S vµ 50S, víi ®Çu anticodon n»m
ë d­íi ®¬n vÞ 30, ®Çu aminoacyl n»m trong d­íi ®¬n vÞ 50S. VÞ trÝ A (cho
aminoacyl) liªn kÕt víi aminoacyl tRNA ®i vµo, mµ ®Çu anticodon cña tRNA nµy
b¾t cÆp víi codon ë vÞ trÝ A cña d­íi ®¬n vÞ 30S (cßn gäi lµ trung t©m m· hãa) cßn
®Çu g¾n aminoacyl t­¬ng t¸c víi trung t©m peptidyl transferase cña d­íi ®¬n vÞ
50S. Khi ribosome di chuyÓn theo h­íng 5’, tRNA nµy ®­îc chuyÓn sang vÞ trÝ P
cña d­íi ®¬n vÞ 30S vµ ®Çu aminoacyl chøa chuçi peptide ®ang mäc dµi ra n»m
trong cÊu tróc ®­êng hÇm cña d­íi ®¬n vÞ 50S. VÞ trÝ E (exit-lèi ra) chøa c¸c tRNA
®· bÞ deacyl hãa, gi¶i phãng chóng ra khái ribosome, mÆc dï t¹i vÞ trÝ nµy nh÷ng
t­¬ng t¸c gi÷a anticodon-codon vÉn cßn nh­ng nã kh«ng ®ñ m¹nh ®Ó duy tr×.
Hai vïng trong ribosome ®ãng vai trß quan träng trong tæng hîp protein, ®ã
lµ trung t©m m· hãa ë d­íi ®¬n vÞ 30S ®¶m b¶o r»ng chØ cã c¸c tRNA mang c¸c
anticodon b¾t cÆp víi codon sÏ ®­îc chÊp nhËn vµo vÞ trÝ A. Vïng thø hai lµ trung
t©m peptidyl transferase n»m trong d­íi ®¬n vÞ 50S lµ n¬i xóc t¸c ®Ó h×nh thµnh
liªn kÕt peptide gi÷a c¸c amino acid. GÇn ®©y, cÊu tróc cña ribosome vµ sù kÕt hîp
víi c¸c tRNA ®· ®­îc x¸c ®Þnh ë møc nguyªn tö b»ng nhiÒu kü thuËt, bao gåm c¶
kü thuËt tinh thÓ tia X. Nh÷ng kÕt qu¶ nµy ®· chØ ra r»ng, c¶ hai trung t©m cña
ribosome ®­îc cÊu t¹o hoµn toµn bëi c¸c vïng cña rRNA, mµ t­¬ng t¸c quan
träng trong hai trung t©m nµy lµ t­¬ng t¸c tRNA-rRNA. Sù h×nh thµnh liªn kÕt
peptide thËm chÝ cßn ®­îc cho lµ ®­îc xóc t¸c bëi mét vÞ trÝ ho¹t ®éng trong
rRNA vµ ®­îc kÕt hîp víi nh÷ng protein ribosome.
2.2. c¸c giai ®o¹n cña qu¸ tr×nh dÞch m·
Qu¸ tr×nh dÞch m· cã thÓ ®­îc chia thµnh ba giai ®o¹n, ®ã lµ c¸c giai ®o¹n:
khëi ®Çu, kÐo dµi vµ kÕt thóc. Ngoµi ribosome, c¸c tRNA vµ mRNA, cßn cã c¸c
protein cÇn thiÕt cho viÖc hoµn thµnh c¸c giai ®o¹n. V× c¸c b­íc chÝnh trong giai
®o¹n khëi ®Çu dÞch m· lµ kh¸c nhau râ rÖt ë prokaryote vµ eukaryote. Do ®ã, sù
khëi ®Çu ®­îc t¸ch lµm hai nhãm. Giai ®o¹n kÐo dµi vµ kÕt thóc ®­îc m« t¶ gièng
nh­ ë vi khuÈn, mµ hai giai ®o¹n nµy ®· ®­îc lµm s¸ng tá trong thêi gian gÇn ®©y.
2.2.1. Giai ®o¹n khëi ®Çu
Khëi ®Çu dÞch m· lµ mét giai ®o¹n cùc k× phøc t¹p víi sù tham gia cña hµng
lo¹t nh©n tè protein: c¸c nh©n tè khëi ®Çu (IF- initiation factor). Ng­êi ta ®· x¸c
®Þnh ®­îc ba nh©n tè IF ë prokaryote vµ 6 nh©n tè IF ë eukaryote (eIF).

140
C«ng viÖc chÝnh cña giai ®o¹n khëi ®Çu dÞch m· lµ ®Þnh vÞ aminoacyl tRNA
®Çu tiªn vµo vÞ trÝ P cña ribosome, b»ng c¸ch nµy sù khëi ®Çu dÞch m· chÝnh x¸c
t¹i vÞ trÝ m· khëi ®Çu trªn khung ®äc. ë hÇu hÕt sinh vËt prokaryote vµ tÊt c¶
eukaryote, amino acid ®Çu tiªn cña bÊt kú chuçi polypeptide míi ®­îc tæng hîp
®Òu lµ methionine, ®­îc m· hãa bëi bé ba AUG. Amino acid khëi ®Çu nµy kh«ng
g¾n víi tRNA cña methionine, mµ nã g¾n víi mét tRNA ®Æc biÖt gäi lµ tRNAMet i
(tRNA vËn chuyÓn methionine khëi ®Çu). ë vi khuÈn, mét nhãm formyl ®­îc g¾n
vµo methionine khi amino acid nµy ®­îc g¾n vµo chÊt khëi ®Çu, h×nh thµnh nªn
N-formylmethionine (nhãm formyl trong N-formylmethionine sau ®ã bÞ lo¹i bá).
H·y nhí l¹i r»ng, ë c¶ prokaryote vµ eukaryote, mRNA cã vïng 5’ kh«ng
dÞch m· bao gåm c¶ tr×nh tù cña vÞ trÝ b¾t ®Çu phiªn m· vµ vÞ trÝ b¾t ®Çu dÞch m·.
ë prokaryote, c¸c codon khëi ®Çu ®­îc ®øng tr­íc bëi tr×nh tù ®Æc biÖt gäi lµ tr×nh
tù Shine-Dalgarno, mµ nã b¾t cÆp víi ®Çu 3’ cña rRNA 16S trong d­íi ®¬n vÞ 30S.
Sù b¾t cÆp chÝnh x¸c nµy ®· ®Þnh vÞ c¸c codon khëi ®Çu ë vÞ trÝ P n¬i tRNA khëi
®Çu sÏ liªn kÕt vµo (h×nh 3.13). mRNA cã thÓ chØ b¾t cÆp víi d­íi ®¬n vÞ 30S, chó
ý r»ng rRNA ®ãng vai trß chñ ®¹o ®Ó ch¾c ch¾n r»ng ribosome ®­îc ®Æt vµo ®óng
vÞ trÝ khëi ®Çu dÞch m·.

H×nh 3.13. Sù b¾t cÆp gi÷a tr×nh tù Shine-Dalgarno víi rRNA 16S cña d­íi
®¬n vÞ ribosome 30S
Vi khuÈn cã ba lo¹i protein-IF1, IF2 vµ IF3 (IF lµ viÕt t¾t cña nh©n tè khëi
®Çu-initation factor) ®­îc cÇn cho sù khëi ®Çu dÞch m· mét c¸ch chÝnh x¸c. Trong
khi IF3 cÇn thiÕt cho viÖc gi÷ d­íi ®¬n vÞ 30S ph©n ly khái d­íi ®¬n vÞ 50S, th×
IF1 vµ IF2 ho¹t ®éng ®Ó ®¶m b¶o r»ng chØ cã tRNA khëi ®Çu ®i vµo vÞ trÝ P (h×nh
3.14a). D­íi ®¬n vÞ 30S, mRNA vµ tRNA khëi ®Çu t¹o thµnh phøc hîp khëi ®Çu
30S. Ribosome 70S hoµn chØnh ®­îc h×nh thµnh b»ng c¸ch kÕt hîp phøc hîp khëi
®Çu 30S víi d­íi ®¬n vÞ 50S vµ gi¶i phãng c¸c nh©n tè khëi ®Çu.

141
V× prokaryote kh«ng cã khoang nh©n ®Ó ph©n t¸ch qu¸ tr×nh phiªn m· vµ
dÞch m·, do ®ã phøc hîp khëi ®Çu cã thÓ h×nh thµnh t¹i tr×nh tù Shine-Dalgarno
gÇn ®Çu 5’ cña mét mRNA ®ang ®­îc phiªn m·. Ng­îc l¹i, qu¸ tr×nh phiªn m· vµ
dÞch m· ë eukaryote x¶y ra ë hai kh«ng gian riªng biÖt trong tÕ bµo. Nh­ ë phÇn
tr­íc ®· ®Ò cËp c¸c mRNA cña tÕ bµo eukaryote ®­îc biÕn ®æi trong nh©n tr­íc
khi ®­îc vËn chuyÓn ra tÕ bµo chÊt ®Ó dÞch m·. Trong tÕ bµo chÊt, mRNA th­êng
®­îc bao phñ bëi c¸c protein vµ c¸c vïng cã thÓ xo¾n kÐp do sù b¾t cÆp cña c¸c
base néi ph©n. C¸c vïng cÊu tróc bËc hai nµy cÇn ®­îc lo¹i bá, ®Ó lé ra codon khëi
®Çu lµ AUG. Sù lo¹i bá nµy ®­îc thùc hiÖn bëi c¸c nh©n tè khëi ®Çu (gäi lµ eIF4A,
B vµ G), lµ phøc hîp liªn kÕt víi cÊu tróc mò (lµ cÊu tróc cã ë ®Çu 5’ cña tÊt c¶
mRNA ë eukaryote) vµ víi d­íi ®¬n vÞ 40S ®· g¾n tRNA khëi ®Çu (h×nh 3.14b).
Trong cïng thêi ®iÓm nµy, viÖc quÐt c¸c tr×nh tù ®Ó lé ra codon khëi ®Çu, sau ®ã
phøc hîp khëi ®Çu 40S nµy kÕt hîp víi d­íi ®¬n vÞ 60S, ®Ó h×nh thµnh nªn mét
ribosome 80S hoµn chØnh. Gièng nh­ ë prokaryote, khi phøc hîp khëi ®Çu 80S
®­îc h×nh thµnh, nã sÏ gi¶i phãng c¸c nh©n tè khëi ®Çu tr­íc khi nã b­íc vµo giai
®o¹n kÐo dµi dÞch m·.

a b

H×nh 3.14. Giai ®o¹n khëi ®Çu dÞch m· ë prokaryote (a) vµ giai ®o¹n khëi ®Çu dÞch m·
ë eukaryote (b)
142
2.2.2. Giai ®o¹n kÐo dµi
Trong suèt giai ®o¹n kÐo dµi nµy, ribosome ®­îc h×nh dung nh­ mét nhµ
m¸y. mRNA ho¹t ®éng nh­ mét b¶n ®å chuyªn biÖt cho c¸c tRNA, mçi tRNA
thùc hiÖn chøc n¨ng vËn chuyÓn amino acid. Mçi amino acid ®­îc thªm vµo chuçi
polypeptide ®ang mäc dµi trong khi tRNA bÞ deacyl hãa ®­îc quay vßng b»ng
c¸ch g¾n thªm mét amino acid kh¸c (h×nh 3.15). H×nh 3.15 m« t¶ chi tiÕt c¸c b­íc
thùc hiÖn giai ®o¹n kÐo dµi dÞch m·, trong giai ®o¹n nµy cã thªm hai protein tham
gia thùc hiÖn giai ®o¹n kÐo dµi, ®­îc gäi lµ nh©n tè kÐo dµi Tu ( viÕt t¾t lµ EF-Tu-
elongation factor Tu) vµ G (EF-G).

H×nh 3.15. C¸c b­íc thùc hiÖn trong giai ®o¹n kÐo dµi dÞch m·

ë phÇn tr­íc cña ch­¬ng, chóng ta thÊy r»ng aminoacyl tRNA ®­îc h×nh
thµnh b»ng liªn kÕt céng hãa trÞ víi amino acid ë ®Çu 3’ cña tRNA mµ cã chøa
anticodon cña amino acid ®ã. Tr­íc khi aminoacyl tRNA ®­îc sö dông ®Ó tæng
hîp protein, chóng ®­îc kÕt hîp víi protein EF-Tu ®Ó t¹o thµnh phøc hîp tam
ph©n (®­îc hîp thµnh bëi amino acid, tRNA vµ EF-Tu). Chu kú kÐo dµi sÏ ®­îc
më ®Çu b»ng mét tRNA khëi ®Çu ®· liªn kÕt ë vÞ trÝ P vµ vÞ trÝ A s½n sµng ®Ó nhËn
mét phøc hîp tam ph©n (h×nh 3.15), mµ c¸c codon ®­îc b¾t cÆp ®óng víi anticodon

143
cña tRNA ë trung t©m m· hãa trong d­íi ®¬n vÞ nhá. Khi sù b¾t cÆp ®óng ®­îc
t¹o ra, ribosome sÏ thay ®æi h×nh d¹ng vµ EF-Tu rêi khái phøc hîp tam ph©n. Hai
®Çu cña aminoacyl ®­îc ®Æt c¹nh nhau ë trung t©m peptidyl transferase trong d­íi
®¬n vÞ lín. T¹i ®©y, mét liªn kÕt peptide ®­îc h×nh thµnh bëi sù di chuyÓn cña
methionine ë vÞ trÝ P ®Õn amino acid ë vÞ trÝ A. Th«ng qua ho¹t ®éng cña protein
thø hai lµ EF-G, mµ nã cã h×nh d¹ng phï hîp víi vÞ trÝ A, c¸c tRNA ë vÞ trÝ A vµ
P bÞ ®Èy ®Õn vÞ trÝ P vµ E t­¬ng øng. Khi nµy, mRNA ®­îc dÞch chuyÓn th«ng qua
ribosome, v× thÕ codon tiÕp theo ®­îc ®Þnh vÞ ë vÞ trÝ A. Khi EF-G rêi khái
ribosome, vÞ trÝ A ®­îc më ra ®Ó nhËn mét phøc hîp tam ph©n tiÕp theo. C¸c chu
kú tiÕp theo, vÞ trÝ A ®­îc lÊp ®Çy víi mét phøc hîp tam ph©n khi tRNA bÞ deacyl
hãa rêi khái vÞ trÝ E. Trong giai ®o¹n kÐo dµi, sè l­îng amino acyl trong peptidyl
tRNA ë vÞ trÝ P t¨ng lªn vµ ®Çu tËn cïng amino cña chuçi peptide ®ang mäc dµi ra
cuèi cïng còng sÏ thß ra khái ®­êng hÇm cña d­íi ®¬n vÞ 50S vµ lã ra khái
ribosome. Qu¸ tr×nh ®­îc lÆp l¹i cho ®Õn khi xuÊt hiÖn dÊu hiÖu kÕt thóc dÞch m·.
Nh©n tè EF-Tu ®Ó vËn chuyÓn aminoacyl tRNA ®Õn vÞ trÝ A cña ribosome
b»ng c¸ch thñy ph©n n¨ng l­îng cña GTP, d­íi d¹ng phøc EF-Tu/GTP, khi EF-
Tu ®­îc lo¹i ra khái vÞ trÝ A nã cã d¹ng EF-Tu/GDP. GDP bÞ ®Èy ra khái phøc
hîp EF-Tu/GDP bëi mét nh©n tè kÐo dµi Ts (EF-Ts) t¹o thµnh phøc hîp EF-
Tu/EF-Ts. Phøc hîp nµy dÔ dµng nhËn ph©n tö GTP míi ®Ó h×nh thµnh nªn EF-
Tu/GTP cã kh¶ n¨ng vËn chuyÓn aminoacyl tRNA ®Õn vÞ trÝ A cña ribosome. C¸c
b­íc nµy ®­îc gäi lµ chu kú chuyÓn vÞ cña nh©n tè EF-Tu.
2.2.3. Giai ®o¹n kÕt thóc
Chu kú kÐo dµi tiÕp diÔn cho ®Õn khi vÞ trÝ A cña ribosome lµ mét trong ba
bé ba kÕt thóc (UGA, UAA hoÆc UAG). H·y nhí l¹i r»ng kh«ng cã mét tRNA
nµo nhËn biÕt ®­îc c¸c codon nµy, thay vµo ®ã lµ c¸c protein ®­îc gäi lµ nh©n tè
gi¶i phãng (release factor – RF), ë vi khuÈn cã ba nh©n tè gi¶i phãng ®ã lµ RF1,
RF2 vµ RF3, nhËn biÕt ®­îc c¸c codon kÕt thóc. ë vi khuÈn, nh©n tè RF1 nhËn
biÕt codon UGA hoÆc UAG, RF2 th× nhËn biÕt ®­îc c¸c codon kÕt thóc UAA hoÆc
UGA. C¶ hai nh©n tè nµy ®­îc hç trî bëi nh©n tè RF3. Sù t­¬ng t¸c gi÷a RF1 vµ
RF2 ë vÞ trÝ A kh¸c víi sù t­¬ng t¸c cña phøc hîp tam ph©n ë hai ph­¬ng thøc:
- §Çu tiªn c¸c codon kÕt thóc ®­îc nhËn biÕt bëi c¸c bé ba peptide trong c¸c
nh©n tè gi¶i phãng (RF) chø kh«ng ph¶i b»ng anticodon.
- Thø hai c¸c nh©n tè gi¶i phãng phï hîp víi vÞ trÝ A cña d­íi ®¬n vÞ 30S
nh­ng kh«ng cã sù h×nh thµnh liªn kÕt peptide, thay vµo ®ã lµ mét ph©n tö n­íc
®i vµo trung t©m peptidyl transferase vµ dÉn ®Õn sù gi¶i phãng polypeptide khái

144
tRNA ë vÞ trÝ P vµ rêi khái ribosome. C¸c d­íi ®¬n vÞ 30S vµ 50S cña ribosome
ph©n t¸ch vµ s½n sµng cho viÖc h×nh thµnh mét phøc hîp khëi ®Çu míi.

H×nh 3.16. C¸c b­íc kÕt thóc dÞch m·

Khi so s¸nh cÊu tróc kh«ng gian cña phøc hîp tam ph©n víi c¸c nh©n tè EF-G,
RF1 vµ RF2 b»ng ph­¬ng ph¸p tinh thÓ tia X. EF-G cã h×nh d¹ng t­¬ng tù nh­
phøc hîp tam ph©n, cßn h×nh d¹ng cña c¸c nh©n tè gi¶i phãng gièng nh­ c¸c
tRNA bÞ deacyl hãa.
2.3. tÝnh chÝnh x¸c cña ph¶n øng tæng hîp protein
TÇn sè sai sãt x¶y ra trong ph¶n øng tæng hîp protein thÊp, chØ kho¶ng 10-5 -
10-4. §iÒu nµy cho thÊy ph¶n øng tæng hîp protein ®­îc kiÓm so¸t chÆt chÏ tõ ph¶n
øng g¾n amino acid vµo tRNA ®Õn ba giai ®o¹n trong qu¸ tr×nh tæng hîp. Ph¶n
øng g¾n amino acid vµo tRNA ®­îc xóc t¸c bëi enzyme aminoacyl-tRNA
synthetase. CÊu tróc ph©n tö cña enzyme gåm nhiÒu vïng víi chøc n¨ng kh¸c nhau
(h×nh 3.17). Mét enzyme ®Æc hiÖu cho mét amino acid vµ mét tRNA vËn chuyÓn
amino acid ®ã.
Sai sãt x¶y ra khi enzyme g¾n nhÇm amino acid vµo tRNA hoÆc ng­îc l¹i.
VÝ dô nh­, cysteine cã thÓ bÞ g¾n nhÇm vµo tRNA cña alanine (cystein-tRNAAla).
Tuy nhiªn, nh÷ng sai sãt nµy ®­îc ph¸t hiÖn vµ lo¹i bá nhê sù kh«ng t­¬ng thÝch

145
vÒ cÊu tróc khi phøc aminoacyl-tRNA ®i vµo ribosome. §©y lµ ho¹t tÝnh ®äc söa
(proofreading) cña enzyme sythetase. Mét khi ®· ®äc söa xong th× tRNA cã nhiÖm
vô mang ®óng amino acid ®ã vµo ribosome; ®èi m· trªn tRNA t­¬ng t¸c víi m·
trªn mRNA vµ amino acid ®­îc chuyÓn sang chuçi peptide. B»ng con ®­êng hãa
häc, cã thÓ thay thÕ amino acid ®óng b»ng amino acid sai trong phøc aminoacyl-
tRNA. VÝ dô, cysteyl-tRNACys (tRNA mang cystein ë tr¹ng th¸i ho¹t hãa) cã thÓ
®­îc thay thµnh alanyl-tRNACys. Trong ph¶n øng tæng hîp protein in vitro, alanine
(amino acid sai) ®­îc chuyÓn tõ phøc alanyl-tRNACys vµo chuçi peptide, mÆc dï
®èi m· trªn tRNACys t¹o cÆp víi m· bé ba cho cystein trªn mRNA. §iÒu nµy cho
thÊy tÝnh chÝnh x¸c cña c¸c amino acid trong chuçi peptide phô thuéc vµo ph¶n
øng g¾n amino acid víi tRNA. NÕu sai sãt kh«ng bÞ ph¸t hiÖn th× amino acid sai
vÉn nèi vµo chuçi peptide ngay khi ®èi m· cña tRNA vµ m· bé ba cña mRNA
hoµn toµn t­¬ng xøng víi nhau.

H×nh 3.17. CÊu t¹o cña enzyme aminoacyl-tRNA synthetase

Sai sãt x¶y ra trong qu¸ tr×nh tæng hîp ë ribosome chñ yÕu do ribosome tr­ît
lÖch kh«ng ®óng 3 nucleotide (mét codon) hoÆc bá qua m· bé ba trªn ph©n tö
mRNA. §iÒu nµy g©y sai sãt t­¬ng tù nh­ ®ét biÕn lÖch khung ®äc hoÆc ®ét biÕn
lµm mÊt vµi amino acid (h×nh 3.18). HiÖn t­îng tr­ît phô thuéc chñ yÕu vµo cÊu
tróc ph©n tö mRNA. Ngoµi ra, ribosome cã thÓ chÊp nhËn amino acid kh«ng ®óng
víi m· bé ba trªn mRNA. §iÒu nµy x¶y ra khi tRNA bÞ ®ét biÕn hoÆc cã thay ®æi
trong cÊu tróc kh«ng gian. VÝ dô: mét vµi tRNA cã kh¶ n¨ng nhËn biÕt m· dõng
tæng hîp nh­ mét codon cña amino acid nµo ®ã. Thùc nghiÖm cho thÊy, tÇn suÊt
t­¬ng t¸c khi chØ cã 2 nucleotide cña codon vµ anticodon bæ sung víi nhau chØ sai
kh¸c kho¶ng 10-1 ®Õn 10-2 lÇn so víi khi c¶ 3 nucleotide cña codon vµ anticodon
®Òu bæ sung víi nhau. Nh­ vËy, t­¬ng t¸c gi÷a codon trªn mRNA vµ anticodon
trªn tRNA kh«ng ph¶i lµ ®iÒu kiÖn duy nhÊt quyÕt ®Þnh tÝnh chÝnh x¸c. Thùc tÕ,
t­¬ng t¸c t¹o cÆp bæ sung t¹o ®iÒu kiÖn ®Ó mRNA aminoacyl-tRNA t­¬ng t¸c víi

146
rRNA. NÕu kh«ng x¶y ra t­¬ng t¸c gi÷a rRNA 16S vµ aminoacyl-tRNA, phøc
aminoacyl-tRNA sÏ bÞ ®µo th¶i ra khái vÞ trÝ A trªn ribosome.

H×nh 3.18. Mét sè sai sãt trong qu¸ tr×nh dÞch m· tæng hîp protein g©y ra do hiÖn t­îng
ribosome di chuyÓn lÖch m· trªn sîi mRNA

HiÖn t­îng ribosome tr­ît m· di truyÒn trªn sîi mRNA ®­îc virus, nÊm men
sö dông ®Ó kiÓm so¸t dÞch m· t¹o ra c¸c polyprotein. Khi ®ã, c¬ chÕ kiÓm so¸t
®­îc gäi lµ dÞch m· lu©n phiªn (alternative translation). Trong tÕ bµo nÊm men,
hai gen tya vµ tyb n»m c¹nh nhau. HiÖn t­îng dÞch m· lu©n phiªn cho phÐp tõ mét
sîi mRNA tæng hîp ®­îc c¸c protein Tya vµ polyprotein Tya-Tyb.

147
CHƯƠNG 5 ĐIỀU HÒA BIỂU HIỆN GEN
Trong c¸c ch­¬ng võa qua, chóng ta ®· xem xÐt c¬ chÕ ho¹t ®éng cña ba qu¸
tr×nh thiÕt yÕu cho sù tån t¹i cña tÕ bµo, ®ã lµ sù sao chÐp, phiªn m· vµ dÞch m·.
Nh­ng tÕ bµo kh«ng thÓ tån t¹i ®éc lËp t¸ch rêi khái m«i tr­êng xung quanh. Sù
trao ®æi chÊt liªn tôc gi÷a tÕ bµo vµ m«i tr­êng ngoµi lµ mét trong nh÷ng ®Æc tÝnh
c¬ b¶n cña sù sèng. §èi víi tÕ bµo prokaryote, m«i tr­êng nµy lµ tËp hîp c¸c nh©n
tè lý ho¸ bao quanh tÕ bµo; cßn ®èi víi tÕ bµo eukaryote ®ã lµ tËp hîp c¸c tÕ bµo
l©n cËn. Nh­ vËy n¶y sinh mét vÊn ®Ò lín: b»ng c¸ch nµo tÕ bµo ®iÒu chØnh ho¹t
®éng cña m×nh cho phï hîp víi c¸c biÕn ®æi cña m«i tr­êng ngoµi ®Ó cã thÓ tån
t¹i thÝch øng?
Tr­íc khi ®Ò cËp ®Õn c¸c ph­¬ng thøc mµ tÕ bµo prokaryote vµ eukaryote sö
dông ®Ó tù ®iÒu chØnh, chóng ta h·y thö ®iÓm l¹i mét sè kh¸c biÖt gi÷a hai lo¹i tÕ
bµo, v× chÝnh nh÷ng sù sai kh¸c nµy quy ®Þnh c¸c ph­¬ng thøc ®iÒu chØnh sÏ ®­îc
sö dông. ë ®©y, ®Ó ®¬n gi¶n ho¸ vÊn ®Ò, chóng t«i dïng tõ "eukaryote" ®Ó chØ c¸c
sinh vËt ®a bµo vµ "prokaryote" ®Ó chØ c¸c sinh vËt ®¬n bµo v× mÆc dï cã mét sè
eukaryote lµ ®¬n bµo nh­ nÊm men nh­ng sè nµy hoµn toµn kh«ng ®¸ng kÓ.
§éng c¬ cña sù ®iÒu hoµ biÓu hiÖn gen:
- ë prokaryote, môc ®Ých cña sù ®iÒu hoµ biÓu hiÖn gen lµ nh»m ®iÒu chØnh
hÖ enzyme cho phï hîp víi c¸c t¸c nh©n dinh d­ìng vµ lÝ ho¸ cña m«i tr­êng,
®¶m b¶o ®­îc hai yªu cÇu chÝnh cña tÕ bµo: t¨ng tr­ëng vµ sinh s¶n. Sù ®iÒu hoµ
ë ®©y rÊt linh ®éng vµ cã tÝnh thuËn nghÞch, nghÜa lµ tuú thuéc vµo ®iÒu kiÖn m«i
tr­êng, c¸c gen m· ho¸ cho c¸c enzyme cã thÓ ®­îc biÓu hiÖn hay ng­ng biÓu
hiÖn vµo bÊt k× thêi ®iÓm nµo cña ®êi sèng tÕ bµo, mét enzyme cã thÓ ®­îc s¶n
xuÊt, ngõng s¶n xuÊt råi ®­îc t¸i s¶n xuÊt sau ®ã.
- ë eukaryote, do tÕ bµo kh«ng tiÕp xóc trùc tiÕp víi m«i tr­êng, sù ®iÒu hoµ
ë ®©y kh«ng cßn nh»m môc ®Ých ®èi phã víi c¸c biÕn ®éng ngo¹i bµo. Lµ mét
thµnh phÇn cña c¬ thÓ sèng, mçi tÕ bµo ph¶i tu©n thñ nghiªm ngÆt mét ch­¬ng
tr×nh ph¸t triÓn chuyªn biÖt tõ khi c¬ thÓ cßn lµ ph«i thai cho ®Õn lóc tr­ëng thµnh.
Sù ®iÒu hoµ ë ®©y h­íng ®Õn viÖc chuyªn biÖt ho¸ tõng lo¹i tÕ bµo vµo tõng cÊu
tróc, chøc n¨ng riªng vµ kh«ng mang tÝnh thuËn nghÞch. ThËt vËy, mét tÕ bµo ®·
®i vµo con ®­êng chuyªn biÖt ho¸, nã kh«ng cßn kh¶ n¨ng quay trë l¹i tr¹ng th¸i
ban ®Çu hay chuyÓn sang mét h­íng kh¸c n÷a. VÝ dô nh­ tÕ bµo ph«i thai khi ®·
biÖt ho¸ thµnh tÕ bµo gan th× kh«ng thÓ trë thµnh tÕ bµo ruét.
CÊu tróc tÕ bµo prokaryote vµ eukaryote

148
Sù kh¸c biÖt trong cÊu tróc tÕ bµo prokaryote vµ eukaryote dÉn ®Õn nh÷ng
kh¸c biÖt trong ®iÒu hoµ biÓu hiÖn gen. ë tÕ bµo prokaryote, do kh«ng cã mµng
nh©n, mRNA võa ®­îc phiªn m· tõ DNA cã thÓ tiÕp xóc ngay víi bé m¸y dÞch
m· ®Ó lµm khu«n cho sù tæng hîp protein, sù phiªn m· vµ dÞch m· x¶y ra ®ång
thêi. Do ®ã, sù ®iÒu hoµ biÓu hiÖn gen chñ yÕu ®­îc thùc hiÖn ë giai ®o¹n phiªn
m·. Trong khi ®ã, ë tÕ bµo eukaryote, sù phiªn m· x¶y ra trong nh©n vµ sù dÞch
m· ngoµi tÕ bµo chÊt lµ hai qu¸ tr×nh kh«ng x¶y ra ®ång thêi; sù ®iÒu hoµ biÓu
hiÖn gen phøc t¹p h¬n, ®­îc tiÕn hµnh ë nhiÒu giai ®o¹n.
Ba thµnh phÇn cña sù ®iÒu hoµ biÓu hiÖn gen
C¸c ®Æc ®iÓm sinh häc cña tÕ bµo ®­îc x¸c ®Þnh bëi l­îng lín protein cã ho¹t
tÝnh ®­îc biÓu hiÖn trong tÕ bµo ®ã. Tuy nhiªn ë bÊt kú thêi ®iÓm nµo trong thêi
gian sèng cña tÕ bµo, chØ cã mét sè ®o¹n RNA vµ c¸c protein ®­îc m· hãa trong
bé gen ®­îc biÓu hiÖn. T¹i c¸c thêi ®iÓm kh¸c nhau, c¸c s¶n phÈm ®­îc biÓu hiÖn
®Æc tr­ng cña gen cã thÓ kh¸c nhau ë c¶ hai ph­¬ng diÖn ®ã lµ c¸c protein ®­îc
biÓu hiÖn vµ møc ®é biÓu hiÖn cña protein nµy.
Sù ®iÒu hßa tæng hîp c¸c b¶n phiªn m· cña gen ®Ó t¹o ra protein cña nã
th­êng ®­îc gäi lµ sù ®iÒu hßa biÓu hiÖn gen. Khi gen ®­îc biÓu hiÖn, nÕu s¶n
phÈm cuèi cïng lµ protein (®iÒu nµy ®óng víi hÇu hÕt c¸c gen), sù ®iÒu hßa cã thÓ
®¹t ®­îc b»ng c¸ch ®iÒu chØnh sù phiªn m· DNA thµnh RNA hoÆc dÞch m· tõ
mRNA thµnh protein. Trong thùc tÕ, sù ®iÒu hßa gen x¶y ra ë nhiÒu møc ®é kh¸c
nhau bao gåm c¶ sù æn ®Þnh mRNA vµ biÕn ®æi protein sau dÞch m·. Tuy nhiªn,
hÇu hÕt sù ®iÒu hßa ®­îc cho lµ chØ ho¹t ®éng ë møc ®é phiªn m· gen. V× thÕ ë
ch­¬ng nµy, träng ®iÓm ®Çu tiªn lµ sù ®iÒu hßa phiªn m·.
C¬ chÕ ®iÒu hßa c¬ b¶n, mµ c¸c ph©n tö bªn ngoµi hoÆc bªn trong dÉn tíi viÖc
liªn kÕt víi c¸c protein ®iÒu hßa, t¸c ®éng ®Õn vÞ trÝ DNA ®Æc biÖt liÒn kÒ víi vïng
m· hãa cho protein vµ sù liªn kÕt nµy ®iÒu khiÓn tèc ®é phiªn m·. C¸c protein nµy
cã thÓ hç trî mét c¸ch trùc tiÕp hay gi¸n tiÕp lªn RNA polymerase b»ng c¸ch liªn
kÕt víi vÞ trÝ khëi ®Çu phiªn m·-promoter-hoÆc chóng cã thÓ lµm dõng qu¸ tr×nh
phiªn m· b»ng c¸ch ng¨n c¶n sù liªn kÕt cña RNA polymerase. §Ó ®iÒu khiÓn sù
phiªn m·, c¸c protein ®iÒu hßa ph¶i cã mét hay nhiÒu vïng cã c¸c chøc n¨ng sau:
• Vïng cã kh¶ n¨ng nhËn biÕt nh©n tè ®iÒu hßa ®óng (vïng b¸m vµo DNA)
• Vïng t­¬ng t¸c víi Ýt nhÊt lµ mét protein cña bé m¸y phiªn m· (RNA
polymerase hoÆc mét protein kÕt hîp víi RNA polymerase).
• Vïng cã kh¶ n¨ng t¸c ®éng trùc tiÕp hay gi¸n tiÕp lªn nhiÔm s¾c chÊt thùc

149
• Vïng t­¬ng t¸c víi c¸c protein liªn kÕt víi DNA ë gÇn vÞ trÝ ®iÒu hßa ®Ó
phèi hîp víi nhau ®iÒu hßa qu¸ tr×nh phiªn m·.
• Vïng ho¹t ®éng nh­ mét c¶m biÕn cña nh÷ng ®iÒu kiÖn sinh lý bªn trong
tÕ bµo.

H×nh 4.1. Tæng quan vÒ ®iÒu hßa biÓu hiÖn gen ë prokaryote vµ eukaryote

Sù c¶i biªn qu¸ tr×nh ®iÒu hßa cho phÐp tÕ bµo ®iÒu hßa mét c¸ch chñ ®éng
vÒ kh¶ n¨ng dinh d­ìng, k×m h·m sù x©m nhËp cña c¸c t¸c nh©n g©y bÖnh ... hay
nh÷ng t¸c ®éng cña m«i tr­êng xung quanh, nh÷ng thay ®æi cña c¸c giai ®o¹n ph¸t
triÓn cña tÕ bµo. Do ®ã, ph©n tö ®iÒu hßa - ®Æc biÖt lµ protein ®iÒu hßa ph¶i cã mét
vïng c¶m biÕn ®Ó t­¬ng t¸c víi c¸c t¸c nh©n thÝch hîp trong m«i tr­êng tÕ bµo, ®Ó
vai trß ®iÒu hßa cña nã cã thÓ ®¸p øng víi nh÷ng nhu cÇu cña tÕ bµo ë thêi ®iÓm
hiÖn t¹i.
Nh×n chung, mÆc dï prokaryote vµ eukaryote cã nhiÒu c¬ chÕ ®iÒu hßa gen
gièng nhau, nh­ng cã mét sè ®Æc ®iÓm kh¸c nhau trong c¸c b­íc thùc hiÖn. H×nh
4.1 tãm t¾t nh÷ng ®Æc ®iÓm gièng vµ kh¸c nhau. Gièng nhau lµ c¶ hai ®Òu sö dông
nh÷ng protein ®iÒu hßa, mµ nã liªn kÕt gÇn víi vïng m· hãa cho protein ®Ó ®iÒu
khiÓn qu¸ tr×nh phiªn m·. Tuy nhiªn, v× bé gen cña eukaryote lín h¬n vµ c¸ch s¾p
xÕp c¸c ®iÓm liªn kÕt còng nhiÒu h¬n, cho nªn møc ®é ®iÒu hßa cña eukaryote
phøc t¹p h¬n prokaryote. Sù kh¸c biÖt quan träng nhÊt lµ DNA cña eukaryote ®­îc
®ãng gãi thµnh c¸c nucleosome h×nh thµnh nªn chÊt nhiÔm s¾c. ChÊt nµy lµ ®¬n

150
vÞ c¬ së cña nhiÔm s¾c thÓ, cÊu tróc nhiÔm s¾c thÓ cã tÝnh c¬ ®éng vµ lµ mét phÇn
cña ®iÒu hßa gen. Trong khi ®ã ë prokaryote, DNA kh«ng cã nucleosome.
- Nh÷ng tÝn hiÖu nµo g©y ra ®¸p øng lµm thay ®æi biÓu hiÖn cña mét gen?
- Sù ®iÒu hoµ biÓu hiÖn gen ®­îc thùc hiÖn ë giai ®o¹n nµo trong chuçi ph¶n
øng ®i tõ qu¸ tr×nh sao chÐp ®Õn sù dÞch m·?
- C¬ chÕ ph©n tö cña sù ®iÒu hoµ biÓu hiÖn gen: sù ®iÒu hoµ ®­îc tiÕn hµnh
ra sao? víi sù tham gia cña nh÷ng thµnh phÇn nµo?
Ta thö xem xÐt c¸c yÕu tè nµy qua hai m« h×nh ®iÒu hoµ ë prokaryote vµ
eukaryote.

1. m« h×nh ®iÒu hoµ biÓu hiÖn gen ë prokaryote


C¸c tÝn hiÖu ®iÒu hoµ ë ®©y chñ yÕu lµ c¸c yÕu tè dinh d­ìng hay vËt lÝ cña
m«i tr­êng. TÕ bµo ®¸p øng víi sù biÕn ®éng cña c¸c yÕu tè trªn b»ng c¸ch thay
®æi sù biÓu hiÖn c¸c gen: Gen cã thÓ t¨ng m¹nh hay ngõng h¼n ho¹t ®éng. Sù ®iÒu
hoµ biÓu hiÖn gen ë prokaryote, nh­ ®· nãi ë phÇn trªn, phÇn lín x¶y ra ë giai
®o¹n phiªn m·. C¬ chÕ ®iÒu hoµ chñ yÕu ®­îc thùc hiÖn th«ng qua c¸c operon.
§©y lµ kh¸i niÖm chØ tån t¹i ë prokaryote. Mçi operon bao gåm:
- Mét sè gen cÊu tróc (gen m· ho¸ cho mét polypeptide), hay cßn gäi lµ
cistron, n»m gÇn nhau.
- C¸c tr×nh tù DNA kh¸c tham gia vµo ho¹t ®éng ®iÒu hoµ.
Cã hai kiÓu operon: operon c¶m øng vµ operon k×m h·m

151
H×nh 4.1. Hai kiÓu ®iÒu hoµ ho¹t ®éng gen ë prokaryote
1.1. operon c¶m øng m· ho¸ cho c¸c enzyme cña con
®­êng dÞ ho¸
Qu¸ tr×nh dÞ ho¸ lµ qu¸ tr×nh trong ®ã c¸c chÊt h÷u c¬ phøc t¹p ®­îc biÕn ®æi
thµnh c¸c thµnh phÇn ®¬n gi¶n dïng cho ho¹t ®éng tÕ bµo. §iÓn h×nh cho kiÓu
operon c¶m øng lµ operon lactose. TÝn hiÖu ®iÒu hoµ ë ®©y lµ ®­êng lactose. Khi
kh«ng cã ®­êng lactose, c¸c gen m· ho¸ cho c¸c enzyme chuyÓn ho¸ cho lactose
kh«ng ®­îc biÓu hiÖn; chØ khi nguån hydrat carbon duy nhÊt trong m«i tr­êng lµ
®­êng lactose, vi khuÈn míi thÝch øng b»ng c¸ch s¶n sinh c¸c enzyme cÇn cho sù
x©m nhËp vµ biÕn ®æi cña lactose trong tÕ bµo. Sù ®iÒu hoµ biÓu hiÖn gen x¶y ra
hoµn toµn ë møc ®é phiªn m·.
1.1.1. C¬ chÕ ®iÒu hoµ cña Operon lac
1.1.1.1. KiÓm so¸t tiªu cùc - vai trß cña yÕu tè k×m h·m
Operon lac ë E.coli lµ operon ®Çu tiªn ®­îc ph¸t hiÖn vµ nghiªn cøu kh¸ chi
tiÕt tõ n¨m 1961 bëi Jacob vµ Monod. Ho¹t ®éng cña operon nµy ®­îc kiÓm so¸t
theo c¬ chÕ tiªu cùc, tøc lµ phiªn m· trªn operon lac bÞ øc chÕ bëi yÕu tè k×m h·m:
protein lacI. Protein nµy lµ s¶n phÈm cña gen lacI n»m ngay phÝa tr­íc operon lac.
Protein LacI chØ cã ho¹t tÝnh khi tån t¹i ë d¹ng tetramer. CÊu tróc vµ c¬ chÕ kiÓm
so¸t operon lac ®­îc tr×nh bµy ë h×nh 4.2.

152
Khi tån t¹i ë d¹ng tetramer, protein LacI cã hai vÞ trÝ t­¬ng t¸c. VÞ trÝ thø
nhÊt t­¬ng t¸c víi ®o¹n nucleotide thuéc vïng promoter cña operon lac. §o¹n nµy
chÝnh lµ operator (O). VÞ trÝ thø hai cã thÓ t­¬ng t¸c víi c¬ chÊt β-galactosides,
hoÆc c¸c chÊt cã cÊu tróc ho¸ häc t­¬ng tù c¬ chÊt, hoÆc mét sè ph©n tö ®Æc biÖt
nh­ isopropyl-thiogalactoside (IPTG). Thùc nghiÖm nhËn thÊy ho¹t ®éng cña
operon lac t¨ng rÊt m¹nh khi cã mÆt cña nh÷ng chÊt cã kh¶ n¨ng t­¬ng t¸c víi vÞ
trÝ thø hai trªn protein LacI. C¸c chÊt cã ®Æc tÝnh kÝch thÝch ho¹t ®éng cña c¸c gen
®­îc gäi chung lµ chÊt c¶m øng (inducer). Khi kh«ng cã chÊt c¶m øng trong m«i
tr­êng, qu¸ tr×nh phiªn m· trªn operon lac bÞ k×m h·m do protein LacI b¸m vµo
operator. Tuy nhiªn, khi cã mÆt chÊt c¶m øng, protein LacI t­¬ng t¸c víi chÊt c¶m
øng nªn bÞ thay ®æi cÊu tróc kh«ng gian. Do ®ã, mét khi ®· t­¬ng t¸c víi c¸c chÊt
c¶m øng th× protein LacI kh«ng cßn kh¶ n¨ng b¸m vµo vÞ trÝ øc chÕ n÷a. Lóc nµy
khëi ®Çu phiªn m· trªn operon lac kh«ng cßn bÞ k×m h·m nªn sè l­îng ph©n tö
mRNA t¨ng nhanh.
1.1.1.2. KiÓm so¸t tÝch cùc - vai trß cña yÕu tè ho¹t ho¸
KiÓm so¸t biÓu hiÖn cña operon lac ë E.coli khi trong m«i tr­êng kh«ng cã
glucose ®­îc xem lµ vÝ dô ®iÓn h×nh cho vai trß cña yÕu tè ho¹t ho¸ tham gia khëi
®Çu phiªn m·. Glucose lµ mét trong c¸c ®­êng cÇn thiÕt cho tÕ bµo vi khuÈn ph¸t
triÓn. Nã ®­îc tÕ bµo sö dông trùc tiÕp, nhanh chãng vµ ®¬n gi¶n nhÊt mµ kh«ng
yªu cÇu tæng hîp míi bÊt kú enzyme nµo. Khi glucose cïng víi mét sè ®­êng
kh¸c nh­ lactose, arabinose cïng cã mÆt trong m«i tr­êng, tÕ bµo chØ sö dông
glucose vµ k×m h·m ho¹t ®éng cña c¸c operon liªn quan ®Õn chuyÓn ho¸ c¸c lo¹i
®­êng kh¸c. HiÖn t­îng nµy ®­îc gäi lµ øc chÕ qu¸ tr×nh dÞ ho¸ (catabolite
reppression).
C¸c nhµ ho¸ häc ph¸t hiÖn r»ng, khi vi khuÈn thiÕu glucose, chóng sÏ t¨ng
c­êng tæng hîp nucleotide cyclic adenosine monophosphate (cAMP). Sè l­îng
cAMP t¨ng lªn gièng nh­ tÝn hiÖu b¸o ®éng vÒ nguy c¬ chuyÓn ho¸. H¬n n÷a, khi
bæ sung cAMP vµo m«i tr­êng cã chøa glucose vµ c¸c ®­êng kh¸c th× ho¹t ®éng
cña c¸c operon liªn quan ®Õn chuyÓn ho¸ c¸c ®­êng nµy kh«ng bÞ øc chÕ mµ ng­îc
l¹i ®­îc ho¹t ho¸. Nh­ vËy cAMP ®ãng vai trß quan träng bËt më ho¹t ®éng cña
mét sè gen ngay khi chóng ®ang ë tr¹ng th¸i bÞ k×m h·m.
Ph©n tÝch c¸c dßng tÕ bµo ®ét biÕn chØ cã kh¶ n¨ng sö dông glucose cho thÊy
cAMP cÇn t­¬ng t¸c víi mét protein ®ång ho¹t ho¸ kh¸c. Thùc nghiÖm ®· ph©n
lËp ®­îc protein nµy vµ gäi lµ protein ho¹t ho¸ qu¸ tr×nh dÞ ho¸ (catabolite activator
protein - CAP). Trong thÝ nghiÖm tæng hîp mRNA invitro ®èi víi operon lac, sè

153
l­îng mRNA t¨ng rÊt nhiÒu khi thªm cAMP vµ CAP vµo ph¶n øng. NÕu chØ thªm
mét trong hai chÊt ®ã, sè l­îng mRNA chØ chiÕm 5% so víi khi cã mÆt c¶ hai.
Nh­ vËy ngoµi viÖc bÞ ®iÒu khiÓn theo c¬ chÕ tiªu cùc bëi protein LacI, operon lac
cßn chÞu sù kiÓm so¸t theo c¬ chÕ tÝch cùc nhê phøc chÊt cAMP-CAP. Phøc nµy
t­¬ng t¸c víi promoter g©y uèn cong sîi DNA, béc lé vÞ trÝ b¸m cho RNA
polymerase. Nh­ vËy operon lac chÞu sù kiÓm so¸t cña hai c¬ chÕ. Qu¸ tr×nh
chuyÓn ®æi gi÷a hai c¬ chÕ nµy phô thuéc vµo ®iÒu kiÖn trong tÕ bµo vµ m«i tr­êng.

H×nh 4.3. Sù ®iÒu hoµ cña operon lac theo c¬ chÕ tÝch cùc

Môc tiªu cña sù ®iÒu hoµ biÓu hiÖn gen ë ®©y lµ nh»m tiÕt kiÖm tèi ®a n¨ng
l­îng. Th«ng th­êng tÕ bµo sÏ sö dông nguån ®­êng ®¬n gi¶n, cÇn Ýt n¨ng l­îng
®Ó "tiªu ho¸" tr­íc nh­ ®­êng glucose; chØ khi nµo kh«ng cã glucose, tÕ bµo míi
chuyÓn sang tiªu ho¸ lactose.
1.1.2. C¬ chÕ ®iÒu hoµ cña operon arabinose
C¬ chÕ ®iÒu hoµ d­¬ng, c¶m øng ®­îc t×m thÊy ë operon arabinose cña E.coli.
Arabinose lµ chÊt ®­êng, cÇn ba enzyme (®­îc m· ho¸ do c¸c gen araB, araA vµ
araD) cho sù biÕn d­ìng. Hai gen kh¸c n»m xa operon gãp phÇn ®­a arabinose
vµo tÕ bµo. Gen ®iÒu hoµ araC n»m gÇn c¸c gen BAD. S¶n phÈm cña gen araC lµ
chÊt øc chÕ (repressor) cña operon khi kh«ng cã ®­êng arabinose.
Tuy nhiªn, khi cã ®­êng arabinose trong tÕ bµo, nã g¾n víi repressor (protein
araC) h×nh thµnh nªn phøc hîp activator (ho¹t ho¸) t¹o thuËn tiÖn cho sù phiªn m·
cña RNA polymerase.

154
Trªn thùc tÕ, c¸c nghiªn cøu cho thÊy c¬ chÕ ®iÒu hoµ nµy rÊt phøc t¹p. VÝ
dô: cAMP (cyclic adenosine monophosphate) vµ protein ho¹t ho¸ qu¸ tr×nh dÞ hãa
(catabolite gen activator protein) cßn ®­îc gäi lµ CRP (cyclic AMP receptor
protein - protein thÓ nhËn cAMP) ®Òu tham gia vµo sù ®iÒu hoµ cña hÖ thèng
arabinose.

H×nh 4.4. C¬ chÕ ®iÒu hoµ cña operon arabinose. (a) khi cã mÆt arobinose, AraC liªn kÕt
víi vïng aral, phøc hîp CAP-cAMP liªn kÕt víi vïng aral ë phÝa ®èi diÖn víi AraC. §iÒu
nµy ®· kÝch thÝch qu¸ tr×nh phiªn m· araB, araA vµ araD. (b) khi kh«ng cã arabinose trong
m«i tr­êng, AraC liªn kÕt víi c¶ hai vïng aral vµ araO lµm cho DNA bÞ xo¾n chÆt h¬n, khi
®ã qu¸ tr×nh phiªn m· bÞ øc chÕ

1.2. operon k×m h·m liªn quan ®Õn con ®­êng ®ång
ho¸
Qu¸ tr×nh ®ång ho¸ ng­îc víi qu¸ tr×nh dÞ ho¸, lµ qu¸ tr×nh trong ®ã tÕ bµo
tæng hîp c¸c hîp chÊt phøc t¹p tõ c¸c thµnh phÇn ®¬n gi¶n. Do ®ã, vÊn ®Ò tiÕt
kiÖm n¨ng l­îng ë ®©y ®­îc ®¶o ng­îc so víi trªn. §iÓn h×nh cña kiÓu operon
k×m h·m lµ operon tryptophan.

155
Hình 4.5. Cơ chế điều hoà phiên mã operon tryptophan.

a) khi có mặt acid amin tryptophan, protein ức chế được hoạt hoá. Protein ức chế bám vào vùng
operator, kìm hãm giai đoạn khởi đầu phiên mã. b) Khi nồng độ tryptophan giảm/không có
trong tế bào, protein ức chế không được hoạt hoá và không liên kết được với operator. Giai
đoạn khởi đầu phiên mã diễn ra bình thường.

* KiÓm so¸t khëi ®Çu phiªn m· theo c¬ chÕ suy gi¶m - vai trß cña cÊu
tróc kÑp tãc
Operon trytophan gåm 5 gen m· cho c¸c enzyme liªn quan ®Õn viÖc tæng hîp
Trp. Khi m«i tr­êng thiÕu amino acid nµy, ho¹t ®éng cña operon t¨ng gÊp 10 lÇn.
Nh­ vËy, sù cã mÆt cña Trp trong m«i tr­êng k×m h·m operon trp. Tuy nhiªn, Trp
kh«ng ph¶i lµ t¸c nh©n g©y øc chÕ biÓu hiÖn cña operon. Chóng gi÷ vai trß cña
chÊt ®ång øc chÕ (co-repressor) khi t­¬ng t¸c víi repressor ®Ó ng¨n c¶n ho¹t ®éng
cña operon trp. Nh­ vËy, operon nµy ®­îc ®iÒu khiÓn theo c¬ chÕ tiªu cùc do chÝnh
s¶n phÈm cuèi cïng cña operon. C¬ chÕ kiÓm so¸t ®Æc biÖt nµy ®­îc gäi lµ øc chÕ
ph¶n håi (feedback inhibition). Ngoµi ra, operon trp cßn chÞu sù kiÓm so¸t ngay
khi phiªn m· ®· b¾t ®Çu theo c¬ chÕ suy gi¶m (h×nh 4.5).
Ph©n tÝch tr×nh tù nucleotide trªn ph©n tö mRNA polycistronic cña operon
trp cho thÊy ®o¹n nucleotide gåm 160 base n»m tr­íc ®iÓm dÞch m· ®Çu tiªn (m·
cho Methyonine) ®ãng vai trß ®iÒu khiÓn qu¸ tr×nh phiªn m· t¹o mRNA trªn
operon trp. §o¹n nµy ®­îc gäi lµ ®o¹n g©y suy gi¶m "attenuator" cã chøa 4 chuçi

156
nucleotide ng¾n cã tr×nh tù t­¬ng ®ång nh­ng ng­îc chiÒu. Do ®ã, 4 chuçi nµy cã
thÓ liªn kÕt t¹o cÆp víi nhau, cÊu tróc "hairpin" (t¹m dÞch lµ cÊu tróc kÑp tãc). Tuy
nhiªn, do møc ®é t­¬ng ®ång kh¸c nhau nªn khi x¶y ra liªn kÕt t¹o cÆp gi÷a chóng
th× tÝnh bÒn cña tõng cÆp kh¸c nhau. Tuú thuéc vµo sù cã mÆt cña Trp trong m«i
tr­êng mµ x¶y ra c¸c kiÓu liªn kÕt t¹o cÆp gi÷a hai chuçi t¹o ra c¸c cÊu tróc kÑp
tãc kh¸c nhau. Nhê ®ã, sù tæng hîp c¸c enzyme cÇn thiÕt cho ph¶n øng t¹o ra Trp
®­îc kiÓm so¸t phï hîp víi sù ®ßi hái cña tÕ bµo ®èi víi lo¹i amino acid nµy.

H×nh 4.6. CÊu tróc ®o¹n attenuator


Chuçi nucleotide 1 trªn ®o¹n suy gi¶m "attenuator" cã chøa c¸c m· di truyÒn
cña Trp. Khi m«i tr­êng cã nhiÒu Trp, c¸c tRNA vËn chuyÓn Trp cho ribosome
dÞch m· trªn chuçi 1 nµy dÔ dµng t×m thÊy Trp trong tÕ bµo. Do ®ã ribosome v­ît
qua chuçi 1 nhanh vµ bao trïm lªn chuçi 2. Lóc nµy chØ cã chuçi 3 vµ 4 liªn kÕt
víi nhau t¹o cÊu tróc kÑp tãc g©y tÝn hiÖu ngõng tæng hîp ph©n tö mRNA. L­u ý
r»ng ë vi khuÈn, qu¸ tr×nh phiªn m· bëi RNA polymerase x¶y ra ®ång thêi víi qu¸
tr×nh dÞch m· bëi ribosome. CÊu tróc kÑp tãc trªn ph©n tö mRNA lµ mét trong
nh÷ng yªu cÇu cÇn cã ®Ó RNA polymerase nhËn biÕt vÞ trÝ dõng qu¸ tr×nh phiªn
m·. Ng­îc l¹i, khi m«i tr­êng thiÕu Trp, c¸c tRNA khã t×m thÊy Trp, do ®ã
ribosome ph¶i chê ®îi l©u ë chuçi 1. Lóc nµy chuçi 2 tù do nªn t¹o liªn kÕt víi
chuçi 3. Tuy nhiªn cÊu tróc kÑp tãc nµy cßn c¸ch xa vÞ trÝ b¸m cña RNA
polymerase nªn kh«ng ¶nh h­ëng ®Õn viÖc tæng hîp mRNA. Nhê ®ã ph©n tö
mRNA cña operon trp ®­îc t¹o ra mét c¸ch trän vÑn.

157
Hình 4.7 Cơ chế điều hoà suy giảm phiên mã (attenuator). a. Cấu trúc operon
tryptophan. b) cấu trúc vùng trình tự điều hoà suy giảm phiên mã. a. cấu trúc bậc
2 của vùng attenuator khi được phiên mã. b. cơ chế điều hoà của attenuator khi
tryptophan trong tế bào không đáp ứng đủ nồng độ yêu cầu. c) cơ chế điều hoà
phiên mã của attenuator khi tryptophan trong tế bào đáp ứng đủ yêu cầu.
1.3. ®iÒu hßa phiªn m· b»ng nh©n tè sigma

158
ë mét sè gen kh«ng cã cÊu tróc promoter ®iÓn h×nh, hoÆc c¸c gen ho¹t ®éng
ë nh÷ng ®iÒu kiÖn kh¸c nhau, ®ßi hái RNA polymerase liªn kÕt víi c¸c yÕu tè
kh¸c nhau. Prokaryote chØ cã mét lo¹i RNA polymerase, nh­ng lâi enzyme cã thÓ
liªn kÕt víi c¸c yÕu tè sigma kh¸c nhau ®Ó phiªn m· trong nh÷ng ®iÒu kiÖn m«i
tr­êng kh¸c nhau. VÝ dô, ë ®iÒu kiÖn b×nh th­êng, RNA polymerase liªn kÕt víi
yÕu tè σ 70 ®Ó thùc hiÖn qu¸ tr×nh phiªn m·. Khi nhiÖt ®é m«i tr­êng t¨ng cao,
RNA polymerase sÏ liªn kÕt víi yÕu tè σ 32 ®Ó nhËn biÕt promoter cña c¸c gen ho¹t
®éng khi nhiÖt ®é t¨ng bÊt th­êng (c¸c gen chÞu shock nhiÖt).

Khi m«i tr­êng thiÕu nguån dinh d­ìng nit¬ th× yÕu tè σ 54 ®­îc sö dông ®Ó phiªn
m·. §Æc biÖt RNA polymerase chøa σ 54 nhËn biÕt promoter tõ vÞ trÝ -24 ®Õn -12;
trong khi víi c¸c yÕu tè σ kh¸c, enzyme nhËn biÕt promoter tõ vÞ trÝ -35 vµ -10.
D­êng nh­ yÕu tè σ 54 cã vai trß nh­ yÕu tè phiªn m· ®èi víi gen eukaryote. C¸c
yÕu tè sigma tham gia cÊu tróc cña RNA polymerase ®Ó nhËn biÕt c¸c promoter
kh¸c nhau ®­îc tr×nh bµy ë b¶ng 4.1.
B¶ng 4.1. C¸c yÕu tè sigma cña E.coli tham gia RNA polymerase khëi ®Çu
phiªn m· trong c¸c ®iÒu kiÖn m«i tr­êng kh¸c nhau.
Gen YÕu tè sigma §iÒu kiÖn sö dông
rpoD σ 70 B×nh th­êng
rpoE σE Sèc nhiÖt
rpoH σ 32 Sèc nhiÖt
rpoN σ 54 ThiÕu nit¬
rpoS σS Stress
fliA σ 28 (σ F ) T¹o roi

2. m« h×nh ®iÒu hoµ biÓu hiÖn gen ë eukaryote

159
Sù ®iÒu hoµ ë eukaryote cã nh÷ng kh¸c biÖt lín so víi ë prokaryote c¶ vÒ tÝn
hiÖu còng nh­ c¬ chÕ ®iÒu hoµ.
TÝn hiÖu ®iÒu hoµ ë c¸c c¬ thÓ ®a bµo lµ nh÷ng ph©n tö do nh÷ng tÕ bµo
chuyªn biÖt s¶n sinh, theo thÓ dÞch l­u chuyÓn kh¾p c¬ thÓ. C¸c ph©n tö nµy t¸c
®éng lªn nh÷ng nhãm tÕ bµo "®Ých", ®iÒu chØnh sù biÓu hiÖn gen ë nh÷ng tÕ bµo
nµy theo ®óng ch­¬ng tr×nh ®· ®Þnh s½n cho phï hîp víi sù ph¸t triÓn cña toµn c¬
thÓ. Cã hai nhãm ph©n tö ®iÒu hoµ chÝnh: c¸c hormone vµ c¸c nh©n tè t¨ng tr­ëng
(Growth Factors - GF).
Bé gen eukaryote cã mét sè ®Æc thï: (1) kÝch th­íc bé gen rÊt lín, (2) ph©n
tö DNA ®­îc nÐn chÆt trong nh©n. Do vËy mµ hÖ thèng ®iÒu hoµ ®¬n gi¶n cña
prokaryote dùa vµo sù nhËn biÕt mét tr×nh tù DNA ng¾n bëi mét protein duy nhÊt
chØ trong giai ®o¹n phiªn m· kh«ng cßn phï hîp. Sù ®iÒu hoµ biÓu hiÖn gen ë
eukaryote thÓ hiÖn trong mäi giai ®o¹n tõ tr­íc lóc sao chÐp ®Õn sau khi dÞch m·.
C¬ chÕ ®iÒu hoµ còng thay ®æi theo tõng giai ®o¹n.
2.1. ®iÒu hoµ b»ng c¸ch biÕn ®æi cÊu tróc nhiÔm s¾c
chÊt hay cÊu tróc cña ph©n tö DNA
NhiÔm s¾c chÊt lµ cÊu tróc liªn kÕt cña DNA vµ protein trong thêi k× gi÷a hai
lÇn ph©n bµo. Khi sù ph©n chia nh©n b¾t ®Çu (k× tr­íc cña ph©n bµo), nhiÔm s¾c
chÊt xo¾n chÆt l¹i, cã d¹ng h×nh que ®Æc tr­ng vµ ®­îc gäi lµ nhiÔm s¾c thÓ. NhiÒu
c«ng tr×nh nghiªn cøu cho thÊy cã sù tån t¹i cña nh÷ng vïng "nh¹y c¶m" trong
nhiÔm s¾c chÊt. C¸c vïng nµy t­¬ng øng víi c¸c gen ho¹t ®éng trong tÕ bµo. Chóng
cã cÊu tróc ®Æc tr­ng khiÕn cho chóng trë nªn dÔ tiÕp cËn ®èi víi nhiÒu nh©n tè
nh­ c¸c enzyme thuû gi¶i hay c¸c enzyme sao chÐp vµ phiªn m·. Nh­ vËy møc ®é
®iÒu hoµ ®Çu tiªn lµ sù s¾p xÕp c¸c gen cÇn biÓu hiÖn vµo mét cÊu tróc nhiÔm s¾c
chÊt ®Æc tr­ng thuËn lîi cho qu¸ tr×nh sao chÐp vµ phiªn m·.

160
Mét vÝ dô ®iÓn h×nh cho kiÓu ®iÒu hoµ nµy lµ gia ®×nh c¸c gen β-globine. C¸c
polypeptide β-globine lµ thµnh phÇn cña hemoglobine (huyÕt s¾c tè) trong hång
cÇu. C¸c gen m· ho¸ cho chóng (gåm α, β, γ, δ) ®­îc s¾p xÕp liÒn nhau trong mét
cÊu tróc nhiÔm s¾c chÊt ®Æc tr­ng. BiÓu hiÖn cña c¸c gen nµy ®­îc ®iÒu chØnh phï
hîp víi tõng thêi k× ph¸t triÓn cña c¬ thÓ. ë ®Çu 5' cña cÊu tróc nhiÔm s¾c chÊt cã
mét tr×nh tù tªn lµ LCR (locus control region-vïng kiÓm so¸t c¸c locus); tr×nh tù
nµy chÞu tr¸ch nhiÖm ®iÒu hoµ biÓu hiÖn cña c¸c gen β-globine. Nã cã mang bèn
vÞ trÝ "nh¹y c¶m" cã kh¶ n¨ng tiÕp nhËn víi nhiÒu protein ®iÒu hoµ. Khi c¸c protein
®iÒu hoµ g¾n vµo LCR, cÊu tróc nhiÔm s¾c chÊt thay ®æi lµm cho c¸c promoter cña
c¸c gen t­¬ng øng ®­îc ph¬i bµy t¹o thuËn lîi cho sù ho¹t ®éng cña c¸c enzyme
phiªn m·.
Ngoµi ra b¶n th©n ph©n tö DNA cã thÓ chÞu nh÷ng biÕn ®æi ho¸ häc hoÆc
thËm chÝ nhiÒu ®o¹n cña nã cã thÓ ®­îc s¾p xÕp l¹i:
- Sù methyl ho¸ tøc sù g¾n mét nhãm methyl lªn c¸c base cña nucleotide lµ
mét biÕn ®æi ho¸ häc tù nhiªn cña ph©n tö DNA x¶y ra ngay sau khi DNA ®­îc
sao chÐp. ë eukaryote, sù methyl ho¸ cã thÓ x¶y ra trªn c¸c cytosine n»m trong
cÆp CG. NhiÒu nghiªn cøu cho thÊy sù methyl ho¸ c¸c cytosine trong vïng 5'
kh«ng phiªn m· cña c¸c gen sÏ lµm gi¶m ho¹t ®éng phiªn m· cña chóng. Nãi
chung, sù methyl ho¸ cßn ®ång nghÜa víi viÖc k×m h·m biÓu hiÖn cña c¸c gen.
KiÓu ®iÒu hoµ nµy mang tÝnh bæ sung, chØ thÊy ë c¸c ®éng vËt cã x­¬ng vµ kh«ng
cã t¸c dông trªn mét sè gen.

161
- Mét sè gen chØ cã thÓ biÓu hiÖn khi cã sù s¾p xÕp l¹i tr×nh tù DNA. §iÓn
h×nh lµ c¸c gen cña "kiÓu giíi tÝnh" ë nÊm men.
ë nÊm men Saccharomyces cervisiae, tån t¹i hai d¹ng sèng: d¹ng l­ìng béi
vµ d¹ng bµo tö ®¬n béi. Cã hai lo¹i bµo tö ®¬n béi MATα vµ MATa h×nh thµnh
nªn ba lo¹i tÕ bµo l­ìng béi MATα/ MATα, MATα/MATa vµ MATa/MATa. ChØ
riªng lo¹i tÕ bµo MATα/MATa do sù kÕt hîp cña hai lo¹i bµo tö MATα vµ MATa
míi cã kh¶ n¨ng t¹o bµo tö trë l¹i. C¸c nghiªn cøu cho thÊy MATα vµ MATa lµ
hai allele cïng mét gen mµ lµ hai gen n»m trªn cïng mét nhiÔm s¾c thÓ. C¸c gen
nµy kh«ng ho¹t ®éng khi chóng n»m ë vÞ trÝ "chê" vµ chØ ®­îc biÓu hiÖn khi chóng
®­îc nh©n lªn vµ chuyÓn ®Õn mét vÞ trÝ ®Æc biÖt lµ locus MAT. Nh­ vËy bµo tö cã
kiÓu h×nh α hay a tuú thuéc kiÓu gen n»m ë locus MAT. Do ®ã, ë ®©y sù biÓu hiÖn
cña gen ®­îc quy ®Þnh bëi sù s¾p xÕp l¹i c¸c tr×nh tù DNA trªn nhiÔm s¾c thÓ.
2.2. §iÒu hoµ ë møc ®é phiªn m·

162
KiÓu ®iÒu hoµ nµy c¬ b¶n gièng sù ®iÒu hoµ ë prokaryote, còng dùa trªn sù
t­¬ng t¸c gi÷a c¸c protein ®iÒu hoµ víi c¸c tr×nh tù DNA chuyªn biÖt nh­ng phøc
t¹p h¬n rÊt nhiÒu. C¸c tr×nh tù DNA chuyªn biÖt ë ®©y ®­îc gäi lµ c¸c tr×nh tù CIS
vµ c¸c protein ®iÒu hoµ t­¬ng t¸c víi chóng lµ c¸c nh©n tè TRANS.
2.2.1. C¸c tr×nh tù DNA tham gia vµo qu¸ tr×nh ®iÒu hoµ biÓu hiÖn gen-
tr×nh tù CIS
Còng gièng nh­ ë prokaryote, vïng 5' cña gen kh«ng phiªn m· cña gen ®­îc
gäi lµ promoter chÞu tr¸ch nhiÖm ®iÒu khiÓn sù phiªn m· cña gen. Tuy nhiªn, c¸c
tr×nh tù ®iÒu hoµ sù phiªn m· l¹i n»m tr­íc ®ã rÊt xa (cã thÓ c¸ch hµng ngµn cÆp
base). ChÝnh c¸c tr×nh tù nµy quyÕt ®Þnh sù biÓu hiÖn ®Æc tr­ng cña gen, nghÜa lµ
gen ®­îc biÓu hiÖn trong lo¹i tÕ bµo nµo, vµo thêi ®iÓm nµo, d­íi t¸c ®éng cña
nh÷ng nh©n tè ®iÒu hoµ nµo. Mét ®Æc ®iÓm chung cho c¸c tr×nh tù nµy lµ chóng
th­êng cã cÊu tróc gåm hai phÇn ®èi xøng nhau, vÝ dô nh­ tr×nh tù ®¸p øng víi
hormone tuyÕn gi¸p (TRE - Thyroid hormone response element) d­íi ®©y:

AGGTCATGACCT

TCCAGTACTGGA
Së dÜ nh­ vËy lµ v× c¸c tr×nh tù nµy th­êng tiÕp nhËn c¸c protein ®iÒu hoµ
(nh©n tè TRANS) d­íi d¹ng dimer (cÊu t¹o tõ hai tiÓu ®¬n vÞ). C¸c tr×nh tù nµy
gäi chung lµ c¸c tr×nh tù CIS.
Bªn c¹nh ®ã cßn cã mét nhãm tr×nh tù kh¸c còng tham gia vµo qu¸ tr×nh ®iÒu
hoµ biÓu hiÖn cña gen, ®ã lµ c¸c nhãm tr×nh tù khuÕch ®¹i (enhancer). C¸c
enhancer nµy cã t¸c dông lµm t¨ng biÓu hiÖn cña gen t­¬ng øng. Kh¸c biÖt c¬ b¶n
cña nhãm nµy so víi c¸c tr×nh tù CIS lµ ho¹t tÝnh khuÕch ®¹i biÓu hiÖn cña chóng
kh«ng phô thuéc vµo (1) vÞ trÝ, chóng kh«ng nhÊt thiÕt ph¶i n»m ë ®Çu 5' cña c¸c
gen mµ cã thÓ hiÖn diÖn ë ®Çu 5', ®Çu 3' hay ngay trong intron cña gen; (2) h­íng,
sù ®¶o ng­îc h­íng cña chóng (tõ 5'3' sang 3'5') kh«ng lµm mÊt ho¹t tÝnh

163
khuÕch ®¹i. Víi cïng c¸c ®Æc tÝnh ®ã nh­ng cã t¸c dông ng­îc l¹i lµ nhãm c¸c
tr×nh tù dËp t¾t (silencer). C¬ chÕ ho¹t ®éng cña hai nhãm nµy ch­a ®­îc biÕt râ.
2.2.2. C¸c nh©n tè protein tham gia vµo qu¸ tr×nh ®iÒu hoµ biÓu hiÖn
gen: c¸c nh©n tè TRANS
§Æc ®iÓm chung cña c¸c nh©n tè nµy lµ chóng bao gåm Ýt nhÊt hai vïng cÊu
tróc -chøc n¨ng chÝnh: (1) vïng chÞu tr¸ch nhiÖm g¾n nh©n tè TRANS vµo DNA;
(2) vïng t¸c ®éng lªn sù phiªn m·. C¸c vïng cÊu tróc-chøc n¨ng nµy ®éc lËp víi
nhau. Ng­êi ta cã thÓ ghÐp hai tr×nh tù DNA cã nguån gèc kh¸c nhau: vïng t¸c
®éng phiªn m· lÊy tõ mét nh©n tè TRANS ë ®éng vËt cã vó vµ vïng g¾n vµo DNA
lÊy tõ nh©n tè TRANS ë nÊm men. KÕt qu¶ cuèi cïng lµ mét nh©n tè "lai" cã kh¶
n¨ng ho¹t ho¸ c¸c gen ®Ých t­¬ng øng ë nÊm men (gen ®Ých lµ gen cã mang tr×nh
tù tiÕp nhËn ®Æc hiÖu nh©n tè TRANS). Ngoµi hai vïng võa kÓ, nhiÒu nh©n tè
TRANS cßn mang mét sè vïng phô kh¸c: nh­ vïng g¾n c¸c hormone, c¸c ion ....
T­¬ng t¸c ®Æc hiÖu gi÷a tr×nh tù CIS vµ nh©n tè TRANS lµ kÕt qu¶ nh÷ng liªn kÕt
yÕu h×nh thµnh gi÷a c¸c nucleotide cña nh©n tè TRANS víi c¸c base cña tr×nh tù
CIS. Do cÊu tróc xo¾n kÐp cè ®Þnh trong kh«ng gian cña ph©n tö DNA nªn ®Ó ®¹t
®­îc t­¬ng t¸c t­¬ng ®èi bÒn v÷ng, c¸c nh©n tè TRANS còng ph¶i cã cÊu tróc
kh«ng gian cè ®Þnh t­¬ng øng. C¸c kÕt qu¶ nghiªn cøu cho thÊy c¸c nh©n tè
TRANS cã thÓ ph©n bè vµo bèn nhãm cÊu tróc:
- "Ngãn tay kÏm" (zinc-finger)
- "Xo¾n vßng xo¾n" (helix-turn-helix)
- "Xo¾n nót xo¾n" (helix-loop-helix)
- "D©y kÐo leucine" (leucine-zipper)
§Æc tÝnh chung cña c¸c cÊu tróc võa kÓ chóng lu«n g¾n lªn c¸c tr×nh tù CIS
d­íi d¹ng dimer (gåm hai monomer).

164
a b

c d

H×nh 4.8. Bèn lo¹i liªn kÕt gi÷a tr×nh tù cis víi nh©n tè trans, (a) ngãn tay kÏm, (b) xo¾n vßng
xo¾n, (c) xo¾n nót xo¾n, (d) d©y kÐo leucine

Mét vÝ dô ®iÓn h×nh lµ ®¹i gia ®×nh c¸c thô thÓ hormone trong nh©n (nuclear
hormone receptor), gåm hai nhãm: thô thÓ hormone tuyÕn gi¸p vµ thô thÓ hormone
steroid. Nh­ ta ®· thÊy, c¸c hormone lµ tÝn hiÖu ®iÒu hoµ ë eukaryote. Chóng t¸c
®éng lªn c¸c tÕ bµo ®Ých (tÕ bµo cã mang thô thÓ cña hormone t­¬ng øng), lµm
biÕn ®æi biÓu hiÖn mét sè gen ®Æc tr­ng ë c¸c tÕ bµo ®ã. T¸c ®éng cña chóng ®­îc
thùc hiÖn th«ng qua thô thÓ cña hormone (hormone receptor). CÊu tróc thô thÓ bao
gåm nhiÒu vïng, trong ®ã ®Æc biÖt cã hai vïng ®­îc biÕt râ nhÊt: vïng g¾n vµo
DNA víi cÊu tróc "ngãn tay kÏm", vµ vïng n¬i hormone g¾n vµo. C¬ chÕ t¸c ®éng
cña hormone cã thÓ ®­îc m« t¶ nh­ sau: c¸c thô thÓ g¾n vµo tr×nh tù CIS cña c¸c
gen ®Ých; khi hormone ®Õn g¾n vµo vïng tiÕp nhËn hormone cña thô thÓ sÏ lµm
thay ®æi cÊu h×nh thô thÓ dÉn dÕn sù ho¹t ho¸ c¸c gen ®Ých. nh­ vËy trong vÝ dô
nµy, vïng t¸c ®éng phiªn m· ch­a ®­îc x¸c ®Þnh râ, t¸c ®éng ®iÒu hoµ biÓu hiÖn
gen lµ kÕt qu¶ cña sù thay ®æi cÊu h×nh kh«ng gian cña thô thÓ nãi chung.
C¬ chÕ ®iÒu hoµ biÓu hiÖn gen ë eukaryote trong giai ®o¹n phiªn m· ®· b¾t
®Çu s¸ng tá. Kh«ng ®¬n gi¶n nh­ ë prokaryote chØ dùa vµo t­¬ng t¸c CIS - TRANS,
sù ®iÒu hoµ ë eukaryote ngoµi t­¬ng t¸c CIS - TRANS cßn dùa vµo c¸c t­¬ng t¸c
protein - protein. Cã thÓ h×nh dung sù viÖc nh­ sau: protein TRANS mét mÆt g¾n

165
vµo tr×nh tù CIS ë ®Çu 5' cña gen ®Ých, mÆt kh¸c sÏ t­¬ng t¸c víi nh÷ng protein
®iÒu hoµ kh¸c. C¸c protein ®iÒu hoµ nµy gåm hai lo¹i: lo¹i cã thÓ g¾n vµo c¸c tr×nh
tù DNA n»m c¸ch xa gen ®Ých vµ ®­îc ®­a l¹i ®ñ gÇn ®Ó t­¬ng t¸c víi protein
TRANS nhê sù gÊp l¹i cña c¸c nhiÔm s¾c chÊt; lo¹i thø hai ®øng ®éc lËp, kh«ng
cã bÊt cø t­¬ng t¸c nµo víi DNA.T­¬ng t¸c gi÷a protein TRANS vµ c¸c protein
®iÒu hoµ kh¸c cïng víi sù gÊp l¹i cña nhiÔm s¾c chÊt sÏ t¹o nªn mét cÊu tróc thuËn
lîi cho sù g¾n enzyme RNA polymerase vµo promoter cña gen ®Ých. Lóc ®ã sù
phiªn m· cña gen ®Ých míi b¾t ®Çu.
Mét kiÓu ®iÒu hoµ kh¸c ë eukaryote còng dùa vµo t­¬ng t¸c CIS - TRANS
nh­ng c¬ chÕ h¬i kh¸c lµ sù ®iÒu hoµ b»ng chän läc promoter. VÝ dô ®iÓn h×nh lµ
gen α-amilase, gen nµy cã hai promoter, mçi promoter cã ho¹t tÝnh phiªn m· kh¸c
nhau vµ chÞu tr¸ch nhiÖm phiªn m· mét lo¹i mRNA nhÊt ®Þnh, ®Æc tr­ng cho m«.
Cßn sù chän läc promoter ho¹t ®éng l¹i tuú thuéc c¸c nh©n tè TRANS hiÖn diÖn
trong tõng lo¹i m« Êy. Nh­ vËy, chÝnh sù t­¬ng t¸c gi÷a tr×nh tù CIS vµ nh©n tè
TRANS ®Æc tr­ng cho m« sÏ quy ®Þnh lo¹i mRNA ®­îc phiªn m· ë m« ®ã.
2.2.3. §iÒu hoµ ë møc ®é sau phiªn m·
Nh­ ta ®· thÊy ë ch­¬ng tr­íc, mRNA võa ®­îc phiªn m· kh«ng ®­îc dÞch
m· ngay mµ cßn tr¶i qua mét giai ®o¹n "tr­ëng thµnh". ë giai ®o¹n nµy tån t¹i
nhiÒu c¬ chÕ cho phÐp ®iÒu hoµ tÝnh chÊt còng nh­ sè l­îng c¸c mRNA sÏ ®­îc
dÞch m·.
2.2.3.1. HiÖn t­îng "ghÐp nèi" kh¸c biÖt (alternative splicing)
HÖ thèng lo¹i bá intron vµ nèi exon cña mRNA s¬ cÊp ®Ó h×nh thµnh mRNA
tr­ëng thµnh kh¸c nhau tuú thuéc tõng lo¹i tÕ bµo, m«. ViÖc ghÐp - nèi kh¸c biÖt
c¸c exon sÏ dÉn ®Õn sù h×nh thµnh c¸c mRNA kh¸c nhau. Th«ng th­êng c¸c
mRNA nµy m· ho¸ cho c¸c protein cã chøc n¨ng t­¬ng tù nh­ng ®«i khi chóng
l¹i cã chøc n¨ng hoµn toµn kh¸c nhau. Mét vÝ dô ®iÓn h×nh lµ kiÓu ®iÒu hoµ ë gen
calcitonine. Hai lo¹i protein ®­îc dÞch m· tõ gen nµy lµ calcitonine ®­îc t×m thÊy
trong tÕ bµo C cña tuyÕn gi¸p vµ CGRP lµ mét chÊt trung gian thÇn kinh ®­îc t×m
thÊy trong n·o. Hai protein trªn lµ s¶n phÈm cña hai mRNA h×nh thµnh do sù ghÐp
nèi t¹o hai tæ hîp exon kh¸c nhau.
2.2.3.2. §iÒu hoµ biÓu hiÖn gen b»ng c¸ch t¨ng gi¶m thêi gian sèng cña
c¸c mRNA
KiÓu ®iÒu hoµ nµy mang tÝnh sè l­îng mRNA cµng tån t¹i l©u trong tÕ bµo
th× cµng ®­îc dÞch m· thµnh nhiÒu protein. HiÖn t­îng nµy thÊy râ trong tr­êng

166
hîp mét sè tÕ bµo ung th­. Qu¸ tr×nh tæng hîp protein tõ mét sè mRNA bÒn v÷ng
t¹o ra mét sè l­îng rÊt cao c¸c protein t­¬ng øng. §iÒu nµy gi¶i thÝch ®­îc phÇn
nµo kh¶ n¨ng sinh s«i v« tËn cña c¸c tÕ bµo ung th­.
2.2.3.3. Sù dù tr÷ c¸c mRNA trong tÕ bµo còng lµ mét ph­¬ng tiÖn ®iÒu
hoµ
RÊt nhiÒu gen ®­îc phiªn m· nh­ng kh«ng bao giê ®­îc dÞch m·. Khi cã
mét tÝn hiÖu xuÊt hiÖn (hormone ch¼ng h¹n), bé m¸y dÞch m· lËp tøc ho¹t ®éng
tæng hîp protein tõ c¸c mRNA ®· tr÷ s½n.
Bªn c¹nh c¸c kiÓu ®iÒu hoµ gen th«ng dông võa kÓ, c¸c tÕ bµo eukaryote ®«i
khi cßn sö dông nhiÒu kiÓu ®iÒu hoµ kh¸c kh«ng ®Ò cËp ë ®©y v× hiÕm gÆp.
2.2.3.4. §iÒu hoµ trong giai ®o¹n dÞch m·
Sù ®iÒu hoµ biÓu hiÖn gen trong giai ®o¹n nµy ch­a ®­îc biÕt râ. D­êng nh­
nã cã liªn quan ®Õn giai ®o¹n dù tr÷ mRNA ®· ®Ò cËp ë trªn, v× sù dÞch m· chÝnh
lµ mét d¹ng tiªu thô dù tr÷ mRNA. Trong phÇn nµy chØ nªu mét vµi tr­êng hîp cô
thÓ ®· ®­îc lµm s¸ng tá, tr­êng hîp ferritine vµ thô thÓ cña transferrine lµ c¸c
protein chÞu tr¸ch nhiÖm dù tr÷ vµ thu hót s¾t vµo tÕ bµo. Khi tÕ bµo gan ®­îc ñ
víi s¾t, sù dÞch m· mRNA cña ferritine t¨ng cao trong khi thô thÓ transferrine
kh«ng ®­îc dÞch m· (hay nãi ®óng h¬n nã bÞ ph©n huû). Ph©n tÝch cÊu tróc cña
hai lo¹i mRNA nµy cho thÊy chóng cã mang mét tr×nh tù cã tªn lµ IRE (iron
responsive element - nh©n tè ®¸p øng víi s¾t) n»m ë ®Çu 5' ®èi víi ferritine vµ ®Çu
3' ®èi víi thô thÓ transferrine. IRE cã kh¶ n¨ng tiÕp nhËn mét protein ®iÒu hoµ tuú
thuéc vµo sù hiÖn diÖn cña s¾t. Khi kh«ng cã s¾t, protein ®iÒu hoµ g¾n vµo c¸c IRE
ng¨n c¶n sù dÞch m· cña mRNA ferritine ®ång thêi l¹i gióp æn ®Þnh mRNA
transferrine. Ng­îc l¹i, khi cã s¾t, protein ®iÒu hoµ t¸ch khái IRE, lóc ®ã, mRNA
ferritine ®­îc dÞch m· cßn mRNA transferrine bÞ ph©n huû. §iÒu nµy gióp tÕ bµo
®¸p øng nhanh víi nång ®é s¾t ngo¹i bµo.
2.2.3.5. Møc ®é ®iÒu hoµ biÓu hiÖn gen cuèi cïng lµ trong giai ®o¹n sau
dÞch m·.
C¸c protein sau dÞch m· cã thÓ tr¶i qua nhiÒu biÕn ®æi ho¸ häc nh­ glycosyl
ho¸, phosphoryl ho¸, acetyl ho¸, ... Sù ®iÒu hoµ trong giai ®o¹n nµy lµ mét vÊn ®Ò
rÊt lín vµ phøc t¹p, v­ît qu¸ giíi h¹n cña quyÓn s¸ch nµy.

167
CHƯƠNG 6. CÁC KỸ THUẬT CƠ BẢN TRONG SINH HỌC
PHÂN TỬ

6.1. TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP THƯỜNG SỬ DỤNG TRONG


LĨNH VỰC SINH HỌC PHÂN TỬ
Kể từ ngày sinh học phân tử ra đời (1953) và phát triển cho đến nay có hàng loạt kỹ
thuật và phương pháp nghiên cứu khác nhau được phát minh ra nhằm đáp ứng các
nghiên cứu trong các lĩnh vực khác nhau. Đỉnh cao của sự phát triển ấy là sự ra đời
và phát triển vượt bậc của kỹ thuật di truyền (genetic engineering) và công nghệ
ADN tái tổ hợp (recombinant DNA technology) từ những năm 1970, mà nền tảng
của chúng là các hiểu biết về các plasmid và việc phát hiện enzyme cắt giới hạn đầu
tiên (1970) ở vi khuẩn. Sự phát triển nhanh chóng của lĩnh vực này không những đã
đưa lại khối lượng tri thức khổng lồ về cấu trúc và cơ chế hoạt động của các gen, các bộ
gen sinh vật mà còn trở thành lực lượng sản xuất trực tiếp của xã hội như: sản xuất
hàng loạt các chế phẩm y-sinh học hữu ích từ các tế bào vi khuẩn, nấm men; tạo các
giống sinh vật mới... góp phần giải quyết những vấn đề thực tiễn đặt ra trong y học
và trong nông lâm ngư nghiệp.... Và thành tựu vĩ đại gần đây là việc xác định đầy đủ
trình tự bộ gen người cùng với bộ gen của nhiều sinh vật khác, đã mở ra một kỷ nguyên
mới - kỷ nguyên bộ gen, với các lĩnh vực nghiên cứu mới đồng loạt ra đời như:
Genomics, Proteomics, Transcriptomics v.v.
Trong chương này chúng ta sẽ tìm hiểu những nét đại cương về: (i) Các phương pháp
thông dụng của Sinh học phân tử; (ii) Các công cụ và phương pháp tạo dòng ADN tái
tổ hợp; và (iii) Ứng dụng của công nghệ ADN tái tổ hợp và kỹ thuật di truyền trong
các lĩnh vực khác nhau của khoa học, sản xuât và đời sống xã hội.
Như chúng ta đã biết, kể từ khi sinh học phân tử ra đời và phát triển cho đến nay có
hàng loạt kỹ thuật và phương pháp nghiên cứu khác nhau được phát minh ra nhằm
đáp ứng các nghiên cứu trong các lĩnh vực khác nhau của khoa học, công nghệ, sản
xuât và đời sống xã hội. Có đến hàng trăm cuốn sách dày mô tả các kỹ thuật, các
phương pháp và quy trình công nghệ liên quan đến sinh học phân tử, kỹ thuật di truyền
và công nghệ gen, công nghệ protein, công nghệ enzyme...
Có thể kể ra đây một số phương pháp như vậy để chúng ta thấy rằng, chúng là vô số,
mà một số trong chúng đã được đề cập sơ lược và rải rác trong giáo trình. Đó là các
phương pháp hiển vi điện tử (dùng trong nghiên cứu cấu trúc các phân tử); đánh dấu
đồng vị phóng xạ (S35, P32, N15, triti v.v.); các phương pháp sắc ký (trong phân tích
thành phần hóa học của protein, ADN và ARN), sắc ký lỏng, sắc ký ái lực, sắc ký lọc
gel hay sắc ký trao đổi ion; phương pháp nhiễu xạ Rơngen (do L. Pauling phát minh
năm 1949, dùng trong nghiên cứu cấu trúc phân tử protein và sau này là ADN); ly tâm
168
siêu tốc; điện di gel (protein và ADN); phóng xạ tự ghi; phương pháp giải mã di truyền
in vitro do M. Nirenberg và H. Khorana đề xuất (1961); các phương pháp xác định trình
tự nucleotide (bằng con đườn hóa học của Maxam Gilbert, bằng enzyme của F. Sanger,
xác định trình tự ADN tự động); sử dụng các mẩu dò đánh dấu; các phương pháp lai
phân tử axit nucleic; phương pháp Southern blots (dù trong trong lập bản đồ giới hạn
chẳng hạn), Northern blots…; các phương pháp kiến tạo các ADN tái tổ hợp trong ống
nghiệm; các phương pháp tạo dòng cADN; các phương pháp biến nạp ADN tái tổ hợp;
các phương pháp biểu hiện các gen được tạo dòng; vi tiêm; gây đột biến định hướng
vị trí (site-directed mutagenesis dùng trong kỹ thuật protein…) bởi M. Smith; phương
pháp PCR do K. Mullis đề xuất (1985) cùng hàng loạt các phương pháp cải biên của nó
về sau này; các phương pháp RFLP, AFLP…; chip ADN và phân tích vi mảng ADN;
phương pháp FISH; phân tích chuỗi của sự biểu hiện gen (SAGE); … Hàng loạt các
phương pháp toán học xác suất và thống kê hiện đại ra đời đã được đưa vào ứng dụng
từ rất sớm. Đặc biệt, cùng với sự phát triển của máy tính và công nghệ thông tin đã
hình thành nên một lĩnh vực ứng dụng vô cùng mới mẻ và rộng lớn, với hiệu quả và giá
trị vô song trong Sinh học phân tử và kỹ thuật di truyền ngày nay, đó là Tin-Sinh học
(Bioinformatics).
6.2. PHƯƠNG PHÁP TÁCH CHIẾT VÀ TINH SẠCH ACID NUCLEIC
Nguyên tắc chung

Việc tách chiết DNA bao gồm các bước cơ bản sau: (1) phá màng tế bào, (2) loại
protein, (3) tủa DNA. Để thu nhận DNA tinh sạch, người ta cần loại bỏ những thành phần
tạp nhiễm, mà quan trọng nhất là protein. Sự tách chiết dựa trên nguyên tắc hòa tan khác
nhau của các phân tử khác nhau (nucleic acid/protein) trong hai pha không hòa tan
(phenol, chloroform/nước). Các hóa chất dùng trong quy trình tách chiết là : (1) phenol,
guanidine thiocyanate có trong thành phần dung dịch Trizol là những chất biến tính
protein mạnh (trong đó có Dnase là enzyme phân hủy DNA và các protein khác ảnh
hưởng đến phản ứng PCR), phenol không hòa tan nucleic acid, khi xử lí với hai hóa chất
này, tế bào sẽ bị phá vỡ và giải phóng các thành phần nội bào: DNA, RNA, protein… (2)
chloroform: thường đi kèm với phenol, có tác dụng bổ sung và loại bỏ hoàn toàn dấu vết
phenol, chloroform cũng làm biến tính protein nhưng yếu hơn phenol. Sau khi ly tâm,
mẫu xử lí với Trizol sẽ phân tách thành hai lớp: Lớp dưới là phenol, lớp trên là nước
chứa DNA, phần protein bị biến tính sẽ nằm ở bề mặt phân cách hai lớp này và bị loại
bỏ. DNA trong phần dịch nổi ở trên sẽ được thu nhận bằng cách tủa với isopropanol có
bổ sung chất trợ tủa. Chất trợ tủa là 1 loại polymer có cấu trúc mạng lưới nên dễ dàng
bắt được các phân tử DNA, nhưng không ức chế phản ứng PCR. Trong điều kiện có chất
trợ tủa, quá trình tủa có thể xảy ra ở nhiệt độ phòng với thời gian ngắn (khoảng 10 phút),
nếu không có chất trợ tủa, quá trình tủa phải được thực hiện ở -200C hoặc -700C trong ít
nhất 1 giờ. DNA sau khi tủa sẽ được tủa và rửa lại 1 lần nữa với ethenol 70% và cuối
169
cùng sẽ được bảo quản trong TE 1X (Tris trong TE có vai trò ổn định pH và EDTA bắt
các ion Mg2+ làm cho Dnase không có khả năng hoạt động).

Có hai kiểu tủa chính:

• Tủa bằng ethanol: Được thực hiện ở nồng độ muối cao, nồng độ ethanol cao (2-
2.5 thể tích ethanol/thể tích dung dịch cần tủa), nhiệt độ thấp thúc đẩy sự tủa.
• Tủa bằng isopropanol: Khác kiểu tủa trên là không cần muối, có thể sử dụng 0.8-
1 thể tích isopropanol/thể tích dung dịch cần tủa, những đoạn DNA thật ngắn dù ở
nồng độ cao cũng không tủa bằng cách này nên có thể loại bỏ chúng dễ dàng.
6.2.1. Phương pháp tách chiết acid nucleic bằng hệ dung môi

6.2.2. Phương pháp tách chiết acid nucleic bằng sắc ký cột.
6.2.3. Phương pháp tinh sạch acid nucleic
Lai phân tử axit nucleic và sử dụng các mẩu dò
Người ta lợi dụng khả năng nói trên của ADN để tạo ra các phân tử ADN lai bằng cách
làm lạnh từ từ hỗn hợp các ADN biến tính từ hai loài khác nhau. Kỹ thuật lai phân tử
(Hình 8.1) này đã được ứng dụng rộng rãi để xác định mức độ tương đồng ADN của
các nhóm phân loại khác nhau. Trên nguyên tắc, nếu mức độ tương đồng càng lớn thì
số lượng các đoạn lai càng lớn và ngược lại. Ví dụ, các thực nghiệm cho thấy có khoảng
25% tổng số ADN người và chuột có thể lai với nhau. Thông thường, mức độ lai được
xác định bằng các phương pháp sắc ký hoặc ly tâm, trong đó một loại ADN được đánh
dấu bằng đồng vị phóng xạ. Hiện giờ các kỹ thuật này được áp dụng khá rộng rãi trong
170
các nghiên cứu sinh học phân tử cũng như trong các lĩnh vực điều tra hình sự hoặc
phát hiện sớm một số bệnh phân tử để điều trị kịp thời.

6.3.PHƯƠNG PHÁP NHÂN DÒNG PHÂN TỬ


Nguyên tắc chung
Về nguyên tắc, kỹ thuật ADN tái tổ hợp hay tạo dòng (cloning) gồm các bước chung
nhất như sau (Hình 8.12): (1) Tách chiết và tinh sạch ADN thuộc các nguồn khác nhau
(gồm vector và ADN mang gen mong muốn); (2) Tạo ra phân tử ADN tái tổ hợp in
vitro; (3) Đưa phân tử ADN tái tổ hợp vào trong tế bào nhận, thường là E. coli hoặc nấm
men; và (4) Phát hiện và phân lập các dòng ADN tái tổ hợp đặc hiệu.
Trong tế bào chủ, phân tử ADN tái tổ hợp có thể biểu hiện gen mong muốn (cho sản
phẩm protein) hoặc tái bản độc lập nhiều lần để tạo ra hàng loạt bản sao của nó, và
khi tế bào chủ phân chia sẽ kéo theo sự tạo dòng phân tử (molecular cloning). Mặt
khác, do tốc độ phân chia rất nhanh của các vi khuẩn nên có thể tạo hàng triệu bản sao
mong muốn trong một thời gian ngắn. Vì thế nhà khoa học có thể tách dòng bất kỳ một
gen nào để dùng cho nghiên cứu hoặc cho sản xuất trên quy mô công nghiệp một số
lượng lớn các protein là các chế phẩm y-sinh học nào đó.
Quy trình tạo dòng gen tái tổ hợp

171
Hình 8.12. Đại cương về quy trình tạo dòng gen (sản xuất protein) ở vi khuẩn.
Bây giờ ta xét quy trình kỹ thuật tạo dòng mà việc phát hiện ADN tái tổ hợp dựa
trên khả năng kháng thuốc do vector plasmid mang lại.
• Bước 1: Tinh chiết ADN
Giả sử đã tinh chiết được plasmid có chứa hai gen kháng ampicillin và tetracyclin, ký
hiệu là AmpR và TetR; và cũng giả thiết rằng gen TetR có chứa điểm cắt của EcoRI,
và phân tử ADN người có mang gen insulin.

172
Hình 8.13. Sơ đồ thí nghiệm tạo dòng vi khuẩn mang ADN tái tổ hợp, ở đây là gen insulin
người.
• Bước 2: Kiến tạo phân tử ADN tái tổ hợp in vitro
Trước tiên, dùng enzyme giới hạn đầu dính EcoRI (xem Bảng 8.1) để cắt vòng plasmid
tại giữa gen TetR và cho cắt ADN người, trong số các đoạn bị cắt có một đoạn mang
gen insulin. Sau đó đem trộn lẫn hai loại ADN trên trong ống nghiệm với ADN ligase.
Kết quả là có thể xảy ra ba trường hợp: (1) Plasmid tự nối lại thành mạch vòng như
lúc đầu; (2) Đoạn ADN tự nối lại thành mạch vòng; và (3) Plasmid tái tổ hợp có mang
gen insulin, và có thể mang một đoạn ADN không phải gen đó.
• Bước 3: Biến nạp và phát hiện dòng ADN tái tổ hợp chung
Đưa các ADN được xử lý vào các tế bào E. coli. Nếu phân tử có kích thước lớn người
ta phải xử lý vi khuẩn 'thể nhận' bằng chlorid calcium (CaCl2) để làm cho màng trở nên
thấm được dễ dàng. Sau đó đem cấy riêng rẽ các vi khuẩn trên môi trường có ampicillin
và theo dõi.
+ Nếu có xuất hiện khuẩn lạc, chứng tỏ vi khuẩn có mang gen AmpR, tức là chúng có
mang plasmid ban đầu (trường hợp 1) hoặc plasmid tái tổ hợp (trường hợp 3). Ngược
lại, nếu chỗ cấy không xuất hiện khuẩn lạc, chứng tỏ vi khuẩn mang ADN tự nối (trường
hợp 2).
+ Kế đó, đem cấy riêng rẽ các vi khuẩn thu được sang môi trường có tetracyclin. Nếu
có xuất hiện khuẩn lạc, chứng tỏ vi khuẩn có mang gen TetR nguyên vẹn (trường hợp
1). Nếu không có khuẩn lạc, chứng tỏ vi khuẩn đem cấy có mang ADN tái tổ hợp
(trường hợp 3); vì gen TetR bị bất hoạt do đoạn ADN xen vào. Bằng cách theo dõi
như vậy cho phép xác định được dòng vi khuẩn mang ADN tái tổ hợp, nhưng vẫn
chưa biết được đâu là các dòng đặc hiệu, nghĩa là có mang gen insulin.
• Bước 4: Chọn dòng ADN tái tổ hợp đặc hiệu
Về nguyên tắc, trong cả triệu phép thử mới có một tế bào mang gen mong muốn. Với
trường hợp trên, người ta có thể sử dụng phương pháp miễn dịch học bằng cách dùng
kháng thể chống lại protein được sinh ra bởi dòng vi khuẩn tương ứng (tức huyết thanh
tìm gen kháng insulin).
Hình 8.14 minh họa một công đoạn của quy trình thí nghiệm ADN tái tổ hợp ở vi
khuẩn E. coli khi sử dụng môi trường nuôi cấy có bổ sung ampicillin đối với ba kiểu
tế bào: tế bào có mang plasmid tái tổ hợp, tế bào chỉ mang plasmid pUC19 không tái
tổ hợp, và tế bào không biến nạp được (Hình 8.14a). Qua đêm sinh trưởng, các tế
bào nào có mang plasmid tái tổ hợp và plasmid không tái tổ hợp sẽ mọc thành các
khuẩn lạc (màu sắc tương ứng ở đây là trắng và xanh; Hình 8.14b). Sau khi chọn ra
các dòng có xen plasmid tái tổ hợp, đưa lên màng lọc và cho tiến hành lai hóa giữa
173
ARN và ADN (gen) của nó bằng các vật dò phóng xạ như đã nói ở trên. Sau đó đưa
sản phẩm lai phân tử này lên tấm phim X quang để định vị gen quan tâm từ dòng
tái tổ hợp (Hình 8.14c).
Nói chung, để tìm dòng lai đặc hiệu người ta sử dụng các mẫu dò là mARN hoặc rARN
đặc hiệu. Chẳng hạn, trong trường hợp nếu cần chọn dòng lai mang đoạn mARN cụ
thể, người ta đem cấy đều các dòng vi khuẩn có chứa ADN tái tổ hợp lên trên mặt
thạch của hộp petri chứa môi trường nuôi cấy. Sau đó đóng dấu lên màng lọc
nitrocellulose, và thu được bản sao. Việc xử lý bản sao bằng NaOH sẽ làm cho các tế
bào vi khuẩn tan vỡ tại chỗ (in situ), và các ADN thoát ra từ chúng sẽ bị biến tính
(các sợi đơn tách rời nhau) và dính vào màng lọc. Sau đó đem nhúng màng lọc này vào
mẫu mARN tương ứng đã được tinh khiết và đánh dấu phóng xạ (P32); mẫu ARN này
được gọi là vật dò phóng xạ (radioactive probe). Nếu dòng nào có chứa ADN mã hoá
cho mARN thì sẽ xảy ra hiện tượng lai giữa mARN và vùng sợi đơn tương ứng trên
ADN đó. Sau khi loại bỏ các mARN không lai được, người ta đặt một miếng phim
ảnh lên trên màng lọc; những vết ảnh xuất hiện trên ảnh phóng xạ tự ghi cho thấy vị
trí của dòng mang ADN bổ trợ với mẫu ARN. Từ đây có thể tách riêng các dòng lai đặc
hiệu để sử dụng cho các nghiên cứu tiếp theo.

6.3.1. Nhân dòng phân tử DNA/RNA trong ống nghiệm (các loại phản ứng PCR)
PCR: phương pháp nhân bản phân tử acid nucleic

Phản ứng chuỗi polymerase (PCR) là một kỹ thuật in vitro được sử dụng để sao
chép hoặc khuếch đại hàng tỉ lần của một vùn DNA đặc biệt chỉ với vài giờ. Sự khuếch
đại này là sự khởi đầu việc gắn trực tiếp đoạn oligonucleotide mồi vào sườn của vùng
DNA cần được khuếch đại. PCR được sử dụng trong chẩn đoán và nghiên cứu ở các
phòng thí nghiệm để tạo ra một lượng DNA đủ chất lượng đáp ứng cho các kiểm tra,
phân tích hoặc các thao tác kế tiếp. Độ nhạy của phản ứng cực kỳ cao, do vậy, PCR là
một phương pháp tiêu chuẩn sử dụng để chẩn đoán nhanh vi sinh vật. Trong thời gian
gần đây, các kit hoá chất và sự đa dạng về mặt bằng thiết bị làm tăng tốc độ, tính linh
hoạt và đơn giản hoá quy trình PCR. Tuy nhiên, vai trò quan trọng của kỹ thuật PCR
đóng góp bao nhiêu cho ngành Y Sinh? Câu trả lời tốt nhất có lẽ là những kết quả tìm
kiếm trên PubMed với từ khoá “PCR” hoặc “PCR” và “diagnosis”.

Kỹ thuật PCR được phát minh năm 1983 bởi Kary B. Mullis, với phát minh này,
Mullis đã được trao giải Nobel trong lĩnh vực hoá học năm 1993. Ứng dụng đầu tiên của
kỹ thuật PCR được Saiki và cộng sự thực hiện vào năm 1985, và khoảng 10 năm sau Cục
quản lý thực phẩm và thuốc của Mỹ sử dụng trong chẩn đoán các bệnh nhiễm trùng.
174
Những năm 1990 là thập kỷ của sự cải tiến hàng loạt các phương pháp khuếch đại acid
nucleic như: Qβ replicase, chuỗi phản ứng ligase, khuếch đại các sợi DNA thay thế,
khuếch đại các sợi RNA (các phân tử liên quan đến sự phiên mã), … Các ứng dụng của
PCR trong nghiên cứu và chẩn đoán cũng tiếp tục phát triển và cải tiến trong những năm
này. Trong khoảng thời gian ngắn, kỹ thuật PCR tạo ra cuộc cách mạng và trở thành một
kỹ thuật chuẩn mực/ thiết yếu trong menu các kỹ thuật của ngành vi sinh vật lâm sàng.
Mặc dù vậy, các chẩn đoán phân tử hiện nay được công nhận như một chuyên ngành
riêng trong ngành vi sinh vật lâm sàng.

2.2.2. Các nguyên tắc của PCR.

2.2.2.1. Khuếch đại DNA bằng enzyme: các thành phần của phản ứng PCR

Hai cải tiến mới nhất để biến đổi kỹ thuật PCR thành công cụ sử dụng trong nghiên
cứu và chẩn đoán là DNA polymerse ổn nhiệt và thiết bị chu trình nhiệt. Về thiết bị,
chúng ta sẽ thảo luận ở phần kế tiếp. Kỹ thuật PCR đầu tiên sử dụng DNA polymerase
không chịu nhiệt. Vì vậy, sau mỗi một chu kỳ của phản ứng, cần phải bổ sung thêm một
lượng enzyme mới vào ống phản ứng. Với các enzyme DNA polymerase bền nhiệt (nhóm
enzyme được tách ra từ vi khuẩn suối nước nóng Thermus aquaticus) hoạt tính của
enzyme không bị ảnh hưởng khi nhiệt độ vượt trên 900C. Những enzyme này được gọi
là enzyme Taq DNA polymerase, hiện nay được sử dụng phổ biến trong các phản ứng
PCR.

Hình 2.6. Các bước thực hiện của phản ứng PCR

Tiến trình cơ bản của phản ứng PCR được mô tả tóm tắt ở hình 2.6. Vai trò của
DNA polymerase là một thành phần cơ bản của phản ứng PCR, bên cạnh các thành phần
175
khác gồm: các đoạn mồi oligonucleotide, các deoxynucleotide triphosphate (dNTPs), các
cation hoá trị 2 (như MgCl 2 ), DNA khuôn (hay thường gọi DNA đích) và dung dịch đệm
(thường là dung dịch Tris). Các mồi phản ứng thường là các đoạn oligonucleotide có
chiều dài khoảng 20 đến 25 base (nucleotide). Chúng được thiết kế để nhận diện trình tự
đặc hiệu của vùng trình tự đích (mong muốn) và xác định vùng cần nhân lên. Trong
khoảng nhiệt độ bắt cặp của mồi, hai mồi liên kết với các đầu đối diện trong vùng nhân
lên này, mỗi mồi bắt cặp bổ sung với sợi DNA đích. Các mồi phải được thiết kế một cách
cẩn thận để tránh mồi tự bắt cặp hoặc tạo cấu trúc dimer. Chiều dài và trình tự của mồi
sẽ quy định nhiệt độ biến tính (nóng chảy) và nhiệt độ bắt cặp của chúng. Khi bắt cặp với
DNA đích, các mồi sẽ tạo ra vị trí liên kết cho enzyme DNA polymerase, là enzyme cần
thiết cho quá trình nhân đôi sợi DNA khuôn. Đoạn DNA kép ngắn trên sợi khuôn khởi
động phản ứng sao chép DNA hoặc quá trình khuếch đại DNA. Trong bước tổng hợp,
enzyme Taq polymerase bổ sụng các nucleotide mới vào đầu 3’OH của mồi để tạo ra sợi
mới cho phân tử DNA. Hỗn hợp dNTPs có chứa đủ 4 loại nucleotide dATP, dGTP,
dTTP, dCTP có nồng độ của các nucleotide bằng nhau. Nếu trong phản ứng PCR sử dụng
enzyme uracil-N-glycosylase (UNG), nhằm tránh hiện tượng bội nhiễm, nguyên liệu
nucleotide sử dụng dUTP thay thế hoặc kết hợp với dTTP. Magie là một cofactor sử dụng
phổ biến trong các phản ứng PCR và cần thiết cho sự hoạt động của Taq DNA
polymerase. Nồng độ của Magie nên được tối ưu hoá cho từng phản ứng khi cần tối ưu
hoá các điều kiện phản ứng PCR.

2.2.2.2. Chu kỳ phản ứng PCR

Phản ứng PCR bao gồm 3 bước: biến tính, bắt cặp của mồi và kéo dài. Mỗi một
lần nhân lên cần thực hiện 3 bước như trên và thường được gọi là chu kỳ PCR. Quá trình
thực hiện này đòi hỏi các nhiệt độ khác nhau ở mỗi bước. Với các thiết bị gia nhiệt cho
phản ứng một cách tự động, các bước làm nóng và làm lạnh ở ống phản ứng thường diễn
ra trong thời gian ngắn. Hầu hết các quy trình (protocol) PCR sử dụng 3 mức nhiệt độ
khác nhau cho từng bước, ngoài ra còn có một số quy trình PCR sử dụng 2 mức nhiệt độ
khi nhiệt độ bắt cặp của mồi và kéo dài có mức nhiệt độ giống nhau. Số lượng chu kỳ
trong phản ứng PCR thường dao động trong khoảng 30-40 chu kỳ, đáp ứng cho việc tạo
ra đủ lượng bản sao để nghiên cứu và chẩn đoán.

Bước biến tính: ở nhiệt độ từ 930C đến 950C, hai sợi của phân tử DNA đích bị
tách ra, hoặc bị biến tính. Ở mức nhiệt độ này, tất cả các phản ứng enzyme xúc tác, như
phản ứng kéo dài chuỗi của chu kỳ trước, bị dừng lại.
176
Bước bắt cặp của mồi: là bước kế tiếp ngay sau bước biến tính, nhiệt độ của phản
ứng bị giảm xuống cho phép các sợi DNA có trình tự bổ sung bắt cặp với nhau. Nhiệt độ
bắt cặp rất đa dạng, phụ thuộc vào trình tự và nhiệt độ biến tính của các mồi
oligonucleotide, nhưng thường dao động trong khoảng 500C đến 600C. Ở mức nhiệt độ
bắt cặp này, các mồi thường ở trạng thái di động do hiệu ứng Brownian (là sự chuyển
động của các phân tử trong môi trường lỏng). Các liên kết ion được hình thành một cách
ổn định và phá vỡ trạng thái sợi đơn của mồi và DNA đích. Khi các mồi liên kết bổ sung
hoàn toàn với trình tự đích, tạo ra dạng liên kết ổn định đủ để cho DNA polymerase bám
vào và khởi động việc tổng hợp DNA tại đầu 3’OH của mỗi mồi.

Bước kéo dài (tổng hợp DNA): Sự kéo dài các mồi thường xảy ra ở nhiệt độ
720C. Taq DNA polymerase có nhiệt độ hoạt động tối ưu ở nhiệt độ này. Khi thêm các
base vào đầu 3’OH của mỗi mồi nhằm kéo dài đoạn sợi kép trên DNA, là kết quả của lực
liên kết ion giữa các base lớn hơn lực bẻ gẫy. Theo lý thuyết, sau mỗi chu kỳ nhân số
lượng DNA sẽ tăng gấp đôi. Do đó sau một vài chu kỳ nhiệt đầu tiên, sản phẩm đoạn
DNA đích của phản ứng thường có số lượng nhiều hơn phân tử DNA khuôn ban đầu và
có thể dự tính được sản phẩm DNA tạo ra sau khi thực hiện 30-40 chu kỳ phản ứng PCR
(hình 2.7). Tuy nhiên trong thực tế, do sự tác động của một số chất ức chế phản ứng PCR
và một số nhân tố khác, hiệu suất phản ứng có thể không bao giờ đạt 100%. Ngoài ra độ
chính xác của phản ứng PCR thường không được tin tưởng khi có hiệu suất khuếch đại
thấp và độ sai số DNA mẫu cao.

177
Hình 2.7. Kết quả nhân bản DNA của phản ứng PCR

Toàn bộ quá trình của phản ứng PCR được thực hiện trên một máy luân nhiệt –
thường được điều khiển bằng một chương trình trên máy tính/chương trình luân nhiệt với
các thông số gia tăng nhiệt độ và giảm nhiệt độ. Các máy luân nhiệt được hoàn thiện về
thiết kế bằng nhiều kỹ thuật mới, các thiết kế thiết bị gia nhiệt mới chủ yếu dựa trên hiệu
ứng Peltier. Trong các thiết kế này, sự biến thiên nhiệt độ dựa vào các chất bán dẫn được
làm nóng nhờ luống khí hoặc chất lỏng hoặc kết hợp Peltier và các công nghệ đối lưu.
Khi lựa chọn các thiết bị luân nhiệt mới cần chú ý các thông số chức năng gia nhiệt, khả
năng cập nhật các kỹ thuật PCR, việc đáp ứng các thay đổi block/module bên trong máy.

2.2.2.3. Xác định và phân tích sản phẩm của phản ứng PCR

Sản phẩm của phản ứng PCR thường là 1 đoạn hoặc nhiều đoạn DNA có chiều dài
xác định. Trước khi sản phẩm PCR được sử dụng cho các ứng dụng kế tiếp, nó nên được
178
phân tích. Trong các ứng dụng chẩn đoán, sự phân tích sản phẩm này thường được thực
hiện dựa trên các mẫu lấy từ từng bệnh nhân bằng cách xác định trực tiếp hoặc gián tiếp
trên mẫu bệnh phẩm. Trước tiên, các phản ứng được kiểm tra để xác định các sản phẩm
thực sự được tạo ra. Các kiểm tra này có thể sử dụng các mẫu dò (probe), hoặc các kỹ
thuật khác để xác định các thông số thiết kế cho phản ứng là phù hợp (mồi, trình tự đích,
điều kiện phản ứng tối ưu…) để tạo ra kích thước chính xác của sản phẩm mong muốn,
giảm thiểu tối đa sản phẩm phụ, hiệu quả hoạt động của mồi phải tối ưu … Sản phẩm
PCR cũng nên được đánh giá để đảm bảo chính xác sự khác biệt giữa đoạn được tạo ra.
Thường các phản ứng PCR áp dụng trong chẩn đoán thường sử dụng 1 cặp mồi. Vì vậy,
khi sản phẩm PCR tạo ra những đoạn có kích thước không mong muốn (sản phẩm phụ)
thường do các điều kiện phản ứng chưa được tối ưu (như thiết kế mồi chưa chính xác,
Taq hoặc MgCl 2 có nồng độ quá cao, nhiệt độ bắt cặp của mồi chưa được tối ưu). Sản
phẩm PCR được phân tích bằng kỹ thuật điện di agarose và nhuộm bằng ethidium
bromide hoặc chất nhuộm hữu cơ (Gelred, Sybrgreen …). Kích thước của các đoạn DNA
được xác định dựa trên thang phân tử của DNA. Kỹ thuật điện di agarose cũng được sử
dụng để xác định sản phẩm PCR nhưng nó không phải là phương pháp tiêu chuẩn để xác
định trình tự khuếch đại. Việc xác định các định dạng sản phẩm PCR được mô tả trong
các phương pháp xác định trình tự.

2.2.3. Các kỹ thuật PCR sử dụng trong in vitro để khuếch đại DNA

2.2.3.1. Hot-start PCR

Hot-Start PCR là kỹ thuật PCR được phát minh bởi Kary Mullis xuất bản 1991,
được ứng dụng trong thực hành vào năm 1992. Các kỹ thuật Hot-start PCR tập trung vào
việc ức chế enzyme DNA polymerase hoạt động trong việc cài đặt phản ứng. Bằng cách
giới hạn hoạt tính polymerase trước khi gia tăng nhiệt độ của phản ứng PCR, sự khuếch
đại không đặc hiệu được giảm xuống và tăng hiệu suất khuếch đại gen đích. Điều này
được thực hiện bằng phân tách vật lý hoặc ức chế hoá học cho một hoặc nhiều hơn 1
thành phần phản ứng cho đến khi nhiệt độ cao khởi động hỗn hợp hoặc hoạt hoá để tạo
ra một hỗn hợp hoàn chỉnh.

Kỹ thuật hot-start PCR thủ công, các phản ứng thiều một thành phần cơ bản
(thường là DNA polymerase) được chuẩn bị và ủ ở nhiệt độ cao hơn 3 lần nhiệt độ bắt
cặp không đặc hiệu của mồi với khuôn. Chỉ trước khi hoàn thành chu kỳ, thành phần bị
thiếu sẽ được bổ sung vào phản ứng để cho phản ứng được thực hiện ở nhiệt độ cao hơn.
Quy trình này hạn chế sự bắt cặp không đặc hiệu của mồi và thường cải thiện hiệu suất
179
khuếch đại gen mong muốn. Phương pháp thủ công này thường gây mệt mỏi và nhàm
chán, khi các ống phải luôn được giữ ở 95-1000C. Ở nhiệt độ này, các ống rất khó cho
việc thao tác. Bên cạnh đó, việc mở ống để thêm các thành phần cuối cùng làm tăng nguy
cơ lây nhiễm bên ngoài hoặc nhiễm chéo giữa các ống. Để đơn giản hoá quy trình, các
ống được giữ trong thiết bị làm ấm theo chu kỳ (thiết bị gia nhiệt) trước khi bổ sung
thành phần cuối cùng.

Hot-start PCR cũng được thực hiện bằng cách tạo ra một rào cản vật lý giữa các
thành phần cơ bản, ví dụ như các mồi và khuôn hoặc enzyme và MgCl 2 . Rào cản này có
thể được tạo ra khi thêm sáp ong hoặc paraffin lên trên hỗn hợp chưa hoàn chỉnh của
phản ứng. Các thành phần còn lại của phản ứng PCR được đặt lên trên lớp sáp ong. Trong
bước biến tính đầu tiên, lớp sáp ong bị tan chảy, các dòng đối lưu trong dung dịch trộn
các thành phần cơ bản của phản ứng PCR với nhau.

Thêm vào đó, các phương pháp hot-start PCR bao gồm việc thay đổi hoá học của
Taq DNA polymerase và kháng thể ức chế Taq DNA polymerase. Kháng thể này liên kết
trực tiếp vào vị trí hoạt động của Taq DNA polymerase, ngăn cản enzyme này sao chép
DNA cho đến khi nhiệt độ tăng lên đến mức biến tính của chu kỳ (950C), tách kháng thể
ra khỏi enzyme. Những biến đổi về enzyme cần thiết cho chu kỳ biến tính khởi đầu kéo
dài hơn so với các Taq DNA polymerase ban đầu.

2.2.3.2. “Hot-start” PCR hoá học

Tương tự với việc kiếm soát nhiệt độ và phân tách vật lý của các thành phần phản
ứng PCR, việc sử dụng đồng thời các dung môi và các enzyme cũng làm giảm hoặc hạn
chế sự bắt cặp không đặc hiệu của mồi. Sử dụng các đồng dung môi như là việc bổ sung
thêm dimethyl sulfoxide (DMSO) và formamide làm tăng độ chính xác bởi việc thay đổi
nhiệt độ nóng chảy của đoạn lai mồi-DNA khuôn. Glycerol cũng được cho là có chức
năng tương tự như các chất trên. Các đồng dung môi có nhiều tác động khác nhau lên
enzyme polymerase. Glycerol làm tăng sự bền nhiệt của Taq DNA polymerase, trong khi
formamide hạ thấp khả năng bền nhiệt của enzyme này. Enzyme uracil N-glycosylase
(UNG) được sử dụng trong phản ứng PCR như là một phần của hệ thống khử các sản
phẩm nhiễm dUTP trước khi chuyển sang thực hiện các bước trong quy trình PCR. Ưu
điểm khác của UNG là phân huỷ các sản phẩm được tạo ra trong các chu kỳ đầu của phản
ứng PCR, nhìn chung UNG hỗ trợ cho hoạt động của enzyme trong hot-start PCR.

2.2.3.2. “Touchdown” PCR


180
Trong khi chương trình PCR cơ bản thường sử dụng một nhiệt độ bắt cặp của mồi
ổn định, touchdown PCR kết hợp một dãy nhiệt độ bắt cặp của mồi trong phản ứng. Các
chu kỳ ban đầu của touchdown PCR có nhiệt độ bắt cặp của mồi ở mức cao. Các chu kỳ
nối tiếp theo sau đó, nhiệt độ bắt cặp của mồi giảm dần bằng các bước giảm nhỏ (thường
10C) cho một vài chu kỳ kế tiếp nhau cho đến khi đạt được nhiệt độ bắt cặp cuối cùng
(“touchdown”), và nhiệt độ này thường được sử dụng cho 10 hoặc nhiều hơn 10 chu kỳ
cuối cùng. Việc giảm từ từ nhiệt độ bắt cặp của mồi này sàng lọc các mồi bắt cặp bổ sung
tốt nhất với khuôn ở các chu kỳ sớm, gần nhất với vùng trình tự quan tâm. Touchdown
PCR thường được ứng dụng để xác định nhiệt độ bắt cặp tối ưu của mồi.

2.2.3.3. PCR suy biến (degenerate PCR)

PCR suy biến là phương pháp làm giảm sự đặc hiệu trong phân tích với các trình
tự khác nhau để xác định mặc dù có sự khác nhau về trình tự trong vùng bắt cặp với mồi.
Thay vì sử dụng một cặp mồi đơn bắt cặp với một trình tự đặc hiệu trên khuôn, tập hợp
các mồi suy biến mà có chứa một vài cặp mồi được thay đổi một hoặc nhiều hơn một
nucleotide, hoặc là các mồi này có chứa các base không đặc hiệu, như là inosine ở vị trí
suy biến (divergent). Trong chẩn đoán vi sinh, sự cần thiết cho việc chẩn đoán mở rộng
có lợi hơn. Ví dụ, chi Norovirus có hàng tá các chủng chỉ khác biệt nhau tương đối ở
vùng biến đổi cao. Nếu chỉ sử dụng 1 cặp mồi đơn, việc bắt cặp của mồi với khuôn sẽ
thiếu sự bắt cặp bổ sung đáp ứng hết cho các chủng, và giá trị chẩn đoán bị thu hẹp. RT-
PCR suy biến cũng được sử dụng thành công để xác định một dãy mở rộng các Norovirus.
Vì các virus thường thiếu các vùng bảo tồn cao như là các gen rDNA, các PCR suy biến
thường được sử dụng trong chẩn đoán các nhân tố gây bệnh.

2.2.3.4. Nested và Heminested PCR

Nested và heminested PCR được thiết kế để tăng độ nhạy của phản ứng PCR thông
qua việc sử dụng trực tiếp sản phẩm PCR đầu tiên để tạo ra sản phẩm PCR thứ hai. Nested
PCR sử dụng hai dãy mồi khuếch đại và hai chương trình PCR độc lập. Các mồi trong
dãy mồi thứ 2 (nested) bắt cặp với vùng trình tự bên trong của các sản phẩm PCR được
tạo ra do các mồi trong dãy mồi thứ nhất. Trong kỹ thuật heminested PCR, vòng PCR
thứ 2 sử dụng 1 trong các mồi của vòng thứ nhất và một mồi mới, là mồi bên trong/nội
tại. Vòng khuếch đại thứ 2 này thường ngắn hơn vòng khuếch đại thứ nhất (hình 2.8).
Ưu điểm của nested PCR làm tăng độ nhạy và tính đặc hiệu của phản ứng, vì các mồi nội
tại chỉ bắt cặp khi có sự khuếch đại sản phẩm tương ứng với các trình tự mong muốn.
Nhược điểm của nested PCR là kéo dài thời gian và chi phí cho xét nghiệm, thêm vào đó
181
tăng nguy cơ nhiễm khi chuyển sản phẩm vòng khuếch đại đầu tiên sang ống thứ hai. Để
giảm thiểu các nguy cơ nhiễm mẫu, thêm sáp ong hoặc dầu khoáng vào hỗn hợp phản
ứng PCR thứ 2 và thiết kế nhiệt độ bắt cặp của dãy mồi thứ 2 với nhiệt độ cao hơn dãy
thứ nhất thường là 2 cải tiến được sử dụng nhiều nhất.

Hình 2.8. Các đặc điểm của phản ứng nested PCR

2.2.3.5. Multiplex PCR

Trong kỹ thuật multiplex PCR, hai hoặc nhiều hơn hai trình tự DNA đặc trưng có
trong cùng một mẫu được nhân lên đồng thời. Các mồi sử dụng trong các phản ứng
multiplex phải được thiết kế tỉ mỉ cho các nhiệt độ bắt cặp của mồi phải tương tự nhau
và tránh trường hợp bắt cặp bổ sung không đặc hiệu và tạo cấu trúc dimer. Phản ứng
multiplex PCR cần các điều kiện tối ưu cho bắt cặp giữa mồi và khuôn tạo ra hiệu suất
khuếch đại cao nhất. Một số kit thương mại có hiệu quả khuếch đại thường ít khác nhau
giữa các trình tự khác nhau hoặc không cần các điều kiện tối ưu cho mồi. Điều này là do
các thành phần trong đệm của phản ứng có khả năng mở rộng dãy nhiệt độ bắt cặp tối ưu
cho mồi. Các kiểm nghiệm chẩn đoán bằng multiplex PCR được sử dụng ngày càng phổ
biến ở các phòng thí nghiệm để khuếch đại DNA đích với một nội đối chứng sử dụng sử
dụng một dãy mồi và các trình tự DNA quan tâm sử dụng với một dãy mồi thứ hai. Các
mồi nội đối chứng được sử dụng để xác định sự hoạt động của phản ứng PCR. Kết quả
dương tính với các mồi đối chứng nội được xác định là các điều kiện tối ưu cho phản ứng
PCR hoạt động (mồi, khuôn, các nhân tố khác). Multiplex PCR cũng được sử dụng trong
các phòng thí nghiệm lâm sàng để xác định nhanh chóng các trình tự DNA của hai hoặc
nhiều hơn của một vài sinh vật khác nhau trong cùng một phản ứng PCR. Các mồi được
182
thiết kế để khuếch đại một sản phẩm DNA có kích thước duy nhất, có nhiệt độ biến tính
đặc trưng hoặc có trình tự liên kết đặc trưng cho mẫu dò. Điều này cho phép xác định và
phân lập được các vi sinh vật khác nhau trong cùng một mẫu. Sự thất bại của phản ứng
multiplex PCR có thể là do độ nhạy thấp, không đặc trưng cho đích nhân lên.

2.2.3.6. Reverse Transcription PCR (RT-PCR)

Reverse Transcription (RT) –PCR là một kỹ thuật khuếch đại phân tử đích RNA.
Vì các DNA polymerase cần sử dụng sợi DNA kép làm khuôn, RNA phải được phiên
mã thành sợi DNA bổ sung (c-DNA) ở vòng PCR đầu tiên bởi enzyme phiên mã ngược.
Kế tiếp cDNA được sử dụng làm khuôn cho chu kỳ PCR tạm thời đầu tiên để tạo khuôn
cDNA sợi kép (hình 2.9). Việc sử dụng kết hợp giữa RT và PCR để khuếch đại RNA
đích được mô tả lần đầu năm 1987. Những nghiên cứu đầu tiên gọi phản ứng này là RT-
PCR, RNA-PCR, RNA phenotyping, và phản ứng khuếch đại kiểu hình thông tin. RT-
PCR là một kỹ thuật quan trọng trong chẩn đoán nhiễm trùng và các bệnh di truyền, là
kỹ thuật chủ chốt được sử dụng trong xác định và định lượng RNA như việc đo lường sự
biểu hiện của gen.

Hai enzyme phiên mã ngược được sử dụng phổ biến nhất là Moloney murine
leukemia virus (M-MuLV) reverse trancriptase và avian myeloblastosis virus (AMV)
reverse trancriptase. Cả hai enzyme này đều giống nhau về chức năng cơ bản nhưng khác
nhau ở một số đặc điểm, như nhiệt độ và pH tối ưu. Ngoài 2 enzyme này, các biến thể
khác của chúng cũng được sử dụng trong phòng thí nghiệm chẩn đoán. Những enzyme
này được tối ưu hoá trước trong các kit RT-PCR thương mại.

Việc phiên mã ngược trong in vitro sử dụng các mồi trực tiếp. Một mồi đơn được
sử dụng để tạo ra cDNA, và có thể là một mồi trong cặp mồi của phản ứng PCR kế tiếp
(trình tự đặc hiệu) hoặc có thể sử dụng đoạn oligonucleotide ngẫu nhiên (mồi ngẫu
nhiên). Sự đặc hiệu không cần thiết cho phản ứng phiên mã ngược. Các oligonucleotide
ngẫu nhiên được sử dụng phổ biến trong các kit RT-PCR hoặc được sử dụng cho tất cả
RNA đích.

Thông thường, bước RT được thực hiện trong một ống phản ứng độc lập chỉ chứa
các thành phần cần thiết cho sự phiên mã ngược. Sau khi thực hiện RT, một phần nhỏ
được chuyển vào ống phản ứng PCR, và ống này được thực hiện PCR để khuếch đại.
Nhìn chung việc phân tách hai giai đoạn vào 2 ống riêng biệt thường tạo ra sự bất tiện và
nguy cơ lây nhiễm chéo. Hiện này, các thí nghiệm RT-PCR thường được thiết kế trong
183
một ống với hai enzyme hoặc 1 enzyme. Thuật ngữ RT-PCR thường được sử dụng để
mô tả cho phản ứng PCR phiên mã ngược (reverse transcription PCR) hoặc real-time
PCR.

Hình 2.9. Kết quả nhân bản DNA của phản ứng RT-PCR

2.2.3.6. PCR định lượng (qPCR)

PCR định lượng là phản ứng PCR xác định chính xác số lượng phân tử acid nucleic
có trong mẫu. Khuôn được sử dụng trong phản ứng có thể là DNA hoặc RNA. Kết quả
định lượng của phản ứng PCR là công cụ hữu ích cho việc đánh giá các liệu pháp điều
trị nhiễm virus, kiểm soát các triệu chứng lâm sàng hoặc dự đoán sự bùng nổ của các
bệnh nhiễm trùng. Các test định lượng PCR thương mại được sử dụng chẩn đoán các
nhiễm trùng virus như: HIV, viêm gan C, viêm gan B, … Việc định lượng acid nucleic
của phản ứng có thể sử dụng giá trị tuyệt đối hoặc giá trị tương quan dựa vào đường
chuẩn. Việc định lượng bằng giá trị tương quan thường dựa vào dãy pha loãng mẫu, và
được khuếch đại đồng thời với mẫu. Kết quả được biểu diễn bằng tỉ số của các tín hiệu
các trình tự đặc trưng với mẫu đối chứng nội. Với các giá trị tương quan đại diện cho giá
trị của từng sản phẩm khuếch đại từ trình tự đặc biệt của mẫu. PCR tương đối sử dụng
các cặp mồi cho mẫu nội đối chứng mà nó được trộn lẫn trong cùng một phản ứng PCR
với các trình tự mồi đặc biệt. Mồi đối chứng nội và các mồi trình tự đặc trưng phải phù
184
hợp với nhau, không tạo ra các band phụ hoặc lai với nhau. Các tìn hiệu từ đối chứng đội
được sử dụng để chuẩn hoá dữ liệu của mẫu thành các giá trị cho hiệu suất khuếch đại
hoặc biến thể của phản ứng RT. Các đối chứng nội thường được sử dụng nhiều nhất là
các gen hoặc các mRNA của nhóm gen quản gia (housekeeping genes) β-actin, GAPDH
và 18S rDNA.

RT-PCR cung cấp giá trị định lượng tuyệt đối của acid nucleic đích trong mẫu.
Một đối chứng nội hoặc đường chuẩn được thêm vào với nồng độ đã biết trước và được
khuếch đại đồng thời với các trình tự đích trong mẫu. Sau khi khuếch đại và được phân
tích, số lượng của sản phẩm hoặc tín hiệu được tạo ra bởi đối chứng nội được quy thành
phương trình chuẩn cho số lượng bản sao của trình tự. Phương trình của đối chứng nội
này được sử dụng để xác định số lượng bản sao của các vùng trình tự đích.

Các giá trị được định lượng trong phản ứng real-time PCR cho phép so sánh với
các đường cong chuẩn bên ngoài để định lượng bản sao của mẫu. Các đối chứng nội
thường không cần thiết sử dụng trong trường hợp này. Bởi vì việc định lượng mẫu được
thực hiện ở từng chu kỳ, trong quá trình tích luỹ theo hằng số mũ của PCR, hiệu suất ổn
định giữa các mẫu. Các phản ứng PCR thông thường định lượng sản phẩm sau khi kết
thúc phản ứng. Vì các sản phẩm PCR được định lượng trong quá trình khuếch đại, việc
định lượng này thường chính xác hơn so với các PCR truyền thống. Với những đặc điểm
này, các mẫu đối chứng ngoại – các acid nucleic được xác định sẵn số lượng bản sao –
được sử dụng thay thế cho mẫu đối chứng nội. Các mẫu đối chứng ngoại được sử dụng
để tạo ra đường cong chuẩn cho phản ứng PCR. Real-time PCR tạo ra điểm ngưỡng chu
kỳ (C T ) hoặc điểm giao nhau (C P ) cho mỗi mẫu. Điểm ngưỡng C T của các mẫu từ bệnh
nhân sẽ được phân tích lại một lần nữa với các đường cong chuẩn để xác định số lượng
bản sao từ DNA hoặc RNA đích.

Bảng 2.1. Các thành phần của phản ứng PCR

Nồng độ Thành phần Mục đích


cuối cùng

1X Đệm Duy trì pH của phản ứng PCR

200 µM Deoxynucleotide Cung cấp năng lượng và nguyên liệu nucleotide


cho tổng hợp DNA. Là thành phần quan trọng, số
(dNTPs)
lượng các nucleotide được thêm vào phản ứng

185
thường bằng nhau trong master Mix nhằm ngăn
cản các base bắt cặp sai.

0.2 - 0.1 Mồi Là những đoạn DNA ngắn (20 – 30 base) có khả
µM năng liên kết với DNA khuôn để tạo điều kiện cho
Taq DNA polymerase tổng hợp sợi DNA. Các mồi
đặc hiệu và phổ biến đều được sử dụng.

1.5 – 2.5 Taq polymerase Enzyme chịu nhiệt, được sử dụng để tổng hợp
µU DNA.

< 1.0 µg DNA khuôn Là phân tử DNA được khuếch đại bởi phản ứng
PCR

Master mix buffer thường được lữu giữ ở dung dịch có độ đặc 10X (100mM Tris-HCl,
pH 8.3, 500mM KCl, 1.5mM MgCl 2 ) khi sử dụng thường được pha loãng thành 1X.
Nước cất và đệm Master mix thường được bảo quản ở nhiệt độ phòng. Các thành phần
khác (dNTPs, mồi, enzyme, … ) phải được bảo quản ở -200C hoặc theo khuyến cáo của
công ti cung cấp.

Ứng dụng của PCR


Chỉ cần nhìn vào ảnh thì bạn đã hình dung ra được phần nào các ứng dụng của
phương pháp PCR này. Bây giờ chúng ta sẽ cùng đi chi tiết hơn từng ứng dụng để thấy
được tầm quan trọng của phương pháp này (hình 4).

Hình 4. Ứng dụng của phương pháp PCR


Kiểm tra huyết thống
186
Một biến thể của kỹ thuật này cũng có thể được sử dụng để xác định các mối quan
hệ tiến hóa giữa các sinh vật.
Vân tay di truyền
Vân tay di truyền là một kỹ thuật pháp y sử dụng để xác định một người bằng cách
so sánh DNA của người đó với mẫu đã có. Về lý thuyết thì chỉ cần một mạch DNA đơn
là đủ.
Chẩn đoán bệnh di truyền
Phát hiện các bệnh di truyền trong một gen nhất định là một quá trình lâu dài và
khó khăn, có thể được rút ngắn đáng kể bằng cách sử dụng phương pháp PCR. Mỗi gen
trong câu hỏi có thể dễ dàng được khuếch đại qua PCR bằng cách sử dụng các loại sơn
lót thích hợp và sau đó trình tự để phát hiện đột biến.
Bệnh virus, cũng có thể được phát hiện bằng phương pháp PCR thông qua khuếch
đại của DNA của virus. Phân tích này là có thể ngay sau khi nhiễm trùng, có thể từ vài
ngày đến vài tháng trước khi các triệu chứng thực tế xảy ra.
Tách dòng gen
Nhân bản một gen không nên nhầm lẫn với nhân bản toàn bộ một sinh vật-mô tả
quá trình cô lập một gen từ một sinh vật và sau đó chèn nó vào sinh vật khác. PCR thường
được sử dụng để khuếch đại gen, mà sau đó có thể được chèn vào một vector (vector là
một phương tiện chèn một gen vào cơ thể) như một plasmid (một phân tử DNA vòng).
Thể hiện một gen nhân bản cũng có thể là một cách để sản xuất hàng loạt hữu ích ví dụ
protein-cho, thuốc men.
Phân tích mẫu DNA cổ
Sử dụng PCR nó sẽ trở thành có thể phân tích ADN đó là hàng ngàn năm tuổi. Kỹ
thuật PCR đã được sử dụng thành công trên động vật, chẳng hạn như một voi ma mút
bốn mươi ngàn năm tuổi.
6.3.2. Nhân dòng phân tử DNA trong tế bào
• Bước 1: Tinh chiết ADN
Giả sử đã tinh chiết được plasmid có chứa hai gen kháng ampicillin và tetracyclin, ký
hiệu là AmpR và TetR; và cũng giả thiết rằng gen TetR có chứa điểm cắt của EcoRI,
và phân tử ADN người có mang gen insulin.

187
Hình 8.13. Sơ đồ thí nghiệm tạo dòng vi khuẩn mang ADN tái tổ hợp, ở đây là gen insulin
người.
• Bước 2: Kiến tạo phân tử ADN tái tổ hợp in vitro
Trước tiên, dùng enzyme giới hạn đầu dính EcoRI (xem Bảng 8.1) để cắt vòng plasmid
tại giữa gen TetR và cho cắt ADN người, trong số các đoạn bị cắt có một đoạn mang
gen insulin. Sau đó đem trộn lẫn hai loại ADN trên trong ống nghiệm với ADN ligase.
Kết quả là có thể xảy ra ba trường hợp: (1) Plasmid tự nối lại thành mạch vòng như
lúc đầu; (2) Đoạn ADN tự nối lại thành mạch vòng; và (3) Plasmid tái tổ hợp có mang
gen insulin, và có thể mang một đoạn ADN không phải gen đó.
• Bước 3: Biến nạp và phát hiện dòng ADN tái tổ hợp chung
Đưa các ADN được xử lý vào các tế bào E. coli. Nếu phân tử có kích thước lớn người
ta phải xử lý vi khuẩn 'thể nhận' bằng chlorid calcium (CaCl2) để làm cho màng trở nên
thấm được dễ dàng. Sau đó đem cấy riêng rẽ các vi khuẩn trên môi trường có ampicillin
và theo dõi.
+ Nếu có xuất hiện khuẩn lạc, chứng tỏ vi khuẩn có mang gen AmpR, tức là chúng có
mang plasmid ban đầu (trường hợp 1) hoặc plasmid tái tổ hợp (trường hợp 3). Ngược
lại, nếu chỗ cấy không xuất hiện khuẩn lạc, chứng tỏ vi khuẩn mang ADN tự nối (trường
hợp 2).
+ Kế đó, đem cấy riêng rẽ các vi khuẩn thu được sang môi trường có tetracyclin. Nếu
có xuất hiện khuẩn lạc, chứng tỏ vi khuẩn có mang gen TetR nguyên vẹn (trường hợp
1). Nếu không có khuẩn lạc, chứng tỏ vi khuẩn đem cấy có mang ADN tái tổ hợp
(trường hợp 3); vì gen TetR bị bất hoạt do đoạn ADN xen vào. Bằng cách theo dõi

188
như vậy cho phép xác định được dòng vi khuẩn mang ADN tái tổ hợp, nhưng vẫn
chưa biết được đâu là các dòng đặc hiệu, nghĩa là có mang gen insulin.
• Bước 4: Chọn dòng ADN tái tổ hợp đặc hiệu
Về nguyên tắc, trong cả triệu phép thử mới có một tế bào mang gen mong muốn. Với
trường hợp trên, người ta có thể sử dụng phương pháp miễn dịch học bằng cách dùng
kháng thể chống lại protein được sinh ra bởi dòng vi khuẩn tương ứng (tức huyết thanh
tìm gen kháng insulin).
Hình 8.14 minh họa một công đoạn của quy trình thí nghiệm ADN tái tổ hợp ở vi
khuẩn E. coli khi sử dụng môi trường nuôi cấy có bổ sung ampicillin đối với ba kiểu
tế bào: tế bào có mang plasmid tái tổ hợp, tế bào chỉ mang plasmid pUC19 không tái
tổ hợp, và tế bào không biến nạp được (Hình 8.14a). Qua đêm sinh trưởng, các tế
bào nào có mang plasmid tái tổ hợp và plasmid không tái tổ hợp sẽ mọc thành các
khuẩn lạc (màu sắc tương ứng ở đây là trắng và xanh; Hình 8.14b). Sau khi chọn ra
các dòng có xen plasmid tái tổ hợp, đưa lên màng lọc và cho tiến hành lai hóa giữa
ARN và ADN (gen) của nó bằng các vật dò phóng xạ như đã nói ở trên. Sau đó đưa
sản phẩm lai phân tử này lên tấm phim X quang để định vị gen quan tâm từ dòng
tái tổ hợp (Hình 8.14c).
Nói chung, để tìm dòng lai đặc hiệu người ta sử dụng các mẫu dò là mARN hoặc rARN
đặc hiệu. Chẳng hạn, trong trường hợp nếu cần chọn dòng lai mang đoạn mARN cụ
thể, người ta đem cấy đều các dòng vi khuẩn có chứa ADN tái tổ hợp lên trên mặt
thạch của hộp petri chứa môi trường nuôi cấy. Sau đó đóng dấu lên màng lọc
nitrocellulose, và thu được bản sao. Việc xử lý bản sao bằng NaOH sẽ làm cho các tế
bào vi khuẩn tan vỡ tại chỗ (in situ), và các ADN thoát ra từ chúng sẽ bị biến tính
(các sợi đơn tách rời nhau) và dính vào màng lọc. Sau đó đem nhúng màng lọc này vào
mẫu mARN tương ứng đã được tinh khiết và đánh dấu phóng xạ (P32); mẫu ARN này
được gọi là vật dò phóng xạ (radioactive probe). Nếu dòng nào có chứa ADN mã hoá
cho mARN thì sẽ xảy ra hiện tượng lai giữa mARN và vùng sợi đơn tương ứng trên
ADN đó. Sau khi loại bỏ các mARN không lai được, người ta đặt một miếng phim
ảnh lên trên màng lọc; những vết ảnh xuất hiện trên ảnh phóng xạ tự ghi cho thấy vị
trí của dòng mang ADN bổ trợ với mẫu ARN. Từ đây có thể tách riêng các dòng lai đặc
hiệu để sử dụng cho các nghiên cứu tiếp theo.
Ứng dụng
Ứng dụng trong nghiên cứu các bộ gen
Việc tách dòng tái tổ hợp cho phép nhận được một số lượng lớn bất kỳ gen hoặc vùng
điều hoà nào để tiến hành phân tích trình tự nucleotide, xác định các vùng chức năng và
chỉ ra các cơ chế hoạt động của chúng. Nhờ đó đã đưa lại những hiểu biết mới về tổ
189
chức và hoạt động của các bộ gen prokaryote (như các khởi điểm tái bản, các vùng điều
hoà phiên mã, các gen nhảy v.v.) và ở các bộ gen eukaryote (như các centromere,
telomere, các gen phân đoạn, các gen giả, ADN lặp lại v.v.) như đã được thảo luận ở
các chương trước.
Bằng các thí nghiệm tạo dòng plasmid tái tổ hợp kinh điển ở vi khuẩn E. coli, và bằng
cách cải tiến sử dụng nhiễm sắc thể nấm men nhân tạo này (YAC), người ta đã thành
lập các thư viện gen (gene library) hay thư viện bộ gen (genomic library) để trên cơ sở
đó tiến hành lập bản đồ vật lý và xác định trình tự ADN bộ gen của nhiều sinh vật khác
nhau, kể cả bộ gen người. Nếu như vào năm 1977, F.Sanger xác định đầy đủ các trình
tự phage φX174 (5386 nucleotide, 9 gen) và phage G4 (5577 nucleotide, 10 gen), thì
đến nay người ta xác định và lập bản đồ cho các ADN có kích thước lớn hơn nhiều;
ví dụ: bộ gen phage lambda gồm 48.502 cặp bazơ với khoảng 61 gen (1983) v.v...
Đáng kể là, Dự án Bộ gen Người (HGP) đã chính thức đi vào hoạt động từ 1990 do
J.Watson chủ trì cùng với sự cộng tác của nhiều nhà khoa học trên thế giới. Việc phân
tích trình tự bộ gen người hoàn thành vào 4/2003, cho thấy bộ gen của chúng ta có
trình tự đầy đủ gồm 3.164.700.000 cặp bazơ, chứa đựng khoảng 25.000 gen mã hóa
protein chịu trách nhiệm xây dựng nên một bộ protein (proteome) gồm khoảng 35.000
protein khác nhau trong các tế bào.
Ứng dụng trong y-dược học
Sản xuất các chế phẩm y-sinh học
Nếu như vào năm 1972, Giáo sư Roger Guillemin (Pháp) đã phải dùng tới
500.000 não cừu mới tinh chiết được vài miligram somatostatin, một hormone sinh
trưởng của vùng dưới đồi thị (với công trình này ông đã được trao giải Nobel năm
1980), thì vào 10/1977 Hebert Boyer (Mỹ) đã chế tạo thành công hormone này từ E.
coli bằng phương pháp ADN tái tổ hợp. Đến 8/1978 chính Boyer lại là người đầu tiên
cho sản xuất thành công insulin người từ E. coli. Các thành tựu đầu tiên này đã mở ra
một kỷ nguyên mới phát triển rực rỡ nhất trong lịch sử công nghệ sinh học, công nghệ
ADN tái tổ hợp.
Sau đó là hàng loạt các chế phẩm khác như các hormone tăng trưởng của người (HGH),
bò (BGH), lợn (PGH), các vaccine và các interferon phòng chống các căn bệnh nan ở
người y như ung thư, viêm gan v.v. và một số bệnh quan trọng ở gia súc như hiện
tượng 'lở mồm-long móng' do virus gây ra... tất cả đều được sản xuất từ E. coli. Đặc
biệt là, sự ra đời của các hãng, các công ty lớn đã đầu tư mạnh mẽ cho sự phát triển
của kỹ nghệ này. Nhờ vậy góp phần giải quyết có hiệu quả nhiều vấn đề thực tiễn đặt ra
trong y học, trong chăn nuôi-thú y, và nông nghiệp nói chung ...

190
Một số sản phẩm được tạo dòng ở vi khuẩn liên quan đến các ứng dụng khác nhau trong
điều trị bệnh ở người được giới thiệu ở Bảng 8
Bảng 8. Các sản phẩm của người được tạo dòng từ vi khuẩn

Sản phẩm Áp dụng


Các Dùng để điều trị các bệnh lây nhiễm virus và
i t f th
Kích thích hệ thống miễn dịch và có thể dùng
Interleukin 2
trong
Insulin ề dùng để điều trị bệnh
Được ố tiểu đường.
ố ễ
Somatotropin Được dùng để điều trị dị tật lùn thuộc về tuyến
Chất kích ê tan các cục đông máu cho điều trị và
Làm
hoạt ngăn chặn các tình trạng tắc nghẽn tim
Nhân tố hoại Tấn công và giết các khối u ung thư.
tử tố XI,
Nhân Được dùng để điều trị bệnh máu khó đông.
VIII
Kích thích tạo các tế bào hồng cầu cho điều
Erythropoieti
n trị bệnh thiếu máu (anemia).
Các chất giảm đau tự nhiên do cơ thể tạo
Beta
endorphin ra; có thể được dùng làm thuốc giảm đau.
Được dùng rộng rãi từ việc điều khiển các
Các enzyme phản ứng hoá học trong các quá trình kỹ nghệ
cho đến việc bổ sung các enzyme trong khẩu
Kích thích khả năng miễn dịch của cơ thể đối
Các vaccine với một hoặc hai kháng nguyên then chốt của
tiểu một tác nhân gây bệnh; giảm nguy cơ rủi ro
đơn vị
của các vaccine thông thường.

Bên cạnh việc sản xuất các hormone, vaccine... nói trên, người ta còn sản xuất được
các kháng thể đơn dòng (monocloning antibodies) dùng để: (i) xác định vi khuẩn gây
bệnh (như thương hàn chẳng hạn); (ii) xác định mức hormone từ đó đánh giá chức năng
tuyến nội tiết hoặc sự thay đổi trong quá trình tổng hợp hormone do khối u gây ra; (iii)
phát hiện một số protein có ý nghĩa trong chẩn đoán khối u hoặc một số tình trạng
trước khi sinh; (iv) phát hiện các thuốc bị cấm có trong máu, hoặc kiểm tra nồng độ
thuốc trong máu và tổ chức nhằm đảm bảo liều thuốc sử dụng sao cho không vượt quá
ngưỡng gây độc v.v. Nhờ có tính đặc hiệu và chính xác cao và sử dụng dễ dàng, việc
sản xuất các kháng thể đơn dòng đã tạo nên một nhánh phát triển mau lẹ nhất của công
nghệ sinh học, và cùng với việc sản xuất các vaccine chúng đã trở thành những phương
191
tiện quan trọng nhất trong chính sách y tế cộng đồng của các nước đang phát triển và
xét về lâu dài, việc ứng dụng các kháng thể đơn dòng có triển vọng chữa được nhiều
bệnh trong đó có các khối u ác tính.
Ứng dụng trong chẩn đoán và điều trị gen
Trong chẩn đoán bệnh ở mức phân tử, thành tựu nổi bật nhất là vào năm 1981, lần đầu
tiên bệnh thiếu máu hồng cầu hình liềm được chẩn đoán trước sinh ở mức độ gen nhờ
phân tích ADN bằng enzyme giới hạn. Từ đây đã mở ra hai hướng chính trong chẩn
đoán gen là: chẩn đoán các bất thường bẩm sinh và chẩn đoán các bất thường ADN
soma. Một số thành tựu khác đạt được theo hướng đầu gồm có: bệnh hemophilia A,
rối loạn dưỡng cơ Duchenne, hội chứng X-fragile, bệnh retinoblastoma - một dạng
ung thư võng mạc...Theo hướng sau, người ta đã áp dụng đối với một số dạng ung thư
máu như các lympho Burkitt, lympho nang, bệnh bạch cầu...Đáng kể là gần đây,
người ta đã xác định được nhiều gen gây bệnh quan trọng ở người, như: gen gây bệnh
hóa xơ nang (cystic fibrosis) năm 1990, gen gây bệnh Huntington năm 1993...
Liệu pháp gen (gene therapy) cũng là một phương thức sản xuất và điều trị mới bằng
các phân tử trị liệu. Đây là hướng có nhiều triển vọng nhất nhưng khó thực hiện nhất vì
nó có liên quan đến cả vấn đề phương pháp luận lẫn khía cạnh đạo lý. Sự kiện nổi
bật nhất là vào năm 1990-91, W.F.Anderson, R.M.Blaese và Ken Cuver thực hiện
thành công ca liệu pháp gen đầu tiên trên một bé gái bốn tuổi mắc bệnh suy giảm
miễn dịch phối hợp (SCID) với sự thiếu hụt adenosine deaminase (ADA), một
enzyme cần thiết cho sản xuất các kháng thể trong các tế bào hệ miễm dịch, gọi là hội
chứng “bubble-boy” (bệnh do gen ở gần đầu mút vai ngắn nhiễm sắc thể số 20 gây
ra). Mặt khác, liệu pháp gen cũng đã mở ra những triển vọng to lớn trong chữa trị các
căn bệnh phổ biến nhất, tác động tới hàng triệu triệu người trên hành tinh như: ung
thư, SIDA/AIDS, viêm gan do virus, các bệnh tim mạch, các bệnh thoái hóa thần
kinh (bệnh Parkinson, bệnh Huntington, bệnh Alzheimer...) hay cả những bệnh mạn
tính như đa thấp khớp.
Ứng dụng trong nông nghiệp
Kỹ thuật di truyền với các sinh vật biến đổi gen (GMO)
• Đối với ngành chăn nuôi, công nghệ sinh học nói chung và công nghệ sinh học
nói riêng đã đạt nhiều thành tựu đáng kể, chẳng hạn các kỹ thuật chuyển ghép gen áp
dụng cho hợp tử và phôi ở các gia súc nhằm tăng cường khả năng chống bệnh và cải
thiện giống nói chung; cũng như các kỹ thuật mới trong xác định giới tính của phôi...

192
Hình 8.16. Mô hình tổng quát về thí nghiệm truyền gen ở động vật.
Hình 8.16 cho thấy khả năng ứng dụng kỹ thuật cấy ghép gen trên trứng chuột đã được
thụ tinh. Sau đó đem phôi đã ghép gen cấy vào trong tử cung của con chuột làm mẹ
khác. Kết quả là tạo ra được chuột con có bộ lông dạng khảm như mong muốn. Điển
hình cho các thí nghiệm truyền gene ở động vật là vào năm 1982,R.D.Palmiter,
R.L.Brinster và các đồng sự ở Đại học Seatle (Philadelphia, USA) bằng cách truyền
gen xác định hormone sinh trưởng của chuột cống vào trứng đã thụ tịnh của chuột bình
thường, rồi cấy trở lại các tế bào đã được biến đổi gen vào vòi trứng của các chuột cái
có thể mang thai cho đến cùng. Và kết quả là, các tác giả này đã thu được dạng chuột
nhắt có kích thước lớn gấp 2-3 lần chuột bình thường, gọi là chuột khổng lồ.
• Đối với trồng trọt, việc sử dụng các phương pháp chuyển ghép gen đã đạt được
nhiều thành tựu to lớn. Chẳng hạn, hãng Biogen (USA) năm 1984 đã chuyển thành
công plasmid Ti vào tế bào thực vật; hãng Calgen và Phytogen (USA, 1984) đã ghép
thành công gen kháng glyphosate để bảo vệ cây bông; năm 1985 hãng Molecular
Genetics (USA) đã tạo được giống ngô mới cho nhiều tryptophan. Năm 1993, bằng
kỹ thuật súng bắn gen vào tế bào thực vật người ta đã đưa được gen sản xuất protein
diệt sâu vào cây ngô, và kết quả là đã tạo ra được giống ngô chống chịu cao đối với sâu
đục thân. Điều thú vị là việc tách các gen cố định đạm, gen Nif (Nif = nitrogen fixation)
từ các vi khuẩn nốt sần cây họ đậu và đưa vào bộ gen của các cây trồng khác để tạo ra
các giống cây trồng mới có khả năng cố định nitơ và cho năng suất cao (Hình 8.17).

193
Hình 8.17. Mô hình chuyển gen ở cây trồng
• Trong chọn giống vi sinh vật, người ta đã thực hiện thành công việc chuyển gen
cellulase vào vi khuẩn (J.P.Aubert, 1/1983), cải biến E. coli để sản xuất L-aspartat (hãng
Tanabe, Nhật 1985), ghép gen vào xạ khuẩn S. violacconiger để cải tiến việc sản sinh
enzyme glucoisomerase (hãng Roquette và Cayla, 1985), ngoài ra còn tạo được các
giống vi sinh vật biến đổi gen có khả năng ăn cặn dầu dùng trong xử lý các phế thải có
độc tố nhằm bảo vệ môi sinh. Bên cạnh việc tạo ra giống nấm men mới có thể giết chết
các vi khuẩn xuất hiện trong bia (hãng Suntory, 1985), còn tạo được chủng nấm men sản
xuất insulin và interferon (Kimura, 1986) v.v.
Ứng dụng trong khoa học hình sự và các vấn đề xã hội khác
Kỹ thuật di truyền còn được ứng dụng rất hiệu quả trong các ngành hình pháp học, chẳng
hạn bằng cách sử dụng kỹ thuật 'dấu vân ADN' (ADN fingerprinting) thay cho 'dấu
vân tay' trước đây cho phép các ngành cảnh sát hình sự xác định chính xác các tội phạm
hoặc nhận dạng xác nạn nhân trong chiến tranh hoặc do tai nạn gây ra (Hình 8.18).

194
Hình 8.18. Dấu vân DNA (DNA finger-printing) có thể giúp các nhà nghiên
cứu xác định khả nghi trong trường hợp tội phạm.
6.4. CÁC CÔNG CỤ SỬ DỤNG TRONG LĨNH VỰC SINH HỌC PHÂN
TỬ

CÁC ENZYME GIỚI HẠN (RESTRICTION ENDONUCLEASE)


Công trình nghiên cứu đầu tiên của Daniel Nathan và Hamilton Smith
năm 1969 ở Haemophilus influenzae xác nhận các tế bào vi khuẩn là những hệ
thống chứa các enzyme sửa đổi và enzyme giới hạn Các enzyme đều có đối
tượng nhận biết là các đoạn trình tự ADN vật chủ và ADN ngoại lai, nhưng có
vai trò khác nhau. Các enzyme sửa đổi (methylase) đóng vai trò bảo vệ ADN
vật chủ bằng cách gắn thêm nhóm methyl ở một số bazơ nhất định trong đoạn
nhận biết hay đoạn đích (target sequence), trong khi các enzyme giới hạn
(restriction endonuclease) đóng vai trò vô hiệu hoá hoạt tính của các ADN lạ
bằng cách phân cắt ở các vị trí đặc thù.

19
Danh pháp và tính chất của các enzyme giới hạn:
- Các enzyme giới hạn chỉ phát hiện được ở các vi khuẩn vì vậy, tên gọi
của các enzyme giới hạn được biểu thị bằng ba hoặc bốn chữ cái viết tắt của vi
khuẩn mà từ đó enzyme được chiết xuất. Chữ cái đầu tiên được viết hoa để
chỉ chi (genus) và hai chữ cái tiếp theo viết thường để chỉ loài (species), và
nếu cần thêm chữ cái thứ tư để chỉ nòi hoặc chủng (strain, type). Ngoài ra, để
phân biệt các enzyme của cùng một nòi dùng thêm số La Mã kèm theo sau (xem
Bảng 8.1).
- Tính chất quan trọng nhất của các enzyme giới hạn là tính đặc hiệu vị trí,
nghĩa là chúng có thể nhận biết và cắt tại trình tự ADN đặc thù.
- Đoạn đích là có kích thước ngắn 4-8 cặp bazơ và có tính đối xứng xuôi
ngược (palindrome; Hình 8.5).
Các enzyme giới hạn khác nhau có hai kiểu cắt: cắt lệch và cắt thẳng
(Hình 8.6). Với kiểu cắt lệch, tạo ra các đoạn ADN có các đầu sợi đơn bổ
sung gọi là các đầu dính (cohesive/sticky ends); ví dụ EcoRI. Với kiểu cắt
thẳng, tức cắt cùng vị trí trên cả hai sợi của ADN sợi kép, tạo ra các đoạn ADN
có các đầu bằng (blunt ends); ví dụ AluI. 19

RE loại II RE loại III RE loại 1


Đặc điểm cấu Độc lập về chức Gồm 2 dưới đơn Gồm 3 dưới đơn vị
trúc protein năng endonuclease vị có chức năng có chức năng kép
và methylase kép

Vị trí nhận Thường vùng trình Trình tự bất đối Phân đôi và bất đối
biết (trình tự tự đối xứng dài 4- xứng dài 5-7bp xứng
nhận biết) 6bp

Vị trí cắt Gần hoặc Ở ngay Cắt ngẫu nhiên Không đặc hiệu có
tại vị trí nhận biết một khoảng 24- thể cách vị trí nhận
26bp ra khỏi vị biết > 1000bp
trí nhận biết

Khả năng cắt Hai kiểu phản ứng Xảy ra đồng thời Xảy ra đồng thời
giới hạn và độc lập
methyl hoá

Các vector thông dụng trong kỹ thuật di truyền


ADN tái tổ hợp (recombinant ADN) là phân tử ADN được tạo ra trong ống
nghiệm bằng cách kết hợp các ADN từ các nguồn khác nhau, theo một quy trình
kỹ thuật nhất định (gọi là kỹ thuật tái tổ hợp ADN).
Thông thường một phân tử ADN tái tổ hợp bao gồm một phân tử ADN có
bản chất là plasmid hoặc phage nguyên vẹn gọi là vector (Hình 8.7) và một
đoạn ADN từ nguồn khác mang một gen hoặc yếu tố điều hòa mong muốn được
cho xen vào gọi là ADN ngoại lai (foreign ADN).

19
Hình 8.7A. Cấu trúc của các plasmid pBR322 và pUC19. Lưu ý các vùng chứa
khởi điểm tái bản (Ori), các gen kháng thuốc (ampicillin, tetracyclin) và các
marker chọn lọc; đặc biệt đối với vector pUC19 cho thấy vị trí đa tạo dòng
(chứa nhiều vị trí cắt của các enzyme giới hạn – xem thêm ở Hình 8.7B). Với
vector pUC19, lacZ′ = gen β-galactosidase; lacI = gen ức chế của operon Lac.

Trong số các vector, các plasmid của vi khuẩn được sử dụng rộng rãi hơn cả,
nhờ có các đặc điểm sau: (i) Mỗi plasmid là một phân tử ADN sợi kép thường
ở dạng vòng và chỉ có một khởi điểm tái bản riêng; (ii) Có khả năng xâm nhập
vào tế bào vật chủ và hoạt động bình thường; (iii) Có kích thước bé, thường chỉ
vài ngàn cặp bazơ nên dễ dàng tinh chiết; (iv) Số bản sao trong mỗi tế bào vi
khuẩn thường khá cao; (v) Một số plasmid có chứa các gen kháng thuốc tiện
lợi cho việc theo dõi và phát hiện sự có mặt của plasmid tái tổ hợp trong vi khuẩn
chủ.

19

Hình 8.8. Các đầu dính của ADN lambda (a) và vector lambda có xen một vùng
ADN miễn dịch gt10 thông qua vết cắt của EcoRI.
Hình 8.9 Cấu trúc và sử dụng của nhiễm sắc thể nhân tạo của nấm men (YAC).
Chú thích: trp1, ura3 = các marker chọn lọc; cen/ars = centromere và trình tự
tái bản tự trị (autonomously replicating sequence = ARS), cho phép tái bản ở
S. cerevisiae; tel = telomere; để đơn giản, khởi điểm tái bản của E. coli và các
marker chọn lọc đối với E. coli không nêu ra ở đây.
c¸c polymerase
C¸c polymerase gåm hai nhãm:
- C¸c DNA polymerase xóc t¸c sù tæng hîp DNA, theo chiÒu 5'3'. PhÇn
lín c¸c DNA polymerase dïng mét b¶n mÉu lµ DNA ®Ó lµm khu«n cho sù tæng
hîp (DNA polymerase I, T4 DNA polymerase, Taq polymerase). Mét DNA
polymerase ®Æc biÖt lµ enzyme phiªn m· ng­îc (reverse transcriptase) l¹i sö dông
khu«n RNA ®Ó tæng hîp DNA. Sau cïng ph¶i kÓ ®Õn mét DNA polymerase kh«ng
tæng hîp m¹ch míi tõ khu«n mµ chØ thªm c¸c nucleotide vµo ®Çu cña mét ph©n
tö DNA cã s½n, ®ã lµ Termial transferase. C¸c DNA polymerase, ®Ó ho¹t ®éng,
cÇn mét måi (primer). Måi lµ mét ®o¹n DNA hay RNA ng¾n b¾t cÆp bæ sung víi
phÇn ®Çu cña khu«n, ®Ó tõ ®ã c¸c polymerase míi nèi dµi t¹o thµnh m¹ch bæ sung.
- C¸c RNA polymerase tham gia tæng hîp RNA, th«ng dông nhÊt lµ SP6, T7
vµ T3 RNA polymerase. 19

. DNA polymerase (DNA pol I)


Trong tù nhiªn, DNA pol I cã vai trß chñ yÕu trong c¬ chÕ söa sai khi sao
chÐp ë vi khuÈn. Ngoµi ho¹t tÝnh polymerase (tæng hîp) theo chiÒu 5'3', DNA
pol I cßn cã ho¹t tÝnh exonuclease (thuû gi¶i dÇn liªn kÕt gi÷a c¸c nucleotide tõ
®Çu ph©n tö DNA) theo chiÒu 5'3' vµ 3'5'.
C¸c øng dông chñ yÕu cña enzyme nµy lµ:
- X¸c ®Þnh tr×nh tù DNA b»ng ph­¬ng ph¸p c¸c dideoxynucleotide
- Tæng hîp mÉu dß cã ®é phãng x¹ cao
- X©y dùng c¸c vector tõ DNA m¹ch khu«n
Trong thùc tÕ, ng­êi ta Ýt sö dông DNA pol I mµ sö dông mét s¶n phÈm h×nh
thµnh tõ sù thuû ph©n nhÑ cña enzyme nµy: ®o¹n Klenow (Klenow fragment).
§o¹n Klenow cña DNA pol I gi÷ ®­îc ho¹t tÝnh polymerase vµ exonuclease
3'5', ®ång thêi mÊt ®i ho¹t tÝnh exonuclease 5'3' kh«ng mong muèn.
. T4 DNA polymerase
Enzyme nµy cã nguån gèc tõ phage T4 x©m nhiÔm vi khuÈn. Ho¹t tÝnh gièng
hÖt nh­ ho¹t tÝnh cña ®o¹n Klenow nh­ng do ho¹t tÝnh exonuclease 3'5' m¹nh
h¬n nªn ®­îc sö dông nhiÒu h¬n khi cÇn tæng hîp mÉu dß cã ®é phãng x¹ cao.
. Taq polymerase
Taq polymerase lµ mét enzyme chÞu nhiÖt, ®­îc t¸ch chiÕt tõ vi khuÈn suèi
n­íc nãng, Thermus aquaticus. Enzyme nµy kh«ng bÞ ph¸ huû ë nhiÖt ®é biÕn
tÝnh DNA vµ xóc t¸c tõ ®Çu ®Õn cuèi cho qu¸ tr×nh tæng hîp DNA trong ph¶n øng
PCR.
. Enzyme phiªn m· ng­îc (Reverse transcriptase)
Cïng víi c¸c enzyme giíi h¹n, enzyme phiªn m· ng­îc cã vai trß quyÕt ®Þnh
trong qu¸ tr×nh h×nh thµnh ngµnh sinh häc ph©n tö eukaryote. Enzyme nµy do c¸c
retrovirus s¶n sinh nh»m sao chÐp bé gen RNA cña chóng trong tÕ bµo kÝ chñ.
HiÖn nay, trªn thÞ tr­êng, enzyme phiªn m· ng­îc cã nguån gèc tõ AMV (avian
myeloblastosis virus) vµ th«ng dông h¬n lµ tõ MMLV (moloney murine leukemia
virus).
Enzyme phiªn m· ng­îc, nh­ tªn gäi cña nã, tæng hîp nªn mét m¹ch DNA
bæ sung (cDNA - complementary DNA) tõ khu«n RNA theo chiÒu 5'3', khi cã
mÆt cña måi. 20

C¸c øng dông chñ yÕu lµ:


- ThiÕt lËp ng©n hµng cDNA
- TiÕn hµnh ph¶n øng PCR trªn mRNA
- X¸c ®Þnh tr×nh tù cña nucleic acid b»ng ph­¬ng ph¸p sö dông c¸c
dideoxynucleotide.
. Terminal transferase
Enzyme nµy ®­îc ly trÝch tõ tuyÕn øc cña bª. Terminal transferase xóc t¸c
ph¶n øng g¾n c¸c deoxynucleotide vµo ®Çu 3'OH tù do cña ph©n tö DNA. Sù g¾n
nµy mang tÝnh ngÉu nhiªn nªn thµnh phÇn nucleotide cña chuçi polynucleotide
míi h×nh thµnh hoµn toµn phô thuéc nång ®é cña 4 lo¹i nucleotide cã trong ph¶n
øng.
Enzyme nµy ®­îc sö dông khi cÇn:
- Thªm ®u«i polynucleotide (tailing) ®Ó t¹o ®Çu sole (xem phÇn RE) cho
ph©n tö DNA, dïng trong t¹o dßng.
- §¸nh dÊu ®Çu 3'OH cña c¸c DNA trong ph­¬ng ph¸p x¸c ®Þnh tr×nh tù
nucleic acid theo Maxam vµ Gilbert.
C¸c RNA polymerase
Ba lo¹i RNA polymerase ®­îc sö dông nhiÒu nhÊt trong sinh häc ph©n tö lµ
SP6 RNA polymerase cã nguån gèc tõ phage x©m nhiÔm Salmonella
typhimurium, T3 vµ T7 RNA polymerase cã nguån gèc tõ phage x©m nhiÔm
Escherichia coli.
C¸c enzyme nµy xóc t¸c sù tæng hîp RNA tõ mét m¹ch cña ph©n tö DNA
m¹ch ®«i theo chiÒu 5'3'. Qu¸ tr×nh tæng hîp kh«ng cÇn måi nh­ng khu«n DNA
ph¶i cã mang mét promoter ®Æc tr­ng cña phage. Ng­êi ta th­êng dïng c¸c
enzyme nµy ®Ó t¹o mét l­îng lín RNA tõ mét tr×nh tù DNA ®­îc nèi ngay sau
promoter thÝch hîp.
Chóng th­êng ®­îc sö dông ®Ó:
- Tæng hîp mÉu dß RNA ®¸nh dÊu phãng x¹ hay ho¸ häc.
- X¸c ®Þnh tr×nh tù cña mét DNA ®­îc dßng ho¸ trong mét vector cã mang
c¸c promoter ®Æc tr­ng cho phage SP6, T3, T7.
- Nghiªn cøu b¶n phiªn m· RNA cña mét DNA ®· ®­îc dßng ho¸. Trong
tr­êng hîp nµy, c¸c RNA polymerase cã gi¸ trÞ cao v× RNA20 lµ nh÷ng ph©n tö kÐm
bÒn v÷ng, rÊt khã thu nhËn ®­îc d­íi d¹ng tinh khiÕt víi hµm l­îng cao b»ng c¸c
kü thuËt cæ ®iÓn. Nhê c¸c RNA polymerase, ng­êi ta cã thÓ tæng hîp mét sè l­îng
RNA lín tõ mét DNA ®­îc dßng ho¸, dïng trong c¸c nghiªn cøu vÒ cÊu tróc,
®iÒu hoµ vµ c¸c mèi t­¬ng t¸c cña RNA.
. c¸c ligase
§©y lµ c¸c enzyme xóc t¸c sù h×nh thµnh liªn kÕt nèi hai ®o¹n DNA (DNA
ligase) hay RNA (RNA ligase). Trong kü thuËt t¹o dßng (lÜnh vùc øng dông quan
träng nhÊt cña c¸c ligase), chóng th­êng ®­îc sö dông kÕt hîp víi hai enzyme
kh¸c lµ T4 polynucleotide kinase vµ Alkaline phosphatase, nªn hai enzyme nµy
sÏ ®­îc ®Ò cËp ngay sau c¸c ligase.
2.2.1. E. coli DNA ligase
Enzyme ®­îc ly trÝch tõ E.coli vµ xóc t¸c cho ph¶n øng nèi hai tr×nh tù DNA
cã ®Çu so le.
5'ACGG + TAATCGCCA3'

3'TGCCATTA GCGGT5'

E.coli DNA ligase

2.2.2. T4 DNA ligase


Cã nguån gèc tõ phage T4 x©m nhiÔm E. coli. Enzyme nµy cã cïng chøc
n¨ng víi ligase trÝch tõ E. coli nh­ng ®Æc biÖt cßn cã kh¶ n¨ng nèi hai tr×nh tù
DNA ®Çu b»ng nªn lµ ligase ®­îc chuéng nhÊt trong kü thuËt t¹o dßng.
. T4 RNA ligase
Enzyme ®­îc li trÝch tõ phage T4 x©m nhiÔm E. coli, xóc t¸c cho sù nèi hai
tr×nh tù RNA b»ng liªn kÕt phosphodiester.
Do c¬ chÊt tèi thÝch cho enzyme lµ c¸c ph©n tö nhá (vÝ dô: nh­ mét
polynucleotide) nªn T4 RNA ligase th­êng ®­îc sö dông ®Ó ®¸nh dÊu phãng x¹
®Çu 3' cña c¸c ph©n tö RNA dïng lµm mÉu dß ph©n tö (probe).
. T4 polynucleotide kinase
Cã nguån gèc tõ phage T4 x©m nhiÔm E. coli. Enzyme xóc t¸c cho sù chuyÓn
nhãm γ-phosphate cña ATP cho ®Çu 5' cña DNA hay RNA. Tuú ®iÒu kiÖn thùc
20
nghiÖm cã thÓ x¶y ra hai kiÓu ph¶n øng: (1) nhãm γ-phosphate ®­îc chuyÓn ®Õn
®Çu 5' cña mét DNA ®· mÊt nhãm phosphate; (2) khi cã mét l­îng thõa ADP,
ph¶n øng mang tÝnh thuËn nghÞch, DNA chuyÓn nhãm phosphate cho ADP vµ
nhËn nhãm γ-phosphate (th­êng cã ®¸nh dÊu phãng x¹) tõ mét ph©n tö
[γ-32P]ATP. Enzyme cßn cã ho¹t tÝnh phosphatase.
C¸c øng dông chÝnh cña enzyme nµy lµ:
- §¸nh dÊu phãng x¹ ®Çu 5' cña DNA trong c¸c kü thuËt x¸c ®Þnh tr×nh tù
cña DNA theo ph­¬ng ph¸p Maxam vµ Gilbert, dïng lµm mÉu dß ph©n tö trong
c¸c kü thuËt lai ...
- Phosphoryl ho¸ c¸c tr×nh tù DNA kh«ng cã nhãm phosphate ®Çu 5' ®Ó
chuÈn bÞ cho ph¶n øng nèi (ligation) trong ph­¬ng ph¸p t¹o dßng.
. Alkaline phosphate
§­îc li trÝch tõ E. coli hay tõ ruét bª, enzyme xóc t¸c sù lo¹i bá nhãm 5'
phosphate cña DNA, RNA vµ c¸c nucleotide tù do. Enzyme nµy ®­îc dïng ®Ó:
- Lo¹i nhãm 5' phosphate cña DNA hay RNA tr­íc khi ®¸nh dÊu phãng x¹
®Çu 5' cña chóng b»ng 32P (xem T4 polynucleotide kinase).
- Lo¹i nhãm 5' phosphate trªn c¸c tr×nh tù DNA. Trong kü thuËt t¹o dßng,
khi mét vector ®­îc "më ra" b»ng mét RE råi ®­îc lo¹i nhãm 5' phosphate th× nã
kh«ng thÓ tù nèi l¹i. ChØ khi cã mét DNA l¹ cã mang c¸c ®Çu 5' phosphate cÇn
thiÕt ®­îc ®­a vµo th× ph¶n øng nèi míi x¶y ra gi÷a vector vµ DNA l¹.
T4 polynucleotide kinase vµ alkaline phosphatase th­êng ®­îc sö dông ®ång
thêi trªn vector vµ ®o¹n DNA cÇn g¾n xen trong kü thuËt t¹o dßng.
. c¸c nuclease
§©y lµ nhãm c¸c enzyme ph©n c¾t DNA (DNase) vµ RNA (RNase). C¸c RE
mµ chóng ta ®· xem ë phÇn tr­íc còng lµ nh÷ng nuclease nh­ng mang tÝnh chuyªn
biÖt tr×nh tù cao h¬n. C¸c nuclease chÝnh bao gåm c¸c enzyme sau ®©y:
. DNase I
Enzyme cã nguån gèc tõ tuþ t¹ng bß xóc t¸c cho ph¶n øng thuû gi¶i liªn kÕt
n»m ngay sau mét pyrimidine trªn chuçi DNA m¹ch ®¬n hay m¹ch ®«i. Trong
tr­êng hîp cña DNA m¹ch ®«i, chç c¾t cã thÓ x¶y ra trªn mét hay trªn c¶ hai
m¹ch.
C¸c øng dông chÝnh cña enzyme nµy lµ:
- Lo¹i DNA t¹p nhiÔm trong c¸c ph©n ®o¹n RNA hay 20
protein.
- T¹o c¸c "chç ®øt" (nick) trªn DNA trong kü thuËt ®¸nh dÊu mÉu dß kiÓu
Nick translation.
- Ph¸t hiÖn c¸c gen ho¹t ®éng trªn nhiÔm s¾c chÊt. Nh­ ®· ®Ò cËp ë trªn,
DNase ë nång ®é thÊp cã kh¶ n¨ng ph©n huû c¸c gen ®ang hay ®· tõng ho¹t ®éng,
®Æc biÖt lµ c¸c vÞ trÝ siªu nh¹y c¶m n»m trong c¸c phÇn ®­îc phiªn m· m¹nh nhÊt
cña nhiÔm s¾c chÊt.
Nuclease S1
Enzyme ®­îc li trÝch tõ Aspergillus oryzae, cã kh¶ n¨ng ph©n huû c¸c DNA
m¹ch ®¬n. DNA m¹ch ®«i, ph©n tö lai DNA:RNA kh«ng bÞ enzyme ph©n c¾t, trõ
nh÷ng ®o¹n m¹ch ®¬n trªn ph©n tö nµy.
Do ®ã, enzyme th­êng ®­îc sö dông ®Ó:
- Ph©n tÝch cÊu tróc cña c¸c ph©n tö lai DNA:RNA.
- Lo¹i bá c¸c phÇn m¹ch ®¬n cña mét ®Çu so le trªn ph©n tö DNA (sau khi
®­îc c¾t bëi mét RE t¹o ®Çu sole) ®Ó t¹o ®Çu b»ng.
- Lo¹i bá cÊu tróc bËc hai (c¸c nót vßng) trªn ph©n tö RNA trong qu¸ tr×nh
phiªn m· ng­îc t¹o cDNA
Mét enzyme cã ho¹t tÝnh t­¬ng tù lµ Mung bean nuclease (®­îc trÝch tõ mÇm
h¹t ®Ëu).
. Exonuclease III
Enzyme ®­îc t¸ch chiÕt tõ E. coli, xóc t¸c cho ph¶n øng thuû gi¶i tuÇn tù
c¸c nucleotide tõ ®Çu 3' OH tù do cña mét DNA, theo chiÒu 3'5'. KÕt qu¶ lµ
h×nh thµnh nªn mét vïng m¹ch ®¬n dµi trªn DNA m¹ch ®«i. Enzyme cßn cã c¸c
ho¹t tÝnh 3' phosphatase, RNase H.
C¸c øng dông chñ yÕu cña exonuclease III lµ:
- T¹o c¸c cÊu tróc m¹ch ®¬n ë mét sè vïng trªn ph©n tö DNA dïng lµm c¬
chÊt cho ®o¹n Klenow cña DNA polymerase I (®Ó s¶n xuÊt mÉu dß ®Æc tr­ng cho
tõng m¹ch).
- T¹o ra nh÷ng ®ét biÕn "mÊt ®o¹n" t¹i nh÷ng vïng ®Æc biÖt trªn DNA khi
phèi hîp víi nuclease S1.
Mét exonuclease cã ho¹t tÝnh t­¬ng tù lµ nuclease BAL31, cã ho¹t tÝnh
20
exonuclease 5'3' vµ 3'5', cã kh¶ n¨ng t¹o c¸c DNA m¹ch ®«i ®Çu b»ng kh«ng
cÇn sù hiÖn diÖn cña nuclease S1.
. RNase A
§©y lµ mét enzyme cã ho¹t tÝnh rÊt cao, hiÖn diÖn ë mäi n¬i vµ cùc k× bÒn
v÷ng (kh«ng bÞ mÊt ho¹t tÝnh khi bÞ xö lÝ ë 900C trong 1 giê). Enzyme th­¬ng m¹i
ho¸ ®­îc li trÝch tõ tuþ bß.
RNase A c¾t mét c¸ch ®Æc tr­ng liªn kÕt phosphodiester n»m ngay sau mét
pyrimidine cña mét RNA m¹ch ®¬n.
Enzyme nµy ®­îc dïng ®Ó:
- Lo¹i bá RNA trong c¸c chÕ phÈm DNA hay protein.
- Lo¹i bá c¸c vïng kh«ng b¾t cÆp trªn RNA trong ph©n tö lai RNA:DNA.
. RNase H
Enzyme nµy cã kh¶ n¨ng lo¹i bá RNA trong mét ph©n tö lai RNA:DNA vµ
th­êng ®­îc dïng ®Ó lo¹i bá RNA sau ph¶n øng phiªn m· ng­îc ®Ó tiÕp tôc tæng
hîp m¹ch thø hai cña cDNA h×nh thµnh mét DNA m¹ch ®«i.
Ngoµi ra, ng­êi ta cßn sö dông mét sè RNase vµo nh÷ng ph¶n øng ®Æc tr­ng
nh­: RNase III vµ V1 c¾t RNA m¹ch ®«i, RNase T1 c¾t ngay sau G, RNase U2
®Æc tr­ng cho A, RNase T2 ®Æc tr­ng cho AGCU ....

TÀI LIỆU THAM KHẢO


[1]. Hồ Huỳnh Thuỳ Dương (2005), Sinh học phân tử, NXB Giáo dục.
(Sách, giáo trình chính trong giảng dạy và học tập thường chiếm 50% nội dung
sử dụng trở lên)
6.2. Danh mục tài liệu tham khảo
[2]. Võ Thị Thương Lan (2005), Sinh học phân tử, NXB Đại học Quốc gia
Hà Nội.
[3]. Harvey Lodish, et al (2013), Molecular cell Biology, 7 th ed., Printed in
the United States of America.
[4]. Peter J. Russell (2010), iGenetics – a molecular approach, Peason
Education Inc, USA.
[5] James D. Watson, et al (2014), Molecular Biology of the Gene, 7th,
Pearson Education Inc, USA.
20

You might also like