You are on page 1of 38

Ch−¬ng 10

di truyÒn häc ph©n tö vµ tiÕn hãa


N¨m 1859, Charles Darwin c«ng bè t¸c phÈm “Nguån gèc c¸c loµi” vµ ®−îc coi lµ
thuyÕt tiÕn hãa quan träng bËc nhÊt ®Õn nay. Trong 6 n¨m (1931 - 1936), Darwin ®· ®i
cïng ®oµn th¸m hiÓm cña Beagle vµ thu thËp ®−îc nhiÒu sè liÖu, h×nh ¶nh, mÉu hãa
th¹ch cña c¸c loµi ®éng, thùc vËt tõ nhiÒu vïng ®Þa lý kh¸c nhau trªn Tr¸i ®Êt. Sau nµy,
«ng sö dông nhiÒu n¨m ®Ó so s¸nh, ph©n tÝch c¸c sè liÖu vµ mÉu vËt. Trªn c¬ së c¸c
nghiªn cøu cña m×nh, Darwin lµ ng−êi ®Çu tiªn ®−a ra nhËn ®Þnh r»ng “tÊt c¶ c¸c d¹ng
sèng ®· vµ ®ang tån t¹i trªn Tr¸i ®Êt cã lÏ ®Òu xuÊt ph¸t tõ mét tæ tiªn nguyªn thñy nµo
®ã” vµ “mçi loµi sinh vËt kh«ng bÊt biÕn mµ c¸c quÇn thÓ cña chóng biÕn ®æi dÇn dµ liªn
tôc qua thêi gian lµ nguyªn nh©n dÉn ®Õn sù h×nh thµnh c¸c loµi míi d−íi t¸c ®éng cña
chän läc tù nhiªn”. §ã còng chÝnh lµ nh÷ng néi dung c¬ b¶n cña ThuyÕt tiÕn hãa Darwin.
Dï ngay trong ngµy ®Çu c«ng bè, t¸c phÈm cña «ng víi 1250 b¶n in ®· ®−îc b¸n hÕt,
nh−ng thùc tÕ lý thuyÕt mµ Darwin ®−a ra lóc ®ã ®· g©y nªn nhiÒu hoµi nghi.
§Õn nay, dï ®· trßn 150 n¨m kÓ tõ ngµy t¸c phÈm “Nguån gèc c¸c loµi” ®−îc c«ng
bè, thuyÕt tiÕn hãa Darwin vÉn ®−îc xem lµ mét lý thuyÕt c¬ b¶n cña sinh häc hiÖn ®¹i.
Tuy vËy, tõ n¨m 1953 khi Watson vµ Crick lµm s¸ng tá cÊu tróc cña vËt chÊt di truyÒn
(ADN), c¸c nghiªn cøu di truyÒn häc ph©n tö ®· “bïng næ” vµ bæ sung ngµy cµng ®Çy ®ñ
h¬n c¸c c¬ së khoa häc cho thÊy sù tiÕn hãa thùc chÊt b¾t ®Çu tõ cÊp ph©n tö, mµ cô thÓ
lµ tõ bªn trong c¸c chuçi xo¾n kÐp ADN (ë hÇu hÕt sinh vËt) vµ ARN (ë mét sè virut).
Trong ch−¬ng nµy, chóng ta sÏ ®Ò cËp ®Õn mét sè néi dung c¬ b¶n cña TiÕn hãa ph©n tö.

10.1. Sù gièng nhau trong hÖ gen hÇu hÕt c¸c loµi ®éng vËt
ViÖc so s¸nh hÖ gen gi÷a c¸c loµi ®éng vËt trong thêi gian gÇn ®©y ®−a ®Õn mét
nhËn ®Þnh chung næi bËt lµ c¸c loµi ®éng vËt cã phÇn lín gen gièng nhau. C¶ ba hÖ gen
®éng vËt cã x−¬ng sèng (§VCXS) ®· ®−îc gi¶i tr×nh tù hoµn chØnh, gåm c¸ nãc (Fugu
rubripes), chuét (Mus musculus) vµ ng−êi (Homo sapiens) ®Òu chøa kho¶ng 20.000 –
25.000 gen. Trõ mét vµi ngo¹i lÖ, hÇu hÕt c¸c gen ®−îc t×m thÊy ë ng−êi ®Òu cã “b¶n sao”
t−¬ng øng ë chuét. Nãi c¸ch kh¸c, hÇu nh− kh«ng cã mét “ph¸t minh” nµo míi trong
kho¶ng 50 triÖu n¨m kÓ tõ khi chuét vµ ng−êi t¸ch li tiÕn hãa tõ tæ tiªn chung. T−¬ng tù
nh− vËy, hÖ gen ng−êi vµ c¸ nãc cïng së h÷u mét l−îng lín c¸c gen gièng nhau ®−îc h×nh
thµnh tõ kho¶ng 400 triÖu n¨m tr−íc. Mét ®iÒu ng¹c nhiªn lµ sè gen trong hÖ gen ng−êi
vµ c¸ nãc gÇn t−¬ng ®−¬ng nhau, trong ®ã 3/4 sè gen cña hai loµi t−¬ng ®ång víi nhau.
Sù b¶o thñ trong hÖ gen c¸c loµi §VCXS thËm chÝ cßn më réng ®Õn mét sè loµi kh¸c
thuéc ngµnh d©y sèng, nh− søa biÓn Ciona intestinalis. Mét nöa sè gen trong hÖ gen loµi
søa nµy ®−îc t×m thÊy ë c¸c loµi §VCXS vµ tæ tiªn chung cña chóng ph©n li kho¶ng 500
triÖu n¨m tr−íc. C¸c nghiªn cøu di truyÒn gÇn ®©y cho thÊy, viÖc t¨ng sè l−îng c¸c gen ë
§VCXS chñ yÕu lµ do sù lÆp l¹i cña c¸c gen vèn ®· cã s½n tõ thêi kú xuÊt hiÖn tæ tiªn
chung cña §VCXS vµ søa biÓn. Ch¼ng h¹n, søa biÓn cã 6 gen m· hãa yÕu tè t¨ng tr−ëng
nguyªn bµo sîi FGF. Mçi gen nµy ®−îc lÆp l¹i trung b×nh kho¶ng 4 lÇn ë c¸c hÖ gen ®éng
vËt cã vó nãi chung; trong ®ã, c¸c hÖ gen chuét vµ ng−êi chøa Ýt nhÊt 22 gen FGF. Sù b¶o
thñ trong hÖ gen c¸c loµi thuéc ngµnh d©y sèng cßn më réng tíi c¸c ngµnh kh¸c. HÖ gen
cña ba loµi ®éng vËt thuéc liªn ngµnh ®éng vËt lét x¸c (Ecdysozoa) lµ giun trßn, ruåi
giÊm vµ muçi, ®· ®−îc gi¶i tr×nh tù hoµn chØnh. KÕt qu¶ so s¸nh hÖ gen cña chóng cho
thÊy: hÖ gen mçi loµi ®Òu chøa kho¶ng 15.000 gen, t−¬ng ®−¬ng víi hÖ gen cña søa biÓn.
285
§inh §oµn Long

Sù t¨ng lªn vÒ sè l−îng gen ë §VCXS t−¬ng ®ång víi c¸c loµi ®éng vËt lét x¸c nªu trªn
còng chñ yÕu lµ do sù lÆp l¹i cña c¸c gen chø kh«ng ph¶i do sù h×nh thµnh c¸c gen míi.
Mét c©u hái ®Æt ra lµ: b»ng c¸ch nµo sù lÆp l¹i cña c¸c gen l¹i t¹o ®−îc sù ®a d¹ng
phong phó ë ®éng vËt nh− chóng ta thÊy hiÖn nay? Cã hai c¸ch gi¶i thÝch ®iÒu nµy:
- Theo c¸ch thø nhÊt, gen nguyªn thñy qua nhiÒu lÇn nh©n ®«i (lÆp l¹i) t¹o nªn
nhiÒu b¶n sao kh¸c nhau. Sau ®ã, vïng m· hãa cña c¸c b¶n sao nµy bÞ ®ét biÕn,
dÉn ®Õn sù thay ®æi ho¹t tÝnh hoÆc ®«i chót vÒ chøc n¨ng gen. Trong nhiÒu
tr−êng hîp, kiÓu thay ®æi nµy kh«ng nhÊt thiÕt dÉn ®Õn sù h×nh thµnh c¸c gen
cã chøc n¨ng hoµn toµn míi. Thay vµo ®ã, nã th−êng t¹o nªn c¸c lo¹i protein cã
chøc n¨ng liªn quan tíi nhau, chØ kh¸c nhau chñ yÕu vÒ ho¹t tÝnh hoÆc ho¹t lùc.
- Theo c¸ch thø hai, c¸c gen sau khi ®−îc lÆp l¹i còng bÞ ®ét biÕn nh−ng kh«ng
liªn quan ®Õn vïng m· hãa. Thay vµo ®ã, nã ®−îc tæ hîp víi c¸c tr×nh tù ADN
®iÒu hßa míi (hoÆc tr×nh tù ®iÒu hßa cò bÞ biÕn ®æi ®i). Qua ®ã, c¸c b¶n sao
kh¸c nhau cña gen ®−îc biÓu hiÖn theo c¸ch míi trong qu¸ tr×nh ph¸t triÓn c¸
thÓ ë mçi loµi.
VÝ dô ë gen FGF cña §VCXS nªu trªn, víi 22 b¶n sao cã trong tÕ bµo, c¸ch biÓu
hiÖn cña gen nµy ë c¸c loµi §VCXS ®a d¹ng h¬n nhiÒu so víi khi nã chØ cã mét b¶n sao
duy nhÊt ë ruåi Drosophila. NÕu nh− ë c¬ quan h« hÊp trong qu¸ tr×nh ph¸t triÓn ph«i
cña c¶ ruåi giÊm vµ §VCXS, gen FGF ®Òu ®−îc biÓu hiÖn; th× ë §VCXS, gen nµy cßn
®−îc biÓu hiÖn ë ch©n, trong khi ë ruåi giÊm th× kh«ng. Nh− vËy, ë ®©y, sù “tiÕn hãa” cña
c¸c tr×nh tù ®iÒu hßa cã vai trß quyÕt ®Þnh vµ lµm thay ®æi c¸ch biÓu hiÖn cña c¸c b¶n sao
kh¸c nhau cña cïng mét gen ë c¸c m«, c¬ quan kh¸c nhau; còng nh− lµ kh¸c nhau ë c¸c
loµi kh¸c nhau.
Víi hai c¸ch tiÕn hãa nªu trªn, chóng ta thÊy: sù ®a d¹ng sinh häc cã thÓ ®−îc t¹o
ra tõ sù lÆp l¹i cña c¸c gen. Theo c¸ch thø nhÊt, chøc n¨ng cña gen ®−îc c¶i biÕn ®«i chót
bëi c¸c ®ét biÕn trong vïng m· hãa gen. Cßn theo c¸ch thø hai, c¸c b¶n sao kh¸c nhau
cña gen ®−îc biÓu hiÖn theo c¸ch kh¸c nhau ë c¸c c¬ quan kh¸c nhau trªn cïng c¬ thÓ.
Víi mét sè gen, ng−êi ta thÊy c¶ hai c¬ chÕ nµy cïng ho¹t ®éng. VÝ dô nh− ë côm gen m·
hãa globin cña ng−êi, sù lÆp l¹i cña c¸c gen kh«ng chØ t¹o nªn sù ®a d¹ng vÒ chøc n¨ng
cña c¸c lo¹i globin kh¸c nhau, mµ c¸ch biÓu hiÖn cña chóng còng kh¸c nhau. TÊt c¶ c¸c
protein do c¸c gen globin m· hãa ®Òu cã chøc n¨ng (trong hemoglobin) liªn kÕt vµ vËn
chuyÓn oxy. Tuy nhiªn, mçi lo¹i globin kh¸c nhau vÒ ¸i lùc liªn kÕt víi oxy vµ chóng ®−îc
biÓu hiÖn vµo c¸c giai ®o¹n kh¸c nhau cña qu¸ tr×nh ph¸t triÓn c¬ thÓ. H×nh 10.1 minh

C¸c loµi c¸ mËp


β (c¸ mËp)
L−ìng c− vµ chim
β (gµ)
Gen β
Thó ®¬n huyÖt
§éng vËt cã x−¬ng sèng β (r¸i c¸)
gen ε
gen γ ε (ng−êi)
γ (ng−êi)
Thó cã gen “γ”
§éng vËt
guèc "γ" (bß)
cã vó
β (bß)
gen δ-globin
Thó cã Linh tr−ëng δ (ng−êi)
nhau thai β (ng−êi)
β (khØ rezut)

H×nh 10.1. Sù lÆp l¹i c¸c gen thuéc hä gen β-globin trong qu¸ tr×nh tiÕn hãa ë ®éng vËt cã x−¬ng sèng
(theo Griffiths et al, 2000, An Introduction to genetic analysis, tr.787)

286
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

häa sù tiÕn hãa c¸c gen β-globin. ë ng−êi, bèn gen cã liªn quan ®Õn β-globin ®−îc h×nh
thµnh theo c¬ chÕ lÆp l¹i, gåm ε-, γ-, δ- vµ β-globin. Bèn gen nµy kh¸c nhau ®«i chót vÒ
c¸ch biÓu hiÖn vµ cÊu tróc cña protein mµ chóng m· hãa. C¸c chuçi ε- vµ γ-globin cã ¸i
lùc víi oxy lín h¬n δ vµ β. Nh÷ng chuçi nµy ®−îc tæng hîp vµ sö dông trong giai ®o¹n bµo
thai (lµ lóc mµ chøc n¨ng phæi ch−a ®Çy ®ñ vµ sù hÊp thu khÝ oxy cña bµo thai chñ yÕu
qua m¸u cña mÑ). C¸c chuçi δ- vµ β-globin liªn kÕt víi oxy víi ¸i lùc thÊp h¬n, ®−îc tæng
hîp ë giai ®o¹n s¬ sinh vµ tr−ëng thµnh. Nh− vËy, víi c¸c gen m· hãa globin, sù “tiÕn
hãa” trong tr×nh tù m· hãa còng nh− trong tr×nh tù ®iÒu hßa cña c¸c gen ®Òu gãp phÇn
vµo sù chuyªn hãa cña c¸c lo¹i chuçi globin kh¸c nhau ®−îc t¹o ra ë §VCXS.
Nh−ng, cÇn kh¼ng ®Þnh r»ng sù tiÕn hãa cña c¸c sinh vËt nãi chung ®Ó cã ®−îc sù
®a d¹ng nh− ngµy nay kh«ng nhÊt thiÕt ph¶i th«ng qua sù lÆp l¹i cña c¸c gen. Cô thÓ lµ,
trong tÊt c¶ c¸c c¬ thÓ sèng, vi khuÈn cã hÖ gen ®a d¹ng nhÊt vµ chóng cã kh¶ n¨ng sèng
trong nh÷ng ®iÒu kiÖn m«i tr−êng rÊt kh¸c nhau. C¸c vi khuÈn ®¬n gi¶n nhÊt h×nh
thµnh c¸ch ®©y kho¶ng 3 tØ n¨m, trong khi c¸c loµi ®éng vËt cæ x−a nhÊt h×nh thµnh c¸ch
®©y kho¶ng trªn d−íi 500 triÖu n¨m. §Æc ®iÓm tiÕn hãa nhanh cña hÖ gen vi khuÈn, cïng
víi lÞch sö tiÕn hãa l©u dµi cña chóng ®· gióp chóng cã ®−îc nhiÒu c¬ chÕ trao ®æi chÊt
kh¸c nhau. Nhê vËy, chóng sèng ®−îc ë nhiÒu m«i tr−êng sèng rÊt kh¸c nhau. Mét sè vi
khuÈn cã kh¶ sèng ®−îc trong m«i tr−êng nhiÖt ®é cao ë gÇn c¸c miÖng nói löa n»m s©u
d−íi ®¸y biÓn, mét sè kh¸c cã thÓ sèng ë c¸c suèi n−íc nãng cã hµm l−îng l−u huúnh (S)
cao. Sè l−îng gen vµ lo¹i gen (chuyªn hãa vÒ chøc n¨ng) trong hÖ gen cña c¸c loµi vi
khuÈn kh¸c nhau lµ rÊt kh¸c nhau. C¸c vi khuÈn ®¬n gi¶n nhÊt (mycoplasma) chØ cã
kho¶ng 500 gen, trong khi nh÷ng vi khuÈn phøc t¹p nhÊt (nh− Streptomyces) cã trªn
7000 gen. Nh− vËy, sù kh¸c biÖt vÒ sè l−îng gen trong hÖ gen c¸c loµi vi khuÈn lªn ®Õn
hµng chôc lÇn. §iÒu nµy lµ kh¸c víi c¸c hÖ gen ®éng vËt vèn cã sè gen kh¸c biÖt tèi ®a chØ
kho¶ng 2 lÇn. ë vi khuÈn, thËm chÝ c¸c loµi cã quan hÖ gÇn còng cã møc ®é kh¸c biÖt lín
vÒ hÖ gen. Ch¼ng h¹n, vi khuÈn Staphococcus vµ E. coli t¸ch ra tõ tæ tiªn chung c¸ch ®©y
kho¶ng 50 triÖu n¨m, tøc lµ t−¬ng ®−¬ng víi thêi gian ph©n li gi÷a tæ tiªn cña ng−êi vµ
chuét. Nh−ng, c¸c gen m· hãa protein cña hai vi khuÈn nµy chØ gièng nhau 75%, cßn 25%
sè gen cßn l¹i cña chóng lµ ®Æc thï vµ kh«ng cã ë loµi kia.
Nh− vËy, nÕu nh− ®éng vËt vèn cã m«i tr−êng sèng h¹n chÕ vµ c¸c con ®−êng trao
®æi chÊt gièng nhau vµ sù ®a d¹ng kiÓu h×nh cña chóng cã xu h−íng phô thuéc vµo sù lÆp
l¹i vµ thay ®æi ho¹t tÝnh (chø kh«ng ph¶i chøc n¨ng) cña c¸c “tæ hîp” gen vèn cã; th×,
ng−îc l¹i, hÖ gen cña c¸c loµi vi khuÈn cã møc ®é t−¬ng ®ång rÊt thÊp. D−êng nh− ®Ó tån
t¹i vµ ph¸t triÓn ®−îc trong c¸c m«i tr−êng sèng kh¸c nhau, sù h×nh thµnh c¸c gen míi
(vÒ chøc n¨ng) gi÷ vai trß quyÕt ®Þnh.

10.2. C¸c con ®−êng thay ®æi sù biÓu hiÖn cña gen trong tiÕn hãa
C¸c gen ®−îc thay ®æi c¸ch ®iÒu hßa biÓu hiÖn trong qu¸ tr×nh tiÕn hãa nh− thÕ
nµo? ë ch−¬ng 5, chóng ta ®· biÕt, hÖ gen cña mäi sinh vËt ®Òu chøa c¸c gen m· hãa
protein cã vai trß ®iÒu khiÓn sù biÓu hiÖn cña c¸c gen kh¸c trong hÖ gen, gäi lµ c¸c gen
®iÒu hßa. PhÇn lín c¸c protein do c¸c gen nµy m· hãa lµ c¸c yÕu tè ®iÒu hßa phiªn m·,
nh−ng còng cã mét sè protein t¸c ®éng vµo c¸c b−íc kh¸c cña qu¸ tr×nh biÓu hiÖn gen (tõ
phiªn m· ®Õn sau dÞch m·). Mét nhãm gen ®iÒu hßa ®−îc t×m thÊy gÇn ®©y ®−îc gäi lµ
“c¸c gen quy ®Þnh kiÓu biÓu hiÖn”. Sù thay ®æi vÒ ho¹t tÝnh còng nh− kiÓu biÓu hiÖn cña
nh÷ng gen nµy trong qu¸ tr×nh tiÕn hãa ®· dÉn ®Õn sù thay ®æi c¸c ®Æc ®iÓm ph¸t sinh
h×nh th¸i vµ ph¸t triÓn ë ®éng vËt. Chøc n¨ng ®Æc thï cña nh÷ng gen thuéc nhãm nµy lµ
®iÒu khiÓn sù h×nh thµnh chÝnh x¸c c¸c cÊu tróc trong qu¸ tr×nh ph¸t triÓn c¬ thÓ. Nªn,
nÕu nh÷ng gen nµy ho¹t ®éng kh«ng chÝnh x¸c, th× c¸c cÊu tróc c¬ thÓ cã thÓ ®−îc h×nh
thµnh sai vÞ trÝ. VÝ dô nh− ë ruåi giÊm, mét gen quy ®Þnh kiÓu biÓu hiÖn kÝ hiÖu lµ Pax6

287
§inh §oµn Long

khi kh«ng biÓu hiÖn ®óng, dÉn ®Õn “®ét biÕn” h×nh thµnh m¾t ë ch©n. Trong phÇn sau,
chóng ta sÏ thÊy mét sè vÝ dô kh¸c n÷a.
Mét hÖ gen ®éng vËt trung b×nh chøa kho¶ng 1000 gen m· hãa c¸c protein ®iÒu hßa
kh¸c nhau. §Õn nay, ch−a cã sè liÖu vÒ sè l−îng c¸c “gen x¸c ®Þnh kiÓu biÓu hiÖn” cã mÆt
trong mçi hÖ gen. Nh−ng, chóng ®−îc xÕp lµ mét nhãm nhá cña c¸c gen ®iÒu hßa. §Ó x¸c
®Þnh ®−îc sè l−îng c¸c “gen quy ®Þnh kiÓu biÓu hiÖn”, cã lÏ ph¶i t¹o ra c¸c ®ét biÕn mang
c¸c gen ®iÒu hßa biÓu hiÖn sai, råi theo dâi c¸c bÊt th−êng xuÊt hiÖn trong qu¸ tr×nh ph¸t
sinh h×nh th¸i cña ®éng vËt. HiÖn nay, ng−êi ta −íc ®o¸n cã kho¶ng 10% gen ®iÒu hßa ë
®éng vËt cã thÓ lµ c¸c “gen quy ®Þnh kiÓu biÓu hiÖn”. NghÜa lµ, mét hÖ gen ®éng vËt trung
b×nh sÏ cã kho¶ng 100 gen cã chøc n¨ng quy ®Þnh kiÓu biÓu hiÖn cña nh÷ng gen kh¸c
trong hÖ gen. ë phÇn tiÕp theo, chóng ta sÏ thÊy b»ng c¸ch nµo sù thay ®æi ho¹t tÝnh vµ
c¸ch huy ®éng c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” l¹i cã thÓ t¹o ra sù ®a d¹ng sinh häc
trong qu¸ tr×nh tiÕn hãa.
Nh×n chung, cã ba c¸ch c¬ b¶n lµm thay ®æi ho¹t tÝnh cña gen quy ®Þnh kiÓu biÓu hiÖn:
1) B¶n th©n mét “gen quy ®Þnh kiÓu biÓu hiÖn” cã thÓ ®−îc biÓu hiÖn theo mét c¸ch
míi. Sù thay ®æi nµy dÉn ®Õn viÖc nh÷ng gen kh¸c mµ nã ®iÒu khiÓn (gäi lµ c¸c
gen ®Ých) còng sÏ biÓu hiÖn theo c¸c c¸ch míi.
2) C¸c protein ®iÒu hßa ®−îc c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” m· hãa cã thÓ cã
chøc n¨ng míi. Ch¼ng h¹n, miÒn ho¹t hãa phiªn m· cña mét yÕu tè phiªn m· trë
thµnh mét miÒn øc chÕ phiªn m·. V× vËy, mét protein ®iÒu hßa vèn lµ yÕu tè
ho¹t hãa phiªn m· cña mét nhãm gen trë thµnh yÕu tè øc chÕ phiªn m· cña
chÝnh nhãm gen ®ã. Mét ®iÓm ®¸ng chó ý lµ sù thay ®æi ë ®©y liªn quan ®Õn chøc
n¨ng cña protein ®iÒu hßa, nh−ng hËu qu¶ g©y ra ®èi víi qu¸ tr×nh tiÕn hãa l¹i
lµ sù thay ®æi kiÓu biÓu hiÖn cña c¸c gen ®Ých.
3) C¸c gen ®Ých cña mét “gen quy ®Þnh kiÓu biÓu hiÖn” cã thÓ “nhËn” mét tr×nh tù
(ADN) ®iÒu hßa míi, dÉn ®Õn viÖc nã ®−îc ®iÒu khiÓn bëi mét gen ®iÒu hßa míi.
B»ng c¸ch nµy, kiÓu biÓu hiÖn cña gen ®Ých còng thay ®æi.

10.2.1. §ét biÕn “gen quy ®Þnh kiÓu biÓu hiÖn” lµm thay ®æi h×nh th¸i ®éng vËt

10.2.1.1. Sù thay ®æi kiÓu biÓu hiÖn cña gen Pax6 g©y nªn sù h×nh thµnh m¾t sai vÞ trÝ
“Gen quy ®Þnh kiÓu biÓu hiÖn” ®−îc biÕt ®Õn réng r·i nhÊt cã lÏ lµ gen Pax6. Gen
nµy ®iÒu khiÓn sù h×nh thµnh vµ ph¸t triÓn cña m¾t ë phÇn lín (còng cã thÓ lµ tÊt c¶) c¸c
loµi ®éng vËt. Sù thay ®æi vÒ kiÓu biÓu hiÖn cña gen Pax6 cã thÓ lµ nguyªn nh©n c¬ b¶n
dÉn ®Õn sù ®a d¹ng vÒ kiÓu h×nh m¾t gi÷a c¸c loµi ®éng vËt kh¸c nhau.
Th«ng th−êng gen Pax6 chØ ®−îc biÓu hiÖn trong m« m¾t trong qu¸ tr×nh ph¸t triÓn
cña ph«i. Nh−ng, khi ®−îc biÓu hiÖn ë mét m« kh¸c, gen Pax6 cã thÓ lµm h×nh thµnh
“m¾t phô” ë vÞ trÝ m« bÊt th−êng (h×nh 10.2). Thùc nghiÖm ë ruåi giÊm cho thÊy sù thay
®æi biÓu hiÖn gen Pax6 cã thÓ dÉn ®Õn sù h×nh thµnh “m¾t” ë c¸nh vµ ch©n. §iÒu nµy chØ
ra r»ng, cã thÓ sù thay ®æi biÓu hiÖn cña gen Pax6 ®· dÉn ®Õn viÖc m¾t ®−îc h×nh thµnh
t¹i c¸c vÞ trÝ kh¸c nhau ë c¸c ®éng vËt kh¸c nhau. HÇu hÕt c¸c ®éng vËt ®Òu cã mét cÆp
m¾t n»m trong hép sä. Nh−ng sù thay ®æi biÓu hiÖn gen Pax6 cã thÓ lµ nguyªn nh©n dÉn
®Õn sù h×nh thµnh “®iÓm m¾t” ë phÇn ch©n ®Çu cña èc.
Sù thay ®æi kiÓu biÓu hiÖn cña gen Pax6 d−êng nh− kh«ng lµm thay ®æi chøc n¨ng
cña protein Pax6, mµ chñ yÕu t¹o nªn sù ®a d¹ng vÒ vÞ trÝ h×nh thµnh m¾t ë c¸c loµi kh¸c
nhau. §iÒu nµy ®−îc chøng minh bëi nghiªn cøu chuyÓn gen Pax6 tõ mùc èng vµo ruåi
giÊm ®· t¹o nªn c¸ thÓ ruåi giÊm cã “m¾t phô” ë c¸nh vµ ch©n gièng víi c¸ thÓ ruåi giÊm

288
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

cã gen Pax6 cña chÝnh nã ®−îc biÓu hiÖn bÊt th−êng ë nh÷ng m« nµy, dï r»ng hai protein
Pax6 cña mùc èng vµ ruåi giÊm chØ cã 30% tr×nh tù axit amin gièng nhau.

(a) §Üa mÇm ch©n (b)


§Üa mÇm m¾t

Êu trïng
Drosophila

Drosophila
tr−ëng thµnh

C¸ thÓ b×nh th−êng (kiÓu d¹i) C¸ thÓ mang gen "h×nh thµnh m¾t" Pax6 ®−îc
biÓu hiÖn ë tÕ bµo tiÒn ph«i h×nh thµnh ch©n

TÕ bµo tiÒn ph«i m¾t TÕ bµo tiÒn ph«i ch©n TÕ bµo tiÒn ph«i ch©n cã gen Pax6 ®−îc biÓu hiÖn “bÊt th−êng”

H×nh 10.2. Sù biÓu hiÖn gen Pax6 (cßn gäi lµ gen ey) vµ h×nh thµnh “m¾t phô” ë ruåi giÊm.
(a) Sù h×nh thµnh m¾t ë ruåi kiÓu d¹i (b×nh th−êng); (b) "M¾t phô" bÊt th−êng h×nh thµnh ë ch©n do sù
biÓu hiÖn sai vÞ trÞ cña gen Pax6 (theo Albert B. et al, 2002, Molecular Biology of the Cell, tr.426)

10.2.1.2. Sù thay ®æi kiÓu biÓu hiÖn cña gen Antp lµm "¨ngten" chuyÓn thµnh "ch©n"
Mét gen quy ®Þnh kiÓu biÓu hiÖn thø hai ®−îc t×m thÊy ë ruåi giÊm lµ gen Antp.
Gen nµy ®iÒu khiÓn sù ph¸t triÓn phÇn th©n gi÷a cña c«n trïng trong qu¸ tr×nh ph¸t
triÓn ph«i. Tõ phÇn th©n gi÷a nµy h×nh thµnh nªn mét cÆp ch©n cã h×nh th¸i kh¸c biÖt
víi c¸c ch©n tr−íc vµ ch©n sau. Gen Antp m· hãa mét protein ®iÒu hßa b×nh th−êng chØ
®−îc biÓu hiÖn ë phÇn th©n gi÷a, nh−ng kh«ng ®−îc biÓu hiÖn ë phÇn ®Çu. Nh−ng nÕu
mét ®ét biÕn tréi g©y ra bëi ®¶o ®o¹n NST ®−a tr×nh tù m· hãa protein Antp tíi gÇn mét
tr×nh tù ADN ®iÒu hßa míi vèn cã vai trß ®iÒu hßa biÓu hiÖn c¸c gen ë phÇn ®Çu (bao gåm
c¶ ¨ngten) th× ch©n sÏ h×nh thµnh thay cho ¨ng ten t¹i vÞ trÝ ¨ngten.
10.2.1.3. ChuyÓn ®o¹n t−¬ng hç gi÷a hai gen ftz vµ Antp cho thÊy vai trß quan träng vÒ
chøc n¨ng cña protein ®iÒu hßa
§Ó t¹o ra sù ®a d¹ng h×nh th¸i, c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” kh«ng nhÊt thiÕt
ph¶i ho¹t ®éng t¹i c¸c vÞ trÝ kh¸c nhau trong c¬ thÓ. Mét c¬ chÕ thø hai t¹o nªn sù ®a
d¹ng trong qu¸ tr×nh tiÕn hãa lµ nh÷ng thay ®æi vÒ tr×nh tù axit amin vµ chøc n¨ng cña
c¸c protein ®iÒu hßa do nh÷ng gen nµy m· hãa.
ë ®©y, chóng ta sÏ xem vÝ dô vÒ hai “gen quy ®Þnh kiÓu biÓu hiÖn” cã liªn quan víi
nhau ë ruåi giÊm lµ ftz (®iÒu khiÓn sù ph©n ®èt) vµ Antp (®iÒu khiÓn sù h×nh thµnh c¸c c¬
quan phÇn th©n gi÷a). Hai gen nµy h×nh thµnh vµ ph©n li xuÊt ph¸t tõ mét sù kiÖn
“nh©n ®«i” gen tæ tiªn x¶y ra tr−íc khi cã sù t¸ch li tiÕn hãa gi÷a c¸c loµi gi¸p x¸c vµ c«n
trïng kho¶ng 400 triÖu n¨m tr−íc. Hai protein t−¬ng øng ®−îc c¸c gen nµy m· hãa (lµ

289
§inh §oµn Long

Ftz vµ Antp) cã liªn quan víi nhau vµ miÒn liªn kÕt ADN cña chóng rÊt gièng nhau. Tuy
vËy, Ftz vµ Antp l¹i nhËn ra c¸c ®o¹n tr×nh tù ADN kh¸c nhau trong hÖ gen, v× khi ho¹t
®éng, chóng t¹o “dÞ phøc kÐp” víi hai lo¹i protein kh¸c nhau. Mèi t−¬ng t¸c protein –
protein ®−îc quy ®Þnh bëi mét mÉu h×nh (motif) peptide ng¾n n»m ngoµi miÒn liªn kÕt
ADN cña hai protein. Antp chøa motif gåm 4 axit amin lµ YPWM quyÕt ®Þnh sù t¹o “dÞ
phøc kÐp” cña protein nµy víi mét protein ®iÒu hßa phæ biÕn gäi lµ Exd. Ng−îc l¹i, Ftz
mang mét motif gåm 5 axit amin lµ LRALL quyÕt ®Þnh sù t−¬ng t¸c cña protein nµy víi
mét protein ®iÒu hßa phæ biÕn kh¸c cã tªn lµ FtzF1.
DÞ phøc kÐp Ftz-FtzF1 nhËn ra tr×nh tù ADN kh¸c víi Antp-Exd. V× vËy, Ftz vµ
Antp ®iÓu khiÓn sù biÓu hiÖn cña c¸c gen ®Ých kh¸c nhau. Cã mét ®iÒu thó vÞ lµ gen ftz ë
mét sè loµi c«n trïng cæ x−a (nh− loµi mät ngò cèc Tribolium castaneum) cã ®ång thêi hai
motif LRALL vµ YPWM. §iÒu nµy cho thÊy Ftz cña Tribolium cã ®Æc ®iÓm “lai”. Trong
thùc tÕ, khi ng−êi ta chuyÓn gen Ftz cña Tribolium vµo ruåi giÊm, th× c¸ thÓ biÕn ®æi gen
®ång thêi bÞ háng c¶ qu¸ tr×nh ph©n ®èt lÉn sù ph¸t triÓn phÇn th©n gi÷a.

10.2.1.4. BiÕn ®æi nhá trong tr×nh tù t¨ng c−êng cã thÓ t¹o ra kiÓu biÓu hiÖn gen míi
Mét c¬ chÕ thø ba t¹o nªn sù ®a d¹ng trong qu¸ tr×nh tiÕn hãa lµ nh÷ng thay ®æi
trong c¸c enhancer (tr×nh tù t¨ng c−êng) cña c¸c gen ®Ých ®−îc ®iÒu khiÓn bëi c¸c “gen
quy ®Þnh kiÓu biÓu hiÖn”. Trong tr−êng hîp nµy, hoÆc lµ gen ®Ých kh«ng ®−îc biÓu hiÖn
b×nh th−êng, hoÆc lµ chøc n¨ng (hoÆc ho¹t tÝnh) cña protein ®iÒu hßa bÞ thay ®æi.
C¸c nghiªn cøu trªn mét “gen quy ®Þnh kiÓu biÓu hiÖn” ë ruåi giÊm lµ Ubx ®ång
thêi minh häa cho ba c¬ chÕ tiÕn hãa: c¸c gen ®Ých cã kiÓu biÓu hiÖn míi khi gen Ubx cã
sù thay ®æi kiÓu biÓu hiÖn, hoÆc s¶n phÈm protein mµ gen nµy m· hãa thay ®æi, hoÆc cã
sù thay ®æi trong tr×nh tù enhancer cña nã. Gen Ubx b×nh th−êng m· hãa cho mét protein
®iÒu hßa ®iÒu khiÓn sù ph¸t triÓn ®èt th©n thø ba trong qu¸ tr×nh ph¸t triÓn ph«i cña
ruåi giÊm. Gen nµy øc chÕ ®Æc hiÖu sù biÓu hiÖn cña c¸c gen cÇn cho sù ph¸t triÓn ®èt
th©n thø hai (trong ®ã cã Antp). §Ó biÖt hãa ®èt th©n thø ba, Ubx øc chÕ sù biÓu hiÖn cña
Antp ë ®èt th©n nµy. §ét biÕn thiÕu protein øc chÕ Ubx lµm gen Antp ®−îc biÓu hiÖn
m¹nh ë c¶ ®èt th©n thø hai vµ ®èt th©n (a) (b)
thø ba, dÉn ®Õn sù h×nh thµnh hai ®èt
th©n gièng nhau.
10.2.1.5. Sù biÓu hiÖn bÊt th−êng cña gen
Ubx lµm thay ®æi h×nh th¸i ë ruåi giÊm
H×nh 10.3. ThÓ ®ét biÕn Ubx cã ®èt th©n thø hai (T2)
ë ruåi giÊm tr−ëng thµnh b×nh
ph¸t triÓn gièng ®èt th©n thø ba (T3). (a) Ruåi kiÓu d¹i
th−êng, ®èt th©n thø hai (T2) mang mét cã mét ®«i c¸nh thËt (®èt T2) vµ mét ®«i c¸nh phô ë phÝa
®«i ch©n vµ mét ®«i c¸nh, trong khi ®èt sau (®èt T3); (b) Ruåi cã gen Ubx kh«ng biÓu hiÖn ë ®èt
th©n thø ba (T3) chØ mang mét ®«i ch©n T3 h×nh thµnh hai ®«i c¸nh thËt (ë c¶ hai ®èt T2,T3).
vµ mét ®«i c¸nh phô. C¸nh phô cã kÝch
th−íc nhá h¬n nhiÒu so víi c¸nh thËt vµ (a) (b)
chØ cã vai trß gi÷ th¨ng b»ng khi bay
(h×nh 10.3). §ét biÕn gen Ubx dÉn ®Õn
thÓ ®ét biÕn cã kiÓu h×nh gåm 4 c¸nh
thËt. KiÓu h×nh ®ét biÕn nµy mét phÇn do
sù biÓu hiÖn bÊt th−êng cña gen Antp. H×nh 10.4. BiÓu hiÖn sai vÞ trÝ cña gen Ubx dÉn ®Õn
Gen Ubx ®iÒu khiÓn sù h×nh thµnh c¸nh thÓ ®ét biÕn mÊt c¸nh thËt ë ruåi giÊm. (a) C¸ thÓ kiÓu
phô th«ng qua øc chÕ mét sè gen ®Ých d¹i cã gen Ubx chØ biÓu hiÖn ë ®èt T3; (b) C¸ thÓ mang
thiÕt yÕu cho sù ph¸t triÓn cña c¸nh thËt, ®ét biÕn Cbx "ph¸ háng" vïng ®iÒu hßa cña gen Ubx,
lµm gen nµy biÓu hiÖn sai vÞ trÝ (ë c¶ hai ®èt T2 vµ T3),
bao gåm gen Antp.
dÉn ®Õn sù h×nh thµnh nªn hai ®«i c¸nh phô.

290
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

Sù biÓu hiÖn cña gen Ubx ë ®èt th©n T3 phô thuéc vµo mét tr×nh tù ®iÒu hßa cã
kÝch th−íc kho¶ng 80 kb. Cã mét ®ét biÕn gäi lµ Cbx lµm háng tr×nh tù ®iÒu hßa nµy
cña gen Ubx nh−ng kh«ng lµm thay ®æi vïng m· hãa protein Ubx. §ét biÕn Cbx lµm
gen Ubx biÓu hiÖn sai vÞ trÝ ë ®èt th©n T2, ngoµi vÞ trÝ biÓu hiÖn b×nh th−êng cña nã lµ ë
®èt th©n T3 (h×nh 10.4). Lóc nµy, gen Ubx sÏ øc chÕ sù biÓu hiÖn cña gen Antp còng
nh− c¸c gen kh¸c cÇn cho sù ph¸t triÓn b×nh th−êng cña ®èt th©n T2. KÕt qu¶ lµ ®èt
th©n T2 trë thµnh mét “b¶n sao” cña ®èt th©n T3. ThÓ ®ét biÕn nµy gåm tÊt c¶ c¸c c¸nh
®Òu lµ c¸nh phô.
10.2.1.6. Sù thay ®æi chøc n¨ng protein Ubx ¶nh h−ëng ®Õn h×nh th¸i ph«i ruåi giÊm
Trªn ®©y, chóng ta ®· nãi ®Õn chøc n¨ng cña protein Ubx nh− yÕu tè phiªn m· øc
chÕ sù biÓu hiÖn cña gen Antp vµ c¸c “gen ®èt th©n thø hai” trong qu¸ tr×nh ph¸t triÓn
cña ®èt th©n thø ba. Nh−ng theo mét c¬ chÕ kh¸c, mét ®ét biÕn chuyÓn hãa Ubx thµnh
mét yÕu tè ho¹t hãa phiªn m· nh÷ng “gen ®èt th©n thø hai” ®· lµm gen nµy cã chøc n¨ng
gièng gen Antp lµ thóc ®Èy sù ph¸t triÓn cña ®èt th©n thø hai. VÝ dô nµy cho thÊy, sù
thay ®æi chøc n¨ng protein ®iÒu hßa cã thÓ trùc tiÕp lµm thay ®æi kiÓu h×nh.
Protein øc chÕ Ubx ®−îc chuyÓn thµnh protein ho¹t hãa b»ng c¸ch kÕt hîp miÒn
liªn kÕt ADN cña gen Ubx víi miÒn ho¹t hãa cña protein virut VP16. §o¹n gen m· hãa
protein øc chÕ Ubx b×nh th−êng n»m ngoµi miÒn liªn kÕt ADN cña Ubx vµ kh«ng n»m
trong ®o¹n kÕt hîp Ubx-VP16. Sù biÓu hiÖn bÊt th−êng cña protein “dung hîp” Ubx-
VP16 lµm cho tÊt c¶ c¸c ®èt th©n ®Òu ph¸t triÓn gièng ®èt th©n thø hai, chø kh«ng gièng
®èt th©n thø ba nh− trong tr−êng hîp gen Ubx biÓu hiÖn bÊt th−êng. Nh− vËy, chøc n¨ng
cña protein dung hîp Ubx-VP16 gièng protein Antp, chø kh«ng gièng Ubx.
10.2.1.7. Sù thay ®æi tr×nh tù t¨ng c−êng cña gen Ubx lµm thay ®æi kiÓu biÓu hiÖn gen
Gièng víi protein Antp (môc 10.2.1.3),
(a) VÞ trÝ liªn kÕt VÞ trÝ liªn kÕt
Ubx chøa mét motif gåm 4 axit amin YPMM
protein Exd protein HOX
lµ vÞ trÝ t−¬ng t¸c víi Exd. Protein Antp liªn
kÕt víi ADN d−íi d¹ng dÞ phøc kÐp Antp-
TGAT NNATKR
Exd. T−¬ng tù nh− vËy, Ubx liªn kÕt ADN ë
d¹ng dÞ phøc kÐp Ubx-Exd. NhiÒu protein ADN
®iÒu hßa liªn kÕt ADN th«ng qua sù t¹o phøc (b)
kÐp víi protein Exd. Phøc hÖ nµy (gäi t¾t lµ Exd Ubx
Exd-HOX) liªn kÕt vµo mét tr×nh tù nhËn TGAT TT ATKR
biÕt “lai ghÐp”, nghÜa lµ Exd liªn kÕt vµo mét ADN
bªn cña tr×nh tù nhËn biÕt (TGAT), cßn c¸c
protein HOX (nh− Ubx) liªn kÕt vµo bªn liÒn (c)
Exd Labial
kÒ cßn l¹i cña tr×nh tù nhËn biÕt (cã tr×nh tù
A-T-T/G-A/G, xem h×nh 10.5). Hai nöa cña T G A T GG A T K R
tr×nh tù nhËn biÕt (cßn gäi lµ tr×nh tù liªn ADN
øng) th−êng t¸ch biÖt nhau bëi 2 nucleotide. H×nh 10.5. Sù ho¸n ®æi vÞ trÝ liªn kÕt cña c¸c
Hai nucleotide nµy cã vai trß x¸c ®Þnh phøc protein Ubx vµ Labial. HÇu hÕt cña protein HOX
®Òu chøa mét miÒn motif YPWM t−¬ng t¸c víi Exd.
hÖ Exd-HOX nµo ®−îc −u tiªn liªn kÕt. VÝ Mçi tiÓu phÇn cña "dÞ phøc kÐp" Exd-HOX nhËn biÕt
dô, phøc hÖ Exd-Ubx −u tiªn tr×nh tù liªn mét bªn cña tr×nh tù liªn øng. Trong ®ã, Exd liªn kÕt
øng cã vÞ trÝ trung t©m T-T, cßn phøc hÖ vµo tr×nh tù TGAT, cßn protein HOX liªn kÕt vµo
Exd-Labial −u tiªn vÞ trÝ trung t©m lµ G-G. ATKR (K = T/G; R = A/G). HOX ®ång thêi cã liªn kÕt
thø cÊp vµo 2 nucleotide trung t©m (NN). Hai
§iÒu nµy cho thÊy sù thay ®æi trong tr×nh tù nucleotide nµy x¸c ®Þnh tÝnh ®Æc tr−ng cña protein
t¨ng c−êng vèn ®−îc ®iÒu khiÓn bëi mét HOX thuéc "dÞ phøc kÐp". VÝ dô: Exd-Ubx liªn kÕt khi
protein HOX nµy cã thÓ trë thµnh tr×nh tù tr×nh tù liªn øng cã hai nucleotide trung t©m lµ TT,
®iÒu hßa ®−îc ®iÒu khiÓn bëi mét protein cßn Exd-Labial liªn kÕt khi hai nucleotide nµy lµ GG.

291
§inh §oµn Long

HOX kh¸c. Nguyªn lý nµy gióp gi¶i thÝch sù ®a d¹ng vÒ h×nh th¸i c¸nh ë ruåi giÊm vµ
c¸c loµi b−ím (®−îc nªu ë môc d−íi ®©y). Nh÷ng vÝ dô trªn còng cho thÊy sù thay ®æi
chøc n¨ng, hay sù biÓu hiÖn cña protein Ubx, hoÆc tr×nh tù enhancer ®Ých cña nã ®Òu cã
thÓ trùc tiÕp dÉn ®Õn nh÷ng thay ®æi lín vÒ h×nh th¸i ph¸t triÓn ph«i ë ruåi giÊm.

10.2.2. Sù biÕn ®æi h×nh th¸i ë c¸c loµi gi¸p x¸c vµ c«n trïng

10.2.2.1. Sù ®a d¹ng h×nh th¸i ë ®éng vËt ch©n ®èt


C¸c ®éng vËt ch©n ®èt gåm 5 nhãm chÝnh: bä ba thïy (®· tuyÖt chñng), bä s¸u ch©n
(c«n trïng), gi¸p x¸c (t«m, cua,...), bä nhiÒu ch©n (nh− rÕt) vµ c¸c loµi ch©n k×m (nh− cua
mãng ngùa, nhÖn, bä c¹p,...). C¸c loµi ch©n ®èt ®· thÝch nghi “thµnh c«ng” trong suèt qu¸
tr×nh tiÕn hãa l©u dµi mét phÇn lµ nhê cÊu tróc kiÓu m«®un cña chóng. C¬ thÓ cña chóng
®−îc cÊu tróc tõ c¸c ®èt th©n lÆp l¹i nh−ng cã sù biÕn ®æi d−êng nh− kh«ng giíi h¹n. Mét
sè ®èt th©n mang c¸nh, trong khi c¸c ®èt th©n kh¸c mang ¨ngten, ch©n, hµm, hay c¬
quan giao phèi. §Õn nay, hiÓu biÕt vÒ sù tiÕn hãa dÉn ®Õn sù ®a d¹ng cña c¸c ®éng vËt
ch©n ®èt lµ râ h¬n bÊt cø nhãm ®éng vËt nµo kh¸c.
10.2.2.2. Thay ®æi biÓu hiÖn gen Ubx dÉn ®Õn sù ®a d¹ng h×nh th¸i ch©n ë gi¸p x¸c
Gi¸p x¸c bao gåm hÇu hÕt (nh−ng kh«ng ph¶i tÊt c¶) c¸c loµi ®éng vËt ch©n ®èt cã
thÓ b¬i trong n−íc. Mét sè sèng ë biÓn, mét sè sèng trong m«i tr−êng n−íc ngät (phæ biÕn
nhÊt lµ t«m vµ cua). Mét trong nh÷ng nhãm gi¸p x¸c ®−îc nghiªn cøu kü nhÊt ®Õn nay lµ
Artemia. Ph«i cña chóng ngõng ph¸t triÓn ë d¹ng bµo tö cøng, nh−ng nÕu ®−a c¸c bµo tö
nµy vµo n−íc muèi, chóng sÏ ph¸t triÓn trë l¹i. PhÇn ®Çu cña c¸c loµi t«m nµy chøa c¸c
phÇn phô miÖng. §èt th©n gÇn ®Çu nhÊt (T1) cã phÇn phô b¬i (ch©n b¬i) còng gièng nh−
c¸c ®èt th©n kh¸c tõ thø hai ®Õn m−êi mét (T2 – T11). Artemia thuéc bé branchiopod
(ch©n mang) vµ ®−îc ph©n biÖt víi bé isopod
PhÇn ®Çu PhÇn th©n
(®¼ng tóc). Isopod kh¸c biÖt branchiopod ë
chç chóng chØ cã ch©n b¬i gièng branchiopod
ë c¸c ®èt th©n tõ T2 ®Õn T8; cßn ë ®èt T1,
ch©n nµy cã kÝch th−íc nhá vµ cã chøc n¨ng T1 T2 T3 T4 T5
Blanchiopod
b¾t thøc ¨n, nªn ®−îc gäi lµ “ch©n miÖng” (Bé ch©n mang)
hay “ch©n hµm” (h×nh 10.6). Ch©n miÖng
nµy gièng víi phÇn phô miÖng ë ®Çu (kh«ng
vÏ trªn h×nh).
Lý do dÉn ®Õn sù h×nh thµnh c¸c lo¹i
“ch©n” kh¸c nhau ë ®èt th©n thø nhÊt (T1) T1 T2 T3 T4 T5
gi÷a isopod vµ branchipod lµ do sù biÓu hiÖn Isopod
kh¸c nhau cña gen Ubx ë hai bé gi¸p x¸c nµy. (Bé ®¼ng tóc)
Cã lÏ, tæ tiªn chung cña chóng cã ch©n b¬i ë
Ch©n hµm C¸c ch©n b¬i
tÊt c¶ c¸c ®èt th©n (gièng branchipod). Trong
qu¸ tr×nh tiÕn hãa ph©n li cña isopod vµ C¸c ®èt biÓu hiÖn Scr C¸c ®èt biÓu hiÖn Ubx
branchipod, tr×nh tù ®iÒu hßa cña gen Ubx ®·
biÕn ®æi ë c¸c loµi isopod. KÕt qu¶ cña sù H×nh 10.6. Sù thay ®æi h×nh th¸i ë gi¸p x¸c.
ë blanchiopod, protein Scr chØ ®−îc biÓu hiÖn ë phÇn
thay ®æi nµy lµ gen Ubx kh«ng ®−îc biÓu ®Çu (protein Scr cã vai trß thóc ®Èy sù ph¸t triÓn cña
hiÖn ë ®èt T1, mµ chØ ®−îc biÓu hiÖn ë c¸c ®èt c¸c phÇn phô miÖng); cßn protein Ubx ®−îc biÓu
T2 - T8. Còng cã thÓ gi¶i thÝch lµ, gen Ubx cã hiÖn ë c¸c ®èt th©n (thóc ®Èy sù ph¸t triÓn cña c¸c
t¸c ®éng øc chÕ lªn c¸c “gen quy ®Þnh kiÓu "ch©n b¬i"). ë isopod, protein Scr ®−îc biÓu hiÖn ë
biÓu hiÖn” ë phÇn ®Çu. ThÕ nªn, ë c¸c loµi c¶ phÇn ®Çu vµ ®èt th©n thø nhÊt (T1), dÉn ®Õn
"ch©n b¬i" ë T1 chuyÓn thµnh "ch©n hµm" cã chøc
Artemia, nh÷ng gen phÇn ®Çu nµy bÞ øc chÕ ë n¨ng nh− mét phÇn phô miÖng bæ sung. Sù biÓu hiÖn
tÊt c¶ 11 ®èt th©n (T1-T11); trong khi ë c¸c cña Scr ë ®©y lµ do ®ét biÕn bÊt ho¹t Ubx (Ubx lµ
loµi isopod, c¸c gen phÇn ®Çu kh«ng bÞ øc chÕ protein øc chÕ ho¹t ®éng cña Scr).

292
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

ë ®èt T1 do thiÕu protein øc chÕ Ubx. Trong thùc tÕ, ë isopod, ng−êi ta ®· x¸c ®Þnh ®−îc
protein Src ho¹t ®éng c¶ ë phÇn ®Çu vµ ®èt th©n T1 dÉn ®Õn sù h×nh thµnh ch©n hµm ë
®èt th©n nµy.
C¬ chÕ ph©n tö nµo dÉn ®Õn sù biÓu hiÖn cña gen Ubx kh¸c nhau ë isopod vµ
branchipod? Cã mét sè gi¶ thiÕt, nh−ng gi¶ thiÕt ®−îc chÊp nhËn réng r·i h¬n cho r»ng
®ét biÕn ®· x¶y ra trong tr×nh tù ®iÒu hßa cña gen Ubx ë c¸c loµi isopod. Theo gi¶ thiÕt
nµy, tr×nh tù t¨ng c−êng cña gen Ubx kh«ng cßn ®iÒu khiÓn ®−îc sù biÓu hiÖn cña gen
nµy ë ®èt T1. Tõ thùc tÕ, ng−êi ta thÊy cã mèi t−¬ng quan chÆt gi÷a sù bÊt ho¹t gen Ubx
víi sù ph¸t triÓn c¸c d¹ng cÊu tróc ch©n hµm ë c¸c loµi gi¸p x¸c. Ch¼ng h¹n, ph«i cña
t«m hïm thiÕu sù biÓu hiÖn gen Ubx ë hai ®èt th©n ®Çu tiªn dÉn ®Õn sù h×nh thµnh hai
®«i ch©n hµm. T−¬ng tù nh− vËy, mét sè loµi t«m thiÕu sù biÓu hiÖn cña gen Ubx ë ba ®èt
th©n ®Çu tiªn, nªn cã ®Õn ba ®«i ch©n hµm.
10.2.2.3. T¹i sao c«n trïng thiÕu ch©n bông ?
TÊt c¶ c«n trïng ®Òu cã 6 ch©n; mçi ®èt th©n trong ba ®èt th©n cña chóng ®Òu
mang mét ®«i ch©n. TÊt c¶ c¸c loµi c«n trïng (−íc l−îng trªn 1 triÖu loµi) ®Òu cã ®Æc ®iÓm
chung nµy. §iÒu ng¹c nhiªn lµ ë c¸c loµi ch©n ®èt kh¸c (nh− gi¸p x¸c), sè l−îng ch©n l¹i
rÊt biÕn ®éng. Trong ®ã, mét sè loµi gi¸p x¸c cã ch©n ë mäi ®èt th©n vµ ®èt bông. Sù tiÕn
hãa dÉn ®Õn sù thiÕu ch©n ë bông cña c¸c loµi c«n trïng kh«ng ph¶i do sù thay ®æi biÓu
hiÖn cña c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” nh− tr−êng hîp h×nh thµnh ch©n miÖng ë c¸c
loµi isopod nªu trªn. Thay vµo ®ã, sù thiÕu ch©n bông ë c«n trïng lµ kÕt qu¶ cña sù thay
®æi chøc n¨ng protein ®iÒu hßa Ubx.
ë c«n trïng, hai gen Ubx vµ abd-A øc chÕ sù biÓu hiÖn cña mét gen quy ®Þnh sù
ph¸t triÓn cña c¸c ch©n ë mçi ®èt th©n, gäi lµ gen Dll. Trong qu¸ tr×nh ph¸t triÓn ph«i
ruåi giÊm, gen Ubx ®−îc biÓu hiÖn ë møc cao t¹i ®èt th©n thø ba vµ c¸c ®èt bông phÝa
tr−íc; riªng sù biÓu hiÖn cña gen abd-A cßn më réng tiÕp ®Õn c¸c ®èt bông phÝa sau. KÕt
hîp víi nhau, c¸c gen Ubx vµ abd-A øc chÕ sù biÓu hiÖn cña gen Dll t¹i 7 ®èt bông ®Çu
tiªn. MÆc dï gen Ubx còng biÓu hiÖn ë ®èt th©n T3, nh−ng nã kh«ng øc chÕ sù biÓu hiÖn
cña gen Dll còng nh− sù h×nh thµnh ch©n ë ®èt th©n nµy; bëi v×, ë ®©y trong qu¸ tr×nh
ph¸t triÓn ph«i, gen Dll ®−îc ho¹t hãa tr−íc khi gen Ubx ®−îc biÓu hiÖn.
ë c¸c loµi gi¸p x¸c, ch¼ng h¹n nh− bé branchiopod, c¶ hai gen Ubx vµ Dll ®Òu ®−îc
biÓu hiÖn ë møc cao t¹i tÊt c¶ 11 ®èt th©n. Sù biÓu hiÖn m¹nh cña gen Dll thóc ®Èy sù
h×nh thµnh ch©n b¬i ë c¶ 11 ®èt th©n nµy. VËy, t¹i sao gen Ubx kh«ng øc chÕ ®−îc sù
biÓu hiÖn cña gen Dll ë c¸c ®èt bông cña gi¸p x¸c? C©u tr¶ lêi thùc thÕ lµ ®· cã sù tiÕn
hãa ph©n li (vÒ cÊu tróc vµ chøc n¨ng) cña protein Ubx ë c«n trïng vµ gi¸p x¸c.
C¸c thÝ nghiÖm ho¹t hãa vµ bÊt ho¹t gen ë ruåi giÊm cho thÊy: nÕu gen Ubx cña
ruåi giÊm ®−îc biÓu hiÖn ë tÊt c¶ c¸c m« thuéc phÇn bông th× ch©n kh«ng h×nh thµnh
®−îc do gen Dll bÞ øc chÕ. Nh−ng nÕu gen Ubx nµy cã nguån gèc tõ gi¸p x¸c th× nã kh«ng
øc chÕ sù biÓu hiÖn cña gen Dll vµ tÊt c¶ c¸c ch©n ®Òu h×nh thµnh b×nh th−êng. §iÒu nµy
chøng tá “chøc n¨ng” cña protein Ubx cña ruåi giÊm vµ gi¸p x¸c lµ kh¸c nhau. Protein
cña ruåi giÊm øc chÕ biÓu hiÖn gen Dll, nh−ng protein cña gi¸p x¸c th× kh«ng.
Nguyªn nh©n nµo lµm chøc n¨ng cña protein Ubx ë ruåi giÊm vµ gi¸p x¸c biÓu hiÖn
kh¸c nhau? Ph©n tÝch tr×nh tù axit amin cña hai protein nµy cho thÊy, chóng chØ gièng
nhau 32%, nh−ng 59/60 axit amin thuéc vïng liªn kÕt ADN lµ gièng nhau hoµn toµn.
Protein Ubx ë gi¸p x¸c cã mét motif ng¾n gåm 29 axit amin cã vai trß “ph¶n øc chÕ”. Khi
motif nµy bÞ lo¹i bá, protein Ubx cña gi¸p x¸c biÓu hiÖn chøc n¨ng gièng nh− cña ruåi
giÊm vµ g©y øc chÕ biÓu hiÖn gen Dll.
Protein Ubx cña c¶ ruåi giÊm vµ gi¸p x¸c ®Òu chøa nhiÒu miÒn øc chÕ kh¸c nhau.
Nh÷ng miÒn nµy cã kh¶ n¨ng t−¬ng t¸c víi mét hoÆc nhiÒu phøc hÖ øc chÕ phiªn m·.

293
§inh §oµn Long

§o¹n peptide “ph¶n øc chÕ” cã mÆt trong cÊu tróc protein Ubx cña gi¸p x¸c ng¨n c¶n sù
huy ®éng phøc hÖ øc chÕ cña protein nµy. Khi chuçi peptide “ph¶n øc chÕ” nµy ®−îc g¾n
vµo protein Ubx cña ruåi giÊm, th× ph©n tö protein lai biÓu hiÖn chøc n¨ng gièng protein
Ubx cña gi¸p x¸c (tøc lµ mÊt kh¶ n¨ng øc chÕ gen Dll).
10.2.2.4. KiÓu h×nh c¸nh ®a d¹ng ë c¸c loµi ch©n ®èt do biÕn ®æi c¸c tr×nh tù ®iÒu hßa
ë c¸c môc trªn, chóng ta ®· ®Ò cËp ®Õn vai trß cña gen Ubx trong viÖc t¹o ra sù ®a
d¹ng c¸c kiÓu h×nh ch©n bông vµ ch©n miÖng ë c¸c loµi gi¸p x¸c vµ c«n trïng. Trong thùc
tÕ, sù thay ®æi tr×nh tù ®iÒu hßa cña gen nµy cßn gióp gi¶i thÝch tÝnh ®a d¹ng kiÓu h×nh
c¸nh (“ch©n bay”) ë ruåi giÊm vµ c¸c loµi b−ím (h×nh 10.7).
ë ruåi giÊm, Ubx cã vai trß lµ protein øc chÕ sù h×nh thµnh c¸nh thËt (c¸nh ®Çy
®ñ). Trong qu¸ tr×nh nµy, Ubx øc chÕ kho¶ng tõ 5 ®Õn 10 gen ®Ých kh¸c nhau. Nh÷ng gen
nµy m· hãa c¸c protein thiÕt yÕu thóc ®Èy sù h×nh thµnh vµ ph¸t triÓn c¸nh thËt. ë c¸nh
phô (®èt T3), nh÷ng gen nµy bÞ øc chÕ bëi Ubx. Nh−ng khi gen Ubx bÞ ®ét biÕn, “c¸nh
phô” ph¸t triÓn thµnh “c¸nh thËt”, dÉn ®Õn thÓ ®ét biÕn cã bèn c¸nh thËt.
Ruåi giÊm thuéc bé c«n trïng hai c¸nh - Dipteran. C¸c loµi thuéc bé nµy cã ®Æc ®iÓm
chung lµ chØ cã mét ®«i c¸nh thËt duy nhÊt bªn c¹nh mét hoÆc mét sè ®«i c¸nh phô.
Protein Ubx ho¹t ®éng víi vai trß lµ protein øc chÕ h×nh thµnh c¸nh thËt ë Dipteran. C¸c
loµi b−ím thuéc mét bé c«n trïng kh¸c, gäi lµ bé c¸nh v¶y (hay c¸nh phÊn) -
Lepidopteran. C¸c loµi Lepidopteran ®Òu cã hai ®«i c¸nh thËt vµ mét hoÆc mét sè ®«i
c¸nh phô. Nguyªn nh©n nµo dÉn ®Õn kh¸c biÖt nµy?
Trong lÞch sö, hai bé c«n trïng nµy tiÕn hãa t¸ch li khái nhau kho¶ng trªn 250
triÖu n¨m tr−íc. §ã còng lµ kho¶ng thêi gian c¸c loµi ®éng vËt cã x−¬ng sèng (bao gåm
ng−êi) vµ kh«ng x−¬ng sèng (nh− Õch) t¸ch li khái nhau. Trong thêi kú nµy, d−êng nh−
gen Ubx tÝch lòy ®ñ c¸c ®ét biÕn (cã thÓ theo mét hoÆc c¶ ba c¬ chÕ tiÕn hãa) ®Õn møc
chøc n¨ng cña nã thay ®æi. Gi¶ thiÕt ®¬n gi¶n nhÊt ®−îc ®−a ra lµ sù thay ®æi kiÓu biÓu
hiÖn cña gen Ubx (lµm gen nµy kh«ng biÓu hiÖn ë c¸c c«n trïng c¸nh v¶y) dÉn ®Õn sù
h×nh thµnh ®«i c¸nh thø hai. HiÖn t−îng “ch©n b¬i” biÕn thµnh “ch©n miÖng” ë bé ®¼ng
tóc (isopod) ®· tõng ®−îc
gi¶i thÝch bëi c¬ chÕ nµy. (a)
Tuy vËy, trong thùc tÕ ®·
kh«ng t×m thÊy sù kh¸c
biÖt râ rÖt vÒ kiÓu biÓu hiÖn
cña gen Ubx gi÷a ruåi giÊm
vµ c¸c loµi b−ím. Cô thÓ, lµ C«n trïng hai c¸nh C«n trïng c¸nh phÊn
gen Ubx ®−îc biÓu hiÖn ë (Dipteran) (Lepidopteran)
møc cao trong suèt qu¸ (b)
tr×nh ph¸t triÓn ®«i c¸nh
thø hai ë c¸c loµi b−ím. Ubx "T¾t" "BËt"
§iÒu nµy cho thÊy cã hai wg
kh¶ n¨ng. Kh¶ n¨ng thø +1 +1
nhÊt lµ sù biÓu hiÖn chøc Ubx "T¾t" "BËt"
n¨ng cña protein Ubx DSRF
kh«ng gièng nhau ë ruåi +1 +1
giÊm vµ ë b−ím. Kh¶ n¨ng H×nh 10.7. Sù thay ®æi tr×nh tù ®iÒu hßa cña c¸c gen ®Ých lµ môc tiªu
thø hai lµ c¸c gen ®Ých t¸c ®éng cña protein Ubx. (a) Protein øc chÕ Ubx ®−îc biÓu hiÖn ë ®«i
thiÕt yÕu cho sù ph¸t triÓn "c¸nh phô" cña c«n trïng hai c¸nh, vµ ë ®«i c¸nh sau (mµu sÉm) cña c«n
c¸nh thËt vèn bÞ øc chÕ bëi trïng c¸nh phÊn. (b) ë c«n trïng hai c¸nh, c¸c gen ®Ých mang c¸c tr×nh tù
protein Ubx (ë c«n trïng) ®iÒu hßa lµ vÞ trÝ g¾n cña protein Ubx (h×nh tr¸i); trong khi, ë c«n trïng
c¸nh phÊn (b−ím, h×nh ph¶i), c¸c tr×nh tù g¾n protein Ubx bÞ mÊt, dÉn ®Õn
cã tr×nh tù ®iÒu hßa bÞ biÕn c¸c gen ph¸t triÓn c¸nh thËt ®−îc biÓu hiÖn (theo Watson, 2004).

294
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

®æi khi c¸c loµi b−ím tiÕn hãa ph©n li, dÉn ®Õn viÖc c¸c gen ®Ých nµy ë b−ím kh«ng cßn bÞ
øc chÕ bëi protein Ubx n÷a. Cã lÏ phÇn lín chóng ta ®Òu cho r»ng kh¶ n¨ng thø nhÊt dÔ
x¶y ra h¬n, bëi kh¶ n¨ng thø hai chØ x¶y ra khi ®ång thêi cã tõ 5 ®Õn 10 gen ®Ých (thiÕt
yÕu cho sù ph¸t triÓn c¸nh ë b−ím) ®Òu cã sù biÕn ®æi trong tr×nh tù ®iÒu hßa cña chóng.
Nh−ng thËt ng¹c nhiªn, sù biÕn ®æi tr×nh tù ®iÒu hßa cña c¸c gen ®Ých cña protein
Ubx l¹i ®−îc t×m thÊy lµ nguyªn nh©n chÝnh dÉn ®Õn sù ®a h×nh kiÓu c¸nh ë b−ím, cßn
protein Ubx biÓu hiÖn sù duy tr× chøc n¨ng gièng nhau ë ruåi giÊm vµ ë b−ím.

10.2.3. Xu h−íng ®ét biÕn thay thÕ trong c¸c tr×nh tù ADN vµ protein
Mét c©u hái ®−îc ®Æt ra tõ l©u trong c¸c nghiªn cøu tiÕn hãa lµ: kiÓu ®ét biÕn vµ
tÇn sè ®ét biÕn cã gièng nhau ë c¸c phÇn kh¸c nhau cña gen kh«ng? Ngay tõ nh÷ng n¨m
70 cña thÕ kû tr−íc, ®· cã nh÷ng nghiªn cøu so s¸nh tr×nh tù axit amin trong c¸c ph©n tö
protein cã chøc n¨ng gièng nhau. C¸c nghiªn cøu nµy ®· chØ ra r»ng, cã mét sè kiÓu thay
®æi vÒ axit amin gi÷a c¸c protein t−¬ng ®ång th−êng x¶y ra h¬n so víi c¸c kiÓu thay
®æi kh¸c. §Æc biÖt, c¸c axit amin thay thÕ nhau th−êng cã tÝnh chÊt hãa häc gièng nhau
vµ thuéc cïng nhãm ph©n lo¹i (xem b¶ng 1.5, ch−¬ng 1). Xu h−íng thay thÕ axit amin
nh− vËy cñng cè hai nguyªn t¾c tiÕn hãa quan träng, ®ã lµ: 1) c¸c ®ét biÕn chØ xuÊt hiÖn ë
tÇn sè thÊp, vµ 2) hÇu hÕt c¸c ®ét biÕn thay ®æi lín (ch¼ng h¹n, do thay thÕ c¸c axit amin
thuéc c¸c nhãm kh¸c nhau) ®Òu bÞ chän läc tù nhiªn ®µo th¶i.
C¸c axit amin cã tÝnh chÊt hãa häc gièng nhau cßn cã xu h−íng ®−îc m· hãa bëi c¸c
m· bé ba gièng nhau (xem b¶ng 4.5, ch−¬ng 4). Nhê vËy, sù xuÊt hiÖn c¸c ®ét biÕn thay
thÕ gi÷a c¸c axit amin cïng lo¹i dÔ x¶y ra h¬n. Ch¼ng h¹n nh− ®Ó xuÊt hiÖn ®ét biÕn Leu
↔ Ile chØ cÇn mét nucleotide trong gen ®−îc thay thÕ (CUU ↔ AUU); nh−ng ®Ó x¶y ra
®ét biÕn Leu ↔ Arg, cÇn ®Õn sù thay thÕ cña hai nucleotide trong gen (CUU ↔ AAU).
C¸c enzym ADN polymerase cã lçi sao chÐp vµo kho¶ng 10-9 – 10-6. NghÜa lµ, cø kho¶ng 1
triÖu ®Õn 1 tØ nucleotide, chóng míi sao chÐp sai mét lÇn. Do vËy, kh¶ n¨ng xuÊt hiÖn c¸c
®ét biÕn thay thÕ hai hay nhiÒu nucleotide t¹i cïng mét vÞ trÝ trong qu¸ tr×nh sao chÐp lµ
rÊt thÊp. H¬n n÷a, chän läc tù nhiªn ®· t¸c ®éng trªn c¸c hÖ thèng sinh häc qua hµng
triÖu n¨m tiÕn hãa, nªn phÇn lín c¸c protein hiÖn cã (kiÓu d¹i) ë c¸c sinh vËt lµ d¹ng cã
biÓu hiÖn chøc n¨ng thÝch nghi cao víi m«i tr−êng sèng hiÖn t¹i. Nªn, phÇn lín c¸c thay
®æi râ rÖt trong cÊu tróc bËc 1 cña ph©n tö protein ®Òu lµm gi¶m sù biÓu hiÖn chøc n¨ng
cña nã vµ g©y h¹i cho sinh vËt. KÕt qu¶ lµ chóng th−êng bÞ chän läc tù nhiªn ®µo th¶i
nhanh chãng.

10.3. C¸c h−íng nghiªn cøu tiÕn hãa ph©n tö


10.3.1. So s¸nh c¸c tr×nh tù ADN

10.3.1.1. Sù thay thÕ c¸c nucleotide vµ m« h×nh Jukes - Cantor


Trong qu¸ tr×nh tiÕn hãa, sau khi hai tr×nh tù nucleotide t¸ch li khái nhau (ch¼ng
h¹n, 2 gen t−¬ng ®ång ë 2 loµi cïng t¸ch li tõ tæ tiªn chung), chóng b¾t ®Çu tÝch lòy c¸c
®ét biÕn ®éc lËp víi nhau. Trong c¸c nghiªn cøu tiÕn hãa dïng phÐp so s¸nh tr×nh tù
ADN, sè nucleotide thay thÕ (K) th−êng lµ th«ng sè c¬ b¶n ®Ó nhËn ®Þnh sù kh¸c biÖt
gi÷a c¸c gen cña c¸c loµi hoÆc c¸ thÓ kh¸c nhau. Theo ®ã, c¸c gen cã Ýt nucleotide thay
thÕ ®−îc xem lµ cã quan hÖ gÇn, vµ ng−îc l¹i. Tuy vËy, ngay tõ n¨m 1969, T. Jukes vµ C.
Cantor ®· nhËn ®Þnh r»ng “viÖc so s¸nh c¸c tr×nh tù chØ dùa trªn c¸c ®¬n ph©n ®¬n lÎ cã
thÓ dÉn ®Õn viÖc ®¸nh gi¸ sai vÒ quan hÖ di truyÒn gi÷a chóng”. Cô thÓ trong ph©n tö
ADN, ë vÞ trÝ dÔ x¶y ra sù thay thÕ nucleotide, th× rÊt cã thÓ t¹i vÞ trÝ ®ã ®· x¶y ra mét
hoÆc nhiÒu lÇn c¸c ®ét biÕn thuËn vµ ®ét biÕn ng−îc (h×nh 10.8). §Ó ph¶n ¸nh kh¶ n¨ng
®ã, Jukes vµ Cantor ®· gi¶ thiÕt r»ng: mçi lo¹i nucleotide ®Òu cã thÓ ®−îc thay thÕ bëi 3
lo¹i nucleotide kh¸c víi kh¶ n¨ng nh− nhau; trong ®ã, qui −íc tØ lÖ thay thÕ mét

295
§inh §oµn Long

nucleotide thµnh mét trong 3 lo¹i nucleotide cßn


l¹i lµ α. Khi ®ã, tØ lÖ thay thÕ mét nucleotide nãi T×nh huèng 1 T×nh huèng 2
chung lµ 3α. Theo m« h×nh nµy, nÕu mét vÞ trÝ C C
t=0
nucleotide trªn gen t¹i thêi ®iÓm 0 (t = 0) lµ C,
th× x¸c suÊt (P) t¹i thêi ®iÓm 1 (t = 1) vÞ trÝ
nucleotide ®ã vÉn lµ C sÏ lµ PC(1) = 1 – 3α. Vµo
c¸c thêi ®iÓm sau ®ã (vÝ dô: t = 2), ph¶i tÝnh ®Õn
kh¶ n¨ng ®ét biÕn “ng−îc” (®ét biÕn “phôc håi”). t=1 A T
NÕu nucleotide gèc lµ C chuyÓn thµnh mét
nucleotide kh¸c (vÝ dô lµ A) t¹i t = 1, th× t¹i t =
2, gi¸ trÞ PC(2) sÏ b»ng (1 - 3α)PC(1) + α[1 – PA(1)].
TiÕp tôc më réng c«ng thøc nµy, vµo thêi ®iÓm T C
t=2
bÊt kú trong t−¬ng lai (t), kh¶ n¨ng mét vÞ trÝ
trªn m¹ch ADN mang nucleotide C sÏ lµ:
H×nh 10.8. Hai t×nh huèng thay thÕ
1 3 nucleotide x¶y ra t¹i cïng mét vÞ trÝ cã thÓ
PC(t) = /4 = ( /4)e -4α
(ph−¬ng tr×nh 10.1)
dÉn ®Õn viÖc −íc l−îng sai sè lÇn ®ét biÕn
C«ng thøc nµy cã thÓ dïng ®Ó tÝnh gi¸ trÞ thay thÕ nucleotide ®Z x¶y ra ë mét gen (t lµ
thêi gian).
cña α, qua ®ã ph¶n ¸nh tÇn sè (tèc ®é) thay thÕ
nucleotide t¹i mét vÞ trÝ trªn ph©n tö ADN.
Tuy vËy, so víi thùc tÕ, c«ng thøc Jukes - Cantor lµ mét c«ng thøc qu¸ gi¶n l−îc.
Ch¼ng h¹n, c¸c ®ét biÕn ®ång ho¸n (thay thÕ purine nµy b»ng purine kh¸c, hoÆc
pyrimidine nµy b»ng pyrimidine kh¸c) trong thùc tÕ th−êng dÔ x¶y ra h¬n so víi c¸c ®ét
biÕn dÞ ho¸n (thay thÕ mét purine b»ng mét pyrimidine hoÆc ng−îc l¹i). Dï vËy, tõ viÖc
më réng c«ng thøc Jukes – Cantor cã thÓ x¸c ®Þnh ®−îc sè lÇn thay thÕ nucleotide thùc
sù ®· x¶y ra (K) t¹i mét vÞ trÝ nucleotide trªn m¹ch ADN dùa theo ph−¬ng tr×nh sau:
K = -3/4 ln [1 – (4/3)p] (ph−¬ng tr×nh 10.2)
trong ®ã, p lµ tØ sè c¸c nucleotide kh¸c nhau gi÷a hai tr×nh tù ADN ®−îc so s¸nh sau mét
lÇn ®Õm ®éc lËp. C«ng thøc nµy phï hîp víi quan ®iÓm cho r»ng nÕu hai tr×nh tù ADN
chØ cã Ýt vÞ trÝ kh¸c biÖt, th× gi¸ trÞ p nhá vµ kh¶ n¨ng thay thÕ nhiÒu lÇn t¹i mét vÞ trÝ lµ
thÊp (vÝ dô: trªn m¹ch ADN cã 100 nucleotide, nÕu p = 0,02 th× K = 0,02). §ång thêi c«ng
thøc nµy cho thÊy: nÕu sè nucleotide kh¸c nhau gi÷a hai tr×nh tù ADN cµng lín, th× tÇn
sè nucleotide thay thÕ thËt cµng lín h¬n tÇn sè quan s¸t (vÝ dô: trªn m¹ch ADN cã 100
nucleotide, nÕu p = 0,50 th× K = 0,82).

10.3.1.2. Tèc ®é thay thÕ c¸c nucleotide


Sè lÇn thay thÕ nucleotide mµ hai tr×nh tù ADN ®· tr¶i qua tõ khi chóng t¸ch li
khái tr×nh tù tæ tiªn ®−îc xem lµ th«ng sè quan träng nhÊt trong nghiªn cøu tiÕn hãa sö
dông phÐp so s¸nh ADN. Khi kÕt hîp sè lÇn thay thÕ nucleotide (K) víi kho¶ng thêi gian
tiÕn hãa (T) th× x¸c ®Þnh ®−îc tÇn sè thay thÕ nucleotide (r). V×, sù thay thÕ nucleotide
x¶y ra ®ång thêi vµ ®éc lËp ë c¶ hai tr×nh tù, nªn r ®−îc tÝnh b»ng c«ng thøc:
r = K/(2T) (ph−¬ng tr×nh 10.3)
§iÒu cÇn l−u ý lµ ®Ó −íc tÝnh ®−îc gi¸ trÞ K, ph¶i thu thËp ®−îc d÷ liÖu vÒ tr×nh tù
ADN tõ Ýt nhÊt 2 loµi trë lªn. ViÖc so s¸nh tÇn sè thay thÕ nucleotide trong ph¹m vi mét
gen hay gi÷a c¸c gen kh¸c nhau cho phÐp dù ®o¸n c¬ chÕ ph©n tö dÉn ®Õn sù thay thÕ
nucleotide trong c¸c tr×nh tù ADN. NÕu tèc ®é tiÕn hãa trong mét nhãm loµi lµ æn ®Þnh
th× tÇn sè thay thÕ nucleotide cã thÓ gióp dù ®o¸n thêi gian x¶y ra mét sù kiÖn tiÕn hãa.

296
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

10.3.1.3. Tèc ®é tiÕn hãa cña c¸c phÇn kh¸c nhau trong gen
KÕt qu¶ so s¸nh tr×nh tù ADN ë nhiÒu gen kh¸c nhau ®· x¸c nhËn r»ng: c¸c phÇn
kh¸c nhau trong gen cã tÇn sè biÕn ®æi kh¸c nhau. Nãi c¸ch kh¸c, chän läc tù nhiªn t¸c
®éng víi møc ®é kh¸c nhau lªn c¸c phÇn kh¸c nhau cña gen. Chóng ta biÕt r»ng, mét gen
sinh vËt nh©n thËt ®iÓn h×nh bao gåm c¸c tr×nh tù m· hãa (quy ®Þnh c¸c axit amin trong
ph©n tö protein) vµ c¸c tr×nh tù kh«ng m· hãa. C¸c tr×nh tù kh«ng m· hãa bao gåm c¸c
intron, c¸c ®o¹n dÉn ®Çu vµ theo sau vïng m· hãa (®−îc phiªn m·, nh−ng kh«ng ®−îc
dÞch m·) vµ c¸c ®o¹n vïng biªn kh«ng ®−îc phiªn m· n»m ng−îc dßng (®Çu 5’) vµ xu«i
dßng (®Çu 3’) cña gen (dï chóng cÇn thiÕt cho sù phiªn m·). Ngoµi ra, trong hÖ gen cßn cã
c¸c gen gi¶ (cïng lµ tr×nh tù kh«ng m· hãa) vèn kh«ng cßn kh¶ n¨ng biÓu hiÖn vµ cho ra
c¸c s¶n phÈm ho¹t ®éng chøc n¨ng b×nh th−êng bëi chóng ®· tÝch lòy nhiÒu ®ét biÕn lµm
mÊt chøc n¨ng trong qu¸ tr×nh tiÕn hãa. Ngay trong tr×nh tù m· hãa cña gen, kh«ng ph¶i
mäi thay thÕ nucleotide ®Òu dÉn ®Õn thay ®æi axit amin trong ph©n tö protein. NhÊt lµ, sù
thay thÕ nucleotide t¹i vÞ trÝ thø ba trong mét m· bé ba (codon) nhiÒu khi kh«ng lµm ¶nh
h−ëng ®Õn thµnh phÇn vµ tr×nh tù axit amin trªn ph©n tö protein do hiÖn t−îng “tho¸i
hãa” cña m· bé ba (xem thªm ch−¬ng 4).
10.3.1.4. C¸c vÞ trÝ ®ång nghÜa vµ kh¸c nghÜa trong gen
B¶ng 10.1 cho thÊy tèc ®é thay ®æi t−¬ng ®èi ë c¸c phÇn kh¸c nhau cña c¸c gen
®éng vËt cã vó. §iÓm ®¸ng chó ý ë c¸c gen biÓu hiÖn chøc n¨ng lµ tÇn sè thay thÕ
nucleotide cao nhÊt t¹i c¸c vÞ trÝ ®ång nghÜa trong vïng m· hãa cña gen. TÇn sè thay thÕ
nucleotide ®ång nghÜa cao gÊp 5 lÇn so víi tÇn sè thay thÕ nucleotide kh¸c nghÜa quan
s¸t ®−îc. C¸c ®ét biÕn thay thÕ nucleotide ®ång nghÜa lµ c¸c ®ét biÕn kh«ng lµm thay ®æi
tr×nh tù axit amin trªn ph©n tö protein; do vËy, kh«ng lµm thay ®æi sù biÓu hiÖn chøc
n¨ng cña protein. §Õn ®©y, chóng ta nhí l¹i: c¸c biÕn ®æi trong tr×nh tù nucleotide cã thÓ
xuÊt hiÖn nh− thÕ nµo? VÒ tæng thÓ, cã thÓ nãi tÊt c¶ nh÷ng thay ®æi nucleotide trong
tr×nh tù ADN lµ do sai sãt cña qu¸ tr×nh sao chÐp hoÆc söa ch÷a ADN. TÊt c¶ c¸c enzym
tham gia sao chÐp vµ söa ch÷a ADN
®Òu kh«ng cã kh¶ n¨ng ph©n biÖt B¶ng 10.1. Tèc ®é thay thÕ nucleotide trung b×nh trong c¸c
mét ®ét biÕn lµ ®ång nghÜa hay vïng tr×nh tù ADN kh¸c nhau thuéc gen ë ®éng vËt cã vó
kh¸c nghÜa. Do vËy, cã thÓ suy ®o¸n Sè nucleotide trung b×nh
r»ng: kh¶ n¨ng xuÊt hiÖn cña c¸c Tr×nh tù ADN thay thÕ t¹i mçi vÞ trÝ
®ét biÕn thay thÕ nucleotide ®ång hµng n¨m (x 10-9)
nghÜa vµ kh¸c nghÜa lµ nh− nhau. C¸c gen biÓu hiÖn chøc n¨ng
Nh−ng, c¸c ®ét biÕn kh¸c nghÜa Vïng biªn ®Çu 5’ cña gen 2,36
th−êng g©y h¹i nªn cã xu h−íng bÞ
§o¹n tr×nh tù dÉn ®Çu gen 1,74
chän läc tù nhiªn ®µo th¶i; trong khi
Tr×nh tù m· hãa, ®ång nghÜa 4,65
®ã, c¸c ®ét biÕn ®ång nghÜa v−ît qua
®−îc c¸c “hµng rµo” chän läc, nªn Tr×nh tù m· hãa, kh¸c nghÜa 0,88
®−îc duy tr×. Nhê vËy, chÝnh c¸c ®ét C¸c tr×nh tù intron 3,70
biÕn ®ång nghÜa cã ý nghÜa ph¶n ¸nh §o¹n tr×nh tù theo sau gen 1,88
tèc ®é ®ét biÕn x¶y ra ë mét hÖ gen, Vïng biªn ®Çu 3’ cña gen 4,46
trong khi c¸c ®ét biÕn kh¸c nghÜa th× C¸c gen gi¶ 4,85
kh«ng.
10.3.1.5. Sù biÕn ®æi ë c¸c vïng biªn cña gen
B¶ng 10.1 cho thÊy møc ®é biÕn ®æi ë vïng biªn ®Çu 3’ cña c¸c gen còng rÊt cao.
Gièng nh− c¸c ®ét biÕn ®ång nghÜa, c¸c tr×nh tù vïng biªn ®Çu 3’ kh«ng ¶nh h−ëng ®Õn
tr×nh tù axit amin cña protein vµ Ýt ¶nh h−ëng ®Õn qu¸ tr×nh biÓu hiÖn cña gen. KÕt qu¶
lµ, phÇn lín c¸c ®ét biÕn thay thÕ ë vïng nµy ®−îc duy tr× qua chän läc tù nhiªn. TÇn sè
thay thÕ nucleotide trong vïng intron cña gen còng cao, nh−ng thÊp h¬n ®ét biÕn ®ång

297
§inh §oµn Long

nghÜa vµ ®ét biÕn thay thÕ ë vïng biªn ®Çu 3’. MÆc dï c¸c tr×nh tù intron kh«ng ph¶i
tr×nh tù m· hãa c¸c axit amin trong protein, nh−ng vïng tiÕp gi¸p gi÷a chóng víi c¸c
exon liÒn kÒ cã vai trß ®¶m b¶o cho qu¸ tr×nh c¾t intron vµ kÕt nèi exon diÔn ra chÝnh
x¸c. Mét sè tr×nh tù bªn trong intron, nh− tr×nh tù ph©n nh¸nh, lµ thiÕt yÕu cho qu¸
tr×nh c¾t intron. Mét sè intron bÞ c¾t bá t¹i m« nµy, nh−ng l¹i ®−îc dïng ®Ó m· hãa axit
amin t¹i m« kh¸c trong m« h×nh “c¸c c¸ch c¾t intron kh¸c nhau” (xem thªm ch−¬ng 5).
Ngoµi ra, ë mét sè gen, intron cßn lµ vÞ trÝ liªn kÕt cña mét sè yÕu tè phiªn m· nªn cã ¶nh
h−ëng ®Õn kh¶ n¨ng vµ tèc ®é phiªn m· cña gen. Do vËy, kh«ng ph¶i mäi thay ®æi trong
tr×nh tù intron cña tÊt c¶ c¸c gen ®Òu v−ît qua ®−îc “hµng rµo” chän läc tù nhiªn.
Nh−ng, nh×n chung tÇn sè thay ®æi cña chóng chØ thÊp h¬n ®«i chót so víi c¸c ®ét biÕn
®ång nghÜa vµ ®ét biÕn thay thÕ ë vïng biªn ®Çu 3’ cña gen.
So víi vïng biªn ®Çu 3’ cña gen, vïng biªn ®Çu 5’ cã møc ®é thay ®æi thÊp h¬n. MÆc
dï vïng nµy còng kh«ng ®−îc phiªn m· vµ dÞch m·, nh−ng nã mang tr×nh tù khëi ®Çu
phiªn m· (promoter) bªn c¹nh c¸c tr×nh tù ®iÒu hßa phiªn m· kh¸c cña gen; v× vËy, vïng
nµy rÊt quan träng cho sù biÓu hiÖn cña gen. ThËm chÝ, nh÷ng thay ®æi nhá trong
promoter, nh− hép TATA, cã thÓ ng¨n c¶n sù phiªn m· cña gen vµ th−êng cã h¹i cho thÓ
®ét biÕn. Chän läc tù nhiªn th−êng ®µo th¶i nh÷ng ®ét biÕn nµy vµ gi¶m thiÓu tèi ®a
nh÷ng thay ®æi trong c¸c vïng quan träng cña hÖ gen, trong ®ã cã c¸c promoter.
Trong c¸c gen, tÇn sè biÕn ®æi thÊp h¬n n÷a thuéc vÒ c¸c vïng dÉn ®Çu vµ theo sau
vïng m· hãa cña gen. MÆc dï nh÷ng vïng nµy kh«ng ®−îc dÞch m· nh−ng chóng ®−îc
phiªn m·, vµ tr×nh tù cña chóng th−êng cã vai trß mang tÝn hiÖu ®iÒu khiÓn hoÆc qu¸
tr×nh hoµn thiÖn mARN (trong nh©n tÕ bµo) hoÆc qu¸ tr×nh dÞch m· tæng hîp protein (ë
tÕ bµo chÊt). Do vËy, c¸c ®ét biÕn thay thÕ nucleotide ë c¸c vïng tr×nh tù nµy Ýt ®−îc duy
tr× còng lµ ®iÒu dÔ hiÓu. Trong ph¹m vi mét gen, tÇn sè c¸c ®ét biÕn thay thÕ thÊp nhÊt
lµ c¸c ®ét biÕn kh¸c nghÜa x¶y ra trong vïng m· hãa cña gen. Nh− chóng ta ®· biÕt,
phÇn lín c¸c protein kiÓu d¹i cña sinh vËt cã tr×nh tù axit amin ®· ®−îc chän läc tù nhiªn
sµng läc nªn th−êng ë d¹ng thÝch nghi nhÊt víi m«i tr−êng sèng hiÖn t¹i; thÕ nªn, phÇn
lín c¸c thay ®æi tr×nh tù axit amin ®Òu dÉn ®Õn sù kÐm thÝch nghi h¬n vµ bÞ chän läc tù
nhiªn ®µo th¶i. TÊt nhiªn møc ®é t¸c ®éng cña chän läc tù nhiªn lµ kh«ng gièng nhau ë
c¸c axit amin kh¸c nhau trong ph©n tö protein, còng nh− cßn phô thuéc vµo viÖc axit
amin thay thÕ cã tÝnh chÊt hãa häc gièng hay kh¸c axit amin gèc.
10.3.1.6. Gen gi¶
TÇn sè ®ét biÕn ®−îc t×m thÊy cao nhÊt ë c¸c gen gi¶. VÝ dô, ë c¸c gen gi¶ globin cña
ng−êi, tÇn sè thay ®æi nucleotide cao gÊp 5 lÇn so víi tÇn sè thay thÕ nucleotide kh¸c
nghÜa ë vïng m· hãa cña gen globin thËt. Së dÜ c¸c gen gi¶ cã tÇn sè thay thÕ nucleotide
cao, v× chóng kh«ng cßn ®−îc dïng ®Ó tæng hîp protein. ThÕ nªn, nh÷ng thay ®æi trong
gen gi¶ hÇu nh− kh«ng bÞ t¸c ®éng bëi chän läc tù nhiªn.
Nãi tãm l¹i, mét xu h−íng dÔ nhËn thÊy trong qu¸ tr×nh tiÕn hãa lµ: c¸c vïng tr×nh tù
(nucleotide hoÆc axit amin) cµng cã vai trß quan träng trong biÓu hiÖn chøc n¨ng cña c¸c
®¹i ph©n tö sinh häc (ADN, ARN vµ protein) cµng cã tèc ®é tiÕn hãa chËm.

10.3.1.7. Xu h−íng chän läc c¸c m· bé ba ®ång nghÜa


Xu h−íng chän läc c¸c m· bé ba ®ång nghÜa lµ vÝ dô cho thÊy nh÷ng thay ®æi dï rÊt
nhá vÒ kh¶ n¨ng thÝch nghi ë sinh vËt ®Òu ®−îc chän läc tù nhiªn t¸c ®éng qua hµng
ngh×n, hµng triÖu thÕ hÖ. B¶ng 10.1 cho thÊy, tèc ®é tiÕn hãa cña c¸c ®ét biÕn ®ång
nghÜa chØ chËm h¬n chót Ýt so víi tèc ®é biÕn ®æi cña c¸c gen gi¶. §iÒu nµy còng ph¶n
¸nh r»ng, c¸c ®ét biÕn ®ång nghÜa kh«ng ph¶i lóc nµo còng lµ trung tÝnh; cô thÓ, mét sè
m· bé ba ®−îc chän läc tù nhiªn d−êng nh− “−u tiªn” chän lùa h¬n nh÷ng m· bé ba ®ång
nghÜa kh¸c. Gi¶ thiÕt nµy ®−îc cñng cè b»ng hiÖn t−îng c¸c m· bé ba ®ång nghÜa ®−îc sö

298
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

dông víi tÇn sè kh¸c nhau trong vïng m· hãa cña hÖ gen nhiÒu loµi sinh vËt. Ch¼ng
h¹n, tÝnh tho¸i hãa cña m· bé ba biÓu hiÖn ë 6 m· bé ba cïng m· hãa axit amin Leu lµ
UUA, UUG, CUU, CUC, CUA vµ CUG. Nh−ng trong thùc tÕ, 60% m· bé ba ®−îc dïng ®Ó
m· hãa Leu ë E. coli lµ CUG, vµ 80% m· bé ba ®−îc dïng m· hãa axit amin nµy ë nÊm
men lµ UUG. §Õn ®©y, chóng ta nhí r»ng: thùc tÕ c¸c m· bé ba ®ång nghÜa “kÕt cÆp” víi
bé ba ®èi m· cña c¸c ph©n tö tARN kh¸c nhau nh−ng cïng vËn chuyÓn mét lo¹i axit
amin (nãi c¸ch kh¸c, së dÜ cã tÝnh tho¸i hãa cña m· bé ba lµ do cã nhiÒu lo¹i tARN tuy
kh¸c nhau ë c¸c bé ba ®èi m· nh−ng cïng vËn chuyÓn mét lo¹i axit amin). V× vËy, cã thÓ
c¸c m· bé ba ®ång nghÜa kh«ng lµm thay ®æi c¸c axit amin trong ph©n tö protein, nh−ng
chóng lµm thay ®æi lo¹i tARN mµ ribosome sö dông trong qu¸ tr×nh dÞch m·. C¸c nghiªn
cøu nh×n chung cho thÊy: sè l−îng c¸c lo¹i tARN ®ång ®¼ng (cïng vËn chuyÓn mét lo¹i
axit amin) kh«ng gièng nhau; vµ lo¹i tARN phæ biÕn nhÊt còng chÝnh lµ lo¹i mang bé ba
®èi m· t−¬ng øng víi m· bé ba ®ång nghÜa ®−îc dïng phæ biÕn nhÊt. Chän läc tù nhiªn cã
lÏ ®· “−u tiªn” lùa chän mét sè m· bé ba ®ång nghÜa nµy so víi c¸c m· bé ba ®ång nghÜa
kh¸c v× lo¹i tARN t−¬ng øng víi m· bé ba ®−îc lùa chän lµ phæ biÕn h¬n. Ngoµi ra, n¨ng
l−îng liªn kÕt gi÷a c¸c m· bé ba trªn mARN víi bé ba ®èi m· trªn tARN lµ kh«ng gièng
nhau do thµnh phÇn cña c¸c baz¬ nit¬. Sù kh¸c biÖt vÒ n¨ng l−îng liªn kÕt trong qu¸
tr×nh dÞch m· cã thÓ lµ ®èi t−îng chÞu t¸c ®éng cña chän läc tù nhiªn. §iÒu nµy ®Æc biÖt
®óng ë nh÷ng gen ®−îc biÓu hiÖn m¹nh vµ ë c¸c loµi cã vßng ®êi ng¾n, kÝch th−íc quÇn
thÓ lín (nh− vi khuÈn, nÊm men vµ ruåi dÊm). Xu h−íng chän läc c¸c m· bé ba ®ång
nghÜa nh− vËy lµ mét b»ng chøng cho thÊy “søc m¹nh” cña chän läc tù nhiªn trong tiÕn
hãa. Ch¼ng h¹n, ngay gi÷a hai chñng vi khuÈn gièng nhau hoµn toµn vÒ mäi ho¹t ®éng
sèng, ngoµi mét kh¸c biÖt duy nhÊt ë mét bé ba m· ®ång nghÜa, th× kh¸c biÖt nhá ®ã còng
®ñ dÉn ®Õn viÖc chØ mét trong hai chñng tÕ bµo ®−îc duy tr× qua hµng triÖu thÕ hÖ tiÕn
hãa d−íi t¸c ®éng cña chän läc tù nhiªn. Chóng ta cã thÓ liªn t−ëng ®iÒu nµy qua h×nh
¶nh: mét c«ng ty A ph¶i tr¶ gi¸ cao 1% cho mét mÆt hµng mµ mçi n¨m hä ph¶i mua hµng
ngµn lÇn, víi mét c«ng ty B ph¶i tr¶ gi¸ cao 30% cho mét mÆt hµng hä chØ ph¶i mua mét
vµi lÇn, th× “lîi nhuËn” ®Çu t− cña c«ng ty B vÉn cao h¬n c«ng ty A vµ søc c¹nh tranh cña
c«ng ty B lµ lín h¬n.
B¶ng 10.2 cho thÊy, c¸c gen biÓu hiÖn m¹nh cã xu h−íng “−u tiªn” sö dông c¸c axit
amin cã chi phÝ n¨ng l−îng tæng hîp thÊp nÕu chóng cã cïng tÝnh chÊt hãa häc vµ cã thÓ
thay thÕ ®−îc. Trong tÕ bµo, n¨ng l−îng tiªu hao cho sù tæng hîp 20 lo¹i axit amin kh¸c
nhau lµ kh¸c nhau. VÝ dô, ®Ó tæng hîp mét ph©n tö Gly cÇn n¨ng l−îng t−¬ng ®−¬ng lµ
11,7 ph©n tö ATP; cßn ®Ó tæng hîp mét ph©n tö Trp cÇn n¨ng l−îng t−¬ng ®−¬ng lµ 78,3
ph©n tö ATP. Trong cÊu tróc cña c¸c protein, cã nh÷ng vÞ trÝ kh«ng thÓ thay thÕ ®−îc
axit amin Trp, nh−ng ë bÊt cø vÞ trÝ Trp nµo cã thÓ thay thÕ ®−îc b»ng Gly (hoÆc thËm
chÝ xãa bá hoµn toµn) th× chän läc tù nhiªn cã xu h−íng “−u tiªn” cho sù thay ®æi nh−
vËy. ë c¸c gen ®−îc biÓu hiÖn m¹nh, sù thay ®æi nµy t¹o ra hiÖu qu¶ tiÕt kiÖm n¨ng
l−îng cao nhÊt. ViÖc gi¶i tr×nh tù hoµn chØnh hµng tr¨m hÖ gen vi khuÈn gÇn ®©y ®· x¸c
nhËn nhËn ®Þnh nµy.

10.3.1.8. Trong hÖ gen, c¸c gen cã tèc ®é tiÕn hãa kh¸c nhau
Tèc ®é tiÕn hãa gi÷a c¸c gen trong hÖ gen, thËm chÝ gi÷a c¸c vïng kh¸c nhau trong
mét gen, lµ kh«ng gièng nhau. Sù kh¸c nhau nµy phô thuéc vµo hai yÕu tè: 1) sù kh¸c
nhau trong tÇn sè ®ét biÕn ë mçi gen, vµ 2) møc ®é t¸c ®éng cña chän läc tù nhiªn lªn mçi
locut. §Ó x¸c ®Þnh mét thay ®æi nucleotide trong hÖ gen lµ do tÝnh thÝch nghi hay chØ lµ
sù kiÖn ngÉu nhiªn, McDonald-Kreitman (1991) ®−a ra m« h×nh so s¸nh sù ®a h×nh di
truyÒn trong ph¹m vi mét loµi víi sù ph©n li gi÷a c¸c loµi kh¸c nhau t¹i c¸c vÞ trÝ ®ét
biÕn ®ång nghÜa vµ kh¸c nghÜa trong vïng m· hãa cña gen. NÕu ë mét gen, tØ sè gi÷a ®ét
biÕn kh¸c nghÜa so víi ®ét biÕn ®ång nghÜa trong ph¹m vi mét loµi t−¬ng ®−¬ng víi gi÷a

299
§inh §oµn Long

B¶ng 10.2. TÇn sè sö dông axit amin trong 10% c¸c s¶n phÈm cña gen cã møc biÓu hiÖn cao nhÊt vµ
10% c¸c s¶n phÈm cña gen cã møc biÓu hiÖn ë møc thÊp nhÊt ë 3 loµi sinh vËt nh©n s¬

Streptococcus Bacillus subtilis subsp.


§é lÖch tõ Escherichia coli K12
Chi phÝ n¨ng pneumonia R6 subtilis str. 168
Axit chi phÝ
l−îng tæng §é lÖch §é lÖch §é lÖch
amin(*) n¨ng l−îng
hîp (sè ATP) ThÊp Cao tÇn sè ThÊp Cao tÇn sè ThÊp Cao tÇn sè
trung b×nh
sö dông sö dông sö dông
Gly (G) 11,7 - 15,66 6,40 8,16 1,76 6,01 8,30 2,29 6,12 8,11 1,99
Ser (S) 11,7 - 15,66 6,65 4,99 - 1,67 6,47 4,96 - 1,51 6,24 5,84 - 0,40
Ala (A) 11,7 - 15,66 8,48 9,76 1,27 5,85 9,80 3,95 7,40 8,70 1,30
Asp (D) 12,7 - 14,66 4,81 5,95 1,15 4,85 6,04 1,19 5,06 5,42 0,36
Asn (N) 14,7 - 12,66 4,45 3,92 - 0,52 3,64 4,60 0,96 3,32 4,24 0,92
Glu (E) 15,3 - 12,06 5,23 7,10 1,87 6,54 7,91 1,37 6,71 8,11 1,40
Gln (Q) 16,3 - 11,06 4,48 3,83 - 0,66 4,43 3,33 - 1,10 3,98 3,46 - 0,52
Thr (T) 18,7 - 8,66 5,41 5,22 - 0,19 4,78 5,97 1,19 4,92 5,82 0,89
Pro (P) 20,3 - 7,06 4,22 4,08 - 0,15 3,17 3,72 0,55 3,87 3,62 - 0,25
Val (V) 23,3 - 4,06 6,24 7,64 1,39 6,54 8,13 1,59 6,59 7,94 1,35
Cys (C) 24,7 - 2,66 1,50 0,92 - 0,57 0,88 0,33 - 0,55 1,02 0,52 - 0,50
Arg (R) 27,3 - 0,06 5,38 5,45 0,07 4,61 4,21 - 0,40 4,71 3,99 - 0,72
Leu (L) 27,3 - 0,06 11,56 8,96 - 2,59 12,70 7,97 - 4,73 10,85 8,40 - 2,45
Lys (K) 30,3 + 2,94 4,34 5,66 1,32 5,96 7,16 1,19 6,25 7,55 1,30
Ile (I) 32,3 + 4,94 6,72 6,03 - 0,69 7,74 6,41 - 1,33 6,79 7,14 0,35
Met (M) 34,3 + 6,94 2,39 2,70 0,31 2,29 2,07 - 0,22 2,65 2,28 - 0,37
His (H) 38,3 + 10,94 2,50 2,05 - 0,45 2,21 1,61 - 0,60 2,74 1,80 - 0,93
Tyr (Y) 50,0 + 22,64 3,15 2,82 - 0,34 4,44 2,96 - 1,48 3,94 2,85 - 1,09
Phe (F) 52,0 + 24,64 4,35 3,71 - 0,64 5,76 3,69 - 2,07 5,56 3,53 - 2,04
Trp (W) 74,3 + 46,94 1,73 1,05 - 0,69 1,13 0,81 - 0,32 1,27 0,67 - 0,60
( )
* C¸c axit amin ®−îc xÕp theo thø tù møc chi phÝ n¨ng l−îng cÇn ®Ó tæng hîp nªn mét ph©n tö axit amin t¨ng dÇn (tÝnh t−¬ng ®−¬ng víi sè liªn kÕt
pyrophosphate cÇn “®øt g·y” tõ ATP ®Ó gi¶i phãng n¨ng l−îng tù do cÇn cho qu¸ tr×nh tæng hîp)(theo Akashi vµ Gojobori, 2002)

c¸c loµi kh¸c nhau, th× hÇu hÕt c¸c ®ét B¶ng 10.3. Tèc ®é thay thÕ nucleotide trung b×nh
biÕn ë gen nµy lµ trung tÝnh; tøc lµ, sù trong tr×nh tù ADN cña c¸c gen ®éng vËt cã vó
thay thÕ nucleotide cã khuynh h−íng Tèc ®é ®ét biÕn(*) Tèc ®é ®ét biÕn
ngÉu nhiªn. Nh−ng nÕu nh÷ng tØ sè nµy C¸c gen
kh¸c nghÜa ®ång nghÜa
kh¸c nhau, th× cã sù t¸c ®éng cña chän Histone H4 0,004 1,43
läc tù nhiªn lªn locut. Nãi c¸ch kh¸c, sù Insulin 0,16 5,41
thay thÕ nucleotide ë ®©y cã khuynh Prolactin 1,29 5,59
h−íng lµm t¨ng tÝnh thÝch nghi cña sinh α-Globin 0,56 3,94
vËt. β-Globin 0,87 2,96
Albumin 0,92 6,72
ë ®éng vËt cã vó, tØ sè gi÷a ®ét
α-Fetoprotein 1,21
4,90
biÕn thay thÕ kh¸c nghÜa víi ®ång nghÜa
MHC 5,10 2,40
lµ kh¸c nhau râ rÖt ë c¸c locut kh¸c
Apolipoprotein E 0,98 4,04
nhau (b¶ng 10.3). §iÒu nµy ph¶n ¸nh, ( )
* Tèc ®é ®ét biÕn ë ®©y lµ sè lÇn thay ®æi nucleotide t¹i mçi vÞ trÝ nucleotide
chän läc tù nhiªn t¸c ®éng víi “c−êng ®é” trªn gen x¶y ra trung b×nh hµng n¨m (x 10-9)
kh¸c nhau lªn mçi locut. VÝ dô vÒ hai
nhãm gen m· hãa cho protein lµ histone vµ apolipoprotein minh häa cho thÊy hiÖu qu¶
t¸c ®éng cña chän läc tù nhiªn cßn tïy thuéc vµo chøc n¨ng cña protein. Cô thÓ, histone
lµ c¸c protein tÝch ®iÖn d−¬ng, cã chøc n¨ng liªn kÕt ADN vµ lµ thµnh phÇn thiÕt yÕu cña

300
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

chÊt nhiÔm s¾c ë tÊt c¶ c¸c sinh vËt nh©n thËt. HÇu nh− tÊt c¶ c¸c axit amin cã trong
ph©n tö histone (vÝ dô H4) ®Òu t−¬ng t¸c víi c¸c gèc hãa häc kh¸c nhau trªn ph©n tö
ADN tÝch ®iÖn ©m. V× vËy, gÇn nh− tÊt c¶ mäi sù thay ®æi trªn ph©n tö histone H4 ®Òu
¶nh h−ëng ®Õn kh¶ n¨ng t−¬ng t¸c cña protein nµy víi ADN. Nh− vËy, histone lµ mét
trong nh÷ng nhãm protein cã tèc ®é tiÕn hãa chËm nhÊt. ThËm chÝ, cã thÓ thay thÕ
histone H4 cña ng−êi b»ng histone H4 cña nÊm men mµ kh«ng lµm thay ®æi hiÖu qu¶
kiÓu h×nh (dï r»ng nÊm men vµ ng−êi ®· t¸ch li tiÕn hãa tõ hµng tr¨m triÖu n¨m). §iÒu
nµy ng−îc víi c¸c apolipoprotein phæ biÕn trong hÖ miÔn dÞch ë §VCXS, vèn cã chøc n¨ng
t−¬ng t¸c vµ vËn chuyÓn kh«ng ®Æc hiÖu nhiÒu hîp chÊt lipide kh¸c nhau. MiÒn liªn kÕt
lipide cña protein nµy gåm thµnh phÇn chñ yÕu lµ c¸c axit amin kÞ n−íc. C¸c axit amin
cã tÝnh kÞ n−íc (vÝ dô: Leu, Ile vµ Val) ®Òu cã thÓ thay thÕ nhau trong miÒn liªn kÕt nµy
mµ kh«ng lµm thay ®æi chøc n¨ng cña protein. KÕt qu¶ lµ, nÕu nh− histone H4 chØ thÊy
cã mét d¹ng duy nhÊt ë ng−êi, th× apolipoprotein cã hµng chôc d¹ng kh¸c nhau.
MÆc dï phÇn lín nh÷ng thay ®æi axit amin ë hÇu hÕt protein th−êng lµ cã h¹i vµ bÞ
chän läc tù nhiªn ®µo th¶i, nh−ng còng cã mét sè locut gen chän läc tù nhiªn l¹i “−u tiªn”
t¨ng sù biÕn ®æi. VÝ dô ®iÓn h×nh vÒ xu h−íng nµy lµ c¸c nhãm gen cña hÖ thèng miÔn
dÞch, bao gåm phøc hÖ t−¬ng hîp m«, c¸c côm gen m· hãa kh¸ng thÓ hoÆc thô thÓ tÕ bµo
T (xem ch−¬ng 9). Ch¼ng h¹n, c¸c gen m· hãa phøc hÖ t−¬ng hîp m« MHC lu«n kh¸c
nhau gi÷a mçi c¸ thÓ (trõ tr−êng hîp ®a sinh cïng trøng). V× vËy, tØ lÖ ®é biÕn kh¸c
nghÜa trong c¸c gen MHC lín h¬n nhiÒu so víi tØ lÖ ®ét biÕn ®ång nghÜa (b¶ng 10.3).
MHC lµ mét hä lín cña nhiÒu gen mµ s¶n phÈm do chóng m· hãa quyÕt ®Þnh kh¶ n¨ng
nhËn biÕt c¸c kh¸ng nguyªn l¹ cña hÖ thèng miÔn dÞch. Trong c¸c quÇn thÓ ng−êi,
kho¶ng 90% c¸c c¸ thÓ nhËn c¸c nhãm gen MHC kh¸c nhau tõ bè vµ mÑ. Khi ph©n tÝch
mét nhãm bÊt kú gåm kho¶ng 200 c¸ thÓ, sè alen kh¸c biÖt cña locut MHC dao ®éng tõ
15 ®Õn 30 alen. Møc ®é ®a d¹ng cao cña nh÷ng vïng gen nµy ®−îc chän läc tù nhiªn duy
tr×. Bëi v× sè lo¹i virut vµ c¸c thÓ g©y nhiÔm lµ rÊt lín, nªn viÖc duy tr×nh tÝnh ®a h×nh
cao sÏ gióp t¨ng sè c¸ thÓ (trong quÇn thÓ) cã kh¶ n¨ng kh¸ng víi nhiÒu lo¹i virut (thùc
chÊt lµ ph¸t hiÖn ®−îc kh¸ng nguyªn cña virut ®ã). Nh−ng, trong qu¸ tr×nh tiÕn hãa,
song song víi viÖc c¸c quÇn thÓ vËt chñ duy tr× tÝnh ®a d¹ng cao cña hÖ thèng miÔn dÞch
th× c¸c virut còng cã tèc ®é tiÕn hãa rÊt nhanh. C¸c gen virut cóm cã tèc ®é thay thÕ
nucleotide ®¹t 1,9x10-3 nucleotide mçi n¨m, tøc lµ gÊp 1 triÖu lÇn tèc ®é ®ét biÕn ®ång
nghÜa ë vïng m· hãa cña c¸c gen ®éng vËt cã vó.

10.3.2. So s¸nh c¸c hÖ gen


10.3.2.1. So s¸nh hÖ gen lµ c«ng cô nghiªn cøu tiÕn hãa vµ x¸c ®Þnh chøc n¨ng gen
Xu h−íng tiÕn hãa chËm cña c¸c tr×nh tù ADN lµ c¬ së cña lÜnh vùc nghiªn cøu hÖ
gen häc so s¸nh (comparative genomics). Trong ®ã, toµn bé hÖ gen cña c¸c loµi kh¸c
nhau ®−îc so s¸nh víi nhau. Mét trong nh÷ng môc tiªu cña c¸c dù ¸n gi¶i tr×nh tù hÖ
gen ë mçi loµi sinh vËt lµ lËp b¶n ®å ®Çy ®ñ cña c¸c gen, nghÜa lµ x¸c ®Þnh vÞ trÝ cña
chóng trªn mçi NST. ViÖc lËp b¶n ®å c¸c gen trong hÖ gen ng−êi ®−îc coi lµ nÒn t¶ng cho
tiÒm n¨ng øng dông kü thuËt thuËt di truyÒn vµ liÖu ph¸p gen trong viÖc ch÷a trÞ c¸c
gen sai háng ë c¸c bÖnh do ®ét biÕn g©y ra, nh− bÖnh hãa x¬ nang hay c¸c bÖnh ung th−.
Nh−ng trong thùc tÕ, nÕu chØ x¸c ®Þnh ®−îc vÞ trÝ mét gen nµo ®ã trªn NST th× kh«ng ®ñ
®Ó chØ ra chøc n¨ng cña gen ®ã, còng nh− kh«ng râ gen ®ã t−¬ng t¸c thÕ nµo víi c¸c gen
vµ c¸c tr×nh tù kh¸c trong hÖ gen. Cã ®Õn 95% tr×nh tù ADN thuéc c¸c hÖ gen sinh vËt
bËc cao lµ c¸c tr×nh tù kh«ng m· hãa. V× vËy, ngay c¶ khi toµn bé tr×nh tù mét hÖ gen ®·
®−îc gi¶i m·, th× viÖc x¸c ®Þnh ph©n ®o¹n nµo lµ vïng m· hãa vµ chøc n¨ng cña s¶n
phÈm do chóng m· hãa th−êng kh«ng dÔ dµng. Trong bèi c¶nh ®ã, viÖc so s¸nh c¸c tr×nh

301
§inh §oµn Long

tù hÖ gen lµ mét trong nh÷ng c¸ch tèt nhÊt ®Ó dù ®o¸n chøc n¨ng cña mét tr×nh tù nhÊt
®Þnh trong hÖ gen. Cô thÓ lµ, viÖc ph¸t hiÖn ra c¸c tr×nh tù gièng nhau ë hai loµi kh¸c xa
nhau lµ dÊu hiÖu cho thÊy vai trß rÊt quan träng cña nh÷ng tr×nh tù nµy. VÝ dô, ng−êi vµ
chuét cã tæ tiªn chung c¸ch ®©y kho¶ng 80 – 100 triÖu n¨m. NÕu c¸c gen gi¶ cã tèc ®é thay
thÕ nucleotide lµ 5x10-9 t¹i mçi nucleotide mçi n¨m, th× gÇn 1/2 tæng sè nucleotide cña
nh÷ng gen nµy (kh«ng bÞ chän läc tù nhiªn ®µo th¶i) sÏ biÕn ®æi Ýt nhÊt mét lÇn kÓ tõ khi
tæ tiªn cña ng−êi vµ chuét b¾t ®Çu t¸ch li. Trªn c¬ së ®ã, khi so s¸nh c¸c hÖ gen, cã thÓ
nhËn biÕt c¸c vïng cã vai trß quan träng, nh− c¸c ®o¹n m· hãa hay c¸c tr×nh tù liªn kÕt
protein ®iÒu hßa t¹i promoter,...
Ph−¬ng ph¸p so s¸nh hÖ gen lµ mét c«ng cô kh«ng chØ h÷u hiÖu trong viÖc x¸c ®Þnh
vai trß c¸c tr×nh tù trong hÖ gen mµ cßn trong c¸c nghiªn cøu tiÕn hãa. Tuy vËy, ph−¬ng
ph¸p so s¸nh hÖ gen còng cã mét sè h¹n chÕ. Ch¼ng h¹n, mét sè gen ë ng−êi kh«ng t×m
thÊy gen “®èi t¸c” ë mét sè ®éng vËt bËc thÊp nªn kh«ng thÓ so s¸nh. Ngoµi ra, mét sè
protein cã vai trß ®a chøc n¨ng nh−ng sù biÓu hiÖn chøc n¨ng cña nh÷ng protein ®ã
kh«ng gièng nhau ë tÊt c¶ c¸c loµi.

10.3.2.2. Tèc ®é tiÕn hãa cña hÖ gen ti thÓ


So víi hÖ gen nh©n, hÖ gen ti thÓ cã ph−¬ng thøc sao chÐp vµ di truyÒn kh¸c biÖt.
Do vËy, hËu qu¶ cña c¸c ®ét biÕn thay thÕ trong hÖ gen ti thÓ vÒ c¨n b¶n còng kh¸c hÖ
gen nh©n. HÖ gen ti thÓ ®éng vËt cã vó chøa mét ph©n tö ADN (kÝ hiÖu lµ mtADN) cã
d¹ng sîi kÐp, m¹ch vßng, dµi kho¶ng 15.000 bp. Ph©n tö mtARN cña ng−êi kh¸ ®Æc
tr−ng víi kÝch th−íc b»ng kho¶ng 1/10.000 hÖ gen nh©n; m· hãa cho 2 lo¹i rARN, 22 lo¹i
tARN vµ 13 lo¹i protein. Víi kÝch th−íc nhá vµ tØ lÖ ®ét biÕn thay thÕ nucleotide ®Æc biÖt
cao, hÖ gen ti thÓ lµ mét ®èi t−îng nghiªn cøu tiÕn hãa phï hîp.
TØ lÖ ®ét biÕn thay thÕ nucleotide ®ång nghÜa ë c¸c gen ti thÓ ng−êi vµo kho¶ng
5,7x10-8 nucleotide mçi n¨m, gÊp 10 lÇn tØ lÖ ®ét biÕn ®ång nghÜa trung b×nh trong vïng
m· hãa cña hÖ gen nh©n. TØ lÖ ®ét biÕn kh¸c nghÜa ë c¸c gen m· hãa protein thuéc hÖ gen
ti thÓ rÊt kh¸c nhau. Nh−ng, trong mäi tr−êng hîp, tØ lÖ nµy ®Òu cao h¬n nhiÒu tØ lÖ ®ét
biÕn kh¸c nghÜa ë c¸c gen thuéc hÖ gen nh©n. C¬ chÕ nµo dÉn ®Õn viÖc mtADN cã tèc ®é
thay ®æi nucleotide lín h¬n nhiÒu so víi ADN hÖ gen nh©n ®Õn nay ch−a râ, nh−ng cã thÓ
liªn quan ®Õn tÇn sè sai sãt cao trong qu¸ tr×nh sao chÐp vµ söa ch÷a mtADN (ti thÓ
kh«ng cã nhiÒu c¬ chÕ söa ch÷a ADN nh− hÖ gen nh©n). Ngoµi ra, nång ®é cao h¬n cña
c¸c chÊt g©y ®ét biÕn, bao gåm c¸c gèc tù do chøa oxy (nh− O2-) vèn lµ s¶n phÈm cña qu¸
tr×nh trao ®æi chÊt diÔn ra trong ti thÓ còng cã thÓ lµ mét nguyªn nh©n dÉn ®Õn tÇn sè
®ét biÕn trong c¸c gen ti thÓ cao h¬n. Mét nguyªn nh©n kh¸c còng cã thÓ lµ do ¸p lùc
thÊp h¬n cña chän läc tù nhiªn ®èi víi hÖ gen ti thÓ v× trong mçi tÕ bµo cã hµng chôc ti
thÓ kh¸c nhau, trong ®ã trung b×nh mçi ti thÓ chøa 2 b¶n sao mtADN. §ã lµ ch−a kÓ ®Õn
c¸c thay ®æi x¶y ra trong phÇn lín c¸c protein, tARN vµ rARN ®−îc hÖ gen ti thÓ m· hãa
Ýt g©y ¶nh h−ëng tíi søc sèng cña c¬ thÓ sinh vËt h¬n so víi nh÷ng thay ®æi t−¬ng tù
trong hÖ gen nh©n (®Æc biÖt ë c¸c sinh vËt ®a bµo). Mét kh¸c biÖt n÷a gi÷a hÖ gen ti thÓ
vµ hÖ gen nh©n lµ hÖ gen ti thÓ chñ yÕu ®−îc di truyÒn theo dßng mÑ. Ti thÓ n»m trong tÕ
bµo chÊt, mµ hÇu nh− chØ cã tÕ bµo chÊt tõ trøng (cña mÑ) ®ãng gãp vµo tÕ bµo chÊt hîp
tö. KÕt qu¶ lµ, mtADN kh«ng tr¶i qua gi¶m ph©n mµ cã kiÓu gen gièng mÑ. ViÖc hÖ gen
ti thÓ tån t¹i ë tr¹ng th¸i ®¬n béi vµ kh«ng tr¶i qua gi¶m ph©n (nghÜa lµ kh«ng cã t¸i tæ
hîp do trao ®æi chÐo nh− cÆp NST t−¬ng ®ång trong hÖ gen nh©n) dÉn ®Õn quan ®iÓm cho
r»ng hÇu hÕt c¸c ®ét biÕn thay thÕ nucleotide trong hÖ gen ti thÓ lµ do ®ét biÕn (chø
kh«ng ph¶i do t¸i tæ hîp di truyÒn) sinh ra. KiÓu di truyÒn nµy cïng víi tèc ®é thay ®æi
nhanh cña hÖ gen ti thÓ cung cÊp mét c«ng cô hiÖu qu¶ cho nghiªn cøu tiÕn hãa vµ so
s¸nh hÖ gen gi÷a c¸c loµi; hoÆc gi÷a c¸c dßng, gièng, chñng téc … cña cïng mét loµi.

302
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

10.3.3. So s¸nh nhiÔm s¾c thÓ


ViÖc so s¸nh kiÓu h×nh NST gi÷a c¸c loµi, ®Æc biÖt ë sinh vËt nh©n thËt, lµ mét
ph−¬ng ph¸p nghiªn cøu c¬ b¶n ®· cung cÊp nhiÒu th«ng tin quan träng vÒ qu¸ tr×nh
h×nh thµnh c¸c loµi. C¸c ®o¹n NST, c¸c gen (hoÆc c¸c ph©n ®o¹n gen) vµ protein (hoÆc
c¸c ®o¹n tr×nh tù axit amin) gièng nhau ë nhiÒu loµi kh¸c nhau ®−îc gäi lµ c¸c ®o¹n
tr×nh tù b¶o thñ cao. KiÓu h×nh nhuém b¨ng NST (cßn gäi lµ “kiÓu nh©n”) cña ng−êi
gièng víi tinh tinh h¬n c¶, sau ®ã lµ víi khØ Gorilla vµ ®−êi −¬i (h×nh 10.9). KiÓu nh©n
cña ng−êi, tinh tinh vµ c¸c loµi v−în ng−êi chñ yÕu kh¸c nhau do mét sè ®ét biÕn ®¶o
®o¹n NST (x¶y ra trªn cïng NST). Cßn sù kh¸c biÖt chñ yÕu gi÷a kiÓu nh©n cña ng−êi vµ
ba loµi v−în ng−êi nµy víi c¸c loµi linh tr−ëng l©u ®êi h¬n chñ yÕu lµ do c¸c ®ét biÕn
chuyÓn ®o¹n NST (x¶y ra gi÷a c¸c NST). NÕu c¶ hai b¶n sao NST sè 2 cña ng−êi bÞ “®øt”
lµm ®«i th× kiÓu nh©n cña ng−êi sÏ cã 48 NST vµ lóc ®ã sÏ gièng víi kiÓu nh©n cña c¸c
loµi v−în ng−êi. KiÓu h×nh nhuém b¨ng NST sè 1 cña ng−êi, tinh tinh, khØ Gorilla vµ
®−êi −¬i gièng víi kiÓu h×nh nhuém b¨ng cña hai NST nhá t×m thÊy ë mét loµi khØ ®u«i
xanh Ch©u Phi. §iÒu nµy cho thÊy, loµi khØ nµy cã quan hÖ di truyÒn, hoÆc thËm chÝ lµ tæ
tiªn cña c¸c loµi linh tr−ëng kh¸c. Khi so s¸nh kiÓu h×nh nhuém b¨ng NST cña c¸c loµi
cã quan hÖ xa h¬n, ng−êi ta nhËn thÊy kiÓu h×nh nhuém b¨ng cña NST X gièng nhau ë
tÊt c¶ c¸c loµi ®éng vËt cã vó.
KiÓu h×nh nhuém b¨ng NST gièng nhau ë nhiÒu loµi ®éng vËt rÊt kh¸c nhau vÒ
h×nh th¸i lµ mét b»ng chøng cho thÊy nguån gèc chung cña c¸c sinh vËt trªn Tr¸i ®Êt.
Nh−ng, v× c¸c ®o¹n NST cã kiÓu h×nh nhuém b¨ng gièng nhau nh−ng ch−a ch¾c mang
c¸c gen cã tr×nh tù hoµn toµn gièng nhau nªn viÖc so s¸nh NST kh«ng ph¶i lµ ph−¬ng
ph¸p lý t−ëng ®Ó x¸c ®Þnh kho¶ng c¸ch di truyÒn gi÷a c¸c loµi. Kü thuËt nhuém b¨ng
NST theo nguyªn t¾c lai huúnh quang t¹i chç - FISH (xem ch−¬ng 11), sö dông c¸c
mÉu dß ADN ®¸nh dÊu huúnh quang, cho phÐp so s¸nh c¸c NST t¹i c¸c vÞ trÝ gen ®Æc
thï. Sù t−¬ng quan vÒ trËt tù c¸c gen trªn NST gi÷a c¸c loµi lµ c¬ së x¸c ®Þnh mèi quan
hÖ tiÕn hãa gi÷a chóng. Ch¼ng h¹n, mét nhãm gåm 11 gen liªn kÕt ®−îc t×m thÊy ®ång
thêi trªn vai dµi NST sè 11 cña ng−êi, trªn NST sè 16 cña chuét vµ NST U10 ë bß. Tuy
vËy, mét sè gen liªn kÕt trªn NST sè 3 vµ NST sè 21 cña ng−êi ®−îc t×m thÊy cïng n»m

N T G§ N T G § N T G § N T G § N T G § N T G §
NST sè 1 NST sè 2 NST sè 3 NST sè 4 NST sè 5 NST sè 6
H×nh 10.9. Sù gièng nhau vÒ kiÓu h×nh nhuém b¨ng NST gi÷a ng−êi vµ c¸c loµi linh tr−ëng. NST c¸c loµi
®−îc xÕp theo thø tù tõ tr¸i qua ph¶i gåm ng−êi (N), tinh tinh (T), khØ Gorilla (G) vµ ®−êi −¬i (§). §©y lµ c¸c NST
t−¬ng øng víi c¸c NST tõ 1 ®Õn 6 cña ng−êi. C¸c NST kh¸c gi÷a c¸c loµi nµy còng cã sù t−¬ng ®ång cao. NÕu
NST sè 2 cña ng−êi “®øt” lµm ®«i th× ng−êi còng cã kiÓu nh©n gåm 48 NST nh− c¸c loµi linh tr−ëng kh¸c.

303
§inh §oµn Long

trªn mét NST ë chuét vµ bß. §iÒu nµy ®−a ®Õn gi¶ thiÕt lµ: loµi ®éng vËt cã vó vèn lµ tæ
tiªn chung cña ba loµi nªu trªn cïng cã c¸c gen nµy liªn kÕt víi nhau trªn mét NST; sau
®ã, chóng “ph¸t t¸n” ®Õn c¸c NST kh¸c trong qu¸ tr×nh tiÕn hãa.

10.3.4. So s¸nh c¸c tr×nh tù protein


Sù kiÖn tÊt c¶ mäi d¹ng sèng trªn Tr¸i ®Êt ®Òu sö dông mét m· di truyÒn chung ®Ó
tæng hîp nªn c¸c lo¹i protein lµ b»ng chøng cho thÊy tÊt c¶ mäi d¹ng sèng trªn Tr¸i ®Êt
cã chung mét tæ tiªn. ViÖc so s¸nh c¸c tr×nh tù protein gi÷a c¸c loµi sinh vËt kh¸c nhau
còng bæ sung thªm d÷ liÖu ñng hé gi¶ thiÕt nµy. VÝ dô, c¸c gen m· hãa keratin tæng hîp
protein l«ng cõu cã ®o¹n t−¬ng ®ång n»m trªn NST sè 11 cña ng−êi. Sù gièng nhau vÒ
thµnh phÇn vµ tr×nh tù axit amin trong c¸c lo¹i protein t−¬ng øng ë ng−êi vµ tinh tinh lµ
®¸ng ng¹c nhiªn (kho¶ng 99%). Mét sè protein cña hai loµi gièng nhau hoµn toµn. Trªn
c¬ së ®ã, khi ph©n tÝch chøc n¨ng cña mét gen míi, c¸c nhµ nghiªn cøu cã thÓ tham kh¶o
c¸c d÷ liÖu cã s½n vÒ nh÷ng gen ®· biÕt ë c¸c sinh vËt kh¸c. Hai vÝ dô d−íi ®©y lµ vÒ hai
trong sè nh÷ng lo¹i protein cã tÝnh b¶o thñ nhÊt

10.3.4.1. Cytochrome C
Cã lÏ, cytochrome C lµ mét protein ®−îc
B¶ng 10.4. Sù tiÕn hãa trong tr×nh tù axit
nghiªn cøu kü nhÊt ®Õn nay vÒ khÝa c¹nh tiÕn amin cña protein cytochrom C
hãa. Protein nµy cã vai trß “b¾t gi÷” n¨ng l−îng Sè axit amin kh¸c biÖt víi
Loµi
tõ c¸c chÊt dinh d−ìng trong qu¸ tr×nh h« hÊp tÕ cytochrom C cña ng−êi
bµo ë ti thÓ. 20 trong tæng sè 104 axit amin cña Tinh tinh 0
protein nµy cã vÞ trÝ gièng hÖt nhau ë tÊt c¶ c¸c KhØ Rhesus 1
loµi eukaryote. Hai loµi cµng cã quan hÖ gÇn, th× Thá 9
Bß 10
cã møc ®é gièng nhau vÒ tr×nh tù axit amin trªn
Chim bå c©u 12
ph©n tö cytochrome C cµng cao. VÝ dô,
Õch 20
cytochrome C cña ng−êi kh¸c cña ngùa lµ 12 axit Ruåi giÊm 24
amin, kh¸c víi cytochrome C cña k¨ng¬ru lµ 8 Lóa m× 37
axit amin, nh−ng gièng hÖt cytochrome C cña NÊm men 42
tinh tinh (b¶ng 10.4).

10.3.4.2. C¸c protein homeobox


Mét nhãm gen kh¸c còng thay ®æi rÊt Ýt trong suèt qu¸ tr×nh tiÕn hãa ®−îc gäi lµ
c¸c gen homeobox, gäi t¾t lµ HOX. C¸c gen nµy m· hãa cho c¸c yÕu tè phiªn m· ®iÒu
khiÓn thø tù “bËt” vµ “t¾t” c¸c gen trong qu¸ tr×nh ph¸t triÓn ph«i. Sù phèi hîp gi÷a c¸c
yÕu tè phiªn m· nµy víi c¸c yÕu tè phiªn m· kh¸c quy ®Þnh vÞ trÝ vµ thêi ®iÓm ph¸t sinh
c¸c c¬ quan ë ph«i. C¸c protein homeobox cã mét ®o¹n tr×nh tù b¶o thñ cao gåm 60 axit
amin, gäi lµ miÒn homeo (hay cßn gäi lµ miÒn ®ång h×nh, homeodomain), ®−îc m· hãa bëi
mét ®o¹n tr×nh tù 180 nucleotide trªn ADN (còng ®−îc gäi lµ homeobox). TÊt c¶ c¸c gen
mang ®o¹n tr×nh tù homeobox ®−îc gäi lµ c¸c gen kiÓu homeo. C¸c gen kiÓu homeo
®−îc t×m thÊy ë c¶ ®éng bËc thÊp (cã cÊu t¹o c¬ thÓ ®¬n gi¶n nh− søa) còng nh− ë ®éng
vËt bËc cao (cã cÊu t¹o c¬ thÓ phøc t¹p nh− con ng−êi). ë tÊt c¶ c¸c loµi mµ c¸c gen
HOX ®· ®−îc gi¶i tr×nh tù, c¸c gen nµy ®Òu cã vai trß “bè trÝ cÊu tróc c¬ thÓ”. HÖ gen
ng−êi vµ c¸c loµi ®éng vËt cã x−¬ng sèng cã 39 gen HOX, ®−îc tæ chøc thµnh 4 côm gen,
kÝ hiÖu lµ A, B, C vµ D. C¸c gen nµy ®Òu chøa rÊt Ýt intron. §iÓm ®¸ng l−u ý ë c¸c côm
gen HOX lµ mçi gen chØ ®−îc biÓu hiÖn vµo mét thêi ®iÓm nhÊt ®Þnh vµ theo mét trËt tù
nhÊt ®Þnh ®−îc ®iÒu khiÓn nghiªm ngÆt trong qu¸ tr×nh ph¸t triÓn ph«i. Thø tù biÓu
hiÖn c¸c gen t−¬ng øng ®óng víi thø tù vÞ trÝ cña chóng trªn NST. C¸c thuËt ng÷

304
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

“homeobox” vµ “homeodomain” cã xuÊt xø tõ “homeotic” nghÜa lµ “thuéc phÇn ®ét biÕn”.


Së dÜ nh− vËy, v× nh÷ng gen homeobox ®Çu tiªn ®−îc t×m thÊy liªn quan ®Õn c¸c ®ét
biÕn g©y rèi lo¹n cÊu tróc th©n ë ruåi giÊm. Vai trß trong tiÕn hãa cña mét sè gen
homeobox ®· ®−îc nªu ë môc 10.2.
C¸c ®ét biÕn ë c¸c gen homeobox g©y nªn mét sè bÖnh di truyÒn ë ng−êi. ë mét
d¹ng bÖnh “m¸u tr¾ng”, mét ®ét biÕn gen homeobox lµm cho mét sè tÕ bµo b¹ch cÇu ch−a
thµnh thôc (ch−a chÝn) chuyÓn sang con ®−êng ph¸t triÓn c¬ quan bÊt th−êng. TÕ bµo bÊt
th−êng nµy duy tr× tèc ®é ph©n chia nhanh vèn cã cña tÕ bµo b¹ch cÇu ch−a chÝn dÉn ®Õn
bÖnh ung th−. Mét bÖnh kh¸c còng cã nguyªn nh©n tõ ®ét biÕn gen homeobox ®−îc gäi lµ
Héi chøng §i-Gioãcd¬ (DiGeorge). MÆc dï c¸c c¸ thÓ bÞ bÖnh nµy kh«ng cã kiÓu h×nh
“ch©n mäc tõ ®Çu” nh− ë c«n trïng (xem môc 10.2) nh−ng kiÓu biÓu hiÖn th× t−¬ng tù.
Nh÷ng c¸ thÓ m¾c héi chøng nµy th−êng thiÕu tuyÕn øc vµ tuyÕn cËn gi¸p; c¸c c¬ quan
nh− tai, mòi, miÖng, cæ ... ph¸t triÓn bÊt th−êng. Nh− vËy, vÞ trÝ cña c¸c c¬ quan bÊt
th−êng nµy còng t−¬ng quan víi c¸c ®èt th©n phÝa tr−íc ë c«n trïng.
Mét sè thÝ nghiÖm chuyÓn gen homeobox tõ loµi nµy sang loµi kh¸c cho thÊy vai trß
thiÕt yÕu vµ chøc n¨ng gièng nhau cña c¸c gen homeobox cã nguån gèc tõ c¸c loµi kh¸c
nhau. Khi ruåi giÊm ®−îc chuyÓn gen homeobox tõ chuét, kiÓu h×nh ®ét biÕn xuÊt hiÖn
còng gièng hÖt nh− khi gen homeobox cña chÝnh ruåi giÊm biÓu hiÖn bÊt th−êng. T−¬ng
tù nh− vËy, khi gen homeobox cña ng−êi ®−îc chuyÓn vµo chuét, sù biÓu hiÖn chøc n¨ng
cña nã gièng víi gen “®èi t¸c” cña chuét. Nh− vËy, ho¹t ®éng cña c¸c gen homeobox cã lÏ
lµ c¬ chÕ c¬ b¶n ®iÒu khiÓn qu¸ tr×nh ph¸t triÓn ë mäi sinh vËt ®a bµo.

10.4. §ång hå ph©n tö vµ x©y dùng c©y chñng lo¹i ph¸t sinh
10.4.1. ThuyÕt ®ång hå ph©n tö
10.4.1.1. C¬ së h×nh thµnh thuyÕt ®ång hå ph©n tö
Nh− nªu ë trªn, møc ®é thay thÕ nucleotide t¹i mçi vïng ADN cña hÖ gen còng nh−
sù thay thÕ axit amin trong c¸c ph©n tö protein ®−îc c¸c gen m· hãa lµ kh¸c nhau, vµ
phô thuéc vµo ¸p lùc cña chän läc tù nhiªn lªn mçi locut vµ chøc n¨ng cña c¸c s¶n phÈm
gen. Tuy vËy, ë c¸c locut cã ¸p lùc chän läc t−¬ng ®−¬ng th× tèc ®é thay ®æi trong c¸c
tr×nh tù ADN lµ æn ®Þnh, khi xÐt trong qu·ng thêi gian tiÕn hãa l©u dµi.
Vµo nh÷ng n¨m 1960, Zuckerkandl vµ Linus Pauling lµ nh÷ng ng−êi ®Çu tiªn tiÕn
hµnh so s¸nh tr×nh tù c¸c protein vµ rót ra nhËn xÐt r»ng: tèc ®é thay thÕ c¸c axit amin
trong cïng ph©n tö protein vÒ c¬ b¶n lµ æn ®Þnh qua hµng triÖu n¨m tiÕn hãa. Trªn c¬ së
nhËn ®Þnh nµy, hä ®· vÝ sù tÝch lòy c¸c ®ét biÕn thay thÕ axit amin nh− nhÞp ®Õm cña
®ång hå tiÕn hãa vµ gäi lµ thuyÕt ®ång hå ph©n tö. §ång hå ph©n tö cã thÓ ch¹y víi tèc
®é kh¸c nhau khi xÐt ë c¸c protein kh¸c nhau, nh−ng sù kh¸c nhau gi÷a hai protein
t−¬ng ®ång th× t−¬ng quan chÆt víi kho¶ng thêi gian kÓ tõ khi hai loµi (mang hai lo¹i
protein t−¬ng ®ång) t¸ch li tiÕn hãa tõ tæ tiªn chung (h×nh 10.10). ThuyÕt ®ång hå ph©n
tö ngay lËp tøc ®· thóc ®Èy c¸c nghiªn cøu tiÕn hãa. Tèc ®é thay ®æi æn ®Þnh gi÷a c¸c
tr×nh tù t−¬ng ®ång kh«ng chØ gióp x¸c ®Þnh ®−îc mèi quan hÖ di truyÒn gi÷a c¸c loµi,
mµ cßn gióp −íc tÝnh qu·ng thêi gian mµ chóng ph©n li khái nhau (gièng nh− c¸ch ®ång
vÞ phãng x¹ ®−îc dïng ®Ó x¸c ®Þnh tuæi hãa th¹ch). Dï vËy, trong thùc tÕ thuyÕt ®ång hå
ph©n tö còng nhËn ®−îc nh÷ng ý kiÕn kh«ng ®ång t×nh. Ch¼ng h¹n, c¸c nhµ tiÕn hãa
kinh ®iÓn cho r»ng nhÞp ®iÖu tiÕn hãa thÊt th−êng cña nhiÒu ®Æc ®iÓm h×nh th¸i kh«ng
t−¬ng ®ång víi tèc ®é thay ®æi æn ®Þnh ë møc ph©n tö. Trong mét sè tr−êng hîp, kÕt qu¶
−íc tÝnh thêi gian ph©n li tiÕn hãa dùa trªn c¸c ph−¬ng ph¸p kinh ®iÓn vµ ph©n tö kh«ng
thèng nhÊt víi nhau.

305
§inh §oµn Long

Chim/ bß s¸t (240 triÖu n¨m)

§éng vËt cã x−¬ng sèng /


Bß s¸t / c¸ (400 triÖu n¨m)
Ph©n li tiÕn hãa cña c¸c

C¸ x−¬ng / c¸ miÖng trßn

c«n trïng (600 triÖu n¨m)


§éng vËt cã vó / bß s¸t
loµi ®éng vËt cã vó

(300 triÖu n¨m)

(500 triÖu n¨m)


Sù t¸ch li tæ tiªn
thùc vËt vµ ®éng
vËt (1,2 tû n¨m)
Sè axit amin thay ®æi trong 100 axit amin

C¸c
fibrinopeptide Hemoglobin
(1,1 triÖu n¨m) (5,8 triÖu n¨m)

Cytochrome C
(20 triÖu n¨m)

TriÖu n¨m tiÕn hãa


H×nh 10.10. Tèc ®é tiÕn hãa kh¸c nhau cña c¸c protein. C¸c protein Fibrinogen chÞu ¸p lùc chän läc tù
nhiªn thÊp h¬n vµ cã tÇn sè ®ét biÕn trung tÝnh thay thÕ nucleotide cao, cßn cytochrom C chÞu ¸p lùc chän
läc tù nhiªn cao h¬n vµ cã tÇn sè ®ét biÕn trung tÝnh thÊp. Sè liÖu tÝnh trung b×nh tõ nhiÒu sinh vËt kh¸c nhau.

10.4.1.2. C¸ch tÝnh tèc ®é tiÕn hãa t−¬ng ®èi


PhÇn lín kho¶ng thêi gian tiÕn hãa ph©n li (biÕn sè T trong ph−¬ng tr×nh 10.3)
gi÷a c¸c loµi hoÆc nhãm loµi sinh vËt trong c¸c nghiªn cøu tiÕn hãa ®−îc tÝnh to¸n dùa
trªn c¸c mÉu hãa th¹ch kh«ng hoµn chØnh ®· cã tuæi hµng ngh×n thËm chÝ hµng triÖu
n¨m. Do ®ã, gi¸ trÞ T x¸c ®Þnh ®−îc th−êng chØ lµ gi¸ trÞ t−¬ng ®èi vµ ®«i khi cã sai sè lín.
§Ó gi¶m thiÓu sai sè nµy, Sarich vµ Wilson (1973) ®· ®Ò ra mét c¸ch tÝnh ®¬n gi¶n gäi lµ
c¸ch tÝnh tèc ®é tiÕn hãa t−¬ng ®èi. Theo m« h×nh nµy, ®Ó x¸c ®Þnh tèc ®é thay thÕ
nucleotide t−¬ng ®èi ë hai loµi (1) vµ (2) thuéc cïng mét dßng tiÕn hãa, ng−êi ta sö dông
mét loµi thø (3) cã quan hÖ xa h¬n hai loµi (1) vµ (2), ®−îc gäi lµ loµi ngoµi nhãm (h×nh
10.11). Ch¼ng h¹n, nÕu loµi (1) vµ (2) lÇn l−ît lµ ng−êi vµ khØ Gorilla, th× loµi thø (3) cã
thÓ lµ mét loµi linh tr−ëng nµo ®ã, ch¼ng h¹n nh− khØ ®Çu chã - Papio. NÕu thêi ®iÓm
trong qu¸ tr×nh tiÕn hãa mµ loµi (1) vµ (2) t¸ch li khái nhau ®−îc kÝ hiÖu lµ A, th× sè
nucleotide kh¸c biÖt (d) cã thÓ cã gi÷a hai loµi sÏ b»ng tæng sè nucleotide thay ®æi xuÊt
hiÖn ë mçi loµi kÓ tõ thêi ®iÓm A, v× vËy:
d13 = dA1 + dA3 (ph−¬ng tr×nh 10.4)
d23 = dA2 + dA3 (ph−¬ng tr×nh 10.5)
d12 = dA1 + dA2 (ph−¬ng tr×nh 10.6)
trong ®ã, sè nucleotide kh¸c biÖt gi÷a c¸c loµi (1), (2) vµ (3) (tøc lµ d13, d23 vµ d12) cã thÓ
x¸c ®Þnh ®−îc tõ thùc nghiÖm. Khai triÓn c¸c ph−¬ng tr×nh ®¹i sè ®¬n gi¶n trªn, ta sÏ thu

306
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

®−îc sè nucleotide thay ®æi t−¬ng ®èi ë mçi loµi (1) vµ (2) kÓ tõ thêi ®iÓm A (tøc lµ tõ khi
chóng b¾t ®Çu ph©n li tõ tæ tiªn chung) lµ:
dA1 = (d12 + d13 – d23)/2 (ph−¬ng tr×nh 10.7)
dA2 = (d12 + d23 – d13)/2 (ph−¬ng tr×nh 10.8)
Theo thuyÕt ®ång hå ph©n tö, kho¶ng thêi gian tÝnh tõ thêi ®iÓm A cña hai loµi (1)
vµ (2) lµ nh− nhau, nªn dA1 = dA2. Khi d÷ liÖu vÒ tr×nh tù hÖ gen cña c¸c loµi còng nh− sè
l−îng loµi ®−îc gi¶i m· tr×nh tù hÖ gen ngµy cµng t¨ng vµ ®Çy ®ñ th× tiÒn ®Ò cña thuyÕt
®ång hå ph©n tö cho r»ng tèc ®é tiÕn hãa cña mçi gen nhÊt ®Þnh sÏ æn ®Þnh qua thêi gian
ë tÊt c¶ c¸c dßng tiÕn hãa. Thùc nghiÖm thùc tÕ cho thÊy tèc ®é thay thÕ nucleotide trong
c¸c gen ë chuét ®ång vµ chuét nh¾t nh×n chung lµ t−¬ng ®−¬ng nhau. Nh−ng ng−îc l¹i, ë
nhãm loµi linh tr−ëng, ng−êi vµ c¸c loµi v−în ng−êi cã møc ®é thay thÕ nucleotide chØ
b»ng mét nöa so víi c¸c loµi khØ kÓ tõ khi cã sù ph©n li tiÕn hãa tõ tæ tiªn chung. T−¬ng
tù nh− vËy, khi sö dông c¸ch tÝnh tèc ®é tiÕn hãa t−¬ng ®èi dùa trªn so s¸nh c¸c gen
t−¬ng ®ång gi÷a ng−êi vµ chuét ®ång, th× tèc ®é thay
thÕ nucleotide cña c¸c loµi linh tr−ëng d−êng nh− chØ 1 2 3
b»ng mét nöa so víi c¸c loµi gÆm nhÊm kÓ tõ khi cã sù
ph©n li tiÕn hãa cña c¸c ®éng vËt cã vó (c¸ch ®©y tõ 80
®Õn 100 triÖu n¨m). Nh− vËy, cã sù kh¸c nhau vÒ tèc
®é cña ®ång hå ph©n tö ë c¸c nhãm loµi kh¸c nhau. V×
A
lý do ®ã, ®é lÖch thùc tÕ tõ tèc ®é tiÕn hãa trung b×nh ë
mçi nhãm ph©n lo¹i (cña c¸c loµi ®ang tån t¹i) lµ mét
khã kh¨n ®Ó cã thÓ x¸c ®Þnh chÝnh x¸c thêi ®iÓm xuÊt
hiÖn vµ qu·ng thêi gian tån t¹i cña c¸c loµi tæ tiªn, tõ
®ã tiÕn hãa ph©n li thµnh c¸c loµi sinh vËt ngµy nay.
§Ó cã thÓ tÝnh to¸n ®−îc ®óng, cÇn x¸c ®Þnh c¸c loµi H×nh 10.11. X©y dùng c©y tiÕn hãa
®−îc ®em so s¸nh vµ ®èi chiÕu víi nhau cã dïng dïng loµi ®èi chøng ngoµi nhãm. Loµi
3 lµ loµi ®èi chøng ngoµi nhãm (tiÕn hãa
“chung” mét ®ång hå ph©n tö (nh− c¸c loµi chuét nªu ®éc lËp tr−íc khi cã sù ph©n li cña hai loµi 1
trªn) hay kh«ng? vµ 2). A lµ tæ tiªn chung cña hai loµi 1 vµ 2.

10.4.1.3. T¹i sao tèc ®é tiÕn hãa l¹i kh¸c nhau gi÷a c¸c nhãm loµi?
Cã mét sè nguyªn nh©n cã thÓ gióp gi¶i thÝch hiÖn t−îng nµy. Ch¼ng h¹n, yÕu tè
vßng ®êi vµ chu tr×nh sinh s¶n ng¾n cña c¸c loµi khØ vµ chuét so víi ng−êi cã thÓ lµ
nguyªn nh©n lµm tèc ®é tiÕn hãa t−¬ng ®èi cña chóng nhanh h¬n. Trong mçi thÕ hÖ, cã
thÓ sè lÇn sao chÐp ADN cña c¸c dßng tÕ bµo ph¸t sinh giao tö (vèn kh¸c biÖt lín gi÷a c¸c
nhãm loµi) míi thùc sù cã t−¬ng quan chÆt víi tÇn sè thay thÕ nucleotide cña c¸c gen,
chø kh«ng ph¶i lµ kho¶ng thêi gian tiÕn hãa ph©n li. Mét nguyªn nh©n kh¸c lµ: kÓ tõ khi
tiÕn hãa ph©n li, c¸c nhãm loµi (thËm chÝ c¸c loµi trong cïng nhãm) ngµy cµng cã nhiÒu
kh¸c biÖt trong c¸c c¬ chÕ di truyÒn vµ sinh s¶n, bao gåm hiÖu qu¶ cña c¸c c¬ chÕ söa
ch÷a ADN, tèc ®é vµ qui m« sinh s¶n, møc ph¬i nhiÔm víi c¸c t¸c nh©n ®ét biÕn vµ kh¶
n¨ng thÝch nghi víi c¸c æ sinh th¸i trong m«i tr−êng sèng cña chóng, v.v...
10.4.2. X©y dùng c©y tiÕn hãa dùa trªn c¸c dÊu hiÖu ph©n tö
10.4.2.1. C¸c dÊu hiÖu ®−îc dïng ®Ó x©y dùng c©y ph¸t sinh chñng lo¹i
Trªn c¬ së thuyÕt ®ång hå ph©n tö, mèi quan hÖ di truyÒn gi÷a tÊt c¶ c¸c d¹ng sèng
®Òu cã thÓ ®−îc x¸c ®Þnh dùa trªn viÖc so s¸nh c¸c dÊu hiÖu ph©n tö gi÷a chóng víi
nhau. Theo ®ã, c¸c loµi cµng cã nhiÒu dÊu hiÖu gièng nhau, cµng cã quan hÖ gÇn.

307
§inh §oµn Long

Tr−íc ®©y, khi ch−a cã c¸c c«ng cô sinh häc ph©n tö, mèi quan hÖ di truyÒn gi÷a
c¸c loµi ®−îc x¸c ®Þnh chñ yÕu dùa trªn viÖc so s¸nh c¸c dÊu hiÖu h×nh th¸i. NÒn t¶ng
cña viÖc sö dông c¸c dÊu hiÖu h×nh th¸i lµ quan ®iÓm cho r»ng: nÕu c¸c dÊu hiÖu h×nh
th¸i gièng nhau th× c¸c gen chi phèi c¸c ®Æc ®iÓm h×nh th¸i ®ã còng gièng nhau, vµ ng−îc
l¹i. Bªn c¹nh c¸c dÊu hiÖu h×nh th¸i, mét sè dÊu hiÖu kh¸c, bao gåm tËp tÝnh, cÊu tróc tÕ
bµo, hãa sinh … còng ®−îc kÕt hîp sö dông trong c¸c nghiªn cøu tiÕn hãa. ViÖc sö dông
c¸c dÊu hiÖu nµy cã hiÖu qu¶ khi nghiªn cøu tiÕn hãa ë nhiÒu nhãm ®éng vËt vµ thùc vËt
bËc cao; vµ hiÖn nay vÉn lµ mét ph−¬ng ph¸p nghiªn cøu tiÕn hãa c¬ b¶n.
Tuy vËy, viÖc sö dông ®¬n thuÇn c¸c dÊu hiÖu h×nh th¸i béc lé mét sè h¹n chÕ. Cô
thÓ, kiÓu h×nh gièng nhau cã thÓ thÊy ë nh÷ng loµi rÊt xa nhau do hiÖn t−îng tiÕn hãa
®ång qui. Ch¼ng h¹n nh−, c¸c loµi chim, d¬i vµ c«n trïng cã thÓ ®−îc xÕp vµo cïng mét
nhãm, bëi v× chóng ®Òu “cã c¸nh”. Nh−ng thùc tÕ ®©y lµ nh÷ng loµi cã quan hÖ rÊt xa
nhau. VÝ dô nµy kh«ng chØ cho thÊy viÖc sö dông dÊu hiÖu h×nh th¸i ®¬n thuÇn cã thÓ x¸c
®Þnh nhÇm mèi quan hÖ di truyÒn gi÷a mét sè loµi, mµ ®ång thêi cho thÊy, mét sè kiÓu
h×nh gièng nhau kh«ng nhÊt thiÕt ph¶i cã kiÓu gen gièng nhau. Ngoµi ra, ë mét sè ®èi
t−îng sinh vËt, ®Æc ®iÓm kiÓu h×nh cña chóng rÊt khã quan s¸t vµ so s¸nh. VÝ dô ®iÓn
h×nh vÒ ®iÒu nµy lµ c¸c vi sinh vËt (nh− vi khuÈn vµ virut) cã c¸c ®Æc ®iÓm h×nh th¸i khã
quan s¸t, hay viÖc so s¸nh gi÷a c¸c loµi ®éng vËt cã vó vµ vi khuÈn hÇu nh− kh«ng t×m
thÊy ®Æc ®iÓm h×nh th¸i nµo lµ gièng nhau. Trong nh÷ng tr−êng hîp nµy, c¸c dÊu hiÖu
ph©n tö (chñ yÕu lµ ADN) cã thÓ gióp kh¾c phôc c¸c khã kh¨n nªu trªn. Dï vËy, kh«ng
cã nghÜa lµ c¸c dÊu hiÖn ph©n tö cã thÓ thay thÕ hoµn toµn c¸c dÊu hiÖu h×nh th¸i, tËp
tÝnh hay hãa sinh trong c¸c nghiªn cøu tiÕn hãa.
ViÖc sö dông c¸c dÊu hiÖu ph©n tö cho thÊy, tèc ®é tiÕn hãa cã kh¸c nhau ë c¸c
dßng tiÕn hãa kh¸c nhau. Do vËy, viÖc x¸c ®Þnh thêi ®iÓm ph©n li tiÕn hãa cña nhiÒu
nhãm sinh vËt cÇn kÕt hîp sö dông c¸c dÊu hiÖu ph©n tö víi c¸c lo¹i dÊu hiÖu kh¸c.
Trong thùc tÕ, c¸c dÊu hiÖu ADN gióp x©y dùng c©y ph¸t sinh chñng lo¹i hiÖu qu¶ vµ
chÝnh x¸c nhÊt khi chóng ®−îc sö dông trong ph¹m vi c¸c nhãm loµi ®· ®−îc ph©n lo¹i s¬
bé b»ng c¸c dÊu hiÖu h×nh th¸i vµ hãa sinh. Trong mét sè tr−êng hîp, khi c¸c dÊu hiÖu
h×nh th¸i vµ ph©n tö kh«ng ®−a ra kÕt luËn thèng nhÊt, th× chÝnh lµ c¬ héi ®Ó x¸c ®Þnh
møc ®é t¸c ®éng cña chän läc tù nhiªn ®Õn c¸c kiÓu h×nh th¸i kh¸c nhau nh− thÕ nµo.
10.4.2.2. C¸c lo¹i c©y ph¸t sinh chñng lo¹i
Tr−íc khi cã c¸c c«ng cô sinh häc ph©n tö, ®· cã nhiÒu ph−¬ng ph¸p kh¸c ®−îc thiÕt
lËp nh»m x¸c ®Þnh mèi quan hÖ di truyÒn gi÷a c¸c loµi. Mét trong nh÷ng ph−¬ng ph¸p c¬
b¶n nhÊt lµ x©y dùng s¬ ®å h×nh c©y ®Ó m« t¶ mèi quan hÖ gi÷a c¸c loµi, gäi lµ c©y ph¸t
sinh chñng lo¹i hay c©y tiÕn hãa. C¸c b»ng chøng sinh häc ®Õn nay ®Òu cho r»ng: mäi
d¹ng sèng trªn Tr¸i ®Êt, kÓ c¶ ®ang tån t¹i hay ®· tuyÖt chñng, ®Òu cã mét tæ tiªn chung
duy nhÊt cã mÆt trªn Tr¸i ®Êt c¸ch ®©y kho¶ng 4 tØ n¨m. Mçi c©y ph¸t sinh chñng lo¹i
th−êng chØ lµ mét phÇn cña c©y tiÕn hãa xuÊt ph¸t tõ tæ tiªn chung ®ã. Nãi c¸ch kh¸c, nã
th−êng chØ gåm mét hay mét sè nh¸nh tiÕn hãa. Mçi cµnh tËn cïng cña mét c©y tiÕn hãa
th−êng gåm mét hoÆc mét sè taxon (®¬n vÞ ph©n lo¹i). §iÓm ph©n nh¸nh n»m ë gi÷a c©y
tiÕn hãa ®¹i diÖn cho tæ tiªn chung tr−íc khi cã sù ph©n li tiÕn hãa thµnh c¸c nhãm loµi
riªng biÖt. ChiÒu dµi cña mçi cµnh ph¶n ¸nh møc ®é kh¸c biÖt gi÷a c¸c taxon. C©y tiÕn
hãa nµo cã ®iÓm x¸c ®Þnh tæ tiªn chung cña c¸c nh¸nh cßn l¹i (phÇn ngän) trong c©y tiÕn
hãa th× ®−îc gäi lµ c©y tiÕn hãa cã gèc. Ng−îc l¹i, c©y tiÕn hãa kh«ng gèc chØ ph¶n
¸nh mèi quan hÖ vµ sù kh¸c biÖt gi÷a c¸c taxon (t−¬ng øng víi c¸c cµnh) mµ kh«ng ph¶n
¸nh sù tiÕn hãa tõ gèc nh− thÕ nµo. ViÖc x©y dùng c©y tiÕn hãa cã gèc hay kh«ng gèc ®Òu
cÇn ®Õn c¸c mÉu taxon ®èi chøng ngoµi nhãm. Ch¼ng h¹n, khi nghiªn cøu mèi quan hÖ di

308
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

truyÒn gi÷a ng−êi vµ khØ Gorilla, ng−êi ta cã thÓ dïng loµi khØ Papio lµm loµi ®èi chøng
ngoµi nhãm.
VÒ sè l−îng c©y ph¸t sinh chñng lo¹i. Sè l−îng c©y tiÕn hãa t¨ng lªn cïng sè
l−îng taxon ®−îc ®em so s¸nh (b¶ng 10.5). Cô thÓ, khi nghiªn cøu ®ång thêi n taxon, th×
sè c©y tiÕn hãa cã gèc (NR) vµ kh«ng gèc (NU) t−¬ng øng cã thÓ cã lµ:
NR = (2n – 3)!/[2n-2(n-2)!] (ph−¬ng tr×nh 10.9)
Nu = (2n – 5)!/[2n-3(n-3)!] (ph−¬ng tr×nh 10.10)
Trong ®ã, ph−¬ng tr×nh 10.9 ®−îc ¸p dông víi n ≥ 2, cßn ph−¬ng tr×nh 10.10
®−îc ¸p dông víi n ≥ 3. Tuy nhiªn, trong thùc tÕ, c©y tiÕn hãa th−êng ®−îc vÏ ®Ó ph¶n
¸nh mèi quan hÖ gi÷a mét sè l−îng lín c¸c mÉu kh¸c nhau, bao gåm tõ hµng chôc ®Õn
hµng tr¨m c¸ thÓ hoÆc taxon. ThÕ nªn sè c©y tiÕn hãa cã thÓ cã thùc tÕ lµ rÊt lín.

B¶ng 10.5. Sè l−îng c©y tiÕn hãa cã gèc vµ kh«ng


gèc cã thÓ cã t¨ng lªn cïng víi sè l−îng taxon
Sè c©y tiÕn hãa Sè c©y tiÕn hãa
Sè taxon
cã gèc kh«ng gèc
2 1 1
3 3 1
4 15 3
5 105 15 C¸c alen chung
10 34.459.425 2.027.025 H×nh 10.12. HiÖn t−îng giao thoa gi÷a c¸c loµi
20 21 20
8,20 x 10 2,22 x 10 cã thÓ x¶y ra nÕu loµi tæ tiªn mang locut ®a
30 4,95 x 10
38
8,69 x 10
36 h×nh gåm hai hay nhiÒu alen, vµ c¸c alen nµy
®Òu ®−îc duy tr× ë c¸c loµi míi sau khi t¸ch li.

VÒ c©y tiÕn hãa gen vµ c©y tiÕn hãa loµi. Mét c©y ph¸t sinh chñng lo¹i ®−îc x©y
dùng trªn c¬ së so s¸nh tr×nh tù mét nhãm gen t−¬ng ®ång gi÷a c¸c loµi hoÆc c¸ thÓ kh¸c
nhau ®−îc gäi lµ c©y tiÕn hãa gen. Lo¹i c©y tiÕn hãa nµy cã thÓ ph¶n ¸nh lÞch sö tiÕn
hãa cña mét gen, nh−ng kh«ng nhÊt thiÕt t−¬ng quan víi sù ph¸t sinh cña c¸c loµi t−¬ng
øng. Ng−îc l¹i, c¸c c©y tiÕn hãa loµi th−êng thu ®−îc tõ viÖc kÕt hîp ph©n tÝch nhiÒu
gen kh¸c nhau vµ ph¶n ¸nh sù ph¸t sinh cña c¸c loµi. Nghe qua, d−êng nh− c©y tiÕn hãa
gen vµ c©y tiÕn hãa loµi “kh«ng t−¬ng ®ång” víi nhau. Nh−ng ®iÒu nµy lµ hîp logic, bëi
sù “ph©n li” cña c¸c gen th−êng xuÊt hiÖn tr−íc sù “c¸ch li” cña c¸c quÇn thÓ dÉn ®Õn sù
“ph©n li tiÕn hãa” h×nh thµnh c¸c loµi míi. H×nh 10.12 minh häa sù ph©n li cña mét
locut. Khi ph©n tÝch locut nµy, mét sè c¸ thÓ cña loµi 1 vµ loµi 2 cßn gièng nhau h¬n khi
so s¸nh chóng víi mét sè c¸ thÓ kh¸c cïng loµi. Ch¼ng h¹n nh− locut MHC (xem ch−¬ng
9) vèn cã tÝnh ®a h×nh rÊt cao. NÕu sö dông c¸c alen cña locut nµy ®Ó vÏ c©y tiÕn hãa loµi,
th× mét sè c¸ thÓ cña ng−êi vµ khØ Gorilla cã thÓ ®−îc xÕp chung cïng mét nhãm do kiÓu
alen cña c¸c c¸ thÓ nµy rÊt gièng nhau.
Tõ c¸c ph−¬ng tr×nh 10.9 vµ 10.10, cã thÓ thÊy vÒ lý thuyÕt sè c©y tiÕn hãa cã thÓ
cã gi÷a c¸c taxon lµ rÊt lín, nh−ng thùc tÕ bao giê còng chØ cã mét c©y ph¶n ¸nh ®óng
mèi quan hÖ gi÷a c¸c taxon. §Ó x¸c ®Þnh ®−îc c©y tiÕn hãa nµy, c¸c d÷ liÖu ph©n tö
th−êng ®−îc ph©n tÝch b»ng c¸c thuËt to¸n x¸c suÊt. C©y tiÕn hãa thu ®−îc tõ viÖc ph©n
tÝch c¸c d÷ liÖu nh− vËy ®−îc gäi lµ c¸c c©y tiÕn hãa néi suy. Th−êng th× viÖc xö lý c¸c d÷
liÖu kh¸ phøc t¹p (do l−îng d÷ liÖu lín) vµ cÇn sù hç trî cña c¸c hÖ thèng m¸y tÝnh vµ

309
§inh §oµn Long

c¸c phÇn mÒm tin sinh häc. Cã 3 d¹ng thuËt to¸n phæ biÕn h¬n c¶ ®−îc dïng trong c¸c
phÇn mÒm m¸y tÝnh nh»m x©y dùng c¸c c©y tiÕn hãa, gåm ma trËn kho¶ng c¸ch
(distance matrix), tÝch ph©n tiÕn hãa (parsimony-based) vµ hîp lý tèi ®a (maximum
likelihood).

10.4.2.3. C¸c ph−¬ng ph¸p x©y dùng c©y ph¸t sinh chñng lo¹i
a) Ph−¬ng ph¸p "Ma trËn kho¶ng c¸ch"
“Ma trËn kho¶ng c¸ch” lµ nhãm c¸c thuËt to¸n ®¬n gi¶n nhÊt, ®−îc sö dông tõ l©u
trong c¸c nghiªn cøu tiÕn hãa. §−îc b¾t ®Çu sö dông tõ nh÷ng n¨m 1960, c¸c thuËt to¸n
nµy ®−îc dïng ®Ó x¸c ®Þnh mèi quan hÖ gi÷a c¸c loµi dùa trªn c¸c dÊu hiÖu h×nh th¸i.
Trong sè ®ã, thuËt to¸n UPGMA (unweighted pair group with arthmetic mean) ph©n tÝch
tÊt c¶ c¸c dÊu hiÖu, qua ®ã x¸c ®Þnh kho¶ng c¸ch di truyÒn gi÷a tÊt c¶ c¸c cÆp mÉu; råi
gép nhãm tõng cÆp mÉu cã kho¶ng c¸ch di truyÒn thÊp nhÊt. §Ó minh häa cho viÖc ¸p
dông thuËt to¸n UPGMA, gi¶ sö chóng ta ph©n tÝch 4 taxon kÝ hiÖu lµ A, B, C vµ D, biÕt
r»ng kho¶ng c¸ch gi÷a tõng cÆp taxon ®−îc x¸c ®Þnh nh− sau:
Taxon A B C
B dAB - -
C dAC dBC -
D dAD dBD dCD
Trong ma trËn nµy, dAB lµ kho¶ng c¸ch di truyÒn ®−îc x¸c ®Þnh b»ng so s¸nh trùc
tiÕp c¸c dÊu hiÖu gi÷a taxon A vµ B (cã thÓ tÝnh theo c«ng thøc Jukes-Carton), cßn dAC
ph¶n ¸nh kho¶ng c¸ch gi÷a taxon A vµ C, v.v… ThuËt to¸n UPGMA ®Çu tiªn sÏ gép
nhãm 2 taxon cã kho¶ng c¸ch nhá nhÊt thµnh mét nhãm (taxon phøc hîp) míi. Gi¶ sö
gi¸ trÞ dAB lµ nhá nhÊt, th× taxon phøc hîp ®Çu tiªn sÏ lµ (AB). Sau lÇn gép nhãm ®Çu
tiªn nµy, kho¶ng c¸ch gi÷a c¸c taxon sÏ ®−îc tÝnh l¹i gi÷a taxon phøc hîp (AB) víi c¸c
taxon cßn l¹i (C vµ D), theo c«ng thøc: d(AB)C = 1/2 (dAC + dBC) vµ d(AB)D = 1/2(dAD + dBD).
C¸c taxon cã kho¶ng c¸ch nhá nhÊt l¹i tiÕp tôc ®−îc gép nhãm thµnh mét taxon phøc hîp
thø hai. Ch¼ng h¹n ë ®©y d(AB)C < d(AB)D th× phøc hîp tiÕp theo sÏ lµ (ABC), tøc lµ C cã
kho¶ng c¸ch di truyÒn gÇn A vµ B h¬n D. Qu¸ tr×nh gép nhãm nh− vËy cø tiÕp tôc cho
®Õn khi tÊt c¶ c¸c taxon ®Òu ®−îc ph©n nhãm hÕt. Trong c©y tiÕn hãa ®−îc x©y dùng theo
ph−¬ng thøc UPGMA, nÕu chiÒu dµi mçi cµnh ph¶n ¸nh kho¶ng c¸ch gi÷a c¸c taxon, th×
®iÓm xuÊt ph¸t cña mçi cµnh lu«n ë trung ®iÓm kho¶ng c¸ch gi÷a chóng (vÝ dô: dAB/2 cho
cÆp taxon A vµ B). ¦u ®iÓm cña thuËt to¸n UPGMA lµ phÐp ph©n tÝch nhanh vµ ®¬n
gi¶n. Nh−ng nh−îc ®iÓm cña UPGMA lµ nã coi tèc ®é tiÕn hãa lµ gièng nhau ë mäi nh¸nh
tiÕn hãa (®iÒu nµy kh«ng ph¶i lóc nµo còng ®óng). §iÒu nµy cã nghÜa lµ, UPGMA sÏ phï
hîp nhÊt khi x©y dùng c©y tiÕn hãa ë c¸c nh¸nh cã tèc ®é tiÕn hãa t−¬ng ®èi æn ®Þnh.
Trong c¸c thuËt to¸n “ma trËn kho¶ng c¸ch”, ngoµi UPGMA, cßn cã mét sè thuËt to¸n
kh¸c, nh− “kho¶ng c¸ch khai triÓn” (transformed distance) hay “kÕt nèi l©n cËn”
(neighbor-joining, NJ). Nh÷ng thuËt to¸n nµy cho phÐp kÕt hîp tèc ®é tiÕn hãa kh¸c
nhau ë c¸c nh¸nh tiÕn hãa vµo cïng c©y tiÕn hãa.
Nh×n chung, c¸c thuËt to¸n dùa trªn “ma trËn kho¶ng c¸ch” cho kÕt qu¶ ph©n tÝch
nhanh, phï hîp ®Ó xö lý mét l−îng d÷ liÖu lín; cho biÕt kho¶ng c¸ch di truyÒn t−¬ng ®èi
gi÷a c¸c loµi, nh−ng kh«ng ph¶n ¸nh ®−îc sù tiÕn hãa ë mçi gen. §«i khi, do sù “gi¶n

310
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

l−îc hãa” qu¸ møc c¸c d÷ liÖu nªn kÕt qu¶ ph©n tÝch kh«ng thèng nhÊt khi dïng c¸c
thuËt to¸n kh¸c nhau (ch¼ng h¹n, khi dïng UPGMA vµ NJ). Th−êng th× NJ ®−îc coi lµ
cho kÕt qu¶ chi tiÕt h¬n UPGMA.
b) Ph−¬ng ph¸p "TÝch ph©n tiÕn hãa" (tiÕt kiÖm tèi ®a)
NÕu nh− c¸c thuËt to¸n “ma trËn kho¶ng c¸ch” ®¬n thuÇn lµ c¸c thuËt to¸n x¸c
suÊt th× “tÝch ph©n tiÕn hãa” dùa trªn nguyªn t¾c sinh häc lµ “®ét biÕn hiÕm khi x¶y ra”.
ThuËt to¸n nµy cho r»ng: c©y tiÕn hãa phï hîp nhÊt lµ c©y cã sè ®ét biÕn thÊp nhÊt trong
tÊt c¶ nh÷ng c©y tiÕn hãa cã thÓ cã gi÷a c¸c taxon ®−îc ph©n tÝch. Do vËy, c©y tiÕn hãa
thu ®−îc tõ “tÝch ph©n tiÕn hãa” ®−îc gäi lµ c©y tÝch ph©n tiÕn hãa tèi −u.
§Ó minh häa ph−¬ng ph¸p “tÝch ph©n tiÕn hãa”, h·y xem vÝ dô vÒ 4 tr×nh tù sau ®©y:
VÞ trÝ
1 2 3 4 5(*) 6(*)
Tr×nh tù G C G A T G
G T G T T G
G T T G C A
G T C C C A

Khi so s¸nh gi÷a c¸c tr×nh tù nµy, chØ hai vÞ trÝ 5 vµ 6 (®¸nh dÊu *) ®−îc xem lµ “cã
t¸c dông th«ng tin”. H×nh 10.13 (trang sau) cho thÊy: cã thÓ cã 3 lo¹i c©y tiÕn hãa kh«ng
gèc ph¶n ¸nh mèi quan hÖ gi÷a 4 taxon. C¸c c©y tiÕn hãa kh«ng gèc gép nhãm tr×nh tù 1
víi 2, t¸ch biÖt víi nhãm tr×nh tù 3 víi 4, vµ chØ ®ßi hái mét ®ét biÕn duy nhÊt ®Ó nèi gi÷a
hai nhãm. Khi ph©n tÝch tõng vÞ trÝ, chóng ta sÏ thÊy: vÞ trÝ sè 1 “kh«ng cã t¸c dông
th«ng tin” bëi v× ®ét biÕn kh«ng x¶y ra ë vÞ trÝ nµy, nªn kh«ng ph©n biÖt ®−îc c¸c taxon.
VÞ trÝ sè 2 còng vËy, bëi c¶ ba c©y tiÕn hãa ®Òu chØ cÇn 1 ®ét biÕn. Cßn c¸c c©y tiÕn hãa
dùa trªn vÞ trÝ sè 3 ®Òu cÇn 2 ®ét biÕn ; trong khi c¸c c©y tiÕn hãa dùa trªn vÞ trÝ sè 4 ®Òu
cÇn 3 ®ét biÕn. V× kh«ng x¸c ®Þnh ®−îc c©y tiÕn hãa nµo cã kh¶ n¨ng x¶y ra h¬n, nªn c¸c
vÞ trÝ 1, 2, 3 vµ 4 ®−îc xem lµ “kh«ng cã t¸c dông th«ng tin”.
ThuËt to¸n “tÝch ph©n tiÕn hãa” ®Çu tiªn x¸c ®Þnh tÊt c¶ c¸c vÞ trÝ cã t¸c dông th«ng
tin b»ng c¸ch so s¸nh tÊt c¶ c¸c tr×nh tù t¹i mçi vÞ trÝ, råi x¸c ®Þnh c©y tiÕn hãa nµo cÇn
Ýt ®ét biÕn nhÊt t¹i mçi vÞ trÝ. C©y tiÕn hãa nµo cÇn Ýt ®ét biÕn nhÊt khi xÐt ë tÊt c¶ c¸c vÞ
trÝ ®−îc gäi lµ c©y tiÕn hãa "pháng ®o¸n". Ngoµi viÖc x©y dùng ®−îc c©y tiÕn hãa, thuËt
to¸n “tÝch ph©n cùc ®¹i” cßn cung cÊp mét th«ng tin h÷u Ých kh¸c. §ã lµ, nã cã thÓ pháng
®o¸n tr×nh tù tæ tiªn ë mçi nh¸nh cña c©y tiÕn hãa, bao gåm c¶ c¸c tr×nh tù ë c¸c loµi ®·
tuyÖt chñng. §©y lµ mét −u ®iÓm cña phÐp “tÝch ph©n tiÕn hãa”. Trong vÝ dô nªu trªn,
phÐp “tÝch ph©n tiÕn hãa” ®· gi¶ thiÕt mçi nucleotide ®Òu cã kh¶ n¨ng ®ét biÕn thay thÕ
thµnh mét trong ba lo¹i nucleotide kh¸c víi "tÇn suÊt" nh− nhau. Trong thùc tÕ, mét sè
phÐp “tÝch ph©n tiÕn hãa” phøc t¹p h¬n ®· ®−îc söa ®æi ®Ó ph¶n ¸nh sù kh¸c nhau gi÷a
tÇn sè ®ét biÕn ®ång ho¸n vµ dÞ ho¸n. Tuy vËy, phÐp “tÝch ph©n tiÕn hãa” ®«i khi ch−a
ph¶n ¸nh thËt chÝnh x¸c vÒ thêi gian x¶y ra sù t¸ch li tiÕn hãa gi÷a c¸c loµi v× tèc ®é thay
thÕ nucleotide gi÷a c¸c nh¸nh tiÕn hãa cã thÓ kh¸c nhau.
c) Ph−¬ng ph¸p "Hîp lý tèi ®a"
Ph−¬ng ph¸p “hîp lý tèi ®a” lµ mét ph−¬ng ph¸p x¸c suÊt thuÇn tóy, th−êng ®−îc
sö dông ®Ó kiÓm chøng l¹i c¸c c©y tiÕn hãa ®−îc x©y dùng bëi c¸c ph−¬ng ph¸p kh¸c.

311
§inh §oµn Long

Ph−¬ng ph¸p nµy ®¸nh


C©y 1 C©y 2 C©y 3
gi¸ mét gi¶ thiÕt tiÕn
hãa b»ng viÖc x©y dùng G G G G G G
g g g g g g
tÊt c¶ c¸c c©y tiÕn hãa VÞ trÝ 1
cã thÓ cã trªn c¬ së gi¶ G G G G G G
thiÕt ®ã, råi x¸c ®Þnh C T T C T T
c©y tiÕn hãa néi suy lµ t t t t t t
VÞ trÝ 2
c©y cã x¸c suÊt x¶y ra T T T T C T
cao nhÊt qua viÖc ph©n
G T T G G C
tÝch c¸c yÕu tè tiÕn hãa. g g g g g g
VÞ trÝ 3
Ch¼ng h¹n, vÒ ®¹i thÓ
G C G C T G
tÇn sè c¸c ®ét biÕn ®ång
ho¸n cao h¬n kho¶ng 3 A T T A A G
g g g g g g
lÇn so víi c¸c ®ét biÕn dÞ VÞ trÝ 4
ho¸n. Trong mét nhãm G C G C T C
cã 3 tr×nh tù kh¸c nhau T T C T T C
ë mét vÞ trÝ nucleotide t t t t t c
VÞ trÝ 5
mang c¸c baz¬ t−¬ng C C T C T C
øng lµ C, T vµ A. Tr×nh
G G A A G A
tù mang c¸c baz¬ C vµ T g g g g g a
VÞ trÝ 6
®−îc xem lµ cã quan hÖ
A A G G G A
di truyÒn gÇn nhau h¬n
so víi tr×nh tù mang
baz¬ A. Ph−¬ng ph¸p H×nh 10.13. Gi÷a 4 taxon, t¹i mçi vÞ trÝ (nucleotide), cã thÓ cã 3 c©y tiÕn
“hîp lý tèi ®a” th−êng hãa kh«ng gèc kh¸c nhau. C¸c nucleotide viÕt b»ng ch÷ in hoa lµ c¸c
nucleotide ®−îc t×m thÊy ë mçi taxon t−¬ng øng víi tõng vÞ trÝ. C¸c nucleotide
®−îc xem lµ ph−¬ng viÕt b»ng ch÷ th−êng biÓu diÔn lo¹i nucleotide cã ë tæ tiªn "pháng ®o¸n".
ph¸p cung cÊp th«ng tin §−êng liÒn nÐt cã vßng trßn biÓu diÔn lo¹i ®ét biÕn thay thÕ nucleotide cÇn x¶y
chÝnh x¸c vµ chi tiÕt h¬n ra ®Ó thu ®−îc sù ®a h×nh tr×nh tù ADN thùc tÕ. C¶ 3 c©y tiÕn hãa cã thÓ cã ë
vÞ trÝ 1 ®Òu kh«ng cÇn ®ét biÕn nµo; trong khi ë vÞ trÝ 2 ®Òu cÇn mét ®ét biÕn, ë
c¶ so víi c¸c ph−¬ng vÞ trÝ 3 ®Òu cÇn 2 ®ét biÕn vµ vÞ trÝ 4 ®Òu cÇn 3 ®ét biÕn. V× vËy, tõ sù thay thÕ
ph¸p kh¸c. Nh−ng thùc nucleotide ë c¸c vÞ trÝ 1, 2, 3 vµ 4 kh«ng x¸c ®Þnh ®−îc c©y tiÕn hãa nµo "dÔ"
tÕ, tèc ®é xö lý th«ng tin x¶y ra h¬n. Trong ph−¬ng ph¸p tÝch ph©n tiÕn hãa, c¸c vÞ trÝ nµy ®−îc coi lµ
"kh«ng cã t¸c dông th«ng tin". Ng−îc l¹i, c¸c vÞ trÝ 5 vµ 6 cho thÊy mét c©y tiÕn
theo ph−¬ng ph¸p nµy hãa cÇn Ýt ®ét biÕn h¬n so víi nh÷ng c©y kh¸c; nªn nh÷ng vÞ trÝ nµy ®−îc xem
rÊt chËm vµ kh«ng “kh¶ lµ "cã t¸c dông th«ng tin". C©y tiÕn hãa "pháng ®o¸n" lµ c©y cÇn sè ®ét biÕn Ýt
thi” khi ph©n tÝch mét nhÊt trong tÊt c¶ c¸c c©y tiÕn hãa cã thÓ cã khi xÐt ë tÊt c¶ c¸c vÞ trÝ.
sè l−îng d÷ liÖu lín, kÓ
c¶ khi sö dông c¸c hÖ thèng m¸y tÝnh m¹nh nhÊt hiÖn nay (vÝ dô: tõ b¶ng 10.5 ta thÊy,
nÕu sè taxon ≥ 30, th× sè c©y tiÕn hãa cã thÓ cã ≥ 5x1038). Tuy vËy, víi tèc ®é ph¸t triÓn
nhanh chãng cña lÜnh vùc tin sinh häc vµ c¸c “c¶i tiÕn” trong øng dông c¸c thuËt to¸n,
ph−¬ng ph¸p “hîp lý tèi ®a” cã tiÒm n¨ng øng dông ngµy cµng réng r·i. Tuy vËy, hiÖn
nay nh×n chung ch−a cã m« h×nh nµo −u thÕ h¬n h¼n c¸c m« h×nh kh¸c. Nh− mét qui −íc
chung, nÕu mét tËp hîp sè liÖu nhÊt ®Þnh khi ®−îc ph©n tÝch bëi hay ba thuËt to¸n (m«
h×nh) kh¸c nhau cïng ®−a ®Õn mét kiÓu h×nh c©y tiÕn hãa, th× c©y tiÕn hãa ®ã cã thÓ tin
cËy ®−îc. Trong nh÷ng tr−êng hîp kh¸c, c¸c m« h×nh cã thÓ dÉn ®Õn c¸c kÕt luËn kh¸c
nhau. V× vËy, víi tõng ®èi t−îng cô thÓ, cÇn c©n nh¾c lùa chän m« h×nh phï hîp vµ cÇn
m« t¶ m« h×nh ®−îc sö dông trong c¸c b¸o c¸o khoa häc.

312
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

10.5. TiÕn hãa hÖ gen vµ nguån gèc loµi ng−êi

10.5.1. HÖ gen ng−êi chøa mét sè gen Ýt ®Õn ng¹c nhiªn


Nh÷ng n¨m cuèi cña thÓ kû XX ®¸nh dÊu mét b−íc ngoÆt quan träng trong c¸c
nghiªn cøu tiÕn hãa häc vµ ph©n tÝch chøc n¨ng hÖ gen ë ng−êi hiÖn ®¹i (Homo sapiens,
gäi t¾t lµ ng−êi). §ã lµ viÖc hÖ gen ng−êi ®−îc gi¶i tr×nh tù hoµn chØnh nhê thµnh qu¶ cña
Dù ¸n hÖ gen ng−êi (HGP) ®−îc triÓn khai tõ n¨m 1990 tíi n¨m 2006. C¸c môc tiªu cña
dù ¸n HGP bao gåm: 1) x¸c ®Þnh tr×nh tù cña toµn bé hÖ gen ng−êi (kho¶ng trªn 3 triÖu
cÆp nucleotide), 2) x¸c ®Þnh tÊt c¶ c¸c gen cã trong hÖ gen ng−êi, 3) l−u gi÷ th«ng tin hÖ
gen ng−êi trong c¸c hÖ thèng c¬ së d÷ liÖu, 4) c¶i tiÕn c¸c c«ng cô qu¶n lý vµ ph©n tÝch d÷
liÖu liªn quan ®Õn hÖ gen ng−êi, 5) chuyÓn giao c«ng nghÖ vµ tuyªn truyÒn c¸c nguyªn
t¾c ®¹o ®øc sinh häc trong viÖc khai th¸c th«ng tin tõ hÖ gen ng−êi. MÆc dï ngµy 26
th¸ng 6 n¨m 2000, Tæng thèng Mü Bill Clinton vµ Thñ t−íng Anh Tony Blair ®· tuyªn bè
b¶n th¶o ®Çu tiªn hÖ gen ng−êi ®· hoµn thµnh, nh−ng thùc tÕ ®Õn cuèi n¨m 2003, dù ¸n
hÖ gen ng−êi míi kÕt thóc; vµ ®Õn th¸ng 6/2006, viÖc gi¶i m· vµ lËp b¶n ®å NST lín nhÊt
cña hÖ gen ng−êi (NST sè 1) míi thùc sù hoµn thµnh.
§Õn nay, mÆc dï hÖ gen ng−êi ®· ®−îc gi¶i tr×nh tù hoµn chØnh, th× sè gen trong hÖ
gen ng−êi vÉn chØ lµ −íc tÝnh (kho¶ng 20.000 – 25.000 gen). Con sè nµy ban ®Çu ®· thùc
sù g©y “sèc” nhiÒu nhµ di truyÒn häc. Bëi, tr−íc khi triÓn khai dù ¸n, trªn c¬ së cÊu tróc
phøc t¹p cña c¬ thÓ ng−êi, sù ®a d¹ng cao cña h×nh th¸i vµ tËp tÝnh, phÇn lín c¸c nhµ di
truyÒn ®Òu dù ®o¸n hÖ gen ng−êi chøa trªn d−íi 100.000 gen. NhiÒu phÇn mÒm m¸y tÝnh
®· ®−îc dïng ®Ó dù ®o¸n sè gen trong hÖ gen ng−êi, chñ yÕu dùa vµo c¸c dÊu hiÖu cña
gen, nh− khung ®äc më (ORF), c¸c tÝn hiÖu nhËn biÕt intron, promoter ... Sau ®ã, c¸c gen
dù ®o¸n th−êng ®−îc kiÓm chøng bëi c¸c nghiªn cøu ®éc lËp, nh− qua viÖc t¸ch dßng c¸c
ph©n tö cADN xuÊt ph¸t tõ b¶n phiªn m· (mARN) t−¬ng øng cña gen. Nh−ng, nh×n
chung ch−a cã phÇn mÒm m¸y tÝnh nµo ®Õn nay cã thÓ x¸c ®Þnh ®−îc ®Çy ®ñ tÊt c¸c gen
tõ toµn bé tr×nh tù hÖ gen ®· biÕt. Bëi v×, c¸c ORF ng¾n, ngÉu nhiªn cã thÓ ®−îc x¸c ®Þnh
nhÇm lµ gen. Ng−îc l¹i, c¸c gen “thËt” vèn gåm nhiÒu exon ng¾n kh«ng cã cÊu tróc ORF
râ rµng cã thÓ bÞ bá sãt. Ngoµi ra, còng cßn nh÷ng “lçi” kh¸c n÷a mµ chóng ta ch−a biÕt
®Çy ®ñ trong c¸c d¹ng cÊu tróc exon-intron cña c¸c gen, hoÆc do “tÝnh tho¸i hãa” cña c¸c
tr×nh tù tÝn hiÖu ®iÒu khiÓn sù c¾t – nèi cña c¸c intron vµ exon trong qu¸ tr×nh hoµn
thiÖn mARN.
Trªn c¬ së c¸c th«ng tin mµ chóng ta ®· nªu, mét ®iÓm ®¸ng l−u ý lµ c¸c loµi ®éng
vËt cã vó (gåm c¶ loµi ng−êi) cã c¸c c¬ chÕ ®iÒu khiÓn gen phøc t¹p ®Ó cã thÓ ®ång thêi cã
nhiÒu kiÓu biÓu hiÖn gen kh¸c nhau. Nãi c¸ch kh¸c lµ d−êng nh−, tÝnh phøc t¹p cña c¬
thÓ kh«ng nhÊt thiÕt t−¬ng quan víi sè gen cã trong hÖ gen, mµ thay vµo ®ã, nã phô
thuéc vµo sè kiÓu biÓu hiÖn cña gen. H·y chó ý lËp luËn sau ®©y: giun trßn (C. elegans) cã
kho¶ng 20.000 gen, trong khi ruåi giÊm (D. melanogaster) cã sè gen Ýt h¬n ®¸ng kÓ (d−íi
14.000 gen). Nh−ng, trong thùc tÕ, sù ®a d¹ng vÒ h×nh th¸i vµ tËp tÝnh cña ruåi giÊm l¹i
cao h¬n nhiÒu so víi giun trßn. Sù phøc t¹p trong biÓu hiÖn kiÓu h×nh nh− vËy cã thÓ lµ
do sù t¨ng lªn vÒ sè kiÓu biÓu hiÖn cña gen. VÝ dô, mét gen ë ruåi giÊm trung b×nh cã thÓ
®−îc ®iÒu khiÓn bëi tõ 3 ®Õn 4 tr×nh tù enhancer kh¸c nhau (t¹i c¸c vÞ trÝ kh¸c nhau cña
c¬ thÓ), t¹o nªn kho¶ng 50.000 kiÓu biÓu hiÖn cña gen kh¸c nhau. Ng−îc l¹i, mçi gen ë
giun trßn trung b×nh chØ ®−îc ®iÒu khiÓn bëi 1 ®Õn 2 tr×nh tù enhancer. V× vËy, giun trßn
chØ cã kho¶ng 30.000 kiÓu biÓu hiÖn gen kh¸c nhau, Ýt h¬n nhiÒu so víi ruåi giÊm (mÆc
dï chóng cã nhiÒu gen h¬n).

313
§inh §oµn Long

10.5.2. HÖ gen ng−êi gièng hÖ gen chuét vµ kh«ng kh¸c mÊy hÖ gen tinh tinh
Ng−êi vµ chuét chøa mét sè l−îng gen t−¬ng ®èi gièng nhau (−íc l−îng ®Òu vµo
kho¶ng 20.000 – 25.000 gen). Kho¶ng 80% sè gen trong hÖ gen cña hai loµi t−¬ng ®ång
víi nhau. C¸c protein ®−îc m· hãa bëi c¸c gen t−¬ng ®ång nµy cã tÝnh b¶o thñ cao vµ cã
®Õn 80% tr×nh tù axit amin lµ gièng nhau hoµn toµn. PhÇn lín sù kh¸c nhau trong sè
20% c¸c gen cßn l¹i gi÷a ng−êi vµ chuét lµ do c¸c sù kiÖn lÆp ®o¹n ë nh÷ng tr×nh tù nhÊt
®Þnh. VÝ dô, chuét cã nhiÒu b¶n sao gen cytochrome P450 h¬n so víi ng−êi. TÊt nhiªn,
ng−îc l¹i, cã nhiÒu vÝ dô cho thÊy c¸c hä gen ë ng−êi cã møc ®é “më réng” cao h¬n ë
chuét. Nh−ng, nh×n chung ®iÓm næi bËt nhÊt khi so s¸nh hÖ gen ng−êi vµ chuét lµ chØ cã
rÊt Ýt gen “míi” (nÕu cã) trong hÖ gen ng−êi.
Sù gièng nhau gi÷a hÖ gen ng−êi víi hÖ gen c¸c loµi linh tr−ëng, ®iÓn h×nh lµ tinh
tinh, thËm chÝ cßn cao h¬n nhiÒu. ChØ cã kho¶ng 2% tr×nh tù hÖ gen gi÷a ng−êi vµ tinh
tinh lµ kh¸c nhau. NghÜa lµ trong mét ®o¹n tr×nh tù 100bp ngÉu nhiªn, trung b×nh chØ cã
2 nucleotide thay ®æi. §iÒu nµy cho thÊy tÝnh b¶o thñ cao trong hÖ gen c¸c ®éng vËt cã
x−¬ng sèng. Trong khi ®ã, viÖc so s¸nh ngÉu nhiªn hai c¸ thÓ mùc èng trong cïng mét
quÇn thÓ cho thÊy hÖ gen cña chóng kh¸c nhau kho¶ng 1%, cßn gi÷a hai quÇn thÓ kh¸c
nhau vµo kho¶ng 2,5%. ë ng−êi vµ tinh tinh, tÝnh b¶o thñ trong liªn kÕt gen còng rÊt
cao. TrËt tù vµ kho¶ng c¸ch gi÷a c¸c gen liªn kÕt lµ rÊt gièng nhau. Thùc tÕ, c¸c tr×nh tù
ADN ®iÒu hßa cã tèc ®é biÕn ®æi (tiÕn hãa) nhanh h¬n so víi c¸c tr×nh tù protein. Cã lÏ,
sù tiÕn hãa ph©n li gi÷a ng−êi vµ tinh tinh chØ lµ nh÷ng thay ®æi nhá trong hÖ gen nh−ng
®ñ lµm thay ®æi ho¹t tÝnh cña c¸c tr×nh tù ADN ®iÒu hßa chñ chèt.

10.5.3. Ng−êi vµ mèi quan hÖ di truyÒn víi c¸c loµi linh tr−ëng cì lín
Ng−êi ph©n biÖt víi c¸c loµi linh tr−ëng cì lín kh¸c, nh− tinh tinh hay khØ Gorilla,
ë mét sè ®Æc ®iÓm ngo¹i h×nh. Trong ®ã c¸c loµi v−în ng−êi cã r¨ng cöa vµ r¨ng nanh lín
h¬n nhiÒu so víi ng−êi; x−¬ng hµm cña chóng còng lín h¬n vµ nÆng h¬n. N·o cña v−în
ng−êi nhá h¬n n·o ng−êi. §iÓm g¾n gi÷a n·o vµ tñy sèng ë v−în ng−êi bÞ “®Èy” vÒ phÝa
sau hép sä, xa h¬n so víi ë ng−êi. H×nh d¸ng vµ tØ lÖ gi÷a c¸c phÇn c¬ thÓ cña ng−êi kh¸c
biÖt víi v−în ng−êi; trong ®ã, nÕu ë v−în ng−êi phÇn th©n cã xu h−íng më réng vÒ phÝa
d−íi th× ë ng−êi trung b×nh kÝch th−íc phÇn th©n cña c¬ thÓ cã xu h−íng æn ®Þnh tõ vai
cho ®Õn th¾t l−ng. TØ sè chiÒu dµi ch©n/th©n cña v−în ng−êi nhá h¬n so víi ng−êi khi ®¹t
tuæi tr−ëng thµnh; x−¬ng chËu cña chóng kh«ng cã cÊu tróc phï hîp cho t− thÕ ®øng
th¼ng. MÆc dï c¸c loµi v−în ng−êi còng cã thÓ ®i b»ng hai ch©n, nh−ng bµn ch©n cña
chóng kh«ng ®ñ v÷ng ®Ó duy tr× viÖc ®i th¼ng l−ng mét c¸ch liªn tôc vµ l©u dµi. Ng−îc
l¹i, ng−êi hoµn toµn ®i b»ng hai ch©n (tÊt nhiªn, trõ trÎ s¬ sinh). Bµn tay vµ bµn ch©n
ng−êi vµ v−în ng−êi kh¸c nhau; trong ®ã, ngãn tay c¸i cña v−în ng−êi kh«ng «m ®−îc
vµo lßng bµn tay vµ n¾m lÊy c¸c ngãn tay kh¸c nh− ë ng−êi.
Nh− ®· nªu ë trªn, dï cã nhiÒu ®Æc ®iÓm h×nh th¸i kh¸c nhau nh− vËy, nh−ng hÖ
gen ng−êi kh«ng kh¸c mÊy hÖ gen v−în ng−êi, ®Æc biÖt lµ tinh tinh. Sù gièng nhau ®Õn
98 - 99% gi÷a hÖ gen ng−êi vµ tinh tinh cho thÊy sù ph©n li tiÕn hãa cña hai loµi tõ tæ
tiªn chung chØ x¶y ra gÇn ®©y (−íc tÝnh tõ 5 ®Õn 9 triÖu n¨m tr−íc). So víi tinh tinh, c¸c
loµi v−în ng−êi kh¸c (nh− khØ Gorilla) cã mèi quan hÖ di truyÒn víi ng−êi xa h¬n.

10.5.4. Nguån gèc loµi ng−êi theo b»ng chøng hãa th¹ch
MÆc dï hiÕm c¸c b»ng chøng hãa th¹ch ®· cung cÊp nh÷ng th«ng tin quan träng vÒ
nguån gèc vµ sù tiÕn hãa cña loµi ng−êi (h×nh 10.14, trang sau). B»ng chøng hãa th¹ch
l©u ®êi nhÊt liªn quan ®Õn dßng tiÕn hãa cña loµi ng−êi t×m thÊy ë Ch©u Phi cã tuæi niªn
®¹i kho¶ng 4 - 5 triÖu n¨m. Sinh vËt cã d¹ng gièng ng−êi (hominid) ®Çu tiªn nµy ®−îc gäi

314
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

lµ ng−êi v−în A®ipitÕc Homo


(Ardipithecus ramidus). Hãa 0 sapiens
Homo
th¹ch cã tuæi niªn ®¹i l©u ®êi tiÕp erectus
theo h×nh thµnh c¸ch ®©y kho¶ng 1 Homo
3 - 4 triÖu n¨m thuéc mét d¹ng ergaster Homo Homo

TriÖu n¨m tr−íc


habilis rudolfensis
hominid kh¸c, ®−îc ®Æt tªn lµ 2 Dßng
ng−êi v−în ¤xtral«pitÕc tiÕn hãa
? Australopithecus
(Australopithecus afarensis). Ng−êi ? afarensis
ng−êi
3 Tinh tinh
v−în ¤xtral«pitÕc cã chiÒu cao
Ardipithecus
kho¶ng 1 – 1,5m, ®i b»ng hai ch©n ramidus
4
(Ýt nhÊt mét ®o¹n ng¾n).
?
Dßng
C¸c loµi ®Çu tiªn ®−îc xÕp 5 tiÕn hãa
cïng chi Homo víi ng−êi hiÖn ®¹i v−în ng−êi
(H. sapiens) cã hãa th¹ch h×nh
thµnh c¸ch ®©y kho¶ng 2 – 2,5
Tæ tiªn chung
triÖu n¨m, ®−îc ®Æt tªn lµ H. cña ng−êi, ng−êi
rudolfensis (gäi lµ ng−êi rudolfen) v−în vµ tinh tinh
vµ H. habilis (gäi lµ ng−êi H×nh 10.14. C©y ph¸t sinh loµi ng−êi trªn c¬ së b»ng chøng
habilis). C¶ hai loµi ng−êi v−în hãa th¹ch. Tæ tiªn chung cña ng−êi, c¸c d¹ng ng−êi v−în vµ tinh tinh
“xuÊt hiÖn sím” nµy cã nhiÒu ®Æc ®· tiÕn hãa theo hai dßng ®éc lËp h×nh thµnh nªn ng−êi hiÖn ®¹i -
sapiens ( dßng tiÕn hãa ng−êi) vµ tinh tinh (dßng tiÕn hãa v−în
®iÓm h×nh th¸i gièng v−în ng−êi. Homo
ng−êi). DÊu hái ph¶n ¸nh "b−íc" tiÕn hãa ch−a ®−îc kh¼ng ®Þnh.
Tuy vËy, so víi ng−êi v−în
¤xtral«pitÕc, hai d¹ng ng−êi v−în nµy cã ®iÓm tiÕp xóc gi÷a n·o bé vµ tñy sèng ë gÇn
gi÷a hép sä h¬n; ngoµi ra, hép sä gi¶m chiÒu dµi vµ t¨ng chiÒu réng (gièng ng−êi h¬n).
MÆc dï vËy, còng cã nhiÒu nhµ cæ sinh vËt häc kh«ng nhÊt trÝ xÕp hai loµi nµy vµo chi
Homo, mµ thay vµo ®ã lµ chi Australopithecus. Loµi cã b»ng chøng hãa th¹ch ®−îc kh¼ng
®Þnh ch¾c ch¾n thuéc chi Homo lµ Homo ergaster, gäi lµ ng−êi Egaxt¬, cã mÉu hãa th¹ch
h×nh thµnh c¸ch ®©y 1,5 – 1,9 triÖu n¨m. Ng−êi Egaxt¬ cã nhiÒu ®Æc ®iÓm h×nh th¸i
gièng víi ng−êi h¬n, bao gåm h×nh d¸ng c¬ thÓ, tØ lÖ kÝch th−íc ch©n-th©n, ®Æc ®iÓm cÊu
tróc hµm vµ kÝch th−íc r¨ng.
TÊt c¶ c¸c mÉu hãa th¹ch trªn ®©y ®Òu ®−îc t×m thÊy ë Ch©u Phi. MÉu hãa th¹ch
hominid ®Çu tiªn ®−îc t×m thÊy ë ngoµi Ch©u Phi thuéc vÒ ng−êi Homo erectus, gäi lµ
ng−êi £rec hay ng−êi ®øng th¼ng. Hãa th¹ch ng−êi £rec, cã tuæi kho¶ng 1 triÖu n¨m,
®−îc t×m thÊy ë nhiÒu vïng thuéc khu vùc §«ng-Nam Ch©u ¸, trong ®ã cã Ên §é,
In®«nªsia, Trung Quèc, ViÖt Nam... §iÒu nµy cho thÊy H. erectus ®· cã ph¹m vi ph©n bè
réng vµ cã thÓ lµ nguån gèc h×nh thµnh nªn c¸c quÇn thÓ ng−êi “cæ x−a” ë Ch©u ¢u, Ch©u
¸ vµ Ch©u Phi. Ng−êi cæ x−a ®−îc biÕt ®Õn nhiÒu nhÊt lµ ng−êi Nªan®ectan (H.
neanderthalensis) ph¸t triÓn kh¸ h−ng thÞnh ë Ch©u ¢u vµ vïng CËn §«ng c¸ch ®©y vµi
tr¨m ngh×n n¨m. Dùa vµo ®Æc ®iÓm h×nh th¸i vµ tæ chøc x· héi gÇn gièng víi ng−êi, tr−íc
®©y ng−êi ta tõng cho r»ng ng−êi Nªan®ectan cã kh¶ n¨ng lµ tæ tiªn cña ng−êi hiÖn ®¹i.
Nh−ng, nh÷ng b»ng chøng ph©n tö (so s¸nh ADN hÖ gen ti thÓ gi÷a hai loµi) gÇn ®©y cho
thÊy ng−êi Nªan®ectan kh«ng hÒ ®ãng gãp vËt chÊt di truyÒn vµo vèn gen ng−êi hiÖn ®¹i.
ThÕ nªn, nhiÒu kh¶ n¨ng, ng−êi Nªan®ectan chÝnh lµ “®èi thñ” c¹nh tranh víi ng−êi cæ
x−a vèn lµ tæ tiªn cña ng−êi hiÖn ®¹i. Trong cuéc c¹nh tranh ®ã, ng−êi Nªan®ectan tá ra
kÐm thÝch nghi h¬n vµ bÞ tuyÖt chñng.
Ng−êi hiÖn ®¹i cã thÓ ®· tiÕn hãa ®ång thêi tõ c¸c quÇn thÓ ng−êi cæ x−a vèn ®·
h×nh thµnh tõ tr−íc ë Ch©u ¢u, Ch©u ¸ vµ Ch©u Phi; hoÆc còng cã thÓ chØ tõ mét ch©u

315
§inh §oµn Long

lôc (nhiÒu kh¶ n¨ng lµ Ch©u Phi), sau ®ã ph¸t t¸n ra c¸c vïng kh¸c trªn Tr¸i ®Êt qua sù
di c−. Gi¶ thiÕt thø nhÊt ®−îc gäi lµ “gi¶ thiÕt ®a vïng”, cßn gi¶ thiÕt thø hai ®−îc gäi lµ
“gi¶ thiÕt ngoµi Ch©u Phi”. TiÕc r»ng, c¸c b»ng chøng hãa th¹ch thu ®−îc ®Òu kh«ng
kh¼ng ®Þnh ®−îc gi¶ thiÕt nµo phï hîp h¬n. Nh−ng gÇn ®©y, viÖc ph©n tÝch vµ so s¸nh
c¸c tr×nh tù ADN ë ng−êi ®−¬ng thêi ®· phÇn nµo tr¶ lêi ®−îc c©u hái nµy.

10.5.5. Nguån gèc loµi ng−êi theo b»ng chøng ph©n tö


Trong vßng 20 n¨m qua, c¸c b»ng chøng ph©n tö (ADN, protein) ®· cung cÊp nhiÒu
th«ng tin bæ sung quan träng vÒ qu¸ tr×nh h×nh thµnh ng−êi hiÖn ®¹i. NhiÒu dÊu hiÖu
ph©n tö kh¸c nhau ®· ®−îc sö dông, nh− c¸c dÊu hiÖu ®a h×nh nhãm m¸u vµ isozyme, ®a
h×nh c¸c ®o¹n giíi h¹n (RFLP), ®a h×nh chiÒu dµi c¸c ®o¹n lÆp l¹i kÕ tiÕp (SSR, VNTR),
v.v... C¶ hai hÖ gen nh©n vµ ti thÓ ®Òu ®−îc “huy ®éng” trong nh÷ng nghiªn cøu nµy. HÖ
gen nh©n cã “−u thÕ” khi ®¸nh gi¸ tÝnh ®a d¹ng di truyÒn chung cña vèn gen loµi ng−êi;
nh−ng hÖ gen ti thÓ cã “−u thÕ” trong viÖc ph©n tÝch di truyÒn theo dßng mÑ, vµ x¸c ®Þnh
thêi ®iÓm ph©n li tiÕn hãa cña c¸c chñng téc.
So víi phÇn lín c¸c ®éng vËt kh¸c, hÖ gen ng−êi cã tÝnh ®ång nhÊt kh¸ cao. Khi so
s¸nh c¸c tr×nh tù ADN, sù thay thÕ c¸c nucleotide ë hÖ gen ng−êi thÊp h¬n 4 lÇn so víi
tinh tinh vµ b»ng 1/10 so víi ruåi giÊm. PhÇn lín (85 – 95%) c¸c d¹ng biÕn dÞ di truyÒn
(c¸c alen) ë ng−êi biÓu hiÖn ngay trong mçi quÇn thÓ, chø kh«ng ph¶i gi÷a c¸c quÇn thÓ
kh¸c nhau. TÇn sè biÕn dÞ t−¬ng ®èi thÊp gi÷a c¸c quÇn thÓ ng−êi cho thÊy: trong qu¸
tr×nh tiÕn hãa cña ng−êi hiÖn ®¹i, kÝch th−íc c¸c quÇn thÓ “tiÒn th©n” ®−îc duy tr× vÒ sau
®· rÊt nhá, −íc tÝnh chØ cã tõ 10.000 ®Õn 100.000 c¸ thÓ. Cã thÓ kÝch th−íc thùc cña c¸c
quÇn thÓ “tiÒn th©n” nµy lµ lín h¬n, nh−ng do mét sè yÕu tè nh− tËp tÝnh kÕt cÆp giao
phèi (®Æc ®iÓm tæ chøc x· Vèn gen
héi), ¸p lùc cña chän läc tù hiÖn t¹i
nhiªn lªn qu¸ tr×nh sinh
s¶n, “hiÖu øng th¾t cæ chai”
g©y ra bëi hµng lo¹t dÞch
bÖnh, n¹n ®ãi, thiªn tai...
dÉn ®Õn kÝch th−íc quÇn
thÓ di truyÒn hiÖu qu¶
(®ãng gãp vµo vèn gen
ng−êi ®−¬ng thêi) ®· lu«n
nhá h¬n 100.000 c¸ thÓ. Thêi
Trong nh÷ng quÇn thÓ nhá gian
nh− vËy, hiÖn t−îng “l¹c
dßng di truyÒn” ®· −u thÕ
h¬n so víi ®ét biÕn trong
viÖc quy ®Þnh sù c©n b»ng
gi÷a møc ®é biÕn dÞ vµ tØ lÖ
c¸c alen trung tÝnh ®−îc
chän läc duy tr×.
Tæ tiªn
Khi ph©n tÝch c¸c chung cña
quÇn thÓ ng−êi kh¸c nhau, c¸c c¸ thÓ
biÕn dÞ di truyÒn ë c¸c ®ang sèng
chñng téc ng−êi Ch©u Phi
cao h¬n h¼n c¸c ch©u lôc H×nh 10.15. Qu¸ tr×nh “dÝnh chËp”. NÕu c¸c dßng tr×nh tù ADN ®−îc t×m
thÊy trong c¸c c¸ thÓ ®ang sèng (vèn gen hiÖn t¹i) ®−îc truy nguyªn vÒ qu¸
kh¸c. §iÒu nµy ñng hé gi¶
khø, th× sÏ thÊy tÊt c¶ c¸c c¸ thÓ hiÖn ®ang tån t¹i ®Òu cã mét tæ tiªn chung.
thiÕt “ngoµi Ch©u Phi”. C¸c tr×nh tù ADN kh¸c ®· tõng cã trong qu¸ khø nh−ng hiÖn nay kh«ng
Ngoµi ra, c¸c kÕt qu¶ so cßn tån t¹i lµ do sù tuyÖt chñng ®−îc kÝ hiÖu b»ng vßng trßn ®en (•).

316
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

s¸nh hÖ gen ti thÓ gi÷a c¸c quÇn thÓ ng−êi kh¸c nhau còng ®· ñng hé gi¶ thiÕt nµy,
nghÜa lµ ban ®Çu chØ cã mét quÇn thÓ ng−êi hiÖn ®¹i ë Ch©u Phi råi di c− tíi c¸c ch©u lôc
kh¸c vµ h×nh thµnh nªn c¸c quÇn thÓ míi (h×nh 10.15).
B»ng viÖc ph©n tÝch hÖ gen ti thÓ gi÷a c¸c chñng téc ng−êi, mét sè nhµ tiÕn hãa −íc
tÝnh tæ tiªn chung cña toµn bé ng−êi ®−¬ng thêi (gäi lµ “£va”, do di truyÒn theo dßng mÑ)
sèng c¸ch ®©y tõ 100.000 ®Õn 200.000 n¨m. §iÒu ®¸ng chó ý lµ sau ®ã viÖc so s¸nh vïng
kh«ng t−¬ng ®ång trªn NST Y (di truyÒn theo dßng bè) ë ®µn «ng tõ c¸c quÇn thÓ kh¸c
nhau còng cho kÕt qu¶ t−¬ng tù (“Adam” sèng c¸ch ®©y kho¶ng 150.000 n¨m). KÕt hîp
c¸c sè liÖu nµy, cã thÓ nhËn ®Þnh r»ng mäi ng−êi sèng trªn Tr¸i ®Êt hiÖn nay ®Òu lµ hËu
duÖ cña mét cÆp “£va - Adam” sèng ë Ch©u Phi c¸ch ®©y kho¶ng 150.000 ®Õn 200.000
n¨m. Nãi nh− vËy, kh«ng cã nghÜa lµ vµo thêi ®iÓm ®ã, chØ cã hai c¸ thÓ nµy tån t¹i; mµ
cßn nhiÒu c¸ thÓ kh¸c. Nh−ng, c¸c dßng di truyÒn kh¸c kh«ng ®−îc duy tr× ®Õn ngµy nay.
NÕu tÊt c¶ nh÷ng gi¶ thiÕt vµ kÕt qu¶ ph©n tÝch trªn ®©y lµ ®óng (bëi còng cßn mét
sè yÕu tè ch−a ch¾c ch¾n vÒ gi¶ thiÕt “®ång hå ph©n tö” vµ ®é chÝnh x¸c cña ph−¬ng ph¸p
ph©n tÝch), th× qu¶ thËt loµi ng−êi cßn rÊt trÎ. Cã lÏ, b¾t nguån tõ mét quÇn thÓ “tiÒn
th©n” nhá ë Ch©u Phi; råi tõ Ch©u Phi, loµi ng−êi di c− tíi Ch©u ¸ vµ Ch©u ¢u, sau ®ã
tíi Ch©u óc vµ Ch©u Mü; cuèi cïng, trë thµnh loµi “thèng trÞ” Tr¸i ®Êt nh− hiÖn nay.

10.6. Sù tiÕn hãa lêi nãi (ng«n ng÷) ë ng−êi

10.6.1. TÝnh tr¹ng “lêi nãi” ë ng−êi vµ gen FOX2P


NÕu nh− cÊu tróc di truyÒn hÖ gen ng−êi vµ c¸c loµi ®éng vËt cã vó kh¸c (nh−
chuét, tinh tinh) lµ gièng nhau, th× mét c©u hái ®Æt ra lµ: sù s¸ng t¹o tiÕn hãa “xuÊt
chóng” nµo ®· lµm cho loµi ng−êi rÊt kh¸c biÖt víi nh÷ng loµi cßn l¹i? Chóng ta h·y dù
®o¸n vÒ nguån gèc mét tÝnh (a)
tr¹ng ph¶n ¸nh sù kh¸c biÖt Chuét
cña loµi ng−êi, ®ã lµ “lêi nãi” Tæ tiªn
chung §−êi −¬i
hay “ng«n ng÷”. §Õn nay,
loµi ng−êi lµ loµi duy nhÊt cã KhØ Gorilla
thÓ giao tiÕp b»ng c¶ hÖ Tinh tinh lïn 3
thèng ng«n ng÷ nãi vµ viÕt.
Tinh tinh 2
Loµi ®éng vËt gÇn ng−êi
nhÊt lµ tinh tinh còng cã kh¶ Ng−êi
n¨ng giao tiÕp qua mét d¹ng
(b)
ng«n ng÷ ®¬n gi¶n, nh−ng s¬ 80 303 325
khai h¬n rÊt nhiÒu so víi loµi N D N S C
ng−êi. VËy, ng«n ng÷ ®· Ng−êi
h×nh thµnh nh− thÕ nµo
trong qu¸ tr×nh ph¸t sinh
N D T N C
Tinh tinh
loµi ng−êi?
Kh¶ n¨ng nãi phô
N E T A C
Chuét
thuéc vµo sù ®iÒu phèi ho¹t
®éng chÝnh x¸c cña c¸c c¬ H×nh 10.16. Sù tiÕn hãa cña protein FOX2P. (a) Mèi quan hÖ gi÷a
c¸c loµi ®−îc x¸c ®Þnh dùa trªn sù sai kh¸c vÒ tr×nh tù axit amin trong
trong thanh qu¶n vµ miÖng. protein FOX2P ë chuét vµ c¸c loµi linh tr−ëng; c¸c chØ sè (2, 3) lµ sè
Sù biÓu hiÖn gi¶m ®i cña mét axit amin ®−îc thay thÕ. (b) C¸c axit amin ®−îc thay thÕ trong protein
protein ®iÒu hßa cã tªn lµ FOX2P ë chuét, tinh tinh vµ ng−êi.

317
§inh §oµn Long

FOXP2 ®−îc t×m thÊy lµ nguyªn nh©n dÉn ®Õn nhiÒu d¹ng sai háng kh¸c nhau vÒ kh¶
n¨ng nãi. Nh÷ng c¸ thÓ thiÕu hôt protein nµy gÆp khã kh¨n trong viÖc ph¸t ©m vµ diÔn
®¹t ng«n ng÷. Gen FOXP2 còng ®−îc t×m thÊy vµ ph©n lËp tõ c¸c ®éng vËt kh¸c nh−
chuét, tinh tinh vµ ®−êi −¬i (h×nh 10.16a). Nh−ng d¹ng protein FOXP2 cña ng−êi kh¸c
biÖt ®«i chót so víi c¸c d¹ng t×m thÊy ë c¸c loµi linh tr−ëng vµ ®éng vËt cã vó kh¸c. §Æc
biÖt, cã hai sù thay thÕ axit amin chØ cã ë protein FOX2P cña ng−êi, ®ã lµ: Thr → Asn t¹i
vÞ trÝ 303, vµ Asn → Ser t¹i vÞ trÝ 325 (h×nh 10.16b). Cã lÏ, nh÷ng ®ét biÕn nµy ®· lµm
thay ®æi chøc n¨ng protein FOX2P cña ng−êi. Mét sè b»ng chøng cho thÊy vïng ®iÒu hßa
øc chÕ cña protein nµy mÊt kh¶
n¨ng ®iÒu khiÓn mét sè gen ®Ých
vèn bÞ øc chÕ ë tinh tinh vµ Vá n·o míi
chuét. HiÖn t−îng nµy d−êng ë c¸c loµi
nh− gièng víi sù xuÊt hiÖn ®o¹n linh tr−ëng
peptide “ph¶n øc chÕ” cña
protein Ubx t×m thÊy ë gi¸p x¸c
(xem môc 10.2). Ngoµi ra,
nh÷ng thay ®æi trong kiÓu biÓu
hiÖn cña gen FOX2P hoÆc trong N MiÒn
chÝnh tr×nh tù c¸c gen ®Ých còng ho¹t hãa
Protein
cã thÓ lµ nguyªn nh©n dÉn ®Õn FOX2P
sù ph¸t triÓn kh¶ n¨ng nãi ë MiÒn liªn kÕt
ng−êi. ADN sîi kÐp
C
10.6.2. Gen FOX2P thóc ®Èy
sù ph¸t triÓn ng«n ng÷ Ng−êi Tinh tinh
ë ng−êi nh− thÕ nµo?
ë ®©y, chóng ta còng ®Ò Gen A Gen A
cËp ®Õn 3 c¬ chÕ lµm thay ®æi “BËt” “T¾t”
chøc n¨ng protein ®iÒu hßa vèn +1 +1
®· ®−îc nªu trong tr−êng hîp
gen Ubx. Nh÷ng nguyªn lý nµy
còng ®−îc ¸p dông ®èi víi gen Gen B Gen B
FOX2P. Cã lÏ ®· cã mét sù kÕt “BËt” “T¾t”
hîp ®ång thêi 3 c¬ chÕ (thay ®æi +1 +1
kiÓu biÓu hiÖn cña gen ®iÒu hßa,
thay ®æi tr×nh tù axit amin cña
protein ®iÒu hßa do gen ®iÒu
Gen C Gen C
hßa m· hãa vµ nh÷ng thay ®æi
“BËt” “BËt”
ngay trong tr×nh tù c¸c gen +1 +1
®Ých) dÉn ®Õn viÖc protein H×nh 10.17. FOX2P vµ thuyÕt tiÕn hãa "ng«n ng÷" ë ng−êi.
FOX2P “®ét xuÊt” trë thµnh mét Protein ®iÒu hßa FOX2P ®−îc biÓu hiÖn trong vá n·o ë ng−êi còng
chÊt “m«i giíi” quan träng cho nh− ë tinh tinh. Tuy nhiªn, ho¹t tÝnh cña protein nµy ë hai loµi cã ®iÓm
sù h×nh thµnh ng«n ng÷ ë ng−êi. kh¸c nhau. Gen ë ng−êi ®−îc biÓu hiÖn m¹nh vµo ®óng thêi ®iÓm cña
Cô thÓ, mét ®ét biÕn trong tr×nh qu¸ tr×nh ph¸t triÓn trung khu “nãi”, trong ®ã cã sù ho¹t hãa 3 gen
®Ých (gi¶ ®Þnh lµ A, B vµ C) trong vïng vá n·o. Nh÷ng gen ®Ých nµy
tù ®iÒu hßa cña gen FOX2P ®· m· hãa c¸c chÊt dÉn truyÒn thÇn kinh quan träng quyÕt ®Þnh sù h×nh
®−îc ph¸t hiÖn lµ nguyªn nh©n thµnh trung khu “nãi”. Ng−îc l¹i, ë tinh tinh, gen FOX2P kh«ng ®−îc
lµm thay ®æi kiÓu biÓu hiÖn cña biÓu hiÖn vµo ®óng thêi ®iÓm tèi −u nhÊt cña qu¸ tr×nh ph¸t triÓn trung
khu “nãi”; ngoµi ra, ngay c¶ khi ®−îc biÓu hiÖn ®óng thêi ®iÓm, sù
gen FOX2P trong n·o ng−êi. ë kh¸c biÖt vÒ mét sè axit amin trong protein FOX2P cña tinh tinh lµm
tinh tinh, gen nµy kh«ng ®−îc gi¶m ho¹t tÝnh ho¹t hãa c¸c gen ®Ých. KÕt qu¶ lµ, tinh tinh chØ cã kh¶
biÓu hiÖn t¹i vÞ trÝ thÝch hîp n¨ng giao tiÕp b»ng ng«n ng÷ “cæ x−a”.

318
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

trong n·o vµ vµo mét thêi ®iÓm phï hîp cña qu¸ tr×nh ph¸t triÓn. Ng−îc l¹i, ë ng−êi gen
nµy ®−îc biÓu hiÖn ë vÞ trÝ vµ thêi ®iÓm rÊt phï hîp cho sù ph¸t triÓn kh¶ n¨ng nãi ë trÎ
em. Ngoµi ra, ë phÇn sau, chóng ta sÏ thÊy protein FOX2P ë ng−êi vµ tinh tinh cã c¸c
nhãm gen ®Ých kh¸c nhau. Gi¶ thiÕt nµy mÆc dï chØ lµ suy ®o¸n, nh−ng nã gióp gi¶i
thÝch t¹i sao chØ mét sè thay ®æi nhá trong c¸c gen ®iÒu hßa vµ gen ®Ých cña chóng l¹i cã
thÓ t¹o nªn ®−îc mét tÝnh tr¹ng “®éc ®¸o” nh− ng«n ng÷ ë ng−êi.
Trong sè c¸c gen ®Ých ®−îc gen FOX2P ®iÒu khiÓn cã c¸c gen m· hãa c¸c chÊt dÉn
truyÒn thÇn kinh vµ c¸c protein tÝn hiÖu quan träng cho sù ph¸t triÓn thanh qu¶n.
Nh÷ng biÕn ®æi ë nh÷ng gen nµy cã thÓ lµm thay ®æi thêi ®iÓm biÓu hiÖn vµ t¨ng møc
biÓu hiÖn cña c¸c gen, sao cho c¸c tÝn hiÖu thiÕt yÕu ®−îc h×nh thµnh ë thanh qu¶n vµo
®óng thêi ®iÓm trÎ ®ang ph¸t triÓn kh¶ n¨ng nãi trë nªn nh¹y c¶m nhÊt víi kh¶ n¨ng
tiÕp thu ng«n ng÷. C¸c gen t−¬ng øng ë tinh tinh chØ biÓu hiÖn ë møc thÊp, sai vÞ trÝ vµ ë
thêi ®iÓm muén h¬n trong qu¸ tr×nh ph¸t triÓn thanh qu¶n (h×nh 10.17).
FOX2P chØ lµ mét vÝ dô vÒ gen ®iÒu hßa tham gia vµo sù ph¸t triÓn “kh¶ n¨ng nãi”
ë ng−êi. ThËt khã ®Ó −íc l−îng cã bao nhiªu “gen ®iÒu hßa ng«n ng÷” kÓ tõ khi cã sù
ph©n li tiÕn hãa gi÷a ng−êi vµ tinh tinh. Tuy vËy, ë ®Çu ch−¬ng nµy chóng ta ®· thÊy chØ
cÇn Ýt h¬n 100 “gen ®iÒu hßa quy ®Þnh kiÓu biÓu hiÖn gen” còng ®ñ ®Ó t¹o nªn mét sù ®a
d¹ng h×nh th¸i rÊt lín ë c¸c loµi ®éng vËt ch©n ®èt. V× vËy, cã lÏ chØ cÇn mét sè gen ®iÒu
hßa lµ ®ñ ®Ó dÉn ®Õn sù ph¸t triÓn ng«n ng÷ ë ng−êi.

10.7. Sù tiÕn hãa c¸c gen c¶m nhËn mµu s¾c vµ bÖnh di truyÒn liªn quan

10.7.1. C¬ së tÕ bµo cña sù c¶m nhËn mµu s¾c ë m¾t


Chóng ta c¶m nhËn ®−îc h×nh ¶nh qua c¸c n¬ron thÇn kinh vâng m¹c ë phÝa sau
nh·n cÇu (h×nh 10.18). Nh÷ng n¬ron nµy cã hai lo¹i: tÕ bµo h×nh nãn vµ tÕ bµo h×nh que.
C¸c tÕ bµo h×nh que chiÕm 95% sè l−îng c¸c tÕ bµo c¶m nhËn ¸nh s¸ng vµ ®−îc kÝch
thÝch bëi c¸c ¸nh s¸ng yÕu. ë c−êng ®é s¸ng m¹nh h¬n, c¸c tÕ bµo h×nh que bÞ b·o hßa vµ
kh«ng cßn chøc n¨ng göi c¸c tÝn hiÖu bæ sung thªm vÒ n·o bé. Lóc nµy, c¸c tÕ bµo h×nh
nãn sÏ tiÕp qu¶n chøc n¨ng nµy, xö lý c¸c b−íc sãng cña ¸nh s¸ng m¹nh, göi tÝn hiÖu vÒ
n·o bé vµ gióp chóng ta ph©n biÖt ®−îc mµu s¾c. C¸c tÕ bµo h×nh nãn cã ba lo¹i. Lo¹i thø
nhÊt chuyªn hãa ®Ó c¶m nhËn ¸nh s¸ng ®á, lo¹i thø hai c¶m nhËn ¸nh s¸ng xanh lôc vµ
lo¹i thø ba c¶m nhËn ¸nh s¸ng xanh lam. §èi víi mçi tÕ bµo thô quan ¸nh s¸ng nh− vËy,
ho¹t ®éng c¶m nhËn ¸nh s¸ng bao gåm sù hÊp thô c¸c photon tõ ¸nh s¸ng ë mét d¶i b−íc
sãng nhÊt ®Þnh, chuyÓn th«ng tin vÒ sè l−îng vµ n¨ng l−îng cña c¸c photon thµnh c¸c tÝn
hiÖu ®iÖn tö vµ chuyÓn c¸c tÝn hiÖu ®ã qua tÕ bµo thÇn kinh thÞ gi¸c tíi bé n·o.

10.7.2. HÖ gen ng−êi cã bèn gen m· hãa bèn protein c¶m nhËn mµu s¾c
C¸c protein c¶m nhËn photon vµ khëi ®Çu sù truyÒn tÝn hiÖu ë c¸c tÕ bµo h×nh nãn
lµ rhodopsin. Protein nµy cã mét chuçi polypeptide duy nhÊt gåm 348 axit amin gÊp nÕp
thµnh chuçi zigzag xuyªn mµng tÕ bµo (h×nh 10.18). Mét axit amin Lys n»m trong chuçi
liªn kÕt víi mét ph©n tö carotenoid s¾c tè trªn vâng m¹c cã kh¶ n¨ng hÊp thô photon.
C¸c axit amin gÇn vïng liªn kÕt vâng m¹c t¹o nªn miÒn ho¹t ®éng cña rhodopsin. Nhê
viÖc thay ®æi vÞ trÝ vâng m¹c qua mét c¬ chÕ ®Æc biÖt, rhodopsin quy ®Þnh kiÓu ®¸p øng
¸nh s¸ng cña tÕ bµo vâng m¹c. Mçi tÕ bµo h×nh que chøa kho¶ng 100 triÖu ph©n tö
rhodopsin. Gen m· hãa rhodopsin ë ng−êi n»m trªn NST sè 3.
Protein cã vai trß c¶m nhËn vµ khëi ®Çu qu¸ tr×nh truyÒn tÝn hiÖu ë c¸c tÕ bµo h×nh
nãn ®èi víi photon mµu xanh lam cã quan hÖ tiÕn hãa víi rhodopsin. Protein nµy còng chØ

319
§inh §oµn Long

cã mét chuçi polypeptide duy a)


nhÊt gåm 348 axit amin vµ bao C¸c tÕ bµo h×nh BiÓu m«
quanh mét ph©n tö s¾c tè ë nãn vµ h×nh que s¾c tè
vâng m¹c. GÇn 50% tr×nh tù
axit amin trªn ph©n tö protein
Vâng m¹c
c¶m nhËn ¸nh s¸ng xanh lam
gièng rhodopsin; phÇn cßn l¹i
kh¸c víi rhodopsin lµ phÇn TÕ bµo thô
chuyªn hãa cho sù c¶m nhËn ¸nh s¸ng c¶m ¸nh s¸ng
¸nh s¸ng xanh lam (h×nh H×nh que
10.18b). Gen m· hãa protein
nµy n»m trªn NST sè 7.
H×nh nãn
Còng cã quan hÖ tiÕn hãa
víi protein rhodopsin lµ c¸c
protein c¶m nhËn ¸nh s¸ng ®á Vâng
vµ xanh lôc n»m trong c¸c tÕ ¸nh s¸ng
m¹c
bµo h×nh nãn mµu ®á vµ xanh Rhodopsin
lôc. Hai protein nµy còng chØ cã
mét chuçi polypeptide duy b) 1- Protein Rhodopsin 2- Protein c¶m nhËn mµu xanh lam
nhÊt, nh−ng chiÒu dµi lµ 364
axit amin. Chóng còng liªn kÕt
víi vâng m¹c vµ n»m xuyªn
mµng tÕ bµo (h×nh 10.18b). 3-Protein c¶m nhËn mµu lôc 4-Protein c¶m nhËn mµu ®á
Còng gièng nh− protein c¶m
nhËn mµu xanh lam, c¸c
protein c¶m nhËn mµu ®á vµ
xanh lôc cã gÇn 50% tr×nh tù
axit amin gièng rhodopsin; c¸c c) C¸c gen m· hãa protein c¶m nhËn mµu ®á
d) Sù tiÕn hãa cña c¸c gen
protein nµy chØ kh¸c nhau c¶m nhËn mµu s¾c
(1) vµ lôc (2) trªn NST X
trung b×nh 4 / 100 axit amin. Gen tiÒn th©n
MÆc dï chØ kh¸c biÖt nhá nh−
vËy nh−ng c¸c protein nµy ®·
biÖt hãa c¸c tÕ bµo h×nh nãn 1 2 2 2 §á Lôc Lam Rhodopsin
thµnh hai lo¹i c¶m øng víi c¸c
photon ¸nh s¸ng cã b−íc sãng H×nh 10.18. C¬ së ph©n tö cña sù c¶m nhËn mµu s¾c. (a) c¸c tÕ
kh¸c nhau, gäi lµ c¸c tÕ bµo bµo h×nh nãn vµ h×nh que ë vâng m¹c chøa hµng triÖu protein thô
h×nh nãn mµu ®á vµ xanh lôc. thÓ liªn kÕt mµng tÕ bµo cã vai trß c¶m nhËn ¸nh s¸ng. (b) c¸c thô
C¶ hai gen m· hãa cho c¸c thÓ c¶m nhËn ¸nh s¸ng ë tÕ bµo h×nh que lµ rhodopsin. C¸c protein
protein c¶m nhËn mµu ®á vµ thô thÓ c¶m nhËn mµu ®á, xanh lam vµ lôc cã ë c¸c tÕ bµo h×nh nãn
gièng víi rhodopsin ë phÇn lín tr×nh tù, nh−ng vÉn ®ñ kh¸c biÖt dÉn
xanh lôc ®Òu n»m trªn NST X, ®Õn kh¶ n¨ng thô c¶m mµu s¾c kh¸c nhau. (c) c¸c gen m· hãa
vµ xÕp thµnh mét chuçi kÕ tiÕp protein c¶m nhËn mµu ®á (1) vµ lôc (2) n»m thµnh chuçi trªn NST
nhau. Mçi NST X ë ng−êi X. Ng−êi b×nh th−êng cã 1 b¶n sao gen m· hãa protein c¶m nhËn
th−êng mang 1 gen m· hãa mµu ®á vµ tõ 1 ®Õn 5 b¶n sao gen m· hãa protein c¶m nhËn mµu
protein c¶m nhËn ¸nh s¸ng ®á lôc. (d) sù tiÕn hãa cña c¸c protein c¶m nhËn mµu s¾c cho thÊy
chóng cïng xuÊt ph¸t tõ mét gen tiÒn th©n, tr¶i qua ba ®ét biÕn lÆp
duy nhÊt, nh−ng cã 1 - 5 b¶n ®o¹n gen ®éc lËp, sau ®ã lµ sù ph©n ly vÒ chøc n¨ng cña c¸c gen.
sao gen m· hãa protein c¶m
nhËn ¸nh s¸ng xanh lôc n»m liÒn kÒ nhau (h×nh 10.18c).

10.7.3. Hä gen rhodopsin tiÕn hãa do hiÖn t−îng lÆp ®o¹n vµ ph©n li chøc n¨ng
Sù gièng nhau vÒ cÊu tróc vµ chøc n¨ng gi÷a bèn lo¹i protein rhodopsin cho thÊy
c¸c gen m· hãa c¸c protein nµy xuÊt hiÖn do hiÖn t−îng lÆp ®o¹n cña mét gen thô thÓ

320
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

c¶m nhËn ¸nh s¸ng tiÒn th©n, råi tiÕp tôc ph©n li do sù tÝch lòy ®ét biÕn. C¸c ®ét biÕn t¹o
nªn kh¶ n¨ng c¶m nhËn mµu s¾c ®−îc −u tiªn chän läc qua hµng triÖu n¨m tiÕn hãa. C¸c
protein c¶m nhËn ¸nh s¸ng ®á vµ xanh lôc gièng nhau h¬n c¶ (chØ kh¸c nhau 15 axit
amin), cho thÊy chóng ®−îc ph©n li gÇn ®©y. Cßn sù gièng nhau vµ kh¸c nhau gi÷a hai
lo¹i protein c¶m nhËn mµu xanh lam vµ rhodopsin, còng nh− so s¸nh víi hai lo¹i protein
cßn l¹i, cho thÊy hai lo¹i protein ®−îc nh¾c ®Õn tr−íc xuÊt hiÖn vµ ph©n li sím h¬n trong
qu¸ tr×nh tiÕn hãa (h×nh 10.18d).

10.7.4. §ét biÕn ë hä gen rhodopsin ¶nh h−ëng ®Õn thÞ lùc vµ kh¶ n¨ng nhËn
biÕt mµu

10.7.4.1. NhiÒu ®ét biÕn thay thÕ axit amin ë rhodopsin g©y mï toµn phÇn hay mét phÇn
Ng−êi ta ®· ph¸t hiÖn ®−îc Ýt nhÊt 29 d¹ng ®ét biÕn thay thÕ axit amin trong
protein rhodopsin g©y nªn mét nhãm bÖnh di truyÒn tréi n»m trªn NST th−êng (gäi
chung lµ c¸c bÖnh lo¹n s¾c tè vâng m¹c, retinitis pigmentosa) víi biÓu hiÖn lµ: ban ®Çu
c¸c tÕ bµo h×nh que mÊt chøc n¨ng, råi dÇn dÇn c¸c tÕ bµo vâng m¹c ngo¹i vi bÞ tho¸i hãa.
Nh÷ng ®ét biÕn nµy g©y nªn sù gÊp nÕp sai cña rhodopsin, hoÆc lµm protein nµy trë nªn
kÐm bÒn. B×nh th−êng, protein rhodopsin ph¶i g¾n vµo mµng tÕ bµo h×nh que, nh−ng khi
bÞ ®ét biÕn chóng kh«ng g¾n ®−îc vµo mµng tÕ bµo vµ kh«ng biÓu hiÖn ®−îc chøc n¨ng
b×nh th−êng. Khi kh«ng cã ®ñ rhodopsin trªn mµng tÕ bµo, tÕ bµo h×nh que th−êng bÞ
chÕt. Tïy theo sè tÕ bµo h×nh que chÕt, ng−êi bÖnh cã thÓ bÞ mï hoµn toµn hay mét phÇn.
C¸c ®ét biÕn kh¸c ë gen m· hãa rhodopsin cßn g©y nªn mét d¹ng bÖnh lý Ýt nghiªm
träng h¬n lµ bÖnh mï ban ®ªm. C¸c ®ét biÕn nµy lµm thay ®æi tr×nh tù cña c¸c axit amin
trong ph©n tö protein theo h−íng lµm t¨ng ng−ìng ¸nh s¸ng kÝch thÝch cÇn thiÕt ®Ó khëi
®Çu chuçi truyÒn tÝn hiÖu c¶m nhËn ¸nh s¸ng. Víi nh÷ng thay ®æi nµy, khi c−êng ®é ¸nh
s¸ng yÕu, m¾t kh«ng c¶m nhËn ®−îc mµu s¾c.
10.7.4.2. C¸c ®ét biÕn gen ë tÕ bµo h×nh nãn lµm gi¶m thÞ lùc theo kiÓu dù ®o¸n ®−îc
C¸c rèi lo¹n thÞ lùc g©y ra bëi c¸c ®ét biÕn liªn quan ®Õn c¸c gen s¾c tè thuéc tÕ bµo
h×nh nãn Ýt nghiªm träng h¬n so víi c¸c rèi lo¹n thÞ lùc g©y ra bëi c¸c ®ét biÕn t−¬ng tù
x¶y ra víi c¸c gen rhodopsin trong c¸c tÕ bµo h×nh que. Nguyªn nh©n chñ yÕu cã lÏ bëi v×
c¸c tÕ bµo h×nh que chiÕm ®Õn 95% sè n¬ron thÇn kinh c¶m nhËn mµu s¾c ë ng−êi, trong
khi c¸c tÕ bµo h×nh nãn chØ chiÕm 5%. Mét sè ®ét biÕn liªn quan ®Õn gen m· hãa protein
c¶m nhËn mµu xanh lam n»m trªn NST sè 7 g©y nªn héi chøng rèi lo¹n thÞ lùc s¾c tè
xanh (tritanopia). C¸c ®ét biÕn ë gen m· hãa protein c¶m nhËn s¾c tè ®á trªn NST X cã
thÓ lµm mÊt chøc n¨ng c¶m nhËn mµu ®á cña c¸c tÕ bµo h×nh nãn vµ g©y bÖnh mï mµu
®á. Mét sè ®ét biÕn nhá kh¸c liªn quan ®Õn gen quy ®Þnh protein c¶m nhËn mµu ®á cã thÓ
g©y nªn bÖnh mï mµu ®á mét phÇn hoÆc hoµn toµn tïy vµo vÞ trÝ ®ét biÕn.
10.7.4.3. Trao ®æi chÐo kh«ng c©n gi÷a c¸c gen m· hãa protein c¶m nhËn mµu xanh lôc
vµ ®á trªn NST X g©y ra phÇn lín c¸c rèi lo¹n thÞ lùc vÒ c¶m nhËn mµu
Mét ng−êi b×nh th−êng chØ cã mét gen duy nhÊt m· hãa protein c¶m nhËn mµu ®á
n»m trªn NST X; nh−ng n»m kÒ gen nµy cã tõ mét ®Õn n¨m b¶n sao gen m· hãa protein
c¶m nhËn mµu xanh lôc. C¸c gen ®á vµ xanh lôc cã tr×nh tù ADN gièng nhau 96%. C¸c
b¶n sao kh¸c nhau cña gen xanh lôc gièng nhau ®Õn 99,9%. Sù gièng nhau vµ n»m gÇn
nhau cña nh÷ng gen nµy lµm hiÖn t−îng trao ®æi chÐo kh«ng c©n rÊt dÔ x¶y ra. Cã lÏ v×
vËy, nhiÒu ®ét biÕn mÊt gen mµu ®á ®· ®−îc t×m thÊy lµ do sù trao ®æi chÐo kh«ng c©n ë
vïng gen nµy. KÕt qu¶ cña nh÷ng trao ®æi chÐo nµy lµ sù tæ hîp l¹i cña c¸c gen xanh lôc,
hoÆc t¹o ra c¸c gen lai míi “xanh lôc - ®á”. Do kh¶ n¨ng c¶m nhËn mµu ®á vµ xanh lôc
phô thuéc vµo tØ lÖ ¸nh s¸ng ®á vµ xanh lôc ®−îc ph¶n chiÕu tõ h×nh ¶nh, nh÷ng ng−êi
thiÕu c¸c gen nµy sÏ c¶m nhËn hai mµu ®á vµ xanh lôc nh− mét mµu gièng nhau.

321
§inh §oµn Long

10.7.4.4. Mét sè ®ét biÕn cã thÓ lµm mÊt kh¶ n¨ng c¶m nhËn mµu ®á vµ xanh lôc
§Õn nay, ®· ph¸t hiÖn cã b¶y d¹ng ®ét biÕn mÊt ®o¹n NST g©y bÖnh mï mµu ®á vµ
xanh lôc liªn kÕt víi NST giíi tÝnh X. BÖnh lý nµy ®−îc gäi lµ héi chøng tÕ bµo h×nh nãn
®¬n s¾c xanh lam (blue cone monochromacy). Nh÷ng ng−êi m¾c héi chøng nµy chØ c¶m
nhËn ®−îc mµu liªn quan ®Õn mµu xanh lam. Nghiªn cøu ph©n tö cho thÊy: c¶ b¶y ®ét
biÕn mÊt ®o¹n nµy ®Òu liªn quan ®Õn mét tr×nh tù gåm 600 bp n»m ngoµi vïng m· hãa
cña c¸c gen ®á vµ xanh lôc. §iÒu nµy cho thÊy ®©y cã thÓ lµ ®o¹n tr×nh tù ®iÒu hßa dµi
cÇn cho sù biÓu hiÖn cña chuçi c¸c gen c¶m nhËn mµu ®á vµ xanh lôc.
Nh− vËy, chóng ta nh×n vµ c¶m nhËn ®−îc c¸c mµu s¾c ®a d¹ng, phong phó cña
v¹n vËt mét phÇn lµ nhê bèn gen trùc tiÕp m· hãa bèn lo¹i protein trong c¸c tÕ bµo
h×nh que vµ h×nh nãn ë vâng m¹c m¾t. C¸c ®ét biÕn lµm thay ®æi nh÷ng gen nµy hoÆc
sè l−îng cña chóng cã thÓ lµm gi¶m thÞ lùc, thËm chÝ lµm háng kh¶ n¨ng c¶m nhËn
mµu s¾c cña m¾t.

322

You might also like