You are on page 1of 372

Lêi nãi ®Çu

MÆc dï di truyÒn häc ®· ®−îc con ng−êi øng dông trong c«ng t¸c chän, t¹o gièng vËt
nu«i vµ c©y trång tõ hµng ngh×n n¨m tr−íc, nh−ng chØ trong vßng 50 n¨m qua, nh÷ng
nguyªn lý c¬ b¶n cña di truyÒn häc ë cÊp ®é ph©n tö vµ d−íi tÕ bµo míi dÇn ®−îc lµm s¸ng tá.
Nh÷ng hiÓu biÕt vÒ c¸c c¬ chÕ di truyÒn tõ gen ®Õn hÖ gen ngµy cµng trë nªn s©u vµ
réng h¬n. §Æc biÖt, kÓ tõ n¨m 2000, khi dù ¸n gi¶i tr×nh tù hÖ gen ng−êi hoµn thµnh b¶n
th¶o ®Çu tiªn, ®· cã nhiÒu ®æi míi vÒ c¸ch “t− duy” trong c¸c nghiªn cøu di truyÒn häc.
Cïng víi c«ng nghÖ th«ng tin, di truyÒn häc ph©n tö ®−îc dù ®o¸n lµ mét trong hai chuyªn
ngµnh khoa häc cã ¶nh h−ëng lín nhÊt ®Õn ®êi sèng x· héi trong giai ®o¹n hiÖn nay vµ s¾p
tíi. C¶ hai chuyªn ngµnh khoa häc nµy ®Òu liªn quan ®Õn viÖc khai th¸c, ph©n tÝch vµ xö
lý mét l−îng lín d÷ liÖu ®−îc m· hãa ë c¸c d¹ng ng«n ng÷ rÊt linh ho¹t vµ hiÖu qu¶. NÕu
ng«n ng÷ cña c«ng nghÖ th«ng tin do con ng−êi s¸ng t¹o, th× ng«n ng÷ vµ c¸c th«ng tin di
truyÒn ®−îc l−u gi÷ trong c¸c hÖ gen sinh vËt ngµy nay lµ kÕt qu¶ cña sù sèng ®· h×nh
thµnh vµ ph¸t triÓn qua nhiÒu triÖu n¨m tiÕn hãa.
Víi c¸ch ®æi míi “t− duy” nh− vËy, gi¸o tr×nh nµy ®−îc biªn so¹n nh»m cung cÊp cho
sinh viªn c¸c ngµnh sinh häc, c«ng nghÖ sinh häc vµ s− ph¹m sinh häc c¸c nguyªn lý c¬
b¶n cña di truyÒn häc ë cÊp ®é ph©n tö vµ tÕ bµo phôc vô cho c¸c c«ng viÖc häc tËp vµ
nghiªn cøu. Gi¸o tr×nh ®−îc chia lµm 11 ch−¬ng víi c¸c néi dung sau:
Ch−¬ng I. Liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc
Ch−¬ng II. CÊu tróc, ®Æc tÝnh, chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc
(ADN, ARN vµ protein)
Ch−¬ng III. Sao chÐp axit nucleic
Ch−¬ng IV. Phiªn m· vµ dÞch m· di truyÒn
Ch−¬ng V. Gen vµ sù ®iÒu hßa biÓu hiÖn gen
Ch−¬ng VI. §ét biÕn vµ söa ch÷a ADN
Ch−¬ng VII. C¬ së di truyÒn häc nhiÔm s¾c thÓ
Ch−¬ng VIII. Chu tr×nh tÕ bµo vµ c¬ së di truyÒn häc ung th−
Ch−¬ng IX. §iÒu hßa gen hÖ miÔn dÞch ë ®éng vËt cã x−¬ng sèng
Ch−¬ng X. Di truyÒn häc ph©n tö vµ tiÕn hãa
Ch−¬ng XI. Ph©n tÝch gen vµ s¶n phÈm cña gen
Ngoµi viÖc sö dông lµm gi¸o tr×nh häc tËp cña sinh viªn c¸c ngµnh sinh häc, c«ng
nghÖ sinh häc vµ s− ph¹m sinh häc, cuèn s¸ch nµy cã thÓ ®−îc dïng lµm tµi liÖu tham kh¶o
cho sinh viªn, häc viªn cao häc vµ nghiªn cøu sinh cã liªn quan ®Õn sinh häc ë c¸c tr−êng
§¹i häc Y, §¹i häc D−îc, §¹i häc N«ng nghiÖp, §¹i häc L©m nghiÖp ... còng nh− víi c¸c
gi¸o viªn gi¶ng d¹y sinh häc ë c¸c tr−êng THPT, c¸c nhµ khoa häc ë c¸c viÖn nghiªn cøu
chuyªn ngµnh hoÆc nh÷ng ai quan t©m ®Õn di truyÒn häc.
Dï ®· cè g¾ng cËp nhËt nh÷ng th«ng tin míi thuéc lÜnh vùc Di truyÒn häc ph©n tö vµ
tÕ bµo, nh−ng trong bèi c¶nh chuyªn ngµnh nµy ®ang ph¸t triÓn m¹nh mÏ vµ kh«ng ngõng
®æi míi, ngoµi ra trong lÇn xuÊt b¶n ®Çu tiªn, gi¸o tr×nh nµy ch¾c kh«ng thÓ tr¸nh khái
thiÕu sãt. C¸c t¸c gi¶ tr©n träng ®ãn nhËn vµ c¶m ¬n c¸c ý kiÕn nhËn xÐt, gãp ý cña c¸c
®ång nghiÖp lµm c«ng t¸c gi¶ng d¹y sinh häc, c¸c nhµ khoa häc, c¸c sinh viªn, häc viªn cao
häc, nghiªn cøu sinh vµ ®éc gi¶ gÇn xa ®Ó lÇn xuÊt b¶n sau cuèn s¸ch ®−îc hoµn chØnh h¬n.

C¸c t¸c gi¶

i
Danh môc c¸c tõ vµ ch÷ viÕt t¾t
Tõ viÕt t¾t NghÜa tiÕng ViÖt NghÜa tiÕng Anh
Ψ / ΨU Pseudouridine Pseudouridine
∆G Møc chªnh lÖch n¨ng l−îng tù do Change in free energy
2-AP 2-aminopurine 2-aminopurine
2D-PAGE §iÖn di 2 chiÒu trªn gel polyacrylamide 2-D polyacrylamide gel electrophoresis
3’UTR Vïng ®Çu 3’ kh«ng ®−îc dÞch m· 3’-untranslated region
5’UTR Vïng ®Çu 5’ kh«ng ®−îc dÞch m· 5’-untranslated region
5-BU 5-bromouracine 5-bromouracine
ADN Axit deoxyribonucleic Deoxyribonucleic acid
ADN pol ADN polymerase / ADN polymeraza DNA polymerase
ADP Adenosine diphosphate Adenosine diphosphate
AIDS Héi chøng suy gi¶m miÔn dÞch m¾c ph¶i Acquired immunodeficiency syndrome
AMP Adenosine monophosphate Adenosine monophosphate
ARE Tr×nh tù ARN giµu AU AU-rich element (sequence)
ARN Axit ribonucleic Ribonucleic acid
ARN pol ARN polymerase / ARN polymeraza RNA polymerase
ARNi ARN can thiÖp Interfering RNA
ATP Adenosine triphosphate Adenosine triphosphate
BER Söa ch÷a b»ng c¾t bá baz¬ nit¬ Base excision repair
cADN ADN phiªn m· ng−îc tõ ARN Complementary DNA (cDNA)
cAMP AMP vßng Cyclic AMP
CAP / CRP Protein ho¹t hãa bëi chÊt dÞ hãa / Catabolite activator protein /
Protein thô thÓ cña cAMP cAMP receptor protein
CDK Enzym kinase phô thuéc cyclin Cyclin-dependent kinase
CE §iÖn di mao qu¶n Capillary electrophoresis
CML Ung th− b¹ch cÇu thÓ tñy tr−êng diÔn Chronic myelogenous cancer
cs Céng sù Co-workers
CTAB Cetyltrimethylammonium bromide Cetyltrimethylammonium bromide
Da Dalton Dalton
DGGE §iÖn di biÕn tÝnh gradient Denaturing gradient gel
electrophoresis
DHU Dihydrouridine Dihydrouridine
dNTP Deoxyribonucleotide triphosphate Deoxyribonucleotide triphosphate
dsADN ADN sîi kÐp Double strand DNA
§VCXS §éng vËt cã x−¬ng sèng Vertebrate animal
EDTA Ethylene diamine tetraacetate Ethylene diamine tetraacetate
EHMR Khèi phæ ®é ph©n gi¶i cùc cao Extremely high mass resolution
EJC Phøc hÖ nèi c¸c exon Exon joining complex
EMS Ethyl methane sulfonate Ethyl methane sulfonate
ESI Ion hãa phun ®iÖn Electrospray ionization
EST §o¹n ®¸nh dÊu tr×nh tù biÓu hiÖn Expressed sequence tag

iii
Tõ viÕt t¾t NghÜa tiÕng ViÖt NghÜa tiÕng Anh
FAP Héi chøng u tuyÕn polyp theo dßng hä Familial adenomatous polyposis
FGF YÕu tè t¨ng tr−ëng nguyªn bµo sîi Fibroblast growth factor
FISH Lai huúnh quang t¹i chç Fluorescent insitu hybridization
gARN ARN dÉn ®−êng Guide RNA
GR Thô thÓ glucocorticoid Glucocorticoid receptor
HIV Virut g©y suy gi¶m miÔn dÞch ë ng−êi Human immunodeficiency virus
HLA Kh¸ng nguyªn liªn kÕt tÕ bµo lympho ng−êi Human leukocyte antigen
HPLC S¾c ký láng cao ¸p / S¾c ký hiÖu n¨ng cao High pressure liquid chromatography
IRES VÞ trÝ ®i vµo cña ribosome Internal ribosome entry site
IS C¸c tr×nh tù (yÕu tè) cµi Insertion sequence
Kcb H»ng sè c©n b»ng Equilibrium constant
kDa Kilodalton Kilodalton
LCR Vïng ®iÒu khiÓn locut Locus control region
LINE C¸c tr×nh tù dµi n»m r¶i r¸c trong nh©n Long interspersed nuclear element
LTR C¸c tr×nh tù lÆp l¹i dµi ë ®Çu tËn cïng Long terminal repeat
MALDI Ph©n hñy laser trong chÊt mang Matrix-assissted laser desorption
ionization
mARN ARN th«ng tin Messeger RNA
MHC Phøc hÖ kh¸ng nguyªn t−¬ng hîp m« Major histocompability complex
miARN TiÓu ARN Micro RNA (miRNA)
MMR Söa ch÷a kÕt cÆp sai nhê m¹ch khu«n Methyl-directed mismatch repair
®−îc methyl hãa
MMS Methyl methane sulfonate Methyl methane sulfonate
MS Khèi phæ Mass spectrophotometry
mtARN ARN ti thÓ Mitochondrial RNA
NER Söa ch÷a b»ng c¾t bá nucleotide Nucleotide excision repair
NJ ThuËt to¸n kÕt nèi l©n cËn Neighbor joining
NMD Ph©n hñy mARN mang ®ét biÕn v« nghÜa Nonsense mediated decay of mRNA
NMR Céng h−ëng tõ h¹t nh©n Nuclear magnetic resonance
NST NhiÔm s¾c thÓ Chromosome
NTP Ribonucleotide triphosphate Ribonucleotide triphosphate
ORF Khung ®äc më Open reading frame
PABP Protein liªn kÕt ®u«i polyA PolyA binding protein
PAGE §iÖn di trªn gel polyacrylamide Polyacrylamide gel electrophoresis
PCR Ph¶n øng chuçi trïng hîp Polymerase chain reaction
PDGF YÕu tè t¨ng tr−ëng cã nguån gèc tiÓu cÇu Platelet-derived growth factor
PEP Phosphoenolpyruvate Phosphoenolpyruvate
PFGE §iÖn di xung tr−êng Pulsed-field gel electrophoresis
PITC Phenylisothyocyanate Phenylisothyocyanate
PPi / ~ Nhãm pyrophosphate Pyrophosphate group
PTS HÖ thèng phosphoryl hãa phô thuéc vµo PEP-dependent phosphotransferase
PEP system

iv
Tõ viÕt t¾t NghÜa tiÕng ViÖt NghÜa tiÕng Anh
rARN ARN ribosome Ribosomal RNA
RBS VÞ trÝ liªn kÕt ribosome Ribosome binding site
RFLP §a h×nh ®é dµi c¸c ®o¹n giíi h¹n Restriction fragment length
polymorphism
RISC Phøc hÖ t¾t gen kÝch øng bëi ARN RNA-induced silencing complex
RPBS VÞ trÝ liªn kÕt protein ®iÒu hßa Regulatory protein binding site
SCID BÖnh suy gi¶m miÔn dÞch kÕt hîp Severe combined immunodeficiency
nghiªm träng disease
SDS Sodium dodecyl sulfate Sodium dodecyl sulfate
siARN ARN can thiÖp kÝch th−íc nhá Small interfering RNA
SINE C¸c yÕu tè tr×nh tù ng¾n n»m r¶i r¸c Short interspersed nuclear element
trong nh©n
SMC Protein duy tr× cÊu tróc nhiÔm s¾c thÓ Structural maintenance of chromosome
snARN ARN nh©n kÝch th−íc nhá Small nuclear RNA
snoARN ARN h¹ch nh©n kÝch th−íc nhá Small nucleolar RNA
snRNP Ribonucleoprotein kÝch th−íc nhá Small nuclear ribonucleoprotein
SRP ARN ARN nhËn biÕt tÝn hiÖu Signal recognition RNA
ssADN ADN m¹ch ®¬n Single strand DNA
SSB Protein b¸m m¹ch ®¬n Single strand binding protein
STR / SSR Tr×nh tù vi vÖ tinh Microsatellite / simple tandem repeats
tARN ARN vËn chuyÓn Transfer RNA
TBP Protein liªn kÕt hép TATA TATA-box binding protein
TE YÕu tè di truyÒn vËn ®éng / gen nh¶y Transposable element
TIC HÖ thèng vËn chuyÓn translocase mµng Translocase, inner chloroplast
trong l¹p thÓ
TIM HÖ thèng vËn chuyÓn translocase mµng Translocase, inner mitochondrial
trong ti thÓ
tmARN ARN tÝch hîp cña mARN vµ tARN tmRNA
TMV Virut kh¶m thuèc l¸ Tobacco mosaic virus
TOC HÖ thèng vËn chuyÓn translocase mµng Translocase, outer chloroplast
ngoµi l¹p thÓ
TOF Thêi gian bay Time of flight
TOM HÖ thèng vËn chuyÓn translocase mµng Translocase, outer mitochondrial
ngoµi ti thÓ
uORF Khung ®äc më n»m ng−îc dßng Upstream open reading frame
UPGMA ThuËt to¸n ph©n cÆp dùa trªn gi¸ trÞ Unweighted pair group with
trung b×nh arthmetic means
UV Tia cùc tÝm Ultra violet
VNTR Tr×nh tù nucleotide ng¾n lÆp l¹i liªn tôc Variable number tandem repeats /
víi sè l−îng biÕn ®éng/ tiÓu vÖ tinh minisatellite

v
Ch−¬ng 1

liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

1.1. §Æc ®iÓm liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc
Liªn kÕt hãa häc lµ lùc hÊp dÉn gi÷ c¸c nguyªn tö víi nhau. Sù kÕt tô cña c¸c nguyªn
tö thµnh mét khèi cã kÝch th−íc x¸c ®Þnh ®−îc gäi lµ ph©n tö. Tr−íc ®©y, ng−êi ta cho r»ng
trong ph©n tö chØ c¸c liªn kÕt céng hãa trÞ (lµ nh÷ng liªn kÕt rÊt m¹nh) míi cã vai trß gi÷
c¸c nguyªn tö víi nhau. Giê ®©y, chóng ta ®· biÕt c¸c liªn kÕt yÕu còng cã vai trß quan
träng trong cÊu tróc cña c¸c ph©n tö sinh häc. Ch¼ng h¹n nh−, bèn chuçi polypeptide cña
hemoglobin ®−îc ®Ýnh kÕt víi nhau nhê mét sè liªn kÕt yÕu. Nh− vËy, mÆc dï quen gäi lµ
liªn kÕt yÕu, nh−ng khi kÕt hîp l¹i c¸c liªn kÕt yÕu còng cã thÓ gi÷ c¸c nguyªn tö víi nhau.
C¸c liªn kÕt hãa häc ®−îc ph©n lo¹i dùa trªn mét sè ®Æc tÝnh, trong ®ã cã lùc liªn kÕt. C¸c
liªn kÕt m¹nh hÇu nh− kh«ng bao giê tù ®øt g·y trong ®iÒu kiÖn sinh lý c¬ thÓ, v× vËy c¸c
nguyªn tö ®−îc tËp hîp bëi c¸c liªn kÕt céng hãa trÞ lu«n thuéc vÒ cïng mét ph©n tö. C¸c
liªn kÕt yÕu th× dÔ ®øt g·y h¬n nhiÒu vµ khi tån t¹i ®¬n lÎ, thêi gian tån t¹i cña chóng
th−êng rÊt ng¾n. Nh−ng, khi tËp hîp l¹i theo mét trËt tù nhÊt ®Þnh th× c¸c liªn kÕt yÕu cã
thÓ tån t¹i l©u dµi. Lùc cña mét liªn kÕt hãa häc t−¬ng quan víi “chiÒu dµi” cña chóng. V×
vËy, hai nguyªn tö ®−îc gi÷ bëi liªn kÕt m¹nh lu«n gÇn nhau h¬n hai nguyªn tö cïng lo¹i
®−îc gi÷ bëi liªn kÕt yÕu. VÝ dô: liªn kÕt céng hãa trÞ gi÷a hai nguyªn tö H trong ph©n tö
(H:H) cã kho¶ng c¸ch 0,74Å, trong khi kho¶ng c¸ch nµy trong lùc Van der Waals lµ 1,2Å.
Mét ®Æc tÝnh quan träng kh¸c lµ sè liªn kÕt tèi ®a mµ mçi nguyªn tö cã thÓ t¹o ra. Sè
liªn kÕt céng hãa trÞ tèi ®a mµ mét nguyªn tö cã thÓ cã ®−îc gäi lµ hãa trÞ cña nguyªn tö ®ã.
Ch¼ng h¹n nh− oxy cã hãa trÞ 2, nghÜa lµ nã kh«ng bao giê h×nh thµnh ®−îc nhiÒu h¬n hai
liªn kÕt céng hãa trÞ. §èi víi liªn kÕt Van der Waals, ®Æc tÝnh nµy linh ho¹t h¬n. Trong ®ã,
sè liªn kÕt Van der Waals mµ mét nguyªn tö cã thÓ cã chØ phô thuéc vµo vÞ trÝ kh«ng gian
cña nã vµ sè nguyªn tö kh¸c mµ nã cã thÓ ®ång thêi tiÕp xóc. Sù h×nh thµnh c¸c liªn kÕt
hydro bÞ h¹n chÕ h¬n so víi liªn kÕt Van der Waals. Mét nguyªn tö hydro liªn kÕt céng
hãa trÞ th−êng chØ tham gia vµo mét liªn kÕt hydro duy nhÊt, trong khi mét nguyªn tö oxy
cã thÓ tham gia vµo nhiÒu h¬n hai liªn kÕt hydro kh¸c nhau. C¸c liªn kÕt m¹nh vµ yÕu
cßn kh¸c nhau vÒ gãc liªn kÕt, ®ã lµ gãc ®−îc h×nh thµnh gi÷a hai liªn kÕt xuÊt ph¸t tõ
cïng mét nguyªn tö. Gãc liªn kÕt gi÷a hai liªn kÕt céng hãa trÞ ®Æc thï th−êng lµ æn ®Þnh.
VÝ dô nh− khi nguyªn tö cacbon cã bèn liªn kÕt céng hãa trÞ ®¬n (CH4), mçi liªn kÕt t¹o
thµnh mét gãc cña khèi tø diÖn ®Òu (gãc liªn kÕt ≈ 109o). Ng−îc l¹i, gãc t¹o thµnh gi÷a c¸c
liªn kÕt yÕu th−êng kh«ng æn ®Þnh. Ngoµi ra, c¸c liªn kÕt cßn kh¸c nhau vÒ møc quay tù
do. C¸c liªn kÕt céng hãa trÞ ®¬n cho phÐp c¸c nguyªn tö quay tù do xung quanh nguyªn tö
liªn kÕt, trong khi c¸c liªn kÕt céng hãa trÞ kÐp (liªn kÕt ®«i hoÆc liªn kÕt ba) th× cøng
nh¾c. V× lý do nµy, nªn c¸c nhãm cacbonyl (C=O) vµ imino (N=C) g¾n kÕt víi nhau qua liªn
kÕt peptide ph¶i n»m trªn cïng mét “mÆt ph¼ng t−¬ng ®èi”. C¸c liªn kÕt yÕu h¬n (nh− liªn
kÕt ion) th× ng−îc l¹i kh«ng cã h¹n chÕ nµo vÒ viÖc ®Þnh h−íng t−¬ng ®èi gi÷a c¸c nguyªn tö.

1.1.1. Sù h×nh thµnh liªn kÕt hãa häc g¾n liÒn víi sù thay ®æi vÒ n¨ng l−îng
Sù h×nh thµnh mét liªn kÕt hãa häc tù ph¸t gi÷a hai nguyªn tö lu«n g¾n liÒn víi sù
gi¶i phãng mét phÇn n¨ng l−îng bªn trong cña c¸c nguyªn tö ë d¹ng kh«ng liªn kÕt (tù do)
vµ chuyÓn chóng thµnh mét d¹ng n¨ng l−îng míi. Liªn kÕt cµng m¹nh th× n¨ng l−îng

1
§inh §oµn Long

“tho¸t” ra cµng lín. Ph¶n øng h×nh thµnh liªn kÕt gi÷a hai nguyªn tö A vµ B cã thÓ m« t¶
nh− sau:
A + B → AB + n¨ng l−îng (ph−¬ng tr×nh 1.1)
trong ®ã AB biÓu diÔn ph©n tö liªn kÕt. Tèc ®é ph¶n øng t−¬ng quan thuËn víi tÇn sè va
ch¹m cña c¸c nguyªn tö. §¬n vÞ th−êng ®−îc dïng ®Ó biÓu diÔn n¨ng l−îng lµ calo; ®ã lµ
l−îng n¨ng l−îng cÇn thiÕt ®Ó lµm t¨ng nhiÖt ®é 1 gam n−íc lªn 1oC. Nh−ng ®Ó lµm vì c¸c
liªn kÕt hãa häc cña mét mole ph©n tö nµo ®ã, th−êng cÇn hµng ngh×n calo, v× vËy møc thay
®æi n¨ng l−îng trong c¸c ph¶n øng hãa häc th−êng ®−îc biÓu diÔn b»ng ®¬n vÞ kcal/mol.
Tuy vËy, c¸c nguyªn tö liªn kÕt hãa häc víi nhau kh«ng ph¶i lu«n duy tr× ë tr¹ng th¸i
liªn kÕt. Sù cã mÆt cña nhiÒu lùc cã thÓ lµm ph¸ vì c¸c liªn kÕt nµy. Mét trong nh÷ng lùc
nh− vËy lµ nhiÖt n¨ng. Sù va ®Ëp gi÷a c¸c nguyªn tö hoÆc ph©n tö khi chuyÓn ®éng nhanh
cã thÓ ph¸ vì c¸c liªn kÕt hãa häc. Trong qu¸ tr×nh va ®Ëp, mét phÇn ®éng n¨ng cña c¸c
nguyªn tö chuyÓn ®éng cã thÓ ®Èy bËt hai nguyªn tö ®ang liªn kÕt ra khái nhau. Mét ph©n
tö cµng chuyÓn ®éng nhanh (tøc lµ nhiÖt ®é cµng cao), th× kh¶ n¨ng ph¸ vì c¸c liªn kÕt
cµng lín. V× vËy, khi nhiÖt ®é cña hçn hîp c¸c ph©n tö t¨ng lªn, th× sù bÒn v÷ng cña c¸c liªn
kÕt hãa häc gi¶m ®i. Sù ®øt g·y cña mét liªn kÕt hãa häc ®−îc biÓu diÔn bëi ph−¬ng tr×nh:
AB + n¨ng l−îng → A + B (ph−¬ng tr×nh 1.2)
L−îng n¨ng l−îng cÇn ®−îc bæ sung ®Ó ph¸ vì mét liªn kÕt ®óng b»ng l−îng n¨ng
l−îng ®−îc gi¶i phãng khi liªn kÕt ®ã h×nh thµnh. Sù c©n b»ng nµy lµ néi dung ®Þnh luËt
nhiÖt ®éng häc thø nhÊt vèn ®−îc ph¸t biÓu r»ng “n¨ng l−îng kh«ng tù nhiªn sinh ra hoÆc
mÊt ®i”.

1.1.2. Sù c©n b»ng gi÷a qu¸ tr×nh h×nh thµnh vµ ph¸ vì liªn kÕt hãa häc
Nh− vËy, sù h×nh thµnh hay ph¸ vì mét liªn kÕt hãa häc lµ kÕt qu¶ cña c¸c ho¹t ®éng
kÕt hîp gi÷a c¸c lùc h×nh thµnh vµ ph¸ vì liªn kÕt. Khi mét hÖ thèng kÝn ®¹t ®Õn tr¹ng th¸i
c©n b»ng, th× sè liªn kÕt h×nh thµnh qua mét ®¬n vÞ thêi gian sÏ ®óng b»ng sè liªn kÕt bÞ ph¸
vì. Khi ®ã, tØ lÖ c¸c nguyªn tö ë tr¹ng th¸i liªn kÕt sÏ ®−îc biÓu diÔn b»ng c«ng thøc sau:
Kcb = [AB]/([A]x[B]) (ph−¬ng tr×nh 1.3)
trong ®ã, Kcb lµ h»ng sè c©n b»ng; [AB], [A] vµ [B] t−¬ng øng lµ nång ®é cña AB, A vµ B,
tÝnh theo ®¬n vÞ mole/L. Dï cho chóng ta b¾t ®Çu hÖ thèng chØ víi A vµ B riªng rÏ, hoÆc
phøc hîp AB, hay c¶ phøc hîp AB vµ A, B riªng rÏ, th× cuèi cïng hÖ thèng kÝn sÏ ®¹t ®Õn
c¸c nång ®é t−¬ng quan cña Kcb.

1.1.3. Kh¸i niÖm vÒ n¨ng l−îng tù do


Mét sù thay ®æi vÒ n¨ng l−îng lu«n xuÊt hiÖn khi cã mét tØ lÖ nhÊt ®Þnh c¸c nguyªn tö
ë tr¹ng th¸i liªn kÕt dÇn chuyÓn sang tr¹ng th¸i c©n b»ng. Trong sinh häc, c¸ch biÓu diÔn sù
thay ®æi n¨ng l−îng nh− vËy h÷u hiÖu nhÊt lµ n¨ng l−îng tù do, ®−îc viÕt t¾t lµ G (®Ó t−ëng
nhí nhµ vËt lý Josiah Gibbs). Trong ph¹m vi gi¸o tr×nh nµy, chóng ta kh«ng ®Ò cËp s©u vÒ
kh¸i niÖm n¨ng l−îng tù do. ë ®©y, xÐt vÒ mÆt sinh häc, chóng ta chØ thõa nhËn lµ “n¨ng
l−îng tù do lµ d¹ng n¨ng l−îng cã thÓ ho¹t ®éng”.
§Þnh luËt thø hai cña nhiÖt ®éng häc ph¸t biÓu r»ng n¨ng l−îng tù do lu«n mÊt ®i
(∆G < 0) khi ph¶n øng hãa häc x¶y ra tù ph¸t, nh−ng khi ®¹t ®Õn tr¹ng th¸i c©n b»ng,
n¨ng l−îng tù do sÏ kh«ng thay ®æi (∆G = 0). Nh− vËy, tr¹ng th¸i c©n b»ng cña mét hÖ
thèng kÝn (gåm tËp hîp c¸c nguyªn tö) chÝnh lµ tr¹ng th¸i cã møc thay ®æi n¨ng l−îng tù
do thÊp nhÊt.

2
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

N¨ng l−îng tù do mÊt ®i khi ®¹t ®Õn tr¹ng th¸i B¶ng 1.1. Sù t−¬ng quan gi÷a h»ng
c©n b»ng ®−îc chuyÓn hãa thµnh nhiÖt n¨ng hoÆc sè c©n b»ng Kcb vµ ∆G ë 25oC
®−îc dïng ®Ó lµm t¨ng møc entr«pi. ë ®©y, chóng ta
còng kh«ng bµn s©u vÒ entr«pi, mµ chØ thõa nhËn ®ã Kcb ∆G (Kcal/mol)
lµ ®¹i l−îng ®o møc ®é hçn lo¹n. Khi møc ®é hçn lo¹n 0,0001 4,089
cµng cao, th× møc entr«pi cµng cao vµ xu h−íng cµng 0,01 2,726
cã nhiÒu ph¶n øng tù ph¸t x¶y ra (tøc lµ n¨ng l−îng 0,1 1,363
tù do gi¶m) nh−ng kh«ng nhÊt thiÕt lµm t¨ng nhiÖt
1,0 0
®é. VÝ dô: khi NaCl hßa tan trong n−íc, nhiÖt bÞ hÊp
thu chø kh«ng ph¶i ®−îc gi¶i phãng ra ngoµi. Trong 10,0 - 1,363
tr−êng hîp nµy n¨ng l−îng tù do gi¶m do lµm t¨ng 100,0 - 2,726
tr¹ng th¸i hçn lo¹n cña c¸c ion Na+ vµ Cl- khi chóng 1000,0 -4,089
chuyÓn tõ tr¹ng th¸i r¾n sang tr¹ng th¸i hßa tan.
1.1.3.1. H»ng sè Kcb cã t−¬ng quan theo hµm sè mò víi chØ sè ∆G
C¨n cø vµo lËp luËn trªn ®©y, râ rµng víi c¸c liªn kÕt cµng m¹nh vµ sù thay ®æi møc
n¨ng l−îng tù do cµng lín th× ph¶n øng cµng cã xu h−íng x¶y ra vµ cµng cã nhiÒu nguyªn
tö tån t¹i ë d¹ng liªn kÕt. §iÒu nµy ®−îc biÓu diÔn mét c¸ch ®Þnh l−îng b»ng c«ng thøc sau:
∆G = -RT ln Kcb hay Kcb = e -∆G/RT (ph−¬ng tr×nh 1.4)
trong ®ã, R lµ h»ng sè khÝ phæ th«ng, T lµ nhiÖt ®é tuyÖt ®èi, ln lµ hµm logarit c¬ sè e (cña
Kcb), cßn Kcb lµ h»ng sè c©n b»ng, e = 2,718.
NÕu ¸p dông víi c¸c gi¸ trÞ phï hîp cña R (1,987 cal/deg.mol) vµ T (298 ë 25oC) th× mét
møc chªnh n¨ng l−îng tù do (∆G) b»ng kho¶ng 2 kcal/mol lµ ®ñ ®Ó l¸i ph¶n øng theo h−íng
h×nh thµnh liªn kÕt nÕu c¸c thµnh phÇn ph¶n øng ®Òu cã mÆt ë l−îng mole (b¶ng 1.1).
1.1.3.2. C¸c liªn kÕt céng hãa trÞ lµ c¸c liªn kÕt rÊt m¹nh
C¸c gi¸ trÞ ∆G cña c¸c ph¶n øng h×nh thµnh c¸c liªn kÕt céng hãa trÞ tõ c¸c nguyªn tö
tù do th−êng cã gi¸ trÞ rÊt lín vµ mang dÊu ©m (tøc lµ gi¶i phãng n¨ng l−îng tù do).
Th«ng th−êng ∆G cña c¸c ph¶n øng nµy dao ®éng trong kho¶ng tõ -50 ®Õn -110 kcal/mol.
C¸c ph−¬ng tr×nh 1.3 vµ 1.4 cho thÊy r»ng h»ng sè Kcb cña mét ph¶n øng sÏ cã gi¸ trÞ lín
t−¬ng quan víi sè liªn kÕt ®−îc h×nh thµnh. VÝ dô víi gi¸ trÞ ∆G = - 100 kcal/mol, nÕu
chóng ta b¾t ®Çu víi 1 mol/L c¸c nguyªn tö ph¶n øng, th× chØ cã 1 trong 1040 nguyªn tö tån
t¹i ë tr¹ng th¸i kh«ng liªn kÕt khi hÖ thèng ®¹t ®Õn tr¹ng th¸i c©n b»ng.

1.2. TÇm quan träng vµ ®Æc ®iÓm cña c¸c liªn kÕt yÕu trong c¸c hÖ thèng
sinh häc
C¸c ®¹i ph©n tö sinh häc ®−îc quan t©m nhiÒu nhÊt trong di truyÒn häc vµ sinh häc
ph©n tö hiÖn nay lµ c¸c axit nucleic vµ protein. Chóng ®Òu ®−îc t¹o nªn tõ c¸c liªn kÕt céng
hãa trÞ gi÷a c¸c ®¬n ph©n t−¬ng øng cña chóng lµ c¸c nucleotide vµ c¸c axit amin. C¸c liªn
kÕt céng hãa trÞ lµ c¸c liªn kÕt m¹nh, bÒn v÷ng vµ trong ®iÒu kiÖn nhiÖt ®é sinh lý tÕ bµo,
chóng kh«ng bao giê tù ®øt g·y. Tuy vËy, trong c¸c hÖ thèng sinh häc cßn tån t¹i nh÷ng
liªn kÕt yÕu còng cã vai trß sèng cßn ®èi víi sù sèng. Së dÜ gäi chóng lµ liªn kÕt yÕu v×
chóng cã thÓ h×nh thµnh vµ ®øt g·y ngay trong c¸c ®iÒu kiÖn sinh lý b×nh th−êng. C¸c liªn
kÕt yÕu chiÕm vai trß chñ ®¹o trong ®iÒu hßa t−¬ng t¸c gi÷a c¸c enzym víi c¬ chÊt, gi÷a c¸c
®¹i ph©n tö sinh häc víi nhau, trong ®ã phæ biÕn nhÊt lµ gi÷a c¸c protein vµ gi÷a protein
víi ADN. C¸c liªn kÕt yÕu ®iÒu hßa sù t−¬ng t¸c gi÷a c¸c ®¹i ph©n tö dÉn ®Õn sù thay ®æi cÊu
h×nh kh«ng gian vµ sù biÓu hiÖn chøc n¨ng cña chóng. Do vËy, dï protein cã b¶n chÊt lµ c¸c
chuçi polypeptide gåm c¸c axit amin liªn kÕt céng hãa trÞ víi nhau, th× sù biÓu hiÖn chøc
n¨ng cña chóng l¹i ®−îc quyÕt ®Þnh cuèi cïng bëi tËp hîp cña nh÷ng liªn kÕt yÕu. Së dÜ

3
§inh §oµn Long

nh− vËy lµ do chÝnh nh÷ng liªn kÕt yÕu nµy míi quyÕt ®Þnh cÊu h×nh kh«ng gian thùc tÕ
cña protein khi biÓu hiÖn chøc n¨ng. T−¬ng tù nh− vËy, hai m¹ch cña chuçi xo¾n kÐp ADN
®−îc gi÷ víi nhau bëi mét lo¹i liªn kÕt yÕu cã vai trß ®Æc biÖt, gäi lµ liªn kÕt hydro.
C¸c lo¹i liªn kÕt yÕu cã vai trß quan träng nhÊt trong c¸c hÖ thèng sinh häc bao
gåm c¸c liªn kÕt Van der Waals, liªn kÕt kÞ n−íc, liªn kÕt hydro vµ liªn kÕt ion. Trong ®ã,
®«i khi khã ph©n biÖt gi÷a liªn kÕt hydro vµ liªn kÕt ion.

1.2.1. C¸c liªn kÕt yÕu cã n¨ng l−îng trong kho¶ng 1 – 7 kcal/mol
Liªn kÕt yÕu nhÊt lµ c¸c liªn kÕt Van der Waals. C¸c liªn kÕt nµy cã n¨ng l−îng trong
kho¶ng 1 - 2 kcal/mol, tøc lµ chØ lín h¬n ®«i chót ®éng n¨ng cña chuyÓn ®éng nhiÖt. N¨ng
l−îng cña c¸c liªn kÕt hydro vµ ion vµo kho¶ng 3 - 7 kcal/mol.
Trong c¸c dÞch láng, hÇu hÕt c¸c ph©n tö h×nh thµnh c¸c liªn kÕt yÕu víi c¸c nguyªn tö
ë xung quanh. TÊt c¶ c¸c ph©n tö cã thÓ h×nh thµnh liªn kÕt Van der Waals, nh−ng c¸c liªn
kÕt hydro vµ ion chØ cã thÓ h×nh thµnh gi÷a c¸c ph©n tö mang ®iÖn tÝch hoÆc khi ®iÖn tÝch
trªn ph©n tö ph©n bè kh«ng ®Òu. Theo nguyªn t¾c ®ã, mét sè ph©n tö trong dung dÞch ®ång
thêi h×nh thµnh mét sè liªn kÕt yÕu kh¸c nhau. Nh−ng, xÐt vÒ mÆt n¨ng l−îng, c¸c ph©n tö
lu«n cã xu h−íng “−u tiªn” cho sù h×nh thµnh c¸c liªn kÕt cã n¨ng l−îng m¹nh h¬n.

1.2.2. Trong ®iÒu kiÖn sinh lý sè liªn kÕt yÕu ®−îc h×nh thµnh vµ ph¸ vì æn ®Þnh
N¨ng l−îng cña liªn kÕt yÕu chØ lín h¬n kho¶ng 10 lÇn so víi ®éng n¨ng chuyÓn ®éng
nhiÖt ë 25oC (~0,6 kcal/mol). V× ®éng n¨ng chuyÓn ®éng nhiÖt cña nhiÒu ph©n tö lµ ®ñ lín ®Ó
ph¸ vì c¸c liªn kÕt yÕu ngay sau khi chóng h×nh thµnh ë ®iÒu kiÖn nhiÖt ®é sinh lý cña c¬
thÓ, nªn ë tr¹ng th¸i c©n b»ng sè liªn kÕt yÕu ®−îc h×nh thµnh vµ ph¸ vì lµ æn ®Þnh.

1.2.3. Sù kh¸c biÖt gi÷a c¸c ph©n tö ph©n cùc vµ kh«ng ph©n cùc
Tïy thuéc vµo b¶n chÊt nguyªn tö, sù ph©n cùc cña c¸c ®iÖn tö cã tÝnh th−êng xuyªn
hoÆc t¹m thêi. VÝ dô: ph©n tö oxy (O : O) cã sù ph©n bè ®iÖn tÝch ®èi xøng gi÷a hai nguyªn tö,
nªn mçi nguyªn tö ®Òu mang c¸c ®iÖn tö kh«ng tÝch ®iÖn. Ng−îc l¹i, ph©n tö n−íc (H :O: H)
kh«ng cã sù ph©n bè ®Òu ®iÖn tÝch. C¸c ®iÖn tö bÞ "hót" bëi c¸c nguyªn tö oxy m¹nh h¬n. V×
vËy, nguyªn tö oxy mang ®iÖn ©m, trong khi hai nguyªn tö hydro cïng chia sÎ mét l−îng
®ång ®Òu vÒ ®iÖn tÝch d−¬ng. Trung t©m mang ®iÖn tÝch d−¬ng n»m vÒ mét phÝa so víi
trung t©m mang ®iÖn tÝch ©m. Sù ph©n cùc cña c¸c ®iÖn tÝch d−¬ng vµ ©m nh− vËy h×nh
thµnh nªn momen l−ìng cùc. Sù chia sÎ c¸c ®iÖn tö kh«ng ®ång ®Òu nh− vËy ph¶n ¸nh ¸i
lùc kh¸c nhau ®èi víi c¸c ®iÖn tö cña c¸c nguyªn tö kh¸c nhau. C¸c nguyªn tö cã xu h−íng
hót ®iÖn tö m¹nh ®−îc gäi lµ c¸c nguyªn tö ©m ®iÖn. Ng−îc l¹i, c¸c nguyªn tö cã xu h−íng
cho ®iÖn tö ®−îc gäi lµ c¸c nguyªn tö d−¬ng ®iÖn.
C¸c ph©n tö cã momen l−ìng cùc (nh− H2O) ®−îc gäi lµ c¸c ph©n tö ph©n cùc. C¸c
ph©n tö kh«ng ph©n cùc lµ c¸c ph©n tö kh«ng cã momen l−ìng cùc râ rÖt. VÝ dô nh− ®èi
víi ph©n tö methane (CH4), c¸c nguyªn tö C vµ H cã ¸i lùc víi cÆp ®iÖn tö gi÷a chóng lµ
®ång ®Òu, cho nªn ph©n tö CH4 kh«ng cã tÝnh ph©n cùc.
Tuy vËy, trong dung dÞch sù ph©n bè cña c¸c ®iÖn tö gi÷a c¸c nguyªn tö cßn bÞ ¶nh
h−ëng bëi c¸c nguyªn tö kh¸c ë xung quanh. §iÒu nµy ®Æc biÖt râ ®èi víi c¸c ph©n tö ph©n
cùc. Sù t¸c ®éng cã thÓ lµm cho mét ph©n tö kh«ng ph©n cùc trë thµnh mét ph©n tö cã tÝnh
ph©n cùc nhÑ. KÓ c¶ trong tr−êng hîp ph©n tö thø hai còng kh«ng ph©n cùc, th× sù cã mÆt
cña nã còng lµm thay ®æi ph©n tö kh«ng ph©n cùc thø nhÊt dÉn ®Õn sù dao ®éng ph©n bè
cña c¸c ®iÖn tÝch gi÷a c¸c nguyªn tö. Trong tr−êng hîp nµy, tÊt nhiªn, sù ph©n t¸ch cña c¸c
®iÖn tö kh«ng râ rÖt nh− trong tr−êng hîp cña c¸c ph©n tö ph©n cùc, v× vËy n¨ng l−îng
t−¬ng t¸c còng yÕu h¬n vµ liªn kÕt hãa häc ®−îc h×nh thµnh gi÷a chóng yÕu h¬n.

4
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

1.2.4. Liªn kÕt Van der Waals


C¸c liªn kÕt Van der Waals h×nh
thµnh khi mét lùc hÊp dÉn kh«ng ®Æc 10 Å
hiÖu xuÊt hiÖn khi hai nguyªn tö tiÕp
xóc gÇn nhau. §iÒu nµy x¶y ra do sù Lùc hÊp dÉn Van
dao ®éng cña c¸c ®iÖn tö bÞ ¶nh h−ëng der Waals yÕu
khi c¸c ph©n tö di chuyÓn ®Õn gÇn
nhau. Trªn c¬ së ®ã, liªn kÕt Van der 5Å
Waals cã thÓ xuÊt hiÖn gi÷a mäi lo¹i
ph©n tö, dï chóng lµ ph©n cùc hay
kh«ng ph©n cùc. Nã chñ yÕu chØ phô Lùc hÊp dÉn Van der
thuéc vµo kho¶ng c¸ch gi÷a c¸c nhãm Waals m¹nh
t−¬ng t¸c, trong ®ã n¨ng l−îng liªn kÕt
tØ lÖ nghÞch theo lòy thõa 6 cña kho¶ng 4Å
c¸ch gi÷a chóng (h×nh 1.1).
Tuy vËy, khi c¸c nguyªn tö tiÕn Lùc hÊp dÉn Van der
gÇn ®Õn nhau mét møc nhÊt ®Þnh th× Waals trë nªn c©n b»ng
víi lùc ®Èy do sù ®Ì lªn
l¹i xuÊt hiÖn lùc ®Èy Van der Waals. nhau cña líp ¸o ®iÖn tö
Lùc ®Èy nµy ph¸t sinh do sù ®Ì lªn
nhau cña líp ¸o ®iÖn tö bao quanh c¸c
H×nh 1.1. Lùc Van der Waals thay ®æi theo kho¶ng
nguyªn tö. Lùc ®Èy vµ lùc hÊp dÉn Van
c¸ch nguyªn tö. C¸c nguyªn tö ë ®©y lµ khÝ tr¬ Argon
der Waals sÏ duy tr× hai nguyªn tö ®Æc (theo Pauling I., 1953, General Chemistry, p.322)
thï c¸ch nhau mét kho¶ng c¸ch æn
®Þnh. Kho¶ng c¸ch nµy ®−îc gäi lµ b¸n
kÝnh Van der Waals (b¶ng 1.2). N¨ng
l−îng liªn kÕt Van der Waals gi÷a hai B¶ng 1.2. B¸n kÝnh Van der Waals cña mét sè
nguyªn tö nhÊt ®Þnh t−¬ng quan víi nguyªn tö phæ biÕn trong c¸c ph©n tö sinh häc
tæng b¸n kÝnh Van der Waals cña mçi Nguyªn tö B¸n kÝnh Van der Waals (Å)
nguyªn tö vµ t¨ng lªn cïng víi kÝch
th−íc cña mçi nguyªn tö t−¬ng øng. H 1,2
§èi víi hai nguyªn tö cã kÝch th−íc N 1,5
trung b×nh, n¨ng l−îng nµy vµo kho¶ng O 1,4
1 kcal/mol, tøc lµ chØ lín h¬n ®«i chót
P 1,9
so víi ®éng n¨ng nhiÖt trung b×nh cña
c¸c ph©n tö ë nhiÖt ®é phßng (0,6 S 1,85
kcal/mol). Gèc (- CH3) 2,0
§iÒu nµy cã nghÜa lµ lùc Van der Mét nöa chiÒu dµy
1,7
Waals chØ trë thµnh mét lùc liªn kÕt ph©n tö chÊt th¬m
®¸ng kÓ ë nhiÖt ®é phßng khi mét sè
nguyªn tö cña mét ph©n tö nµo ®ã liªn kÕt víi mét sè nguyªn tö cña mét ph©n tö kh¸c. Khi
®ã, n¨ng l−îng liªn kÕt sÏ lín h¬n nhiÒu so víi ®éng n¨ng nhiÖt g©y nªn sù ph©n t¸ch. §Ó
cã sù t−¬ng t¸c m¹nh qua liªn kÕt Van der Waals, sù "¨n khíp" vÒ cÊu h×nh kh«ng gian
gi÷a c¸c ph©n tö lµ yªu cÇu tiªn quyÕt, ®Ó ®¶m b¶o kho¶ng c¸ch gi÷a hai nguyªn tö t−¬ng
t¸c kh«ng ®−îc lín h¬n tæng b¸n kÝnh Van der Waals. Lùc liªn kÕt Van der Waals sÏ
nhanh chãng bÞ triÖt tiªu khi kho¶ng c¸ch gi÷a c¸c nguyªn tö chØ h¬i v−ît b¸n kÝnh Van
der Waals. Nh− vËy, kiÓu liªn kÕt Van der Waals chØ m¹nh nhÊt khi mét ph©n tö cã mét
phÇn cÊu tróc "¨n khíp" chÆt chÏ víi mét nhãm hay mét vïng cÊu tróc cña mét ph©n tö
kh¸c gièng nh− tr−êng hîp t−¬ng t¸c gi÷a kh¸ng nguyªn víi kh¸ng thÓ. Trong tr−êng hîp
liªn kÕt kh¸ng nguyªn - kh¸ng thÓ, n¨ng l−îng liªn kÕt cã thÓ ®¹t møc 20 - 30 kcal/mol, v×
vËy hiÕm khi phøc hîp kh¸ng nguyªn - kh¸ng thÓ t¸ch nhau ra. C¸c liªn kÕt Van der
Waals th−êng kh«ng chiÕm −u thÕ trong sù liªn kÕt gi÷a c¸c ph©n tö ph©n cùc. Bëi v× c¸c

5
§inh §oµn Long

ph©n tö nµy cã xu h−íng ®¹t ®−îc tr¹ng th¸i n¨ng l−îng thÊp nhÊt (mÊt Ýt n¨ng l−îng tù do
nhÊt) khi h×nh thµnh c¸c d¹ng liªn kÕt kh¸c.

1.2.5. C¸c liªn kÕt hydro


Liªn kÕt hydro lµ liªn kÕt ®−îc h×nh thµnh
gi÷a mét nguyªn tö hydro liªn kÕt céng hãa trÞ B¶ng 1.3. ChiÒu dµi mét sè liªn kÕt
(®−îc gäi lµ nguyªn tö cho liªn kÕt hydro) víi mét hydro quan träng trong sinh häc
nguyªn tö liªn kÕt céng hãa trÞ kh¸c mang mét
sè ®iÖn tÝch ©m hoÆc d−¬ng (®−îc gäi lµ nguyªn Liªn kÕt ChiÒu dµi liªn kÕt (Å)
tö nhËn liªn kÕt hydro). Mét vÝ dô vÒ liªn kÕt O–H
……
O 2,70 ± 0,10
hydro lµ nguyªn tö hydro cña nhãm amino (-H2)
bÞ hÊp dÉn bëi c¸c nguyªn tö oxy tÝch ®iÖn ©m …… - 2,63 ± 0,10
O–H O
trong nhãm keto (-C=O). C¸c liªn kÕt hydro
quan träng nhÊt trong sinh häc lµ liªn kÕt gi÷a O–H
……
N 2,88 ± 0,13
mét nguyªn tö hydro víi mét nguyªn tö oxy (O-
H) hay víi mét nguyªn tö nit¬ (N-H). Nãi c¸ch N–H
……
O 3,04 ± 0,13
kh¸c, c¸c nguyªn tö nhËn liªn kÕt hydro quan
+ ……
träng nhÊt lµ nit¬ vµ oxy. B¶ng 1.3 liÖt kª mét sè N –H O 2,93 ± 0,10
liªn kÕt hydro quan träng. Khi kh«ng cã c¸c ……
ph©n tö n−íc, n¨ng l−îng liªn kÕt hydro vµo N–H N 3,10 ± 0,13
kho¶ng 3 - 7 kcal/mol. Nh×n chung, c¸c liªn kÕt
hydro lµ yÕu h¬n so víi c¸c liªn kÕt céng hãa trÞ
nh−ng m¹nh h¬n c¸c liªn kÕt Van der Waals. V× vËy, kho¶ng c¸ch gi÷a hai nguyªn tö nµo
®ã ®−îc gi÷ l¹i víi nhau bëi liªn kÕt hydro lµ ng¾n h¬n so víi kho¶ng c¸ch cña chóng trong
tr−êng hîp liªn kÕt Van der Waals, nh−ng l¹i xa h¬n trong tr−êng hîp liªn kÕt céng hãa
trÞ.
Mét ®iÓm kh¸c biÖt so víi liªn kÕt Van der Waals lµ c¸c liªn kÕt hydro cã tÝnh ®Þnh
h−íng. Liªn kÕt hydro trë nªn m¹nh nhÊt khi nguyªn tö hydro cho liªn kÕt ë vÞ trÝ ®èi diÖn
trùc tiÕp víi nguyªn tö nhËn liªn kÕt hydro. NÕu gãc liªn kÕt v−ît qu¸ 30o th× lùc liªn kÕt
yÕu ®i nhiÒu. Nh− vËy, liªn kÕt hydro cã tÝnh ®Æc thï cao h¬n so víi liªn kÕt Van der
Waals, bëi chóng cÇn sù t−¬ng ®ång gi÷a c¸c nguyªn tö cho vµ nhËn liªn kÕt.

1.2.6. Mét sè liªn kÕt ion cã b¶n chÊt lµ liªn kÕt hydro
RÊt nhiÒu hîp chÊt h÷u c¬ chøa c¸c nhãm ion mang mét hay nhiÒu ®iÖn tÝch ©m hoÆc
d−¬ng. VÝ dô nh− c¸c nucleotide mang nhãm phosphate tÝch ®iÖn ©m, hay mçi axit amin
(trõ prolin) mang mét nhãm imino tÝch ®iÖn d−¬ng (NH3+) vµ mét nhãm cacboxyl tÝch ®iÖn
©m (COO-). Trong dung dÞch, nh÷ng nhãm tÝch ®iÖn nµy th−êng ®−îc "trung hßa" bëi c¸c
nhãm tÝch ®iÖn tr¸i dÊu ë gÇn. Lùc tÜnh ®iÖn sÏ xuÊt hiÖn gi÷a c¸c nhãm tÝch ®iÖn tr¸i dÊu
vµ ®−îc gäi lµ c¸c liªn kÕt ion. N¨ng l−îng liªn kÕt ion trung b×nh lµ kho¶ng 5 kcal/mol.
Trong nhiÒu tr−êng hîp, c¸c ph©n tö h÷u c¬ bÞ ion hãa th−êng ®−îc trung hßa ®iÖn
tÝch bëi mét cation v« c¬ (nh− Na+, K+ hay Mg2+) hoÆc mét anion v« c¬ (nh− Cl- hay SO42-).
Tuy vËy, ë trong dung dÞch, vÞ trÝ c¸c cation vµ anion th−êng kh«ng cè ®Þnh bëi c¸c ion v« c¬
lu«n bÞ bao v©y bëi “líp ¸o” gåm c¸c ph©n tö n−íc dÉn ®Õn viÖc chóng kh«ng liªn kÕt ®−îc víi
c¸c nhãm tÝch ®iÖn tr¸i dÊu. Do ®ã, trong dung dÞch n−íc, liªn kÕt ion víi c¸c cation hoÆc
anion v« c¬ th−êng kh«ng quyÕt ®Þnh cÊu h×nh kh«ng gian cña c¸c ph©n tö h÷u c¬.
Ng−îc l¹i, liªn kÕt yÕu cã tÝnh ®Þnh h×nh cao h¬n l¹i lµ liªn kÕt hydro ®−îc h×nh
thµnh gi÷a c¸c nhãm ®iÖn tÝch tr¸i dÊu. Ch¼ng h¹n nh− c¸c nhãm COO- vµ NH3+ th−êng
®−îc gi÷ l¹i víi nhau bëi liªn kÕt hydro. Mét liªn kÕt hydro m¹nh còng cã thÓ ®−îc h×nh
thµnh gi÷a mét nhãm tÝch ®iÖn víi mét nhãm kh«ng tÝch ®iÖn. VÝ dô nh−, nguyªn tö hydro

6
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

thuéc nhãm amino (NH2) cã thÓ t¹o liªn kÕt m¹nh víi nguyªn tö oxy cña nhãm cacboxyl
(COO–).

1.2.7. C¸c liªn kÕt yÕu cÇn c¸c bÒ mÆt ph©n tö t−¬ng ®ång
C¸c liªn kÕt yÕu chØ trë nªn hiÖu qu¶ khi bÒ mÆt cña c¸c ph©n tö tiÕp xóc gÇn nhau,
vµ lùc liªn kÕt trë thµnh “m¹nh” khi bÒ mÆt c¸c ph©n tö cã cÊu tróc t−¬ng ®ång (gièng
nh− kiÓu “ch×a khãa tra vµo æ khãa”). Trong sinh häc, “nguyªn t¾c” nµy d−êng nh− ®ång
nghÜa víi viÖc mét lo¹i ph©n tö hÇu nh− kh«ng bao giê −u tiªn t¹o liªn kÕt yÕu víi chÝnh
nã, bëi v× nã th−êng thiÕu tÝnh ®èi xøng cÇn thiÕt. Bëi v× mét ph©n tö cã nguyªn tö hydro
cho liªn kÕt hydro, nh−ng kh«ng cã c¸c nguyªn tö nhËn liªn kÕt hydro phï hîp. Ng−îc
l¹i, nhiÒu ph©n tö cã nhãm nhËn liªn kÕt hydro, nh−ng l¹i kh«ng cã c¸c nguyªn tö hydro
cho liªn kÕt nµy. Nh−ng còng ph¶i nãi r»ng vÉn cã nhiÒu ph©n tö cã tÝnh ®èi xøng cÇn
thiÕt ®Ó cã thÓ tù h×nh thµnh c¸c liªn kÕt yÕu gi÷a chóng víi nhau, nh− c¸c ph©n tö n−íc
ch¼ng h¹n.

1.2.8. C¸c ph©n tö n−íc tù h×nh thµnh liªn kÕt hydro víi nhau
Trong ®iÒu kiÖn sinh lý tÕ bµo, c¸c ph©n tö n−íc hiÕm khi bÞ ion hãa thµnh c¸c ion H+
vµ OH-. Thay vµo ®ã, chóng th−êng tån t¹i d−íi
d¹ng c¸c ph©n tö ph©n cùc H-O-H, víi c¸c
nguyªn tö O vµ H “s½n sµng” cho viÖc h×nh
thµnh nªn c¸c liªn kÕt hydro m¹nh. Trong mçi
ph©n tö n−íc, mçi nguyªn tö oxy cã thÓ g¾n ®−îc
víi hai nguyªn tö H ë bªn ngoµi. Trong khi ®ã,
mçi nguyªn tö H chØ cã thÓ t¹o ®−îc mét liªn kÕt
hydro víi nguyªn tö O bªn ngoµi. Trªn nguyªn
t¾c ®ã, mçi ph©n tö n−íc cã thÓ t¹o liªn kÕt
hydro víi tèi ®a 4 ph©n tö n−íc ë xung quanh
b
vµ h×nh thµnh c¸c gãc cña khèi tø diÖn ®Òu
(h×nh 1.2). ë nhiÖt ®é ®«ng l¹nh, c¸c liªn kÕt
hydro nµy rÊt ch¾c, lµm cho c¸c ph©n tö n−íc cã
cÊu tróc ®Þnh h×nh. Khi nhiÖt ®é cao h¬n 0oC, c
®éng n¨ng nhiÖt cña c¸c ph©n tö ®ñ lín ®Ó cã thÓ H×nh 1.2. Mçi ph©n tö n−íc cã thÓ t¹o liªn
ph¸ vì c¸c liªn kÕt hydro vµ lµm cho c¸c ph©n tö kÕt hydro víi 4 ph©n tö n−íc kh¸c ë xung
n−íc hÇu nh− liªn tôc “thay ®æi” c¸c ph©n tö quanh vµ h×nh thµnh cÊu tróc tø diÖn ®Òu.
n−íc l©n cËn. Nh−ng nh×n chung, ë d¹ng láng Trªn h×nh, c¸c nguyªn tö O lµ h×nh cÇu mµu
mét ph©n tö n−íc lu«n ë tr¹ng th¸i liªn kÕt sÉm, c¸c nguyªn tö H lµ h×nh cÇu mµu s¸ng;
hydro víi bèn ph©n tö n−íc ë xung quanh nã. a,b,c,d lµ c¸c ph©n tö n−íc ë xung quanh

1.2.9. C¸c liªn kÕt yÕu gi÷a c¸c ph©n tö trong c¸c dÞch láng
MÆc dï n¨ng l−îng trung b×nh cña mét liªn kÕt thø cÊp nhá h¬n nhiÒu so víi liªn kÕt
céng hãa trÞ, nh−ng còng ®ñ m¹nh khi so s¸nh víi ®éng n¨ng nhiÖt. V× vËy, trong dung
dÞch phÇn lín c¸c ph©n tö ë tr¹ng th¸i liªn kÕt thø cÊp víi c¸c ph©n tö kh¸c. N¨ng l−îng
liªn kÕt chØ vµo kho¶ng 2 - 3 kcal/mol lµ ®ñ ®Ó c¸c ph©n tö h×nh thµnh nªn mét sè tèi ®a c¸c
liªn kÕt thø cÊp mµ mçi ph©n tö cã thÓ cã. TÝnh ®Þnh h×nh cña mét dung dÞch phô thuéc vµo
thµnh phÇn c¸c chÊt tan, kh«ng chØ v× c¸c ph©n tö nµy cã h×nh d¹ng ®Æc thï mµ cßn v×
chóng cã thÓ cã c¸c liªn kÕt thø cÊp kh¸c nhau. Trong dung dÞch, mét ph©n tö cã xu h−íng
di ®éng liªn tôc cho ®Õn khi nã tiÕp cËn gÇn mét hoÆc mét sè ph©n tö kh¸c mµ nã cã thÓ
h×nh thµnh c¸c liªn kÕt thø cÊp m¹nh nhÊt cã thÓ.
Do c¸c tÕ bµo sèng th−êng tån t¹i ë d¹ng dÞch láng vµ c¸c ho¹t ®éng trao ®æi chÊt lµ sù
chuyÓn hãa th−êng xuyªn mét ph©n tö nµy thµnh mét ph©n tö kh¸c, nªn b¶n chÊt cña c¸c

7
§inh §oµn Long

liªn kÕt thø cÊp thay ®æi liªn tôc. CÊu tróc thÓ dÞch cña tÕ bµo v× vËy còng th−êng xuyªn bÞ
ph¸ vì kh«ng chØ do c¸c chuyÓn ®éng nhiÖt, mµ cßn do sù chuyÓn hãa c¸c ph©n tö chÊt tan.

1.2.10. C¸c ph©n tö h÷u c¬ tan trong n−íc vµ xu h−íng t¹o liªn kÕt hydro
Nh− ®· nãi ë trªn n¨ng l−îng liªn kÕt hydro lín h¬n nhiÒu so víi liªn kÕt Van der
Waals, v× vËy, khi cã ®ñ ®iÒu kiÖn h×nh thµnh liªn kÕt hydro c¸c ph©n tö sÏ cã xu h−íng “−u
tiªn” cho sù h×nh thµnh liªn kÕt hydro h¬n so víi liªn kÕt Van der Waals. VÝ dô vÒ hiÖn
t−îng nµy lµ khi chóng ta trén dung m«i ph©n cùc lµ n−íc víi dung m«i kh«ng ph©n cùc lµ
benzen, c¸c ph©n tö n−íc vµ benzen sÏ nhanh chãng t¸ch nhau ra. C¸c ph©n tö n−íc sÏ “−u
tiªn” h×nh thµnh liªn kÕt hydro víi nhau, cßn c¸c ph©n tö benzen liªn kÕt víi nhau theo lùc
Van der Waals. V× vËy, kh«ng thÓ hßa lÉn mét ph©n tö h÷u c¬ kh«ng cã kh¶ n¨ng t¹o liªn
kÕt hydro vµo n−íc.
Ng−îc l¹i, c¸c ph©n tö ph©n cùc nh− glucose vµ pyruvate chøa c¸c nhãm chøc cã thÓ
h×nh thµnh liªn kÕt hydro (nh− =O hoÆc –OH) th× chóng cã thÓ hßa tan trong n−íc. Khi c¸c
nhãm chøc nµy xen vµo c¸c ph©n tö n−íc, chóng cã thÓ ph¸ vì c¸c liªn kÕt hydro gi÷a c¸c
ph©n tö n−íc vµ h×nh thµnh liªn kÕt hydro míi gi÷a chóng víi c¸c ph©n tö n−íc ë xung
quanh. Tuy vËy, kh«ng ph¶i lóc nµo c¸c liªn kÕt hydro nµy còng phï hîp víi xu thÕ vÒ hiÖu
n¨ng so víi liªn kÕt hydro gi÷a c¸c ph©n tö n−íc víi nhau. V× vËy, ngay c¶ víi c¸c ph©n tö
cã tÝnh ph©n cùc m¹nh nhÊt, th× kh¶ n¨ng hßa tan cña chóng trong n−íc còng cã giíi h¹n.
Nãi c¸ch kh¸c, hÇu hÕt mäi ph©n tö h÷u c¬ dï ®−îc tÕ bµo hÊp thô tõ thøc ¨n hay ®−îc
tæng hîp tõ qu¸ tr×nh trao ®æi chÊt, ®Òu Ýt nhiÒu kh«ng tan trong n−íc. Nh÷ng ph©n tö nµy
khi chuyÓn ®éng nhiÖt sÏ va ®Ëp vµo c¸c ph©n tö kh¸c ®Õn khi chóng t×m thÊy c¸c ph©n tö cã
bÒ mÆt t−¬ng ®ång cao vµ g¾n vµo qua sù h×nh thµnh c¸c liªn kÕt thø cÊp (®ång thêi gi¶i
phãng ra c¸c ph©n tö n−íc vèn cã xu h−íng −u tiªn cho liªn kÕt hydro “n−íc - n−íc”).

1.2.11. C¸c liªn kÕt kÞ n−íc gióp duy tr× æn ®Þnh cÊu tróc c¸c ®¹i ph©n tö sinh häc
Trong dung dÞch, mét xu h−íng n÷a lµ c¸c ph©n tö n−íc lu«n ®Èy c¸c nhãm kh«ng
ph©n cùc ra xa, vµ ®©y ®−îc gäi lµ c¸c liªn kÕt kÞ n−íc. Cã thÓ thÊy tõ “liªn kÕt” ë ®©y
d−êng nh− bÞ dïng nhÇm bëi kh«ng cã “liªn kÕt” thùc sù nµo ®−îc h×nh thµnh. Ngoµi ra,
thuËt ng÷ “liªn kÕt kÞ n−íc” cßn ®−îc dïng ®Ó nhÊn m¹nh hiÖn t−îng “c¸c nhãm kh«ng
ph©n cùc lu«n tù s¾p xÕp sao cho chóng kh«ng tiÕp xóc víi c¸c ph©n tö n−íc”. C¸c liªn kÕt kÞ
n−íc cã ý nghÜa quan träng trong viÖc gióp duy tr× tÝnh ®Þnh h×nh cña c¸c ph©n tö protein
vµ c¸c phøc hÖ protein víi c¸c ph©n tö kh¸c, kÓ c¶ viÖc ph©n bè c¸c protein trªn mµng tÕ
bµo. Nh÷ng liªn kÕt nµy chiÕm kho¶ng mét nöa tæng n¨ng l−îng tù do cña qu¸ tr×nh ®ãng
gãi c¸c protein.
Chóng ta lÊy mét vÝ dô vÒ sù h×nh thµnh liªn kÕt cña Alanine (Ala) vµ Glycine (Gly)
víi mét ph©n tö thø ba cã bÒ mÆt t−¬ng ®ång víi Ala. VÒ cÊu tróc, Ala kh¸c víi Gly lµ nã
cã mét nhãm methyl (CH3-). Khi Ala liªn kÕt víi mét ph©n tö thø ba, lùc Van der Waals
xung quanh nhãm (CH3-) cã møc n¨ng l−îng ~1 kcal/mol. N¨ng l−îng nµy kh«ng xuÊt hiÖn
trong tr−êng hîp ph©n tö thø ba liªn kÕt víi Gly. Tuy vËy, tõ ph−¬ng tr×nh 1.4, chóng ta
thÊy r»ng sù chªnh lÖch nhá nµy chØ t¹o ra mét hÖ sè 1/6 chªnh lÖch trong xu h−íng liªn
kÕt cña Ala vµ Gly. Nh−ng ngoµi yÕu tè trªn ®©y, cßn cã mét yÕu tè n÷a ®ã lµ c¸c ph©n tö
n−íc cã lùc ®Èy Ala ra xa (lùc kÞ n−íc) m¹nh h¬n nhiÒu so víi Gly (bëi v× nhãm CH3 cña
Ala cã tÝnh kh«ng t−¬ng ®ång víi m¹ng l−íi c¸c ph©n tö n−íc). Xu h−íng c¸c ph©n tö n−íc
®Èy Ala ra xa ®· lµm axit amin nµy cµng dÔ tiÕp cËn tíi ph©n tö thø ba h¬n. Lùc kÞ n−íc
chªnh lÖch gi÷a Ala vµ Gly trong tr−êng hîp nµy −íc l−îng ®¹t kho¶ng 2 - 3 kcal/mol. Víi
vÝ dô nµy, chóng ta ®i ®Õn mét nhËn ®Þnh lµ sù chªnh lÖch møc n¨ng l−îng trong liªn kÕt
gi÷a nh÷ng ph©n tö gièng nhau nhÊt ®Õn mét ph©n tö thø ba vµo kho¶ng 2 - 3 kcal/mol. Sù
chªnh lÖch nµy bÞ triÖt tiªu trong m«i tr−êng kh«ng cã n−íc. Thùc tÕ cho thÊy møc chªnh
lÖch nµy th−êng vµo kho¶ng 3 - 4 kcal/mol.

8
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

1.2.12. Gi¸ trÞ ∆G trong kho¶ng 2 – 5 kcal/mol chiÕm −u thÕ


Nh− ph©n tÝch ë trªn, møc n¨ng l−îng t−¬ng ®−¬ng mét liªn kÕt thø cÊp (2 - 5
kcal/mol) lµ ®ñ ®Ó ®¶m b¶o mét ph©n tö cã xu h−íng liªn kÕt æn ®Þnh víi mét nhãm chän läc
cña ph©n tö kh¸c. Tuy vËy, sù chªnh lÖch n¨ng l−îng nµy lµ kh«ng ®ñ ®Ó h×nh thµnh cÊu
tróc m¹ng bÒn v÷ng. V× vËy, trong m«i tr−êng néi bµo kh«ng bao giê cã sù “tinh thÓ hãa”,
hoÆc ®iÒu nµy chØ cã thÓ x¶y ra khi møc n¨ng l−îng cña c¸c liªn kÕt thø cÊp ®−îc t¨ng lªn
nhiÒu lÇn. Nh−ng nÕu sù chªnh lÖch n¨ng l−îng (∆G) lµ lín h¬n th× c¸c liªn kÕt thø cÊp ®«i
khi bÞ ®øt g·y, dÉn ®Õn sù khuÕch t¸n chËm cña c¸c ph©n tö. §iÒu nµy kh«ng phï hîp víi sù
tån t¹i cña tÕ bµo.

1.2.13. Sù t−¬ng t¸c gi÷a enzym víi c¬ chÊt th−êng lµ liªn kÕt yÕu
C¸c enzym vèn cã tÝnh liªn kÕt chän läc, cã ¸i lùc ®Æc biÖt cao víi c¬ chÊt ®Æc thï cña
chóng. Trong sù kÕt hîp ®ã, c¸c liªn kÕt yÕu lµ ®éng lùc c¬ b¶n. Bëi c¸c enzym xóc t¸c c¶
hai chiÒu cña mét ph¶n øng hãa häc, nªn chóng th−êng ph¶i cã ¸i lùc ®Æc tr−ng víi hai
“nhãm ph©n tö” thuéc hai chiÒu cña ph¶n øng. §«i khi, ng−êi ta cã thÓ ®o ®−îc h»ng sè Kcb
trong liªn kÕt gi÷a mét enzym víi c¬ chÊt cña nã (ph−¬ng tr×nh 1.4), qua ®ã tÝnh ®−îc gi¸
trÞ ∆G khi h×nh thµnh liªn kÕt. Thùc tÕ tÝnh to¸n cho thÊy c¸c t−¬ng t¸c enzym-c¬ chÊt cã
gi¸ trÞ ∆G n»m trong kho¶ng 5 - 10 kcal/mol lu«n ®i kÌm víi sù xuÊt hiÖn mét sè liªn kÕt
thø cÊp. Mét ®iÓm ®¸ng l−u ý n÷a lµ gi¸ trÞ ∆G trong c¸c liªn kÕt enzym – c¬ chÊt kh«ng
bao giê qu¸ cao, tøc lµ sù h×nh thµnh vµ ph©n t¸ch cña phøc hÖ enzym – c¬ chÊt diÔn ra
mét c¸ch liªn tôc do t¸c ®éng cña c¸c chuyÓn ®éng nhiÖt ngÉu nhiªn. §iÒu nµy còng gióp
gi¶i thÝch t¹i sao hÇu hÕt c¸c enzym cã thêi gian biÓu hiÖn chøc n¨ng rÊt ng¾n (®«i khi ®¹t
tèc ®é 106 lÇn / gi©y). NÕu nh− c¸c enzym liªn kÕt víi c¬ chÊt, vµ ®Æc biÖt lµ víi s¶n phÈm
cña ph¶n øng, b»ng nh÷ng liªn kÕt m¹nh h¬n th× ho¹t ®éng xóc t¸c cña chóng sÏ chËm ®i.

1.2.14. HÇu hÕt c¸c t−¬ng t¸c gi÷a c¸c ®¹i ph©n tö tham gia c¸c qu¸ tr×nh di
truyÒn (ADN, ARN, protein) ®−îc ®iÒu hßa bëi c¸c liªn kÕt yÕu
Chóng ta sÏ thÊy trong c¸c phÇn sau cña gi¸o tr×nh nµy, sù t−¬ng t¸c gi÷a c¸c ®¹i
ph©n tö sinh häc, trong ®ã ®Æc biÖt lµ sù t−¬ng t¸c ADN-protein vµ protein-protein lµ c¬
chÕ chñ yÕu gióp tÕ bµo tiÕp nhËn vµ ®¸p øng l¹i c¸c tÝn hiÖu sinh häc ngo¹i bµo còng nh−
néi bµo. §iÒu ®ã biÓu hiÖn trong tÊt c¶ c¸c qu¸ tr×nh ®iÒu hßa biÓu hiÖn cña gen, sao chÐp
vµ söa ch÷a ADN, c¬ chÕ t¸i tæ hîp gi÷a c¸c gen, còng nh− nhiÒu ho¹t ®éng kh¸c n÷a trong
chu tr×nh tÕ bµo. T−¬ng tù nh− mèi t−¬ng t¸c gi÷a enzym vµ c¬ chÊt, nh÷ng liªn kÕt yÕu
chiÕm −u thÕ trong nh÷ng t−¬ng t¸c nµy. MÆc dï møc n¨ng l−îng cña mçi liªn kÕt yÕu ®¬n
lÎ lµ thÊp, nh−ng sù kÕt hîp cña nhiÒu liªn kÕt yÕu lµ ®ñ ®Ó gióp c¸c ph©n tö cã ®−îc sù
liªn kÕt æn ®Þnh vµ ph¶n ¸nh tÝnh ®Æc hiÖu cao trong sù t−¬ng t¸c gi÷a c¸c ®¹i ph©n tö.

1.3. TÇm quan träng vµ ®Æc ®iÓm cña c¸c liªn kÕt cao n¨ng
ë trªn, chóng ta ®· ®Ò cËp ®Õn sù h×nh thµnh c¸c liªn kÕt yÕu trªn quan ®iÓm nhiÖt
®éng häc. Theo ®ã, chóng ta biÕt r»ng c¸c liªn kÕt yÕu cã xu h−íng xuÊt hiÖn khi ∆G < 0.
Xu h−íng nµy còng ®óng ®èi víi c¸c liªn kÕt céng hãa trÞ. Nh−ng thùc tÕ, trong tÕ bµo
nhiÒu liªn kÕt céng hãa trÞ d−êng nh− ®−îc h×nh thµnh kh«ng tu©n theo nguyªn lý cña
nhiÖt ®éng häc, trong ®ã ®Æc biÖt lµ c¸c ph¶n øng kÕt nèi c¸c ph©n tö nhá ®Ó h×nh thµnh c¸c
®¹i ph©n tö cã kÝch th−íc lín. Sù h×nh thµnh nh÷ng liªn kÕt nµy th−êng lµm t¨ng møc n¨ng
l−îng tù do. Tho¹t tiªn, cã ng−êi cho r»ng tÕ bµo lµ hÖ thèng duy nhÊt cã thÓ ®i ng−îc l¹i c¸c
nguyªn lý nhiÖt ®éng häc vµ ®iÒu nµy tõng ®−îc xem nh− mét “bÝ Èn cña sù sèng”.
Giê ®©y, chóng ta ®· biÕt c¸c qu¸ tr×nh sinh tæng hîp kh«ng hÒ “®i ng−îc” c¸c
nguyªn lý nhiÖt ®éng häc; thay vµo ®ã, nã diÔn ra trªn c¬ së nh÷ng ph¶n øng kh¸c biÖt

9
§inh §oµn Long

víi dù ®o¸n ban ®Çu. Ch¼ng h¹n nh− c¸c axit nucleic kh«ng ph¶i ®−îc h×nh thµnh tõ sù
kÕt tô cña c¸c nucleoside monophosphate; hay glycogen kh«ng ph¶i ®−îc h×nh thµnh trùc
tiÕp tõ glucose; còng nh− protein kh«ng ph¶i lµ sù hîp nhÊt thuÇn tóy cña c¸c axit amin.
Thay vµo ®ã, c¸c ph©n tö tiÒn chÊt th−êng dïng n¨ng l−îng tõ ATP (adenosine
triphosphate) hoÆc c¸c hîp chÊt t−¬ng ®−¬ng ®Ó chuyÓn hãa chóng thµnh c¸c tiÒn chÊt
n¨ng l−îng cao. Nh÷ng tiÒn chÊt nµy sau ®ã (víi sù cã mÆt cña enzym ®Æc hiÖu) míi cã
thÓ kÕt hîp víi nhau tù ph¸t ®Ó h×nh thµnh nªn c¸c ®¹i ph©n tö. ë ®©y chóng ta sÏ xem
sù h×nh thµnh c¸c liªn kÕt peptide (ë protein) vµ phosphodieste (ë c¸c axit nucleic) trªn
c¬ së nguyªn lý nhiÖt ®éng häc. Tuy nhiªn, tr−íc ®ã chóng ta ®Ò cËp ®Õn mét sè ®Æc ®iÓm
c¬ b¶n cña liªn kÕt céng hãa trÞ.

1.3.1. C¸c ph©n tö cao n¨ng th−êng kÐm bÒn


Cã sù kh¸c biÖt vÒ møc n¨ng l−îng tù do trong c¸c ph©n tö v× c¸c liªn kÕt céng hãa trÞ
kh¸c nhau cã møc n¨ng l−îng kh«ng gièng nhau. VÝ dô: liªn kÕt céng hãa trÞ gi÷a H vµ O
m¹nh h¬n liªn kÕt gi÷a chÝnh c¸c nguyªn tö nµy víi nhau. KÕt qu¶ lµ sù h×nh thµnh liªn
kÕt O-H tõ c¸c ph©n tö O-O vµ H-H sÏ gi¶i phãng ra n¨ng l−îng tù do. Trªn c¬ së ®ã, trong
mét hçn hîp cã nång ®é oxy vµ hydro ®ñ cao, chóng lu«n cã xu h−íng chuyÓn thµnh n−íc.
Nh− vËy, mét ph©n tö sÏ cã n¨ng l−îng tù do lín h¬n so víi khi chÝnh c¸c nguyªn tö
kh¸c lo¹i cña nã tù liªn kÕt víi nhau bëi c¸c liªn kÕt céng hãa trÞ yÕu. D−êng nh− ®iÒu nµy lµ
nghÞch lý, nh−ng thùc tiÔn cho thÊy lµ c¸c ph©n tö ®−îc h×nh thµnh dùa trªn c¸c liªn kÕt
cµng m¹nh th× n¨ng l−îng tù do ®−îc gi¶i phãng cµng Ýt. Ng−îc l¹i, nh÷ng ph©n tö cã vai trß
dinh d−ìng (cho n¨ng l−îng) tèt nhÊt chÝnh lµ c¸c ph©n tö mang c¸c liªn kÕt céng hãa trÞ yÕu,
v× chóng th−êng kÐm bÒn vÒ mÆt nhiÖt ®éng häc. VÝ dô nh− glucose lµ mét ph©n tö dinh
d−ìng lý t−ëng v× khi bÞ oxy hãa thµnh n−íc vµ CO2, n¨ng l−îng liªn kÕt cña nã bÞ gi¶m ®¸ng
kÓ. Ng−îc l¹i, chÝnh CO2 vèn cã hai liªn kÕt ®«i rÊt m¹nh gi÷a C vµ O kh«ng thÓ dïng lµm
chÊt dinh d−ìng ë ®éng vËt. NÕu kh«ng cã n¨ng l−îng tõ ATP, CO2 kh«ng thÓ tù chuyÓn hãa
®−îc thµnh c¸c chÊt h÷u c¬ phøc t¹p h¬n, kÓ c¶ khi cã mÆt c¸c enzym. ë thùc vËt, së dÜ CO2 cã
thÓ ®−îc dïng lµm nguån cacbon v× n¨ng l−îng ®−îc cung cÊp tõ c¸c l−îng tö ¸nh s¸ng thu
®−îc qua qu¸ tr×nh quang hîp vµ ®−îc chuyÓn hãa thµnh ATP.
Khi kh«ng cã chÊt xóc t¸c, c¸c ph¶n øng hãa häc mµ ë ®ã c¸c ph©n tö ®−îc chuyÓn hãa
thµnh c¸c ph©n tö kh¸c cã n¨ng l−îng liªn kÕt thÊp h¬n còng kh«ng x¶y ra mét c¸ch ®¸ng
kÓ ë nhiÖt ®é sinh lý b×nh th−êng. Bëi v×, mét liªn kÕt céng hãa trÞ dï lµ yÕu nhÊt còng ®ñ
m¹nh ®Ó hiÕm khi bÞ ®øt g·y bëi c¸c chuyÓn ®éng nhiÖt trong tÕ bµo. NÕu kh«ng cã chÊt xóc
t¸c, mét liªn kÕt céng hãa trÞ chØ bÞ ph¸ vì khi n¨ng l−îng ®−îc cung cÊp ®ñ ®Ó ®Èy c¸c
nguyªn tö liªn kÕt ra khái nhau. Nh−ng khi c¸c nguyªn tö nµy bÞ ®Èy mét phÇn khái nhau,
chóng ngay lËp tøc cã thÓ liªn kÕt víi c¸c nguyªn tö míi ®Ó h×nh thµnh nh÷ng liªn kÕt
m¹nh h¬n. Trong qu¸ tr×nh t¸i kÕt hîp nh− vËy, n¨ng l−îng gi¶i phãng ra sÏ b»ng tæng
n¨ng l−îng tù do ®−îc cung cÊp lµm ®øt g·y liªn kÕt cò vµ n¨ng l−îng chªnh lÖch gi÷a liªn
kÕt cò vµ liªn kÕt míi (h×nh 1.3).

10
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

N¨ng l−îng cÇn cung cÊp ®Ó ph¸ Tr¹ng th¸i ho¹t hãa
vì mét liªn kÕt céng hãa trÞ
®−îc gäi lµ n¨ng l−îng ho¹t
hãa. N¨ng l−îng ho¹t hãa N¨ng l−îng

N¨ng l−îng tù do
th−êng thÊp h¬n n¨ng l−îng ho¹t hãa
cña liªn kÕt gèc, bëi sù s¾p xÕp
l¹i c¸c ph©n tö th−êng kh«ng
t¹o nªn c¸c nguyªn tö tù do
hoµn toµn. Thay vµo ®ã, sù va ∆G cña
ch¹m cña hai ph©n tö tham gia ph¶n øng
ph¶n øng th−êng dÉn ®Õn sù
h×nh thµnh mét phøc hÖ t¹m
thêi ë tr¹ng th¸i ho¹t hãa. ë TiÕn tr×nh ph¶n øng
tr¹ng th¸i nµy, sù tiÕp xóc gÇn
H×nh 1.3. N¨ng l−îng ho¹t hãa cña ph¶n øng hãa häc:
nhau cña hai ph©n tö lµm c¸c
(A - B) + (C – D) → (A – D) + (C – B). Ph¶n øng nµy ®i kÌm
liªn kÕt kh¸c trë nªn kÐm æn
víi sù gi¶m ®i cña n¨ng l−îng tù do (∆G < 0)
®Þnh vµ n¨ng l−îng cÇn ®Ó ph¸
vì liªn kÕt lµ thÊp h¬n so víi khi liªn kÕt cã mÆt trong mét ph©n tö ë tr¹ng th¸i tù do.
V× vËy, hÇu hÕt c¸c ph¶n øng céng hãa trÞ trong tÕ bµo ®−îc m« t¶ bëi ph−¬ng tr×nh sau:
(A – B) + (C – D) → (A – D) + (B – C) (ph−¬ng tr×nh 1.5)
Sù biÓu diÔn t¸c dông khèi l−îng cña ph¶n øng nh− sau:
Kcb = ([A – D] x [B – C]) / ([A – D] x [B – C]) (ph−¬ng tr×nh 1.6)
trong ®ã [A – D], [B – C] lµ nång ®é c¸c chÊt tham gia ph¶n øng tÝnh theo mol/L, vµ gi¸
trÞ Kcb quan hÖ víi ∆G qua ph−¬ng tr×nh 1.4.
Do n¨ng l−îng ho¹t hãa th−êng ®−îc ®ßi hái rÊt cao (kho¶ng 20 - 30 kcal/mol), nªn
tr¹ng th¸i ho¹t hãa kh«ng bao giê tù xuÊt hiÖn trong ®iÒu kiÖn nhiÖt ®é sinh lý, hay cã thÓ
nãi ®©y chÝnh lµ “rµo c¶n” kh«ng cho c¸c liªn kÕt céng hãa trÞ thay ®æi tù ph¸t trong tÕ bµo.
Nh÷ng rµo c¶n nµy cã ý nghÜa ®Æc biÖt quan träng, v× sù sèng kh«ng thÓ cã nÕu kh«ng
cã nã. Lóc ®ã, tÊt c¶ c¸c nguyªn tö sÏ chØ tån t¹i ë d¹ng cã møc n¨ng l−îng thÊp nhÊt cã thÓ,
dÉn ®Õn viÖc n¨ng l−îng sÏ kh«ng ®−îc dù tr÷ cho c¸c ho¹t ®éng tiÕp sau. Ng−îc l¹i, sù
sèng còng kh«ng thÓ cã nÕu thiÕu c¬ chÕ lµm gi¶m n¨ng l−îng ho¹t hãa cña c¸c ph¶n øng
mét c¸ch ®Æc hiÖu. §iÒu nµy b¾t buéc ph¶i x¶y ra bëi sù ph¸t triÓn cña tÕ bµo cÇn diÔn ra ë
mét tèc ®é ®ñ nhanh vµ ph¶i tr¸nh ®−îc sù t¸c ®éng cña c¸c lùc ngÉu nhiªn (nh− chiÕu x¹
UV hay ion hãa) cã thÓ lµm ph¸ vì c¸c liªn kÕt hãa häc.

1.3.2. Enzym cã vai trß lµm gi¶m n¨ng l−îng ho¹t hãa cña c¸c ph¶n øng
C¸c enzym ®Æc biÖt thiÕt yÕu ®èi víi sù sèng. Chøc n¨ng cña chóng lµ lµm t¨ng tèc ®é
c¸c ph¶n øng hãa häc cÇn cho sù tån t¹i cña tÕ bµo, b»ng viÖc lµm gi¶m n¨ng l−îng ho¹t
hãa tíi møc mµ c¸c chuyÓn ®éng nhiÖt lµ ®ñ cho sù s¾p xÕp l¹i cña c¸c ph©n tö (h×nh 1.4).
Khi cã mÆt mét enzym ®Æc thï, “rµo c¶n” ng¨n sù x¶y ra cña c¸c ph¶n øng kh«ng cßn tån
t¹i, ngay c¶ khi c¸c ph©n tö cã n¨ng l−îng tù do thÊp nhÊt. C¸c enzym kh«ng bao giê lµm
¶nh h−ëng ®Õn tr¹ng th¸i c©n b»ng, nghÜa lµ chóng chØ ®¬n thuÇn lµm t¨ng tèc ®é ph¶n øng.
NÕu sù c©n b»ng vÒ nhiÖt ®éng häc lµ kh«ng phï hîp ®èi víi sù h×nh thµnh mét ph©n tö nµo
®ã, th× cho dï cã mÆt enzym, ph©n tö ®ã kh«ng bao giê ®−îc tÝch lòy.
Trong tÕ bµo, hÇu nh− mäi ph¶n øng ®Òu ®−îc xóc t¸c bëi c¸c enzym ®Æc thï. Nªn,
viÖc biÕt møc n¨ng l−îng tù do cña c¸c ph©n tö kh«ng nãi ®−îc g× vÒ kh¶ n¨ng ph¶n øng x¶y

11
§inh §oµn Long

ra. §iÒu quan träng lµ tèc ®é cña c¸c ph¶n øng. Khi tÕ bµo cã mét enzym nµo ®ã, th× ph¶n
øng t−¬ng øng mµ enzym ®ã xóc t¸c sÏ diÔn ra nhanh vµ trë nªn quan träng.
Tr¹ng th¸i ho¹t hãa

N¨ng l−îng ho¹t


N¨ng l−îng tù do

hãa cña ph¶n øng


khi kh«ng cã enzym
N¨ng l−îng ho¹t
hãa cña ph¶n øng
khi cã enzym

TiÕn tr×nh ph¶n øng


H×nh 1.4. Enzym lµm t¨ng tèc ®é ph¶n øng nhê lµm gi¶m n¨ng l−îng ho¹t hãa
Chó ý lµ ∆G kh«ng ®æi, v× tr¹ng th¸i c©n b»ng kh«ng ®æi dï cã mÆt hay v¾ng mÆt enzym

1.3.3. N¨ng l−îng tù do trong c¸c ®¹i ph©n tö sinh häc


Nguyªn lý nhiÖt ®éng häc ph¸t biÓu r»ng ®iÓm ®Æc tr−ng cña tÊt c¶ c¸c ph¶n øng hãa
sinh lµ nã diÔn ra cïng víi sù gi¶m ®i cña n¨ng l−îng tù do. Chóng ta dÔ dµng nhËn thÊy
®iÒu nµy trong c¸c ph¶n øng dÞ hãa. ë ®ã, c¸c ph©n tö dinh d−ìng kÐm bÒn vÒ nhiÖt ®éng
häc lu«n ®−îc chuyÓn hãa thµnh c¸c hîp chÊt bÒn v÷ng h¬n (nh− CO2vµ H2O) cïng víi mét
l−îng nhiÖt tho¸t ra. C¸c ph¶n øng ph©n gi¶i sinh häc cã hai ®Æc ®iÓm c¬ b¶n lµ: (1) h×nh
thµnh nªn c¸c chÊt h÷u c¬ cã kÝch th−íc nhá h¬n, vµ (2) gi÷ l¹i mét phÇn ®¸ng kÓ n¨ng
l−îng tù do cña chÊt dinh d−ìng ban ®Çu phôc vô cho ho¹t ®éng sèng. §Æc ®iÓm thø hai
®−îc thùc hiÖn th«ng qua viÖc kÕt hîp mét sè b−íc trong qu¸ tr×nh ph©n gi¶i víi sù h×nh
thµnh c¸c ph©n tö cao n¨ng nh− ATP ®Ó tÝch lòy n¨ng l−îng tù do.
Kh«ng ph¶i mäi n¨ng l−îng tù do cã trong chÊt dinh d−ìng ®Òu ®−îc chuyÓn hãa
thµnh n¨ng l−îng trong c¸c ph©n tö cao n¨ng. Bëi v×, nÕu ®iÒu ®ã x¶y ra, th× kh«ng cã sù
gi¶m ®i møc n¨ng l−îng tù do, tøc lµ kh«ng cã ®éng lùc cho viÖc ph¸ vì c¸c ph©n tö dinh
d−ìng trªn c¬ së nguyªn lý nhiÖt ®éng häc. Thay vµo ®ã, tÊt c¶ c¸c qu¸ tr×nh ph©n gi¶i sinh
häc ®Òu chuyÓn mét phÇn lín n¨ng l−îng tù do cã trong c¸c ph©n tö dinh d−ìng thµnh
nhiÖt n¨ng hoÆc entr«pi. VÝ dô nh− trong tÕ bµo, chØ kho¶ng 40% n¨ng l−îng tù do cña
glucose ®−îc chuyÓn vµo c¸c ph©n tö cao n¨ng, phÇn cßn l¹i th× bÞ “tiªu ®i” ë d¹ng nhiÖt
n¨ng vµ entr«pi.
Mét ph©n tö cao n¨ng cã thÓ bÞ ®øt g·y vµ gi¶i phãng mét l−îng lín n¨ng l−îng tù do
(trªn 5 kcal/mol) bëi c¸c ph©n tö n−íc, qua qu¸ tr×nh gäi lµ thñy ph©n. C¸c liªn kÕt bÞ ph¸
vì trong qu¸ tr×nh thñy ph©n c¸c hîp chÊt cao n¨ng vµ sinh ra ∆G cã gi¸ trÞ ©m lín ®−îc
gäi lµ liªn kÕt cao n¨ng. Dï thùc tÕ ®©y kh«ng ph¶i lµ n¨ng l−îng liªn kÕt mµ lµ n¨ng
l−îng tù do ®−îc gi¶i phãng ra khi c¸c liªn kÕt bÞ ph¸ vì, nh−ng theo thãi quen chóng ta
dïng thuËt ng÷ “liªn kÕt cao n¨ng” cho thuËn tiÖn vµ kÝ hiÖu chóng b»ng dÊu “~”.

12
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

B¶ng 1.4. Mét sè nhãm liªn kÕt cao n¨ng quan träng trong sinh häc
∆G cña ph¶n øng
Nhãm liªn kÕt CÊu tróc ph©n tö Ph¶n øng
(kcal/mol)
Pyrophosphate ~ ~ <=>  +  ∆G = - 6

Nucleoside diphosphate Adenosine - ~ ADP <=> AMP +  ∆G = - 6


(NDP) (ADP)

Nucleoside triphosphate Adenosine - ~~ ATP <=> ADP +  ∆G = - 7


(NTP) (ATP)
ATP <=> AMP + ~ ∆G = - 8

O- O
C
Enol phosphate C O ~ PEP <=> pyruvate +  ∆G = - 12
CH2
Phosphoenolpyruvate
(PEP)

Adenosine
R
~ O
Aminoacyl adenylate - AMP~AA <=> AMP + AA ∆G = - 7
C C NH3
O H

O
H2C C
N O-
Guanidinium phosphate H creatine~P <=> creatine + P ∆G = - 8
H3C C N ~
NH
creatine phosphate

O
H3C C
Thioeste Acetyl CoA <=> CoA-SH + acetate ∆G = - 8
S CoA
Acetyl - CoA

N¨ng l−îng thñy ph©n cña mét liªn kÕt cao n¨ng trung b×nh (7 kcal/mol) nhá h¬n
nhiÒu so víi n¨ng l−îng ®−îc gi¶i phãng ra khi ph©n gi¶i hoµn toµn mét ph©n tö glucose qua
mét b−íc trùc tiÕp (688 kcal/mol). Nh−ng trong tÕ bµo, glucose kh«ng bao giê ®−îc ph©n
gi¶i hoµn toµn qua mét b−íc (v× ®iÒu nµy kh«ng hiÖu qu¶ cho sù h×nh thµnh c¸c liªn kÕt cao
n¨ng). Thay vµo ®ã, con ®−êng ph©n gi¶i glucose diÔn ra qua nhiÒu b−íc kh¸c nhau.
Hîp chÊt cao n¨ng quan träng nhÊt trong sinh häc lµ ATP. Nã ®−îc h×nh thµnh tõ
ADP (adenosine diphosphate) vµ nhãm phosphate v« c¬ () víi viÖc sö dông n¨ng l−îng
thu ®−îc hoÆc tõ c¸c ph¶n øng ph©n gi¶i hoÆc tõ l−îng tö ¸nh s¸ng mÆt trêi qua quang hîp.
Tuy vËy, ngoµi ATP cßn cã nhiÒu hîp chÊt cao n¨ng quan träng kh¸c n÷a. Mét sè ®−îc
h×nh thµnh trùc tiÕp tõ c¸c ph¶n øng ph©n gi¶i; mét sè kh¸c ®−îc h×nh thµnh tõ mét phÇn
n¨ng l−îng tù do cña ATP. B¶ng 1.4 liÖt kª mét sè lo¹i liªn kÕt cao n¨ng quan träng; tÊt c¶
®Òu liªn quan ®Õn c¸c nguyªn tö phosphate () vµ/hoÆc l−u huúnh (S). Nhãm
pyrophosphate cao n¨ng cña ATP h×nh thµnh tõ sù kÕt hîp cña hai nhãm phosphate
(~). §©y lµ d¹ng liªn kÕt cao n¨ng duy nhÊt cña phosphate. C¸c liªn kÕt cao n¨ng liªn

13
§inh §oµn Long

quan ®Õn c¸c nguyªn tö l−u huúnh còng cã vai trß quan träng ®èi víi c¸c ho¹t ®éng sinh
häc t−¬ng tù nh− c¸c liªn kÕt cao n¨ng phosphate. Ph©n tö cao n¨ng quan träng nhÊt chøa
S lµ Acetyl-CoA. Ph©n tö nµy lµ nguån cung cÊp n¨ng l−îng chñ yÕu cho c¸c qu¸ tr×nh sinh
tæng hîp c¸c axit bÐo.
Møc ®é biÕn ®éng réng cña ∆G (b¶ng 1.4) cã nghÜa lµ kh¸i niÖm “cao n¨ng” ®«i khi
khã x¸c ®Þnh. Tiªu chÝ th−êng dïng ®Ó x¸c ®Þnh mét liªn kÕt cao n¨ng lµ xem sù thñy ph©n
liªn kÕt ®ã cã ®i kÌm víi mét qu¸ tr×nh sinh tæng hîp quan träng hay kh«ng. Ch¼ng h¹n
nh−, ∆G gi¶i phãng ra tõ thñy ph©n glucose-6-phosphate lµ kho¶ng 3 - 4 kcal/mol, nh−ng
gi¸ trÞ ∆G nµy kh«ng ®ñ ®Ó qu¸ tr×nh tæng hîp c¸c liªn kÕt peptide cã thÓ x¶y ra hiÖu qu¶.
V× vËy, liªn kÕt phosphate-este nµy kh«ng ®−îc xem lµ liªn kÕt cao n¨ng.
1.3.4. C¸c liªn kÕt cao n¨ng trong c¸c ph¶n øng sinh tæng hîp
Sù h×nh thµnh c¸c ®¹i ph©n tö tõ c¸c ph©n tö ®¬n ph©n cÇn bæ sung n¨ng l−îng. Còng
gièng nh− sù ph©n gi¶i sinh häc, qu¸ tr×nh sinh tæng hîp còng kh«ng thÓ diÔn ra nÕu
kh«ng cã sù gi¶m ®i n¨ng l−îng tù do tæng sè. §èi víi c¸c qu¸ tr×nh sinh tæng hîp, nguån
n¨ng l−îng nµy ®−îc cung cÊp tõ c¸c hîp chÊt cao n¨ng. Sù h×nh thµnh c¸c liªn kÕt míi
trong c¸c ph¶n øng sinh tæng hîp lu«n ®i kÌm víi sù ®øt g·y cña c¸c liªn kÕt cao n¨ng, do
®ã n¨ng l−îng tù do tæng sè gi¶m ®i. V× c¸c ho¹t ®éng sèng diÔn ra liªn tôc, nªn thêi gian
tån t¹i trong tÕ bµo cña c¸c c¸c liªn kÕt cao n¨ng lµ rÊt ng¾n. HÇu nh− ngay sau khi h×nh
thµnh, chóng lËp tøc bÞ ph©n gi¶i ®Ó t¹o ®éng lùc cho c¸c ph¶n øng kh¸c x¶y ra. Tuy vËy,
kh«ng ph¶i tÊt c¶ c¸c b−íc cña mét qu¸ tr×nh sinh tæng hîp ®Òu cÇn sù ®øt g·y cña c¸c liªn
kÕt cao n¨ng. Th«ng th−êng, chØ mét hoÆc mét sè b−íc cÇn ®Õn sù ®øt g·y nh÷ng liªn kÕt
cao n¨ng nh− vËy. §ã lµ v× ®«i khi ∆G ®−îc t¹o ra tõ mét sù ®øt g·y liªn kÕt cao n¨ng lµ
®ñ cho nhiÒu ph¶n øng sinh tæng hîp diÔn ra. ThËm chÝ ë mét sè b−íc cña qu¸ tr×nh sinh
tæng hîp, ∆G cã thÓ cã gi¸ trÞ d−¬ng. Nh−ng gi¸ trÞ ∆G d−¬ng nµy kh«ng cã nhiÒu ý nghÜa,
bëi ë c¸c b−íc ph¶n øng tiÕp theo, sù ®øt g·y c¸c liªn kÕt cao n¨ng kh¸c sÏ “bï” l¹i gi¸ trÞ
n¨ng l−îng ®ã.
Còng gièng nh− vËy, kh«ng ph¶i tÊt c¶ c¸c b−íc cña qu¸ tr×nh ph©n gi¶i ®Òu t¹o ra c¸c
liªn kÕt cao n¨ng. VÝ dô nh−: chØ cã hai b−íc trong qu¸ tr×nh thñy ph©n glucose s¶n sinh
ATP. §ã lµ ch−a nãi ®Õn mét sè b−íc cña qu¸ tr×nh ph©n gi¶i thËm chÝ cßn cÇn n¨ng
l−îng tõ viÖc ®øt g·y c¸c liªn kÕt cao n¨ng. Ngay chÝnh trong qu¸ tr×nh thñy ph©n glucose,
®Ó t¹o ra 4 ph©n tö ATP, ë mét sè b−íc nã cÇn sö dông 2 ph©n tö ATP. TÊt nhiªn, tæng sè
liªn kÕt cao n¨ng ®−îc h×nh thµnh ph¶i nhiÒu h¬n tæng sè liªn kÕt bÞ tiªu thô.
1.3.4.1. Ph¶n øng thñy ph©n c¸c liªn kÕt peptide diÔn ra tù ph¸t
Sù h×nh thµnh mét liªn kÕt peptide (vµ mét ph©n tö n−íc) tõ hai axit amin ®ßi hái mét
∆G cã gi¸ trÞ tõ 1 ®Õn 4 kcal/mol. Gi¸ trÞ ∆G d−¬ng cho chóng ta biÕt lµ c¸c chuçi polypeptide
kh«ng thÓ h×nh thµnh tù ph¸t tõ c¸c axit amin tù do. Ngoµi ra, chóng ta còng cÇn chó ý lµ
trong tÕ bµo, n−íc lµ ph©n tö phæ biÕn h¬n rÊt nhiÒu lÇn so víi c¸c ph©n tö kh¸c (th−êng Ýt
nhÊt lµ nhiÒu h¬n 100 lÇn). Do vËy, tÊt c¶ c¸c ph¶n øng c©n b»ng cã sù tham gia cña n−íc ®Òu
cã xu h−íng diÔn ra theo chiÒu tiªu thô c¸c ph©n tö n−íc. §iÒu nµy cã thÓ nhËn thÊy tõ kh¸i
niÖm vÒ Kcb, ch¼ng h¹n ®èi víi ph¶n øng h×nh thµnh liªn kÕt peptide sau:
axit amin A + axit amin B → peptide (A – B) + H2O (ph−¬ng tr×nh 1.7)
Ph¶n øng nµy cã h»ng sè c©n b»ng lµ:
Kcb = ([A – B] x [H2O]) / ([A] x [B]) (ph−¬ng tr×nh 1.8)
trong ®ã, nång ®é c¸c chÊt (trong dÊu [ ]) ®−îc tÝnh theo mol/L.
Nh− vËy, ë gi¸ trÞ Kcb nhÊt ®Þnh, nÕu l−îng n−íc cµng cao th× sè liªn kÕt peptide
cµng thÊp. Râ rµng lµ nång ®é c¸c hîp chÊt cã vai trß quyÕt ®Þnh chiÒu ph¶n øng x¶y ra.

14
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

Trong thùc tÕ, sù thñy ph©n liªn kÕt peptide cã thÓ x¶y ra ngay khi ∆G chØ vµo kho¶ng
- 3 kcal/mol.
Tõ lý thuyÕt trªn, cã thÓ thÊy trong dung dÞch, protein lµ nhãm hîp chÊt kh«ng bÒn.
NÕu thêi gian ®ñ dµi, c¸c ph©n tö protein cã thÓ bÞ thñy ph©n mét c¸ch tù ph¸t thµnh c¸c
axit amin tù do. Nh−ng trong tÕ bµo, nÕu kh«ng cã c¸c enzym, qu¸ tr×nh thñy ph©n protein
diÔn ra rÊt chËm vµ cã thÓ g©y nªn nh÷ng hiÖu øng kh«ng thuËn lîi ®èi víi qu¸ tr×nh trao
®æi chÊt. V× vËy, trong ®iÒu kiÖn sinh lý, mét khi ®· h×nh thµnh, c¸c protein th−êng ®−îc
duy tr× t−¬ng ®èi æn ®Þnh ®Õn khi nã ®−îc ph©n gi¶i chñ yÕu nhê t¸c ®éng cña c¸c enzym.
1.3.4.2. Sù kÕt hîp gi÷a ∆G d−¬ng vµ ∆G ©m
N¨ng l−îng tù do ph¶i ®−îc bæ sung vµo c¸c axit amin tr−íc khi chóng tæ hîp víi nhau
thµnh protein. §iÒu nµy diÔn ra nhê vai trß cña ATP lµ chÊt cho n¨ng l−îng. ATP chøa ba
nhãm phosphate g¾n vµo gèc adenosine (Adenosine-~~). Khi mét hoÆc hai nhãm ~
bÞ ®øt g·y bëi sù thñy ph©n, n¨ng l−îng tù do sÏ ®−îc gi¶i phãng mét l−îng ®¸ng kÓ:
Adenosine-~~ + H2O → Adenosine-~ +  (∆G = - 7 kcal/mol)
(ph−¬ng tr×nh 1.9)
Adenosine-~~ + H2O → Adenosine- +  ~ (∆G = - 8 kcal/mol)
(ph−¬ng tr×nh 1.10)
Adenosine-~ + H2O → Adenosine- +  (∆G = - 6 kcal/mol)
(ph−¬ng tr×nh 1.11)
TÊt c¶ c¸c ph¶n øng lµm ®øt g·y ®¹i ph©n tö thµnh c¸c ®¬n ph©n tö lu«n cã gi¸ trÞ ∆G
©m vµ trÞ tuyÖt ®èi lín h¬n trÞ tuyÖt ®èi cña ∆G d−¬ng h×nh thµnh trong ph¶n øng tæng hîp
diÔn ra theo chiÒu ng−îc l¹i. §iÓm mÊu chèt cña c¸c ph¶n øng sinh tæng hîp (cã gi¸ trÞ ∆G
d−¬ng) lµ chóng lu«n ®i kÌm víi sù ®øt g·y cña c¸c liªn kÕt cao n¨ng (vèn cã trÞ tuyÖt ®èi
cña ∆G ©m lµ lín h¬n). Do ®ã, trong tæng hîp protein, sù h×nh thµnh mét liªn kÕt peptide
(∆G = + 0,5 kcal/mol) lu«n ®i kÌm víi ph¶n øng ®øt g·y ATP thµnh AMP vµ nhãm ~
(∆G = - 8 kcal/mol). KÕt qu¶ lµ ∆G tæng sè b»ng – 7,5 kcal/mol, thõa ®ñ ®Ó tr¹ng th¸i c©n
b»ng ®Èy ph¶n øng vÒ h−íng tæng hîp c¸c liªn kÕt peptide (h×nh thµnh ph©n tö protein).

1.3.5. Sù ho¹t hãa c¸c tiÒn chÊt cña c¸c ®¹i ph©n tö sinh häc
Khi ATP bÞ thñy ph©n thµnh ADP vµ , hÇu hÕt n¨ng l−îng tù do tho¸t ra ë d¹ng
nhiÖt. Do nhiÖt n¨ng kh«ng thÓ dïng ®Ó h×nh thµnh c¸c liªn kÕt céng hãa trÞ, nªn mét ph¶n
øng “kÐp” (xÐt vÒ n¨ng l−îng) kh«ng chØ ®¬n thuÇn lµ sù kÕt hîp cña mét ph¶n øng cã gi¸
trÞ ∆G d−¬ng víi mét ph¶n øng cã cã gi¸ trÞ ∆G ©m. Thay vµo ®ã, ph¶n øng kÐp lu«n lµ sù
kÕt hîp cña hai hay nhiÒu ph¶n øng kÕ tiÕp nhau, bao gåm c¸c ph¶n øng chuyÓn nhãm
chøc. §©y lµ nhãm c¸c ph¶n øng mµ c¸c ph©n tö tham gia ph¶n øng trao ®æi c¸c nhãm
chøc víi nhau (kh«ng cã sù oxy hãa hay sù khö). C¸c enzym xóc t¸c cho c¸c ph¶n øng nµy
®−îc gäi lµ c¸c transferase. Mét ph¶n øng chuyÓn hãa nhãm chøc ®iÓn h×nh ®−îc viÕt
nh− sau:
(A – X) + (B – Y) → (A – B) + (X – Y) (ph−¬ng tr×nh 1.12)
trong ph¶n øng nµy, nhãm chøc cña X vµ B trao ®æi víi nhau. C¸c ph¶n øng chuyÓn nhãm
chøc ®«i khi khã ph©n biÖt khi cã sù tham gia cña n−íc trong thµnh phÇn ph¶n øng:
(A – B) + (H - OH) → (A – OH) + (B – H) (ph−¬ng tr×nh 1.13)

15
§inh §oµn Long

Lóc nµy, ph¶n øng l¹i cã b¶n chÊt lµ thñy ph©n vµ c¸c enzym xóc t¸c ®−îc gäi lµ hydrolase.
Trong c¸c hÖ thèng sinh häc, c¸c ph¶n øng chuyÓn nhãm chøc gi÷ mét vai trß quan
träng trong viÖc h×nh thµnh c¸c ph©n tö cao n¨ng. Khi mét nhãm chøc mang liªn kÕt cao
n¨ng ®−îc chuyÓn sang mét ph©n tö nhËn míi thÝch hîp, nã sÏ g¾n vµo ph©n tö nµy còng
b»ng mét liªn kÕt cao n¨ng. Tõ ®ã, ph¶n øng chuyÓn nhãm chøc cho phÐp liªn kÕt cao n¨ng
chuyÓn ®−îc tõ ph©n tö nµy sang ph©n tö kh¸c. C¸c ph−¬ng tr×nh d−íi ®©y cho thÊy liªn
kÕt cao n¨ng ®−îc chuyÓn tõ ATP sang GTP (®©y còng lµ mét ph©n tö cung cÊp n¨ng l−îng
cho nhiÒu ho¹t ®éng cña tÕ bµo).
Adenosine-~~ + Guanosine- → Adenosine-~ + Guanosine-~
(ph−¬ng tr×nh 1.14)
Adenosine-~~ + Guanosine-~ → Adenosine-~ + Guanosine-~~
(ph−¬ng tr×nh 1.15)
Nhãm cao n¨ng ~ trªn ph©n tö GTP giê ®©y cho phÐp nã cã thÓ t¹o liªn kÕt tù
ph¸t víi c¸c ph©n tö kh¸c. GTP lµ mét vÝ dô vÒ tr−êng hîp cña c¸c ph©n tö ®−îc ho¹t hãa.
Qu¸ tr×nh ho¹t hãa GTP nh− vËy cßn ®−îc gäi lµ sù ho¹t hãa nhãm chøc.
1.3.5.1. TÝnh linh ho¹t cña ATP trong c¸c ph¶n øng chuyÓn nhãm chøc
Sù tæng hîp ATP cã vai trß ®Æc biÖt quan träng trong viÖc “b¾t gi÷” n¨ng l−îng cña
c¸c ph©n tö vµ biÕn nã thµnh chÊt cho n¨ng l−îng. Trong c¶ hai qu¸ tr×nh phosphoryl hãa
oxy hãa vµ quang hîp, n¨ng l−îng ®Òu bÞ tiªu thô cïng víi viÖc ATP h×nh thµnh tõ ADP
vµ phosphate:
Adenosine-~ +  + N¨ng l−îng → Adenosine-~~ (ph−¬ng tr×nh 1.16)
Do ATP lµ chÊt nhËn nhãm cao n¨ng ®Çu tiªn trong nhiÒu qu¸ tr×nh sinh häc, nªn
nhãm cao n¨ng cña nã cã thÓ ®−îc chuyÓn tiÕp cho c¸c ph©n tö cã n¨ng l−îng thÊp h¬n ®Ó
ho¹t hãa c¸c ph©n tö nµy thµnh d¹ng cã thÓ tham gia c¸c ph¶n øng tù ph¸t. Vai trß cung
cÊp n¨ng l−îng cña ATP biÓu hiÖn qua viÖc nã sö dông hai liªn kÕt cao n¨ng, mµ khi ph©n
t¸ch gi¶i phãng ra ba nhãm chøc ®Æc thï, ®ã lµ: mét nhãm pyrophosphate ~; mét
nhãm adenosine monophosphate (AMP); vµ mét nhãm phosphate ~. §¸ng chó ý lµ c¸c
nhãm chøc nµy chØ duy tr× møc n¨ng l−îng cao cña chóng khi ®−îc chuyÓn ®Õn mét chÊt
nhËn phï hîp. Ch¼ng h¹n, khi nhãm ~ nÕu ®−îc chuyÓn ®Õn COO- th× thu ®−îc nhãm
acylphosphate (COO~) cã n¨ng l−îng cao, nh−ng khi ®−îc chuyÓn tíi gèc (-C-OH) cña
glucose th× chØ h×nh thµnh mét liªn kÕt n¨ng l−îng thÊp (Glu-6-).
1.3.5.2. Axit amin ®−îc ho¹t hãa nhê g¾n gèc AMP
Sù ho¹t hãa c¸c axit amin lµ nhê viÖc chuyÓn mét nhãm AMP (adenosine
monophosphate) tõ ATP sang nhãm COO- cña axit amin, nh− minh häa ë ph−¬ng tr×nh
d−íi ®©y:
H R H R
+ O + O
H N C C + Adenosine-~~ → H N C C + ~
- -
H H O O ~ -Adenosine
H H
(ph−¬ng tr×nh 1.17)
ë ph−¬ng tr×nh trªn, R biÓu diÔn cho gèc bªn ®Æc tr−ng cña mçi lo¹i axit amin.
Enzym xóc t¸c cho ph¶n øng nµy lµ aminoacyl synthetase. Sau khi ®−îc ho¹t hãa, c¸c
axit amin (AA) cã thÓ ®−îc dïng ®Ó tæng hîp protein mét c¸ch hiÖu qu¶ trªn c¬ së nhiÖt
®éng häc. Tuy vËy, phøc hÖ AA~AMP ch−a ph¶i lµ tiÒn chÊt trùc tiÕp tæng hîp protein.
Thay vµo ®ã, ta sÏ thÊy ë ch−¬ng 4 (môc 4.3: DÞch m· di truyÒn), mét sù chuyÓn nhãm

16
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

chøc thø hai sÏ chuyÓn axit amin ®· ho¹t hãa tíi nhãm hydroxyl tËn cïng ®Çu 3’ cña ph©n
tö tARN:
AA~AMP + tARN → AA~tARN + AMP (ph−¬ng tr×nh 1.18)
Mét liªn kÕt peptide sau ®ã ®−îc h×nh thµnh qua viÖc g¾n ph©n tö AA~tARN vµo cuèi
chuçi polypeptide ®ang ®−îc kÐo dµi:
AA~tARN + chuçi polypeptide (n axit amin)
tARN + chuçi polypeptide kÐo dµi (n+1 axit amin) (ph−¬ng tr×nh 1.19)
Nh− vËy, b−íc cuèi cña ph¶n øng kÐp nµy còng gièng nh− nh÷ng ph¶n øng kÐp kh¸c
thùc chÊt lµ sù lo¹i bá nhãm chøc cã t¸c dông ho¹t hãa vµ chuyÓn liªn kÕt cao n¨ng vµo
ph©n tö cã n¨ng l−îng tù do thÊp h¬n. ∆G ë ®©y cã gi¸ trÞ ©m vµ ph¶n øng theo chiÒu tæng
hîp protein.
1.3.5.3. TiÒn chÊt cña c¸c axit nucleic ®−îc ho¹t hãa bëi pyrophosphate (~)
C¶ hai axit nucleic lµ ARN vµ ADN ®Òu ®−îc cÊu thµnh tõ c¸c ®¬n ph©n lµ nucleotide,
hay cßn ®−îc gäi lµ c¸c nucleoside phosphate hoÆc mononucleotide. XÐt vÒ nhiÖt ®éng häc,
c¸c mononucleotide cßn khã tù h×nh thµnh liªn kÕt víi nhau h¬n so víi c¸c axit amin. §ã
lµ do liªn kÕt phosphodieste gi÷a c¸c nucleotide khi bÞ thñy ph©n cã møc n¨ng l−îng tù do
kh¸ lín (-6 kcal/mol). §iÒu ®ã cã nghÜa lµ c¸c axit nucleic chØ tù thñy ph©n thµnh c¸c
nucleotide ë tèc ®é thÊp. V× vËy, ®Ó tæng hîp c¸c axit nucleic viÖc ho¹t hãa c¸c nucleotide
cßn cÇn n¨ng l−îng cao h¬n so víi c¸c axit amin lµ tiÒn chÊt tæng hîp protein.
C¸c tiÒn chÊt trung gian ®Ó tæng hîp ADN vµ ARN lµ c¸c nucleoside triphosphate.
§èi víi ADN, ®ã lµ dATP, dGTP, dCTP vµ dTTP (d lµ viÕt t¾t cña deoxy; c¶ bèn lo¹i ®−îc
viÕt t¾t lµ dNTP; dTTP ®«i khi ®−îc viÕt lµ TTP). Cßn ®èi víi tæng hîp ARN, c¸c tiÒn chÊt
bao gåm ATP, GTP, CTP vµ UTP. Nh− vËy ATP kh«ng chØ cã vai trß lµ ph©n tö cung cÊp
n¨ng l−îng cho nhiÒu ph¶n øng chuyÓn nhãm chøc trong tÕ bµo, mµ b¶n th©n nã trùc tiÕp
cßn lµ mét tiÒn chÊt tæng hîp ARN. C¶ ba tiÒn chÊt cßn l¹i cña ARN ®Òu ®−îc h×nh thµnh tõ
c¸c ph¶n øng chuyÓn nhãm chøc ®−îc nªu ë c¸c ph−¬ng tr×nh 1.14 vµ 1.15. C¸c dNTP
®−îc h×nh thµnh c¬ b¶n dùa trªn cïng nguyªn t¾c lµ: sau khi c¸c deoxymonophosphate
(dNMP) ®−îc h×nh thµnh, chóng ®−îc chuyÓn sang tr¹ng th¸i ho¹t hãa (dNTP) nhê sù
chuyÓn nhãm chøc tõ ATP:
Deoxynucleoside- + ATP → Deoxynucleoside-~ + ADP (ph−¬ng tr×nh 1.20)
Deoxynucleoside-~ + ATP → Deoxynucleoside-~~ + ADP
(ph−¬ng tr×nh 1.21)
C¸c hîp chÊt dNTP ë tr¹ng th¸i ho¹t hãa lóc nµy cã thÓ t¹o liªn kÕt phosphodieste
víi nhau ®Ó h×nh thµnh nªn chuçi polynucleotide. HËu qu¶ cña ph¶n øng chuyÓn nhãm
chøc lµ mét liªn kÕt bÞ ®øt g·y vµ nhãm ~ ®−îc gi¶i phãng ra:
Deoxynucleoside-~~ + chuçi polynucleotide (n nucleotide)
→ ~ + chuçi polynucleotide (n+1 nucleotide) (ph−¬ng tr×nh 1.22)
VÒ nhiÖt ®éng häc, ph¶n øng nµy kh«ng gièng nh− sù h×nh thµnh liªn kÕt peptide.
Thùc tÕ ë ®©y, ∆G cã gi¸ trÞ d−¬ng nhÑ (kho¶ng 0,5 kcal/mol). §iÒu nµy lµm xuÊt hiÖn c©u
hái: “n¨ng l−îng tù do cÇn cho ph¶n øng nµy xuÊt ph¸t tõ ®©u?”
1.3.5.4. N¨ng l−îng tõ nhãm ~ ®−îc gi¶i phãng trong qu¸ tr×nh tæng hîp axit nucleic
N¨ng l−îng tù do cÇn cã cho ph¶n øng tæng hîp axit nucleic xuÊt ph¸t tõ sù ®øt g·y
nhãm pyrophosphate cao n¨ng x¶y ra ®ång thêi khi liªn kÕt phosphodieste ®−îc h×nh
thµnh. Mäi tÕ bµo ®Òu cã mét enzym ho¹t ®éng rÊt m¹nh lµ pyrophosphatase. Enzym nµy
xóc t¸c ph¶n øng ph¸ vì c¸c nhãm ~ hÇu nh− bÊt cø khi nµo chóng võa h×nh thµnh:
~ → 2  (∆G = - 7 kcal/mol) (ph−¬ng tr×nh 1.23)

17
§inh §oµn Long

∆G ë ®©y cã gi¸ trÞ ©m lín cho thÊy ph¶n øng nµy kh«ng thÓ ®¶o ng−îc, nghÜa lµ mét
khi liªn kÕt ~ bÞ ph¸ vì, chiÒu liªn kÕt trë l¹i cña 2  kh«ng bao giê x¶y ra.
ViÖc kÕt hîp ph¶n øng tæng hîp gi÷a c¸c dNTP (ph−¬ng tr×nh 1.22) víi sù ph©n t¸ch cña
nhãm ~ (ph−¬ng tr×nh 1.23) cã Kcb ®−îc x¸c ®Þnh b»ng tæng gi¸ trÞ ∆G cña hai ph¶n
øng lµ (0,5 kcal/mol) + (- 7 kcal/mol) = - 6,5 kcal/mol. Gi¸ trÞ ∆G nµy cho thÊy c¸c axit
nucleic hÇu nh− kh«ng bao giê tù ®øt g·y thµnh c¸c nucleotide ë ®iÒu kiÖn sinh lý tÕ bµo.

1.3.5.5. Sù ®øt g·y liªn kÕt ~ x¸c ®Þnh chiÒu h−íng cña phÇn lín c¸c ph¶n øng sinh tæng hîp
Sù ®øt g·y liªn kÕt ~ kh«ng chØ x¸c ®Þnh chiÒu h−íng cña ph¶n øng tæng hîp c¸c
axit nucleic, mµ thùc tÕ, hÇu hÕt c¸c qu¸ tr×nh sinh tæng hîp ®Òu Ýt nhiÒu liªn quan ®Õn sù
gi¶i phãng nhãm ~. VÝ dô: khi ho¹t hãa axit amin (AA), n¨ng l−îng tõ ATP ®−îc
chuyÓn ®Õn AA~AMP, t¹o ra mét gi¸ trÞ ∆G ©m lín vµ ph¶n øng kh«ng thÓ ®¶o ng−îc.

a)

Phosphate
Nucleoside
diphosphate (NDP)

Chuçi polynucleotide ®ang


tæng hîp (cã n nucleotide)
Chuçi polynucleotide ®ang tæng
hîp (cã n+1 nucleotide)
b)

Pyrophosphate Phosphate
Nucleoside
triphosphate (NTP)

Chuçi polynucleotide ®ang


tæng hîp (cã n nucleotide)
Chuçi polynucleotide ®ang tæng
hîp (cã n+1 nucleotide)

Nucleoside Pyrophosphate Phosphate


triphosphate (NTP)

Chuçi polynucleotide ®ang tæng


hîp (cã n+1 nucleotide)
Chuçi polynucleotide ®ang tæng
hîp (cã n+2 nucleotide)

H×nh 1.5. Hai m« h×nh sinh tæng hîp axit nucleic. (a) tiÒn chÊt lµ c¸c nucleoside diphosphate (NDP);
(b) tiÒn chÊt lµ c¸c nucleoside triphosphate (NTP)

18
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

HiÖu qu¶ sö dông nhãm ~ cã thÓ thÊy trong tr−êng hîp tÕ bµo “cè g¾ng” tæng
hîp axit nulecic tõ NDP chø kh«ng ph¶i tõ NTP (h×nh 1.5). Trong tr−êng hîp nµy, nhãm
 chø kh«ng ph¶i ~ ®−îc gi¶i phãng ra. Nh−ng ë ®©y, c¸c liªn kÕt phosphodieste
kh«ng bÒn v× n¨ng l−îng tù do (∆G) ®−îc gi¶i phãng ra kh«ng lín. V× vËy, dÉn ®Õn ph¶n øng
sinh tæng hîp dÔ bÞ “®¶o ng−îc”. NÕu l−îng phosphate v« c¬ () ®−îc tÝch lòy ngµy cµng
cao, ph¶n øng sÏ ngµy cµng cã xu h−íng lµm ®øt g·y c¸c chuçi polynucleotide míi h×nh
thµnh tu©n theo luËt t¸c dông khèi l−îng. Ngoµi ra, tÕ bµo cßn cÇn sö dông  cho
nhiÒu ho¹t ®éng sèng cña nã. Trong thùc tÕ, ph¶n øng ®øt g·y liªn kÕt ~ kh«ng chØ
gi¶i phãng mét l−îng lín n¨ng l−îng tù do, mµ ®ång thêi h×nh thµnh c¸c  riªng lÎ. §iÒu
nµy ng¨n c¶n kh¶ n¨ng x¶y ra c¸c ph¶n øng ®¶o ng−îc. Nãi c¸ch kh¸c, b»ng c¬ chÕ kÐp nªu
trªn, tÕ bµo rÊt khã tËp trung ®ñ l−îng ~ cÇn thiÕt ®Ó ph¶n øng ®¶o ng−îc cã thÓ diÔn ra
theo luËt t¸c dông khèi l−îng. Ta thÊy râ ë ®©y viÖc c¸c NTP ®−îc dïng lµm tiÒn chÊt
tæng hîp c¸c axit nucleic kh«ng hÒ lµ mét sù t×nh cê cña t¹o hãa.
Còng tõ ph©n tÝch trªn ®©y, chóng ta thÊy râ sù −u viÖt cña viÖc sö dông ATP,
chø kh«ng ph¶i ADP, lµ chÊt cho n¨ng l−îng chñ yÕu cña mäi tÕ bµo. Trong c¸c tÕ bµo,
nh÷ng ph¶n øng sö dông ADP lµm ph©n tö cho n¨ng l−îng th−êng diÔn ra c©n b»ng
theo hai chiÒu.

1.4. C¸c liªn kÕt m¹nh vµ yÕu quy ®Þnh cÊu h×nh cña c¸c ®¹i ph©n tö
ADN, ARN vµ protein ®Òu lµ c¸c ®¹i ph©n tö sinh häc ®−îc h×nh thµnh tõ c¸c ®¬n
ph©n. §èi víi ADN vµ ARN, nh÷ng ®¬n ph©n nµy lµ c¸c nucleotide, cßn víi protein lµ 20
lo¹i axit amin c¬ b¶n (vµ mét sè lo¹i biÕn ®æi kh¸c) ®−îc ho¹t hãa bëi tARN. Chøc n¨ng
sinh hãa vµ di truyÒn cña c¸c ®¹i ph©n tö nµy ®Òu ®−îc quy ®Þnh bëi thµnh phÇn vµ trËt
tù cña c¸c ®¬n ph©n. C¸c liªn kÕt yÕu gi÷ vai trß quan träng trong viÖc x¸c ®Þnh cÊu h×nh
kh«ng gian (ë ®©y gäi t¾t lµ cÊu h×nh) vµ chøc n¨ng cña c¸c ®¹i ph©n tö nµy. CÊu tróc
bËc I cña ADN, ARN vµ protein lµ trËt tù cña c¸c ®¬n ph©n liªn kÕt víi nhau bëi c¸c liªn
kÕt céng hãa trÞ. Nh−ng, cÊu h×nh ®Æc thï cña ADN, ARN vµ protein (yÕu tè quyÕt ®Þnh
chøc n¨ng cña chóng) l¹i chñ yÕu ®−îc quy ®Þnh bëi sù cã mÆt ®ång thêi cña nhiÒu liªn
kÕt yÕu. ChÝnh c¸c liªn kÕt yÕu, bao gåm c¸c liªn kÕt hydro, ion, kÞ n−íc vµ lùc Van der
Waals, ®· t¹o nªn c¸c vÞ trÝ ho¹t ®éng cña c¸c ph©n tö protein; cßn ®èi víi ADN, nã lµm
cho ph©n tö nµy cã d¹ng cÊu tróc chuçi xo¾n kÐp. Trong thùc tÕ, khi nh÷ng liªn kÕt yÕu
mÊt ®i (vÝ dô: bëi nhiÖt hoÆc c¸c chÊt tÈy), dï cho c¸c liªn kÕt céng hãa trÞ vÉn cßn
nguyªn, th× ho¹t tÝnh sinh häc cña ph©n tö nµy hÇu nh− kh«ng cßn. Trong phÇn nµy,
chóng ta sÏ ®Ò cËp ®Õn c¸c lùc quy ®Þnh cÊu h×nh kh«ng gian cña ADN, ARN vµ protein.
§©y chÝnh lµ c¬ chÕ chñ yÕu cña nhiÒu qu¸ tr×nh sinh häc nãi chung vµ di truyÒn häc nãi
riªng ®−îc nh¾c tíi trong c¸c phÇn sau cña gi¸o tr×nh nµy, bao gåm c¶ c¸c qu¸ tr×nh sao
chÐp, phiªn m·, dÞch m·, ®iÒu hßa biÓu hiÖn cña c¸c gen, ®iÒu khiÓn thay ®æi chøc n¨ng
protein qua c¬ chÕ “dÞ h×nh”, v.v…

1.4.1. CÊu h×nh ph©n tö ®−îc quy ®Þnh bëi c¸c liªn kÕt trong vµ ngoµi ph©n tö
1.4.1.1. Sù h×nh thµnh chuçi xo¾n kÐp ®Òu ®Æn cña ph©n tö ADN
CÊu tróc xo¾n kÐp ®Òu ®Æn cña ADN lµ do hÇu hÕt c¸c ph©n tö ADN cã hai m¹ch
polynucleotide song song ng−îc chiÒu (cßn gäi lµ “®èi song song”) liªn kÕt víi nhau qua
liªn kÕt hydro mang tÝnh bæ sung. Hai m¹ch cña ph©n tö ADN ®−îc gi÷ l¹i víi nhau bëi
c¸c liªn kÕt hydro gi÷a c¸c cÆp purine (adenine vµ guanine) vµ pyrimidine (thymine vµ
cytosine) t−¬ng hîp (xem thªm ch−¬ng 2). Sù t−¬ng hîp gi÷a tõng cÆp baz¬ nit¬ vµ tÝnh
®èi song song cña ph©n tö ADN sîi kÐp lµ do yªu cÇu vÒ tÝnh ®Þnh h−íng cña c¸c nhãm

19
§inh §oµn Long

chøc cho vµ nhËn liªn kÕt hydro. Trong m«i tr−êng néi bµo, adenine (A) lu«n cã xu h−íng
liªn kÕt hydro víi thymine (T), cßn guanine (G) lu«n liªn kÕt hydro víi cytosine (C). Ngoµi
ra, c¸c nguyªn tö trªn bÒ mÆt cña phÇn ®−êng vµ phosphate th−êng h×nh thµnh c¸c liªn kÕt
yÕu víi c¸c ph©n tö n−íc ë xung quanh.
C¸c cÆp baz¬ nit¬ (base) purine-pyrimidine lu«n ë phÇn trung t©m cña ph©n tö ADN.
Sù s¾p xÕp nh− vËy cho phÐp bÒ mÆt ph©n tö ph¼ng cña chóng xÕp thµnh tõng líp chång lªn
nhau, gióp c¸c baz¬ nit¬ chia sÎ ®−îc c¸c ®iÖn tö (π - π), ®ång thêi h¹n chÕ sù tiÕp xóc cña
chóng víi c¸c ph©n tö n−íc. Sù cã mÆt cña c¸c cÆp baz¬ nit¬ liªn kÕt bæ trî víi nhau trong
chuçi xo¾n kÐp lµm cÊu tróc ph©n tö cã h×nh d¹ng xo¾n ®Òu ®Æn, do kho¶ng c¸ch gi÷a mçi
cÆp baz¬ nit¬ lµ æn ®Þnh.
Ph©n tö ADN ë d¹ng xo¾n kÐp cã tÝnh æn ®Þnh cao nhê hai lý do: Thø nhÊt, sù ph¸ vì
cÊu tróc xo¾n kÐp lµm c¸c purine vµ pyrimidine vèn cã tÝnh kÞ n−íc ph¶i tiÕp xóc víi c¸c
ph©n tö n−íc lµ kh«ng phï hîp víi xu h−íng hãa n¨ng. Thø hai, c¸c ph©n tö ADN sîi kÐp
cã mét l−îng lín c¸c liªn kÕt yÕu s¾p xÕp theo mét trËt tù nhÊt ®inh, nªn kh«ng dÔ ®øt ra
®ång thêi. Trong dung dÞch, sù chuyÓn ®éng cña c¸c ph©n tö cã thÓ lµm ®øt g·y c¸c liªn kÕt
hydro ë hai ®Çu ph©n tö ADN sîi kÐp, nh−ng th−êng kh«ng bao giê cã thÓ lµm ®øt g·y c¸c
liªn kÕt ë s©u bªn trong. Mét khi liªn kÕt hydro bÞ ®øt g·y, th× sù kiÖn cã xu h−íng x¶y ra
ngay sau ®ã lµ liªn kÕt hydro h×nh thµnh trë l¹i. TÊt nhiªn, trong mét sè ®iÒu kiÖn nhÊt
®Þnh (vÝ dô: nhiÖt ®é cao hoÆc trong m«i tr−êng kiÒm), nhiÒu liªn kÕt hydro cã thÓ bÞ ®øt
g·y liªn tiÕp. Trong tr−êng hîp hai m¹ch cña ADN ®· t¸ch nhau ra mµ kh«ng liªn kÕt
ngay trë l¹i, th× qu¸ tr×nh nµy th−êng b¾t ®Çu tõ mét ®Çu cña ph©n tö vµ tiÕn dÇn vµo phÝa
trong. Tuy nhiªn, hiÖn t−îng nµy nh×n chung hiÕm khi x¶y ra trong ®iÒu kiÖn sinh lý b×nh
th−êng vµ c¸c ®o¹n ADN cã nhiÒu h¬n 10 liªn kÕt hydro th−êng bÒn ë nhiÖt ®é phßng.
Khi nhiÖt ®é t¨ng dÇn lªn vµ cao h¬n nhiÖt ®é sinh lý c¬ thÓ th× tËp hîp c¸c liªn kÕt
yÕu ngµy cµng trë nªn kÐm bÒn. ë nhiÖt ®é cao, sù ®øt g·y cña c¸c liªn kÕt yÕu x¶y ra ngµy
cµng nhanh h¬n. Khi sè liªn kÕt ®øt g·y ®¹t ®Õn sè l−îng nhÊt ®Þnh, th× ph©n tö mÊt ®i cÊu
h×nh nguyªn thñy cña nã (gäi lµ sù biÕn tÝnh cña ph©n tö) vµ mÊt ®i ho¹t tÝnh. Nh− vËy,
khi nhiÖt ®é t¨ng lªn, ph¶i cã nh÷ng mèi t−¬ng t¸c nhÊt ®Þnh míi cã thÓ duy tr× cÊu h×nh
sîi kÐp cña ph©n tö ADN.
1.4.1.2. ARN cã nhiÒu d¹ng cÊu tróc kh¸c nhau
Ng−îc víi cÊu tróc ADN sîi kÐp cã tÝnh æn ®Þnh cao, ARN th−êng thÊy ë d¹ng m¹ch
®¬n. Mét sè lo¹i ARN (nh− mARN) cã chøc n¨ng nh− ph©n tö vËn chuyÓn th«ng tin t¹m
thêi, th−êng ë tr¹ng th¸i liªn kÕt víi c¸c protein kh¸c nhau, nªn chóng th−êng kh«ng cã
cÊu h×nh bËc 3 æn ®Þnh. C¸c ph©n tö ARN kh¸c cã thÓ gÊp nÕp thµnh mét sè d¹ng cÊu h×nh
bËc 3 ®Æc thï. §èi víi nh÷ng ph©n tö nµy, th−êng th× c¸c mèi t−¬ng t¸c néi ph©n tö gi÷a c¸c
ph©n ®o¹n kh¸c nhau gióp h×nh thµnh nªn cÊu h×nh ®Æc thï cña chóng. Nh÷ng t−¬ng t¸c
nµy bao gåm sù t−¬ng t¸c gi÷a c¸c baz¬ nit¬ theo m« h×nh cña Watson-Crick, mét sè d¹ng
kÕt cÆp baz¬ bÊt th−êng kh¸c chØ cã ë ARN, vµ sù xÕp chång lªn nhau cña c¸c baz¬ nit¬ cã
tÝnh kÞ n−íc. ARN kh¸c ADN ë ®−êng ribose lµ cã gèc C2’-OH. Trong cÊu tróc gÊp nÕp cña
c¸c ph©n tö ARN, gèc C2’-OH nµy th−êng tham gia vµo c¸c mèi t−¬ng t¸c gióp æn ®Þnh cÊu
h×nh ph©n tö. Ch¼ng h¹n nh− c¸c ion hãa trÞ 2 (nh− Mg2+, Mn2+, Ca2+) khi g¾n vµo ph©n tö
ARN gióp c¸c cÊu tróc gÊp nÕp cña ph©n tö nµy trë nªn æn ®Þnh vµ bÒn v÷ng, ®ã lµ nhê
nh÷ng ion nµy cã thÓ che ch¾n c¸c ®iÖn tÝch ©m cña trôc ph©n tö, t¹o ®iÒu kiÖn ®Ó c¸c miÒn
(domain) cña ph©n tö tiÕp cËn ®−îc gÇn nhau.
CÊu h×nh bËc 3 cña mét sè lo¹i ARN, ®Æc biÖt lµ tARN, th−êng cã cÊu tróc chÆt vµ gÊp
nÕp ®Æc tr−ng. CÊu tróc cña nhãm ph©n tö nµy cho thÊy sù xÕp chång lªn nhau cña c¸c
baz¬ nit¬ gi÷ mét vai trß quan träng gióp duy tr× cÊu h×nh æn ®Þnh cña ARN. Cô thÓ, trong

20
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

mét ph©n tö ARN cã kho¶ng 76 baz¬ nit¬, trung b×nh t×m thÊy 72 baz¬ nit¬ cã kiÓu t−¬ng
t¸c xÕp chång lªn nhau. §Æc ®iÓm nµy gièng víi cÊu tróc ADN sîi kÐp. Nh− ®· nãi ë trªn,
cÊu tróc nµy lµ bÒn v÷ng vÒ mÆt hãa n¨ng. C¸c vïng cã cÊu tróc xo¾n kÐp vµ xÕp chång
lªn nhau nh− vËy cña ARN cßn cã thÓ cã c¸c t−¬ng t¸c bËc 3 kh¸c n÷a gióp ph©n tö ARN cã
cÊu h×nh æn ®Þnh.
1.4.1.3. Thuéc tÝnh cña c¸c axit amin - thµnh phÇn cÊu t¹o nªn c¸c protein
Kh«ng gièng 8 lo¹i nucleotide (4 lo¹i deoxyribonucleotide vµ 4 lo¹i ribonucleotide)
trong cÊu tróc cña ADN vµ ARN, 20 lo¹i axit amin phæ biÕn tæng hîp nªn protein cã tÝnh
®a d¹ng rÊt cao. C¸c axit amin cã ®Æc ®iÓm chung lµ cã mét nguyªn tö cacbon trung t©m
(Cα) liªn kÕt víi mét nguyªn tö H, mét nhãm amino (-NH3+) vµ mét nhãm cacboxyl (-COO-).
Liªn kÕt thø t− cña Cα g¾n víi mét chuçi bªn cã cÊu tróc kh¸c nhau gi÷a c¸c lo¹i axit amin
vµ cßn ®−îc gäi lµ gèc R. Gèc R cña c¸c axit amin kh¸c nhau vÒ kÝch th−íc, h×nh d¹ng,
thµnh phÇn hãa häc vµ ®Æc tÝnh hãa lý. Dùa trªn c¸c thuéc tÝnh hãa lý, c¸c chuçi bªn (gèc
R) cña c¸c axit amin ®−îc chia lµm 4 nhãm: nhãm trung tÝnh kh«ng ph©n cùc, nhãm trung
tÝnh ph©n cùc, nhãm cã tÝnh axit vµ nhãm cã tÝnh baz¬ (b¶ng 1.5). C¸c gèc R thuéc nhãm
trung tÝnh kh«ng ph©n cùc gåm c¸c chuçi cacbon hoÆc cÊu tróc vßng th¬m cã tÝnh kÞ n−íc.
C¸c gèc R thuéc nhãm trung tÝnh ph©n cùc gåm hydroxyl, sulfhydryl, amit vµ imidazole cã
kh¶ n¨ng t¹o liªn kÕt hydro m¹nh. C¸c gèc R mang ®iÖn tÝch (cã tÝnh axit hoÆc baz¬), bao
gåm c¸c amin vµ cacboxylate bËc mét hoÆc hai, cã kh¶ n¨ng t¹o c¸c liªn kÕt hydro vµ ion.
TÊt c¶ c¸c lo¹i chuçi bªn R ®Òu cã thÓ tham gia c¸c liªn kÕt Van der Waals.
1.4.1.4. Liªn kÕt peptide
Liªn kÕt céng hãa trÞ gi÷a c¸c axit amin trong
Liªn kÕt peptide
ph©n tö protein lµ liªn kÕt peptide (h×nh 1.6). Liªn
kÕt nµy ®−îc t¹o ra gi÷a nhãm -NH2 cña axit amin
nµy víi nhãm –COOH cña axit amin liÒn kÒ. §©y lµ
mét liªn kÕt ®«i (mét phÇn). NghÜa lµ, liªn kÕt nµy H R1 H H
O
chøa nhiÒu h¬n mét cÆp ®iÖn tö, do ®ã møc ®é quay H N C C N C C -
quanh liªn kÕt cña c¸c nguyªn tö bÞ h¹n chÕ. C¸c O
nguyªn tö chØ cã thÓ quay tù do quanh liªn kÕt khi H H O R2
chØ cã mét liªn kÕt ®¬n duy nhÊt, ch¼ng h¹n nh− c¸c
nhãm -CH3 cña metan (H3C-C3H) cã thÓ quay tù do H×nh 1.6. Liªn kÕt peptide. DÊu
quanh liªn kÕt C-C. Trõ liªn kÕt peptide, mäi liªn ngoÆc chØ hai axit amin ®−îc nèi víi
kÕt kh¸c trong trôc polypeptide lµ c¸c liªn kÕt ®¬n vµ nhau b»ng mét liªn kÕt peptide
do ®ã c¸c nguyªn tö cã thÓ quay tù do. Víi ®Æc ®iÓm
cÊu tróc nµy, vÒ lý thuyÕt c¸c chuçi polypeptide cã thÓ cã nhiÒu d¹ng cÊu h×nh kh¸c nhau.
Nh−ng trong tr−êng hîp cña protein, do t¸c ®éng phèi trÝ (steric interference) gi÷a c¸c
liªn kÕt peptide mµ kh¶ n¨ng quay quanh liªn kÕt cña c¸c nguyªn tö vµ gèc R bÞ h¹n chÕ.
§iÒu nµy lµm cÊu h×nh kh«ng gian cña c¸c ph©n tö protein võa cã tÝnh æn ®Þnh võa cã
tÝnh linh ho¹t t−¬ng ®èi khi t−¬ng t¸c víi c¸c ph©n tö kh¸c.
1.4.1.5. Bèn cÊp cÊu h×nh cña protein
CÊu h×nh bËc mét cña mét ph©n tö protein lµ tr×nh tù c¸c axit amin cÊu t¹o nªn
ph©n tö ®ã. C¸c axit amin gÇn nhau t¹o c¸c liªn kÕt thø cÊp víi nhau ®Ó h×nh thµnh nªn
cÊu h×nh bËc hai. Cã hai d¹ng cÊu h×nh bËc hai phæ biÕn lµ d¹ng xo¾n α vµ mÆt ph¼ng β.
C¸c cÊu h×nh bËc hai tiÕp tôc ®ãng gãi t¹o nªn cÊu h×nh bËc ba th−êng cã tÝnh ®Æc thï ®èi
víi tõng chuçi polypeptide. HÇu hÕt c¸c ph©n tö protein ®Òu ®−îc cÊu thµnh tõ nhiÒu chuçi
polypeptide kh¸c nhau, trong ®ã mçi chuçi ®−îc gäi lµ c¸c tiÓu ®¬n vÞ protein. C¸c tiÓu
®¬n vÞ kÕt hîp víi nhau hoÆc víi mét sè ph©n tö kh¸c ®Ó h×nh thµnh nªn cÊu h×nh bËc

21
§inh §oµn Long

bèn. §¸ng chó ý lµ mét ph©n tö protein cã thÓ cã nhiÒu cÊu h×nh bËc bèn kh¸c nhau. TÊt
nhiªn, mçi d¹ng cÊu h×nh nµy th−êng cã chøc n¨ng hoÆc ho¹t tÝnh sinh häc kh¸c nhau.
B¶ng 1.5. Ph©n lo¹i axit amin trªn c¬ së kh¶ n¨ng tÝch ®iÖn vµ tÝnh ph©n cùc cña c¸c chuçi bªn
C¸c axit amin trung tÝnh cã chuçi bªn (R) kh«ng ph©n cùc (kÞ n−íc)
-
-
COO -
- - COO COO
COO COO H3N C H
H3N C H H3N C H
H3N C H H3N C H CH2
CH CH3 CH CH2
H CH3 CH CH3
CH3 CH3 CH3
CH3
Glycine Alanine Valine Leucine Isoleucine
(Gly, G) (Ala, A) (Val, V) (Leu, L) (Ile, I)
-
COO -
COO
- COO
H3N C H -
- H3N C H H3N C H COO
COO CH2
CH2 CH2 H3N C H
CH
H2N C CH2 CH2
NH
S SH
CH3

Proline Phenylalanine Tryptophane Methionine Cysteine


(Pro, P) (Phe, F) (Trp, W) (Met, M) (Cys, C)
C¸c axit amin trung tÝnh cã chuçi bªn (R) ph©n cùc (−a n−íc)
-
COO -
- COO
- H3N C H COO
- COO H3N C H
COO CH2 H3N C H
H3N C H CH2
H3N C H CH2
CHOH CH2
CH2OH C
CH3 H2N O C
OH
H2N O

Serine Threonine Tyrosine Asparagine Glutamine


(Ser, S) (Thr, T`) (Tyr, Y) (Asn, N) (Gln, Q)

C¸c axit amin tÝch ®iÖn d−¬ng (tÝnh kiÒm / tÝnh baz¬) C¸c axit amin tÝch ®iÖn ©m (tÝnh axit)
-
COO -
COO COO
- -
H3N C H COO
H3N C H -
CH2 H3N C H COO
H3N C H
CH2 CH2 CH2 H3N C H
CH2
CH2 CH2 CH2
N - CH2
NH CH2 COO -
C NH COO
CH2 NH3
H2N NH2
Arginine Lysine Histidine Axit aspartic Axit glutamic
(Arg, R) (Lys, K) (His, H) (Asp, D) (Glu, E)

22
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

1.4.1.6. CÊu h×nh protein bËc hai phæ biÕn lµ d¹ng chuçi xo¾n α vµ mÆt ph¼ng β
D¹ng cÊu h×nh bËc hai bÒn v÷ng nhÊt cña khung polypeptide lµ d¹ng chuçi xo¾n α
(h×nh 1.7). §©y lµ d¹ng xo¾n ph¶i, cã chu kú vßng xo¾n dµi 5,4Å theo chiÒu dµi trôc xo¾n
víi mçi vßng xo¾n cã trung b×nh 3,6 axit amin. CÊu h×nh xo¾n α ®−îc gi÷ æn ®Þnh lµ nhê
c¸c liªn kÕt yÕu (chñ yÕu lµ liªn kÕt hydro) gi÷a c¸c nguyªn tö thuéc c¸c nhãm imino vµ
cacboxyl gÇn nhau trªn chuçi polypeptide vµ phï hîp víi khung peptide cã c¸c gãc quay
lµ φ (phi) vµ ψ (psi), do t¸c ®éng phèi trÝ cña c¸c nhãm chøc (h×nh 1.8). ChØ cã mét axit
amin duy nhÊt kh«ng t¹o ®−îc liªn kÕt hydro lµ proline (v× axit amin nµy cã cÊu tróc vßng
nªn nã kh«ng cã nguyªn tö cho liªn kÕt hydro, xem b¶ng 1.5). V× vËy, Proline cßn ®−îc gäi
lµ tiÓu phÇn lµm gËp chuçi xo¾n. Mét sè axit amin kh¸c, bao gåm Glycine, Tyrosine, vµ
Serine, mÆc dï kh«ng cã cÊu tróc ng¨n c¶n sù h×nh thµnh vßng xo¾n α, nh−ng hiÕm khi cã
mÆt trong c¸c chuçi xo¾n α.
ViÖc h×nh thµnh cÊu h×nh xo¾n α chñ yÕu dùa trªn sù tiÕp xóc gi÷a c¸c nguyªn tö
trªn trôc polypeptide dÉn ®Õn hiÖn t−îng lµ c¸c chuçi bªn (gèc R) cña c¸c axit amin trªn
chuçi polypeptide th−êng ®−îc ®Èy ra xa khái chuçi xo¾n (h×nh 1.8). §iÒu nµy gióp c¸c
chuçi bªn cã ®−îc vÞ trÝ lý t−ëng ®Ó cã thÓ t−¬ng t¸c víi c¸c vïng kh¸c cña c¸c ph©n tö
protein, hoÆc víi c¸c ®¹i ph©n tö kh¸c, bao gåm ADN vµ ARN.

Liªn kÕt peptide

MÆt ph¼ng β
§o¹n “nót th¾t” O R H

H H
C Cα N


Vßng xo¾n α N C Cα
H
MÆt ph¼ng MÆt ph¼ng
liªn kÕt H liªn kÕt
O
R R
Gãc quay do t¸c ®éng phèi trÝ

H×nh 1.7. Hai d¹ng cÊu tróc bËc hai H×nh 1.8. C¸c gãc quay phi (φφ) vµ psi (ψ
ψ) quanh c¸c liªn kÕt
phæ biÕn cña protein lµ d¹ng vßng Cαα-N vµ Cαα-C. Vïng ®−îc vÏ b»ng ®−êng ®øt nÐt lµ mÆt ph¼ng
xo¾n α vµ d¹ng mÆt ph¼ng β cña c¸c nguyªn tö tham gia liªn kÕt peptide (theo Watson, 2004)

CÊu h×nh bËc hai phæ biÕn thø hai cña protein lµ d¹ng mÆt ph¼ng β (h×nh 1.7).
Kh«ng gièng víi d¹ng xo¾n α, d¹ng mÆt ph¼ng β lµ kÕt qu¶ cña sù liªn kÕt gi÷a c¸c phÇn
xa nhau h¬n thuéc khung polypeptide (h×nh 1.9). Sù æn ®Þnh cña cÊu h×nh mÆt ph¼ng β lµ
do sù xÕp th¼ng hµng cña c¸c ph©n ®o¹n polypeptide sao cho c¸c nhãm -C=O vµ -NH thuéc
c¸c ph©n ®o¹n liÒn kÒ xÕp th¼ng hµng vµ cã thÓ t¹o liªn kÕt hydro víi nhau. Qua tËp hîp
c¸c liªn kÕt nµy, mét mÆt ph¼ng β ®−îc h×nh thµnh. Mét mÆt ph¼ng β ®iÓn h×nh th−êng
bao gåm tõ 4 ®Õn 6 ph©n ®o¹n polypeptide xÕp th¼ng hµng (nh÷ng ph©n ®o¹n nµy cßn
®−îc gäi t¾t lµ chuçi β) víi chiÒu dµi mçi ph©n ®o¹n gåm tõ 8 ®Õn 10 axit amin. Trong cÊu
h×nh mÆt ph¼ng β, ®Ó c¸c nhãm -C=O vµ -NH cã thÓ liªn kÕt hydro ®−îc víi nhau (dÉn
®Õn c¸c nhãm nµy n»m trªn cïng mÆt ph¼ng), c¸c axit amin gÇn kÒ ph¶i quay ng−îc
nhau 180o, vµ v× vËy c¸c gèc R t−¬ng øng cña chóng th−êng h−íng vÒ c¸c phÝa ®èi diÖn cña
mÆt ph¼ng β.

23
§inh §oµn Long

a) b)

H×nh 1.9. Hai d¹ng cÊu tróc cña mÆt ph¼ng β . a) d¹ng mÆt ph¼ng β thuËn song song,
b) d¹ng mÆt ph¼ng β ®èi song song (nguån: Branden C vµ Tooze J, 1999)

CÊu h×nh mÆt ph¼ng β chñ yÕu xuÊt hiÖn ë hai d¹ng kh¸c nhau vÒ h−íng ph©n cùc
cña c¸c chuçi β liÒn kÒ. ë d¹ng thø nhÊt, c¸c chuçi β liÒn kÒ cã h−íng ph©n cùc (tõ ®Çu C
®Õn ®Çu N) cïng chiÒu, t¹o nªn mÆt ph¼ng β thuËn song song (h×nh 1.9a). ë d¹ng thø
hai, c¸c chuçi β liÒn kÒ ch¹y song song nh−ng theo chiÒu ng−îc nhau, nªn gäi lµ mÆt
ph¼ng β ®èi song song (h×nh 1.9b). Mét sè mÆt ph¼ng β ®−îc t¹o ra bëi sù kÕt hîp cña
c¶ c¸c hai d¹ng nµy, nh−ng Ýt phæ biÕn h¬n. Trong c¶ hai d¹ng mÆt ph¼ng β ®èi song song
vµ thuËn song song, tÊt c¶ c¸c nhãm peptide ®Òu n»m trªn bÒ mÆt cña “mÆt ph¼ng t−¬ng
®èi”. C¸c nghiªn cøu cÊu h×nh kh«ng gian cña protein cho thÊy phÇn lín c¸c chuçi β cã xu
h−íng h¬i vÆn xo¾n vÒ phÝa ph¶i däc theo chiÒu dµi cña nã. V× vËy, cÊu h×nh mÆt ph¼ng β
cña protein kh«ng cã d¹ng ph¼ng tuyÖt ®èi, mµ cã xu h−íng cuén vßng lµm cÊu h×nh ph©n
tö protein trë nªn chÆt h¬n.
C¶ hai d¹ng chuçi xo¾n α vµ mÆt ph¼ng β ®Òu lµ c¸c d¹ng cÊu h×nh kh«ng gian æn
®Þnh. Tuy vËy, ®Ó cã ®−îc kh¶ n¨ng t−¬ng t¸c tèi ®a víi c¸c ph©n tö kh¸c trong qu¸ tr×nh
biÓu hiÖn chøc n¨ng, c¸c ph©n tö protein ph¶i cã cÊu h×nh linh ho¹t h¬n. Kh¶ n¨ng c¸c
chuçi bªn (gèc R) cã thÓ bÎ cong mét phÇn c¸c khung ph©n tö cã vai trß lµm t¨ng kh¶ n¨ng
t¹o ra c¸c liªn kÕt thø cÊp cña c¸c ph©n tö protein. Ngoµi ra, trªn chuçi polypeptide cßn
cã mét sè vïng cã cÊu h×nh Ýt tu©n theo qui luËt, cho phÐp chóng bÎ gËp (gäi lµ vÞ trÝ
“nót th¾t”, h×nh 1.7) ë cuèi mçi vßng xo¾n α vµ/hoÆc gi÷a c¸c chuçi β. C¸c axit amin t¹i
c¸c vÞ trÝ nót th¾t th−êng chØ cã vai trß nèi gi÷a c¸c vßng xo¾n α vµ mÆt ph¼ng β, vµ b¶n
th©n chóng kh«ng cã cÊu h×nh bËc hai æn ®Þnh. C¸c “nót th¾t” nµy cã chiÒu dµi biÕn ®éng,
cã thÓ tõ vµi axit amin ®Õn hµng chôc axit amin. Nh−ng, nh×n chung chóng chØ th−êng
t−¬ng ®èi ng¾n.
Mét yÕu tè quan träng kh¸c cã ¶nh h−ëng ®Õn sù gÊp nÕp cña c¸c ph©n tö protein lµ
thµnh phÇn c¸c axit amin cã tÝnh kÞ n−íc. Trong m«i tr−êng n−íc, c¸c ph©n tö protein cã
xu h−íng gÊp nÕp sao cho c¸c axit amin mang nh¸nh bªn (gèc R) kh«ng ph©n cùc ®−îc
“giÊu” vµo phÝa trong (®Ó tr¸nh tiÕp xóc víi n−íc) vµ béc lé c¸c axit amin mang gèc R cã
tÝnh ph©n cùc ra ngoµi. V× lý do nµy, nÕu mét ph©n tö protein cã sù gÊp nÕp kh«ng phï
hîp hoÆc chøa phÇn lín c¸c gèc ph©n cùc th× th−êng kÐm bÒn trong m«i tr−êng n−íc. Nãi
c¸ch kh¸c, trªn c¬ së hãa n¨ng, khi ph©n tö protein cµng chøa nhiÒu nh¸nh bªn kh«ng
ph©n cùc th× cµng khã bÞ thñy ph©n, bëi lóc ®ã n¨ng l−îng ph¸ vì c¸c liªn kÕt cßn cÇn ®Ó
cµi c¸c gèc kÞ n−íc vµo gi÷a c¸c ph©n tö n−íc.

24
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

1.4.2. CÊu h×nh kh«ng gian ®Æc thï cña protein ®−îc quy ®Þnh bëi c¸c liªn kÕt
hydro néi ph©n tö
NÕu mét phÇn n¨ng l−îng ®−îc dïng ®Ó lµm æn ®Þnh mét ph©n tö protein cã nguån
gèc tõ c¸c mèi t−¬ng t¸c kÞ n−íc, th× cÊu h×nh kh«ng gian ®Æc thï cña nã ®−îc quyÕt ®Þnh
chñ yÕu bëi c¸c liªn kÕt hydro. Trong khi c¸c t−¬ng t¸c kÞ n−íc th−êng kh«ng phô thuéc vµo
h−íng vµ vÞ trÝ cña c¸c gèc (nhãm chøc) cho vµ nhËn liªn kÕt, th× c¸c liªn kÕt hydro th−êng
®ßi hái c¸c gèc nµy ph¶i cã kho¶ng c¸ch vµ tÝnh ®Þnh h−íng nhÊt ®Þnh. Nh×n chung, c¸c
nguyªn tö cho vµ nhËn liªn kÕt hydro trong ph©n tö protein th−êng thuéc vÒ nh÷ng cÆp
nhãm chøc phï hîp. NÕu liªn kÕt hydro ®−îc t¹o nªn tõ c¸c cÆp nhãm chøc kh«ng phï hîp,
th× n¨ng l−îng cÇn cho sù h×nh thµnh liªn kÕt cÇn lín h¬n (vµi kcal/liªn kÕt). Qua ®ã, vai
trß cña liªn kÕt hydro trong ph©n tö protein chÝnh lµ lµm gi¶m tÝnh æn ®Þnh cña c¸c cÊu
tróc kh«ng phï hîp (do thiÕu sù t−¬ng ®ång).

1.4.3. PhÇn lín protein cã cÊu t¹o kiÓu m«®un víi hai hoÆc ba domain (miÒn) chÝnh
C¸c tiÓu ®¬n vÞ protein (mét chuçi polypeptide ®¬n lÎ) th−êng cã kÝch th−íc rÊt biÕn
®éng, tõ vµi chôc ®Õn vµi ngh×n axit amin. Chuçi polypeptide h×nh thµnh nªn mét ph©n tö
protein ho¹t ®éng chøc n¨ng nhá nhÊt ®· biÕt cã chiÒu dµi kho¶ng 100 axit amin, khèi
l−îng xÊp xØ 11.000 dalton (dalton ®−îc viÕt t¾t lµ Da, 1 Da = 1,67x10-24g). Nh−ng, nh×n
chung hÇu hÕt c¸c chuçi polypeptide h×nh thµnh nªn c¸c ph©n tö protein ho¹t ®éng chøc
n¨ng cã khèi l−îng tõ 20.000 ®Õn 70.000 Da.
C¸c chuçi polypeptide cã khèi l−îng lín h¬n 20.000 Da th−êng ®−îc cÊu t¹o tõ hai
hoÆc nhiÒu domain. ThuËt ng÷ “domain” ®−îc dïng ®Ó chØ c¸c miÒn cÊu tróc hoÆc chøc
n¨ng kh¸c nhau trong ph©n tö protein. TÝnh bÒn v÷ng cña mçi domain trong dung dÞch
th−êng kh¸c nhau. Th«ng th−êng, mçi domain th−êng ®−îc cÊu t¹o tõ mét chuçi axit amin
liªn tiÕp, chø hiÕm khi nã tæ hîp tõ c¸c phÇn kh¸c nhau cña ph©n tö. §©y còng lµ mét ®Æc
®iÓm ®Ó x¸c ®Þnh mét protein cã bao nhiªu domain.
1.4.3.1. C¸c protein ®−îc cÊu t¹o chØ tõ mét sè Ýt c¸c motif (mÉu h×nh)
Tr−íc ®©y, ng−êi ta cho r»ng sè motif protein cã thÓ cã lµ kh«ng giíi h¹n. Nh−ng gÇn
®©y, tõ kÕt qu¶ nghiªn cøu chi tiÕt cÊu h×nh cña hµng ngµn protein kh¸c nhau, ng−êi ta
t×m thÊy mét ®iÒu ng¹c nhiªn lµ chØ cã mét sè l−îng Ýt c¸c motif c¬ b¶n ®−îc dïng phèi hîp
víi nhau ®Ó t¹o nªn sù ®a d¹ng vµ phong phó cña c¸c ph©n tö protein. MÆc dï cho ®Õn nay
ch−a gäi tªn ®−îc hÕt c¸c motif c¬ b¶n, nh−ng cã mét ®iÒu ch¾c ch¾n lµ sè motif c¬ b¶n nhá
h¬n nhiÒu sè cÊu h×nh kh«ng gian vèn rÊt ®a d¹ng vµ phong phó cña protein.
C¸c motif c¬ b¶n th−êng liªn quan ®Õn mét sè chøc n¨ng sinh häc nhÊt ®Þnh. Mét
trong nh÷ng motif phæ biÕn nhÊt ®−îc gäi lµ gÊp nÕp nucleotide kÐp t×m thÊy ë c¸c
enzym liªn kÕt ATP. Domain chøa motif nµy liªn kÕt víi ATP qua mét mÆt ph¼ng β ë
trung t©m vµ cã c¸c chuçi xo¾n α ë hai bªn. VÞ trÝ liªn kÕt lµ ë ®Çu tËn cïng C cña chuçi β.
C¸c ph©n tö protein cã cïng motif nµy chØ kh¸c vÒ sè l−îng vµ c¸ch s¾p xÕp cña c¸c chuçi
xo¾n α vµ ®«i khi lµ trËt tù cña c¸c chuçi β. C¸c domain chøa c¸c motif t−¬ng tù ë c¸c lo¹i
protein kh¸c nhau th−êng cã chøc n¨ng gièng nhau.
1.4.3.2. Chøc n¨ng protein cã thÓ thay ®æi do sù tæ hîp l¹i cña c¸c domain
C¸c thuéc tÝnh vµ chøc n¨ng kh¸c nhau cña protein cã thÓ xuÊt hiÖn tõ sù tæ hîp kh¸c
nhau gi÷a c¸c m«®un cña c¸c ph©n tö protein. Chóng ta cã thÓ liªn t−ëng ®iÒu nµy gièng
víi viÖc l¾p r¸p mét bé m¸y tÝnh (PC) hiÖn nay th−êng ®−îc tæ hîp tõ nhiÒu m«®un (nh−
bo m¹ch chñ, æ cøng, RAM, æ CD, mµn h×nh v.v....). §èi víi protein, cã rÊt nhiÒu vÝ dô
chøng minh cho ®iÒu nµy. Ch¼ng h¹n nh− cã nhiÒu enzym dehydrogenase kh¸c nhau ho¹t
®éng trªn c¸c c¬ chÊt kh¸c nhau. Mçi enzym ®Òu cã hai domain. Mét domain lµ vÞ trÝ liªn

25
§inh §oµn Long

kÕt víi coenzym NAD+ gåm hai nucleotide, cßn domain kia chøa vÞ trÝ liªn kÕt c¬ chÊt vµ vÞ
trÝ xóc t¸c. C¸c enzym dehydrogenase chØ kh¸c nhau vÒ cÊu tróc cña domain thø hai.
C¸c protein ®iÒu hßa ho¹t ®éng cña gen còng lµ mét vÝ dô vÒ cÊu tróc protein d¹ng
m«®un. ChÊt øc chÕ operon Lac (lac I) vµ protein ho¹t hãa gen CAP (xem ch−¬ng 5) ë E.
coli ®Òu lµ c¸c protein cã nhiÒu domain kh¸c nhau. CÊu tróc d¹ng tinh thÓ cña CAP cho
thÊy cã hai domain: mét domain lín liªn kÕt víi cAMP, cßn domain nhá thø hai chøa vÞ trÞ
nhËn biÕt ADN (phÇn ®Çu 5’ cña promoter). Cã sù gièng nhau vÒ tr×nh tù c¸c axit amin
trong domain lín cña CAP víi tr×nh tù cña mét tiÓu phÇn protein cña c¸c enzym kinase
ho¹t ®éng phô thuéc vµo cAMP. §iÒu nµy cho thÊy vÞ trÝ liªn kÕt cAMP cña c¶ hai nhãm
protein nµy cã thÓ cã cïng nguån gèc tiÕn hãa. ë CAP, domain liªn kÕt cAMP ®Ýnh kÕt víi
domain liªn kÕt ADN, nhê vËy sù thay ®æi vÒ l−îng cAMP liªn kÕt sÏ ®ång thêi ®iÒu khiÓn
møc ®é phiªn m·. ë enzym kinase, domain liªn kÕt cAMP ®iÒu hßa ho¹t ®éng cña enzym
tham gia ph©n gi¶i glycogen.
1.4.3.3. C¸c liªn kÕt yÕu x¸c ®Þnh vÞ trÝ ®Ýnh kÕt cña protein trªn ph©n tö ADN vµ ARN
C¸c protein liªn kÕt ADN tham gia ®iÒu hßa nhiÒu qu¸ tr×nh sinh häc c¬ b¶n. C¸c
liªn kÕt yÕu gióp cho c¸c ph©n tö protein ®Ýnh kÕt ®−îc víi ADN còng chÝnh lµ c¸c liªn kÕt
gióp h×nh thµnh cÊu h×nh kh«ng gian ba chiÒu cña c¸c ph©n tö ADN, ARN vµ protein. C¸c
protein liªn kÕt ADN phæ biÕn nhÊt chÝnh lµ c¸c protein cÊu tróc cã vai trß trong viÖc ®ãng
gãi vµ thu nhá ADN võa vÆn vµo nh©n tÕ bµo. Cô thÓ, chóng ta biÕt r»ng, nh©n cña tÕ bµo
ng−êi cã kÝch th−íc trung b×nh kho¶ng 10 µm (10-5 mÐt), nh−ng tæng chiÒu dµi ADN hÖ gen
vµo kho¶ng 2 mÐt (~6,4x109 nucleotide x 3,4Å).
Cã rÊt nhiÒu c¸ch ®Ó protein cã thÓ nhËn ra mét tr×nh tù ADN ®Æc thï. Mét sè kiÓu
t−¬ng t¸c ADN-protein lµ ®Æc thï cho nh÷ng tr×nh tù nhÊt ®Þnh trªn ADN. Trong khi, c¸c
kiÓu t−¬ng t¸c kh¸c biÓu hiÖn tÝnh ®Æc thï ®èi víi cÊu h×nh kh«ng gian gi÷a c¸c ph©n tö. VÝ
dô: khi ADN ®−îc gi·n xo¾n trong qu¸ tr×nh sao chÐp hoÆc t¸i tæ hîp, th× ngay lËp tøc ADN
m¹ch ®¬n ®−îc g¾n bëi c¸c protein liªn kÕt m¹ch ®¬n SSB (single strand binding protein).
Nh÷ng protein nµy, dï kh«ng cã tÝnh ®Æc hiÖu cao víi tr×nh tù ADN sîi kÐp, nh−ng l¹i cã tÝnh
liªn kÕt ®Æc hiÖu cao víi ADN m¹ch ®¬n. §Ó cã tÝnh chÊt nµy, c¸c protein SSB h×nh thµnh c¸c
liªn kÕt ion vµ hydro víi khung phosphate cña ADN m¹ch ®¬n vµ qua viÖc xen cña c¸c
chuçi bªn d¹ng vßng kÝch th−íc lín cña mét sè axit amin ®Æc thï (nh− tyrosine hoÆc
tryptophane) vµo gi÷a c¸c baz¬ nit¬.
HÇu hÕt c¸c protein liªn kÕt ADN ®−îc nh¾c ®Õn trong gi¸o tr×nh nµy lµ c¸c protein
liªn kÕt tr×nh tù ®Æc hiÖu trªn ph©n tö ADN sîi kÐp. Nh÷ng protein ®ã th−êng liªn quan
®Õn viÖc t×m ra c¸c tr×nh tù ®Æc hiÖu trong hÖ gen (vÝ dô: c¸c ®iÓm khëi ®Çu sao chÐp hoÆc
phiªn m·), hoÆc t¹i ®ã x¶y ra t¸i tæ hîp ADN. ¦íc l−îng cã kho¶ng 2 - 3% protein ë
prokaryote (sinh vËt nh©n s¬) vµ 6 - 7% protein ë eukaryote (sinh vËt nh©n thËt) lµ c¸c
protein liªn kÕt ®Æc hiÖu ADN. §Õn nay, c¬ chÕ phæ biÕn nhÊt ®Ó c¸c protein nhËn ra c¸c
tr×nh tù ADN ®Æc hiÖu lµ qua viÖc cµi chuçi xo¾n α vµo khe chÝnh (cßn gäi lµ r·nh chÝnh)
cña ph©n tö ADN sîi kÐp (xem ch−¬ng 3). ViÖc sö dông chuçi xo¾n α ®Ó cµi vµo khe chÝnh
vµ viÖc nhËn biÕt tr×nh tù ADN ®Æc hiÖu cã mét sè −u ®iÓm sau ®©y:
1. ChiÒu réng vµ chiÒu s©u cña khe chÝnh trªn ADN sîi kÐp cã kÝch th−íc võa khÝt víi
kÝch th−íc cña chuçi xo¾n α. Sù “võa khÝt” nh− vËy gióp c¸c liªn kÕt yÕu cã thÓ h×nh
thµnh gi÷a ph©n tö ADN vµ mét bªn bÒ mÆt cña chuçi xo¾n α.
2. Khe chÝnh trªn ph©n tö ADN th−êng giµu c¸c nguyªn tö cho vµ nhËn liªn kÕt
hydro. §iÒu quan träng h¬n lµ kiÓu h×nh liªn kÕt hydro lµ kh¸c nhau gi÷a c¸c cÆp
baz¬ nit¬. §iÒu nµy cho phÐp c¸c nguyªn tö cho vµ nhËn liªn kÕt hydro ho¹t ®éng
gièng nh− liªn kÕt hydro trong ph©n tö ADN, ®¶m b¶o cho viÖc nhËn biÕt ®−îc
tr×nh tù ADN theo nguyªn t¾c bæ sung. H×nh 1.10 minh häa c¸c nguyªn tö cho
vµ nhËn liªn kÕt hydro t¹i c¸c khe chÝnh vµ khe phô (r·nh phô) cña ph©n tö

26
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

ADN sîi kÐp. §iÒu ®¸ng chó ý ë ®©y lµ sù kÕt cÆp c¸c baz¬ liªn kÕt hydro t¹i c¸c
khe chÝnh cña ADN kh«ng chØ gióp ph©n biÖt ®−îc c¸c cÆp G:C vµ A:T, mµ ngay
c¶ gi÷a c¸c cÆp A:T vµ T:A, còng nh− G:C vµ C:G. Ng−îc l¹i, kiÓu h×nh kÕt cÆp baz¬
ë khe phô th−êng chØ ph©n biÖt ®−îc gi÷a c¸c cÆp A:T vµ G:C (nªn ®©y th−êng lµ vÞ
trÝ liªn kÕt Ýt ®Æc hiÖu h¬n cña c¸c protein cÊu tróc, ch¼ng h¹n nh− c¸c histon).
3. Chuçi xo¾n α cã momen l−ìng cùc nªn ®Çu N cña nã tÝch ®iÖn d−¬ng. §Çu tÝch ®iÖn
nµy th−êng t¹o liªn kÕt yÕu víi khung phosphate tÝch ®iÖn ©m ë gÇn khe chÝnh.
Motif “xo¾n-uèn-xo¾n” lµ motif protein liªn kÕt ADN ®Çu tiªn ®−îc x¸c ®Þnh. Motif
nµy gåm hai chuçi xo¾n α t¸ch biÖt nhau bëi mét vßng th¾t nhá. Mét trong hai chuçi α
®−îc dïng lµm chuçi nhËn biÕt ADN. C¸c motif protein liªn kÕt ADN kh¸c (nh− kiÓu
“ngãn tay kÏm” hay “khãa kÐo l¬xin”, xem thªm ch−¬ng 5) còng th−êng cµi c¸c chuçi xo¾n
α vµo khe chÝnh cña ADN.
MÆc dï chuçi xo¾n α ®−îc sö dông phæ biÕn trong viÖc nhËn biÕt c¸c tr×nh tù ADN ®Æc
hiÖu, cã mét sè protein sö dông c¬ chÕ kh¸c. Mét vÝ dô nh− vËy lµ protein liªn kÕt hép
TATA (TBP) trong qu¸ tr×nh khëi ®Çu phiªn m· ë eukaryote. TBP sö dông mét vïng cña
mÆt ph¼ng β ®Ó nhËn ra khe chÝnh cña tr×nh tù t¹i hép TATA.
1.4.3.4. Protein tr−ît däc ph©n tö ADN ®Ó x¸c ®Þnh vÞ trÝ liªn kÕt ®Æc thï
RÊt nhiÒu protein liªn kÕt ADN th«ng qua tiÕp xóc víi phÇn khung ph©n tö ADN
hoÆc víi tr×nh tù ®Æc hiÖu cña nã. §iÒu hßa c¸c ho¹t ®éng tiÕp xóc nµy lµ c¸c vïng chøa axit
amin tÝch ®iÖn d−¬ng n»m gÇn c¸c vÞ trÝ liªn kÕt víi c¸c baz¬ nit¬. Sù kÕt hîp nµy vÒ c¬ b¶n
phô thuéc vµo lùc tÜnh ®iÖn gi÷a c¸c vïng chøa axit amin tÝch ®iÖn d−¬ng víi khung
phosphate tÝch ®iÖn ©m cña ADN. Do phÇn khung cña ADN lu«n cã bÒ mÆt tÝch ®iÖn ©m
gièng nhau, nªn dï tr×nh tù axit amin nh− thÕ nµo, th× lùc t−¬ng t¸c tÜnh ®iÖn còng lu«n
lµ mét phÇn ®¸ng kÓ, dï cã hay kh«ng mét ¸i lùc ®Æc tr−ng. NghÜa lµ, thËm chÝ mét ph©n tö
protein liªn kÕt ADN cã tÝnh chän läc rÊt cao, th× nã còng cã ¸i lùc ®¸ng kÓ víi c¸c tr×nh tù
ADN kh«ng ®Æc hiÖu kh¸c.
Tuy vËy, ¸i lùc liªn kÕt th−êng lín h¬n rÊt nhiÒu khi protein g¾n kÕt vµo ®óng
tr×nh tù ®Æc hiÖu cña nã. VÝ dô nh− ¸i lùc liªn kÕt cña chÊt øc chÕ operon Lac (LacI) vµo
tr×nh tù chØ huy O (operator) lµ cao gÊp 105 lÇn so víi ¸i lùc cña chóng vµo nh÷ng tr×nh tù
ADN kh«ng ®Æc hiÖu kh¸c. Nh− vËy, trong tÕ bµo c¸c protein g¾n vµo nhiÒu vÞ trÝ kh«ng
®Æc hiÖu trªn ph©n tö ADN còng nh− ë c¸c vÞ trÝ ADN ®Æc thï cña nã. Së dÜ nh− vËy, bëi v×
trong hÖ gen, sè c¸c vÞ trÝ kh«ng ®Æc hiÖu nhiÒu h¬n rÊt nhiÒu so víi sè c¸c vÞ trÝ ®Æc hiÖu.
Thùc tÕ, mäi nucleotide trong hÖ gen ®Òu cã thÓ coi lµ vÞ trÝ b¾t ®Çu cña mét tr×nh tù liªn
kÕt kh«ng ®Æc hiÖu. Nãi c¸ch kh¸c, hÖ gen E. coli gåm ~5x106bp th× còng cã nghÜa nã cã
~5x106 vÞ trÝ g¾n kh«ng ®Æc hiÖu. Ta cã thÓ thÊy, mÆc dï ¸i lùc t¹i vÞ trÝ g¾n ®Æc hiÖu cao
h¬n nhiÒu lÇn (105) t¹i vÞ trÝ kh«ng ®Æc hiÖu, nh−ng sè tr×nh tù kh«ng ®Æc hiÖu so víi
tr×nh tù ®Æc hiÖu cßn lín h¬n nhiÒu (5x106). §iÒu nµy gi¶i thÝch cho viÖc t¹i sao tÕ bµo
cïng lóc ph¶i cã nhiÒu ph©n tö protein øc chÕ kh¸c nhau míi ®¶m b¶o ®−îc viÖc c¸c vÞ trÝ
liªn kÕt ADN ®Æc hiÖu lu«n cã xu h−íng ®−îc liªn kÕt bëi c¸c protein ®iÒu hßa ®Æc hiÖu
t−¬ng øng. Nh−ng ng−îc l¹i, phÇn lín c¸c ph©n tö protein ®iÒu hßa l¹i g¾n vµo c¸c tr×nh
tù kh«ng ®Æc hiÖu.
Mèi t−¬ng t¸c protein-ADN kh«ng ®Æc hiÖu nªu trªn kh«ng chØ ®¬n thuÇn lµ kÕt qu¶
®−¬ng nhiªn cña viÖc protein sö dông khung ADN ®Ó g¾n kÕt, mµ ng−êi ta cho r»ng kiÓu
liªn kÕt nµy cã t¸c dông gióp mét lo¹i protein nµo ®ã t×m ra tr×nh tù ®Æc thï cña nã nhanh
h¬n. C¸c protein liªn kÕt kh«ng ®Æc hiÖu (trªn c¬ së c¸c liªn kÕt tÜnh ®iÖn tr¸i dÊu), sÏ
khuÕch t¸n däc theo ph©n tö ADN, chø kh«ng ph¶i theo kiÓu “nh¶y lß cß”, ®Ó t×m ra c¸c
tr×nh tù ®Æc thï cña chóng. Sù khuÕch t¸n nh− vËy cho phÐp c¸c ph©n tö protein nhanh
chãng t×m ra môc tiªu liªn kÕt trªn ph©n tö ADN. Bëi v× b»ng viÖc tr−ît däc theo ph©n tö

27
§inh §oµn Long

ADN, c¸c protein sÏ t×m ®Õn vÞ trÝ liªn kÕt ®Æc hiÖu cña chóng nhanh h¬n khi chóng khuÕch
t¸n tù do trong kh¾p tÕ bµo.

Khe chÝnh Khe chÝnh

 
   
A 

   

 

Khe phô Khe phô


Khe chÝnh Khe chÝnh

     
 

     

Khe phô Khe phô


H×nh 1.10. C¸c nguyªn tö cho vµ nhËn liªn kÕt hydro t¹i c¸c vïng khe chÝnh vµ phô
trªn ph©n tö ADN sîi kÐp.  nguyªn tö nhËn liªn kÕt hydro,  nguyªn tö cho liªn kÕt
hydro,  nguyªn tö hydro kh«ng ph©n cùc,  c¸c gèc methyl (nguån: Watson et al., 2004)

Mét sè protein liªn kÕt ADN kh«ng chØ cã kh¶ n¨ng khuÕch t¸n trªn ph©n tö ADN,
mµ thay vµo ®ã chóng tr−ît däc trªn ph©n tö ADN mét c¸ch chñ ®éng. Nh÷ng protein nµy
chuyÓn ®éng cã h−íng trªn ph©n tö ADN ®Ó thùc hiÖn nh÷ng chøc n¨ng cña chóng trong
qu¸ tr×nh sao chÐp, söa ch÷a vµ t¸i tæ hîp ADN. Do chuyÓn ®éng nµy lµ cã h−íng, nªn c¸c
protein nµy cÇn n¨ng l−îng vµ th−êng ®−îc lÊy tõ ATP.
1.4.3.5. Protein cã nhiÒu c¸ch kh¸c nhau ®Ó nhËn biÕt ARN
Chóng ta biÕt r»ng ARN cã cÊu tróc ®a d¹ng h¬n so víi ADN. C¸c protein liªn kÕt
ARN cã nhiÒu vai trß kh¸c nhau, tõ viÖc gi÷ æn ®Þnh cÊu tróc ARN cho ®Õn viÖc thùc hiÖn
c¸c chøc n¨ng cña enzym. CÊu tróc kh¸c nhau cña c¸c protein khi liªn kÕt vµo c¸c ph©n tö
ARN ®Ých cho thÊy chóng cã nhiÒu c¸ch ®Ó nhËn biÕt tr×nh tù ARN.

28
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

Mét sè protein chØ liªn kÕt ®Æc hiÖu víi ARN cã cÊu tróc d¹ng sîi kÐp. Trong tr−êng
hîp nµy, protein nhËn ra nh÷ng ®Æc ®iÓm ph©n biÖt ARN víi ADN. VÝ dô nh− sù cã mÆt cña
nhãm C2’-OH lµ ®Æc ®iÓm ph©n biÖt râ ARN, hoÆc nh− d¹ng cÊu tróc phæ biÕn cña ARN lµ
d¹ng A (cã c¸c khe chÝnh s©u vµ hÑp h¬n so víi d¹ng B lµ d¹ng phæ biÕn cña ADN sîi kÐp).
Nh−ng kh«ng gièng c¸c protein liªn kÕt ADN, c¸c protein liªn kÕt ARN th−êng kh«ng sö
dông c¸c chuçi xo¾n α ®Ó cµi vµo c¸c khe trªn ARN.
RÊt nhiÒu protein liªn kÕt ARN kh«ng dùa trªn cÊu h×nh kh«ng gian ®Òu ®Æn cña
ph©n tö, trong ®ã bao gåm c¶ c¸c protein liªn kÕt víi mARN trong qu¸ tr×nh phiªn m· vµ
hoµn thiÖn ARN. T−¬ng tù nh− vËy, bé m¸y c¾t intron còng nh− dÞch m· ARN lµ phøc hÖ
cña protein vµ ARN. Motif cña c¸c ribonuclear protein (RNP) nµy lµ mét trong nh÷ng
motif “protein liªn kÕt ARN” phæ biÕn nhÊt. Motif nµy chøa mét ph©n vïng gåm 80 axit
amin víi cÊu tróc gÊp α-β hçn hîp, cã tÝnh ®Æc thï cao víi bÒ mÆt liªn kÕt cña ARN theo
kiÓu “ch×a khãa tra vµo æ khãa”.

1.4.4. Qui t¾c dÞ h×nh cña protein: sù ®iÒu hßa chøc n¨ng protein th«ng qua sù
thay ®æi cÊu h×nh kh«ng gian cña chóng
Sù ®Ýnh kÕt cña c¸c ph©n tö kÝch th−íc lín hoÆc nhá (gäi chung lµ chÊt g¾n ®Æc hiÖu -
ligand) vµo mét ph©n tö protein cã thÓ lµm thay ®æi c¨n b¶n cÊu h×nh kh«ng gian cña ph©n
tö protein ®ã. Nh÷ng thay ®æi vÒ cÊu h×nh cã thÓ g©y nªn nhiÒu hiÖu øng kh¸c nhau, tõ viÖc
lµm t¨ng ¸i lùc cña mét ph©n tö protein nµo ®ã víi chÊt g¾n ®Æc hiÖu thø hai, cho tíi viÖc
cã thÓ “bËt” hay “t¾t” ho¹t tÝnh enzym cña mét ph©n tö protein. C¬ chÕ nµy ®−îc gäi chung
lµ qui t¾c dÞ h×nh vµ lµ mét trong c¸c c¬ chÕ ®iÒu hßa phæ biÕn trong c¸c hÖ thèng sinh
häc. “DÞ h×nh” ë ®©y cã nghÜa lµ “cã c¸c d¹ng cÊu h×nh kh¸c nhau”. C¬ chÕ nµy vÒ c¬ b¶n cã
thÓ tãm t¾t nh− sau: mét ligand (cßn gäi lµ chÊt kÝch øng dÞ h×nh hay phèi thÓ) ®Ýnh
kÕt vµo mét ph©n tö protein vµ lµm thay ®æi cÊu h×nh cña nã (th−êng liªn quan ®Õn c¸c vÞ
trÝ ho¹t ®éng hoÆc c¸c vÞ trÝ liªn kÕt kh¸c cña protein) dÉn ®Õn lµm t¨ng hay gi¶m ho¹t ®é
cña protein. Cã v« sè c¸c vÝ dô vÒ c¸c protein ho¹t ®éng theo qui t¾c dÞ h×nh, bao gåm tõ
c¸c enzym trong c¸c con ®−êng trao ®æi chÊt ®Õn c¸c lo¹i protein tham gia ®iÒu hßa phiªn
m·. Tuy nhiªn, cã ba kiÓu ®iÒu hßa c¬ chÕ dÞ h×nh c¬ b¶n. KiÓu thø nhÊt liªn quan ®Õn
c¸c ligand. Trong ®ã, c¸c chÊt kÝch øng dÞ h×nh phæ biÕn nhÊt lµ c¸c ph©n tö cã kÝch th−íc
nhá (nh− ®−êng hay mét sè axit amin). KiÓu thø hai liªn quan ®Õn sù ®iÒu hßa quy t¾c dÞ
h×nh bëi chÝnh sù ®Ýnh kÕt gi÷a c¸c lo¹i protein kh¸c nhau. Tr−êng hîp thø ba liªn quan
®Õn sù biÕn ®æi ë mét sè tiÓu phÇn axit amin trong c¸c ph©n tö protein (ch¼ng h¹n nh− sù
phosphoryl hãa vµ/hoÆc methyl ho¸). D−íi ®©y lµ mét sè vÝ dô.
1.4.4.1. Qui t¾c dÞ h×nh liªn quan ®Õn ba kiÓu c¬ b¶n: qua t¸c ®éng cña c¸c ligand,
qua t−¬ng t¸c protein-protein vµ qua sù biÕn ®æi cña c¸c protein
Ligand kÝch th−íc nhá - sù ®iÒu hßa chÊt øc chÕ operon Lac (LacI) bëi allolactose:
Gen lacI ë E. coli m· hãa cho chÊt øc chÕ (LacI) cña operon Lac. Thùc tÕ ®©y lµ ph©n tö
protein liªn kÕt ADN ho¹t ®éng theo c¬ chÕ dÞ h×nh ®Çu tiªn ®−îc t×m thÊy. Protein nµy
tham gia ®iÒu hßa ho¹t ®éng cña gen. Khi g¾n vµo ADN, nã ng¨n c¶n sù phiªn m· cña c¸c
gen mµ tÕ bµo cÇn thiÕt ®Ó cã thÓ chuyÓn hãa lactose lµm nguån cacbon khi thiÕu glucose.
Tuy vËy, sau khi lactose cã mÆt trong m«i tr−êng, nã sÏ ®−îc chuyÓn thµnh mét dÉn xuÊt
®Æc biÖt gäi lµ β-1,6-allolactose. ChÊt nµy sÏ kÝch øng sù biÓu hiÖn c¸c gen cÊu tróc cña
operon Lac. ChÊt kÝch øng allolactose ho¹t ®éng qua viÖc ®Ýnh kÕt trùc tiÕp vµo LacI, dÉn ®Õn
sù mÊt æn ®Þnh trong mèi t−¬ng t¸c gi÷a protein LacI víi tr×nh tù ADN ®Æc thï cña nã.
Ph©n tÝch cÊu tróc cho thÊy, LacI ®· bÞ thay ®æi cÊu h×nh kh«ng gian sau khi ®Ýnh kÕt
víi chÊt kÝch øng. LacI lµ mét protein cã kÝch th−íc lín (155 kDa), víi ®Çu N tËn cïng (c¸c
axit amin tõ 1 - 49) cã motif xo¾n-uèn-xo¾n. §©y chÝnh lµ vïng cµi vµo khe chÝnh cña ph©n

29
§inh §oµn Long

tö ADN sîi kÐp. Ngay c¹nh vïng a) b)


chøa motif nµy cã mét cÊu tróc “xo¾n
èc” gäi lµ “vïng xo¾n èc b¶n lÒ” liªn
kÕt víi khe phô cña ph©n tö ADN.
ViÖc so s¸nh cÊu h×nh cña LacI
ë hai tr¹ng th¸i liªn kÕt vµ kh«ng liªn
kÕt víi ADN (trong ®ã, ë tr−êng hîp
thø hai, LacI liªn kÕt víi β-1,6-
allolactose) cho thÊy râ t¹i sao hai
tr¹ng th¸i cÊu h×nh nµy cã tÝnh chÊt
“lo¹i trõ” lÉn nhau (h×nh 1.11). Sù
thay ®æi cÊu h×nh cña LacI sau khi
liªn kÕt víi chÊt kÝch øng ®· lµm gi¶m ChÊt kÝch øng (allolactose)
¸i lùc liªn kÕt cña nã víi vÞ trÝ ®Æc
hiÖu trªn ADN. Mét vÝ dô kh¸c trªn H×nh 1.11. Sù thay ®æi dÞ h×nh cña chÊt øc chÕ LacI.
h×nh 1.12 còng cho thÊy hiÖu qu¶ g©y a) H×nh tr¸i minh häa cÊu tróc kÐp (dimer) cña protein
LacI. Khi protein LacI bÞ g¾n bëi chÊt kÝch øng
ra do chÊt ligand (ë ®©y lµ CTP) ®èi víi
(allolactose), ph©n tö nµy kh«ng liªn kÕt ®−îc vµo tr×nh
sù thay ®æi dÞ h×nh vµ ho¹t tÝnh cña tù chØ huy (operator) cña operon Lac, b) Khi v¾ng mÆt
enzym aspartate transcarbamoylase. chÊt kÝch øng, cÊu tróc ®Çu N cña LacI trë nªn cã ¸i lùc
ChÊt kÝch øng cã b¶n chÊt cao vµ liªn kÕt víi operator (nguån: Lewis, 1996)
protein - sù ho¹t hãa Cdk bëi cyclin:
B©y giê chóng ta h·y xem tr−êng hîp ®iÒu hßa dÞ h×nh cña mét protein khi t−¬ng t¸c víi
mét protein kh¸c. Enzym Cdk2 lµ mét trong c¸c enzym kinase ho¹t ®éng phô thuéc vµo
cyclin (hä enzym nµy ®−îc gäi chung lµ Cdk) tham gia ®iÒu hßa chu tr×nh tÕ bµo. Cdk2
th−êng ë tr¹ng th¸i kh«ng ho¹t ®éng cho ®Õn khi nã ®Ýnh kÕt víi protein ®iÒu hßa lµ cyclin.
Khi cyclin ®Ýnh kÕt vµo Cdk2, nã kÝch øng lµm thay ®æi cÊu h×nh cña protein nµy quanh vÞ
trÝ xóc t¸c vµ gãp phÇn ho¹t hãa enzym nµy. Theo sau ®ã, mét sù biÕn ®æi (phosphoryl hãa)
cña axit amin threonine (Thr) gÇn vÞ trÝ xóc t¸c sÏ ho¹t hãa toµn phÇn enzym nµy.
C¸c ph©n tÝch cÊu tróc cho thÊy: gièng víi mäi enzym kinase kh¸c, Cdk2 cã hai yÕu
tè quan träng, ®ã lµ mét chuçi xo¾n α gäi lµ vßng xo¾n PSTAIRE vµ mét vßng th¾t cã
tÝnh linh ho¹t gäi lµ vßng th¾t T. Hai yÕu tè nµy ®Òu n»m gÇn vÞ trÝ xóc t¸c cña kinase. Khi
cyclin ®Ýnh kÕt víi Cdk2, nã lµm thay ®æi cÊu h×nh vßng xo¾n PSTAIRE vµ vßng th¾t T.
Khi kh«ng cã cyclin, vßng
th¾t T chÆn phÝa tr−íc vÞ trÝ C¸c chuçi
xóc t¸c, cßn vßng xo¾n polypeptide xóc t¸c Chuçi
PSTAIRE bÞ ®Èy ra xa vÞ trÝ polypeptide
nµy (lµm cho axit amin ®iÒu hßa
glycine - Gly -cã vai trß thiÕt a) b)
yÕu ®èi víi ho¹t tÝnh xóc t¸c
cña enzym bÞ ®Èy ra xa khái
vÞ trÝ xóc t¸c). Nh−ng khi
cyclin ®Ýnh kÕt, vßng xo¾n
PSTAIRE vµ glutamate ®−îc
®−a ®Õn gÇn vÞ trÝ xóc t¸c vµ VÞ trÝ g¾n VÞ trÝ ChÊt øc
C¬ chÊt chÊt øc chÕ xóc t¸c chÕ (CTP)
enzym ®−îc ho¹t hãa. §ång
thêi lóc ®ã, vßng th¾t T bÞ H×nh 1.12. Sù thay ®æi dÞ h×nh cña enzym aspartate
®Èy ra xa khái vÞ trÝ xóc t¸c, transcarbamoylase (ATCase) bëi chÊt øc chÕ CTP.
cho phÐp c¬ chÊt dÔ dµng tiÕp a) Enzym ë tr¹ng th¸i ho¹t ®éng, b) Enzym ë tr¹ng th¸i kh«ng ho¹t
xóc vµo vÞ trÝ xóc t¸c, vµ ®éng do sù ®Ýnh kÕt cña chÊt øc chÕ (nguån: Watson et al., 2004)
ph¶n øng x¶y ra dÔ dµng.

30
Ch−¬ng 1. liªn kÕt hãa häc cña c¸c ®¹i ph©n tö sinh häc

Ho¹t hãa protein bëi qu¸ tr×nh phosphoryl hãa - sù ho¹t hãa Cdk bëi CAK: Trªn ®©y,
chóng ta ®· ®Ò cËp ®Õn sù ho¹t hãa mét phÇn enzym Cdk bëi sù ®Ýnh kÕt víi c¸c cylin.
Nh−ng Cdk chØ ®−îc ho¹t hãa toµn phÇn khi cã thªm mét sù thay ®æi cÊu h×nh thø hai, ®ã
lµ qu¸ tr×nh phosphoryl hãa protein. Sù phosphoryl hãa nµy x¶y ra ë threonine n»m trong
vßng th¾t T. Sau khi nhãm phosphate ®−îc g¾n vµo threonine, mét “cÇu” liªn kÕt víi ba
axit amin arginine quanh vÞ trÝ xóc t¸c ®−îc h×nh thµnh. Nhê ®ã, cÊu h×nh kh«ng gian t¹i
vÞ trÝ xóc t¸c trë nªn æn ®Þnh vµ enzym ®¹t ho¹t lùc cao nhÊt.
Sù phosphoryl hãa diÔn ra ®−îc lµ nhê mét enzym kinase kh¸c, gäi lµ CAK (Cdk
activating kinase, tøc lµ kinase ho¹t hãa Cdk). RÊt nhiÒu enzym kinase ®Òu ®−îc ho¹t hãa
bëi c¬ chÕ t−¬ng tù. Nh− vËy, ph¶i cã hai b−íc trong qu¸ tr×nh ho¹t hãa Cdk, ®ã lµ sù liªn
kÕt cña cyclin vµ sù phosphoryl hãa. Quan hÖ cña hai qu¸ tr×nh cã tÝnh t−¬ng hç, bëi v×
viÖc liªn kÕt cña cyclin kh«ng chØ lµm t¨ng ho¹t tÝnh enzym mµ cßn lµm cho vßng th¾t T cã
thÓ tiÕp xóc ®−îc víi CAK ®Ó sù phosphoryl hãa cã thÓ x¶y ra.
1.4.4.2. Kh«ng ph¶i tÊt c¶ protein ®Òu ®−îc ®iÒu hßa chøc n¨ng bëi c¬ chÕ dÞ h×nh
Mét sè protein ®−îc ®iÒu hßa chøc n¨ng kh«ng dùa trªn c¬ chÕ dÞ h×nh. Ch¼ng h¹n,
mét lo¹i protein cã thÓ ®−îc huy ®éng ®Õn mét vÞ trÝ ®Æc thï trong tÕ bµo hoÆc tíi vÞ trÝ cña
c¬ chÊt vµ t−¬ng t¸c víi c¸c ph©n tö kh¸c tr−íc khi chuyÓn sang tr¹ng th¸i ho¹t ®éng. VÝ dô
vÒ sù ®iÒu hßa nµy lµ c¸c enzym phiªn m· ARN polymerase tr−íc qu¸ tr×nh phiªn m·. ViÖc
chän ®iÒu hßa biÓu hiÖn gen nµo vµo mét thêi ®iÓm nhÊt ®Þnh ®−îc thùc hiÖn bëi c¸c protein
®iÒu hßa. Phøc hÖ protein ®iÒu hßa nµy cã mét phÇn bÒ mÆt liªn kÕt víi ADN cßn phÇn bÒ
mÆt kh¸c liªn kÕt víi ARN polymerase. Sù t−¬ng t¸c nµy cña phøc hÖ protein ®iÒu hßa gióp
huy ®éng enzym ®Æc thï tíi vÞ trÝ cña gen (hoÆc c¸c gen) cã vÞ trÝ liªn kÕt phï hîp víi c¸c
protein ®iÒu hßa t−¬ng øng. HiÖn t−îng nµy ®−îc gäi lµ sù liªn hîp gi÷a ADN vµ protein.

31
Ch−¬ng 2

cÊu tróc, ®Æc tÝnh, chøc n¨ng cña C¸C §¹I PH¢N
Tö SINH HäC - adn, arn Vµ PRoTeIN

2.1. C¸c axit nucleic – ADN vµ ARN

2.1.1. Axit nucleic lµ vËt chÊt mang th«ng tin di truyÒn


Ngµy 25 th¸ng 4 n¨m 1953 ®¸nh dÊu mét b−íc ngoÆt trong qu¸ tr×nh ph¸t triÓn
cña lÜnh vùc di truyÒn häc hiÖn ®¹i khi James Watson (nhµ Sinh häc ng−êi Mü) vµ
Francis Crick (nhµ VËt lý ng−êi Anh) lµ ®ång t¸c gi¶ c«ng bè bµi b¸o “M« h×nh cÊu tróc
ph©n tö cña axit nucleic: mét cÊu tróc cña axit deoxyribose nucleic” trªn t¹p chÝ
“Nature”. ë ®o¹n kÕt cña bµi b¸o, c¸c t¸c gi¶ viÕt: “§iÒu ¸m ¶nh chóng t«i lµ nguyªn t¾c
kÕt cÆp bæ sung cña c¸c baz¬ nit¬ cã thÓ chØ ra mét c¬ chÕ sao chÐp vËt chÊt di truyÒn”.
C«ng bè cña Watson vµ Crick ®−îc coi lµ mèc ®¸nh dÊu b−íc ngoÆt ph¸t triÓn cña
lÜnh vùc di truyÒn häc ph©n tö, lÜnh vùc chuyªn nghiªn cøu vÒ cÊu tróc, chøc n¨ng vµ c¬
chÕ vËn ®éng cña vËt chÊt di truyÒn ë møc ®é ph©n tö vµ d−íi tÕ bµo. Tuy vËy, trong thùc
tÕ tr−íc khi Watson vµ Crick c«ng bè vÒ m« h×nh ADN ®· cã mét sè nghiªn cøu ®−îc tiÕn
hµnh nh»m t×m hiÓu vÒ cÊu tróc vµ chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc nµy.
Nghiªn cøu ®Çu tiªn ph¶i kÓ ®Õn lµ c«ng tr×nh cña Friedrich Miescher. N¨m 1871,
Miescher lµ ng−êi ®Çu tiªn ph¸t hiÖn ra axit nucleic tõ nh©n cña tinh trïng c¸ håi (lóc ®ã
«ng gäi lµ nuclein) vµ nhËn ®Þnh vÒ kh¶ n¨ng cã vai trß di truyÒn cña axit nucleic. C«ng
tr×nh nghiªn cøu cña Friedriech Mischer ®−îc c«ng bè hÇu nh− cïng thêi víi c¸c nghiªn
cøu cña Gregor Mendel (1866) - ng−êi ®· ph¸t hiÖn ra c¸c quy luËt vËn ®éng cña c¸c
“nh©n tè di truyÒn”, mµ sau nµy chóng ta gäi ®ã lµ c¸c “gen”, th«ng qua c¸c thÝ nghiÖm lai
t¹o ë c©y ®Ëu Hµ Lan. Mét ®iÒu thó vÞ lµ hai nhµ khoa häc nµy lóc c«ng bè c¸c c«ng tr×nh
nghiªn cøu cña m×nh ®· kh«ng hÒ biÕt vÒ nghiªn cøu vµ ph¸t hiÖn cña ng−êi kia.
Trong thùc tÕ, c¸c ph¸t hiÖn cña Gregor Mendel vµ Friedrich Miescher sau nµy ®·
më ra mét thêi kú ph¸t triÓn míi cña Di truyÒn häc, khi mµ c¸c nghiªn cøu sau ®ã ®· cã
nh÷ng c¬ së c¨n b¶n ®Ó t×m hiÓu s©u h¬n vÒ cÊu tróc, chøc n¨ng vµ c¬ chÕ vËn ®éng cña
vËt chÊt di truyÒn. V× lý do ®ã, nh÷ng n¨m cuèi thÕ kû XVIII ®−îc coi lµ giai ®o¹n khai
sinh cña Di truyÒn häc hiÖn ®¹i. Tõ giai ®o¹n nµy, cã thÓ nãi phÇn lín c¸c nghiªn cøu
thuéc Di truyÒn häc cã xu h−íng tËp trung vµo hai h−íng chÝnh. NÕu nh− c¸c c«ng tr×nh
cña Mendel khëi ®Çu cho sù ra ®êi vµ ph¸t triÓn cña lÜnh vùc Di truyÒn häc truyÒn thèng
(conventional genetics), trong ®ã c¬ chÕ vËn ®éng cña vËt chÊt di truyÒn ®−îc t×m hiÓu
th«ng qua c¸c ph−¬ng ph¸p lai t¹o kÕt hîp víi thèng kª to¸n häc; th× nghiªn cøu cña
Friedrich Miescher ®−îc coi lµ sù khëi ®Çu cña lÜnh vùc Di truyÒn häc ph©n tö (molecular
genetics), mµ theo ®ã c¸c nhµ nghiªn cøu ngµy cµng ®i s©u t×m hiÓu vÒ vËt chÊt di truyÒn
d−íi gãc ®é cÊu tróc vµ chøc n¨ng. Hai h−íng nghiªn cøu nµy sau ®ã tån t¹i song song
cïng ph¸t triÓn, hç trî bæ sung cho nhau ®Ó h×nh thµnh nªn hai h−íng nghiªn cøu c¬ b¶n
cña Di truyÒn häc hiÖn ®¹i.

32
Ch−¬ng 2. CÊu tróc, ®Æc tÝnh, chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc – ADN, ARN vµ protein

Theo h−íng nghiªn cøu di truyÒn ph©n tö, ®Õn ®Çu thÕ kû XIX, Kossel lµ ng−êi x¸c
®Þnh ®−îc thµnh phÇn cÊu t¹o cña c¸c axit nucleic bao gåm c¸c baz¬ nit¬ (adenine,
guanine, cytosine vµ thymine hoÆc uracil), mét tiÓu ph©n tö ®−êng vµ nhãm phosphate.
§Õn n¨m 1930, Levene cïng céng sù ph¸t hiÖn ra c¸c ph©n tö ®−êng cã trong thµnh phÇn
nuclein lµ deoxyribose. §ång thêi, nhãm t¸c gi¶ nµy còng chøng minh ®−îc r»ng trong tÕ
bµo cã c¶ hai d¹ng cña axit nucleic: axit ribonucleic (viÕt t¾t lµ ARN) vµ axit
deoxyribonucleic (ADN). Nh− vËy, nh÷ng n¨m 1930 cã thÓ ®−îc xem lµ thêi kú tËp trung
cho c¸c nghiªn cøu vÒ thµnh phÇn cña c¸c axit nucleic. Tõ ®ã ®Õn nay, cÊu tróc vµ chøc
n¨ng cña c¸c axit nucleic ngµy cµng ®−îc hiÓu biÕt s©u h¬n víi vai trß lµ vËt chÊt mang
th«ng tin di truyÒn.
Tr−íc khi t×m hiÓu vÒ cÊu tróc cña c¸c axit nucleic vµ b»ng c¸ch nµo c¸c hîp chÊt
nµy cã thÓ l−u tr÷ vµ truyÒn t¶i th«ng tin di truyÒn, chóng ta h·y xem xÐt mét sè b»ng
chøng chøng minh axit nucleic (ADN vµ ARN) chÝnh lµ vËt chÊt mang th«ng tin di
truyÒn.

2.1.2. B»ng chøng vÒ vai trß mang th«ng tin di truyÒn cña axit nucleic
Cã rÊt nhiÒu b»ng chøng chøng tá axit nucleic lµ vËt chÊt mang th«ng tin di
truyÒn. Tuy vËy, ë ®©y chóng ta chØ nªu 3 dÉn chøng ®iÓn h×nh:
1) Axit nucleic hÊp thô tia tö ngo¹i cùc ®¹i ë b−íc sãng 260 nm. B−íc sãng nµy
còng lµ b−íc sãng mµ tia tö ngo¹i g©y tÇn sè ®ét biÕn cao nhÊt ë c¸c tÕ bµo.
Trong khi ®ã, ®é hÊp thô cùc ®¹i cña protein lµ ë b−íc sãng 280 nm.
2) N¨m 1928, mét y sü qu©n y ng−êi Anh lµ Frederick Griffith khi nghiªn cøu ë vi
khuÈn Streptococcus pneumoniae ph¸t hiÖn thÊy cã 2 chñng kh¸c nhau: chñng S
cã khuÈn l¹c nh½n (S = smooth) lµm chÕt chuét khi ®em tiªm vµo chuét. Trong
khi ®ã chñng R khuÈn l¹c nh¨n (R = rough) l¹i kh«ng g©y chÕt chuét. ¤ng tiÕn
hµnh lµm thÝ nghiÖm nh− sau:
a) Khi tiªm vi khuÈn chñng R vµo chuét thÊy chuét kh«ng chÕt. Khi tiªm vi
khuÈn chñng S vµo chuét thÊy chuét chÕt. Khi tiªm vi khuÈn chñng S ®· bÞ
bÊt ho¹t bëi nhiÖt thÊy chuét kh«ng chÕt. §iÒu nµy chøng tá chñng S g©y chÕt,
cßn chñng R kh«ng g©y chÕt, ®ång thêi chñng S bÞ bÊt ho¹t bëi nhiÖt còng
kh«ng g©y chÕt.
b) Tuy vËy, khi tiªm hçn hîp c¸c vi khuÈn chñng R cßn sèng víi c¸c vi khuÈn
chñng S ®· bÞ bÊt ho¹t bëi nhiÖt vµo chuét th× chuét chÕt vµ tõ chóng Griffith
ph©n lËp ®−îc chñng vi khuÈn S sèng. Râ rµng, ®· cã mét t¸c nh©n nµo ®ã ®−îc
truyÒn tõ vi khuÈn S bÞ bÊt ho¹t vµo vi khuÈn R ®Ó h×nh thµnh nªn vi khuÈn S
cã t¸c dông g©y chÕt. Qu¸ tr×nh nµy sau ®ã ®−îc gäi lµ qu¸ tr×nh biÕn n¹p.
Sau thÝ nghiÖm cña Griffith vµi n¨m, Alloway chøng minh ®−îc r»ng dÞch chiÕt
th« cña chñng vi khuÈn S ®· lo¹i bá thµnh tÕ bµo (nhê ph−¬ng ph¸p läc) cã thÓ
th©m nhËp vµo trong tÕ bµo chñng R. §Õn n¨m 1944, Avery, MacLeod vµ
McCartey ®· chøng minh ®−îc nh©n tè biÕn n¹p trong thÝ nghiÖm cña Griffith
chÝnh lµ ADN.
3) N¨m 1957, Corat vµ Singer ®· c«ng bè thÝ nghiÖm “l¾p r¸p” virut ®èm thuèc l¸ lµ
virut kh«ng chøa ADN, mµ chØ cã ARN vµ vá protein. Chóng cã hai d¹ng A vµ B.
C¸c t¸c gi¶ ®· l¾p r¸p ®−îc lâi cña d¹ng nµy víi vá cña d¹ng kia. Sau ®ã lÇn l−ît
®em nhiÔm tõng lo¹i vµo thuèc l¸ ®Ó g©y ®èm. KÕt qu¶ cho thÊy tÊt c¶ thÕ hÖ
virut con ph©n lËp ®−îc tõ c¸c c©y bÞ l©y bÖnh ®Òu ë cïng mét d¹ng vµ lµ d¹ng
cña lâi ARN ®em nhiÔm chø kh«ng ph¶i d¹ng cña vá protein. Nh− vËy, râ rµng
th«ng tin di truyÒn chøa trong ARN chø kh«ng ph¶i trong vá protein.
§Õn nay, chóng ta ®· biÕt râ vËt chÊt di truyÒn cña phÇn lín c¸c loµi sinh vËt lµ
ADN, vµ ë mét sè virut lµ ARN.

33
§inh §oµn Long

2.1.3. Thµnh phÇn cÊu t¹o cña c¸c axit nucleic


C¶ ADN vµ ARN ®Òu lµ c¸c chÊt trïng ph©n (polymer) m¹ch dµi gåm nhiÒu ®¬n
ph©n (monomer) nèi víi nhau. Trong ®ã, mçi ®¬n ph©n cña ADN lµ deoxyribonucleotide,
cßn cña ARN lµ ribonucleotide.
Mçi mét nucleotide gåm ba thµnh phÇn c¬ b¶n: 1) baz¬ nit¬: lµ c¸c dÉn xuÊt hoÆc
cña purine, gåm adenine (A) vµ guanine (G); hoÆc cña pyrimidine, gåm thymine (T),
cytosine (C), vµ uracil (U); 2) ®−êng pentose; vµ 3) nhãm phosphate (h×nh 2.1). VÞ trÝ
c¸c nguyªn tö cacbon (C) trªn m¹ch vßng cña ®−êng pentose ®−îc ®¸nh sè tõ C-1’ ®Õn C-
5’. C¸c nucleotide mang nhãm phosphate ë vÞ trÝ C-5’ cã vai trß quan träng ®èi víi cÊu
tróc vµ chøc n¨ng cña ADN vµ ARN. Sù cã mÆt cña nhãm phosphate ë vÞ trÝ nµy lµm c¸c
ph©n tö ADN vµ ARN th−êng mang ®iÖn tÝch ©m vµ cã tÝnh axit. Trong ®iÒu kiÖn in vivo,
nÕu c¸c ®iÖn tÝch cña axit nucleic kh«ng ®−îc trung hßa th× nã kh«ng thÓ ®ãng gãi vµo
nhiÔm s¾c thÓ vµ nh©n tÕ bµo ®−îc. Sù trung hßa ®iÖn tÝch diÔn ra nhê sù cã mÆt cña c¸c
protein cã tÝnh kiÒm (cßn gäi lµ tÝnh kiÒm) xuÊt hiÖn trong tÕ bµo ë c¶ c¸c sinh vËt
prokaryote (nh©n s¬) vµ eukaryote (nh©n thËt). ë eukaryote, ®ã lµ c¸c ph©n tö protein
histon mang tÝnh kiÒm, cßn ë prokaryote lµ c¸c polyamin.

OH OH o nh2 o

’CH2 OH ’CH2 OH c ch 3 c c
O O hn  c n ch hn ch
’C 
H H C’’C H H C’
C C C C c   ch c ch c ch
H ’ ’ H H ’ ’ H o n o n o n
OH OH OH H h h h
a) Ribose b) Deoxyribose Thymine (T) Cytosine (C) Uracil (U)
O
Baz¬ nit¬ cña ADN
+
H -O P O-H + Baz¬ nit¬ cña ARN
nh 2 o
O
c n c n
n  c hn c
’CH2 OH   ch
ch
O
hc  c  c c
’C H H C’ 
n n n
h h 2n n
C C
H H
’
OH
’H Adenine (A) Guanine (G)
c) Deoxyribose monophosphate Baz¬ nit¬ cña ADN vµ ARN
H×nh 2.1. §−êng ribose cña c¸c H×nh 2.2. CÊu tróc baz¬ nit¬ cña c¸c nucleotide.
nucleotide. a) §−êng ribose cã nhãm –OH DÉn xuÊt cña pyrimidine gåm thymine (T), cytosine
liªn kÕt ë vÞ trÝ C-2’, b) §−êng deoxyribose (C) vµ uracil (U); dÉn xuÊt cña purine gåm adenine
cã gèc –H liªn kÕt ë vÞ trÝ C-2’, c) ®−êng (A) vµ guanine (G). ADN ®−îc cÊu t¹o tõ dA, dT, dG
deoxyribose liªn kÕt víi nhãm phosphate. vµ dC, trong khi ARN ®−îc cÊu t¹o tõ A, U, G vµ C.

Nh− ®· nãi ë trªn, c¸c ®¬n ph©n h×nh thµnh nªn ADN lµ c¸c deoxyribonucleotide. Cã
bèn lo¹i deoxyribonucleotide trong thµnh phÇn cÊu t¹o ADN. Chóng kh¸c nhau vÒ lo¹i
baz¬ nit¬, cßn gièng nhau vÒ cÊu tróc ®−êng pentose vµ nhãm phosphate (h×nh 2.2). Bèn
lo¹i baz¬ nit¬ ®ã lµ adenine (A), guanine (G), thymine (T) vµ cytosine (C). Trong thùc
tÕ, tªn cña c¸c baz¬ nit¬ còng ®−îc dïng ®Ó gäi lo¹i deoxyribonucleotide t−¬ng øng.

34
Ch−¬ng 2. CÊu tróc, ®Æc tÝnh, chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc – ADN, ARN vµ protein

Gièng nh− ADN, B¶ng 2.1. Tªn gäi c¸c nucleotide lµ thµnh phÇn cña ADN vµ ARN
ARN còng mang c¸c baz¬
nit¬ lµ adenine, guanine Baz¬ nit¬ Nucleoside Nucleotide
vµ cytosine, nh−ng thay Adenine (A) Adenosine Deoxyadenosine 5’- monophosphate
thymine b»ng uracil (U) Guanine (G) Guanosine Deoxyguanosine 5’- monophosphate
còng lµ mét baz¬ nit¬ cã Thymine (T) Thymidine Deoxythymidine 5’- monophosphate
a

tÝnh chÊt ho¸ häc t−¬ng tù Cytosine (C) Cytidine Deoxycytidine 5’- monophosphate
nh− thymine. Ngoµi c¸c b
Uracil (U) Uridine Uridine 5’- monophosphate
baz¬ nit¬ phæ biÕn trªn, a
ARN cßn chøa nhiÒu d¹ng Cã ë ADN, nh−ng kh«ng cã ë ARN
b
dÉn xuÊt kh¸c cña baz¬ Cã ë ARN, nh−ng kh«ng cã ë ADN
nit¬ nh− thymine,
4-thiouracil, 7-methylguanine, 6,6-dimethyladenine vµ hypoxanthin. C¸c baz¬ nit¬ hiÕm
nµy th−êng gÆp ë ARN vËn chuyÓn (tARN) vµ ARN th«ng tin (mARN). ë ADN, trõ mét
sè d¹ng methyl hãa cña cytosine (5-methylcytosine, 5-mC) vµ adenine (N6-
methyladenine, m6A), kh«ng thÊy cã c¸c baz¬ nit¬ nµo kh¸c ngoµi 4 lo¹i A, T, G vµ C.
Mçi lo¹i baz¬ nit¬ ®Òu cã hai d¹ng hç biÕn. Trong dung dÞch, chóng th−êng tån t¹i ë
tr¹ng th¸i c©n b»ng. Sù c©n b»ng −u tiªn cho d¹ng bÒn v÷ng h¬n. Cô thÓ lµ, nguyªn tö
nit¬ g¾n vµo c¸c vßng purine (cña A) vµ pyrimidine (cña C) ë d¹ng amino lµ bÒn v÷ng h¬n
ë d¹ng imino. T−¬ng tù nh− vËy, nguyªn tö oxy g¾n vµo G, T vµ U th−êng ë d¹ng keto,
hiÕm khi ë d¹ng enol. ë ch−¬ng 6, chóng ta sÏ thÊy sù hç biÕn cña c¸c nucleotide lµ mét
trong nh÷ng c¬ chÕ g©y ®ét biÕn trong sao chÐp (t¸i b¶n) ADN.
C¸c baz¬ nit¬ g¾n víi ®−êng pentose b»ng liªn kÕt céng hãa trÞ ë vÞ trÝ C-1’
cña ®−êng víi nit¬ ë vÞ trÝ sè 9 cña purine hoÆc nit¬ ë vÞ trÝ sè 1 cña pyrimidine. CÊu tróc
chØ gåm baz¬ nit¬ víi ®−êng pentose ®−îc gäi lµ nucleoside. C¸c nucleoside cña A, G, T vµ
C ®−îc gäi t−¬ng øng lµ adenosine, guanosine, thymidine vµ uridine (b¶ng 2.1).
Mét kh¸c biÖt n÷a gi÷a ADN vµ ARN lµ thµnh phÇn ®−êng pentose. NÕu nh−
®−êng pentose trong ph©n tö ADN lµ 2-deoxy-D-ribose, th× ®−êng pentose trong ph©n tö
ARN lµ ribose. ChÝnh v× sù kh¸c biÖt nµy mµ hai ph©n tö ADN vµ ARN cã c¸c tÝnh chÊt
ho¸ häc kh¸c nhau vµ biÓu hiÖn NH 2

chøc n¨ng sinh häc kh¸c nhau. C


Thµnh phÇn ®−êng lµm 4 lo¹i HC N
Cytosine (C)
nucleotide triphosphate cÊu t¹o HC C
nªn ADN (viÕt t¾t lµ dATP, TTP, O - N O O

dGTP vµ dCTP) lµ kh¸c biÖt víi H C C


O P O CH 3
4 lo¹i nucleotide cÊu t¹o nªn 2
O C NH
C H H C
ARN (viÕt t¾t lµ ATP, GTP, UTP O -
C C HC C
vµ CTP). V× tÝnh chÊt ho¸ häc H
O H
H
N O
NH
cña hai lo¹i ®¹i ph©n tö sinh häc Thymine (T)
2

nµy kh¸c nhau, ng−êi ta cã thÓ O P O CH 2


O N
C
C
N
dïng c¸c enzym ®Æc hiÖu (DNase O - C H H C
HC
C C
vµ RNase) ®Ó ph©n t¸ch hai lo¹i H H
N
C CH
O H N
nhãm hîp chÊt nµy trong phßng Liªn kÕt Adenine (A)
thÝ nghiÖm. phosphodieste O P O CH 2
O

Trong ph©n tö ADN vµ O - C H H C


C C
ARN, c¸c nucleotide n»m liÒn kÒ H
O H
H

trªn chuçi polynucleotide nèi víi


nhau thµnh mét m¹ch dµi qua O P O -

H×nh 2.3. Liªn kÕt phosphodieste


liªn kÕt phosphodieste (h×nh gi÷a c¸c nucleotide trong chuçi O -

2.3) gi÷a nhãm hydroxyl ë ®Çu polynucleotide cña ADN.

35
§inh §oµn Long

C-5’ cña ®−êng pentose cña nucleotide nµy víi nhãm phosphate t¹i ®Çu C-3’ cña
nucleotide n»m ë vÞ trÝ kÕ tiÕp. Cø nh− vËy, c¸c liªn kiÕt phosphodieste h×nh thµnh gi÷a
c¸c nucleotide trªn cïng mét chuçi t¹o nªn bé khung “®−êng - phosphate” bao ngoµi
ph©n tö ADN. C¸c baz¬ nit¬ cã tÝnh kÞ n−íc liªn kÕt bæ sung víi nhau n»m phÝa trong bé
khung nµy. Víi cÊu tróc nh− vËy, mçi m¹ch polynucleotide cña ph©n tö axit nucleic
mang tÝnh ph©n cùc: mét ®Çu C-5’ mang nhãm phosphate (hoÆc ®«i khi lµ hydroxyl) cßn
®Çu kia (C-3’) lu«n mang nhãm hydroxyl.

2.1.4. CÊu tróc vµ ®Æc tÝnh hãa lý cña axit nucleic


2.1.4.1. Thµnh phÇn vµ cÊu tróc cña ADN
Trong ph©n tö ADN sîi kÐp (gäi nh− vËy v× mçi ph©n tö gåm hai m¹ch ®¬n
polynucleotide), hai m¹ch polynucleotide liªn kÕt víi nhau qua liªn kÕt hydro gi÷a c¸c
nucleotide ®èi diÖn trªn hai m¹ch. Liªn kÕt hydro trong ADN h×nh thµnh gi÷a hai m¹ch
th−êng lµ A = T vµ G ≡ C. Trong ®ã, sè g¹ch nèi gi÷a c¸c nucleotide (A, T, G vµ C) ph¶n
¸nh sè liªn kÕt hydro gi÷a chóng; theo ®ã, gi÷a A vµ T cã hai liªn kÕt hydro, cßn gi÷a G
vµ C cã ba liªn kÕt hydro. Nguyªn t¾c liªn kÕt nµy cßn gäi lµ nguyªn t¾c bæ sung, hay
nguyªn t¾c Chargaff (do Erwin Chargaff ph¸t hiÖn ®Çu tiªn n¨m 1950). Khi thñy ph©n
ADN, Chargaff ®· lu«n nhËn ®−îc hµm l−îng purine b»ng hµm l−îng pyrimidine; nãi
c¸ch kh¸c, lu«n tån t¹i c«ng thøc A + G = T + C, trong khi ®ã l−îng A + T th−êng kh¸c
l−îng G + C. Quy luËt nµy ®−îc t×m thÊy ë mäi sinh vËt (b¶ng 2.2), chØ trõ c¸c virut cã
hÖ gen kh«ng ph¶i ADN sîi kÐp.
§Ó cã cÊu tróc hai m¹ch polynucleotide liªn kÕt bæ sung víi nhau suèt däc chiÒu dµi
ph©n tö cña ADN, c¸c nucleotide cña mét m¹ch ph¶i quay 180o so víi c¸c nucleotide cña
m¹ch ®èi diÖn khi B¶ng 2.2. Thµnh phÇn nucleotide theo tû lÖ (%) trong ADN ë mét sè loµi
qu¸ tr×nh tæng Loµi Adenine Guanine Cytosine Thymine
hîp ADN diÔn ra. Virót
§Æc ®iÓm quay Thùc khuÈn thÓ T2 32,6 18,1 16,6 32,6
cña c¸c nucleotide Herpes simplex 18,8 37,7 35,6 12,8
nh− vËy lµ cÇn Phag¬ λ 26,0 23,8 24,3 25,8
thiÕt ®Ó c¸c liªn Pseudorables 13,2 37,0 36,3 13,5
kÕt hydro cã thÓ Vi khuÈn
h×nh thµnh. NÕu Escherichia coli 26,0 24,9 25,2 23,9
kh«ng, c¸c nguyªn Diplococcus pneumoniae 29,8 20,5 18,0 31,6
tö cho vµ nhËn Micrococcus hysodeikticus 14,4 37,3 34,6 13,7
liªn kÕt hydro sÏ Ramibacterium ramosum 35,1 14,9 15,2 34,8
quay vÒ c¸c gãc NÊm men
kh¸c nhau vµ liªn Neurospora crassa 23,0 27,1 26,6 23,3
kÕt kh«ng ®−îc Aspergillus niger 25,0 25,1 25,0 24,9
h×nh thµnh (xem Saccharomyces cerevisiae 31,7 18,3 17,4 32,6
thªm ®Æc ®iÓm Sinh vËt nh©n chuÈn
liªn kÕt hãa häc ë Arachis hypogaea (®Ëu) 32,1 17,6 18,0 32,2
ch−¬ng 1). V× lý Bombyx mori (t»m) 30,7 18,9 19,4 31,1
do nµy, cÊu tróc Drosophila melanogaster 30,7 19,6 20,2 29,4
ADN sîi kÐp lu«n Homo sapiens (ng−êi)
gåm mét m¹ch TÕ bµo gan 30,3 19,5 19,9 30,3
ch¹y theo chiÒu 5’ Tinh trïng 29,8 20,2 18,2 31,8
→ 3’, cßn m¹ch TuyÕn gi¸p 30,5 19,9 20,6 28,9
Nicotinana tabacum 29,3 23,5 16,5 30,7
kia ch¹y theo
Rana pipiens (Õch) 26,3 23,5 23,8 26,4
chiÒu ng−îc l¹i lµ
Zea mays (ng«) 25,6 24,5 24,6 25,3
3’ → 5’. CÊu tróc

36
Ch−¬ng 2. CÊu tróc, ®Æc tÝnh, chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc – ADN, ARN vµ protein

ADN sîi kÐp nh− vËy gäi lµ cÊu tróc song song ng−îc chiÒu (hay ®èi song song).
Trong qu¸ tr×nh sao chÐp (t¸i b¶n) ADN, mçi m¹ch cña chuçi xo¾n kÐp ®−îc dïng lµm
khu«n ®Ó tæng hîp nªn mét chuçi ADN xo¾n kÐp míi. C¸c nucleotide cña m¹ch lµm
khu«n sÏ “thu hót” c¸c nucleotide tù do trong m«i tr−êng theo nguyªn t¾c Chargaff. B»ng
c¸ch nµy, hai m¹ch cña hai ph©n tö ADN míi ®−îc tæng hîp sÏ lu«n cã mét m¹ch xuÊt ph¸t
tõ ph©n tö ADN gèc, cßn m¹ch kia ®−îc tæng hîp míi. Qu¸ tr×nh tæng hîp ADN sîi kÐp
nh− vËy gäi lµ c¬ chÕ sao chÐp b¸n b¶o toµn.
Ngoµi c¸c liªn kÕt phosphodieste vµ liªn kÕt hydro gi÷a c¸c nucleotide, th× viÖc c¸c
chuçi polynucleotide cã c¸c møc cÊu tróc cao h¬n, nh− viÖc c¸c baz¬ nit¬ (cã cÊu h×nh
ph¼ng) xÕp thµnh nhiÒu líp chång lªn nhau lµm cho ph©n tö ADN cã tÝnh bÒn v÷ng.
Trong m« h×nh cña Watson vµ Crick (còng lµ m« h×nh cÊu tróc ADN ë tr¹ng th¸i
ho¹t ®éng phæ biÕn h¬n c¶), hai m¹ch ®¬n cña ph©n tö ADN sîi kÐp xo¾n xung quanh
nhau vÒ phÝa ph¶i. CÊu tróc xo¾n ®Òu ®Æn nh− vËy t¹o ra hai lo¹i khe (h×nh 2.4) trong
mçi vßng xo¾n gäi lµ khe chÝnh (major groove) vµ khe phô (minor groove). Do sù cuén
xo¾n cña chuçi ADN sîi kÐp, khe chÝnh réng h¬n so víi khe phô. C¸c nghiªn cøu sau nµy
trªn c¸c ®èi t−îng sinh vËt kh¸c nhau cho thÊy c¸c protein ®iÒu hoµ ho¹t ®éng cña gen
th−êng cã xu h−íng liªn kÕt víi tr×nh tù ADN mµ nã ®iÒu khiÓn t¹i vÞ trÝ c¸c khe chÝnh
nhê nh÷ng tr×nh tù axit amin ®Æc biÖt cã kh¶ n¨ng h×nh thµnh c¸c liªn kÕt hydro víi c¸c
baz¬ nit¬ trªn ph©n tö ADN t¹i khe chÝnh. Mèi t−¬ng t¸c nµy ®−îc t×m thÊy t−¬ng ®èi
phæ biÕn ë c¶ sinh vËt nh©n s¬ vµ nh©n thËt (xem thªm ch−¬ng 5). Trong khi ®ã, c¸c khe
phô cã xu h−íng lµ vÞ trÝ g¾n cña c¸c protein cÊu tróc th−êng tham gia vµo qu¸ tr×nh ®ãng
gãi c¸c ph©n tö ADN ë sinh vËt nh©n thËt (xem thªm ch−¬ng 7). Nh÷ng protein nµy, ch¼ng
h¹n nh− histon, chøa mét l−îng lín c¸c axit amin mang tÝnh kiÒm (tÝch ®iÖn d−¬ng) nh−
Arg vµ Lys, chóng cã khuynh h−íng t−¬ng t¸c víi nhãm phosphate mang ®iÖn ©m trªn
ph©n tö ADN. VÞ trÝ cña c¸c cÆp baz¬ nit¬ trong ph©n tö ADN kh«ng n»m däc trôc ®−êng –
phosphate gióp gi¶i thÝch cho ®Æc tÝnh hÊp thô ¸nh s¸ng cùc ®¹i cña ph©n tö ADN ë b−íc
sãng 260 nm (chÝnh 20 Å
x¸c h¬n lµ 257 nm). 5’ 3’
Tïy thuéc vµo
mét sè yÕu tè m«i
tr−êng xung quanh,
nh− ®é pH, tr¹ng
th¸i methyl hãa cña
Khe chÝnh
c¸c nucleotide, ®é
Èm, hµm l−îng muèi, C¸c cÆp
baz¬ nit¬
tÝnh −a n−íc, lùc ion xÕp chång
ho¸, sù cã mÆt cña Khe chÝnh lªn nhau
c¸c protein liªn kÕt
ADN… mµ ph©n tö
ADN sîi kÐp cã thÓ 34 Å Khe phô
xuÊt hiÖn ë mét sè
d¹ng cÊu h×nh kh«ng 3,4 Å
gian kh¸c nhau.
Trong ®ã, d¹ng cÊu Khe phô
h×nh phæ biÕn nhÊt
lµ d¹ng B (viÕt t¾t lµ
B-ADN), ®©y chÝnh
lµ m« h×nh ®−îc
Watson vµ Crick m« 3’
5’
t¶. Trong tÕ bµo
sèng, phÇn lín ph©n H×nh 2.4. M« h×nh chuçi xo¾n kÐp ADN d¹ng B cña Watson vµ Crick (1953)

37
§inh §oµn Long

tö ADN sîi kÐp ë d¹ng cÊu h×nh nµy, nh−ng khi ®é Èm gi¶m ®i (∼75%) th× cã thÓ cã sù
h×nh thµnh cña cÊu h×nh d¹ng A (A-ADN); hoÆc nÕu trong m«i tr−êng cã hµm l−îng muèi
cao hoÆc cã hiÖn t−îng methyl hãa cytosine, ph©n tö ADN cã thÓ cã cÊu h×nh hiÕm gÆp
h¬n lµ d¹ng Z (Z-ADN cßn gäi lµ zigzag ADN; hay d¹ng S-ADN). §Æc ®iÓm cña mét sè
d¹ng cÊu h×nh kh«ng gian cña ADN ®−îc m« t¶ trªn trªn h×nh 2.5 vµ b¶ng 2.3.

A - ADN B - ADN C - ADN D - ADN Z - ADN

H×nh 2.5. Mét sè d¹ng cÊu h×nh kh«ng gian cña ADN

B¶ng 2.3. §Æc tÝnh cÊu h×nh kh«ng gian c¸c d¹ng A, B vµ Z cña ADN
D¹ng ADN
§Æc tÝnh
A B Z
ChiÒu quay cña chuçi xo¾n VÒ phÝa ph¶i VÒ phÝa ph¶i VÒ phÝa tr¸i
Nång ®é muèi cao,
§iÒu kiÖn h×nh thµnh §é Èm ~ 75% §é Èm ~ 92% hoÆc methyl hãa
cytosine
§−êng kÝnh (Å) 26 Å 20 Å 18 Å
Sè cÆp baz¬ nit¬ trªn mét vßng xo¾n 11 10 12
O O
Gãc nghiªng gi÷a hai cÆp baz¬ nit¬ kÕ tiÕp 33 36 60O
§é cao theo trôc chuçi xo¾n cña mét cÆp baz¬ nit¬ (Å) 2,6 Å 3,4 Å 3,7 Å
§é cao theo trôc chuçi xo¾n cña mét vßng xo¾n (Å) 28 Å 34 Å 45 Å
§Æc ®iÓm khe chÝnh HÑp vµ s©u Réng vµ s©u Ph¼ng
§Æc ®iÓm khe phô Réng vµ n«ng HÑp vµ s©u HÑp vµ s©u

M« h×nh ADN cña Watson vµ Crick lµ chuçi xo¾n kÐp quay ph¶i gäi lµ d¹ng B. M«
h×nh nµy cã mét sè ®Æc ®iÓm c¬ b¶n nh− sau: mçi vßng xo¾n gåm m−êi baz¬ nit¬ cã chiÒu
dµi xÊp xØ 3,4 nm (kho¶ng c¸ch gi÷a hai baz¬ nit¬ kÕ tiÕp lµ xÊp xØ 0,34 nm). Ngoµi c¸c
d¹ng cÊu h×nh A, B, Z, ®Õn nay cßn cã 18 d¹ng cÊu h×nh kh¸c cña ADN ®−îc m« t¶ (chØ
cßn c¸c ch÷ c¸i F, Q, U, V vµ Y trong b¶ng ch÷ c¸i ch−a ®−îc dïng ®Ó m« t¶ c¸c d¹ng cÊu
h×nh ADN).
Trong qu¸ tr×nh tiÕn hãa, d−êng nh− cã mét xu h−íng lµ c¬ thÓ mét loµi cµng cã cÊu
t¹o phøc t¹p th× l−îng th«ng tin di truyÒn cµng lín vµ v× vËy l−îng ADN cã trong mçi tÕ
bµo cña nã cµng lín (b¶ng 2.4). Theo xu h−íng nµy, l−îng ADN cã trong tÕ bµo ng−êi lín
gÊp kho¶ng 800 lÇn so víi l−îng ADN cã trong vi khuÈn E. coli. Tuy vËy, khi xÐt chi tiÕt
®Õn tõng loµi, quy luËt nµy kh«ng hoµn toµn ®óng, ch¼ng h¹n nh− nhãm c¸ phæi cã l−îng
ADN lín h¬n ng−êi nhiÒu. NghÞch lý nµy ®−îc gäi lµ nghÞch lý gi¸ trÞ C (xem thªm
ch−¬ng 7).
ë ng−êi, chiÒu dµi cña tÊt c¶ c¸c ph©n tö ADN trªn 46 nhiÔm s¾c thÓ cña mét tÕ
bµo l−ìng béi nÕu duçi dµi ra cã kÝch th−íc kho¶ng 2 m víi trªn 6 tû cÆp baz¬ nit¬ (bp)
trong mçi tÕ bµo. Chóng ta cã thÓ −íc tÝnh ®−îc kÝch th−íc vµ sè l−îng c¸c nucleotide cña

38
Ch−¬ng 2. CÊu tróc, ®Æc tÝnh, chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc – ADN, ARN vµ protein

mét hÖ gen ng−êi dùa vµo cÊu h×nh kh«ng gian c¬ b¶n cña ADN sîi kÐp theo m« h×nh cña
Watson vµ Crick víi mét sè th«ng sè c¬ b¶n nh− sau: 1g axit nucleic t−¬ng øng víi
kho¶ng 2 x 1021 nucleotide. Mét bé nhiÔm s¾c thÓ ®¬n béi cña ng−êi (23 NST) chøa 3,2 x
10-12 g ADN. V× vËy, mçi tÕ bµo ®¬n béi ë ng−êi sÏ cã kho¶ng (2 x 1021) x (3,2 x 10-12) = 6,4
x 109 nucleotide. Nh−ng v× ADN cña chóng ta lµ sîi kÐp nªn sÏ cã 3,2 x 109 cÆp
nucleotide. Víi tÕ bµo l−ìng béi (tÕ bµo soma, hay cßn gäi lµ tÕ bµo sinh d−ìng), l−îng
ADN sÏ gÊp ®«i vµ do v hÖ gen tÕ bµo sinh d−ìng cña ng−êi cã kho¶ng 6 tû (6,4 x 109) cÆp
nucleotide.
B¶ng 2.4. Th«ng sè ADN trong tÕ bµo ®¬n béi cña mét sè loµi sinh vËt

Hµm l−îng ADN Sè cÆp baz¬ nit¬ ChiÒu dµi


Loµi sinh vËt
(x 10-12g) (x 103) (µ
µm)
Virót
SV40 0,0000051 5,1 1,8
Herpes simplex 0,00011 110,0 38,0
Phag¬ λ (lambda) 0,000055 55,0 19,0
Phag¬ T2, T4, T6 0,0002 200,0 69,0
Vi KHUÈN
Escherichia coli 0,0047 4700 1620
Staphyloccus aureus 0,007 7000 2414
Streptococcus pneumoniae 0,002 2000 690
NÊm men
Saccharomyces cerevisiae 0,245 245.000 84.483
Thùc vËt
Ng« 7,5 7.500.000 2.586.000
Thuèc l¸ 1,2 1.200.000 413.790
§éng vËt
Ruåi giÊm (D. melanogaster) 0,18 180.000 62.070
Õch 6,5 6.500.000 2.241.380
Gµ 1,3 1.300.000 448.275
Chuét 2,5 2.500.000 862.070
Gia sóc (tr©u, bß, ngùa) 3,0 3.000.000 1.034.483
Ng−êi 3,2 3.200.000 1.103.448
C¸ phæi 102,0 102.000.000 3.517.241

2.1.4.2. Thµnh phÇn vµ cÊu tróc cña ARN


Ph©n tö ARN th−êng cã cÊu tróc mét m¹ch polynucleotide ®¬n duy nhÊt, ®−îc h×nh
thµnh tõ bèn lo¹i ribonucleotide c¬ b¶n lµ A, G, C vµ U. Trªn cïng mét m¹ch, c¸c
nucleotide còng liªn kÕt víi nhau qua liªn kÕt phosphodieste.
§Õn nay, ng−êi ta ®· t×m thÊy nhiÒu lo¹i ARN víi chøc n¨ng kh¸c nhau, trong ®ã
cã 3 lo¹i quan träng vµ phæ biÕn nhÊt lµ mARN (ARN th«ng tin, messeger RNA), tARN
(ARN vËn chuyÓn, transfer RNA) vµ rARN (ARN ribosome, ribosomal RNA).
a) ARN th«ng tin (mARN)
Ph©n tö mARN cã cÊu tróc mét m¹ch ®¬n lµ b¶n phiªn m· tr×nh tù cña gen (thùc
tÕ cã tr×nh tù gièng víi m¹ch mang nghÜa trªn ph©n tö ADN m· hãa cho chuçi
polypeptide t−¬ng øng). Lo¹i ARN nµy chiÕm kho¶ng 2 - 5 % tæng l−îng ARN cña tÕ bµo.

39
§inh §oµn Long

ë sinh vËt nh©n s¬, phÇn lín mARN lµ b¶n sao nguyªn vÑn tr×nh tù nucleotide
®−îc h×nh thµnh sau qu¸ tr×nh phiªn m· tõ ph©n tö ADN, ®ång thêi ®−îc sö dông ngay
lµm khu«n ®Ó dÞch m· tæng hîp protein. Cßn ë sinh vËt nh©n thËt, hÇu hÕt c¸c ph©n tö
mARN ®−îc h×nh thµnh sau phiªn m· cßn ph¶i tr¶i qua mét giai ®o¹n hoµn thiÖn (cßn
gäi lµ sù chÕ biÕn ARN) trong nh©n tÕ bµo. Qu¸ tr×nh hoµn thiÖn mARN gåm 3 sù kiÖn c¬
b¶n: 1) l¾p “mò” 7mG (7-methylguanidine triphosphate) vµo ®Çu 5’ tËn cïng cña ph©n tö
mARN tiÒn th©n (tiÒn-mARN); 2) C¾t bá c¸c ®o¹n tr×nh tù kh«ng m· ho¸ (intron) vµ
ghÐp nèi c¸c ®o¹n tr×nh tù m· ho¸ (exon) víi nhau; 3) l¾p ghÐp vµo phÇn ®u«i ph©n tö
mARN b»ng tr×nh tù polyA (tr×nh tù chøa tõ vµi chôc ®Õn hµng tr¨m adenine liªn tiÕp).
S¶n phÈm h×nh thµnh sau qu¸ tr×nh hoµn thiÖn nµy lµ ph©n tö mARN hoµn chØnh, s½n
sµng cho qu¸ tr×nh dÞch m· (tæng hîp protein) diÔn ra ë tÕ bµo chÊt.
KÝch th−íc cña sîi mARN th−êng dµi tõ 900 ®Õn 1200 ribonucleotide, khèi l−îng
trung b×nh kho¶ng tõ 3x105 ®Õn 4x106 Da víi hÖ sè l¾ng dao ®éng trong kho¶ng tõ 6S
®Õn 25S. ë sinh vËt nh©n thËt, phÇn lín c¸c ph©n tö mARN ®−îc tæng hîp tõ trong nh©n
tÕ bµo, chØ trõ mét sè Ýt ®−îc tæng hîp tõ c¸c gen trong ti thÓ vµ l¹p thÓ.
b) ARN vËn chuyÓn (tARN)
Hµm l−îng ARN vËn chuyÓn (tARN) trong tÕ bµo chiÕm kho¶ng 10 - 15% tæng
l−îng ARN. Ph©n tö tARN th−êng lµ mét m¹ch polynucleotide ng¾n, chøa tõ 75 ®Õn 95
ribonucleotide, khèi l−îng ph©n tö kho¶ng 23 - 30 kDa (1 kDa = 1.000 Da), hÖ sè l¾ng lµ
4S.
CÊu tróc tARN ®iÓn h×nh gåm 1 m¹ch polynucleotide cuén xo¾n d¹ng l¸ ph©n thïy
(h×nh 2.6), trong ®ã cã mét vµi ®o¹n xo¾n kÐp do c¸c ribonuclotide liªn kÕt bæ sung theo
nguyªn t¾c Chargaff. Trong cÊu tróc nµy, tARN cã mét thuú tiÕp nhËn axit amin (th«ng
qua liªn kÕt céng ho¸ trÞ) cã ®Çu tËn cïng lu«n lµ tr×nh tù CCA. Thuú ®èi m· mang bé ba
®èi m· phï hîp víi m· bé ba trªn ph©n tö mARN lµm m¹ch khu«n trong qu¸ tr×nh dÞch
m·. Ngoµi ra cßn cã 1 hoÆc 2 thuú phô tïy vµo tõng lo¹i tARN. Tuy ®Õn nay vai trß cña
c¸c thuú phô ch−a râ, nh−ng d−êng nh− chóng cã vai trß lµm t¨ng tÝnh æn ®Þnh cña c¸c
ph©n tö tARN. Mçi
lo¹i tARN cã vai trß OH
3’
vËn chuyÓn mét lo¹i A
axit amin duy nhÊt. P
C
C
Nh−ng mét axit 5’
Thïy nhËn
amin cã thÓ ®−îc (A)
axit amin
VÞ trÝ g¾n axit amin

vËn chuyÓn bëi


ThïyVßng
D (DHU) Thïy TΨC
Vßng
nhiÒu lo¹i tARN D
kh¸c nhau. §Õn nay, Thïy TΨC
Vßng TΨC
®· cã trªn 300 lo¹i 5’
3’
ph©n tö tARN kh¸c T Ψ C

nhau ®−îc x¸c ®Þnh Vßng hay


Thïy
biÕn
bÊt®æi
®Þnh
gi÷ vai trß vËn
Vßng
Thïy Thïy
Vßng D
chuyÓn 20 lo¹i axit §èi m· (DHU)
®èi m·
amin c¬ b¶n. MÆc dï
(B)
c¸c ph©n tö tARN cã Bé ba ®èi mW
thÓ kh¸c nhau ®«i
chót vÒ sè l−îng c¸c
H×nh 2.6. CÊu h×nh phæ biÕn cña tARN.
ribonucleotide, nh−ng
(A)H×nh
CÊu1.6.
trócCÊum¹chtróc phæ biÕn cña tARN.
polyribonucleotide d¹ng l¸
chóng cã mét sè ®Æc ( A)
ph©n thïy, (B) CÊu h×nh kh«ng gian h×nhd¹ng
CÊu tróc m¹ch polyribonucleotit thµnhl¸do
ph©n nh¸nh, (B) CÊu tróc kh«ng gian h×nh thµnh Bé ba ®èi mW
®iÓm cÊu h×nh chuçi polyribonucleotide gÊp nÕp vµ xo¾n l¹i.
do chuçi polyribonucleotit gÊp nÕp vµ xo¾n l¹i

40
Ch−¬ng 2. CÊu tróc, ®Æc tÝnh, chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc – ADN, ARN vµ protein

chung. Theo ®ã, c¸c ph©n tö tARN ®Òu lµ c¸c chuçi polynucleotide m¹ch ®¬n, tù cuén
xo¾n bëi c¸c liªn kÕt hydro h×nh thµnh gi÷a c¸c nuleotide bªn trong sîi kÓ tõ ®Çu 5’, ®ång
thêi cã mét sè ®Æc ®iÓm: 1) Cã mét nhãm monophosphate ë ®Çu 5’; 2) Mét cÊu tróc thïy
DHU (cßn gäi t¾t lµ thïy DHU) mang baz¬ nit¬ hiÕm gÆp dihydrouridin (DHU); 3) Mét
cÊu tróc thïy mang bé ba ®èi m·, gióp “dÞch” m· bé ba trªn mARN ®−îc gäi lµ “thïy ®èi
m·”; 4) Mét cÊu tróc thïy bÊt ®Þnh, th−êng cã sè nucleotide rÊt kh¸c nhau (tõ 3 ®Õn 21
nucleotide) ë c¸c lo¹i ph©n tö tARN kh¸c nhau; 5) CÊu tróc thïy TΨC mang baz¬ nit¬
hiÕm gÆp pseudouridin (kÝ hiÖu Ψ, hoÆc ΨU); 6) PhÇn th©n cña thïy nhËn axit amin
th−êng gåm 7 cÆp baz¬ nit¬ liªn kÕt bæ sung, trong ®ã cã thÓ cã mét cÆp liªn kÕt bÊt
th−êng gi÷a G vµ U; 7) Mét tr×nh tù gåm 3 nucleotide tËn cïng ®Çu 3’ lu«n lµ CCA t×m
thÊy ë tÊt c¶ c¸c lo¹i tARN, trong ®ã nhãm –OH cña A t¹i ®Çu 3’ tËn cïng chÝnh lµ vÞ trÝ
g¾n axit amin nhê ho¹t ®éng xóc t¸c cña enzym aminoacyl-tARN synthetase. Enzym nµy
gióp l¾p ghÐp chÝnh x¸c tõng lo¹i axit amin vµo ph©n tö tARN t−¬ng øng vËn chuyÓn nã.
Phøc hîp tARN sau khi l¾p ghÐp víi axit amin ®−îc gäi lµ aminoacyl-tARN (viÕt t¾t lµ
AA-tARN).
c) ARN ribosome (rARN)
ARN ribosome (rARN) chiÕm kho¶ng 80% tæng l−îng ARN trong tÕ bµo. rARN
th−êng cã cÊu tróc d¹ng m¹ch ®¬n polyribonuleotide víi nhiÒu khóc cuén, chøa tõ d−íi
100 ®Õn 1500 ribonucleotide. C¸c rARN kÕt hîp víi mét sè ph©n tö protein ®Æc biÖt t¹o
thµnh c¸c ribosome. Ribosome cã cÊu t¹o gåm hai tiÓu phÇn, gäi lµ tiÓu phÇn nhá vµ tiÓu
phÇn lín. Trong qu¸ tr×nh dÞch m· hai tiÓu phÇn cña rib«x«m kÕt hîp víi nhau t¹o thµnh
phøc hÖ ribosome hoµn chØnh cã ho¹t tÝnh dÞch m·. Khi kÕt thóc dÞch m·, hai tiÓu phÇn
l¹i t¸ch nhau ra vµ tån t¹i riªng rÏ, lóc nµy chóng kh«ng cã ho¹t tÝnh dÞch m·.
B¶ng 4.4 liÖt kª c¸c thµnh phÇn cÊu t¹o cña ribosome ë c¸c sinh vËt kh¸c nhau. ë
sinh vËt nh©n thËt, ribosome ë tÕ bµo chÊt cã hÖ sè l¾ng lµ 80S. Trong ®ã, tiÓu phÇn nhá
cã hÖ sè l¾ng lµ 40S ®−îc cÊu t¹o tõ mét ph©n tö rARN 18S vµ kho¶ng 35 ph©n tö
protein cÊu tróc; cßn tiÓu phÇn lín cã hÖ sè l¾ng lµ 60S ®−îc cÊu t¹o tõ 3 ph©n tö rARN
víi hÖ sè l¾ng lµ 5S, 5,8S vµ 28S kÕt hîp víi kho¶ng 50 ph©n tö protein cÊu tróc. Nh−
vËy, sinh vËt nh©n thËt cã 4 lo¹i rARN.
ë sinh vËt nh©n s¬, ribosome cã hÖ sè l¾ng lµ 70S, còng gåm hai tiÓu phÇn. TiÓu
phÇn nhá cã hÖ sè l¾ng lµ 30S ®−îc cÊu t¹o tõ mét ph©n tö rARN 16S vµ 21 ph©n tö
protein cÊu tróc; tiÓu phÇn lín cã hÖ sè l¾ng lµ 50S gåm hai ph©n tö rARN cã hÖ sè l¾ng
lµ 5S vµ 23S kÕt hîp víi 31 ph©n tö protein cÊu tróc. Nh− vËy, sinh vËt nh©n s¬ cã 3 lo¹i
rARN.
d) C¸c lo¹i ARN kh¸c
Trong tÕ bµo sinh vËt nh©n thËt, cßn cã mét sè ARN cã kÝch th−íc nhá chØ chøa
kho¶ng 90 - 300 ribonucleotide ®−îc gäi lµ c¸c snARN (small nuclear RNA). C¸c ph©n tö
snARN kh«ng tham gia vµo qu¸ tr×nh phiªn m·, mµ thay vµo ®ã, nã kÕt hîp víi mét sè
protein ®Æc thï ®Ó t¹o nªn phøc hîp tham gia vµo viÖc c¾t c¸c intron vµ nèi c¸c exon
trong qu¸ tr×nh hoµn thiÖn ph©n tö mARN, phøc hîp nµy ®−îc gäi lµ phøc hÖ c¾t intron
(spliceosome).
Ngoµi snARN, mét sè lo¹i ARN kÝch th−íc nhá cã ho¹t tÝnh gièng enzym gäi lµ
ribozyme. Ribozyme thùc chÊt lµ c¸c ph©n tö ARN kÝch th−íc nhá (th−êng chØ chøa
kho¶ng 40 - 50 ribonucleotide), cã tr×nh tù ®Æc hiÖu vµ cã kh¶ n¨ng xóc t¸c viÖc c¾t c¸c
ph©n tö ARN ë mét sè vÞ trÝ nhÊt ®Þnh. Ngoµi ra, trong tÕ bµo cßn cã mét sè lo¹i ARN
kh¸c nh− SRP ARN (signal recognition particle RNA, cßn gäi lµ ARN nhËn biÕt tÝn
hiÖu), snoARN (small nucleolar RNA, cßn gäi lµ ARN h¹ch nh©n), c¸c ARN tham gia

41
§inh §oµn Long

®iÒu hßa ho¹t ®éng cña gen (siARN vµ miARN). Môc 2.1.5.2 ®Ò cËp ®Õn chøc n¨ng cña
c¸c ARN nµy.
2.1.4.3. Mét sè tÝnh chÊt cña axit deoxyribonucleic
a) TÝnh chÊt biÕn tÝnh vµ håi tÝnh
Ph©n tö ADN sîi kÐp bÞ biÕn tÝnh (t¸ch thµnh hai m¹ch ®¬n) khi nhiÖt ®é m«i
tr−êng t¨ng cao, hoÆc khi trong m«i tr−êng cã mét sè yÕu tè g©y biÕn tÝnh nh− kiÒm,
urª,... C¸c yÕu tè g©y ra hiÖn t−îng trªn ®©y ®−îc gäi lµ c¸c yÕu tè g©y biÕn tÝnh ADN.
Trong tr−êng hîp yÕu tè g©y biÕn tÝnh lµ nhiÖt ®é, th× nhiÖt ®é ë ®ã mét nöa sè ph©n tö
ADN sîi kÐp bÞ t¸ch hoµn toµn thµnh hai m¹ch ®¬n ®−îc gäi lµ nhiÖt ®é nãng ch¶y, ký
hiÖu lµ Tm (melting temperature). §èi víi mçi ph©n tö ADN, gi¸ trÞ Tm phô thuéc vµo
thµnh phÇn, tØ lÖ vµ vÞ trÝ s¾p xÕp cña c¸c cÆp nucleotide trong ph©n tö ADN. Trong ph©n
tö ADN cã tû lÖ G ≡ C cµng cao th× gi¸ trÞ Tm cµng lín vµ ng−îc l¹i. Ngoµi ra, nÕu ph©n tö
ADN cã sè ®o¹n tr×nh tù lÆp l¹i liªn tôc cµng nhiÒu th× nhiÖt ®é biÕn tÝnh Tm còng cµng
cao. Ng−êi ta −íc tÝnh nÕu sè liªn kÕt G ≡ C trong ph©n tö ADN gi¶m ®i 1%, th× nhiÖt ®é
biÕn tÝnh Tm gi¶m ®i 0,4oC. Trong ®iÒu kiÖn b×nh th−êng, Tm cña mét phÇn tö ADN
th−êng trong kho¶ng 85 - 95oC.
§Ó −íc tÝnh nhiÖt ®é biÕn tÝnh (Tm) cña mét ph©n tö ADN cã kÝch th−íc ng¾n h¬n hoÆc
b»ng 25bp1 (base pairs = cÆp baz¬ nit¬), ng−êi ta th−êng dïng c«ng thøc cña Wallace (1989):
Tm = 2oC x (A + T) + 4oC x (G + C)
trong ®ã, (A + T) vµ (G + C) lµ sè cÆp baz¬ nit¬ t−¬ng øng cã trong ph©n tö ADN.
Cßn ®èi víi ph©n tö ADN dµi h¬n 25bp, Tm cã thÓ ®−îc −íc tÝnh theo c«ng thøc cña
Meinkoth - Wahl (1989):
Tm = 81,5oC + 16,6 (log10[Na+]) + 0,41(%[G+C]) - (500/n) - 0,61 (%FA).
trong ®ã [Na+] lµ nång ®é Na+. [Na+] cµng cao, gi¸ trÞ Tm −íc l−îng cµng thiÕu chÝnh x¸c; n
lµ chiÒu dµi chuçi ADN ®−îc nh©n b¶n; FA = formamide.
Sau khi bÞ biÕn tÝnh, nÕu nh− c¸c t¸c nh©n g©y biÕn tÝnh bÞ lo¹i khái m«i tr−êng th×
ph©n tö ADN sîi kÐp cã kh¶ n¨ng håi tÝnh. Lóc nµy, hai m¹ch ®¬n ®· t¸ch nhau ra trong
qu¸ tr×nh biÕn tÝnh sÏ liªn kÕt trë l¹i theo nguyªn t¾c Chargaff ®Ó h×nh thµnh nªn cÊu
tróc chuçi xo¾n kÐp. Tuy vËy, nÕu nhiÖt ®é h¹ qu¸ ®ét ngét, sù håi tÝnh cã thÓ kh«ng diÔn
ra. Lóc ®ã, ph©n tö ADN sÏ ë d¹ng v« ®Þnh h×nh hoÆc cã cÊu tróc rèi lo¹n do c¸c m¹ch
®¬n bÞ ®øt ë nhiÒu ®iÓm. Mét sè t¸c nh©n ho¸ häc g©y biÕn tÝnh ADN còng cã thÓ lµm c¸c
ph©n tö ADN bÞ biÕn tÝnh vÜnh viÔn, nghÜa lµ chóng kh«ng thÓ trë vÒ tr¹ng th¸i xo¾n kÐp
ban ®Çu, kÓ c¶ khi t¸c nh©n g©y biÕn tÝnh ®· ®−îc lo¹i bá.
§Æc ®iÓm biÕn tÝnh cña ADN ®−îc øng dông trong viÖc ph¸t minh ra m¸y nh©n gen
PCR (polymerase chain reaction). §©y lµ ph−¬ng ph¸p nh©n b¶n c¸c ®o¹n tr×nh tù ADN
trong ®iÒu kiÖn invitro vµ nay ®· trë thµnh mét ph−¬ng ph¸p nghiªn cøu ®Çu tay trong
c¸c lÜnh vùc nghiªn cøu di truyÒn, kü thuËt gen vµ c«ng nghÖ ADN t¸i tæ hîp. C¸c ph©n
tö ADN kh«ng bÞ biÕn tÝnh (d¹ng sîi kÐp) cã ®Æc tÝnh hÊp thô ¸nh s¸ng UV thÊp h¬n so
víi d¹ng ADN bÞ biÕn tÝnh (d¹ng m¹ch ®¬n). Nãi c¸ch kh¸c, khi nhiÖt ®é cµng t¨ng, mËt
®é quang häc hÊp thô ë b−íc sãng 260nm (kÝ hiÖu A260 hoÆc OD260) cña ADN cµng t¨ng.
HiÖn t−îng nµy cßn ®−îc gäi lµ sù t¨ng s¾c c¶m. Trªn c¬ së nµy, ng−êi ta cã thÓ sö dông
quang phæ kÕ ®Ó theo dâi qu¸ tr×nh biÕn tÝnh vµ håi tÝnh cña ADN. §ång thêi, dùa vµo
chØ sè OD260, ng−êi ta −íc tÝnh ®−îc hµm l−îng ADN còng nh− møc ®é lÆp l¹i liªn tiÕp
cña c¸c nucleotide trong mét ph©n tö ADN hay hÖ gen nµo ®ã (xem thªm ch−¬ng 11, môc
11.2.2).

1
bp (base pair = cÆp baz¬ nit¬) vµ kb (kilobase pair = 1000 bp) lµ ®¬n vÞ ®o kÝch th−íc c¸c ®o¹n ph©n tö ADN.

42
Ch−¬ng 2. CÊu tróc, ®Æc tÝnh, chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc – ADN, ARN vµ protein

b) C¸c baz¬ nit¬ cã thÓ “v¨ng” ra ngoµi chuçi xo¾n kÐp


TÝnh chÊt hãa n¨ng cña chuçi xo¾n kÐp ADN
“−u tiªn” cho sù kÕt cÆp gi÷a mét baz¬ trªn m¹ch
polynucleotide nµy víi mét baz¬ bæ sung víi nã trªn
m¹ch ®èi diÖn. Tuy nhiªn, ®«i khi mét baz¬ ®¬n lÎ cã
thÓ bÞ “v¨ng” ra ngoµi chuçi xo¾n kÐp nh− minh häa
trªn h×nh 2.7. ë ch−¬ng 6, chóng ta sÏ gÆp mét sè Baz¬ nit¬
enzym cã chøc n¨ng methyl hãa hoÆc söa ch÷a ADN. "v¨ng" ra
Nh÷ng enzym nµy cã thÓ thùc hiÖn ®−îc c¸c chøc
n¨ng cña chóng lµ nhê c¸c baz¬ cã thÓ "v¨ng" ra ngoµi
khung ®−êng – phosphate cña chuçi xo¾n vµ ¸p s¸t vÞ
trÝ xóc t¸c cña c¸c enzym. Ngoµi ra, ng−êi ta cho r»ng
c¸c enzym liªn quan ®Õn t¸i tæ hîp t−¬ng ®ång vµ söa
ch÷a ADN còng cÇn c¸c baz¬ "v¨ng" ra, khi c¸c
enzym nµy tr−ît däc ph©n tö ADN ®Ó ph¸t hiÖn c¸c
tr×nh tù t−¬ng ®ång vµ c¸c nucleotide sai háng. Qu¸
tr×nh nµy kh«ng tèn nhiÒu n¨ng l−îng v× mçi lÇn chØ
cã mét baz¬ “v¨ng” ra. Nh− vËy, cÊu h×nh ADN kh«ng
hÒ cøng nh¾c nh− c¸c m« h×nh th−êng ®−îc vÏ trong
c¸c s¸ch gi¸o khoa.
c) ADN cã thÓ ë d¹ng sîi ®¬n hay sîi kÐp, m¹ch th¼ng
hay vßng H×nh 2.7. Baz¬ nit¬ cã thÓ bÞ “v¨ng” ra
Cã thêi ng−êi ta tõng cho r»ng ADN chØ cã ë ngoµi trong cÊu tróc xo¾n kÐp ADN.
Ng−êi ta cho r»ng ®iÒu nµy lµ cÇn thiÕt ®Ó
d¹ng m¹ch th¼ng víi hai ®Çu tù do. ë sinh vËt nh©n c¸c ho¹t ®éng t¸i tæ hîp ADN, methyl hãa
thËt, thùc tÕ mçi NST lµ mét ph©n tö ADN duy nhÊt, baz¬ nit¬ (nh− cytosine vµ adenine) vµ söa
m¹ch th¼ng vµ dµi. Tuy vËy, trong tù nhiªn, ADN ch÷a ADN cã thÓ diÔn ra. Trªn h×nh, baz¬
còng tån t¹i ë d¹ng m¹ch vßng. Ch¼ng h¹n nh−, hÖ nit¬ v¨ng ra lµ cytosine.
gen virut SV40 g©y bÖnh ë khØ lµ mét ph©n tö ADN sîi kÐp, m¹ch th¼ng chøa kho¶ng
5000 bp. T−¬ng tù nh− vËy, phÇn lín (nh−ng kh«ng ph¶i tÊt c¶) nhiÔm s¾c thÓ vi khuÈn
th−êng ë d¹ng m¹ch vßng. Ch¼ng h¹n nh−, hÖ gen E. coli lµ mét ph©n tö ADN sîi kÐp,
m¹ch vßng chøa kho¶ng 5 triÖu bp. Ngoµi ra, nhiÒu lo¹i vi khuÈn cßn cã vËt chÊt di
truyÒn bæ sung lµ c¸c plasmid th−êng ë d¹ng ADN sîi kÐp, m¹ch vßng.
Trong tù nhiªn, ®iÒu lý thó lµ cã mét sè ph©n tö ADN cã lóc ë d¹ng m¹ch th¼ng, cã
lóc ë d¹ng m¹ch vßng. VÝ dô ®iÓn h×nh vÒ ®iÒu nµy lµ phag¬ λ. Khi ®ãng gãi trong h¹t
virut, ADN cña virut nµy ë d¹ng sîi kÐp, m¹ch th¼ng. Nh−ng khi l©y nhiÔm vµo E. coli,
nhê ph©n tö ADN cña nã cã hai ®Çu dÝnh (vÞ trÝ cos, xem thªm ch−¬ng 3) vµ sù cã mÆt
cña enzym E. coli ADN ligase, ADN cña virut chuyÓn sang d¹ng sîi kÐp, m¹ch vßng.
d) CÊu h×nh kh«ng gian cña ADN
V× ADN lµ mét ph©n tö cã cÊu tróc linh ho¹t, nªn c¸c th«ng sè h×nh häc cña nã thùc
tÕ cßn phô thuéc vµo m«i tr−êng xung quanh, bao gåm møc ®é ion hãa, tr¹ng th¸i liªn
kÕt víi c¸c protein cÊu tróc chÊt nhiÔm s¾c (nh− c¸c histon) hoÆc c¸c protein ®iÒu hßa
biÓu hiÖn gen (kÓ c¶ c¸c enzym nh− ARN polymerase) v.v... Do ®Çu tËn cïng cña ph©n tö
ADN m¹ch th¼ng tù do, nªn c¸c m¹ch ADN cã thÓ quay tù do vµ sè lÇn c¸c m¹ch cã thÓ
vÆn xo¾n quanh nhau d−êng nh− kh«ng h¹n chÕ. Nh−ng nÕu c¶ hai m¹ch cña chuçi xo¾n
kÐp ADN cã ®Çu tËn cïng liªn kÕt céng hãa trÞ h×nh thµnh d¹ng m¹ch vßng vµ kh«ng cã
sù “®øt qu·ng” cña khung ®−êng – phosphate, th× sè lÇn c¸c m¹ch cã thÓ quÊn quanh
nhau bÞ giíi h¹n. Sù giíi h¹n nµy ®−îc gäi lµ “sù cøng nh¾c h×nh häc cña ADN”. Sù cøng
nh¾c h×nh häc thùc tÕ còng x¶y ra víi c¸c ph©n tö ADN m¹ch th¼ng, do c¸c ph©n tö nµy
th−êng rÊt dµi vµ th−êng xuyªn ë tr¹ng th¸i liªn kÕt víi c¸c protein vµ c¸c thµnh phÇn
kh¸c trong tÕ bµo. Dï cã sù cøng nh¾c h×nh häc, nh−ng ADN l¹i liªn tôc tham gia vµo c¸c

43
§inh §oµn Long

qu¸ tr×nh cã tÝnh n¨ng ®éng cao, nh− Topoisomerase I


sù sao chÐp vµ phiªn m·. ë ch−¬ng 5,
chóng ta sÏ thÊy sù thay ®æi cÊu h×nh
kh«ng gian cña ADN lµ mét c¬ chÕ
quan träng ®iÒu hßa sù biÓu hiÖn gen.
§èi víi mét ph©n tö ADN sîi kÐp
m¹ch vßng, còng nh− ë ®o¹n gi÷a mét C¾t mét m¹ch ADN
ph©n tö ADN dµi m¹ch th¼ng, trong
®iÒu kiÖn sinh lý, ®Ó t¸ch hai m¹ch ®¬n
khái nhau, b−íc ®Çu tiªn cña viÖc níi
láng ph©n tö ADN lµ cÇn ph¶i c¾t “t¹m
thêi” Ýt nhÊt mét liªn kÕt céng hãa trÞ
trªn khung ®−êng - phosphate, råi sau
®ã khung nµy ®−îc nèi l¹i víi nhau.
Ho¹t ®éng “c¾t - nèi” nh− vËy ®−îc thùc
hiÖn bëi nhãm c¸c enzym gäi lµ
topoisomerase.
Cã hai kiÓu topoisomerase.
Topoisomerase kiÓu II (vÝ dô: ADN
gyrase ë E. coli) c¾t ADN trªn c¶ hai
Nèi l¹i
m¹ch (sè lÇn “c¾t - nèi” lµ sè ch½n), råi
sau ®ã nèi chóng trë l¹i víi nhau. Ho¹t
®éng xóc t¸c cña Topoisomerase II cÇn
n¨ng l−îng tõ ATP. Ng−îc l¹i,
topoisomerase kiÓu I chØ xóc t¸c H×nh 2.8. C¸c enzym topoisomerase dïng liªn kÕt céng
ph¶n øng c¾t - nèi trªn m¹ch ®¬n ADN, hãa trÞ “Tyrosine – ” ®Ó c¾t vµ nèi l¹i m¹ch ADN.
vµ kh«ng cÇn dïng n¨ng l−îng tõ ATP.
VËy, b»ng c¸ch nµo topoisomerase cã thÓ níi láng ph©n tö ADN vµ thóc ®Èy ho¹t
®éng sèng cña ADN mét c¸ch chÝnh x¸c vµ hµi hßa? C©u hái nµy phÇn nµo ®−îc gi¶i thÝch
d−íi ®©y.
e) Topoisomerase dïng liªn kÕt céng hãa trÞ ®Ó "c¾t" vµ "nèi l¹i" c¸c m¹ch ADN
§Ó thùc hiÖn chøc n¨ng cña m×nh, c¸c enzym topoisomerase ph¶i c¾t mét hoÆc c¶
hai m¹ch cña ph©n tö ADN råi nèi chóng l¹i víi nhau. C¸c enzym topoisomerase còng cã
thÓ thóc ®Èy c¶ hai ho¹t ®éng “c¾t” vµ “nèi” ADN mµ kh«ng nhÊt thiÕt cÇn n¨ng l−îng tõ
ATP hoÆc sù hç trî nµo tõ c¸c lo¹i protein nµo kh¸c. §ã lµ v× chóng cã mét c¬ chÕ “t¹o
cÇu liªn kÕt céng hãa trÞ trung gian”. M¹ch ADN sÏ ®−îc “c¾t” khi axit amin tyrosine
(Tyr) t¹i vÞ trÝ ho¹t hãa cña enzym tiÕp cËn liªn kÕt phosphodieste trªn khung ®−êng -
phosphate cña ®o¹n ADN ®Ých (h×nh 2.8). Lóc nµy, m¹ch ADN bÞ "c¾t" sÏ cã mét ®Çu cña
nã ®−îc nèi víi nhãm -OH thuéc gèc R trong axit amin Tyr cña enzym qua liªn kÕt céng
hãa trÞ -Tyr. §Çu thø hai cña m¹ch ADN võa ®øt sÏ h×nh thµnh gèc -OH tù do; ®Çu
nµy ®−îc ®Ýnh "chÆt" vµo enzym. Liªn kÕt -Tyr b¶o tån ®−îc n¨ng l−îng gi¶i phãng ra
tõ liªn kÕt phosphodieste võa ®øt g·y. Nhê vËy, m¹ch ADN cã thÓ ®−îc nèi l¹i "tù ph¸t"
b»ng mét ph¶n øng ng−îc víi ph¶n øng "c¾t", mµ kh«ng cÇn dïng thªm n¨ng l−îng tõ
ph¶n øng thñy ph©n ATP. Nh− ®Ò cËp ë trªn, ho¹t ®éng cña topoisomerase II cÇn n¨ng
l−îng tõ ATP, nh−ng cã lÏ n¨ng l−îng nµy cÇn cho sù thay ®æi cÊu h×nh kh«ng gian cña
phøc hÖ ADN-topoisomerase, chø kh«ng ph¶i cho chÝnh ph¶n øng "c¾t" vµ "nèi l¹i".
Mét ®iÓm ®¸ng l−u ý lµ gi÷a hai ph¶n øng "c¾t" vµ "nèi l¹i", mét m¹ch ADN ®−îc
topoisomerase ®Èy qua m¹ch cßn l¹i t¹i vÞ trÝ "c¾t". Ho¹t ®éng nµy diÔn ra ®−îc lµ nhê
cÊu h×nh ®Æc biÖt cña topoisomerase. H×nh 2.9 (trang sau) minh häa c¬ chÕ ho¹t ®éng
cña topoisomerase I.

44
Ch−¬ng 2. CÊu tróc, ®Æc tÝnh, chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc – ADN, ARN vµ protein

Topoisomerase I

3'

ADN
5'
C¾t vµ më §Èy mét m¹ch Nèi l¹i m¹ch ®·
"cæng" qua "cæng" c¾t, råi rêi ADN

H×nh 2.9. M« h×nh c¸c b−íc cña ph¶n øng “c¾t” vµ “nèi l¹i” m¹ch ®¬n ADN cña topoisomerase I

f) C¸c ®ång ph©n h×nh häc cña ADN cã thÓ ph©n t¸ch b»ng ®iÖn di
C¸c ph©n tö ADN sîi kÐp m¹ch vßng cã
thÓ cã chiÒu dµi gièng nhau nh−ng sè l−îng vÞ
trÝ "v¾t xo¾n" qua nhau cña ph©n tö ADN sîi
kÐp (vÝ dô do ho¹t ®éng cña topoisomerase) cã
thÓ kh¸c nhau. Sù kh¸c biÖt vÒ h×nh häc nh−
vËy ®−îc gäi lµ c¸c d¹ng ®ång ph©n h×nh
häc cña ADN. Dï kh«ng kh¸c nhau vÒ khèi
l−îng ph©n tö, c¸c d¹ng ®ång ph©n h×nh häc
cña ADN cã tèc ®é di chuyÓn trªn tr−êng ®iÖn
di (agarose) kh¸c nhau. C¸c d¹ng ®ång ph©n
h×nh häc cña ADN cã sè vÞ trÝ "v¾t xo¾n" cµng
nhiÒu, th× møc ®é "®ãng xo¾n" cµng chÆt, vµ
chóng di chuyÓn cµng nhanh trªn tr−êng ®iÖn
di. H×nh 2.10 minh häa tèc ®é di chuyÓn trªn
tr−êng ®iÖn di cña c¸c d¹ng ®ång ph©n h×nh
häc kh¸c nhau cña mét ph©n tö ADN sîi kÐp,
m¹ch vßng.
g) Cation ethidium lµm gi·n xo¾n ADN
Ethidium lµ mét cation ph¼ng, kÝch
th−íc lín. Nhê cÊu h×nh ph¼ng, ethidium cã H×nh 2.10. Sù ph©n t¸ch trªn tr−êng ®iÖn di cña
thÓ cµi vµo kho¶ng kh«ng gi÷a hai líp baz¬ c¸c d¹ng ®ång ph©n h×nh häc ADN. Lµn A minh
häa ph©n tö ADN d¹ng gi·n xo¾n (kh«ng cã sù "v¾t
nit¬ kÕ tiÕp xÕp chång lªn nhau trong ph©n tö xo¾n") hoÆc bÞ "®øt" mét m¹ch. Lµn B minh häa
ADN. Do cã tÝnh chÊt ph¸t quang d−íi ®Ìn ph©n tö ADN ë d¹ng m¹ch th¼ng. Lµn C lµ d¹ng
UV víi c−êng ®é ph¸t s¸ng t¨ng lªn sau khi ADN m¹ch vßng ë tr¹ng th¸i siªu xo¾n (cã nhiÒu
cµi vµo ADN, nªn thuèc nhuém ethidium cÊu tróc "v¾t xo¾n"). Lµn D lµ thang ph©n biÖt c¸c
d¹ng ®ång ph©n h×nh häc.
®−îc dïng réng r·i ®Ó nhuém ADN. Khi
ethidium cµi vµo gi÷a hai baz¬ nit¬, nã lµm gãc quay gi÷a hai cÆp baz¬ liÒn kÒ gi¶m 26o
(nghÜa lµ gãc quay th«ng th−êng lµ 36o sÏ gi¶m xuèng cßn 10o). Nh− vËy, ethidium cã t¸c
dông "gi·n xo¾n" ADN. Mµ, nh− ®· nªu ë trªn, møc ®é gi·n xo¾n ADN cã ¶nh h−ëng ®Õn
tèc ®é di chuyÓn cña nã trªn tr−êng ®iÖn di. ThÕ nªn, trong m«i tr−êng b·o hßa ethidium,
ADN cã xu h−íng di chuyÓn chËm h¬n so víi trong m«i tr−êng kh«ng b·o hßa ethidium.

2.1.5. Chøc n¨ng sinh häc cña c¸c axit nucleic


2.1.5.1. Chøc n¨ng sinh häc cña ADN
ë phÇn lín c¸c loµi sinh vËt (chØ trõ mét sè virut), ADN cã chøc n¨ng lµ vËt chÊt
mang th«ng tin di truyÒn. §Ó ®¶m nhiÖm chøc n¨ng nµy, ADN cã bèn ®Æc tÝnh c¬ b¶n sau:
1. Cã kh¶ n¨ng l−u gi÷ th«ng tin ë d¹ng bÒn v÷ng cÇn cho viÖc cÊu t¹o, sinh s¶n vµ
ho¹t ®éng cña tÕ bµo.

45
§inh §oµn Long

2. Cã kh¶ n¨ng sao chÐp chÝnh x¸c ®Ó th«ng tin di truyÒn cã thÓ ®−îc truyÒn tõ thÕ
hÖ nµy sang thÕ hÖ kÕ tiÕp th«ng qua qu¸ tr×nh ph©n bµo hay qu¸ tr×nh sinh s¶n.
3. Th«ng tin chøa ®ùng trong vËt chÊt di truyÒn ph¶i ®−îc dïng ®Ó t¹o ra c¸c ph©n
tö cÇn cho cÊu t¹o vµ ho¹t ®éng cña tÕ bµo.
4. VËt liÖu di truyÒn cã kh¶ n¨ng biÕn ®æi, nh−ng nh÷ng thay ®æi nµy (®ét biÕn) chØ
x¶y ra ë tÇn sè thÊp.
Trong c¸c tÕ bµo sinh vËt nh©n thËt, phÇn lín c¸c th«ng tin di truyÒn cÇn thiÕt cña tÕ
bµo ®−îc l−u gi÷ trong nh©n, chØ mét phÇn ®−îc l−u gi÷ trong ti thÓ (c¬ quan tö cã vai trß
h« hÊp tÕ bµo, tæng hîp ra phÇn lín ATP) hoÆc l¹p thÓ (c¬ quan quang hîp ë thùc vËt).
ë ch−¬ng 3, chóng ta sÏ ®Ò cËp kü h¬n vÒ qu¸ tr×nh truyÒn th«ng tin di truyÒn tõ
vËt chÊt di truyÒn (ADN, gen) thµnh sù biÓu hiÖn c¸c tÝnh tr¹ng t−¬ng øng ®−îc m· hãa
trong gen th«ng qua hai qu¸ tr×nh phiªn m· vµ dÞch m·. Trong ®ã, phiªn m· lµ qu¸
tr×nh th«ng tin di truyÒn ®−îc truyÒn tõ ADN sang ph©n tö mARN. Qu¸ tr×nh nµy cã
®iÓm ®Æc tr−ng lµ tr×nh tù cña c¸c nucleotide trong ph©n tö ADN sÏ ®−îc chuyÓn thµnh
tr×nh tù t−¬ng øng cña c¸c ribonucleotide trong ph©n tö mARN. Cßn qu¸ tr×nh dÞch m·
lµ qu¸ tr×nh mµ tr×nh tù cña c¸c ribonucleotide trong ph©n tö mARN ®−îc chuyÓn thµnh
tr×nh tù t−¬ng øng cña c¸c axit amin trong chuçi polypeptide mµ gen m· hãa. Nh− vËy,
qu¸ tr×nh truyÒn th«ng tin di truyÒn cã thÓ viÕt tãm t¾t lµ [ADN → mARN → protein].
§©y còng chÝnh lµ nguyªn lý trung t©m cña di truyÒn häc. Nguyªn lý trung t©m cho
chóng ta thÊy: ADN, ARN vµ protein chÝnh lµ c¸c ®¹i ph©n tö sinh häc cã vai trß quan
träng trong qu¸ tr×nh truyÒn th«ng tin di truyÒn, ®Æc biÖt ë cÊp ph©n tö vµ d−íi tÕ bµo.
Trong tÕ bµo, th«ng tin di truyÒn ®−îc truyÒn tõ ADN tíi protein th«ng qua ph©n tö
trung gian lµ mARN. Trong qu¸ tr×nh nµy, nÕu ADN cã vai trß l−u gi÷ vµ cung cÊp th«ng
tin di truyÒn th× protein lµ s¶n phÈm ®−îc t¹o ra ®Ó thùc hiÖn c¸c chøc n¨ng cña tÕ bµo.
2.1.5.2. Chøc n¨ng sinh häc cña ARN
Kh¸c víi ADN, trong tÕ bµo cã nhiÒu lo¹i ARN kh¸c nhau; mçi lo¹i ®¶m nhËn mét
chøc n¨ng sinh häc riªng biÖt. Nãi c¸ch kh¸c, ARN gi÷ nhiÒu vai trß kh¸c nhau trong tÕ
bµo. ë ch−¬ng 3, chóng ta sÏ thÊy trong c¸c bé m¸y biÓu hiÖn gen (bao gåm phiªn m·,
dÞch m· vµ c¶i biÕn protein) ®Òu cã sù tham gia phæ biÕn cña nhiÒu lo¹i ARN kh¸c nhau.
Nh×n chung, cã thÓ tãm t¾t c¸c chøc n¨ng c¬ b¶n cña ARN ®· biÕt nh− sau:
- Chøc n¨ng vËn chuyÓn th«ng tin di truyÒn: ®©y lµ vai trß chñ yÕu cña ARN th«ng
tin (mARN). Ph©n tö nµy lµ b¶n phiªn m· cña gen (ADN), ®ång thêi lµm khu«n ®Ó tæng
hîp nªn chuçi polypeptide (protein) t−¬ng øng.
- Chøc n¨ng tham gia tæng hîp vµ vËn chuyÓn protein: chøc n¨ng nµy biÓu hiÖn qua
vai trß cña tARN lµ ph©n tö cã vai trß nhËn biÕt vµ l¾p ghÐp chÝnh x¸c c¸c axit amin
t−¬ng øng víi bé ba ®èi m· trªn ph©n tö mARN trong qu¸ tr×nh phiªn m·; vai trß cña
rARN kÕt hîp víi c¸c protein cÊu tróc ®Ó h×nh thµnh nªn phøc hÖ ribosome hoµn chØnh,
lµ n¬i qu¸ tr×nh dÞch m· (tæng hîp protein) diÔn ra; vµ vai trß cña SRP ARN trong vËn
chuyÓn protein.
- Chøc n¨ng hoµn thiÖn c¸c ph©n tö ARN: c¸c snARN lµ thµnh phÇn tham gia h×nh
thµnh nªn spliceosome lµ phøc hîp cã vai trß trong viÖc c¾t c¸c intron vµ nèi c¸c exon
trong qu¸ tr×nh hoµn thiÖn mARN ë sinh vËt nh©n thËt. Ngoµi ra, ë sinh vËt nh©n thËt
cßn cã c¸c snoARN tham gia vµo qu¸ tr×nh hoµn thiÖn c¸c ph©n tö rARN tõ c¸c ph©n tö
tiÒn th©n (tiÒn-rARN) t¹i h¹ch nh©n, ®Ó tõ ®ã h×nh thµnh nªn c¸c tiÓu ®¬n vÞ cña
ribosome. ë sinh vËt nh©n s¬, M1 ARN lµ thµnh phÇn cña ribonuclease P cã chøc n¨ng
hoµn thiÖn c¸c ph©n tö tARN tõ ph©n tö tiÒn th©n (tiÒn-tARN).

46
Ch−¬ng 2. CÊu tróc, ®Æc tÝnh, chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc – ADN, ARN vµ protein

- Chøc n¨ng xóc t¸c: mét sè ARN cã kÝch th−íc nhá cã tÝnh chÊt xóc t¸c gièng
enzym, cßn gäi lµ c¸c ribozyme. B¶n th©n mét sè snoARN vµ M1 ARN tham gia vµo c¸c
qu¸ tr×nh hoµn thiÖn rARN vµ tARN ®−îc nªu ë trªn còng cã ho¹t tÝnh xóc t¸c.
- Chøc n¨ng ®iÒu hßa biÓu hiÖn cña gen: mÆc dï míi chØ ®−îc ph¸t hiÖn gÇn ®©y
(Fire vµ Mellor, 1998), song sù cã mÆt phæ biÕn cña c¸c lo¹i ARN tham gia ®iÒu hßa biÓu
hiÖn cña gen t×m thÊy ë hÇu hÕt c¸c loµi sinh vËt nh©n thËt ®−îc nghiªn cøu ®Õn nay cho
thÊy, ®©y cã lÏ lµ mét chøc n¨ng c¬ b¶n cña ARN vèn ®· h×nh thµnh tõ l©u trong qu¸
tr×nh tiÕn hãa. Nhãm c¸c ARN cã chøc n¨ng nµy ®−îc gäi chung lµ ARN can thiÖp (ARNi,
interfering RNA), ®−îc chia lµm hai nhãm nhá cã h×nh thøc ho¹t ®éng t−¬ng ®èi kh¸c
biÖt lµ siARN (small intefering RNA) vµ miARN (micro RNA). C¬ chÕ ®iÒu hßa biÓu hiÖn
cña gen bëi ARN ®−îc nªu ë ch−¬ng 5.
Ngoµi c¸c chøc n¨ng kÓ trªn, mét sè nhãm virut cã th«ng tin di truyÒn ®−îc l−u gi÷
trªn c¸c ph©n tö ARN, chø kh«ng ph¶i trªn ADN nh− phÇn lín c¸c ®èi t−îng sinh vËt
kh¸c. HÖ gen cña c¸c virut nµy cã thÓ lµ ARN ë d¹ng sîi kÐp hay m¹ch ®¬n. VÝ dô vÒ c¸c
nhãm virut cã vËt chÊt di truyÒn lµ ARN bao gåm retrovirut, reovirut, rhabdovirut,
orthomyxovirut, paramyxovirut, picornavirut, coronavirut, togavirut. Mét sè virut thËm chÝ
cã vËt chÊt di truyÒn ®ång
thêi gåm c¶ ADN vµ ARN B¶ng 2.5. C¸c lo¹i ARN vµ chøc n¨ng sinh häc
(nh− hepadnavirut). Nh− Lo¹i ARN Chøc n¨ng sinh häc
vËy, ë virut, ARN cßn cã ARN th«ng tin (mARN) TruyÒn th«ng tin qui ®Þnh tr×nh tù axit amin
vai trß l−u gi÷ th«ng tin cña protein tõ ADN tíi ribosome
di truyÒn. Trong qu¸ ARN vËn chuyÓn (tARN) DÞch c¸c m· bé ba trªn ph©n tö mARN
tr×nh truyÒn th«ng tin di thµnh c¸c axit amin trªn ph©n tö protein
truyÒn ®Ó tæng hîp nªn ARN ribosome (rARN) CÊu tróc ribosome vµ cã vai trß xóc t¸c
c¸c ph©n tö protein cÇn (ribozyme) h×nh thµnh liªn kÕt peptide
TiÒn-ARN S¶n phÈm trùc tiÕp cña qu¸ tr×nh phiªn m·;
thiÕt cho sù sinh s¶n vµ
lµ ph©n tö tiÒn th©n h×nh thµnh nªn mARN,
ph¸t triÓn cña phÇn lín tARN vµ rARN hoµn thiÖn. ë eukaryote,
virut kÓ trªn, th«ng tin di mét sè ph©n ®o¹n ARN intron cã vai trß
truyÒn trªn c¸c ph©n tö xóc t¸c (ribozyme) ph¶n øng c¾t chÝnh nã
ARN cÇn ®−îc phiªn m· snARN (ARN nh©n kÝch Cã vai trß xóc t¸c vµ cÊu tróc trong phøc
ng−îc thµnh ADN nhê sù th−íc nhá) hÖ c¾t intron (spliceosome) tõ c¸c ph©n tö
xóc t¸c cña enzym phiªn tiÒn-mARN ®Ó t¹o thµnh mARN hoµn thiÖn
m· ng−îc lµ reverse SRP ARN (ARN nhËn Lµ thµnh phÇn cña phøc hÖ ARN-protein
biÕt tÝn hiÖu) lµm nhiÖm vô nhËn biÕt c¸c peptide tÝn
transcriptase. Ph©n tö hiÖu trong ph©n tö protein míi ®−îc tæng
ADN ®−îc h×nh thµnh hîp, gióp "gi¶i phãng" c¸c ph©n tö protein
theo con ®−êng nµy ®−îc nµy khái m¹ng l−íi néi chÊt
gäi lµ ph©n tö cADN sno ARN (ARN h¹ch Tham gia hoµn thiÖn rARN tõ ph©n tö tiÒn-
(complementary DNA hay nh©n kÝch th−íc nhá) rARN vµ ®ãng gãi ribosome t¹i h¹ch nh©n
copy DNA). Sau ®ã, qu¸ Telomerase-ARN Thµnh phÇn cña enzym telomerase; lµm
khu«n ®Ó tæng hîp tr×nh tù ADN lÆp l¹i t¹i
tr×nh truyÒn th«ng tin
c¸c ®Çu mót nhiÔm s¾c thÓ ë eukaryote
tiÕp tôc diÔn ra tõ cADN gARN Tham gia vµo qu¸ tr×nh "biªn tËp" ADN ti
®Õn protein theo dßng thÓ ë thùc vËt vµ nguyªn sinh ®éng vËt, vµ
th«ng tin th«ng th−êng, ADN l¹p thÓ ë thùc vËt
nghÜa lµ cADN → mARN tmARN ARN tÝch hîp chøc n¨ng cña tARN vµ
→ protein. mARN, gióp gi¶i phãng ribosome khái sù
"t¾c nghÏn" khi dÞch m· c¸c ph©n tö mARN
Ngoµi c¸c ARN cã bÞ mÊt bé ba m· kÕt thóc (stop codon).
chøc n¨ng kÓ trªn, mét sè M1 ARN Thµnh phÇn ARN cã vai trß xóc t¸c cña
lo¹i ARN cã chøc n¨ng ARNase P, tham gia hoµn thiÖn c¸c ph©n
“tÝch hîp” ®−îc t×m thÊy ë tö tARN ë prokaryote
mét sè sinh vËt. Ch¼ng C¸c lo¹i ARN can thiÖp Tham gia ®iÒu hßa biÓu hiÖn gen ë
h¹n nh−, tmARN cã ®Æc (siARN vµ miARN) eukaryote

47
§inh §oµn Long

tÝnh kÕt hîp gi÷a tARN vµ mARN trong cïng mét ph©n tö. tmARN lµ thµnh phÇn tham
gia bé m¸y “cøu hé” ribosome khi c¸c ribosome bÞ “¸ch t¾c” trong qu¸ tr×nh dÞch m· mét
ph©n tö mARN mang ®ét biÕn mÊt bé ba m· kÕt thóc (ë ch−¬ng 3, ta sÏ thÊy, ribosome
chØ kÕt thóc dÞch m· khi gÆp bé ba m· kÕt thóc). B¶ng 2.5 tãm t¾t c¸c chøc n¨ng kh¸c
nhau cña ARN.
XÐt vÒ cÊu tróc, së dÜ ARN cã thÓ ®¶m nhËn nhiÒu chøc n¨ng kh¸c nhau trong tÕ
bµo (kh¸c víi ADN) lµ do chóng cã ba tÝnh chÊt: i) ARN cã thÓ t¹o liªn kÕt hydro víi c¸c
ph©n tö ADN hoÆc ARN kh¸c, ii) mçi ph©n tö ARN cã cÊu h×nh ®Æc thï do liªn kÕt hydro
h×nh thµnh gi÷a c¸c phÇn kh¸c nhau cña nã, vµ iii) c¸c ARN cã thÓ mang nhiÒu nhãm
chøc kh¸c nhau (nhí r»ng ARN cã nhiÒu lo¹i nucleotide c¶i biÕn h¬n so víi ADN), nªn
ARN cã thÓ cã ho¹t tÝnh xóc t¸c nh− c¸c enzym.
ViÖc ngµy cµng ph¸t hiÖn ra nhiÒu chøc n¨ng kh¸c nhau cña ARN lµ c¬ së dÉn ®Õn
quan ®iÓm cho r»ng: ARN cã thÓ lµ ®¹i ph©n tö sinh häc ®Çu tiªn xuÊt hiÖn trong qu¸
tr×nh tiÕn hãa (chø kh«ng ph¶i lµ ADN hay protein nh− nhiÒu gi¶ thiÕt tr−íc ®©y). Cã thÓ
t−ëng t−îng vÒ mét d¹ng sèng nguyªn thñy chØ cã ARN. ë d¹ng sèng nµy, ARN võa cã
vai trß lµ vËt chÊt mang th«ng tin di truyÒn, võa biÓu hiÖn chøc n¨ng cña enzym. D¹ng
sèng ®ã dÇn biÕn ®æi thµnh thÕ giíi sèng dùa trªn ba lo¹i ®¹i ph©n tö lµ ADN, ARN vµ
protein. Mét b»ng chøng ñng hé quan ®iÓm protein xuÊt hiÖn sau ARN lµ chøc n¨ng cña
ARN trong ribosome. Trong ribosome, chÝnh thµnh phÇn cã vai trß xóc t¸c h×nh thµnh
liªn kÕt peptide (enzym peptidyl transferase) lµ ARN. §iÓm kh¸c biÖt gi÷a petidyl
transferase víi c¸c lo¹i ribozyme kh¸c (nh− ARNase P) lµ c¸c ribozyme kh¸c ®Òu g©y t¸c
®éng xóc t¸c lªn trung t©m ph¶n øng lµ phospho, cßn petidyl transferase g©y hiÖu øng
xóc t¸c lªn trung t©m ph¶n øng lµ cacbon, qua ®ã h×nh thµnh liªn kÕt peptide. Cã thÓ
ribozyme cña ribosome lµ mét “vÕt tÝch” sãt l¹i cña d¹ng sèng nguyªn thñy vèn chØ cã c¸c
enzym ARN.

2.2. Protein

2.2.1. Protein lµ nhãm hîp chÊt quyÕt ®Þnh phÇn lín ho¹t ®éng sinh lý tÕ bµo
C¸c ph©n tö ADN chøa trong mäi tÕ bµo mang nhiÒu lo¹i th«ng tin, ch¼ng h¹n nh−
c¸c tr×nh tù ®iÒu khiÓn, c¸c tÝn hiÖu khëi ®Çu vµ kÕt thóc phiªn m·, c¸c ®o¹n tr×nh tù
t¨ng c−êng hoÆc k×m h·m phiªn m·, c¸c tr×nh tù m· hãa c¸c lo¹i ARN vµ protein.
Tuy vËy, phÇn lín c¸c th«ng tin ®−îc l−u gi÷ trong ADN lµ ®Ó tæng hîp nªn c¸c
ph©n tö protein. Nh− vËy, cã thÓ tãm t¾t qu¸ tr×nh biÓu hiÖn chÝnh cña th«ng tin di
truyÒn trong tÕ bµo nh− sau: c¸c gen m· hãa cho c¸c th«ng tin cÇn thiÕt ®Ó x¸c ®Þnh cÊu
tróc cña c¸c protein; ®Õn l−ît m×nh, cÊu tróc cña c¸c protein x¸c ®Þnh c¸c ho¹t tÝnh sinh
häc cña chóng, vµ ho¹t tÝnh sinh häc cña c¸c protein x¸c ®Þnh c¸c ho¹t ®éng sinh lý cña
tÕ bµo vµ c¬ thÓ.
V× lý do ®ã, mäi sù thay ®æi trong cÊu tróc ADN (ch¼ng h¹n nh− ®ét biÕn) sÏ ¶nh h−ëng ®Õn
ho¹t ®éng sinh lý cña tÕ bµo th«ng qua sù thay ®æi vÒ cÊu tróc protein. Do sù thay ®æi vÒ
cÊu tróc, ho¹t tÝnh cña protein bÞ thay ®æi theo vµ g©y ¶nh h−ëng ®Õn ho¹t ®éng sinh lý cña
tÕ bµo vµ c¬ thÓ. V× vËy, kiÓu gen cña tÕ bµo (h×nh thøc l−u tr÷ th«ng tin di truyÒn) sÏ x¸c
®Þnh kiÓu h×nh cña tÕ bµo (lµ sù biÓu hiÖn cña kiÓu gen th«ng qua protein).

2.2.2. CÊu tróc cña protein


2.2.2.1. C¸c ®Æc ®iÓm cÊu tróc c¬ b¶n
Protein lµ nhãm ph©n tö sinh häc cã vai trß thóc ®Èy phÇn lín c¸c ph¶n øng ho¸
sinh trong tÕ bµo vµ c¬ thÓ, tham gia vµo qu¸ tr×nh ®iÒu khiÓn biÓu hiÖn cña c¸c gen, x¸c
®Þnh nhiÒu ®Æc tÝnh vÒ mÆt cÊu tróc cña c¸c tÕ bµo, m« vµ c¬ quan (kÓ c¶ cña virut lµ

48
Ch−¬ng 2. CÊu tróc, ®Æc tÝnh, chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc – ADN, ARN vµ protein

d¹ng kh«ng cã cÊu tróc tÕ bµo ®iÓn h×nh). Tr−íc khi ®Ò cËp ®Õn c¸c chøc n¨ng cña
protein, chóng ta xem xÐt ®Æc ®iÓm cÊu tróc c¬ b¶n cña lo¹i ®¹i ph©n tö nµy.
Mét ph©n tö protein th−êng bao gåm mét hay nhiÒu chuçi polypeptide. Mçi chuçi
polypeptide lµ mét d·y c¸c axit amin liªn kÕt víi nhau qua liªn kÕt peptit - lµ liªn kÕt
céng hãa trÞ gi÷a nhãm carboxyl (-COOH) cña axit amin nµy víi nhãm amino (-NH2) cña
axit amin kÕ tiÕp trong chuçi. V× cã cÊu tróc nµy, chuçi polypeptide cã tÝnh ph©n cùc, mét
®Çu tËn cïng lµ nhãm amino tù do (cßn gäi lµ ®Çu N), mét ®Çu tËn cïng lµ nhãm carboxyl
tù do (cßn gäi lµ ®Çu C). Trong qu¸ tr×nh tæng hîp chuçi polypeptide, c¸c axit amin tiÕp
theo sau ®−îc bæ sung vµo chuçi ®ang tæng hîp th«ng qua viÖc g¾n vµo ®Çu carboxyl tù
do cña chuçi ®ã. V× vËy, ®Ó ®¸nh sè thø tù c¸c axit amin trong chuçi polypeptide, ng−êi ta
tÝnh tõ chiÒu N → C (t−¬ng øng víi chiÒu 5’ → 3’ cña m¹ch m· hãa).
Trong tù nhiªn, cã 20 lo¹i axit amin phæ biÕn ®−îc t×m thÊy trong thµnh phÇn cÊu
t¹o nªn tÊt c¶ c¸c protein ë mäi giíi sinh vËt kh¸c nhau. ChÝnh thµnh phÇn vµ tr×nh tù
c¸c axit amin trong chuçi polypeptide quy ®Þnh cÊu tróc, chøc n¨ng vµ ho¹t tÝnh cña
ph©n tö protein t−¬ng øng. V× mçi chuçi polypeptide th−êng bao gåm tõ hµng chôc ®Õn
hµng ngh×n axit amin víi sè l−îng vµ trËt tù s¾p xÕp cña c¸c axit amin trong trong chuçi
lµ hoµn toµn ngÉu nhiªn, nªn sù ®a d¹ng cña c¸c lo¹i protein trong tù nhiªn lµ rÊt lín.
CÊu t¹o ph©n tö cña c¶ 20 lo¹i axit amin ®Òu cã mét nguyªn tö cacbon gäi lµ cacbon
α. Cacbon α liªn kÕt víi mét nhãm -COOH, mét nhãm -NH2 vµ mét chuçi bªn ®−îc gäi lµ
gèc R. Ph©n tö cña c¸c lo¹i axit amin ph©n biÖt nhau ë gèc R nµy. CÊu tróc cña gèc R cã
thÓ tõ rÊt ®¬n gi¶n nh− mét nguyªn tö –H duy nhÊt (Gly) hay -CH3 (Ala) ®Õn mét sè
d¹ng phøc t¹p h¬n nh− cÊu tróc vßng cña Tyr hay cña Trp. Gèc R qui ®Þnh ®Æc tÝnh lý
hãa cña mçi lo¹i axit amin. Dùa trªn ®Æc tÝnh lý hãa, 20 lo¹i axit amin ®−îc chia thµnh 4
nhãm chÝnh (xem b¶ng 1.5), bao gåm: 1) c¸c axit amin cã tÝnh axit (gåm 2 lo¹i axit
amin lµ Asp vµ Glu, tæng céng ®−îc m· hãa bëi 4 bé ba; xem b¶ng 4.5, ch−¬ng 4), 2) c¸c
axit amin cã tÝnh kiÒm (gåm 3 lo¹i axit amin lµ Lys, Arg, His; tæng céng ®−îc m· hãa
bëi 10 bé ba), 3) c¸c axit amin trung tÝnh ph©n cùc (gåm 6 lo¹i axit amin lµ Tyr, Ser,
Thr, Asn, Gln vµ Cys; tæng céng ®−îc m· hãa bëi 18 bé ba), vµ 4) c¸c axit amin trung
tÝnh kh«ng ph©n cùc (gåm 9 lo¹i axit amin lµ Trp, Phe, Gly, Ala, Val, Ile, Leu, Met vµ
Pro; tæng céng ®−îc m· hãa bëi 19 bé ba). Mét sè hÖ thèng ph©n lo¹i xÕp riªng Gly thµnh
mét nhãm riªng, bëi axit amin nµy cã gèc R lµ nguyªn tö –H duy nhÊt kh«ng biÓu hiÖn râ
tÝnh chÊt ph©n cùc hay kh«ng ph©n cùc. ë phÇn sau cña gi¸o tr×nh nµy, chóng ta sÏ thÊy
chøc n¨ng vµ ho¹t tÝnh cña protein ®−îc quyÕt ®Þnh kh«ng chØ bëi thµnh phÇn vµ trËt tù
c¸c axit amin trªn c¸c chuçi polypeptide, mµ cßn ®−îc quyÕt ®Þnh bëi axit amin thuéc
nhãm nµo cã mÆt t¹i c¸c trung t©m ho¹t ®éng cña protein.
Mét xu h−íng phæ biÕn trong qu¸ tr×nh tiÕn hãa lµ c¸c ®ét biÕn thay thÕ axit amin
trong cïng nhãm Ýt lµm thay ®æi chøc n¨ng vµ ho¹t tÝnh cña protein h¬n sù thay thÕ axit
amin thuéc c¸c nhãm kh¸c nhau (xem thªm ch−¬ng 10). Víi sù ph©n bè c¸c m· bé ba nªu
trªn, mét ®iÓm ®¸ng chó ý lµ phÇn lín c¸c protein th−êng cã tÝnh kiÒm yÕu. V× vËy, trong
tÕ bµo, ADN th−êng xuyªn ë tr¹ng th¸i ®Ýnh kÕt víi c¸c lo¹i protein kh¸c nhau. §iÒu nµy
cã ý nghÜa rÊt quan träng trong sù biÓu hiÖn chøc n¨ng cña ADN, còng nh− trong ho¹t
®éng cña c¸c protein tham gia vµo c¸c qu¸ tr×nh biÓu hiÖn cña gen.
PhÇn lín c¸c chuçi polypeptide ®−îc h×nh thµnh sau qu¸ tr×nh dÞch m· (xem
ch−¬ng 3) sÏ tiÕp tôc cuén gËp ë bËc cao h¬n ®Ó t¹o nªn c¸c cÊu tróc kh«ng gian bËc cao
mang tÝnh ®Æc thï ®èi víi tõng lo¹i protein. H×nh thøc vµ møc ®é gÊp nÕp vµ cuén xo¾n
phô thuéc vµo chÝnh thµnh phÇn vµ tr×nh tù c¸c axit amin trong c¸c chuçi polypeptide.
Qu¸ tr×nh cuén gËp cña nhiÒu lo¹i protein trong tÕ bµo cÇn cã sù hç trî cña mét sè lo¹i
protein ®Æc biÖt gäi lµ chaperon. Mét vÝ dô vÒ chaperon ®ãng gãi protein histon ®−îc
nªu ë ch−¬ng 7.

49
§inh §oµn Long

§èi víi protein, cÊu tróc kh«ng gian cña mét Nh©n hem 2 chuçi β
ph©n tö sÏ quyÕt ®Þnh chøc n¨ng vµ ho¹t tÝnh cña
nã. Nh×n chung trong ®iÒu kiÖn sinh lý tÕ bµo (m«i
tr−êng n−íc), c¸c chuçi polypeptide th−êng cuén
gËp sao cho c¸c axit amin −a n−íc (gåm c¸c axit
amin cã tÝnh axit, baz¬, vµ c¸c axit amin trung tÝnh
ph©n cùc) h−íng ra bªn ngoµi bÒ mÆt ph©n tö (®©y
lµ phÇn tiÕp xóc víi n−íc trong dung dÞch) cßn c¸c
axit amin kÞ n−íc (c¸c axit amin trung tÝnh kh«ng
ph©n cùc) h−íng vµo trong ph©n tö. C¸c vÞ trÝ ho¹t
®éng cña enzym th−êng chøa Ser, His vµ c¸c axit
amin cã tÝnh kiÒm vµ/hoÆc tÝnh axit.
Trong c¸c axit amin kh«ng ph©n cùc, ®¸ng 2 chuçi α
chó ý cã Met vµ Cys lµ c¸c axit amin chøa l−u H×nh H×nh 2.11.1.7.
CÊuCÊutróc hemoglobin.
tróc hemoglobinGåm
huúnh (S). Khi mét chuçi polypeptide b¾t ®Çu ®−îc bèn chuçi
Gåm bènpolypeptide
chuçi (hai
polypeptitchuçi α vµ α
(hai chuçi hai
chuçi
vµ hai Mçi chuçi
β). chuçi β). cã chuçi
Mçi mét nh©n
cã hem
mét lµ vÞ
nh©n
tæng hîp, axit amin lu«n ®−îc l¾p r¸p ®Çu tiªn lµ trÝ g¾n cña mét ph©n tö oxy.
hem lµ vÞ trÝ g¾n cña mét ph©n tö oxy.
Met v× bé ba m· më ®Çu (AUG) còng chÝnh lµ bé ba
m· hãa Met (axit amin nµy sau ®ã cã thÓ bÞ c¾t bá hoÆc kh«ng). Axit amin Cys gi÷ mét
vai trß quan träng trong viÖc qui ®Þnh cÊu h×nh kh«ng gian cña protein bëi nã th−êng
h×nh thµnh nªn liªn kÕt cao n¨ng disulfide. Nhãm –SH (sulfhydryl) cña Cys lµ mét gèc
hãa häc ph¶n øng m¹nh, th−êng cã mÆt ë c¸c trung t©m ho¹t ®éng cña enzym hoÆc cã vai
trß g¾n kÕt c¸c nhãm chøc kh¸c nhau vµo protein.
ë møc cÊu tróc bËc hai, c¸c chuçi polypeptide cã hai d¹ng cÊu h×nh c¬ b¶n gäi lµ
d¹ng xo¾n α vµ d¹ng mÆt ph¼ng β. CÊu tróc xo¾n α cã d¹ng gièng lß xo ®−îc h×nh thµnh
bëi liªn kÕt hydro gi÷a nhãm (-NH) cña axit amin nµy víi nhãm (-CO) cña axit amin
c¸ch nã kho¶ng bèn axit amin trong chuçi polypeptide. Trong khi ®ã, cÊu tróc mÆt ph¼ng
β gièng nh− nh÷ng d¶i “ruy b¨ng” ch¹y song song ®−îc h×nh thµnh do c¸c liªn kÕt gi÷a
c¸c axit amin cã kho¶ng c¸ch xa nhau h¬n trong chuçi polypeptide (xem thªm ch−¬ng 1).
Ngoµi ra, cÊu tróc kh«ng gian cña protein cã thÓ ®−îc x¸c ®Þnh do mèi liªn kÕt céng ho¸
trÞ gi÷a c¸c nguyªn tö l−u huúnh (S) trong c¸c cÆp axit amin Cys tõ c¸c phÇn kh¸c nhau
cña chuçi polypeptide.
PhÇn lín c¸c protein ®−îc h×nh thµnh tõ hai hay nhiÒu chuçi polypeptide. Ch¼ng
h¹n nh− hemoglobin (protein vËn chuyÓn oxy trong m¸u) gåm 4 chuçi polypeptide, trong
®ã cã hai cÆp chuçi polypeptide kh¸c nhau ®−îc gäi lµ hai chuçi α vµ hai chuçi β (h×nh
2.11, l−u ý: ký hiÖu α vµ β trong chuçi hemoglobin kh«ng ph¶i lµ ký hiÖu d¹ng xo¾n α vµ
d¹ng mÆt ph¼ng β trong cÊu tróc protein).
2.2.2.2. Nucleoprotein, lipoprotein vµ glycoprotein lµ c¸c protein phøc hîp
Protein phøc hîp lµ c¸c protein ®−îc h×nh thµnh b»ng sù kÕt hîp c¸c nhãm chÊt
kh¸c vµo protein. Ch¼ng h¹n, nucleoprotein ®−îc h×nh thµnh tõ protein vµ axit nucleic,
lipoprotein ®−îc h×nh thµnh tõ viÖc g¾n c¸c gèc lipid vµo protein, cßn glycoprotein lµ
sù liªn kÕt c¸c thµnh phÇn hydrat cacbon (®−êng) víi protein.
Glycoprotein ®−îc t×m thÊy phæ biÕn trªn mµng tÕ bµo. C¸c protein nµy th−êng
mang c¸c chuçi hydrat cacbon ng¾n nh« ra ngoµi mµng tÕ bµo. C¸c chuçi ®−êng nµy
th−êng liªn kÕt víi protein qua gèc hydroxyl (-OH) cña Thr hay Ser, hoÆc nhãm amide
(N-C*=O) cña Asn. C¸c glycoprotein th−êng cã vai trß ®Ýnh kÕt gi÷a c¸c tÕ bµo, ®Æc biÖt ë
c¸c loµi ®éng vËt kh«ng cã thµnh tÕ bµo v÷ng ch¾c vµ æn ®Þnh. Ngoµi ra, phÇn hydrat
cacbon cña glycoprotein cßn th−êng lµ yÕu tè tiÕp nhËn tÝn hiÖu cña tÕ bµo. VÝ dô nh−
tinh trïng nhËn ra trøng th«ng qua phÇn hydrat cacbon cña glycoprotein trªn mµng tÕ

50
Ch−¬ng 2. CÊu tróc, ®Æc tÝnh, chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc – ADN, ARN vµ protein

bµo. C¸c tÕ bµo cña hÖ miÔn dÞch còng th−êng nhËn biÕt kh¸ng nguyªn dùa vµo cÊu tróc
chuçi hydrat cacbon cña c¸c glycoprotein. C¸c kh¸ng nguyªn A vµ B cña hÖ thèng nhãm
m¸u ABO thùc tÕ kh¸c nhau bëi mét chuçi hydrat cacbon trong thµnh phÇn glycoprotein
n»m trªn mµng tÕ bµo hång cÇu.
NhiÒu lo¹i lipoprotein liªn kÕt vµo mµng tÕ bµo bëi phÇn ®u«i lipid cña chóng. VÝ
dô ®iÓn h×nh vÒ nhãm hîp chÊt nµy lµ β -lactamase cã ë c¸c vi khuÈn gram d−¬ng, nh−
c¸c loµi Bacillus. Enzym nµy b¶o vÖ vi khuÈn khái t¸c ®éng cña c¸c chÊt kh¸ng sinh
thuéc hä β-lactam nh− penicillin. Do môc tiªu t¸c ®éng cña penicillin lµ thµnh tÕ bµo vi
khuÈn, nªn enzym b¶o vÖ cÇn ph¶i bäc ë phÝa ngoµi thµnh tÕ bµo. §u«i lipid (kÞ n−íc)
®¶m b¶o cho nã kh«ng bÞ "tr−ît" ra xa khái mµng tÕ bµo vµo m«i tr−êng (th−êng chøa
n−íc) ë xung quanh.
Proteolipid lµ mét nhãm con cña c¸c lipoprotein cã ®Æc ®iÓm kÞ n−íc vµ kh«ng hßa
tan trong n−íc. Chóng chØ hßa tan trong c¸c dung m«i h÷u c¬ vµ ®−îc t×m thÊy trong
vïng kÞ n−íc (s©u bªn trong) cña mµng tÕ bµo. Tuy vËy, ®Æc tÝnh n»m s©u bªn trong
mµng tÕ bµo cña c¸c proteolipid kh«ng chØ phô thuéc vµo sù cã mÆt cña c¸c gèc lipid, mµ
cßn phô thuéc vµo tØ lÖ thµnh phÇn c¸c axit amin kh«ng ph©n cùc cã mÆt trong ph©n tö
protein. Do vËy, thùc tÕ kh«ng ph¶i mäi ph©n tö lipoprotein ®Òu n»m s©u bªn trong
mµng tÕ bµo, mµ thay vµo ®ã chóng "béc lé" ra phÝa ngoµi mµng.

2.2.3. C¸c chøc n¨ng c¬ b¶n vµ ph©n lo¹i protein


Protein lµ hîp chÊt h÷u c¬ phæ biÕn nhÊt trong tÕ bµo, nã th−êng chiÕm trªn 50%
träng l−îng chÊt kh« cña tÕ bµo. Mét c©u hái ®Æt ra lµ: t¹i sao protein l¹i cã tÇm quan
träng vµ phæ biÕn nh− vËy trong tÕ bµo?
Chóng ta biÕt r»ng, protein cã vai trß sèng cßn ®èi víi tÕ bµo bëi v× chóng chÝnh lµ
c¸c ph©n tö thùc hiÖn phÇn lín c¸c ho¹t ®éng sinh lý cña tÕ bµo. Chóng biÓu hiÖn b»ng
c¸c chøc n¨ng sinh lý kh¸c nhau. H¬n n÷a, ®èi víi mçi mét chøc n¨ng, nh− chøc n¨ng
xóc t¸c cña enzym ch¼ng h¹n, còng ®· cã hµng tr¨m ngh×n lo¹i ph©n tö protein kh¸c
nhau. Tuy vËy, mçi ph©n tö protein lu«n cã mét cÊu tróc vµ chøc n¨ng ®Æc thï.
Protein cã thÓ mang nhiÒu chøc n¨ng kh¸c nhau nhê kh¶ n¨ng thay ®æi lín vÒ cÊu
h×nh cña chóng. Sù thay ®æi vÒ cÊu h×nh cña protein lµ kÕt qu¶ cña sù thay ®æi vÒ thµnh
phÇn vµ trËt tù cña c¸c axit amin trong ph©n tö. Hai ph©n tö protein cã thµnh phÇn axit
amin gièng nhau, nh−ng tr×nh tù cña c¸c axit amin kh¸c nhau th× cÊu tróc ph©n tö còng
sÏ kh¸c nhau dÉn ®Õn chóng sÏ cã ho¹t tÝnh vµ chøc n¨ng kh¸c nhau. Nãi c¸ch kh¸c, sù
®a d¹ng vÒ cÊu h×nh cña c¸c ph©n tö protein hÇu nh− kh«ng cã giíi h¹n. Nhê vËy, sù
biÓu hiÖn chøc n¨ng cña protein trong thÕ giíi sinh vËt lµ cùc kú phong phó.
Tuy vËy, ®Ó dÔ theo dâi vµ nghiªn cøu, ng−êi ta th−êng chia c¸c lo¹i ph©n tö
protein cã trong tÕ bµo thµnh mét sè nhãm chÝnh dùa vµo c¸c ho¹t tÝnh vµ chøc n¨ng
sinh lý c¬ b¶n cña chóng, ch¼ng h¹n bao gåm c¸c nhãm nh− sau: protein vËn chuyÓn,
enzym, G-protein, protein tÝn hiÖu, protein vËn ®éng (protein c¬), protein b¶o vÖ, protein
thô thÓ, protein ®iÒu hßa, protein cÊu tróc, vµ nhãm c¸c lo¹i protein kh¸c (b¶ng 2.6).
2.2.3.1. C¸c protein vËn chuyÓn
C¸c protein vËn chuyÓn t×m thÊy phæ biÕn trong hÖ tuÇn hoµn vµ c¸c m¹ch b¹ch
huyÕt, ngoµi ra cßn thÊy bªn trong c¸c tÕ bµo. Vai trß cña chóng lµ vËn chuyÓn c¸c ph©n
tö kh¸c nhau bªn trong vµ gi÷a c¸c tÕ bµo, hoÆc bªn trong vµ gi÷a c¸c m¹ch m¸u vµ
m¹ch b¹ch huyÕt. Trong nhãm nµy, cã thÓ nªu mét sè vÝ dô vÒ protein vËn chuyÓn axit
bÐo (albumin), vËn chuyÓn oxy (hemoglobin), vËn chuyÓn cholesterol (lipoprotein) vµ s¾t
(transferrin).

51
§inh §oµn Long

B¶ng 2.6. Ph©n lo¹i protein dùa vµo ho¹t tÝnh vµ chøc n¨ng sinh häc

Lo¹i protein Ho¹t tÝnh vµ chøc n¨ng sinh häc VÝ dô


C¸c ph©n tö cã chøc n¨ng vËn chuyÓn bªn Albumin, hemoglobin,
Protein vËn chuyÓn
trong vµ gi÷a c¸c tÕ bµo hoÆc gi÷a m¹ch m¸u lipoprotein, transferin,
(carrier proteins)
vµ hÖ b¹ch huyÕt galactoside permerase…
C¸c hîp chÊt cã vai trß xóc t¸c thóc ®Èy c¸c
Enzym Alcohol dehydrogenase,
ph¶n øng ho¸ häc, nh−ng b¶n th©n chóng
(enzymes) hexokinase, protease, …
kh«ng mÊt ®i sau qu¸ tr×nh ph¶n øng
Ph©n tö protein cã chøc n¨ng truyÒn tÝn hiÖu tõ
G - protein bªn ngoµi vµo bªn trong tÕ bµo b»ng viÖc kÝch
Transductin, Gs, αi, …
(G – proteins) thÝch s¶n xuÊt c¸c chÊt truyÒn tÝn hiÖu thø hai,
sö dông GTP lµm nguån n¨ng l−îng
Bao gåm c¸c hãcm«n vµ c¸c protein kh¸c, mµ
Protein tÝn hiÖu khi ho¹t ®éng, chóng truyÒn tÝn hiÖu tíi c¸c tÕ Insulin, glucagon, hoocm«n,
(Signal proteins) bµo vµ m« ®Ých, lµm thay ®æi ho¹t ®éng sinh lý prolactin, …
vµ trao ®æi chÊt ë c¸c m«, tÕ bµo ®ã
Cßn gäi lµ protein c¬. Cô thÓ, ®ã lµ sù t−¬ng t¸c
Protein vËn ®éng
cña actin vµ myosin t¹o nªn c¸c ho¹t ®éng co Actin, myosin
(Muscle proteins)
vµ duçi cña c¬
Protein b¶o vÖ Cã chøc n¨ng b¶o vÖ vµ chèng l¹i sù x©m nhËp Kh¸ng thÓ, interferon,
(Protection proteins) cña c¸c vi sinh vËt vµ c¸c hîp chÊt ®éc interleukin,…
C¸c protein xuyªn mµng hoÆc bªn trong tÕ bµo
C¸c thô thÓ insulin vµ
Protein thô thÓ lµ ph©n tö truyÒn th«ng tin trung gian tõ c¸c
adrenalin bÒ mÆt tÕ bµo, c¸c
(Receptors) hoocm«n hoÆc c¸c chÊt dÉn truyÒn thÇn kinh
thô thÓ opioid, histamine …
trong c¸c ho¹t ®éng sinh lý néi bµo
C¸c chÊt k×m h·m hoÆc øc
Protein ®iÒu hoµ
§iÒu hoµ ho¹t ®éng cña gen vµ tÕ bµo chÕ ho¹t ®éng phiªn m·,
(Regulatory proteins)
dÞch m· trong tÕ bµo, …
Lµ thµnh phÇn t¹o nªn “bé khung” cña c¸c tiÓu Cytochrome, protein khung
Protein cÊu tróc
phÇn d−íi tÕ bµo, c¸c c¬ quan tö trong tÕ bµo x−¬ng tÕ bµo (cytoskeleton),
(Structural proteins)
vµ b¶n th©n tÕ bµo. histon, ribosome, …
Bao gåm c¸c lo¹i protein t¹o kªnh xuyªn mµng
C¸c protein kªnh xuyªn
C¸c lo¹i protein kh¸c tÕ bµo, vµ c¸c lo¹i protein ®Æc biÖt liªn quan
mµng cña ion Cl-, K+, Na+, ...
®Õn sù trao ®æi tÝn hiÖu gi÷a c¸c tÕ bµo...

Hemoglobin lµ mét trong nh÷ng protein vËn chuyÓn ®−îc nghiªn cøu chi tiÕt nhÊt
cho ®Õn nay. Ph©n tö cña nã gåm cã hai thµnh phÇn. PhÇn nh©n hem t¹o cho m¸u cã
mµu ®á, lµ mét dÉn xuÊt cña porphyrin mang bèn vßng pyrol xung quanh mét nguyªn tö
s¾t. §©y lµ vÞ trÝ g¾n cña c¸c ph©n tö oxy. (CÊu tróc nh©n hem cña hemoglobin gièng víi
hem t×m thÊy trong c¸c cytochrom vµ trong myoglobin - protein vËn chuyÓn oxy cña c¬).
PhÇn globin lµ mét ph©n tö protein gåm bèn chuçi polypeptide, trong ®ã cã hai chuçi α
vµ hai chuçi β. Mçi mét chuçi protein th× g¾n vµo mét ph©n tö hem.
Mét thuéc tÝnh quan träng cña hemoglobin lµ mét phÇn tö cña nã cã kh¶ n¨ng liªn
kÕt víi bèn ph©n tö O2 (t−¬ng ®−¬ng víi bèn nh©n hem). ViÖc g¾n vµo nh©n hem cña
ph©n tö oxy thø nhÊt sÏ thóc ®Èy viÖc g¾n cña c¸c ph©n tö oxy tiÕp theo. NghÜa lµ, mét
khi ph©n tö oxy ®· g¾n vµo nh©n hem, th× ¸i lùc cña hemoglobin víi c¸c ph©n tö oxy tiÕp
theo sÏ t¨ng lªn. Thùc tÕ, ph©n tö oxy thø t− khi g¾n vµo hemoglobin cã ¸i lùc t¨ng cao
gÊp 100 lÇn so víi ph©n tö oxy ®Çu tiªn. Dï vËy, ¸i lùc liªn kÕt cña oxy vµo hemoglobin lµ
cã thÓ bÞ ®¶o ng−îc. NghÜa lµ, nh©n hem kh«ng chØ cã kh¶ n¨ng g¾n vµo c¸c ph©n tö oxy
mµ cßn cã thÓ gi¶i phãng c¸c ph©n tö oxy nµy ra khi cÇn thiÕt tïy theo yªu cÇu sinh lý
cña tÕ bµo.

52
Ch−¬ng 2. CÊu tróc, ®Æc tÝnh, chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc – ADN, ARN vµ protein

2.2.3.2. C¸c enzym


Enzym lµ nhãm c¸c hîp chÊt xóc t¸c h÷u c¬. C¸c ph©n tö nµy cã vai trß lµm t¨ng
tèc ®é c¸c ph¶n øng ho¸ häc mµ b¶n th©n chóng kh«ng mÊt ®i trong qu¸ tr×nh ph¶n øng
x¶y ra. Khi ph¶n øng ho¸ häc kÕt thóc, chóng trë vÒ d¹ng nguyªn thñy ban ®Çu vµ cã thÓ
tham gia xóc t¸c c¸c ph¶n øng tiÕp theo. NÕu so s¸nh víi l−îng c¸c c¬ chÊt tham gia
ph¶n øng, l−îng enzym cÇn cho mét ph¶n øng ho¸ häc th−êng thÊp h¬n nhiÒu. HÇu nh−
tÊt c¶ mäi ph¶n øng sinh häc trong tÕ bµo ®Ó chuyÓn hãa mét ph©n tö tõ d¹ng nµy sang
d¹ng kh¸c, hoÆc tõ c¬ chÊt thµnh s¶n phÈm, ®Òu ®ßi hái Ýt nhÊt mét enzym.
Ngoµi mét sè lo¹i ARN cã chøc n¨ng xóc t¸c (ribozyme), hÇu hÕt c¸c enzym trong
c¸c hÖ thèng sinh häc cã b¶n chÊt lµ protein. §Õn nay, chóng ta ®· biÕt hµng chôc ngh×n
lo¹i enzym kh¸c nhau cã b¶n chÊt protein. Trong ®ã, mçi lo¹i enzym th−êng xóc t¸c cho
mét ph¶n øng chuyÓn ho¸ nhÊt ®Þnh. §iÒu nµy x¶y ra ®−îc lµ nhê protein cã thÓ cã nhiÒu
d¹ng cÊu tróc kh¸c nhau, phô thuéc vµo tr×nh tù axit amin trªn c¸c chuçi polypeptide
cña chóng, hoÆc vµo sù t−¬ng t¸c gi÷a chóng víi c¸c ph©n tö kh¸c. CÊu tróc ®Æc thï cña
mçi protein t¹o ra c¸c ho¹t tÝnh vµ chøc n¨ng sinh häc kh¸c nhau. §Ó c¸c tÕ bµo vµ c¬ thÓ
cã thÓ ho¹t ®éng b×nh th−êng, c¸c qu¸ tr×nh chuyÓn ho¸ vÒ mÆt sinh häc ®Òu ®ßi hái c¸c
lo¹i enzym ®Æc thï. Ch¼ng h¹n nh− qu¸ tr×nh chuyÓn ho¸ glucose thµnh c¸c ph©n tö
n¨ng l−îng cao n¨ng ATP cÇn ®Õn kho¶ng 25 ph¶n øng, mçi ph¶n øng ®Òu cÇn Ýt nhÊt
mét enzym ®Æc thï. Trong mét sè tr−êng hîp, mét ph¶n øng cã thÓ ®ßi hái hai hay nhiÒu
lo¹i enzym cïng lóc.
B¶n th©n enzym còng xóc t¸c cho chÝnh qu¸ tr×nh tæng hîp c¸c lo¹i protein kh¸c
nhau, bao gåm c¶ c¸c lo¹i enzym kh¸c. Ch¼ng h¹n nh−, qu¸ tr×nh chuyÓn ho¸ c¸c
vitamin thµnh c¸c coenzym (lµ thµnh phÇn cña enzym cÇn thiÕt ®Ó biÓu hiÖn ho¹t tÝnh
enzym) ®ßi hái sù tham gia cña nhiÒu enzym. HoÆc nh−, qu¸ tr×nh chuyÓn ho¸ axit
panthothenic thµnh coenzym A (mét thµnh phÇn quan träng cña hÖ thèng enzym chuyÓn
ho¸ glucose thµnh ATP), còng cÇn sù xóc t¸c cña mét sè enzym ®Æc thï.
Hai vÝ dô kh¸c vÒ vai trß cña enzym bao gåm: alcohol dehydrogenase (ADH) vµ
hyaluronidase. ADH lµ enzym ph©n hñy r−îu vµ cån, gióp c¬ thÓ chóng ta lo¹i bít ®éc
tÝnh cña alcohol vµ c¶m thÊy thÝch thó khi uèng bia hay r−îu mµ kh«ng bÞ say. Cßn
hyaluronidase lµ enzym quan träng trong qu¸ tr×nh thô tinh ë ng−êi vµ ®éng vËt, cã
trong ®Çu cña tinh trïng. Khi tinh trïng gÆp tÕ bµo trøng trong qu¸ tr×nh thô tinh,
hyaluronidase thñy ph©n líp mµng b¶o vÖ cña tÕ bµo trøng vµ nhê vËy tinh trïng cã thÓ
x©m nhËp ®−îc vµo tÕ bµo trøng.
2.2.3.3. C¸c lo¹i G-protein
Mét hä c¸c lo¹i protein ®−îc gäi lµ G-protein cã chøc n¨ng tham gia vµo qu¸ tr×nh
truyÒn tÝn hiÖu tõ bªn ngoµi vµo bªn trong tÕ bµo. Tªn G-protein xuÊt ph¸t tõ viÖc c¸c
lo¹i protein nµy th−êng sö dông nguån n¨ng l−îng lµ GTP. Chóng truyÒn tÝn hiÖu b»ng
viÖc kÝch thÝch tæng hîp c¸c chÊt truyÒn tÝn hiÖu thø hai (second messenger) bªn trong tÕ
bµo. G-protein lµ cÇu nèi gi÷a c¸c thô thÓ trªn bÒ mÆt tÕ bµo víi c¸c con ®−êng chuyÓn
hãa sinh häc bªn trong tÕ bµo. C¸c hoocm«n hay c¸c chÊt dÉn truyÒn thÇn kinh (cßn gäi
lµ c¸c chÊt truyÒn tÝn hiÖu thø nhÊt, first messenger) kh¸c nhau cã thÓ truyÒn tÝn hiÖu
vµo trong tÕ bµo th«ng qua c¸c ph©n tö G-protein kh¸c nhau. Mét sè chÊt truyÒn tÝn hiÖu
cã ®Æc tÝnh nh− vËy cã thÓ kÓ ®Õn bao gåm: c¸c hîp chÊt hoocm«n, nh− adrenalin,
glucagon vµ insulin; hay nh− c¸c chÊt dÉn truyÒn thÇn kinh, nh− acetylcholin. Toµn bé
c¸c qu¸ tr×nh trao ®æi chÊt vµ dÉn truyÒn ph¶n x¹ thÇn kinh, nÕu ®−îc ®iÒu khiÓn bëi c¬
chÕ hoocm«n hay chÊt dÉn truyÒn thÇn kinh, sÏ cã nguy c¬ bÞ sai lÖch vµ thËm trÝ rèi lo¹n
nÕu thiÕu G-protein t−¬ng øng hoÆc khi c¸c G-protein nµy bÞ sai háng.
C¸c G-protein th−êng chøa ba chuçi polypeptide n»m s¸t ngay bªn d−íi thô thÓ
cña bÒ mÆt tÕ bµo, hoÆc ®«i khi bªn trong tÕ bµo. Khi thô thÓ bÞ ho¹t ho¸ bëi hoocm«n
hay chÊt dÉn truyÒn thÇn kinh, thô thÓ sÏ ho¹t ho¸ chuçi α cña G-protein bëi ph¶n øng

53
§inh §oµn Long

xóc t¸c enzym chuyÓn ho¸ GTP thµnh GDP ë vÞ trÝ g¾n chuçi α. Chuçi nµy sau ®ã sÏ
t¸ch ra khái hai chuçi cßn l¹i vµ ho¹t ho¸ mét hîp chÊt kh¸c gäi lµ hîp chÊt ho¹t ®éng
(effector, ®©y còng lµ chÊt truyÒn tÝn hiÖu thø hai), ch¼ng h¹n nh− cAMP. ChÊt truyÒn
tÝn hiÖu thø hai ®Õn l−ît nã l¹i kÝch ho¹t mét enzym kh¸c vµ b¾t ®Çu mét lo¹t c¸c ph¶n
øng ho¸ häc tiÕp theo. B»ng c¸ch nµy, c¸c hoocm«n vµ c¸c chÊt dÉn truyÒn thÇn kinh (më
réng ra lµ mét sè d−îc phÈm vµ c¸c chÊt cã ho¹t tÝnh sinh häc kh¸c) t¹o ra c¸c t¸c dông
hay hiÖu øng sinh lý cña chóng. Mét khi qu¸ tr×nh ho¹t ho¸ chÊt truyÒn tÝn hiÖu thø hai
kÕt thóc, th× chuçi α cïng víi GDP g¾n trë l¹i tr¹ng th¸i ban ®Çu víi hai chuçi cßn l¹i
cña ph©n tö G-protein vµ qu¸ tr×nh cø nh− vËy tiÕp diÔn lÆp ®i lÆp l¹i.
2.2.3.4. C¸c protein tÝn hiÖu
C¸c protein tÝn hiÖu ®iÓn h×nh lµ c¸c hoocm«n vµ c¸c chÊt dÉn truyÒn thÇn kinh.
Trong c¬ thÓ, khi c¸c chÊt nµy tiÕp xóc víi tÕ bµo môc tiªu cña chóng, chóng sÏ kÝch thÝch
vµ g©y ra mét lo¹t c¸c ph¶n øng sinh lý vµ trao ®æi chÊt. C¸c hoocm«n th× ®−îc m¸u vËn
chuyÓn ®i kh¾p c¬ thÓ, nh−ng chóng chØ t¹o ra hiÖu øng ®èi víi c¸c tÕ bµo môc tiªu ®Æc
thï cña chóng, bëi v× chØ cã c¸c tÕ bµo môc tiªu míi cã c¸c protein thô thÓ phï hîp trªn
mµng tÕ bµo ®Ó cã kh¶ n¨ng nhËn biÕt c¸c ph©n tö hoocm«n ®Æc thï t−¬ng øng. Ch¼ng
h¹n nh− vÝ dô ë phÇn trªn, th«ng tin cña hoocm«n sÏ ®−îc truyÒn vµo trong tÕ bµo th«ng
qua ph©n tö trung gian lµ G-protein, ph©n tö nµy sau ®ã sÏ ho¹t ho¸ hÖ thèng truyÒn tÝn
hiÖu thø hai bªn trong tÕ bµo, th−êng b¾t ®Çu lµ cAMP.
C¸c thô thÓ lµ c¸c protein cã ¸i lùc cao víi c¸c hoocm«n t−¬ng øng. Khi hoocm«n
g¾n vµo thô thÓ cña nã, chóng sÏ “ho¹t hãa” thô thÓ vµ kÝch thÝch t¹o ra c¸c ®¸p øng sinh
lý t−¬ng øng cña tÕ bµo. ë ®©y chóng ta nªu mét vÝ dô vÒ qu¸ tr×nh ®iÒu hßa l−îng ®−êng
trong m¸u. Møc ®−êng huyÕt th«ng th−êng trong c¬ thÓ ng−êi th−êng kho¶ng 80 - 120
mg / 100 ml. Khi l−îng ®−êng trong m¸u thÊp h¬n 80 mg / 100 ml, c¸c tÕ bµo α cña tuyÕn
tôy ph¶n øng b»ng viÖc gi¶i phãng hoocm«n glucagon vµo m¸u. T¹i tÕ bµo ®Ých (tÕ bµo
gan), glucagon sÏ g¾n vµo thô thÓ cña nã trªn bÒ mÆt tÕ bµo. Thô thÓ nµy liªn kÕt víi G-
protein ph©n bè trªn bÒ mÆt tÕ bµo vµ kÝch thÝch sù tæng hîp chÊt truyÒn tÝn hiÖu thø hai
cAMP. §Õn l−ît nã, cAMP ho¹t ho¸ mét sè lo¹i enzym kh¸c. KÕt qu¶ lµ tÕ bµo gan gi¶i
phãng glucose tõ d¹ng dù tr÷ cña chóng lµ glycogen, råi chuyÓn vµo m¸u lµm t¨ng l−îng
®−êng trong m¸u ®Ó duy tr× møc ®−êng huyÕt b×nh th−êng.
2.2.3.5. C¸c protein vËn ®éng
C¸c protein vËn ®éng (protein c¬) nh− actin vµ myosin cã t¸c dông phèi hîp víi
nhau vµ víi hîp chÊt cao n¨ng ATP gióp cho c¬ cã thÓ co vµ duçi ®−îc. Actin lµ protein
kÝch thÝch sù thñy ph©n ATP vµ g©y nªn sù kÕt hîp vµ ph©n ly cña actin víi myosin mµ
chóng ta ghi nhËn b»ng ho¹t ®éng co c¬. ATP thùc chÊt bÞ thñy ph©n bëi myosin, nh−ng
b¶n th©n qu¸ tr×nh nµy ®ßi hái actin ph¶i ®−îc g¾n vµo ATP tr−íc khi ph¶n øng diÔn ra.
Thùc tÕ, tªn actin cã nghÜa lµ “ho¹t hãa” (activate) ATP khi cã mÆt myosin.
2.2.3.6. C¸c protein b¶o vÖ
C¸c dÞch tÕ bµo ®éng vËt, ®Æc biÖt lµ m¸u, chøa nhiÒu lo¹i protein cã chøc n¨ng b¶o
vÖ c¬ thÓ chèng l¹i sù x©m nhËp cña c¸c ho¸ chÊt ®éc, c¸c protein l¹ vµ vi sinh vËt (vi
khuÈn, virut, sinh vËt ®¬n bµo, v.v…). T−¬ng tù nh− vËy, trong c¬ thÓ ng−êi, trong tuyÕn
n−íc bät, tuyÕn må h«i vµ thËm trÝ n−íc m¾t cã mét enzym gäi lµ lysozym cã thÓ ph©n
hñy ®−îc thµnh tÕ bµo cña nhiÒu lo¹i vi khuÈn, bao gåm c¸c loµi Staphylococcus vµ
Streptococcus, gióp c¬ thÓ tr¸nh khái sù nhiÔm trïng víi c¸c nguån g©y bÖnh nµy.
Interferon lµ mét nhãm gåm mét sè protein ®−îc t¹o ra tõ nhiÒu tÕ bµo trong c¬ thÓ
gióp c¬ thÓ ph¶n øng l¹i sù x©m nhËp hoÆc l©y nhiÔm cña nhiÒu lo¹i virut. Tªn cña nhãm
protein nµy b¾t nguån tõ tiÕng Anh lµ interference (can thiÖp) v× c¸c protein nµy cã ho¹t
tÝnh “can thiÖp” vµo qu¸ tr×nh sao chÐp vµ nh©n lªn cña virut, ®ång thêi kÝch thÝch c¸c tÕ
bµo cña hÖ miÔn dÞch ph¶n øng l¹i sù x©m nhËp cña virut.

54
Ch−¬ng 2. CÊu tróc, ®Æc tÝnh, chøc n¨ng cña c¸c ®¹i ph©n tö sinh häc – ADN, ARN vµ protein

Cho ®Õn nay, c¸c protein cã chøc n¨ng b¶o vÖ quan träng nhÊt ®−îc tæng hîp nhê
hÖ miÔn dÞch ë ®éng vËt cã x−¬ng sèng (kÓ c¶ loµi ng−êi) lµ c¸c kh¸ng thÓ, cßn gäi lµ c¸c
globulin miÔn dÞch (immunoglobulins). Ngoµi ra, trong c¬ thÓ, cßn cã c¸c protein cã t¸c
dông b¶o vÖ kh¸c ®ã lµ c¸c thô thÓ trªn mµng tÕ bµo cña hÖ miÔn dÞch hay c¸c hîp chÊt
thuéc lo¹i interleukin. Khi phèi hîp víi nhau, c¸c protein nµy cã thÓ lµm bÊt ho¹t vµ tiªu
diÖt c¸c lo¹i vi sinh vËt hoÆc hîp chÊt l¹ x©m nhËp vµo tÕ bµo vµ lµm trung hßa ®éc tÝnh
cña chóng. Ngoµi ra, interleukin cßn cã chøc n¨ng lµ c¸c chÊt mang tÝn hiÖu cÇn thiÕt cho
sù trao ®æi th«ng tin bªn trong vµ gi÷a c¸c tÕ bµo cña hÖ thèng miÔn dÞch. Thùc tÕ, viÖc
tiªm v¾c xin phßng bÖnh lµ nh»m kÝch thÝch hÖ miÔn dÞch ho¹t ®éng ®Ó tù b¶o vÖ c¬ thÓ.
HÖ thèng miÔn dÞch trong c¬ thÓ con ng−êi cã kh¶ n¨ng s¶n xuÊt ra hµng triÖu lo¹i
kh¸ng thÓ kh¸c nhau tïy theo yªu cÇu cña c¬ thÓ. C¸c protein kh¸ng thÓ th−êng chuyªn
ho¸ vÒ chøc n¨ng vµ chØ ph¶n øng víi ph©n tö kÝch thÝch hÖ miÔn dÞch s¶n xuÊt ra chóng,
®ã lµ c¸c kh¸ng nguyªn. Tuy vËy, kh¶ n¨ng b¶o vÖ cña hÖ thèng miÔn dÞch lµ cã giíi
h¹n. Do vËy, ®èi víi c¸c bÖnh nh©n bÞ Héi chøng suy gi¶m miÔn dÞch m¾c ph¶i (AIDS) hÖ
miÔn dÞch cña hä bÞ suy yÕu do sù l©y nhiÔm vµ tÊn c«ng cña virut HIV. Khi bÖnh nh©n
bÞ l©y nhiÔm víi c¸c d¹ng vi sinh vËt g©y bÖnh kh¸c, hÖ miÔn dÞch kh«ng cßn kh¶ n¨ng
chèng l¹i vµ cã nguy c¬ tö vong cao (xem thªm ch−¬ng 9).
2.2.3.7. C¸c protein thô thÓ
C¸c protein thô thÓ th−êng ®−îc t×m thÊy trªn bÒ mÆt c¸c lo¹i tÕ bµo vµ nhiÒu lo¹i
lµ c¸c protein xuyªn mµng. Chóng lµ nh÷ng ph©n tö trung gian cÇn thiÕt cho qu¸ tr×nh
truyÒn th«ng tin tõ c¸c ph©n tö tÝn hiÖu (bao gåm c¸c hîp chÊt hoocm«n, c¸c dÉn truyÒn
thÇn kinh, c¸c hîp chÊt cã ho¹t tÝnh sinh häc, d−îc phÈm) ch¼ng h¹n nh− insulin,
glucagon, adrenaline, vµ acetylcholine tõ bªn ngoµi vµo bªn trong tÕ bµo. C¸c protein thô
thÓ cã hai ®Æc tÝnh c¬ b¶n: 1) ë bªn ngoµi tÕ bµo, chóng cã kh¶ n¨ng nhËn biÕt vµ liªn kÕt
víi mét hoÆc mét sè ph©n tö tÝn hiÖu ®Æc tr−ng (cßn gäi lµ chÊt g¾n ®Æt hiÖu, vÝ dô nh−
c¸c hoocm«n) theo ph−¬ng thøc “ch×a kho¸ tra vµo æ kho¸”; 2) cßn ë bªn trong tÕ bµo,
chóng ho¹t ho¸ c¸c G-protein vµ kÝch thÝch viÖc tæng hîp nªn c¸c chÊt truyÒn tÝn hiÖu
thø hai (vÝ dô nh− cAMP). Dùa vµo c¸c tÝn hiÖu nhËn ®−îc cña tõng lo¹i thô thÓ, tÕ bµo
sÏ ph¶n øng b»ng viÖc thay ®æi c¸c ho¹t ®éng trao ®æi chÊt cña nã. §èi víi mçi mét lo¹i
hoocm«n hay chÊt truyÒn tÝn hiÖu, cã thÓ cã nhiÒu lo¹i thô thÓ kh¸c nhau. Sù kÕt hîp cña
nhiÒu lo¹i thô thÓ kh¸c nhau trªn bÒ mÆt tÕ bµo sÏ gióp x¸c ®Þnh c¸c lo¹i ph©n tö tÝn
hiÖu kh¸c nhau mµ tÕ bµo cã thÓ ph¶n øng theo c¸c c¸ch phï hîp t−¬ng øng.
Ngoµi ra, c¸c protein thô thÓ còng gi÷ vai trß quan träng trong viÖc vËn chuyÓn c¸c
chÊt theo c¬ chÕ chñ ®éng tõ bªn ngoµi vµo bªn trong tÕ bµo, vÝ dô nh− trong qu¸ tr×nh
vËn chuyÓn cholesterol vµo trong tÕ bµo nhê c¸c lipoprotein, hay qu¸ tr×nh vËn chuyÓn
ion Fe2+ nhê transferrin.
2.2.3.8. C¸c protein ®iÒu hoµ
Trong sè c¸c protein cã vai trß ®iÒu hoµ cã thÓ kÓ ®Õn protein ®iÒu hoµ biÓu hiÖn
cña gen, c¸c protein ®iÒu khiÓn qu¸ tr×nh ph©n bµo, vµ nhiÒu protein ®iÒu hoµ c¸c ho¹t
®éng kh¸c nhau cña tÕ bµo. Mét vÝ dô vÒ protein ®iÒu hßa lµ calmodulin. Protein nµy cã
vai trß ®iÒu hoµ l−îng Ca2+ trong tÕ bµo b»ng viÖc ®iÒu khiÓn ho¹t ®éng cña kªnh xuyªn
mµng Ca2+ trªn mµng tÕ bµo huyÕt t−¬ng. T−¬ng tù nh− vËy, cã nhiÒu protein tham gia
®iÒu hoµ c¸c ho¹t ®éng kh¸c cña tÕ bµo nh− c¸c qu¸ tr×nh trao ®æi glycogen, ®iÒu hoµ trao
®æi n¨ng l−îng, ®iÒu hoµ gi¶i phãng chÊt dÉn truyÒn thÇn kinh, c¸c chÊt truyÒn tÝn hiÖu
thø hai, c¸c hoocm«n, v.v…
C¸c protein ®iÒu hoµ còng gi÷ mét vai trß rÊt quan träng trong ®iÒu hoµ biÓu hiÖn
cña c¸c gen (tæng hîp c¸c ph©n tö protein vµ ARN), th−êng ®−îc gäi chung lµ sù biÓu
hiÖn cña gen, tïy theo yªu cÇu sinh lý cña tÕ bµo. Trong thùc tÕ, cã nhiÒu protein tham
gia ®iÒu hoµ c¸c qu¸ tr×nh phiªn m· (sinh tæng hîp mARN) vµ dÞch m· (tæng hîp

55
§inh §oµn Long

protein). Dùa vµo c¸c tÝn hiÖu xuÊt ph¸t tõ bªn trong hay bªn ngoµi tÕ bµo, mét gen nµo
®ã sÏ ®−îc ®iÒu khiÓn viÖc “bËt” hay “t¾t”, hoÆc t¨ng c−êng, hoÆc gi¶m møc ®é ho¹t ®éng
nhê sù ®iÒu hoµ cña c¸c ph©n tö protein ®Æc thï. Chóng ta sÏ ®Ò cËp kü h¬n vÒ chñ ®Ò
“§iÒu hßa biÓu hiÖn cña gen” ë ch−¬ng 5 cña gi¸o tr×nh nµy.
2.2.3.9. C¸c protein cÊu tróc
C¸c protein cÊu tróc tham gia vµo viÖc ®Þnh h×nh cÊu tróc vµ h×nh d¹ng cña tÕ bµo
vµ nhiÒu cÊu tróc d−íi tÕ bµo. Thuéc lo¹i nµy, cã thÓ kÓ ®Õn c¸c protein thuéc nhãm
protein khung x−¬ng tÕ bµo cÇn cho viÖc ®Þnh h×nh tÕ bµo. Histon, mét lo¹i protein nhá cã
tÝnh kiÒm, lµ protein cÊu tróc tham gia vµo viÖc ®ãng gãi vµ ®Þnh h×nh nhiÔm s¾c thÓ.
Ngoµi ra, cßn nhiÒu lo¹i protein cÊu tróc kh¸c tham gia cÊu t¹o c¸c tiÓu phÇn d−íi tÕ bµo
nh− ribosome, cytochrome, v.v…
Protein thuéc lo¹i khung x−¬ng tÕ bµo phæ biÕn nhÊt cã thÓ kÓ ®Õn lµ c¸c sîi actin
vµ thoi ph©n bµo. Histon lµ mét nhãm gåm 5 protein cã tÝnh kiÒm, ®−îc ký hiÖu lÇn l−ît
lµ H1, H2A, H2B, H3 vµ H4. C¸c protein nµy ®−îc dïng ®Ó trung hoµ ®iÖn tÝch ©m cña
ph©n tö ADN, nhê vËy qu¸ tr×nh ®ãng gãi nhiÔm s¾c thÓ cã thÓ diÔn ra.
Ribosome lµ n¬i diÔn ra qu¸ tr×nh dÞch m· th«ng tin di truyÒn tõ mARN ®Ó tæng
hîp protein. Mçi ribosome cã cÊu t¹o gåm 2 thµnh phÇn: protein vµ ARN. CÊu tróc
ribosome gåm hai tiÓu phÇn, mét tiÓu phÇn cã kÝch th−íc lín vµ mét tiÓu phÇn cã kÝch
th−íc nhá. Mçi tiÓu phÇn ribosome chøa ARN vµ protein ë tØ lÖ khèi l−îng gÇn t−¬ng
®−¬ng. ë sinh vËt nh©n thËt, tiÓu phÇn lín chøa kho¶ng 50 ph©n tö protein vµ tiÓu phÇn
nhá chøa kho¶ng 30 ph©n tö protein. ë sinh vËt nh©n s¬, ribosome vÒ c¬ b¶n cã kÝch
th−íc nhá h¬n, trong ®ã tiÓu phÇn lín chøa 32 ph©n tö protein cßn tiÓu phÇn nhá chøa 21
ph©n tö protein. Khi protein tham gia cÊu tróc ribosome bÞ háng, qu¸ tr×nh phiªn m· hay
tæng hîp protein kh«ng thÓ diÔn ra b×nh th−êng, dÉn ®Õn tÕ bµo bÞ rèi lo¹n hoÆc chÕt.
Cytochrome lµ ph©n tö protein mang mét nguyªn tö s¾t n»m trong nh©n hem.
PhÇn hem nµy liªn kÕt víi ph©n tö protein gièng nh− trong ph©n tö hemoglobin ®· nãi ë
phÇn trªn. MÆc kh¸c, gièng víi histon, c¸c protein cÊu tróc trong cytochrome cã tÝnh b¶o
thñ rÊt cao trong suèt hµng triÖu n¨m tiÕn ho¸ cña sinh vËt. Cô thÓ, cytochrome cña vi
khuÈn vµ cña ng−êi rÊt gièng nhau vµ gièng víi c¸c loµi sinh vËt kh¸c. CÊu tróc æn ®Þnh
nµy cã thÓ liªn quan ®Õn chøc n¨ng sinh lý quan träng cña nã; v× vËy, hÇu hÕt c¸c ®ét
biÕn ë gen nµy ®Òu g©y gi¶m søc sèng hoÆc g©y chÕt.
2.2.3.10. C¸c lo¹i protein kh¸c
C¸c lo¹i protein kh¸c bao gåm c¸c protein kh«ng xÕp vµo c¸c lo¹i ë trªn, nh−ng vai
trß cña chóng trong c¸c ho¹t ®éng sinh lý cña tÕ bµo kh«ng kÐm phÇn quan träng.
Trong nhãm nµy, cã thÓ kÓ ®Õn c¸c protein t¹o kªnh xuyªn mµng cho phÐp hÊp thô
chñ ®éng mét sè ion nhÊt ®Þnh (nh− Na+, K+, Cl-) qua mµng tÕ bµo hoÆc c¬ quan tö (ti thÓ,
l¹p thÓ) theo ®óng chiÒu vµ ®óng thêi ®iÓm theo yªu cÇu sinh lý cña tÕ bµo. Ch¼ng h¹n,
trong qu¸ tr×nh truyÒn xung thÇn kinh, mµng tÕ bµo thÇn kinh bÞ ph©n cùc vµ gi¶i ph©n
cùc. ViÖc vËn chuyÓn glucose vµo trong tÕ bµo phô thuéc vµo c¸c kªnh b¬m ion Na+ vµ K+.
Mét vÝ dô kh¸c cho thÊy bÖnh x¬ ho¸ khÝ qu¶n lµ kÕt qu¶ do gen m· ho¸ tæng hîp
protein tham gia cÊu tróc c¸c kªnh vËn chuyÓn Cl- ë phæi vµ mét sè m« kh¸c bÞ sai háng.
Lóc nµy, kªnh trao ®æi ion Cl- kh«ng cßn ®iÒu khiÓn chÝnh x¸c ®−îc h−íng x©m nhËp vµo tÕ
bµo cña c¸c ion Cl-, do vËy g©y ®Õn hiÖn t−îng trµn dÞch mµng phæi vµ cã thÓ dÉn ®Õn tö
vong. Ngoµi ra, gi÷a c¸c tÕ bµo cßn cã c¸c ph©n tö protein h×nh thµnh nªn kªnh trao ®æi
liªn bµo, ®©y lµ ®−êng truyÒn qua l¹i cña c¸c hîp chÊt v« c¬ phæ biÕn nh− ®−êng, axit amin,
nucleotide. Nh−ng ®èi víi c¸c hîp chÊt cã kÝch th−íc lín h¬n nh− protein, axit nucleic vµ
polysaccharide, chóng th−êng kh«ng thÓ ®i qua con ®−êng trao ®æi liªn bµo nµy.

56
Ch−¬ng 3

Sao chÐp axit nucleic

3.1. Sao chÐp ADN sîi kÐp

3.1.1. Sao chÐp ADN lµ sù khëi ®Çu qu¸ tr×nh sinh s¶n
Còng nh− c¸c c¸ thÓ trong mét loµi, c¸c tÕ bµo trong mét c¬ thÓ ®a bµo duy tr× sù
tån t¹i cña chóng qua sù sinh s¶n. VÒ mÆt di truyÒn, sinh s¶n lµ c¬ chÕ duy tr× sù æn ®Þnh
cña vËt chÊt di truyÒn tõ thÕ hÖ nµy sang thÕ hÖ kh¸c. V× vËy, trong qu¸ tr×nh sinh s¶n,
vËt chÊt di truyÒn ph¶i ®−îc sao chÐp (t¸i b¶n) mét c¸ch chÝnh x¸c. KÕt qu¶ cña qu¸
tr×nh ®ã lµ c¸c th«ng tin di truyÒn thiÕt yÕu cña tÕ bµo bè, mÑ ®−îc truyÒn cho tÕ bµo con
gÇn nh− nguyªn vÑn. Trong tÕ bµo eukaryote, phÇn lín th«ng tin di truyÒn ®−îc l−u gi÷
trong ADN hÖ gen nh©n, chØ mét phÇn nhá ®−îc l−u gi÷ trong c¸c c¬ quan tö ë tÕ bµo
chÊt (ti thÓ vµ l¹p thÓ).
Còng nh− c¸c sinh vËt ®a bµo kh¸c, ë ng−êi mäi c¬ thÓ ®Òu ®−îc h×nh thµnh tõ mét
tÕ bµo hîp tö nhá bÐ ban ®Çu (®−êng kÝnh ~10nm). Trong qu¸ tr×nh ph¸t triÓn cña ph«i,
hîp tö ph©n chia nguyªn ph©n nhiÒu lÇn liªn tiÕp ®Ó h×nh thµnh nªn hµng tû tÕ bµo. Khi
®¹t ®Õn giai ®o¹n tr−ëng thµnh, mét c¬ thÓ ng−êi chøa hµng triÖu tû tÕ bµo. Trõ mét sè
ngo¹i lÖ, hÇu nh− tÊt c¶ c¸c tÕ bµo nµy ®Òu chøa nh÷ng b¶n sao gièng nhau cña kho¶ng
20.000 ®Õn 25.000 gen. §Ó cã ®−îc kÕt qu¶ ®ã, trong mçi lÇn ph©n bµo, toµn bé hÖ gen
gåm kho¶ng 6 tû cÆp baz¬ nit¬ (tÕ bµo l−ìng béi) ph¶i ®−îc sao chÐp mét c¸ch chÝnh x¸c.
Ngoµi ra, trong c¬ thÓ kh«ng ph¶i mäi tÕ bµo ®Òu tån t¹i vÜnh viÔn trong suèt qu¸ tr×nh
ph¸t triÓn cña c¬ thÓ, mµ ë nhiÒu m«, c¸c tÕ bµo cò th−êng xuyªn ®−îc thay thÕ bëi c¸c tÕ
bµo míi, vÝ dô nh− tñy x−¬ng mçi phót t¹o ra kho¶ng 2 triÖu tÕ bµo m¸u míi.
VÒ tèc ®é sao chÐp vËt chÊt di truyÒn, ë eukaryote, qu¸ tr×nh sao chÐp ADN diÔn ra
víi tèc ®é kho¶ng 60 - 90 nucleotide/gi©y, cßn ë prokaryote lµ kho¶ng 850
nucleotide/gi©y. Nh− vËy, râ rµng bé m¸y sao chÐp ph¶i ho¹t ®éng víi tèc ®é cao, nh−ng
®iÒu quan träng h¬n c¶ lµ th«ng tin di truyÒn ph¶i ®−îc sao chÐp mét c¸ch chÝnh x¸c tõ
tÕ bµo mÑ sang c¸c tÕ bµo con. Thùc tÕ cho thÊy ®é chÝnh x¸c trong sao chÐp vËt chÊt di
truyÒn ë c¸c loµi sinh vËt lµ rÊt cao. Ch¼ng h¹n ë E. coli, tÇn sè sao chÐp sai lÖch trung
b×nh chØ kho¶ng 1/109 nucleotide. Nh− vËy, cã thÓ nãi phÇn lín c¸c gen cña hai tÕ bµo cã
cïng nguån gèc sau nguyªn ph©n hÇu nh− gièng nhau hoµn toµn, trõ nh÷ng sai kh¸c cã
thÓ x¶y ra do kÕt qu¶ cña ®ét biÕn hoÆc do sù sai háng cña bé m¸y söa ch÷a ADN.
Mét c©u hái ®−îc ®Æt ra lµ: b»ng c¸ch nµo c¸c ph©n tö ADN sîi kÐp cã thÓ ®−îc sao
chÐp vµ truyÒn cho thÕ hÖ con mét c¸ch chÝnh x¸c nh− vËy?
M« h×nh sao chÐp ADN sîi kÐp ®Çu tiªn ®−îc chÝnh Watson vµ Crick ®Ò xuÊt n¨m
1953 ®ång thêi víi viÖc m« t¶ m« h×nh chuçi xo¾n kÐp cña ph©n tö ADN. Tuy vËy, lóc ®ã
nh÷ng hiÓu biÕt liªn quan ®Õn qu¸ tr×nh sao chÐp ADN cßn rÊt s¬ l−îc. M« h×nh ph©n tö
ADN mµ Watson vµ Crick ®· ®Ò xuÊt cã c¬ chÕ sao chÐp b¸n b¶o toµn. NghÜa lµ, mçi
m¹ch polynucleotide trong ph©n tö ADN sîi kÐp bè (mÑ) sÏ ®−îc dïng lµm khu«n ®Ó tæng
hîp nªn mét ph©n tö ADN sîi kÐp míi. KÕt qu¶ lµ mçi mét ph©n tö ADN sîi kÐp con sÏ

57
§inh §oµn Long

mang mét m¹ch cò cã nguån gèc tõ ph©n tö ADN gèc vµ mét m¹ch ®−îc tæng hîp míi
(l−u ý: trong gi¸o tr×nh nµy, “sîi” ®−îc dïng ®Ó diÔn ®¹t tr¹ng th¸i axit nucleic gåm 2
m¹ch ®¬n, cßn “m¹ch” ®Ó chØ mét chuçi polynucleotide ®¬n nhÊt). Watson vµ Crick ®· ®Ò
xuÊt m« h×nh sao chÐp ADN nh− vËy chØ dùa vµo c¸c th«ng sè ho¸ lý cña ADN ®· biÕt khi
®ã. Ph¶i 5 n¨m sau, m« h×nh nµy míi ®−îc Meselson vµ Stahl chøng minh b»ng thùc
nghiÖm (h×nh 3.1). Ngoµi ra, c¸c nghiªn cøu sau nµy cho thÊy c¸c m¹ch ®¬n cña ADN sîi
kÐp tæng hîp míi ®−îc tiÕn hµnh theo hai ph−¬ng thøc kh¸c nhau. Trong ®ã, mét phÇn
®−îc tæng hîp liªn tôc, nghÜa lµ c¸c nucleotide ®−îc “l¾p r¸p” lÇn l−ît theo nguyªn t¾c bæ
sung tõ ®Çu nµy ®Õn ®Çu kia cña m¹ch khu«n (theo chiÒu m¹ch khu«n 3’ → 5’) ®−îc gäi
lµ m¹ch dÉn ®Çu (leading strand). Cßn mét phÇn ®−îc tæng hîp theo kiÓu gi¸n ®o¹n,
trong ®ã c¸c ®o¹n ADN nhá ®−îc tæng hîp riªng rÏ (do chiÒu m¹ch khu«n lµ 5’ → 3’) vµ
®−îc gäi lµ c¸c ®o¹n Okazaki, råi sau ®ã nèi l¹i víi nhau, gäi lµ m¹ch theo sau (lagging
strand). KiÓu sao chÐp ADN sîi kÐp nh− vËy ®−îc gäi lµ kiÓu (ph−¬ng thøc) sao chÐp
nöa gi¸n ®o¹n.
§Ó tiÖn cho qu¸ tr×nh ph©n tÝch vµ nghiªn cøu, gièng nh− c¸c qu¸ tr×nh phiªn m·
(tæng hîp ARN) vµ dÞch m· (tæng hîp protein) (xem ch−¬ng 4), qu¸ tr×nh sao chÐp ADN
th−êng ®−îc chia lµm ba giai ®o¹n: (1) khëi ®Çu sao chÐp, (2) kÐo dµi chuçi vµ (3) kÕt thóc

Ph©n tö S¶n phÈm sao S¶n phÈm sao


ADN khu«n chÐp ADN thÕ hÖ 1 chÐp ADN thÕ hÖ 2

A) KiÓu sao chÐp


b¸n b¶o toµn
+ + + +

HH HL LH HL LL LL LH
KÕt qu¶ ly t©m
gradient mong ®îi HH HL LL HL

B) KiÓu sao chÐp


b¶o toµn
+

HH HH LL
KÕt qu¶ ly t©m
gradient mong ®îi HH LL HH

C) KiÓu sao chÐp


ph©n t¸n
+ + + +

HH Hçn hîp Hçn hîp


KÕt qu¶ ly t©m
gradient mong ®îi HH HL 25%H; 75%L
H×nh 3.1. Ba kiÓu sao chÐp ADN ®−îc gi¶ thiÕt trong thÝ nghiÖm cña Meselson vµ Stahl (1958).
KiÓu sao chÐp b¶o toµn (B) bÞ lo¹i v× ë thÕ hÖ 1 kh«ng thu ®−îc 50% chuçi LL vµ 50% chuçi HH. KiÓu sao
chÐp ph©n t¸n (C) còng bÞ lo¹i v× ë thÕ hÖ 2 kh«ng thu ®−îc mét b¨ng gradient hçn hîp duy nhÊt. KÕt qu¶
thÝ nghiÖm thùc tÕ trïng khíp với m« h×nh sao chÐp b¸n b¶o toµn cña Watson vµ Crick (1953). H lµ ®o¹n
tr×nh tù ADN cña sîi lµm khu«n ban ®Çu ®−îc h×nh thµnh tõ c¸c nucleotide chøa 15N (H = heavy); L lµ
®o¹n tr×nh tù ADN ®−îc tæng hîp míi tõ c¸c nucleotide ®−îc cÊu t¹o tõ 14N (L = light).

58
Ch−¬ng 3. Sao chÐp axit nucleic

trïng hîp chuçi. Trong phÇn ®Çu cña ch−¬ng nµy, chóng ta sÏ ®Ò cËp ®Õn m« h×nh sao
chÐp ph©n tö ADN sîi kÐp lµ m« h×nh phæ biÕn ë phÇn lín c¸c loµi sinh vËt (kÓ c¶
prokaryote vµ eukaryote). PhÇn sau ®Ò cËp mét sè m« h×nh sao chÐp vËt chÊt di truyÒn ë
mét sè virut mµ vËt chÊt di truyÒn cña chóng kh«ng ph¶i lµ ADN sîi kÐp.

3.1.2. M« h×nh sao chÐp ADN sîi kÐp


Cho ®Õn nay, qu¸ tr×nh sao chÐp ADN ë prokaryote, ®Æc biÖt lµ E. coli ®−îc hiÓu
biÕt ®Çy ®ñ h¬n c¶. ë eukaryote, do tÝnh phøc t¹p h¬n vÒ kÝch th−íc vµ cÊu tróc hÖ gen,
vÉn cßn mét sè khÝa c¹nh cña qu¸ tr×nh sao chÐp ADN vÉn ch−a ®−îc biÕt ®Çy ®ñ. Tuy
nhiªn, c¸c dÉn liÖu thùc nghiÖm cho thÊy c¸c qu¸ tr×nh sao chÐp ADN ë prokaryote vµ
eukaryote c¬ b¶n gièng nhau, ®Æc biÖt vÒ c¸c nguyªn t¾c hãa sinh vµ sinh häc ph©n tö. ë
®©y, chóng ta sÏ xem xÐt m« h×nh sao chÐp ADN ë E. coli, vµ ph©n tÝch mét sè ®Æc ®iÓm
®Æc thï trong sao chÐp ADN ë eukaryote.
3.1.2.1. C¸c thµnh phÇn tham gia sao chÐp ADN ë E. coli
Qu¸ tr×nh sao chÐp ph©n tö ADN sîi kÐp ë E. coli cã sù tham gia cña nhiÒu thµnh
phÇn, bao gåm c¸c thµnh phÇn c¬ b¶n nh− sau (xem c¸c h×nh 3.2, 3.3 vµ b¶ng 3.1):
1) ADN khu«n (template DNA): ®ã lµ tr×nh tù c¸c nucleotide thuéc ph©n tö ADN
gèc ®−îc sö dông lµm nguån th«ng tin ®Ó tiÕn hµnh sao chÐp (tæng hîp) nªn c¸c
ph©n tö ADN con dùa trªn nguyªn t¾c liªn kÕt bæ sung (liªn kÕt Chargaff) gi÷a
c¸c nucleotide.
2) §iÓm khëi ®Çu sao chÐp (origin): ®©y lµ mét tr×nh tù nucleotide ®Æc hiÖu trªn
m¹ch ADN khu«n ®−îc phøc hÖ khëi ®Çu sao chÐp nhËn ra, g¾n vµo vµ b¾t ®Çu
sao chÐp.

C¸c ®o¹n Okazaki

DnaB 5'

M¹ch theo sau (lagging strand)

5' Ch¹c sao chÐp



M¹ch dÉn ®Çu (leading strand)
3'

Protein Rep
3'

Protein SSB

H×nh 3.2. Sù khëi ®Çu sao chÐp ph©n tö ADN sîi kÐp. Ph©n tö ADN ®−îc gi·n xo¾n tại vÞ trÝ khëi ®Çu sao chÐp
nhê helicase (DnaB + Rep). Trong ®ã, tiÓu phÇn Rep liªn kÕt vµo m¹ch khu«n tæng hîp m¹ch dÉn ®Çu (m¹ch ®−îc
tæng hîp liªn tôc), vµ DnaB (helicase II) liªn kÕt vµo m¹ch khu«n tæng hîp m¹ch theo sau (m¹ch ®−îc tæng hîp
gi¸n ®o¹n víi nhiÒu ®o¹n Okazaki). Protein SSB liªn kÕt vµo hai m¹ch khu«n ng¨n c¶n chóng liªn kÕt trë l¹i.

59
§inh §oµn Long
ADN pol III
M¹ch dÉn ®Çu Protein Rep Ph©n tö ADN mÑ
5’ 5’
3’ 3’
Protein SSB Helicase II
Primosome
3’
5’
M¹ch theo sau (ra chËm)
§o¹n ARN måi
§o¹n Okazaki ®ang
®−îc tæng hîp

5’ 5’
3’ 3’

Primosome tæng hîp Hai ®o¹n Okazaki ®−îc nèi


®o¹n måi ARN míi víi nhau nhê ADN ligase
5’
3’
§o¹n Okazaki ®−îc tæng hîp hoµn chØnh §o¹n ARN måi ®−îc thay
thÕ nhê ADN polymerase I

5’ 5’
3’ 3’

3’
5’
§o¹n Okazaki
§o¹n Okazaki ®−îc tæng
míi b¾t ®Çu
hîp phÝa tr−íc
®−îc tæng hîp
H×nh 3.3. Qu¸ tr×nh sao chÐp ADN sîi kÐp. Sîi theo sau quay vßng, nhê vËy phøc hÖ sao chÐp (gåm Ýt
nhÊt hai enzym ADN pol I vµ III) cã thÓ bæ sung c¸c deoxyribonucleotide vµo ®Çu 3'-OH cña m¹ch
polynucleotide míi ®ang ®−îc kÐo dµi.

3) C¸c lo¹i protein tham gia sao chÐp ADN:


+ C¸c protein DnaA, DnaB, DnaC, Rep, IHF, FIS: ®©y lµ nhãm c¸c protein
cÇn thiÕt ®Ó nhËn ra ®iÓm khëi ®Çu sao chÐp vµ cã t¸c dông t¸ch (gi·n xo¾n)
hai m¹ch ®¬n cña ph©n tö ADN sîi kÐp sau khi chóng t¸ch khái nhau sau giai
®o¹n khëi ®Çu sao chÐp.
+ Protein b¸m m¹ch ®¬n SSB (single strand binding protein): protein nµy cã vai
trß ng¨n c¶n hai m¹ch ®¬n sau khi gi·n xo¾n kh«ng liªn kÕt trë l¹i víi nhau,
nhê vËy qu¸ tr×nh sao chÐp cã thÓ diÔn ra.
4) C¸c nucleotide: ®ã lµ c¸c deoxyribonucleotide triphosphate (dNTP) vµ d¹ng
ribonucleotide triphosphate cña c¸c baz¬ nit¬ adenine, guanine, cytosine vµ
uracil (NTP). C¸c ph©n tö nµy võa ®ãng vai trß lµ c¸c ®¬n vÞ cÊu tróc nªn ADN,
võa lµ nguån cung cÊp n¨ng l−îng cho qu¸ tr×nh sao chÐp (vÝ dô: ATP, GTP, …).
5) C¸c enzym: cã rÊt nhiÒu enzym tham gia vµo qu¸ tr×nh sao chÐp ADN, nh−ng
chóng ta chØ nh¾c ®Õn mét sè enzym cã vai trß quan träng nhÊt theo thø tù tham
gia vµo qu¸ tr×nh sao chÐp ph©n tö ADN sîi kÐp, gåm cã:
a) Gyrase: ®©y lµ mét enzym topoisomerase lo¹i II, cã vai trß th¸o xo¾n vµ gì rèi
ph©n tö ADN sîi kÐp chuÈn bÞ cho ho¹t ®éng lµm gi·n xo¾n hoµn toµn ph©n
tö ADN bëi enzym helicase ë b−íc khëi ®Çu sao chÐp; ®ång thêi enzym nµy cã
vai trß gì rèi vµ t¸ch hai ph©n tö ADN con h×nh thµnh khi qu¸ tr×nh sao chÐp
kÕt thóc.

60
Ch−¬ng 3. Sao chÐp axit nucleic

b) Helicase: enzym lµm gi·n xo¾n ph©n


O O
tö ADN sîi kÐp, chuÈn bÞ s½n sµng ..
cho qu¸ tr×nh sao chÐp ADN. E Lys NH2 + N R O P O P O R A

c) ADN primase: ®©y lµ c¸c enzym cÇn -


O O-
thiÕt cho qu¸ tr×nh tæng hîp ®o¹n NAD+

ARN måi, lµ mét yªu cÇu b¾t buéc NMN+
cña qu¸ tr×nh sao chÐp ADN.
d) C¸c enzym ADN polymerase (ADN O

pol): cã 5 lo¹i ADN pol ®−îc t×m thÊy +


E Lys NH2 P O R A
ë E. coli (kÝ hiÖu ADN pol I – V).
Trong ®ã ADN pol III lµ enzym chÝnh O-

thùc hiÖn ph¶n øng tæng hîp ADN,


cã vai trß xóc t¸c ph¶n øng kÐo dµi
chuçi polynucleotide b¾t ®Çu tõ ®o¹n 
ARN måi ®Õn hÕt m¹ch ADN lµm
khu«n. ADN pol I cã vai trß lo¹i bá + E Lys NH2
®o¹n måi ARN vµ tæng hîp thay thÕ
vµo ®ã ®o¹n ADN t−¬ng øng. C¸c
ADN pol II, IV vµ V cã vai trß chÝnh
trong c¸c ho¹t ®éng söa ch÷a ADN. R A
TÊt c¶ c¸c ADN pol ®Òu sö dông
ADN lµm m¹ch khu«n vµ ®Òu cã 
chøc n¨ng ®äc söa. AMP
E Lys NH2
f) ADN ligase: Enzym nèi c¸c ®o¹n
Okazaki n»m kÒ nhau b»ng viÖc xóc O
t¸c h×nh thµnh liªn kÕt
O P O
phosphodieste gi÷a c¸c ®o¹n nµy
(h×nh 3.4). O-

H×nh 3.4. Nguyªn lý ho¹t ®éng cña ADN ligase ë


E. coli. ë eukaryote vµ T4 ADN ligase, ATP thay
cho NAD +. V× vËy, s¶n phÈm t¹o ra ë b−íc  thay
cho NMN+ lµ pyrophosphate (PPi).

B¶ng 3.1. Chøc n¨ng cña mét sè gen vµ tr×nh tù ADN liªn quan ®Õn sao chÐp ADN ë E. coli
S¶n phÈm cña gen Chøc n¨ng chÝnh Gen
ADN polymerase I (ADN pol I) Tæng hîp ADN; thay thÕ ®o¹n måi ARN; ®äc söa polA
ADN polymerase II (ADN pol II) Söa ch÷a ADN polB
ADN polymerase III (ADN pol III) Enzym tæng hîp ADN chÝnh; ®äc söa dnaE, dnaQ, holE
ADN polymerase IV (ADN pol IV) Söa ch÷a ADN dinB
ADN polymerase V (ADN pol V) Söa ch÷a ADN umuDC
Protein DnaA G¾n vµo tr×nh tù OriC; khëi ®Çu sao chÐp dnaA
Protein IHF Protein liªn kÕt ADN himA
Protein FIS Protein liªn kÕt ADN fis
Helicase (DnaB vµ Rep) Gi·n xo¾n ADN vµ ho¹t hãa primase dnaB (uvrD, rep)
Protein DnaC T¹o phøc víi DnaB, thóc ®Èy DnaB liªn kÕt ADN dnaC
Primase Tæng hîp ®o¹n måi ARN dnaG
Protein SSB (b¸m sîi ®¬n) Ng¨n c¶n hai m¹ch ADN liªn kÕt bæ sung ssb
ADN ligase Enzym nèi c¸c ®o¹n ADN víi nhau lig
Gyrase (mét lo¹i topoisomerase II) Enzym gì rèi ADN vµ th¸o xo¾n gyrA, gyrB
Tr×nh tù khëi ®Çu sao chÐp oriC VÞ trÝ khëi ®Çu sao chÐp oriC
Tr×nh tù kÕt thóc sao chÐp ter VÞ trÝ kÕt thóc sao chÐp ter
Protein TBP (Protein liªn kÕt ter) Dõng ch¹c sao chÐp tus

61
§inh §oµn Long

3.1.2.1.1. ADN m¹ch khu«n


MÆc dï ADN polymerase I vµ III lµ c¸c enzym xóc t¸c trùc tiÕp ph¶n øng tæng
hîp chuçi ADN, nh−ng c¶ hai enzym nµy ®Òu kh«ng cã kh¶ n¨ng tù ®éng l¾p r¸p vµ kÕt
nèi c¸c nucleotide theo mét trËt tù bÊt kú, còng nh− kh«ng cã kh¶ n¨ng tù ®éng khëi
®Çu qu¸ tr×nh sao chÐp ADN. V× vËy, ®Ó cã thÓ ho¹t ®éng ®−îc, hai enzym nµy ph¶i dùa
vµo trËt tù cña c¸c nucleotide ®· ®−îc x¸c ®Þnh trong ph©n tö ADN gèc, tøc lµ c¸c m¹ch
lµm khu«n.
Khi ph©n tö ADN sîi kÐp ®ang ®−îc tæng hîp, c¸c nucleotide míi ®−îc chän läc
b»ng c¸ch ghÐp cÆp víi c¸c nucleotide trªn m¹ch khu«n. Qu¸ tr×nh ghÐp cÆp nµy ®−îc
thùc hiÖn dùa theo nguyªn t¾c Chargaff, nghÜa lµ A liªn kÕt bæ sung víi T, G liªn kÕt víi
C (vµ ng−îc l¹i). Nh− vËy, tr×nh tù c¸c nucleotide trªn m¹ch ADN khu«n sÏ lu«n x¸c ®Þnh
tr×nh tù c¸c nucleotide trªn ph©n tö ADN sîi kÐp míi.
3.1.2.1.2. §iÓm khëi ®Çu sao chÐp
ë c¸c prokaryote, sù khëi ®Çu qu¸ tr×nh sao chÐp ADN kh«ng ph¶i b¾t ®Çu ë mét
®iÓm bÊt kú däc theo ph©n tö ADN. Thay vµo ®ã, sù sao chÐp ADN th−êng b¾t ®Çu ë
nh÷ng vÞ trÝ nhÊt ®Þnh, gäi lµ ®iÓm khëi ®Çu sao chÐp (replication origin).
ë E. coli, chØ cã mét tr×nh tù khëi ®Çu sao chÐp duy nhÊt gåm 245 cÆp baz¬ nit¬
(bp), ®−îc gäi lµ tr×nh tù oriC. §o¹n tr×nh tù nµy chøa mét côm tr×nh tù gåm ba b¶n
sao mét ®o¹n lÆp 13 bp giµu A=T (gäi lµ ®o¹n lÆp giµu A=T) vµ bèn b¶n sao mét ®o¹n
lÆp gåm 9 bp. §o¹n lÆp giµu A=T rÊt dÔ biÕn tÝnh (t¸ch thµnh m¹ch ®¬n) vµ lµ ®Æc ®iÓm
cã ë c¸c tr×nh tù khëi ®Çu sao chÐp ë mäi sinh vËt. VÞ trÝ ®o¹n lÆp gåm 9 bp lµ vÞ trÝ liªn
kÕt cña DnaA. Khi DnaA liªn kÕt vµo oriC, nã lµm thay ®æi cÊu h×nh kh«ng gian cña
ADN t¹i vÞ trÝ nµy, ®ång thêi huy ®éng DnaB (cã ho¹t tÝnh helicase) ®Õn vÞ trÝ khëi ®Çu
sao chÐp. Nh×n chung, giai ®o¹n khëi ®Çu sao chÐp ë E. coli ®−îc ghi nhËn b»ng ba ho¹t
®éng chÝnh:
(1) NhËn biÕt tr×nh tù khëi ®Çu sao chÐp.
(2) Lµm biÕn tÝnh ph©n tö ADN sîi kÐp ë vÞ trÝ khëi ®Çu sao chÐp (th«ng qua viÖc
lµm gÉy c¸c liªn kÕt hydro gi÷a hai m¹ch ®¬n t¹i ®o¹n lÆp giµu A=T)
(3) Enzym helicase g¾n vµo tr×nh tù khëi ®Çu sao chÐp vµ ho¹t ®éng.
§èi víi c¸c eukaryote, nh− nÊm men vµ ®éng vËt, vÞ trÝ vµ cÊu tróc cña c¸c ®iÓm
khëi ®Çu sao chÐp khã x¸c ®Þnh h¬n do cÊu tróc cña hÖ gen cña c¸c sinh vËt nµy phøc t¹p
h¬n. Nh×n chung, hÖ gen nh©n cña eukaryote cã nhiÒu ®iÓm khëi ®Çu sao chÐp, vµ tr×nh
tù ë c¸c ®iÓm khëi ®Çu sao chÐp ë eukaryote cã møc ®é biÕn ®æi lín.
Sau khi sù khëi ®Çu sao chÐp ADN ®· diÔn ra, qu¸ tr×nh tæng hîp ph©n tö ADN sîi
kÐp trong c¶ hai lo¹i tÕ bµo prokaryote vµ eukaryote ®Òu diÔn ra theo hai chiÒu, däc theo
ch¹c sao chÐp, nghÜa lµ tiÕn vÒ c¶ hai phÝa cña ph©n tö ADN.

3.1.2.1.3. C¸c lo¹i protein tham gia sao chÐp ADN


ë E. coli, protein DnaA lµ lo¹i protein cã vai trß nhËn ra vµ g¾n vµo tr×nh tù khëi
®Çu sao chÐp. Sau khi DnaA ®· g¾n vµo vÞ trÝ khëi ®Çu sao chÐp, mét phøc hÖ DnaB -
DnaC cã ¸i lùc cao víi DnaA sÏ liªn kÕt vµo vÞ trÝ khëi ®Çu sao chÐp ®Ó h×nh thµnh nªn
phøc hÖ khëi ®Çu sao chÐp hoµn chØnh gåm 3 protein nµy. Trong ®ã, DnaB cã ho¹t tÝnh
gi·n xo¾n cña helicase vµ gãp phÇn trùc tiÕp lµm biÕn tÝnh (t¸ch thµnh 2 m¹ch ®¬n) ph©n
tö ADN sîi kÐp.

62
Ch−¬ng 3. Sao chÐp axit nucleic

Nh− ®· nãi ë trªn, trong qu¸ tr×nh sao chÐp ADN, hai m¹ch ®¬n cña ph©n tö ADN
sîi kÐp míi ®−îc tæng hîp vÒ hai phÝa cña ch¹c sao chÐp theo hai kiÓu kh¸c nhau. Mét
m¹ch míi ®−îc tæng hîp liªn tôc (dùa trªn m¹ch khu«n theo chiÒu 3’ → 5’) gäi lµ m¹ch
dÉn ®Çu, cßn m¹ch thø hai ®−îc tæng hîp gi¸n ®o¹n qua nh÷ng ®o¹n nhá Okazaki ®−îc gäi
lµ m¹ch theo sau. Trong c¶ hai tr−êng hîp, m¹ch polynucleotide míi ®Òu ®−îc tæng hîp
theo chiÒu 5’ → 3’. Lóc nµy, enzym ADN helicase (do gen dnaB m· hãa) th−êng ë d¹ng dÞ
phøc kÐp liªn kÕt trªn c¸c hai m¹ch vµ lµm gi·n xo¾n ph©n tö ADN vÒ c¶ hai phÝa cña
ch¹c sao chÐp. N¨ng l−îng cÇn cho sù gi·n xo¾n nµy thu ®−îc tõ sù thñy ph©n ATP. Cø
mçi lÇn t¸ch mét cÆp baz¬ nit¬, helicase sö dông n¨ng l−îng tõ hai ph©n tö ATP.
C¸c protein SSB cã vai trß thiÕt yÕu gi÷ cho c¸c m¹ch ®¬n cña ph©n tö ADN sîi
kÐp lµm khu«n ®· t¸ch ra kh«ng liªn kÕt trë l¹i trong qu¸ tr×nh sao chÐp ADN. C¸c
protein nµy ng¨n c¶n sù h×nh thµnh liªn kÕt hydro gi÷a c¸c baz¬ nit¬ bæ sung trªn hai
m¹ch ®èi diÖn.
3.1.2.1.4. C¸c lo¹i nucleotide
Qu¸ tr×nh sao chÐp ADN sîi kÐp trong tÕ bµo ®ßi hái m«i tr−êng néi bµo ph¶i cung
cÊp ®Çy ®ñ t¸m lo¹i nucleotide kh¸c nhau, gåm bèn lo¹i deoxyribonucleotide vµ bèn lo¹i
ribonucleotide. Trong ®ã, bèn lo¹i deoxyribonucleotide cÇn cho sù tæng hîp vµ kÐo
dµi chuçi ADN lµ deoxyadenine-5-triphosphate (dATP), deoxyguanosine-5-triphosphate
(dGTP), deoxycytidine-5-triphosphate (dCTP) vµ deoxythymidine-5-triphosphate
(dTTP). Bèn lo¹i ribonucleotide cÇn cho sù tæng hîp ®o¹n måi (cã b¶n chÊt ARN) lµ
adenosine-5-triphosphate (ATP), guanosine-5-triphosphate (GTP), cytidine-5-
triphosphate (CTP) vµ uridine-5-triphosphate (UTP).
VÒ sù h×nh thµnh cña c¸c nucleotide trong tÕ bµo: trong c¸c ph¶n øng cña qu¸ tr×nh
h« hÊp, glucose vµ c¸c axit bÐo bÞ oxy hãa, c¸c ®iÖn tö bÞ t¸ch ra vµ chuyÓn vµo chuçi
truyÒn ®iÖn tö trong c¸c cytochrome. Chuçi truyÒn ®iÖn tö nµy liªn kÕt víi mét hÖ thèng
c¸c enzym mµ qua ®ã, chóng chuyÓn ho¸ n¨ng l−îng ®−îc l−u gi÷ trong c¸c ®iÖn tö thµnh
n¨ng l−îng cao n¨ng trong ATP qua qu¸ tr×nh photphoryl hãa - oxy ho¸. KÕt qu¶ cña
qu¸ tr×nh nµy lµ chuyÓn hãa adenosine diphosphate (ADP) thµnh adenosine triphosphate
(ATP). Nh− vËy cã thÓ nãi sù trao ®æi chÊt cña glucose vµ axit bÐo ®· gi¸n tiÕp cung cÊp
n¨ng l−îng vµ nguyªn liÖu cho qu¸ tr×nh sao chÐp ADN. C¸c ph©n tö ATP, sau khi ®−îc
t¹o ra ®−îc dïng ®Ó chuyÓn hãa thµnh c¸c ph©n tö nucleotide triphosphate kh¸c.
Trong qu¸ tr×nh chuyÓn hãa ®Ó t¹o ra c¸c ph©n tö nucleotide cã n¨ng l−îng cao
(nh− ATP, GTP…), cã hai ph¶n øng c¬ b¶n do enzym xóc t¸c. Ph¶n øng ®Çu tiªn do
enzym monophosphate kinase (vÝ dô: adenylate kinase) xóc t¸c, sÏ chuyÓn ho¸ d¹ng
nucleoside monophosphate thµnh d¹ng diphosphate nhê viÖc sö dông mét ph©n tö ATP,
vÝ dô: AMP + ATP → 2 ADP, hoÆc GMP + ATP → GDP + ADP. Sau ®ã, mét enzym thø
hai gäi lµ nucleoside diphosphate kinase sÏ tiÕn hµnh phosphoryl hãa c¸c ph©n tö d¹ng
diphosphate thµnh d¹ng triphosphate, vÝ dô: GDP + ATP → GTP + ADP.
Qu¸ tr×nh chuyÓn hãa ®Ó t¹o ra c¸c nucleotide d¹ng deoxyribonucleotide cÇn mét
nhãm c¸c enzym kh¸c, gäi chung lµ ribonucleotide reductase. Mçi mét enzym reductase
®Æc tr−ng cho tõng lo¹i ribonucleotide t−¬ng øng. C¬ chÊt cña lo¹i enzym nµy lµ c¸c d¹ng
nucleoside diphosphate, ch¼ng h¹n ADP ®−îc chuyÓn ho¸ thµnh dADP, hay CDP ®−îc
chuyÓn ho¸ thµnh dCDP. C¸c hîp chÊt nµy sau ®ã sÏ ®−îc phosphoryl ho¸ ®Ó h×nh thµnh
d¹ng triphosphate (dNTP) s½n sµng cho qu¸ tr×nh tæng hîp ADN.
Trong qu¸ tr×nh sao chÐp ADN, c¸c nucleotide ®ång thêi cã 3 chøc n¨ng quan träng:
1) lµ nguyªn liÖu (thµnh phÇn) tham gia cÊu tróc ADN (vµ ARN).

63
§inh §oµn Long

2) l−u tr÷ th«ng tin di truyÒn (nãi chÝnh x¸c h¬n lµ tr×nh tù c¸c nucleotide trong
ph©n tö ADN sîi khu«n gi÷ chøc n¨ng nµy).
3) cung cÊp n¨ng l−îng (ë d¹ng triphosphate) cho qu¸ tr×nh sao chÐp.
Riªng víi chøc n¨ng thø ba, chóng ta chó ý r»ng ph¶n øng tæng hîp ADN lµ mét
ph¶n øng trïng hîp tiªu tèn n¨ng l−îng. C¸c nucleotide tham gia ph¶n øng tæng hîp
ADN ë d¹ng triphosphate, nh−ng trong ph©n tö ADN nã ë d¹ng monophosphate. Trong
qu¸ tr×nh tæng hîp ADN, c¸c ph©n tö nucleotide triphosphat khi kÕt hîp vµo chuçi
polynucleotide sÏ ®ång thêi gi¶i phãng ra hai nhãm phosphate (gäi lµ pyrophosphate, ký
hiÖu lµ PPi) vµ n¨ng l−îng ®−îc sö dông ®Ó g¾n kÕt c¸c ph©n tö nucleoside
monophosphate vµo chuçi ADN. Qu¸ tr×nh nµy cã thÓ m« t¶ v¾n t¾t nh− sau: ATP →
AMP + PPi + n¨ng l−îng → ADN.
3.1.2.1.5. C¸c lo¹i enzym
a) Gyrase
Tr−íc khi qu¸ tr×nh sao chÐp ADN diÔn ra, ph©n tö ADN ®ang ®−îc cuén xo¾n rÊt
chÆt ph¶i ®−îc gi·n xo¾n vµ t¸ch thµnh hai m¹ch ®¬n ë vÞ trÝ khëi ®Çu sao chÐp. Qu¸
tr×nh gi·n xo¾n cña hai m¹ch ®¬n trªn ph©n tö ADN lµ cÇn thiÕt ®Ó lµm gi¶m søc c¨ng
cña c¸c liªn kÕt däc ph©n tö ADN ë vÞ trÝ ®iÓm khëi ®Çu sao chÐp. Khi sù sao chÐp cña
toµn bé ph©n tö ADN kÕt thóc, hai ph©n tö ADN con ®−îc h×nh thµnh sÏ ph¶i t¸ch nhau
ra. TÊt c¶ c¸c ho¹t ®éng nµy ®−îc thùc hiÖn bëi mét enzym gäi lµ gyrase. Enzym nµy gióp
lµm gi¶m søc c¨ng trong ph©n tö ADN b»ng c¸ch lµm g·y liªn kÕt phosphodieste trªn
hai m¹ch ADN trong mét thêi gian ng¾n. Sù bÎ g·y liªn kÕt nµy cã thÓ x¶y ra víi tÇn
suÊt 1 trong kho¶ng 10 nucleotide.
b) Helicase
Ho¹t tÝnh cña helicase thùc chÊt lµ ho¹t tÝnh cña dÞ phøc kÐp, gåm 2 protein lµ
DnaB vµ Rep (®Ó ph©n biÖt, ng−êi ta cßn gäi protein DnaB lµ helicase II vµ Rep lµ Rep
helicase). Hai protein nµy cïng víi protein b¸m sîi ®¬n SSB cã vai trß t¸ch c¸c m¹ch ®¬n
cña ph©n tö ADN sîi kÐp b»ng viÖc lµm g·y liªn kÕt hydro gi÷a c¸c nucleotide bæ sung
gi÷a hai m¹ch. Lóc nµy, hai m¹ch ®¬n cña ph©n tö ADN sîi kÐp t¸ch nhau ra vµ viÖc g¾n
c¸c protein SSB sÏ gi÷ cho hai m¹ch kh«ng liªn kÕt trë l¹i. Cø nh− vËy, hai m¹ch ®¬n
®−îc sö dông lµm khu«n cho qu¸ tr×nh tæng hîp hai ph©n tö ADN míi. Tõ vÞ trÝ khëi
®Çu sao chÐp, hai ch¹c sao chÐp tiÕn vÒ hai phÝa vµ qu¸ tr×nh sao chÐp sÏ ®ång thêi diÔn
ra theo hai h−íng.
Trong qu¸ tr×nh sao chÐp, nÕu nh− Rep ch¹y däc theo m¹ch khu«n ®Ó tæng hîp nªn
m¹ch dÉn ®Çu (m¹ch ®−îc tæng hîp liªn tôc) th× protein DnaB g¾n vµo m¹ch khu«n ®Ó
tæng hîp nªn m¹ch theo sau (m¹ch ®−îc tæng hîp gi¸n ®o¹n). Nh− vËy, nÕu nh− ph©n tö
protein Rep di chuyÓn theo chiÒu tõ 3’ → 5’ th× DnaB di chuyÓn theo chiÒu ng−îc l¹i tõ 5’
→ 3’. Nãi c¸ch kh¸c, protein DnaB tham gia trùc tiÕp sù tæng hîp c¸c ®o¹n Okazaki.
c) ADN primase
Mét ®Æc ®iÓm ®¸ng chó ý trong qu¸ tr×nh sao chÐp ADN sîi kÐp lµ trong giai ®o¹n
khëi ®Çu cÇn cã sù tæng hîp mét ®o¹n måi kh«ng ph¶i lµ ADN mµ lµ ARN. §o¹n ARN
måi lµ ®iÒu kiÖn tiªn quyÕt ®Ó qu¸ tr×nh sao chÐp ADN cã thÓ b¾t ®Çu. Së dÜ nh− vËy lµ
bëi v× tÊt c¶ c¸c ADN polymerase ®· biÕt ®Òu kh«ng cã kh¶ n¨ng tù khëi ®Çu tæng hîp
ADN; chóng chØ cã thÓ xóc t¸c viÖc g¾n mét dNTP vµo mét m¹ch (cã thÓ lµ ADN hoÆc
ARN) ®· cã s½n ®Çu 3’-OH tù do. §o¹n ARN måi nµy cã kÝch th−íc thay ®æi (tõ 2 - 10
nucleotide) tïy tõng tÕ bµo. NÕu nh− viÖc tæng hîp m¹ch ADN dÉn ®Çu chØ cÇn mét ®o¹n

64
Ch−¬ng 3. Sao chÐp axit nucleic

ARN måi duy nhÊt (sau ®ã qu¸ tr×nh kÐo dµi chuçi ADN diÔn ra liªn tôc ®Õn hÕt chuçi);
th× viÖc tæng hîp m¹ch ADN theo sau cÇn nhiÒu ®o¹n ARN måi. Cô thÓ lµ, mçi ®o¹n
Okazaki cÇn 1 ®o¹n ARN måi riªng biÖt.
Enzym gi÷ vai trß tæng hîp ®o¹n ARN måi ®−îc gäi lµ ADN primase. Enzym nµy
thùc chÊt lµ mét ARN polymerase. Sù cÇn thiÕt ph¶i cã ADN primase trong b−íc khëi
®Çu qu¸ tr×nh sao chÐp ADN ph¶n ¸nh mét thuéc tÝnh kh¸c biÖt c¬ b¶n gi÷a ADN
polymerase vµ ARN polymerase. §ã lµ, nÕu nh− ADN polymerase cÇn ph¶i cã mét m¹ch
polynucleotide cã s½n míi cã thÓ b¾t ®Çu sù tæng hîp m¹ch ADN míi, th× ARN
polymerase kh«ng cÇn ®iÒu kiÖn nµy. C¶ hai lo¹i enzym ARN vµ ADN polymerase ®Òu cã
kh¶ n¨ng kÐo dµi c¸c chuçi polynucleotide, nh−ng chØ theo mét chiÒu duy nhÊt lµ 5’ → 3’.
§Ó tæng hîp ®o¹n ARN måi, ADN primase ®äc c¸c tr×nh tù ADN mçi lÇn mét
nucleotide trªn m¹ch khu«n vµ l¾p ghÐp c¸c baz¬ nit¬ theo nguyªn t¾c bæ sung gi÷a A víi
U, G víi C (vµ ng−îc l¹i) ®Ó h×nh thµnh nªn c¸c ®o¹n lai ADN/ARN ng¾n. V× lµ sù tæng
hîp ARN, nªn lóc nµy c¸c nucleotide cÇn thiÕt tõ m«i tr−êng lµ c¸c ribonucleotide chø
kh«ng ph¶i c¸c deoxyribonucleotide. VÒ cÊu tróc, ADN primase ë E. coli lµ mét ph©n tö
protein cã kÝch th−íc nhá gåm mét chuçi polypeptide duy nhÊt.
d) C¸c enzym ADN polymerase
N¨m 1955, Arthur Kornberg cïng c¸c ®ång nghiÖp ®· x¸c ®Þnh ®−îc enzym xóc t¸c
ph¶n øng sao chÐp ADN tõ vi khuÈn, sau nµy ®−îc gäi lµ ADN polymerase I (®−îc viÕt
t¾t lµ ADN pol I). N¨m 1959, «ng ®−îc trao gi¶i th−ëng Nobel nhê c«ng tr×nh “ph¸t hiÖn
ra c¬ chÕ sinh tæng hîp ADN”. Trong nghiªn cøu cña m×nh, Kornberg ®ång thêi x¸c ®Þnh
®−îc bèn yÕu tè thiÕt yÕu ®Ó qu¸ tr×nh sao chÐp ADN ë E. coli cã thÓ x¶y ra. ThiÕu mét
trong bèn yÕu tè nµy, qu¸ tr×nh tæng hîp ADN kh«ng thÓ diÔn ra, ®ã lµ:
1) Ph¶i cã mÆt c¶ bèn lo¹i dNTP (nÕu thiÕu mét trong bèn lo¹i A, T, G hoÆc C, sù
tæng hîp ®Òu kh«ng x¶y ra). §©y chÝnh lµ c¸c tiÒn chÊt h×nh thµnh nªn ADN;
2) Mét ®o¹n ADN ®−îc sö dông lµm khu«n;
3) Enzym ADN pol I;
4) Ion Mg2+ cÇn thiÕt cho ho¹t ®éng tèi −u cña enzym ADN pol I.
C¸c nghiªn cøu sau nµy cho thÊy: sù tæng hîp ADN lu«n cÇn mét ph©n tö ADN lµm
khu«n; nãi c¸ch kh¸c c¸c ph©n tö ADN míi lµ b¶n sao chÝnh x¸c tõng nucleotide so víi
ph©n tö ADN ban ®Çu. C¸c nghiªn cøu sau nµy còng dÉn ®Õn viÖc ph¸t hiÖn ra nhiÒu
lo¹i ADN polymerase kh¸c nhau ë prokaryote còng nh− ë eukaryote. Tuy vËy, tÊt c¶ c¸c
ADN polymerase ®Òu cã mét ®Æc ®iÓm chung lµ xóc t¸c cho ph¶n øng trïng hîp tõ c¸c
tiÒn chÊt nucleotide triphosphate (dNTP) thµnh chuçi ADN. Ph¶n øng trïng hîp chuçi
ADN nh×n chung cã ba ®Æc ®iÓm c¬ b¶n:
1. T¹i ®Çu m¹ch ADN ®ang kÐo dµi (®Çu 3’), mäi enzym ADN polymerase ®Òu xóc
t¸c ph¶n øng h×nh thµnh liªn kÕt phosphodiester gi÷a nhãm 3’-OH cña nucleotide
cuèi cïng trong chuçi víi ®Çu 5’-phosphate cña tiÒn chÊt dNTP. N¨ng l−îng ho¹t
hãa ph¶n øng nµy thu ®−îc tõ chÝnh sù gi¶i phãng nhãm pyrophosphate (~)
cña c¸c dNTP. Lóc nµy, m¹ch ADN ®ang kÐo dµi chÝnh lµ måi ®Ó ADN polymerase
cã thÓ xóc t¸c g¾n mét nucleotide míi vµo ®Çu 3’-OH tù do.
2. T¹i mçi b−íc cña qu¸ tr×nh kÐo dµi chuçi ADN, ADN polymerase t×m ®óng tiÒn
chÊt dNTP t−¬ng øng víi nucleotide trªn m¹ch khu«n theo nguyªn t¾c Chargaff,
råi “l¾p r¸p” nucleotide ®ã vµo m¹ch ®ang kÐo dµi víi tèc ®é kho¶ng 850

65
§inh §oµn Long

nucleotide/gi©y ë prokaryote vµ 60 – 90 nucleotide/gi©y ë eukaryote. Tuy qu¸


tr×nh l¾p r¸p nucleotide kh«ng chÝnh x¸c 100%, nh−ng tÇn sè sai sãt lµ rÊt thÊp.
3. ChiÒu tæng hîp m¹ch ADN míi lu«n lµ 5’ → 3’ do thuéc tÝnh cña ADN polymerase
vµ phï hîp víi xu h−íng hãa n¨ng cña ph¶n øng ®øt g·y nhãm ~ cña dNTP.
Sau c«ng tr×nh nghiªn cøu cña Kornberg, vµo ®Çu nh÷ng n¨m 1970, ng−êi ta t×m
thÊy 2 lo¹i ADN polymerase kh¸c cã ë E. coli. Cô thÓ, n¨m 1970, Gefter, Knippers vµ
Richardson ®éc lËp víi nhau t×m thÊy ADN pol II; ®Õn n¨m 1971, Gefter vµ Kornberg
cïng phèi hîp ph¸t hiÖn ra ADN pol III. Sau nµy, ë E. coli, ng−êi ta cßn t×m thÊy hai
lo¹i ADN polymerase kh¸c n÷a lµ ADN pol IV vµ ADN pol V. Trong thùc tÕ, chØ cã ADN
pol I vµ III lµ thiÕt yÕu cho sù sao chÐp ADN ë E. coli. C¸c ADN polymerase kh¸c, bao
gåm ADN pol II (do gen polB m· hãa), ADN pol IV (gen dinB) vµ ADN pol V (gen
umuDC) cã vai trß chñ yÕu trong c¸c qu¸ tr×nh söa ch÷a ADN.
ADN pol I do gen polA m· hãa, lµ mét enzym ®¬n gi¶n gåm mét chuçi polypeptide
duy nhÊt. Enzym lâi ADN pol III cã ho¹t tÝnh xóc t¸c ®−îc cÊu t¹o tõ ba chuçi
polypeptide, ®ã lµ α (do gen dnaE m· hãa), ε (gen dnaQ) vµ θ (gen holE); d¹ng ®Çy ®ñ
khëi ®Çu sao chÐp cña enzym nµy (gäi lµ ADN pol III holoenzyme) ngoµi thµnh phÇn trªn
cßn cã 6 chuçi polypeptide kh¸c.
Trong tÕ bµo, c¶ hai enzym ADN pol I vµ III ®Òu sao chÐp ADN theo chiÒu 5’ → 3’;
ngoµi ra, chóng ®Òu cã ho¹t tÝnh exonuclease theo chiÒu 3’ → 5’. Nhê ho¹t tÝnh thø hai
nµy, chóng cã thÓ c¾t bá nucleotide tõ ®Çu 3’ cña m¹ch ADN. Ho¹t tÝnh enzym nµy cã vai
trß trong söa ch÷a ADN. NÕu mét baz¬ nit¬ trong chuçi ADN bÞ l¾p r¸p sai (tÇn sè l¾p
r¸p sai cña hai enzym ADN pol I vµ III vµo kho¶ng 10-6), th× trong phÇn lín tr−êng hîp
c¸c sai sãt ®ã ®−îc ph¸t hiÖn ngay. Lóc nµy, ho¹t tÝnh exonuclease chiÒu 3’ → 5’ cña ADN
pol I vµ III sÏ gióp lo¹i bá nucleotide sai khái m¹ch ADN míi. Chøc n¨ng nµy còng gièng
nh− khi chóng ta sö dông phÝm “Back space” trªn bµn phÝm m¸y vi tÝnh. Sau khi c¾t bá
nucleotide sai háng, ADN polymerase dÞch chuyÓn ng−îc vÒ phÝa tr−íc vµ l¾p r¸p l¹i
nucleotide phï hîp. Ho¹t tÝnh exonuclease chiÒu 3’ → 5’ cña ADN polymerase chÝnh lµ c¬
chÕ ®äc söa gióp lµm gi¶m tÇn sè sao chÐp sai sãt cña c¸c ADN polymerase. Nhê ho¹t
®éng ®äc söa nµy, tÇn sè sai sãt cña ADN pol I vµ III gi¶m xuèng d−íi 10-9. NÕu nh− ho¹t
tÝnh exonuclease chiÒu 3’ → 5’ cña ADN pol I n»m trªn chuçi polypeptide duy nhÊt cña
nã, th× ho¹t tÝnh nµy ë ADN pol III n»m trªn chuçi ε vµ ®−îc thóc ®Èy bëi chuçi θ.
ADN pol I cã mét ho¹t tÝnh thø ba ®Æc thï mµ ADN pol III kh«ng cã. §ã lµ ho¹t
tÝnh exonuclease theo chiÒu 5’ → 3’, gióp enzym nµy cã thÓ lo¹i bá c¸c nucleotide tõ c¸c
m¹ch ADN hoÆc ARN b¾t ®Çu tõ ®Çu 5’. Ho¹t tÝnh nµy cña ADN pol I cã vai trß quan
träng trong qu¸ tr×nh sao chÐp ADN. Cô thÓ, chóng ta biÕt r»ng trong qu¸ tr×nh sao chÐp
ADN, c¸c ph©n tö ADN sîi kÐp míi ®−îc tæng hîp hoÆc theo kiÓu liªn tôc (m¹ch dÉn ®Çu)
hoÆc theo kiÓu gi¸n ®o¹n (m¹ch theo sau víi sù h×nh thµnh c¸c ®o¹n Okazaki). ë
prokaryote, c¸c ®o¹n Okazaki cã kÝch th−íc kho¶ng 1000 - 2000 nucleotide. Cßn ë
eukaryote, chóng cã kÝch th−íc ng¾n h¬n, kho¶ng 100 - 200 nucleotide. Trong qu¸ tr×nh
sao chÐp ADN, c¸c ®o¹n Okazaki sau khi ®−îc tæng hîp tr¶i qua b−íc hoµn thiÖn b»ng
viÖc bÞ c¾t bá ®o¹n ARN måi, råi thay vµo ®ã lµ ®o¹n ADN t−¬ng øng. Qu¸ tr×nh nµy diÔn
ra gièng hÖt ë m¹ch dÉn ®Çu. Nh−ng, nÕu nh− ë m¹ch dÉn ®Çu chØ x¶y ra mét lÇn duy
nhÊt, th× ë m¹ch theo sau viÖc lo¹i bá vµ thay thÕ ARN måi x¶y ra ë tÊt c¶ c¸c ®o¹n
Okazaki. C¸c ®o¹n Okazaki sau ®ã ®−îc nèi l¹i víi nhau ®Ó h×nh thµnh nªn m¹ch ADN
theo sau hoµn chØnh. Trong qu¸ tr×nh nµy, nÕu nh− ho¹t ®éng kÐo dµi c¸c ®o¹n Okazaki
chñ yÕu ®−îc thùc hiÖn nhê enzym ADN pol III, th× c¸c ho¹t ®éng c¾t bá c¸c ®o¹n måi
ARN vµ tæng hîp bï c¸c ®o¹n ADN t−¬ng øng lµ nhê ho¹t ®éng cña ADN pol I. Khi c¸c

66
Ch−¬ng 3. Sao chÐp axit nucleic

®o¹n Okazaki ®−îc tæng hîp míi ®· tiÕp xóc gÇn nhau, enzym nµy võa tiÕn hµnh tæng
hîp ®o¹n Okazaki phÝa tr−íc theo chiÒu 5’ → 3’, võa c¾t vµ lo¹i bá c¸c ribonucleotide
(ARN) ë ®Çu 5’ cña ®o¹n Okazaki kÕ tiÕp vµ cø thÕ tiÕn hµnh ®Õn khi lo¹i bá hÕt ®o¹n
måi ARN. Lóc nµy hai ®o¹n Okazaki chØ cßn c¸ch nhau mét liªn kÕt phosphodieste. Chøc
n¨ng nµy ®−îc gäi lµ ®äc m· qua khe Okazaki.
f) ADN ligase
ADN ligase cã nhiÖm vô nèi c¸c ®o¹n ADN víi nhau trong qu¸ tr×nh sao chÐp, söa
ch÷a vµ t¸i tæ hîp. TÊt c¶ c¸c enzym ligase sÏ lµm nhiÖm vô nèi nhãm phosphoryl ë ®Çu
5’ víi nhãm hydroxyl ë ®Çu 3’ cña hai ®o¹n ADN liÒn kÒ. Nhê vËy, ADN ligase chÝnh lµ
enzym nèi c¸c ®o¹n Okazaki l¹i víi nhau (sau khi ADN pol I ®· hoµn thµnh ho¹t ®éng
®äc m· qua khe Okazaki) ®Ó h×nh thµnh nªn m¹ch ADN hoµn chØnh.
Ph¶n øng nèi diÔn ra qua mét sè b−íc liªn tôc nhê ADN ligase vµ sö dông n¨ng
l−îng hoÆc tõ ATP (ë eukaryote) hoÆc tõ NAD+ (ë prokaryote).
Trong qu¸ tr×nh sao chÐp ADN, enzym ADN ligase ho¹t ®éng nh− sau (h×nh 3.4):
1) Nhãm adenyl cña NAD+ (hoÆc ATP) ®−îc chuyÓn vµo ADN ligase.
2) Enzym nµy sau ®ã xóc t¸c viÖc chuyÓn nhãm adenyl vµo ®Çu 5’ phosphate cña
khe sao chÐp (khe n»m gi÷a hai ®o¹n Okazaki kÕ tiÕp) ®Ó h×nh thµnh nªn mét
nhãm pyrophosphate (PPi) vµ AMP g¾n vµo ®Çu 5’-.
3) TiÕp theo, ADN ligase xóc t¸c viÖc g¾n nhãm 5’- vµo vÞ trÝ 3’-OH cña ®o¹n
Okazaki kÕ tiÕp, ®ång thêi gi¶i phãng mét ph©n tö AMP.
Nhê vËy, mét liªn kÕt phophodiester gi÷a nucleotide ë ®Çu 3’ cña ®o¹n Okazaki
phÝa tr−íc vµ nucleotide ë ®Çu 5’ cña ®o¹n Okazaki kÕ tiÕp ®−îc h×nh thµnh (h×nh 3.4).
3.1.2.2. Sao chÐp ADN ë prokaryote (sinh vËt nh©n s¬)
Trong mét chu tr×nh tÕ bµo, sù sao chÐp ADN lµ mét qu¸ tr×nh ®−îc ®iÒu khiÓn chÆt
chÏ vµ chØ x¶y ra mét lÇn duy nhÊt. ë E. coli, ph©n tö ADN ®−îc sao chÐp víi tèc ®é rÊt
cao (xÊp xØ 850 nucleotide/gi©y). Nhê vËy, toµn bé nhiÔm s¾c thÓ trong tÕ bµo cña vi
khuÈn nµy cã thÓ ®−îc sao chÐp chØ trong vßng 40 phót. §Õn nay, ¶nh h−ëng cña c¸c yÕu
tè m«i tr−êng lªn sù khëi ®Çu sao chÐp ë prokaryote vµ eukaryote ch−a ®−îc biÕt ®Çy ®ñ.
Nh−ng, nhiÒu b»ng chøng cho thÊy: ë vi khuÈn, thµnh phÇn m«i tr−êng dinh d−ìng cã
¶nh h−ëng râ rÖt; cßn ë eukaryote, sù cã mÆt hay v¾ng mÆt cña c¸c yÕu tè sinh tr−ëng néi
bµo liªn quan chÆt chÏ ®Õn sù khëi ®Çu sao chÐp ADN. §iÒu nµy cã nghÜa lµ, sù khëi ®Çu
sao chÐp ADN cã lÏ ®−îc ®iÒu khiÓn nghiªm ngÆt bëi c¸c tÝn hiÖu tõ m«i tr−êng néi bµo
hoÆc ngo¹i bµo. Qu¸ tr×nh ®iÒu khiÓn sù sao chÐp ADN nh×n chung cÇn ®¶m b¶o c¸c tiªu
chÝ sau:
1. Thêi ®iÓm sao chÐp ADN cã liªn quan chÆt chÏ víi c¸c sù kiÖn sinh lý, sinh ho¸
x¶y ra trong qu¸ tr×nh trao ®æi chÊt cña tÕ bµo vµ ho¹t ®éng ph©n bµo.
2. Sù sao chÐp ADN ®−îc ®iÒu khiÓn sao cho nã chØ x¶y ra mét lÇn duy nhÊt trong
mçi chu tr×nh tÕ bµo.
3. Sù khëi ®Çu sao chÐp ADN chØ x¶y ra mét khi c¸c ®iÒu kiÖn m«i tr−êng cÇn cho
sù sinh tr−ëng vµ ph¸t triÓn cña tÕ bµo lµ s½n sµng vµ ®Çy ®ñ. Khi thiÕu c¸c ®iÒu
kiÖn nµy, sù sao chÐp ADN bÞ øc chÕ. Sù øc chÕ nµy còng cã thÓ x¶y ra khi ADN
bÞ h− háng hay khi tÕ bµo ®· ®¹t ®Õn tr¹ng th¸i biÖt ho¸ cuèi cïng.

67
§inh §oµn Long

VÝ dô nh−, ë mét sè vi khuÈn, bao gåm Bacillus vµ Clostridium, néi bµo tö ®−îc
xem lµ giai ®o¹n biÖt ho¸ cuèi cïng. ë eukaryote, nhÊt lµ ë c¸c sinh vËt ®a bµo,
th× sù ®iÒu khiÓn qu¸ tr×nh biÖt hãa tÕ bµo nãi chung vµ sù sao chÐp ADN nãi
riªng tá ra phøc t¹p h¬n. C¸c lo¹i tÕ bµo kh¸c nhau hoÆc cã thÓ ®¸p øng hoÆc
hoµn toµn kh«ng ®¸p øng víi c¸c tÝn hiÖu khëi ®Çu sao chÐp ADN. Ch¼ng h¹n, ë
ng−êi, c¸c tÕ bµo thÇn kinh sau khi ®¹t tr¹ng th¸i tr−ëng thµnh hÇu nh− kh«ng
sao chÐp ADN vµ ph©n chia tÕ bµo thªm n÷a. Nh−ng ng−îc l¹i, ë mét sè tÕ bµo
kh¸c nh− tÕ bµo da hay tÕ bµo gan, mÆc dï ®· biÖt hãa, vÉn cã kh¶ n¨ng sao
chÐp ADN vµ ph©n chia tÕ bµo.
Nh− ®· nãi ë trªn, sù sao chÐp ADN sîi kÐp x¶y ra theo hai kiÓu kh¸c nhau trªn
hai m¹ch cña ph©n tö ADN lµm khu«n vµ ®−îc gäi lµ kiÓu sao chÐp nöa gi¸n ®o¹n. Tr−íc
khi xem xÐt c¸c b−íc cña m« h×nh sao chÐp nµy, chóng ta l−u ý hai ®Æc ®iÓm quan träng
liªn quan ®Õn sù sao chÐp ADN, ®ã lµ:
1. C¸c nucleotide tù do trong m«i tr−êng lu«n ®−îc phosphoryl ho¸ ë vÞ trÝ ®Çu C-
5’.
2. Ho¹t ®éng tæng hîp chuçi polynucleotide cña c¸c enzym ADN vµ ARN
polymerase lu«n theo chiÒu 5’ → 3’.
V× tÝnh chÊt ho¹t ®éng cña c¸c enzym ADN vµ ARN polymerase nh− vËy, nªn
mçi khi mét nucleotide míi ®−îc “l¾p r¸p” vµo chuçi polypeptide ®ang ®−îc tæng
hîp th× liªn kÕt ®ã lu«n x¶y ra gi÷a nhãm phosphate (ë ®Çu C-5’) cña nucleotide
míi víi nhãm hydroxyl (ë ®Çu C-3’) cña nucleotide n»m liÒn kÒ phÝa tr−íc trong
chuçi. ChÝnh v× vËy, sù kÐo dµi chuçi ADN míi trong qu¸ tr×nh sao chÐp chØ x¶y
ra theo chiÒu 5’ → 3’.
Sù sao chÐp ADN x¶y ra theo ph−¬ng thøc nöa gi¸n ®o¹n. NghÜa lµ, hai m¹ch ®¬n
cña hai ph©n tö ADN míi n»m vÒ cïng mét phÝa cña ch¹c sao chÐp ®−îc tæng hîp theo
hai ph−¬ng thøc kh¸c nhau. Trong ®ã, mét m¹ch ADN míi ®−îc kÐo dµi b»ng viÖc bæ
sung liªn tôc c¸c nucleotide vµo ®Çu 3’ (sau khi ®o¹n ARN måi ®· h×nh thµnh), trong khi
m¹ch thø hai ®−îc t¹o ra b»ng c¸ch tæng hîp lÆp ®i lÆp l¹i ®o¹n ARN måi vµ c¸c ®o¹n
Okazaki. C¸c ®o¹n Okazaki sau ®ã míi ®−îc nèi l¹i víi nhau nhê enzym ADN ligase.
CÇn ph©n biÖt hai thuËt ng÷ nöa gi¸n ®o¹n (semicontinuous) vµ b¸n b¶o toµn
(semiconservative). ThuËt ng÷ thø nhÊt ®−îc dïng ®Ò m« t¶ kiÓu (ph−¬ng thøc) tæng hîp
c¸c m¹ch ADN míi, cßn thuËt ng÷ thø hai ®−îc dïng ®Ó chØ nguån gèc c¸c m¹ch
polynucleotide trong chuçi ADN sîi kÐp míi ®−îc tæng hîp.
3.1.2.3. C¸c b−íc cña qu¸ tr×nh sao chÐp ADN
C¬ chÕ sao chÐp ADN ®Õn nay ®−îc biÕt râ nhÊt lµ ë E. coli. HÖ gen cña vi khuÈn nµy
mang mét ph©n tö ADN vßng xo¾n kÐp ®ãng kÝn duy nhÊt cã kÝch th−íc dµi kho¶ng
1300µm, gåm xÊp xØ 4,7x106 cÆp baz¬ nit¬. §¹i ph©n tö nµy ®−îc chøa trong tÕ bµo cã kÝch
th−íc kho¶ng 3 µm, nghÜa lµ ng¾n h¬n b¶n th©n chiÒu dµi ph©n tö ADN h¬n 400 lÇn.
Mét c©u hái ®−îc ®Æt ra lµ: b»ng c¸ch nµo tÕ bµo cã thÓ sao chÐp mét ph©n tö dµi
nh− vËy víi tèc ®é cao (~850 nucleotide/gi©y) trong mét kh«ng gian ng¾n? §Ó thùc
hiÖn ®−îc ®iÒu ®ã, ph©n tö ADN ®−îc xo¾n chÆt vµ ®ãng gãi n»m gän trong tÕ bµo.
Khi qu¸ tr×nh sao chÐp ADN diÔn ra, c¸c ph©n tö ®−îc gi·n xo¾n tõng phÇn. Ngay khi
sù sao chÐp hoµn thµnh t¹i mçi phÇn, ph©n tö ADN sîi kÐp míi sÏ nhanh chãng ®ãng
xo¾n vµ ®−îc bao gãi trë l¹i ngay lËp tøc. Râ rµng toµn bé c¸c giai ®o¹n gi·n xo¾n, sao

68
Ch−¬ng 3. Sao chÐp axit nucleic

chÐp ADN vµ ®ãng xo¾n trë l¹i cña ph©n tö ADN cÇn ®−îc thùc hiÖn nghiªm ngÆt vµ
chÝnh x¸c.
a) Sù khëi ®Çu sao chÐp ADN
§Ó b¾t ®Çu qu¸ tr×nh sao chÐp, enzym ADN gyrase sö dông n¨ng l−îng tõ ATP xóc
t¸c ph¶n øng lµm g·y mét sè liªn kÕt phosphodiester trªn m¹ch polynucleotide cña ph©n
tö ADN t¹i vÞ trÝ khëi ®Çu sao chÐp (oriC) gióp ph©n tö ADN ®−îc th¸o xo¾n mét phÇn.
Sù th¸o xo¾n cña c¸c ph©n tö ADN ®−îc tiÕn hµnh theo mét trËt tù nhÊt ®Þnh. Sau b−íc
ho¹t ®éng cña enzym ADN gyrase, mét phøc hÖ khëi ®Çu sao chÐp gåm enzym helicase
vµ SSB xuÊt hiÖn vµ liªn kÕt vµo c¸c m¹ch ADN lµm khu«n, råi tiÕn hµnh c¸c ho¹t ®éng
khëi ®Çu sao chÐp vµ kÐo dµi chuçi ADN.
C¸c b−íc khëi ®Çu sao chÐp ë vÞ trÝ oriC diÔn ra nh− sau (h×nh 3.2):
1. Protein DnaA g¾n vµo vÞ trÝ oriC, lµm gi·n xo¾n c¸c nucleotide ë vÞ trÝ nµy, ®ång
thêi lµm gÉy c¸c liªn kÕt hydro gi÷a c¸c cÆp baz¬ nit¬ (kho¶ng 40 bp). Qu¸ tr×nh
nµy sö dông n¨ng l−îng tõ ATP.
2. ViÖc ph©n tö protein DnaA g¾n vµo vÞ trÝ khëi ®Çu sao chÐp lµm t¨ng ¸i lùc liªn
kÕt cña c¸c lo¹i ph©n tö protein tiÕp theo lµ DnaB vµ DnaC vµo vÞ trÝ nµy. KÕt
qu¶ cña ho¹t ®éng nµy lµ sù h×nh thµnh phøc hÖ khëi ®Çu sao chÐp gåm DnaA,
DnaB vµ DnaC.
3. TiÕp theo, phøc hÖ gåm c¸c enzym helicase, gyrase vµ protein SSB, b¾t ®Çu lµm
gi·n xo¾n vµ ph©n t¸ch hai m¹ch ®¬n cña ph©n tö ADN sîi kÐp lµm khu«n. Ho¹t
®éng nµy t¹o ®iÒu kiÖn cho c¸c enzym ADN primase g¾n ®−îc vµo vÞ trÝ khëi ®Çu
sao chÐp cña ph©n tö ADN gèc.
V× hai m¹ch ®¬n cña ph©n tö ADN sîi kÐp ch¹y song song ng−îc chiÒu (xem
ch−¬ng 2), trong khi sù tæng hîp m¹ch ADN míi lu«n theo chiÒu 5’→3’, nªn vÒ
mét phÝa cña ch¹c sao chÐp tõ vÞ trÝ ori C, mét m¹ch cña ph©n tö ADN lµm
khu«n sÏ ho¹t ®éng theo chiÒu 5’ → 3’, cßn m¹ch kia sÏ ho¹t ®éng theo chiÒu 3’
→ 5’. M¹ch ho¹t ®éng theo chiÒu 3’ → 5’ sÏ lµm khu«n ®Ó tæng hîp nªn m¹ch dÉn
®Çu, cßn m¹ch ho¹t ®éng theo chiÒu 5’ → 3’ ®−îc lµm khu«n ®Ó tæng hîp nªn
m¹ch theo sau.
b) Sù h×nh thµnh primosome (phøc hÖ t¹o ARN måi)
Mét khi enzym helicase vµ SSB ®· g¾n vµo vµ ho¹t ®éng ë vÞ trÝ khëi ®Çu sao chÐp
trªn ADN, th× enzym ADN primase cã thÓ g¾n vµo vµ h×nh thµnh nªn phøc hÖ t¹o ARN
måi, gäi lµ primosome. Phøc hÖ nµy thùc chÊt gåm c¸c protein vµ enzym xóc t¸c cho sù
h×nh thµnh c¸c ®o¹n ARN måi ë vÞ trÝ ®Çu 5’ cña mçi ®o¹n ADN míi ®−îc tæng hîp, còng
nh− ë ®Çu 5’ cña mçi ®o¹n Okazaki trong sîi ADN theo sau.
c) Tæng hîp m¹ch ADN dÉn ®Çu (m¹ch ®−îc tæng hîp liªn tôc)
Do m¹ch ADN míi ®ang ®−îc tæng hîp ch¹y song song ng−îc chiÒu víi m¹ch ADN
lµm khu«n vµ chiÒu tæng hîp cña nã lµ thuËn chiÒu ho¹t ®éng cña ADN polymerase
(5’→3’), nªn viÖc tæng hîp m¹ch nµy chØ cÇn mét ®o¹n ARN måi duy nhÊt. Sau ®ã, enzym
ADN pol III sÏ g¾n vµo vÞ trÝ ®o¹n måi nµy vµ xóc t¸c ph¶n øng kÐo dµi chuçi (b»ng viÖc
l¾p r¸p lÇn l−ît c¸c deoxyribonucleotide vµo ®Çu 3’ cña chuçi polynucleotide ®ang tæng
hîp) cho ®Õn khi kÕt thóc m¹ch ADN lµm khu«n (h×nh 3.3).
d) Tæng hîp m¹ch ADN theo sau (m¹ch ®−îc tæng hîp gi¸n ®o¹n)
Qu¸ tr×nh tæng hîp m¹ch theo sau còng theo nguyªn t¾c ®èi song song, nh−ng
chiÒu tæng hîp cña nã ng−îc chiÒu so víi chiÒu ho¹t ®éng cña enzym ADN polymerase.

69
§inh §oµn Long

Thùc tÕ, ®Ó tæng hîp nªn sîi theo sau, m¹ch ADN khu«n sau khi gi·n xo¾n cã thÓ
quay ~1800 t¹o thµnh vßng sao chÐp, nhê vËy sù tæng hîp m¹ch gi¸n ®o¹n cã thÓ diÔn ra
cïng chiÒu víi sù tæng hîp m¹ch liªn tôc.
Qu¸ tr×nh tæng hîp m¹ch ADN gi¸n ®o¹n cã thÓ m« t¶ qua c¸c b−íc nh− sau (h×nh 3.3):
1. §o¹n måi ARN ®−îc tæng hîp nhê phøc hÖ primosome.
2. Sau khi h×nh thµnh ®o¹n måi cã cÊu tróc lai ARN/ADN, sîi ®−îc tæng hîp theo
kiÓu gi¸n ®o¹n quay ng−îc ~1800 vµ g¾n vµo phøc hÖ enzym ADN pol III. Phøc
hÖ enzym nµy sau ®ã xóc t¸c ph¶n øng kÐo dµi chuçi ADN.
3. Qu¸ tr×nh kÐo dµi chuçi ADN tiÕp diÔn ®Õn khi ADN pol III hoµn thµnh viÖc kÕt
nèi ®−îc kho¶ng 1000 - 2000 deoxyribonucleotide vµ tiÕp cËn ®−îc ®Çu 5’ cña
®o¹n Okaraki phÝa tr−íc.
4. Lóc nµy, enzym ADN pol III sÏ rêi khái m¹ch khu«n. §ång thêi mét sè enzym
®Æc hiÖu sÏ thóc ®Èy sù gi¶i phãng c¸c protein SSB khái m¹ch khu«n.
5. Khi qu¸ tr×nh tæng hîp ADN tiÕp tôc x¶y ra ë ®o¹n Okazaki tiÕp theo, ngµy cµng
cã nhiÒu protein SSB g¾n vµo phÝa sau enzym ADN polymerase trªn m¹ch
khu«n ®−îc dïng ®Ó tæng hîp sîi theo sau (ph©n tö ADN míi cã m¹ch ADN ®−îc
tæng hîp kiÓu gi¸n ®o¹n).
6. Sau khi protein SSB g¾n vµo m¹ch ADN khu«n, phøc hÖ primosome sÏ xóc t¸c
viÖc tæng hîp mét ®o¹n ARN måi míi, vµ theo sau lµ ®o¹n ADN ®−îc tæng hîp
nhê ADN pol III. Cø nh− vËy, chu k× tæng hîp c¸c ®o¹n Okazaki tiÕp diÔn.
7. Khi ®· “tÝch luü” ®−îc nhiÒu ®o¹n Okazaki (cã Ýt nhÊt hai ®o¹n Okaraki), enzym
ADN pol I ho¹t ®éng, víi chøc n¨ng cña mét exonuclease theo chiÒu 5’ → 3’, råi
sau ®ã bæ sung c¸c deoxyribonucleotide vµo ®Çu 3’ cña mét ®o¹n Okazaki, ®ång
thêi lo¹i bá ®Çu ARN måi ë ®Çu 5’ cña ®o¹n Okazaki phÝa tr−íc. Hai chøc n¨ng
nµy cña enzym ADN pol I (gåm chøc n¨ng polymerase vµ exonuclease) cø tiÕp
tôc lÆp ®i lÆp l¹i cho ®Õn khi toµn bé ®o¹n måi ARN ®−îc lo¹i bá vµ ®Çu 3’ cña
mét ®o¹n Okazaki phÝa sau sÏ gÆp ®Çu 5’ cña ®o¹n Okazaki phÝa tr−íc. Lóc nµy,
hai ®o¹n Okazaki kÕ tiÕp nhau ®· bao gåm toµn bé thµnh phÇn lµ c¸c
deoxyribonucleotide vµ chØ cßn thiÕu mét liªn kÕt phosphodieste ®Ó nèi chóng l¹i
víi nhau.
8. Enzym ADN ligase sÏ cã mÆt vµ lµm nèt nhiÖm vô cßn l¹i, lµ sö dông NAD+ ®Ó
xóc t¸c ph¶n øng h×nh thµnh liªn kÕt phosphodieste gi÷a hai ®o¹n Okazaki
liÒn kÒ.
ë E. coli, c¸c b−íc tæng hîp nh− trªn lÆp ®i lÆp l¹i cho ®Õn khi c¶ hai m¹ch ADN
®−îc tæng hîp míi theo kiÓu liªn tôc vµ gi¸n ®o¹n cña cïng ch¹c sao chÐp hoµn thµnh
trän vÑn mét vßng nhiÔm s¾c thÓ chøa ADN sîi kÐp. Lóc nµy, qu¸ tr×nh sao chÐp toµn bé
ph©n tö ADN kÕt thóc.

3.1.2.4. Sao chÐp ADN ë eukaryote (sinh vËt nh©n thËt)


Nh×n chung, sù sao chÐp ADN ë eukaryote vµ prokaryote lµ gièng nhau vÒ c¸c
nguyªn lý hãa sinh vµ sinh häc ph©n tö. Sù kh¸c nhau chñ yÕu do tæ chøc hÖ gen cña
eukaryote phøc t¹p h¬n vµ ADN ph©n bè trªn nhiÒu nhiÔm s¾c thÓ kh¸c nhau.

70
Ch−¬ng 3. Sao chÐp axit nucleic

Mét sè ®Æc ®iÓm kh¸c biÖt c¬ b¶n gi÷a sao chÐp ADN ë eukaryote vµ prokaryote
gåm cã:
1. C¸c ®o¹n ARN måi vµ c¸c ®o¹n Okazaki ®−îc tæng hîp ë eukaryote th−êng ng¾n
h¬n ë prokaryote.
2. HÖ gen cña eukaryote lín h¬n nhiÒu, v× vËy qu¸ tr×nh sao chÐp ADN diÔn ra
trong thêi gian dµi h¬n (th−êng kho¶ng 6 - 8 giê), trong khi ë prokaryote th−êng
ng¾n h¬n (ch¼ng h¹n ë E. coli lµ 40 phót).
3. NÕu nh− ë prokaryote, qu¸ tr×nh sao chÐp ADN th−êng b¾t ®Çu tõ mét ®iÓm
khëi ®Çu sao chÐp ®Æc tr−ng duy nhÊt, th× ë hÖ gen eukaryote th−êng cã nhiÒu
®iÓm khëi ®Çu sao chÐp. Ch¼ng h¹n, ë ng−êi −íc l−îng cã tõ 20.000 ®Õn 30.000
®iÓm khëi ®Çu sao chÐp kh¸c nhau trong toµn hÖ gen.
4. Tèc ®é sao chÐp ADN ë eukaryote ®¹t kho¶ng 60 - 90 nucleotide / gi©y, thÊp h¬n
so víi tèc ®é sao chÐp ADN ë prokaryote (kho¶ng 850 nucleotide / gi©y).
5. NÕu nh− ë prokaryote, chØ cã mét sè Ýt lo¹i enzym ADN polymerase (ë E. coli, lµ
5 lo¹i), th× ë eukaryote ®Õn nay ®· t×m ®−îc nhiÒu lo¹i ADN polymerase (ë ng−êi,
cã Ýt nhÊt 15 lo¹i) tham gia vµo qu¸ tr×nh sao chÐp ADN.
6. Qu¸ tr×nh sao chÐp ADN ë prokaryote cã thÓ diÔn ra liªn tôc vµ ®ång thêi víi
qu¸ tr×nh phiªn m· vµ dÞch m·. Cßn ë eukaryote, qu¸ tr×nh sao chÐp ADN chØ
x¶y ra vµo giai ®o¹n S cña chu tr×nh tÕ bµo, diÔn ra trong nh©n tÕ bµo, trong khi
qu¸ tr×nh dÞch m· diÔn ra ë tÕ bµo chÊt.
Ngoµi c¸c ®Æc ®iÓm trªn, chóng ta cßn thÊy: ë eukaryote, ADN ®−îc ®ãng gãi bëi c¸c
protein histon thµnh c¸c ®¬n vÞ gäi lµ nucleosome, tr−íc khi chóng tiÕp tôc cuén xo¾n
h×nh thµnh chÊt nhiÔm s¾c n»m trong nh©n tÕ bµo. Mét sè c©u hái ®Æt ra lµ: liÖu c¸c
nucleosome cã ng¨n c¶n sù më réng ch¹c sao chÐp trong qu¸ tr×nh tæng hîp ADN hay
kh«ng? B»ng c¸ch nµo c¸c phøc hÖ sao chÐp ADN cã thÓ v−ît qua c¸c nucleosome trong
qu¸ tr×nh sao chÐp? Ngoµi ra, kh¸c víi hÖ gen E. coli vèn lµ mét ph©n tö ADN sîi kÐp,
vßng kÝn, ADN hÖ gen nh©n cña eukaryote th−êng lµ c¸c ph©n tö ADN m¹ch dµi, hë 2
®Çu. Sau mçi lÇn sao chÐp, phÇn ®Çu mót cña ph©n tö ADN bÞ ng¾n l¹i. HiÖn t−îng nµy
cã ý nghÜa g×? Chóng ta sÏ ®Ò cËp ®Õn nh÷ng hiÖn t−îng nµy ë c¸c phÇn d−íi ®©y.
a) Chu tr×nh tÕ bµo vµ sù sao chÐp ADN ë eukaryote
Khi vi khuÈn ®−îc nu«i trong m«i tr−êng dinh d−ìng ®Çy ®ñ, qu¸ tr×nh sao chÐp
ADN cã thÓ diÔn ra liªn tôc, vµ th−êng ®ång thêi diÔn ra víi c¸c qu¸ tr×nh phiªn m· vµ
dÞch m·. Trong khi ®ã, ë eukaryote, sù sao chÐp ADN chØ giíi h¹n trong pha S cña chu
tr×nh tÕ bµo. Mét chu tr×nh tÕ bµo ë eukaryote lµ kho¶ng thêi gian tÝnh tõ lÇn ph©n bµo
nµy ®Õn lÇn ph©n bµo tiÕp theo, ®−îc chia lµm 4 giai ®o¹n c¬ b¶n: giai ®o¹n G1 (cßn gäi lµ
pha G1, x¶y ra ngay sau qu¸ tr×nh ph©n bµo, G = gap), giai ®o¹n S (tæng hîp ADN, S =
DNA Synthesis), giai ®o¹n G2 (chuÈn bÞ cho lÇn ph©n bµo tiÕp theo), vµ giai ®o¹n M
(ph©n chia tÕ bµo, M = mitosis). Trong qu¸ tr×nh ph¸t triÓn cña ph«i (hoÆc ë mét sè tÕ
bµo), qu¸ tr×nh ph©n bµo diÔn ra víi tèc ®é cao nªn c¸c giai ®o¹n G1 vµ G2 diÔn ra rÊt
ng¾n, thËm chÝ d−êng nh− kh«ng tån t¹i. Trong qu¸ tr×nh ®iÒu khiÓn chu tr×nh tÕ bµo, cã
mét sè ®iÓm kiÓm tra (checkpoint) quan träng, ch¼ng h¹n nh− c¸c ®iÓm kiÓm tra x¶y ra
tr−íc qu¸ tr×nh sao chÐp ADN (pha S) vµ tr−íc khi tÕ bµo b−íc vµo ph©n chia (pha M). Sù
®iÒu khiÓn chu tr×nh tÕ bµo vµ vai trß cña c¸c ®iÓm kiÓm tra ®−îc nªu kü h¬n ë ch−¬ng 8.

71
§inh §oµn Long

b) HÖ gen eukaryote cã nhiÒu ®iÓm khëi ®Çu sao chÐp ADN


Ph©n tö ADN trong nhiÔm s¾c thÓ lín nhÊt cña ruåi giÊm Drosophila melanogaster
chøa kho¶ng 6,5x107 cÆp baz¬ nit¬. Tèc ®é sao chÐp ADN ë loµi ®éng vËt nµy lµ 2600
nucleotide/phót ë nhiÖt ®é 25oC. V× vËy, nÕu chØ cã mét ®iÓm khëi ®Çu sao chÐp duy nhÊt,
viÖc sao chÐp hoµn toµn ph©n tö ADN trªn nhiÔm s¾c thÓ nµy cÇn thêi gian t−¬ng ®−¬ng
17,5 ngµy. Nh−ng nÕu cã 2 ®iÓm khëi ®Çu sao chÐp vµ qu¸ tr×nh sao chÐp diÔn ra c¶ vÒ
hai phÝa, thêi gian cÇn thiÕt ®Ó sao chÐp hoµn toµn ph©n tö ADN lµ 8,5 ngµy. Trong khi
®ã, kÕt qu¶ thùc nghiÖm cho thÊy c¸c nhiÔm s¾c thÓ cña ruåi dÊm trong qu¸ tr×nh ph¸t
triÓn cña ph«i chØ cÇn 3 - 4 phót ®Ó sao chÐp hoµn toµn, vµ tÕ bµo ph©n chia víi chu kú
thêi gian lµ 9 - 10 phót / chu kú. Nh− vËy, ®Ó cã thÓ sao chÐp toµn bé hÖ gen trong vßng
3,5 phót, c¸c nhiÔm s¾c thÓ cña ruåi dÊm cÇn Ýt nhÊt 7000 ®iÓm khëi ®Çu sao chÐp kh¸c
nhau, n»m ph©n bè r¶i r¸c trªn toµn hÖ gen. C¸c dÉn liÖu trªn ®©y cho thÊy, ®Ó cã thÓ
sao chÐp toµn bé c¸c ph©n tö ADN cã kÝch th−íc rÊt lín n»m trªn nhiÔm s¾c thÓ cña
eukaryote, qu¸ tr×nh sao chÐp cÇn ph¶i ®−îc b¾t ®Çu tõ rÊt nhiÒu ®iÓm khëi ®Çu sao chÐp
kh¸c nhau.
Nghiªn cøu thùc nghiÖm chøng minh sù tån t¹i cña nhiÒu ®iÓm khëi ®Çu sao chÐp
ADN ë eukaryote ®−îc Huberman vµ Riggs tiÕn hµnh n¨m 1968 b»ng viÖc sö dông
nucleotide ®¸nh dÊu phãng x¹ 3H-thymine trong thÝ nghiÖm ë tÕ bµo chuét Hamxt¬.
Sau nµy, c¸c nghiªn cøu sö dông kÝnh hiÓn vi ®iÖn tö còng kh¼ng ®Þnh sù tån t¹i cña
nhiÒu ®iÓm khëi ®Çu sao chÐp ë c¸c loµi eukaryote. §o¹n ADN ®−îc tæng hîp kÓ tõ
®iÓm khëi ®Çu sao chÐp ®Õn khi kÕt thóc (gÆp ®o¹n ®−îc tæng hîp tõ c¸c ®iÓm khëi ®Çu
sao chÐp liÒn kÒ) ®−îc gäi lµ mét ®¬n vÞ sao chÐp replicon. Nh− vËy, ë prokaryote, mét
nhiÔm s¾c thÓ th−êng chØ cã mét replicon. Cßn ë eukaryote, cã rÊt nhiÒu replicon. HÖ
gen ng−êi vµ ®éng vËt cã vó cã thÓ chøa ®Õn hµng chôc ngh×n replicon víi kÝch th−íc
mçi replicon dao ®éng tõ 30.000 ®Õn 300.000 bp. §iÒu ®¸ng chó ý lµ sù sao chÐp ADN
kh«ng diÔn ra ®ång thêi ë tÊt c¶ c¸c replicon trong hÖ gen cña cïng mét c¬ thÓ. Thay
vµo ®ã, sè l−îng replicon vµ thêi ®iÓm khëi ®Çu sao chÐp ë mçi replicon lµ kh¸c nhau ë
mçi lo¹i tÕ bµo, còng nh− cã thÓ thay ®æi trong c¸c giai ®o¹n ph¸t triÓn kh¸c nhau cña
c¬ thÓ. Ch¼ng h¹n nh−, trong giai ®o¹n ®Çu qu¸ tr×nh ph¸t triÓn ph«i, sè replicon ë mçi
tÕ bµo th−êng nhiÒu h¬n nhiÒu so víi khi c¬ thÓ ®· tr−ëng thµnh. §¸ng tiÕc, ®Õn nay
chóng ta ch−a biÕt râ c¬ chÕ nµo ®iÒu kiÓn sè l−îng replicon cã trong mçi tÕ bµo, còng
nh− sù “lËp tr×nh” khëi ®Çu sao chÐp t¹i mçi replicon ë c¸c giai ®o¹n ph¸t triÓn kh¸c
nhau cña c¬ thÓ diÔn ra nh− thÕ nµo.
c) Cã nhiÒu lo¹i ADN polymerase ë eukaryote
Mét trong nh÷ng kh¸c biÖt n÷a gi÷a sù sao chÐp ADN ë eukaryote víi prokaryote
lµ viÖc tham gia ®ång thêi cña nhiÒu lo¹i enzym ADN polymerase kh¸c nhau ë cïng
mét ch¹c sao chÐp. C¸c nghiªn cøu vÒ sao chÐp ADN cña virut diÔn ra trong tÕ bµo ®éng
vËt cã vó ®· cung cÊp nhiÒu th«ng tin liªn quan ®Õn hiÖn t−îng nµy. Ch¼ng h¹n nh−
qu¸ tr×nh sao chÐp ADN cña virut ë khØ SV40 (Simian virus 40) ®−îc thùc hiÖn nhê bé
m¸y sao chÐp cña tÕ bµo chñ, ®ßi hái Ýt nhÊt hai enzym ADN polymerase, lµ α vµ δ
(hoÆc ε). Enzym ADN pol α ë d¹ng phøc kÐp víi mét enzym primase khëi ®Çu sù sao
chÐp ADN b»ng tæng hîp mét ®o¹n måi ARN gåm kho¶ng 10 nucleotide. §o¹n måi nµy
sau ®ã ®−îc ADN pol α më réng thªm kho¶ng 30 nucleotide. C¸c ®o¹n måi ARN/ADN
sau ®ã ®−îc kÐo dµi bëi ADN pol δ vµ ε. Trong ®ã, mét enzym tæng hîp m¹ch ADN dÉn
®Çu, mét enzym tæng hîp m¹ch ADN theo sau. Nh−ng ®Õn nay ch−a râ lo¹i enzym nµo
tæng hîp m¹ch nµo.

72
Ch−¬ng 3. Sao chÐp axit nucleic

ë eukaryote, ngoµi c¸c ADN polymerase tham gia sao chÐp ADN hÖ gen nh©n, cßn
cã c¸c ADN polymerase chuyªn hãa sao chÐp ADN c¸c hÖ gen ti thÓ vµ l¹p thÓ, còng nh−
cã nhiÒu lo¹i ADN polymerase tham gia vµo c¸c qu¸ tr×nh söa ch÷a ADN kh¸c nhau.
Ngoµi c¸c ADN polymerase, ë eukaryote cßn cã nhiÒu lo¹i protein kh¸c nhau tham
gia ®iÒu khiÓn qu¸ tr×nh sao chÐp ADN. Ch¼ng h¹n nh− RF-A (RF = replication factor),
RF-B vµ RF-C. RF-A lµ mét protein b¸m m¹ch ®¬n (gièng SBB ë vi khuÈn). Mét lo¹i
protein gäi lµ PCNA (proliferating cell nuclear antigen) lµ thµnh phÇn cña enzym ADN
polymerase δ, cã cÊu tróc nh− “d©y buéc” gi÷ enzym víi ph©n tö ADN trong qu¸ tr×nh sao
chÐp. Ngoµi c¸c lo¹i protein nµy, ë eukaryote cßn nhiÒu lo¹i protein kh¸c tham gia vµo
qu¸ tr×nh sao chÐp ADN, nh−ng ®Õn nay ch−a biÕt ®Çy ®ñ.
d) Sù nh©n ®«i nucleosome ë ch¹c sao chÐp
Chóng ta biÕt r»ng, ë eukaryote, c¸c ph©n tö ADN ®−îc ®ãng gãi thµnh c¸c
nucleosome (kÕt hîp víi c¸c ph©n tö protein histon) tr−íc khi tiÕp tôc cuén gËp vµ ®ãng
gãi thµnh c¸c nhiÔm s¾c thÓ. Trong cÊu tróc th«ng th−êng, mét nucleosome th−êng chøa
146 cÆp baz¬ nit¬, cuèn kho¶ng 1,65 vßng xung quanh mét phøc hÖ histon gåm 8 ph©n tö
(trong ®ã cã hai ph©n tö cña mçi lo¹i histon H2A, H2B, H3 vµ H4). Víi kÝch th−íc cña
nucleosome vµ phøc hÖ sao chÐp ADN t−¬ng ®èi lín nh− vËy, mét c©u hái ®Æt ra lµ: b»ng
c¸ch nµo phøc hÖ sao chÐp ADN cã thÓ v−ît qua ®−îc cÊu tróc nucleosome? vµ cÊu tróc
nucleosome míi ®−îc h×nh thµnh thÕ nµo khi ®ãng gãi ph©n tö ADN míi ®−îc tæng hîp?.
C¸c nghiªn cøu trªn kÝnh hiÓn vi cho thÊy sè l−îng vµ mËt ®é c¸c nucleosome lµ t−¬ng
®èi æn ®Þnh phÝa tr−íc vµ phÝa sau ch¹c sao chÐp ADN cña eukaryote. §iÒu nµy chøng tá
ph©n tö ADN míi ®−îc tæng hîp lu«n ®−îc ®ãng gãi ngay lËp tøc víi c¸c nucleosome. Tuy
vËy, ®Ó sù sao chÐp ADN cã thÓ diÔn ra, c¸c nucleosome ph¶i ®−îc th¸o rêi trong mét thêi
gian ng¾n, råi ®−îc l¾p r¸p trë l¹i ngay. Sù th¸o rêi c¸c nucleosome cò vµ l¾p r¸p c¸c
nucleosome míi diÔn ra nh− sau: nuclesome cò sÏ ph©n t¸ch thµnh mét “tø phøc” H3-H4
(gåm 2 “dÞ phøc kÐp” H3-H4 liªn kÕt víi nhau) vµ hai “dÞ phøc kÐp” H2A-H2B. C¸c tø
phøc H3-H4 vµ dÞ phøc kÐp H2A-H2B cò võa ®−îc gi¶i phãng th−êng ®−îc sö dông l¹i
ngay ®Ó ®ãng gãi ®o¹n ADN sîi kÐp võa ®−îc sao chÐp xong. Tuy nhiªn, trong c¸c cÊu
tróc nucleosome míi sÏ cã mét nöa sè ph©n tö histon ®−îc tæng hîp míi. Trong c¸c
nucleosome míi nµy sÏ cã tø phøc H3-H4 hoÆc míi hoµn toµn hoÆc cò hoµn toµn (nãi
c¸ch kh¸c lµ tø phøc H3-H4 cã tÝnh b¶o toµn), cßn tø phøc H2A-H2B cã thÓ ®−îc h×nh
thµnh tõ c¸c dÞ phøc kÐp H2A-H2B cò hoµn toµn, hoÆc míi hoµn toµn, hoÆc mét n÷a cò
mét n÷a míi (nãi c¸ch kh¸c, tø phøc H2A-H2B ®−îc h×nh thµnh theo kiÓu tæ hîp ngÉu
nhiªn). Sù ®ãng gãi ADN cña c¸c histon thµnh nucleosome b¾t ®Çu tõ tø phøc H3-H4 råi
sau ®ã ®Õn tø phøc H2A-H2B (xem thªm ch−¬ng 7). §iÒu ®¸ng chó ý lµ mÆc dï trong
®iÒu kiÖn in vitro, sù ®ãng gãi nucleosome gi÷a c¸c histon vµ ADN cã thÓ diÔn ra tù ph¸t,
nh−ng trong ®iÒu kiÖn sinh lý th× kh«ng. Qu¸ tr×nh ®ãng gãi nh− vËy trong tÕ bµo ®−îc
®iÒu khiÓn bëi mét nhãm protein ®Æc biÖt gäi lµ c¸c histon chaperon.
e) Sù sao chÐp ë ®Çu mót nhiÔm s¾c thÓ vµ hiÖn t−îng giµ hãa
Nh− ®· nãi ë trªn, c¸c tÕ bµo cña eukaryote th−êng chøa c¸c ph©n tö ADN sîi kÐp,
m¹ch th¼ng, hë hai ®Çu. Mét hiÖn t−îng x¶y ra trong qu¸ tr×nh sao chÐp ADN lµ khi c¸c
®o¹n ARN måi ®−îc lo¹i bá ®i ë phÝa ®Çu cña m¹ch dÉn ®Çu hoÆc ë ®o¹n Okazaki ®Çu
tiªn cña m¹ch theo sau, th× kh«ng cã sù tæng hîp thay thÕ c¸c tr×nh tù cña
deoxyribonucleotide cho ®o¹n ARN måi do c¸c ADN polymerase khi thiÕu ®o¹n måi phÝa
tr−íc kh«ng thÓ thùc hiÖn ®−îc chøc n¨ng tæng hîp ADN. VËy sù thay thÕ c¸c
deoxyribonucleotide diÔn ra nh− thÕ nµo? Thùc tÕ, viÖc tæng hîp ®o¹n ®Çu mót nµy cña
ph©n tö ADN ®−îc thùc hiÖn bëi mét enzym ®Æc biÖt gäi lµ telomerase (ADN
telomerase).

73
§inh §oµn Long
M¹ch ph©n tö ADN lµm khu«n
3’
TTAGGGTTAGGGTTAGGGTTA
AATCCC
5’ §Çu mót ph©n tö ADN ch−a ®−îc sao chÐp trän vÑn
Telomerase g¾n vµo  ’
ChiÒu ho¹t ®éng cña enzym
TTAGGGTTAGGGTTAGGGTTA
AATCCC AAUCCCAAU
5’
Telomerase kÐo dµi m¹ch ’
ADN khu«n vÒ phÝa ®Çu 3’ 
dùa vµo tr×nh tù ARN cña nã Enzym telomerase vµ tr×nh tù ARN lµm khu«n

TTAGGGTTAGGGTTAGGGTTAGGGTTAGGGTTAGGGTTA
AATCCC 5’ AAUCCCAAU
§Çu mót cña m¹ch ADN míi
tæng hîp ®−îc lÊp ®Çy nhê 
enzym ADN polymerase
3’
TTAGGGTTAGGGTTAGGGTTAGGGTTAGGGTTAGGGTTA
AATCCC AATCCCAATCCC
5’

Enzym ADN polymerase


H×nh 3.5. Ho¹t ®éng sao chÐp phÇn ®Çu mót ph©n tö ADN cña enzym ADN telomerase.  Enzym g¾n vµo
®Çu mót cña m¹ch ADN,  Enzym telomerase sö dông tr×nh tù ARN cña chÝnh nã ®Ó tiÕn hµnh tæng hîp vµ kÐo
dµi m¹ch ADN lµm khu«n vÒ phÝa ®Çu 3’,  dùa trªn m¹ch ADN lµm khu«n ®· ®−îc kÐo dµi, ADN polymerase
lÊp ®Çy c¸c nucleotide cßn thiÕu ë phÇn ®Çu mót cña m¹ch ADN míi ch−a ®−îc sao chÐp trän vÑn.

Enzym telomerase thùc chÊt lµ mét phøc hÖ protein - ARN. Enzym telomerase ë
ng−êi chøa mét tr×nh tù lÆp l¹i liªn tiÕp lµ [AAUCCC]. Enzym nµy cã kh¶ n¨ng nhËn ra
vïng giµu guanine (G) ë ®Çu 3’. Khi ho¹t ®éng, enzym nµy kh«ng tæng hîp c¸c nucleotide
vµo c¸c vÞ trÝ cßn trèng trªn m¹ch ADN ®ang ®−îc tæng hîp míi gièng nh− ho¹t tÝnh cña
c¸c enzym ADN vµ ARN polymerase, mµ thay vµo ®ã nã xóc t¸c ph¶n øng tæng hîp kÐo
dµi chuçi ADN tõ ®Çu 3’ cña m¹ch lµm khu«n dùa trªn tr×nh tù ARN ®èi m· cña nã. Nhê
vËy, nhiÒu ®o¹n tr×nh tù [TTAGGG] lÆp l¹i liªn tiÕp ®−îc tæng hîp tõ ®Çu 3’ cña m¹ch
khu«n (h×nh 3.5). Dùa trªn m¹ch míi ®−îc tæng hîp nµy, ADN polymerase cã thÓ tiÕn
hµnh tæng hîp ®o¹n ADN ë phÝa ®Çu mót trªn m¹ch ®èi diÖn. NÕu sù tæng hîp ®o¹n ®Çu
mót nµy kh«ng diÔn ra, nhiÔm s¾c thÓ sÏ ngµy cµng ng¾n l¹i sau mçi lÇn sao chÐp ADN;
vµ nÕu nh− sù ng¾n l¹i nµy tiÕp cËn gÇn mét gen quan träng ë phÇn ®Çu mót nhiÔm s¾c
thÓ, th× tÕ bµo cã thÓ bÞ chÕt.
ë ng−êi, kh«ng gièng nh− c¸c tÕ bµo sinh dôc, hÇu hÕt c¸c tÕ bµo x«ma (soma)
kh«ng cã enzym telomerase ho¹t ®éng. Trong ®iÒu kiÖn nu«i cÊy invitro, c¸c tÕ bµo x«ma
cña ng−êi th−êng chØ cã kh¶ n¨ng ph©n chia tõ 20 tíi 70 lÇn tr−íc khi giµ hãa vµ chÕt.
HiÖn t−îng giµ hãa vµ chÕt cña tÕ bµo cã t−¬ng quan víi ®é dµi ®Çu mót nhiÔm s¾c thÓ. ë
mét sè dßng tÕ bµo bÊt tö (nh− mét sè tÕ bµo ung th−) cã kh¶ n¨ng ph©n bµo v« h¹n vµ
kh«ng cã biÓu hiÖn giµ hãa, ng−êi ta thÊy cã sù ho¹t ®éng m¹nh cña enzym telomerase.
V× vËy, mét trong c¸c biÖn ph¸p ®−îc ®Ò xuÊt trong ®iÒu trÞ ung th− lµ t×m c¸ch øc chÕ
ho¹t ®éng cña enzym telomerase. Mét dÉn chøng kh¸c chøng minh mèi quan hÖ chÆt chÏ
gi÷a ®o¹n ®Çu mót nhiÔm s¾c thÓ vµ qu¸ tr×nh giµ hãa lµ c¸c nghiªn cøu trªn Héi chøng
Hutchinson-Gilford (bÖnh giµ sím ë trÎ s¬ sinh) vµ Héi chøng Werner (giµ sím ë tuæi vÞ
thµnh niªn) ®Òu cho thÊy cã liªn quan ®Õn sù mÊt ®i ®o¹n ®Çu mót nhiÔm s¾c thÓ. Tuy
vËy, ®Õn nay, c¬ chÕ sinh häc dÉn ®Õn sù giµ hãa bëi viÖc ng¾n ®i cña ®o¹n ®Çu mót c¸c
nhiÔm s¾c thÓ còng vÉn ch−a ®−îc biÕt ®Çy ®ñ.

74
Ch−¬ng 3. Sao chÐp axit nucleic

3.2. Sao chÐp c¸c lo¹i axit nucleic kh¸c


M« h×nh sao chÐp ADN ®−îc chóng ta nh¾c ®Õn ë trªn lµ m« h×nh sao chÐp ADN sîi
kÐp, lµ vËt chÊt di truyÒn cña c¸c c¬ thÓ cã cÊu tróc tÕ bµo hoµn chØnh, bao gåm c¶
prokaryote vµ eukaryote. Tuy vËy, trong thùc tÕ, cßn tån t¹i mét sè d¹ng sèng mµ chóng
kh«ng ph¶i lµ c¸c tÕ bµo hoµn chØnh, ®ã lµ c¸c virut. VËt liÖu di truyÒn cña c¸c virut cã
mét sè ®Æc ®iÓm vµ c¬ chÕ sao chÐp riªng.
Cã thÓ kÓ ®Õn bèn lo¹i axit nucleic ®−îc sö dông lµm vËt liÖu di truyÒn ë c¸c d¹ng
virut mµ kh«ng cã b¶n chÊt lµ ADN sîi kÐp, bao gåm: (1) ph©n tö ADN m¹ch ®¬n, (2)
ph©n tö ADN sîi kÐp, (3) ph©n tö ARN m¹ch ®¬n, vµ (4) ph©n tö ARN d¹ng sîi kÐp hay
nhiÒu sîi. C¸c ph©n tö axit nucleic nµy cã thÓ cã cÊu tróc d¹ng m¹ch th¼ng (hë hai ®Çu)
hoÆc d¹ng vßng (khÐp kÝn). MÆc dï vËy, ë mçi lo¹i virut, chØ cã mét d¹ng axit nucleic ®Æc
thï ®−îc dïng lµm vËt chÊt mang th«ng tin di truyÒn.
Do c¸c lo¹i virut cã c¸c d¹ng cÊu tróc cña vËt chÊt di truyÒn kh¸c biÖt nh− vËy, nªn
chóng cã c¸c c¬ chÕ sao chÐp ®Æc tr−ng vµ kh¸c biÖt víi m« h×nh sao chÐp ADN sîi kÐp
phæ biÕn. §Æc ®iÓm chung cña c¸c hÖ gen virut lµ chóng cã kÝch th−íc nhá, chØ gåm tõ
mét gen duy nhÊt (nh− virut thuèc l¸ STRV) tíi vµi tr¨m gen (nh− virut g©y bÖnh ®Ëu
mïa, cã 240 gen).
TÊt c¶ c¸c virut ®Òu cã ®Æc tÝnh ký sinh b¾t buéc, nghÜa lµ chóng ph¶i phô thuéc
vµo tÕ bµo chñ trong qu¸ tr×nh sèng, ho¹t ®éng vµ sinh s¶n. Së dÜ nh− vËy lµ do c¸c virut
th−êng thiÕu c¸c hÖ enzym hoÆc c¸c hÖ thèng chuyÓn ho¸ n¨ng l−îng dÉn ®Õn viÖc chóng
kh«ng cã kh¶ n¨ng sinh s¶n hoÆc trao ®æi chÊt ®éc lËp, kh«ng cã kh¶ n¨ng tù s¶n xuÊt
c¸c hîp chÊt cao n¨ng (nh− ATP, NAD+) hay c¸c protein thiÕt yÕu.
C¸c virut cã thÓ l©y nhiÔm tÊt c¶ c¸c d¹ng tÕ bµo sèng, tõ vi khuÈn ®Õn thùc vËt vµ
®éng vËt. Nh−ng mçi lo¹i virut th−êng chØ cã mét hoÆc mét sè c¬ thÓ chñ nhÊt ®Þnh. H¬n
n÷a, mét sè lo¹i virut (ch¼ng h¹n nh− HIV) chØ cã thÓ l©y nhiÔm vµo mét sè d¹ng tÕ bµo
®Æc tr−ng (®èi víi HIV lµ c¸c tÕ bµo lympho CD4+ trong m¸u).
Mét c©u hái ®Æt ra lµ: lµm thÕ nµo c¸c virut cã vËt chÊt di truyÒn kh«ng ph¶i ADN
sîi kÐp cã thÓ sao chÐp hÖ gen cña chóng ®Ó duy tr× sù sinh s¶n vµ tån t¹i cña chóng?
Trong phÇn tiÕp theo chóng ta sÏ xem xÐt h×nh thøc sao chÐp vËt chÊt di truyÒn cña
mét sè lo¹i virut cã vËt liÖu di truyÒn lµ mét trong c¸c d¹ng axit nucleic ®−îc nªu ë trªn,
bao gåm:
+ Phag¬ ΦX174: hÖ gen lµ mét ph©n tö ADN m¹ch ®¬n, vßng kÝn.
+ Virut kh¶m thuèc l¸ (TMV): hÖ gen lµ mét ph©n tö ARN sîi ®¬n, m¹ch th¼ng.
+ Virut g©y suy gi¶m miÔn dÞch ë ng−êi (HIV): hÖ gen lµ mét ph©n tö ARN sîi
®¬n, m¹ch th¼ng, cïng lóc cã hai b¶n sao, chøa tr×nh tù m· hãa mét enzym ®Æc
biÖt gäi lµ enzym phiªn m· ng−îc (reverse transcriptase).
+ Phag¬ λ: hÖ gen lµ ph©n tö ADN sîi kÐp, m¹ch th¼ng.
Trong qu¸ tr×nh sinh s¶n, tÊt c¶ c¸c virut nµy ®Òu ph¶i tr¶i qua mét sè b−íc ®Æc
biÖt, trong ®ã cã sù sao chÐp vËt chÊt di truyÒn cña chóng. C¸c b−íc cña qu¸ tr×nh sinh
s¶n cña virut cã thÓ kÓ ®Õn nh− sau:
1. Virut ®Ýnh kÕt vµo thµnh tÕ bµo chñ.
2. Toµn bé virut x©m nhËp vµo c¬ thÓ chñ (mét sè d¹ng virut ë eukaryote), hoÆc vËt
liÖu di truyÒn (axit nucleic) cña virut ®−îc “tiªm” vµo tÕ bµo chñ.

75
§inh §oµn Long

3. Virut lµm thay ®æi bé m¸y sinh hãa cña tÕ bµo chñ lµm cho bé m¸y nµy phï hîp
víi ho¹t ®éng sao chÐp vËt chÊt di truyÒn cña virut.
4. Qu¸ tr×nh sao chÐp axit nucleic cña virut diÔn ra trong tÕ bµo chñ.
5. Qu¸ tr×nh tæng hîp c¸c protein thiÕt yÕu cña virut (vÝ dô nh− c¸c protein vá
virut) diÔn ra trong tÕ bµo chñ.
6. Qu¸ tr×nh ®ãng gãi c¸c thµnh phÇn virut (vËt chÊt di truyÒn vµ c¸c protein vá) ®Ó
h×nh thµnh c¸c h¹t virut hoµn chØnh.
7. Virut thÕ hÖ con gi¶i phãng khái tÕ bµo chñ.

3.2.1. Sao chÐp ADN ë phag¬ ΦX174


HÖ gen cña phag¬ Sao chÐp ADN
ΦX174 gåm mét ph©n tö ADN §iÓm khëi ®Çu sao
d¹ng RF chÐp m¹ch (+)
§iÒu khiÓn
sîi ®¬n, m¹ch vßng, gåm 5386
SS → RF Ngõng sao chÐp
nucleotide, m· ho¸ cho 11 IR ADN tÕ bµo chñ
protein. Qu¸ tr×nh sao chÐp hÖ
A ChiÒu phiªn m·
gen cña ΦX174 phô thuéc vµo §iÒu khiÓn sù
l©y nhiÔm, DÉn xuÊt
bé m¸y sao chÐp cña E. coli. protein vá
protein ®Çu
Khi l©y nhiÔm tÕ bµo E. nhän phô T¨ng kÝch th−íc
vµ ”n¶y mÇm”
coli, ΦX174 “tiªm” ADN cña
IR ΦX174
nã vµo trong tÕ bµo chñ. §Ó Hoµn thiÖn ADN
Protein ®Çu
ph©n biÖt, ph©n tö ADN m¹ch nhän chÝnh
§ãng gãi vá virut
®¬n nµy ®−îc ®¸nh dÊu (+).
IR Ph©n gi¶i
M¹ch ADN(+) nµy m· ho¸ cho
F IR tÕ bµo chñ
c¸c protein cÇn thiÕt cña virut. §iÓm khëi ®Çu sao
chÐp m¹ch (-) Protein lâi, tham
Gen A* trong hÖ gen cña virut gia ®ãng gãi ADN
(h×nh 3.6) m· ho¸ cho protein Protein vá virut
cã vai trß øc chÕ sù sao chÐp chñ yÕu
ADN cña tÕ bµo chñ trong H×nh 3.6. HÖ gen cña virut ΦX174. PhÇn chó thÝch xung quanh lµ
vßng 20 - 30 phót sau khi l©y chøc n¨ng t−¬ng øng cña c¸c gen ®· biÕt. IR (Intergenic region) lµ c¸c
®o¹n tr×nh tù kh«ng m· hãa gi÷a c¸c gen (c¸c tr×nh tù liªn gen).
nhiÔm, b»ng c¸ch c¾t rêi c¸c
m¹ch ®¬n t¹i vÞ trÝ ch¹c sao chÐp cña tÕ bµo chñ. Ho¹t ®éng nµy cña protein do gen A* m·
hãa nh»m gi¶i phãng mét sè enzym sao chÐp cña tÕ bµo chñ (nh− phøc hÖ primosome) lóc
nµy trë nªn cÇn thiÕt cho sù sao chÐp hÖ gen cña virut.
§Ó cã thÓ sao chÐp m¹ch ADN(+) trong khi m¹ch bæ sung lµ ADN(-) kh«ng ph¶i lµ
tr×nh tù mang th«ng tin di truyÒn cña virut, qu¸ tr×nh sao chÐp vËt chÊt di truyÒn cña
ΦX174 ph¶i tr¶i qua 3 giai ®o¹n (h×nh 3.7) nh− sau:
1. Phiªn m· th«ng tin di truyÒn trªn m¹ch ADN(+) cña virut (cßn ký hiÖu lµ SS =
single strand) thµnh d¹ng ph©n tö ADN sîi kÐp d¹ng sao chÐp (ký hiÖu lµ RF =
replicative form) mang mét m¹ch ADN(+) vµ mét m¹ch bæ sung lµ ADN(-) (nh−
vËy, giai ®o¹n 1 cã thÓ viÕt t¾t lµ SS → RF).
2. Sao chÐp ph©n tö ADN sîi kÐp ë d¹ng RF nhiÒu lÇn ®Ó t¨ng lªn vÒ sè l−îng, theo
nguyªn t¾c sao chÐp vßng l¨n. KÕt qu¶ lµ tõ mét ph©n tö RF mÑ thu ®−îc nhiÒu
ph©n tö RF con (giai ®o¹n 2 = mét RF mÑ → nhiÒu RF con).

76
Ch−¬ng 3. Sao chÐp axit nucleic
a) Giai ®o¹n 1: Phiªn mN tõ d¹ng SS → RF (mÑ)

 Primase  ADN  
tæng hîp
M¹ch (+)
polymerase Lo¹i bá ADN ADN
ARN måi ARN måi ligase gyrase
M¹ch
(+) ARN
Tæng hîp
C¸c protein Protein theo kiÓu
khëi ®Çu DnaB M¹ch (-) Ph©n tö ADN
HÖ gen virut gi¸n ®o¹n
sao chÐp sîi kÐp d¹ng
ban ®Çu
RF (mÑ)
b) Giai ®o¹n 2: Sao chÐp c¸c ph©n tö ADN sîi kÐp, RF (mÑ) → RF (con)
gpA (protein
 §iÓm khëi ®Çu  cña gen A)
sao chÐp
gpA lµm Tæng hîp
®øt sîi (+)  m¹ch (+)

t¹i ®iÓm KÐo dµi theo kiÓu


khëi ®Çu m¹ch (+) vßng l¨n
Ph©n tö sao chÐp vÒ phÝa
RF (mÑ) ®Çu 3’
§iÓm khëi
®Çu sao
chÐp míi

“TiÕp tôc sao chÐp theo kiÓu vßng l¨n”

  M¹ch (+)
+ míi

Ph©n tö RF Tæng hîp m¹ch (-) theo kiÓu gi¸n ®o¹n 


(con)
c) Giai ®o¹n 3: Sao chÐp tõ d¹ng RF → SS (d¹ng vËt chÊt di truyÒn cña virut)
§iÓm khëi ®Çu gpA
sao chÐp   Tæng hîp
gpA lµm KÐo dµi m¹ch (+)
®øt sîi (+) m¹ch (+) theo kiÓu
vÒ phÝa
t¹i ®iÓm vßng l¨n
®Çu 3’
khëi ®Çu
sao chÐp Tæng hîp Protein vá

protein vá virut ®ãng
 gãi ADN 


“TiÕp tôc sao chÐp theo kiÓu vßng l¨n”

 +
Virut thÕ hÖ §ãng gãi thµnh h¹t virut hoµn chØnh
con tr−ëng
thµnh
HÖ gen virut
(m¹ch +)
H×nh 3.7. Ba giai ®o¹n cña qu¸ tr×nh sao chÐp hÖ gen virut ΦX174. C¸c chØ sè, (,,,...) lµ c¸c b−íc t−¬ng
øng ®−îc m« t¶ trong phÇn diÔn gi¶i.

77
§inh §oµn Long

3. Tæng hîp m¹ch ADN(+) b»ng viÖc sö dông m¹ch ADN(-) trong ph©n tö ADN sîi
kÐp d¹ng RF lµm khu«n th«ng qua c¬ chÕ sao chÐp vßng l¨n. Nh− vËy, giai ®o¹n
ba lµ giai ®o¹n phiªn m· ®Ó thu ®−îc d¹ng SS lµ d¹ng m· hãa th«ng tin di
truyÒn cña virut (giai ®o¹n 3 = RF → SS).
Trong giai ®o¹n 1, qu¸ tr×nh sao m· tõ SS → RF ®−îc thùc hiÖn th«ng qua 6 b−íc
c¬ b¶n. Qu¸ tr×nh nµy diÔn ra nhê ho¹t ®éng cña c¸c hÖ enzym vµ protein tÕ bµo chñ. Sù
chuyÓn m· di truyÒn tõ m¹ch ADN(+) cña virut thµnh ph©n tö ADN sîi kÐp d¹ng RF hoµn
toµn gièng víi sù tæng hîp m¹ch ADN kh«ng liªn tôc trong m« h×nh sao chÐp ADN sîi kÐp
®· ®−îc m« t¶. S¸u b−íc cña qu¸ tr×nh phiªn m· SS → RF diÔn ra nh− sau (h×nh 3.7a):
 Tr−íc khi g¾n måi: Protein b¸m sîi ®¬n SSB cña tÕ bµo chñ g¾n vµo ADN cña
phag¬ ΦX174 (khi ph©n tö ADN nµy ®· ®−îc tiªm vµo tÕ bµo chñ), ®ång thêi ADN
virut ®−îc gi·n xo¾n bëi enzym gyrase. Trong mét b−íc phô tiÕp theo, mét sè
protein nh− n, n’, n”, protein i, DnaB, DnaC g¾n vµo ADN virut ®Ó h×nh thµnh
nªn phøc hÖ g©y gi·n xo¾n ph©n tö ADN tr−íc khi g¾n måi.
 G¾n måi: enzym primase cña tÕ bµo chñ g¾n vµo sîi ADN virut vµ h×nh thµnh nªn
phøc hÖ primosome. Phøc hÖ primosome di chuyÓn däc theo ph©n tö ADN theo
chiÒu 5’ → 3’vµ tæng hîp ®o¹n ARN måi (theo kiÓu sîi theo sau trong m« h×nh sao
chÐp ADN sîi kÐp). Qu¸ tr×nh nµy cÇn sù tham gia cña protein DnaB. ViÖc tæng hîp
c¸c ®o¹n ARN måi xuÊt hiÖn ë c¸c vÞ trÝ ngÉu nhiªn.
 KÐo dµi chuçi: Khi ®o¹n ARN måi ®· h×nh thµnh, enzym ADN polymerase III sÏ
g¾n vµo vµ tiÕp tôc ph¶n øng kÐo dµi chuçi sö dông c¸c deoxyribonucleotide tù do
trong tÕ bµo chñ ®Ó tæng hîp nªn mét sîi ADN theo kiÓu gi¸n ®o¹n, gåm nhiÒu ®o¹n
Okazaki.
 Nèi c¸c ®o¹n Okazaki: enzym ADN polymerase I cã vai trß lo¹i bá c¸c ®o¹n ARN
måi vµ thùc hiÖn qu¸ tr×nh dÞch m· qua khe n»m gi÷a c¸c ®o¹n Okazaki.
 G¾n kÕt ph©n tö ADN: ADN ligase xóc t¸c viÖc g¾n c¸c ®o¹n Okazaki riªng rÏ
thµnh mét chuçi polynucleotide liªn tôc.
 Cuén xo¾n: enzym ADN gyrase xóc t¸c ho¹t ®éng cuén xo¾n cña ph©n tö ADN sîi
kÐp gåm mét m¹ch ADN(+) vµ mét m¹ch ADN(-) ®Ó t¹o nªn cÊu tróc d¹ng RF.
Thêi gian cÇn thiÕt ®Ó thùc hiÖn mét chu kú tæng hîp ph©n tö RF nh− trªn lµ ~1 phót.
Trong giai ®o¹n thø 2, hÖ gen cña ΦX174 ë d¹ng RF ®−îc nh©n lªn nhiÒu lÇn, víi
c¸c ®Æc ®iÓm ®¬n gi¶n h¬n so víi giai ®o¹n 1. Giai ®o¹n nµy chØ cÇn thªm hai lo¹i protein:
(1) mét lo¹i protein cÇn thiÕt cho sù khëi ®Çu vµ kÕt thóc cña qu¸ tr×nh sao chÐp, lµ s¶n
phÈm cña gen A (ký hiÖu lµ gpA), vµ (2) ADN helicase cÇn thiÕt cho viÖc lµm gi·n xo¾n
ph©n tö ADN d¹ng RF, lµ s¶n phÈm do gen rep cña E. coli. Hai lo¹i protein nµy gióp sao
chÐp m¹ch ADN(+) d¹ng vßng trßn khÐp kÝn, theo kiÓu sao chÐp vßng l¨n.
Vai trß cña c¸c enzym ADN helicase, ADN polymerase III, vµ c¸c protein gpA, SSB
trong qu¸ tr×nh tæng hîp m¹ch ADN(+) d¹ng vßng cña virut cô thÓ nh− sau (h×nh 3.7b):
 ADN helicase vµ protein SSB g¾n vµo ph©n tö ADN sîi kÐp (d¹ng RF) lµm gi·n
xo¾n vµ gi÷ ph©n tö ADN sîi kÐp ë tr¹ng th¸i hai m¹ch ®¬n.
 Protein gpA c¾t liªn kÕt phosphodieste ë mét vÞ trÝ ®Æc tr−ng trªn sîi ADN(+) t¹o
thµnh mét khe, ®ång thêi b¶n th©n nã g¾n vµo ®Çu 5’ cña sîi ADN(+) ngay t¹i vÞ trÝ
khe ®øt võa ®−îc t¹o ra.

78
Ch−¬ng 3. Sao chÐp axit nucleic

 §Çu 5’ cña sîi ADN(+) sÏ bÞ ®Èy khái cÊu tróc sîi ®«i. Enzym ADN polymerase III
sö dông sîi ADN(-) lµm m¹ch khu«n, xóc t¸c viÖc l¾p r¸p lÇn l−ît c¸c
deoxyribonucleotide míi theo nguyªn t¾c bæ sung vµo ®Çu 3’ cña m¹ch ADN(+) ®·
bÞ ®øt ra. Qu¸ tr×nh tæng hîp sîi (+) cø vËy tiÕp tôc diÔn ra xung quanh sîi (-),
trong khi ®Çu 5’ cña sîi (+) b¾t ®Çu tù quay vßng. Sau khi qu¸ tr×nh tæng hîp sîi
ADN (+) míi kÕt thóc, sîi ADN(+) cò sÏ t¸ch ra khái cÊu tróc ADN sîi kÐp (RF).
 KÕt thóc qu¸ tr×nh sao chÐp, protein gpA sÏ c¾t ADN ë vÞ trÝ khëi ®Çu (vÞ trÝ vÕt ®øt
®Çu tiªn trªn sîi (+), ®ång thêi ®ãng vßng ph©n tö ADN míi ®−îc t¹o ra b»ng viÖc
h×nh thµnh mèi liªn kÕt phosphodieste ë vÞ trÝ vÕt ®øt. Nh− vËy, s¶n phÈm cña qu¸
tr×nh sao chÐp lµ h×nh thµnh mét ph©n tö ADN sîi kÐp d¹ng RF, trong ®ã mét
m¹ch (+) ®−îc tæng hîp míi thay thÕ cho m¹ch (+) cò.
 Lóc nµy, m¹ch ADN(+) cò ®−îc t¸ch ra råi ®−îc sö dông lµm m¹ch khu«n ®Ó tæng
hîp nªn m¹ch ADN(-) míi theo nguyªn t¾c kh«ng liªn tôc nh− m« t¶ ë giai ®o¹n 1.
Cø nh− vËy, sè ph©n tö ADN sîi kÐp d¹ng RF t¨ng lªn nhanh chãng.
Qu¸ tr×nh sao chÐp ph©n tö ADN sîi kÐp d¹ng RF cã thÓ kÐo dµi ®Õn 20 phót, víi sè
lÇn ph©n tö RF ®−îc sao chÐp lªn ®Õn kho¶ng 35 lÇn. Lóc nµy (kho¶ng 20 - 25 phót sau
khi l©y nhiÔm), sù sao chÐp cña RF còng nh− cña ADN tÕ bµo chñ bÞ ®iÒu khiÓn dõng l¹i.
Giai ®o¹n 3 (giai ®o¹n cuèi cïng) chÝnh lµ giai ®o¹n sao chÐp thùc sù hÖ gen cña
ΦX174 (RF → SS). §©y lµ qu¸ tr×nh tæng hîp riªng m¹ch ADN(+). Trong giai ®o¹n nµy,
m¹ch ADN(-) ®−îc sö dông lµm khu«n vµ qu¸ tr×nh sao chÐp còng diÔn ra theo ph−¬ng
thøc vßng l¨n. C¸c m¹ch ADN(+) míi ®−îc t¹o ra theo nguyªn t¾c tæng hîp liªn tôc. C¸c
m¹ch ADN(+) míi sau ®ã ®−îc ®ãng gãi vµ h×nh thµnh c¸c h¹t virut hoµn chØnh.
C¸c b−íc cña giai ®o¹n tæng hîp c¸c sîi SS cã thÓ m« t¶ nh− sau (h×nh 3.7c):
 Protein gpA, ®−îc phøc hÖ primosome trî gióp, g¾n vµo sîi ADN kÐp vµ c¾t ®øt
m¹ch ADN(+) ë mét vÞ trÝ ®Æc tr−ng ®Ó t¹o ra hai ®Çu 3’ vµ 5’ tù do. Sau ®ã, protein
gpA tiÕp tôc g¾n ë ®Çu 5’ cña m¹ch ADN(+).
 Enzym ADN helicase ®−îc m· hãa bëi gen cña tÕ bµo chñ g¾n vµo m¹ch ADN(-) t¹i
vÞ trÝ vÕt ®øt võa ®−îc t¹o ra. Cïng víi phøc hÖ primosome, enzym ADN helicase
b¾t ®Çu lµm gi·n xo¾n cÊu tróc RF sîi kÐp, sau ®ã primosome tiÕn hµnh tæng hîp
®o¹n ARN måi b¾t ®Çu tõ ®Çu 3’ cña m¹ch ADN(-).
 Khi ®o¹n ARN måi ®· h×nh thµnh, enzym ADN polymerase III g¾n vµo vµ xóc t¸c
ph¶n øng tæng hîp kÐo dµi chuçi ADN kÓ tõ ®o¹n måi.
 Khi m¹ch ADN(+) ®−îc t¸ch ra tõ cÊu tróc sîi kÐp, c¸c protein vá virut (®−îc tæng
hîp nhê bé m¸y dÞch m· cña tÕ bµo chñ) g¾n vµo ph©n tö ADN(+) võa míi ®−îc
tæng hîp. ViÖc c¸c ph©n tö protein cña virut g¾n vµo ph©n tö ADN(+) ®ång thêi sÏ
lµm øc chÕ ho¹t ®éng cña bé m¸y sao chÐp sö dông m¹ch ADN(+) lµm khu«n ®Ó sao
chÐp ADN.
 Protein gpA c¾t ®o¹n m¹ch ADN(+) t¹i vÞ trÝ khëi ®Çu, ®ång thêi khÐp kÝn vßng
trßn b»ng sù h×nh thµnh liªn kÕt phosphodieste. Cuèi cïng, mét sè protein kh¸c
cña virut sÏ ®−îc dïng ®Ó ®ãng gãi vµ h×nh thµnh c¸c h¹t virut hoµn chØnh.
Giai ®o¹n 3 (RF → SS) th−êng kÐo dµi kho¶ng tõ 20 ®Õn 30 phót. KÕt qu¶ lµ: tõ mét
h¹t virut ΦX174 l©y nhiÔm vµo mét tÕ bµo vi khuÈn E. coli ban ®Çu, cã thÓ t¹o ra kho¶ng
35 cÊu tróc ADN sîi kÐp (d¹ng RF) vµ kho¶ng 500 h¹t virut míi (d¹ng SS) trong vßng 1
giê. Víi h×nh thøc sao chÐp nµy, kh«ng mét h¹t virut thÕ hÖ con nµo mang m¹ch ADN gèc
cña virut mÑ. V× vËy, kiÓu sao chÐp ADN nµy lµ kiÓu sao chÐp ADN kh«ng b¶o toµn.

79
§inh §oµn Long

3.2.2. Sao chÐp axit nucleic ë virut kh¶m thuèc l¸ (TMV)


Virut kh¶m thuèc l¸ (TMV) cã hÖ gen lµ mét ph©n tö ARN sîi ®¬n, m¹ch th¼ng,
gåm 6390 nucleotide, m· ho¸ cho 4 gen.
Gièng nh− trong tr−êng hîp cña ΦX174, sù sao chÐp ARN cña virut TMV ®ßi hái sù
tæng hîp cña m¹ch ®èi diÖn. Nh−ng sù kh¸c biÖt lµ ë chç, ®Ó thùc hiÖn ®−îc qu¸ tr×nh ®ã,
virut TMV cã mét enzym ARN polymerase ®Æc biÖt, gäi lµ replicase, cã kh¶ n¨ng sö dông
m¹ch ARN lµm khu«n ®Ó sao chÐp. Enzym nµy ®−îc m· ho¸ bëi chÝnh hÖ gen virut TMV.
Còng gièng nh− qu¸ tr×nh sao chÐp ADN, qu¸ tr×nh tæng hîp chuçi polynucleotide
cña ph©n tö ARN lu«n lu«n diÔn ra theo chiÒu 5’ → 3’. V× vËy, viÖc tæng hîp ARN sÏ b¾t
®Çu tõ ®Çu 3’ cña sîi khu«n. Tuy vËy, ®¸ng chó ý lµ qu¸ tr×nh tæng hîp ARN sîi ®¬n ë
virut kh«ng cã c¬ chÕ söa ch÷a sao chÐp nh− trong tr−êng hîp sao chÐp ADN. HiÖn
t−îng nµy phÇn nµo cã thÓ gi¶i thÝch cho hiÖn t−îng hÖ gen cña virut th−êng cã tû lÖ
®ét biÕn cao.
Khi virut TMV ®· l©y nhiÔm tÕ bµo chñ, nã gi¶i phãng ra sîi ARN(+). Sîi nµy ®−îc
sö dông lµm m¹ch khu«n ®Ó tæng hîp trùc tiÕp nªn m¹ch ARN bæ sung theo nguyªn t¾c
Chargaff. Do qu¸ tr×nh sao chÐp nµy lµ sao chÐp trùc tiÕp ph©n tö ARN, nªn c¸c
nucleotide ®−îc sö dông trong qu¸ tr×nh sao chÐp vËt chÊt di truyÒn lµ c¸c
ribonucleotide.
C¸c b−íc trong qu¸ tr×nh sinh s¶n cña virut TMV (h×nh 3.8) nh− sau:
 Virut l©y nhiÔm tÕ bµo chñ (thuèc l¸) vµ “tiªm” hÖ gen (ARN) cña nã vµo tÕ bµo chñ.

Phiªn m·
Phiªn m·
sîi ARN (+)
sîi ARN (-) Sîi ARN (-)

 

Phiªn m· sîi 
ARN (+)



ARN (+) phag¬ mÑ



 
TÕ bµo chñ  ARN replicase Protein vá virut

L©y nhiÔm 

Phage con Sîi ARN (+)


thÕ hÖ con

H×nh 3.8. C¸c giai ®o¹n trong qu¸ tr×nh sao chÐp hÖ gen cña virut TMV. C¸c chØ sè, (,,,...) lµ c¸c
b−íc t−¬ng øng ®−îc m« t¶ trong phÇn diÔn gi¶i.

80
Ch−¬ng 3. Sao chÐp axit nucleic

 Virut sö dông bé m¸y tæng hîp protein cña tÕ bµo chñ ®Ó dÞch m· th«ng tin trªn
ph©n tö ARN cña nã. KÕt qu¶ lµ: enzym replicase vµ mét sè protein vá virut ®−îc
t¹o ra.
 Enzym replicase sau khi h×nh thµnh sö dông sîi ARN(+) cña virut ®Ó phiªn m·
thµnh sîi ARN(-) theo nguyªn t¾c bæ sung gi÷a A vµ U, G vµ C (vµ ng−îc l¹i). Qu¸
tr×nh phiªn m· diÔn ra b¾t ®Çu tõ ®Çu 3’ cña sîi khu«n, v× vËy sîi ARN(-) míi sÏ
®−îc tæng hîp theo chiÒu tõ 5’ → 3’. Kh«ng cã sù h×nh thµnh cÊu tróc sîi kÐp.
 Sîi ARN(-) sau khi h×nh thµnh l¹i ®−îc enzym replicase sö dông lµm m¹ch khu«n
®Ó tæng hîp nªn c¸c sîi ARN(+) míi. Qu¸ tr×nh tæng hîp b©y giê b¾t ®Çu tõ ®Çu 3’
cña sîi ARN(-). Nhê vËy, c¸c sîi ARN(+) míi còng ®−îc tæng hîp theo chiÒu 5’ → 3’.
B»ng c¸ch sao chÐp ARN trùc tiÕp nh− vËy, c¸c sîi ARN(+) ®−îc phiªn m· sÏ cã
tr×nh tù c¸c ribonucleotide gièng víi sîi ARN(+) mÑ ban ®Çu.
 Cuèi cïng, c¸c protein vá cña virut ®−îc tæng hîp ë b−íc 2 cã kh¶ n¨ng nhËn biÕt
mét sè tr×nh tù ®Æc hiÖu trªn sîi ARN(+) vµ ®ãng gãi ph©n tö ARN nµy ®Ó h×nh
thµnh nªn c¸c h¹t virut hoµn chØnh.
Virut TMV hoµn thiÖn cã mét líp vá protein bao quanh hÖ gen ARN. Lóc nµy, c¸c
h¹t virut cã thÓ ph¸ vì tÕ bµo chñ vµ tiÕp tôc l©y nhiÔm c¸c tÕ bµo chñ kh¸c.

3.2.3. Retrovirut (virut phiªn m· ng−îc): HIV


Retrovirut, cßn gäi lµ virut phiªn m· ng−îc, lµ mét nhãm c¸c virut cã kh¶ n¨ng
“phiªn m· ng−îc” vËt chÊt di truyÒn cña chóng. Së dÜ gäi lµ phiªn m· ng−îc, v× hÖ gen
cña nh÷ng virut nµy lµ ARN; trong qu¸ tr×nh sao chÐp vËt chÊt di truyÒn, th«ng tin di
truyÒn tõ d¹ng ARN tr−íc tiªn ph¶i ®−îc phiªn m· tõ ARN → ADN, nh− vËy ng−îc víi
chiÒu th«ng tin di truyÒn phæ biÕn mµ chóng ta ®· biÕt lµ “ADN → ARN”.
Trong nhãm retrovirut, HIV (virut g©y suy gi¶m miÔn dÞch ë ng−êi) lµ virut ®Õn
nay ®−îc quan t©m nghiªn cøu nhiÒu h¬n c¶. HIV tÊn c«ng vµo tÕ bµo lympho CD4 lµ tÕ
bµo cã vai trß quyÕt ®Þnh kh¶ n¨ng kÝch øng cña hÖ thèng miÔn dÞch. Nh− vËy, virut nµy
tÊn c«ng vµo ®óng c¸c tÕ bµo mµ chøc n¨ng cña chóng lµ b¶o vÖ c¬ thÓ khái sù x©m nhËp
cña c¸c virut vµ c¸c hîp chÊt l¹ vµo c¬ thÓ chñ. ViÖc l©y nhiÔm cña HIV g©y nªn Héi
chøng suy gi¶m miÔn dÞch m¾c ph¶i (AIDS) ë ng−êi.
Gièng nh− phÇn lín c¸c lo¹i retrovirut kh¸c, HIV cã hÖ gen lµ ARN, cÊu tróc sîi
®¬n, m¹ch th¼ng. Ngoµi ra, c¸c h¹t HIV cã hai b¶n sao ARN gièng hÖt nhau. Hai b¶n
sao nµy g¾n víi nhau ë ®Çu 5’ cña chóng th«ng qua mét ph©n tö tARN (h×nh 3.9).
HÖ gen cña HIV gåm cã 3 gen ®Õn nay ®· biÕt chøc n¨ng, bao gåm: (1) gen gag m·
ho¸ cho protein cÊu tróc néi bµo cña virut, (2) gen env m· ho¸ cho protein vá virut, vµ (3)
gen pol m· ho¸ cho hai enzym thiÕt yÕu kh¸c cÇn cho qu¸ tr×nh sao chÐp ARN cña virut
lµ reverse transcriptase vµ integrase. Ngoµi ra, virut nµy cßn cã mét sè gen kh¸c.
Trong qu¸ tr×nh sinh s¶n cña virut trong tÕ bµo chñ, viÖc tæng hîp sîi ADN tõ sîi
khu«n ARN lµ b−íc ®Çu tiªn, ®−îc xóc t¸c bëi enzym phiªn m· ng−îc reverse
transcriptase (thuèc AZT ®−îc sö dông ®Ó ®iÒu trÞ AIDS lµ mét “®ång ®¼ng” cña thymine
cã ho¹t tÝnh øc chÕ enzym reverse transcriptase).
Qu¸ tr×nh sinh s¶n cña HIV cã thÓ m« t¶ qua c¸c b−íc nh− sau:
 Virut g¾n vµo vÞ trÝ thô thÓ ®Æc hiÖu trªn tÕ bµo lympho CD4+.

81
§inh §oµn Long

a) ~ 60 nucleotide 5’

tARN

~ 8000 nucleotide
3’ ~ 8000 nucleotide
3’ 3’
env pol gag 3’ gag pol env
®Çu poly (A) ®Çu poly (A)
tARN
~ 60 nucleotide
5’ 75 nucleotide
Protein
b) lâi trong
H×nh 3.9. CÊu tróc vµ chøc n¨ng hÖ gen retrovirut -
HIV. a) cÊu tróc hÖ gen retrovirut gåm 2 b¶n sao ph©n tö Protein
ARN g¾n víi nhau, b) cÊu tróc h¹t retrovirut hoµn chØnh. lâi ngoµi

ARN

Protein vá
bÒ mÆt
Líp mµng
kÐp lipid
Protein vá
Enzym phiªn m· ng−îc xuyªn mµng

 Enzym reverse transcriptase sö dông mét trong hai b¶n sao cña ph©n tö ARN
virut lµm m¹ch khu«n ®Ó tæng hîp nªn m¹ch ADN cã tr×nh tù bæ sung. Sau ®ã,
chÝnh enzym nµy l¹i sö dông m¹ch ADN võa ®−îc tæng hîp lµm m¹ch khu«n ®Ó
tæng hîp nªn mét ph©n tö ADN sîi kÐp cã tr×nh tù bæ sung t−¬ng øng víi ARN
cña virut.
 Enzym integrase ®−îc m· hãa bëi hÖ gen virut, lóc nµy, cã kh¶ n¨ng xóc t¸c
viÖc g¾n kÕt ph©n tö ADN sîi kÐp cña virut võa ®−îc tæng hîp vµo hÖ gen nh©n
(còng cã cÊu tróc ADN sîi kÐp) cña tÕ bµo chñ (cã thÓ x¶y ra ë mét nhiÔm s¾c thÓ
bÊt kú). Vµo giai ®o¹n nµy, tr¹ng th¸i tÕ bµo ®−îc gäi lµ tr¹ng th¸i tiÒm tan.
 Nhê hÖ thèng phiªn m· (trong ®ã cã ARN polymerase) cña tÕ bµo chñ, ARN cña
virut ®−îc phiªn m· tõ tr×nh tù gen trªn ®o¹n ADN cña virut ®· ®−îc g¾n vµo hÖ
gen cña tÕ bµo chñ. C¸c ph©n tö ARN nµy võa ®−îc sö dông lµm vËt chÊt di
truyÒn cña virut thÕ hÖ sau, võa ®−îc sö dông lµm khu«n ®Ó tæng hîp nªn c¸c
protein cÊu tróc, c¸c protein lâi vµ vá cña virut trong tÕ bµo chñ.
 C¸c protein cña virut ®−îc t¹o ra cã kh¶ n¨ng ®ãng gãi ph©n tö ARN cña virut
mét c¸ch ®Æc hiÖu ®Ó t¹o thµnh c¸c h¹t virut hoµn chØnh.
 C¸c h¹t virut gi¶i phãng khái tÕ bµo chñ (®ång thêi lµm chÕt tÕ bµo chñ) vµ tiÕp
tôc l©y nhiÔm c¸c tÕ bµo chñ tiÕp theo.
Trong qu¸ tr×nh sinh s¶n cña HIV, ®¸ng chó ý lµ viÖc tæng hîp ph©n tö ADN sîi
kÐp cña virut diÔn ra trong tÕ bµo chÊt. Sau ®ã, ph©n tö ADN nµy ®−îc vËn chuyÓn vµo
trong nh©n vµ liªn kÕt vµo nhiÔm s¾c thÓ cña tÕ bµo chñ. Sù tæng hîp c¸c ph©n tö ARN

82
Ch−¬ng 3. Sao chÐp axit nucleic

hÖ gen cña thÕ hÖ virut con còng diÔn ra trong nh©n, sau ®ã chóng ®−îc chuyÓn ra tÕ bµo
chÊt, ®ång thêi ®Ó tæng hîp c¸c lo¹i protein cña virut vµ ®ãng gãi thµnh c¸c h¹t virut míi.
Nh− vËy, ®Æc ®iÓm ®Æc biÖt cña retrovirut chÝnh lµ kh¶ n¨ng phiªn m· theo chiÒu
ARN → ADN. §Õn nay, chóng lµ d¹ng sèng duy nhÊt ®· ®−îc ph¸t hiÖn cã kh¶ n¨ng nµy.
Enzym reverse transcriptase thùc chÊt lµ mét enzym ADN polymerase cã kh¶ n¨ng sö
dông ARN lµm m¹ch khu«n. XÐt tæng thÓ, revese transcriptase lµ mét enzym cã 3 chøc
n¨ng kh¸c nhau, bao gåm:
1. Chøc n¨ng tæng hîp ph©n tö ADN sîi ®¬n dùa trªn m¹ch khu«n lµ ph©n tö
ARN. Ho¹t tÝnh nµy ®−îc gäi lµ ho¹t tÝnh cña ADN polymerase sö dông ARN
lµm khu«n (RNA-dependent DNA polymerase).
2. Chøc n¨ng tæng hîp m¹ch ADN thø hai bæ sung víi m¹ch ADN thø nhÊt ®−îc
phiªn m· tõ m¹ch khu«n ARN ®Ó h×nh thµnh nªn mét ph©n tö ADN sîi kÐp.
Ho¹t tÝnh nµy gäi lµ ho¹t tÝnh cña ADN polymerase sö dông ADN lµm khu«n
(DNA-dependent DNA polymerase).
3. Trong qu¸ tr×nh sao chÐp ADN cña virut, theo nguyªn t¾c chung cña qu¸ tr×nh
sao chÐp ADN sîi kÐp, cÇn ph¶i cã ®o¹n ARN måi ®−îc h×nh thµnh tr−íc khi
chuçi polynucleotide ®−îc tæng hîp kÐo dµi. Trong tr−êng hîp cña HIV, ®o¹n måi
ARN chÝnh lµ tr×nh tù gièng tARN ®· ®−îc g¾n s½n vµo hÖ gen cña virut. Trong
qu¸ tr×nh sao chÐp ADN virut, ®o¹n måi nµy ®−îc c¾t bá bëi chÝnh enzym
reverse transcriptase. Ho¹t tÝnh nµy cña enzym reverse transcriptase ®−îc gäi lµ
ho¹t tÝnh cña ribonuclease H, tøc lµ ho¹t tÝnh ph©n gi¶i ARN bÊt cø khi nµo cã
ph©n tö lai ADN/ARN. Ch÷ H ë ®©y viÕt t¾t tõ thuËt ng÷ hybrid (¸m chØ ph©n tö
lai ADN/ARN ®−îc t¹o ra bëi enzym phiªn m· ng−îc trong qu¸ tr×nh sao chÐp hÖ
gen cña virut).
C¸c retrovirut cã kh¶ n¨ng duy tr× tr¹ng th¸i tiÒm tan trong mét thêi gian d−êng
nh− v« ®Þnh. ë tr¹ng th¸i tiÒm tan, th«ng th−êng biÓu hiÖn bÖnh lý ë ng−êi bÖnh bÞ nhiÔm
virut lµ kh«ng râ (giai ®o¹n nµy gäi lµ giai ®o¹n cöa sæ). Lóc nµy, ADN cña virut sÏ ®−îc
sao chÐp cïng víi qu¸ tr×nh sao chÐp ADN cña tÕ bµo chñ khi tÕ bµo chñ chuÈn bÞ tiÕn
hµnh ph©n chia tÕ bµo. V× lý do nµy, nhiÒu bÖnh nh©n nhiÔm HIV cã thêi gian ñ bÖnh (giai
®o¹n cöa sæ, t−¬ng øng víi tr¹ng th¸i tiÒm tan cña virut) rÊt kh¸c nhau.
Khi c¸c ph©n tö ARN cña virut ®−îc phiªn m· tõ tr×nh tù ADN cña chóng (lóc nµy
®ang liªn kÕt víi hÖ gen tÕ bµo chñ) råi ®−îc ®ãng gãi thµnh c¸c h¹t virut míi vµ gi¶i
phãng khái tÕ bµo chñ, chóng sÏ lµm chÕt c¸c tÕ bµo chñ. Vµo giai ®o¹n nµy, c¸c triÖu
chøng bÖnh lý cña ng−êi bÖnh míi biÓu hiÖn râ (giai ®o¹n l©y nhiÔm vµ AIDS). Lóc nµy,
tr¹ng th¸i tÕ bµo ®−îc gäi lµ tr¹ng th¸i g©y tan (sinh tan). Mét sè c©u hái ®−îc ®Æt ra
lµ: Khi nµo virut b¾t ®Çu chuyÓn tõ tr¹ng th¸i tiÒm tan sang tr¹ng th¸i g©y tan? TÝn
hiÖu nµo khëi ®Çu qu¸ tr×nh tæng hîp ph©n tö ARN virut? YÕu tè nµo kÝch thÝch sù gi¶i
m· tÝn hiÖu l−u tr÷ trong ph©n tö ADN ë tr¹ng th¸i tiÒm tan ®Ó virut chuyÓn vÒ tr¹ng
th¸i g©y tan (tr¹ng th¸i AIDS)?
C¸c c©u hái nµy ®Õn nay vÉn ®ang ®−îc tiÕp tôc ®−îc lµm râ. Tuy vËy, ®èi víi HIV,
ë nhiÒu ng−êi bÖnh râ rµng tr¹ng th¸i “tiÒm tan” kh«ng nhÊt thiÕt ph¶i x¶y ra.
3.2.4. Phag¬ lambda (λ) vµ hiÖn t−îng tiÒm tan
Trõ mét sè tr−êng hîp ngo¹i lÖ, phÇn lín c¸c thùc khuÈn thÓ (phag¬) vµ virut ë
®éng vµ thùc vËt cã mét chu kú g©y tan duy nhÊt. NghÜa lµ, ngay sau qu¸ tr×nh sinh s¶n
c¸c virut ®−îc gi¶i phãng ra khái tÕ bµo chñ vµ lµm chÕt tÕ bµo chñ. Nh÷ng virut nµy
®−îc gäi lµ c¸c virut ®éc (virulent virus).

83
§inh §oµn Long
a) Chu kú b) Chu kú
g©y tan tiÒm tan

Virut l©y nhiÔm


tÕ bµo chñ

Ph©n chia
tÕ bµo

ADN virut ®−îc chuyÓn


vµo tÕ bµo chñ [ChiÕu x¹ UV]

G©y tan Sao chÐp ADN virut theo ADN virut ikÕt hîp víi hÖ
tÕ bµo chñ kiÓu cuén vßng trßn gen nh©n tÕ bµo chñ Ph©n chia tÕ bµo

ADN vµ c¸c thµnh phÇn cña virut


®ãng gãi thµnh virut thÕ hÖ con

H×nh 3.10. Chu kú g©y tan vµ chu kú tiÒm tan cña phage lambda (λ
λ)
C¸c gen sao chÐp ADN
a)
C¸c gen t¸i tæ hîp C¸c gen tiÒm tan C¸c gen g©y tan
C¸c gen cÊu tróc C¸c gen cÊu tróc
phÇn ®Çu virut phÇn ®u«i virut att int xis α β γ cIII N cl cro cII O P Q S R

Cos Cos

H×nh 3.11. B¶n ®å gen cña phage lambda (λ λ). N cl cro


b) cIII
a) B¶n ®å c¸c gen d¹ng m¹ch th¼ng (d¹ng tù nhiªn γ cII
cña virut), b) b¶n ®å gen ë d¹ng m¹ch vßng (d¹ng O
β
tån t¹i trong E. coli sau khi virut l©y nhiÔm; 2 ®Çu P
α
cos g¾n víi nhau h×nh thµnh vßng trßn khÐp kÝn).
xis Q
Nh−ng ®èi víi mét sè lo¹i virut, S
int
nh− phag¬ λ hay HIV, chóng cã kh¶
att R
n¨ng kh¸c. C¸c virut nµy cã kh¶ n¨ng
kÕt hîp vËt chÊt di truyÒn cña chóng víi Cos
hÖ gen cña tÕ bµo chñ. Nhê vËy, c¸c virut
nµy cã thÓ ®−îc truyÒn tõ thÕ hÖ tÕ bµo
nµy sang thÕ hÖ tÕ bµo kh¸c th«ng qua
qu¸ tr×nh ph©n chia cña tÕ bµo chñ. C¸c
lo¹i phag¬ (hoÆc virut) ®· g¾n ®−îc ADN C¸c gen C¸c gen
cña chóng vµo nhiÔm s¾c thÓ cña tÕ bµo cÊu tróc phÇn ®u«i cÊu tróc phÇn ®Çu
chñ ®−îc gäi lµ phag¬ (virut) tiÒm tan.
Cho ®Õn nay, c¬ chÕ vÒ hiÖn t−îng tiÒm tan vµ g©y tan ®−îc biÕt râ h¬n c¶ ë phag¬ λ khi
l©y nhiÔm tÕ bµo chñ E. coli. Trong phÇn nµy chóng ta sÏ xem xÐt hiÖn t−îng tiÒm tan vµ
g©y tan ë phag¬ λ (h×nh 3.10).
Phag¬ λ lµ mét virut cã kÝch th−íc trung b×nh. VËt chÊt di truyÒn cña nã lµ ADN sîi
kÐp, m¹ch th¼ng (h×nh 3.11a), gåm 48.502 cÆp baz¬ nit¬, m· hãa cho kho¶ng 50 gen.
Ph©n tö ADN sîi kÐp m¹ch th¼ng nµy cã mét ®Æc ®iÓm ®Æc biÖt lµ: hai ®Çu 5’ cña hai
m¹ch ®¬n cã tr×nh tù gåm 12 nucletotit bæ sung víi nhau. Tr×nh tù ë hai ®Çu tËn cïng

84
Ch−¬ng 3. Sao chÐp axit nucleic

nµy cña phag¬ λ ®−îc gäi lµ ®Çu dÝnh (cohensive ends), hay vÞ trÝ Cos. Khi virut l©y
nhiÔm vµo tÕ bµo chñ, ph©n tö ADN nµy sÏ chuyÓn vÒ d¹ng cÊu tróc vßng kÝn nhê enzym
ADN ligase cña E. coli nèi hai ®Çu Cos l¹i víi nhau (h×nh 3.11b). TiÕp theo, enzym ADN
gyrase cña tÕ bµo chñ sÏ gióp ph©n tö ADN virut tiÕp tôc cuén xo¾n.
Sau khi l©y nhiÔm E. coli, phag¬ λ cã thÓ chuyÓn vÒ mét trong hai tr¹ng th¸i: hoÆc lµ
g©y tan (s¶n sinh ra c¸c phag¬ thÕ hÖ con vµ tiªu diÖt tÕ bµo chñ), hoÆc tiÒm tan (liªn kÕt
hÖ gen cña nã víi hÖ gen cña tÕ bµo chñ). Trong qu¸ tr×nh nµy, mét sè yÕu tè (nh− thµnh
phÇn c¸c chÊt dinh d−ìng trong m«i tr−êng, mËt ®é phag¬ so víi tÕ bµo chñ, v.v…) cã ¶nh
h−ëng ®Õn xu h−íng tÕ bµo chuyÓn sang tr¹ng th¸i tiÒm tan hay g©y tan. Ch¼ng h¹n, khi
m«i tr−êng nghÌo dinh d−ìng, trao ®æi chÊt ë vi khuÈn bÞ ¶nh h−ëng thËm trÝ ®Õn møc mµ
tÕ bµo cña nã ph¶i tiÕn hµnh ph©n hñy c¸c ph©n tö protein vµ ARN cña chÝnh nã dÉn ®Õn
viÖc virut còng cã thÓ bÞ bÊt ho¹t vµ chÕt. Ng−îc l¹i, khi mËt ®é virut cao, nÕu qu¸ tr×nh
tiÒm tan kh«ng x¶y ra, virut sÏ sinh s¶n vµ ph¸ vì tÕ bµo chñ (tr¹ng th¸i g©y tan). ë tr¹ng
th¸i tiÒm tan, tÕ bµo chñ kh«ng bÞ l©y nhiÔm bëi virut cïng lo¹i n÷a (hiÖn t−îng miÔn
dÞch). Virut cã thÓ tån t¹i ë tr¹ng th¸i tiÒm tan qua nhiÒu thÕ hÖ tÕ bµo chñ, nh−ng sau ®ã
vµo bÊt cø lóc nµo, chóng còng cã thÓ b¾t ®Çu mét chu kú g©y tan míi.
3.2.4.1. Chu kú g©y tan
Trong chu kú g©y tan, ADN cña phag¬ λ ®−îc sao chÐp theo nguyªn t¾c vßng l¨n.
Ngoµi ra, nhê ho¹t ®éng cña enzym ARN polymerase, hÖ gen cña virut ®−îc phiªn m·
trong tÕ bµo chñ. Qu¸ tr×nh g©y tan x¶y ra qua mét sè b−íc nh− sau:
1. ADN m¹ch th¼ng cña virut ®−îc “tiªm” vµo tÕ bµo chñ.
2. D−íi t¸c dông cña enzym ADN ligase, mèi liªn kÕt phosphodieste ë vÞ trÝ hai ®Çu
dÝnh (Cos) cña ph©n tö ADN sîi kÐp, m¹ch th¼ng cña virut ®−îc h×nh thµnh, nhê
vËy ph©n tö ADN chuyÓn thµnh d¹ng sîi kÐp, m¹ch vßng khÐp kÝn.
3. TiÕp theo, sù sao chÐp ADN b¾t ®Çu diÔn ra. Lóc ®Çu, ph©n tö ADN sîi kÐp,
m¹ch vßng sao chÐp theo kiÓu θ (gièng cña E. coli), sau ®ã chuyÓn sang kiÓu sao
chÐp vßng l¨n (gièng cña ΦX174). KiÓu sao chÐp thø nhÊt ®−îc sö dông nh»m
lµm t¨ng sè ph©n tö ADN ®−îc dïng lµm khu«n tõ ®ã tæng hîp nªn c¸c protein
cña virut, ®ång thêi ®−îc sö dông l¹i cho qu¸ tr×nh sao chÐp tiÕp theo. Trong khi
®ã, kiÓu sao chÐp thø hai ®−îc sö dông ®Ó sao chÐp c¸c ph©n tö ADN sau nµy
®−îc dïng lµm vËt chÊt di truyÒn l−u gi÷ trong c¸c h¹t virut thÕ hÖ con. ë c¶ hai
kiÓu sao chÐp, s¶n phÈm t¹o ra ®Òu lµ c¸c ph©n tö ADN sîi kÐp. Khi ADN ®−îc
sao chÐp theo kiÓu vßng l¨n, s¶n phÈm ADN míi ®−îc t¸ch khái sîi ADN mÑ ë vÞ
trÝ Cos vµ ®−îc ®ãng gãi cïng víi c¸c protein vá cña virut (lóc nµy ®· ®−îc tæng
hîp qua qu¸ tr×nh dÞch m·) ®Ó h×nh thµnh nªn phÇn ®Çu cña virut. Sau ®ã, phÇn
®u«i virut ®−îc g¾n vµo phÇn ®Çu ®Ó h×nh thµnh nªn h¹t virut hoµn chØnh.
Nh−ng, kh«ng gièng nh− virut TMV, phag¬ λ kh«ng cã kh¶ n¨ng tù ®ãng gãi, mµ
qu¸ tr×nh nµy cÇn sù “hç trî” cña mét sè protein ®Æc hiÖu trong tÕ bµo chñ.
4. Nhê ph¶n øng enzym, thµnh vµ mµng tÕ bµo chñ sÏ bÞ ph©n gi¶i vµ c¸c h¹t virut
®−îc gi¶i phãng ra ngoµi m«i tr−êng, tiÕp tôc l©y nhiÔm c¸c tÕ bµo chñ kh¸c.
Trong mét chu kú g©y tan nh− trªn, tõ mét h¹t phag¬ l©y nhiÔm (tÕ bµo E. coli) cã
thÓ s¶n sinh ra kho¶ng 100 h¹t phag¬ thÕ hÖ con.
3.2.4.2. Chu kú tiÒm tan
Nh− ®· nãi ë trªn, trong ®iÒu kiÖn m«i tr−êng nhÊt ®Þnh (nghÌo dinh d−ìng, mËt ®é
virut cao) virut cã thÓ chuyÓn vÒ tr¹ng th¸i “nghØ”, hay cßn gäi lµ tr¹ng th¸i tiÒm tan, cho
®Õn khi ®iÒu kiÖn m«i tr−êng thay ®æi thÝch hîp h¬n cho sù ph¸t triÓn cña virut.

85
§inh §oµn Long

Phøc hÖ øc chÕ
a) (d¹ng dÞ phøc kÐp)

C¸c gen øc chÕ sinh OR3 OR2 OR1 Gen Cro vµ c¸c gen
s¶n vµ g©y tiÒm tan sinh s¶n (g©y tan)

C¸c tr×nh tù chØ huy (Operator)

b)

C¸c gen øc chÕ sinh Gen Cro vµ c¸c gen


s¶n vµ g©y tiÒm tan sinh s¶n (g©y tan)

Enzym RecA
UV
Phøc hÖ øc chÕ
bÞ ph¸ hñy

H×nh 3.12. CÊu tróc ph©n vïng c¸c gen tiÒm tan vµ g©y tan n»m t¸ch biÖt bëi c¸c tr×nh tù ®iÒu hßa ë
phage λ. a) Khi phøc hÖ chÊt øc chÕ g¾n vµo c¸c tr×nh tù chØ huy OR1 vµ OR2, sù phiªn m· gen Cro vµ c¸c gen
g©y tan bÞ øc chÕ; trong khi ®ã, sù biÓu hiÖn cña c¸c gen øc chÕ vµ c¸c gen g©y tiÒm tan ®−îc t¨ng c−êng →
tr¹ng th¸i tiÒm tan, b) Khi cã chiÕu x¹ UV, hÖ thèng söa ch÷a SOS ®¸p øng vµ t¹o ra protein RecA. RecA gi¶i
phãng phøc hÖ øc chÕ khái c¸c tr×nh tù chØ huy OR1 vµ OR2 vµ ph©n hñy phøc hÖ nµy; nhê vËy, ARN polymerase
cã thÓ g¾n vµo tr×nh tù chØ huy vµ tiÕn hµnh phiªn m· gen cro vµ c¸c gen g©y tan → tr¹ng th¸i g©y tan

ë tr¹ng th¸i tiÒm tan, ADN cña phag¬ λ liªn kÕt víi ADN tÕ bµo E. coli ë vÞ trÝ ®Æc
hiÖu (kh¸c víi HIV cã thÓ liªn kÕt ngÉu nhiªn víi c¸c nhiÔm s¾c thÓ ë ng−êi) th−êng n»m
gi÷a hai gen m· hãa c¸c enzym tham gia chuyÓn hãa galactose vµ tæng hîp biotin. VÞ trÝ
nµy ®−îc gäi tªn lµ attB (att = attachment). Cßn vÞ trÝ g¾n ®Æc hiÖu cña hÖ gen virut
(kh«ng ph¶i b¾t ®Çu tõ hai vÞ trÝ Cos) n»m ë gÇn gi÷a ph©n tö ADN cña virut ®−îc gäi lµ
attP. Qu¸ tr×nh g¾n ADN virut vµo ADN tÕ bµo chñ cÇn ®Õn enzym integrase. Qu¸ tr×nh
nµy cã thÓ ®¶o ng−îc. NghÜa lµ, sau ®ã virut cã thÓ chuyÓn tõ tr¹ng th¸i tiÒm tan trë vÒ
tr¹ng th¸i g©y tan. Lóc nµy, ADN virut ®−îc t¸ch ra khái ADN tÕ bµo chñ nhê ho¹t ®éng
cña mét enzym, gäi lµ excisionase (cïng phèi hîp víi enzym integrase vµ mét sè protein
kh¸c cña tÕ bµo chñ).
ViÖc phag¬ λ chuyÓn ®æi tõ tr¹ng th¸i tiÒm tan sang g©y tan phô thuéc vµo mét sè
yÕu tè m«i tr−êng d−íi sù ®iÒu khiÓn cña mét c¬ chÕ di truyÒn. Cô thÓ, trong hÖ gen cña
virut cã hai gen m· hãa cho hai lo¹i protein ®iÒu hßa qu¸ tr×nh tiÒm tan vµ g©y tan, gäi
lµ cII vµ Cro. Trong ®ã, cII cã vai trß thóc ®Èy qu¸ tr×nh tæng hîp cña hai lo¹i protein
kh¸c lµ protein cI (protein cã t¸c dông øc chÕ qu¸ tr×nh g©y tan) vµ integrase (protein
xóc t¸c sù liªn kÕt ADN phag¬ vµo hÖ gen tÕ bµo chñ). Trong khi ®ã, protein Cro cã vai
trß thóc ®Èy ho¹t ®éng cña enzym ARN polymerase nh»m phiªn m· c¸c gen g©y tan cña
virut, ®ång thêi øc chÕ sù biÓu hiÖn cña gen m· hãa protein cI.

86
Ch−¬ng 3. Sao chÐp axit nucleic

Trong cÊu t¹o hÖ gen virut cã mét tr×nh tù ADN ®−îc gäi lµ tr×nh tù chØ huy
gåm 3 vÞ trÝ g¾n protein, ®−îc ®¸nh sè 1, 2 vµ 3 (h×nh 3.12). Tr×nh tù chØ huy nµy n»m
ng¨n c¸ch gi÷a c¸c gen cÇn cho qu¸ tr×nh tiÒm tan vµ c¸c gen cÇn cho qu¸ tr×nh g©y
tan. Cô thÓ, n»m vÒ phÝa ph¶i cña tr×nh tù chØ huy lµ c¸c gen tham gia vµo qu¸ tr×nh
g©y tan vµ sinh s¶n cña virut, bao gåm c¸c gen OR1, OR2, OR3. N»m vÒ phÝa tr¸i cña
tr×nh tù chØ huy lµ c¸c gen m· hãa protein cI vµ mét sè protein kh¸c cã t¸c dông øc chÕ
qu¸ tr×nh g©y tan.
Trong mét sè ®iÒu kiÖn m«i tr−êng nhÊt ®Þnh (ch¼ng h¹n: m«i tr−êng nghÌo dinh
d−ìng), c¸c protein cII, råi sau ®ã lµ cI vµ integrase ®−îc t¨ng c−êng tæng hîp. Hai lo¹i
protein cI vµ cII h×nh thµnh nªn phøc hÖ øc chÕ gåm hai tiÓu phÇn, råi g¾n vµo vÞ trÝ sè 1
cña tr×nh tù chØ huy (h×nh 3.12a). Khi phøc hÖ øc chÕ nµy g¾n vµo vÞ trÝ sè 1, cã hai hiÖu
øng ®ång thêi x¶y ra: (1) ARN polymerase kh«ng thÓ g¾n ®−îc vµo tr×nh tù chØ huy vµ
tiÕn hµnh phiªn m· c¸c gen g©y tan (n»m bªn ph¶i tr×nh tù chØ huy); (2) ¸i lùc liªn kÕt
cña phøc hÖ øc chÕ vµo tr×nh tù chØ huy sè 2 t¨ng lªn. Khi phøc hÖ øc chÕ g¾n vµo vÞ trÝ
sè 2 ®ång thêi lµm t¨ng ¸i lùc liªn kÕt cña enzym ARN polymerase vµo vÞ trÝ sè 3, nhê
vËy sù biÓu hiÖn cña c¸c gen øc chÕ g©y tan t¨ng lªn. Nh− vËy, trong tr−êng hîp nµy,
protein cI cã kh¶ n¨ng tù ®iÒu hßa sù biÓu hiÖn cña gen m· hãa chÝnh nã. B»ng c¸ch nh−
vËy, víi sù ho¹t ®éng cña c¸c protein øc chÕ g©y tan vµ enzym integrase, hÖ gen cña virut
®−îc thóc ®Èy liªn kÕt víi hÖ gen cña tÕ bµo chñ, dÉn ®Õn tr¹ng th¸i tiÒm tan.
Song song víi qu¸ tr×nh trªn ®©y, trong ®iÒu kiÖn m«i tr−êng nghÌo dinh d−ìng, tÕ
bµo chñ E. coli ®ång thêi t¨ng c−êng viÖc tæng hîp mét l−îng lín c¸c ph©n tö tÝn hiÖu,
nh− cAMP. Trong khi ®ã, trong hÖ gen virut ngoµi gen m· hãa protein cII cßn gen m·
hãa enzym ph©n hñy protein cII nµy. V× viÖc tæng hîp enzym ph©n hñy protein cII l¹i lµ
mét qu¸ tr×nh phô thuéc vµo cAMP, nªn khi nång ®é cAMP t¨ng cao, ho¹t ®éng tæng hîp
enzym ph©n hñy cII bÞ øc chÕ. KÕt qu¶ lµ: khi m«i tr−êng nghÌo dinh d−ìng hoÆc mËt ®é
virut cao, th× cã nhiÒu ph©n tö cAMP ®−îc t¹o thµnh vµ cã Ýt enzym ph©n hñy cII ®−îc
tæng hîp, dÉn ®Õn trong tÕ bµo cã mét l−îng lín protein cII ho¹t ®éng. V× vËy, còng dÉn
®Õn tr¹ng th¸i tiÒm tan.
T−¬ng tù nh− vËy, trong tr−êng hîp mËt ®é virut trong m«i tr−êng t¨ng cao, l−îng
protein cII ®−îc tæng hîp nhiÒu h¬n do sè l−îng b¶n sao cña virut trong tÕ bµo chñ t¨ng
lªn. Lóc ®ã, mét l−îng lín protein cII ®−îc t¹o ra (tr−íc khi c¸c gen g©y tan ®−îc ho¹t
hãa) thóc ®Èy sù biÓu hiÖn gen cI. §Õn l−ît m×nh, protein cI l¹i t¨ng c−êng øc chÕ sù biÓu
hiÖn cña c¸c gen g©y tan (vÝ dô: OR1, OR2, OR3), dÉn ®Õn viÖc tÕ bµo chuyÓn sang tr¹ng
th¸i tiÒm tan.
Ng−îc l¹i, trong mét sè ®iÒu kiÖn m«i tr−êng nhÊt ®Þnh (nh− thiÕu thymine hoÆc cã
mÆt khÝ nit¬) hoÆc khi cÊu tróc ADN cña vi khuÈn bÞ sai háng (vÝ dô: do chiÕu x¹ tÞa UV,
tia X), hoÆc do sù k×m h·m qu¸ tr×nh biÓu hiÖn cña c¸c gen øc chÕ g©y tan nh− cI, th×
virut cã thÓ chuyÓn tõ tr¹ng th¸i tiÒm tan trë vÒ tr¹ng th¸i g©y tan. Trong tr−êng hîp
nµy (ch¼ng h¹n khi ADN tÕ bµo chñ bÞ sai háng), tÕ bµo chñ cã thÓ kÝch ho¹t hÖ thèng söa
ch÷a SOS cña nã. HÖ thèng SOS nµy ho¹t ®éng dÉn ®Õn viÖc biÓu hiÖn mét sè gen cña tÕ
bµo chñ, trong ®ã cã gen m· hãa protein RecA lµ protein ph¸ hñy protein cI cña phag¬ λ.
ViÖc ph¸ hñy nµy ®i kÌm víi viÖc g©y bÊt ho¹t gen m· ho¸ protein cI (v× protein cI cã
chøc n¨ng tù xóc t¸c ph¶n øng tæng hîp chÝnh nã) ®ång thêi ho¹t hãa mét sè gen kh¸c,

87
§inh §oµn Long

trong ®ã cã gen m· hãa protein Cro (h×nh 3.12b). Protein Cro ®−îc t¹o ra sÏ thóc ®Èy
viÖc biÓu hiÖn cña c¸c gen g©y tan (n»m bªn ph¶i tr×nh tù chØ huy), ®ång thêi øc chÕ viÖc
gi¶i m· c¸c gen g©y tiÒm tan (n»m bªn tr¸i tr×nh tù chØ huy). §ång thêi, protein Cro cßn
cã kh¶ n¨ng gi¶i phãng c¸c phøc hÖ øc chÕ khái hai vÞ trÝ g¾n sè 1 vµ 2 trªn tr×nh tù chØ
huy. Nhê vËy, enzym ARN polymerase cã thÓ g¾n vµo tr×nh tù chØ huy vµ tr−ît vÒ phÝa
ph¶i ®Ó phiªn m· c¸c gen g©y tan. Song song víi qu¸ tr×nh nµy, lóc ®ã b¶n th©n protein
Cro cßn cã kh¶ n¨ng g¾n vµo vÞ trÝ sè 3 trªn tr×nh tù chØ huy vµ ng¨n c¶n kh«ng cho
enzym ARN polymerase g¾n ®−îc vµo vÞ trÝ nµy vµ tiÕn hµnh phiªn m· c¸c gen g©y tiÒm
tan. Nhê vËy, cïng víi sù ho¹t ®éng cña c¸c enzym excisionase, integrase vµ mét sè
protein ®Æc hiÖu kh¸c, ADN cña phag¬ tiÒm tan t¸ch ra khái hÖ gen cña tÕ bµo chñ vµ tù
tiÕn hµnh sao chÐp theo nguyªn t¾c vßng l¨n, dÉn ®Õn sù g©y tan.
Nh− vËy, víi c¸c h×nh thøc sao chÐp vËt chÊt di truyÒn kh«ng cã cÊu tróc ph©n tö
ADN sîi kÐp cña mét sè d¹ng virut nh− ®−îc tr×nh bµy ë trªn, chóng ta nhËn thÊy
ph−¬ng thøc sao chÐp vËt chÊt di truyÒn ®· ®−îc ph¸t triÓn ®a d¹ng cïng víi qu¸ tr×nh
tiÕn hãa cña virut vµ phï hîp víi tËp tÝnh ký sinh cña c¸c lo¹i virut trong tÕ bµo chñ. VÒ
qu¸ tr×nh sinh ra sù ®a d¹ng nµy, cã thÓ nhËn thÊy chÝnh nhê kÝch th−íc vµ cÊu tróc hÖ
gen nhá, ®¬n gi¶n, tÇn sè ®ét biÕn cao, kh¶ n¨ng t¸i tæ hîp víi hÖ gen cña c¸c loµi sinh
vËt chñ, mµ c¸c lo¹i virut rÊt dÔ biÕn ®æi vµ thÝch nghi víi c¸c ®iÒu kiÖn sèng kh¸c nhau.

88
Ch−¬ng 4

Phiªn m· vµ dÞch m· di truyÒn

4.1. Gen biÓu hiÖn th«ng qua sù phiªn m· vµ dÞch m·


CÊu tróc, chøc n¨ng, sù
sinh tr−ëng vµ sinh s¶n cña mét C¸c gen A vµ C ®−îc phiªn m· tõ
c¬ thÓ phô thuéc vµo c¸c thuéc m¹ch (+), trong khi …
tÝnh protein cã trong mçi m«, tÕ
bµo cña c¬ thÓ ®ã. Mét ph©n tö ARN
ADN
protein cã thÓ gåm mét hoÆc mét
5’ Gen A Gen B Gen C 3’
sè chuçi polypeptide; trong ®ã, 3’ 5’
tr×nh tù c¸c axit amin trong
chuçi polypeptide ®−îc qui ®Þnh ARN ARN
bëi tr×nh tù nucleotide trong gen
(ADN). Khi tÕ bµo cÇn mét lo¹i … gen B ®−îc phiªn
protein nµo ®ã, th«ng tin di m· tõ m¹ch (-).
truyÒn tõ gen ®−îc “dÞch m·”
thµnh tr×nh tù axit amin trong H×nh 4.1. ARN cã thÓ ®−îc phiªn m tõ bÊt cø m¹ch nµo
ph©n tö protein t−¬ng øng. Qu¸ cña ADN sîi kÐp. Víi phÇn lín sinh vËt, mçi gen chØ ®−îc
tr×nh truyÒn th«ng tin nh− vËy phiªn m· tõ mét m¹ch ADN, nh−ng c¸c gen kh¸c nhau cã
(cßn gäi lµ sù biÓu hiÖn cña gen) thÓ ®−îc phiªn m· tõ mét trong hai m¹ch. M¹ch (+) theo qui
®−îc thùc hiÖn qua hai giai ®o¹n −íc lµ m¹ch cã tr×nh tù gièng víi mARN m· hãa protein ®Æc
tr−ng cña vËt chñ (vÝ dô: protein vá virut), m¹ch cßn l¹i lµ (-).
lµ “phiªn m·” vµ “dÞch m·”.
Trong ®ã, phiªn m· lµ qu¸ tr×nh tæng hîp mét ph©n tö ARN (tr×nh tù c¸c
ribonucleotide) m¹ch ®¬n lµ b¶n phiªn m· cña gen (tr×nh tù c¸c deoxyribonucleotide), cßn
dÞch m· lµ qu¸ tr×nh tæng hîp protein (tr×nh tù c¸c axit amin) dùa trªn m¹ch khu«n lµ
b¶n phiªn m· (ARN). Kh«ng gièng sao chÐp ADN vèn chØ diÔn ra mét lÇn duy nhÊt trong
mçi chu tr×nh tÕ bµo, phiªn m· vµ dÞch m· diÔn ra liªn tôc trong suèt chu tr×nh tÕ bµo
(tuy cã gi¶m ë pha M). N¨m 1956 (3 n¨m sau ngµy c«ng bè m« h×nh xo¾n kÐp ADN cïng
Watson), Crick ®−a ra kh¸i niÖm vÒ “nguyªn lý trung t©m” ph¶n ¸nh hai giai ®o¹n cña
mét qu¸ tr×nh biÓn hiÖn gen lµ ADN → ARN → protein.
Trong phiªn m·, ARN ®−îc tæng hîp tõ m¹ch khu«n ADN. ë phÇn lín c¸c loµi, mçi
gen th−êng chØ ®−îc phiªn m· tõ mét m¹ch cña ph©n tö ADN sîi kÐp, nh−ng c¸c gen
kh¸c nhau cã thÓ ®−îc phiªn m· hoÆc tõ m¹ch nµy hoÆc tõ m¹ch kia cña ADN (h×nh
4.1). Trong hÖ gen, kh«ng ph¶i mäi gen ®Òu m· hãa protein; nãi c¸ch kh¸c, kh«ng ph¶i
mäi b¶n phiªn m· ARN ®Òu ®−îc dÞch m·. Trong thùc tÕ, cã 4 lo¹i ARN chÝnh (ngoµi mét
sè lo¹i kh¸c), mçi lo¹i ®−îc m· hãa bëi mét nhãm gen kh¸c nhau, bao gåm:
1) mARN (ARN th«ng tin) m· hãa cho tr×nh tù axit amin cña chuçi polypeptide.
C¸c mARN chÝnh lµ b¶n phiªn m· cña c¸c gen m· hãa protein, cßn gäi lµ gen
cÊu tróc.
2) rARN (ARN ribosome) kÕt hîp víi c¸c protein ribosome ®Ó t¹o nªn c¸c ribosome
hoµn chØnh. Ribosome chÝnh lµ “bé m¸y dÞch m·” tr×nh tù mARN thµnh protein.

89
§inh §oµn Long

3) tARN (ARN vËn chuyÓn) lµm nhiÖm vô vËn chuyÓn c¸c axit amin tíi ribosome
trong dÞch m·; ®ãng vai trß nh− “ng−êi phiªn dÞch” ®Ó chuyÓn “ng«n ng÷” cña c¸c
nucleotide trªn ARN thµnh “ng«n ng÷” cña c¸c axit amin trªn ph©n tö protein.
4) snARN (ARN nh©n nhá) kÕt hîp víi protein h×nh thµnh nªn phøc hÖ hoµn thiÖn
ARN (c¾t c¸c intron) sau phiªn m·, gäi lµ spliceosome.
Trong phÇn sau cña ch−¬ng nµy, chóng ta sÏ ®Ò cËp ®Õn mét sè khÝa c¹nh cña c¸c
qu¸ tr×nh phiªn m· vµ dÞch m· ë prokaryote vµ eukaryote, còng nh− vÒ c¸c lo¹i ARN.

4.2. Phiªn m· (tæng hîp ARN)

4.2.1. C¸c thµnh phÇn tham gia qu¸ tr×nh phiªn m·


Trong qu¸ tr×nh phiªn m·, ARN ®−îc tæng hîp theo chiÒu 5’ → 3’. M¹ch ADN
(chiÒu 3’ → 5’) ®−îc ARN polymerase tr−ît trªn ®ã ®Ó tiÕn hµnh phiªn m· ®−îc gäi lµ
m¹ch khu«n ADN. M¹ch ADN bæ sung (chiÒu 5’ → 3) ®−îc gäi lµ m¹ch kh«ng lµm
khu«n. Do tr×nh tù m¹ch ADN kh«ng lµm khu«n cã chiÒu ph©n cùc vµ tr×nh tù nucleotide
gièng víi ARN ®−îc t¹o thµnh nªn ®−îc gäi lµ m¹ch m· hãa; trong khi m¹ch kh«ng lµm
khu«n ®−îc gäi lµ m¹ch ®èi m·. C¸c thµnh phÇn c¬ b¶n kh¸c tham gia qu¸ tr×nh phiªn
m· bao gåm:
1) Enzym ARN polymerase (ARN pol): ®©y lµ enzym trùc tiÕp xóc t¸c ph¶n øng
trïng hîp ARN. Enzym nµy cã kh¶ n¨ng tù t¸ch hai m¹ch ®¬n cña ph©n tö ADN
sîi kÐp, tr−ît däc trªn mét m¹ch vµ xóc t¸c ph¶n øng trïng hîp ARN. Còng
gièng ADN pol, ho¹t ®éng xóc t¸c ph¶n øng cña ARN pol ®−îc cung cÊp n¨ng
l−îng tõ chÝnh sù ®øt g·y nhãm ~ cña c¸c dNTP; v× vËy, sù tæng hîp chØ diÔn
ra theo chiÒu 5’→3’ vµ ARN pol dÞch chuyÓn trªn m¹ch ADN trong phiªn m·
theo mét chiÒu nhÊt ®Þnh. Tuy nhiªn, kh¸c víi ADN pol, ARN pol cã kh¶ n¨ng tù
khëi ®Çu ph¶n øng trïng hîp mµ kh«ng cÇn ®o¹n måi. ë prokaryote, toµn bé hÖ
gen ®−îc phiªn m· bëi mét lo¹i ARN pol duy nhÊt; trong khi ®ã, ë eukaryote cã
ba lo¹i (kÝ hiÖu lµ ARN pol I, II vµ III).
2) C¸c ribonucleotide triphosphate (NTP): Gièng nh− c¸c dNTP trong sao chÐp
ADN, c¸c NTP võa lµ thµnh phÇn cÊu tróc nªn ARN, võa lµ nguån cung cÊp
n¨ng l−îng cho qu¸ tr×nh phiªn m·. CÇn ph©n biÖt c¸c nucleotide cÊu t¹o nªn
ARN vµ c¸c nucleotide cÊu t¹o nªn ADN. Chóng lµ 8 lo¹i nucleotide kh¸c nhau.
Trong ®ã, cÊu t¹o nªn ARN lµ c¸c ribonucleotide cã vÞ trÝ C-2’ ë phÇn ®−êng
ribose lµ nhãm –OH; cßn ADN ®−îc cÊu t¹o tõ c¸c deoxyribonucleotide cã vÞ trÝ
C-2’ ë phÇn ®−êng lµ nhãm –H.
3) C¸c tr×nh tù ®iÒu hßa phiªn m·: ®ã lµ c¸c tr×nh tù nucleotide ®Æc thï trªn
ADN ®¸nh dÊu vÞ trÝ gen ®−îc b¾t ®Çu vµ kÕt thóc phiªn m·, hoÆc lµ c¸c tr×nh tù
®iÒu khiÓn sù biÓu hiÖn cña gen. §o¹n tr×nh tù ADN mµ ë ®ã ARN pol g¾n vµo
vµ khëi ®Çu phiªn m· ®−îc gäi lµ tr×nh tù khëi ®Çu phiªn m· (hay
promoter). §o¹n tr×nh tù ADN mµ ë ®ã sù phiªn m· cña gen kÕt thóc ®−îc gäi
lµ tr×nh tù (hay tÝn hiÖu) kÕt thóc phiªn m· (terminator). Sù khëi ®Çu vµ
kÕt thóc phiªn m· ë prokaryote vµ eukaryote cã nh÷ng ®Æc ®iÓm kh¸c nhau
(®−îc nªu ë phÇn sau). Nh×n chung, trong phiªn m·, v× ARN pol chuyÓn dÞch
trªn ph©n tö ADN theo mét chiÒu, nªn promoter th−êng n»m ng−îc dßng (tøc lµ
vÒ phÝa ®Çu 5’) cña ®o¹n tr×nh tù m· hãa ë mçi gen; ng−îc l¹i, c¸c terminator
th−êng n»m xu«i dßng (vÒ phÝa ®Çu 3’) cña ®o¹n tr×nh tù m· hãa. Ngoµi c¸c tr×nh
tù nªu trªn, sù phiªn m· ë nhiÒu gen cßn phô thuéc vµo c¸c tr×nh tù kh¸c lµ vÞ

90
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

trÝ liªn kÕt cña c¸c yÕu tè ho¹t hãa (vÝ dô: enhancer) hoÆc cña c¸c protein ®iÒu
hßa sù biÓu hiÖn gen (nh− operator, attenuator, v.v...; xem thªm ch−¬ng 5).
4) C¸c yÕu tè ®iÒu hßa phiªn m·: sù phiªn m· cña phÇn lín c¸c gen ë c¶
prokaryote vµ eukaryote ®Òu ®−îc ®iÒu khiÓn bëi nhiÒu protein kh¸c nhau. C¸c
protein nµy cã thÓ lµ c¸c protein ho¹t hãa (®iÒu hßa d−¬ng tÝnh) hoÆc øc chÕ
phiªn m· (®iÒu hßa ©m tÝnh), hoÆc lµ c¸c yÕu tè tham gia bé m¸y phiªn m·.
Chóng ®−îc m· hãa bëi c¸c gen kh¸c trong hÖ gen, nh−ng t−¬ng t¸c víi c¸c tr×nh
tù ®iÒu hßa ®Ó ®iÒu khiÓn sù biÓu hiÖn gen.

4.2.2. C¸c enzym ARN polymerase vµ qu¸ tr×nh phiªn m·


XÐt vÒ c¬ chÕ hãa häc vµ ho¹t ®éng cña enzym, c¸c b−íc cña phiªn m· rÊt gièng víi
sao chÐp ADN (ch−¬ng 3). C¶ hai qu¸ tr×nh ®Òu lµ ph¶n øng trïng hîp c¸c axit nucleic
xóc t¸c bëi enzym; trong ®ã, mét m¹ch axit nucleic míi ®−îc tæng hîp dùa trªn mét m¹ch
ADN s½n cã. Tuy nhiªn, gi÷a hai qu¸ tr×nh cã mét sè kh¸c biÖt, bao gåm:
- ARN pol (enzym tæng hîp ARN) kh«ng cÇn ®o¹n måi nh− ADN pol; nã cã kh¶
n¨ng tù khëi ®Çu sù tæng hîp chuçi polyribonucleotide (ARN). Tuy vËy, sù khëi
®Çu nµy chØ cã thÓ diÔn ra tõ nh÷ng vÞ trÝ nhÊt ®Þnh trªn ph©n tö ADN, gäi lµ
promoter.
- §Ó sao chÐp ADN, phøc hÖ sao chÐp gåm ADN pol liªn kÕt ®ång thêi trªn hai
m¹ch cña ADN sîi kÐp; viÖc t¸ch hai m¹ch ®−îc thùc hiÖn bëi mét sè protein ®Æc
biÖt. Trong khi ®ã, ®Ó phiªn m·, ARN pol chØ liªn kÕt trªn mét m¹ch cña ph©n tö
ADN; nã tù gi·n xo¾n cÊu tróc ADN xo¾n kÐp, ®ång thêi xóc t¸c ph¶n øng phiªn
m· mµ kh«ng cÇn c¸c protein gi·n xo¾n vµ t¸ch m¹ch ®¬n chuyªn biÖt.
- Nguyªn liÖu ®Ó ARN pol tæng hîp ARN lµ c¸c ribonucleotide triphosphate (ATP,
GTP, CTP vµ UTP), gäi chung lµ NTP; trong khi nguyªn liÖu ®Ó ADN pol tæng
hîp ADN lµ c¸c deoxyribonucleotide (dNTP). Ngoµi ra, trong phiªn m·,
nucleotide ®−îc ARN pol dïng bæ sung vµo chuçi ARN ®Ó kÕt cÆp víi A lµ U, chø
kh«ng ph¶i T nh− tr−êng hîp cña ADN pol. Nh− vËy, nÕu m¹ch khu«n ADN lµ
[3’– ATACTGGAC – 5’] th× m¹ch ARN sÏ lµ [5’– UAUGACCUG – 5’].
- S¶n phÈm ARN ®−îc t¹o ra tõ phiªn m· kh«ng duy tr× liªn kÕt hydro víi m¹ch
ADN lµm khu«n. Thay vµo ®ã, ARN pol “®Èy” m¹ch ARN míi tæng hîp ngay sau
khi mét vµi ribonucleotide ®· ®−îc bæ sung vµo chuçi ARN. Sù t¸ch ra cña ARN
lµ cÇn thiÕt ®Ó sau ®ã nã cã thÓ ®−îc dïng ngay lµm khu«n tæng hîp protein (ë
prokaryote) hoÆc ®Ó biÕn ®æi thµnh ARN thµnh thôc s½n sµng cho dÞch m· (ë
eukaryote). Còng nhê sù t¸ch ARN x¶y ra gÇn nh− ngay lËp tøc, mét gen cïng
lóc cã thÓ ®−îc phiªn m· bëi nhiÒu ARN pol ®Ó t¹o nªn nhiÒu b¶n phiªn m· ®ång
thêi. Nhê vËy, tÕ bµo cã thÓ tæng hîp ®−îc mét sè l−îng lín protein tõ mét gen
duy nhÊt trong thêi gian ng¾n.
- Tuy còng cã chøc n¨ng ®äc söa gièng ADN pol, ®é chÝnh x¸c cña c¸c ARN pol
trong viÖc ghÐp cÆp c¸c nucleotide theo nguyªn t¾c Chargaff lµ thÊp h¬n. Trung
b×nh, tÇn sè sai sãt trong phiªn m· lµ 10-4 - 10-6, cßn tÇn sè nµy trong sao chÐp
ADN lµ 10-7 - 10-9.
ë tÊt c¶ c¸c lo¹i tÕ bµo, ARN pol cã thÓ tån t¹i ë nhiÒu d¹ng kh¸c nhau, nh−ng
chóng ®Òu xóc t¸c cho cïng ph¶n øng vµ cã nhiÒu ®Æc ®iÓm chung. Tõ vi khuÈn ®Õn thó,
c¸c ARN pol ®Òu ®−îc cÊu t¹o gåm nhiÒu chuçi polypeptide (trõ mét sè phag¬ vµ ë bµo
quan eukaryote). B¶ng 4.1 nªu sè l−îng vµ kÝch th−íc c¸c thµnh phÇn cña ARN pol ë c¸c
giíi sinh vËt kh¸c nhau (prokaryote, eukaryote vµ archaea). D÷ liÖu trªn b¶ng cho thÊy ë
prokaryote chØ cã mét lo¹i ARN pol, trong khi ë eukaryote cã ba lo¹i lµ ARN pol I, II vµ

91
§inh §oµn Long

III. Trong ®ã ARN pol II ®−îc quan t©m h¬n c¶ bëi enzym nµy thùc hiÖn phiªn m· c¸c
gen m· hãa protein (chiÕm phÇn lín hÖ gen) vµ tæng hîp nªn c¸c mARN. C¸c enzym ARN
pol I vµ III thùc hiÖn phiªn m· c¸c gen tæng hîp nªn c¸c lo¹i ARN kh¸c. Trong ®ã, ARN
pol I phiªn m· tæng hîp tiÒn-ARN tõ ®ã h×nh thµnh nªn c¸c rARN 23S vµ 18S; ARN pol
III phiªn m· c¸c gen m· hãa c¸c tARN, rARN 5S vµ nhiÒu lo¹i ARN kÝch th−íc nhá kh¸c.
Enzym lâi ARN pol ë vi khuÈn lµ phÇn xóc t¸c ph¶n øng tæng hîp ARN ®−îc cÊu
t¹o tõ 5 chuçi polypeptide, gåm 2 chuçi α, 1 chuçi β, 1 chuçi β’ vµ 1 chuçi ω. Enzym nµy
cã mèi quan hÖ gÇn víi ARN pol ë sinh vËt nh©n thËt (b¶ng 4.1). §Æc biÖt hai tiÓu phÇn
lín lµ β vµ β’ rÊt gièng víi hai tiÓu phÇn lín cña ARN pol II (RPB1 vµ RPB2). C¸c chuçi α
gièng víi RPB3 vµ RPB11, trong khi chuçi ω gièng víi RPB6. CÊu tróc cña ARN pol ë vi
khuÈn rÊt gièng víi ARN pol II cña nÊm men. Nhê gièng nhau vÒ cÊu tróc, c¸c ARN pol ë
c¸c sinh vËt kh¸c nhau biÓu hiÖn ho¹t ®éng rÊt gièng nhau.
VÒ cÊu h×nh, ARN pol gièng
nh− “cµng cua”. Trong ®ã, c¸c tiÓu B¶ng 4.1. Thµnh phÇn c¸c chuçi polypeptide cña c¸c
phÇn lín (β vµ β’ ë prokaryote; RPB1 enzym ARN polymerase (viÕt t¾t lµ ARN pol)
vµ RPB2 ë eukaryote) chiÕm phÇn Prokaryote Archaea Eukaryote
lín kh«ng gian ë mçi “cµng”. VÞ trÝ (vi khuÈn) (vi khuÈn
xóc t¸c n»m ë vïng gèi lªn nhau cña cùc ®oan) ARN pol I ARN pol II ARN pol III
hai tiÓu phÇn vµ ®−îc gäi lµ “khe Enzym lâi Enzym lâi (pol I) (pol II) (pol III)
trung t©m ho¹t ®éng” (h×nh 4.2). β’ A’ / A” RPA1 RPB1 RPC1
Khe trung t©m ho¹t ®éng cña c¸c β B RPA2 RPB2 RPC2
ADN pol vµ ARN pol th−êng liªn kÕt α1 D RPC5 RPB3 RPC5
víi 2 ion Mg2+ theo c¬ chÕ ®ång xóc α2 L RPC9 RPB11 RPC9
t¸c víi c¸c ion hãa trÞ 2. CÊu h×nh ω K RPB6 RPB6 RPB6
cña ARN pol cho phÐp c¸c m¹ch [+ 6 chuçi [+ 9 chuçi [+ 7 chuçi [+ 11 chuçi
ADN, ARN vµ NTP ®i vµo vµ ra khái kh¸c] kh¸c] kh¸c] kh¸c]
khe trung t©m ho¹t ®éng.

4.2.3. C¸c b−íc cña qu¸ tr×nh phiªn m·


§Ó phiªn m· mét gen, ARN pol ph¶i tr¶i qua mét lo¹t c¸c b−íc ho¹t ®éng vµ th−êng
®−îc chia lµm ba giai ®o¹n: khëi ®Çu phiªn m·, ph¶n øng kÐo dµi chuçi ARN vµ kÕt thóc
phiªn m·. §Æc ®iÓm c¬ b¶n cña c¸c giai ®o¹n phiªn m· nh− sau (h×nh 4.3):
- Khëi ®Çu phiªn m·: ®−îc tÝnh tõ khi ARN pol (cïng víi c¸c yÕu tè khëi ®Çu
phiªn m·) liªn kÕt vµo promoter
®Õn khi enzym nµy ®· tæng hîp
Kªnh “tho¸t”
®−îc mét m¹ch ARN gåm kho¶ng ARN
“Cµng” mang chuçi β’
10 bp dùa trªn m¹ch khu«n
ADN. Gièng nh− sao chÐp ADN, σ3.2 σ2
sù trïng hîp ARN chØ diÔn ra ADN (®o¹n
theo chiÒu 5’ → 3’. Tuy nhiªn, ng−îc dßng) +1
σ4 -10
kh¸c víi qu¸ tr×nh sao chÐp, ë σ1.1 ADN (®o¹n
-35 σ xu«i dßng)
phiªn m· chØ cã mét m¹ch ADN 3.1 “Cµng” mang
®−îc dïng lµm khu«n. Khi ARN Kªnh m¹ch chuçi β
pol ®· liªn kÕt vµo promoter, ë Kªnh m¹ch m· hãa
mçi gen lu«n chØ cã mét m¹ch lµm khu«n
®−îc dïng phiªn m·. ViÖc chän
promoter nµo trong hÖ gen ®Ó H×nh 4.2. CÊu tróc “khe trung t©m ho¹t ®éng” cña ARN
khëi ®Çu phiªn m· lµ mét c¬ chÕ polymerase ë vi khuÈn vµ phøc hÖ phiªn m më.
®iÒu hßa biÓu hiÖn gen c¬ b¶n
(xem thªm ch−¬ng 5).

92
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

C¸c b−íc thuéc khëi ®Çu phiªn m·


®−îc chia lµm 3 giai ®o¹n nhá nh− sau:
ARN pol
i) h×nh thµnh phøc hÖ ®ãng: ®ã
lµ khi ARN pol võa liªn kÕt vµo
promoter, ADN vÉn duy tr× ë ADN ®o¹n ADN
d¹ng sîi kÐp, trong khi enzym ng−îc dßng +1 ®o¹n xu«i dßng
liªn kÕt vµo bÒ mÆt cña chuçi
xo¾n kÐp; Promoter

ii) h×nh thµnh phøc hÖ më: phøc


hÖ ARN pol-promoter biÕn ®æi
cÊu h×nh, trong ®ã ADN biÕn tÝnh
ARN pol liªn kÕt
(t¸ch thµnh m¹ch ®¬n) trªn mét

Khëi ®Çu phiªn m·


vµo promoter
®o¹n dµi kho¶ng 14 bp quanh Phøc hÖ “®ãng”
®iÓm khëi ®Çu phiªn m· vµ h×nh
thµnh nªn “bãng phiªn m·”;
iii) h×nh thµnh phøc hÖ phiªn m·
gåm ba thµnh phÇn: hai H×nh thµnh
“bãng phiªn m·”
ribonucleotide ®Çu tiªn ®−îc ®−a Phøc hÖ “më”
vµo “trung t©m xóc t¸c” cña ARN
pol vµ xÕp th¼ng hµng víi c¸c
baz¬ nit¬ bæ sung t−¬ng øng víi
chóng trªn m¹ch ADN khu«n.
B¾t ®Çu
Enzym b¾t ®Çu di chuyÓn däc ARN tæng hîp ARN
m¹ch khu«n. Trong qu¸ tr×nh ®ã,
c¸c ribonucleotide ®−îc bæ sung
tiÕp vµo chuçi ARN ®ang kÐo dµi.
Trong thùc tÕ, hiÖu suÊt tæng hîp
®o¹n ARN ban ®Çu th−êng thÊp; KÐo dµi chuçi
KÐo dµi chuçi

ARN pol th−êng gi¶i phãng ra c¸c ARN ARN


®o¹n ARN ng¾n h¬n 10 bp vµ
khëi ®éng l¹i sù phiªn m· nhiÒu
lÇn. Nh−ng, mét khi enzym ®·
tæng hîp ®−îc mét ®o¹n ARN dµi
h¬n 10 bp, nã tho¸t khái
promoter, h×nh thµnh mét phøc ARN
hÖ phiªn m· gåm ba thµnh phÇn
KÕt thóc phiªn m·

(ADN, ARN vµ protein) s½n sµng


cho ph¶n øng kÐo dµi chuçi. ARN pol
- Ph¶n øng kÐo dµi chuçi ARN: ARN
Khi mét ®o¹n ng¾n ARN (kho¶ng 10
ADN
nucleotide) ®· h×nh thµnh, phøc hÖ phiªn
m· chuyÓn sang giai ®o¹n kÐo dµi chuçi. H×nh 4.3. Ba giai ®o¹n cña qu¸ tr×nh phiªn m:
Sù chuyÓn tiÕp gi÷a hai giai ®o¹n ®ßi hái khëi ®Çu phiªn m, kÐo dµi chuçi vµ kÕt thóc
sù thay ®æi cÊu h×nh cña ARN pol. Sù thay phiªn m. H×nh trªn chØ minh häa ADN, ARN pol
®æi nµy lµ cÇn thiÕt ®Ó enzym mét mÆt liªn vµ ARN. C¸c yÕu tè tham gia phiªn m· kh«ng
®−îc minh häa ë ®©y (nh−ng ®−îc m« t¶ trong
kÕt æn ®Þnh vµo m¹ch ADN khu«n ®ång bµi). VÞ trÝ (+1) lµ ®iÓm b¾t ®Çu phiªn m·.
thêi thùc hiÖn mét lo¹t c¸c chøc n¨ng kh¸c,

93
§inh §oµn Long

bao gåm: gi·n xo¾n m¹ch ADN ë phÝa tr−íc, tæng hîp chuçi ARN, t¸ch chuçi ARN khái
m¹ch khu«n ADN vµ ®ãng xo¾n trë l¹i m¹ch ADN ë phÝa sau. §Õn ®©y chóng ta nhí
r»ng, ®Ó thùc hiÖn ®−îc c¸c ho¹t ®éng t−¬ng tù trong sao chÐp ADN, ADN pol cÇn sù “hç
trî” cña mét sè enzym hoÆc protein kh¸c (nh− topoisomerase, helicase, ...). Cßn trong
phiªn m·, c¸c chøc n¨ng trªn ®Òu ®−îc ARN pol thùc hiÖn.
- KÕt thóc phiªn m·: Khi ARN pol ®· phiªn m· hÕt chiÒu dµi gen (hoÆc c¸c gen),
nã cÇn dõng l¹i vµ gi¶i phãng b¶n phiªn m· ARN. Trong mét sè tr−êng hîp, tÝn hiÖu kÕt
thóc phiªn m· cã cÊu tróc ®Æc biÖt phï hîp cho sù gi¶i phãng c¸c thµnh phÇn cña phøc
hÖ phiªn m·. Trong c¸c tr−êng hîp kh¸c, tÝn hiÖu kÕt thóc phiªn m· chØ lµ c¸c ®o¹n tr×nh
tù ®Æc thï gióp c¸c yÕu tè kÕt thóc phiªn m· nhËn ra vµ thóc ®Èy sù kÕt thóc phiªn m·.

4.2.4. Phiªn m· ë prokaryote

4.2.4.1.Khëi ®Çu phiªn m·


VÒ lý thuyÕt, enzym lâi ARN pol cã thÓ khëi ®Çu phiªn m· tõ bÊt cø ®iÓm nµo
trªn ADN khi nã ë d¹ng m¹ch ®¬n. Nh−ng, trong tÕ bµo sù khëi ®Çu phiªn m· chØ x¶y ra
ë promoter, bëi v× chØ cã yÕu tè σ thuéc holoenzym khi liªn kÕt vµo promoter míi lµm
thay ®æi cÊu h×nh ADN sîi kÐp thµnh d¹ng 2 m¹ch ®¬n (d¹ng "bãng phiªn m·").
ë E. coli, yÕu tè σ phæ biÕn nhÊt lµ σ70 cã khèi l−îng ph©n tö 70 kDa. C¸c promoter
®−îc yÕu tè σ70 nhËn biÕt ®Òu cã ®Æc ®iÓm chung gåm hai ®o¹n tr×nh tù æn ®Þnh dµi 6 bp
c¸ch nhau mét ®o¹n tr×nh tù biÕn ®æi dµi 17 – 19 bp. Hai ®o¹n ADN æn ®Þnh cã vai trß
quyÕt ®Þnh sù ®Ýnh kÕt cña ARN pol vµo promoter nªn ®−îc gäi lµ c¸c tr×nh tù liªn øng.
TÝnh tõ nucleotide trung t©m, hai tr×nh tù liªn øng n»m ng−îc dßng vµ c¸ch nucleotide
®−îc phiªn m· ®Çu tiªn (vÞ trÝ +1) lµ 35 vµ 10 bp. Tr×nh tù liªn øng t¹i vÞ trÝ -35 (cßn gäi
lµ hép -35, hay yÕu tè -35) ®iÓn h×nh lµ [5’-TTGACA-3’], cßn tr×nh tù liªn øng t¹i vÞ trÝ
-10 (hép -10, hép Pribnow hay hép TATA) ®iÓn h×nh lµ [5’-TATAAT-3’]. D¹ng
holoenzym cña ARN pol mang yÕu tè σ70 ®Ýnh kÕt vµo promoter qua hai b−íc. Trong b−íc
thø nhÊt, nã ®Ýnh kÕt "láng lÎo" vµo vÞ trÝ -35; lóc nµy promoter ë d¹ng phøc hÖ ®ãng. Khi
ARN pol t¨ng c−êng liªn kÕt vµo promoter t¹i vÞ trÝ -10, th× ph©n tö ADN ®−îc "vÆn
xo¾n". Lóc nµy promoter chuyÓn sang d¹ng phøc hÖ më. Mét khi ARN pol ®· liªn kÕt vµo
hép -10, nã sÏ khëi ®Çu sù phiªn m· ®óng t¹i nucleotide +1 cña gen.
Trong thùc tÕ, hiÕm khi cã hai gen nµo mµ toµn bé tr×nh tù promoter cña chóng
gièng hÖt nhau (ngay c¶ c¸c tr×nh tù liªn øng -35, -10 vµ ®o¹n gi÷a chóng). V× vËy, "¸i
lùc" cña ARN pol víi promoter cña c¸c gen kh¸c nhau lµ kh¸c nhau. §©y lµ mét nguyªn
nh©n gióp gi¶i thÝch t¹i sao c¸c gen kh¸c nhau th−êng ®−îc biÓu hiÖn ë møc ®é kh¸c
nhau. Nh×n chung, promoter cµng cã c¸c tr×nh tù liªn øng gièng víi c¸c tr×nh tù ®iÓn
h×nh th× tèc ®é biÓu hiÖn gen cµng cao. VÝ dô, promoter cã tr×nh tù -10 lµ [GATAAT] cã
tèc ®é phiªn m· thÊp h¬n so víi tr×nh tù [TATAAT], bëi v× kh¶ n¨ng nhËn biÕt vµ liªn kÕt
vµo promoter cña yÕu tè σ70 víi tr×nh tù thø nhÊt thÊp h¬n so víi tr×nh tù thø hai.
ë E. coli, ng−êi ta t×m thÊy mét sè yÕu tè σ kh¸c nhau (cßn gäi lµ c¸c yÕu tè sigma
thay thÕ) gi÷ vai trß quan träng trong ®iÒu hßa biÓu hiÖn cña c¸c gen. C¸c yÕu tè σ kh¸c
nhau nhËn biÕt c¸c nhãm promoter kh¸c nhau, nh−ng ®Òu cã thÓ liªn kÕt víi enzym lâi.
Qua c¬ chÕ nµy, c¸c yÕu tè σ kh¸c nhau gióp ARN pol nhËn biÕt ®−îc c¸c nhãm gen kh¸c
nhau. Cô thÓ, phÇn lín c¸c promoter ë E. coli ®−îc nhËn biÕt bëi σ70. Nh−ng, trong ®iÒu
kiÖn sèc nhiÖt hoÆc ë mét sè m«i tr−êng kh¾c nghiÖt, cã mét yÕu tè σ kh¸c lµ σ32 (khèi
l−îng ph©n tö 32 kDa) ®−îc tæng hîp t¨ng lªn vÒ sè l−îng. YÕu tè σ32 nhËn biÕt promoter
cña c¸c gen m· hãa protein cÇn cho sinh vËt ®¸p øng l¹i c¸c tÝn hiÖu kh¾c nghiÖt cña m«i
tr−êng. Promoter cña nh÷ng gen nµy cã hai tr×nh tù liªn øng ®Æc thï víi σ32 lµ vÞ trÝ -39

94
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

(tr×nh tù lµ [CCCCC]) vµ -15 (tr×nh tù lµ [TATAAATA]). Trong ®iÒu kiÖn m«i tr−êng
thiÕu nit¬, mét yÕu tè σ thø ba lµ σ54 (khèi l−îng ph©n tö 54 kDa) ®−îc h×nh thµnh. YÕu
tè nµy nhËn ra c¸c promoter cã tr×nh tù [GTGGC] t¹i vÞ trÝ -26 vµ [TTGCA] t¹i vÞ trÝ
-14. Mét yÕu tè σ thø t− lµ σ23 (khèi l−îng ph©n tö 23 kDa) ®−îc tæng hîp khi tÕ bµo bÞ
nhiÔm phag¬ T4. YÕu tè σ nµy nhËn ra c¸c promoter cã tr×nh tù [TATAATA] t¹i vÞ trÝ
-15. C¸c yÕu tè σ kh¸c ®iÒu khiÓn sù biÓu hiÖn cña c¸c nhãm gen kh¸c nhau trong
nh÷ng ®iÒu kiÖn nhÊt ®Þnh. Ngoµi E. coli, c¸c yÕu tè σ thay thÕ cßn ®−îc t×m thÊy ë
nhiÒu vi khuÈn kh¸c.
Ngoµi c¸c tr×nh tù liªn øng lµ vÞ trÝ liªn kÕt cña yÕu tè σ, mét sè promoter ho¹t
®éng m¹nh cßn cã mét sè tr×nh tù kh¸c gióp t¨ng c−êng sù t−¬ng t¸c gi÷a ARN pol vµ
ADN. VÝ dô nh−: promoter cña c¸c gen m· hãa rARN cã yÕu tè UP lµ vÞ trÝ cã ¸i lùc cao
víi ®Çu N cña chuçi α thuéc enzym ARN pol; v× vËy, ARN pol th−êng xuyªn ë tr¹ng th¸i
liªn kÕt víi c¸c promoter nµy. Mét sè gen kh¸c l¹i cã promoter thiÕu mét trong c¸c tr×nh
tù liªn øng, nh−ng l¹i ®−îc bæ sung bëi mét tr×nh tù kh¸c ®Ó "bï ®¾p" cho tr×nh tù thiÕu.
Ch¼ng h¹n gen gal ë E. coli ®−îc nhËn biÕt bëi yÕu tè σ70. MÆc dï promoter cña gen nµy
thiÕu tr×nh tù -35 ; nh−ng nã cã ®o¹n -10 më réng cã ¸i lùc cao víi yÕu tè σ70. Nh− vËy, râ
rµng møc ®é phiªn m· cña mét gen phô thuéc vµo sù t−¬ng quan gi÷a ARN pol vµ
promoter.

4.2.4.2. Ph¶n øng kÐo dµi chuçi ARN


Sù tæng hîp ARN diÔn ra ë vïng m· hãa cña gen (th−êng t¸ch biÖt víi vïng
promoter). Mét khi “bãng phiªn m·” vµ mét ®o¹n ARN gåm kho¶ng 10 ribonucleotide ®·
h×nh thµnh, yÕu tè σ sÏ t¸ch khái enzym lâi ARN pol. Sau ®ã, yÕu tè σ cã thÓ ®−îc dïng
l¹i cho mét chu kú khëi ®Çu phiªn m· míi, cßn enzym lâi tiÕp tôc ph¶n øng phiªn m·.
Khi enzym lâi ARN pol di chuyÓn däc ph©n tö ADN sîi kÐp, nã b¸m trªn mét m¹ch
cña ADN, lµm gi·n xo¾n ph©n tö nµy (h×nh 4.2). Trong vïng ADN ®−îc gi·n xo¾n (tøc lµ
t¹i “bãng phiªn m·”), c¸c ribonucleotide (ARN) ®−îc enzym ARN pol xóc t¸c võa h×nh
thµnh liªn kÕt phosphodieste víi m¹ch ARN ®ang kÐo dµi, võa t¹o liªn kÕt hydro víi c¸c
deoxyribonucleotide (ADN) cña m¹ch ®èi m· h×nh thµnh nªn mét ®o¹n lai ADN – ARN.
Tuy vËy, víi cÊu h×nh ®Æc biÖt ARN pol ngay sau ®ã t¸ch ph©n tö ARN khái ®o¹n lai,
®ång thêi ®ãng xo¾n trë l¹i ph©n tö ADN sau khi ®· tr−ît qua. Sù phiªn m· diÔn ra víi
tèc ®é 30 – 50 nucleotide / gi©y. C¸c b»ng chøng thùc nghiÖm cho thÊy enzym ARN pol cã
2 ho¹t tÝnh ®äc söa. Mét ho¹t tÝnh ®äc söa gièng víi ADN pol, nghÜa lµ c¸c nucleotide
kÕt cÆp sai ®−îc lo¹i bá b»ng ph¶n øng ng−îc víi ph¶n øng tæng hîp; råi enzym lïi l¹i ®Ó
tæng hîp thay thÕ nucleotide ®óng vµo vÞ trÝ sai. Ho¹t tÝnh ®äc söa thø hai lµ enzym lïi
l¹i mét hoÆc mét sè nucleotide råi c¾t bá ®o¹n ARN mang nucleotide sai, råi kh«i phôc l¹i
b»ng ho¹t tÝnh tæng hîp. Còng gièng qu¸ tr×nh sao chÐp ADN, n¨ng l−îng cÇn cho sù
tæng hîp ARN lµ tõ sù ®øt g·y nhãm ~ cña c¸c ribonucleotide triphosphate (NTP).

4.2.4.3. Sù kÕt thóc phiªn m·


ë prokaryote, sù kÕt thóc phiªn m· x¶y ra khi enzym ARN pol tiÕp cËn tr×nh tù kÕt
thóc phiªn m· (cßn gäi lµ tÝn hiÖu kÕt thóc phiªn m·). Cã mét protein quan träng tham
gia vµo sù kÕt thóc phiªn m· ë mét sè gen cña E. coli ®−îc gäi lµ yÕu tè kÕt thóc phiªn
m· Rho (viÕt t¾t lµ ρ). Tr×nh tù kÕt thóc phiªn m· cña nh÷ng gen nµy ®ång thêi ®−îc gäi
lµ tr×nh tù kÕt thóc phiªn m· phô thuéc vµo Rho, hay tr×nh tù kÕt thóc phiªn m· lo¹i II.
Nh−ng, ë nhiÒu gen kh¸c, ARN pol cã thÓ tù kÕt thóc phiªn m· ë nh÷ng tr×nh tù kÕt thóc
phiªn m· cña gen mµ kh«ng cÇn ρ. Nh÷ng tr×nh tù nµy ®−îc gäi lµ c¸c tr×nh tù kÕt thóc
phiªn m· kh«ng phô thuéc vµo Rho, hay tr×nh tù kÕt thóc phiªn m· lo¹i I.

95
§inh §oµn Long

C¸c tÝn hiÖu kÕt thóc phiªn m· kh«ng phô thuéc vµo Rho (lo¹i I) th−êng mang
tr×nh tù lÆp l¹i ®¶o ng−îc dµi kho¶ng 16 – 20 bp n»m ng−îc dßng ®iÓm kÕt thóc phiªn
m·, theo sau lµ mét ®o¹n tr×nh tù gåm kho¶ng 4 - 8 cÆp A = T liªn tôc. Khi ARN pol
phiªn m· qua ®o¹n tr×nh tù lÆp l¹i ®¶o ng−îc, phÇn ®Çu 3’ cña ph©n tö ARN míi sÏ h×nh
thµnh mét cÊu tróc "cÆp tãc" theo sau lµ ®o¹n polyU (lµ kÕt qu¶ phiªn m· tõ ®o¹n A=T
liªn tôc; xem h×nh 4.4). Sù h×nh thµnh cÊu tróc "cÆp tãc" lµm ARN pol dõng l¹i t¹i vÞ trÝ
kÕt thóc phiªn m·. §ång thêi, t¹i tr×nh tù polyU, ®o¹n lai ADN-ARN cã liªn kÕt yÕu
(A=U lµ liªn kÕt Chargaff yÕu nhÊt gi÷a c¸c baz¬ nit¬ cña axit nucleic) nªn chØ cÇn mét
t¸c ®éng nhá lµ ®ñ ®Ó lµm g·y c¸c liªn kÕt hydro gi÷a hai m¹ch ADN vµ ARN. ChÝnh cÊu
tróc cÆp tãc ë phÝa tr−íc ®o¹n tr×nh tù nµy ®· t¹o nªn mét lùc "c¨ng" lµm ®øt g·y liªn kÕt
hydro vµ ph©n tö mARN t¸ch khái ADN còng nh− phøc hÖ phiªn m·, dÉn ®Õn sù kÕt
thóc phiªn m·.
C¸c tr×nh tù kÕt thóc phiªn m· phô thuéc vµo Rho (lo¹i II) th−êng kh«ng cã ®o¹n
tr×nh tù polyA=T vµ trong nhiÒu tr−êng hîp kh«ng t¹o ra cÊu tróc cÆp tãc. M« h×nh kÕt
thóc phiªn m· phô thuéc vµo Rho ®−îc m« t¶ nh− sau: protein Rho (ρ) mang mét miÒn
liªn kÕt ARN vµ mét miÒn cã ho¹t tÝnh ATPase. Rho liªn kÕt vµo tr×nh tù kÕt thóc phiªn
m· trªn ARN sau khi ®o¹n tr×nh tù nµy ®· tho¸t ra ngoµi ARN pol. Khi liªn kÕt vµo
tr×nh tù nµy, Rho biÓu hiÖn ho¹t tÝnh ATPase vµ thñy ph©n ATP. N¨ng l−îng thñy ph©n
tõ ATP sÏ t¸ch ARN khái ARN pol, ®ång thêi phøc hÖ phiªn m· t¸ch khái ADN.
ë prokaryote, mÆc dï mçi vi khuÈn cã thÓ cã mét sè d¹ng holoenzym kh¸c nhau
nh−ng chØ lu«n t×m thÊy mét enzym lâi ARN pol duy nhÊt; thÕ nªn, tÊt c¶ c¸c gen (m· hãa
cho protein, tARN, rARN hay c¸c lo¹i ARN kh¸c) ®Òu ®−îc phiªn m· bëi enzym lâi nµy.

a) Tr×nh tù tÝn hiÖu kÕt thóc phiªn m b) KÕt thóc phiªn m kh«ng phô thuéc ρ
ADN Tr×nh tù lÆp l¹i … mARN
M¹ch m· hãa
M¹ch lµm khu«n
(N = nucleotide bÊt kú) … ®¶o ng−îc ADN
Phiªn m· CÊu tróc “cÆp tãc” ARN pol

mARN
th¸o rêi phøc hÖ phiªn m·
CÊu tróc
“cÆp tãc”
tõ sù kÕt cÆp
cña hai tr×nh
tù lÆp l¹i
ng−îc chiÒu

TÝn hiÖu polyU

mARN ARN pol

H×nh 4.4. Sù kÕt thóc phiªn m kh«ng phô thuéc vµo yÕu tè Rho (ρ ρ) ë prokaryote. a) TÝn hiÖu kÕt thóc
phiªn m· trªn ADN t¹o ra vïng ®Çu 3' cña mARN mang mét tr×nh tù lÆp l¹i ®¶o ng−îc gåm 16 - 20 nucleotide,
theo sau lµ mét tr×nh tù polyU; b) Tr×nh tù ®Çu 3' cña mARN t¹o nªn cÊu tróc "cÆp tãc"; ARN pol khi tiÕp cËn
tr×nh tù polyA sÏ "tung khái" m¹ch khu«n vµ sù phiªn m· kÕt thóc.

4.2.5. Phiªn m· ë eukaryote


Sù phiªn m· ë eukaryote nh×n chung lµ phøc t¹p h¬n sù phiªn m· ë prokaryote.
Mét phÇn bëi v× ë eukaryote cã ba lo¹i ARN pol kh¸c nhau; ngoµi ra, do sù khëi ®Çu
phiªn m· ë eukaryote th−êng cÇn sù tÝch hîp cña nhiÒu lo¹i tÝn hiÖu h¬n.

96
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

4.2.5.1. C¸c enzym ARN polymerase


ë eukaryote, cã 3 lo¹i ARN pol tham gia phiªn m· tæng hîp c¸c lo¹i ph©n tö ARN
kh¸c nhau. ARN pol I tËp trung ë h¹ch nh©n (nucleolus) vµ xóc t¸c ph¶n øng tæng hîp
ba lo¹i rARN, gåm 28S, 18S vµ 5,8S. ARN pol II chØ cã trong sinh chÊt nh©n cña tÕ bµo;
enzym nµy trùc tiÕp xóc t¸c c¸c ph¶n øng tæng hîp mARN vµ mét sè ARN tham gia vµo
qu¸ tr×nh hoµn thiÖn ARN, bao gåm snARN. Enzym ARN pol III còng chØ thÊy trong
vïng sinh chÊt nh©n; enzym nµy xóc t¸c ph¶n øng tæng hîp ba nhãm ARN, gåm i) c¸c
tARN, ii) ARN ribosome 5S (5S rARN) vµ iii) c¸c snARN kh«ng ®−îc tæng hîp bëi ARN
pol II.
So víi cÊu tróc vµ chøc n¨ng cña ARN pol ë E. coli, cã thÓ nãi ®Õn nay cÊu tróc vµ
ho¹t ®éng chøc n¨ng cña c¸c ARN pol ë eukaryote cßn ch−a biÕt ®Çy ®ñ. §iÒu duy nhÊt
cã thÓ kh¼ng ®Þnh lµ: c¸c ARN pol ë eukaryote ®Òu cã cÊu t¹o tõ rÊt nhiÒu tiÓu phÇn kh¸c
nhau; nãi c¸ch kh¸c, cã nhiÒu gen cïng phèi hîp m· hãa enzym nµy. Ch¼ng h¹n nh−
ARN pol II cña nÊm men cã 12 chuçi polypeptide vµ cã cÊu tróc kh«ng gian kiÓu ch÷ "U".
Trong 12 chuçi polypeptide lµ thµnh phÇn ARN pol II ë nÊm men, cã 5 chuçi ®ång thêi lµ
thµnh phÇn cña ARN pol III ë sinh vËt nµy. Nh×n chung, c¸c enzym ARN pol kh¸c cña
nÊm men còng cã c¸ch tæ hîp t−¬ng tù.
4.2.5.2. ARN polymerase II phiªn m· c¸c gen m· hãa protein
Nh− ®· nªu ë trªn, nh÷ng hiÓu biÕt ®Õn nay cho thÊy tÊt c¶ c¸c gen m· hãa protein
®Òu ®−îc phiªn m· bëi ARN pol II. S¶n phÈm cña qu¸ tr×nh phiªn m· nµy lµ mét ph©n tö
tiÒn-mARN. Së dÜ gäi lµ tiÒn-mARN bëi v× sau phiªn m· ph©n tö nµy tiÕp tôc biÕn ®æi
vµ söa ®æi (hoÆc b»ng c¶ hai c¬ chÕ) ®Ó h×nh thµnh nªn ph©n tö mARN hoµn thiÖn ®−îc
dïng cho dÞch m·. Sù biÕn ®æi ARN sau phiªn m· ®Ó ®¹t ®−îc d¹ng biÓu hiÖn chøc n¨ng
cña nã ®−îc gäi lµ qu¸ tr×nh hoµn thiÖn ARN (®«i khi ®−îc gäi lµ chÕ biÕn ARN).
a) C¸c tr×nh tù khëi ®Çu phiªn m· (promoter) vµ c¸c tr×nh tù t¨ng c−êng (enhancer)
§Ó lµm râ cÊu tróc vµ chøc n¨ng cña c¸c promoter thuéc c¸c gen m· hãa protein,
ng−êi ta th−êng tiÕp cËn theo hai h−íng chÝnh. H−íng thø nhÊt lµ theo dâi hËu qu¶ c¸c
®ét biÕn (thªm, mÊt hay thay thÕ nucleotide) trong vïng ADN n»m ng−îc dßng gen; ®Æc
biÖt xem nh÷ng biÕn ®æi nµy ¶nh h−ëng thÕ nµo ®Õn sù phiªn m· cña gen. C¸c nucleotide
®ét biÕn cã ¶nh h−ëng râ rÖt ®Õn sù phiªn m· cña gen ®−îc xem lµ c¸c phÇn quan träng
cña promoter. H−íng thø hai lµ so s¸nh tr×nh tù promoter cña nhiÒu gen víi nhau; trong
®ã, nh÷ng tr×nh tù gièng nhau ë nhiÒu gen ®−îc xem lµ c¸c tr×nh tù quan träng. Tõ c¸c
nghiªn cøu nµy, ng−êi ta thÊy promoter cña phÇn lín gen m· hãa protein ë eukaryote
th−êng gåm kho¶ng 200 bp (®«i khi dµi h¬n) n»m ng−îc dßng kÓ tõ vÞ trÝ b¾t ®Çu phiªn
m· (+1) vµ mang mét sè tr×nh tù (cßn gäi lµ c¸c yÕu tè tr×nh tù) ®−îc chia lµm hai vïng
chÝnh: vïng lâi promoter vµ vïng biªn promoter.
Vïng lâi promoter gåm c¸c yÕu tè tr×nh tù t¸c ®éng gÇn (cis-acting) ®iÒu khiÓn
viÖc b¾t ®Çu phiªn m· ®óng vÞ trÝ cña ARN pol. Vïng lâi promoter th−êng cã kÝch th−íc
kho¶ng 50 bp n»m ng−îc dßng vµ s¸t ®iÓm b¾t ®Çu phiªn m·. Vïng lâi promoter ®iÓn
h×nh gåm cã hai tr×nh tù: (i) mét tr×nh tù ng¾n kÝ hiÖu lµ Inr, n»m ng−îc dßng vïng m·
hãa cña gen vµ më réng tíi vÞ trÝ b¾t ®Çu phiªn m·; (ii) hép TATA (cßn gäi lµ yÕu tè
TATA, hay hép Goldberg-Hogness), th−êng n»m ë vÞ trÝ -30, cã mét tr×nh tù liªn øng
®iÓn h×nh gåm 7 nucleotide lµ [5’-TATAAAA-3’]. C¸c yÕu tè tr×nh tù Inr vµ TATA cã vai
trß gióp ARN pol nhËn ra promoter vµ b¾t ®Çu phiªn m· chÝnh x¸c (t¹i ®óng vÞ trÝ +1).
C¸c yÕu tè vïng biªn promoter th−êng n»m ng−îc dßng hép TATA, trong kho¶ng
tõ vÞ trÝ -50 ®Õn -200 (kÓ tõ vÞ trÝ +1). Trong nhãm nµy cã thÓ kÓ ®Õn hép CAAT (®äc t¾t
lµ hép "cat") cã tr×nh tù liªn øng lµ [CAAT] th−êng ë vÞ trÝ -75, vµ hép GC cã tr×nh tù

97
§inh §oµn Long

liªn øng [GGGCGG] th−êng ë vÞ trÝ -90. C¶ hai hép CAAT vµ GC ®Òu cã thÓ biÓu hiÖn
chøc n¨ng theo c¶ hai chiÒu (nghÜa lµ dï nã cïng chiÒu phiªn m· hay ng−îc l¹i, th× ARN
pol ®Òu nhËn ra). §ét biÕn x¶y ra trong tr×nh tù cña hai hép nµy th−êng lµm gi¶m hiÖu
suÊt phiªn m· cho thÊy chóng cã liªn quan trùc tiÕp ®Õn sù khëi ®Çu phiªn m·.
C¸c promoter kh¸c nhau cã thÓ cã sù tæ hîp kh¸c nhau cña c¸c yÕu tè thuéc vïng
lâi vµ vïng biªn. C¸c yÕu tè thuéc vïng biªn th−êng cã vai trß quan träng trong viÖc x¸c
®Þnh vÞ trÝ vµ thêi ®iÓm biÓu hiÖn cña gen. Trong ®ã, "ch×a khãa" cña sù ®iÒu hßa nµy lµ
c¸c protein ho¹t hãa cã vai trß quyÕt ®Þnh mét gen cã ®−îc phiªn m· hay kh«ng. Ch¼ng
h¹n, c¸c gen ®−îc biÓu hiÖn ë mäi tÕ bµo cña c¬ thÓ (c¸c gen "gi÷ nhµ") ®Òu mang c¸c yÕu
tè vïng biªn lµ vÞ trÝ liªn kÕt cña c¸c protein ho¹t hãa cã mÆt phæ biÕn ë mäi tÕ bµo. Mét
vÝ dô vÒ c¸c gen "gi÷ nhµ" lµ gen m· hãa actin vµ gen m· hãa enzym glucose-6-
phosphate dehydrogenase. Ng−îc l¹i, c¸c gen chØ ®−îc biÓu hiÖn ë mét tÕ bµo nhÊt ®Þnh,
hoÆc vµo mét thêi ®iÓm nhÊt ®Þnh cña qu¸ tr×nh ph¸t triÓn, th−êng chØ mang c¸c yÕu tè
vïng biªn lµ vÞ trÝ liªn kÕt cña c¸c protein ho¹t hãa vèn chØ ®−îc tæng hîp ë nh÷ng tÕ bµo
®Æc thï vµ/hoÆc vµo mét thêi ®iÓm ®Æc tr−ng cña qu¸ tr×nh ph¸t triÓn.
Mét sè tr×nh tù kh¸c, nh− enhancer (tr×nh tù t¨ng c−êng) cÇn thiÕt ®Ó gen ®−îc
biÓu hiÖn ë møc tèi ®a. Enhancer lµ mét vÝ dô kh¸c vÒ c¸c yÕu tè t¸c ®éng gÇn. MÆc dï vÒ
nguyªn t¾c, c¸c enhancer cã thÓ n»m ng−îc dßng, xu«i dßng thËm chÝ ®«i khi n»m trong
tr×nh tù m· hãa cña gen, nh−ng vÞ trÝ phæ biÕn cña chóng lµ n»m ng−îc dßng gen. C¸c
enhancer ®«i khi n»m c¸ch ®iÓm b¾t ®Çu phiªn m· hµng ngh×n nucleotide. Nh− vËy, c¸c
enhancer ®iÒu hßa phiªn m· tõ mét kho¶ng c¸ch xa h¬n nhiÒu so víi c¸c yÕu tè thuéc
promoter. C¸c enhancer th−êng mang mét chuçi c¸c ®o¹n ADN ng¾n, trong ®ã mét sè
gièng víi c¸c yÕu tè tr×nh tù cña promoter ®−îc nªu ë trªn. C¸c protein ho¹t hãa cã thÓ
võa liªn kÕt vµo enhancer, võa liªn kÕt víi mét sè protein ®iÒu hßa phiªn m· kh¸c. C¸c
®o¹n ADN mang enhancer ®−îc ®−a ®Õn gÇn promoter mµ t¹i ®ã ®· cã s½n bé m¸y phiªn
m·, qua ®ã thóc ®Èy ho¹t ®éng cña bé m¸y nµy vµ gen ®−îc biÓu hiÖn ë møc tèi ®a. (Ho¹t
®éng cña c¸c protein ®iÒu hßa, promoter vµ enhancer ®−îc nªu kÜ h¬n ë ch−¬ng 5).
b) Sù khëi ®Çu phiªn m·
Sù khëi ®Çu phiªn m· c¸c gen m· hãa protein cã chÝnh x¸c hay kh«ng phô thuéc
vµo viÖc "l¾p r¸p" cña enzym ARN pol II víi mét sè protein kh¸c ®−îc gäi lµ c¸c yÕu tè
phiªn m· chung (general transciptional factor, GTF) t¹i tr×nh tù lâi promoter. C¶ ba
lo¹i ARN pol ë eukaryote ®Òu cÇn c¸c yÕu tè GTF ®Ó cã thÓ khëi ®Çu phiªn m·. C¸c GTF
®−îc ®¸nh sè la m· (I, II vµ III) t−¬ng øng víi lo¹i ARN pol mµ chóng phèi hîp ho¹t
®éng. Ch¼ng h¹n, TFIID lµ yÕu tè phiªn m· thø t− ®−îc t×m thÊy ho¹t ®éng phèi hîp
cïng ARN pol II.
Trong ®iÒu kiÖn invitro, enzym ARN pol II vµ c¸c GTF liªn kÕt vµo promoter theo
mét thø tù nhÊt ®Þnh ®Ó h×nh thµnh nªn phøc hÖ tiÒn khëi ®Çu phiªn m· (PIC). Së dÜ gäi
lµ phøc hÖ tiÒn khëi ®Çu phiªn m·, bëi v× ë nhiÒu gen cña eukaryote ngay c¶ khi PIC ®·
h×nh thµnh, gen vÉn ch−a ®−îc phiªn m·. ë nh÷ng gen nµy, ngoµi phô thuéc vµo PIC,
cßn cÇn sù t−¬ng t¸c gi÷a c¸c protein ho¹t hãa víi c¸c tr×nh tù vïng biªn promoter hoÆc
c¸c enhancer th× gen míi biÓu hiÖn. Trong ®iÒu kiÖn invivo, trËt tù "l¾p r¸p" cña c¸c GTF
vµ ARN pol vµo promoter nh− thÕ nµo ®Õn nay ch−a râ. Mét sè d÷ liÖu cho thÊy d−êng
nh− phøc hÖ phiªn m· gåm ARN pol vµ c¸c GTF ®−îc l¾p r¸p tr−íc khi tiÕp cËn promoter
cña gen. NÕu ®iÒu nµy lµ ®óng, th× sù khëi ®Çu phiªn m· ë eukaryote râ rµng rÊt phøc
t¹p, bëi v× phøc hÖ khëi ®Çu phiªn m· sÏ cã kÝch th−íc lín l¹i gÆp sù cã mÆt cña cÊu tróc
nucleosome trong chÊt nhiÔm s¾c ë eukaryote (xem thªm ch−¬ng 5).

98
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

4.2.5.3. mARN ë eukaryote


H×nh 4.5
mARN 5’- -3’
minh häa cÊu tróc
Vïng 5’ kh«ng ®−îc Tr×nh tù m· hãa protein (ORF) Vïng 3’ kh«ng ®−îc
chung cña mARN ë
dÞch m· (5’UTR) dÞch m· (3’UTR)
d¹ng hoµn thiÖn
m· b¾t ®Çu dÞch m· m· kÕt thóc dÞch m·
(s½n sµng cho dÞch (5’-UAG-3’) (UAA/UAG/UGA)
m·) ë prokaryote
H×nh 4.5. CÊu tróc chung cña mARN ®−îc dïng ®Ó dÞch m.
vµ eukaryote. Theo
a) Prokaryote b) Eukaryote
®ã, cÊu tróc cña
mARN cã thÓ chia Mµng tÕ bµo
Sinh chÊt
lµm ba vïng nh©n
ADN
chÝnh. ë tËn cïng
®Çu 5’ lµ mét ®o¹n Nh©n
tr×nh tù dÉn ®Çu, tiÒn-mARN
TÕ bµo chÊt
cßn gäi lµ vïng
®Çu 5’ kh«ng mARN vËn chuyÓn
®−îc dÞch m· (5’-
Ribosome
UTR) cã chiÒu dµi
kh¸c nhau ë c¸c Protein
mARN cña c¸c gen (polypeptide)
kh¸c nhau. Theo
sau 5’-UTR lµ H×nh 4.6. Phiªn m vµ dÞch m ë prokaryote vµ eukaryote. a) ë prokaryote,
vïng tr×nh tù m· mARN ®−îc ARN pol tæng hîp kh«ng cÇn söa ®æi mµ cã thÓ ®−îc dïng ngay
hãa; ®©y chÝnh lµ ®Ó dÞch m·. Do kh«ng cã mµng nh©n, dÞch m· cã thÓ b¾t ®Çu ngay c¶ khi
tr×nh tù nucleotide phiªn m· ch−a kÕt thóc (sù kÕt cÆp phiªn m· - dÞch m·). b) ë eukaryote, b¶n
x¸c ®Þnh tr×nh tù phiªn m· ®Çu tiªn (tiÒn-mARN) ph¶i qua qu¸ tr×nh hoµn thiÖn (gåm l¾p mò
m7G, g¾n ®u«i polyA vµ c¾t bá c¸c intron) míi ®−îc dïng ®Ó dÞch m·; chØ khi
c¸c axit amin trªn mARN hoµn thiÖn ®−îc vËn chuyÓn ra tÕ bµo chÊt sù dÞch m· míi diÔn ra.
ph©n tö protein
trong dÞch m·. Theo sau vïng tr×nh tù m· hãa lµ ®o¹n tr×nh tù theo sau, hay cßn gäi vµ
vïng ®Çu 3’ kh«ng ®−îc dÞch m· (3’-UTR); ®o¹n tr×nh tù nµy qui ®Þnh tÝnh bÒn cña
mARN vµ hiÖu suÊt dÞch m·.
Sù tæng hîp mARN cã kh¸c nhau gi÷a prokaryote vµ eukaryote (h×nh 4.6). ë
prokaryote, ph©n tö mARN míi ®−îc phiªn m· th−êng ®−îc sö dông ngay ®Ó tæng hîp
protein. Ngoµi ra, do vi khuÈn kh«ng cã mµng nh©n nªn c¸c mARN cã thÓ ®−îc ribosome
dïng ngay ®Ó dÞch m·, kÓ c¶ khi chóng ch−a ®−îc phiªn m· xong. Qu¸ tr×nh nµy ®−îc gäi
lµ sù kÕt cÆp phiªn m· - dÞch m·. ë eukaryote, ph©n tö mARN sau phiªn m· (tiÒn-
mARN) ph¶i tr¶i qua mét lo¹t c¸c sù kiÖn biÕn ®æi (qu¸ tr×nh hoµn thiÖn ARN) ®Ó h×nh
thµnh nªn ph©n tö mARN hoµn thiÖn (cßn gäi lµ mARN thµnh thôc). Ngoµi ra, ë
eukaryote ph©n tö mARN ph¶i ®−îc vËn chuyÓn tõ nh©n ra tÕ bµo chÊt n¬i cã sù tËp
trung c¸c ribosome th× sù dÞch m· míi cã thÓ b¾t ®Çu. Nh− vËy, mét ph©n tö mARN ë
eukaryote lu«n ®−îc phiªn m· hoµn chØnh vµ ®−îc hoµn thiÖn tr−íc dÞch m·.
Mét kh¸c biÖt c¬ b¶n n÷a gi÷a mARN cña prokaryote vµ eukaryote lµ mARN cña
prokaryote th−êng lµ ®a cistron, nghÜa lµ chóng ®ång thêi chøa th«ng tin m· hãa cña
nhiÒu h¬n mét chuçi polypeptide; trong khi ®ã, mARN cña eukaryote lu«n lµ ®¬n cistron,
nghÜa lµ nã chØ mang th«ng tin m· hãa mét chuçi polypeptide duy nhÊt.

99
§inh §oµn Long

4.2.6. Sù hoµn thiÖn vµ vËn chuyÓn ARN sau phiªn m·

4.2.6.1. Sù hoµn thiÖn mARN ë eukaryote


Kh«ng gièng mARN cña prokaryote, mARN cña
eukaryote ®−îc c¶i biÕn ë c¶ hai ®Çu 5’ vµ 3’. Ngoµi ra,

7-methylguanosine
mét trong nh÷ng ph¸t hiÖn quan träng nhÊt cña di
truyÒn häc ph©n tö ®−îc Richard Robert, Philip Sharp
vµ Susan Berger t×m ra n¨m 1977 lµ c¸c gen cña mét sè
virut ®éng vËt chøa c¸c tr×nh tù n»m trong gen nh−ng
kh«ng ®−îc dÞch m· thµnh c¸c axit amin trong ph©n tö
protein. HiÖn t−îng nh− vËy sau nµy ®−îc t×m thÊy ë tÊt

CÇu phosphate
c¶ c¸c loµi eukaryote. Trong thùc tÕ, hÇu hÕt c¸c gen m·
hãa protein ë eukaryote ®Òu cã c¸c ®o¹n tr×nh tù kh«ng
m· hãa axit amin n»m trong gen, sau nµy ®−îc gäi lµ c¸c
intron. N»m xen kÏ gi÷a c¸c intron lµ c¸c exon. C¸c baz¬ nit¬
exon bao gåm c¸c ®o¹n tr×nh tù m· hãa axit amin trªn

PhÇn ®Çu 5’ cña mARN


ph©n tö protein vµ c¶ c¸c ®o¹n m· hãa c¸c tr×nh tù ë ®Çu (methyl hãa)
5’ vµ 3’ kh«ng ®−îc dÞch m· cña mARN (nh− vËy, exon lµ
tr×nh tù trªn ADN m· hãa c¸c ®o¹n tr×nh tù cã mÆt trªn baz¬ nit¬
ph©n tö mARN s½n sµng cho dÞch m·). Trong qu¸ tr×nh
hoµn thiÖn mARN, c¸c intron ®−îc c¾t bá. Gi¶i th−ëng (methyl hãa)
Nobel vÒ Sinh lý häc vµ Y häc n¨m 1993 ®−îc trao cho
Roberts vµ Sharp vÒ sù ph¸t hiÖn cña hä liªn quan ®Õn
"sù ph©n m¶nh cña c¸c gen". H×nh 4.7. CÊu tróc ®Çu 5’ cña
mARN hoµn thiÖn ë eukaryote.
a) Sù c¶i biÕn ®Çu 5’ vµ 3’ cña mARN Mò 7-methylguanosine (m7G / m7Gppp)
Sù l¾p mò ®Çu 5’ lµ b−íc ®Çu tiªn cña qu¸ tr×nh liªn kÕt vµo nucleotide ®Çu tiªn qua
cÇu 5'-5'. Mét hoÆc hai nucleotide
hoµn thiÖn mARN. Mét khi enzym ARN pol II ®· tæng ®Çu tiªn ®−îc methyl hãa t¹i C-2'.
hîp ®−îc mét ®o¹n tiÒn-mARN dµi kho¶ng 20 – 30
nucleotide, th× mét enzym "l¾p mò" sÏ bæ sung mét nucleotide guanine ®−îc g¾n nhãm
methyl (-CH3) t¹i vÞ trÝ sè 7 cña baz¬ guanosine (m7G) vµo ®Çu 5’ cña chuçi ARN qua liªn
kÕt 5’-5’ (thay cho liªn kÕt th«ng th−êng lµ 5’-3’, h×nh 4.7). Nhê cÇu liªn kÕt 5’-5’, mò
m7G b¶o vÖ ®−îc mARN trong suèt qu¸ tr×nh dÞch m· tr¸nh t¸c ®éng cña c¸c
exonulcease. Ngoµi viÖc l¾p mò m7G, ë sinh vËt nh©n thËt bËc cao, mét hoÆc hai
nucleotide ®Çu tiªn trong chuçi ®−îc methyl hãa ë vÞ trÝ C-2’ (hiÖn t−îng nµy kh«ng gÆp ë
sinh vËt nh©n thËt bËc thÊp).
C¸c tiÒn-mARN tr−íc khi ®−îc vËn chuyÓn tõ nh©n ra tÕ bµo chÊt ®ång thêi ®−îc
biÕn ®æi ®Çu 3’ b»ng viÖc g¾n ®u«i polyA (th−êng lµ mét chuçi liªn tôc gåm 50 - 250 A).
Trªn m¹ch ADN khu«n kh«ng cã tr×nh tù m· hãa ®u«i polyA nµy, mµ nã ®−îc bæ sung
vµo mARN trong qu¸ tr×nh hoµn thiÖn. §u«i polyA cÇn ®Ó mARN ®−îc vËn chuyÓn "an
toµn" tõ nh©n ra tÕ bµo chÊt. Trong tÕ bµo chÊt, ®u«i polyA ngoµi viÖc gióp b¶o vÖ ®Çu 3’
cña mARN khái sù t¸c ®éng cña c¸c exonuclease, cßn cã vai trß trong ®iÒu hßa tÝnh æn
®Þnh cña c¸c ph©n tö mARN vµ t¨ng hiÖu suÊt dÞch m· (xem phÇn dÞch m· d−íi ®©y).
Sù kÕt thóc phiªn m· vµ g¾n ®u«i polyA ë eukaryote cã liªn quan ®Õn tr×nh tù liªn
øng nhËn biÕt ®u«i [5’-AAUAAA-3] n»m gÇn ®Çu 3’ cña mARN. Th−êng th× trong qu¸
tr×nh phiªn m·, ARN pol II tæng hîp ph©n tö tiÒn-mARN v−ît qua vÞ trÝ nµy. Nh−ng mét
lo¹i exonuclease ®Æc biÖt nhËn ra vÞ trÝ nµy vµ tiÕn hµnh c¾t ph©n tö ARN ®ang ®−îc kÐo
dµi kho¶ng 10 ®Õn 30 nucleotide kÓ tõ mét vÞ trÝ cã ®«i nucleotide 5’-CA-3’. C¸ch vÞ trÝ

100
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

c¾t mét qu·ng vÒ ®Çu 3’ cña mARN lµ mét ®o¹n tr×nh tù giµu GU còng cã vai trß gióp
nhËn ra vÞ trÝ g¾n ®u«i polyA, nh−ng ®o¹n nµy sau ®ã ®−îc c¾t bá (h×nh 4.8).
§Ó g¾n ®u«i polyA vµo mARN, cã sù tham gia cña hai protein liªn kÕt ARN cã tªn
gäi lµ CPSF (yÕu tè c¾t ARN vµ g¾n ®u«i polyA) vµ CF1 (yÕu tè c¾t thø nhÊt). CPSF cã vÞ
trÝ liªn kÕt vµo mARN lµ tr×nh tù [AAUAAA], cßn CF1 (cßn gäi lµ CST) cã vÞ trÝ liªn kÕt
mARN lµ ®o¹n giµu GU. Khi CPSF vµ CF1 ®· liªn kÕt vµo mARN, chóng "huy ®éng"
phøc hÖ polyadenine hãa tiÕp cËn mARN. Ngoµi CPSF vµ CF1, phøc hÖ polyadenine
hãa cßn bao gåm mét yÕu tè c¾t mARN thø hai (CF2), enzym polyA-polymerase (PAP) vµ
protein liªn kÕt tr×nh tù polyA (PABP). Khi phøc hÖ polyadenine hãa ®· hoµn chØnh vµ
liªn kÕt vµo mARN, ph©n tö mARN ®−îc c¾t t¹i vÞ trÝ sau 5’-CA-3’. Khi ®ã, mARN cã ®Çu
3’ tù do ®−îc g¾n ®u«i polyA bëi ho¹t ®éng cña enzym PAP dïng c¬ chÊt ATP (®ång thêi
lµ chÊt cho n¨ng l−îng). §o¹n polyA ®−îc PABP g¾n vµo vµ duy tr× trong dÞch m·. Sù
g¾n ®u«i polyA lµ cÇn thiÕt cho sù dÞch m· ë nhiÒu gen (mét sè mARN ë eukaryote trong
qu¸ tr×nh ph¸t triÓn ph«i kh«ng ®−îc dÞch m· nÕu thiÕu ®u«i polyA).
Mét sè mARN ë vi khuÈn còng cã ®u«i polyA (dµi kho¶ng 10-20 bp). Nh−ng, ®iÒu
®¸ng l−u ý lµ ë prokaryote, vai
trß cña ®u«i polyA hoµn toµn a) ARN
ADN
kh¸c biÖt víi ë eukaryote. Cô polymerase

thÓ, ®u«i polyA l¹i thóc ®Èy sù


biÕn tÝnh cña mARN ë TiÒn-mARN §o¹n giµu GU
prokaryote. Thùc nghiÖm cho
thÊy viÖc bæ sung ®u«i polyA TÝn hiÖu ®u«i
vµo ADN l¹p thÓ còng thóc ®Èy Phøc hÖ g¾n ®u«i polyA
sù biÕn tÝnh cña nã. §©y còng b) ARN
lµ mét b»ng chøng cho thÊy ADN polymerase
biÓu hiÖn cña hÖ gen ë c¸c bµo CF1
quan gièng víi c¸c hÖ gen vi
CPSF
khuÈn. TiÒn-mARN

b) C¸ch c¾t intron ®iÓn


h×nh ë sinh vËt nh©n thËt
Ph©n tö tiÒn-mARN C¾t rêi TiÒn-mARN

th−êng chøa mét sè intron. §Ó


t¹o ra mARN hoµn thiÖn s½n CF1
sµng cho dÞch m·, c¸c intron c)
CPSF
cÇn ®−îc c¾t khái tiÒn-mARN. TiÒn-mARN
Ph©n tö mARN hoµn thiÖn chØ
mang tr×nh tù liªn tôc cña c¸c Bæ sung ®u«i poly A
exon vèn bÞ t¸ch biÖt bëi c¸c
d)
intron khi ë trong gen.
mARN
Vµo n¨m 1977 khi
Roberts vµ Sharp ph¸t hiÖn ra H×nh 4.8. Bæ sung ®u«i polyA vµo mARN ë eukaryote.
intron, ng−êi ta t×m thÊy trong a) Trong qu¸ tr×nh phiªn m·, ARN pol tæng hîp ARN v−ît qua
nh©n tÕ bµo mét l−îng lín "tÝn hiÖu ®u«i" ®Õn khi ARN ®−îc c¾t rêi. Cã 3 tr×nh tù quan
träng: tÝn hiÖu ®u«i [AAUAAA], ®iÓm c¾t sau cÆp nucleotide CA
ARN kÝch th−íc kh¸c nhau, gäi
vµ ®o¹n giµu GC. b) Phøc hÖ g¾n ®u«i polyA gåm mét sè
lµ c¸c ARN dÞ nh©n protein liªn kÕt vµo c¸c tr×nh tù võa nªu, trong ®ã cã enzym
(hnARN). Sau nµy, hnARN PolyA polymerase (PAP), c¸c yÕu tè c¾t CPSF, CF1, CF2
®−îc x¸c ®Þnh lµ hçn hîp c¸c (kh«ng vÏ trªn h×nh), protein liªn kÕt ®u«i polyA (PABP).
tiÒn-ARN cã kÝch th−íc kh¸c c) mARN ®−îc c¾t sau vÞ trÝ CA. d) §u«i polyA ®−îc bæ sung
nhau. N¨m 1978, Philip Leder vµ ®−îc "duy tr×" bëi liªn kÕt cña PABP (theo Clark, 2006).

101
§inh §oµn Long

khi nghiªn cøu gen β-globin tõ c¸c tÕ bµo chuét t×m thÊy chuçi β-globin do gen nµy m·
hãa gåm 146 axit amin. C¸c nhµ nghiªn cøu ph©n lËp ®−îc ph©n tö hnARN (chØ cã trong
nh©n) dµi 1,5 kb lµ tiÒn-mARN m· hãa β-globin, ®ång thêi ph©n lËp ®−îc mARN sau khi
hoµn thiÖn cã kÝch th−íc 0,7 kb. C¶ hai lo¹i mARN ®Òu cã mò m7G ë ®Çu 5’ vµ ®u«i polyA
ë ®Çu 3’. Lóc ®ã, c¸c nhµ nghiªn cøu cho r»ng gen β-globin cã mét intron dµi 800 bp. C¸c
nghiªn cøu sau nµy thùc tÕ ®· chøng minh gen nµy cã hai intron; trong ®ã, mét intron kÝch
th−íc nhá kh«ng ®−îc t×m thÊy trong nghiªn cøu tr−íc ®ã cña Leder.
Ngoµi c¸c gen m· hãa protein ë eukaryote th−êng cã c¸c intron, sù “ph©n m¶nh cña
gen" cßn gÆp ë virut. Ch¼ng h¹n nh− gen thymidylate synthetase cña phag¬ T4 cã mét
intron.
TÕ bµo nhËn ra intron nhê mét sè tr×nh tù vïng biªn cña intron vµ ®o¹n nèi gi÷a
exon vµ intron. Cô thÓ, c¸c intron ®iÓn h×nh ®−îc giíi h¹n bëi ®Çu 5’-GU vµ 3’-AG. Ngoµi
ra, trong intron cßn cã mét sè tr×nh tù ®Æc thï kh¸c. §o¹n tr×nh tù tÝn hiÖu ®Çy ®ñ ë ®Çu
5’ gÆp ë phÇn lín c¸c intron lµ 5’-AG↓GUAAGU-3’ vµ ë ®Çu 3’ lµ 5’-YYYYYYNCAG↓-3’
(Y = pyrimidine, N = nucleotide bÊt kú). C¸c intron trong tiÒn-mARN ®−îc c¾t bá cßn c¸c
exon ®−îc nèi l¹i víi nhau trong qu¸ tr×nh xÐn mARN. Phøc hÖ thùc hiÖn nhiÖm vô nµy
®−îc gäi lµ phøc hÖ xÐn intron (spliceosome), gåm tiÒn-mARN kÕt hîp víi c¸c h¹t
ribonucleoprotein kÝch th−íc nhá, ®−îc kÝ hiÖu lµ snRNP (®äc lµ "sníp"). snRNP ®−îc t¹o
thµnh tõ sù liªn kÕt gi÷a snARN vµ protein. Cã 5 lo¹i snARN phæ biÕn ®−îc kÝ hiÖu lµ
U1, U2, U4, U5 vµ U6. Mçi lo¹i liªn kÕt víi mét sè ph©n tö protein ®Ó h×nh thµnh nªn
snRNP. Trõ U4 vµ U6 t×m thÊy trong cïng mét snRNP, c¸c lo¹i kh¸c t×m thÊy trong c¸c
snRNP kh¸c nhau.
Qu¸ tr×nh xÐn intron ®iÓn h×nh tr¶i qua mét sè b−íc nh− sau (h×nh 4.9 vµ 4.10):
1) U1 snRNP g¾n vµo vÞ trÝ c¾t ®Çu 5’ cña intron. ViÖc g¾n nµy dùa trªn nguyªn t¾c
Chargaff gi÷a U1 snARN cã trong snRNP víi tr×nh tù ®o¹n nèi exon-intron ë
®Çu 5’ cña intron.
2) U2 snRNP g¾n vµo mét tr×nh tù gäi lµ ®iÓm ph©n nh¸nh n»m ng−îc dßng víi
®o¹n nèi intron-exon vÒ phÝa ®Çu 3’ cña intron. §iÓm ph©n nh¸nh lµ vÞ trÝ ®Æc
thï cña c¸c intron, t¹i ®ã chøa mét adenine (A) lµ vÞ trÝ g¾n vµo cña ®Çu 5’ tù do
cña intron trong qu¸ tr×nh xÐn intron. Tr×nh tù ®iÓm ph©n nh¸nh phæ biÕn ë
nhiÒu gen lµ 5’-UACUAAC-3’.
3) Phøc hÖ U4/U6 snRNP t−¬ng t¸c víi U5 snRNP råi g¾n vµo c¸c phøc hÖ U1 vµ
U2 snRNP lµm hai ®Çu 5’ vµ 3’ cña intron tiÕn l¹i gÇn nhau, t¹o thµnh cÊu tróc
"thßng läng".
4) U4 snRNP t¸ch ra khái phøc hÖ, lóc nµy spliceosome chuyÓn thµnh d¹ng cã ho¹t
tÝnh c¾t cña exonuclease.
5) snRNP c¾t intron ë ®Çu 5’ t¹o ra mét ®Çu 5’ tù do. §Çu nµy sÏ liªn kÕt víi
nucleotide A t¹i ®iÓm ph©n nh¸nh qua vÞ trÝ 2’-OH (liªn kÕt phosphodiester 5’-
2’). Nhãm 3’-OH cña adenine nµy vÉn liªn kÕt b×nh th−êng víi c¸c nucleotide
kh¸c trong chuçi.
6) Intron ®−îc c¾t ë phÝa ®Çu 3’ (intron vÉn ë d¹ng "thßng läng") cßn c¸c exon liÒn
kÒ ë hai ®Çu 5’ vµ 3’ cña intron liªn kÕt víi nhau. Lóc nµy phøc hÖ snRNP rêi
khái ph©n tö ARN.
Qu¸ tr×nh xÐn intron gåm c¸c b−íc nªu trªn ®−îc lÆp l¹i cho ®Õn khi c¸c intron
®−îc c¾t hÕt.

102
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

c) Cã c¸c c¬ chÕ c¾t intron kh¸c nhau


Cã nhiÒu nhãm intron kh¸c nhau (b¶ng 4.2). C¸c intron GT-AG (t−¬ng ®−¬ng víi
GU-AG trªn ARN) ®Õn nay lµ d¹ng phæ biÕn nhÊt trong hÖ gen nh©n sinh vËt nh©n thËt.
C¸c intron AT-AC (hay AU-AC) cã c¸ch thøc ho¹t ®éng rÊt gièng víi c¸c intron GT-AG,
chØ kh¸c bëi nucleotide ë hai ®Çu lµ G ®−îc thay b»ng A vµ mét sè yÕu tè thuéc phøc hÖ
spliceosome cã thay ®æi.
VÞ trÝ c¾t ®Çu 5’ VÞ trÝ c¾t ®Çu 3’
Tr×nh tù ®iÓm ph©n nh¸nh

TiÒn-mARN Exon 1 Intron Exon 2

Sù h×nh thµnh cÊu tróc thßng läng

C¾t ®Çu 3’ vµ nèi c¸c exon

C¸c exon ®−îc nèi víi nhau

CÊu tróc thßng läng (intron)

H×nh 4.9. Qu¸ tr×nh xÐn intron ®iÓn h×nh (nhãm GT-AG) tõ tiÒn-mARN ë eukaryote
C¸c intron nhãm I VÞ trÝ c¾t ®Çu 5’ VÞ trÝ c¾t ®Çu 5’
lµ c¸c intron tù c¾t.
Exon 1 Tr×nh tù ®iÓm ph©n nh¸nh Exon 2
Trong tr−êng hîp nµy
ARN cã ho¹t tÝnh xóc t¸c TiÒn mARN Intron
(ho¹t tÝnh ribozyme) vµ U1, U2
qu¸ tr×nh c¾t intron
kh«ng cÇn protein ®Æc U1 U2
hiÖu. Ph©n tö ARN gÊp
khóc sao cho h×nh thµnh
mét lo¹t cÊu tróc "cÆp U5, U4/6
tãc" hoÆc "nót th¾t", bªn
trong chøa c¸c cÆp
Exon 2
nucleotide liªn kÕt bæ Exon 1
sung víi nhau. Sù gÊp 3’
5’ U1
khóc lµm cho hai vÞ trÝ
c¾t ®−îc ®−a ®Õn gÇn U2 U5
nhau vµ sù "kÐo c¨ng" Intron
U6 U4
lµm suy yÕu liªn kÕt
phosphodieste. Liªn kÕt
nµy sÏ ®øt g·y khi mét
Phøc hÖ c¾t intron (spliceosom)
trong c¸c ph©n tö GMP,
GDP hay GTP "tÊn c«ng" H×nh 4.10. Sù h×nh thµnh phøc hÖ c¾t intron (spliceosome)
vµo vÞ trÝ liªn kÕt ®Çu 5’
(h×nh 4.11) vµ c¾t rêi intron khái c¸c exon. §iÒu ®¸ng chó ý lµ nucleotide G ë ®©y kh«ng
ph¶i lµ thµnh phÇn cña ARN mµ lµ d¹ng tù do tõ m«i tr−êng. Sau ®ã, ®Çu 3’-OH tù do sÏ
ph¶n øng víi ®Çu 5’ n»m xu«i dßng (võa ®−îc c¾t) ®Ó h×nh thµnh liªn kÕt phosphodieste míi.

103
§inh §oµn Long

KÕt qu¶ cña qu¸ tr×nh c¾t B¶ng 4.2. C¸c nhãm intron
intron lµ h×nh thµnh nªn Tªn nhãm intron VÞ trÝ gen
mét ph©n tö ARN d¹ng C¸c intron GT-AG HÖ gen nh©n ë eukaryote (phæ biÕn)
vßng (chÝnh lµ intron) vµ (hay GU-AG)
mét ph©n tö ARN d¹ng C¸c intron AT-AC HÖ gen nh©n ë eukaryote (hiÕm)
th¼ng chøa c¸c exon. (hay AU-AC)
Ho¹t tÝnh tù xóc t¸c cña C¸c intron nhãm I Trong c¸c bµo quan, gen m· hãa rARN ë c¸c
ARN trong tr−êng hîp loµi eukaryote bËc thÊp, ë prokaryote (hiÕm)
cña c¸c intron nhãm I C¸c intron nhãm II Trong c¸c bµo quan cña thùc vËt vµ nÊm,
kh«ng ®−îc coi lµ ho¹t mét sè ë prokaryote
tÝnh enzym, bëi v× c¸c C¸c intron nhãm III Trong c¸c bµo quan
ph©n tö ARN kh«ng vÒ C¸c intron ghÐp Trong c¸c bµo quan
C¸c intron tiÒn-tARN Gen m· hãa tARN trong nh©n ë eukaryote
d¹ng ban ®Çu sau khi
C¸c intron cæ C¸c gen m· hãa rARN vµ tARN ë Archaea
ph¶n øng kÕt thóc. C¸c
intron nhãm I bao gåm
c¸c intron thuéc c¸c gen m· hãa rARN ë sinh vËt nh©n thËt bËc thÊp, nh− nguyªn sinh
®éng vËt Tetrachynema. Nh−ng, phÇn lín intron nhãm I ®−îc t×m thÊy trong ti thÓ vµ l¹p
thÓ; mét vµi tr−êng hîp ®−îc t×m thÊy ë phag¬ vµ vi khuÈn (hiÕm).
C¸c intron nhãm II t×m thÊy trong bµo quan cña nÊm vµ mét sè tr−êng hîp ë vi
khuÈn. C¸c intron nhãm III b¾t gÆp ë c¸c bµo quan. C¸c intron thuéc hai nhãm II vµ III
còng ®Òu lµ c¸c intron tù c¾t. Tuy nhiªn, ph¶n øng tù c¾t ë hai nhãm nµy kh¸c víi nhãm
I ë chç nucleotide "tÊn c«ng" vµo vÞ trÝ c¾t lµ mét adenine (A) cã trong ph©n tö tiÒn-ARN
chø kh«ng ph¶i lµ nucleotide tù do trong m«i tr−êng. C¬ chÕ nµy còng dÉn ®Õn sù h×nh
thµnh "vßng th¾t" ë tiÒn-mARN nh− m« t¶ ë trªn. Sù gièng nhau nµy cho thÊy cã lÏ ba
nhãm intron I, II vµ III cã cïng nguån gèc tiÕn hãa. C¸c intron nhãm II vµ III rÊt gièng
nhau, trõ h×nh d¹ng vµ kÝch th−íc (nhãm III th−êng nhá h¬n).

a) Intron nhãm I b) Intron nhãm II

B−íc

B−íc

B−íc 

B−íc 

H×nh 4.11. Ph¶n øng tù c¾t cña c¸c intron nhãm I vµ II. ë c¶ hai nhãm, c¸c intron ®Òu "gÊp nÕp" sao cho c¸c
®Çu nèi gi÷a c¸c exon ¸p s¸t víi nhau (ë ®©y chØ minh häa sù kÕt cÆp gi÷a c¸c nucleotide qua liªn kÕt hydro).
a) ë intron nhãm I, mét nucleotide G trong m«i tr−êng tÊn c«ng vµo ®iÓm c¾t ®Çu 5' lµm ®øt intron khái exon; sau
®ã, ®Çu 3'-OH tù do cña exon ph¶n øng víi G t¹i ®iÓm c¾t ®Çu 3' (lµm t¸ch rêi intron vµ nèi hai exon). b) ë intron
nhãm II, ph¶n øng c¾t vÒ c¬ b¶n gièng intron nhãm I, trõ ®Æc ®iÓm lµ ph¶n øng c¾t ®Çu tiªn ®−îc thùc hiÖn bëi A
cã trong chÝnh tiÒn-ARN.

104
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

Intron ghÐp (twintron) lµ mét d¹ng phøc hîp intron, mµ mét intron nµy n»m
trong hoÆc gèi lªn tr×nh tù cña mét intron kh¸c. Chóng cã thÓ ®ång thêi gåm intron thuéc
hai hay nhiÒu nhãm kh¸c nhau (I, II vµ III). Do hiÖn t−îng c¸c intron "lång" tr×nh tù vµo
nhau nh− vËy, nªn trong tÕ bµo chóng cÇn ®−îc "xÐn" theo mét trËt tù nhÊt ®Þnh. Cã thÓ
h×nh dung trËt tù c¾t c¸c "intron ghÐp" gièng nh− khi ta thùc hiÖn mét phÐp tÝnh ®¹i sè
cã nhiÒu ngoÆc ®¬n vµ ngoÆc kÐp cÇn ph¶i tiÕn hµnh theo mét thø tù nhÊt ®Þnh.
C¸c intron cæ (archeal) ®−îc t×m thÊy ë c¸c gen m· hãa tARN vµ rARN cña vi
khuÈn cæ (giíi Archaea; cßn gäi lµ vi khuÈn cùc ®oan). C¸c intron nµy cã mét sè ®Æc ®iÓm
gièng víi tiÒn-tARN ë eukaryote. C¬ chÕ c¾t c¸c intron cæ kh«ng cã phøc hÖ kiÓu
spliceosome, kh«ng cã c¸c snRNP còng nh− kh«ng cã ribozyme. C¸c ph©n tö tARN vµ
rARN gÊp nÕp t¹o thµnh c¸c "vßng th¾t" cã cÊu tróc rÊt æn ®Þnh (v× vËy kh«ng cÇn c¸c
snRNP). C¸c vßng th¾t sau ®ã ®−îc c¾t bëi ribonuclease cã trong tÕ bµo, råi ®−îc nèi l¹i
bëi ARN ligase.
d) Mét tiÒn-ARN cã thÓ ®−îc c¾t intron theo nhiÒu c¸ch kh¸c nhau
Nh− nªu ë trªn, mÆc dï viÖc nhËn biÕt intron x¶y ra theo mét c¬ chÕ ®−îc kiÓm so¸t
nghiªm ngÆt. Nh−ng, c¸c c¸c tÕ bµo eukaryote cã thÓ chän c¸c ®iÓm c¾t intron kh¸c nhau
ngay ë mçi gen. HiÖn t−îng thay ®æi c¸ch c¾t intron phæ biÕn nhÊt lµ ë c¸c tÕ bµo kh¸c
nhau trong cïng c¬ thÓ. C¬ chÕ nµy cho phÐp mét tr×nh tù ADN ®−îc dïng ®Ó m· hãa
nhiÒu protein kh¸c nhau (nh−ng th−êng cã quan hÖ vÒ chøc n¨ng); nhê vËy, sè lo¹i
protein cã trong tÕ bµo cã thÓ t¨ng lªn mµ kh«ng cÇn t¨ng l−îng ADN. Tuy vËy, còng
gièng phÇn lín c¸c qu¸ tr×nh di truyÒn ë cÊp ph©n tö kh¸c trong tÕ bµo, viÖc thay ®æi vÞ
trÝ c¾t intron còng ®−îc tÕ bµo kiÓm so¸t chÆt chÏ vµ cÇn bæ sung c¸c protein ®Æc hiÖu.
D−íi ®©y lµ ba kiÓu thay ®æi c¸ch c¾t intron phæ biÕn:
- Chän c¸c promoter kh¸c nhau. Theo c¬ chÕ nµy, c¸c tÕ bµo kh¸c nhau cã c¸c
yÕu tè phiªn m· kh¸c nhau. C¸c yÕu tè phiªn m· nµy nhËn ra c¸c promoter kh¸c
nhau (mÆc dï chóng dïng chung mét phÇn tr×nh tù m· hãa). H×nh 4.12 minh
häa c¬ chÕ nµy.
- Chän vÞ trÝ g¾n ®u«i polyA kh¸c nhau. Theo c¬ chÕ nµy, c¸c tÕ bµo kh¸c
nhau chän vÞ trÝ g¾n ®u«i polyA kh¸c nhau. Mét sè tÕ bµo chän tÝn hiÖu g¾n ®u«i
polyA sím dÉn ®Õn viÖc ph©n tö mARN tr−ëng thµnh thiÕu mét sè exon ë xa
(h×nh 4.13). C¬ chÕ nµy ®−îc dïng ®Ó s¶n sinh c¸c kh¸ng thÓ cïng nhËn biÕt c¸c
ph©n tö kh¸ng nguyªn l¹ x©m nhËp vµo tÕ bµo, nh−ng cã phÇn ®u«i kh¸c nhau
(xem thªm ch−¬ng 9). Mét lo¹i ®−îc tiÕt vµo m¸u, cßn lo¹i kh¸c ®−îc g¾n lªn
mµng tÕ bµo.
- Thay ®æi c¸ch c¾t intron b»ng chän c¸c tæ hîp exon kh¸c nhau. §©y lµ c¬
chÕ thay ®æi tæ hîp c¸c exon thùc sù víi c¸c tæ hîp ®iÓm c¾t intron kh¸c nhau.
Tïy thuéc vµo c¸c ®iÓm c¾t ®−îc chän, mét hay mét sè exon cã thÓ cã mÆt trong
mARN hoµn thiÖn ë tÕ bµo nµy, nh−ng v¾ng mÆt ë tÕ bµo kh¸c. Theo c¬ chÕ nµy,
ph©n tö tiÒn-ARN ban ®Çu ®−îc t¹o ra trong phiªn m· lu«n gièng nhau. ViÖc
chän vÞ trÝ c¾t phô thuéc vµo mét sè yÕu tè ®Æc tr−ng cña tÕ bµo tham gia vµo
phøc hÖ spliceosome. C¬ chÕ chi tiÕt ®iÒu khiÓn sù xuÊt hiÖn c¸c yÕu tè nµy cßn
ch−a biÕt ®Çy ®ñ. Mét vÝ dô vÒ c¬ chÕ nµy lµ gen m· hãa protein c¬ troponin T. ë
chuét, gen nµy cã 18 exon. Trong ®ã, 11 exon lu«n ®−îc dïng, 5 exon (tõ exon 4
®Õn 8) ®−îc sö dông trong c¸c tæ hîp bÊt kú (kÓ c¶ kh«ng cã exon nµo), 2 exon
cßn l¹i (17 vµ 18) ®−îc dïng thay phiªn nhau. C¬ chÕ nµy gióp gen m· hãa
troponin T cã thÓ t¹o ra 64 lo¹i mARN hoµn thiÖn kh¸c nhau; kÕt qu¶ lµ m« c¬

105
§inh §oµn Long

chøa rÊt nhiÒu lo¹i protein troponin T. Sù thay ®æi c¸ch c¾t intron ë gen
troponin T kh«ng chØ thÊy trong ph¹m vi mét loµi vµ cßn gi÷a c¸c loµi ®éng vËt
cã x−¬ng sèng kh¸c nhau. Mét sè gen m· hãa protein c¬ kh¸c còng cã c¬ chÕ
t−¬ng tù.
Ngoµi ba kiÓu c¾t intron thay ®æi nªu trªn, cßn cã mét kiÓu hiÕm gÆp kh¸c ®−îc gäi
lµ sù c¾t chuyÓn chç intron (trans-splicing). Trong c¬ chÕ nµy, c¸c exon cã nguån gèc tõ
c¸c tiÒn-ARN kh¸c nhau ®−îc c¾t ra vµ tæ hîp l¹i trong ph©n tö ARN hoµn thiÖn. Trïng
mòi khoan lµ sinh vËt nh©n thËt ®¬n bµo g©y bÖnh "èm ngñ" vµ mét sè bÖnh nhiÖt ®íi
kh¸c. Loµi nguyªn sinh ®éng vËt nµy cã thÓ v−ît qua sù gi¸m s¸t cña hÖ miÔn dÞch cña
®éng vËt cã x−¬ng sèng b»ng c¸ch thay ®æi protein bÒ mÆt tÕ bµo dùa trªn c¬ chÕ "tr¸o ®æi
vÞ trÝ" c¸c phÇn cña gen. Ngoµi ra, nã cßn cã thÓ tæ hîp c¸c exon tõ nhiÒu gen kh¸c nhau.
MÆc dï hiÖn t−îng nµy ch−a tõng gÆp ë ®éng vËt cã x−¬ng sèng, nh−ng c¬ chÕ c¾t chuyÓn
chç intron còng ®· ®−îc t×m thÊy ë giun trßn vµ trong hÖ gen l¹p thÓ ë thùc vËt.

Promoter #1 Promoter #2

ADN P1 Exon1 Intron P2 Exon2 Intron Exon3 Intron Exon4 Intron


Phiªn m· tõ P1 Phiªn m· tõ P2

TiÒn-mARN ®−îc phiªn m· tõ P1 TiÒn-mARN ®−îc phiªn m· tõ P2


Exon1 Intron P2 Exon2 Intron Exon3 Intron Exon4 Exon2 Intron Exon3 Intron Exon4

xÐn intron xÐn intron

mARN1 Exon1 Exon3 Exon4 mARN2 Exon2 Exon3 Exon4

H×nh 4.12. C¸c tÕ bµo cã thÓ chän c¸c promoter kh¸c nhau ®Ó biÓu hiÖn gen. ADN cã thÓ cã hai
promoter kh¸c nhau, tõ ®ã phiªn m· h×nh thµnh hai "phiªn b¶n" tiÒn-mARN kh¸c nhau. NÕu dïng promoter
#1, th× b¶n phiªn m· hoµn thiÖn sÏ gåm c¸c exon1, 3 vµ 4. NÕu dïng promoter #2, th× b¶n phiªn m· sÏ
gåm c¸c exon 2, 3 vµ 4 (theo Clark, 2006).

Promoter TÝn hiÖu ®u«i #1 TÝn hiÖu ®u«i #2

ADN Exon1 Intron Exon2 Intron Exon3 Intron Exon4

Phiªn m·

TiÒn-mARN tõ c¸ch chän tÝn hiÖu ®u«i #1 TiÒn-mARN tõ c¸ch chän tÝn hiÖu ®u«i #2
Exon1 Intron Exon2 Intron Exon3 Exon1 Intron Exon2 Intron Exon3 Intron Exon4

Hoµn thiÖn mARN Hoµn thiÖn mARN

mARN1 Exon1 Exon2 Exon3 AAAAAAA mARN2 Exon1 Exon2 Exon4 AAAAAAA

H×nh 4.13. C¸c tÕ bµo cã thÓ chän vÞ trÝ g¾n ®u«i polyA kh¸c nhau ®Ó biÓu hiÖn gen. ADN ë ®©y cã hai
tÝn hiÖu ®u«i kh¸c nhau. NÕu tÝn hiÖu ®u«i #1 ®−îc sö dông, th× b¶n phiªn m· hoµn thiÖn sÏ gåm c¸c exon1, 2
vµ 3. NÕu tÝn hiÖu ®u«i #2 ®−îc sö dông, th× b¶n phiªn m· sÏ gåm c¸c exon 1, 2 vµ 4 (theo Clark, 2006).

106
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

4.2.6.2. Sù hoµn thiÖn c¸c rARN vµ tARN


ë vi khuÈn, cã 3 lo¹i rARN (cã hÖ Tr×nh tù Tr×nh tù Tr×nh tù
rARN 16S rARN 23S rARN 5S
sè l¾ng t−¬ng øng lµ 5S, 16S vµ 23S)
tARN
®−îc h×nh thµnh tõ mét tiÒn-ARN duy
nhÊt. Ph©n tö tiÒn-ARN mang ba ®o¹n
tr×nh tù m· hãa c¸c rARN theo trËt tù Ribonuclease c¾t t¹i c¸c vÞ trÝ ®¸nh dÊu b»ng mòi tªn

16S-23S-5S xen gi÷a c¸c ®o¹n nèi kh«ng


m· hãa (c¸c ®o¹n nèi kh«ng m· hãa nµy Tr×nh tù Tr×nh tù Tr×nh tù
rARN 16S rARN 23S rARN 5S
kh«ng ®−îc gäi lµ exon v× chóng n»m
ngoµi gen). ë vi khuÈn, ph©n tö tiÒn-
rARN cßn mang tr×nh tù m· hãa mét sè C¸c Exonuclease c¾t tØa t¹i c¸c ®Çu 5’ vµ 3’

tARN. ë prokaryote còng nh− ë


eukaryote, hÖ gen th−êng ®ång thêi cã rARN 16S rARN 23S rARN 5S
nhiÒu b¶n sao cña gen m· hãa c¸c rARN. hoµn thiÖn hoµn thiÖn hoµn thiÖn

ë prokaryote, ph©n tö rARN hoµn


thiÖn ®−îc t¹o ra tõ tiÒn-ARN bëi ho¹t H×nh 4.14. Hoµn thiÖn c¸c rARN ë prokaryote.
®éng c¾t intron cña c¸c ribonuclease. Ph©n tö tiÒn-rARN ®ång thêi mang tr×nh tù m· hãa
c¶ 3 lo¹i rARN, xen gi÷a bëi mét hoÆc hai tr×nh tù
Qu¸ tr×nh c¾t th−êng gåm hai b−íc m· hãa tARN. §Çu tiªn, c¸c enzym ribonuclease c¾t
(h×nh 4.14). B−íc 1, c¸c ph©n ®o¹n c¸c tiÒn-rARN t¹i c¸c vÞ trÝ ®Æc hiÖu. Sau ®ã, c¸c
mang tr×nh tù m· hãa rARN 16S, 23S vµ enzym exonuclease "c¾t tØa" tõ hai ®Çu 5' vµ 3' ®Ó
5S ®−îc 3 enzym ribonuclease III, P vµ F h×nh thµnh c¸c rARN hoµn thiÖn (5S, 16S vµ 23S).
t−¬ng øng nhËn ra (dùa trªn tr×nh tù ®Æc
tr−ng t¹i mçi vïng cña tiÒn-rARN) vµ c¾t rêi khái nhau. B−íc 2, mét sè exonuclease tiÕn
hµnh "c¾t tØa" c¸c nucleotide ë hai ®Çu ®Ó t¹o nªn c¸c lo¹i rARN hoµn thiÖn.
ë eukaryote, cã bèn lo¹i rARN lµ 5S, 5,8S, 18S vµ 28S. Riªng rARN 5S ®−îc tæng
hîp tõ mét locut ®éc lËp (n»m cïng côm gen m· hãa c¸c tARN) bëi ARN pol III. Cßn ba
lo¹i rARN cßn l¹i ®−îc h×nh thµnh tõ cïng mét tiÒn-rARN theo kiÓu gièng víi prokaryote
®−îc nªu ë trªn do enzym ARN pol I tiÕn hµnh phiªn m·.
C¸c tARN hoµn thiÖn ®−îc h×nh thµnh tõ c¸c ph©n tö tiÒn-tARN cã kÝch th−íc lín
vµ cÇn tr¶i qua qu¸ tr×nh hoµn thiÖn. Mét sè tARN ®−îc tæng hîp (phiªn m·) ®éc lËp,
mét sè kh¸c ®−îc phiªn m· cïng nhau (tõ cïng mét tiÒn-tARN); ë vi khuÈn, mét sè
tARN ®−îc h×nh thµnh tõ tiÒn-ARN m· hãa ®ång thêi tARN vµ rARN. Trong qu¸ tr×nh
hoµn thiÖn tARN ë vi khuÈn, ®Çu 5’ ®−îc c¾t tØa bëi mét ribozyme ®Æc biÖt, cã tªn lµ
ribonuclease P. Enzym ribonuclease P cã thµnh phÇn bao gåm protein vµ ARN, nh−ng
ho¹t tÝnh xóc t¸c lµ do ARN; thµnh phÇn protein chØ cã vai trß cÊu tróc vµ ®iÒu hßa ho¹t
®éng cña enzym.
4.2.6.3. gARN ®iÒu khiÓn sù biÕn ®æi nucleotide trong qu¸ tr×nh hoµn thiÖn rARN
Nh− ®· nªu ë ch−¬ng 2, kh¸c víi ADN, ARN th−êng mang nhiÒu nucleotide (thùc
chÊt lµ phÇn baz¬ nit¬) ®−îc biÕn ®æi. §iÒu nµy ®Æc biÖt ®óng víi tARN. Tuy vËy, ngay c¶
c¸c rARN vµ ®«i khi lµ mARN còng mang c¸c baz¬ nit¬ ®−îc biÕn ®æi.
Trong tr−êng hîp ë tARN, sù c¶i biÕn c¸c baz¬ ®−îc thùc hiÖn bëi c¸c enzym.
Chóng nhËn ra c¸c baz¬ nhÊt ®Þnh trong c¸c vïng ®Æc thï cña c¸c ph©n tö tARN vµ tiÕn
hµnh biÕn ®æi chóng. Sù biÕn ®æi nucleotide bëi enzym còng x¶y ra ë mét sè rARN vi
khuÈn. §èi víi rARN ë eukaryote, sù biÕn ®æi c¸c baz¬ nit¬ x¶y ra ë nhiÒu vÞ trÝ kh¸c
nhau trªn ph©n tö vµ cÇn mét sè ph©n tö ARN kÝch th−íc nhá ngoµi c¸c enzym c¶i biÕn
nucleotide. C¸c ph©n tö ARN kÝch th−íc nhá nµy cã vai trß x¸c ®Þnh vÞ trÝ nucleotide cÇn
biÕn ®æi trªn ph©n tö rARN qua kÕt cÆp bæ sung gi÷a c¸c ®o¹n nucleotide ng¾n. C¸c ARN

107
§inh §oµn Long

kÝch th−íc nhá nµy ®−îc gäi lµ c¸c ARN chØ dÉn, kÝ hiÖu lµ gARN; do chóng chØ cã trong
nh©n tÕ bµo, nªn chóng cßn ®−îc gäi lµ ARN nh©n kÝch th−íc nhá, kÝ hiÖu lµ snoARN).
C¸c nucleotide trong ph©n tö rARN ë eukaryote th−êng ®−îc biÕn ®æi b»ng viÖc g¾n
thªm nhãm methyl (-CH3) vµo vÞ trÝ 2’-OH cña ®−êng ribose, hoÆc bëi sù biÕn ®æi uridine
(U) thµnh pseudouridine (kÝ hiÖu lµ Ψ, hoÆc ΨU). MÆc dï chØ cã mét sè baz¬ ®−îc biÕn
®æi, song sè vÞ trÝ baz¬ ®−îc biÕn ®æi trong ph©n tö lµ kh¸ lín. Trung b×nh, mét ph©n tö
tiÒn-rARN ë ng−êi ®−îc methyl hãa t¹i 106 vÞ trÝ vµ biÕn ®æi U → Ψ t¹i 95 vÞ trÝ. Tr×nh tù
c¸c baz¬ nit¬ ë quanh vÞ trÝ ®−îc biÕn ®æi th−êng kh«ng gièng nhau cho thÊy c¸c enzym
biÕn ®æi nucleotide kh«ng ho¹t ®éng theo c¬ chÕ dïng c¸c tr×nh tù liªn øng. Thay vµo ®ã,
mçi nucleotide cÇn biÕn ®æi th−êng sö dông mét ph©n tö gARN chuyªn biÖt. Mçi ph©n tö
gARN th−êng cã kÝch th−íc 70 – 100 nucleotide vµ cã tr×nh tù ®Æc thï t−¬ng øng víi vÞ
trÝ cÇn biÕn ®æi trªn ARN. Ngoµi ra, tÊt c¶ c¸c gARN ®Òu cã mét mÉu (motif) tr×nh tù
gièng nhau lµ vÞ trÝ liªn kÕt víi enzym methylase; qua ®ã gióp enzym nµy nhËn ra vÞ trÝ
cÇn methyl hãa trªn ARN. T−¬ng tù nh− vËy, sù biÕn ®æi U → Ψ cÇn mét hä c¸c gARN cã
vai trß chØ dÉn ®Ó c¸c enzym biÕn ®æi U → Ψ t¹i ®óng vÞ trÝ cÇn thiÕt.
T−¬ng t¸c gi÷a rARN vµ gARN th−êng liªn quan ®Õn sù kÕt cÆp bÊt th−êng G – U.
KiÓu kÕt cÆp bÊt th−êng nµy kh¸ bÒn trong c¸c vïng ARN xo¾n kÐp (dsARN). HiÖn t−îng
nµy còng x¶y ra trong t−¬ng t¸c gi÷a gARN vµ mARN trong qu¸ tr×nh biªn tËp ARN
®−îc nªu d−íi ®©y (h×nh 4.15).
Do cã nhiÒu baz¬ nit¬ ®−îc biÕn ®æi trong c¸c lo¹i ARN, ë mçi tÕ bµo eukaryote cã
hµng tr¨m lo¹i gARN kh¸c nhau. Tuy vËy, chØ cã mét sè Ýt gARN nµy ®−îc phiªn m· tõ
c¸c gen cã cÊu tróc hoµn chØnh. Cßn phÇn lín c¸c gARN ®−îc m· hãa trong vïng intron
cña c¸c gen m· hãa cho c¸c protein kh¸c. Nh− vËy, nhiÒu gARN ®−îc h×nh thµnh trong
qu¸ tr×nh hoµn thiÖn mARN cña c¸c gen m· hãa cho c¸c protein kh¸c nhau. Trong sè c¸c
gen cã c¸c intron mang vïng m· hãa gARN cã c¸c gen m· hãa protein cña ribosome.
Ch¼ng h¹n nh−, snoARN U16 ®−îc m· hãa trong intron 3 cña gen m· hãa protein
ribosome L1.

4.2.6.4. Biªn tËp ARN tr−íc dÞch m·


Cã lÏ sù biÕn ®æi c¸c nucleotide phøc t¹p nhÊt x¶y ra ë c¸c mARN lµ sù biªn tËp
ARN tr−íc dÞch m·. §©y lµ qu¸ tr×nh ph©n tö tiÒn-mARN ®−îc bæ sung thªm, hoÆc c¾t
bít ®i, hoÆc ®−îc thay thÕ mét sè nucleotide, dÉn ®Õn viÖc ph©n tö ARN khi ®−îc dïng ®Ó
dÞch m· cã tr×nh tù kh«ng "khíp" víi tr×nh tù ADN cña gen gèc. Kh«ng cã g× ng¹c nhiªn
khi trong thùc tÕ sù biªn tËp ARN rÊt hiÕm x¶y ra ë hÇu hÕt c¸c sinh vËt. ë thó, sù biªn
tËp ARN chØ x¶y ra trong ph¹m vi biÕn ®æi c¸c nucleotide lµ C → U vµ A → I (inosine); vµ
còng chØ x¶y ra ë mét sè Ýt mARN. ë thùc vËt, c¶ hai kiÓu biªn tËp C → U vµ U → C ®Òu
xuÊt hiÖn phæ biÕn. HiÖn t−îng ARN ®−îc biªn tËp l¹i ®−îc t×m thÊy phæ biÕn nhÊt ë mét
sè nguyªn sinh ®éng vËt (nh− trïng mòi khoan) víi viÖc ®ång thêi bæ sung thªm hoÆc c¾t
bít ®i mét sè nucleotide trong ph©n tö mARN.
Mét vÝ dô vÒ "biªn tËp ARN" ë ng−êi lµ gen m· hãa alipoprotein B. Protein nµy gåm
4563 axit amin, lµ mét trong c¸c protein lín nhÊt ®· tõng biÕt ®Õn nay. Alipoprotein B cã
kÝch th−íc ®Çy ®ñ, kÝ hiÖu apoB100, ®−îc tæng hîp ë tÕ bµo gan tr−íc khi ®−îc tiÕt vµo
m¸u. ApoB100 cã vai trß "l¾p r¸p" c¸c h¹t lipoprotein mËt ®é thÊp (LDL) vµ rÊt thÊp
(VLDL) lµm nhiÖm vô vËn chuyÓn lipid (kÓ c¶ cholesterol) trong c¬ thÓ. Mét phiªn b¶n
protein kh¸c cña gen nµy, kÝ hiÖu lµ apoB48, chØ gåm 2153 axit amin ®−îc tiÕt ra tõ c¸c
tÕ bµo ruét. ApoB48 cã vai trß hÊp thô chÊt bÐo tõ thøc ¨n. So víi apoB100, apoB48 thiÕu
mét ®o¹n tr×nh tù axit amin lµ vÞ trÝ liªn kÕt víi thô thÓ cña LDL (gåm c¸c axit amin tõ
3129 ®Õn 3532). KÕt qu¶ lµ c¸c chÊt bÐo tõ thøc ¨n ®−îc apoB48 vËn chuyÓn chñ yÕu

108
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

®−îc hÊp thu ë gan, trong khi apoB100 cã vai trß ph©n phèi cholesterol vµo c¸c m« ngo¹i
vi mµ ë ®ã tÕ bµo cña chóng cã thô thÓ LDL.
Hai phiªn b¶n protein apoB48 vµ apoB100 ®Òu ®−îc m· hãa bëi cïng mét gen. §Ó
tæng hîp ®−îc hai protein nµy, cÇn cã sù biªn tËp l¹i ARN sau phiªn m·. Sù biªn tËp
ARN diÔn ra nh− sau: bé ba m· hãa Gln (t¹i vÞ trÝ 2154 cña apoB100) t−¬ng øng trªn
mARN lµ CAA ®−îc biÕn ®æi thµnh mét m· bé ba kÕt thóc UAA. ë ®©y, viÖc biªn tËp
®−îc thùc hiÖn bëi enzym lo¹i nhãm amin (-NH2) cña C dÉn ®Õn viÖc biÕn ®æi C → U.
Qu¸ tr×nh lo¹i amin cÇn mét lo¹t protein bæ trî ®Ó ®¶m b¶o ph¶n øng chØ x¶y ra ®óng ë
nucleotide cÇn thiÕt. Mét ®iÓm ®¸ng chó ý trong biÓu hiÖn gen alipoprotein B lµ: mÆc dï
®Ó t¹o ra hai lo¹i protein lµ apoB48 vµ apoB100 chØ cÇn mét gen duy nhÊt, nh−ng ®Ó biªn
tËp ®−îc ARN chÝnh x¸c l¹i cÇn cã nhiÒu protein bæ trî kh¸c ®−îc m· hãa bëi nhiÒu gen
kh¸c. Nh− vËy, râ rµng khi sö dông hÖ thèng biªn tËp l¹i ARN tÕ bµo cÇn bé m¸y phøc
t¹p vµ cã lÏ cÇn chi phÝ n¨ng l−îng cao h¬n nÕu tÕ bµo cã hai gen m· hãa cho hai protein
nµy. T¹i sao chän läc l¹i duy tr× c¸ch thøc "biªn tËp ARN" chø kh«ng ph¶i "hai gen" ®Õn
nay ch−a râ.
ë thó, mét c¬ chÕ biªn tËp ARN kh¸c ®−îc t×m thÊy lµ sù thay thÕ A → I. Trong
tr−êng hîp nµy, mét enzym cã tªn lµ dsARN adnosine deaminase nhËn ra ®o¹n dsARN
mang nucleotide A cÇn biÕn ®æi ®ang liªn kÕt bæ sung víi mét tr×nh tù intron ®Æc thï
trªn ph©n tö mARN vµ tiÕn hµnh lo¹i nhãm amin khái A (A → I). Nh− vËy, ë ®©y chóng
ta thÊy intron ®−îc dïng lµm tÝn hiÖu cho sù biªn tËp ARN. V× vËy, trong tr−êng hîp nµy
viÖc biªn tËp ARN ph¶i x¶y ra tr−íc viÖc c¾t
intron. Trong qu¸ tr×nh dÞch m·, I th−êng ®−îc mARN
"dÞch m·" gièng G, v× vËy dÔ dÉn ®Õn sù thay thÕ §iÓm c¾t

axit amin trong ph©n tö protein. HiÖn t−îng nµy


AGA
thùc tÕ x¶y ra trong qu¸ tr×nh tæng hîp c¸c
protein thô thÓ cña serotonine vµ thô thÓ gARN
glutamate thuéc hÖ thÇn kinh trung −¬ng ë ®éng
5’
vËt cã vó, kÓ c¶ ë ng−êi. Sai sãt x¶y ra trong qu¸
tr×nh biªn tËp ARN cña nh÷ng gen nµy dÉn ®Õn
mét sè héi chøng thÇn kinh nghiªm träng. Sù biÕn Cµi thªm mét sè nucleotide U
3’
®æi A → I còng x¶y ra trong c¸c vïng kh«ng m·
hãa cña c¸c gen kh¸c nhau. Nh×n chung, vai trß
cña nh÷ng biÕn ®æi nµy ®Õn nay ch−a biÕt ®Çy ®ñ.
Sù biªn tËp l¹i mARN theo kiÓu biÕn ®æi UUU
AGA
C → U hoÆc U → C ®−îc t×m thÊy trong hÖ gen ti
thÓ vµ l¹p thÓ ë phÇn lín thùc vËt. Mét c¸ch phæ
biÕn, sù biªn tËp ARN trung b×nh lµm thay ®æi tõ 5’
3 ®Õn 4 nucleotide trong mçi ®o¹n tr×nh tù gåm
20 nucleotide mARN cña hÖ gen l¹p thÓ. Trong
3’
nhiÒu tr−êng hîp, sù thay thÕ c¸c nucleotide dÉn
®Õn nh÷ng biÕn ®æi trong tr×nh tù axit amin cÇn H×nh 4.15. Biªn tËp mARN ë trïng mòi
thiÕt ®Ó protein ®¹t ho¹t tÝnh cao nhÊt. Nh−ng, khoan (Trypanosome). gARN kÕt cÆp víi
®o¹n tr×nh tù ®Æc tr−ng trªn mARN. §o¹n
còng cã tr−êng hîp sù biªn tËp ARN chØ dÉn ®Õn tr×nh tù bæ sung (AGA) ë gARN ®−îc dïng
mét ®ét biÕn c©m. VÝ dô nh−, tr−êng hîp gen lµm khu«n ®Ó cµi thªm mét sè nucleotide U
atpA ë l¹p thÓ c©y thuèc l¸ cã mét bé ba CUC vµo mARN. Trong vÝ dô trªn ®©y, cã mét
trªn mARN ®−îc biªn tËp l¹i thµnh CUU. C¶ hai liªn kÕt "láng lÎo" G-U gi÷a hai ARN.

109
§inh §oµn Long

bé ba ®Òu m· hãa Ser. HËu qu¶ cña sù biªn tËp nµy lµ mét lo¹i tARN kh¸c ®−îc huy
®éng nhiÒu h¬n trong dÞch m·. Cã lÏ sù thay ®æi lo¹i tARN ë ®©y cã hiÖu qu¶ vÒ n¨ng
l−îng (nh−ng ch−a cã b»ng chøng kh¼ng ®Þnh ®iÒu nµy).
Sù biªn tËp ARN phøc t¹p h¬n ®−îc t×m thÊy ë trïng mòi khoan. ë ®©y, kh«ng chØ
cã sù biÓn ®æi nucleotide nµy thµnh nucleotide kh¸c, mµ sù "biªn tËp ARN" biÓu hiÖn
b»ng viÖc bæ sung thªm hoÆc bá bít mét sè nucleotide. Mét sè b¶n phiªn m· cña c¸c gen,
nhÊt lµ c¸c gen ë ti thÓ, ®−îc bæ sung hoÆc c¾t bá ®i mét sè U (h×nh 4.15). Sù biªn tËp
ARN ë mét sè gen cña trïng mòi khoan lµ cÇn thiÕt bëi tr×nh tù gen trªn ADN kh«ng
ph¶i lµ c¸c khung ®äc më (ORF) chÝnh x¸c. Khi viÖc biªn tËp mARN diÔn ra sai sãt,
protein ®−îc tæng hîp "lÖch" khung ®äc vµ mÊt chøc n¨ng. §Ó g¾n thªm c¸c U vµo c¸c vÞ
trÝ chÝnh x¸c, trïng mòi khoan sö dông mét sè gARN. C¸c gARN nµy cã tr×nh tù bæ sung
víi mét ®o¹n ng¾n cña mARN, nh−ng ngoµi ra cã thªm mét (hoÆc mét sè) A. Phøc hÖ
biªn tËp ARN sÏ bæ sung thªm U vµo mARN t¹i c¸c vÞ trÝ ®èi diÖn víi A trªn gARN.

4.2.6.5. VËn chuyÓn ARN tõ nh©n ra tÕ bµo chÊt ë eukaryote


Nh©n tÕ bµo ®−îc bao bäc bëi mét líp mµng kÐp. Trªn mµng cã c¸c lç cho phÐp c¸c
ph©n tö ®i ra vµ vµo theo c¸c con ®−êng ®−îc ®iÒu khiÓn nghiªm ngÆt. Trong ®ã, mçi lç
trªn mµng nh©n ®−îc bäc bëi c¸c protein kiÓm so¸t sù ra, vµo cña c¸c ph©n tö. C¬ chÕ chi
tiÕt kiÓm so¸t sù di chuyÓn cña ARN vµ protein ra, vµo nh©n tÕ bµo ®Õn nay cßn nhiÒu bÝ
Èn. Chóng ta míi chØ biÕt r»ng, mét khi mARN ®· ®−îc l¾p mò m7G, g¾n ®u«i polyA vµ
c¾t bá intron, th× chóng s½n sµng cho sù vËn chuyÓn tõ nh©n ra tÕ bµo chÊt. Khi ARN
®ang liªn kÕt víi phøc hÖ spliceosome, nã kh«ng thÓ ®i qua lç mµng nh©n.
Sù vËn chuyÓn c¸c ARN vµ protein ra, vµo mµng nh©n ®ßi hái n¨ng l−îng. C¸c b»ng
chøng ®Õn nay cho thÊy n¨ng l−îng nµy xuÊt ph¸t tõ thñy ph©n GTP. C¸c protein tham
gia vËn chuyÓn c¸c ®¹i ph©n tö khái nh©n ®−îc gäi lµ c¸c exportin; cßn vËn chuyÓn vµo
nh©n ®−îc gäi lµ c¸c importin. VÝ dô: exportin-t chuyªn tr¸ch vËn chuyÓn tARN.
4.2.6.6. Sù ph©n gi¶i ARN
a) Sù ph©n gi¶i ARN sau dÞch m·
C¸c ph©n tö mARN nh×n chung cã "thêi gian sèng" t−¬ng ®èi ng¾n. ë vi khuÈn, thêi
gian b¸n ph©n hñy cña chóng kho¶ng 1 – 2 phót. C¸c mARN kh«ng liªn kÕt víi ribosome
th−êng bÞ ph©n hñy nhanh. ë vi khuÈn, cã nhiÒu ribonuclease võa tham gia hoµn thiÖn
tARN vµ rARN võa cã vai trß ph©n hñy mARN sau dÞch m·. C¸c ribonuclease nµy cã thÓ
thay thÕ ®−îc cho nhau, v× vËy nÕu chØ x¶y ra ®ét biÕn lµm mÊt mét ribonuclease, c¬ thÓ
Ýt bÞ ¶nh h−ëng. C¸c mARN vi khuÈn ®−îc ph©n gi¶i qua hai b−íc. B−íc 1, c¸c vïng
mARN kh«ng liªn kÕt ribosome bÞ c¾t bëi ribonuclease E. B−íc 2, c¸c enzym exonuclase
chiÒu 3’ → 5’ tiÕp tôc ph©n hñy c¸c ®o¹n c¾t. §iÓm l−u ý ë ®©y lµ chiÒu ho¹t ®éng cña
exonulease ng−îc chiÒu ph©n gi¶i ARN tæng thÓ (5’ → 3’), bëi v× c¸c exonulease ®i sau c¸c
ribosome.
ë eukaryote, sù ph©n hñy ARN diÔn ra qua mét sè b−íc. §Çu tiªn, ®u«i polyA vµ
®Çu m7G bÞ c¾t bá, sau ®ã ARN bÞ ph©n hñy bëi c¸c enzym nuclease. Mét khi ®u«i polyA
®· bÞ c¾t kho¶ng 10 – 20 nucleotide, protein liªn kÕt ®u«i polyA (PABP) ®−îc gi¶i
phãng. ChØ sau khi PABP ®· ®−îc gi¶i phãng, ®Çu m7G míi ®−îc c¾t bá. Vµ chØ khi ®Çu
m7G ®· ®−îc c¾t bá, mét enzym lµ Xrn1 míi b¾t ®Çu tiÕn hµnh ph©n gi¶i mARN theo
chiÒu 5’ → 3’.

110
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

Sù bÒn v÷ng cña mARN cßn phô thuéc vµo tÝnh æn ®Þnh cña c¸c tr×nh tù trong ph©n
tö. C¸c mARN cã thêi gian sèng ng¾n th−êng cã vïng 3’UTR chøa mét ®o¹n kho¶ng 50
nucleotide giµu A-U (gäi lµ ARE). C¸c ARE th−êng cã sù lÆp l¹i nhiÒu lÇn cña tr×nh tù
[5’-AUUUA-3’]. Cã mét lo¹i protein chuyªn nhËn biÕt ARE vµ thóc ®Èy viÖc lo¹i ®u«i
polyA khái ph©n tö mARN, dÉn ®Õn viÖc c¸c mARN nµy sím bÞ ph©n hñy.
b) Sù ph©n hñy ARN mang ®ét biÕn v« nghÜa ë eukaryote (c¬ chÕ NMD)
C¸c tÕ bµo eukaryote cã mét c¬ chÕ kiÓm so¸t mARN ®Æc biÖt cho phÐp chóng ph¸
hñy ngay c¸c mARN mang ®ét biÕn v« nghÜa (tøc lµ mét bé ba m· hãa axit amin ®ét biÕn
thµnh m· kÕt thóc) vèn th−êng dÉn ®Õn sù h×nh thµnh c¸c protein mÊt chøc n¨ng do
ng¾n h¬n b×nh th−êng. C¬ chÕ ph©n gi¶i c¸c ARN mang ®ét biÕn v« nghÜa nh− vËy ®−îc
gäi t¾t lµ c¬ chÕ NMD (nonsense mediated decay of mARN).
NMD lµ mét c¬ chÕ b¶o vÖ ë eukaryote khi chóng ë tr¹ng th¸i dÞ hîp tö, mang mét
alen b×nh th−êng vµ mét alen ®ét biÕn v« nghÜa. NÕu alen ®ét biÕn v« nghÜa ®−îc phiªn
m· vµ dÞch m·, nã sÏ s¶n sinh ra c¸c protein mÊt chøc n¨ng, g©y l·ng phÝ n¨ng l−îng vµ
nguyªn liÖu cña tÕ bµo. §ã lµ ch−a kÓ ®Õn c¸c protein sai háng cã thÓ lµm rèi lo¹n c¸c
ho¹t ®éng sinh lý do c¹nh tranh víi c¸c protein b×nh th−êng do alen kiÓu d¹i sinh ra (bëi
chóng th−êng gièng nhau mét phÇn). Do ®ã, sù ph©n hñy sím c¸c mARN mang ®ét biÕn
v« nghÜa cã tÇm quan träng ®Æc biÖt trong viÖc b¶o vÖ tÕ bµo eukaryote khái nh÷ng hËu
qu¶ sinh lý nghiªm träng do c¸c ®ét biÕn v« nghÜa cã thÓ g©y ra. Kh¸c víi c¸c c¬ chÕ söa
ch÷a ADN (xem ch−¬ng 6), NMD lµ c¬ chÕ h¹n chÕ hËu qu¶ cña ®ét biÕn th«ng qua viÖc
t¸c ®éng tíi sù biÓu hiÖn cña gen ®ét biÕn, chø kh«ng söa ch÷a ®−îc sai háng di truyÒn;
®Æc biÖt, ®Ó kh¾c phôc c¸c lçi xuÊt hiÖn trong qu¸ tr×nh hoµn thiÖn mARN trùc tiÕp dÉn
®Õn c¸c mARN sai háng. §iÓm ®¸ng chó ý lµ c¬ chÕ NMD chØ t×m thÊy cã ë eukaryote, mµ
kh«ng thÊy cã ë prokaryote (vèn hÇu nh− kh«ng cã sù c¾t bá c¸c intron).
C¸c mARN mang c¸c ®ét biÕn v« nghÜa cã thÓ h×nh thµnh do mét sè nguyªn nh©n sau:
1. Do mét gen bÞ ®ét biÕn h×nh thµnh mét bé ba kÕt thóc sím.
2. Do sai sãt x¶y ra trong qu¸ tr×nh phiªn m· dÉn ®Õn h×nh thµnh bé ba kÕt thóc sím
trªn mARN. Nh÷ng sai sãt nµy cã thÓ g©y ra bëi: i) sai sãt do ARN pol l¾p r¸p sai
nucleotide trong phiªn m·, ii) sai sãt trong qu¸ tr×nh c¾t bá intron dÉn ®Õn lµm
lÖch khung ®äc vµ t¹o ra mét m· bé ba kÕt thóc sím, vµ iii) sai sãt trong c¾t bá
intron dÉn ®Õn mét phÇn hoÆc toµn bé intron cã mÆt trong ph©n tö mARN ®−îc
dïng dÞch m·.
C¬ chÕ NMD ®−îc kÝch ho¹t khi cã mét m· kÕt thóc xuÊt hiÖn ng−îc dßng mét vÞ trÝ
nèi exon-exon trªn mARN (kho¶ng 50 - 55 nucleotide). Së dÜ c¬ chÕ NMD nhËn ra c¸c vÞ
trÝ nèi exon-exon lµ do trong qu¸ tr×nh hoµn thiÖn mARN c¸c vÞ trÝ nèi exon-exon ®·
®−îc "®¸nh dÊu" mét c¸ch ®Æc biÖt bëi phøc hÖ nèi exon, gäi lµ EJC. C¸c EJC th−êng liªn
kÕt vµo mARN ng−îc dßng vÞ trÝ nèi exon-exon kho¶ng 20 - 24 nucleotide trong qu¸ tr×nh
hoµn thiÖn mARN (h×nh 4.16).
Trong qu¸ tr×nh vËn chuyÓn mARN tõ nh©n ra tÕ bµo chÊt ®Ó tiÕn hµnh dÞch m·, cã
3 protein (kÝ hiÖu Upf1-3) liªn kÕt vµo phøc hÖ EJC-mARN. §Çu tiªn lµ Upf3 liªn kÕt
vµo EJC khi mARN vÉn cßn trong nh©n tÕ bµo. Sau ®ã, ngay khi mARN ra khái nh©n,
Upf2 sÏ liªn kÕt vµo phøc hÖ EJC-mARN. Trong lÇn dÞch m· ®Çu tiªn, ribosome tr−ît
trªn ph©n tö mARN ®ång thêi "®Èy" phøc hÖ EJC/Upf3/Upf2 khái mARN. NÕu kh«ng cã
®ét biÕn v« nghÜa, ribosome sÏ lÇn l−ît ®Èy c¸c phøc hÖ EJC/Upf3/Upf2 cho ®Õn phøc hÖ
cuèi cïng trªn ph©n tö mARN. Tuy vËy, khi cã mét m· kÕt thóc sím, ribosome sÏ kÕt
thóc dÞch m· khi mµ trªn ph©n tö mARN cßn mét hoÆc mét sè phøc hÖ EJC/Upf3/Upf2
ch−a ®−îc "gi¶i phãng". Lóc nµy phøc hÖ kÕt thóc dÞch m· (gåm yÕu tè RF, xem phÇn
dÞch m· d−íi ®©y) vèn liªn kÕt s½n víi Upf1 sÏ t−¬ng t¸c víi phøc hÖ EJC/Upf3/Upf2 cßn

111
§inh §oµn Long

l¹i trªn mARN. Khi cã sù t−¬ng t¸c gi÷a hai lo¹i phøc hÖ (qua t−¬ng t¸c cña 3 lo¹i Upf),
mARN nhanh chãng bÞ ph©n hñy.
Trong qu¸ tr×nh ph©n hñy mARN theo c¬ chÕ NMD, mò m7G ®−îc lo¹i bá tr−íc tiªn
(®iÓm nµy kh¸c víi sù ph©n gi¶i mARN b×nh th−êng vèn b¾t ®Çu tõ ®u«i polyA). Sau ®ã,
mARN sÏ bÞ ph©n gi¶i bëi c¸c ribonuclease ho¹t ®éng theo chiÒu 5’ → 3’.
Mò m7G
TiÒn-mARN
XÐn intron; g¾n phøc hÖ
EJC vµ Upf3

Nh©n tÕ bµo

mARN ®−îc vËn TÕ bµo chÊt


chuyÓn ra tÕ bµo chÊt;
mARN “b×nh th−êng” Upf2 liªn kÕt vµo EJC

mARN “v« nghÜa”

TÊt c¶ phøc hÖ EJC ®−îc ®Èy khái


mARN ë chï kú dÞch m· ®Çu tiªn

Cßn mét sè phøc hÖ EJC trªn mARN


sau chï kú dÞch m· ®Çu tiªn

KÕt thóc dÞch m· ®óng vÞ trÝ( t−¬ng øng víi viÖc ®Èy toµn bé c¸c
phøc hÖ EJC khái mARN) cho phÐp c¸c yÕu tè dÞch m· (vÝ dô:
PABP) t¨ng c−êng t−¬ng t¸c víi bé m¸y dÞch m·, qua ®ã n©ng Huy ®éng yÕu tè
cao tÝnh æn ®Þnh cña mARN vµ hiÖu suÊt dÞch m·. RF cïng Upf1

KÕt thóc dÞch m· diÔn ra b×nh th−êng nÕu KÕt thóc dÞch m· diÔn ra kh«ng b×nh th−êng,
“phøc hÖ gi¸m s¸t” quÐt tõ ®Çu 5’→ 3’, ph¸t g©y nªn sù øc chÕ dÞch m· vµ ph©n hñy nhanh
hiÖn ra vµ lo¹i bá EJC, råi kÝch ho¹t hÖ thèng mARN “v« nghÜa” theo c¬ chÕ ®Æc biÖt
ph©n hñy ARN
Sù ph©n hñy mARN diÔn ra theo nhiÒu c¸ch kh¸c
nhau; th−êng th×, mò ®Çu 5’ bÞ ph©n hñy tr−íc, råi
sau ®ã lµ sù ph©n hñy theo chiÒu 5’ → 3’

H×nh 4.16. Sù ph©n hñy mARN mang ®ét biÕn v« nghÜa ë eukaryote (c¬ chÕ NMD). Trong qu¸ tr×nh
hoµn thiÖn mARN trong nh©n tÕ bµo, phøc hÖ nèi c¸c exon (EJC) cïng yÕu tè Upf3 liªn kÕt gÇn c¸c ®iÓm
nèi exon-exon. Sau khi mARN ®−îc chuyÓn ra tÕ bµo chÊt, yÕu tè Upf2 liªn kÕt vµo EJC. Trong tr−êng hîp
kh«ng cã ®ét biÕn v« nghÜa, ë chu kú dÞch m· ®Çu tiªn, ribosome sÏ ®Èy tÊt c¶ c¸c phøc hÖ EJC/Upf3/Upf2
ra khái mARN. §©y lµ "tÝn hiÖu" ®Ó c¸c yÕu tè dÞch m· t¨ng c−êng t−¬ng t¸c víi bé m¸y dÞch m·, gióp duy
tr× tÝnh æn ®Þnh cña mARN vµ qu¸ tr×nh dÞch m· tiÕp tôc. Trong tr−êng hîp ®ét biÕn "v« nghÜa", bé m¸y
ph©n hñy ARN ®−îc kÝch ho¹t bëi sù t−¬ng t¸c gi÷a phøc hÖ (RF + Upf1) vµ phøc hÖ EJC cßn l¹i trªn
mARN (vÏ theo Baker vµ Parker, 2004).

112
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

ë nÊm men, sè gen chøa intron chØ chiÕm d−íi 5%. V× vËy, phÇn lín c¸c gen nÊm
men trong qu¸ tr×nh hoµn thiÖn mARN kh«ng cÇn c¾t intron. KÕt qu¶ lµ, mARN nÊm
men kh«ng cã c¸c vÞ trÝ nèi exon-exon ®−îc ®¸nh dÊu b»ng EJC. Thay vµo ®ã, mARN cña
nÊm men ®−îc ®¸nh dÊu ë c¸c ®o¹n tr×nh tù giµu AU gäi lµ c¸c yÕu tè tr×nh tù ng−îc
dßng (kÝ hiÖu lµ DSE). DSE lµ c¸c vÞ trÝ g¾n kÕt cña c¸c protein tham gia vµo bé m¸y
ph©n hñy mARN mang ®ét biÕn v« nghÜa. Tuy c¬ chÕ ho¹t ®éng chi tiÕt cña DSE ch−a
biÕt ®Çy ®ñ, nh−ng cã mét kh¸c biÖt so víi c¬ chÕ NMD ë ®éng vËt (gåm tõ giun trßn ®Õn
®éng vËt cã vó) lµ: c¬ chÕ NMD ®−îc ®iÒu hßa bëi sù phosphoryl hãa Upf1, trong khi ®iÒu
nµy kh«ng x¶y ra trong c¬ chÕ DSE. C¸c thÓ ®ét biÕn bÊt ho¹t gen Upf ë nÊm men khi
®−îc nu«i trong m«i tr−êng chän läc cã thÓ sèng, nh−ng mét sè chøc n¨ng ti thÓ bÞ háng.
C¸c c¸ thÓ giun trßn bÞ sai háng c¬ chÕ NMD còng cã thÓ sèng, nh−ng th−êng cã c¬ quan
sinh s¶n sai háng vµ bÊt thô. ë ®éng vËt cã vó, c¸c sai háng liªn quan ®Õn gen Upf ®Òu
g©y chÕt.

4.3. DÞch m· (tæng hîp protein)


DÞch m· lµ qu¸ tr×nh th«ng tin di truyÒn trong tr×nh tù ARN ®−îc dïng ®Ó tæng hîp
nªn chuçi axit amin t−¬ng øng cña ph©n tö protein. §©y cã lÏ lµ qu¸ tr×nh tÕ bµo sö dông
nhiÒu n¨ng l−îng nhÊt, ®ång thêi cã tÝnh "b¶o thñ" nhÊt ë sinh vËt (rÊt gièng nhau ë mäi
loµi). Vi khuÈn trong pha t¨ng tr−ëng sö dông ®Õn 80% n¨ng l−îng tÕ bµo vµ 50% l−îng
chÊt kh« ®Ó tæng hîp protein. §Ó tæng hîp mét ph©n tö protein cÇn sù phèi hîp cña trªn
100 lo¹i ARN vµ protein kh¸c nhau. D−íi ®©y lµ mét sè néi dung c¬ b¶n cña dÞch m·.

4.3.1. C¸c thµnh phÇn tham gia tæng hîp protein


Bé m¸y tæng hîp protein gåm bèn thµnh phÇn c¬ b¶n lµ mARN, tARN, enzym
aminoacyl-tARN synthetase vµ ribosome. Khi kÕt hîp víi nhau, c¸c thµnh phÇn cña
bé m¸y dÞch m· lµm nhiÖm vô phiªn dÞch ng«n ng÷ “tø ph©n” (gåm 4 “kÝ tù” A, G, T vµ C)
ë d¹ng “3 bit” (m· bé ba) ®−îc viÕt trªn ph©n tö ADN thµnh ng«n ng÷ cña 20 lo¹i axit
amin phæ biÕn trªn ph©n tö protein; trong ®ã mçi mét m· bé ba (codon) qui ®Þnh mét axit
amin vµ ®−îc ®äc liªn tôc trong vïng m· hãa (ORF) cña mARN hoµn thiÖn. Trong qu¸
tr×nh dÞch m·, mARN ®−îc dïng lµm khu«n ®Ó tæng hîp protein; nh− vËy, ph©n tö nµy cã
vai trß cung cÊp th«ng tin cho bé m¸y dÞch m·. tARN lµ “giao diÖn” võa ®Ó c¸c m· bé ba
cña mARN ®Ýnh vµo, võa ®Ó c¸c axit amin t−¬ng øng víi c¸c m· bé ba cña mARN cã thÓ
liªn kÕt vµo chuçi polypeptide. Vai trß cña tARN cã thÓ vÝ nh− “ng−êi phiªn dÞch” gi÷a
hai “ng«n ng÷” ADN vµ protein. Enzym aminoacyl-tARN synthetase xóc t¸c ph¶n øng
h×nh thµnh liªn kÕt céng hãa trÞ ®Æc hiÖu gi÷a axit amin víi ph©n tö tARN vËn chuyÓn;
chÝnh enzym nµy ®¶m b¶o viÖc dÞch m· chÝnh x¸c qua ho¹t ®éng lùa chän ®óng c¸c ph©n
tö tARN phï hîp víi mçi lo¹i axit amin (xem môc 4.3.2.3). Thµnh phÇn cuèi cïng cña bé
m¸y dÞch m· lµ ribosome cã khèi l−îng ph©n tö lín (hµng ngµn kDa) ®−îc cÊu t¹o tõ
protein vµ rARN. Ribosome lµm nhiÖm vô “®iÒu phèi” viÖc nhËn ra chÝnh x¸c c¸c m· bé
ba trªn mARN cña mçi tARN, ®ång thêi thóc ®Èy ph¶n øng h×nh thµnh liªn kÕt peptide.

4.3.2. Ho¹t ®éng cña c¸c thµnh phÇn trong bé m¸y dÞch m·

4.3.2.1. mARN mang tr×nh tù m· hãa protein


Trong qu¸ tr×nh dÞch m·, bé m¸y dÞch m· cã nhiÖm vô gi¶i m· vïng m· hãa cña
mARN. Vïng m· hãa protein cña mçi ph©n tö mARN hoµn thiÖn, cßn ®−îc gäi lµ khung
®äc më (kÝ hiÖu lµ ORF), lµ mét tr×nh tù nucleotide liªn tiÕp (kh«ng "ng¾t qu·ng") ®−îc
®äc liªn tôc (kh«ng "dÊu phÈy") tõ mét m· më ®Çu (th−êng lµ AUG) vµ kÕt thóc ë mét

113
§inh §oµn Long

trong c¸c m· kÕt thóc (th−êng lµ UAA, UAG vµ UGA). CÇn ph©n biÖt tr×nh tù b¾t ®Çu vµ
kÕt thóc cña mét ORF th−êng t−¬ng øng víi c¸c ®iÓm b¾t ®Çu vµ kÕt thóc dÞch m·, cßn
c¸c tr×nh tù khëi ®Çu vµ kÕt thóc cña mARN (kh«ng kÓ ®u«i polyA) t−¬ng øng víi ®iÓm
b¾t ®Çu vµ kÕt thóc phiªn m·. DÞch m· b¾t ®Çu tõ ®iÓm b¾t ®Çu cña mét ORF vµ ®äc liªn
tôc mçi lÇn mét m· bé ba cho ®Õn khi gÆp m· kÕt thóc cña ORF ®ã. C¸c m· b¾t ®Çu vµ
kÕt thóc cña mét ORF ®−îc gäi t¾t t−¬ng øng lµ m· b¾t ®Çu vµ m· kÕt thóc dÞch m·.
ë prokaryote, m· b¾t ®Çu dÞch m· th−êng lµ 5’-AUG-3’, nh−ng ®«i khi lµ 5’-GUG-3’
hay 5’-UUG-3’. TÕ bµo eukaryote (trõ hÖ gen ti thÓ vµ l¹p thÓ) lu«n dïng m· b¾t ®Çu lµ
5’-AUG-3’. M· b¾t ®Çu cã vai trß rÊt quan träng, v× nã ®ång thêi thùc hiÖn hai chøc n¨ng.
Chøc n¨ng thø nhÊt lµ x¸c ®Þnh axit amin ®Çu tiªn cña chuçi polypeptide, th−êng lµ Met
(mÆc dï ë mét sè protein, axit amin nµy ®−îc c¾t bá khi hoµn thiÖn). Chøc n¨ng thø hai
lµ x¸c ®Þnh ®iÓm b¾t ®Çu mét ORF vµ toµn bé c¸c bé ba cßn l¹i trong ORF. Mäi ®ét biÕn
liªn quan ®Õn m· b¾t ®Çu ®Òu lµm mÊt hoµn toµn nghÜa cña ORF vµ dÉn ®Õn viÖc protein
kh«ng ®−îc tæng hîp. VÒ nguyªn t¾c, trªn mét m¹ch ADN cã thÓ cã tèi ®a 3 ORF kh¸c
nhau; nÕu xÐt trªn c¶ hai m¹ch ADN th× sÏ cã tèi ®a 6 ORF kh¸c nhau. §©y lµ c¬ së cña
hiÖn t−îng c¸c ORF cã thÓ n»m gèi lªn nhau (mÆc dï hiÖn t−îng nµy ®Õn nay míi gÆp ë
virut) vµ cã thÓ ®−îc ®äc theo c¶ hai chiÒu (t−¬ng øng víi hai m¹ch) cña ph©n tö ADN.
Tuy nhiªn, mét khi sù dÞch m· ®· b¾t ®Çu th× mçi m· bé ba ®−îc dÞch m· tiÕp theo lu«n
n»m kÒ s¸t m· bé ba phÝa tr−íc. Nãi c¸ch kh¸c, nÕu ribosome ®· x¸c ®Þnh mét m· b¾t
®Çu, th× m· bé ba ®ã x¸c ®Þnh tÊt c¶ c¸c bé ba theo sau cña qu¸ tr×nh dÞch m· ®ã.
PhÇn lín sinh vËt sö dông 3 m· kÕt thóc lµ 5’-UAA-3’, 5’-UAG-3’ vµ 5’-UGA-3’.
C¸c m· kÕt thóc võa x¸c ®Þnh ranh giíi tËn cïng cña mét ORF, võa lµ tÝn hiÖu kÕt thóc
dÞch m·.
Mçi ph©n tö mARN th−êng cã Ýt nhÊt mét ORF. Sè ORF ®ång thêi cã trªn mét
mARN cã xu h−íng kh¸c nhau ë eukaryote vµ prokaryote. HÇu hÕt c¸c mARN eukaryote
chØ cã mét ORF duy nhÊt, trong khi c¸c mARN ë prokaryote ®iÓn h×nh th−êng ®ång thêi
cã hai hoÆc nhiÒu ORF kh¸c nhau. C¸c mARN cã nhiÒu h¬n mét ORF ®−îc gäi lµ c¸c
mARN ®a cistron, cßn c¸c mARN chØ cã mét ORF duy nhÊt ®−îc gäi lµ mARN ®¬n
cistron. C¸c mARN ®a cistron th−êng m· hãa cho c¸c protein liªn quan ®Õn nhau vÒ chøc
n¨ng, vÝ dô nh− c¸c protein tham gia tæng hîp c¸c axit amin hay nucleotide.
§Ó b¾t ®Çu dÞch m·, c¸c ribosome ®−îc “huy ®éng” ®Õn mARN. C¸c mARN th−êng
cã tr×nh tù liªn kÕt cña ribosome n»m ng−îc dßng (vÒ phÝa ®Çu 5’) kÓ tõ m· b¾t ®Çu cña
mét ORF, ®−îc gäi lµ vÞ trÝ ®Ýnh kÕt ribosome (viÕt t¾t lµ RBS). Tr×nh tù ®Ýnh kÕt
ribosome ë prokaryote ®−îc gäi lµ Shine-dalgarno. Tr×nh tù nµy th−êng n»m c¸ch m·
b¾t ®Çu tõ 3 ®Õn 6 nucleotide vµ cã tr×nh tù bæ sung víi tr×nh tù ë ®Çu 3’ cña rARN 16S
(lµ thµnh phÇn cña tiÓu phÇn nhá cña ribosome ®−îc m« t¶ d−íi ®©y). Vïng trung t©m
nhËn biÕt mARN cña rARN 16S cã tr×nh tù lµ 5’-CCUCCU-3’, trong khi vÞ trÝ RBS cã
tr×nh tù lµ 5’-AGGAGG-3’. Tèc ®é dÞch m· cña mét mARN phô thuéc vµo møc ®é t−¬ng
®ång gi÷a tr×nh tù t¹i RBS cña mARN víi vïng nhËn biÕt mARN cña rARN 16S.
Tuy vËy, mét sè ORF ë prokaryote thuéc c¸c mARN ®a cistron tuy kh«ng cã c¸c
RBS m¹nh nh−ng vÉn ®−îc dÞch m· ë c−êng ®é cao, ®ã lµ nhê chóng cã m· b¾t ®Çu n»m
gèi lªn m· kÕt thóc cña mét ORF ë phÝa tr−íc (trong phÇn lín tr−êng hîp, tr×nh tù nµy lµ
5’-AUGA-3’; nghÜa lµ, cã mét m· b¾t ®Çu vµ mét m· kÕt thóc). Nhê vËy, mét ribosome
võa hoµn thµnh dÞch m· mét ORF phÝa tr−íc sÏ ®−îc huy ®éng ngay ®Ó dÞch m· ORF
tiÕp theo trªn ph©n tö mARN ®a cistron. HiÖn t−îng nµy cßn gäi lµ kÕt cÆp dÞch m·.

114
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

Kh¸c víi prokaryote, mARN ë eukaryote kh«ng “huy ®éng” ribosome theo kiÓu
dïng RBS, mµ thay vµo ®ã, nã th−êng dïng mò ®Çu 5’. Mò ®Çu 5’ cña mARN eukaryote
mang 7-methyl guanosine (viÕt t¾t lµ m7G hoÆc m7Gppp). ChÝnh cÊu tróc nµy cã vai trß
“huy ®éng” ribosome tíi mARN. Mét khi ®· liªn kÕt vµo ®Çu 5’ cña mARN, ribosome
tr−ît däc mARN (gäi lµ qu¸ tr×nh quÐt) theo chiÒu 5’ → 3’ ®Õn khi gÆp m· më ®Çu 5’-
AUG-3’.
C¸c mARN ë eukaryote cßn cã hai ®Æc ®iÓm kh¸c gióp t¨ng c−êng hiÖu suÊt dÞch
m·. §Æc ®iÓm thø nhÊt lµ mét sè mARN lu«n cã mét purine (A hoÆc G) n»m ng−îc dßng
c¸ch m· b¾t ®Çu (AUG) 3 nucleotide vµ mét G n»m ngay sau nã, tøc lµ chóng cã tr×nh tù
5’-G/ANNAUGG-3’. Tr×nh tù nµy ®−îc gäi lµ tr×nh tù Kozak. NhiÒu mARN ë eukaryote
kh«ng cã tr×nh tù nµy, nh−ng bÊt cø khi nµo cã tr×nh tù nµy, hiÖu suÊt dÞch m· cña c¸c
mARN ®−îc t¨ng c−êng. §iÓm ®¸ng chó ý lµ kh¸c víi tr×nh tù Shine-dalgarno, tr×nh tù
Kozak kh«ng t¨ng c−êng dÞch m· qua t−¬ng t¸c víi rARN thuéc tiÓu phÇn nhá cña
ribosome, mµ thay vµo ®ã nã t−¬ng t¸c víi tr×nh tù cña tARNMet khëi ®Çu dÞch m·. Mét
®Æc ®iÓm thø hai gióp t¨ng c−êng hiÖu suÊt dÞch m· ë eukaryote lµ mARN cña chóng
lu«n cã ®u«i polyA ë ®Çu 3’. MÆc dï tr×nh tù polyA c¸ch kh¸ xa ®iÓm khëi ®Çu dÞch m·,
nh−ng nã cã t¸c dông t¨ng c−êng sù t¸i ho¹t ®éng cña ribosome nªn trùc tiÕp lµm t¨ng
hiÖu suÊt dÞch m· (xem h×nh 4.21).

4.3.2.2. tARN dÞch tõng m· bé ba (codon) thµnh axit amin


Nh− ®· nªu ë ch−¬ng 3, mÆc dï cã nhiÒu lo¹i tARN (trªn 300 lo¹i ®· ®−îc ph¸t
hiÖn), nh−ng mçi tARN chØ ®Ýnh kÕt víi mét lo¹i axit amin ®Æc tr−ng duy nhÊt vµ nhËn
biÕt mét hoÆc mét sè m· bé ba nhÊt ®Þnh (trªn mARN, phÇn lín tARN nhËn biÕt ®−îc
nhiÒu h¬n mét m· bé ba). KÝch th−íc cña phÇn lín tARN lµ kho¶ng 75 – 95 nucleotide.
MÆc dï, tr×nh tù chi tiÕt cña c¸c tARN lµ kh¸c nhau, nh−ng chóng ®Òu cã c¸c ®Æc ®iÓm
chung sau:
- C¸c tARN chøa nhiÒu ribonucleotide ®−îc biÕn ®æi sau phiªn m·, ch¼ng h¹n nh−
pseudouridine (Ψ), dihydrouridine (DHU), hypoxanthine, thymine (T),
methylguanine (mG); mÆc dï c¸c baz¬ biÕn ®æi nµy kh«ng cã vai trß thiÕt yÕu
trong ho¹t ®éng cña tARN, nh−ng nÕu thiÕu c¸c baz¬ biÕn ®æi nµy tÕ bµo th−êng
sinh tr−ëng kÐm (riªng hypoxanthine cã vai trß quan träng trong nhËn biÕt m·
bé ba cña mét sè tARN);
- C¸c tARN ®Òu cã cÊu t¹o gåm c¸c ®o¹n tr×nh tù xo¾n kÐp (h×nh thµnh bëi liªn
kÕt hydro gi÷a c¸c phÇn tr×nh tù kh¸c nhau cña ph©n tö) xen kÏ víi c¸c ®o¹n
tr×nh tù m¹ch ®¬n vµ cÊu h×nh ®iÓn h×nh cña chóng gièng mét chiÕc l¸ gåm 4
thïy chÝnh, ®ã lµ c¸c thïy tiÕp nhËn axit amin, thïy Ψ (hay ΨU), thïy D (DHU)
vµ thïy ®èi m·. Ngoµi ra cßn cã mét thïy biÕn ®æi cã kÝch th−íc vµ tr×nh tù
nucleotide kh¸c nhau ë c¸c tARN kh¸c nhau. Cã thÓ m« t¶ ®Æc ®iÓm c¬ b¶n cña
mçi thïy nh− sau (xem h×nh 2.6, ch−¬ng 2):
+ Thïy tiÕp nhËn axit amin ®−îc h×nh thµnh bëi sù kÕt cÆp cña c¸c ®o¹n tr×nh tù ë
hai ®Çu 5’ vµ 3’ cña ph©n tö tARN. TÊt c¶ tARN ®Òu cã tr×nh tù ®Çu 3’ tËn cïng
thuéc thïy tiÕp nhËn axit amin lµ 5’-CCA-3’. §©y chÝnh lµ vÞ trÝ tARN liªn kÕt
víi axit amin trong qu¸ tr×nh dÞch m· (nhê xóc t¸c bëi aminoacyl-tARN
synthetase);
+ Thïy TΨC cã ®Æc ®iÓm ®Æc tr−ng lµ cã mét baz¬ uridine ®−îc biÕn ®æi thµnh Ψ,
vµ baz¬ nµy th−êng ®−îc t×m thÊy trong tr×nh tù 5’-TΨCC-3’.
+ Thïy DHU cã ®Æc ®iÓm ®Æc tr−ng lµ chøa baz¬ dihydrouridine (DHU).

115
§inh §oµn Long

+ Thïy ®èi m· mang m· bé ba ®èi m· (anticodon) t−¬ng øng víi m· bé ba


(codon) trªn ph©n tö mARN. M· bé ba ®èi m· lu«n liÒn kÒ víi mét purine (A
hoÆc G) ë ®Çu 3’ vµ mét uracil (U) ë ®Çu 5’ trªn ph©n tö tARN.
+ Thïy bÊt ®Þnh ë gi÷a thïy ®èi m· vµ thïy TΨC, cã chiÒu dµi tõ 3 ®Õn 21
nucleotide.
tARN khi ®· liªn kÕt víi axit amin ®−îc gäi lµ tARN ®· n¹p axit amin, cßn c¸c
tARN ch−a liªn kÕt víi axit amin ®−îc gäi lµ tARN ch−a n¹p axit amin. Qu¸ tr×nh
“n¹p axit amin” dïng n¨ng l−îng tõ ATP ®Ó h×nh thµnh liªn kÕt acyl gi÷a nhãm –COOH
cña axit amin víi nhãm 2’- hoÆc 3’-OH cña nucleotide A ë tËn cïng ®Çu 3’ cña tARN.
§¸ng chó ý lµ liªn kÕt acyl cña tARN sau khi n¹p axit amin lµ mét liªn kÕt cao n¨ng.
§iÒu nµy rÊt quan träng, bëi n¨ng l−îng tù do gi¶i phãng tõ liªn kÕt cao n¨ng nµy trong
qu¸ tr×nh kÐo dµi chuçi polypepitide chÝnh lµ ®éng lùc h×nh thµnh liªn kÕt peptide gi÷a
c¸c axit amin.
4.3.2.3. Aminoacyl-tARN synthetase n¹p axit amin vµo tARN qua hai b−íc
Chuçi polypeptide
B¶ng 4.3. C¸c nhãm aminoacyl-tARN synthetase
Nhãm II CÊu tróc bËc bèn Nhãm I CÊu tróc bËc bèn
Gly α2β2 Glu α
Ala α4 Gln α
Pro α2 Arg α
Ser α2 Cys α2
Thr α2 Met α2
His α2 Val α
Asp α2 Ile α peptidyl-tARN (1) aminoacyl-tARN
Asn α2 Leu α
Lys α2 Tyr α
Phe α2β2 Trp α
C¸c enzym nhãm I vµ II ph©n biÖt nhau vÒ vÞ trÝ g¾n axit amin vµo
®Çu 3’ cña tARN (xem trong bµi). C¸c enzym nhãm I th−êng chØ gåm
1 chuçi polypeptide, trong khi c¸c enzym nhãm II th−êng lµ d¹ng phøc
kÐp (2 chuçi polypeptide) hoÆc tø phøc (4 chuçi polypeptide).

TÊt c¶ c¸c enzym aminoacyl-tARN


synthetase (tõ ®©y gäi t¾t lµ tARN-synthetase)
®Òu xóc t¸c ph¶n øng g¾n axit amin vµo tARN
qua hai b−íc ph¶n øng enzym (h×nh 4.17). B−íc tARN peptidyl-tARN (2)
thø nhÊt lµ adenylyl hãa axit amin, trong ®ã
H×nh 4.17. Ph¶n øng tæng hîp chuçi
ATP chuyÓn gèc AMP sang axit amin ®ång thêi polypeptide (gäi t¾t lµ ph¶n øng peptide)
gi¶i phãng nhãm ~ (cÇn phÇn biÖt sù
adenylyl hãa víi adenyl hãa lµ sù chuyÓn gèc
baz¬ adenine). Gièng c¸c qu¸ tr×nh tæng hîp ADN vµ ARN, ®éng lùc cña c¸c ph¶n øng
adenylyl hãa lµ sù thñy ph©n nhãm ~ bëi enzym pyrophosphatase. KÕt qu¶ cña ph¶n
øng adenylyl hãa lµ axit amin ®−îc liªn kÕt víi axit adenylic qua liªn kÕt este cao n¨ng
gi÷a gèc –COOH cña axit amin vµ gèc phosphate cña AMP. B−íc thø hai lµ n¹p axit
amin ®· ®−îc adenylyl hãa cho tARN. Trong b−íc nµy, axit amin (ë tr¹ng th¸i liªn

116
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

kÕt víi enzym) ph¶n øng víi tARN. Ph¶n øng nµy dÉn ®Õn viÖc chuyÓn axit amin vµo
®Çu 3’ cña tARN, ®ång thêi gi¶i phãng AMP.
Cã hai nhãm tARN-synthetase (b¶ng 4.3). C¸c enzym nhãm I n¹p c¸c axit amin
vµo ®Çu 2’-OH cña tARN vµ th−êng lµ c¸c protein cã cÊu t¹o mét chuçi polypeptide (gåm
lo¹i α). C¸c enzym nhãm II n¹p c¸c axit amin vµo ®Çu 3’-OH cña tARN vµ th−êng ®−îc
cÊu t¹o tõ 2 hoÆc 4 chuçi polypeptide (gåm 2 lo¹i α vµ β).
Mçi lo¹i tARN-synthetase chØ cã thÓ n¹p mét lo¹i axit amin duy nhÊt; nh−ng nã cã
thÓ n¹p lo¹i axit amin ®ã vµo mét sè tARN kh¸c nhau. §iÒu nµy lµ phï hîp víi tÝnh
“tho¸i hãa cña m· bé ba”, nghÜa lµ phÇn lín axit amin ®−îc m· hãa bëi nhiÒu h¬n mét
m· bé ba (tøc lµ ®−îc vËn chuyÓn bëi nhiÒu h¬n mét tARN). PhÇn lín sinh vËt cã 20 lo¹i
tARN-synthetase t−¬ng øng víi 20 lo¹i axit amin phæ biÕn, nh−ng còng cã c¸c ngo¹i lÖ.
Ch¼ng h¹n, mét sè vi khuÈn thiÕu enzym n¹p axit amin glutamine (Gln) vµo tARN t−¬ng
øng cña nã (tARNGln). ë nh÷ng loµi nµy, chóng sö dông chung mét enzym tARN-
synthetase ®Ó n¹p axit glutamic (Glu) vµo c¶ hai lo¹i tARNGlu vµ tARNGln. Sau ®ã, mét
enzym thø hai chuyÓn hãa Glu → Gln b»ng ph¶n øng amin hãa (g¾n nhãm –NH2). KÕt
qu¶ lµ Glu-tARNGln → Gln-tARNGln. Nh− vËy, sù cã mÆt cña enzym thø hai dÉn ®Õn viÖc
mét lo¹i tARN-synthetase kh«ng cÇn thiÕt n÷a. Tuy nhiªn, ®iÒu ®¸ng chó ý h¬n c¶ lµ
mét tARN-synthetase kh«ng bao giê g¾n nhiÒu h¬n mét lo¹i axit amin vµo cïng mét lo¹i
tARN nhÊt ®Þnh nµo ®ã. §iÒu nµy cã ý nghÜa ®Æc biÖt quan träng ®Ó dÞch m· diÔn ra
chÝnh x¸c. Nã l¹i cµng quan träng h¬n khi nhiÒu thÝ nghiÖm cho thÊy phøc hÖ ribosome
(thµnh phÇn chÝnh cña bé m¸y dÞch m·) kh«ng cã kh¶ n¨ng ph©n biÖt mét tARN cã ®−îc
n¹p ®óng axit amin hay kh«ng. Trong thùc tÕ, tÇn sè n¹p axit amin sai cña mçi lo¹i
enzym tARN-synthetase vµo c¸c tARN t−¬ng øng cña nã thÊp h¬n 10-3.
4.3.2.4. Ribosome lµ thµnh phÇn chÝnh cña bé m¸y dÞch m·
Ribosome ®−îc cÊu t¹o tõ nhiÒu ®¹i ph©n tö vµ cã vai trß ®iÒu khiÓn qu¸ tr×nh tæng
hîp protein. So víi c¸c bé m¸y sao chÐp ADN vµ phiªn m· (tæng hîp ARN), th× ribosome
cã cÊu tróc phøc t¹p vµ lín h¬n nhiÒu. VÒ nguyªn t¾c, sù sao chÐp ADN vµ tæng hîp ARN
cã thÓ diÔn ra bëi ho¹t ®éng xóc t¸c cña mét chuçi polypeptide duy nhÊt (xem ch−¬ng 3).
Ng−îc l¹i, bé m¸y tæng hîp protein ®¬n gi¶n nhÊt còng cã khèi l−îng 2.500 kDa ®−îc cÊu
t¹o tõ 3 ph©n tö ARN (kÝch th−íc vµi ngµn bp) vµ trªn 50 ph©n tö protein kh¸c nhau. VÒ
tèc ®é xóc t¸c ph¶n øng, nÕu c¸c ADN pol cã tèc ®é trïng hîp lµ 200 – 1.000
nucleotide/gi©y, th× ribosome cã tèc ®é lµ 2 – 20 axit amin/gi©y.
ë prokaryote, bé m¸y phiªn m· vµ dÞch m· kh«ng bÞ ng¨n c¸ch bëi mµng nh©n. ThÕ
nªn, ribosome cã thÓ khëi ®Çu dÞch m· ngay khi ®o¹n ®Çu 5’ cña b¶n phiªn m· mARN ®−îc
ARN pol ®Èy khái phøc hÖ phiªn m·. NghÜa lµ, sù phiªn m· vµ dÞch m· cã thÓ diÔn ra ®ång
thêi. §iÓm ®¸ng chó ý lµ kh¶ n¨ng phiªn m· vµ dÞch m· ®ång thêi ®· ®−îc vi khuÈn “khai
th¸c” lµm c¬ chÕ ®iÒu hßa biÓu hiÖn cña nhiÒu gen (vÝ dô: m« h×nh operon Trp, xem ch−¬ng
5). Kh¶ n¨ng phiªn m· vµ dÞch m· ®ång thêi còng ph¶n ¸nh qua sù t−¬ng quan vÒ tèc ®é
dÞch m· vµ phiªn m·. NÕu nh− c¸c ribosome cña prokaryote cã tèc ®é tæng hîp protein
kho¶ng 20 axit amin / gi©y (t−¬ng øng víi dÞch m· 60 nucleotide / gi©y), th× tèc ®é tæng hîp
mARN cña ARN pol ë vi khuÈn vµo kho¶ng 50 – 100 nucleotide / gi©y.
ë eukaryote, sù phiªn m· vµ dÞch m· bÞ mµng nh©n ng¨n c¸ch. NÕu nh− phiªn m·
x¶y ra trong nh©n, th× dÞch m· x¶y ra trong tÕ bµo chÊt. Cã lÏ, do phiªn m· vµ dÞch m·
kh«ng diÔn ra ®ång thêi, nªn kh«ng cã sù t−¬ng quan vÒ tèc ®é phiªn m· vµ dÞch m· ë
eukaryote; tèc ®é dÞch m· ë eukaryote lµ chËm h¬n (2 - 4 axit amin / gi©y).

117
§inh §oµn Long

VÒ cÊu tróc, ribosome ë tÊt


B¶ng 4.4. Thµnh phÇn cÊu t¹o cña c¸c ribosome
c¶ c¸c giíi sinh vËt (prokaryote,
eukaryote vµ archaea), dï ho¹t VÞ trÝ ho¹t ®éng cña ribosome C¸c tiÓu Lo¹i rARN

®éng trong tÕ bµo chÊt hay trong phÇn protein
c¸c bµo quan, ®Òu ®−îc cÊu t¹o TÕ bµo chÊt ®éng vËt 40S 18S 33
60S 28S - 5,8S - 5S 49
gåm hai tiÓu phÇn (gäi lµ tiÓu
28S 12S 31
phÇn lín vµ tiÓu phÇn nhá). TiÓu Ti thÓ ®éng vËt 39S 16S 48
phÇn lín mang vïng xóc t¸c h×nh 40S 18 ~35
thµnh liªn kÕt peptide, gäi lµ TÕ bµo chÊt thùc vËt 60S 28S - 5,8S - 5S ~50
trung t©m peptidyl Ti thÓ thùc vËt 30S 18S > 25
transferase. TiÓu phÇn nhá 50S 26S - 5S > 30
30S 16S 22-31
mang vïng cã vai trß ®èi chiÕu bé L¹p thÓ thùc vËt
50S 23S - 5S - 4,5S 32-36
ba ®èi m· cña tARN (®· n¹p axit 30S 16S 21
amin) víi m· bé ba trªn mARN Vi khuÈn (prokaryote) 50S 23S - 5S 31
nªn ®−îc gäi lµ trung t©m gi¶i 30S 16S 26-27
Vi khuÈn cùc ®oan (archaea)
m·. C¶ tiÓu phÇn lín vµ tiÓu 50S 23S - 5S 30-31
phÇn nhá, còng nh− c¸c rARN
cÊu t¹o nªn chóng ®−îc ph©n biÖt vµ gäi tªn dùa trªn hÖ sè l¾ng trong li t©m vµ ®−îc ®äc
lµ S (Svedberg). Ribosome cña prokaryote cã hÖ sè l¾ng lµ 70S ®−îc cÊu t¹o tõ mét tiÓu
phÇn lín 50S vµ mét tiÓu phÇn nhá 30S (hÖ sè l¾ng S kh«ng chØ phô thuéc vµo khèi
l−îng, mµ cßn phô thuéc vµo kÝch th−íc, h×nh d¹ng... ; nªn hÖ sè l¾ng cña mét phøc hÖ
th−êng kh«ng b»ng tæng hÖ sè l¾ng thµnh phÇn). Ribosome cña eukaryote cã hÖ sè l¾ng
80S, ®−îc cÊu t¹o tõ mét tiÓu phÇn lín 60S vµ mét tiÓu phÇn nhá 40S. B¶ng 4.4 nªu
thµnh phÇn cÊu tróc cña ribosome ë c¸c hÖ gen thuéc c¸c giíi sinh vËt kh¸c nhau.
Trong qu¸ tr×nh dÞch m·, mÆc dï vµo mçi thêi ®iÓm mét ribosome chØ tæng hîp ®−îc
mét chuçi polypeptide, nh−ng mçi mARN l¹i cã thÓ ®−îc dÞch m· ®ång thêi bëi nhiÒu
ribosome kh¸c nhau. Khi mét mARN ®ang ®−îc dÞch m· ®ång thêi bëi nhiÒu ribosome th×
®−îc gäi lµ polysome (hay polyribosome). Do cã kÝch th−íc lín, mét ribosome khi dÞch
m· bao phñ mét ®o¹n tr×nh tù kho¶ng 30 nucleotide trªn mARN. Trong cÊu tróc
polysome, cø hai ribosome liÒn kÒ trªn mARN c¸ch nhau kho¶ng 80 nucleotide. Kh¶
n¨ng nhiÒu ribosome cã thÓ ®ång thêi dÞch m· mét mARN gióp gi¶i thÝch t¹i sao tÕ bµo
b×nh th−êng chØ cÇn mét l−îng nhá mARN (chØ chiÕm 1 - 5% tæng l−îng ARN). NÕu sù
dÞch m· chØ dïng mét ribosome cho mçi mARN, th× chØ cã kho¶ng d−íi 10% sè ribosome
®−îc “khai th¸c” t¹i mét thêi ®iÓm. Do thùc tÕ mét mARN th−êng ®−îc dÞch m· ®ång thêi
bëi nhiÒu ribosome, nªn trong tÕ bµo hÇu hÕt ribosome lu«n ®−îc dïng ®Ó dÞch m·.
Trong cÊu tróc vµ ho¹t ®éng cña ribosome, mét trong nh÷ng ph¸t hiÖn quan träng
gÇn ®©y lµ viÖc lµm s¸ng tá vai trß cña c¸c rARN. Trong ®ã, c¸c rARN kh«ng chØ cã vai
trß cÊu tróc vµ nhËn biÕt mARN, mµ chóng trùc tiÕp cã vai trß xóc t¸c ph¶n øng h×nh
thµnh liªn kÕt peptide trong qu¸ tr×nh tæng hîp protein. C¸c nghiªn cøu ë cÊp ph©n tö ®·
x¸c nhËn r»ng toµn bé trung t©m xóc t¸c cña ribosome (cßn gäi lµ trung t©m peptidyl
transferase) ®−îc cÊu t¹o gåm rARN hoÆc bëi phÇn lín lµ c¸c rARN. C¸c protein
ribosome chñ yÕu cã vai trß cÊu tróc vµ gióp duy tr× tÝnh æn ®Þnh cña ribosome.
§Ó xóc t¸c ph¶n øng h×nh thµnh liªn kÕt peptide, mçi ribosome ph¶i ®ång thêi cã Ýt
nhÊt hai vÞ trÝ liªn kÕt tARN. Trong thùc tÕ, mçi ribosome cã ba vÞ trÝ liªn kÕt tARN,
®−îc gäi lµ c¸c vÞ trÝ A, P vµ E (h×nh 4.18). VÞ trÝ A lµ n¬i ®Ýnh kÕt víi tARN ®· n¹p axit
amin; vÞ trÝ P lµ n¬i ®Ýnh kÕt víi tARN mang axit amin ®· liªn kÕt vµo chuçi polypeptide
®ang tæng hîp (peptidyl-tARN); vÞ trÝ E lµ n¬i tARN gi¶i phãng khái chuçi polypeptide
vµ ribosome. Mçi vÞ trÝ liªn kÕt cña tARN ®Òu n»m trªn vïng gi¸p nèi (gèi nhau) gi÷a

118
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn
fMet
tiÓu phÇn lín vµ tiÓu phÇn nhá cña ribosome. Nhê vËy, f
tARN cã thÓ ®ång thêi tiÕp cËn ®−îc “trung t©m TiÓu phÇn lín
peptidyl transferase” cña tiÓu phÇn lín, võa tiÕp cËn fMet-tARNifMet

®−îc “trung t©m gi¶i m·” cña tiÓu phÇn nhá. Trong khi E P A
thïy mang axit amin (®Çu 3’) cña tARN ®Ýnh vµo tiÓu
phÇn lín, th× thïy ®èi m· cña nã ®Ýnh vµo tiÓu phÇn
nhá.
TiÓu phÇn nhá
§Ó tiÕn hµnh dÞch m·, cÊu h×nh phÇn tö cña mARN
ribosome h×nh thµnh nhiÒu ®−êng dÉn nhá ra vµ vµo.
Ph©n tö mARN ®i vµo vµ ra khái “trung t©m gi¶i m·”
f
qua mét khe dÉn hÑp chØ võa ®ñ réng cho mét ph©n tö
ARN d¹ng m¹ch ®¬n chui qua. §iÒu nµy ®¶m b¶o cho
viÖc dÞch m· diÔn ra khi c¸c mèi t−¬ng t¸c néi ph©n tö
gi÷a c¸c ribonucleotide kh«ng thÓ h×nh thµnh. ë gi÷a P A
khe dÉn hÑp ®ã lµ vïng tiÕp xóc tARN. §iÒu ®¸ng chó 5’ 3’

ý lµ kÝch th−íc vïng nµy võa ®ñ chç cho ®óng hai m·


bé ba (t−¬ng øng víi m· bé ba ®èi m· cña hai tARN)
liªn kÕt vµo, ®¶m b¶o m· di truyÒn ®−îc ®äc theo ®óng f
m· bé ba. TiÓu phÇn lín cña ribosome cã mét khe dÉn
thø hai lµ ®−êng dÉn ra cña chuçi polypeptide míi E P A

tæng hîp. Còng gièng nh− khe dÉn mARN ë tiÓu phÇn
nhá, khe dÉn chuçi polypeptide ë tiÓu phÇn lín chØ võa
5’ 3’
®ñ réng ®Ó chuçi polypeptide ®i ra vµ h¹n chÕ sù t−¬ng
t¸c gi÷a c¸c axit amin trong ph©n tö protein. Trong H×nh 4.18. C¸c thµnh phÇn vµ sù
kiÖn khëi ®Çu dÞch m. Ribosome cã
ribosome, c¸c chuçi polypeptide chØ h×nh thµnh ®−îc 3 vÞ trÝ liªn kÕt tARN lµ A, P vµ E. Vïng
cÊu tróc bËc hai d¹ng xo¾n α, chø kh«ng h×nh thµnh liªn kÕt trïm qua c¶ hai tiÓu phÇn. Sù
khëi ®Çu dÞch m· ®−îc thùc hiÖn bëi
®−îc d¹ng mÆt ph¼ng β hay c¸c cÊu tróc bËc cao h¬n. mét tARN ®Æc biÖt (tARNi); kh¸c víi
V× vËy, cÊu h×nh cña protein ë d¹ng ho¹t ®éng chøc c¸c tARN kh¸c, nã ®−îc vËn chuyÓn
th¼ng vµo vÞ trÝ P. TiÓu phÇn lín ®−îc
n¨ng chØ h×nh thµnh sau khi chóng rêi ribosome. l¾p r¸p vµo phøc hÖ sau khi mARN vµ
tARNi ®· liªn kÕt vµo tiÓu phÇn nhá.
Còng gièng nh− sù sao chÐp ADN vµ phiªn m·,
qu¸ tr×nh dÞch m· diÔn ra qua nhiÒu b−íc vµ ®−îc chia
lµm ba giai ®o¹n chÝnh: sù khëi ®Çu, kÐo dµi vµ kÕt thóc dÞch m·.

4.3.3. C¸c b−íc cña qu¸ tr×nh dÞch m·

4.3.3.1. Khëi ®Çu dÞch m·


§Ó viÖc khëi ®Çu dÞch m· thµnh c«ng, cÇn cã ba sù kiÖn: ribosome ®−îc huy ®éng
®Õn mARN, tARN ®· n¹p axit amin ®−îc ®Æt vµo vÞ trÝ P cña ribosome vµ ribosome ®Þnh
vÞ chÝnh x¸c trªn m· b¾t ®Çu (AUG). Trong ®ã, viÖc ribosome ®Þnh vÞ chÝnh x¸c trªn bé ba
m· b¾t ®Çu cã ý nghÜa quyÕt ®Þnh, bëi v× nã x¸c ®Þnh khung ®äc më (ORF) cña toµn bé
mARN. ChØ cÇn lÖch mét nucleotide còng ®ñ dÉn ®Õn viÖc tæng hîp nªn mét chuçi
polypeptide hoµn toµn kh«ng liªn quan g× ®Õn chuçi polypeptide b×nh th−êng. Sù khëi
®Çu dÞch m· ë prokaryote vµ eukaryote cã nh÷ng ®Æc ®iÓm kh¸c nhau. Chóng ta sÏ ®Ò
cËp ®Õn c¸c sù kiÖn diÔn ra ë prokaryote, sau ®ã nªu c¸c kh¸c biÖt ë eukaryote.

119
§inh §oµn Long

a) Sù khëi ®Çu dÞch m· ë prokaryote


Trong dÞch m· ë vi khuÈn, tr−íc tiªn tiÓu phÇn nhá cña ribosome ®−îc "huy ®éng"
®Õn mARN, th«ng qua t−¬ng t¸c Chargaff gi÷a tr×nh tù trªn rARN 16S víi tr×nh tù trªn
ph©n tö mARN t¹i vÞ trÝ liªn kÕt ribosome (kÝ hiÖu lµ RBS). Ribosome th−êng ®−îc l¾p
r¸p vµo vÞ trÝ RBS sao cho vÞ trÝ P cña nã t−¬ng øng víi m· b¾t ®Çu. Trong qu¸ tr×nh dÞch
m·, th−êng th× mét tARN ®· n¹p axit amin sÏ ®i vµo ribosome t¹i vÞ trÝ A vµ chØ chuyÓn
sang vÞ trÝ P sau khi mét ph¶n øng h×nh thµnh liªn kÕt peptide diÔn ra. Tuy nhiªn, ë
b−íc khëi ®Çu dÞch m·, mét tARN ®Æc biÖt, gäi lµ tARN khëi ®Çu (kÝ hiÖu lµ tARNi), cã
thÓ ®i "th¼ng" vµo vÞ trÝ P cña ribosome. Bé ba ®èi m· cña tARNi kÕt cÆp víi c¸c m· më
®Çu AUG hoÆc GUG. Hai m· bé ba AUG vµ GUG mang nghÜa kh¸c nhau khi xuÊt hiÖn
bªn trong mét ORF. Trong ®ã, AUG ®−îc tARN dÞch m· cho Met (tARNMet) cßn GUG
®−îc dÞch m· cho Val (tARNVal). Tuy nhiªn, ë ®iÓm khëi ®Çu dÞch m· c¶ hai axit amin nµy
®Òu kh«ng bao giê ®−îc n¹p vµo tARNi; thay vµo ®ã lµ mét dÉn xuÊt cña Met lµ N-formyl
methionine (kÝ hiÖu lµ fMet, cã nhãm formyl ®−îc g¾n "thªm" vµo nhãm amino cña
methionine). tARNi sau khi n¹p axit amin fMet ®−îc viÕt lµ fMet-tARNifMet.
Nh− vËy, fMet lu«n lµ axit amin ®Çu tiªn cña mét chuçi polypeptide ®−îc tæng hîp
ë prokaryote. Tõ ®ã, cã thÓ chóng ta nghÜ r»ng mäi protein ë vi khuÈn lu«n cã ®Çu N lµ
fMet. Nh−ng, trong thùc tÕ kh«ng ph¶i vËy. Cã mét enzym lo¹i nhãm formyl lµ
deformylase sÏ lo¹i bá nhãm formyl khái ®Çu N trong qu¸ tr×nh chuçi polypeptide ®·
hoÆc ®ang ®−îc tæng hîp. Ngoµi ra, nhiÒu protein ë vi khuÈn kh«ng cã ®Çu N tËn cïng lµ
Met, ®ã lµ do c¸c enzym aminopeptidase th−êng lo¹i bá axit amin nµy hoÆc mét vµi
axit amin ë ®Çu N tËn cïng cña chuçi polypeptide trong qu¸ tr×nh hoµn thiÖn protein.
Sù khëi ®Çu dÞch m· ë prokaryote ngoµi viÖc ®−îc b¾t ®Çu b»ng liªn kÕt cña tiÓu
phÇn nhá ribosome vµo vÞ trÞ RBS trªn mARN, cßn cã sù tham gia cña ba yÕu tè khëi ®Çu
dÞch m· kÝ hiÖu lµ IF1, IF2 vµ IF3.
- IF1 ng¨n kh«ng cho tARN liªn kÕt vµo tiÓu phÇn nhá t¹i vÞ trÝ A cña ribosome.
- IF2 thùc chÊt lµ mét GTPase (enzym thñy ph©n GTP). IF2 t−¬ng t¸c víi 3 thµnh
phÇn quan träng cña bé m¸y khëi ®Çu dÞch m·, gåm tiÓu phÇn nhá cña ribosome,
yÕu tè IF1 vµ fMet-tARNifMet. Khi t−¬ng t¸c víi c¸c yÕu tè nµy, IF2 thóc ®Èy sù
®Ýnh kÕt gi÷a fMet-tARNifMet víi tiÓu phÇn nhá cña ribosome, ®ång thêi ng¨n c¶n
c¸c tARN kh¸c ®Ýnh kÕt vµo tiÓu phÇn nhá.
- IF3 ®Ýnh kÕt vµo tiÓu phÇn nhá vµ ng¨n c¶n nã liªn kÕt trë l¹i víi tiÓu phÇn lín
hoÆc liªn kÕt víi tARN. V× sù khëi ®Çu dÞch m· cÇn tiÓu phÇn nhá ribosome ë
tr¹ng th¸i "tù do" (kh«ng liªn kÕt víi tiÓu phÇn lín) nªn IF3 lµ thiÕt yÕu cho sù
khëi ®Çu mét chu kú dÞch m· míi.
C¸c yÕu tè khëi ®Çu dÞch m· liªn kÕt t¹i c¸c vÞ trÝ A,
P vµ E ®Ó thùc hiÖn c¸c chøc n¨ng cña chóng. Víi vai trß TiÓu phÇn
ribosome 30S
ng¨n c¶n sù liªn kÕt cña c¸c tARN vµo vÞ trÝ A, IF1 liªn
kÕt vµo tiÓu phÇn nhá ribosome t¹i vïng t−¬ng øng víi vÞ P A
trÝ A. IF2 võa liªn kÕt vµo IF1 võa phñ nªn vïng t−¬ng IF3
øng víi vÞ trÝ P lµ n¬i nã t−¬ng t¸c víi fMet-tARNifMet. E IF2

Cuèi cïng, IF3 liªn kÕt vµo vïng t−¬ng øng víi vÞ trÝ E. IF1
Nh− vËy, ë giai ®o¹n khëi ®Çu dÞch m·, khi c¸c yÕu tè
IF1, IF2 vµ IF3 ®· liªn kÕt víi tiÓu phÇn nhá ribosome,
chØ cßn mét chç duy nhÊt t−¬ng øng víi vÞ trÝ P lµ cßn VÞ trÝ rçng cho
liªn kÕt tARNifMet
rçng (h×nh 4.19).
H×nh 4.19. M« h×nh liªn kÕt cña c¸c
Khi ®· cã sù liªn kÕt cña c¸c yÕu tè IF1, IF2 vµ IF3, yÕu tè khëi ®Çu dÞch m (IF) vµo tiÓu
tiÓu phÇn nhá ë d¹ng s½n sµng liªn kÕt víi mARN vµ phÇn ribosome 30S.

120
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

fMet-tARNiMet. Cô thÓ, hai lo¹i ARN lóc nµy cã thÓ liªn kÕt vµo tiÓu phÇn nhá theo trËt
tù bÊt kú. Trong ®ã, sù liªn kÕt cña mARN phô thuéc vµo t−¬ng t¸c gi÷a rARN 16S vµ vÞ
trÝ RBS, cßn sù liªn kÕt cña fMet-tARNiMet vµo vÞ trÝ P phô thuéc vµo t−¬ng t¸c cña IF2
(lóc nµy ë d¹ng phøc IF2/GTP) vµ kÕt cÆp gi÷a bé ba ®èi m· cña tARN vµ m· b¾t ®Çu cña
mARN. Khi tiÓu phÇn nhá ribosome ®· liªn kÕt víi mARN vµ ®· cã fMet-tARNiMet t¹i vÞ
trÝ P, nã biÕn ®æi cÊu h×nh dÉn ®Õn gi¶i phãng yÕu tè IF3. Lóc nµy, tiÓu phÇn lín
ribosome liªn kÕt ®−îc víi tiÓu phÇn nhá ®Ó h×nh thµnh nªn ribosome 70S hoµn chØnh.
Sù liªn kÕt cña tiÓu phÇn lín vµo tiÓu phÇn nhá thóc ®Èy ho¹t tÝnh GTPase cña phøc hÖ
IF2/GTP dÉn ®Õn thñy ph©n GTP → GDP. Sù thñy ph©n nµy lµm phøc hÖ IF2/GDP gi¶m
¸i lùc víi ribosome còng nh− víi fMet-tARNiMet lµm cho c¶ IF2/GDP vµ IF1 ®Òu gi¶i
phãng khái ribosome. Nh− vËy, kÕt qu¶ cuèi cïng khi h×nh thµnh ribosome 70S, lµ t¹i vÞ
trÝ m· b¾t ®Çu cña mARN t−¬ng øng vÞ trÝ P cña ribosome sÏ cã fMet-tARNiMet, cßn t¹i vÞ
trÝ A th× rçng. Phøc hÖ ribosome-mARN lóc nµy s½n sµng tiÕp nhËn tARN vµo vÞ trÝ A vµ
s½n sµng cho ph¶n øng kÐo dµi chuçi polypeptide.
b) Sù khëi ®Çu dÞch m· ë eukaryote
VÒ nhiÒu ph−¬ng diÖn, sù khëi ®Çu dÞch m· ë eukaryote gièng víi ë prokaryote.
Ch¼ng h¹n, c¶ hai giíi sinh vËt ®Òu dïng chung m· b¾t ®Çu (AUG) vµ cã tARN chuyªn
hãa cho sù khëi ®Çu dÞch m·; bé m¸y dÞch m· cña chóng ®Òu cã c¸c yÕu tè khëi ®Çu dÞch
m· vµ l¾p r¸p tiÓu phÇn nhá ribosome
vµo mARN tr−íc khi liªn kÕt víi tiÓu a) Sù l¾p r¸p trªn ribosome b) Sù l¾p r¸p ®Çu 5’ cña mARN
phÇn lín ®Ó h×nh thµnh ribosome hoµn Ribosome
chØnh. Nh−ng, eukaryote cã c¬ chÕ nhËn E P A mARN
biÕt mARN vµ m· b¾t ®Çu kh¸c víi §Çu 5'
M· b¾t ®Çu
prokaryote (h×nh 4.20). eIF4F (AUG)
eIF4A eIF4B
ë eukaryote, tiÓu phÇn nhá cña
eIF3
ribosome lu«n liªn kÕt víi tARNi
(tARNiMet) tr−íc khi nã ®−îc huy ®éng
3 4A
tíi liªn kÕt vµo ®Çu 5’ cña mARN. Sau
E P A
®ã, nã tr−ît däc mARN theo chiÒu 5’ →
3’ cho ®Õn khi gÆp m· 5’-AUG-3’ ®Çu eIF5b/GTP
tiªn (xem thªm vÒ tr×nh tù Kozak nªu ë
trªn); vµ trong phÇn lín (nh−ng kh«ng eIF2/GTP
ph¶i tÊt c¶) tr−êng hîp, nã nhËn biÕt bé
ba nµy lµ m· b¾t ®Çu dÞch m·. Ph−¬ng Met-tARNiMet
ph¸p nhËn biÕt ®iÓm khëi ®Çu dÞch m· 2
nµy phï hîp víi ®Æc ®iÓm ë eukaryote
5b
lµ hÇu hÕt mARN thuéc lo¹i ®¬n cistron 3 4A
Phøc hÖ khëi
vµ th−êng chØ m· hãa mét chuçi ®Çu dÞch m· 43S
polypeptide duy nhÊt. Sù khëi ®Çu dÞch
m· ë eukaryote còng ®ßi hái nhiÒu yÕu
tè khëi ®Çu dÞch m· cã chøc n¨ng t−¬ng
tù nh− IF1, IF2 vµ IF3 ë vi khuÈn; song
sè l−îng cña chóng th−êng nhiÒu h¬n.
ë eukaryote, th−êng cã trªn 30 chuçi 3 4A
polypeptide kh¸c nhau ®ång thêi liªn
quan ®Õn sù khëi ®Çu dÞch m·. Khi
ribosome ë eukaryote hoµn thµnh mét H×nh 4.20. L¾p r¸p tiÓu phÇn nhá ribosome vµ tARNi vµo
chu tr×nh kú dÞch m·, nã ph©n t¸ch mARN trong khëi ®Çu dÞch m ë eukaryote. L−u ý: yÕu tè
eIF4F gåm 3 protein: eIF4A, eIF4E vµ eIF4G. eIF4E trùc tiÕp liªn kÕt
thµnh tiÓu phÇn lín vµ nhá nhê ho¹t vµo mò m7G (®Çu 5'), "cét" hai protein cßn l¹i vµo phÇn sau cña
®éng cña hai yÕu tè eIF3 vµ eIF1A. Hai mARN (theo Watson, 2004).

121
§inh §oµn Long

yÕu tè nµy cã chøc n¨ng t−¬ng ®−¬ng víi IF3 vµ IF1 ë vi khuÈn (kÝ hiÖu e cã nghÜa lµ
eukaryote). §Ó thóc ®Èy sù l¾p r¸p cña tARNi vµo vÞ trÝ P cña tiÓu phÇn nhá cña
ribosome, cã hai yÕu tè eIF2 vµ eIF5B lµ hai protein liªn kÕt GTP (chøc n¨ng t−¬ng
®−¬ng víi IF2 ë vi khuÈn). ë eukaryote, tARNi ®−îc "n¹p" Met ®Ó h×nh thµnh phøc hÖ
Met-tARNiMet chø kh«ng ph¶i fMet nh− ë vi khuÈn. §Çu tiªn, phøc hÖ eIF5B/GTP qua
t−¬ng t¸c víi eIF1A liªn kÕt vµo tiÓu phÇn nhá cña ribosome, råi sau ®ã nã huy ®éng c¸c
phøc hÖ eIF2/GTP vµ Met-tARNiMet liªn kÕt vµo vÞ trÝ P cña tiÓu phÇn nhá ribosome. Lóc
nµy, phøc hÖ khëi ®Çu dÞch m· ë eukaryote cã hÖ sè l¾ng 43S ®−îc gäi lµ phøc hÖ tiÒn
khëi ®Çu dÞch m· 43S. Phøc hÖ 43S nµy nhËn ra mò m7G cña mARN nhê yÕu tè khëi
®Çu dÞch m· cã tªn lµ eIF4F. eIF4F lµ mét protein cã 3 chuçi polypeotide; trong ®ã, mét
chuçi polypeptide (eIF4E) trùc tiÕp ®Ýnh kÕt vµo mò ®Çu 5’ cña mARN, hai chuçi
polypeptide cßn l¹i (eIF4A vµ G) liªn kÕt kh«ng ®Æc hiÖu vµo mARN (mét trong hai chuçi
nµy cã ho¹t tÝnh ARN helicase, tøc lµ t¸ch m¹ch ®«i ARN). Phøc hÖ nµy sau ®ã liªn kÕt
víi yÕu tè eIF4B lµ yÕu tè ho¹t hãa ho¹t tÝnh ARN helicase cña eIF4F. Ho¹t ®éng cña
ARN helicase gióp "lo¹i bá" c¸c cÊu tróc bËc hai (vÝ dô d¹ng "cÆp tãc") nÕu cã cña mARN
ë phÇn ®Çu 5’. Nhê sù duçi "th¼ng" cña mARN ë phÇn ®Çu 5’ mµ tiÓu phÇn nhá cña
ribosome cã thÓ liªn kÕt vµo. Sù liªn kÕt x¶y ra do ¸i lùc liªn kÕt gi÷a hai yÕu tè eIF4F
(cã trong phøc hÖ víi mARN) vµ eIF3 (cã trong phøc hÖ khëi ®Çu dÞch m· 43S).
Khi ®· liªn kÕt vµo ®Çu 5’ cña mARN, tiÓu phÇn nhá cña ribosome tr−ît däc mARN
theo chiÒu 5’ → 3’ nhê ho¹t tÝnh ARN helicase cña eIF4F vµ sö dông n¨ng l−îng tõ ATP.
Trong qu¸ tr×nh dÞch chuyÓn, tiÓu phÇn nhá cña ribosome "quÐt" tr×nh tù mARN ®Ó t×m
m· b¾t ®Çu (AUG). M· b¾t ®Çu nµy ®−îc t×m thÊy nhê bé ba ®èi m· cña tARNiMet lóc nµy
®· liªn kÕt vµo phøc hÖ khëi ®Çu dÞch m·. §©y chÝnh lµ lý do t¹i sao ë eukaryote, sù khëi
®Çu dÞch m· cÇn sù ®Ýnh kÕt cña tARNi vµo ribosome tr−íc khi liªn kÕt vµo mARN. Khi
sù kÕt cÆp gi÷a bé ba ®èi m· ë tARNi vµ m· b¾t ®Çu cña mARN ®· ®−îc "x¸c nhËn", phøc
hÖ khëi ®Çu dÞch m· gi¶i phãng eIF2 vµ eIF3. Do mÊt eIF3 (cã vai trß ng¨n c¶n liªn kÕt
gi÷a 2 tiÓu phÇn cña ribosome) vµ eIF2 (yÕu tè liªn kÕt víi tARNi) nªn lóc nµy tiÓu phÇn
lín cña ribosome liªn kÕt ®−îc vµo tiÓu phÇn nhá vµ h×nh thµnh nªn ribosome hoµn
chØnh. Còng gièng ë prokaryote, khi tiÓu phÇn lín liªn kÕt vµo tiÓu phÇn nhá, chóng thóc
®Èy ho¹t tÝnh GTPase cña phøc hÖ eIF5B/GTP (t−¬ng tù IF2 ë vi khuÈn) dÉn ®Õn sù thñy
ph©n GTP → GDP vµ gi¶i phãng c¸c yÕu tè khëi ®Çu dÞch m· cßn l¹i. KÕt qu¶ cña nh÷ng
sù kiÖn nµy lµ Met-tARNiMet liªn kÕt vµo vÞ trÝ P cña ribosome (t−¬ng øng víi vÞ trÝ m·
b¾t ®Çu cña mARN) vµ h×nh thµnh nªn phøc hÖ khëi ®Çu dÞch m· 80S. Lóc nµy,
ribosome s½n sµng cho viÖc tiÕp nhËn C¸c tiÓu phÇn
ribosome
c¸c tARN ®· n¹p axit amin vµo vÞ trÝ §u «
i po
ly A

A cña ribosome vµ thùc hiÖn ph¶n


øng kÐo dµi chuçi polypeptide.
PABP Mò m G 7 eIF4F
M· AUG
Mét ®iÓm ®Æc biÖt trong dÞch m·
ë eukaryote lµ c¸c yÕu tè khëi ®Çu
dÞch m· kh«ng chØ t−¬ng t¸c víi phÇn
®Çu 5’ cña mARN, mµ chóng cßn mARN

t−¬ng t¸c víi phÇn ®u«i polyA ë ®Çu


3’ (cÇu liªn kÕt 5’ – 3’) lµm mARN
trong dÞch m· cã d¹ng vßng trßn
(h×nh 4.21). Sù t−¬ng t¸c nµy x¶y ra
gi÷a yÕu tè eIF4F vµ protein liªn
kÕt ®u«i polyA (PABP). ChÝnh v× Protein

cÊu tróc mARN ë eukaryote trong H×nh 4.21. M« h×nh dÞch m mARN kiÓu “vßng trßn”
dÞch m· cã d¹ng vßng trßn, nªn ®u«i ë eukaryote. Vßng trßn ®−îc h×nh thµnh qua mèi t−¬ng t¸c
polyA mÆc dï ë xa l¹i cã ¶nh h−ëng gi÷a eIF4G (cña eIF4F) vµ protein liªn kÕt ®u«i polyA (PABP).

122
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

trùc tiÕp ®Õn sù khëi ®Çu dÞch m·. T¸c ®éng nµy lµ do phÇn lín c¸c ribosome võa ®−îc
gi¶i phãng khi dÞch m· kÕt thóc sÏ cã xu h−íng ®−îc dïng l¹i ngay cho mét chu kú dÞch
m· míi cña chÝnh mARN ®ã.
Ngoµi ®Æc ®iÓm khëi ®Çu dÞch m· phæ biÕn nªu trªn, mét sè Ýt gen ë eukaryote mang
tr×nh tù liªn kÕt ribosome s©u trong ph©n tö mARN (th−êng ë vïng 5’UTR), gäi lµ lµ vÞ trÝ
®i vµo cña ribosome (kÝ hiÖu IRES). C¸c gen cã IRES ®−îc t×m thÊy ®Çu tiªn ë mét sè
virut picorna vµ rhino; sau nµy, ®−îc t×m thÊy ë mét sè loµi eukaryote. Chóng th−êng liªn
quan ®Õn c¸c gen ®−îc biÓu hiÖn m¹nh trong ®iÒu kiÖn sèc nhiÖt hoÆc khi tÕ bµo thiÕu
n¨ng l−îng. Lóc nµy, c¸c c¬ chÕ khëi ®Çu dÞch m· th«ng th−êng (kiÓu "quÐt" cña ribosome)
kh«ng ho¹t ®éng ®−îc. ViÖc c¸c gen sö dông IRES ë gãc ®é nµo ®ã gièng nh− tÕ bµo vi
khuÈn sö dông tr×nh tù Shine-dalgarno, gióp tÕ bµo cã mét c¬ chÕ "dù phßng" cho phÐp c¸c
gen thiÕt yÕu ®−îc biÓu hiÖn trong ®iÒu kiÖn m«i tr−êng kh¾c nghiÖt.
4.3.3.2. Ph¶n øng kÐo dµi chuçi polypeptide Chuçi polypeptide
Khi ribosome ®· l¾p r¸p ®óng tARNi (®· n¹p Trung t©m liªn kÕt
axit amin) vµo vÞ trÝ P, nã cã thÓ b¾t ®Çu tæng hîp c¸c yÕu tè dÞch m·

protein. Cã ba sù kiÖn cÇn x¶y ra nh»m ®¶m b¶o sù


bæ sung ®óng lo¹i axit amin vµo chuçi polypeptide.
A
Thø nhÊt lµ cÇn l¾p r¸p ®óng lo¹i aminoacyl-tARN E P
vµ vÞ trÝ A cña ribosome t−¬ng øng víi m· bé ba trªn
mARN. Thø hai lµ liªn kÕt peotide cÇn ®−îc h×nh
thµnh gi÷a aminoacyl-tARN (ë vÞ trÝ A) vµ chuçi 5' 3'

peptide ®ang kÐo dµi cã ®Çu C ®ang ®Ýnh vµo EF-Tu/GTP


peptidyl-tARN (ë vÞ trÝ P). Lóc nµy ho¹t tÝnh
peptidyl transferase (do rARN cña tiÓu phÇn lín) sÏ
tiÕn hµnh chuyÓn chuçi polypeptide ®ang kÐo dµi tõ aa

peptidyl-tARN ë vÞ trÝ P sang aminoacyl-tARN ë vÞ


trÝ A. Thø ba lµ peptidyl-tARN ë vÞ trÝ A võa h×nh
aminoacyl-tARN
thµnh sÏ dÞch chuyÓn ®óng 3 nucleotide sang vÞ trÝ P,
®Ó ribosome b¾t ®Çu l¹i mét chu kú nhËn diÖn mét
m· bé ba vµ tæng hîp liªn kÕt peptide míi. §Ó tÊt c¶
c¸c sù kiÖn trªn diÔn ra chÝnh x¸c, cã hai yÕu tè ®−îc aa
gäi lµ c¸c yÕu tè kÐo dµi dÞch m·, gåm EF-Tu vµ EF- E P A
G, ®iÒu khiÓn c¸c sù kiÖn nµy. C¶ hai yÕu tè nµy ®Òu
dïng n¨ng l−îng tõ GTP.
5' 3'
Kh«ng gièng khëi ®Çu dÞch m·, ph¶n øng kÐo
dµi chuçi polypeptide ë eukaryote vµ prokaryote lµ
EF-Tu/GDP
rÊt gièng nhau c¶ vÒ c¬ chÕ ho¹t ®éng còng nh− biÓu
hiÖn chøc n¨ng cña c¸c yÕu tè kÐo dµi chuçi. V× vËy, ë GDP

®©y chóng ta chØ m« t¶ qu¸ tr×nh ë prokaryote.


a) YÕu tè EF-Tu ®iÒu khiÓn viÖc l¾p r¸p
aminoacyl-tARN vµo vÞ trÝ P cña ribosome
aa
Aminoacyl-tARN (tARN sau khi ®−îc n¹p axit
amin) kh«ng liªn kÕt tù ph¸t vµo vÞ trÝ P cña E P A
ribosome, mµ thay vµo ®ã nã ®−îc "hé tèng" ®Ó ®Ýnh
kÕt vµo vÞ trÝ P cña ribosome bëi EF-Tu (h×nh 4.22).
Sau khi tARN ®· ®−îc n¹p axit amin, EF-Tu liªn kÕt 5' 3'
vµo ®Çu 3’ cña tARN vµ che lÊp axit amin. Sù t−¬ng
t¸c nh− vËy lµm cho axit amin sÏ chØ liªn kÕt ®−îc H×nh 4.22. Aminoacyl-tARN ®−îc EF-Tu
vµo chuçi polypeptide khi EF-Tu ®−îc gi¶i phãng. ®−a vµo vÞ trÝ A trªn ribosome.

123
§inh §oµn Long

Gièng nh− yÕu tè khëi ®Çu dÞch m· IF2, yÕu tè EF-Tu liªn kÕt vµo aminoacyl-tARN
khi nã ë d¹ng phøc víi GTP vµ sÏ kh«ng ®−îc gi¶i phãng nÕu GTP kh«ng bÞ thñy ph©n.
Trong dÞch m·, sù thñy ph©n GTP dÉn ®Õn chuyÓn hãa EF-Tu/GTP → EF-Tu/GDP chØ
x¶y ra khi tARN ®−îc ®−a vµo vÞ trÝ A cña ribosome, ®ång thêi bé ba ®èi m· cña nã phï
hîp víi bé ba trªn mARN. Nh− vËy, chØ khi tARN ®−îc l¾p r¸p ®óng, EF-Tu míi ®−îc
gi¶i phãng.
b) Ribosome cã nhiÒu c¬ chÕ lo¹i bá c¸c aminoacyl-tARN kÕt cÆp sai
TØ lÖ sai sãt trong dÞch m· vµo kho¶ng 10-4 – 10-3. C¬ së ®¶m b¶o cho sù dÞch m·
chÝnh x¸c lµ viÖc chän läc aminoacyl-tARN kÕt cÆp ®óng víi m· bé ba trªn mARN t¹i vÞ
trÝ A cña ribosome. Nh− nªu ë trªn, sù kiÓm so¸t dÞch m· ®−îc thùc hiÖn th«ng qua EF-
Tu. Nh−ng ngoµi c¬ chÕ nµy (gäi lµ c¬ chÕ thø nhÊt), ribosome cßn Ýt nhÊt hai c¬ chÕ kh¸c
®Ó gi¶m thiÓu sù sai sãt trong dÞch m·. C¬ chÕ thø hai liªn quan ®Õn tr×nh tù cña rARN
16S trong tiÓu phÇn nhá cña ribosome. Ph©n tö rARN nµy cã hai nucleotide adenine (A)
n»m trùc diÖn vÞ trÝ A cña ribosome (còng lµ trùc diÖn m· bé ba ®ang ®−îc dÞch m· trªn
mARN (h×nh 4.23). Hai A nµy t¹o liªn kÕt hydro bæ sung khi bé ba ®èi m· trªn tARN vµ
bé ba m· hãa trªn mARN kÕt cÆp ®óng (gi÷a G≡C vµ A=U, h×nh 4.23b). Nh−ng, nÕu kÕt
cÆp sai, th× liªn kÕt hydro kh«ng h×nh thµnh, lµm gi¶m ¸i lùc liªn kÕt cña bé ba ®èi m·
trªn tARN víi m· bé ba trªn mARN, nªn tARN l¾p r¸p sai sÏ bÞ rêi ra tr−íc khi liªn kÕt
peptide h×nh thµnh. C¬ chÕ thø ba ®¶m b¶o cho sù kÕt cÆp chÝnh x¸c lµ kh¶ n¨ng "®äc
söa" cña ribosome sau khi EF-Tu ®· ®−îc gi¶i phãng. Khi aminoacyl-tARN l¾p r¸p vµo
vÞ trÝ A ë d¹ng phøc víi EF-Tu/GTP, ®Çu 3’ cña nã ë xa vÞ trÝ h×nh thµnh liªn kÕt peptide.
§Ó tham gia ph¶n øng peptide, tARN ph¶i "quay" sao cho axit amin h−íng vµo trung
t©m peptidyl transferase. C¸c tARN kÕt cÆp sai sÏ bÞ "tung khái" ribosome khi tARN
quay nh− vËy (ë ®©y, c¬ chÕ thø hai vµ thø ba cã xu h−íng kÕt hîp víi nhau). Víi ba c¬
chÕ võa nªu, hÇu hÕt c¸c tARN kÕt cÆp sai ®Òu ®−îc lo¹i bá tr−íc khi ph¶n øng x¶y ra.

a) KÕt cÆp ®óng KÕt cÆp sai b) KÕt cÆp ®óng KÕt cÆp sai

Chuçi polypeptide Trung t©m liªn kÕt Thïy ®èi m·


yÕu tè dÞch m· cña tARN

P A mARN
E P E
A 5' 3' 5' 3'
mARN rARN
5' 3' 5' 3' 16S
Kh«ng thñy ph©n
Thñy ph©n GTP vµ GTP, nªn gi¶i
EF-Tu/GDP KÕt cÆp ®óng KÕt cÆp sai
gi¶i phãng EF-Tu phãng toµn bé
GDP
phøc hÖ EF-Tu/tARN

E PA P A
E 5' 3'

5' 3' 5' 3' "Quay", t×m sù kÕt cÆp phï hîp

H×nh 4.23. Ba c¬ chÕ ®¶m b¶o sù kÕt cÆp chÝnh x¸c gi÷a
tARN vµ mARN. a) EF-Tu/GTP chØ ®−îc thñy ph©n khi cã sù kÕt cÆp
®óng. b) C¸c liªn kÕt hydro bæ sung gi÷a hai nucleotide A trªn rARN
16S víi bé ba ®èi m· trªn tARN chØ h×nh thµnh khi cã sù kÕt cÆp ®óng.
c) ChØ khi cã sù kÕt cÆp ®óng, tARN míi "quay" axit amin vÒ ®óng
trung t©m ph¶n øng. 5' 3' 5' 3'

124
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

c) Ribosome lµ mét ribozyme


Khi aminoacyl-tARN ®· ®−îc l¾p r¸p ®óng vµo vÞ trÝ A vµ quay axit amin vµo
trung t©m peptidyl transferase, ph¶n øng peptide sÏ x¶y ra. Ph¶n øng nµy ®−îc xóc t¸c
bëi chÝnh rARN 23 S cña tiÓu phÇn lín. C¸c d÷ liÖu thùc nghiÖm ®· x¸c nhËn toµn bé
trung t©m peptidyl transferase ®−îc cÊu t¹o tõ ARN hoÆc phÇn lín tõ ARN. VËy, b»ng
c¸ch nµo rARN 23S cã thÓ xóc t¸c ph¶n øng peptide? C¸c b−íc cña ph¶n øng ®−îc m«
t¶ nh− sau:
- §Çu tiªn, sù kÕt cÆp gi÷a c¸c nucleotide thuéc rARN 23S vµ tr×nh tù CCA ë ®Çu
3’ cña tARN n»m ë c¸c vÞ trÝ A vµ P cña ribosome thóc ®Èy Cα cña axit amin
thuéc aminoacyl-tARN "tÊn c«ng" vµo nhãm carbonyl (-COOH) cña chuçi
polypeptide ®ang ®Ýnh vµo peptidyl-tARN. T−¬ng t¸c nµy lµ æn ®Þnh nÕu tARN
l¾p r¸p ®óng m· bé ba trªn mARN.
- TiÕp theo, khi c¸c c¬ chÊt ®· ¸p s¸t nhau, c¸c nucleotide thuéc trung t©m
peptidyl transferase cã thÓ nhËn mét nguyªn tö hydro tõ nhãm α-NH2 cña
aminoacyl-tARN, lµm cho nguyªn tö nit¬ trë thµnh mét nguyªn tö cho ®iÖn tö
m¹nh vµ tÊn c«ng vµo nhãm carbonyl dÉn ®Õn sù h×nh thµnh liªn kÕt peptide
(h×nh 4.17).
Víi c¬ chÕ nªu trªn, cã thÓ nãi ribosome (thùc chÊt lµ peptidyl transferase) lµ mét
ribozyme.
d) EF-G ®iÒu khiÓn ribosome dÞch chuyÓn trªn mARN theo tõng bé ba nucleotide
Sau mçi mét liªn kÕt peptide ®−îc h×nh thµnh, tARN ë vÞ trÝ P trë nªn "tù do"
(kh«ng cßn g¾n víi chuçi polypeptide n÷a); lóc nµy, chuçi polypeptide ®· g¾n vµo axit
amin cña tARN t¹i vÞ trÝ A. §Ó tiÕp tôc chu kú kÐo dµi chuçi, tARN ë vÞ trÝ P ph¶i ®−îc
chuyÓn sang vÞ trÝ E, cßn tARN ë vÞ trÝ A cÇn ®−îc chuyÓn sang vÞ trÝ P, ®ång thêi mARN
ph¶i dÞch chuyÓn ®óng 3 nucleotide ®Ó "béc lé" bé ba nucleotide tiÕp theo. C¸c ho¹t ®éng
nµy ®−îc gäi lµ sù chuyÓn vÞ cña ribosome. Sù chuyÓn vÞ nµy ®ßi hái mét yÕu tè kÐo dµi
chuçi kh¸c, gäi lµ EF-G. EF-G chØ liªn kÕt vµo ribosome khi ë d¹ng phøc víi GTP (EF-
G/GTP). Khi mét ph¶n øng peptide võa x¶y ra, peptidyl-tARN t¹i vÞ trÝ A lµm thay ®æi
cÊu h×nh tiÓu phÇn lín cña ribosome, dÉn ®Õn lµm t¨ng ¸i lùc ®Ýnh kÕt cña EF-G/GTP
vµo trung t©m GTPase cña ribosome. V× vËy, sau khi EF-G/GTP liªn kÕt vµo ribosome,
nã ®−îc GTPase thñy ph©n thµnh EF-G/GDP. Phøc hÖ EF-G/GDP biÕn ®æi cÊu h×nh cho
phÐp chóng chuyÓn sang tiÓu phÇn nhá cña ribosome, ®ång thêi thóc ®Èy sù chuyÓn vÞ
cña tARN t¹i vÞ trÝ A. Khi sù chuyÓn vÞ kÕt thóc, tiÓu phÇn nhá cña ribosome gi¶m ¸i lùc
víi EF-G/GDP vµ gi¶i phãng yÕu tè nµy khái ribosome. KÕt qu¶ lµ, khi EF-G rêi khái
ribosome, peptidyl-tARN vèn ë vÞ trÝ A chuyÓn sang vÞ trÝ P, cßn tARN "tù do" t¹i vÞ trÝ P
chuyÓn sang vÞ trÝ E, råi sau ®ã ®−îc gi¶i phãng khái ribosome.
e) EF-Tu vµ EF-G ®−îc dïng l¹i trong c¸c chu kú kÐo dµi chuçi míi
EF-Tu vµ EF-G nh− m« t¶ trªn ®©y lµ c¸c protein cã ho¹t tÝnh xóc t¸c. Chóng ®−îc
gi¶i phãng ra sau mçi chu kú ph¶n øng peptide kÐo dµi chuçi. Lóc rêi khái ribosome,
chóng ®Òu ë d¹ng phøc víi GDP. §Ó tham gia vµo chu kú tiÕp theo, chóng ph¶i t¸ch khái
GDP vµ t¹o phøc víi GTP. §èi víi EF-G, do EF-G ë tr¹ng th¸i tù do cã ¸i lùc víi GTP cao
h¬n nhiÒu so víi GDP, nªn sù thay thÕ GDP b»ng GTP diÔn ra tù ph¸t. Cßn ®èi víi EF-
Tu, ®Ó chuyÓn ®æi phøc EF-Tu/GDP → EF-Tu/GTP, cÇn mét yÕu tè kÐo dµi chuçi thø ba,
gäi lµ EF-Ts. Cô thÓ, sau khi EF-Tu/GDP ®−îc gi¶i phãng khái ribosome, mét ph©n tö
EF-Ts liªn kÕt vµo EF-Tu/GDP vµ ®Èy GDP khái EF-Tu. Nh−ng khi gÆp GTP, EF-Ts l¹i

125
§inh §oµn Long

bÞ "®Èy" khái phøc hÖ EF-Tu/EF-Ts dÉn ®Õn h×nh thµnh phøc hÖ EF-Tu/GTP vµ EF-Ts
tù do. Nh− nªu ë trªn, EF-G/GTP vµ EF-Tu/GTP sÏ s½n sµng cho chu kú kÐo dµi chuçi
míi.
Nh− vËy, ta thÊy ®Ó g¾n mét axit amin vµo chuçi polypeptide, tÕ bµo cÇn tiªu tèn 2
GTP vµ 1 ATP. Trong ®ã, 1 ATP ®−îc dïng ®Ó g¾n axit amin vµo tARN, 1 GTP ®−îc dïng
®Ó ®−a tARN vµo vÞ trÝ P cña ribosome vµ 1 GTP ®−îc dïng ®Ó chuyÓn vÞ ribosome.
Nh×n chung, so víi prokaryote, c¸c sù kiÖn kÐo dµi chuçi polypeptide vµ chuyÓn vÞ
ribosome diÔn ra trong dÞch m· ë eukaryote lµ t−¬ng tù, kÓ c¶ sè l−îng vµ thuéc tÝnh cña
c¸c yÕu tè kÐo dµi chuçi. Tuy vËy, ®Ó ph©n biÖt, hai yÕu tè kÐo dµi chuçi ë eukaryote ®−îc
gäi lµ eEF1 vµ eEF2 lÇn l−ît t−¬ng øng víi EF-Tu vµ EF-G ë prokaryote.

4.3.3.3. Sù kÕt thóc dÞch m·


a) C¸c tÝn hiÖu kÕt thóc dÞch m· ®−îc nhËn ra bëi c¸c RF nhãm I
Trªn c¬ së ®Æc ®iÓm khëi ®Çu dÞch m·, tr−íc ®©y ng−êi ta cho r»ng cã lÏ ®· tån t¹i
mét tARN ®Æc biÖt lµm nhiÖm vô kÕt thóc dÞch m· (qua nhËn biÕt m· kÕt thóc). Nh−ng,
thùc tÕ kh«ng ®óng nh− vËy. Sù kÕt thóc dÞch m· së dÜ cã thÓ x¶y ra lµ v× kh«ng cã tARN
nµo cã bé ba ®èi m· t−¬ng øng víi m· kÕt thóc. M· kÕt thóc ®−îc nhËn biÕt bëi c¸c
protein gäi lµ c¸c yÕu tè kÕt thóc dÞch m· (kÝ hiÖu RF). C¸c yÕu tè RF sau khi liªn kÕt
vµo m· kÕt thóc cã vai trß ho¹t hãa sù thñy ph©n chuçi polypeptide khái peptidyl-tARN.
Cã hai nhãm RF. C¸c RF nhãm I nhËn ra m· kÕt thóc vµ kÝch ho¹t sù thñy ph©n
chuçi polypeptide khái peptidyl-tARN t¹i vÞ trÝ P. C¸c tÕ bµo prokaryote cã hai yÕu tè RF
thuéc nhãm I gäi lµ RF1 vµ RF2. RF1 nhËn ra m· kÕt thóc UAG, cßn RF2 nhËn ra m·
kÕt thóc UGA. C¶ hai yÕu tè RF1 vµ RF2 ®Òu nhËn ra m· kÕt thóc thø ba UAA. TÕ bµo
eukaryote chØ cã mét yÕu tè kÕt thóc dÞch m· nhãm I duy nhÊt lµ eRF1 (®ång thêi nhËn
ra c¶ ba m· kÕt thóc). C¸c RF nhãm II cã chøc n¨ng gi¶i phãng RF nhãm I khái ribosome
khi chuçi polypeptide ®· ®−îc gi¶i phãng khái tARN, ®¸nh dÊu sù kÕt thóc dÞch m·.
VËy, b»ng c¸ch nµo c¸c yÕu tè RF nhãm I cã thÓ nhËn ra c¸c m· kÕt thóc? D÷ liÖu
thùc nghiÖm cho thÊy c¸c RF nhËn ra m· kÕt thóc th«ng qua mèi t−¬ng t¸c protein –
ARN; trong ®ã cã 3 axit amin cã vai trß nhËn ra m· kÕt thóc ®−îc gäi lµ bé ba peptide ®èi
m·. Ngoµi ra, tÊt c¶ c¸c RF nhãm I ®Òu gièng nhau ë mét mÉu peptide lµ GGQ (glycine-
glycine-glutamine) t−¬ng t¸c víi trung t©m peptidyl transferase cña ribosome. MÉu
peptide GGQ liªn quan ®Õn viÖc thñy ph©n chuçi polypeptide khái peptidyl-tARN. Tuy
nhiªn, ®Õn nay ch−a râ liÖu c¸c RF trùc tiÕp xóc t¸c viÖc thñy ph©n chuçi polypeptide,
hay chóng chØ t¸c ®éng gi¸n tiÕp qua viÖc lµm thay ®æi cÊu h×nh cña peptidyl transferase.
b) C¸c RF nhãm II cã vai trß phôc håi c¸c RF nhãm I
Khi c¸c RF nhãm I ®· thñy ph©n ®−îc chuçi polypeptide khái peptidyl-tARN, nã
cÇn ®−îc gi¶i phãng khái ribosome. Chøc n¨ng nµy do c¸c yÕu tè RF nhãm II ®¶m
nhiÖm. ë prokaryote, RF nhãm II lµ RF3, cßn ë eukaryote lµ eRF3. C¸c RF nhãm II lµ
c¸c protein liªn kÕt GTP. Nh−ng kh¸c biÖt víi c¸c protein liªn kÕt GTP kh¸c tham gia
dÞch m·, c¸c RF nhãm II cã ¸i lùc víi GDP cao h¬n víi GTP. V× vËy, ë d¹ng tù do chóng
th−êng liªn kÕt víi GDP. Khi RF nhãm II kÕt thóc dÞch m· nã lµm thay ®æi cÊu h×nh
ribosome, ®ång thêi thóc ®Èy c¸c RF nhãm I thay GDP b»ng GTP. ë d¹ng phøc víi
GTP, c¸c RF nhãm II cã ¸i lùc cao víi ribosome; nã liªn kÕt vµo ribosome vµ ®Èy c¸c RF
nhãm I ra ngoµi ®ång thêi thÕ vµo vÞ trÝ cña RF nhãm I t¹i vÞ trÝ liªn kÕt c¸c RF ë
ribosome. Gièng c¸c protein liªn kÕt GTP kh¸c tham gia dÞch m·, sù t−¬ng t¸c nµy lµm

126
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

thñy th©n GTP → GDP. ë d¹ng phøc víi GDP, c¸c RF nhãm II gi¶m ¸i lùc víi ribosome
vµ tho¸t ra ngoµi.
c) C¸c yÕu tè phôc håi ribosome ho¹t ®éng gièng nh− c¸c tARN
Sau khi chuçi polypeptide vµ c¸c yÕu tè RF ®· rêi khái ribosome, th× mARN vÉn cßn
g¾n víi ribosome, ®ång thêi cã hai tARN tù do ®ang ë c¸c vÞ trÝ E vµ P. §Ó tham gia ®−îc
vµo c¸c chï kú dÞch m· míi, c¸c tARN ph¶i ®−îc gi¶i phãng khái ribosome, råi hai tiÓu
phÇn cña ribosome ph¶i t¸ch nhau ra. C¸c sù kiÖn nµy ®−îc gäi lµ sù phôc håi
ribosome.
ë prokaryote, cã c¸c yÕu tè phôc håi ribosome, kÝ hiÖu lµ RRF. C¸c RRF t−¬ng
t¸c víi c¸c yÕu tè EF-G vµ RF3 theo kiÓu gièng tARN ®Ó phôc håi ribosome. Cô thÓ, sau
khi chuçi polypeptide rêi khái ribosome, RRF liªn kÕt vµo vÞ trÝ A (®ang rçng). Do RRF
"gièng" tARN, EF-G liªn kÕt vµo mét ®Çu cña RRF. Nh− mét ph¶n øng kÐo dµi chuçi,
EF-G thóc ®Èy sù gi¶i phãng c¸c tARN kh«ng n¹p axit amin khái ribosome. IF3 (xem
chøc n¨ng ®· nªu ë trªn) lóc nµy cã vai trß gi¶i phãng mARN vµ t¸ch hai tiÓu phÇn cña
ribosome khái nhau. KÕt qu¶ lµ tÊt c¶ c¸c ph©n tö tARN, tiÓu phÇn nhá cña ribosome
(liªn kÕt víi IF3) vµ tiÓu phÇn lín cña ribosome ®Òu t¸ch khái nhau vµ khái mARN. TÊt
c¶ c¸c thµnh phÇn nµy ®Òu cã thÓ ®−îc dïng l¹i cho c¸c chu kú tæng hîp protein míi.

4.3.4. M· di truyÒn lµ m· bé ba, cã tÝnh tho¸i hãa vµ phæ biÕn

4.3.4.1. M· di truyÒn cã tÝnh tho¸i hãa


B¶ng 4.5. B¶ng m di truyÒn
Tõ ®Æc ®iÓm cña qu¸ tr×nh dÞch m·,
chóng ta thÊy m· di truyÒn lu«n ®−îc Baz¬ thø hai
®äc theo tõng côm 3 nucleotide, ®−îc gäi
lµ m· bé ba. Tõ bèn "kÝ tù" (A, T, G vµ
Baz¬
thø nhÊt U C A G Baz¬
thø ba
UUU Phe UCU Ser UAU Tyr UGU Cys U
C), hÖ thèng di truyÒn cña c¸c sinh vËt cã
UUC Phe UCC Ser UAC Tyr UGC Cys C
tæng céng 64 bé ba kh¸c nhau. B¶ng 4.5 U UUA Leu UCA Ser UAA* (KT) UGA* (KT) A
liÖt kª tÊt c¶ c¸c m· bé ba vµ nghÜa phæ UUG Leu UCG Ser UAG* (KT) UGG Trp G
biÕn (axit amin ®−îc m· hãa) cña chóng CUU Leu CCU Pro CAU His CGU Arg U
(c¸c m· ®−îc viÕt theo chiÒu 5’ → 3’). CUC Leu CCC Pro CAC His CGC Arg C
Trong 64 m· bé ba, cã 3 m· kÕt thóc vµ C CUA Leu CCA Pro CAA Gln CGA Arg A
61 bé ba m· hãa cho 20 axit amin phæ CUG Leu CCG Pro CAG Gln CGG Arg G
biÕn (mét sè axit amin hiÕm ®−îc nªu ë AUU Ile ACU Thr AAU Asn AGU Ser U
AUC Ile ACC Thr AAC Asn AGC Ser C
môc 4.3.5.4 d−íi ®©y). §iÒu nµy cã nghÜa
lµ mét sè axit amin ®−îc m· hãa bëi
A AUA Ile ACA Thr AAA Lys AGA Arg A
AUG* Met ACG Thr AAG Lys AGG Arg G
nhiÒu h¬n mét m· bé ba. HiÖn t−îng nµy
GUU Val GCU Ala GAU Asp GGU Gly U
®−îc gäi lµ tÝnh tho¸i hãa cña m· bé GUC Val GCC Ala GAC Asp GGC Gly C
ba. C¸c m· bé ba ®−îc dïng ®Ó m· hãa G GUA Val GCA Ala GAA Glu GGA Gly A
cho cïng mét axit amin ®−îc gäi lµ c¸c GUG Val GCG Ala GAG Glu GGG Gly G
m· bé ba ®ång nghÜa. Nh×n chung, c¸c *Ghi chó: AUG m· hãa Met, ®ång thêi lµ m· khëi ®Çu dÞch m·. (KT) =
m· ®ång nghÜa th−êng cã hai nucleotide m· kÕt thóc dÞch m·; ®«i khi lµ m· ®ét biÕn "v« nghÜa". UGA cßn ®−îc
dïng m· hãa axit amin Sec, UAG cßn ®−îc dïng m· hãa axit amin
®Çu gièng nhau, nucleotide thø ba hoÆc Pyl (xem môc 4.3.5.4). M· ngo¹i lÖ ®−îc nªu ë môc 4.3.4.2.
lµ C hoÆc lµ U, hoÆc lµ A vµ G (thay thÕ
nhau). Tuy vËy, nguyªn t¾c nµy kh«ng B¶ng 4.6. KÕt cÆp baz¬ “láng lÎo” t¹i vÞ trÝ thø ba
ph¶i lóc nµo còng ®óng, ®iÓn h×nh lµ Leu Baz¬ trong bé ba ®èi m· (tARN) Baz¬ trong bé ba m· hãa (mARN)
®−îc m· hãa bëi c¸c bé ba UUA, UUG, G U hoÆc G
CUU, CUC, CUA vµ CUG; hay Arg ®−îc C G
m· hãa bëi c¸c bé ba CGU, CGC, CGA, A U
CGG, AGA vµ AGG. Sù tho¸i hãa cña m· U A hoÆc G
bé ba, ®Æc biÖt ë vÞ trÝ thø ba, gi¶i thÝch I (inosine) A, U hoÆc C

127
§inh §oµn Long

cho hiÖn t−îng t¹i sao tØ lÖ AT/GC ë phÇn lín c¸c loµi lµ kh¸c nhau, nh−ng thµnh phÇn
axit amin trong c¸c protein cña chóng l¹i rÊt gièng nhau. §ång thêi, nhê ®Æc tÝnh tho¸i
hãa nµy, sai sãt dÞch m· ®−îc gi¶m thiÓu. Bëi v×, chóng ta biÕt r»ng c¸c liªn kÕt G≡C cã
lùc liªn kÕt lín h¬n so víi A=U. VËy nªn, nÕu hai nucleotide ®Çu tiªn lµ G/C th× kh¶ n¨ng
kÕt cÆp sai trong dÞch m· ë nucleotide thø ba rÊt dÔ x¶y ra. ViÖc sö dông bÊt kú mét
nucleotide trong sè 4 nucleotide ë vÞ trÝ thø ba ®Ó m· hãa cho cïng mét axit amin gióp
gi¶m thiÓu hËu qu¶ ®ét biÕn.
Ngoµi ®Æc ®iÓm nªu trªn, tÝnh tho¸i hãa cña m· bé ba cßn biÓu hiÖn ë sù "láng lÎo"
trong liªn kÕt cña nucleotide thø ba cña bé ba ®èi m· trªn tARN (nucleotide ®Çu 5’ cña
bé ba ®èi m·). B¶ng 4.6 cho thÊy, ngoµi 4 nucleotide th«ng th−êng, vÞ trÝ thø ba nµy cã
thÓ mang mét nucleotide biÕn ®æi lµ I (inosine). I ®−îc biÕn ®æi tõ A b»ng ph¶n øng lo¹i
nhãm amin khái vÞ trÝ C-6 (I thùc chÊt lµ mét nucleotide cã phÇn ®−êng lµ ribose vµ phÇn
baz¬ lµ hypoxanthine). I cã thÓ ®ång thêi t¹o liªn kÕt hydro víi A, U hoÆc C. T¹i vÞ trÝ thø
ba, G cã thÓ liªn kÕt víi C hoÆc liªn kÕt "láng lÎo" víi U; ng−îc l¹i, U cã thÓ liªn kÕt víi A
hoÆc "láng lÎo" víi G. Kh¶ n¨ng liªn kÕt "láng lÎo" trªn ®©y cña nucleotide thø ba cho
thÊy thùc tÕ mét sè tARN cã thÓ liªn kÕt vµo nhiÒu h¬n mét m· bé ba trªn mARN (nh−ng
kh«ng bao giê nhiÒu h¬n 3 m· bé ba kh¸c nhau).
4.3.4.2. M· di truyÒn cã tÝnh phæ biÕn nh−ng còng cã nhiÒu ngo¹i lÖ
TÊt c¶ c¸c hÖ thèng sinh häc (kÓ c¶ virut, vi khuÈn cho ®Õn c¸c sinh vËt nh©n thËt)
®Òu sö dông m· di truyÒn lµ m· bé ba vµ dïng mét b¶ng m· chung (b¶ng 4.5). §Æc ®iÓm
nµy ®−îc gäi lµ tÝnh phæ biÕn cña m· di truyÒn. TÝnh phæ biÕn cña m· di truyÒn ®−îc
biÓu hiÖn ®ång thêi víi c¸c ®Æc tÝnh chung cña m· bé ba lµ: 1) c¸c m· bé ba (trªn mARN)
lu«n ®−îc ®äc theo chiÒu 5’ → 3’; 2) kÓ tõ m· b¾t ®Çu (cña ORF), c¸c m· bé ba lu«n ®−îc
®äc liªn tôc kh«ng ng¾t qu·ng cho ®Õn khi gÆp m· kÕt thóc (nãi c¸ch kh¸c lµ c¸c m· bé
ba ®−îc ®äc trong c¸c ORF cè ®Þnh). §©y lµ nh÷ng b»ng chøng quan träng cho thÊy c¸c
d¹ng sèng trªn Tr¸i ®Êt ®Òu cã nguån gèc chung (xem thªm ch−¬ng 10). Ngoµi ra, còng
nhê c¸c ®Æc tÝnh nµy, c¸c nghiªn cøu vÒ kÜ thuËt di truyÒn hiÖn nay cã thÓ tiÕn hµnh t¸i
tæ hîp ADN (hoÆc c¸c gen) gi÷a bÊt cø hai ®èi t−îng sinh vËt nµo (kÓ tõ virut cho ®Õn thó
vµ ng−êi). Tuy vËy, ë mét sè hÖ thèng, m· di truyÒn bÞ "biÕn ®æi" nh− sau:
HÖ gen ti thÓ ë eukaryote cã mét sè biÕn ®æi so víi c¸c m· chuÈn, cô thÓ lµ:
- UGA kh«ng ®−îc dïng lµm m· kÕt thóc. Thay vµo ®ã, nã m· hãa cho Trp. KÕt
qu¶ lµ bé ba ®èi m· trªn ph©n tö tARNTrp ®ång thêi nhËn ra hai m· UCC vµ
UCA trªn mARN.
- C¸c m· AUG vµ AUA ®ång thêi ®−îc dïng ®Ó m· hãa Met trªn chuçi
polypeptide.
- ë ®éng vËt cã vó, c¸c m· AGA vµ AGG kh«ng ®−îc dïng ®Ó m· hãa Arg, mµ
®−îc dïng lµm m· kÕt thóc. Nh− vËy, hÖ gen ti thÓ cã 4 m· kÕt thóc lµ UAA,
UAG, AGA vµ AGG.
- ë ruåi giÊm, hai m· AGA vµ AGG kh«ng m· hãa cho Arg, mµ m· hãa cho Ser.
Kh«ng cã g× ng¹c nhiªn khi hÖ gen ti thÓ sö dông mét b¶ng m· kh¸c víi b¶ng m·
phæ biÕn. Ngay ë ®éng vËt cã vó, ti thÓ chØ cã 22 lo¹i tARN kh¸c nhau, trong khi cÇn tèi
thiÓu 32 tARN míi cã thÓ tiÕn hµnh dÞch m· ARN theo nguyªn t¾c "tho¸i hãa" vµ "láng
lÎo" theo nh− b¶ng m· chuÈn. KÕt qu¶ lµ, nÕu mét axit amin ®ång thêi ®−îc m· hãa bëi 4

128
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

m· bé ba kh¸c nhau (hai nucleotide ®Çu gièng nhau), th× chØ cÇn mét tARN duy nhÊt.
Ph©n tö tARN nh− vËy ë ti thÓ th−êng cã U t¹i vÞ trÝ thø ba trong bé ba ®èi m·.
B¶ng m· di truyÒn "ngo¹i lÖ" kh«ng chØ gÆp ë c¸c hÖ gen ti thÓ, mµ cßn b¾t gÆp ë
mét sè vi khuÈn vµ hÖ gen nh©n ë mét sè eukaryote. VÝ dô, vi khuÈn Mycoplasma
capricolum dïng UGA (phæ biÕn lµ m· kÕt thóc) ®Ó m· hãa cho Trp. T−¬ng tù nh− vËy,
mét sè nguyªn sinh ®éng vËt sö dông c¸c m· kÕt thóc phæ biÕn lµ UAA vµ UAG ®Ó m·
hãa Gln; hoÆc nh− nÊm men Candida dïng m· CUG (phæ biÕn m· hãa cho Leu) ®Ó m·
hãa Ser.

4.3.5. Sù hoµn thiÖn vµ vËn chuyÓn protein sau dÞch m·

4.3.5.1. VËn chuyÓn protein dùa trªn c¸c tÝn hiÖu ®Çu N
C¸c protein ®−îc h×nh thµnh sau dÞch m· cÇn ®−îc vËn chuyÓn ®Õn ®óng n¬i tÕ bµo
cÇn. Trõ c¸c protein lµ thµnh phÇn cña m¹ng l−íi néi chÊt lµ n¬i diÔn ra c¸c sù kiÖn dÞch
m·, hÇu hÕt c¸c protein kh¸c ®Òu cÇn ®−îc vËn chuyÓn ®Õn ®óng ®Ých. C¸c protein ph¶i
®−a ra ngoµi tÕ bµo cÇn cã c¬ chÕ vËn chuyÓn qua mµng. Nh÷ng c¬ chÕ vËn chuyÓn nh−
vËy vÒ c¬ b¶n gièng nhau ë prokaryote vµ eukaryote. §Ó vËn chuyÓn chÝnh x¸c, c¸c
protein th−êng ®−îc "®¸nh dÊu" b»ng c¸c tr×nh tù tÝn hiÖu ®Çu N. Th−êng th× sau ®ã
nh÷ng tÝn hiÖu nµy ®−îc c¾t bá nhê c¸c protease liªn kÕt ngoµi mµng tÕ bµo (nghÜa lµ,
protein khi biÓu hiÖn chøc n¨ng kh«ng cßn c¸c tÝn hiÖu vËn chuyÓn). Tr×nh tù tÝn hiÖu
th−êng dµi kho¶ng 20 axit amin vµ cã cÊu tróc bËc 2 d¹ng xo¾n α. Mçi tr×nh tù tÝn hiÖu
th−êng rÊt ®Æc thï víi mçi lo¹i protein vµ cã Ýt ®Æc ®iÓm chung. Cã lÏ, ®Æc ®iÓm chung
phæ biÕn nhÊt lµ ®Çu N th−êng cã tõ 2 ®Õn 8 axit amin cã tÝnh baz¬, theo sau lµ mét
chuçi axit amin kh«ng ph©n cùc; axit amin ë ngay tr−íc vÞ trÝ c¾t th−êng cã kÝch th−íc
chuçi bªn nhá.
ë vi khuÈn, ®Ó nhËn biÕt c¸c tÝn hiÖu vËn chuyÓn protein, cã mét nhãm c¸c protein
nhËn biÕt tÝn hiÖu, kÝ hiÖu lµ SecA. Khi SecA liªn kÕt vµo protein, nã dÉn protein
t−¬ng øng qua phøc hÖ chuyÓn chç (translocase) trªn mµng tÕ bµo. PhÇn cßn l¹i cña
protein võa ®−îc tæng hîp võa ®−îc ®−a ra ngoµi mµng tÕ bµo (h×nh 4.24). Sù vËn
chuyÓn theo c¬ chÕ nµy ®−îc gäi lµ sù vËn chuyÓn protein ®ång thêi víi dÞch m·.
Tr×nh tù tÝn hiÖu ®−îc c¾t bëi enzym peptidase ®Æc hiÖu ngoµi mµng tÕ bµo. Mçi tÕ bµo
E. coli cã kho¶ng 500 translocase. Tr−íc mçi lÇn ph©n bµo, vi khuÈn nµy tiÕt ra ngoµi
m«i tr−êng kho¶ng 106 ph©n tö protein. ë mét tÕ bµo nh©n ®«i trong 20 phót, mçi phót
cã kho¶ng 100 protein ®−îc ®−a qua mçi translocase. PhÇn lín protein ®−îc tiÕt ra ngoµi
m«i tr−êng ë vi khuÈn Gram Enzym peptidase
©m nh− E. coli lµ c¸c protein (c¾t ®Æc hiÖu ®o¹n dÉn ®Çu) Protein §o¹n dÉn ®Çu

cÊu tróc mµng ngoµi tÕ bµo,


chø kh«ng ph¶i lµ c¸c enzym
Translocase

Ngoµi mµng tÕ bµo


lµm nhiÖm vô ph©n gi¶i c¸c
chÊt dinh d−ìng.
ë eukaryote, c¬ chÕ vËn
chuyÓn protein ®ång thêi dÞch Trong mµng tÕ bµo
m· x¶y ra ë m¹ng l−íi néi
TÝn hiÖu
chÊt. C¸c protein th−êng ®−îc dÉn ®Çu
tiÕt ra ngoµi tÕ bµo ë sinh vËt mARN mARN mARN mARN
nh©n thËt ®a bµo phæ biÕn lµ
T1 T2 T3 T4
c¸c enzym ph©n gi¶i c¸c chÊt
dinh d−ìng, nh− amylase, H×nh 4.24. VËn chuyÓn protein ®ång thêi víi dÞch m ë prokaryote.
protease,... Ngoµi ra cßn nhiÒu T1-4: c¸c thêi ®iÓm kh¸c nhau cña dÞch m·.

129
§inh §oµn Long

lo¹i protein kh¸c, nh− c¸c kh¸ng thÓ, c¸c hoocm«n, c¸c protein vËn chuyÓn. Khi c¸c gen
m· hãa protein tiÒn-insulin (preproinsulin) vµ ovalbumin cña ng−êi ®−îc chuyÓn vµo tÕ
bµo E. coli, c¸c protein nµy ®−îc tæng hîp, c¾t tr×nh tù tÝn hiÖu vµ vËn chuyÓn ra ngoµi
mµng tÕ bµo vi khuÈn mét c¸ch chÝnh x¸c nh− ë tÕ bµo ng−êi. Ng−îc l¹i, khi gen β-
lactamase cña vi khuÈn ®−îc chuyÓn vµo tÕ bµo nÊm men, protein nµy còng ®−îc biÕn ®æi
vµ vËn chuyÓn gièng nh− ë vi khuÈn. Nh÷ng b»ng chøng nµy cho thÊy, cã lÏ c¬ chÕ vËn
chuyÓn protein nh×n chung lµ gièng nhau ë prokaryote vµ eukaryote.

4.3.5.2. Chaperon "gi¸m s¸t" sù ®ãng gãi protein


Chaperon (cßn gäi lµ chaperonin) lµ mét nhãm protein cã vai trß "gi¸m s¸t" sù
®ãng gãi c¸c protein kh¸c. RÊt nhiÒu chaperon lµ c¸c protein sèc nhiÖt (kÝ hiÖu HSP)
bëi v× khi nhiÖt ®é cao, l−îng cña chóng trong tÕ bµo t¨ng râ rÖt. C¸c chaperon ®−îc chia
lµm 2 nhãm chÝnh: mét nhãm ng¨n c¶n protein ®ãng gãi sím, mét nhãm söa c¸c protein
®ãng gãi sai (vÒ c¬ chÕ, chóng kh«ng ®iÒu khiÓn sù ®ãng gãi).
Ch¼ng h¹n, trong qu¸ tr×nh vËn chuyÓn protein ë vi khuÈn cã mét chaperon lµ SecB
gi÷ cho c¸c m¹ch polypeptide kh«ng ®ãng gãi sím. Nhê vËy, c¸c protein ®−îc duy tr× ë
d¹ng "th¼ng" trong suèt qu¸ tr×nh tæng hîp; ë d¹ng nµy, protein míi ®−îc vËn chuyÓn
qua translocase xuyªn mµng tÕ bµo. C¸c chaperon Hsp70 còng cã vai trß t−¬ng tù b»ng
c¸ch liªn kÕt vµo c¸c protein míi ®−îc tæng hîp.
Bé m¸y chaperon GroE (=Hsp60/Hsp10) phøc t¹p h¬n vµ cã c¬ chÕ söa ®ãng gãi sai
cña c¸c protein. Ch¼ng h¹n, khi mét protein ®ãng gãi kh«ng ®óng, chóng th−êng béc lé
c¸c vïng kÞ n−íc ra phÝa ngoµi. Trong dung dÞch thuÇn khiÕt, c¸c protein ®ãng gãi sai cã
thÓ ®ãng gãi l¹i t−¬ng ®èi chÝnh x¸c. Nh−ng, trong tÕ bµo v× l−îng protein rÊt lín, nªn c¸c
vïng kÞ n−íc cña c¸c protein kh¸c nhau sÏ cã thÓ dÝnh kÕt víi nhau. Bé m¸y chaperon
GroE t¹o nªn c¸c "hèc" hay "xoang" mµ ë ®ã mçi protein sÏ ®−îc biÖt lËp víi c¸c t−¬ng t¸c
kh¸c; nhê vËy, protein ®−îc ®ãng gãi trë l¹i cho ®óng.
4.3.5.3. Sù vËn chuyÓn protein vµo ti thÓ vµ l¹p thÓ
C¶ ti thÓ vµ l¹p thÓ ®Òu lµ c¸c bµo quan trong tÕ bµo eukaryote ®−îc nh©n lªn b»ng
h×nh thøc trùc ph©n vµ cã vËt chÊt di truyÒn riªng ë d¹ng ADN sîi kÐp, m¹ch vßng (gièng
víi hÖ gen vi khuÈn). HÖ gen ti thÓ vµ l¹p thÓ cã mét sè gen ®Æc thï m· hãa cho c¸c lo¹i
ribosome vµ protein riªng biÖt (chØ cÇn cho ho¹t ®éng cña chóng). Ribosome cña ti thÓ vµ
l¹p thÓ cã nhiÒu ®Æc ®iÓm gièng ë vi khuÈn h¬n ë sinh vËt nh©n thËt. C¸c yÕu tè khëi ®Çu
vµ kÕt thóc dÞch m· c¬ b¶n gièng víi ë vi khuÈn. Tuy vËy cã sù kh¸c biÖt vÒ thµnh phÇn
ribosome ë ti thÓ vµ l¹p thÓ so víi ribosome ë vi khuÈn (b¶ng 4.4).
KÝch th−íc hÖ gen c¸c bµo quan cã møc ®é kh¸c biÖt lín gi÷a c¸c loµi. Nh×n chung,
c¸c loµi eukaryote cã bËc tiÕn hãa cµng cao, cã kÝch th−íc hÖ gen c¸c bµo quan cµng nhá.
HÖ gen ti thÓ ®éng vËt cã vó m· hãa kho¶ng 10 protein, trong khi hÖ gen l¹p thÓ thùc vËt
bËc cao m· hãa kho¶ng 50 protein. C¸c protein kh¸c cÇn cho ho¹t ®éng cña bµo quan ®Òu
®−îc tæng hîp tõ hÖ gen nh©n (t¹i m¹ng l−íi néi chÊt) tr−íc khi vËn chuyÓn tíi bµo quan.
Sù vËn chuyÓn c¸c protein tõ tÕ bµo chÊt vµo ti thÓ ®−îc ®iÒu khiÓn bëi tr×nh tù tÝn
hiÖu gåm kho¶ng trªn 20 axit amin ë ®Çu N (gäi lµ ®o¹n dÉn ®Çu). Tr×nh tù tÝn hiÖu
nµy th−êng cã mét axit amin tÝch ®iÖn d−¬ng (Lys hoÆc Arg) trong mçi ®o¹n gåm 3 – 4
axit amin, ®ång thêi kh«ng cã axit amin tÝch ®iÖn ©m. §o¹n dÉn ®Çu cã cÊu h×nh chuçi
xo¾n α víi mét bÒ mÆt tÝch ®iÖn d−¬ng, mét bÒ mÆt kÞ n−íc. Mét thô thÓ trªn mµng ti thÓ
nhËn ra tÝn hiÖu nµy vµ thóc ®Èy hai hÖ thèng translocase trªn mµng ngoµi ti thÓ (kÝ
hiÖu TOM) vµ mµng trong ti thÓ (kÝ hiÖu TIM) vËn chuyÓn protein vµo trong ti thÓ. Sau
khi vµo trong ti thÓ, ®o¹n tr×nh tù tÝn hiÖu ®−îc c¾t bá bëi c¬ chÕ enzym.

130
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

Sù vËn chuyÓn protein vµo c¸c bµo quan ë thùc vËt cßn phøc t¹p h¬n ë ®éng vËt, bëi
v× ngoµi ti thÓ, chóng cßn cã l¹p thÓ. C¬ chÕ vËn chuyÓn protein vµo l¹p thÓ vÒ c¬ b¶n
còng gièng nh− ë ti thÓ. Tr×nh tù tÝn hiÖu ë ®o¹n dÉn ®Çu cña c¸c protein cÇn vËn
chuyÓn vµo l¹p thÓ cã ®Æc ®iÓm chung gièng víi tr−êng hîp ë ti thÓ, nh−ng chØ tÕ bµo
thùc vËt cã thÓ ph©n biÖt. Thùc nghiÖm cho thÊy, khi protein l¹p thÓ ®−îc biÓu hiÖn
trong tÕ bµo nÊm men, ti thÓ cña cña chóng còng tiÕp nhËn protein nµy. C¬ chÕ nµo
gióp tÕ bµo thùc vËt ph©n biÖt ®−îc protein l¹p thÓ víi protein ti thÓ ®Õn nay ch−a râ
(chØ biÕt r»ng protein l¹p thÓ th−êng cã ®o¹n dÉn ®Çu dµi h¬n). T−¬ng øng víi hai hÖ
thèng vËn chuyÓn qua mµng ti thÓ lµ TOM vµ TIM, ë l¹p thÓ hai hÖ thèng translocase
®−îc gäi lµ TOC vµ TIC.
Ngoµi c¸c hÖ thèng vËn chuyÓn nªu trªn, sù vËn chuyÓn protein vµo trong c¸c bµo
quan cßn cÇn c¸c chaperon ë trong vµ ngoµi mµng. §Ó vËn chuyÓn ®−îc c¸c protein qua
c¸c kªnh translocase, c¸c ph©n tö protein cÇn ë d¹ng "th¼ng". C¸c chaperon ngoµi mµng
gi÷ cho chóng kh«ng ®ãng gãi sím, cßn c¸c chaperon trong mµng "gi¸m s¸t" sù ®ãng gãi
®Ó h×nh thµnh c¸c protein hoµn thiÖn.

4.3.5.4. Sù biÕn ®æi axit amin sau dÞch m·


MÆc dï m· di truyÒn chØ m· hãa cho 20 lo¹i axit amin, nh−ng ®«i khi trong thµnh
phÇn protein cßn cã mét sè lo¹i axit amin kh¸c. Ngoµi 2 axit amin lµ selenocysteine
(Sec) vµ pyrolysine (Pyl) ®−îc nªu d−íi ®©y, cßn cã mét sè axit amin biÕn ®æi kh¸c.
Nh÷ng biÕn ®æi nµy ®−îc gäi lµ sù biÕn ®æi axit amin sau dÞch m·. Mét vÝ dô vÒ hiÖn
t−îng nµy lµ axit amin diphthamide (dÉn xuÊt cña His) cã trong yÕu tè kÐo dµi chuçi eEF2
cã ë eukaryote vµ archea. YÕu tè t−¬ng øng ë vi khuÈn (EF-G) kh«ng cã axit amin nµy.
Sec tõng ®−îc coi lµ axit amin thø 21 bëi v× nã ®−îc t×m thÊy trong mét sè protein
ë nhiÒu sinh vËt kh¸c nhau, kÓ c¶ ë vi khuÈn, thó vµ ng−êi. ViÖc gi¶i m· tr×nh tù c¸c gen
cho thÊy Sec ®−îc m· hãa bëi m· bé ba UGA. Chóng ta biÕt r»ng m· UGA th«ng th−êng
lµ mét m· kÕt thóc. Nh−ng m· nµy khi m· hãa cho Sec, nã n»m trong mét vïng tr×nh tù
gäi lµ tr×nh tù cµi Sec (kÝ hiÖu lµ SECIS). Sec cã tARN vËn chuyÓn riªng cho nã vµ cã
mét yÕu tè (protein) ®Æc biÖt gióp ®−a Sec-tARNSec vµo ribosome trong qu¸ tr×nh dÞch m·.
Thùc tÕ, Sec kh«ng ®−îc tæng hîp mét c¸ch ®éc lËp. Thay vµo ®ã, ban ®Çu Ser g¾n vµo
tARNSec, råi mét enzym biÕn ®æi Ser-tARNSec → Sec-tARNSec.
§iÒu ®Æc biÖt lµ cÊu tróc hãa häc Sec l¹i gièng Cys, chØ thay thÕ nguyªn tö S → Se
(xem b¶ng 1.5, ch−¬ng 1). Bëi v× nguyªn tö Se nh¹y c¶m víi sù oxy hãa h¬n nguyªn tö S,
nªn c¸c protein chøa Se cÇn tr¸nh oxy. Mét sè enzym cña c¸c vi khuÈn kÞ khÝ chøa Sec
t¹i vïng trung t©m xóc t¸c. Khi cã oxy chóng bÞ bÊt ho¹t vµ chØ ho¹t ®éng khi thiÕu oxy
(trong m«i tr−êng kÞ khÝ). Mét sè ®iÒu tra cho thÊy sinh vËt bËc cao cã kho¶ng 20 protein
chøa Sec. Protein chøa nhiÒu Sec nhÊt ®· biÕt lµ selenoprotein chiÕt xuÊt tõ c¸ ngùa.
Axit amin thø 22 lµ Pyl ®−îc ph¸t hiÖn lÇn ®Çu n¨m 2002. Axit amin nµy ®−îc
t×m thÊy ë mét sè protein cña giíi vi khuÈn cæ (Archaea) vµ ®−îc m· hãa bëi bé ba UAG
(còng th−êng lµ m· kÕt thóc). Pyl ®−îc t×m thÊy ë vi khuÈn sinh mªtan Methanosarcina
(trong vïng xóc t¸c cña methylamine methyl-transferase). Cã mét enzym tARN
synthetase, mét tARNPyl vµ 3 gen m· hãa protein ®−îc t×m thÊy chuyªn tr¸ch cho viÖc
dÞch m· Pyl. Tuy nhiªn, so víi Sec c¬ chÕ dÞch m· Pyl vÒ chi tiÕt ®Õn nay cßn ch−a râ.

4.3.6. Sù ph©n hñy protein

4.3.6.1. C¸c c¬ chÕ ph©n hñy chung


§Ó phôc vô c¸c ho¹t ®éng sèng, tÕ bµo cÇn tæng hîp c¸c protein; nh−ng khi kh«ng
cÇn thiÕt, chóng còng cÇn ®−îc ph©n hñy. Tuy sù ph©n hñy protein d−êng nh− kh«ng

131
§inh §oµn Long

phøc t¹p nh− qu¸ tr×nh tæng hîp, nh−ng nh×n chung nã còng ®−îc kiÓm so¸t nghiªm
ngÆt vµ rÊt ®Æc hiÖu víi tõng protein. C¸c enzym ph©n hñy protein ®−îc gäi chung lµ
protease. Víi chøc n¨ng cña chóng, cã thÓ thÊy c¸c protease dÔ g©y h¹i cho tÕ bµo vµ ho¹t
®éng cña chóng cÇn ®−îc "kiÓm so¸t" nghiªm ngÆt. Do vËy, trong tÕ bµo vµ c¬ thÓ, c¸c
protease th−êng ®−îc chøa trong c¸c bµo quan hoÆc c¸c xoang ®Æc biÖt, ë ®ã ho¹t ®éng
cña chóng kh«ng g©y h¹i ®Õn c¸c thµnh phÇn kh¸c cña tÕ bµo vµ c¬ thÓ. Ngoµi ra, c¸c
protease cßn ®−îc cÊu t¹o sao cho chØ c¸c protein cã "tÝn hiÖu" nhÊt ®Þnh míi bÞ ph©n hñy.
Nh×n chung, cã ba n¬i ph©n bè chÝnh cña c¸c protease, bao gåm:
1) C¸c èng tiªu hãa ë ®éng vËt. Th−êng th× khi míi tæng hîp xong, c¸c protease ë
d¹ng tiÒn chÊt kh«ng ho¹t ®éng. Sau khi ®−îc tiÕt ra khái c¸c tÕ bµo tæng hîp
nªn chóng vµ chøa vµo c¸c xoang an toµn, chóng míi ®−îc chuyÓn hãa thµnh
d¹ng cã ho¹t tÝnh.
2) Lysosome. §©y lµ mét bµo quan cã mµng bao bäc ë eukaryote. Chóng th−êng
chøa nhiÒu enzym tiªu hãa néi bµo, bao gåm c¶ c¸c protease. Khi tÕ bµo hÖ miÔn
dÞch "b¾t gi÷" c¸c vi khuÈn vµ h¹t virut g©y nhiÔm (xem thªm ch−¬ng 9), c¸c
nang vËn chuyÓn trong tÕ bµo (mang c¸c t¸c nh©n g©y nhiÔm) hßa nhËp víi
lysosome ®Ó ph©n hñy chóng. Tuy vËy, cã nh÷ng vi khuÈn (nh− c¸c chñng
Salmonella) kh«ng bÞ ph©n gi¶i bëi c¸c enzym tiªu hãa cã trong lysosome.
3) TÕ bµo chÊt. C¸c protease cã trong tÕ bµo chÊt cÇn ®−îc "kiÓm so¸t" nghiªm
ngÆt h¬n c¶. Nh−ng, tÕ bµo còng cÇn chóng th−êng xuyªn ®Ó ph©n hñy c¸c
protein d− thõa vµ sai háng. §Ó thùc hiÖn ®−îc chøc n¨ng cña ®ã, c¸c protease ë
prokaryote th−êng cã cÊu h×nh vßng trßn, víi trung t©m xóc t¸c n»m s©u trong
vßng. C¸c protein cÇn ph©n hñy ®−îc "hé tèng" bëi c¸c protein hç trî vµ ®−îc
"®Èy" vµo trung t©m ph¶n øng n»m s©u trong c¸c cÊu tróc vßng.
C¸c tÕ bµo eukaryote cã c¸c phøc hÖ protease phøc t¹p h¬n, gäi lµ c¸c
proteasome. C¸c phøc hÖ protease nµy cã cÊu h×nh khèi trô víi trung t©m
protease n»m s©u trong lßng khèi trô. PhÇn ®Çu vµo vµ ra cña khèi trô cã c¸c
protein nhËn biÕt c¸c protein d− thõa hoÆc sai háng. C¸c protein ®−îc ph©n hñy
®−îc ®¸nh dÊu b»ng ubiquitin. §©y lµ mét protein nhá th−êng liªn kÕt vµo c¸c
protein sai háng hoÆc ®ãng gãi sai vµ c¸c protein chØ cÇn trong thêi gian ng¾n.
C¸c protein liªn kÕt ubiquitin ®−îc duçi xo¾n, råi ®−îc ®Èy vµo èng h×nh trô cña
proteasome. ë ®ã, chóng bÞ ph©n hñy thµnh c¸c ®o¹n peptide ng¾n. Ubiquitine
sau ®ã ®−îc gi¶i phãng vµ sö dông l¹i cho c¸c chu kú ph©n hñy protein sau ®ã.
4.3.6.2. tmARN vµ sù ph©n hñy protein bÊt th−êng do ®ét biÕn mÊt m· kÕt thóc
Theo c¬ chÕ dÞch m· ®−îc nªu ë phÇn trªn, mét ph©n tö mARN kh«ng nh÷ng chØ
cÇn mét m· b¾t ®Çu mµ cßn cÇn mét m· kÕt thóc míi cã thÓ ®−îc dÞch m· b×nh th−êng.
Nh−ng ®iÒu g× sÏ x¶y ra nÕu gen bÞ ®ét biÕn lµm mÊt m· kÕt thóc trªn ph©n tö mARN?
Thùc tÕ, tõ c¬ chÕ phiªn m·, chóng ta nhËn thÊy bé m¸y phiªn m· chØ phô thuéc vµo c¸c
tr×nh tù khëi ®Çu (promoter) vµ tÝn hiÖu kÕt thóc (terminator) phiªn m·, mµ kh«ng phô
thuéc vµo sù biÕn ®æi cña c¸c tr×nh tù ADN n»m gi÷a chóng. Cßn sù khëi ®Çu dÞch m·
hÇu nh− chØ phô thuéc vµo tr×nh tù phÇn ®Çu 5’ cña c¸c mARN. V× vËy, c¸c ph©n tö
mARN mang ®ét biÕn mÊt m· kÕt thóc kh«ng nh÷ng ®−îc phiªn m·, mµ cßn ®−îc khëi
®Çu dÞch m· b×nh th−êng tõ ®Çu 5’; nh−ng v× thiÕu m· kÕt thóc nªn c¸c ribosome kh«ng
thÓ rêi khái mARN (dÉn ®Õn hiÖn t−îng "¸ch t¾c" ribosome trªn mARN) ®ång thêi
protein tæng hîp ra kh«ng b×nh th−êng. NÕu hiÖn t−îng nµy kh«ng ®−îc kh¾c phôc, tÕ
bµo cã thÓ bÞ l©m vµo t×nh tr¹ng "nguy hiÓm" bëi v× sù tÝch lòy c¸c protein vµ cÊu tróc
dÞch m· bÊt th−êng cã thÓ g©y rèi lo¹n c¸c ho¹t ®éng cña tÕ bµo.

132
Ch−¬ng 4. Phiªn m· vµ dÞch m· di truyÒn

a) CÊu tróc mARN ë vi khuÈn E. coli b) C¬ chÕ kh«i phôc vµ kÕt thóc dÞch m bëi tmARN
MiÒn gièng
tARN tmARN

Thïy mang
Ribosome bÞ "¸ch tmARN nhËn ra vµ tmARN kh«i phôc
axit amin
t¾c" do thiÕu m· liªn kÕt vµo vÞ trÝ A l¹i qu¸ tr×nh tæng
kÕt thóc (sù kÕt cña ribosome hîp protein
Thïy DHU Thïy TΨC
thóc dÞch m·
kh«ng thÓ diÔn ra) mARN ®ét biÕn mÊt m· kÕt
thóc t¸ch khái ribosome vµ
bÞ ph©n hñy ngay

C¸c protein ®−îc


"®¸nh dÊu" (mang "tÝn tmARN "g¾n" tr×nh tù axit amin "tÝn hiÖu";
hiÖu") bÞ ph©n hñy ngay DÞch m· kÕt thóc t¹i m· kÕt thóc cña tmARN

MiÒn gièng mARN

U A A C¸c m· kÕt
CGACAU CGUC C U
A thóc dÞch m·
UAGUCGCAAACGAAAACUAC GCUUUA GCAG C U
UA
vÞ trÝ kh«i phôc tæng hîp protein

H×nh 4.25. CÊu tróc bËc hai (gi¶n l−îc) vµ m« h×nh c¬ chÕ ho¹t ®éng cña tmARN ë E. coli.

ë E. coli vµ phÇn lín c¸c vi khuÈn ®· ®−îc nghiªn cøu, hiÖn t−îng nµy ®−îc kh¾c
phôc nhê ho¹t ®éng cña mét lo¹i ARN ®Æc biÖt lµ d¹ng "hçn hîp" cña tARN vµ mARN,
gäi lµ tmARN. tmARN ®iÓn h×nh cã mét phÇn gièng tARN (gäi lµ miÒn gièng tARN),
phÇn cßn l¹i gièng nöa cuèi cña mét ph©n tö mARN (gäi lµ miÒn gièng mARN); së dÜ nãi
lµ "gièng nöa cuèi” v× miÒn gièng mARN th−êng kh«ng cã m· b¾t ®Çu nh−ng cã mét
hoÆc mét sè m· kÕt thóc (h×nh 4.25a).
Khi ribosome bÞ "¸ch t¾c" trªn mARN, nhê cã cÊu tróc gièng tARN, tmARN ®−îc
l¾p vµo vÞ trÝ A cña ribosome gièng nh− mét tARN tham gia dÞch m·. Sù liªn kÕt cña
tmARN vµo ribosome dÉn ®Õn hai hiÖu øng ®ång thêi: (i) mARN ®ét biÕn ®−îc gi¶i phãng
ra, vµ (ii) kh«i phôc dÞch m· cña ribosome. Ph©n tö mARN ®ét biÕn sau khi rêi ribosome
bÞ ph©n hñy ngay theo c¸c c¬ chÕ ph©n hñy ARN. Trong khi ®ã, qu¸ tr×nh dÞch m· miÒn
mARN cña tmARN diÔn ra vµ kÕt thóc t¹i m· kÕt thóc cña tmARN theo c¬ chÕ dÞch m·
th«ng th−êng. Trong qu¸ tr×nh dÞch m· tmARN, ribosome bæ sung mét chuçi tr×nh tù
axit amin "tÝn hiÖu" vµo chuçi polypeptide sai háng. Nhê "tÝn hiÖu" nµy, sù ph©n hñy
protein sai háng ®−îc tiÕn hµnh ngay sau khi sù dÞch m· kÕt thóc (h×nh 4.25b).
Nh− vËy, cã thÓ tãm t¾t ba chøc n¨ng c¬ b¶n cña tmARN bao gåm: (1) nhËn ra vµ
gi¶i tho¸t c¸c ribosome bÞ ¸ch t¾c trªn mARN, (2) lo¹i bá vµ thóc ®Èy sù ph©n hñy mARN
mang "®ét biÕn" mÊt m· kÕt thóc, (3) bæ sung "tÝn hiÖu" vµo c¸c protein sai háng ®Ó thóc
®Èy sù ph©n hñy nhanh nh÷ng protein nµy.

133
Ch−¬ng 5

Gen vµ sù ®iÒu hßa biÓu hiÖn gen

5.1. Tæng quan vÒ sù ®iÒu hßa biÓu hiÖn gen


ë c¸c ch−¬ng tr−íc, chóng ta ®· biÕt th«ng tin di truyÒn (trong gen) b»ng c¸ch
nµo ®−îc t¸i b¶n (sao chÐp) vµ chuyÓn thµnh tÝnh tr¹ng (qua sù phiªn m· vµ dÞch m·).
Tuy vËy, ë mäi loµi sinh vËt, vµo mét thêi ®iÓm nhÊt ®Þnh, kh«ng ph¶i tÊt c¶ c¸c gen
®Òu biÓu hiÖn.
Ngay c¸c sinh vËt bËc thÊp (nh− vi khuÈn) còng ®· cã mét kh¶ n¨ng thÝch øng ®Æc
biÖt víi c¸c ®iÒu kiÖn m«i tr−êng th−êng xuyªn biÕn ®éng. Sù thÝch øng cña chóng phô
thuéc mét phÇn quan träng vµo kh¶ n¨ng “bËt”, “t¾t” vµ “®iÒu chØnh” sù biÓu hiÖn cña tËp
hîp c¸c gen nh»m ®¸p øng c¸c thay ®æi cña m«i tr−êng. Sù ®iÒu hßa ho¹t ®éng cña c¸c gen
th−êng cã xu h−íng gióp c¸c tÕ bµo chØ tæng hîp c¸c protein vµ enzym cÇn thiÕt cho sù sèng
cña chóng vµo tõng thêi ®iÓm, mµ kh«ng tæng hîp c¸c s¶n phÈm kh«ng cã nhu cÇu. §iÒu
nµy ®¶m b¶o cho c¸c hÖ thèng sinh häc sö dông n¨ng l−îng mét c¸ch hiÖu qu¶.
ë sinh vËt ®a bµo, sù ®iÒu hßa ho¹t ®éng gen kh«ng chØ lµ sù ®¸p øng l¹i c¸c thay
®æi cña m«i tr−êng, mµ cßn g¾n víi nhiÒu ho¹t ®éng sèng quan träng kh¸c, nh− sù “biÖt
hãa c¸c tÕ bµo” vµ “qu¸ tr×nh ph¸t triÓn c¬ thÓ”. Trong thùc tÕ, hÇu hÕt c¸c tÕ bµo ng−êi
(trõ mét sè tÕ bµo hÖ tuÇn hoµn vµ miÔn dÞch) ®Òu chøa hÖ gen gièng hÖt nhau. Nh−ng,
tËp hîp c¸c gen ®−îc biÓu hiÖn ë c¸c tÕ bµo vµ m« kh¸c nhau (nh− ë hÖ thÇn kinh, c¬, da,
v.v...) lµ kh¸c nhau. ChÝnh sù biÓu hiÖn cña c¸c gen kh¸c nhau ®· dÉn ®Õn sù ph©n hãa
chøc n¨ng cña c¸c tÕ bµo. Gièng nh− ë vi khuÈn (prokaryote), sù biÓu hiÖn gen ë sinh vËt
nh©n thËt (eukaryote) ®−îc ®iÒu khiÓn ë nhiÒu b−íc kh¸c nhau, tõ tr−íc phiªn m· tíi
sau phiªn m· vµ dÞch m·. Nh−ng, nh×n chung kiÓu ®iÒu hßa c¬ b¶n nhÊt lµ ë sù khëi ®Çu
phiªn m·.
Trong phÇn ®Çu cña ch−¬ng nµy, chóng ta sÏ nãi ®Õn mét sè kh¸i niÖm c¬ b¶n vÒ
®iÒu hßa biÓu hiÖn gen trªn c¬ së c¸c c¬ chÕ ®iÒu hßa ®· biÕt ë prokaryote (chñ yÕu ë E.
coli). Trong phÇn tiÕp theo, chóng ta sÏ ®Ò cËp ®Õn mét sè c¬ chÕ ®iÒu hßa gen ë
eukaryote, tõ c¸c tr−êng hîp ë nÊm men ®Õn c¸c sinh vËt ®a bµo bËc cao; ph©n tÝch mét
sè ®Æc ®iÓm c¬ b¶n trong ®iÒu hßa gen ë eukaryote, bao gåm sù thay ®æi cÊu h×nh chÊt
nhiÔm s¾c, hay sù tham gia cña c¸c ARN kÝch th−íc nhá.

5.1.1. Kh¸i niÖm vÒ c¸c gen c¬ ®Þnh (constitutive) vµ c¶m øng (inducible)
Mét sè s¶n phÈm cña hÖ gen, ch¼ng h¹n nh− c¸c tARN, rARN, c¸c protein thµnh
phÇn cña ribosome, cña ADN polymerase vµ nhiÒu enzym xóc t¸c tham gia vµo c¸c qu¸
tr×nh trao ®æi chÊt c¬ b¶n (nh− chuyÓn hãa ®−êng glucose, tæng hîp c¸c axit amin),... lµ
c¸c thµnh phÇn thiÕt yÕu cho sù tån t¹i cña mäi lo¹i tÕ bµo. C¸c gen m· hãa cho c¸c lo¹i
s¶n phÈm nµy th−êng ®−îc biÓu hiÖn th−êng xuyªn vµ liªn tôc ë hÇu hÕt c¸c tÕ bµo. Do
vËy, chóng ®−îc gäi lµ c¸c gen c¬ ®Þnh (constitutive genes).
Ng−îc l¹i, nhiÒu s¶n phÈm kh¸c cña hÖ gen chØ cÇn cho tÕ bµo vµ c¬ thÓ vµo nh÷ng
thêi ®iÓm nhÊt ®Þnh hoÆc trong ®iÒu kiÖn m«i tr−êng ®Æc thï. ViÖc ho¹t ®éng theo kiÓu c¬
®Þnh ®èi víi nh÷ng gen nµy sÏ lµ sù l·ng phÝ vÒ n¨ng l−îng. Cã lÏ v× vËy, tr¶i qua hµng
triÖu n¨m tiÕn hãa, c¸c tÕ bµo ®· ph¸t triÓn c¸c c¬ chÕ ®iÒu hßa biÓu hiÖn gen sao cho
chóng chØ biÓu hiÖn c¸c gen cÇn thiÕt vµo tõng thêi ®iÓm vµ vÞ trÝ nhÊt ®Þnh cña c¬ thÓ;
134
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

vµ c¸c c¬ thÓ cã c¸c c¬ chÕ ®iÒu hßa hiÖu qu¶ sÏ cã −u thÕ chän läc cao h¬n so víi c¸c c¬
thÓ thiÕu c¸c c¬ chÕ nµy. Gi¶ thiÕt nµy gióp gi¶i thÝch v× sao hÇu hÕt mäi d¹ng sèng tån
t¹i hiÖn nay, kÓ c¶ vi khuÈn vµ virut, ®Òu cã c¸c c¬ chÕ biÓu hiÖn gen rÊt hiÖu qu¶.
E. coli vµ phÇn lín c¸c vi khuÈn kh¸c cã thÓ sinh tr−ëng trong m«i tr−êng cã nguån
n¨ng l−îng lµ c¸c lo¹i ®−êng kh¸c nhau. NÕu m«i tr−êng cã glucose, vi khuÈn cã xu
h−íng −u tiªn sö dông ®−êng nµy. Nh−ng, khi kh«ng cã glucose, vi khuÈn vÉn cã thÓ
sinh tr−ëng tèt nÕu cã mét trong c¸c lo¹i ®−êng kh¸c, nh− sucrose, galactose, arabinose
vµ lactose.
VÝ dô nh−, khi m«i tr−êng chØ cã lactose lµ nguån hydrat carbon duy nhÊt, c¸c tÕ
bµo E. coli sÏ tiÕn hµnh tæng hîp enzym β-galactosidase vµ protein permease cÇn thiÕt
cho viÖc sö dông lactose lµm nguån n¨ng l−îng (thay thÕ cho glucose). Permease lµ mét
protein vËn chuyÓn gióp “b¬m” lactose tõ ngoµi m«i tr−êng vµo trong tÕ bµo, cßn β-
galactosidase lµ enzym ph©n c¾t lactose thµnh glucose vµ galactose. Hai protein nµy hÇu
nh− kh«ng cã vai trß g× khi tÕ bµo E. coli ®−îc nu«i trong m«i tr−êng kh«ng cã lactose.
ViÖc tæng hîp hai protein nµy cÇn n¨ng l−îng (tõ ATP vµ GTP). V× vËy, c¬ chÕ ®iÒu hßa
cho phÐp c¸c tÕ bµo chØ tæng hîp m¹nh c¸c s¶n phÈm cÇn thiÕt cho chuyÓn hãa lactose
khi m«i tr−êng cã lactose (vµ kh«ng cã glucose), ®ång thêi h¹n chÕ tèi ®a sù ho¹t ®éng
cña chóng khi m«i tr−êng kh«ng cã ®−êng nµy (hoÆc cã glucose) sÏ ®¶m b¶o cho c¸c tÕ
bµo sö dông n¨ng l−îng hiÖu qu¶ cho ho¹t ®éng sèng cña chóng.
Trong m«i tr−êng tù nhiªn (vÝ dô: èng tiªu hãa ë ng−êi), vi khuÈn E. coli hiÕm khi
gÆp ®iÒu kiÖn thiÕu glucose vµ thõa lactose. Do vËy, c¸c gen m· hãa c¸c enzym chuyÓn hãa
lactose cña nã th−êng ë tr¹ng th¸i “t¾t” (thùc chÊt lµ biÓu hiÖn tèi thiÓu). Nh−ng nÕu vi
khuÈn ®−îc chuyÓn sang m«i tr−êng chØ cã lactose lµm nguån hydrat carbon, th× chóng
nhanh chãng (chØ sau kho¶ng 10 phót) tæng hîp c¸c enzym chuyÓn hãa vµ sö dông lactose.
Qu¸ tr×nh “bËt” sù biÓu hiÖn cña gen ®Ó ®¸p øng l¹i sù cã mÆt cña tÝn hiÖu nµo ®ã trong
m«i tr−êng ®−îc gäi lµ sù c¶m øng. C¸c gen ®−îc ®iÒu hßa theo kiÓu nµy ®−îc gäi lµ c¸c
gen c¶m øng (inducible genes). S¶n phÈm do gen nh− vËy m· hãa, nÕu lµ enzym th× ®−îc
gäi lµ c¸c enzym c¶m øng, cßn nÕu lµ protein th× ®−îc gäi lµ protein c¶m øng.
C¸c enzym tham gia vµo c¸c qu¸ tr×nh dÞ hãa, nh− chuyÓn hãa lactose, galactose,
hay arabinose, th−êng lµ c¸c gen c¶m øng ®iÓn h×nh. CÇn ph©n biÖt sù kÝch øng (c¶m
øng t¨ng c−êng) biÓu hiÖn gen m· hãa c¸c enzym víi sù ho¹t hãa enzym, bëi hai hiÖn
t−îng nµy kh¸c nhau vÒ c¬ chÕ vµ ph−¬ng thøc thùc hiÖn. Sù kÝch øng biÓu hiÖn c¸c gen
lµm thay ®æi tèc ®é tæng hîp enzym, chø kh«ng lµm thay ®æi ho¹t tÝnh enzym. Ng−îc l¹i,
sù ho¹t hãa c¸c enzym th−êng liªn quan tíi sù t−¬ng t¸c gi÷a enzym vµ c¸c ph©n tö tÝn
hiÖu lµm thay ®æi ho¹t tÝnh enzym, nh−ng th−êng kh«ng lµm thay ®æi møc ®é biÓu hiÖn
cña gen m· hãa enzym.
C¸c vi khuÈn cã thÓ tù tæng hîp phÇn lín c¸c ph©n tö h÷u c¬ cÇn cho sù sèng cña
chóng, nh− c¸c axit amin, c¸c nucleotide vµ vitamin. VÝ dô nh−, hÖ gen E. coli chøa 5 gen
m· hãa c¸c enzym tham gia sinh tæng hîp tryptophan (Trp). N¨m gen nµy biÓu hiÖn theo
kiÓu c¬ ®Þnh khi E. coli ®−îc nu«i trong m«i tr−êng thiÕu Trp. Nh−ng nÕu vi khuÈn ®−îc
nu«i trong m«i tr−êng d− thõa Trp, th× E. coli cã mét c¬ chÕ ®iÒu hßa gióp “t¾t” sù biÓu
hiÖn cña c¸c gen nµy. C¸c gen ®−îc ®iÒu hßa theo kiÓu nµy ®−îc gäi lµ c¸c gen bÞ nÐn,
hay gen bÞ øc chÕ. Khi c¸c gen bÞ nÐn ®−îc ho¹t hãa trë l¹i th× ®−îc gäi lµ sù gi¶i nÐn.
C¸c gen m· hãa enzym tham gia vµo c¸c qu¸ tr×nh ®ång hãa th−êng lµ c¸c gen
®−îc ®iÒu hßa biÓu hiÖn theo kiÓu bÞ nÐn. Gièng nh− kiÓu ®iÒu hßa c¶m øng, sù nÐn gen
®iÓn h×nh ®−îc thùc hiÖn ë b−íc phiªn m·. CÇn ph©n biÖt sù nÐn gen víi sù øc chÕ ph¶n
håi. Bëi øc chÕ ph¶n håi th−êng liªn quan ®Õn sù øc chÕ g©y ra bëi s¶n phÈm cuèi cïng
cña mét con ®−êng chuyÓn hãa ®èi víi ho¹t tÝnh cña enzym tham gia con ®−êng chuyÓn
hãa ®ã, mµ kh«ng ¶nh h−ëng ®Õn sù biÓu hiÖn cña gen m· hãa enzym.

135
§inh §oµn Long

5.1.2. §iÒu hßa d−¬ng tÝnh vµ ®iÒu hßa ©m tÝnh


Sù ®iÒu hßa biÓu hiÖn gen, dï lµ kÝch øng hay øc chÕ, ®Òu cã thÓ thùc hiÖn qua hai
c¬ chÕ ®iÒu hßa d−¬ng tÝnh vµ ©m tÝnh. C¶ hai c¬ chÕ nµy ®Òu liªn quan ®Õn sù tham gia
cña c¸c gen ®iÒu hßa. C¸c gen nµy m· hãa cho c¸c s¶n phÈm trùc tiÕp ®iÒu hßa sù biÓu
hiÖn cña c¸c gen kh¸c. Trong c¬ chÕ ®iÒu hßa d−¬ng tÝnh, s¶n phÈm cña gen ®iÒu hßa
cã vai trß lµm t¨ng sù biÓu hiÖn cña mét hay mét sè gen cÊu tróc. Cßn trong c¸c c¬ chÕ
®iÒu hßa ©m tÝnh, s¶n phÈm cña gen ®iÒu hßa th−êng øc chÕ hoÆc lµm t¾t sù biÓu hiÖn
cña gen cÊu tróc. C¸c c¬ chÕ ®iÒu hßa ©m tÝnh vµ d−¬ng tÝnh ®èi víi c¶ hai hÖ thèng ®iÒu
hßa kÝch øng vµ øc chÕ ®−îc minh häa trªn h×nh 5.1.
ë ch−¬ng 4, chóng ta biÕt r»ng mét gen ®−îc biÓu hiÖn khi ARN polymerase cã thÓ
liªn kÕt vµo promoter cña nã vµ tiÕn hµnh tæng hîp b¶n phiªn m· ARN chøa vïng m·
hãa cña gen. S¶n phÈm cña gen ®iÒu hßa ho¹t ®éng b»ng c¸ch liªn kÕt vµo vÞ trÝ ®iÒu hßa
cña nã (vÞ trÝ liªn kÕt protein ®iÒu hßa, kÝ hiÖu RPBS) th−êng n»m gÇn promoter cña
gen mµ nã ®iÒu hßa. Khi s¶n phÈm cña gen ®iÒu hßa liªn kÕt vµo RPBS, sù phiªn m· gen
cÊu tróc ®−îc ho¹t hãa trong hÖ thèng ®iÒu hßa d−¬ng tÝnh (h×nh 5.1, ph¶i) hoÆc bÞ øc
chÕ hay k×m h·m trong hÖ thèng ®iÒu hßa ©m tÝnh (h×nh 5.1, tr¸i). S¶n phÈm cña c¸c
gen ®iÒu hßa ®−îc gäi lµ c¸c protein ®iÒu hßa, xuÊt hiÖn d−íi mét trong hai d¹ng lµ: 1)
protein ho¹t hãa trong c¸c hÖ thèng ®iÒu hßa d−¬ng tÝnh, vµ 2) protein øc chÕ trong
c¸c hÖ thèng ®iÒu hßa ©m tÝnh. ViÖc c¸c protein ®iÒu hßa cã liªn kÕt vµo RPBS ®−îc hay
kh«ng th−êng phô thuéc vµo sù xuÊt hiÖn c¸c ph©n tö cã kÝch th−íc nhá (nh− c¸c axit
amin, ®−êng hoÆc c¸c s¶n phÈm trao ®æi chÊt kh¸c). Nh÷ng ph©n tö nµy ®−îc gäi chung
lµ c¸c ph©n tö tÝn hiÖu. NÕu c¸c ph©n tö tÝn hiÖu nµy lµm t¨ng c−êng sù biÓu hiÖn cña
gen th× ®−îc gäi lµ c¸c ph©n tö kÝch øng; cßn nÕu lµm h¹n chÕ hay k×m h·m sù biÓu
hiÖn cña gen ®−îc gäi lµ c¸c ph©n tö ®ång øc chÕ.
C¸c ph©n tö kÝch øng vµ ®ång øc chÕ th−êng liªn kÕt vµo protein ®iÒu hßa (ho¹t hãa
hoÆc øc chÕ) vµ lµm thay ®æi cÊu h×nh cña chóng, dÉn ®Õn sù thay ®æi ho¹t tÝnh hoÆc
chøc n¨ng cña nh÷ng protein nµy. Sù thay ®æi cÊu h×nh dÉn ®Õn sù thay ®æi ho¹t tÝnh
hoÆc chøc n¨ng cña c¸c protein nh− vËy ®−îc gäi lµ sù biÕn ®æi dÞ h×nh (xem môc 1.4.4,
ch−¬ng 1). §èi víi c¸c protein ho¹t hãa vµ øc chÕ, sù biÕn ®æi dÞ h×nh g©y ra bëi c¸c ph©n
tö kÝch øng hoÆc ®ång øc chÕ th−êng liªn quan ®Õn sù thay ®æi ¸i lùc liªn kÕt cña chóng
vµo c¸c vÞ trÝ RPBS ë gÇn promoter cña c¸c gen mµ chóng ®iÒu khiÓn.
Trong hÖ thèng ®iÒu hßa kÝch øng vµ ©m tÝnh (h×nh 5.1a, tr¸i), khi kh«ng cã ph©n
tö kÝch øng, protein øc chÕ ë tr¹ng th¸i tù do sÏ liªn kÕt vµo RPBS vµ g©y øc chÕ sù
phiªn m·. Cßn khi cã ph©n tö kÝch øng, phøc hÖ [chÊt kÝch øng/protein øc chÕ] kh«ng thÓ
g¾n ®−îc vµo RPBS, dÉn ®Õn viÖc ARN polymerase sau khi liªn kÕt vµo promoter cã thÓ
khëi ®Çu phiªn m·. Nh− vËy, ë ®©y sù biÓu hiÖn cña gen cÊu tróc chØ diÔn ra khi cã chÊt
kÝch øng.
Trong hÖ thèng ®iÒu hßa k×m h·m vµ ©m tÝnh (h×nh 5.1b, tr¸i), sù phiªn m· c¸c
gen cÊu tróc chØ diÔn ra khi cã chÊt ®ång øc chÕ. Khi cã chÊt ®ång øc chÕ, phøc hÖ
[protein øc chÕ/chÊt ®ång øc chÕ] liªn kÕt vµo RPBS vµ ng¨n c¶n enzym ARN polymerase
tiÕn hµnh phiªn m· c¸c gen cÊu tróc. Khi kh«ng cã chÊt ®ång øc chÕ, protein øc chÕ
kh«ng liªn kÕt ®−îc vµo tr×nh tù RPBS, vµ v× vËy ARN polymerase cã thÓ liªn kÕt ®−îc
vµo promoter vµ khëi ®Çu sù phiªn m· gen cÊu tróc.
Trong hÖ thèng ®iÒu hßa øc chÕ vµ d−¬ng tÝnh (h×nh 5.1b, ph¶i), s¶n phÈm cña gen
®iÒu hßa lµ protein ho¹t hãa liªn kÕt ®−îc vµo RPBS vµ thóc ®Èy sù liªn kÕt cña ARN
polymerase vµo promoter vµ tiÕn hµnh phiªn m· c¸c gen cÊu tróc. Khi chÊt ®ång øc chÕ
xuÊt hiÖn, nã sÏ h×nh thµnh phøc hÖ [protein ho¹t hãa/chÊt ®ång øc chÕ]. Phøc hÖ nµy

136
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

kh«ng thÓ liªn kÕt ®−îc víi RPBS. KÕt qu¶ lµ, ARN polymerase kh«ng thÓ liªn kÕt ®−îc
víi promoter vµ sù phiªn m· gen cÊu tróc kh«ng diÔn ra.
§iÒu hßa ©m tÝnh §iÒu hßa d−¬ng tÝnh
VÞ trÝ g¾n protein
®iÒu hßa VÞ trÝ g¾n protein
Gen ®iÒu hßa Promoter C¸c gen cÊu tróc Gen ®iÒu hßa ®iÒu hßa Promoter C¸c gen cÊu tróc

Liªn kÕt cña yÕu tè øc chÕ lµm


ng¨n c¶n phiªn m·
ARN polymerase kh«ng liªn
kÕt ®−îc vµo promoter nÕu yÕu
tè (protein) ho¹t hãa kh«ng liªn
Protein øc chÕ Protein (yÕu tè) kÕt ®−îc vµo vÞ trÝ ®iÒu hßa
(yÕu tè øc chÕ) ARN polymerase øc chÕ kh«ng ho¹t ®éng

ChÊt kÝch øng ChÊt kÝch øng


VÞ trÝ g¾n protein VÞ trÝ g¾n protein
Gen ®iÒu hßa Promoter ®iÒu hßa C¸c gen cÊu tróc Gen ®iÒu hßa ®iÒu hßa Promoter C¸c gen cÊu tróc

Phiªn m· diÔn ra Phiªn m· diÔn ra

Phøc hÖ chÊt kÝch øng / protein øc chÕ kh«ng liªn Phøc hÖ chÊt kÝch øng / protein ho¹t hãa liªn kÕt
kÕt ®−îc vµo vÞ trÝ ®iÒu hßa ®−îc vµo vÞ trÝ ®iÒu hßa

 a) HÖ thèng ®iÒu hßa kÝch øng (inducible)

§iÒu hßa ©m tÝnh §iÒu hßa d−¬ng tÝnh

VÞ trÝ g¾n protein VÞ trÝ g¾n protein


Gen ®iÒu hßa Promoter ®iÒu hßa C¸c gen cÊu tróc Gen ®iÒu hßa ®iÒu hßa Promoter C¸c gen cÊu tróc

Phiªn m· diÔn ra Phiªn m· diÔn ra

Protein øc chÕ ë tr¹ng th¸i tù do kh«ng liªn Protein ho¹t hãa ë tr¹ng th¸i tù do liªn
kÕt ®−îc vµo vÞ trÝ ®iÒu hßa kÕt ®−îc vµo vÞ trÝ ®iÒu hßa

ChÊt ®ång øc chÕ ChÊt ®ång øc chÕ

VÞ trÝ g¾n protein VÞ trÝ g¾n protein


®iÒu hßa Gen ®iÒu hßa ®iÒu hßa Promoter C¸c gen cÊu tróc
Gen ®iÒu hßa Promoter C¸c gen cÊu tróc

Phiªn m· kh«ng
ARN polymerase kh«ng liªn kÕt
diÔn ra
®−îc vµo promoter nÕu yÕu tè
ho¹t hãa kh«ng liªn kÕt ®−îc
ARN polymerase vµo vÞ trÝ ®iÒu hßa
Phøc hÖ chÊt ®ång øc chÕ / protein øc chÕ liªn Phøc hÖ chÊt ®ång øc chÕ / protein øc chÕ
kÕt ®−îc vµo vÞ trÝ ®iÒu hßa kh«ng liªn kÕt ®−îc vµo vÞ trÝ ®iÒu hßa
 b) HÖ thèng ®iÒu hßa øc chÕ (repressible)
H×nh 5.1. §iÒu hßa ©m tÝnh vµ d−¬ng tÝnh cña c¸c gen biÓu hiÖn kiÓu kÝch øng hoÆc øc chÕ. C¸c protein ®iÒu
hßa cÇn liªn kÕt ®−îc vµo ADN ®Ó "bËt" gen trong ®iÒu hßa d−¬ng tÝnh vµ "t¾t" gen trong ®iÒu hßa ©m tÝnh (nguån:
Snudstad vµ Simmons, 2003)

137
§inh §oµn Long

§Ó hiÓu h¬n c¸c hÖ thèng ®iÒu hßa gen nªu trªn, cÇn ph©n biÖt ®−îc sù kh¸c biÖt
gi÷a chóng, bao gåm: 1) S¶n phÈm cña gen ®iÒu hßa lµ protein ho¹t hãa lµm t¨ng c−êng
biÓu hiÖn cña gen trong ®iÒu hßa d−¬ng tÝnh; nh−ng nÕu ®ã lµ protein øc chÕ, th× nã sÏ
liªn quan ®Õn sù k×m h·m hay øc chÕ biÓu hiÖn cña gen trong ®iÒu hßa ©m tÝnh; 2) ë c¶
hai hÖ thèng ®iÒu hßa ©m tÝnh vµ d−¬ng tÝnh, th× sù ho¹t hãa hay øc chÕ biÓu hiÖn gen
phô thuéc vµo viÖc protein ®iÒu hßa cã liªn kÕt hay kh«ng vµo c¸c vÞ trÝ RPBS.

5.2. §iÒu hßa biÓu hiÖn gen ë prokaryote


ARN polymerase ë vi khuÈn phæ biÕn nhÊt (mang yÕu tè σ70) nhËn ra promoter dùa
vµo ba yÕu tè tr×nh tù, gäi lµ c¸c tr×nh tù liªn øng, lµ “-10”, “-35” vµ “UP”. Khi kh«ng cã
protein ®iÒu hßa, c¸c tr×nh tù nµy quy ®Þnh hiÖu suÊt liªn kÕt cña ARN polymerase vµo
promoter vµ sù khëi ®Çu phiªn m·. Nh×n chung, sù ®iÒu hßa biÓu hiÖn gen cã thÓ ®−îc
thùc hiÖn ë nhiÒu b−íc kh¸c nhau tõ tr−íc phiªn m· ®Õn sau dÞch m·. Nh−ng, kiÓu ®iÒu
hßa c¬ b¶n nhÊt ë prokaryote lµ b−íc khëi ®Çu phiªn m·. Trong thùc tÕ, tÝnh linh ho¹t
trong c¸c c¬ chÕ ®iÒu hßa biÓu hiÖn gen lµ cao h¬n, bao gåm c¸c kiÓu ®iÒu hßa sau khëi
®Çu phiªn m·, nh− sù ng¨n c¶n kÕt thóc phiªn m· hay ®iÒu hßa dÞch m·.

5.2.1. C¸c nguyªn t¾c ®iÒu hßa phiªn m·

5.2.1.1. BiÓu hiÖn gen ®−îc ®iÒu khiÓn bëi c¸c protein ®iÒu hßa
Nh− ®· nªu ë trªn, sù biÓu hiÖn cña nhiÒu gen ë c¶ prokaryote vµ eukaryote phô
thuéc chÆt chÏ vµo m«i tr−êng, cô thÓ h¬n lµ c¸c tÝn hiÖu cña m«i tr−êng. ë vi khuÈn, c¸c
tÝn hiÖu ®iÓn h×nh chÝnh lµ c¸c ph©n tö cã mÆt trong m«i tr−êng sèng. “Th«ng tin” tõ c¸c
tÝn hiÖu nµy ®−îc “truyÒn” tíi gen qua c¸c protein ®iÒu hßa. Chóng ta nhí l¹i c¸c b−íc
khëi ®Çu phiªn m· (ch−¬ng 3). §Çu tiªn, ARN polymerase liªn kÕt vµo promoter trong
phøc hÖ khëi ®Çu phiªn m· “®ãng”. Sau ®ã, phøc hÖ nµy chuyÓn thµnh d¹ng “më” víi hai
m¹ch cña ph©n tö ADN t¹i promoter gi·n xo¾n, t¸ch ra côc bé, råi ARN polymerase b¾t
®Çu sù phiªn m·. VËy, c¸c protein ®iÒu hßa ho¹t ®éng thÕ nµo? C¸c protein ho¹t hãa vµ
øc chÕ t¸c ®éng vµo b−íc nµo cña sù khëi ®Çu phiªn m·? §iÒu nµy thùc tÕ phô thuéc vµo
tõng promoter vµ protein ®iÒu hßa. Sau ®©y lµ hai vÝ dô ®iÓn h×nh.

5.2.1.2. NhiÒu promoter ®−îc ®iÒu khiÓn qua ¸i lùc gi÷a ARN polymerase víi ADN
Víi nhiÒu promoter, khi kh«ng cã c¸c protein ®iÒu hßa, ARN polymerase th−êng liªn
kÕt rÊt yÕu, bëi v× nh÷ng promoter nµy thiÕu mét trong c¸c yÕu tè cña tr×nh tù liªn øng,
hoÆc do chóng kh«ng hoµn chØnh. Nh−ng, do “kÏ hë” cña liªn kÕt yÕu, ®«i khi ARN
polymerase vÉn liªn kÕt ®−îc víi promoter vµ khëi ®Çu sù phiªn m·. §iÒu nµy dÉn ®Õn sù
biÓu hiÖn gen kiÓu c¬ ®Þnh, nh−ng chØ ë møc c¬ b¶n (tèi thiÓu). Sù liªn kÕt cña ARN
polymerase vµo promoter ë ®©y lµ mét kiÓu giíi h¹n tèc ®é biÓu hiÖn gen (h×nh 5.2a).
§Ó ®iÒu hßa ©m tÝnh mét promoter nh− vËy, chØ cÇn cã mét protein øc chÕ g¾n vµo
mét vÞ trÝ bªn trong hoÆc gèi lªn promoter. VÞ trÝ nµy ®−îc gäi lµ tr×nh tù ®iÒu hµnh
(operator). Do sù liªn kÕt cña protein øc chÕ vµo operator, ARN polymerase kh«ng g¾n
®−îc vµo promoter vµ sù phiªn m· kh«ng ®−îc thùc hiÖn (h×nh 5.2b). Ng−îc l¹i, ®Ó ®iÒu
hßa d−¬ng tÝnh promoter nµy, mét protein ho¹t hãa cã thÓ gióp ARN polymerase liªn kÕt
dÔ dµng h¬n víi promoter. HiÖn t−îng nµy x¶y ra mét c¸ch ®iÓn h×nh nh− sau: protein
ho¹t hãa dïng mét phÇn ph©n tö cña nã ®Ó liªn kÕt víi ADN t¹i vÞ trÝ gÇn promoter, cßn
phÇn kh¸c t−¬ng t¸c víi ARN polymerase, nhê vËy ®−a enzym nµy ®Õn gÇn promoter
(h×nh 5.2c). C¬ chÕ nµy ®−îc gäi lµ sù liªn hîp ADN/protein. Vai trß cña chÊt ho¹t hãa
ë ®©y chØ ®¬n thuÇn cã vai trß “®Ýnh kÕt” gi÷a ADN vµ ARN polymerase. Nãi c¸ch kh¸c,

138
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

vai trß cña nã lµ mang enzym tíi gÇn promoter. Mét khi yÕu tè ho¹t hãa cã mÆt, sù h×nh
thµnh phøc hÖ “më” t¹i promoter cã thÓ h×nh thµnh tù ph¸t vµ sù phiªn m· diÔn ra.
Operon lac ë E. coli ho¹t ®éng víi sù tham gia cña mét protein ho¹t hãa vµ mét
protein øc chÕ theo kiÓu trªn ®©y. Chóng ta sÏ xem ho¹t ®éng cña operon nµy ë phÇn sau.

5.2.1.3. Qui t¾c dÞ h×nh ®iÒu khiÓn sau b−íc ARN polymerase ®Ýnh kÕt vµo promoter
Kh«ng ph¶i mäi
promoter ®Òu ®−îc ®iÒu a)
khiÓn b»ng c¬ chÕ gièng ARN polymerase
nhau. Theo mét c¬ chÕ kh¸c,
ARN polymerase cã thÓ liªn
kÕt s½n víi mét phøc hÖ khëi
®Çu phiªn m· “®ãng”. Nh−ng
phøc hÖ nµy kh«ng tù chuyÓn
Operator
sang ®−îc tr¹ng th¸i “më” Phiªn m· ë
møc c¬ b¶n
khi kh«ng cã protein ho¹t VÞ trÝ liªn kÕt cña
hãa. Khi cã mÆt protein ho¹t protein ho¹t hãa Promoter
hãa, phøc hÖ “®ãng” chuyÓn
b) Protein øc chÕ
thµnh phøc hÖ “më”, vµ sù
Kh«ng cã
khëi ®Çu phiªn m· diÔn ra.
phiªn m·
§iÓn h×nh lµ c¸c protein ho¹t
hãa sau khi t−¬ng t¸c víi c)
phøc hÖ khëi ®Çu phiªn m· Protein ho¹t hãa
“®ãng”, chóng kÝch øng sù ARN polymerase
thay ®æi cÊu h×nh hoÆc cña
Phiªn m· ë møc
ARN polymerase hoÆc cña t¨ng c−êng
ADN theo qui t¾c dÞ h×nh,
vµ chuyÓn phøc hÖ “®ãng”
thµnh “më”. ë ch−¬ng 1,
chóng ta biÕt qui t¾c dÞ h×nh
H×nh 5.2. Ho¹t hãa gen bëi sù huy ®éng ARN polymerase.
lµ mét trong nh÷ng qui t¾c c¬ a) Khi kh«ng cã protein ®iÒu hßa, ARN polymerase cã thÓ liªn kÕt tù ph¸t víi
b¶n nhÊt trong ®iÒu hßa chøc promoter vµ khëi ®Çu phiªn m· (ë møc c¬ b¶n), b) Sù liªn kÕt cña protein øc
n¨ng vµ ho¹t tÝnh protein. chÕ vµo operator ng¨n c¶n ARN polymerase liªn kÕt vµo promoter, qua ®ã
øc chÕ sù phiªn m·, c) ARN polymerase ®−îc c¸c protein ho¹t hãa huy
Mét vÝ dô lµ c¸c protein ®éng ®Õn gen lµm t¨ng c−êng sù phiªn m· (gen biÓu hiÖn ë møc tèi ®a)
Cyclin ho¹t hãa c¸c enzym
Cdk tham gia ®iÒu khiÓn chu
tr×nh tÕ bµo. C¸c Cyclin ho¹t
hãa ®−îc enzym nµy b»ng c¸ch liªn kÕt vµo enzym vµ chuyÓn chóng tõ tr¹ng th¸i kh«ng
ho¹t ®éng sang tr¹ng th¸i ho¹t ®éng (h×nh 1.12). ë ®©y, chóng ta xem qui t¾c dÞ h×nh
®−îc vËn dông trong ®iÒu hßa phiªn m· ë hai promoter lµ glnA vµ metT. Trong tr−êng
hîp ë glnA, chÊt ho¹t hãa (NtrC) t−¬ng t¸c víi ARN polymerase vµ thóc ®Èy phøc hÖ khëi
®Çu phiªn m· “®ãng” chuyÓn thµnh “më”. Cßn trong tr−êng hîp metT, chÊt ho¹t hãa
(MerR) t¹o ra hiÖu øng t−¬ng tù nh−ng b»ng sù thay ®æi cÊu h×nh ADN (promoter).
Còng ph¶i nãi lµ sù ®iÒu hßa phiªn m· t¹i promoter trong thùc tÕ lµ ®a d¹ng h¬n.
Ch¼ng h¹n nh−, nhiÒu c¬ chÕ kh¸c nhau cã thÓ ®−îc kÕt hîp ®ång thêi, hoÆc sù k×m
h·m phiªn m· kh«ng nhÊt thiÕt ph¶i qua sù ng¨n c¶n liªn kÕt gi÷a ARN polymerase vµ
promoter.

139
§inh §oµn Long

a) Protein ®iÒu hßa c)


Protein ho¹t hãa
Protein
bÎ cong ARN polymerase
ADN ADN
ADN
b)

H×nh 5.3. Sù t−¬ng t¸c gi÷a c¸c protein liªn kÕt ADN. a) T−¬ng t¸c gi÷a c¸c
protein ®iÒu hßa liªn kÕt gÇn nhau. b) T−¬ng t¸c gi÷a c¸c protein ®iÒu hßa liªn kÕt
xa nhau, h×nh thµnh "vßng th¾t" trªn ph©n tö ADN. c) "Protein bÎ cong ADN" gióp
®−a mét protein ho¹t hãa liªn kÕt ë xa ®Õn gÇn phøc hÖ khëi ®Çu phiªn m· vµ
ADN t−¬ng t¸c víi ARN polymerase.

5.2.1.4. Sù ®iÒu khiÓn biÓu hiÖn gen tõ kho¶ng c¸ch xa vµ cÊu tróc vßng th¾t ADN
C¸c protein ®iÒu hßa th−êng liªn kÕt ë vÞ trÝ gÇn promoter cña gen, nh−ng ®iÒu nµy
kh«ng ph¶i lóc nµo còng ®óng. §«i khi, protein ®iÒu hßa liªn kÕt vµo ph©n tö ADN t¹i vÞ
trÝ c¸ch gen rÊt xa. Lóc nµy, ®Ó protein ®iÒu hßa cã thÓ t−¬ng t¸c ®−îc víi gen, th−êng cã
sù h×nh thµnh c¸c “vßng th¾t” trªn ph©n tö ADN (h×nh 5.3b). Trong thùc tÕ, protein ho¹t
hãa phiªn m· NtrC (®· ®−îc nh¾c ®Õn ë trªn) ho¹t ®éng theo c¸ch nµy. VÞ trÝ liªn kÕt
ADN cña nã n»m ng−îc dßng promoter (vÒ phÝa ®Çu 5’ cña m¹ch m· hãa) 150 bp. Protein
nµy thËm chÝ cã thÓ ho¹t hãa gen ngay c¶ khi nã liªn kÕt ë vÞ trÝ xa h¬n (1 kb hoÆc h¬n).
Trong viÖc ®iÒu khiÓn biÓu hiÖn gen tõ xa nh− vËy, c¸c vßng th¾t ADN cã thÓ cã ®é dµi
®¹t ®Õn 3 kb. Mét c¸ch kh¸c ®Ó ®−a c¸c tr×nh tù ADN ë xa ®Õn gÇn nhau lµ nhê c¸c
protein liªn kÕt vµo ®o¹n tr×nh tù ë gi÷a (h×nh 5.3c). Nh÷ng protein “kÕt cÊu” nh− vËy
®−îc t×m thÊy trong c¬ chÕ t¸i tæ hîp ®Æc hiÖu (xem ch−¬ng 6). ë cuèi ch−¬ng, chóng ta
còng sÏ thÊy kiÓu ®iÒu khiÓn “tõ xa” ë eukaryote cßn phæ biÕn h¬n.
5.2.1.5. Qui t¾c dÞ h×nh vµ liªn kÕt ADN - protein trong ®iÒu hßa biÓu hiÖn gen
Trong nhiÒu tr−êng hîp, sù ho¹t hãa gen ®−îc thùc hiÖn b»ng sù t−¬ng t¸c ®¬n gi¶n
gi÷a c¸c ®¹i ph©n tö, vÝ dô nh− gi÷a ADN vµ ARN polymerase, tõ ®ã huy ®éng bé m¸y
phiªn m· tËp trung tíi promoter. Trong nh÷ng tr−êng hîp kh¸c, gen ®−îc ®iÒu hßa bëi
qui t¾c dÞ h×nh. NghÜa lµ, mét protein ho¹t hãa t−¬ng t¸c víi enzym ARN polymerase ®·
liªn kÕt s½n víi ADN vµ lµm thay ®æi cÊu h×nh hoÆc cña enzym vµ/hoÆc cña promoter,
qua ®ã sù khëi ®Çu phiªn m· cã thÓ diÔn ra.
C¶ hai qui t¾c liªn kÕt ADN-protein vµ dÞ h×nh ®Òu cã nh÷ng vai trß kh¸c n÷a trong
®iÒu hßa ho¹t ®éng cña gen vµ c¸ch t−¬ng t¸c gi÷a chóng cã thÓ phøc t¹p h¬n. VÝ dô nh−
hai hay nhiÒu protein ®iÒu hßa cïng t−¬ng t¸c víi nhau vµ víi ADN; qua ®ã, chóng hç trî
nhau cïng t¨ng c−êng liªn kÕt vµo vÞ trÝ gen ®−îc ®iÒu khiÓn. KiÓu t−¬ng t¸c nµy t¹o nªn
t¸c dông “hiÖp lùc” vµ cã thÓ nhanh chãng chuyÓn mét gen tõ tr¹ng th¸i kh«ng biÓu hiÖn
sang tr¹ng th¸i biÓu hiÖn tèi ®a. Sù “hiÖp lùc” cña c¸c protein ho¹t hãa cßn cã vai trß tÝch
hîp tÝn hiÖu. §ã lµ khi c¸c gen chØ biÓu hiÖn khi ®ång thêi cã mÆt nhiÒu tÝn hiÖu kh¸c
nhau. Mét vÝ dô vÒ kiÓu ®iÒu hßa nµy lµ sù biÓu hiÖn c¸c gen ë phag¬ λ (xem ch−¬ng 3).

140
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

5.2.1.6. Khëi ®Çu phiªn m· kh«ng ph¶i lµ c¬ chÕ ®iÒu hßa duy nhÊt ë tÊt c¶ c¸c gen
Nh− nªu ë trªn, sù ®iÒu hßa ho¹t ®éng cña c¸c gen th«ng qua b−íc khëi ®Çu phiªn
m· lµ mét c¬ chÕ ®iÒu hßa gen c¬ b¶n nhÊt, kh«ng chØ ë prokaryote mµ c¶ ë eukaryote.
Nh−ng, mét sè vÝ dô ë phÇn sau cho thÊy: ë vi khuÈn ngoµi c¬ chÕ ®iÒu hßa ho¹t ®éng gen
ë b−íc khëi ®Çu phiªn m· cßn cã c¸c c¬ chÕ ®iÒu hßa biÓu hiÖn gen kh¸c n÷a, bao gåm c¸c
b−íc kÐo dµi phiªn m·, hoµn thiÖn mARN, dÞch m· tæng hîp protein.

5.2.2. Sù ®iÒu hßa khëi ®Çu phiªn m· ë vi khuÈn


Môc nµy tr×nh bµy c¸ch thøc ho¹t ®éng cña côm gen m· hãa c¸c enzym ph©n gi¶i
®−êng lactose (operon Lac) ë vi khuÈn E. coli. Qua ®ã, chóng ta sÏ thÊy c¸ch mµ c¸c
protein ®iÒu hßa (ho¹t hãa vµ øc chÕ) cïng phèi hîp ®iÒu khiÓn sù biÓu hiÖn cña c¸c gen.

5.2.2.1. Operon Lac ®−îc ®iÒu khiÓn ®ång thêi bëi c¸c protein ho¹t hãa vµ øc chÕ
Operon Lac lµ mét côm gen
trong hÖ gen E. coli gåm 3 gen cÊu a)
tróc (lacZ, lacY vµ lacA) n»m liÒn lacZ lacY lacA
kÒ nhau (h×nh 5.4a). Gäi lµ VÞ trÝ CAP operator
operon bëi sù phiªn m· cña c¸c
gen nµy diÔn ra ®ång thêi do dïng promoter
chung mét promoter. Promoter b) ARN polymerase
cña operon Lac (promoter lac),
n»m gÇn ®Çu 5’ cña LacZ, ®iÒu
khiÓn sù phiªn m· tæng hîp mét
ph©n tö mARN duy nhÊt. Nh−ng,
ph©n tö mARN nµy chøa th«ng
tin m· hãa cña nhiÒu h¬n mét b1)
lacZ
gen, nªn ®−îc gäi lµ mARN ®a
cistron. Ph©n tö mARN nµy sau BiÓu hiÖn ë møc c¬ b¶n
®ã ®−îc dÞch m· cho ra ba lo¹i
protein kh¸c nhau. Gen lacZ m·
hãa enzym β-galactosidase. b2) LacI lacZ
Enzym nµy xóc t¸c ph¶n øng thñy
ph©n lactose thµnh glucose vµ Kh«ng biÓu hiÖn
galactose, ®Ó cung cÊp n¨ng l−îng
cho tÕ bµo. Ngoµi ra, β-
galactosidase cßn xóc t¸c ph¶n ARN polymerase
øng chuyÓn hãa mét phÇn lactose b3) CAP lacZ
(liªn kÕt β-1,4-D-glycoside cña
glucose vµ galactose) thµnh mét BiÓu hiÖn ë
®ång ph©n lµ allolactose (liªn kÕt møc cao(tèi ®a)
β-1,6-D-glycoside cña glucose vµ
galactose). Chóng ta sÏ thÊy ë H×nh 5.4. Sù biÓu hiÖn cña operon Lac. a) CÊu tróc cña operon
phÇn sau, allolactose (chø kh«ng Lac, víi ba gen cÊu tróc (lacZ, Y vµ A). Tr×nh tù liªn kÕt CAP vµ
ph¶i lactose) chÝnh lµ ph©n tö kÝch promoter dµi kho¶ng 20bp. Operator n»m gèi lªn promoter, cßn vÞ trÝ
CAP ngay phÝa tr−íc promoter. b) Sù cã mÆt hay v¾ng mÆt glucose
øng sù biÓu hiÖn cña operon Lac.
vµ lactose ®iÒu khiÓn møc biÓu hiÖn cña c¸c gen cÊu tróc. Møc biÓu
Gen lacY m· hãa protein vËn hiÖn cao (b3) cÇn cã lactose vµ kh«ng cã glucose; møc biÓu hiÖn c¬
chuyÓn permease. Permease n»m b¶n (b1) khi m«i tr−êng cã c¶ lactose vµ glucose; operon kh«ng ®−îc
xuyªn mµng tÕ bµo vi khuÈn vµ cã phiªn m· (b2) khi m«i tr−êng kh«ng cã lactose.
vai trß vËn chuyÓn chñ ®éng
lactose tõ m«i tr−êng ngo¹i bµo

141
§inh §oµn Long

vµo trong tÕ bµo. Gen lacA m· hãa enzym thiogalactoside transacetylase, cã vai trß gi¶i
®éc tÕ bµo ®èi víi c¸c hîp chÊt thiogalactoside còng ®−îc vËn chuyÓn vµo tÕ bµo khi
permease ho¹t ®éng.
Nh÷ng gen nµy chØ ®−îc biÓu hiÖn m¹nh khi trong m«i tr−êng cã lactose vµ kh«ng
cã glucose. Cã hai protein ®iÒu hßa tham gia ®iÒu khiÓn ho¹t ®éng cña operon Lac, ®ã lµ
protein ho¹t hãa CAP vµ protein øc chÕ LacI. LacI ®−îc m· hãa bëi gen lacI n»m
gÇn operon Lac vÒ phÝa ®Çu 5’, vµ lµ mét gen c¬ ®Þnh. CAP cßn cã tªn lµ CRP (cAMP
receptor protein; hay protein thô thÓ cña cAMP). Gen m· hãa CAP n»m xa operon Lac.
C¶ hai protein ®iÒu hßa CAP vµ LacI ®Òu lµ c¸c protein liªn kÕt ADN víi vÞ trÝ liªn kÕt
t−¬ng øng n»m gÇn ®Çu 5’ (víi CAP) vµ 3’ (víi LacI; vÞ trÝ nµy ®−îc gäi lµ tr×nh tù ®iÒu
hµnh, hay Operator) cña promoter lac (h×nh 5.4).
Mçi protein ®iÒu hßa “tiÕp nhËn” mét tÝn hiÖu kh¸c nhau tõ m«i tr−êng vµ “truyÒn
tin” tíi operon Lac. NÕu CAP truyÒn tÝn hiÖu vÒ viÖc m«i tr−êng kh«ng cã glucose, th×
LacI th«ng b¸o trong m«i tr−êng cã lactose. HÖ thèng ®iÒu khiÓn operon Lac ho¹t ®éng
nh− sau: LacI chØ liªn kÕt ®−îc vµo Operator vµ øc chÕ operon Lac khi m«i tr−êng kh«ng
cã lactose. Khi cã mÆt lactose, LacI bÞ “bÊt ho¹t” vµ operon Lac ®−îc “gi¶i nÐn” vµ biÓu
hiÖn. Ng−îc l¹i, protein CAP khi liªn kÕt vµo operon Lac l¹i cã vai trß thóc ®Èy operon
ho¹t ®éng. Tuy vËy, CAP chØ liªn kÕt m¹nh khi m«i tr−êng kh«ng cã glucose. V× vËy, sù
phèi hîp cña hai protein ®iÒu hßa CAP vµ LacI sÏ ®¶m b¶o cho operon chØ biÓu hiÖn
m¹nh khi trong m«i tr−êng cã lactose, ®ång thêi kh«ng cã glucose (h×nh 5.4b).

5.2.2.2. CAP vµ LacI cã ¶nh h−ëng ®èi lËp ®Õn liªn kÕt promoter - ARN polymerase
ë operon Lac, tr×nh tù ®iÒu hµnh O gåm 21 bp víi tr×nh tù ë hai ®Çu lÆp l¹i ®¶o
chiÒu, ®èi xøng qua cÆp nucleotide sè 11 (h×nh 5.5b). CÊu tróc ®èi xøng cña operator
®−îc nhËn biÕt t−¬ng øng bëi hai tiÓu phÇn cña LacI. Do tr×nh tù liªn kÕt cña LacI t¹i
operator phñ lªn promoter lac mét phÇn (h×nh 5.5a), nªn khi LacI liªn kÕt vµo operator,
nã ng¨n c¶n sù liªn kÕt cña ARN polymerase vµo promoter. Cßn ®èi víi CAP, khi thiÕu
v¾ng protein nµy, ARN polymerase chØ liªn kÕt ®−îc rÊt yÕu vµo promoter. Së dÜ nh− vËy,
v× promoter lac thiÕu tr×nh tù UP, ®ång thêi tr×nh tù liªn øng “-35” cña nã kh«ng hoµn
chØnh. Sù kh«ng hoµn chØnh cña c¸c tr×nh tù liªn øng lµ ®Æc ®iÓm ®iÓn h×nh cña nhiÒu
promoter ®−îc ®iÒu hßa biÓu hiÖn bëi c¸c protein ho¹t hãa.

a) CÊu tróc vïng ®iÒu khiÓn operon Lac


Tr×nh tù liªn kÕt ARN polymerase liªn kÕt vµ bao phñ ®o¹n tr×nh tù
CAP nµy
mARN
5’ CA A C GCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACA TTTATGCCTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCT
3’ GTTGCGTTAATTACACTCAATCGAGTGAGTAATCCGTGGGGTCCGAAATGTAAATACGGAGGCCGAGCATACAACACACCTTAACACTCGCCTATTGTTAAAGTGTGTCCTTTGTCGA
-35 -10 +1

LacI liªn kÕt vµ bao phñ


b) Tr×nh tù operator (O) cña operon Lac
®o¹n tr×nh tù nµy (operator)
5’ AATTGTGAGCGGATAACAATT
TTAACACTCGCCTATTGTTAA
3’

2 tr×nh tù lÆp l¹i ®¶o chiÒu qua cÆp nucleotide


H×nh 5.5. CÊu tróc vïng ®iÒu khiÓn cña operon Lac. a) Tr×nh tù nucleotide vµ cÊu tróc vïng ®iÒu khiÓn cho
thÊy vÞ trÝ CAP ngay phÝa tr−íc promoter, cßn tr×nh tù liªn kÕt cña protein øc chÕ LacI n»m "gèi" lªn promoter. b)
Operator (O) gåm hai ®o¹n tr×nh tù lÆp l¹i ®¶o chiÒu, ®èi xøng qua cÆp nucleotide sè 11.

142
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

Còng gièng nh− LacI, CAP lµ mét protein cã hai chuçi polypeptide liªn kÕt vµo
mét tr×nh tù ADN cã kÝch th−íc t−¬ng ®−¬ng tr×nh tù ®iÒu hµnh O, nh−ng kh¸c vÒ
tr×nh tù nucleotide. Khi CAP liªn kÕt vµo vÞ trÝ nµy, nã ®ång thêi thóc ®Èy vµ huy ®éng
ARN pol ®Ýnh kÕt vµo promoter. Sù liªn kÕt phèi hîp nµy lµm t¨ng tÝnh æn ®Þnh cña
liªn kÕt ®−îc h×nh thµnh gi÷a ARN pol vµ promoter. Sau ®©y, chóng ta xem chi tiÕt c¬
chÕ ®iÒu hßa bëi CAP.
5.2.2.3. CAP cã mét miÒn liªn kÕt ADN vµ mét miÒn ho¹t hãa
CAP ho¹t hãa operon Lac b»ng viÖc huy ®éng enzym ARN polymerase ®Õn
promoter. Mét sè ph©n tö CAP ®ét biÕn liªn kÕt ®−îc vµo promoter, nh−ng kh«ng ho¹t
hãa ®−îc operon. Nh÷ng ®ét biÕn nµy cho thÊy, sù ho¹t hãa cña CAP kh«ng phô thuéc
®¬n thuÇn vµo viÖc liªn kÕt víi operon, mµ yÕu tè kh«ng kÐm quan träng lµ CAP ®ång
thêi ph¶i cã mét miÒn ho¹t hãa (vÞ trÝ tiÕp xóc víi ARN polymerase) míi cã thÓ ho¹t
hãa ®−îc operon. Vïng ho¹t hãa nµy t−¬ng t¸c víi miÒn ®Çu C cña tiÓu phÇn α thuéc
ARN polymerase (αCTD).
§Õn ®©y, chóng ta nhí l¹i r»ng, ARN polymerase ë E. coli gåm 6 tiÓu phÇn
(polypeptide) víi 2 tiÓu phÇn α. Trong c¸c tiÓu phÇn α nµy cã mét ®o¹n tr×nh tù linh ho¹t
®Çu N, ®−îc gäi lµ ®o¹n nèi linh ho¹t αNTD. PhÇn chÝnh cña αNTD n»m s©u trong
ph©n tö, nh−ng mét ®o¹n ®Çu N cña chuçi polypeptide nµy béc lé ra ngoµi, gäi lµ αCTD,
vµ th−êng liªn kÕt víi yÕu tè
UP cña c¸c promoter. ë operon
α
Lac, v× kh«ng cã yÕu tè UP, αCTD β
NTD β’
nªn thay vµo viÖc liªn kÕt víi
promoter, αCTD sÏ liªn kÕt vµo
miÒn ho¹t hãa cña CAP (h×nh
5.6). V× vËy, khi CAP liªn kÕt CAP lacZ
vµo promoter, nã sÏ huy ®éng
ARN polymerase tËp trung t¹i VÞ trÝ liªn -35 -10
vÞ trÝ nµy. Mét c©u hái ®Æt ra kÕt CAP
lµ: B»ng c¸ch nµo c¸c protein
H×nh 5.6. Protein CAP ho¹t hãa operon Lac. CAP ®−îc ARN
®iÒu hßa, nh− CAP vµ LacI, polymerase nhËn biÕt bëi ®Çu αCTD thuéc chuçi α cña enzym. αCTD
nhËn ra ®−îc c¸c vÞ trÝ liªn kÕt ®ång thêi liªn kÕt víi ADN sau khi g¾n vµo CAP. B»ng c¸ch nµy, CAP
®Æc hiÖu cña chóng trªn ADN? huy ®éng ®−îc ARN polymerase tíi promoter lac.
5.2.2.4. CAP vµ LacI liªn kÕt ADN qua c¸c mÉu h×nh (motif) c¬ b¶n
C¸c nghiªn cøu cÊu tróc cña c¸c protein ®iÒu hßa ë vi khuÈn (bao gåm CAP vµ
LacI) cho thÊy, xÐt vÒ chi tiÕt c¸c protein nµy kh¸c nhau vÒ c¸ch ho¹t ®éng. Nh−ng, c¸ch
nhËn biÕt tr×nh tù ADN ®Æc hiÖu cña chóng th× t−¬ng ®èi gièng nhau.
Trong tr−êng hîp ®iÓn h×nh, c¸c protein ®iÒu hßa th−êng gåm hai chuçi polypeptide
gièng nhau. T−¬ng øng víi chóng, tr×nh tù liªn kÕt trªn ADN th−êng lµ c¸c tr×nh tù
ng¾n, lÆp l¹i ®¶o chiÒu (h×nh 5.5b). Mçi chuçi polypeptide cña protein ®iÒu hßa liªn kÕt
víi mét bªn cña ®o¹n tr×nh tù ADN nhËn biÕt. §Ó liªn kÕt vµo ADN, protein ®iÒu hßa
th−êng dïng cÊu tróc bËc 2 phæ biÕn lµ “xo¾n – uèn – xo¾n” vµ cµi mét chuçi xo¾n α vµo
khe chÝnh cña ph©n tö ADN sîi kÐp (h×nh 5.7a). Nh− nªu ë ch−¬ng 1, nhê cÊu h×nh t−¬ng
®ång nh− vËy, c¸c axit amin trªn bÒ mÆt ph©n tö protein cã thÓ t−¬ng t¸c ®−îc víi c¸c
gèc thuéc c¸c baz¬ nit¬. Sù t−¬ng t¸c nµy cã thÓ th«ng qua c¸c liªn kÕt hydro (trùc tiÕp
hoÆc gi¸n tiÕp qua c¸c ph©n tö n−íc), hoÆc bëi lùc Van der Waals. §Æc ®iÓm cña nh÷ng
liªn kÕt nµy trong t−¬ng t¸c protein-ADN ®· ®−îc nªu ë ch−¬ng 1. H×nh 5.7b minh häa
mét vÝ dô vÒ sù t−¬ng t¸c gi÷a mét protein víi tr×nh tù ADN ®Æc hiÖu qua khe chÝnh.

143
§inh §oµn Long

Chuçi xo¾n thø a) b)


hai trong cÊu tróc
xo¾n-uèn-xo¾n th−êng
n»m v¾t ngang khe
chÝnh vµ tiÕp xóc víi
phÇn khung cña

VÞ trÝ t−¬ng t¸c protein - ADN


ADN, võa ng¨n c¶n R Gln33
sù t¸c ®éng vµo vÞ trÝ Gln44
nµy cña c¸c ph©n tö
kh¸c, võa bæ sung Ser45

thªm lùc liªn kÕt gi÷a


protein ®iÒu hßa vµ R Asn55

ADN. KiÓu liªn kÕt A


Lys4
cña protein ®iÒu hßa G
víi ADN trªn ®©y
kh«ng chØ ®óng ®èi G

víi CAP vµ LacI, mµ


cßn gÆp ë nhiÒu
protein ®iÒu hßa kh¸c
ë vi khuÈn, nh− CI vµ H×nh 5.7. T−¬ng t¸c gi÷a protein ®iÒu hßa vµ ADN. a) Mét kiÓu liªn kÕt ®iÓn
Cro ë phag¬ λ (xem h×nh, trong ®ã protein ®iÒu hßa cã motif xo¾n-uèn-xo¾n liªn kÕt vµo ADN b»ng viÖc
ch−¬ng 3). "cµi" chuçi xo¾n α (kÝ hiÖu R) vµo khe chÝnh cña ADN; protein nµy liªn kÕt ë d¹ng
phøc kÐp (dimer) víi 2 tr×nh tù ADN lÆp l¹i ®¶o chiÒu; b) Liªn kÕt hydro h×nh thµnh
XÐt chi tiÕt vÒ gi÷a protein øc chÕ cI (ë phag¬ λ) víi khe chÝnh cña ph©n tö ADN. C¸c axit amin
ho¹t ®éng cña c¸c trªn h×nh t¹o liªn kÕt hydro víi c¸c baz¬ nit¬ n»m trong khe chÝnh thuéc tr×nh tù nhËn
protein ®iÒu hßa, mét biÕt cña promoter.
sè kh¸c biÖt ®−îc t×m
thÊy nh− sau:
- ë operon Lac, LacI thùc tÕ cã Operator
bèn (chø kh«ng ph¶i hai) tiÓu phÇn, bëi
ngoµi hai tiÓu phÇn liªn kÕt vµo tr×nh tù
LacI
O s¬ cÊp, hai tiÓu phÇn kh¸c cña nã
th−êng liªn kÕt vµo mét trong hai tr×nh
Promotor Operator Operator
tù O thø cÊp (n»m c¸ch tr×nh tù O s¬
cÊp 90 bp vÒ ®Çu 5’, vµ 400 bp vÒ ®Çu
3’). Víi ®Æc ®iÓm nµy, khi LacI liªn kÕt H×nh 5.8. Protein øc chÕ LacI liªn kÕt vµo hai tr×nh tù
vµo operator, ®o¹n ADN quanh operon operator cña operon Lac ë d¹ng hai ®«i phøc kÐp. Vßng
Lac cã cÊu tróc “th¾t nót” (h×nh 5.8) vµ xo¾n ADN h×nh thµnh gi÷a hai vÞ trÝ liªn kÕt cña LacI vµo tr×nh
tù operator s¬ cÊp vµ operator thø cÊp n»m ng−îc dßng
lµm t¨ng hiÖu qu¶ ng¨n c¶n phiªn m·.
promoter. Mçi h×nh trßn minh häa mét tiÓu phÇn (chuçi
- Trong mét sè tr−êng hîp, c¸c polypeptide) cña LacI.
vïng ngoµi cÊu tróc “xo¾n-uèn-xo¾n”
cña protein còng liªn kÕt ®−îc víi ADN.
Ch¼ng h¹n nh− protein øc chÕ cI ë phag¬ λ cã thÓ sö dông ®Çu N tËn cïng ®Ó liªn kÕt víi
ADN. Nh÷ng ®o¹n polynucleotide nµy quÊn quanh ADN vµ t−¬ng t¸c víi khe phô ë mÆt
sau chuçi xo¾n ADN (h×nh 5.7b).
- Trong nhiÒu tr−êng hîp, sù liªn kÕt víi protein kh«ng lµm thay ®æi cÊu h×nh
ADN. Nh−ng trong c¸c tr−êng hîp kh¸c, sù t−¬ng t¸c protein-ADN cã thÓ t¹o nªn nh÷ng
cÊu tróc ADN biÕn d¹ng. Cô thÓ ë operon Lac, khi protein CAP liªn kÕt vµo ADN, nã “bÎ
cong” chuçi xo¾n kÐp vµ lµm chuçi xo¾n quÊn quanh nã mét phÇn. §©y còng lµ mét vÝ dô
vÒ sù t−¬ng t¸c gi÷a c¸c phÇn protein n»m ngoµi cÊu tróc “xo¾n-uèn-xo¾n” víi c¸c tr×nh

144
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

tù ADN n»m ngoµi promoter (võa nªu trªn). Ngoµi ra, ®«i khi protein ®iÒu hßa sau khi
liªn kÕt cã thÓ vÆn xo¾n tr×nh tù ADN t¹i promoter theo chiÒu ngang trôc chuçi xo¾n.
Ph¶i nãi thªm r»ng, kh«ng ph¶i mäi protein ®iÒu hßa ë prokaryote ®Òu liªn kÕt
ADN bëi cÊu tróc “xo¾n-uèn-xo¾n”. Ch¼ng h¹n nh−, protein øc chÕ Arc ë phag¬ P22
(phag¬ nµy g©y nhiÔm ë Salmonella), còng dïng cÊu tróc protein kÐp (dimer) cña nã ®Ó
liªn kÕt vµo operator cã cÊu tróc lÆp l¹i ®¶o chiÒu, nh−ng nã kh«ng dïng chuçi xo¾n α ®Ó
cµi vµo phÇn khe chÝnh cña ADN, mµ thay vµo ®ã lµ sö dông cÊu tróc mÆt ph¼ng β.

5.2.2.5. CAP vµ LacI ®−îc c¸c ph©n tö tÝn hiÖu ®iÒu khiÓn theo qui t¾c dÞ h×nh
Khi lactose ®−îc permease vËn chuyÓn vµo trong tÕ bµo, nã ®−îc β-galactosidase
chuyÓn hãa thµnh allolactose. ChÝnh allolactose ®iÒu hßa sù ho¹t ®éng cña LacI. Mét c©u
hái ®Æt ra lµ: d−êng nh− lóc nµy operon Lac ch−a ®−îc ho¹t hãa, vËy β-galactosidase ë
®©u mµ cã?
C©u tr¶ lêi lµ: sù ®iÒu hßa øc chÕ operon Lac cã “kÏ hë”. Ngay c¶ khi operon Lac ë
tr¹ng th¸i bÞ øc chÕ, th× vÉn lu«n cã mét Ýt ph©n tö mARN cña c¸c gen cÊu tróc ®−îc
phiªn m·. Së dÜ nh− vËy lµ do sù liªn kÕt cña ARN polymerase còng nh− cña c¸c protein
®iÒu hßa kh¸c vµo ADN lµ nh÷ng liªn kÕt yÕu, nghÜa lµ chóng ®−îc h×nh thµnh vµ ph¸ vì
ë møc c©n b»ng (xem ch−¬ng 1). Do ®ã, lu«n cã mét Ýt ph©n tö ARN polymerase cã thÓ
liªn kÕt ®−îc vµo promoter vµ tiÕn hµnh phiªn m· c¸c gen cÊu tróc. “KÏ hë” nµy gióp tÕ
bµo lu«n duy tr× ®−îc mét l−îng nhá β-galactosidase vµ permease, ngay c¶ khi m«i
tr−êng kh«ng cã lactose. §iÒu nµy gi¶i thÝch t¹i sao ngay khi cã lactose, lactose cã thÓ
®−îc vËn chuyÓn ngay vµo tÕ bµo vµ chuyÓn hãa thµnh allolactose ®Ó kÝch øng ho¹t ®éng
cña operon.
Allolactose liªn kÕt vµo LacI vµ lµm thay ®æi cÊu h×nh cña protein øc chÕ nµy, dÉn
®Õn sù “láng lÎo” trong liªn kÕt gi÷a nã vµ operator, vµ lacI “rêi khái” promoter; c¸c
ph©n tö LacI tù do kh¸c nÕu ®· liªn kÕt víi allolactose th× hÇu nh− kh«ng cã ¸i lùc víi
ADN. Lóc nµy, c¸c gen cÊu tróc cña operon Lac ®−îc “gi¶i nÐn”. Ch−¬ng 1 ®· ®Ò cËp
®Õn sù thay ®æi dÞ h×nh cña LacI víi ®Æc ®iÓm miÒn liªn kÕt allolactose n»m ngoµi miÒn
liªn kÕt ADN.
Ho¹t ®éng cña CAP ®−îc ®iÒu hßa bëi mét c¬ chÕ t−¬ng tù, trong ®ã ph©n tö cAMP
lµ ph©n tö kÝch øng dÞ h×nh cña CAP. NghÜa lµ, chØ khi cAMP liªn kÕt víi CAP, th×
protein nµy míi cã cÊu h×nh phï hîp ®Ó liªn kÕt víi ADN. MÆt kh¸c, trong tÕ bµo E. coli,
nång ®é cAMP cã t−¬ng quan nghÞch víi l−îng glucose cã trong m«i tr−êng. Nãi c¸ch
kh¸c, khi nång ®é glucose cao th× nång ®é cAMP thÊp vµ ng−îc l¹i. Së dÜ nh− vËy lµ do
c¸c ph©n tö glucose khi ®−îc vËn chuyÓn vµo trong tÕ bµo th−êng ®−îc phosphoryl hãa
bëi hÖ thèng phosphoryl hãa phô thuéc vµo PEP (phosphoenolpyruvate). HÖ thèng nµy
®−îc gäi t¾t lµ PTS (PEP-dependent phosphotransferase system, h×nh 5.9). Khi m«i
tr−êng cã glucose, protein xuyªn mµng EIIIg (®−îc phosphoryl hãa bëi PEP) sÏ chuyÓn
nhãm phosphat cho glucose ®Ó h×nh thµnh glucose-6-phosphate (nhê vËy, glucose sau khi
®· vµo tÕ bµo kh«ng thÓ bÞ vËn chuyÓn ng−îc trë l¹i). Nh−ng khi m«i tr−êng kh«ng cã
glucose, EIIIg sÏ ho¹t hãa enzym adenylate cyclase. §Õn l−ît m×nh, enzym nµy xóc t¸c
chuyÓn hãa ATP thµnh cAMP vµ lµm t¨ng nång ®é chÊt nµy trong tÕ bµo. Nh− vËy, khi
m«i tr−êng kh«ng cã glucose, nång ®é cAMP t¨ng cao, lµm t¨ng sù h×nh thµnh phøc hÖ
CAP-cAMP. Lóc nµy, CAP liªn kÕt m¹nh víi operon Lac vµ ho¹t hãa sù biÓu hiÖn cña
operon nµy. §iÒu ®¸ng chó ý lµ vÞ trÝ liªn kÕt víi cAMP cña CAP kh«ng n»m trong vïng
liªn kÕt ADN cña protein nµy.

145
§inh §oµn Long

Operon Lac lµ m« h×nh ®−îc hai nhµ sinh häc ng−êi Ph¸p lµ Francois Jacob vµ
Jacques Monod ®−a ra n¨m 1961 ®Ó chøng minh cho c¬ chÕ ®iÒu hßa ho¹t ®éng gen. Víi
c«ng tr×nh nµy, hai nhµ khoa häc ®· ®−îc trao gi¶i th−ëng Nobel y häc vµo n¨m 1965.

H×nh 5.9. HÖ thèng


phosphoryl hãa PTS.
M«i tr−êng ngo¹i bµo
cã glucose lµm gi¶m
l−îng cAMP ®−îc t¹o
ra trong tÕ bµo, vµ
ng−îc l¹i.

5.2.2.6. CAP ®iÒu khiÓn ®ång thêi nhiÒu gen theo kiÓu ®iÒu hßa tæ hîp
Operon Lac lµ mét vÝ dô vÒ c¬ chÕ ®iÒu hßa theo kiÓu tÝch hîp tÝn hiÖu. NghÜa lµ,
sù biÓu hiÖn cña c¸c gen ®−îc ®iÒu hßa ®ång thêi bëi hai ph©n tö tÝn hiÖu lµ allolactose
vµ cAMP qua hai protein ®iÒu hßa t−¬ng øng lµ LacI vµ CAP.
ë E. coli, cã mét operon kh¸c, lµ operon Gal, m· hãa cho c¸c enzym chuyÓn hãa
galactose. Operon nµy ho¹t ®éng khi trong m«i tr−êng cã galactose vµ kh«ng cã glucose.
Gièng nh− operon Lac, operon Gal còng ®−îc ®iÒu hßa bëi hai tÝn hiÖu, th«ng qua mét
protein ho¹t hãa vµ mét protein øc chÕ. Protein øc chÕ, do gen galR m· hãa, ®−îc ®iÒu
khiÓn bëi chÊt kÝch øng galactose, vµ protein ho¹t hãa ë ®©y mét lÇn n÷a lµ CAP. §iÒu
nµy cho thÊy CAP cã thÓ ®ång thêi ®iÒu khiÓn nhiÒu gen kh¸c nhau. KiÓu ®iÒu hßa nh−
vËy ®−îc gäi lµ ®iÒu hßa tæ hîp. Trong thùc tÕ, ë E. coli, CAP tham gia ®iÒu hßa ®ång
thêi sù biÓu hiÖn cña trªn 100 gen kh¸c nhau. Qua ph−¬ng thøc ®iÒu hßa tæ hîp, mét
ph©n tö tÝn hiÖu cã thÓ ®ång thêi tham gia ®iÒu khiÓn nhiÒu gen kh¸c nhau. Nh−ng, sù
®iÒu hßa cña mçi gen vÉn cã tÝnh ®Æc tr−ng bëi sù xuÊt hiÖn c¸c ph©n tö tÝn hiÖu ®Æc thï
cña nã (vÝ dô nh−, víi operon Lac lµ allolactose). Vµ, trong hÇu hÕt tr−êng hîp, c¸c ph©n
tö tÝn hiÖu chØ t−¬ng t¸c víi mét protein ®iÒu hßa riªng cña nã. ë phÇn sau, chóng ta sÏ
thÊy sù “tÝch hîp tÝn hiÖu” vµ “®iÒu hßa tæ hîp” ë eukaryote cßn phæ biÕn vµ linh ho¹t h¬n.

5.2.2.7. C¸c yÕu tè σ thay thÕ vµ sù “lËp tr×nh” biÓu hiÖn theo thø tù cña c¸c gen
ë ch−¬ng 3, chóng ta biÕt r»ng ARN polymerase nhËn biÕt ®−îc promoter lµ nhê
yÕu tè σ (sigma). Promoter lac còng nh− phÇn lín c¸c promoter kh¸c ë E. coli ®−îc
nhËn biÕt bëi ARN polymerase mang yÕu tè σ70. Nh−ng, ngoµi σ70, E. coli cßn cã mét sè
yÕu tè σ kh¸c (gäi lµ c¸c yÕu tè σ thay thÕ). Chóng ho¹t ®éng ë c¸c nhãm promoter ®Æc
thï riªng, v× vËy chØ khi cã mÆt chóng, ARN polymerase míi ®−îc huy ®éng ®Õn nh÷ng
promoter nµy.
Mét trong nh÷ng yÕu tè σ nh− vËy lµ yÕu tè σ sèc nhiÖt (σ32). Khi tÕ bµo E. coli gÆp
®iÒu kiÖn sèc nhiÖt, th× σ32 ®−îc tæng hîp m¹nh trong tÕ bµo; yÕu tè nµy thay thÕ σ70
trong thµnh phÇn ARN polymerase. C¸c ARN polymerase mang yÕu tè σ32 ®−îc huy ®éng
®Õn promoter thuéc c¸c gen vµ s¶n phÈm cña chóng cã vai trß b¶o vÖ tÕ bµo khái t¸c ®éng
cña c¸c yÕu tè sèc nhiÖt. L−îng σ32 trong tÕ bµo t¨ng lªn nhê hai c¬ chÕ. Mét lµ, sù t¨ng

146
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

c−êng dÞch m·, nghÜa lµ khi cã hiÖn t−îng sèc nhiÖt, ph©n tö mARN m· hãa σ32 ®−îc dÞch
m· víi hiÖu suÊt cao h¬n tr−íc. Hai lµ, ®é bÒn cña s¶n phÈm protein t¨ng lªn. Mét vÝ dô
kh¸c vÒ yÕu tè σ thay thÕ lµ σ54. YÕu tè σ54 nµy liªn quan ®Õn ho¹t ®éng cña ARN
polymerase tiÕn hµnh phiªn m· c¸c gen tham gia xóc t¸c sù chuyÓn hãa nit¬.
C¸c yÕu tè σ thay thÕ còng cã thÓ ®−îc sö dông trong viÖc “lËp tr×nh” biÓu hiÖn cña
nhiÒu gen theo mét trËt tù nhÊt ®Þnh. Ch¼ng h¹n nh−, hiÖn t−îng nµy xuÊt hiÖn trong
qu¸ tr×nh ph¸t sinh bµo tö ë vi khuÈn Bacillus subtilis hay trong qu¸ tr×nh g©y nhiÔm
cña phag¬ ë vi khuÈn nµy. Phag¬ SPO1 g©y nhiÔm vµ g©y tan vi khuÈn B. subtilis. Sù
g©y tan nµy ®ßi hái phag¬ ph¶i biÓu hiÖn c¸c gen cña nã theo mét trËt tù rÊt nghiªm
ngÆt. TrËt tù nµy ®−îc “lËp tr×nh” b»ng viÖc sö dông mét sªri (chuçi) c¸c yÕu tè σ thay
thÕ. Ban ®Çu, khi míi g©y nhiÔm, ARN polymerase cña vi khuÈn (mang yÕu tè σ70) sÏ chØ
nhËn ra c¸c promoter “sím” cña phag¬ vµ tiÕn hµnh phiªn m· c¸c gen m· hãa c¸c protein
cÇn thiÕt cho giai ®o¹n “sím” cña sù g©y nhiÔm. Trong sè nh÷ng gen ®−îc biÓu hiÖn sím,
cã mét gen m· hãa cho mét yÕu tè σ thay thÕ (gäi lµ gen 28). YÕu tè σ nµy cã thÓ ®Èy yÕu
tè σ70 cña vi khuÈn khái ARN polymerase vµ huy ®éng enzym nµy tíi mét nhãm promoter
thø hai cña phag¬. Nh÷ng promoter nµy thuéc nh÷ng gen ®−îc biÓu hiÖn ë giai ®o¹n
“gi÷a”. Mét trong nh÷ng gen biÓu hiÖn ë giai ®o¹n “gi÷a” l¹i m· hãa cho mét yÕu tè σ
kh¸c lµm nhiÖm vô huy ®éng ARN polymerase tíi c¸c promoter cña c¸c gen ®−îc biÓu
hiÖn “muén”. Cø nh− vËy, c¸c nhãm gen ®−îc biÓu hiÖn theo mét trËt tù nhÊt ®Þnh.
5.2.2.8. NtrC vµ MerR lµ c¸c protein ho¹t hãa phiªn m· theo qui t¾c dÞ h×nh
ë trªn, chóng ta thÊy phÇn lín protein ho¹t hãa phiªn m· ë prokaryote ho¹t ®éng
theo kiÓu huy ®éng ARN polymerase ®Õn promoter. Tuy vËy, còng cã c¸c tr−êng hîp
ngo¹i lÖ. Hai vÝ dô sau ®©y cho thÊy protein ho¹t hãa kh«ng ho¹t ®éng theo c¬ chÕ huy
®éng ARN polymerase, mµ thay vµo ®ã chóng sö dông qui t¾c dÞ h×nh. §ã lµ c¸c yÕu tè
ho¹t hãa NtrC vµ MerR. Tr−íc tiªn, chóng ta cÇn ph©n biÖt sù kh¸c nhau gi÷a hai c¬
chÕ “huy ®éng ARN polymerase” vµ “qui t¾c dÞ h×nh”. Trong c¬ chÕ thø nhÊt, c¸c protein
ho¹t hãa “thu hót” ARN polymerase tíi promoter; cßn ë c¬ chÕ thø hai, ARN
polymerase th−êng liªn kÕt s½n víi promoter nh−ng kh«ng ho¹t ®éng. Enzym nµy chØ
trë nªn ho¹t ®éng sau khi ®Ýnh kÕt víi protein ho¹t hãa vµ thay ®æi cÊu h×nh cña nã theo
qui t¾c dÞ h×nh.
NtrC ®iÒu khiÓn sù phiªn m· c¸c gen chuyÓn hãa nit¬, bao gåm glnA. T¹i gen glnA,
ARN polymerase liªn kÕt s½n vµo promoter nh−ng chØ ë d¹ng phøc hÖ khëi ®Çu phiªn m·
“®ãng”. Protein ho¹t hãa NtrC sau khi liªn kÕt vµo enzym lµm thay ®æi cÊu h×nh kh«ng
gian cña enzym vµ chuyÓn phøc hÖ khëi ®Çu phiªn m· “®ãng” sang tr¹ng th¸i “më”. Sù
ho¹t hãa ë ®©y dùa trªn sù thay ®æi dÞ h×nh cña enzym ARN polymerase.
MerR lµ protein ho¹t hãa gen merT. Gen nµy m· hãa enzym gióp tÕ bµo gi¶i ®éc
thñy ng©n. Còng gièng nh− NtrC, MerR kÝch øng sù thay ®æi cÊu h×nh cña phøc hÖ
promoter - ARN polymerase vµ chuyÓn chóng tõ tr¹ng th¸i “®ãng” sang “më”. Nh−ng
kh¸c víi NtrC, MerR lµm thay ®æi cÊu h×nh cña ADN (chø kh«ng ph¶i cña ARN
polymerase).
5.2.2.9. NtrC cã ho¹t tÝnh ATPase vµ ho¹t ®éng tõ xa
Gièng nh− CAP, NtrC cã mét miÒn liªn kÕt ADN t¸ch biÖt víi miÒn trung t©m ho¹t
®éng, vµ còng chØ liªn kÕt ®−îc víi ADN khi cã ph©n tö tÝn hiÖu ®Æc thï. Trong tr−êng
hîp cña NtrC, tÝn hiÖu nµy chÝnh lµ nång ®é nit¬ (N) thÊp. Khi nång ®é N thÊp, mét
enzym kinase lµ NtrB sÏ phosphoryl hãa NtrC vµ thay ®æi cÊu h×nh cña nã. Lóc nµy,
NtrC míi cã thÓ ®Ýnh kÕt vµo ADN t¹i bèn vÞ trÝ c¸ch promoter cña gen kho¶ng 150 bp vÒ

147
§inh §oµn Long

phÝa ®Çu 5’. T¹i mçi vÞ trÝ, NtrC liªn kÕt bëi mét cÊu tróc dimer, vµ th«ng qua t−¬ng t¸c
protein-protein gi÷a c¸c dimer, bèn ph©n tö NtrC liªn kÕt víi nhau theo kiÓu hîp lùc.
D¹ng ARN polymerase phiªn m· gen glnA chøa tiÓu phÇn σ54. Khi kh«ng cã NtrC,
enzym nµy liªn kÕt bÒn v÷ng víi glnA, nh−ng ë d¹ng phøc hÖ “®ãng”. Khi ë tr¹ng th¸i
ho¹t ®éng, NtrC (c¸ch promoter 150 bp) t−¬ng t¸c víi yÕu tè σ54 cña ARN polymerase. §Ó
cã ®−îc sù t−¬ng t¸c nµy, mét “vßng th¾t” ADN (cã kÝch th−íc kho¶ng 150 kb) ®−îc h×nh
thµnh (h×nh 5.10). Thùc
nghiÖm cho thÊy, NtrC cã thÓ
ho¹t hãa ®−îc gen glnA ngay NtrC
c¶ khi vÞ trÝ liªn kÕt ADN cña
nã c¸ch promoter ®Õn 1 - 2 kb. ARN polymerase

B¶n th©n NtrC cã ho¹t glnA


tÝnh cña enzym ATPase. Ho¹t
tÝnh nµy cung cÊp n¨ng l−îng Gen ë tr¹ng th¸i “ho¹t hãa”
Promoter
cÇn thiÕt ®Ó nã cã thÓ lµm thay
®æi cÊu h×nh cña ARN
polymerase. Sù thay ®æi cÊu H×nh 5.10. Sù ho¹t hãa gen bëi NtrC. Promoter cña gen glnA ®−îc
h×nh nµy gióp enzym cã thÓ ARN polymerase mang yÕu tè σ54 nhËn biÕt. MÆc dï kh«ng ®−îc minh
khëi ®Çu phiªn m·, bëi qua ®ã häa trªn h×nh, NtrC thùc tÕ t−¬ng t¸c víi tiÓu phÇn σ cña enzym. ë
54

®©y, NtrC ®−îc minh häa nh− mét protein d¹ng phøc kÐp (dimer), nh−ng
nã chuyÓn phøc hÖ khëi ®Çu
thùc tÕ d¹ng phøc cña nã phøc t¹p h¬n.
phiªn m· tõ tr¹ng th¸i “®ãng”
(kh«ng ho¹t ®éng), sang “më”
(ho¹t ®éng).
5.2.2.10. MerR ho¹t hãa phiªn m· b»ng viÖc “vÆn xo¾n” ®o¹n promoter
Khi m«i tr−êng cã thñy ng©n (Hg2+), MerR ho¹t hãa gen merT. H×nh 5.11 cho thÊy
protein nµy liªn kÕt vµo c¸c vÞ trÝ “-10” vµ “-35” cña promoter merT (ARN polymerase
phiªn m· gen nµy mang σ70). MerR liªn kÕt vµo promoter qua mÆt ®èi diÖn víi mÆt liªn
kÕt cña ARN polymerase. Nhê vËy, c¶ ARN polymerase vµ MerR cã thÓ cïng liªn kÕt ®−îc
víi promoter. Promoter merT cã ®Æc ®iÓm lµ: ®o¹n tr×nh tù gi÷a hai vÞ trÝ “-10” vµ “-35” cã
19 bp (hÇu hÕt c¸c promoter kh¸c ho¹t ®éng víi σ70-ARN polymerase cã chiÒu dµi 15 – 17
bp). Do vËy, yÕu tè σ70 kh«ng ®ång thêi trùc diÖn ®−îc víi hai vÞ trÝ “-10” vµ “-35”, dÉn ®Õn
ARN polymerase th−êng chØ liªn kÕt “láng lÎo” víi promoter nµy. Ngoµi ra, khi kh«ng cã
Hg2+, MerR liªn kÕt vµo promoter, t¹o nªn cÊu h×nh kh«ng thuËn lîi cho sù liªn kÕt vµo
promoter cña ARN polymerase, a)
vµ sù phiªn m· kh«ng diÔn ra. MerT

Khi Hg2+ liªn kÕt vµo MerR


-35 -10
MerR, protein nµy thay ®æi
cÊu h×nh, råi lµm vÆn xo¾n
Hg2+
ph©n tö ADN t¹i promoter
(h×nh 5.11b). Sù “biÕn d¹ng” b)
MerT
cÊu tróc ADN nh− vËy lµm
kho¶ng c¸ch gi÷a hai vÞ trÝ “- -35 MerR -10
35” vµ “-10” cña promoter
merT gÇn l¹i, vµ cã kÝch th−íc
H×nh 5.11. Sù ho¹t hãa gen bëi MerR. a) Các trình tự "-35" và
gièng víi c¸c promoter σ70 "-10" không trực diện với nhau trên trục của promoter. (a) Khi không có
m¹nh kh¸c. Lóc nµy, ARN 2+
Hg , MerR liên kết vào promoter ở dạng không hoạt động. b) Khi có
polymerase cã thÓ khëi ®Çu
2+
Hg , MerR vặn xoắn trục khung ADN làm các trình tự liên ứng trở nên
phiªn m· hiÖu qu¶. trực diện, đồng thời khoảng cách giữa chúng ngắn lại, phù hợp cho sự
liên kết của ARN polymerase.

148
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

§iÒu ®¸ng chó ý ë ®©y lµ ®Ó ho¹t hãa phiªn m·, protein MerR kh«ng t−¬ng t¸c víi
ARN polymerase; thay vµo ®ã, nã lµm thay ®æi cÊu h×nh cña ADN ®Ó ARN polymerase cã
thÓ liªn kÕt vµo. Mét ®iÓm n÷a lµ, ë MerR kh«ng cã hai miÒn liªn kÕt ADN víi miÒn ho¹t
hãa riªng biÖt. Thay vµo ®ã MerR liªn kÕt trùc tiÕp vµo ADN vµ ho¹t hãa phiªn m·.
5.2.2.11. Mét sè chÊt øc chÕ phiªn m· theo kiÓu "gi÷" ARN polymerase t¹i promoter
LacI øc chÕ sù biÓu hiÖn cña operon Lac theo mét c¬ chÕ rÊt ®¬n gi¶n lµ nã liªn kÕt
vµo mét tr×nh tù n»m gèi lªn promoter, lµm ARN polymerase kh«ng liªn kÕt ®−îc vµo vÞ
trÝ nµy. NhiÒu chÊt øc chÕ phiªn m· còng ho¹t ®éng theo c¬ chÕ t−¬ng tù. Nh−ng, còng cã
mét sè chÊt øc chÕ phiªn m· cã c¬ chÕ ho¹t ®éng kh¸c. Ch¼ng h¹n nh− mét sè protein øc
chÕ cã vÞ trÝ liªn kÕt hoµn toµn ë ngoµi promoter. V× vËy, thùc tÕ chóng kh«ng trùc tiÕp
ng¨n c¶n ARN polymerase liªn kÕt vµo promoter. Nh−ng, thay vµo ®ã, chóng liªn kÕt víi
ARN polymerase, lµm ®o¹n ADN ë gi÷a vÞ trÝ liªn kÕt cña protein øc chÕ vµ promoter
h×nh thµnh cÊu tróc “vßng th¾t”. Víi cÊu tróc nµy gen kh«ng ®−îc biÓu hiÖn, mÆc dï
ARN polymerase ®−îc gi÷ t¹i promoter. VÝ dô vÒ kiÓu ®iÒu hßa nµy lµ protein øc chÕ biÓu
hiÖn cña gen Gal ®· ®−îc nªu ë môc 5.2.2.6 trªn ®©y.

5.2.2.12. AraC vµ sù ®iÒu hßa operon araBAD b»ng c¬ chÕ chèng ho¹t hãa
Operon araBAD ë E. coli (gåm c¸c gen tham gia chuyÓn hãa ®−êng arabinose)
®−îc ho¹t hãa khi m«i tr−êng cã arabinose vµ kh«ng cã glucose. Lóc nµy, operon cã hai
protein ®iÒu hßa cïng ho¹t ®éng lµ AraC vµ CAP. Khi m«i tr−êng cã arabinose, AraC
liªn kÕt víi ®−êng nµy vµ cã cÊu h×nh phï hîp ®Ó liªn kÕt víi ADN t¹i hai vÞ trÝ araI1 vµ
araI2 (h×nh 5.12). N»m phÝa tr−íc c¸c vÞ trÝ nµy lµ vÞ trÝ liªn kÕt cña CAP (kh«ng vÏ trªn
h×nh). Gièng nh− ë operon Lac, khi kh«ng cã glucose, phøc hÖ CAP-cAMP liªn kÕt vµo vÞ
trÝ liªn kÕt CAP vµ thóc ®Èy sù phiªn m· cña ARN polymerase.
Khi m«i tr−êng kh«ng cã arabinose, operon araBAD kh«ng biÓu hiÖn, bëi lóc nµy
AraC cã mét d¹ng cÊu h×nh kh¸c vµ nã liªn kÕt víi ADN theo mét kiÓu kh¸c. Cô thÓ lµ,
mét tiÓu phÇn AraC liªn kÕt vµo vÞ trÝ araI1, nh−ng tiÓu phÇn thø hai liªn kÕt vµo mét vÞ
trÝ kh¸c c¸ch vÞ trÝ ®Çu tiªn 194 bp, gäi lµ araO2. Lóc nµy, mét “vßng th¾t” ADN ®−îc
h×nh thµnh gi÷a araI1 vµ araO2. §ång thêi, do thiÕu AraC liªn kÕt ë vÞ trÝ araI2, nªn

a) Khi m«i tr−êng cã arabinose


ARN polymerase Gen ®−îc
araC
biÓu hiÖn

araO2 I1 I2
araPBAD
araI
b) Khi m«i tr−êng kh«ng cã arabinose araO2

araC Gen kh«ng


biÓu hiÖn

I1 I2

H×nh 5.12. Sù ®iÒu khiÓn operon araBAD. a) Arabinose liªn kÕt vµo araC, lµm thay ®æi cÊu h×nh protein ho¹t hãa
nµy vµ nã liªn kÕt vµo c¸c vÞ trÝ araI1 vµ araI2. Nhê mét tiÓu phÇn cña araC gÇn ARN polymerase nªn gen ®−îc ho¹t
hãa phiªn m·. b) Khi kh«ng cã arabinose, phøc hÖ kÐp araC cã cÊu h×nh kiÓu kh¸c vµ nã liªn kÕt vµo c¸c vÞ trÝ araO2
vµ araI1. Lóc nµy, protein araC kh«ng ho¹t hãa ®−îc promoter araPBAD. Promoter nµy còng ®−îc ho¹t hãa bëi CAP
(nh−ng kh«ng ®−îc minh häa ë ®©y).

149
§inh §oµn Long

promoter kh«ng cã cÊu h×nh phï hîp cho sù khëi ®Çu phiªn m·. KÕt qu¶ lµ gen kh«ng
biÓu hiÖn.
HiÖu qu¶ kÝch øng biÓu hiÖn gen cña arabinose qua promoter araBAD lµ rÊt
m¹nh. V× vËy, promoter nµy ®−îc dïng lµm thµnh phÇn cña nhiÒu vect¬ biÓu hiÖn trong
kÜ thuËt di truyÒn. C¸c vect¬ biÓu hiÖn lµ cÊu tróc ADN ®¶m b¶o cho sù tæng hîp hiÖu qu¶
mét protein nµo ®ã, khi gen cña nã ®−îc “cµi” vµo vect¬ bªn c¹nh mét “promoter” m¹nh.
Khi sö dông vect¬ biÓu hiÖn chøa promoter araBAD, gen sÏ kh«ng ®−îc biÓu hiÖn cho ®Õn
khi bæ sung arabinose vµo trong m«i tr−êng. HÖ thèng biÓu hiÖn nµy thËm chÝ cho phÐp
biÓu hiÖn c¸c gen mµ s¶n phÈm cña chóng g©y ®éc víi tÕ bµo vi khuÈn.

5.2.3. Sù ®iÒu hßa gen sau khëi ®Çu phiªn m· ë vi khuÈn

5.2.3.1. C¸c operon sinh tæng hîp axit amin ®−îc ®iÒu khiÓn bëi c¬ chÕ phiªn m· kh«ng
hoµn chØnh (phiªn m· dë)
ë vi khuÈn E. coli, operon Trp gåm 5 gen n»m kÕ tiÕp nhau m· hãa cho c¸c enzym
tham gia tæng hîp axit amin tryptophan (Trp). C¸c gen nµy chØ ®−îc biÓu hiÖn m¹nh khi
l−îng Trp trong tÕ bµo lµ thÊp (h×nh 5.13). Operon Trp ®−îc ®iÒu khiÓn bëi protein øc
chÕ trpR theo kiÓu gièng víi LacI ë operon Lac. Tuy vËy, ë operon Trp, ph©n tö c¶m
øng (tryptophan) kh«ng ho¹t ®éng nh− mét chÊt kÝch øng, mµ lµ chÊt ®ång øc chÕ.
NghÜa lµ, khi m«i tr−êng d− thõa tryptophan, chÊt nµy sÏ liªn kÕt víi trpR vµ lµm thay
®æi cÊu h×nh protein nµy, gióp nã liªn kÕt ®−îc víi tr×nh tù ®iÒu hµnh (operator) vµ ng¨n
c¶n sù phiªn m·. Khi nång ®é Trp thÊp, chÊt øc chÕ trpR ®−îc gi¶i phãng vµ kh«ng liªn
kÕt ®−îc víi operator. Nhê vËy, sù phiªn m· gen cã thÓ diÔn ra.
Nh−ng, mét ®iÒu thó vÞ ë operon Trp lµ ngay c¶ khi ARN polymerase ®· khëi ®Çu
phiªn m·, th× kh«ng cã nghÜa lµ b¶n phiªn m· (mARN) ®Çy ®ñ sÏ ch¾c ch¾n ®−îc t¹o ra.
Trong thùc tÕ, phÇn lín c¸c b¶n phiªn m· ®−îc kÕt thóc sím, tr−íc khi tiÕp cËn ®−îc gen
®Çu tiªn (trpE), trõ khi cã “mét hÖ thèng ®iÒu hßa thø hai” cho biÕt tÕ bµo chØ cßn Ýt Trp.
“HÖ thèng ®iÒu hßa thø hai” nµy ®−îc gäi lµ sù phiªn m· kh«ng hoµn chØnh (cßn
®−îc gäi lµ sù kÕt thóc phiªn m· sím, hay c¬ chÕ phanh h·m). Khi nång ®é Trp cao,
enzym ARN polymerase (®· khëi ®Çu phiªn m·) sÏ dõng l¹i ë mét vÞ trÝ ®Æc biÖt, råi kÕt
thóc phiªn m· tr−íc khi tiÕp cËn ®−îc gen trpE. Nh−ng khi nång ®é Trp thÊp, ARN
polymerase sÏ kh«ng dõng l¹i mµ tiÕp tôc “®äc” ®Ó phiªn m· c¸c gen cÊu tróc cña operon.
C¬ chÕ ®iÒu hßa nµy x¶y ra ®−îc lµ nhê ë vi khuÈn, sù phiªn m· vµ dÞch m· th−êng x¶y
ra ®ång thêi, vµ ARN cã thÓ cã mét sè cÊu tróc ®Æc biÖt do sù t−¬ng t¸c néi ph©n tö gi÷a
c¸c nucleotide.
§iÓm mÊu chèt ®Ó hiÓu ®−îc c¬ chÕ ®iÒu hßa qua kÕt thóc phiªn m· sím lµ cÊu tróc
phÇn gÇn ®Çu 5’ cña ph©n tö mARN ®−îc phiªn m· tõ operon Trp. Ph©n tö mARN nµy cã
mét tr×nh tù dÉn ®Çu (ë ®Çu 5’ vµ kh«ng ph¶i tr×nh tù m· hãa) gåm 161 m· bé ba
(codon), n»m gi÷a promoter vµ gen trpE. §o¹n tr×nh tù nµy chøa 4 vïng: vïng I gåm c¸c
nucleotide tõ 50 ®Õn 68, vïng II gåm c¸c nucleotide tõ 75 ®Õn 92, vïng III gåm c¸c
nucleotide tõ 108 ®Õn 121 vµ vïng IV lµ c¸c nucleotide tõ 125 ®Õn 132. Sau vïng IV lµ
mét ®o¹n tr×nh tù gåm 8 nucleotide Uracil liªn tiÕp (gäi lµ tr×nh tù polyU), kÕt thóc ë
nucleotide sè 140 (h×nh 5.13b). Bèn vïng cÊu tróc nµy cã mét tÝnh chÊt ®Æc biÖt lµ: vïng
I vµ vïng II cã thÓ t¹o liªn kÕt bæ sung (liªn kÕt Chargaff) víi nhau; liªn kÕt bæ sung nµy
còng cã thÓ x¶y ra gi÷a vïng II vµ III, còng nh− gi÷a vïng III vµ IV. Víi tÝnh chÊt nh−
vËy, ®o¹n dÉn ®Çu cña ph©n tö mARN cã ®Æc ®iÓm lµ: khi vïng I liªn kÕt víi vïng II, th×
vïng III liªn kÕt víi vïng IV. Lóc nµy, ®o¹n tr×nh tù dÉn ®Çu trªn ph©n tö mARN cã
d¹ng cÊu tróc cÆp tãc kÐp (h×nh 5.13b vµ d). Nh−ng nÕu vïng I kh«ng liªn kÕt ®−îc
víi vïng II, th× vïng II liªn kÕt víi vïng III, vµ lóc nµy c¶ vïng I vµ IV ë tr¹ng th¸i tù

150
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

do, kh«ng liªn kÕt. Trong tr−êng hîp nµy, ®o¹n tr×nh tù dÉn ®Çu cã d¹ng cÊu tróc cÆp
tãc ®¬n (h×nh 5.13b vµ c).
a) CÊu tróc operon Trp
§o¹n dÉn ®Çu
trpE trpD trpC trpB trpA
Operator
Promoter
b) Tr×nh tù bèn vïng ®iÒu khiÓn thuéc ®o¹n dÉn ®Çu trªn mARN
D¹ng cÆp tãc ®¬n h×nh D¹ng cÆp tãc kÐp
thµnh khi vïng II vµ III h×nh thµnh khi
liªn kÕt víi nhau vïng I liªn kÕt
víi vïng II,
 II vµ vïng III
2 bé ba liªn kÕt víi
m· hãa  III vïng IV
Trp  I

 IV
Bé ba m·
kÕt thóc

c) §o¹n dÉn ®Çu khi m«i tr−êng thiÕu tryptophan – Operon Trp ®−îc biÓu hiÖn

ARN polymerase tiÕp tôc phiªn m·

Ribosome
Ribosome dõng ë ®©y
dõng ë ®©y

d) §o¹n dÉn ®Çu khi m«i tr−êng d− thõa tryptophan – Operon Trp kh«ng biÓu hiÖn

CÊu tróc cÆp tãc


kÐp hoµn chØnh,
Ribosome t¹i ARN polymerase
bé ba m· kÕt thóc phiªn m·
kÕt thóc t¹i ®©y

Ribosome rêi khái CÆp tãc kÐp b¾t


ph©n tö mARN ®Çu h×nh thµnh

H×nh 5.13. §iÒu hßa phiªn mX ë operon Trp. a) CÊu tróc operon Trp, víi operator (vÞ trÝ liªn kÕt cña
protein øc chÕ trpR) n»m trong promoter. b) Bèn vïng (I, II, III vµ IV) thuéc ®o¹n dÉn ®Çu cã thÓ h×nh thµnh
hoÆc cÊu tróc cÆp tãc ®¬n (tr¸i) hoÆc cÆp tãc kÐp (ph¶i). c) Khi m«i tr−êng thiÕu trytophan, cÊu tróc cÆp tãc
®¬n h×nh thµnh, sù phiªn m· diÔn ra hoµn chØnh vµ c¸c gen cÊu tróc (trpE, trpD, trpC, trpB vµ trpA) ®−îc biÓu
hiÖn. d) Khi m«i tr−êng d− thõa tryptophan, cÊu tróc cÆp tãc kÐp h×nh thµnh, sù phiªn m· kÕt thóc sím vµ c¸c
gen cÊu tróc kh«ng ®−îc biÓu hiÖn (theo Peter Paolella, 1998).

151
§inh §oµn Long

Mét ®iÓm l−u ý n÷a trªn mARN cña operon Trp lµ gi÷a vïng I vµ II cã mét m· bé
ba kÕt thóc (UGA) n»m ë c¸c nucleotide 69 - 71. PhÝa tr−íc nã, cã hai bé ba m· hãa cho
tryptophan (5’-UGGUGG-3’) n»m ë vÞ trÝ tõ nucleotide 54 ®Õn 59. ChÝnh c¸c m· bé ba
nµy cã vai trß quyÕt ®Þnh cho sù kÕt thóc phiªn m· sím (®−îc m« t¶ d−íi ®©y). §Æc ®iÓm
nµy cã ë tr×nh tù dÉn ®Çu cña c¸c operon m· hãa c¸c enzym tham gia tæng hîp nhiÒu lo¹i
axit amin kh¸c, ch¼ng h¹n nh− operon Leu cã 4 bé ba m· hãa Leu liªn tiÕp, operon His cã
7 bé ba m· hãa His liªn tiÕp, operon Val cã 5 bé ba m· hãa Val liªn tiÕp, v.v...
VËy, sù ®iÒu hßa biÓu hiÖn gen bëi c¬ chÕ kÕt thóc phiªn m· sím diÔn ra thÕ nµo?
Chóng ta h·y xem ë m« h×nh operon Trp nh− sau:
- Khi nång ®é Trp trong m«i tr−êng thÊp, Trp (víi vai trß chÊt ®ång øc chÕ) gi¶i
phãng khái phøc hÖ Trp-trpR lµm cho protein øc chÕ nµy kh«ng liªn kÕt ®−îc vµo
operator. Nhê vËy, ARN polymerase cã thÓ liªn kÕt vµo promoter vµ khëi ®Çu phiªn m·.
Sau khi ARN polymerase ®· phiªn m· ®−îc mét ®o¹n mARN dµi kho¶ng 90 nucleotide th×
ribosome g¾n vµo gÇn ®Çu 5’ cña ph©n tö mARN ®ang ®−îc kÐo dµi vµ b¾t ®Çu dÞch m·,
tæng hîp mét chuçi peptide dÉn ®Çu (kh«ng thuéc chuçi polypeptide cña c¸c gen cÊu
tróc). Ribosome sÏ tiÕp tôc tr−ît däc ph©n tö mARN, ®Õn khi nã gÆp hai bé ba m· hãa
Trp (5’-UGGUGG-3’) ë vïng I. C¸c bé ba nµy sÏ chØ ®−îc dÞch m· khi m«i tr−êng cã s½n
Trp vµ c¸c ph©n tö tARNTrp cã thÓ l¾p ghÐp chóng vµo chuçi peptide ®ang kÐo dµi. Nh−ng
v× lóc nµy m«i tr−êng thiÕu Trp, c¸c m· bé ba nµy kh«ng ®−îc dÞch m·. Do ®ã, ribosome sÏ
dõng l¹i ë c¸c m· bé ba m· hãa Trp nµy. ViÖc ribosome dõng l¹i ë vïng I (®o¹n nucleotide
54 - 59) liªn quan ®Õn hai hiÖn t−îng: 1) ARN polymerase vÉn tiÕp tôc tiÕn vÒ phÝa tr−íc
®Ó kÐo dµi chuçi mARN ®ang ®−îc kÐo dµi; 2) ribosome dõng l¹i theo nguyªn t¾c vËt lý mµ
kh«ng rêi khái chuçi mARN, v× ®©y kh«ng ph¶i lµ tÝn hiÖu kÕt thóc dÞch m·. Khi
ribosome dõng l¹i ë c¸c nucleotide 54-59, vïng I sÏ kh«ng liªn kÕt ®−îc víi vïng II. Lóc
nµy, vïng II sÏ liªn kÕt víi vïng III vµ “gi¶i phãng” vïng IV (cÊu tróc cÆp tãc ®¬n). ë ®o¹n
dÉn ®Çu cña ph©n tö mARN ë d¹ng nµy, ARN polymerase tiÕp tôc kÐo dµi chuçi mARN vµ
tiÕp cËn ®−îc gen trpE còng nh− c¸c gen kh¸c cña operon Trp. Nãi c¸ch kh¸c, operon Trp
®−îc ho¹t hãa.
- Khi nång ®é Trp trong m«i tr−êng cao, mét mÆt Trp víi vai trß ®ång øc chÕ, sÏ
liªn kÕt víi protein øc chÕ trpR. Lóc nµy, phøc hÖ Trp-trpR sÏ liªn kÕt vµo operator vµ
ng¨n c¶n ARN polymerase liªn kÕt vµo promoter vµ tiÕn hµnh phiªn m·. Tuy vËy, do “kÏ
hë” cña c¬ chÕ ®iÒu hßa th«ng qua liªn kÕt cña ARN polymerase víi promoter (®· nªu ë
môc 5.2.2.5), mét tØ lÖ nhá ARN polymerase vÉn cã thÓ khëi ®Çu phiªn m·. Sau khi mét
phÇn ph©n tö mARN ®−îc h×nh thµnh, sù dÞch m· chuçi peptide dÉn ®Çu ®−îc b¾t ®Çu
nh− m« t¶ ë trªn. Ribosome sÏ tr−ît däc ph©n tö mARN ®Õn khi gÆp c¸c bé ba m· hãa
Trp ë cuèi vïng I. Nh−ng kh¸c víi tr−êng hîp trªn, lóc nµy do cã s½n tryptophan, c¸c axit
amin nµy ®−îc bæ sung vµo chuçi polypeptide ®ang kÐo dµi. KÕt qu¶ lµ, ribosome sÏ v−ît
qua ®−îc vÞ trÝ c¸c nucleotide 54 - 59 vµ tiÕp cËn ®Õn bé ba m· kÕt thóc (UGA) t¹i c¸c
nucleotide 69 - 71. T¹i ®©y, theo c¬ chÕ kÕt thóc dÞch m· th«ng th−êng (xem ch−¬ng 4),
ribosome rêi khái mARN. Lóc nµy, vïng I sÏ liªn kÕt víi vïng II vµ vïng III liªn kÕt víi
vïng IV, t¹o nªn cÊu tróc cÆp tãc kÐp. Cã mét ®iÓm ®¸ng chó ý lµ cÊu tróc cÆp tãc gi÷a
vïng III vµ IV cã lùc liªn kÕt lín (v× cã nhiÒu liªn kÕt G ≡ C). Lùc liªn kÕt nµy ®ñ ®Ó cã
thÓ ®Èy ph©n tö ARN polymerase ra khái mARN vµ m¹ch ADN lµm khu«n lóc nµy ®ang
tiÕp cËn ®Õn tr×nh tù polyU (nhí r»ng liªn kÕt A = U lµ liªn kÕt yÕu nhÊt trong c¸c liªn
kÕt nucleotide theo nguyªn t¾c bæ sung). ViÖc ARN polymerase t¸ch khái phøc hÖ phiªn
m· sÏ lµm qu¸ tr×nh phiªn m· kÕt thóc sím vµ c¸c gen cÊu tróc (n»m sau ®o¹n tr×nh tù
dÉn ®Çu) kh«ng ®−îc phiªn m·. Sù k×m h·m phiªn m· nh− vËy diÔn ra cho ®Õn khi l−îng

152
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

tryptophan trong tÕ bµo gi¶m xuèng ®Õn møc tryptophan trong phøc hÖ øc chÕ Trp-trpR
®−îc ®em ra sö dông, ®ång thêi ribosome sÏ dõng l¹i t¹i c¸c bé ba m· hãa Trp trong qu¸
tr×nh tæng hîp ®o¹n peptide dÉn ®Çu nªu trªn. NghÜa lµ, lóc ®ã operon Trp ®−îc biÓu
hiÖn trë l¹i.
ViÖc kÕt hîp hai c¬ chÕ ®iÒu hßa phiªn m· kiÓu øc chÕ (bëi protein øc chÕ trpR) vµ
phanh h·m (bëi c¬ chÕ kÕt thóc phiªn m· sím) nh− nªu trªn ®−îc vÝ nh− “chiÕt ¸p sinh
häc” cã thÓ “tinh chØnh” l−îng tryptophan trong tÕ bµo. ¦íc tÝnh, c¬ chÕ ®iÒu hßa kiÓu øc
chÕ lµm gi¶m møc ®é biÓu hiÖn gen kho¶ng 70 lÇn, cßn kiÓu k×m h·m lµm gi¶m møc biÓu
hiÖn gen thªm 8 - 10 lÇn n÷a. NghÜa lµ khi ho¹t ®éng, operon Trp cã møc biÓu hiÖn m¹nh
h¬n khi kh«ng ho¹t ®éng kho¶ng 600 lÇn. §èi víi mét sè operon tham gia tæng hîp c¸c
axit amin kh¸c, cã mét ®iÓm ®¸ng nãi lµ cã mét sè operon kh«ng ®−îc ®iÒu hßa theo kiÓu
øc chÕ (kh«ng cã protein øc chÕ), vÝ dô nh− c¸c operon His hay Leu. Thay vµo ®ã, nh÷ng
operon nµy ®−îc ®iÒu hßa ®¬n thuÇn dùa trªn sù kÕt thóc phiªn m· sím. Nh− vËy, kh«ng
ph¶i tÊt c¶ c¸c gen ®Òu cÇn protein ®iÒu hßa ®iÒu khiÓn sù biÓu hiÖn cña chóng.
5.2.3.2. C¸c protein ribosome tù øc chÕ sù biÓu hiÖn c¸c gen m· hãa chóng
C¬ chÕ ®iÒu hßa dÞch m· th−êng ho¹t ®éng theo kiÓu gièng víi sù øc chÕ phiªn m·,
nghÜa lµ mét protein øc chÕ sÏ liªn kÕt vµo vÞ trÝ khëi ®Çu dÞch m· vµ ng¨n c¶n sù dÞch
m·. Trong mét sè tr−êng hîp, sù liªn kÕt liªn quan ®Õn viÖc nhËn ra cÊu tróc bËc 2 ®Æc
thï cña mARN. ë ®©y, chóng ta sÏ xem sù ®iÒu hßa c¸c gen m· hãa cho protein
ribosome.
Sù biÓu hiÖn cña c¸c gen m· hãa protein ribosome cã ý nghÜa quan träng víi mäi tÕ
bµo. Mçi ribosome chøa kho¶ng 50 lo¹i protein kh¸c nhau ®−îc tæng hîp cïng lóc. H¬n
n÷a, tèc ®é biÓu hiÖn cña nh÷ng gen nµy cã liªn hÖ mËt thiÕt víi tèc ®é t¨ng tr−ëng cña
tÕ bµo. Mét thay ®æi nhá trong m«i tr−êng cã thÓ ¶nh h−ëng ®Õn sù tæng hîp c¸c thµnh
phÇn cña ribosome. VËy, c¸c gen nµy ®−îc ®iÒu khiÓn thÕ nµo?
ë E. coli, c¸c gen m· hãa protein ribosome tËp hîp thµnh mét sè operon. Cã operon
chøa tr×nh tù m· hãa ®Õn 11 lo¹i protein ribosome kh¸c nhau. Trong sè nµy, mét sè
operon cßn chøa nh÷ng gen kh¸c cã liªn quan chÆt chÏ víi sù sinh tr−ëng cña tÕ bµo, vÝ
dô nh− c¸c tiÓu phÇn α, β vµ β’ cña ARN polymerase; c¸c yÕu tè kÐo dµi chuçi dÞch m·
EF-G, EF-Tu, v.v... (h×nh 5.14). Còng gièng c¸c operon kh¸c, c¸c operon nµy ®«i khi
®−îc ®iÒu hßa ë b−íc phiªn m·. Nh−ng kiÓu ®iÒu hßa c¬ b¶n nhÊt cña chóng l¹i lµ ë b−íc
dÞch m·. ThÝ nghiÖm sau sÏ m« t¶ sù kh¸c biÖt gi÷a hai c¬ chÕ:
L11 L1
Operon L11
Promoter
L10 L7/12 β β’
Operon β

S12 S7 EF-G EF-Tu


Operon str

S10 L3 L4 L23 L2 L22/S19 S3 L16 L29


Operon S10

L14 L24 L5 S14 S8 L6 L18 S5 L30 L15


Operon spc

S13 S11 S4 α L17


Operon α

H×nh 5.14. C¸c operon mX hãa protein ribosome ë E. coli. C¸c protein ribosome ®−îc in ®Ëm (gen cña
nã ®−îc kÝ hiÖu b»ng dÊu chÊm) lµ c¸c protein cã vai trß øc chÕ dÞch m· c¸c operon t−¬ng øng. S lµ c¸c
protein cña tiÓu phÇn nhá ribosome, cßn L lµ cña tiÓu phÇn lín (Nguån: Nomura M et al, 1984).

153
§inh §oµn Long

- Khi sè b¶n sao operon m· hãa


protein ribosome ®−îc ®−a thªm vµo tÕ
bµo, th× sè ph©n tö mARN h×nh thµnh t¨ng
lªn t−¬ng øng, nh−ng sù tæng hîp protein
th× kh«ng ®æi. ThÝ nghiÖm nµy cho thÊy tÕ
bµo d−êng nh− ®· kh«ng dïng c¸c b¶n
phiªn m· t¨ng thªm lµm khu«n ®Ó tæng
hîp protein. Thùc tÕ, ®iÒu nµy x¶y ra lµ do
chÝnh c¸c protein ribosome ®· øc chÕ sù
dÞch m· tõ c¸c b¶n phiªn m· (mARN)
t−¬ng øng cña chóng.
- T¹i mçi operon, protein ribosome
liªn kÕt vµo ph©n tö mARN t¹i tr×nh tù
khëi ®Çu dÞch m· (th−êng phñ lªn m· më
®Çu AUG) cña mét trong nh÷ng gen ®Çu
tiªn cña operon, qua ®ã ng¨n c¶n sù liªn
kÕt cña ribosome vµo mARN vµ tiÕn hµnh
dÞch m·. Sù øc chÕ dÞch m· ë mét trong H×nh 5.15. Protein ribosome S8 liªn kÕt víi rARN 16S.
nh÷ng gen ®Çu tiªn cña operon g©y nªn So s¸nh tr×nh tù t¹i vÞ trÝ liªn kÕt cña protein ribosome S8
hiÖu øng øc chÕ tÊt c¶ c¸c gen n»m sau nã víi rARN 16S trong ribosome (h×nh tr¸i) vµ víi tr×nh tù khëi
®Çu dÞch m· trªn mARN cña nã (h×nh ph¶i). C¸c
trong operon. C¬ chÕ øc chÕ nµy rÊt nh¹y. nucleotide ch÷ mµu tr¾ng cho thÊy sù gièng nhau gi÷a hai
ChØ cÇn vµi ph©n tö L4 kh«ng ®−îc dïng, tr×nh tù nµy. §−êng ®øt nÐt biÓu diÔn vïng rARN 16S ®−îc
nã sÏ lËp tøc lµm t¾t sù dÞch m· c¸c gen kÓ protein S8 bao phñ (theo Cerretti et al, 1988).
tõ gen L4 trong operon S10 (h×nh 5.14).
B»ng c¸ch nµy, c¸c protein ribosome lu«n ®−îc tæng hîp võa ®ñ theo yªu cÇu tæng hîp
ribosome cña tÕ bµo.
Mét c©u hái ®Æt ra lµ: b»ng c¸ch nµo mét protein võa cã thÓ ®ãng vai trß lµ thµnh
phÇn cÊu t¹o ribosome, võa lµ chÊt øc chÕ dÞch m·? §Ó gi¶i thÝch ®iÒu nµy, chóng ta h·y
so s¸nh hai tr×nh tù liªn kÕt víi protein ribosome trªn ph©n tö rARN (®Ó h×nh thµnh
ribosome) vµ mARN (®Ó øc chÕ dÞch m·). H×nh 5.15 cho thÊy hai tr×nh tù nµy gièng nhau
vÒ cÊu tróc bËc 2 vµ c¸c nucleotide t¹i vÞ trÝ liªn kÕt. Sù gièng nhau nµy cho phÐp protein
S8 cã thÓ liªn kÕt vµo c¶ rARN vµ mARN. Tuy vËy, do ¸i lùc liªn kÕt cña protein
ribosome víi rARN lµ lín h¬n víi mARN, nªn protein ribosome chØ g¾n kÕt víi mARN vµ
øc chÕ dÞch m· khi chóng ®· ®ñ cho sù tæng hîp ribosome vµ trë nªn d− thõa.

5.3. §iÒu hßa biÓu hiÖn gen ë eukaryote


Nh×n chung, ë eukaryote, sù ®iÒu hßa biÓu hiÖn gen cã thÓ ®−îc thùc hiÖn ë tÊt c¶
c¸c b−íc nh− ë vi khuÈn, ngoµi ra cßn cã mét sè b−íc bæ sung kh¸c n÷a. Mét trong nh÷ng
b−íc bæ sung næi bËt nhÊt lµ sù c¾t-nèi intron vµ hoµn thiÖn mARN. Nh− chóng ta ®·
biÕt, c¸c gen ë eukaryote th−êng cã tÝnh ph©n m¶nh. Sau khi phiªn m·, c¸c vïng m· hãa
cña ph©n tö tiÒn-ARN ®−îc c¾t vµ nèi l¹i ®Ó h×nh thµnh ph©n tö mARN hoµn thiÖn.
Trong nhiÒu tr−êng hîp, mét b¶n phiªn m· tiÒn-ARN cã thÓ ®−îc c¾t vµ nèi theo c¸c c¸ch
kh¸c nhau, dÉn ®Õn sù h×nh thµnh c¸c ph©n tö mARN hoµn thiÖn kh¸c nhau. Nãi c¸ch
kh¸c, mét gen cã thÓ m· hãa cho mét sè protein kh¸c nhau.
Tõ ch−¬ng 3, chóng ta biÕt r»ng bé m¸y phiªn m· vµ dÞch m· ë eukaryote lµ phøc
t¹p h¬n so víi ë prokaryote. §iÒu nµy ®Æc biÖt ®óng víi sù phiªn m· cña ARN
polymerase II (enzym phiªn m· c¸c gen m· hãa protein). Nh−ng, nh×n chung nhiÒu qui
t¾c chóng ta ®· gÆp trong ®iÒu hßa biÓu hiÖn gen ë prokaryote còng ®−îc t×m thÊy ë
eukaryote. Ch¼ng h¹n nh− sù ®iÒu hßa biÓu hiÖn gen ë c¶ hai giíi sinh vËt th−êng liªn

154
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

quan ®Õn c¸c protein ho¹t hãa vµ øc chÕ. ë eukaryote, nh÷ng protein nµy còng lµ nh÷ng
protein liªn kÕt ADN vµ cã vai trß t¨ng c−êng hay øc chÕ sù biÓu hiÖn cña gen (sau khi
chóng tiÕp nhËn tÝn hiÖu tõ m«i tr−êng). Ngoµi kh¸c biÖt vÒ sù c¾t-nèi intron nªu trªn,
cã hai sù kh¸c biÖt næi bËt kh¸c trong ®iÒu hßa biÓu hiÖn gen ë eukaryote so víi
prokaryote, cã thÓ tãm t¾t nh− sau:
1) C¸c cÊu tróc nucleosome (thÓ nh©n) vµ c¸c d¹ng biÓn ®æi cña chóng ¶nh
h−ëng ®Õn sù biÓu hiÖn cña c¸c gen. Chóng ta biÕt r»ng, ADN hÖ gen eukaryote
th−êng ®−îc ®ãng gãi cïng víi c¸c protein histone trong cÊu tróc nucleosome. CÊu tróc
nµy lµm gi¶m (øc chÕ) kh¶ n¨ng biÓu hiÖn cña nhiÒu gen nÕu kh«ng cã sù “hç trî” cña c¸c
protein ho¹t hãa. C¸c tÕ bµo eukaryote th−êng cã mét l−îng lín c¸c enzym cã chøc n¨ng
t¸i cÊu tróc nucleosome, hoÆc c¶i biÕn (hãa häc) c¸c histone. Sù cã mÆt cña chóng th−êng
lµm thay ®æi cÊu tróc nucleosome, qua ®ã bé m¸y phiªn m· nãi riªng vµ c¸c protein liªn
kÕt ADN kh¸c nãi chung cã thÓ tiÕp cËn ®−îc c¸c gen cÇn biÓu hiÖn. Nh− vËy, ë
prokaryote, chóng ta kh«ng gÆp cÊu tróc nucleosome; cßn ë eukaryote, ®©y lµ mét c¬ chÕ
c¬ b¶n tham gia ®iÒu hßa biÓu hiÖn cña c¸c gen.
2) C¸c gen ë eukaryote th−êng ®ång thêi ®−îc ®iÒu khiÓn bëi nhiÒu yÕu tè
®iÒu hßa h¬n h¼n so víi c¸c gen prokaryote ®iÓn h×nh. NÕu ë vi khuÈn, vÞ trÝ liªn
kÕt cña c¸c protein ®iÒu hßa th−êng lµ c¸c tr×nh tù ng¾n, rêi r¹c ë gÇn gen trªn ph©n tö
ADN, th× ë eukaryote, mçi gen th−êng ®ång thêi cã nhiÒu vÞ trÝ liªn kÕt cña c¸c protein
®iÒu hßa kh¸c nhau vµ chóng cã thÓ n»m rÊt xa tÝnh tõ vÞ trÝ cña gen. Chóng ta gäi ®o¹n
tr×nh tù gÇn gen mµ ë ®ã bé m¸y phiªn m· liªn kÕt vµo vµ khëi ®Çu (khëi ®éng) sù phiªn
m· lµ promoter; vÞ trÝ liªn kÕt cña tõng protein ®iÒu hßa lµ tr×nh tù ®iÒu hßa; cßn tËp
hîp toµn bé c¸c vÞ trÝ ®iÒu hßa cña mét gen ®−îc gäi lµ c¸c tr×nh tù ®iÒu hßa. Kh¸i
niÖm “c¸c tr×nh tù ®iÒu hßa” phÇn nµo cho thÊy, xu h−íng c¸c gen ë eukaryote ®−îc ®iÒu
hßa ®ång thêi bëi nhiÒu protein ®iÒu hßa kh¸c nhau vµ cã sù tÝch hîp cña nhiÒu ph©n tö
tÝn hiÖu kh¸c nhau. ë trªn, chóng ta ®· gÆp mét sè c¬ chÕ ®iÒu hßa phèi hîp ë vi khuÈn.
Nh−ng th−êng th× ë vi khuÈn chØ liªn quan ®Õn hai protein ®iÒu hßa kh¸c nhau lµm
nhiÖm vô tÝch hîp th«ng tin tõ hai ph©n tö tÝn hiÖu kh¸c nhau (nh− glucose vµ lactose ë
operon Lac ch¼ng h¹n). Nh−ng ë eukaryote (®Æc biÖt ë sinh vËt ®a bµo), sù biÓu hiÖn cña
mét gen th−êng cÇn ph¶i diÔn ra ®óng thêi ®iÓm vµ ®óng vÞ trÝ nhÊt ®Þnh trong c¬ thÓ,
®ång thêi liªn quan ®Õn nhiÒu ph©n tö tÝn hiÖu kh¸c nhau. ë nÊm men, sù tÝch hîp tÝn
hiÖu nh− vËy kh«ng kh¸c nhiÒu so víi vi khuÈn vµ c¸c gen cña chóng còng cã Ýt c¸c tr×nh
tù ®iÒu hßa h¬n nhiÒu so víi c¸c loµi eukaryote bËc cao (h×nh 5.16).

Promoter
Vi khuẩn Trình tự điều hòa

H×nh 5.16. Tr×nh tù ®iÒu Nấm men


hßa cña gen ë vi khuÈn,
nÊm men vµ ng−êi. H×nh
¶nh nµy minh häa sù phøc
t¹p t¨ng lªn trong cÊu tróc Người
c¸c tr×nh tù ®iÒu hßa tõ vi
khuÈn (nhiÒu gen chØ cã mét
tr×nh tù ®iÒu hßa duy nhÊt)
®Õn ng−êi (mét gen cã thÓ
cã nhiÒu tr×nh tù ®iÒu hßa).

155
§inh §oµn Long

ë eukaryote, c¸c tr×nh tù ®iÒu hßa cã thÓ c¸ch promoter ®Õn hµng ngh×n nucleotide
vÒ phÝa ®Çu 5’ hay 3’, vµ mçi gen cã thÓ cã ®Õn hµng chôc vÞ trÝ ®iÒu hßa kh¸c nhau.
Th«ng th−êng c¸c vÞ trÝ ®iÒu hßa nµy ®−îc tËp hîp thµnh c¸c ®¬n vÞ gäi lµ c¸c ®o¹n
tr×nh tù enhancer hoÆc ®o¹n tr×nh tù silencer (lµm “t¾t” gen). C¸c protein ®iÒu hßa
th−êng liªn kÕt víi c¸c ®o¹n tr×nh tù nµy ®Ó t−¬ng øng “bËt” hoÆc “t¾t” c¸c gen vµo
nh÷ng thêi ®iÓm vµ vÞ trÝ (tÕ bµo vµ m«) nhÊt ®Þnh trong qu¸ tr×nh sinh tr−ëng cña c¬ thÓ
sinh vËt.
ë eukaryote, vÞ trÝ ®iÒu hßa cã thÓ c¸ch gen ®−îc ®iÒu khiÓn ®Õn 50 kb hoÆc h¬n.
VËy, b»ng c¸ch nµo c¸c protein ®iÒu hßa cã thÓ ®iÒu khiÓn ®−îc gen tõ kho¶ng c¸ch xa
nh− vËy? C¸c vÝ dô vÒ ®iÒu khiÓn tõ xa ë vi khuÈn cho biÕt, ADN th−êng t¹o cÊu tróc
“vßng th¾t” ë gi÷a vÞ trÝ ®iÒu hßa vµ gen cÊu tróc. ë eukaryote, cÊu tróc nµy còng gióp
gi¶i thÝch sù ®iÒu hßa tõ xa trong phÇn lín tr−êng hîp. Nh−ng ë mét sè tr−êng hîp,
kho¶ng c¸ch nµy xa ®Õn møc mµ chi tiÕt cÊu tróc “vßng th¾t” ADN thÕ nµo ®Õn nay
ch−a râ.
Sù ho¹t hãa gen tõ xa trªn ph©n tö ADN ®Æt ra mét vÊn ®Ò n÷a lµ: khi liªn kÕt vµo
enhancer tõ mét kho¶ng c¸ch xa, protein ho¹t hãa cã thÓ ¶nh h−ëng ®Õn nhiÒu gen kh¸c
nhau. Nh−ng ®Õn nay, mét hiÖn t−îng phæ biÕn lµ hÇu hÕt mçi enhancer chØ liªn quan
®Õn sù ®iÒu khiÓn chØ mét (hoÆc mét sè Ýt) gen nhÊt ®Þnh. Ngoµi ra, cã mét nhãm c¸c
®o¹n tr×nh tù ®iÒu hßa kiÓu kh¸c, gäi lµ c¸c ®o¹n tr×nh tù c¸ch li (simulator) th−êng
®−îc t×m thÊy n»m ë gi÷a c¸c enhancer vµ promoter. C¸c ®o¹n tr×nh tù c¸ch li th−êng cã
vai trß ng¨n c¶n sù biÓu hiÖn gen, dï cho protein ho¹t hãa ®· liªn kÕt vµo enhancer. Nh−
vËy, mét vai trß cña c¸c yÕu tè c¸ch li lµ kiÓm so¸t ho¹t ®éng cña c¸c yÕu tè ho¹t hãa.

5.3.1. C¸c c¬ chÕ ®iÒu hßa phiªn m· chung ë eukaryote


Trong môc nµy, chóng ta sÏ tãm l−îc mét sè c¬ chÕ ®iÒu hßa chung ë eukaryote, tõ
nÊm men ®Õn ®éng vËt cã vó. Nh÷ng loµi sinh vËt nµy ®Òu cã bé m¸y phiªn m· phøc t¹p
vµ cÊu tróc nucleosome ®iÓn h×nh. Trong c¸c eukaryote, nÊm men lµ ®èi t−îng dÔ thao
t¸c trong phßng thÝ nghiÖm vµ cã chu tr×nh sèng ng¾n, nªn th−êng ®−îc chän lµ ®èi t−îng
nghiªn cøu m« h×nh. ThÕ nªn, phÇn lín c¸c kiÕn thøc thu ®−îc ®Õn nay vÒ ®iÒu hßa biÓu
hiÖn gen ë eukaryote lµ tõ ®èi t−îng nµy. Thùc nghiÖm cho thÊy c¸c protein ho¹t hãa
®iÓn h×nh cña nÊm men cã t¸c dông thóc ®Èy phiªn m· ë c¸c tÕ bµo ®éng vËt cã vó, nghÜa
lµ bé m¸y ®iÒu hßa biÓu hiÖn c¸c gen cña chóng cã nh÷ng ®Æc ®iÓm chung.
Chóng ta còng sÏ thÊy, mét protein ho¹t hãa ®iÓn h×nh ë eukaryote th−êng cã c¸ch
thøc ho¹t ®éng gièng víi tr−êng hîp phæ biÕn nhÊt ë vi khuÈn. NghÜa lµ, chóng th−êng
cã miÒn liªn kÕt ADN t¸ch biÖt víi miÒn ho¹t hãa, vµ chóng ho¹t hãa phiªn m· th«ng
qua huy ®éng ARN polymerase vµ phøc hÖ khëi ®Çu phiªn m· tíi promoter cña c¸c gen.
Tuy vËy, ë eukaryote, c¸c protein øc chÕ cã nhiÒu kiÓu ho¹t ®éng kh¸c nhau, trong ®ã
mét sè cã c¸ch ho¹t ®éng rÊt kh¸c biÖt víi vi khuÈn. Trong sè nµy cã c¸c c¬ chÕ lµm t¾t
gen, mµ sù biÕn ®æi cÊu tróc chÊt nhiÔm s¾c lµ mét c¬ chÕ c¬ b¶n lµm mét phÇn lín ADN
hÖ gen trong chu tr×nh sèng cña tÕ bµo th−êng duy tr× ë tr¹ng th¸i kh«ng ho¹t ®éng.
Dï cã nhiÒu ®Æc ®iÓm chung, nh−ng xÐt vÒ chi tiÕt, sù ®iÒu hßa biÓu hiÖn gen ë
eukaryote lµ ®a d¹ng vµ cã tÝnh linh ho¹t cao. ë nÊm men, sè vÞ trÝ ®iÒu hßa ë mçi gen
nh×n chung th−êng Ýt h¬n so víi c¸c sinh vËt ®a bµo. Qua ®ã, ta cã thÓ dù ®o¸n r»ng, c¸c
c¬ chÕ ®iÒu hßa gen ë sinh vËt bËc ®a bµo cã sù ®a d¹ng vµ phøc t¹p h¬n.

156
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

5.3.1.1. Protein ho¹t hãa ë eukaryote cã miÒn ho¹t hãa t¸ch biÖt víi miÒn liªn kÕt ADN
Gièng ë vi khuÈn, nhiÒu protein ho¹t hãa ë eukaryote cã c¸c trung t©m ho¹t hãa vµ
vÞ trÝ liªn kÕt ADN thuéc c¸c miÒn (domain) t¸ch biÖt nhau. Th«ng th−êng, hai bÒ mÆt
t−¬ng t¸c nµy cña protein thuéc vÒ hai miÒn chøc n¨ng kh¸c nhau. §«i khi, trung t©m
ho¹t hãa vµ vÞ trÝ liªn kÕt ADN thuéc vÒ c¸c chuçi polypeptide kh¸c nhau. B¶n chÊt t¸ch
biÖt gi÷a c¸c miÒn ho¹t hãa vµ liªn kÕt ADN ë c¸c protein ®iÒu hßa cña eukaryote cã thÓ
®−îc ph¸t hiÖn bëi kü thuËt ph©n tÝch t−¬ng t¸c protein-protein (ch−¬ng 11).
5.3.1.2. C¸c protein ®iÒu hßa ë eukaryote sö dông c¸ch nhËn biÕt tr×nh tù ADN gièng
prokaryote, nh−ng cã thÓ cã nhiÒu miÒn liªn kÕt ADN kh¸c nhau
ë trªn, chóng ta biÕt r»ng phÇn lín protein ®iÒu hßa ë vi khuÈn liªn kÕt víi tr×nh
tù ADN ®Ých bëi d¹ng phøc kÐp (dimer) cña protein; trong ®ã, mçi tiÓu phÇn cña nã
th−êng cµi mét chuçi α vµo khe chÝnh cña ph©n tö ADN sîi kÐp. KiÓu liªn kÕt nµy kh«ng
cÇn protein hay ADN ph¶i thay ®æi cÊu h×nh kh«ng gian cña nã. §Ó cã kiÓu t−¬ng t¸c
ADN-protein nµy, nhiÒu protein ®iÒu hßa ë vi khuÈn sö dông motif xo¾n-uèn-xo¾n.
Motif nµy th−êng cã hai chuçi xo¾n α nèi víi nhau bëi mét vßng th¾t ng¾n. Mét chuçi α
cµi “võa khÝt” vµo khe chÝnh cña ADN vµ nhËn biÕt c¸c baz¬ nit¬ ®Æc hiÖu. Chuçi α kia
liªn kÕt däc khung ph©n tö vµ lµm t¨ng c−êng lùc liªn kÕt gi÷a ADN vµ protein (h×nh
5.7).
KiÓu liªn kÕt nh− vËy còng ®−îc t×m thÊy ë eukaryote (mÆc dï xÐt vÒ chi tiÕt, cã
mét vµi kh¸c biÖt). NghÜa lµ, c¸c protein còng th−êng liªn kÕt vµo vÞ trÝ ®iÒu hßa ë d¹ng
phøc kÐp (dimer) vµ cµi chuçi α vµo khe chÝnh cña ADN (h×nh 5.18). Mét nhãm lín c¸c
protein ®iÒu hßa ë eukaryote cã chuçi xo¾n lµm nhiÖm vô nhËn biÕt ADN cã motif d¹ng
xo¾n-uèn-xo¾n; tuy vËy, mét sè kh¸c cã motif vïng nhËn biÕt ADN hoµn toµn kh¸c biÖt.
VÝ dô nh−, mét trong nh÷ng motif gÆp nhiÒu ë eukaryote, nh−ng ch−a gÆp ë prokaryote,
lµ motif dÞ phøc kÐp (heterodimer), hoÆc trong C Chuçi xo¾n α
mét sè tr−êng hîp lµ c¸c motif ®¬n ph©n (chØ nhËn biÕt ADN
cã mét chuçi polypeptide). CÊu tróc dÞ phøc kÐp
cho phÐp c¸c protein ®iÒu hßa më réng kh¶ MÆt ph¼ng β
n¨ng liªn kÕt ®Æc hiÖu cña chóng. Khi mçi ®¬n
His
ph©n cã tÝnh ®Æc thï liªn kÕt riªng, th× tÝnh ®Æc Cys
thï cña cÊu tróc dÞ phøc kÐp lµ kh¸c víi
nguyªn phøc kÐp (homodimer). D−íi ®©y lµ Zn
mét sè vÝ dô vÒ motif miÒn liªn kÕt ADN cña
protein ®iÒu hßa ë eukaryote.
MiÒn ®ång h×nh (homeodomain). “MiÒn His Cys
®ång h×nh” lµ kh¸i niÖm m« t¶ mét nhãm cÊu
tróc d¹ng “xo¾n-uèn-xo¾n” trong vïng liªn kÕt
ADN phæ biÕn ë c¸c yÕu tè phiªn m·; vÒ c¬ b¶n
chóng nhËn biÕt ADN theo kiÓu gièng ë vi
khuÈn. Nh−ng, nÕu motif “xo¾n-uèn-xo¾n” cña
c¸c protein ®iÒu hßa ë vi khuÈn kh¸c nhau vÒ N
cÊu tróc khi xÐt chi tiÕt, th× “miÒn ®ång h×nh” ë
c¸c protein ®iÒu hßa t×m thÊy ë hÇu hÕt c¸c
H×nh 5.17. Mét vÝ dô vÒ miÒn liªn kÕt ADN
loµi eukaryote l¹i rÊt gièng nhau. NhiÒu
chøa kÏm (Zn). Chuçi xo¾n α bªn tr¸i cã vai trß
protein cã miÒn ®ång h×nh liªn kÕt ADN ë nhËn biÕt ADN. MÆt ph¼ng β bªn ph¶i t−¬ng t¸c
d¹ng dÞ phøc kÐp. víi bÒ mÆt ph©n tö ADN. Nguyªn tö Zn liªn kÕt
MiÒn liªn kÕt ADN chøa kÏm. Mét sè víi hai Cys cña mÆt ph¼ng β vµ hai His cña chuçi
xo¾n α, t¹o nªn mét cÊu tróc æn ®Þnh cÇn thiÕt
miÒn liªn kÕt ADN cã chøa c¸c nguyªn tö kÏm cho protein ®iÒu hßa cã thÓ liªn kÕt vµo ADN
(Zn), trong ®ã bao gåm c¸c protein ngãn tay (theo Lee et al, 1989; Science, 254).

157
§inh §oµn Long

kÏm (nh− yÕu tè TFIIIA ®iÒu hßa phiªn m· c¸c gen m· hãa rARN) hay c¸c protein bã
kÏm (nh− yÕu tè Gal4 ë nÊm men). Trong protein ho¹t hãa Gal4, c¸c nguyªn tö Zn
t−¬ng t¸c víi c¸c axit amin His vµ Cys t¹o thµnh mét cÊu tróc cÇn cho sù liªn kÕt vµo
ADN cña protein (h×nh 5.17). ë ®©y, ADN còng ®−îc nhËn biÕt qua viÖc cµi chuçi α vµo
khe chÝnh cña ADN. Mét sè protein cã thÓ chøa nhiÒu bã kÏm kÕt ®u«i nhau, mçi bã
®Òu liªn kÕt víi ADN qua khe chÝnh vµ chuçi α. Víi chiÒu dµi më réng nh− vËy, tÝnh
®Æc hiÖu cña liªn kÕt t¨ng lªn.
Motif khãa kÐo leucine. Motif nµy th−êng gåm hai chuçi α dµi kÑp vµo ph©n tö
ADN nh− mét chiÕc “k×m”. Trong ®ã, mçi chuçi cµi vµo mét khe chÝnh (h×nh 5.18a). ë
motif khãa kÐo leucine, hai chuçi polypeptide th−êng ®−îc gi÷ víi nhau bëi t−¬ng t¸c kÞ
n−íc gi÷a c¸c axit amin Leu vµ sù lång vµo nhau cña 2 vßng xo¾n α. C¸c protein motif
khãa kÐo leucine cã thÓ hoÆc ë d¹ng dÞ phøc kÐp hoÆc nguyªn phøc kÐp (h×nh 5.18b).
Motif xo¾n-vßng-xo¾n - HLH (helix-loop-helix). Gièng motif khãa kÐo leucine,
motif nµy th−êng lµ phøc khÐp cña hai chuçi polypeptide (cã thÓ lµ dÞ phøc kÐp hoÆc
nguyªn phøc kÐp) gåm c¸c vßng xo¾n α cµi vµo khe chÝnh vµ cã vai trß nhËn biÕt ADN,
ngoµi ra cã c¸c vßng xo¾n α ng¾n h¬n cã vai trß cÊu tróc. Gi÷a hai vßng xo¾n α lµ mét
“vßng th¾t” linh ho¹t gi÷ chóng víi nhau (v× vËy ®−îc gäi lµ xo¾n-vßng-xo¾n). Do vïng
liªn kÕt ADN mang c¸c axit amin kiÒm, nªn c¸c protein cã motif nµy cßn ®−îc gäi lµ c¸c
HLH kiÒm.
a) b)

Chuçi xo¾n α

Khe chÝnh
ADN
ADN

Nguyªn phøc kÐp DÞ phøc kÐp


(homodimer) (heterodimer)

H×nh 5.18. Motif khãa kÐo leucine. a) MiÒn liªn kÕt ADN cã motif nµy gåm hai chuçi xo¾n α kÝch th−íc lín lång
vµo nhau; mçi chuçi cµi t−¬ng øng vµo mét khe chÝnh. b) Hai chuçi xo¾n cã thÓ tån t¹i ë d¹ng nguyªn phøc kÐp
(hai chuçi gièng nhau), hoÆc dÞ phøc kÐp (hai chuçi kh¸c nhau)

5.3.1.3. MiÒn ho¹t hãa cã cÊu h×nh linh ho¹t


Kh¸c víi miÒn liªn kÕt ADN, miÒn ho¹t hãa th−êng cã cÊu tróc biÕn ®æi. §iÒu nµy
gióp trung t©m ho¹t hãa cã thÓ chuyÓn ®−îc tr¹ng th¸i, sau khi protein ®iÒu hßa liªn kÕt
víi c¸c ph©n tö tÝn hiÖu kh¸c nhau. Thay cho motif, miÒn ho¹t hãa th−êng ®−îc ph©n lo¹i
dùa trªn ®Æc tÝnh tÝch ®iÖn cña c¸c axit amin n»m trong miÒn nµy. NhiÒu ®ét biÕn lµm
t¨ng tÝnh ë axit ë miÒn ho¹t hãa ®i ®«i víi ho¹t lùc cña protein ®iÒu hßa t¨ng lªn, cho
thÊy vai trß cña c¸c axit amin tÝnh axit ë miÒn nµy. Ngoµi ra, c¸c protein ho¹t hãa
th−êng kh¸c nhau vÒ tr×nh tù axit amin cña miÒn ho¹t hãa, nh−ng th−êng cã ®Æc ®iÓm
chung vÒ c¸c axit amin cã tÝnh kÞ n−íc vµ tÝch ®iÖn ©m. V× vËy, cã quan ®iÓm cho r»ng
miÒn ho¹t hãa th−êng gåm nhiÒu “®¬n vÞ”, trong ®ã mçi “®¬n vÞ” cã ho¹t tÝnh riªng; khi sè
®¬n vÞ vµ tÝnh axit cña miÒn ho¹t hãa cµng cao, th× ho¹t tÝnh cµng cã xu h−íng t¨ng.

158
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

5.3.2. C¸c phøc hÖ ®iÒu hßa biÓu hiÖn gen ë eukaryote


5.3.2.1. C¸c protein ho¹t hãa th−êng tæ hîp víi nhau ®Ó tÝch hîp tÝn hiÖu
ë vi khuÈn, chóng ta ®· thÊy hiÖn t−îng tÝch hîp tÝn hiÖu trong ®iÒu hßa biÓu hiÖn
gen. Ch¼ng h¹n, operon Lac ë E. coli ®−îc ®iÒu hßa ®ång thêi bëi sù cã mÆt cña lactose vµ
kh«ng cã glucose. Hai tÝn hiÖu nµy ®−îc truyÒn ®Õn gen th«ng qua hai protein ®iÒu hßa
riªng biÖt, mét lµ protein ho¹t hãa (CAP), mét lµ protein øc chÕ (LacI). ë sinh vËt ®a bµo,
sù tÝch hîp tÝn hiÖu nh− vËy rÊt phæ biÕn. Còng gièng ë vi khuÈn, mçi tÝn hiÖu trong ®iÒu
hßa gen ë eukaryote th−êng ®−îc truyÒn ®Õn gen th«ng qua mét yÕu tè ®iÒu hßa riªng
biÖt. Nh− vËy, ë mçi gen th−êng cã nhiÒu protein ®iÒu hßa cïng phèi hîp ho¹t ®éng.
Khi phèi hîp ho¹t ®éng, c¸c protein ho¹t hãa th−êng cã t¸c ®éng hiÖp lùc. NghÜa
lµ, hiÖu øng chung lín h¬n tæng hiÖu øng thµnh phÇn. TÝnh hiÖp lùc cã thÓ thÊy khi:
1) nhiÒu protein ho¹t hãa kh¸c nhau cïng huy ®éng mét thµnh phÇn cña bé m¸y phiªn
m·, 2) khi chóng huy ®éng c¸c thµnh phÇn kh¸c nhau cña bé m¸y phiªn m·, hoÆc 3) khi
c¸c protein ho¹t hãa cã t¸c ®éng bæ trî trong liªn kÕt vµo ADN vµ ®iÒu khiÓn biÓu hiÖn
gen. H×nh 5.19 minh häa mét sè c¸ch c¸c protein ho¹t hãa cã thÓ tæ hîp víi nhau trong
t−¬ng t¸c víi ADN. Sù tæ hîp cã ý nghÜa quan träng ®èi víi sù tÝch hîp tÝn hiÖu cña c¸c
protein ho¹t hãa. NhiÒu gen chØ biÓu a) b)
hiÖn khi nhËn ®−îc ®ång thêi nhiÒu tÝn A B A B
hiÖu kh¸c nhau. Mçi tÝn hiÖu ®−îc
X
truyÒn ®Õn gen bëi c¸c ph©n tö ho¹t hãa
riªng, nh−ng gen hÇu nh− kh«ng ho¹t
®éng khi kh«ng cã ®ñ c¸c tÝn hiÖu (hoÆc A B A
X B
c¸c protein ®iÒu hßa) cÇn thiÕt.
a) T¸c ®éng hiÖp lùc cña hai
VÞ trÝ liªn
protein ®iÒu hßa (mét cã vai trß huy kÕt B
®éng c¸c protein c¶i biÕn nucleosome, c) d)
mét cã vai trß huy ®éng bé m¸y phiªn
m·) ë gen HO. NÊm men S. cerevisiae VÞ trÝ liªn
sinh s¶n b»ng h×nh thøc n¶y chåi d−íi
A kÕt A
sù ®iÒu khiÓn bëi gen HO. Gen HO chØ
A
biÓu hiÖn trong tÕ bµo mÑ vµo mét thêi B
®iÓm nhÊt ®Þnh cña chu tr×nh tÕ bµo.
Sù kiÖn nµy x¶y ra bëi hai tÝn hiÖu
®−îc “truyÒn t¶i” ®Õn gen qua hai Enzym t¸i
protein ®iÒu hßa lµ SW15 vµ SBF. cÊu tróc A
SW15 liªn kÕt vµo mét sè vÞ trÝ ë xa
gen, trong ®ã vÞ trÝ gÇn nhÊt c¸ch A B
promoter trªn 1 kb (h×nh 5.20). SBF B
còng liªn kÕt vµo nhiÒu vÞ trÝ kh¸c
nhau, nh−ng gÇn promoter h¬n so víi
SW15. Së dÜ sù biÓu hiÖn cña gen nµy
phô thuéc vµo hai protein ho¹t hãa H×nh 5.19. Mét sè c¸ch phèi hîp cña
B
kh¸c nhau, v×: SBF (chØ ho¹t ®éng vµo c¸c protein ®iÒu hßa. a) vµ b) Sù tæ hîp
mét thêi ®iÓm nhÊt ®Þnh cña chu tr×nh trùc tiÕp cña hai hay nhiÒu protein ®iÒu
hßa. c) Mét protein ®iÒu hßa (A) huy ®éng
tÕ bµo) kh«ng thÓ liªn kÕt vµo c¸c vÞ trÝ mét enzym t¸i cÊu tróc nucleosome, lµm
cña nã trªn nhiÔm s¾c thÓ khi béc lé vÞ trÝ liªn kÕt cña protein kh¸c (B). A
nucleosome ch−a ®−îc c¶i biÕn, cßn d) Mét protein lµm gi·n xo¾n ADN t¹i
SW15 (chØ ho¹t ®éng trong tÕ bµo mÑ) nucleosome, gióp mét protein kh¸c liªn kÕt
cã thÓ liªn kÕt vµo c¸c vÞ trÝ cña nã mµ ®−îc vµo vÞ trÝ cña nã (Watson, 2004).

159
§inh §oµn Long

kh«ng cÇn sù biÕn ®æi nµo cña chÊt nhiÔm s¾c. Sù cã mÆt cña SW15 gióp huy ®éng c¸c
yÕu tè c¶i biÕn nucleosome (nh− enzym histone acetylase vµ phøc hÖ t¸i cÊu tróc
nucleosome SWI/SNF). Nhê vËy, SBF liªn kÕt ®−îc vµo c¸c vÞ trÝ ®iÒu hßa cña nã, ®ång
thêi huy ®éng bé m¸y phiªn m· tíi gen vµ ho¹t hãa gen. Nh− vËy, gen HO chØ ®−îc biÓu
hiÖn khi cã ®ång thêi hai protein SW15 vµ SBF.
b) Sù phèi hîp cña c¸c protein ho¹t hãa gen β-interferon ë ng−êi. Gen m· hãa β-
interferon ë ng−êi ®−îc ho¹t hãa khi cã sù x©m nhiÔm cña virut. Sù x©m nhiÔm nµy kÝch
ho¹t ba protein ®iÒu hßa lµ NFκB, IRF vµ Jun/ATF. C¸c protein nµy liªn kÕt vµo c¸c vÞ
trÝ c¹nh nhau trong mét tr×nh tù enhancer c¸ch promoter 1 kb vÒ phÝa ®Çu 5’, vµ h×nh
thµnh mét phøc hÖ t¨ng c−êng (enhancing complex). Sù h×nh thµnh phøc hÖ t¨ng
c−êng lµ mét c¬ chÕ ®¶m b¶o cho sù tÝch hîp c¸c tÝn hiÖu: gen chØ biÓu hiÖn khi cã c¶ ba
protein vµ chØ khi cã phøc hÖ t¨ng c−êng bé m¸y phiªn m· míi tiÕn hµnh biÓu hiÖn gen.

5.3.2.2. §iÒu hßa tæ hîp lµ trung t©m cña tÝnh ®a d¹ng vµ phøc t¹p trong ®iÒu hßa biÓu
hiÖn gen ë eukaryote
Phøc hÖ t¸i cÊu tróc
Kh¸i niÖm ®iÒu hßa tæ hîp ®· ®−îc chÊt nhiÔm s¾c
chóng ta nh¾c ®Õn trong tr−êng hîp protein CAP Enzym
®−îc dïng ®Ó ®iÒu hßa ®ång thêi nhiÒu gen kh¸c SW15 histone acetylase
nhau ë vi khuÈn (vÝ dô c¸c operon Lac vµ Gal). HO
Sù tæ hîp nµy ë eukaryote thËm chÝ cßn phæ biÕn
h¬n. H×nh 5.21 minh häa mét vÝ dô vÒ ®iÒu hßa Gen kh«ng
tæ hîp. Gen A ®−îc ®iÒu khiÓn bëi bèn tÝn hiÖu biÓu hiÖn
(1, 2, 3 vµ 4), mçi tÝn hiÖu ho¹t ®éng qua mét
SBF
protein ho¹t hãa kh¸c nhau (a1 – a4). Gen B
®−îc ®iÒu khiÓn bëi 3 tÝn hiÖu (3, 5 vµ 6) vµ qua
c¸c protein ho¹t hãa a3 – a6. Nh− vËy, hai gen HO
nµy ®−îc ®iÒu khiÓn bëi cÆp “tÝn hiÖu – protein
VÞ trÝ liªn Gen
VÞ trÝ liªn
ho¹t hãa” chung lµ “3 – a3”. ë ®éng vËt, kiÓu kÕt SW15 kÕt SBF biÓu hiÖn
®iÒu hßa tæ hîp th−êng liªn quan ®Õn nhiÒu gen
H×nh 5.20. Sù ®iÒu khiÓn gen HO. SW15 cã
vµ nhiÒu protein ®iÒu hßa h¬n. VËy, b»ng c¸ch thÓ liªn kÕt vµo vÞ trÝ cña nã trªn ADN mµ kh«ng
nµo sù ®iÒu hßa tæ hîp kh«ng g©y “r¾c rèi” cho cÇn cã sù c¶i biÕn nµo, nh−ng SBF th× kh«ng. Sau
sù biÓu hiÖn cña mçi gen? khi liªn kÕt vµo ADN, SW15 huy ®éng histone
acetylase vµ phøc hÖ t¸i cÊu tróc nucleosome lµm
Nh− ®· nãi ë trªn, nhiÒu protein ®iÒu hßa c¶i biÕn vïng chÊt nhiÔm s¾c t¹i vÞ trÝ liªn kÕt SBF,
ho¹t ®éng theo kiÓu “tæ hîp”. ThËm chÝ, c¸c tiÓu nhê vËy protein ho¹t hãa SBF cã thÓ liªn kÕt vµo vÞ
phÇn kh¸c nhau cña chóng còng cã thÓ g©y nªn trÝ cña nã (gÇn promoter) vµ ho¹t hãa gen.
t¸c ®éng “tæ hîp”. §iÒu nµy gi¶i thÝch t¹i sao
nhiÒu protein ®iÒu hßa cã thÓ cïng ho¹t ®éng
trong c¸c tæ hîp kh¸c nhau. C¸c vÝ dô vÒ sù “tÝch 1 2 3 4
hîp tÝn hiÖu” nªu trªn (c¸c gen HO vµ β- Gen A
interferon) ®Òu liªn quan ®Õn mét sè protein
VÞ trÝ 1 VÞ trÝ 2 VÞ trÝ 3 VÞ trÝ 4
tham gia ®iÒu hßa tæ hîp. ë nÊm men, SW15
tham gia ®iÒu hßa nhiÒu gen kh¸c nhau; cßn ë 3 5 6
®éng vËt cã vó, NFκB kh«ng chØ ®iÒu hßa gen β- Gen B
interferon mµ cßn nhiÒu gen kh¸c, bao gåm
chuçi nhÑ κ cña immunoglobulin trong c¸c tÕ bµo VÞ trÝ 3 VÞ trÝ 4 VÞ trÝ 5
lympho B. T−¬ng tù nh− vËy, Jun/ATF khi tæ H×nh 5.21. VÝ dô vÒ ®iÒu hßa tæ hîp. Hai gen
hîp víi c¸c protein ho¹t hãa kh¸c cã thÓ tham nµy ®−îc ®iÒu khiÓn ®ång thêi bëi nhiÒu tÝn hiÖu
gia ®iÒu hßa nhiÒu gen kh¸c nhau. Chóng ta kh¸c nhau. Mçi tÝn hiÖu ®−îc "truyÒn t¶i" bëi mét
protein ®iÒu hßa. Protein 3 ho¹t ®éng ®ång thêi trªn
còng ®· m« t¶ mét sè protein liªn kÕt ADN cã c¶ hai gen. Nh−ng ë mçi gen, nã tæ hîp víi c¸c yÕu
thÓ ë d¹ng “dÞ phøc kÐp” hoÆc “nguyªn phøc tè ®iÒu hßa kh¸c nhau.

160
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

kÐp”. §©y còng lµ mét c¬ chÕ ®iÒu hßa tæ hîp kh¸c n÷a. §Õn nay, cã thÓ nãi c¬ chÕ ®iÒu
hßa tæ hîp ®−îc t×m thÊy phæ biÕn ë mäi eukaryote. §iÒu nµy ®Æc biÖt ®óng ®èi víi c¸c
gen ®Æc tr−ng cho toµn bé liªn giíi. V× vËy, nã ®−îc coi lµ trung t©m cña tÝnh phøc t¹p vµ
®a d¹ng trong ®iÒu hßa gen ë eukaryote.

5.3.2.3. C¸c chÊt øc chÕ phiªn m·


Chóng ta ®· biÕt ë vi khuÈn cã mét sè protein øc chÕ phiªn m· ho¹t ®éng theo kiÓu
liªn kÕt vµo c¸c vÞ trÝ n»m trong hoÆc gèi lªn c¸c promoter (nh− ë c¸c operon Trp vµ Lac)
lµm ng¨n c¶n sù liªn kÕt cña ARN polymerase vµo promoter. Ngoµi ra, c¸c protein øc chÕ
cßn ho¹t ®éng theo mét sè c¸ch kh¸c n÷a. Ch¼ng h¹n nh− chóng liªn kÕt vµo mét sè vÞ trÝ
gÇn promoter, råi t−¬ng t¸c víi ARN polymerase vµ øc chÕ enzym nµy khëi ®Çu phiªn
m·; hoÆc th«ng qua sù can thiÖp vµo ho¹t ®éng cña c¸c protein ho¹t hãa.
ë eukaryote, chóng ta còng gÆp c¸c c¬ chÕ a) C¬ chÕ c¹nh tranh
øc chÕ nªu trªn, trõ c¬ chÕ ®Çu tiªn (®¸ng ng¹c
A R
nhiªn lµ c¬ chÕ nµy l¹i chÝnh lµ c¬ chÕ phæ biÕn
nhÊt ë vi khuÈn). ë eukaryote, c¬ chÕ phæ biÕn
h¬n c¶ d−êng nh− lµ qua c¸c protein øc chÕ cã Promoter
vai trß huy ®éng c¸c phøc hÖ c¶i biÕn VÞ trÝ liªn kÕt VÞ trÝ liªn kÕt
nucleosome. Nh−ng kh¸c víi c¸c protein ho¹t protein ho¹t hãa protein øc chÕ
hãa, c¸c enzym ®−îc protein øc chÕ huy ®éng
b) C¬ chÕ øc chÕ
th−êng lµm chÊt nhiÔm s¾c ®ãng chÆt h¬n, ®ång
thêi lo¹i bá c¸c “tÝn hiÖu” ®−îc bé m¸y phiªn m· A R
nhËn biÕt. Ch¼ng h¹n, c¸c enzym histone
deacetylase øc chÕ phiªn m· qua viÖc lo¹i
nhãm acetyl khái ®o¹n ®u«i cña c¸c protein
histone (d−íi ®©y, ta sÏ thÊy nhãm acetyl cña c) C¬ chÕ k×m hXm trùc tiÕp
c¸c histone cã vai trß thóc ®Èy phiªn m·).
T−¬ng tù nh− vËy, c¸c enzym methyl hãa vïng R
“®u«i” histone còng th−êng cã t¸c dông øc chÕ Phøc hÖ
phiªn m·. Nh÷ng c¶i biÕn nµy h×nh thµnh nªn khëi ®Çu
ChÊt m«i giíi phiªn m·
mét c¬ chÕ “bÝt gen”. H×nh 5.22 minh häa mét
sè c¬ chÕ “bÝt gen” ë eukaryote.
5.3.2.4. C¸c con ®−êng truyÒn tÝn hiÖu vµ sù
®iÒu khiÓn c¸c yÕu tè ®iÒu hßa phiªn m· ARN polymerase
a) TÝn hiÖu ®−îc truyÒn ®Õn c¸c yÕu tè ®iÒu d) C¬ chÕ k×m hXm gi¸n tiÕp
hßa phiªn m· nh− thÕ nµo? Protein øc chÕ huy
ë prokaryote vµ eukaryote, chóng ta ®Òu ®éng histone
deacetylase
thÊy sù biÓu hiÖn cña gen th−êng phô thuéc
R
vµo mét sè tÝn hiÖu tõ m«i tr−êng. Cã nhiÒu
c¸ch kh¸c nhau ®Ó c¸c tÕ bµo vµ gen cña chóng
ph¸t hiÖn ®−îc c¸c tÝn hiÖu nµy. VÝ dô ë vi
khuÈn, c¸c ph©n tö tÝn hiÖu ®iÒu khiÓn c¸c
protein ®iÒu hßa b»ng c¸ch thay ®æi cÊu h×nh
cña chóng. Th«ng th−êng, hiÖu øng “dÞ h×nh”
xuÊt hiÖn trùc tiÕp; nghÜa lµ, mét ph©n tö nhá
Vïng gen bÞ bÝt bëi histone deacetylase
(nh− allolactose hay cAMP) liªn kÕt vµo yÕu tè
®iÒu hßa, lµm thay ®æi cÊu h×nh vµ sù biÓu hiÖn H×nh 5.22. Mét sè c¸ch ho¹t ®éng cña protein
chøc n¨ng cña chóng. Nh−ng ®«i khi, hiÖu øng øc chÕ biÓu hiÖn gen ë eukaryote. A lµ protein
“dÞ h×nh” lµ gi¸n tiÕp. Ch¼ng h¹n, ®èi víi yÕu tè ho¹t hãa, R lµ protein øc chÕ.

161
§inh §oµn Long

ho¹t hãa NtrC (môc 5.2.2.8), tÝn hiÖu cña m«i tr−êng (nång ®é NH4+ thÊp) ho¹t hãa mét
enzym kinase; ®Õn l−ît m×nh, enzym nµy phosphoryl hãa vµ ho¹t hãa NtrC. KiÓu truyÒn
tÝn hiÖu gi¸n tiÕp (qua nhiÒu b−íc) nµy lµ mét vÝ dô vÒ mét con ®−êng truyÒn tÝn hiÖu.
Kh¸i niÖm “tÝn hiÖu” ë ®©y th−êng ®−îc hiÓu chÝnh lµ ph©n tö kÝch øng (ligand) ®Çu
tiªn. ë eukaryote, trong c¸c con ®−êng truyÒn tÝn hiÖu ®iÓn h×nh, c¸c ligand th−êng ®−îc
nhËn biÕt bëi c¸c thô thÓ bÒ mÆt tÕ bµo ®Æc tr−ng cña nã (ligand th−êng ®Ýnh kÕt vµo
miÒn ngo¹i bµo cña thô thÓ, råi tÝn hiÖu tiÕp tôc ®−îc thô thÓ truyÒn tíi miÒn néi bµo).
Tõ ®ã, tÝn hiÖu th−êng ®−îc truyÒn tíi c¸c yÕu tè ®iÒu hßa phiªn m· qua mét chuçi c¸c
enzym kinase. Mét c©u hái ®Æt ra lµ: b»ng c¸ch nµo viÖc ®Ýnh kÕt mét ligand vµo miÒn
ngo¹i bµo cña thô thÓ ®−îc “truyÒn t¶i” vµo miÒn néi bµo? §ã lµ do tÝnh chÊt “dÞ h×nh”
cña miÒn néi bµo ë c¸c thô thÓ. Ngoµi ra, c¸c ligand còng cã thÓ ho¹t ®éng theo kiÓu kÕt
hîp hai hay nhiÒu thô thÓ víi nhau. Sù t−¬ng t¸c gi÷a miÒn néi bµo cña c¸c thô thÓ kh¸c
nhau cã thÓ ho¹t hãa lÉn nhau. H×nh 5.23 minh häa mét vÝ dô ®¬n gi¶n vÒ mét con
®−êng truyÒn tÝn hiÖu. ë ®©y, mét enzym kinase th−êng xuyªn liªn kÕt vµo miÒn néi bµo
cña thô thÓ. Khi ligand (ë ®©y lµ mét cytokine) ho¹t hãa thô thÓ, nã “®−a” hai chuçi thô
thÓ ®Õn gÇn nhau vµ ho¹t hãa kinase xóc t¸c ph¶n øng phosphoryl hãa ë mét tr×nh tù
®Æc biÖt trong miÒn néi bµo cña thô thÓ. VÞ trÝ g¾n gèc ~ nµy ®−îc mét protein ®Æc biÖt
(STAT) nhËn ra vµ liªn kÕt vµo, sau ®ã thô thÓ truyÒn l¹i gèc ~ cho STAT. Sau khi
®−îc ho¹t hãa (nhËn gèc ~), protein STAT h×nh thµnh mét nguyªn phøc kÐp vµ ®−îc
vËn chuyÓn vµo nh©n tÕ bµo. T¹i ®©y, nã liªn kÕt víi ADN vµ ho¹t hãa sù biÓu hiÖn gen.
Trong thùc tÕ, c¸c con ®−êng truyÒn tÝn hiÖu ®Ó ho¹t hãa gen cã tÝnh phøc t¹p vµ møc ®é
tæ hîp cao h¬n. Nh×n chung, sù truyÒn tÝn hiÖu phæ biÕn nhÊt lµ qua sù phosphoryl hãa.
Tuy vËy, nh÷ng c¬ chÕ c¶i biÕn protein kh¸c, bao gåm sù ph©n gi¶i protein, lo¹i gèc
phosphate... còng ®−îc dïng ®Ó truyÒn tÝn hiÖu.

Cytokine

Ngo¹i bµo

SH2 TÕ bµo chÊt


STAT
Kinase
Nh©n tÕ bµo
(JAK) SH2
STAT
Gen 1
H×nh 5.23. Mét vÝ dô vÒ con ®−êng truyÒn tÝn hiÖu trong ®iÒu hßa sù biÓu hiÖn cña gen.

b) C¸c yÕu tè ®iÒu hßa phiªn m· ë eukaryote ®−îc ®iÒu khiÓn bëi tÝn hiÖu nh− thÕ nµo?
Khi c¸c tÝn hiÖu ®· ®−îc truyÒn tíi c¸c yÕu tè ®iÒu hßa phiªn m·, th× ho¹t ®éng ®iÒu
khiÓn phiªn m· tiÕp theo nh− thÕ nµo? ë vi khuÈn, sù ®iÒu hßa qua qui t¾c dÞ h×nh lµm
thay ®æi “¸i lùc liªn kÕt” cña mét yÕu tè ®iÒu hßa trªn ADN lµ mét c¬ chÕ phæ biÕn.
Nh−ng ë eukaryote, c¸c yÕu tè ®iÒu hßa phiªn m· ®iÓn h×nh chñ yÕu kh«ng ho¹t ®éng
qua c¬ chÕ nµy (trõ mét sè ngo¹i lÖ). HÇu hÕt c¸c yÕu tè ®iÒu hßa phiªn m· ë eukaryote
ho¹t ®éng theo hai c¸ch c¬ b¶n sau:
- Béc lé vïng ho¹t hãa: C¬ chÕ nµy x¶y ra hoÆc qua sù thay ®æi cÊu h×nh cña yÕu
tè phiªn m· liªn kÕt s½n víi ADN (nh−ng ch−a h×nh thµnh phøc hÖ “më”), hoÆc qua sù
gi¶i phãng c¸c gen khái c¸c protein bÞt mÆt (masking protein) lµm bé m¸y phiªn m·
kh«ng tiÕp cËn ®−îc gen. Sù thay ®æi cÊu h×nh cña c¸c protein bÞt mÆt cã thÓ do sù liªn

162
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

kÕt trùc tiÕp cña c¸c ligand, hoÆc qua sù phosphoryl hãa ®−îc kÝch øng bëi c¸c ligand. Mét
vÝ dô vÒ tr−êng hîp nµy lµ yÕu tè ho¹t hãa Gal4. Khi kh«ng cã galactose, Gal4 liªn kÕt ®−îc
vµo gen GAL1, nh−ng nã kh«ng ho¹t hãa ®−îc gen nµy v× cã mét protein kh¸c (Gal80) liªn
kÕt vµo nã vµ lµm bÊt ho¹t vïng ho¹t hãa cña Gal4. §−êng galactose cã t¸c dông kÝch øng
gi¶i phãng Gal80, qua ®ã ho¹t hãa gen GAL1 (bëi v× lóc nµy Gal4 ®−îc tù do).
Trong nhiÒu tr−êng hîp, c¸c protein bÞt mÆt kh«ng chØ phong táa c¸c vïng ho¹t hãa
mµ b¶n th©n chóng lµ (hoÆc huy ®éng) mét deacetylase cã t¸c ®éng g©y øc chÕ m¹nh sù
biÓu hiÖn cña gen. Mét vÝ dô vÒ c¬ chÕ nµy lµ yÕu tè ho¹t hãa E2F ë eukaryote. YÕu tè
E2F th−êng xuyªn liªn kÕt phÝa tr−íc gen ®Ých cña nã. Mét protein øc chÕ (Rb) kiÓm so¸t
ho¹t ®éng cña E2F b»ng c¸ch liªn kÕt vµo nã. Rb võa cã t¸c dông khãa vïng ho¹t hãa cña
E2F, võa huy ®éng mét enzym deacetylase g©y øc chÕ biÓu hiÖn cña gen ®Ých. Sù
phosphoryl hãa Rb lµm gi¶i phãng Rb khái E2F, nhê vËy gen ®−îc biÓu hiÖn. E2F lµ yÕu
tè ho¹t hãa c¸c gen ®iÒu khiÓn tÕ bµo v−ît qua pha S cña chu tr×nh tÕ bµo (xem ch−¬ng
8). Nh− vËy, sù phosphoryl hãa Rb liªn quan ®Õn sù ®iÒu khiÓn ph©n bµo vµ c¸c ®ét biÕn
¶nh h−ëng ®Õn con ®−êng truyÒn tÝn hiÖu nµy th−êng liªn quan ®Õn ung th−.
- VËn chuyÓn ra vµ vµo nh©n tÕ bµo: Khi ë tr¹ng th¸i kh«ng ho¹t ®éng, hÇu hÕt
c¸c protein ®iÒu hßa biÓu hiÖn gen ®Òu ®−îc gi÷ ë tÕ bµo chÊt. C¸c ph©n tö tÝn hiÖu
th−êng ®ång thêi trùc tiÕp hoÆc gi¸n tiÕp kÝch øng sù vËn chuyÓn chóng vµo nh©n tÕ bµo.
§Ó thùc hiÖn qu¸ tr×nh nµy cã nhiÒu c¸ch kh¸c nhau. Ch¼ng h¹n, mét yÕu tè ®iÒu hßa cã
thÓ bÞ gi÷ ë tÕ bµo chÊt bëi sù liªn kÕt víi mét protein øc chÕ hoÆc víi mµng tÕ bµo; hoÆc
bëi nã ë d¹ng cÊu h×nh lµm che khuÊt tr×nh tù (peptide) tÝn hiÖu ®−îc bé m¸y vËn chuyÓn
nhËn biÕt. Sù vËn chuyÓn c¸c yÕu tè ®iÒu hßa vµo nh©n tÕ bµo cã thÓ ®−îc thùc hiÖn qua
sù ph©n gi¶i mét protein øc chÕ (hoÆc mét protein b¾t gi÷ yÕu tè ®iÒu hßa t¹i tÕ bµo chÊt)
hoÆc bëi sù biÕn ®æi “dÞ h×nh” cña c¸c protein cã liªn quan.
c) C¸c protein ho¹t hãa vµ øc chÕ ®«i khi cã tÝnh ph©n m¶nh
Nh×n chung, chóng ta th−êng m« t¶ c¸c protein ®iÒu hßa (ho¹t hãa vµ øc chÕ) ë
nh÷ng d¹ng ®¬n gi¶n nhÊt. Nh−ng thùc tÕ, chóng th−êng cã d¹ng phøc t¹p h¬n. Ch¼ng
h¹n, trong nhiÒu tr−êng hîp c¸c yÕu tè ho¹t hãa cã tÝnh ph©n m¶nh. NghÜa lµ, hai miÒn
liªn kÕt ADN vµ ho¹t hãa t¸ch biÖt nhau trªn hai chuçi polypeptide kh¸c nhau. Vµ, chØ
khi chóng cïng liªn kÕt trªn ADN th× yÕu tè ho¹t hãa hoµn chØnh míi h×nh thµnh. Ngoµi
ra, khi t×m hiÓu c¸ch thøc ®iÒu khiÓn cña mét sè yÕu tè ®iÒu hßa, mét ®Æc ®iÓm ®−îc
nhËn thÊy lµ: mét sè yÕu tè ®iÒu hßa cã tÝnh ho¹t hãa hay øc chÕ cßn phô thuéc vµo b¶n
chÊt vµ sù s¾p xÕp vÞ trÝ liªn kÕt trªn ADN cña chóng. H·y xem vÝ dô vÒ thô thÓ
glucocorticoid (GR) d−íi ®©y.
Khi kh«ng cã ligand, GR bÞ gi÷ l¹i tÕ bµo chÊt do liªn kÕt víi protein hsp90. Khi cã
ligand, GR ®−îc gi¶i phãng khái hsp90 vµ ®−îc chuyÓn vµo nh©n tÕ bµo. Khi ®· ë trong
nh©n, GR cã hai vÞ trÝ liªn kÕt. Khi GR liªn kÕt vµo vÞ trÝ thø nhÊt, chóng ho¹t hãa gen;
nh−ng khi liªn kÕt vµo vÞ trÝ thø hai, chóng øc chÕ sù biÓu hiÖn cña gen. VËy sù ho¹t hãa
vµ øc chÕ nµy x¶y ra thÕ nµo?
Khi liªn kÕt vµo vÞ trÝ thø hai, GR cã cÊu h×nh dÔ liªn kÕt víi histone deacetylase,
do vËy th−êng g©y øc chÕ c¸c gen l©n cËn. Nh−ng khi liªn kÕt víi vÞ trÝ thø nhÊt, GR cã
cÊu h×nh kh«ng liªn kÕt ®−îc víi histone deacetylase, mµ thay vµo ®ã, nã liªn kÕt víi mét
ph©n tö kh¸c lµ CBP. Phøc hÖ GR/CBP dÉn ®Õn sù ho¹t hãa mét sè gen gÇn kÒ, mét
phÇn bëi CBP cã ho¹t tÝnh histone acetylase, mét phÇn nã cã t¸c ®éng huy ®éng c¸c
thµnh phÇn cña bé m¸y phiªn m· (ë ®éng vËt cã vó, CBP tham gia ho¹t hãa nhiÒu gen,
trong ®ã cã β-interferon ë ng−êi).
C¸c kh¸i niÖm “yÕu tè ®ång ho¹t hãa” hay “yÕu tè ®ång øc chÕ” th−êng ®−îc dïng ®Ó
chØ c¸c protein kh«ng trùc tiÕp tham gia vµo bé m¸y phiªn m·, ®ång thêi kh«ng ph¶i lµ

163
§inh §oµn Long

c¸c yÕu tè ®iÒu hßa phiªn m· trùc tiÕp, nh−ng chóng cã liªn quan ®Õn ho¹t ®éng ®iÒu hßa
phiªn m·. ë ®©y, CBP lµ mét vÝ dô vÒ yÕu tè “®ång ho¹t hãa”. C¸c kh¸i niÖm nµy còng
®−îc dïng ®Ó chØ c¸c phøc hÖ c¶i biÕn nucleosome.

5.3.3. BÝt gen qua biÕn ®æi histone vµ ADN


Trªn ®©y, chóng ta míi chØ ®Ò cËp ®Õn sù ®iÒu hßa ho¹t ®éng gen bëi c¸c protein
®iÒu hßa g¾n kÕt gÇn vÞ trÝ c¸c gen vµ ®iÒu khiÓn ho¹t ®éng cña chóng. C¸c hiÖu øng nµy
th−êng cã tÝnh côc bé vµ ®−îc ®iÒu khiÓn bëi c¸c tÝn hiÖu ngo¹i bµo. ë ®©y, chóng ta ®Ò
cËp ®Õn mét sè c¬ chÕ bÝt gen (gene blocking). BÝt gen ë ®©y lµ mét hiÖu øng vÞ trÝ, nghÜa
lµ gen bÞ bÝt lµ do vÞ trÝ cña nã trªn NST, chø kh«ng ph¶i do ®¸p øng l¹i c¸c tÝn hiÖu m«i
tr−êng. BÝt gen cã thÓ lan táa däc ph©n tö ADN, lµm t¾t sù biÓu hiÖn cña nhiÒu gen,
thËm chÝ ë mét vÞ trÝ rÊt xa kÓ tõ vÞ trÝ b¾t ®Çu x¶y ra sù “bÝt gen”. Dï cã kh¸c biÖt,
nh−ng nh÷ng c¬ chÕ “bÝt gen” nh×n chung ®Òu dùa trªn c¸c nguyªn lý ®iÒu hßa biÓu hiÖn
gen ®· nªu.
KiÓu bÝt gen phæ biÕn nhÊt lµ “d¹ng kÕt ®Æc” cña chÊt nhiÔm s¾c gäi lµ dÞ nhiÔm
s¾c. DÞ nhiÔm s¾c lµ vïng chÊt nhiÔm s¾c cã møc ®é kÕt ®Æc cao h¬n so víi nguyªn
nhiÔm s¾c. Do ®ã, khi quan s¸t d−íi kÝnh hiÓn vi quang häc, vïng dÞ nhiÔm s¾c ®−îc
ph©n biÖt b»ng sù b¾t mµu thuèc nhuém m¹nh h¬n. DÞ nhiÔm s¾c g¾n liÒn víi mét sè
vïng trªn NST, ®Æc biÖt lµ t©m ®éng vµ ®Çu mót. T©m ®éng vµ ®Çu mót lµ hai vïng
trªn NST th−êng chøa c¸c ®o¹n ADN lÆp l¹i ë møc ®é cao vµ mang rÊt Ýt (thËm chÝ
kh«ng cã) gen m· hãa protein. NÕu mét gen ®−îc chuyÓn vµo hai vïng nµy, th−êng th×
chóng sÏ kh«ng ho¹t ®éng. Thùc tÕ, trªn NST cã nh÷ng vïng dÞ nhiÔm s¾c kh¸c cã thÓ
g©y hiÖu øng t−¬ng tù. ë ®éng vËt cã vó, kho¶ng 50% hÖ gen ë d¹ng dÞ nhiÔm s¾c. CÊu
tróc dÞ nhiÔm s¾c cã thÓ bÞ biÕn ®æi bëi mét sè enzym c¶i biÕn histone, qua ®ã ¶nh h−ëng
®Õn sù béc lé cña ADN trong c¸c qu¸ tr×nh sao chÐp, t¸i tæ hîp ADN vµ phiªn m·. ë
eukaryote, c¶ sù ho¹t hãa còng nh− øc chÕ phiªn m· ®Òu th−êng cã liªn quan ®Õn sù thay
®æi cÊu tróc nucleosome.
BÝt gen còng cã thÓ x¶y ra do sù methyl hãa ADN bëi c¸c enzym ADN methylase.
KiÓu bÝt gen nµy kh«ng thÊy cã ë nÊm men, nh−ng rÊt phæ biÕn ë ®éng vËt cã vó. Sù
methyl hãa c¸c tr×nh tù ADN cã thÓ øc chÕ sù liªn kÕt cña c¸c protein ®iÒu hßa, thËm chÝ
cña c¶ bé m¸y dÞch m·. Nh−ng sù methyl hãa còng cã thÓ øc chÕ sù biÓu hiÖn cña gen
theo mét sè c¸ch kh¸c, ch¼ng h¹n nh− c¸c tr×nh tù bÞ methyl hãa ®−îc nhËn biÕt bëi c¸c
protein øc chÕ ®Æc hiÖu vµ qua ®ã c¸c protein nµy lµm t¾t sù biÓu hiÖn cña c¸c gen l©n
cËn, hoÆc ®«i khi lµm bÊt ho¹t gen qua viÖc huy ®éng enzym histone deacetylase.
5.3.3.1. BÝt gen ë nÊm men ®−îc thùc hiÖn qua methyl hãa vµ lo¹i acetyl hãa histone
ë nÊm men Saccharomyces cereviseae, ®Çu mót lµ mét trong nh÷ng vïng gen bÞ bÝt
(h×nh 5.24). §ã lµ mét ®o¹n NST cã kÝch th−íc kho¶ng 1 – 5 kb, kÕt ®Æc vµ gÊp khóc.
C¸c gen khi ®−îc chuyÓn ®Õn vïng nµy th−êng bÞ bÊt ho¹t (®Æc biÖt ®èi víi c¸c gen vèn
®· ho¹t ®éng yÕu t¹i vÞ trÝ nguyªn thñy cña nã). ChÊt nhiÔm s¾c ë ®Çu mót ®−îc acetyl
hãa ë møc thÊp h¬n so víi c¸c vïng kh¸c cña NST vµ c¸c gen chØ ®−îc biÓu hiÖn yÕu.

164
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

§o¹n ®Çu mót 1 - 5 kb


Protein RAP1

Protein SIR2

C¸c protein SIR3 vµ SIR4 Nhãm acetyl

H×nh 5.24. Sù bÝt gen t¹i ®Çu mót nhiÔm s¾c thÓ ë nÊm men. Protein RAP1 huy ®éng phøc hÖ SIR tíi ®Çu
mót. T¹i ®©y, mét thµnh phÇn cña phøc hÖ nµy (SIR2) xóc t¸c ph¶n øng lo¹i nhãm acetyl khái ®o¹n ®u«i cña
histone. §o¹n ®Çu mót mang c¸c nucleosome bÞ lo¹i acetyl nµy sau ®ã sÏ liªn kÕt víi SIR3 vµ SIR4, lµm phøc hÖ
SIR ngµy cµng trë nªn tËp trung h¬n. Trong ®iÒu kiÖn ®ã, SIR2 tiÕp tôc xóc t¸c ph¶n øng lo¹i acetyl ë c¸c
nucleosome l©n cËn. VÝ dô nµy minh häa cho hiÖu øng bÝt gen lan táa g©y ra bëi sù c¶i biÕn nucleosome (ë ®©y,
lµ sù lo¹i acetyl hãa ®o¹n ®u«i cña histone).

Cã ba gen m· hãa cho c¸c protein ®iÒu hßa g©y bÝt gen, cã tªn lµ SIR2, 3 vµ 4. Ba
protein ®−îc c¸c gen nµy m· hãa h×nh thµnh nªn phøc hÖ bÝt gen t¹i vïng chÊt nhiÔm s¾c
mµ chóng g¾n vµo. Trong c¸c protein nµy, SIR2 lµ mét histone deacetylase. Phøc hÖ bÝt
gen ®−îc huy ®éng tíi ®Çu mót bëi mét protein liªn kÕt ADN ®Æc hiÖu víi tr×nh tù lÆp l¹i
ë ®Çu mót (protein RAP1). Sù huy ®éng nµy khëi ®Çu cho ho¹t ®éng lo¹i nhãm acetyl t¹i
®o¹n ®u«i histone. C¸c histone bÞ lo¹i acetyl ®−îc “phøc hÖ bÝt gen” nhËn ra, råi sau ®ã
hiÖn t−îng lo¹i acetyl hãa lan táa däc theo NST, t¹o nªn mét vïng dÞ nhiÔm s¾c kÕt ®Æc.
Nh−ng, t¹i sao sù lan táa nµy chØ giíi h¹n ë vïng ®Çu mót (vµ c¸c vïng gen bÞ “bÝt”
kh¸c)? §ã lµ do cã mét sè c¬ chÕ kh¸c lµm c¶n trë sù sù lan táa hiÖu øng cña SIR2. Trong
®ã, ë ®©y sù methyl hãa ®o¹n ®u«i cña histone H3 ®−îc xem lµ nguyªn nh©n g©y nªn
hiÖn t−îng nµy. C¸c enzym histone methylase th−êng g¾n nhãm methyl vµo ®o¹n ®u«i
histone (cô thÓ, lµ t¹i mét axit amin Lys ®Æc thï thuéc ®o¹n ®u«i cña c¸c histone H3 vµ
H4). ë nÊm men S. cereviseae, ho¹t ®éng cña histone methylase ®−îc t×m thÊy cã liªn
quan ®Õn sù øc chÕ mét sè gen, vµ ng¨n c¶n sù lan táa hiÖu øng bÝt gen cña SIR2.
Nh−ng, c¸c nghiªn cøu vÒ enzym histone methylase ®èi víi ®iÒu hßa biÓu hiÖn gen
®Õn nay ®−îc biÕt râ h¬n ë loµi nÊm men Schizosaccharomyces pombe vµ mét sè loµi
eukaryote kh¸c. Nh×n chung, sù bÝt gen ®iÓn h×nh kh«ng chØ liªn quan ®Õn sù lo¹i nhãm
acetyl khái c¸c histone, mµ th−êng ®ång thêi liªn quan ®Õn sù methyl hãa. Tuy vËy, sù
methyl hãa cã thÓ g©y hiÖu øng biÓu hiÖn gen kh¸c nhau, tïy thuéc vµo vÞ trÝ ph¶n øng x¶y
ra. Ch¼ng h¹n, ë nÊm men S. pombe, nÕu sù methyl hãa Lys sè 9 cña ®o¹n ®u«i histone H3
th−êng ®i ®«i víi sù bÝt gen vµ lµ dÊu hiÖu h×nh thµnh vïng dÞ nhiÔm s¾c, th× sù methyl
hãa ë Lys sè 4 còng thuéc ®o¹n ®u«i nµy l¹i lµm t¨ng c−êng sù biÓu hiÖn cña gen.

5.3.3.2. Sù c¶i biÕn histone vµ gi¶ thiÕt m· histone


Cã ý kiÕn cho r»ng cã sù tån t¹i cña m· histone. Theo quan ®iÓm nµy, c¸c kiÓu
biÕn ®æi kh¸c nhau cña histone cã thÓ ®−îc “®äc” vµ “hiÓu” theo c¸c nghÜa kh¸c nhau.
H·y xem vÝ dô ë S. pombe liªn quan ®Õn Lys sè 9 cña ®o¹n ®u«i histone H3. Sù biÕn ®æi
kh¸c nhau t¹i vÞ trÝ nµy ®−îc “hiÓu” theo nghÜa kh¸c nhau. Khi axit amin nµy ®−îc g¾n
nhãm acetyl, c¸c gen th−êng biÓu hiÖn m¹nh. Lóc ®ã, axit amin nµy ®−îc mét sè enzym
histone acetylase nhËn biÕt vµ thóc ®Èy sù acetyl hãa c¸c nucleosome l©n cËn. Nh−ng khi
axit amin Lys 9 kh«ng ®−îc acetyl hãa, c¸c gen th−êng bÞ bÝt. C¸c histone kh«ng ®−îc
acetyl hãa cã xu h−íng huy ®éng c¸c enzym deacetylase (lo¹i nhãm acetyl), v× vËy t¨ng
c−êng sè c¸c histone kh«ng ®−îc acetyl hãa (gièng nh− kiÓu bÝt gen lan táa ë S.

165
§inh §oµn Long

cereviseae). ë mét sè loµi, viÖc axit amin Lys 9 bÞ methyl hãa lµ “dÊu hiÖu” ®Ó mét sè
protein ®Æc thï liªn kÕt vµo vµ duy tr× tr¹ng th¸i dÞ nhiÔm s¾c.
Sù c¶i biÕn ®o¹n ®u«i histone kh«ng chØ ¶nh h−ëng trùc tiÕp ®Õn chøc n¨ng
nucleosome, mµ cßn t¹o ra c¸c vÞ trÝ liªn kÕt cña protein. Cã hai lo¹i miÒn protein ®Æc
hiÖu ®iÒu hßa ho¹t ®éng t−¬ng t¸c nµy gäi lµ miÒn bromo vµ miÒn chromo. C¸c
protein chøa miÒn bromo th× t−¬ng t¸c víi ®o¹n ®u«i histone bÞ acetyl hãa, cßn c¸c
protein chøa miÒn chromo t−¬ng t¸c víi ®o¹n ®u«i histone bÞ methyl hãa. ¶nh h−ëng cña
sù c¶i biÕn ®o¹n ®u«i histone ®Õn sù biÓu hiÖn cña gen th«ng qua c¸c protein ®iÒu hßa
trung gian mang c¸c miÒn bromo vµ chromo sÏ ®−îc ®Ò cËp thªm ë ch−¬ng 7.

5.3.3.3. Methyl hãa ADN liªn quan ®Õn sù bÝt gen ë ®éng vËt cã vó
Mét sè gen ®éng vËt cã vó bÞ bÝt bëi hiÖn t−îng methyl hãa ADN. Thùc tÕ, phÇn lín
hÖ gen ®éng vËt cã vó ®−îc “ghi nhí” theo c¸ch nµy. Ngoµi ra, c¸c ®o¹n ADN bÞ methyl
hãa th−êng liªn quan tíi c¸c vïng dÞ nhiÔm s¾c. §ã lµ do c¸c tr×nh tù ADN bÞ methyl hãa
th−êng ®−îc mét sè protein ®Æc biÖt (nh− MeCP2) nhËn biÕt, råi chóng l¹i tiÕp tôc huy
®éng c¸c enzym histone deacetylase vµ histone methylase. Nh÷ng enzym nµy sau ®ã xóc
t¸c lµm biÕn ®æi c¸c vïng chÊt nhiÔm s¾c ë gÇn. KÕt qu¶ lµ sù methyl hãa cã tÝnh lan táa
vµ c¸c vïng bÞ methyl hãa th−êng chuyÓn thµnh vïng dÞ nhiÔm s¾c (h×nh 5.25).
HiÖn t−îng methyl hãa ADN lµ c¬ së cña hiÖn t−îng in vÕt ADN (DNA imprinting)
®−îc m« t¶ sau ®©y. Chóng ta biÕt r»ng, trong c¸c tÕ bµo l−ìng béi, hÇu hÕt c¸c gen ®Òu
tån t¹i víi hai b¶n sao (chóng n»m trªn cÆp NST t−¬ng ®ång). Mét b¶n sao cã nguån gèc
tõ bè, cßn mét b¶n sao cã nguån gèc tõ mÑ. Trong phÇn lín tr−êng hîp, hai b¶n sao (hoÆc
alen) nµy ®−îc biÓu hiÖn t−¬ng ®−¬ng. Bëi v×, c¸c b¶n sao cña cïng mét locut gen th−êng
mang c¸c tr×nh tù ®iÒu hßa gièng nhau vµ ®−îc ®iÒu khiÓn bëi c¸c protein ®iÒu hßa
chung. Ngoµi ra, trªn NST, vÝ trÝ cña chóng còng th−êng t−¬ng ®ång (nªn chóng cã xu
h−íng gièng nhau vÒ tr¹ng th¸i methyl hãa; hoÆc chÞu t¸c ®éng nh− nhau tõ c¸c enzym
c¶i biÕn histone). Nh−ng trong mét sè tr−êng hîp, chØ mét trong hai b¶n sao ho¹t ®éng,
cßn b¶n sao cßn l¹i bÞ “t¾t”. VÝ dô ®iÓn h×nh vÒ hiÖn t−îng “in vÕt ADN” nh− vËy ë ng−êi
lµ c¸c gen H19 vµ Igf2 n»m gÇn nhau trªn cïng NST sè 11. Trong mçi tÕ bµo, chØ mét
b¶n sao cña H19 (trªn NST xuÊt xø tõ mÑ) ho¹t ®éng, cßn b¶n sao kia (xuÊt xø tõ bè) bÞ
“t¾t”. Ng−îc l¹i, víi gen Igf2, b¶n sao tõ bè th× “bËt”, cßn b¶n sao tõ mÑ th× “t¾t”.
Trong sù chuyªn hãa biÓu hiÖn c¸c gen H19 vµ Igf2, cã hai tr×nh tù quan träng
(h×nh 5.26). §ã lµ mét tr×nh tù t¨ng c−êng n»m xu«i dßng gen H19, vµ mét tr×nh tù
c¸ch li n»m gi÷a hai gen. Tr×nh tù t¨ng c−êng (sau khi liªn kÕt víi yÕu tè ho¹t hãa cña
nã) cã thÓ ho¹t hãa c¶ hai gen H19 vµ Igf2. Nh−ng t¹i sao nã chØ ho¹t hãa gen H19 cã
nguån gèc tõ mÑ vµ gen Igf2 cã nguån gèc tõ bè? C©u tr¶ lêi lµ: do tr¹ng th¸i methyl hãa
cña tr×nh tù c¸ch li trªn hai NST cã nguån gèc tõ mÑ vµ bè lµ kh¸c nhau. Së dÜ tr×nh tù
t¨ng c−êng kh«ng ho¹t hãa ®−îc gen Igf2 tõ mÑ lµ v×: trªn NST nµy, mét protein (gäi lµ
yÕu tè c¸ch li CTCF) ®Ýnh kÕt vµo tr×nh tù c¸ch li, lµm c¶n trë sù t−¬ng t¸c gi÷a gen Igf2
víi yÕu tè ho¹t hãa liªn kÕt t¹i tr×nh tù t¨ng c−êng. Ng−îc l¹i, trªn NST tõ bè, c¸c tr×nh
tù c¸ch li vµ promoter cña gen H19 bÞ methyl hãa. ë tr¹ng th¸i nµy, bé m¸y phiªn m·
kh«ng liªn kÕt ®−îc víi promoter H19, ®ång thêi CTCF kh«ng liªn kÕt ®−îc víi tr×nh tù
c¸ch li. KÕt qu¶ lµ, tr×nh tù t¨ng c−êng cã thÓ ho¹t hãa ®−îc gen Igf2. Ngoµi ra, gen H19
cßn bÞ øc chÕ bæ sung bëi sù liªn kÕt cña protein MeCP2 vµo tr×nh tù bÞ methyl hãa trªn
NST tõ bè (ë trªn, chóng ta ®· biÕt MeCP2 cã vai trß huy ®éng histone deacetylase lµm
øc chÕ gen).

166
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

Gen ®−îc ho¹t hãa ▼ Gen kh«ng ®−îc ho¹t hãa ▼


Protein ho¹t hãa

Gen kh«ng ®−îc


ADN ®−îc ho¹t hãa
methyl hãa
C¸c thµnh phÇn phøc
hÖ khëi ®Çu phiªn m·

H×nh 5.25. BÝt gen bëi sù methyl hãa ADN vµ c¶i Protein liªn kÕt Gen kh«ng biÓu hiÖn
biÕn nucleosome. Khi kh«ng cã sù c¶i biÕn
vµo ®o¹n ADN
nucleosome, gen ®−îc "bËt" hay "t¾t" phô thuéc vµo sù
®−îc methyl hãa
cã mÆt cña c¸c yÕu tè ho¹t hãa vµ bé m¸y phiªn m·
(minh häa trªn hµng ®Çu tiªn). Tuy vËy, do "kÏ hë", gen
vÉn biÓu hiÖn ë møc ®é c¬ b¶n. §Ó lµm "t¾t" hoµn toµn
mét gen ë eukaryote th−êng liªn quan ®Õn sù methyl hãa
Gen kh«ng biÓu hiÖn
ADN vµ c¶i biÕn nucleosome. Khi mét gen kh«ng ®−îc
phiªn m·, ADN methylase cã thÓ methyl hãa cytosine
n»m trong promoter, trong gen hoÆc trong c¸c tr×nh tù Phøc hÖ t¸i cÊu
tróc nucleosome Histone
enhancer. Nh÷ng methylcytosine nµy ®−îc mét sè protein
(nh− MeCP2) nhËn ra vµ g¾n vµo. Nh÷ng protein nµy sau deacetylase
®ã huy ®éng enzym deacetylase vµ phøc hÖ t¸i cÊu tróc
nucleosome lµm t¾t hoµn toµn sù biÓu hiÖn cña gen
(Watson, 2004).
Gen hoµn toµn kh«ng biÓu hiÖn

a) NhiÔm s¾c thÓ cña mÑ

YÕu tè c¸ch li
CTCF
Igf2 H19

Gen kh«ng biÓu hiÖn Tr×nh tù c¸ch li Gen biÓu hiÖn Tr×nh tù t¨ng c−êng

b) NhiÔm s¾c thÓ cña bè

Me Me Me Me Me Me
Igf2

Gen biÓu hiÖn Tr×nh tù c¸ch li H19 Tr×nh tù t¨ng c−êng


Gen kh«ng biÓu hiÖn
H×nh 5.26. In vÕt ADN (DNA imprinting). H×nh nµy minh häa vÝ dô vÒ sù in vÕt ADN, ®ã lµ c¸c gen Igf2 vµ H19
ë ®éng vËt cã vó. ë mçi tÕ bµo, chØ cã gen H19 trªn NST mÑ vµ gen Igf2 trªn NST bè biÓu hiÖn. Tr¹ng th¸i methyl
hãa tr×nh tù c¸ch li cã vai trß quyÕt ®Þnh viÖc liÖu yÕu tè c¸ch li CTCF cã ng¨n c¶n ®−îc ho¹t ®éng cña yÕu tè t¨ng
c−êng (n»m xu«i dßng gen H19 vµ Igf2) hay kh«ng.

5.3.3.4. Mét sè tr¹ng th¸i biÓu hiÖn gen ®−îc di truyÒn qua ph©n bµo, kÓ c¶ khi kh«ng cßn
tÝn hiÖu kÝch øng biÓu hiÖn gen
§«i khi sù biÓu hiÖn cña mét gen ®−îc di truyÒn qua ph©n bµo. Trong qu¸ tr×nh
ph¸t triÓn c¸ thÓ, mét ph©n tö tÝn hiÖu ®−îc gi¶i phãng tõ mét tÕ bµo nhÊt ®Þnh cã thÓ
lµm “bËt” hoÆc “t¾t” mét sè gen ë c¸c tÕ bµo l©n cËn. Nh÷ng gen nµy cã thÓ duy tr× tr¹ng

167
§inh §oµn Long

th¸i “bËt” hoÆc “t¾t” t−¬ng øng qua nhiÒu thÕ ph©n bµo kÕ tiÕp, kÓ c¶ khi ph©n tö tÝn
hiÖu kh«ng cßn n÷a. Sù di truyÒn vÒ kh¶ n¨ng biÓu hiÖn cña gen nh− vËy ®−îc gäi lµ sù
di truyÒn ngo¹i sinh. Sù in vÕt ADN nªu trªn còng lµ mét vÝ dô vÒ di truyÒn ngo¹i
sinh.
Sù ®iÒu hßa biÓu hiÖn gen qua c¬ chÕ di truyÒn ngo¹i sinh d−êng nh− ng−îc l¹i c¸c
c¬ chÕ ®iÒu hßa biÓu hiÖn gen ®· ®−îc ®Ò cËp trªn ®©y. Theo ®ã, sù ho¹t hãa cña gen
th−êng liªn quan ®Õn sù cã mÆt cña mét ph©n tö tÝn hiÖu, truyÒn tin qua mét protein
ho¹t hãa. Nh− ë vi khuÈn, operon Lac chØ thùc sù ho¹t ®éng khi ®ång thêi cã hai tÝn hiÖu
lµ cã lactose vµ kh«ng cã glucose. ë nÊm men, gen GAL chØ biÓu hiÖn khi cã galactose
®ång thêi kh«ng cã glucose. ë ng−êi, gen β-interferon chØ ho¹t ®éng khi tÕ bµo bÞ virut
l©y nhiÔm. Khi kh«ng cã nh÷ng tÝn hiÖu nµy, c¸c gen trªn ë tr¹ng th¸i “t¾t”.
ë ®©y, sù c¶i biÕn ADN vµ nucleosome lµ c¬ së cña di truyÒn häc ngo¹i sinh. H·y
xem tr−êng hîp mét gen bÞ “t¾t” bëi sù methyl hãa histone côc bé. Khi vïng NST bÞ
methyl hãa ®−îc sao chÐp trong ph©n bµo, c¸c histone bÞ methyl hãa tõ c¸c ph©n tö ADN
bè, mÑ sÏ ph©n bè (t−¬ng ®èi) ®Òu vÒ hai tÕ bµo con. Nh− vËy, mçi ph©n tö ADN con ®Òu
mang mét sè nucleosome ®−îc methyl hãa vµ mét sè kh«ng ®−îc methyl hãa. C¸c
nucleosome ®−îc methyl hãa sÏ huy ®éng c¸c protein chøa miÒn chromo, bao gåm c¸c
histone methylase. Nh÷ng enzym nµy sÏ methyl hãa c¸c histone ch−a ®−îc methyl hãa ë
gÇn. Qua ®ã, mét m¹ch ADN con sinh ra sau t¸i b¶n ADN, nÕu cã Ýt histone ®−îc methyl
hãa sÏ huy ®éng ®−îc Ýt enzym methylase h¬n so víi m¹ch ADN cã nhiÒu histone ®−îc
methyl hãa. B»ng c¸ch nµy, tr¹ng th¸i methyl hãa cña chÊt nhiÔm s¾c ®−îc duy tr× qua
ph©n bµo.
H×nh 5.27 cho thÊy sù methyl hãa ADN cã thÓ di truyÒn æn ®Þnh h¬n qua c¬ chÕ
ho¹t ®éng cña c¸c enzym duy tr× methyl hãa. Nh÷ng enzym nµy xóc t¸c ph¶n øng
methyl hãa c¸c ph©n ®o¹n trªn ph©n tö ADN ®· ®−îc methyl hãa mét phÇn trong qu¸
tr×nh t¸i b¶n ADN ®Ó thu ®−îc ph©n ®o¹n methyl hãa hoµn toµn. Trong vÝ dô nµy, enzym
duy tr× methyl hãa nhËn ra ph©n ®o¹n ®−îc methyl hãa mét nöa vµ bæ sung nhãm

Me Me

5’ 3’ 5’ 3’
A C G T A T C G T AC G T A T C G T
methyl hãa
Sao chÐp ADN ADN
Cytosine (C) kh«ng T G C A T A G C A T G C A T A G C A
®−îc methyl hãa 3’ 3’ 5’
Me 5’
Me
5’ 3’
A C G T A T C G T
Enzym duy tr×
Enzym duy tr×
methylase kh«ng
methylase
nhËn ra C nµy
T G C A T A G C A
3’ 5’ Me
Me
5’ 3’ 5’ 3’
A C G T A T C G T AC G T A T C G T
methyl hãa
ADN
T G C A T A G C A T G C A T A G C A
3’ 5’ 3’ 5’
Me Me

H×nh 5.27. KiÓu methyl hãa ADN cã thÓ ®−îc duy tr× qua ph©n bµo (nguån: Alberts et al., 2002).

168
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

methyl vµo cytosine (C) ch−a ®−îc methyl hãa. Enzym nµy kh«ng nhËn biÕt ®−îc c¸c
nucleotide C ë ph©n ®o¹n kh«ng ®−îc methyl hãa. KÕt qu¶ lµ, hai ph©n tö ADN con cã
tr¹ng th¸i methyl hãa gièng nhau vµ gièng ph©n tö ADN gèc.
Trong tÕ bµo ®éng vËt cã vó, sù methyl hãa ADN lµ “dÊu hiÖu c¬ b¶n” cho biÕt mét
vïng hÖ gen cã ®−îc biÓu hiÖn kh«ng. Sau sù t¸i b¶n ADN, c¸c vÞ trÝ ®−îc methyl hãa
mét phÇn th−êng ®−îc chuyÓn thµnh tr¹ng th¸i methyl hãa hoµn toµn. Nh÷ng vïng nµy
®ång thêi ®−îc protein MeCP2 nhËn biÕt vµ huy ®éng c¸c enzym c¶i biÕn nucleosome
kh¸c lµm t¸i bÊt ho¹t sù biÓu hiÖn cña gen, thËm chÝ chuyÓn chóng thµnh dÞ nhiÔm s¾c
(h×nh 5.25).

5.3.4. §iÒu hßa biÓu hiÖn gen ë eukaryote qua khëi ®Çu phiªn m·

5.3.4.1. C¸c yÕu tè ho¹t hãa huy ®éng bé m¸y phiªn m· tíi c¸c gen
ë vi khuÈn, mét c¬ chÕ phæ biÕn lµ c¸c yÕu tè ho¹t hãa thóc ®Èy sù phiªn m· c¸c
gen qua viÖc ®ång thêi liªn kÕt víi ADN vµ ARN polymerase ®Ó huy ®éng enzym tíi vÞ trÝ
cña gen. C¸c yÕu tè ho¹t hãa ë eukaryote còng ho¹t ®éng theo c¸ch nµy, nh−ng rÊt hiÕm
khi cã sù t−¬ng t¸c trùc tiÕp gi÷a chóng víi ARN polymerase. Thay vµo ®ã, c¸c yÕu tè
ho¹t hãa th−êng huy ®éng ARN polymerase gi¸n tiÕp theo hai c¸ch. C¸ch thø nhÊt, c¸c
yÕu tè ho¹t hãa t−¬ng t¸c víi c¸c thµnh phÇn trung gian cña bé m¸y phiªn m· (chø
kh«ng ph¶i ARN polymerase), cßn ®−îc gäi lµ c¸c chÊt m«i giíi trung gian; sau ®ã, chÊt
m«i giíi trung gian huy ®éng ARN polymerase tíi promoter. C¸ch thø hai, c¸c yÕu tè
ho¹t hãa huy ®éng c¸c yÕu tè c¶i biÕn nucleosome vµ lµm thay ®æi chÊt nhiÔm s¾c ®Ó bé
m¸y phiªn m· dÔ dµng tiÕp cËn c¸c gen
Tr×nh tù
h¬n, nhê ®ã ARN polymerase cã thÓ liªn t¨ng c−êng
kÕt vµo promoter vµ khëi ®Çu phiªn m·.
Cã khi, c¸c yÕu tè ho¹t hãa ®ång thêi ho¹t YÕu tè
®éng theo c¶ hai c¸ch (h×nh 5.28). ho¹t hãa
ChÊt m«i giíi
Sù phiªn m· ë eukaryote th−êng trung gian (mediator)
cÇn mét sè lín c¸c thµnh phÇn kh¸c nhau.
Trong nhiÒu tr−êng hîp, bé m¸y phiªn
m· ®−îc huy ®éng tíi gen ë d¹ng phøc hÖ TFIID
ARN poiymerase II
duy nhÊt (gåm nhiÒu protein liªn kÕt víi
nhau) gäi lµ holoenzym. Phøc hÖ
holoenzym nµy th−êng ®ång thêi gåm c¸c Hép TATA
chÊt m«i giíi trung gian, ARN
H×nh 5.28. Ho¹t hãa sù khëi ®Çu phiªn mX ë
polymerase, vµ mét sè yÕu tè phiªn m· eukaryote qua sù huy ®éng phøc hÖ phiªn mX. ë ®©y,
kh¸c. ChØ mét sè Ýt c¸c yÕu tè cßn l¹i ®−îc yÕu tè ho¹t hãa cã thÓ huy ®éng trùc tiÕp yÕu tè khëi ®Çu
huy ®éng tíi gen mét c¸ch rêi r¹c (vÝ dô: phiªn m· TFIID, vµ gi¸n tiÕp huy ®éng ARN polymerase
II th«ng qua chÊt m«i giíi trung gian. Trong thùc tÕ, sù
TFIID hay TFIIE). Sù huy ®éng nh÷ng huy ®éng nµy cã thÓ liªn quan ®Õn nhiÒu h¬n mét protein
yÕu tè nµy cã thÓ trùc tiÕp do cña c¸c yÕu ho¹t hãa.
tè ho¹t hãa hoÆc do c¸c yÕu tè kh¸c thuéc
holoenzym.
5.3.4.2. C¸c yÕu tè ho¹t hãa huy ®éng c¸c yÕu tè c¶i biÕn nucleosome lµm t¨ng kh¶ n¨ng
tiÕp cËn promoter cña bé m¸y phiªn m·
Ngoµi c¬ chÕ huy ®éng trùc tiÕp, c¸c yÕu tè ho¹t hãa còng cã thÓ huy ®éng c¸c yÕu
tè c¶i biÕn nucleosome ®Ó ho¹t hãa c¸c gen bÞ “bÝt” trong chÊt nhiÔm s¾c. C¸c yÕu tè c¶i
biÕn nucleosome xuÊt hiÖn ë hai d¹ng. D¹ng thø nhÊt bæ sung c¸c nhãm chøc vµo ®o¹n

169
§inh §oµn Long

®u«i cña c¸c histone, vÝ dô nh− c¸c histone acetylase. D¹ng thø hai cã t¸c dông t¸i cÊu
tróc nucleosome, vÝ dô nh− phøc hÖ SWI/SNF (sö dông n¨ng l−îng tõ ATP). H×nh 5.29
m« t¶ hai m« h×nh c¬ b¶n gióp gi¶i thÝch b»ng c¸ch nµo sù c¶i biÕn nucleosome g©y nªn
bëi c¸c yÕu tè trªn ®©y cã thÓ ho¹t hãa ®−îc gen.
§Çu tiªn, sù t¸i cÊu tróc lµm béc lé c¸c vÞ trÝ liªn kÕt trªn ph©n tö ADN (tr−íc ®ã
n»m ë vÞ trÝ bÞ “bÝt” cña nucleosome). Sù t¸i cÊu tróc nµy hoÆc sù bæ sung nhãm acetyl vµo
®o¹n ®u«i cña histone vµ cña c¸c nucleosome l©n cËn cã thÓ lµm t¨ng sù “láng lÎo” cña c¸c
nucleosome vµ chÊt nhiÔm s¾c, dÉn ®Õn viÖc gi¶i phãng c¸c vÞ trÝ liªn kÕt trªn ADN.
Ngoµi ra, sù bæ sung nhãm acetyl vµo ®o¹n ®u«i c¸c histone cßn ®ång thêi lµm thay
®æi kh¶ n¨ng liªn kÕt cña bé m¸y phiªn m· theo mét c¸ch kh¸c, ®ã lµ nã t¹o ra vÞ trÝ liªn
kÕt trªn nucleosome víi c¸c protein mang miÒn bromo. Mét thµnh phÇn cña phøc hÖ
TFIID mang miÒn bromo, nªn nã liªn kÕt víi c¸c nucleosome ®−îc acetyl hãa tèt h¬n so
víi c¸c nucleosome kh«ng ®−îc acetyl hãa. Nh− vËy, mét gen cã promoter mang nhiÒu
histone ®−îc acetyl hãa th−êng cã ¸i lùc víi bé m¸y phiªn m· cao h¬n khi kh«ng ®−îc
acetyl hãa.
Cã mét sè c©u hái ®−îc ®Æt ra lµ thµnh phÇn nµo cña bé m¸y phiªn m· vµ yÕu tè c¶i
biÕn nucleosome nµo lµ thiÕt yÕu cho sù phiªn m· cña gen; thµnh phÇn nµo cÇn c¸c yÕu
tè ho¹t hãa huy ®éng trùc tiÕp? C©u tr¶ lêi lµ ch−a râ. Nh−ng, c¸c b»ng chøng nh×n
chung cho thÊy, mét sè thµnh phÇn cña bé m¸y phiªn m· (hoÆc c¸c yÕu tè c¶i biÕn
nucleosome) cã thÓ quan träng víi gen nµy, nh−ng Ýt quan träng víi gen kh¸c. Sù kh¸c
biÖt nµy ®«i khi còng kh«ng hoµn toµn râ rÖt. Nãi c¸ch kh¸c, trõ ARN polymerase lµ
thiÕt yÕu cho sù biÓu hiÖn cña mäi gen, th× víi c¸c gen kh¸c nhau, sù phô thuéc vµo c¸c
thµnh phÇn cña bé m¸y phiªn m·, còng nh− c¸c yÕu tè c¶i biÕn nucleosome cã thÓ rÊt
kh¸c nhau, hoÆc thËm chÝ hoµn toµn kh«ng phô thuéc vµo nh÷ng yÕu tè nµy. Ngoµi ra,
møc ®é yªu cÇu mét yÕu tè ®iÒu hßa cßn phô thuéc vµo hoµn c¶nh cô thÓ cña tÕ bµo, nh−
c¸c thêi ®iÓm kh¸c nhau cña chu tr×nh tÕ bµo, hay vµo c¸c giai ®o¹n kh¸c nhau cña qu¸

YÕu tè Promoter YÕu tè


ho¹t hãa Promoter
ho¹t hãa

Histone Phøc hÖ
acetylase c¶i biÕn
nucleosome

Acetyl hãa histone T¸i cÊu tróc nucleosome

Bé m¸y phiªn m· liªn Bé m¸y phiªn m· liªn


kÕt vµo promoter kÕt vµo promoter
H×nh 5.29. C¸c yÕu tè ho¹t hãa lµm thay ®æi cÊu tróc côc bé cña chÊt nhiÔm s¾c. a) C¬ chÕ th«ng qua sù
huy ®éng c¸c enzym c¶i biÕn histone, nh− histone acetylase. b) C¬ chÕ th«ng qua sù huy ®éng phøc hÖ c¶i
biÕn nucleosome, ch¼ng h¹n nh− SWI/SNF (nguån: Watson, 2004).

170
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

tr×nh ph¸t triÓn c¸ thÓ. Mét vÝ dô dÔ thÊy lµ trong nguyªn ph©n, khi c¸c NST ®ang co
xo¾n “cùc ®¹i”, sù ho¹t hãa gen hÇu nh− kh«ng thÓ x¶y ra trõ khi enzym acetylase ®−îc
huy ®éng ®Õn vÞ trÝ cña gen cÇn ®−îc biÓu hiÖn.
5.3.4.3. §iÒu hßa tõ xa: cÊu tróc vßng th¾t ADN vµ c¸c tr×nh tù c¸ch li
RÊt nhiÒu yÕu tè ho¹t hãa gen ë eukaryote ho¹t ®éng tõ mét vÞ trÝ rÊt xa so víi vÞ
trÝ cña gen. Ch¼ng h¹n, ë ®éng vËt cã vó, tr×nh tù enhancer cã thÓ n»m xu«i dßng hay
ng−îc dßng, c¸ch gen hµng tr¨m kb. ë vi khuÈn, chóng ta ®· biÕt sù tån t¹i cña kiÓu ®iÒu
hßa tõ xa. Nh−ng th−êng th× kho¶ng c¸ch tõ vÞ trÝ ®iÒu hßa ®Õn gen chØ vµi tr¨m bp vµ
th−êng liªn quan ®Õn sù h×nh thµnh vßng th¾t ADN. Kho¶ng c¸ch nµy ®ñ gÇn ®Ó c¸c
protein ®iÒu hßa t−¬ng t¸c ®−îc víi nhau. Nh−ng khi kho¶ng c¸ch nµy v−ît qu¸ vµi kb,
th× kh¶ n¨ng t−¬ng t¸c cña chóng mÊt ®i.
Cã mét sè m« h×nh ®−îc ®−a ra ®Ó gi¶i thÝch nhê ®©u ë eukaryote, gen cã thÓ ®−îc
ho¹t hãa tõ mét tr×nh tù t¨ng c−êng ë rÊt xa gen. Mét m« h×nh nh− vËy lµ viÖc t×m thÊy
nhiÒu protein liªn kÕt vµo vïng gi÷a tr×nh tù t¨ng c−êng vµ vïng m· hãa cña gen, dÉn
®Õn h×nh thµnh nhiÒu vßng th¾t liªn tiÕp, lµm tr×nh tù t¨ng c−êng ®−îc ®−a ®Õn gÇn
gen h¬n. Mét m« h×nh kh¸c cho thÊy, chÊt nhiÔm s¾c ®«i khi còng cã nh÷ng cÊu h×nh ®Æc
biÖt (vÝ dô: do sù c¶i biÕn cña c¸c histone vµ t¸i cÊu tróc nucleosome) gióp ®−a c¸c tr×nh
tù t¨ng c−êng ®Õn gÇn gen. Nh−ng, nh×n chung c¬ chÕ ph©n tö cña c¸c hiÖn t−îng nµy
®Õn nay ch−a hoµn toµn s¸ng tá.
NÕu mét tr×nh tù t¨ng c−êng cã thÓ ho¹t hãa mét gen c¸ch nã ®Õn 50 kb, th× yÕu tè
nµo ng¨n c¶n nã kh«ng ho¹t hãa c¸c gen gÇn h¬n? Cã sù xuÊt hiÖn cña mét sè tr×nh tù
®Æc biÖt, gäi lµ c¸c tr×nh tù c¸ch li. Nh÷ng protein liªn kÕt vµo tr×nh tù nµy (gäi lµ c¸c
yÕu tè c¸ch li) kiÓm so¸t ho¹t
®éng cña c¸c yÕu tè t¨ng c−êng. a) Gen biÓu hiÖn
Khi n»m gi÷a mét tr×nh tù t¨ng
c−êng vµ promoter, c¸c yÕu tè c¸ch Tr×nh tù Promoter
li sÏ øc chÕ sù ho¹t hãa gen bëi t¨ng c−êng
yÕu tè t¨ng c−êng. Nh− vÝ dô trªn b)
h×nh 5.30, yÕu tè c¸ch li kh«ng øc Gen kh«ng biÓu hiÖn
chÕ sù ho¹t hãa gen cña yÕu tè
Tr×nh tù Tr×nh tù Promoter
t¨ng c−êng nÕu nã kh«ng n»m t¨ng c−êng c¸ch li
gi÷a tr×nh tù t¨ng c−êng vµ
promoter; còng nh− nã kh«ng øc c)Gen biÓu hiÖn
Gen kh«ng biÓu hiÖn
chÕ yÕu tè t¨ng c−êng ho¹t hãa c¸c
gen kh¸c. Nh− vËy, xÐt vÒ b¶n Promoter Tr×nh tù Tr×nh tù Promoter
chÊt, c¸c yÕu tè c¸ch li kh«ng øc t¨ng c−êng c¸ch li
chÕ ho¹t ®éng cña promoter, còng
nh− kh«ng k×m h·m ho¹t ®éng cña d)
Gen biÓu
hiÖn
c¸c yÕu tè t¨ng c−êng. Thay vµo
®ã, nã ng¨n c¶n sù t−¬ng t¸c gi÷a Tr×nh tù Tr×nh tù Promoter Tr×nh tù
c¸c yÕu tè nµy. §«i khi, c¸c yÕu tè t¨ng c−êng c¸ch li t¨ng c−êng
c¸ch li cã thÓ øc chÕ sù lan táa c¶i
H×nh 5.30. YÕu tè c¸ch li ng¨n c¶n sù ho¹t hãa gen cña yÕu tè
biÕn chÊt nhiÔm s¾c. ë ®Çu t¨ng c−êng. a) Gen ®−îc biÓu hiÖn nhê ho¹t ®éng cña yÕu tè
ch−¬ng nµy, chóng ta ®· biÕt, t¨ng c−êng liªn kÕt ®−îc víi tr×nh tù t¨ng c−êng (enhancer).
tr¹ng th¸i c¶i biÕn chÊt nhiÔm s¾c b) YÕu tè c¸ch li ng¨n c¶n sù t−¬ng t¸c gi÷a yÕu tè t¨ng c−êng víi
cã thÓ g©y ¶nh h−ëng ®Õn viÖc promoter, nªn gen kh«ng ®−îc biÓu hiÖn (dï cho yÕu tè t¨ng
biÓu hiÖn cña mét gen. “BÝt gen” lµ c−êng liªn kÕt ®−îc vµo enhancer. c) YÕu tè t¨ng c−êng vÉn cã
thÓ ho¹t hãa ®−îc gen ë phÝa ®èi diÖn tr×nh tù c¸ch li (hoÆc trªn
mét trong c¸c c¬ chÕ øc chÕ sù biÓu cïng m¹ch ADN hoÆc trªn m¹ch ®èi m·). d) YÕu tè c¸ch li ng¨n
hiÖn gen cã thÓ lan táa däc theo c¶n ho¹t ®éng cña yÕu tè ho¹t hãa n»m ng−îc dßng, nh−ng
kh«ng ng¨n c¶n ho¹t ®éng cña yÕu tè ho¹t hãa n»m xu«i dßng.

171
§inh §oµn Long

chÊt nhiÔm s¾c, ®ång thêi lµm t¾t nhiÒu gen, mµ kh«ng nhÊt thiÕt ph¶i cã c¸c protein øc
chÕ. C¸c yÕu tè c¸ch li cã thÓ øc chÕ ho¹t ®éng lan táa cña c¬ chÕ c¶i biÕn chÊt nhiÔm s¾c.
Nh− vËy, c¸c yÕu tè c¸ch li cã thÓ b¶o vÖ gen khái sù ho¹t hãa hay øc chÕ tuú tiÖn.
HiÖn t−îng nµy cã liªn quan ®Õn viÖc nhiÒu gen ®−îc biÕn n¹p trong thùc nghiÖm ë
eukaryote bÞ “bÝt”, do chóng bÞ cµi ngÉu nhiªn vµo c¸c vïng dÞ nhiÔm s¾c. Nh−ng, nÕu c¸c
yÕu tè c¸ch li n»m ngay tr−íc hoÆc sau gen ®−îc cµi th× nã cã thÓ gióp c¸c gen nµy kh«ng
bÞ “bÝt” do hiÖu øng lan táa cña sù c¶i biÕn chÊt nhiÔm s¾c.
5.3.4.4. Sù ®iÒu hßa biÓu hiÖn mét sè gen cÇn “vïng ®iÒu khiÓn locut” - LCR
Gen m· hãa globin ®−îc biÓu hiÖn trong c¸c tÕ bµo hång cÇu ë ng−êi tr−ëng thµnh
vµ trong mét sè dßng tÕ bµo gèc m¸u trong qu¸ tr×nh ph¸t triÓn c¸ thÓ. HÖ gen ng−êi cã 5
gen m· hãa globin kh¸c nhau (h×nh 5.31). MÆc dï kÕt côm, nh−ng nh÷ng gen nµy ®−îc
®iÒu khiÓn biÓu hiÖn riªng rÏ. Mçi gen ®−îc biÓu hiÖn vµo c¸c thêi kú kh¸c nhau cña qu¸
tr×nh ph¸t triÓn c¬ thÓ. §Çu tiªn lµ gen ε, sau ®ã lµ γ, råi ®Õn β vµ δ. TrËt tù biÓu hiÖn cña
c¸c gen nµy ®−îc ®iÒu khiÓn thÕ nµo?
Mçi gen ®Òu cã mét tËp hîp c¸c vÞ trÝ ®iÒu hßa ®Ó ®iÒu khiÓn “bËt” gen ®óng thêi
®iÓm vµ m«, tÕ bµo phï hîp trong qu¸ tr×nh ph¸t triÓn c¸ thÓ. Cô thÓ, gen β (tÕ bµo tñy
x−¬ng ng−êi tr−ëng thµnh) cã hai tr×nh tù t¨ng c−êng: mét n»m xu«i dßng gen, mét n»m
ng−îc dßng gen. ChØ cã tÕ bµo tñy x−¬ng ng−êi tr−ëng thµnh míi cã ®Çy ®ñ c¸c protein
®iÒu hßa phï hîp, xuÊt hiÖn ë tØ lÖ thÝch hîp, ®Ó liªn kÕt ®−îc vµo hai tr×nh tù t¨ng c−êng
nµy. Tuy vËy, ®Ó c¸c gen ®−îc biÓu hiÖn theo ®óng trËt tù, cßn cÇn mét nhãm c¸c yÕu tè
®iÒu hßa chung, gäi lµ vïng ®iÒu khiÓn locut - LCR (Locus Control Region), n»m
ng−îc dßng c¸ch côm gen globin 30 – 50 kb. C¸ch ho¹t ®éng cña LCR ®Õn nay ch−a s¸ng
tá, nh−ng nã lµ vÞ trÝ liªn kÕt cña c¸c protein ®iÒu hßa kh¸c nhau cã thÓ kÝch øng lµm
“më” cÊu tróc chÊt nhiÔm s¾c quanh côm gen globin, ®ång thêi cho phÐp mét chuçi c¸c
yÕu tè ®iÒu hßa cã thÓ ®iÒu khiÓn c¸c gen ®¬n lÎ theo mét trËt tù nhÊt ®Þnh.
LCR gåm nhiÒu tr×nh tù thµnh
phÇn. Trong ®ã, mét sè lµ c¸c tr×nh tù a)
t¨ng c−êng, mét sè lµ tr×nh tù c¸ch li, cßn Vïng ®iÒu khiÓn locut (LCR) ε γG γA δ β
l¹i lµ promoter. Sù ®a d¹ng vÒ chøc n¨ng
cña c¸c tr×nh tù nµy ®−îc xem lµ m« h×nh
gi¶i thÝch cho c¬ chÕ ho¹t ®éng cña LCR. Côm gen m· hãa globin
10 kb
Trong ®ã, c¸ch ®¬n gi¶n nhÊt lµ c¸c b)
protein ®iÒu hßa liªn kÕt vµo LCR vµ huy LCR Ey β h1 β maj β min
®éng phøc hÖ c¶i biÕn chÊt nhiÔm s¾c tiÕp
cËn vïng gen cÇn biÓu hiÖn. ViÖc c¸c LCR 10 kb
th−êng ë gÇn promoter cña gen ®−îc ho¹t
hãa lµ c¨n cø ñng hé cho c¸ch ®iÓu khiÓn H×nh 5.31. §iÒu hßa ho¹t ®éng gen bëi vïng
nµy. Tuy vËy, theo mét c¸ch kh¸c, toµn bé ®iÒu khiÓn locut - LCR. a) Côm gen m· hãa globin
ë ng−êi ®−îc ®iÒu khiÓn bëi mét LCR. Trªn h×nh kh«ng
bé m¸y phiªn m· ®−îc huy ®éng tíi LCR
minh häa gen α-globin, lµ gen ®−îc biÓu hiÖn trong
vµ xuÊt ph¸t tõ ®©y, c¸c ho¹t ®éng ®iÒu
suèt qu¸ tr×nh ph¸t triÓn. C¸c gen cßn l¹i (β, ε, δ, vµ γ)
hßa phiªn m· (bao gåm sù c¶i biÕn cÊu chØ biÓu hiÖn vµo nh÷ng giai ®o¹n kh¸c nhau cña qu¸
tróc chÊt nhiÔm s¾c vµ gi¶i phãng c¸c yÕu tr×nh ph¸t triÓn vµ theo mét trËt tù nhÊt ®Þnh. Chuçi α-
tè øc chÕ côc bé) b¾t ®Çu diÔn ra. ë globin kÕt hîp víi mét lo¹i chuçi globin kh¸c h×nh
eukaryote, cã mét sè côm gen còng ®−îc thµnh nªn c¸c d¹ng hemoglobin vµo c¸c giai ®o¹n
t×m thÊy cã kiÓu ®iÒu hßa qua LCR t−¬ng ph¸t triÓn kh¸c nhau cña c¬ thÓ. b) Côm gen m· hãa
tù gen m· hãa globin. globin ë chuét còng ®−îc ®iÒu khiÓn bëi mét LCR.

172
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

5.3.5. §iÒu hßa biÓu hiÖn gen ë eukaryote sau khëi ®Çu phiªn m·

5.3.5.1. Mét sè yÕu tè t¨ng c−êng biÓu hiÖn gen theo kiÓu kÐo dµi phiªn m·
C¸c bé m¸y phiªn m· ë eukaryote th−êng gåm nhiÒu protein cÇn cho sù khëi ®Çu
phiªn m·. §ång thêi nã còng chøa mét sè yÕu tè tham gia vµo giai ®o¹n kÐo dµi (xem
ch−¬ng 4). ë mét sè gen, n»m sau promoter cã c¸c tr×nh tù g©y t¹m dõng sù “tr−ît däc”
ph©n tö ADN cña ARN polymerase. ë nh÷ng gen nµy, sù cã mÆt hay v¾ng mÆt nh÷ng
yÕu tè kÐo dµi (chuçi polyribonucleotide ®ang tæng hîp) cã vai trß quyÕt ®Þnh møc biÓu
hiÖn cña gen.
VÝ dô gen HSP70 ë ruåi giÊm, gen nµy ®−îc ho¹t hãa bëi yÕu tè sèc nhiÖt vµ ®−îc
®iÒu khiÓn ®ång thêi bëi hai yÕu tè ho¹t hãa. YÕu tè liªn kÕt GAGA ®−îc xem lµ ®ñ ®Ó cã
thÓ huy ®éng bé m¸y phiªn m· tíi gen vµ khëi ®Çu phiªn m·. Song, nÕu kh«ng cã yÕu tè
thø hai lµ HSF th× ARN polymerase sÏ dõng l¹i ë mét vÞ trÝ sau promoter kho¶ng 100 bp.
Nh−ng, khi cã tÝn hiÖu “sèc nhiÖt”, HSF sÏ liªn kÕt vµo mét vÞ trÝ ®Æc hiÖu trªn promoter
vµ huy ®éng mét enzym kinase (pTEF) tíi vÞ trÝ bé m¸y phiªn m· ®ang dõng l¹i. Enzym
nµy phosphoryl hãa miÒn ®Çu C thuéc tiÓu phÇn lín nhÊt cña ARN polymerase vµ “níi
láng” enzym ë vÞ trÝ t¹m dõng; nhê vËy, sù kÐo dµi phiªn m· ®−îc tiÕp tôc. Nh− vËy,
ngoµi c¸c c¬ chÕ ®iÒu hßa chung, ®©y lµ mét kiÓu ®iÒu hßa bæ sung. Còng cã thÓ chØ cã
mét sè gen cã c¬ chÕ ®iÒu hßa bæ sung gièng HSP70.
HIV g©y héi chøng AIDS tiÕn hµnh phiªn m· c¸c gen cña nã tõ mét promoter ®−îc
®iÒu khiÓn bëi pTEF. Trong tr−êng hîp cña HIV còng vËy, polymerase (ë ®©y lµ reverse
transcriptase) khëi ®Çu phiªn m· t¹i promoter nh−ng ngay sau ®ã nã dõng l¹i. Lóc ®ã,
pTEF ®−îc vËn chuyÓn ®Õn enzym bëi mét protein liªn kÕt ARN (chø kh«ng ph¶i ADN)
cã tªn lµ TAT. TAT nhËn ra mét tr×nh tù ®Æc hiÖu gÇn vÞ trÝ ë ®Çu ph©n tö ARN cña HIV
vµ tr×nh tù t−¬ng øng trªn b¶n phiªn m· ®· ®−îc t¹o ra bëi polymerase ®ang dõng l¹i.
TAT cã mét vïng t−¬ng t¸c víi pTEF vµ nhê vËy huy ®éng ®−îc protein nµy ®Õn enzym.
5.3.5.2. C¸ch c¾t intron kh¸c nhau ë c¸c tÕ bµo cã thÓ t¹o ra c¸c protein kh¸c nhau
ë ch−¬ng 3 chóng ta ®· biÕt, hÇu hÕt gen ë eukaryote ®Òu cã tÝnh ph©n m¶nh: n»m
gi÷a c¸c tr×nh tù m· hãa (exon) lµ c¸c tr×nh tù kh«ng m· hãa (intron). Trong phiªn m·,
ban ®Çu toµn bé tr×nh tù gen (ADN) ®−îc chuyÓn thµnh tr×nh tù b¶n phiªn m· (tiÒn-
mARN). Sau ®ã, ph©n tö tiÒn-ARN ®−îc c¾t bá c¸c intron, vµ nèi l¹i c¸c exon thµnh ph©n
tö ARN hoµn thiÖn. ë eukaryote, c¬ thÓ cµng phøc t¹p, sè gen cã intron, sè intron trung
b×nh vµ kÝch th−íc c¸c intron ë mçi gen cµng cã xu h−íng t¨ng lªn.
Trong mét sè tr−êng hîp, c¸ch c¾t intron tõ cïng mét ph©n tö tiÒn-mARN cã thÓ
theo mét sè c¸ch kh¸c nhau, t¹o nªn c¸c ph©n tö mARN hoµn thiÖn kh¸c nhau (tõ ®ã, t¹o
nªn c¸c protein kh¸c nhau). Tuy vËy, ®iÒu ®¸ng chó ý lµ kiÓu c¾t bá intron l¹i cã tÝnh di
truyÒn vµ ®Æc tr−ng ë mçi lo¹i tÕ bµo (m«) vµ vµo nh÷ng thêi ®iÓm nhÊt ®Þnh cña qu¸
tr×nh ph¸t triÓn c¸ thÓ. Nãi c¸ch kh¸c, qu¸ tr×nh nµy còng ®−îc ®iÒu khiÓn chÆt chÏ.
ë khÝa c¹nh nµo ®ã, viÖc ®iÒu hßa c¸ch c¾t intron còng gièng nh− c¬ chÕ ®iÒu hßa
phiªn m·. §Ó c¾t c¸c intron vµ nèi c¸c exon, “bé m¸y c¾t intron” th−êng liªn kÕt vµo c¸c
vÞ trÝ c¾t intron vµ thùc hiÖn ph¶n øng c¾t-nèi. Cã hai yÕu tè chÝnh ¶nh h−ëng ®Õn ho¹t
®éng c¾t-nèi intron lµ ¸i lùc liªn kÕt víi c¸c vÞ trÝ c¾t-nèi cña bé m¸y c¾t intron vµ ho¹t
lùc cña c¸c protein tham gia ph¶n øng c¾t – nèi. NÕu vÞ trÝ c¾t-nèi cã ¸i lùc cao víi bé
m¸y c¾t intron, th× ho¹t ®éng c¾t intron ë vÞ trÝ ®ã cã thÓ ®−îc ®iÒu khiÓn theo kiÓu “c¬
®Þnh” (nghÜa lµ, th−êng xuyªn x¶y ra). Nh−ng nÕu nã bÞ øc chÕ bëi mét “yÕu tè k×m h·m
c¾t intron” (gièng nh− kiÓu LacI), th× bé m¸y c¾t intron kh«ng liªn kÕt ®−îc vµo vÞ trÝ c¾t

173
§inh §oµn Long

intron vµ ph¶n øng c¾t-nèi kh«ng x¶y ra. C¬ chÕ øc chÕ c¾t intron nh− vËy gièng víi c¬
chÕ øc chÕ phiªn m· vµ dÞch m· chóng ta ®· thÊy ë E. coli.
Theo mét c¸ch kh¸c, ng−êi ta t×m thÊy nh÷ng “tr×nh tù t¨ng c−êng c¾t intron” ë gÇn
c¸c vÞ trÝ c¾t-nèi. Nh÷ng tr×nh tù nµy ®−îc nhËn biÕt bëi c¸c protein ®iÒu hßa cã xu
h−íng huy ®éng bé m¸y c¾t intron tíi c¸c vÞ trÝ c¾t-nèi. Gièng nh− c¸c yÕu tè ho¹t hãa
phiªn m·, c¸c protein ®iÒu hßa nµy cã c¸c miÒn chøc n¨ng t¸ch biÖt nhau. Mét miÒn liªn
kÕt víi axit nucleic (ë ®©y lµ ARN), cßn mét miÒn liªn kÕt víi bé m¸y c¾t intron.
C¬ chÕ ®iÒu hßa c¾t intron bëi c¸c protein ho¹t hãa vµ øc chÕ c¾t intron lµ c¬ së cña
c¬ chÕ x¸c ®Þnh giíi tÝnh ë ruåi giÊm, ®−îc m« t¶ nh− sau:
- Giíi tÝnh ë ruåi giÊm ®−îc qui ®Þnh dùa trªn tØ sè gi÷a sè NST giíi tÝnh X trªn sè
bé NST th−êng (X/A). Con c¸i ®iÓn h×nh cã tØ sè nµy lµ 1,0 (2 NST X vµ 2 bé NST th−êng),
cßn con ®ùc ®iÓn h×nh cã tØ sè nµy lµ 0,5 (1 NST X vµ 2 bé NST th−êng). TØ sè nµy ban
®Çu ®−îc “®o” bëi møc phiªn m· cña mét sè gen ®−îc ®iÒu khiÓn bëi hai yÕu tè ho¹t hãa,
lµ SisA vµ SisB. C¸c gen m· hãa c¸c yÕu tè nµy ®Òu n»m trªn NST X. Nhê vËy, trong thêi
kú ®Çu ph¸t triÓn ph«i, con c¸i sÏ s¶n sinh SisA vµ SisB nhiÒu gÊp ®«i c¸c con ®ùc.
C¸c protein ho¹t hãa nµy liªn kÕt vµo c¸c vÞ trÝ ®iÒu hßa n»m ng−îc dßng gen qui
®Þnh giíi tÝnh SxI (h×nh 5.32). Mét protein ®iÒu hßa kh¸c còng liªn kÕt vµ ®iÒu khiÓn
biÓu hiÖn cña SxI lµ protein øc chÕ Dpn. Dpn ®−îc m· hãa bëi mét gen n»m trªn NST sè
2. Nh− vËy, ta thÊy tØ lÖ protein ho¹t hãa (SisA vµ SisB) vµ øc chÕ (Dpn) lµ kh¸c nhau ë
hai giíi. §iÒu nµy dÉn ®Õn gen SxI ®−îc t¨ng c−êng ë con c¸i vµ øc chÕ ë con ®ùc.
Gen SxI ®−îc biÓu hiÖn tõ hai promoter kh¸c nhau, gäi lµ Pm vµ Pe. Trong ®ã, Pe
®−îc ®iÒu khiÓn bëi SisA vµ SisB (nh− vËy, Pe chØ ho¹t ®éng ë con c¸i). Trong c¸c giai
®o¹n sau cña qu¸ tr×nh ph¸t triÓn, Pe kh«ng ho¹t ®éng; sù duy tr× ho¹t ®éng cña gen SxI
lµ nhê Pm. Pm ho¹t ®éng theo kiÓu c¬ ®Þnh ë c¶ con ®ùc vµ c¸i, nh−ng s¶n phÈm mARN
cña gen SxI ®−îc phiªn m· tõ Pm nhiÒu h¬n s¶n phÈm phiªn m· tõ Pe mét exon. NÕu
mARN hoµn thiÖn cã exon nµy, th× protein t¹o ra kh«ng cã ho¹t tÝnh (®iÒu nµy x¶y ra ë
con ®ùc). NÕu mARN ®−îc c¾t bá exon nµy, protein SxI ho¹t ®éng vµ duy tr× kiÓu h×nh
con c¸i. Nh− vËy, trong giai ®o¹n ph«i sím, Pe ho¹t ®éng ë con c¸i, dÉn ®Õn viÖc protein
Ruåi giÊm c¸i Ruåi giÊm ®ùc
2X : 2A 1X : 2A
SisA Dpn SisA Dpn
SisB 1x SisB 1x
2x 1x

Pm Pe §iÓm dõng Pm Pe §iÓm dõng


ADN
Phiªn m· Kh«ng phiªn m·
TiÒn-mARN 5’ 3’
XÐn intron
mARN hoµn thiÖn 5’ 3’
DÞch m·
Protein SxI N C

H×nh 5.32. §iÒu hßa phiªn mX gen biÓu hiÖn sím SxI ë ruåi giÊm ®ùc vµ c¸i. C¸c gen sisA vµ sisB n»m
trªn NST X m· hãa cho c¸c yÕu tè ho¹t hãa ®iÒu khiÓn gen SxI. Dpn lµ yÕu tè øc chÕ biÓu hiÖn gen SxI cã gen m·
hãa n»m trªn NST sè 2. NÕu l−îng Dpn sinh ra tõ gen trªn NST th−êng lµ gièng nhau ë c¶ 2 giíi, th× c¸c yÕu tè ho¹t
hãa (SisA vµ B) ®−îc tæng hîp ë con c¸i nhiÒu gÊp ®«i con ®ùc. Sù kh¸c biÖt vÒ tØ sè [protein ho¹t hãa]/[protein øc
chÕ] quyÕt ®Þnh gen SxI chØ biÓu hiÖn ë con c¸i, nh−ng kh«ng biÓu hiÖn ë con ®ùc (nguån: Estes et al, 1995)

174
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

SxI cã ë con c¸i mµ kh«ng cã ë con ®ùc. Protein nµy trùc tiÕp ®iÒu khiÓn c¾t exon trªn
ph©n tö tiÒn-mARN ®−îc phiªn m· tõ promoter Pm. Nªn, ë con c¸i, “exon øc chÕ” nµy bÞ
c¾t bá.
5.3.5.3. Sù ®iÒu hßa biÓu hiÖn gen ®−îc ®iÒu khiÓn ë b−íc dÞch m·
Gcn4 lµ mét yÕu tè ho¹t hãa phiªn m· ë nÊm men. Nã tham gia ®iÒu khiÓn c¸c gen
m· hãa enzym xóc t¸c c¸c ph¶n øng tæng hîp c¸c axit amin. Dï lµ mét yÕu tè phiªn m·,
nh−ng sù tæng hîp protein nµy ®−îc ®iÒu hßa ë b−íc dÞch m·. Khi nång ®é c¸c axit amin
trong tÕ bµo thÊp, mARN cña Gcn4 ®−îc dÞch m·. Nh−ng, khi nång ®é axit amin trong tÕ
bµo cao, mARN cña Gcn4 kh«ng ®−îc dÞch m·. C¬ chÕ cña hiÖn t−îng nµy nh− thÕ nµo?
mARN cña Gcn4 chøa bèn khung ®äc më n»m ng−îc dßng gen Gcn4 (kÝ hiÖu
uORF). Trong ®ã uORF1 c¸ch gen xa nhÊt vµ ®−îc nhËn biÕt m¹nh nhÊt khi phøc hÖ
dÞch m· (ribosome) tr−ît däc mARN tõ ®Çu 5’. Khi khung ®äc uORF1 ®· dÞch m· xong,
mét thuéc tÝnh ®Æc biÖt cña khung ®äc nµy lµ nã cho phÐp 50% sè tiÓu phÇn nhá cña
ribosome tiÕp tôc duy tr× liªn kÕt víi mARN vµ t×m ®Õn m· më ®Çu (AUG) cña c¸c uORF
tiÕp sau nã.
Tr−íc khi khëi ®Çu dÞch m·, ë c¸c uORF tiÕp theo, tiÓu phÇn ribosome 40S (®iÒu
khiÓn sù tr−ît däc ph©n tö mARN cña ribosome) ph¶i liªn kÕt ®−îc víi yÕu tè dÞch m·
eIF2 (®· t¹o phøc s½n víi Met-tARN). Khi nång ®é axit amin thÊp, eIF2 bÞ phosphoryl
hãa, lµm gi¶m hiÖu qu¶ liªn kÕt cña nã vµo ribosome. §ång thêi lóc nµy sù s½n cã phøc
hÖ Met-tARN còng thÊp. Nh− vËy, khi hiÕm axit amin, tiÓu phÇn nhá cña ribosome cã xu
h−íng v−ît qua c¸c uORF 2 – 4 tr−íc khi liªn kÕt ®−îc trë l¹i víi eIF2-tARNMet (vèn vÉn
ë hµm l−îng thÊp). Nh− vËy, dï phøc hÖ dÞch m· kh«ng khëi ®Çu dÞch m· ®−îc ë c¸c
uORF2-4, nh−ng nã l¹i cã thÓ khëi ®Çu ë ORF cña gen Gcn4. Së dÜ nh− vËy, bëi v× ORF
cña Gcn4 n»m xa uORF1 h¬n, vµ ribosome cã ®ñ thêi gian “trèng” ®Ó liªn kÕt víi eIF2-
tARNMet vµ b¾t ®Çu dÞch m· gen nµy. Lóc ®ã, protein Gcn4 ®−îc h×nh thµnh vµ nã “bËt”
c¸c gen tham gia tæng hîp c¸c axit amin trong tÕ bµo.
Khi l−îng c¸c axit amin trong tÕ bµo cao, phøc hÖ eIF2-tARNMet sÏ liªn kÕt víi tiÓu
phÇn ribosome nhá ngay khi nã kÕt thóc dÞch m· uORF1, vµ sù dÞch m· sÏ ®−îc diÔn ra
víi c¸c uORF2, 3 vµ 4. Sau khi nh÷ng khung ®äc nµy ®−îc dÞch m· xong, ribosome sÏ t¸ch
khái ph©n tö mARN vµ kh«ng dÞch m· khung ORF cña gen Gcn4. Do vËy, Gcn4 kh«ng
h×nh thµnh.

5.3.6. C¸c vai trß kh¸c nhau cña ARN trong ®iÒu hßa biÓu hiÖn gen
ë ch−¬ng 2, chóng ta ®· thÊy c¸c chøc n¨ng ®a d¹ng cña ARN. Trong thùc tÕ, nhãm
ph©n tö nµy cßn cã vai trß quan träng trong ®iÒu hßa biÓu hiÖn cña nhiÒu gen kh¸c nhau.
Chóng ta cßn nhí ë E. coli, trong m« h×nh operon Trp, cÊu tróc bËc 2 cña mARN cña
opreron Trp ®· trùc tiÕp ®iÒu hßa biÓu hiÖn c¸c gen cña operon nµy.
ë eukaryote, vai trß cña ARN trong ®iÒu hßa ho¹t ®éng gen cßn linh ho¹t h¬n. Mét
trong nh÷ng c¬ chÕ ®ã lµ: nh÷ng ®o¹n ARN ng¾n cã thÓ trùc tiÕp øc chÕ sù biÓu hiÖn cña
c¸c gen cã tr×nh tù t−¬ng ®ång víi nã. Sù øc chÕ nµy, gäi lµ ARN can thiÖp (kÝ hiÖu
ARNi). C¸c ph©n tö ARNi cã thÓ g©y nªn c¸c hiÖu øng: (1) øc chÕ dÞch m· ®èi víi mARN,
(2) ph©n gi¶i mARN, vµ (3) øc chÕ sù phiªn m· cña gen ë trong nh©n. C¬ chÕ chi tiÕt cã
thÓ ®ång thêi g©y nªn c¸c hiÖu øng trªn cña ARNi ch−a biÕt ®Çy ®ñ. Nh−ng ë ®©y, chóng
ta sÏ xem m« h×nh ho¹t ®éng cña ARNi ®−îc t×m thÊy ë giun trßn C. elegans. HiÖn nay,
viÖc sö dông ARNi ®−îc ¸p dông nh− mét c«ng cô h÷u hiÖu khi cÇn “t¾t” mét gen nµo ®ã.

175
§inh §oµn Long

5.3.6.1. ARN sîi kÐp øc chÕ m¹nh sù biÓu hiÖn cña gen cã tr×nh tù t−¬ng ®ång víi nã
N¨m 2006, hai nhµ sinh häc ng−êi Mü lµ Fire vµ Mello ®· ®−îc trao gi¶i Nobel vÒ
c«ng tr×nh nghiªn cøu c«ng bè n¨m 1998 cña hä vÒ viÖc c¸c ph©n tö ARN sîi kÐp
(dsARN), sau khi biÕn n¹p vµo tÕ bµo C. elegans, g©y nªn hiÖu øng øc chÕ m¹nh sù biÓu
hiÖn cña c¸c gen cã tr×nh tù t−¬ng ®ång hoµn toµn hoÆc mét phÇn víi chóng. HiÖu øng
nµy sau ®ã ®−îc t×m thÊy ë nhiÒu eukaryote kh¸c. Tuy nhiªn, tr−íc khi cã nh÷ng nghiªn
cøu nµy, ng−êi ta ®· t×m thÊy hiÖn
t−îng c¸c gen bÞ “t¾t” khi biÕn n¹p ARN sîi kÐp
c¸c ®o¹n tr×nh tù t−¬ng ®ång cña (dsARN)
chóng vµo tÕ bµo thùc vËt. C¸c Mµng tÕ bµo
®o¹n gen biÕn n¹p ®−îc t×m thÊy cã
nhiÒu b¶n sao, mét sè liªn kÕt vµo YÕu tè TÕ bµo chÊt
hÖ gen nh©n víi tr×nh tù ®¶o chiÒu. xÐn
ë thùc vËt, ng−êi ta còng t×m thÊy (dicer)
Nh©n
c¸c tr×nh tù ARN t−¬ng ®ång trong
tÕ bµo
mét sè c¬ chÕ b¶o vÖ tÕ bµo khái sù siARN sîi kÐp
g©y nhiÔm cña virut. Ngoµi ra, cã (siARN duplex)
mét hiÖn t−îng lµ sù l©y nhiÔm cña
virut ARN mang mét b¶n sao gen ADN
cña thùc vËt th−êng lµm “t¾t” sù
biÓu hiÖn cña gen tÕ bµo chñ. TÊt T¸i cÊu tróc
c¶ c¸c hiÖn t−îng trªn ®©y cã c¬ chÕ chÊt nhiÔm s¾c RISC
liªn quan ®Õn nhau, ®ã lµ c¸c ph©n
tö ARN sîi kÐp cã thÓ lµm “t¾t” sù ATP
biÓu hiÖn cña gen. C¬ chÕ ®−îc m«
t¶ trong c¸c môc d−íi ®©y. ADP

5.3.6.2. C¬ chÕ lµm t¾t gen bëi siARN RISC*


YÕu tè xÐn (dicer) lµ mét
enzym cã ho¹t tÝnh ARNaseIII,
nghÜa lµ nã nhËn biÕt vµ c¾t c¸c
®o¹n ARN sîi kÐp (dsARN) kÝch m7G
th−íc dµi. S¶n phÈm c¾t cña nã lµ
c¸c ph©n ®o¹n dsARN ng¾n kho¶ng øc chÕ siARN ®−îc
23 bp, kÝ hiÖu lµ siARN (h×nh dÞch m· nh©n lªn
5.33). siARN g©y øc chÕ sù biÓu
hiÖn cña c¸c gen cã tr×nh tù t−¬ng
®ång víi nã qua ba c¸ch: 1) ph©n Ph©n gi¶i b¶n phiªn m· mARN
gi¶i b¶n phiªn m· mARN cña gen, H×nh 5.33. C¬ chÕ lµm “t¾t” gen bëi siARN. siARN lµm t¾t gen
2) øc chÕ sù dÞch m· trªn ph©n tö nÕu mét ®o¹n dsARN cã tr×nh tù t−¬ng ®ång víi gen ®ã ®−îc chuyÓn
vµo (hoÆc ®−îc h×nh thµnh trong) tÕ bµo. Trong tÕ bµo, enzym xÐn
mARN t−¬ng øng, vµ 3) c¶i biÕn (dicer) sÏ c¾t dsARN thµnh nh÷ng ph©n ®o¹n nhá (siARN). siARN sÏ
vïng nhiÔm s¾c, dÉn ®Õn lµm bÊt ®iÒu khiÓn phøc hÖ RISC ho¹t ®éng theo 3 con ®−êng: (1) g¾n vµo vµ
ph©n gi¶i c¸c ph©n tö mARN cã tr×nh tù bæ trî víi siARN, (2) ng¨n c¶n
ho¹t gen. §iÒu ®¸ng chó ý lµ, dï
sù dÞch m· tõ c¸c ph©n tö mARN nh− vËy, vµ (3) huy ®éng enzym c¶i
qua con ®−êng nµo, ®Òu cã sù tham biÕn chÊt nhiÔm s¾c ®Õn gen t−¬ng øng trong nh©n ®Ó bÊt ho¹t sù
gia cña mét bé m¸y gäi lµ “phøc phiªn m· cña gen. siARN còng cã thÓ ®−îc dïng lµm måi ®Ó nh©n lªn
c¸c ®o¹n siARN míi nhê ARN polymerase dïng ARN lµm khu«n. C¸c
hÖ t¾t gen kÝch øng bëi ARN”, ho¹t ®éng trªn ®©y còng cã thÓ x¶y ra trong nh©n tÕ bµo. Trªn h×nh,
gäi t¾t lµ RISC (RNA-induced RISC* biÓu diÔn phøc hÖ RISC sau khi ®−îc ho¹t hãa bëi siARN (theo:
Hannon GJ, 2002).

176
Ch−¬ng 5. gen vµ sù ®iÒu hoµ biÓu hiÖn gen

silencing complex). Ngoµi siARN, RISC th−êng chøa mét sè thµnh phÇn lµ protein; trong
®ã, ®¸ng chó ý lµ mét sè protein thuéc hä Agronaut (liªn kÕt ARN).
Nh− m« t¶ trªn h×nh 5.33, sau khi siARN ®−îc t¹o ra (nhê dicer), nã liªn kÕt víi
phøc hÖ RISC vµ biÕn tÝnh thµnh m¹ch ®¬n (dïng n¨ng l−îng tõ ATP). Sù xuÊt hiÖn
m¹ch ®¬n ARN sÏ ho¹t hãa RISC (kÝ hiÖu lµ RISC*). ë tr¹ng th¸i ho¹t hãa, RISC* ®−îc
“®−a” ®Õn c¸c ph©n tö mARN ®Ých cã tr×nh tù bæ sung víi siARN cña nã. Lóc nµy, RISC*
sÏ c¾t ph©n tö mARN ®Ých vµ ng¨n c¶n sù dÞch m· tõ ph©n tö nµy. C¬ chÕ t¾t gen lóc
nµy mét phÇn phô thuéc vµo møc ®é t−¬ng ®ång gi÷a siARN vµ mARN ®Ých. NÕu sù
t−¬ng ®ång lµ hoµn toµn, ph©n tö ARN ®Ých cã xu h−íng bÞ ph©n gi¶i (do ho¹t tÝnh
nuclease cña RISC). NÕu chØ t−¬ng ®ång mét phÇn, xu h−íng x¶y ra lµ sù øc chÕ dÞch m·.
RISC* còng cã thÓ x©m nhËp ®−îc vµo nh©n tÕ bµo vµ kÕt cÆp víi tr×nh tù t−¬ng
®ång trªn ph©n tö ADN hÖ gen. Lóc nµy, RISC huy ®éng mét sè protein lµm c¶i biÕn chÊt
nhiÔm s¾c quanh vÞ trÝ promoter cña gen, dÉn ®Õn sù k×m h·m phiªn m· (ch¼ng h¹n, qua
c¬ chÕ “bÝt gen” do sù biÕn ®æi chÊt nhiÔm s¾c ®· ®−îc ®Ò cËp ë trªn).
Mét ®iÓm ®¸ng chó ý lµ c¬ chÕ “t¾t” gen bëi ARNi cã hiÖu qu¶ rÊt cao. ChØ cÇn mét
l−îng nhá siARN ®−îc ®−a vµo tÕ bµo cã thÓ ®ñ ®Ó lµm “t¾t” hoµn toµn sù biÓu hiÖn cña
mét gen nµo ®ã (vèn cã nhiÒu b¶n sao trong c¬ thÓ ®a bµo). C¬ chÕ g©y nªn hiÖu øng
m¹nh nh− vËy ch−a biÕt ®Çy ®ñ, nh−ng cã b»ng chøng cho thÊy siARN ®· ®−îc nh©n lªn
nhê c¸c enzym ARN polymerase dïng ARN lµm khu«n. Sù nh©n lªn cña c¸c siARN
®−îc ph¸t hiÖn nhê hiÖn t−îng sau: khi ph©n tö siARN liªn kÕt vµo mARN ®Ých, c¸c ph©n
tö siARN míi ®−îc h×nh thµnh cã tr×nh tù gièng víi tr×nh tù ph©n ®o¹n mARN n»m gÇn
tr×nh tù mARN ®Ých cña siARN gèc. V× vËy, cã lÏ enzym ARN polymerase dïng ARN lµm
khu«n ®· ®−îc c¸c siARN gèc huy ®éng ®Õn ph©n tö mARN ®Ých; vµ c¸c enzym nµy ®· sö
dông chÝnh c¸c ®o¹n siARN m¹ch ®¬n lµm “måi” ®Ó tæng hîp nªn c¸c ph©n tö siARN míi.
5.3.6.3. C¸c miARN ®iÒu khiÓn sù biÓu hiÖn gen trong qu¸ tr×nh ph¸t triÓn
Ngoµi c¬ chÕ ®iÒu hßa biÓu hiÖn gen b»ng siARN kÓ trªn, trong tù nhiªn cßn c¬ chÕ
®iÒu hßa biÓu hiÖn gen bëi mét nhãm ARN gäi lµ microARN (miARN). C¸c ph©n tö
miARN øc chÕ trùc tiÕp sù biÓu hiÖn gen theo kiÓu gièng víi siARN. miARN ®−îc t×m
thÊy ®Çu tiªn ë C. elegans, sau ®ã ®−îc ph¸t hiÖn vµ nghiªn cøu kü h¬n ë thùc vËt. C¸c
ph©n tö miARN ®iÓn h×nh cã chiÒu dµi 21 – 22 nucleotide, h×nh thµnh tõ c¸c tiÒn-ARN cã
kÝch th−íc 70 - 90 nucleotide (®−îc phiªn m· tõ c¸c ®o¹n ADN kh«ng m· hãa protein).
C¸c miARN ®−îc c¸c dicer nhËn biÕt vµ c¾t. Víi c¬ chÕ gièng siARN, c¸c miARN lµm
ph©n gi¶i c¸c ph©n tö mARN ®Ých (ë thùc vËt), hoÆc øc chÕ sù dÞch m· (ë giun trßn).
¦íc l−îng cã kho¶ng 120 gen m· hãa miARN ë giun trßn, cßn ë ng−êi cã kho¶ng
250 gen. Th«ng th−êng, c¸c gen miARN ®−îc ®iÒu hßa theo kiÓu chØ biÓu hiÖn vµo nh÷ng
thêi ®iÓm nhÊt ®Þnh vµ ë c¸c m« nhÊt ®Þnh trong qu¸ tr×nh ph¸t triÓn. Mét c¸ch ®iÓn
h×nh lµ chóng øc chÕ c¸c mARN m· hãa c¸c protein ®iÒu hßa tham gia ®iÒu khiÓn sù biÓu
hiÖn c¸c nhãm gen t−¬ng øng víi mét giai ®o¹n ph¸t triÓn cña c¬ thÓ sinh vËt. §¸ng chó
ý, 30% c¸c ph©n tö miARN ë giun trßn cã tr×nh tù rÊt gièng víi ë ruåi giÊm vµ ®éng vËt
cã vó. §iÒu nµy cho thÊy, d−êng nh− c¬ chÕ ®iÒu hßa biÓu hiÖn gen bëi miARN ®· cã
nguån gèc tõ l©u trong qu¸ tr×nh tiÕn hãa, vµ vai trß cña chóng trong viÖc “lËp tr×nh”
biÓu hiÖn cña hÖ gen lµ quan träng h¬n nh÷ng dù ®o¸n ban ®Çu.

177
§inh §oµn Long

Cã gi¶ thiÕt cho r»ng, trong qu¸ tr×nh tiÕn hãa, c¬ chÕ sö dông ARNi ®· xuÊt hiÖn
do nhu cÇu b¶o vÖ tÕ bµo chñ (eukaryote) khái c¸c virut vèn dïng c¸c ph©n tö dsARN lµ
d¹ng trung gian trong sù sinh s¶n cña chóng. Nh− chóng ta ®· biÕt, nhiÒu virut vµ c¸c
yÕu tè di truyÒn vËn ®éng (transposon) sao chÐp th«ng qua d¹ng trung gian dsARN. Lóc
nµy, ARNi lµm t¾t c¸c gen cña c¸c thÓ g©y nhiÔm, ®ång thêi ph¸ bá c¸c ph©n tö dsARN
trung gian. Mét ®iÓm ®¸ng chó ý lµ kiÓu ho¹t ®éng cña ARNi biÓu hiÖn râ ë thùc vËt.
NhiÒu virut thùc vËt còng ®· ph¸t triÓn c¬ chÕ chèng l¹i sù ®¸p øng tù vÖ nhê ARNi cña
vËt chñ. C¬ chÕ nµy ë virut ®−îc gäi lµ “sù øc chÕ t¾t gen bëi ARNi”, viÕt t¾t lµ VSGS
(viral suppression of gene silencing). ë c¸c c¬ thÓ chñ mµ con ®−êng ®¸p øng tù vÖ nhê
ARNi bÞ háng th× chøc n¨ng VSGS kh«ng cÇn thiÕt n÷a. ë giun trßn, mét sè ®ét biÕn lµm
háng bé m¸y ARNi cã liªn quan ®Õn sù t¨ng c−êng ho¹t ®éng cña c¸c yÕu tè di truyÒn
vËn ®éng.

178
Ch−¬ng 6

§ét biÕn vµ söa ch÷a ADN

6.1. §ét biÕn lµ nguån nguyªn liÖu cña qu¸ tr×nh tiÕn hãa
Tõ c¸c ch−¬ng tr−íc, chóng ta biÕt r»ng di truyÒn lµ hiÖn t−îng c¸c gen ®−îc
truyÒn tõ bè, mÑ sang con c¸i qua sinh s¶n. Trong ®ã, gen lµ ®¬n vÞ l−u gi÷ th«ng tin di
truyÒn ®−îc h×nh thµnh tõ tr×nh tù c¸c deoxyribonucleotide trong ph©n tö ADN, hoÆc tõ
c¸c ribonucleotide trong ph©n tö ARN. ë ch−¬ng 3, chóng ta còng ®· biÕt b»ng c¸ch nµo
th«ng tin di truyÒn ®−îc t¸i b¶n chÝnh x¸c trong qu¸ tr×nh sao chÐp ADN theo nguyªn
t¾c b¸n b¶o toµn, hoÆc bëi mét sè c¬ chÕ sao chÐp ARN ®Æc thï kh¸c ë virut. Sù sao chÐp
chÝnh x¸c cßn phô thuéc mét phÇn vµo ho¹t tÝnh ®äc söa cña c¸c enzym ADN polymerase
vµ ARN polymerase. C¸c c¬ chÕ sao chÐp vËt chÊt di truyÒn hiÖn h÷u ë c¸c sinh vËt ngµy
nay ®Òu nh»m ®¶m b¶o cho viÖc th«ng tin di truyÒn ®−îc truyÒn t¶i chÝnh x¸c tõ tÕ bµo
mÑ sang c¸c tÕ bµo con, vµ tõ thÕ hÖ nµy sang thÕ hÖ kh¸c. Tuy nhiªn, trong qu¸ tr×nh ®ã,
c¸c sai háng hoÆc lçi sao chÐp cã thÓ x¶y ra. Nh÷ng thay ®æi trong vËt chÊt di truyÒn nh−
vËy, khi ®−îc duy tr× qua c¸c thÕ hÖ, ®−îc gäi lµ ®ét biÕn.
Kh¸i niÖm ®ét biÕn th−êng gåm hai ý. Mét lµ sù thay ®æi trong vËt chÊt di truyÒn.
Hai lµ qu¸ tr×nh ph¸t sinh thay ®æi ®ã. Mét c¬ thÓ biÓu hiÖn kiÓu h×nh míi do kÕt qu¶
cña ®ét biÕn th× ®−îc gäi lµ thÓ ®ét biÕn. Mét ®iÒu quan träng lµ cÇn ph©n biÖt ®ét biÕn
víi biÕn dÞ tæ hîp, trong ®ã biÕn dÞ tæ hîp lµ sù thay ®æi kiÓu h×nh do kÕt qu¶ t¸i tæ hîp
cña vËt chÊt di truyÒn mang c¸c ®ét biÕn vèn ®· xuÊt hiÖn tõ tr−íc. C¶ hai sù kiÖn nµy
®«i khi ®Òu t¹o ra kiÓu h×nh míi. Nh−ng, ®ét biÕn lµ nh÷ng thay ®æi trùc tiÕp liªn quan
®Õn sè l−îng vµ cÊu tróc nhiÔm s¾c thÓ (NST), ®Æc biÖt lµ cÊu tróc cña nh÷ng gen riªng
biÖt. Nh÷ng ®ét biÕn chØ liªn quan ®Õn mét vÞ trÝ nhÊt ®Þnh trªn gen ®−îc gäi lµ ®ét biÕn
®iÓm. Chóng bao gåm sù thay thÕ mét cÆp baz¬ nit¬ nµy b»ng mét cÆp baz¬ nit¬ kh¸c,
hoÆc bëi sù mÊt ®i hay thªm vµo mét (hoÆc mét sè) cÆp baz¬ nit¬ t¹i vÞ trÝ nhÊt ®Þnh trªn
gen. Trong di truyÒn häc hiÖn nay, theo thãi quen ®ét biÕn th−êng ®−îc dïng víi nghÜa
hÑp ®Ó chØ ®ét biÕn ®iÓm. Do vËy, trong gi¸o tr×nh nµy, c¸c ®ét biÕn ®−îc chóng ta nh¾c
tíi chñ yÕu lµ ®ét biÕn ®iÓm.
§ét biÕn lµ nguån gèc tËn cïng cña mäi biÕn dÞ di truyÒn, do vËy nã ®−îc coi lµ
nguyªn liÖu s¬ cÊp cña tiÕn hãa. C¸c c¬ chÕ t¸i tæ hîp di truyÒn thùc chÊt chØ lµ sù tæ hîp
l¹i c¸c biÕn dÞ di truyÒn; cßn chän läc (tù nhiªn vµ nh©n t¹o) cã vai trß ®Þnh h−íng nh»m
duy tr× nh÷ng kiÓu tæ hîp (gen) thÝch nghi víi c¸c ®iÒu kiÖn m«i tr−êng sèng cña sinh vËt
(chän läc tù nhiªn), hoÆc ®¸p øng ®−îc tèt nh÷ng nhu cÇu cña con ng−êi (chän läc nh©n
t¹o). NÕu kh«ng cã ®ét biÕn, mäi gen ®Òu chØ tån t¹i ë mét tr¹ng th¸i duy nhÊt, sÏ kh«ng
cã kh¸i niÖm vÒ alen vµ kh«ng cã sù ph©n ly tÝnh tr¹ng; quan träng h¬n c¶ lµ c¸c quÇn
thÓ kh«ng thÓ tiÕn hãa ®Ó thÝch nghi ®−îc víi c¸c ®iÒu kiÖn m«i tr−êng thay ®æi. Nh−
vËy, ®Ó sinh vËt cã thÓ ph¸t triÓn vµ thÝch nghi ®−îc víi c¸c m«i tr−êng sèng míi, viÖc
ph¸t sinh ®ét biÕn lµ cÇn thiÕt. Nh−ng, nÕu ®ét biÕn x¶y ra víi tÇn sè qu¸ cao hoÆc
th−êng xuyªn th× sù truyÒn t¶i th«ng tin di truyÒn gi÷a c¸c thÕ hÖ kh«ng cßn nguyªn
vÑn. H¬n n÷a, phÇn lín ®ét biÕn khi míi xuÊt hiÖn th−êng kh«ng cã lîi cho søc sèng cña
thÓ ®ét biÕn. Ngoµi c¸c t¸c nh©n ®ét biÕn, tÇn sè ®ét biÕn cña gen cßn phô thuéc vµo c¸c
yÕu tè di truyÒn kh¸c, nh− c¸c c¬ chÕ ®iÒu hßa møc ®é ®ét biÕn ®−îc ®Ò cËp d−íi ®©y.

179
§inh §oµn Long

6.2. Mét sè ®Æc ®iÓm c¬ b¶n cña sù ph¸t sinh ®ét biÕn

6.2.1. §ét biÕn tÕ bµo mÇm sinh dôc vµ ®ét biÕn tÕ bµo soma
§ét biÕn cã thÓ xuÊt hiÖn ë mäi tÕ bµo, trong mäi giai ®o¹n cña qu¸ tr×nh ph¸t triÓn
ë sinh vËt. HiÖu qu¶ kiÓu h×nh cña ®ét biÕn phô thuéc vµo lo¹i tÕ bµo mµ ®ét biÕn sinh
ra, thêi ®iÓm ph¸t sinh ®ét biÕn trong chu tr×nh tÕ bµo, tr¹ng th¸i tréi-lÆn cña nã (so víi
b¶n sao thø hai trong tÕ bµo l−ìng béi). ë sinh vËt bËc cao, trong giai ®o¹n ®Çu ph¸t
triÓn ph«i, c¸c tÕ bµo mÇm sinh dôc s¶n sinh ra c¸c tÕ bµo sinh tinh vµ sinh trøng, tõ ®ã
h×nh thµnh nªn c¸c tÕ bµo sinh dôc tr−ëng thµnh (tinh trïng vµ trøng). Nh÷ng tÕ bµo
nµy ®−îc gäi chung lµ tÕ bµo sinh dôc. TÊt c¶ c¸c tÕ bµo kh¸c cña c¬ thÓ ®−îc gäi lµ tÕ bµo
soma. §ét biÕn x¶y ra trong c¸c tÕ bµo sinh dôc ®−îc gäi lµ ®ét biÕn giao tö, cßn ®ét
biÕn x¶y ra trong tÕ bµo soma ®−îc gäi lµ ®ét biÕn soma.
§ét biÕn soma chØ ®−îc duy tr× qua sù nguyªn ph©n cña tÕ bµo ®ét biÕn mµ kh«ng
®−îc truyÒn qua giao tö cho c¸c thÕ hÖ sau. NhiÒu gièng t¸o t©y vµ vµ cam Navel cã qu¶
ngät lµ kÕt qu¶ cña ®ét biÕn soma. Nh÷ng c©y mang ®ét biÕn soma th−êng ë d¹ng kh¶m,
kh«ng di truyÒn ®−îc ®Æc tÝnh ®ét biÕn qua sinh s¶n h÷u tÝnh. RÊt may, nh÷ng loµi c©y
trªn ®©y cã thÓ sinh s¶n sinh d−ìng (v« tÝnh) nhê c¸c kü thuËt nh− chiÕt, ghÐp, gi©m
cµnh ... ®Ó duy tr× ®−îc c¸c ®Æc tÝnh “®ét biÕn” mong muèn.
NÕu mét ®ét biÕn giao tö lµ tréi, th× hiÖu øng kiÓu h×nh cña nã cã thÓ xuÊt hiÖn
ngay ë thÕ hÖ con. NÕu ®ét biÕn giao tö lµ lÆn, kiÓu h×nh cña nã kh«ng biÓu hiÖn ë kiÓu
gen dÞ hîp tö. C¸c ®ét biÕn giao tö cã thÓ xuÊt hiÖn ë mäi giai ®o¹n cña qu¸ tr×nh sinh
s¶n. NÕu nã chØ cã ë mét giao tö duy nhÊt, th× chØ cã mét c¸ thÓ con duy nhÊt mang gen
®ét biÕn. Nh−ng, nÕu ®ét biÕn xuÊt hiÖn trong tÕ bµo tiÒn sinh dôc (tÕ bµo sinh tinh hoÆc
sinh trøng), th× sÏ cã nhiÒu giao tö nhËn ®−îc gen ®ét biÕn vµ kh¶ n¨ng gen ®ét biÕn
®−îc duy tr× sang c¸c thÕ hÖ sau lµ rÊt cao. V× vËy, tÝnh tréi – lÆn cña c¸c gen vµ thêi
®iÓm xuÊt hiÖn ®ét biÕn trong chu kú sinh s¶n ë sinh vËt lµ nh÷ng yÕu tè quyÕt ®Þnh kh¶
n¨ng mét gen (alen) ®ét biÕn cã ®−îc biÓu hiÖn vµ ph¸t t¸n trong quÇn thÓ hay kh«ng.

6.2.2. §ét biÕn tù ph¸t vµ ®ét biÕn g©y t¹o


§ét biÕn cã thÓ xuÊt hiÖn do c¸c t¸c nh©n tõ m«i tr−êng, kÓ c¶ tõ m«i tr−êng néi
bµo. Trong ®ã, ®ét biÕn tù ph¸t lµ nh÷ng ®ét biÕn mµ t¸c nh©n g©y ®ét biÕn th−êng
kh«ng cô thÓ. Chóng cã thÓ do c¸c sai háng cña qu¸ tr×nh trao ®æi chÊt trong c¬ thÓ g©y
nªn, hoÆc do nh÷ng t¸c nh©n kh«ng x¸c ®Þnh tõ m«i tr−êng. §ét biÕn g©y t¹o lµ ®ét
biÕn xuÊt hiÖn khi tÕ bµo hoÆc c¬ thÓ sinh vËt ®−îc xö lý víi c¸c t¸c nh©n vËt lý hoÆc hãa
häc kh¸c nhau, lµm thay ®æi cÊu tróc vµ tr×nh tù nucleotide trong ph©n tö ADN (hoÆc
ARN ë mét sè virut). Nh÷ng t¸c nh©n nµy ®−îc gäi lµ t¸c nh©n ®ét biÕn, bao gåm c¸c
bøc x¹ ion hãa, tia s¸ng cùc tÝm (UV) vµ nhiÒu hãa chÊt g©y ®ét biÕn kh¸c nhau.
MÆc dï ®−îc ph©n lo¹i nh− vËy, nh−ng trong thùc tÕ viÖc x¸c ®Þnh mét ®ét biÕn lµ
do tù ph¸t hay g©y t¹o th−êng kh«ng râ rµng. V× vËy, trong c¸c nghiªn cøu di truyÒn, ®Ó
ph©n biÖt c¸c ®ét biÕn g©y t¹o vµ tù ph¸t, c¸c nhµ nghiªn cøu th−êng ph¶i lµm thÝ
nghiÖm so s¸nh víi “®èi chøng”. Cô thÓ, nÕu xö lý mét t¸c nh©n nµo ®ã mµ ®ét biÕn nhÊt
®Þnh t¨ng lªn 100 lÇn, th× cã thÓ coi 99% lµ do t¸c nh©n ®ét biÕn, cßn 1% lµ do tù ph¸t.
C¸c ®ét biÕn tù ph¸t th−êng hiÕm x¶y ra, dï tÇn sè quan s¸t ®−îc lµ kh¸c nhau ë
tõng gen vµ ë tõng ®èi t−îng sinh vËt. TÇn sè ®ét biÕn tù ph¸t cña nhiÒu gen ë vi khuÈn
vµ virut ®−îc x¸c ®Þnh vµo kho¶ng 10-10 - 10-8 víi mçi nucleotide trong mét lÇn sao chÐp.
Nh− vËy, víi mét gen kÝch th−íc trung b×nh 1000 bp, th× tÇn sè ®ét biÕn ë mçi gen sÏ vµo
kho¶ng 10-7 - 10-4 trong mçi thÕ hÖ.

180
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

ViÖc xö lý víi c¸c t¸c nh©n ®ét biÕn th−êng lµm t¨ng râ rÖt tÇn sè ®ét biÕn. TÇn sè
®ét biÕn ë mçi gen cña vi khuÈn vµ virut khi xö lý hãa chÊt ®ét biÕn th−êng t¨ng trªn
1%. NghÜa lµ, cã thªm 1% sè gen cña vi khuÈn sÏ mang Ýt nhÊt mét ®ét biÕn, hay lµ cã
trªn 1% sè phag¬ trong quÇn thÓ mang Ýt nhÊt mét ®ét biÕn khi xÐt ë mçi gen.

6.2.3. §ét biÕn cã ph¶i lµ ngÉu nhiªn, v« h−íng?


ë c¸c thµnh phè, nhiÒu quÇn thÓ chuét trë nªn kh¸ng víi thuèc diÖt chuét truyÒn
thèng. T−¬ng tù nh− vËy, nhiÒu quÇn thÓ c«n trïng (s©u ®ôc th©n, s©u ¨n l¸ ...) trë nªn
kh¸ng víi c¸c thuèc trõ s©u; ngµy cµng cã nhiÒu chñng vi khuÈn g©y bÖnh trë nªn kh¸ng
c¸c chÊt kh¸ng sinh. ViÖc con ng−êi ®−a vµo sö dông c¸c lo¹i thuèc trõ s©u vµ kh¸ng
sinh míi ®· t¹o nªn m«i tr−êng sèng míi ë c¸c sinh vËt nµy, vµ chÝnh c¸c ®ét biÕn ®· t¹o
cho chóng kh¶ n¨ng kh¸ng víi c¸c thuèc trõ s©u vµ kh¸ng sinh nãi trªn. C¸c c¸ thÓ
kh«ng ®ét biÕn, mÉn c¶m víi thuèc th× bÞ chÕt; cßn c¸c thÓ ®ét biÕn th× sinh s¶n nhanh
thµnh nh÷ng quÇn thÓ kh¸ng thuèc míi. §Õn nay, cã nhiÒu b»ng chøng kh¼ng ®Þnh sù
tiÕn hãa ë sinh vËt lµ kÕt qu¶ cña chän läc c¸c ®ét biÕn lµm t¨ng kh¶ n¨ng thÝch nghi ë
sinh vËt.
Nh÷ng vÝ dô nµy ®Æt ra mét sè c©u hái c¬ b¶n lµ liÖu sù xuÊt hiÖn ®ét biÕn cã
®óng lµ sù kiÖn ngÉu nhiªn hoµn toµn cßn yÕu tè m«i tr−êng chØ duy tr× c¸c ®ét biÕn
s½n cã? hay sù xuÊt hiÖn ®ét biÕn ®−îc ®iÒu khiÓn bëi c¸c yÕu tè m«i tr−êng? Thùc
nghiÖm cho thÊy, xu h−íng ®ét biÕn ®−îc h×nh thµnh theo c¸ch thø nhÊt. Ch¼ng h¹n,
nÕu c¾t ®u«i chuét liªn tiÕp nhiÒu thÕ hÖ th× còng kh«ng bao giê thu ®−îc “loµi” chuét
côt ®u«i. Tuy vËy, Lamarck vµ Lysenko ®· tõng tin vµo viÖc c¸c yÕu tè m«i tr−êng quy
®Þnh sù tiÕn hãa.
Ngµy nay, chóng ta cã thÓ khã hiÓu t¹i sao Lysenko l¹i ñng hé thuyÕt cña Lamarck
vÒ sù h×nh thµnh c¸c tÝnh tr¹ng tËp nhiÔm (thuyÕt nµy ngù trÞ ë n−íc Nga trong suèt giai
®o¹n 1937 – 1964). Nh−ng, ph¶i thõa nhËn kh«ng dÔ phñ quyÕt häc thuyÕt Lamarck, ®Æc
biÖt khi xÐt ®Õn nhiÒu tr−êng hîp ë vi khuÈn. Ch¼ng h¹n, mét quÇn thÓ E. coli ®−îc cÊy
vµo m«i tr−êng kh«ng cã streptomycin, råi sau ®ã chuyÓn sang m«i tr−êng cã kh¸ng sinh
nµy, th× phÇn lín vi khuÈn bÞ chÕt. Nh−ng, cã mét sè tÕ bµo kh¸ng ®−îc chÊt kh¸ng sinh,
cã thÓ sinh tr−ëng vµ ph¸t triÓn m¹nh. Mét c©u hái ®Æt ra lµ: ®ét biÕn kh¸ng kh¸ng sinh
®· tån t¹i s½n trong quÇn thÓ hay khi cã chÊt kh¸ng sinh nã míi xuÊt hiÖn?
N¨m 1952, Joshua vµ Lederberg ®· ph¸t triÓn mét kü thuËt quan träng, gäi lµ
ph−¬ng ph¸p ®ãng dÊu. Ph−¬ng ph¸p nµy chøng minh c¸c ®ét biÕn kh¸ng kh¸ng sinh
®· xuÊt hiÖn ë vi khuÈn tõ tr−íc khi chóng ®−îc chuyÓn sang nu«i cÊy trong m«i tr−êng
cã chÊt kh¸ng sinh. Lederberg ®· hßa lo·ng dÞch nu«i vi khuÈn vµ tr¶i chóng lªn bÒ mÆt
m«i tr−êng chøa agar vµ nu«i trong buång nu«i ®Õn khi mçi tÕ bµo vi khuÈn ph¸t triÓn
thµnh tõng khuÈn l¹c riªng biÖt. C¸c nhµ nghiªn cøu sau ®ã ®· dïng mét viªn gç trßn
bäc v¶i nhung (gäi lµ “con dÊu”) Ên lªn bÒ mÆt m«i tr−êng. TÕ bµo vi khuÈn t−¬ng øng víi
vÞ trÝ khuÈn l¹c ®−îc “in vÕt” lªn mÆt v¶i nhung cña con dÊu. B−íc tiÕp theo, “con dÊu”
®−îc dïng ®Ó in vi khuÈn lªn mÆt m«i tr−êng chøa streptomycin. Hä lÆp l¹i quy tr×nh
nµy víi nhiÒu ®Üa petri, mçi ®Üa gåm kho¶ng 200 khuÈn l¹c. Sau khi nu«i qua ®ªm, h«m
sau hä nhËn ®−îc mét sè khuÈn l¹c cã kh¶ n¨ng kh¸ng streptomycin.
Lederberg sau ®ã ®· kiÓm tra c¸c khuÈn l¹c trong m«i tr−êng kh«ng cã
streptomycin vÒ kh¶ n¨ng sèng cña chóng trong m«i tr−êng chøa streptomycin. KÕt qu¶
thó vÞ lµ, c¸c khuÈn l¹c trong m«i tr−êng kh«ng cã streptomycin t−¬ng øng víi c¸c khuÈn
l¹c mäc trong m«i tr−êng cã streptomycin, hÇu nh− lu«n cã tÕ bµo kh¸ng ®−îc chÊt kh¸ng
sinh. Trong khi c¸c khuÈn l¹c kh«ng mäc trong m«i tr−êng chän läc rÊt hiÕm khi cã tÕ
bµo kh¸ng ®−îc chÊt kh¸ng sinh. B»ng c¸ch nµy, Lederberg ®· chøng minh ®−îc r»ng, sù
xuÊt hiÖn c¸c ®ét biÕn kh¸ng streptomycin ®· cã mÆt s½n trong quÇn thÓ tõ tr−íc khi

181
§inh §oµn Long

chóng ®−îc chuyÓn sang m«i tr−êng cã streptomycin. C¸c b»ng chøng thùc nghiÖm sau
nµy còng chøng minh r»ng, c¸c t¸c nh©n m«i tr−êng kh«ng trùc tiÕp ®iÒu khiÓn sù h×nh
thµnh ®ét biÕn (nh− quan ®iÓm cña Lysenko), mµ chóng chØ ®¬n thuÇn chän läc c¸c ®ét
biÕn vèn cã s½n ë tÇn sè thÊp; dÉn ®Õn c¸c kiÓu h×nh thÝch nghi h¬n trong m«i tr−êng
sèng míi vµ trë nªn sinh s¶n m¹nh mÏ, lÊn ¸t c¸c kiÓu h×nh kh¸c kÐm thÝch nghi h¬n.

6.2.4. §ét biÕn cã thÓ ®¶o ng−îc (®ét biÕn phôc håi)
Nh− ®· nªu, mét ®ét biÕn ë gen kiÓu d¹i cã thÓ t¹o nªn mét alen ®ét biÕn vµ dÉn
®Õn mét kiÓu h×nh bÊt th−êng. §ét biÕn tõ alen kiÓu d¹i thµnh alen ®ét biÕn ®−îc xem lµ
®ét biÕn thuËn. Nh−ng, alen ®ét biÕn còng cã thÓ ®ét biÕn ng−îc l¹i ®Ó trë vÒ d¹ng kiÓu
d¹i. §ét biÕn nµy ®−îc gäi lµ ®ét biÕn ng−îc hay ®ét biÕn phôc håi.
Trong thùc tÕ, ®«i khi viÖc x¸c ®Þnh mét kiÓu h×nh lµ ®ét biÕn hay kiÓu d¹i kh«ng
dÔ dµng. Chóng ®¬n gi¶n chØ lµ hai kiÓu h×nh cã hÖ sè thÝch nghi t−¬ng ®−¬ng. Ch¼ng
h¹n, ë ng−êi, c¸c mµu m¾t ®en, n©u vµ xanh ®Òu ®−îc xem lµ kiÓu h×nh kiÓu d¹i. Nh−ng
ë quÇn thÓ mµu m¾t ®en chiÕm −u thÕ, chØ cã Ýt c¸ thÓ mµu m¾t xanh th× alen m¾t xanh
cã thÓ bÞ coi lµ ®ét biÕn.
Khi mét ®ét biÕn thø hai lµm phôc håi kiÓu h×nh ban ®Çu vèn mÊt ®i do ®ét biÕn
thø nhÊt, th× qu¸ tr×nh ®ã ®−îc gäi lµ phôc phåi ®ét biÕn. Sù phôc håi ®ét biÕn cã thÓ
diÔn ra theo hai c¸ch: 1) ®ét biÕn KiÓu h×nh KiÓu gen
trë l¹i: ®ã lµ khi ®ét biÕn thø hai x¶y +
ra t¹i cïng vÞ trÝ trªn gen, kh«i phôc KiÓu d¹i
l¹i tr×nh tù nucleotide ban ®Çu cña §ét biÕn
m
gen; vµ 2) ®ét biÕn øc chÕ: ®ã lµ khi KiÓu h×nh ®ét biÕn
mét ®ét biÕn thø hai x¶y ra ë mét vÞ §ét biÕn trë l¹i §ét biÕn øc chÕ
trÝ kh¸c trong hÖ gen, ng¨n c¶n sù
Phôc håi kiÓu h×nh
biÓu hiÖn cña ®ét biÕn thø nhÊt
+ m s
(h×nh 6.1). Nh− vËy, ®ét biÕn trë l¹i KiÓu d¹i (1) (2)
th× phôc håi tr×nh tù nucleotide kiÓu
d¹i, cßn ®ét biÕn øc chÕ th× kh«ng. Lai ng−îc víi kiÓu d¹i
§ét biÕn øc chÕ cã thÓ x¶y ra ë vÞ trÝ
kh¸c trong gen, ë gen kh¸c, hay thËm (1) +
+ Toµn bé thÕ hÖ con
chÝ ë NST kh¸c. cã kiÓu h×nh kiÓu d¹i
+
Mét sè ®ét biÕn phôc håi theo
kiÓu ®ét biÕn trë l¹i, nh−ng nhiÒu m s
(a) C¸c kiÓu h×nh kiÓu
d¹ng ®ét biÕn kh¸c lµ do ®ét biÕn øc
+ d¹i cña bè, mÑ
chÕ. §Ó ph©n biÖt hai d¹ng ®ét biÕn (2) m s (b)
ng−îc nµy, ng−êi ta tiÕn hµnh phÐp m T¸i tæ hîp: kiÓu
lai ng−îc (thÓ ®ét biÕn x kiÓu d¹i). + (c) h×nh ®ét biÕn
NÕu ®ét biÕn ng−îc theo kiÓu ®ét s T¸i tæ hîp: kiÓu
(d) h×nh ch−a biÕt
biÕn øc chÕ, th× kiÓu h×nh ®ét biÕn
thø nhÊt sÏ xuÊt hiÖn trë l¹i (nhê sù H×nh 6.1. Sù kh«i phôc kiÓu h×nh kiÓu d¹i cña mét c¬ thÓ.
ph©n li khái thÓ ®ét biÕn øc chÕ sau §iÒu nµy cã thÓ x¶y ra bëi (1) §ét biÕn trë l¹i, hoÆc (2) §ét
t¸i tæ hîp di truyÒn). NÕu kiÓu d¹i biÕn øc chÕ. Mét sè thÓ ®ét biÕn cã thÓ ®¶o ng−îc vÒ kiÓu d¹i
b»ng c¶ hai c¬ chÕ. Cã thÓ ph©n biÖt hai lo¹i ®ét biÕn phôc
®−îc phôc håi nhê ®ét biÕn trë l¹i, th× håi b»ng viÖc cho lai ng−îc víi kiÓu d¹i ban ®Çu. NÕu ®ét biÕn
tÊt c¶ c¸c c¸ thÓ lai sinh ra tõ phÐp phôc håi lµ ®ét biÕn ng−îc th× toµn bé con lai lµ kiÓu d¹i. NÕu
lai ng−îc ®Òu cã kiÓu h×nh kiÓu d¹i. ®ét biÕn phôc håi lµ ®ét biÕn øc chÕ, th× mét sè con lai cã kiÓu
h×nh ®ét biÕn (d¹ng 2c).

182
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

6.3. §ét biÕn vµ hiÖu qu¶ kiÓu h×nh


HiÖu qu¶ kiÓu h×nh cña ®ét biÕn cã thÓ rÊt yÕu ♀ ♂
(chØ ph¸t hiÖn ®−îc b»ng ph©n tÝch di truyÒn hoÆc hãa
sinh), song còng cã thÓ rÊt lín (g©y hËu qu¶ nghiªm P + l +
träng víi sinh vËt, kÓ c¶ g©y chÕt). C¸c ®ét biÕn trong X X X Y
vïng m· hãa cña gen th−êng t¹o nªn alen míi cña
gen ®ã. Nh÷ng alen kh«ng t¹o ra hiÖu qu¶ kiÓu h×nh
kh¸c biÖt víi kiÓu d¹i (hoÆc chØ cã thÓ ph¸t hiÖn bëi
F1 + + l + + l
c¸c ph©n tÝch ®Æc biÖt), ®−îc gäi lµ c¸c alen ®ång
®¼ng (isoallele). Cßn nh÷ng ®ét biÕn lµm s¶n phÈm X X X X X Y X Y
♀ ♀ ♂ ♂
cña gen mÊt chøc n¨ng, hoÆc gen kh«ng cßn ®−îc
H×nh 6.2. Sù thay ®æi tØ lÖ giíi tÝnh ë
dïng ®Ó dÞch m·, th× alen sinh ra ®−îc gäi lµ alen v« ruåi giÊm do ®ét biÕn lÆn g©y chÕt
nghÜa (null allele). NÕu ®ét biÕn alen v« nghÜa liªn liªn kÕt NST X. Con c¸i dÞ hîp tö vÒ
quan ®Õn c¸c gen thiÕt yÕu cho sù ph¸t triÓn cña sinh alen ®ét biÕn sinh ra tØ lÖ 2 c¸i : 1 ®ùc.
vËt, th× c¸c c¸ thÓ ®ång hîp tö th−êng chÕt sím. C¸c alen nh− vËy cßn ®−îc gäi lµ alen
lÆn g©y chÕt. CÇn ph©n biÖt ®ét biÕn alen v« nghÜa víi ®ét biÕn v« nghÜa. Trong ®ã, ®ét
biÕn v« nghÜa lµ ®ét biÕn h×nh thµnh mét trong c¸c bé ba kÕt thóc (UAA, UAG vµ UGA)
trong vïng m· hãa cña gen.
Alen ®ét biÕn cã thÓ ë tr¹ng th¸i tréi hoÆc lÆn. ë sinh vËt ®¬n béi (nh− vi khuÈn,
virut), dï tr¹ng th¸i ®ét biÕn lµ tréi hay lÆn, th× hiÖu qu¶ kiÓu h×nh ®ét biÕn th−êng biÓu
hiÖn ngay (tøc lµ alen ®ét biÕn biÓu hiÖn kiÓu h×nh ngay khi chóng h×nh thµnh). ë sinh
vËt l−ìng béi (nh− ruåi giÊm, ng−êi), c¸c ®ét biÕn lÆn chØ lµm thay ®æi kiÓu h×nh khi ë
tr¹ng th¸i ®ång hîp tö. ë nh÷ng loµi nµy, phÇn lín ®ét biÕn lÆn kh«ng biÓu hiÖn kiÓu
h×nh khi chóng võa xuÊt hiÖn (v× lóc ®ã chóng th−êng ë d¹ng dÞ hîp tö), trõ c¸c ®ét biÕn
lÆn liªn kÕt NST X biÓu hiÖn ngay ë c¸ thÓ dÞ giao tö (con ®ùc ë phÇn lín ®éng vËt). C¸c
®ét biÕn lÆn g©y chÕt th−êng lµm thay ®æi tØ lÖ giíi tÝnh cña thÕ hÖ con, do c¸ thÓ dÞ giao
tö mang alen g©y chÕt kh«ng tån t¹i (h×nh 6.2).

6.3.1. PhÇn lín ®ét biÕn lµ cã h¹i vµ th−êng ë tr¹ng th¸i lÆn

PhÇn lín ®ét biÕn ®−îc ph¸t hiÖn lµ cã h¹i (bªn c¹nh nhiÒu ®ét biÕn trung tÝnh
th−êng Ýt ®−îc quan t©m) vµ ë tr¹ng th¸i lÆn. §iÒu nµy cã thÓ hiÓu ®−îc khi chóng ta xÐt
c¬ chÕ kiÓm so¸t di truyÒn cña qu¸ tr×nh trao ®æi chÊt. Mçi qu¸ tr×nh trao ®æi chÊt
th−êng gåm mét hoÆc nhiÒu chuçi ph¶n øng, trong ®ã mçi b−íc ph¶n øng ®Òu cÇn Ýt nhÊt
mét enzym ®Æc hiÖu, mµ mçi enzym th× ®−îc m· hãa bëi mét hoÆc mét sè gen nhÊt ®Þnh.
C¸c ®ét biÕn trong nh÷ng gen nµy th−êng c¶n trë qu¸ tr×nh trao ®æi chÊt (h×nh 6.3).
Nh÷ng c¶n trë nµy xuÊt hiÖn do sù thay ®æi tr×nh tù c¸c baz¬ nit¬ trong gen dÉn ®Õn sù
thay ®æi tr×nh tù c¸c axit amin trong protein. Vµ, trong nhiÒu tr−êng hîp, c¸c protein ®ét
biÕn bÞ mÊt chøc n¨ng. Trong thùc tÕ, ®©y chÝnh lµ hiÖu øng ®ét biÕn ®−îc ph¸t hiÖn phæ
biÕn nhÊt. Qua viÖc c¸c alen kiÓu d¹i m· hãa cho c¸c enzym cã ho¹t tÝnh, cßn c¸c alen ®ét
biÕn m· hãa cho c¸c enzym mÊt hoµn toµn hay mét phÇn ho¹t tÝnh th× còng dÔ hiÓu t¹i

183
§inh §oµn Long

sao c¸c alen ®ét biÕn th−êng lµ lÆn. NÕu mét tÕ bµo cã c¶ hai d¹ng enzym cã ho¹t tÝnh vµ
mÊt ho¹t tÝnh, th× d¹ng cã ho¹t tÝnh vÉn cã thÓ xóc t¸c c¸c ph¶n øng diÔn ra b×nh th−êng.
Ngoµi ra, do tÝnh tho¸i hãa cña m· bé ba (nhiÒu m· bé ba cïng m· hãa mét axit
amin), nªn nhiÒu ®ét biÕn cã thÓ kh«ng t¹o nªn hiÖu qu¶ kiÓu h×nh. Nh÷ng ®ét biÕn nµy
®−îc gäi lµ ®ét biÕn c©m (lµ mét d¹ng cña ®ét biÕn trung tÝnh). Mét c©u hái ®Æt ra lµ
t¹i sao phÇn lín ®ét biÕn quan s¸t ®−îc th−êng t¹o ra s¶n phÈm mÊt hoÆc gi¶m ho¹t
tÝnh? Cã lÏ tr¶i qua hµng triÖu n¨m tiÕn hãa, c¸c alen kiÓu d¹i ®· ®−îc chän läc vÒ hiÖu
qu¶ thÝch nghi nªn chóng ®· cã ho¹t tÝnh tèi −u. V× vËy, c¸c ®ét biÕn ngÉu nhiªn sinh ra
th−êng dÉn ®Õn sù thay ®æi cña tr×nh tù axit amin cã hÖ sè thÝch nghi cao nhÊt. Ta cã thÓ
vÝ ®iÒu nµy víi mét cç m¸y phøc t¹p. NÕu c¸c m«®un cÊu t¹o m¸y ®· ®−îc tèi −u, mäi sù
thay ®æi ®Òu cã xu h−íng lµm gi¶m hiÖu qu¶ cña hÖ thèng. Quan ®iÓm nh− vËy gióp gi¶i
thÝch t¹i sao phÇn lín ®ét biÕn quan s¸t ®−îc th−êng lµ c¸c alen lÆn vµ cã h¹i.

TiÒn chÊt ChÊt trung gian 1 ChÊt trung gian 2 S¶n phÈm
Enzym A Enzym B Enzym C

Gen A Gen B Gen C


alen kiÓu d¹i A alen kiÓu d¹i B alen kiÓu d¹i C

§ét biÕn §ét biÕn §ét biÕn

Alen ®ét biÕn a Alen ®ét biÕn b Alen ®ét biÕn c

Enzym a mÊt ho¹t tÝnh Enzym b mÊt ho¹t tÝnh Enzym c mÊt ho¹t tÝnh
ë c¬ thÓ ®ång hîp tö ë c¬ thÓ ®ång hîp tö ë c¬ thÓ ®ång hîp tö
aa bb cc
TiÒn chÊt ChÊt trung gian 1 ChÊt trung gian 2 S¶n phÈm

H×nh 6.3. C¸c alen lÆn ®ét biÕn th−êng g©y c¶n trë c¸c con ®−êng trao ®æi chÊt. C¸c con ®−êng nµy cã
thÓ gåm mét sè b−íc ph¶n øng (nh− minh häa trªn h×nh), hoÆc gåm nhiÒu chuçi ph¶n øng dµi h¬n. C¸c alen
kiÓu d¹i ë mçi gen m· hãa cho mét enzym b×nh th−êng xóc t¸c mét ph¶n øng hãa häc nhÊt ®Þnh trong qu¸
tr×nh trao ®æi chÊt. PhÇn lín c¸c ®ét biÕn x¶y ra ë c¸c alen kiÓu d¹i dÉn ®Õn sù h×nh thµnh c¸c d¹ng enzym bÞ
biÕn ®æi gi¶m ho¹t tÝnh hoÆc kh«ng cßn ho¹t tÝnh. ë tr¹ng th¸i ®ång hîp tö, c¸c alen ®ét biÕn s¶n sinh ra c¸c
enzym mÊt chøc n¨ng, g©y c¶n trë ( ) qu¸ tr×nh trao ®æi chÊt do thiÕu ho¹t tÝnh enzym cÇn thiÕt.

6.3.2. HiÖu qu¶ kiÓu h×nh c¸c gen m· hãa globin ë ng−êi

C¸c ®ét biÕn gen m· hãa hemoglobin ë ng−êi lµ mét vÝ dô cho thÊy phÇn lín ®ét
biÕn lµ cã h¹i. ë ng−êi tr−ëng thµnh, hemoglobin chñ yÕu ë d¹ng A gåm hai chuçi α vµ
hai chuçi β. Mçi chuçi α gåm 141 axit amin, cßn mçi chuçi β gåm 146 axit amin. Do
gièng nhau vÒ tr×nh tù, cã thÓ tin r»ng c¸c gen m· hãa globin (α, β, γ, ε vµ δ) cã cïng
nguån gèc.
ë c¸c quÇn thÓ ng−êi kh¸c nhau, ng−êi ta t×m thÊy nhiÒu ®ét biÕn ë gen m· hãa
globin, trong ®ã hÇu hÕt lµ cã h¹i. Ch¼ng h¹n bÖnh hång cÇu h×nh liÒm (kÝ hiÖu HbS) g©y
ra do ®ét biÕn thay thÕ axit amin sè 6 lµ Glu (®©y lµ mét axit amin tÝnh axit) trªn chuçi β
thµnh Val (®©y lµ mét axit amin trung tÝnh). Sù thay ®æi nµy dÉn ®Õn h×nh thµnh mét

184
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

liªn kÕt míi néi ph©n tö, lµm


VÞ trÝ axit amin trong chuçi β - globin
cÊu h×nh cña hemoglobin thay
®æi vµ chóng cã xu h−íng kÕt
C¸c d¹ng Hb
dÝnh víi nhau, lµm tÕ bµo hång
cÇu cã h×nh liÒm. C¬ së ph©n tö
dÉn ®Õn sù thay ®æi axit amin
trªn chuçi β lµ do ®ét biÕn thay
thÕ cÆp nucleotide A=T trªn alen
kiÓu d¹i (HbAβ) thµnh T=A trªn
alen ®ét biÕn (HbSβ). Sù thay thÕ
nucleotide nh− vËy ban ®Çu
®−îc dù ®o¸n tõ tr×nh tù axit
amin, sau nµy ®−îc kh¼ng ®Þnh
b»ng gi¶i tr×nh tù c¸c gen (alen)
HbAβ vµ HbSβ.
§Õn nay, ®· cã trªn 100
d¹ng ®ét biÕn kh¸c nhau liªn H×nh 6.4. Mét sè d¹ng thay thÕ axit amin trong chuçi β-globin ë
ng−êi. TÊt c¶ c¸c tr−êng hîp nªu trªn h×nh ®Òu do ®ét biÕn thay thÕ
quan ®Õn chuçi β ®−îc ph¸t hiÖn ®¬n nucleotide ë gen HbAβ. §iÒu ®¸ng chó ý lµ nhiÒu d¹ng thay thÕ
(mét sè vÝ dô ®−îc nªu trªn axit amin ë ®©y lµm thay ®æi tæng ®iÖn tÝch cña chuçi, mÆc dï chØ cã
h×nh 6.4). PhÇn lín chóng lµ c¸c 5 trong sè 20 axit amin phæ biÕn tÝch ®iÖn ë pH trung tÝnh. C¸c ®ét
biÕn thay thÕ axit amin lµm thay ®æi tæng ®iÖn tÝch dÔ dÉn ®Õn sù
®ét biÕn dÉn ®Õn thay thÕ mét thay ®æi cÊu h×nh kh«ng gian cña protein h¬n so víi nh÷ng d¹ng thay
axit amin. Ngoµi ra, ë ng−êi, cßn thÕ kh¸c. Nãi c¸ch kh¸c, nh÷ng thay thÕ axit amin lµm thay ®æi tæng
®iÖn tÝch cña protein dÔ lµm thay ®æi chøc n¨ng cña nã.
cã nhiÒu ®ét biÕn kh¸c liªn quan
®Õn chuçi α.

6.3.3. PhÇn lín ®ét biÕn ë ng−êi ng¨n c¶n c¸c con ®−êng trao ®æi chÊt
H×nh 6.3 cho chóng ta thÊy, c¸c ®ét biÕn gen m· hãa enzym th−êng ng¨n c¶n c¸c
con ®−êng trao ®æi chÊt. Nh÷ng ®ét biÕn nh− vËy x¶y ra ë mäi loµi sinh vËt.
Chóng ta sÏ xem c¸c ®ét biÕn liªn quan ®Õn c¸c gen m· hãa enzym tham gia vµo
c¸c con ®−êng chuyÓn hãa phenylalanine (Phe) vµ tyrosine (Tyr) g©y ra hiÖu øng kiÓu
h×nh nh− thÕ nµo. ë ng−êi, Phe vµ Tyr lµ c¸c axit amin kh«ng thay thÕ. Nh−ng, kh¸c víi
vi khuÈn, c¬ thÓ ng−êi kh«ng tù tæng hîp ®−îc hai axit amin nµy, mµ ®−îc cung cÊp tõ
thøc ¨n.
BÖnh di truyÒn phæ biÕn nhÊt liªn quan ®Õn chuyÓn hãa Phe vµ Tyr lµ phenyl
keto niÖu. Ng−êi m¾c bÖnh nµy kh«ng cã enzym phenylalanine hydroxylase lµm nhiÖm
vô chuyÓn hãa Phe → Tyr. BÖnh nµy g©y ra do ®ét biÕn lÆn n»m trªn NST th−êng. TriÖu
chøng cña bÖnh lµ thiÓu n¨ng trÝ tuÖ nÕu ng−êi bÖnh kh«ng cã chÕ ®é dinh d−ìng (gi¶m
Phe) hîp lý. Tuy nhiªn, ngoµi phenyl keto niÖu, bÖnh di truyÒn liªn quan ®Õn chuyÓn hãa
Phe vµ Tyr ®Çu tiªn ®−îc ph¸t hiÖn l¹i lµ alkapto niÖu. Nguyªn nh©n g©y bÖnh còng do
mét ®ét biÕn lÆn n»m trªn NST th−êng, m· hãa enzym homogentisic acid oxidase.
Ngoµi c¸c bÖnh di truyÒn liªn quan ®Õn con ®−êng chuyÓn hãa Phe-Tyr nªu trªn,
cßn cã hai bÖnh di truyÒn kh¸c do ®ét biÕn lÆn trªn NST th−êng ë c¸c gen m· hãa enzym
tham gia vµo qu¸ tr×nh dÞ hãa Tyr, ®ã lµ bÖnh c−êng tyrosine (tyrosinosis) vµ tyrosine

185
§inh §oµn Long

huyÕt (tyrosinemia). TriÖu chøng cña hai bÖnh nµy lµ do sù thiÕu hôt t−¬ng øng c¸c
enzym tyrosine transaminase vµ p-hydroxyphenylpyruvic acid oxidase (h×nh 6.5). BÖnh
c−êng tyrosine rÊt hiÕm gÆp vµ ch−a ®−îc nghiªn cøu chi tiÕt. Ng−êi m¾c bÖnh nµy cã
hµm l−îng tyrosine tÝch lòy trong m¸u vµ n−íc tiÓu cao, ®ång thêi cã mét sè dÞ tËt bÈm
sinh kh¸c. Ng−êi m¾c bÖnh tyrosine huyÕt cã hµm l−îng cña c¶ tyrosine vµ axit
p-hydroxyphenylpyruvic trong m¸u vµ n−íc tiÓu cao. PhÇn lín trÎ s¬ sinh m¾c chøng
tyrosine huyÕt chÕt trong 6 th¸ng ®Çu sau khi sinh do bÞ háng gan.
BÖnh b¹ch t¹ng còng lµ bÖnh di truyÒn cã thÓ liªn quan ®Õn chuyÓn hãa tyrosine,
do thiÕu enzym chuyÓn hãa tyrosine thµnh melanine (s¾c tè mµu ®en). Mét d¹ng b¹ch
t¹ng lµ do thiÕu tyrosinase. Enzym nµy xóc t¸c ph¶n øng ®Çu tiªn trong con ®−êng tæng
hîp melanine tõ tyrosine. C¸c d¹ng b¹ch t¹ng kh¸c lµ do sù ng¨n c¶n c¸c b−íc cña con
®−êng chuyÓn hãa tyrosine → melanine. Nh×n chung, c¸c d¹ng b¹ch t¹ng kh¸c nhau ®Òu
do alen lÆn trªn NST th−êng g©y nªn. V× vËy, c¸c thÓ dÞ hîp tö th−êng cã kiÓu h×nh b×nh
th−êng. Víi c¬ chÕ trªn, ta cã thÓ thÊy, trong tr−êng hîp kÕt h«n gi÷a hai ng−êi bÞ b¹ch
t¹ng bëi ®ét biÕn ë c¸c gen kh¸c nhau, th× tÊt c¶ c¸c con cña hä vÉn cã thÓ b×nh th−êng.
Nh− vËy, c¸c nghiªn cøu liªn quan ®Õn sù trao ®æi Phe-Tyr ®· cho chóng ta thÊy cã Ýt
nhÊt n¨m bÖnh di truyÒn kh¸c nhau. ë ng−êi, cßn nhiÒu vÝ dô kh¸c n÷a cho thÊy c¬ chÕ di
truyÒn kiÓm so¸t c¸c con ®−êng trao ®æi chÊt trong c¬ thÓ t−¬ng tù nh− víi Phe-Tyr.

Protein
(tæng hîp hoÆc tõ thøc ¨n) Thyroxine

Phenylalanine
hydroxylase Tyrosinase
Phenylalanine Tyrosine DOPA
PKU B¹ch t¹ng (3,4-Dihydroxy
C−êng (kiÓu ©m tÝnh víi phenylalanine)
tyrosine Tyrosine tyrosinase)
Axit B¹ch t¹ng
transaminase
Phenylpyruvic (kiÓu d−¬ng tÝnh
víi tyrosinase)
p-Hydroxyphenyl
(®éc víi hÖ thÇn
pyruvate
kinh trung −¬ng)
Tyrosine p-Hydroxyphenyl
huyÕt pyruvate oxidase Melanine
(S¾c tè lµm tãc mµu
®en vµ da sÉm mµu)
2,5-Dihydroxyphenyl pyruvate
(axit homogentisic)

Axit homogentisic
AKU
oxidase

Axit maleylacetoacetic

CO2 + H2O
H×nh 6.5. Nh÷ng bÖnh di truyÒn ë ng−êi liªn quan ®Õn chuyÓn hãa phenylalanine-tyrosine. C¸c bÖnh
nµy bao gåm: phenyl keto niÖu, c−êng tyrosine, tyrosine huyÕt, alkapt« niÖu vµ b¹ch t¹ng. C¶ 5 bÖnh nµy ®Òu
do c¸c ®ét biÕn lÆn n»m trªn NST th−êng g©y nªn. C¸c alen ®ét biÕn sinh ra c¸c enzym mÊt ho¹t tÝnh vµ ng¨n
c¶n qu¸ tr×nh chuyÓn hãa phenylalanine – tyrosine b×nh th−êng t¹i c¸c b−íc ®−îc chØ trªn h×nh.

186
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

6.3.4. §ét biÕn g©y chÕt cã ®iÒu kiÖn lµ c«ng cô nghiªn cøu di truyÒn häc
Trong tÊt c¶ c¸c lo¹i ®ét biÕn, kÓ c¶ c¸c ®ét biÕn trung tÝnh vµ g©y chÕt, c¸c ®ét
biÕn g©y chÕt cã ®iÒu kiÖn cã ý nghÜa nhÊt trong c¸c nghiªn cøu di truyÒn häc. ThÓ
mang ®ét biÕn g©y chÕt cã ®iÒu kiÖn cã ®Æc ®iÓm: 1) chÕt trong mét m«i tr−êng, gäi lµ
®iÒu kiÖn giíi h¹n; vµ 2) sèng ®−îc trong mét m«i tr−êng kh¸c, gäi lµ ®iÒu kiÖn chän
läc. C¸c ®ét biÕn g©y chÕt cã ®iÒu kiÖn ®−îc sö dông ®Ó x¸c ®Þnh nh÷ng gen thiÕt yÕu
qua viÖc mÊt hoµn toµn ho¹t tÝnh cña s¶n phÈm do gen m· hãa trong c¸c c¬ thÓ ®¬n béi.
C¸c thÓ ®ét biÕn cã thÓ ®−îc nh©n lªn trong ®iÒu kiÖn chän läc vµ cung cÊp th«ng tin vÒ
chøc n¨ng s¶n phÈm gen bÞ thiÕu hôt khi chóng ®−îc nu«i trong ®iÒu kiÖn giíi h¹n. §Õn
nay, nhiÒu ®ét biÕn g©y chÕt cã ®iÒu kiÖn ®· ®−îc dïng trong viÖc lµm s¸ng tá chøc n¨ng
cña c¸c gen trong c¸c qu¸ tr×nh sinh häc ë c¸c ®èi t−îng sinh vËt.
Cã ba lo¹i thÓ ®ét biÕn cã ®iÒu kiÖn c¬ b¶n lµ: 1) c¸c ®ét biÕn dinh d−ìng thô ®éng
(khuyÕt d−ìng), 2) c¸c ®ét biÕn mÉn c¶m nhiÖt ®é, vµ 3) c¸c ®ét biÕn mÉn c¶m chÊt g©y
®éc. C¸c thÓ ®ét biÕn dinh d−ìng thô ®éng thiÕu kh¶ n¨ng sinh tæng hîp mét hîp
chÊt thiÕt yÕu (nh− axit amin, purine, pyrimidine, vitamin, ...) vèn ®−îc tæng hîp b×nh
th−êng ë c¬ thÓ kiÓu d¹i, hoÆc ë d¹ng dinh d−ìng chñ ®éng trong cïng loµi. Do vËy, trong
m«i tr−êng kh«ng cã chÊt chÊt dinh d−ìng nµy, thÓ ®ét biÕn dinh d−ìng thô ®éng kh«ng
sèng ®−îc. Nh−ng, trong m«i tr−êng ®−îc bæ sung chÊt dinh d−ìng thiÕu hôt, thÓ ®ét
biÕn cã thÓ ph¸t triÓn vµ sinh s¶n b×nh th−êng. C¸c thÓ ®ét biÕn mÉn c¶m nhiÖt ®é
chØ sèng trong mét vïng nhiÖt ®é nhÊt ®Þnh, nh−ng chÕt trong mét vïng nhiÖt ®é kh¸c.
PhÇn lín c¸c thÓ ®ét biÕn thuéc nhãm nµy lµ mÉn c¶m víi nhiÖt ®é cao, nh−ng cã mét
sè ®ét biÕn mÉn c¶m víi nhiÖt ®é thÊp. Së dÜ kh¶ n¨ng sèng cña c¸c thÓ ®ét biÕn phô
thuéc nhiÖt ®é lµ do mét (hoÆc mét sè) enzym cña chóng ë tr¹ng th¸i ho¹t ®éng ë vïng
nhiÖt ®é nµy, nh−ng mÊt (hoÆc gi¶m) ho¹t tÝnh ë mét vïng nhiÖt ®é kh¸c. Ngoµi ra, cã
tr−êng hîp lµ do gen m· hãa mét sè enzym hoÆc protein thiÕt yÕu chØ biÓu hiÖn ë vïng
nhiÖt ®é nµy, mµ kh«ng biÓu hiÖn ë vïng nhiÖt ®é kh¸c. Nh−ng, mét khi ®· ®−îc biÓu
hiÖn, s¶n phÈm cña gen còng cã ho¹t tÝnh vµ æn ®Þnh nh− ë c¸ thÓ kiÓu d¹i. C¸c thÓ
®ét biÕn mÉn c¶m chÊt g©y ®éc lµ nh÷ng thÓ ®ét biÕn chÕt khi kh«ng cã protein øc
chÕ chÊt g©y ®éc, nh−ng sèng khi cã nh÷ng protein øc chÕ nµy. C¸c gen m· hãa protein
øc chÕ cã thÓ söa ch÷a nh÷ng sai háng trong kiÓu h×nh cña c¸c thÓ ®ét biÕn mÉn c¶m
víi chÊt g©y ®éc; hoÆc nã cã thÓ lµm biÕn ®æi s¶n phÈm cña gen ®ét biÕn vÒ d¹ng kh«ng
ho¹t ®éng. VËy, b»ng c¸ch nµo chóng ta cã thÓ sö dông c¸c ®ét biÕn g©y chÕt cã ®iÒu
kiÖn trong nghiªn cøu c¸c qu¸ tr×nh sinh häc. H·y b¾t ®Çu b»ng mét con ®−êng sinh
tæng hîp ®¬n gi¶n sau ®©y:
Gen A Gen B
↓ ↓
Enzym A Enzym B
TiÒn chÊt X ---------→ ChÊt trung gian Y ---------→ S¶n phÈm Z
ChÊt trung gian Y ®−îc t¹o ra tõ tiÒn chÊt X nhê ho¹t ®éng cña enzym A, nh−ng nã
®−îc chuyÓn hãa nhanh chãng thµnh s¶n phÈm Z do ho¹t ®éng cña enzym B. V× vËy,
trong tÕ bµo, chÊt trung gian Y chØ tån t¹i ë l−îng “vÕt” vµ rÊt khã ph©n lËp ®Ó ph©n tÝch.
Tuy vËy, ë ®ét biÕn gen B, nÕu enzym B mÊt hoÆc gi¶m ho¹t tÝnh, chÊt trung gian Y sÏ
®−îc tÝch lòy ë l−îng cao, nªn dÔ ph©n lËp vµ nghiªn cøu. T−¬ng tù nh− vËy, nÕu gen A
®ét biÕn, tiÒn chÊt X cã thÓ ®−îc tÝch lòy. Nhê vËy, qua nh÷ng ®ét biÕn nµy, ta cã thÓ x¸c
®Þnh ®−îc c¸c b−íc cña mét con ®−êng trao ®æi chÊt.
Sù ph¸t sinh h×nh th¸i vµ ph¸t triÓn cña sinh vËt mét phÇn lµ do biÓu hiÖn theo
thø tù nhÊt ®Þnh cña c¸c gen trong hÖ gen. KÕt qu¶ cña qu¸ tr×nh ®ã lµ c¸c protein lÇn
l−ît ®−îc bæ sung vµo cÊu tróc cña c¸c ®¹i ph©n tö sinh häc, lµm thay ®æi cÊu h×nh vµ

187
§inh §oµn Long

biÓu hiÖn chøc n¨ng cña chóng. Nhê sù ph©n lËp c¸c thÓ ®ét biÕn vÒ c¸c gen m· hãa c¸c
protein, chóng ta cã thÓ x¸c ®Þnh ®−îc thø tù c¸c b−íc biÓu hiÖn cña gen trong hÖ gen vµ
ph©n t¸ch c¸c qu¸ tr×nh ®ã thµnh c¸c b−íc ph¶n øng ®éc lËp.
Trªn c¬ së ph©n lËp c¸c d¹ng ®ét biÕn, Robert Edgar vµ céng sù ®· x©y dùng hoµn
chØnh c¸c b−íc cña qu¸ tr×nh ph¸t sinh h×nh th¸i ë phag¬ T4. Qu¸ tr×nh nµy liªn quan
®Õn sù biÓu hiÖn cña tõ 50 ®Õn 200 gen ë hÖ gen T4. Mçi gen m· hãa cho mét protein cÊu
tróc, hoÆc mét enzym xóc t¸c mét ph¶n øng trong qu¸ tr×nh ph¸t sinh h×nh th¸i. B»ng
viÖc sö dông hai ph−¬ng ph¸p, gåm: 1) ph©n lËp c¸c thÓ ®ét biÕn mÉn c¶m nhiÖt ®é vµ
g©y chÕt cã ®iÒu kiÖn (kho¶ng 50 gen), vµ 2) sö dông kÝnh hiÓn vi ®iÖn tö vµ ph©n tÝch
hãa sinh ®Ó ph©n tÝch cÊu tróc c¸c protein ®−îc tÝch lòy ë mçi d¹ng ®ét biÕn (nu«i trong
®iÒu kiÖn giíi h¹n), c¸c t¸c gi¶ ®· t×m ra c¸c b−íc chi tiÕt cña qu¸ tr×nh ph¸t sinh h×nh
th¸i ë T4 nh− ®−îc minh häa trªn h×nh 6.6.

37, 38 36 35 34
Sîi ®u«i

20, 21,
22, 23, 16, 2, 4,
24, 31, 17, 50, 64, 13,
40, 66 49 65 14 (Tù ph¸t) 63
§Çu

5, 6, 7, 8, 10, 9, 54,
25, 26, 27, 28, 11, 48,
29, 51, 53 12 19 18 3, 15
§u«i

H×nh 6.6. S¬ ®å gi¶n l−îc minh häa qu¸ tr×nh ph¸t sinh h×nh th¸i cña thùc khuÈn thÓ T4. C¸c gen m·
hãa c¸c phÇn ®Çu, ®u«i vµ c¸c sîi ®u«i ®−îc biÓu hiÖn theo c¸c con ®−êng riªng; råi s¶n phÈm cña chóng
®−îc tæ hîp l¹i vµo giai ®o¹n cuèi cïng. C¸c chØ sè trªn h×nh biÓu diÔn gen cÇn ®−îc biÓu hiÖn t¹i mçi b−íc.
Mét sè b−íc cña qu¸ tr×nh ph¸t sinh h×nh th¸i ë virut nµy ®· biÕt nh−ng ®−îc gi¶n l−îc kh«ng vÏ trªn h×nh.

RÊt nhiÒu qu¸ tr×nh sinh häc kh¸c còng ®· ®−îc ph©n tÝch dùa trªn c¸c nghiªn cøu
®ét biÕn nh− vËy, bao gåm chuçi truyÒn ®iÖn tö trong quang hîp ë thùc vËt vµ c¸c qu¸
tr×nh cè ®Þnh nit¬ ë vi khuÈn. GÇn ®©y, c¸c thÓ ®ét biÕn nµy còng ®−îc sö dông trong
nhiÒu nghiªn cøu vÒ sù biÖt hãa vµ ph¸t sinh h×nh th¸i ë c¸c loµi ®éng vËt vµ thùc vËt
bËc cao. VÒ nguyªn t¾c, c¸c thÓ ®ét biÕn cã thÓ ®−îc dïng ®Ó x¸c ®Þnh c¸c b−íc cña mäi
qu¸ tr×nh sinh häc ®−îc ®iÒu khiÓn bëi c¸c c¬ chÕ di truyÒn v× mçi gen ®Òu cã thÓ ®ét biÕn
vÒ d¹ng mµ s¶n phÈm cña nã kh«ng biÓu hiÖn chøc n¨ng. §iÒu quan träng lµ viÖc x¸c
®Þnh vµ ph©n lËp ®−îc c¸c d¹ng ®ét biÕn liªn quan ®Õn c¸c tÝnh tr¹ng cÇn quan t©m.

6.4. C¬ së ph©n tö cña ®ét biÕn

6.4.1. §ét biÕn do lçi sao chÐp ADN


Nh− ®· nãi ë ch−¬ng 2, khi m« t¶ cÊu tróc chuçi xo¾n kÐp ADN, Watson vµ Crick
cho r»ng “nguyªn t¾c kÕt cÆp bæ trî cña c¸c baz¬ nit¬ chÝnh lµ nguyªn lý c¬ b¶n cña qu¸
tr×nh sao chÐp vËt chÊt di truyÒn”. §ång thêi, c¸c t¸c gi¶ ®· chØ ra mét c¬ chÕ gi¶i thÝch
sù xuÊt hiÖn ®ét biÕn tù ph¸t. Theo ®ã, Watson vµ Crick ®· nªu r»ng “cÊu tróc cña c¸c
baz¬ nit¬ trong ph©n tö ADN kh«ng ph¶i ë tr¹ng th¸i tÜnh”. C¸c nguyªn tö hydro cã thÓ
chuyÓn tõ mét vÞ trÝ nµy sang vÞ trÝ kh¸c trong purine hay pyrimidine, vÝ dô nh− tõ mét
nhãm amino sang mét nguyªn tö nit¬ vßng. Nh÷ng biÕn ®æi hãa häc nh− vËy ®−îc gäi lµ

188
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

sù hç biÕn hãa häc. MÆc dï


D¹ng phæ biÕn D¹ng hiÕm gÆp
hiÖn t−îng hç biÕn hãa häc
hiÕm khi x¶y ra, nh−ng thùc tÕ O OH
chóng cã vai trß quan träng C C
trong duy tr× cÊu tróc chÝnh x¸c HN  C CH3 N  C CH3
 
cña ADN, bëi v× mét sè d¹ng hç C CH C CH
biÕn hãa häc cã thÓ lµm thay O N O N
®æi kh¶ n¨ng kÕt cÆp gi÷a c¸c §−êng §−êng
D¹ng keto Thymine (T) D¹ng enol
baz¬ nit¬. C¸c cÊu tróc axit
nucleic ®−îc chóng ta m« t¶ ë NH2 NH
ch−¬ng 2 lµ c¸c d¹ng phæ biÕn, C C
bÒn v÷ng; mµ ë nh÷ng d¹ng N  CH HN  CH
 
nµy, adenine (A) lu«n kÕt cÆp C CH C CH
O N O N
vµ thymine (T), còng nh− §−êng §−êng
guanine (G) lu«n kÕt cÆp víi
D¹ng Amino Cytosine (C) D¹ng Imino
cytosine (C), vµ ng−îc l¹i. C¸c
NH2 NH
d¹ng bÒn v÷ng cña c¸c baz¬
nit¬, lµ keto (®èi víi G vµ T) vµ C N C N
N  C HN  C
amino (®èi víi A vµ C) rÊt  CH  CH
hiÕm khi bÞ hç biÕn t−¬ng øng HC C HC C
N N N N
thµnh d¹ng kÐm bÒn h¬n lµ §−êng §−êng
enol vµ imino (h×nh 6.7). Thêi D¹ng Amino ADENine (A) D¹ng Imino
gian tån t¹i ë d¹ng kÐm bÒn O OH
cña c¸c baz¬ nit¬ th−êng rÊt
C N C N
ng¾n. Tuy vËy, nÕu ®óng lóc HN  C N  C
 CH  CH
c¸c baz¬ nit¬ tån t¹i ë c¸c d¹ng C C C C
N N
hç biÕn hãa häc kÐm bÒn, mµ H2N N H2N N
§−êng §−êng
chóng ®−îc huy ®éng tham gia
vµo qu¸ tr×nh sao chÐp ADN vµ D¹ng keto Guanine (G) D¹ng enol
l¾p r¸p vµo m¹ch ADN ®ang H×nh 6.7. C¸c d¹ng hç biÕn cña bèn lo¹i nucleotide phæ biÕn. Sù
®−îc tæng hîp, th× ®ét biÕn chuyÓn vÞ nguyªn tö hydro (H) gi÷a vÞ trÝ sè 3 vµ 4 cña pyrimidine vµ
gi÷a sè 1 vµ 6 cña purine lµm thay ®æi kh¶ n¨ng kÕt cÆp cña chóng.
(thay thÕ nucleotide) sÏ x¶y ra.
Khi c¸c baz¬ nit¬ tån t¹i ë d¹ng hç biÕn hãa häc hiÕm gÆp (enol vµ imino), th× c¸c cÆp
baz¬ nit¬ ®−îc h×nh thµnh lµ A = C vµ G ≡ T (h×nh 6.8a). HËu qu¶ cña hiÖn t−îng nµy
lµ sau hai lÇn sao chÐp, sÏ x¶y ra sù thay thÕ cÆp nucleotide A = T thµnh G ≡ C, hoÆc G ≡
C thµnh A = T (h×nh 6.8b).
C¸c ®ét biÕn g©y ra bëi hiÖn t−îng hç biÕn hãa häc dÉn ®Õn sù thay thÕ cÆp purine -
pyrimindine nµy b»ng mét cÆp purine - pyrimidine kh¸c (vÝ dô A = T → G ≡ C) vµ ng−îc
l¹i. Nh÷ng ®ét biÕn thay thÕ nucleotide nh− vËy ®−îc gäi lµ ®ét biÕn ®ång ho¸n. Cßn
®ét biÕn thay thÕ c¸c baz¬ nit¬ tõ mét purine thµnh mét pyrimidine vµ ng−îc l¹i, th×
®−îc gäi lµ ®ét biÕn dÞ ho¸n. Cã 4 kiÓu ®ét biÕn ®ång ho¸n vµ 8 kiÓu ®ét biÕn dÞ ho¸n
kh¸c nhau (h×nh 6.8c). Mét d¹ng ®ét biÕn ®iÓm kh¸c lµ sù thªm vµo hoÆc mÊt ®i mét
hoÆc mét sè c¸c cÆp baz¬ nit¬. Khi sè cÆp baz¬ nit¬ ®−îc thªm vµo hoÆc mÊt ®i kh«ng
ph¶i béi sè cña ba vµ n»m trong khung ®äc cña gen, th× dÉn ®Õn ®ét biÕn dÞch khung.
Bëi v×, nh÷ng ®ét biÕn nµy lµm thay ®æi khung ®äc cña tÊt c¶ c¸c bé ba m· hãa cßn l¹i
trong gen n»m xu«i dßng kÓ tõ vÞ trÝ ®ét biÕn (h×nh 6.9).

189
§inh §oµn Long

C¶ ba d¹ng ®ét biÕn lµ ®ång ho¸n, dÞ ho¸n vµ lÖch khung ®Òu cã thÓ xuÊt hiÖn do
hËu qu¶ cña ®ét biÕn tù ph¸t. Tuy vËy, mét ®iÒu ®¸ng ng¹c nhiªn lµ phÇn lín c¸c ®ét
biÕn tù ph¸t ®· ®−îc nghiªn cøu ®Õn nay thuéc nhãm thªm hoÆc mÊt mét cÆp nucleotide
chø kh«ng ph¶i lµ c¸c ®ét biÕn thay thÕ nucleotide. HÇu nh− tÊt c¶ c¸c ®ét biÕn dÞch
khung trong thùc tÕ ®Òu dÉn ®Õn sù tæng hîp c¸c protein mÊt chøc n¨ng.

a) C¸c d¹ng kÕt cÆp hiÕm A = C vµ G ≡ T h×nh thµnh khi C vµ G ë c¸c d¹ng hç biÕn hiÕm lµ imino vµ enol
CH3
H H
C O
C N HC C H
HC C H H  O
 N N N
N N C H C
§−êng C H C N §−êng N C
N
N C O  CH
O  CH H C C
HC C N N N
Cytosine N N Thymine
§−êng
D¹ng hiÕm imino §−êng D¹ng phæ biÕn keto H
ADENine GuaNine
D¹ng phæ biÕn amino D¹ng hiÕm enol

D¹ng kÕt cÆp hiÕm A = C D¹ng kÕt cÆp hiÕm G ≡ T

b) Hç biÕn g©y ®ét biÕn thay thÕ nucleotide sau 2 lÇn sao chÐp c) 12 kiÓu thay thÕ nucleotide cã
thÓ x¶y ra trong ph©n tö ADN
ADN gèc T=A G≡C A=T C≡G T
Sao chÐp lÇn 1

T* ≡ G G* ≡ T A* = C C* = A A G
Sao chÐp lÇn 2

ADN ®ét biÕn C≡G A=T G≡C T=A C


Tr−êng hîp 1 Tr−êng hîp 2 Tr−êng hîp 3 Tr−êng hîp 4
H×nh 6.8. HiÖn t−îng hç biÕn hãa häc g©y ®ét biÕn thay thÕ nucleotide. a) HiÖn t−îng hç biÕn hãa häc g©y
nªn c¸c d¹ng kÕt cÆp hiÕm lµ A = C vµ G ≡ T (cã 4 tr−êng hîp t−¬ng øng víi 4 d¹ng hç biÕn hiÕm cña A, T, G vµ
C; ë ®©y chØ minh häa 2 tr−êng hîp cña G vµ C). b) HiÖn t−îng hç biÕn g©y ®ét biÕn thay thÕ nucleotide kiÓu
®ång ho¸n sau hai lÇn sao chÐp, nÕu nucleotide d¹ng hç biÕn hiÕm (kÝ hiÖu dÊu *) xuÊt hiÖn mét lÇn trong qu¸
tr×nh sao chÐp. c) 12 kiÓu thay thÕ nucleotide cã thÓ x¶y ra trong ph©n tö ADN, trong ®ã cã 4 kiÓu ®ét biÕn thay
thÕ ®ång ho¸n (kÝ hiÖu b»ng mòi tªn liÒn nÐt) vµ 8 kiÓu ®ét biÕn thay thÕ dÞ ho¸n (kÝ hiÖu b»ng mòi tªn ®øt nÐt).

Thªm cÆp G ≡ C

A T G A A A G G G C C C T T T ... A T G A A A C G G G C C C T T T ...
ADN
T A C T T T C C C G G G A A A ... T A C T T T G C C C G G G A A A ...

M¹ch m· hãa
A U G A A A G G G C C C U U U ... A U G A A A C G G G C C C U U ...
mARN

Codon Codon Codon Codon Codon Codon Codon Codon Codon Codon
1 2 3 4 5 1 2 3 4 5
Protein Met Lys Gly Pro Phe … Met Lys Arg Ala Leu …
H×nh 6.9. §ét biÕn dÞch khung. Sù thªm vµo hay mÊt ®i mét hoÆc hai cÆp baz¬ nit¬ lµm thay ®æi khung ®äc vµ
toµn bé c¸c bé ba (codon) m· hãa cßn l¹i n»m xu«i dßng gen kÓ tõ vÞ trÝ ®ét biÕn.

190
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

Mét c¬ chÕ ®ét biÕn tù a) ChiÒu tæng hîp ADN b) ChiÒu tæng hîp ADN
ph¸t kh¸c cã thÓ x¶y ra dÉn
®Õn sù thªm vµo hoÆc mÊt ®i
mét sè nucleotide liªn quan
®Õn sù sao chÐp ADN
tr−ît (cßn gäi lµ sù sao
chÐp lÖch môc tiªu, h×nh
6.10). HiÖn t−îng nµy
th−êng ®−îc cho lµ c¬ chÕ
dÉn ®Õn sù h×nh thµnh nhiÒu
locut mang c¸c tr×nh tù
nucleotide ng¾n lÆp l¹i liªn
tôc víi sè l−îng biÕn ®éng c)
STR (short tandem repeats)
vµ VNTR (variable number ChiÒu tæng hîp ADN
tandem repeats). Sù sao
chÐp lÖch môc tiªu lµ do sù
h×nh thµnh c¸c vßng ADN
m¹ch ®¬n th−êng h×nh
thµnh ë c¸c ®o¹n c¸c tr×nh tù
nucleotide ng¾n lÆp l¹i liªn
tôc. NÕu vßng nµy xuÊt ph¸t
tõ m¹ch khu«n, th× cã xu
h−íng lµm mÊt nucleotide
(lµm gi¶m sè tr×nh tù lÆp
l¹i); cßn nÕu xuÊt ph¸t tõ
m¹ch ®ang ®−îc tæng hîp th×
cã xu h−íng thªm nucleotide
(lµm t¨ng sè tr×nh tù lÆp l¹i). H×nh 6.10. Sao chÐp tr−ît (lÖch) môc tiªu cã thÓ lµ nguyªn nh©n dÉn
§o¹n tr×nh tù ng¾n lÆp l¹i ®Õn c¸c locut cã sè l−îng tr×nh tù lÆp l¹i biÕn ®éng (STR vµ VNTR).
liªn tiÕp ®−îc gäi lµ ®¬n vÞ a) NÕu baz¬ nit¬ bÞ sao chÐp tr−ît n»m trªn m¹ch ®ang tæng hîp míi, th×
lÆp l¹i. Chóng ta dÔ dµng dÉn ®Õn sù t¨ng sè l−îng cña ®¬n vÞ lÆp l¹i (ë vÝ dô nµy lµ [T]5 → [T]6).
b) NÕu baz¬ nit¬ bÞ sao chÐp tr−ît n»m trªn m¹ch lµm khu«n, th× dÉn ®Õn
nhËn thÊy nÕu ®¬n vÞ lÆp l¹i
sù gi¶m sè l−îng ®¬n vÞ lÆp l¹i (ë vÝ dô nµy lµ [GA]3 → [GA]4). c) Mét sè
kh«ng ph¶i lµ béi sè cña ba, tr×nh tù lÆp l¹i cã thÓ t¹o cÊu tróc cÆp tãc, dÉn ®Õn sè l−îng ®¬n vÞ lÆp l¹i
th× ®ét biÕn do sao chÐp lÖch thay ®æi nhiÒu sau mçi lÇn sao chÐp (ë vÝ dô nµy lµ [GTC]8 → [GTC]13).
môc tiªu cã xu h−íng g©y
nªn ®ét biÕn dÞch khung. Trong c¸c locut STR (cßn gäi lµ vi vÖ tinh, microsatellite, hay
SSR), ®¬n vÞ lÆp l¹i th−êng ng¾n, gåm tõ 2 ®Õn 6 bp, ch¼ng h¹n ®¬n vÞ lÆp l¹i 2 bp [GT]n
hay lÆp l¹i 3 bp [CAG]n (trong ®ã n lµ sè lÇn lÆp l¹i). Theo mét thèng kª gÇn ®©y, hÖ gen
ng−êi cã kho¶ng 128.000 locut lÆp 2 bp, 8740 locut lÆp l¹i 3 bp, 23.680 locut lÆp l¹i 4 bp,
4300 locut lÆp l¹i 5 bp vµ 230 locut lÆp l¹i 6 bp. Trong c¸c locut lÆp l¹i 6 bp bao gåm c¸c
locut t¹i c¸c vïng ®Çu mót NST. C¸c locut VNTR (cßn gäi lµ tiÓu vÖ tinh, minisatellites)
cã ®Æc ®iÓm còng gièng víi STR vÒ sù lÆp l¹i liªn tiÕp cña c¸c tr×nh tù ®¬n, nh−ng ®¬n vÞ
lÆp l¹i th−êng lín h¬n, gåm tõ 7 ®Õn vµi chôc bp. Trong hÖ gen ng−êi, sè locut VNTR Ýt
h¬n nhiÒu so víi STR.
MÆc dï cßn nhiÒu ®iÓm ch−a hoµn toµn s¸ng tá vÒ nguyªn nh©n, c¬ chÕ ph©n tö
vµ tÇn sè cña c¸c ®ét biÕn tù ph¸t nh−ng cã thÓ kÓ ®Õn 3 yÕu tè chÝnh lµ: 1) sù chÝnh
x¸c cña bé m¸y sao chÐp ADN, 2) hiÖu qu¶ cña c¸c c¬ chÕ söa ch÷a ADN, vµ 3) møc ®é
tiÕp xóc víi c¸c t¸c nh©n g©y ®ét biÕn trong m«i tr−êng. Thùc tÕ, nh÷ng trôc trÆc trong

191
§inh §oµn Long

c¸c qu¸ tr×nh sao chÐp ADN vµ söa ch÷a ADN (vèn lµ c¸c qu¸ tr×nh ®−îc ®iÒu khiÓn bëi
c¬ chÕ di truyÒn) trong nhiÒu tr−êng hîp ®· lµm t¨ng tÇn sè ®ét biÕn lªn ®¸ng kÓ.

6.4.2. §ét biÕn do c¸c t¸c nh©n hãa häc


ViÖc ph¸t hiÖn ra ngµy cµng nhiÒu c¸c hîp chÊt g©y ®ét biÕn ®· gióp chóng ta hiÓu
biÕt ngµy cµng ®Çy ®ñ h¬n vÒ c¸c c¬ chÕ ®ét biÕn ë møc ph©n tö. MÆc dï ngµy nay ®· cã
nhiÒu hîp chÊt ®−îc xÕp vµo danh môc c¸c hîp chÊt g©y ®ét biÕn, nh−ng ë ®©y chóng ta
chØ nªu ®¹i diÖn mét sè hîp chÊt cã hiÖu lùc g©y ®ét biÕn m¹nh vµ c¬ chÕ ®Æc tr−ng.
Cã lÏ, khÝ mï t¹t lµ hîp chÊt g©y ®ét biÕn ®Çu tiªn ®−îc biÕt. Nhµ khoa häc Anh
Auerbach vµ c¸c ®ång nghiÖp ®· ph¸t hiÖn ra hiÖu lùc ®ét biÕn cña khÝ nµy trong ThÕ
chiÕn thø hai. Nh−ng do lo sî khÝ nµy ®−îc dïng lµm vò khÝ, chÝnh phñ Anh ®· kh«ng
cho phÐp c¸c nhµ khoa häc c«ng bè vÒ ph¸t hiÖn nµy cho ®Õn khi ThÕ chiÕn kÕt thóc.
Ngµy nay chóng ta biÕt, khÝ mï t¹t thuéc mét nhãm lín hîp chÊt g©y ®ét biÕn cã tªn gäi
chung lµ c¸c hîp chÊt alkyl hãa (lµ c¸c chÊt cã kh¶ n¨ng chuyÓn c¸c nhãm -CH3 hoÆc
- C2H5 ... sang c¸c baz¬ nit¬ cña ADN).
C¸c t¸c nh©n ®ét biÕn hãa häc cã thÓ ph©n thµnh hai nhãm chÝnh: 1) nhãm c¸c hîp
chÊt t¸c ®éng ®Õn ADN ®ang sao chÐp hay kh«ng sao chÐp; nhãm nµy gåm c¸c hîp chÊt
alkyl hãa vµ axit nit¬, vµ 2) nhãm c¸c hîp chÊt chØ t¸c ®éng ®Õn c¸c ph©n tö ADN ®ang
sao chÐp, bao gåm c¸c hîp chÊt cã cÊu tróc ph©n tö gÇn gièng c¸c purine vµ pyrimidine
(gäi lµ c¸c hîp chÊt thÕ baz¬ nit¬). Ngoµi ra, nhãm thø hai còng gåm c¶ c¸c thuèc nhuém
acridine, cã thÓ xen vµo gi÷a ph©n tö ADN lµm ph¸t sinh sai sãt trong sao chÐp ADN.
Së dÜ c¸c hîp chÊt thÕ baz¬ nit¬ cã thÓ g©y ®ét biÕn lµ do chóng cã cÊu tróc
gièng c¸c baz¬ nit¬ nªn cã thÓ cµi vµo chuçi polynucleotide ®ang tæng hîp. Nh−ng, ®ång
thêi chóng còng ®ñ kh¸c c¸c baz¬ nit¬ ®Ó g©y nªn sù kÕt cÆp sai trong qu¸ tr×nh sao
chÐp. Cã hai hîp chÊt g©y ®ét biÕn ®iÓn h×nh ho¹t ®éng theo c¬ chÕ thÕ baz¬ nit¬ lµ 5-BU
(5-bromouracine) vµ 2-AP (2-aminopurine). 5-BU cã cÊu tróc gièng thymine (ë vÞ trÝ C5
cña 5-BU cã nhãm bromine gièng víi nhãm methyl ë vÞ trÝ nµy cña thymine). Nh−ng do
nhãm bromine hay thay ®æi sù ph©n bè ®iÖn tÝch, nªn dÔ x¶y ra hiÖn t−îng hç biÕn hãa
häc (h×nh 6.11). ë d¹ng bÒn v÷ng keto, 5-BU liªn kÕt víi adenine. Nh−ng khi bÞ hç biÕn
(vÒ d¹ng enol), 5-BU sÏ liªn kÕt víi guanine. Nh− vËy, hËu qu¶ cña ®ét biÕn do 5-BU g©y
ra gièng víi ®ét biÕn do hç biÕn hãa häc cña c¸c baz¬ nit¬ trong ®ét biÕn tù ph¸t (h×nh
6.8b). Nãi c¸ch kh¸c, ®ét biÕn do 5-BU g©y ra th−êng lµ ®ång ho¸n (A=T → G≡C). Tuy
nhiªn, nÕu d¹ng kÐm bÒn enol cña 5-BU l¹i xuÊt hiÖn ®óng vµo lóc m¹ch ADN ®ang tæng
hîp, th× 5-BU cã thÓ kÕt cÆp víi guanine, vµ dÉn ®Õn ®ét biÕn ng−îc (G≡C → A=T). §©y lµ
mét c¬ chÕ g©y ®ét biÕn phôc håi. Nh−ng, nhí r»ng d¹ng enol lµ kÐm bÒn nªn rÊt hiÕm
gÆp. V× vËy, tÇn sè ®ét biÕn ng−îc th−êng nhá h¬n ®ét biÕn thuËn. C¬ chÕ ho¹t ®éng cña
2-AP còng gièng nh− 5-BU, nh−ng nã thay thÕ c¸c purine A vµ G.
Axit nit¬ (HNO2) lµ mét chÊt g©y ®ét biÕn m¹nh t¸c ®éng lªn ph©n tö ADN bÊt kÓ
ph©n tö nµy ®ang sao chÐp hay kh«ng. §©y lµ mét hîp chÊt oxy hãa m¹nh, lµm lo¹i
nhãm amin (NH2-) ra khái c¸c baz¬ nit¬ A, G vµ C. Ph¶n øng nµy lµm d¹ng amino
chuyÓn thµnh d¹ng keto, vµ lµm thay ®æi kh¶ n¨ng t¹o liªn kÕt hydro cña c¸c baz¬ nit¬
(h×nh 6.11d). Adenine sau khi bÞ lo¹i nhãm amin th× chuyÓn thµnh hypoxanthine cã xu
h−íng liªn kÕt víi cytosine (chø kh«ng ph¶i víi thymine nh− b×nh th−êng). Cytosine th×
chuyÓn thµnh uracil (nghÜa lµ liªn kÕt víi A chø kh«ng ph¶i víi G). Guanine th× chuyÓn
thµnh xanthine; nh−ng xanthine th× vÉn liªn kÕt víi C, nªn sù lo¹i amin hãa cña guanine
kh«ng g©y ®ét biÕn. Do sù lo¹i amin hãa cña axit nit¬ ®èi víi A dÉn ®Õn ®ét biÕn ®ång
ho¸n A=T → G≡C, vµ ®èi víi C g©y nªn ®ét biÕn ®ång hãa ng−îc lµ G≡C → A=T. Nªn cã
thÓ kh¼ng ®Þnh, axit nit¬ cã thÓ g©y ®ét biÕn hai chiÒu A=T ↔ G≡C. KÕt qu¶ lµ, t¸c nh©n
®ét biÕn nµy cã thÓ g©y ®ét biÕn thuËn vµ ®ét biÕn ng−îc phôc håi trë l¹i alen kiÓu d¹i.

192
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

C¸c thuèc nhuém acridine, nh− proflavine (h×nh 6.11c) hay c¸c dÉn xuÊt
acridine kh¸c, lµ c¸c hîp chÊt g©y ®ét biÕn m¹nh theo kiÓu ®ét biÕn dÞch khung. C¸c
thuèc nhuém acridine cã tÝnh kiÒm lu«n cã xu h−íng t¹o liªn kÕt vµ xen vµo gi÷a c¸c
cÆp baz¬ nit¬ xÕp chång lªn nhau trªn chuçi ADN. Khi ph©n tö nµy xen vµo chuçi xo¾n
kÐp, nã lµm ph©n tö ADN trë nªn cøng nh¾c vµ lµm thay ®æi cÊu h×nh xo¾n kÐp th«ng
th−êng, thËm chÝ lµm vÆn xo¾n ph©n tö ADN. Khi ®o¹n ADN ®ang sao chÐp liªn kÕt víi
acridine, nã th−êng bÞ mÊt mét hoÆc mét sè baz¬ nit¬, dÉn ®Õn ®ét biÕn dÞch khung.
Nh− ®· ®Ò cËp ë trªn, c¸c ®ét biÕn do acridine g©y ra th−êng lµm mÊt chøc n¨ng gen
hoÆc s¶n phÈm cña gen.
C¸c chÊt alkyl hãa lµ c¸c chÊt cã thÓ chuyÓn nhãm alkyl cña chóng cho c¸c hîp
chÊt kh¸c. Chóng bao gåm khÝ mï t¹t vµ c¸c hîp chÊt methyl vµ ethyl methane sulfate
(MMS vµ EMS). C¸c hîp chÊt nµy cã nhiÒu hiÖu øng kh¸c nhau lªn ph©n tö ADN. C¸c
hîp chÊt alkyl hãa cã thÓ g©y nªn c¸c lo¹i ®ét biÕn kh¸c nhau, bao gåm ®ång ho¸n, dÞ
ho¸n, dÞch khung vµ thËm chÝ biÕn d¹ng NST, tïy thuéc vµo møc ho¹t ®éng cña mçi hîp
chÊt víi ADN. Mét c¬ chÕ g©y ®ét biÕn cña c¸c hîp chÊt alkyl hãa lµ chóng chuyÓn nhãm
ethyl hoÆc methyl tíi c¸c baz¬ nit¬ vµ lµm chóng kÕt cÆp sai. VÝ dô nh−, EMS ethyl hãa
c¸c baz¬ nit¬ ë c¸c vÞ trÝ 7-N vµ 6-O. Khi G → 7-ethylguanine, nã kÕt cÆp víi thymine vµ

a) C¸c hîp chÊt akyl hãa


Cl CH2 CH2 S CH2 CH2 Cl CH3 CH2 O SO2 CH3 CH3 CH2 O SO2 CH2 CH3
Di-(2-chloroethyl) sulfide Ethyl methane sulfonate Ethyl ethane sulfonate
(khÝ mï t¹t) (EMS) (EES)

b) C¸c hîp chÊt gièng baz¬ nit¬ c) Nhãm thuèc nhuém acridine
O H H H H
H C Br C N H C C C H
N C N C C C C C
C H
C C C C C C + C C +
O N H H2N N N H2N C N C NH3
H H H H H
5-Bromouracine 2 - Amino purine 2,8-Diamino acridine
(5-BU) (2-AP) (Proflavin)

d) C¸c hîp chÊt khö e) C¸c hîp chÊt f) Sù kÕt cÆp cña 5-BU víi A vµ G
nhãm amin hydroxyl hãa Br
N C O
HNO2 NH2OH C C H H
N
Axit nit¬ Hydroxylamine N N
§−êng C H C N
N C
O C H
H×nh 6.11. Mét sè nhãm hîp chÊt g©y ®ét biÕn C C
N
H N
m¹nh. a) C¸c hîp chÊt akyl hãa cã thÓ g©y nªn c¸c
®ét biÕn ®ång ho¸n, dÞ ho¸n, dÞch khung hoÆc biÕn (5-BU = A) §−êng
d¹ng NST. b) C¸c hîp chÊt thÕ baz¬ nit¬ cã xu Br
h−íng g©y nªn ®ét biÕn ®ång ho¸n. c) Nhãm hîp
N C O
chÊt kiÓu acridine cã xu h−íng g©y ®ét biÕn dÞch C C H
khung. d) C¸c hîp chÊt khö nhãm amin cã thÓ g©y O
N N
®ét biÕn ®ång ho¸n hai chiÒu. e) C¸c hîp chÊt §−êng C H C N
N C
hydroxyl hãa cã hiÖu øng g©y ®ét biÕn ®Æc hiÖu O C H
(xem thªm trong bµi). f) Kh¶ n¨ng kÕt cÆp ®ång thêi H C C
N
N N
cña 5-BU víi A vµ G lµ c¬ së cña c¸c ®ét biÕn ®ång
ho¸n th−êng g©y ra bëi hîp chÊt nµy. (5-BU ≡ G) H §−êng

193
§inh §oµn Long

g©y nªn ®ét biÕn ®ång ho¸n G≡C → A=T. Sù alkyl hãa c¸c baz¬ nit¬ kh¸c cã thÓ thóc ®Èy
mét sè c¬ chÕ söa ch÷a ADN cã xu h−íng sai (vÝ dô: c¬ chÕ SOS, ®−îc m« t¶ ë phÇn sau
ch−¬ng nµy), dÉn ®Õn c¸c ®ét biÕn ®ång ho¸n, dÞ ho¸n, hoÆc dÞch khung. Mét sè hîp chÊt
alkyl hãa, ®Æc biÖt lµ c¸c hîp chÊt cã hai nhãm alkyl ho¹t ®éng cã thÓ t¹o nªn sù v¾t chÐo
gi÷a hai m¹ch hoÆc gi÷a hai ph©n tö ADN, dÉn ®Õn sù ®øt g·y hoÆc mét sè biÕn d¹ng
kh¸c cña NST. Nh− vËy, so víi c¸c hîp chÊt thÕ baz¬ nit¬, axit nit¬ vµ c¸c thuèc nhuém
acridine, c¸c hîp chÊt alkyl hãa cã xu h−íng g©y hiÖu øng ®ét biÕn Ýt ®Æc hiÖu h¬n.
Kh¸c víi c¸c hîp chÊt acridine, c¸c hîp chÊt hydroxyl hãa (cho nhãm OH-), nh−
hydroxylamine NH2OH, l¹i cã hiÖu øng g©y ®ét biÕn ®Æc hiÖu. Nhãm hîp chÊt nµy g©y
nªn ®ét biÕn ®ång ho¸n G≡C → A=T. Khi ADN ®−îc xö lý víi NH2OH, cytosine bÞ chuyÓn
hãa thµnh hydroxylamincytosine. Hîp chÊt nµy kÕt cÆp víi adenin, dÉn ®Õn ®ét biÕn G≡C
→ A=T. Nhê g©y hiÖu øng ®ét biÕn ®Æc hiÖu, hydroxylamine cã mét øng dông ®Æc biÖt
quan träng trong viÖc x¸c ®Þnh ®−îc kiÓu ®ét biÕn ®ång ho¸n. Cô thÓ lµ, c¸c ®ét biÕn phôc
håi do xö lý víi axit nit¬ hay chÊt thÕ baz¬ nit¬ cã thÓ ®−îc ph©n biÖt thµnh hai nhãm
trªn c¬ së xö lý víi hydroxylamine. Nhãm thø nhÊt mang cÆp baz¬ nit¬ ®ét biÕn A=T
kh«ng ®¶o ng−îc ®−îc khi xö lý víi hydroxylamine, cßn nhãm thø hai mang cÆp baz¬ nit¬
®ét biÕn G≡C cã thÓ ®¶o ng−îc ®−îc nhê hydroxylamine. Nh− vËy, hydroxylamine cã thÓ
®−îc dïng ®Ó ph©n biÖt ®ét biÕn ®ång ho¸n lµ tõ A=T → G≡C hay tõ G≡C → A=T.
6.4.3. §ét biÕn do c¸c t¸c nh©n vËt lý
Vïng phæ ®iÖn tõ (h×nh Vïng ¸nh s¸ng nh×n thÊy
6.12) víi c¸c b−íc sãng ng¾n
h¬n vµ dµi h¬n ¸nh s¸ng nh×n

Xanh lam
Xanh lôc
thÊy ®−îc chia lµm hai vïng

380 nm
750nm

Vµng

bøc x¹ ion hãa (gåm tia X,


§á

tia gamma, c¸c tia vò trô


n¨ng l−îng cao) vµ bøc x¹
kh«ng ion hãa (tia cùc tÝm - B−íc Vi Hång Tia
UV Tia X Tia γ
sãng radio sãng ngo¹i vò trô
UV). C¸c tia bøc x¹ ion hãa
th−êng cã n¨ng l−îng cao vµ 103m 9
10 nm
6
10 nm
3
10 nm 1nm 10-3nm 10-5nm B−íc sãng
®−îc sö dông trong chÈn ®o¸n (1m)
Bøc x¹ ion hãa
y häc do chóng cã kh¶ n¨ng
ThÊp nhÊt Møc n¨ng l−îng Cao nhÊt
xuyªn s©u qua c¸c m«. Trong
qu¸ tr×nh truyÒn qua c¸c m«, H×nh 6.12. Phæ ®iÖn tõ. C¸c b−íc sãng ë møc n¨ng l−îng cao cã thÓ
tÕ bµo, c¸c tia x¹ va ch¹m vµo g©y ®ét biÕn gen vµ NST (nÕu liÒu chiÕu ®ñ lín trong thêi gian dµi).
c¸c h¹t nh©n vµ lµm gi¶i
phãng ®iÖn tö, t¹o nªn c¸c gèc tù do tÝch ®iÖn d−¬ng hoÆc c¸c ion. §Õn l−ît m×nh, c¸c ion
va ch¹m víi c¸c ph©n tö kh¸c vµ lµm gi¶i phãng c¸c ®iÖn tö kh¸c tiÕp theo. KÕt qu¶ lµ
mét “h×nh nãn” cña c¸c ion h×nh thµnh däc theo ®−êng ®i cña tia x¹ khi nã xuyªn qua c¸c
m«. Qu¸ tr×nh ion hãa nµy th−êng ®−îc thùc hiÖn bëi m¸y ph¸t tia X, tia pr«t«n, tia
n¬tr«n, còng nh− c¸c tia alpha, bªta vµ gama xuÊt ph¸t tõ c¸c ®ång vÞ phãng x¹ nh− 32P,
35
S vµ urani-38 ®−îc dïng trong c¸c lß ph¶n øng h¹t nh©n.
Tia cùc tÝm (UV) cã n¨ng l−îng thÊp h¬n c¸c bøc x¹ ion hãa, nªn nã chØ th©m nhËp
®−îc líp tÕ bµo bÒ mÆt vµ kh«ng t¹o nªn hiÖu øng ion hãa. Tia UV bÞ mÊt n¨ng l−îng cho
h¹t nh©n mµ nã tiÕp xóc, lµm cho ®iÖn tö ë quü ®¹o ngoµi cña h¹t nh©n t¨ng lªn vÒ møc
n¨ng l−îng, gäi lµ møc kÝch thÝch. C¸c ph©n tö mang c¸c nguyªn tö ion hãa hoÆc ë møc
kÝch thÝch cã tÝnh ph¶n øng hãa häc cao h¬n nhiÒu so víi d¹ng bÒn v÷ng th«ng th−êng

194
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

cña chóng. Kh¶ n¨ng ph¶n øng t¨ng lªn cña c¸c nguyªn tö trong ph©n tö ADN lµ nguyªn
nh©n cña phÇn lín c¸c ®ét biÕn g©y ra bëi c¸c bøc x¹ ion hãa vµ tia UV.
Tia X vµ c¸c bøc x¹ ion hãa th−êng ®−îc ®o b»ng ®¬n vÞ r¬ntghen (r), tÝnh b»ng sè
nguyªn tö ion hãa trªn mét ®¬n vÞ thÓ tÝch trong ®iÒu kiÖn tiªu chuÈn. Thùc tÕ, mét
r¬ntghen ®−îc tÝnh b»ng l−îng chiÕu x¹ ion hãa t¹o ra 2,083 x 109 cÆp ion trªn 1cm3 khÝ ë
0oC vµ ¸p suÊt lµ 760 mmHg. CÇn chó ý lµ, liÒu chiÕu x¹ cã sù tÝch lòy theo thêi gian.
NghÜa lµ, liÒu chiÕu x¹ thÊp qua thêi gian dµi cã thÓ t−¬ng ®−¬ng víi liÒu cao trong thêi
gian ng¾n. §iÒu nµy rÊt quan träng, bëi phÇn lín c¸c nghiªn cøu cho thÊy tÇn sè ®ét biÕn
®iÓm xuÊt hiÖn tØ lÖ thuËn víi liÒu chiÕu x¹. Ch¼ng h¹n nh−, tØ lÖ ®ét biÕn ®iÓm g©y chÕt
ë tinh trïng ruåi dÊm t¨ng tuyÕn tÝnh tõ 0 ®Õn 15% khi liÒu chiÕu tia X t¨ng tõ 0 ®Õn
5000 r (tøc lµ, liÒu chiÕu cø t¨ng 1000 r, tÇn sè ®ét biÕn t¨ng 3%). Mèi quan hÖ tuyÕn
tÝnh nµy cho thÊy, hiÖu øng g©y ®ét biÕn cña tia X cã ®éng häc riªng lÎ. NghÜa lµ, mçi ®ét
biÕn lµ kÕt qu¶ cña mét sù kiÖn ion hãa ®éc lËp. Nãi c¸ch kh¸c, trong ®iÒu kiÖn tiªu
chuÈn, mçi ph¶n øng ion hãa bëi chiÕu x¹ n¨ng l−îng cao cã x¸c suÊt g©y ®ét biÕn ®iÓm
gièng nhau.
VËy, c−êng ®é chiÕu x¹ lµ bao nhiªu th× an toµn? ViÖc ph¸t triÓn vµ sö dông bom
h¹t nh©n, còng nh− sù cè ë c¸c nhµ m¸y ®iÖn nguyªn tö ®· g©y nªn mèi hoµi nghi vÒ
nguy c¬ ph¬i nhiÔm phãng x¹. Mèi quan hÖ tuyÕn tÝnh gi÷a tÇn sè ®ét biÕn vµ liÒu chiÕu
x¹ cho thÊy, kh«ng cã møc chiÕu x¹ nµo lµ an toµn. LiÒu chiÕu x¹ cµng cao, th× tÇn sè ®ét
biÕn cµng cao vµ ng−îc l¹i. ThËm chÝ ngay víi mét c−êng ®é chiÕu x¹ thÊp, th× dï tÇn sè
®ét biÕn cã thÓ thÊp, nh−ng x¸c suÊt ®Ó mét ®ét biÕn cã thÓ x¶y ra lµ hiÖn h÷u.
Khi thö nghiÖm chiÕu x¹ tinh trïng cña ruåi giÊm, c¸c nhµ nghiªn cøu thÊy r»ng
liÒu chiÕu dµi víi c−êng ®é thÊp cã hiÖu qu¶ ®ét biÕn gièng víi liÒu chiÕu ng¾n víi
c−êng ®é cao. Tuy vËy, ë chuét, liÒu chiÕu dµi c−êng ®é thÊp g©y Ýt ®ét biÕn h¬n ®«i chót
liÒu chiÕu ng¾n ë c−êng ®é cao (víi tæng liÒu chiÕu nh− nhau). Ngoµi ra, trªn chuét thÝ
nghiÖm, víi tæng liÒu chiÕu nh− nhau, sù chiÕu x¹ gi¸n ®o¹n lµm gi¶m nhÑ tÇn sè ®ét
biÕn so víi chiÕu x¹ liªn tôc. Sù kh¸c biÖt nµy trong hiÖu øng g©y ®ét biÕn cña chiÕu x¹
ion hãa gi÷a ®éng vËt cã vó vµ ruåi giÊm ®−îc gi¶i thÝch bëi hiÖu qu¶ cña c¸c c¬ chÕ söa
ch÷a ADN sai háng kh¸c nhau ë c¸c ®èi t−îng sinh vËt nµy. Mét sè c¬ chÕ söa ch÷a
ADN cã thÓ xuÊt hiÖn ë c¸c tÕ bµo sinh tinh vµ sinh trøng ë ®éng vËt cã vó, nh−ng
kh«ng ho¹t ®éng ë tinh trïng ruåi giÊm. Tuy vËy, ph¶i kh¼ng ®Þnh lµ tÊt c¶ c¸c xö lý
chiÕu x¹ ®Òu cã kh¶ n¨ng g©y ®ét biÕn, dï møc ®é cã thÓ kh¸c nhau, ë ruåi giÊm còng
nh− ë ®éng vËt cã vó.
C¸c chiÕu x¹ ion hãa còng cã thÓ g©y nªn nh÷ng biÕn ®æi lín trong cÊu tróc NST,
nh− mÊt ®o¹n, ®¶o ®o¹n, lÆp ®o¹n vµ chuyÓn ®o¹n. Nh÷ng sai háng NST nµy th−êng lµ
kÕt qu¶ cña c¸c sù kiÖn ®øt g·y NST, g©y ra bëi ®éng häc cña nhiÒu sù va ch¹m khi tia
x¹ truyÒn qua (kh¸c víi ®ét biÕn ®iÓm d−êng nh− chñ yÕu g©y ra bëi nh÷ng va ch¹m
®¬n lÎ).
Tia UV kh«ng ®ñ møc n¨ng l−îng ®Ó g©y nªn hiÖn t−îng ion hãa. Nh−ng nã l¹i
®−îc hÊp thô bëi nhiÒu ph©n tö h÷u c¬, trong ®ã cã c¸c purine vµ pyrimidine cña ADN,
vµ nguyªn tö cña nh÷ng ph©n tö nµy sau ®ã chuyÓn sang tr¹ng th¸i kÝch thÝch. Do kh¶
n¨ng xuyªn thÊu kÐm, tia UV chñ yÕu t¸c ®éng lªn líp tÕ bµo bÒ mÆt cña sinh vËt ®a bµo.
Nh−ng, ®èi víi sinh vËt ®¬n bµo, nã lµ mét t¸c nh©n g©y ®ét biÕn hiÖu qu¶. B−íc sãng
hÊp thô tia UV tèi ®a cña ADN lµ 254 nm; vµ ®©y còng lµ b−íc sãng g©y tÇn sè ®ét biÕn
cao nhÊt. §iÒu nµy cho thÊy ®ét biÕn cã liªn quan trùc tiÕp ®Õn sù hÊp thô tia UV cña c¸c
purine vµ pyrimidine. Trong ®ã, ®Æc biÖt lµ c¸c pyrimidine sau khi hÊp thô tia UV ë b−íc
sãng 254nm, chóng trë nªn cã kh¶ n¨ng ph¶n øng m¹nh. HiÖu øng næi bËt cña chiÕu x¹
tia UV ®èi víi c¸c pyrimidine (C vµ T) lµ sù h×nh thµnh c¸c pyrimidine hydrate (g¾n
thªm gèc OH-) vµ h×nh thµnh phøc kÐp pyrimidine (h×nh 6.13). C¸c phøc kÐp thymine

195
§inh §oµn Long

(T :: T) cã thÓ g©y ®ét biÕn theo hai c¸ch: 1) lµm biÕn d¹ng cÊu tróc ADN, dÉn ®Õn sao
chÐp sai; vµ 2) kÝch ho¹t hÖ thèng söa ch÷a ADN theo c¬ chÕ SOS dÔ ph¸t sinh ®ét biÕn
(xem phÇn “C¸c c¬ chÕ söa ch÷a ADN” d−íi ®©y).
a) O O O O
CH3 CH3
H C CH3 H C CH3 H C C H
N C N C UV N C C N
+
C C C C C C C C
O N H O N H O N N O
H H
H H H H
Thymine (T) Thymine (T) Phøc kÐp Thymine (T :: T)

b) NH2 NH2
H×nh 6.13. Tia UV g©y biÕn ®æi cÊu tróc
C H C H
pyrimidine. a) Liªn kÕt céng hãa trÞ h×nh UV + H2O
N C N C OH
thµnh gi÷a hai tiÓu phÇn thymine ®øng
c¹nh nhau trªn ph©n tö ADN t¹o nªn phøc
C C C C H
O N H O N H
kÐp thymine. b) Sù hydrate hãa cytosine
H H
t¹o thµnh cytosine hydrate, lµ nguyªn
Cytosine Cytosine hydrate
nh©n g©y kÕt cÆp sai trong sao chÐp ADN.

6.4.4. §ét biÕn do c¸c yÕu tè di truyÒn vËn ®éng (gen nh¶y)
C¸c c¬ thÓ sèng nãi chung chøa mét l−îng ADN cã thÓ vËn ®éng tõ vÞ trÝ nµy sang
vÞ trÝ kh¸c trong hÖ gen. Nh÷ng yÕu tè nµy ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng
(transposable genetic elements, viÕt t¾t lµ TGE hoÆc TE), hay gäi t¾t lµ gen nh¶y
(transposon). ViÖc cµi mét TE vµo gen th−êng lµm mÊt chøc n¨ng cña gen. NÕu gen m·
hãa cho mét protein quan träng, kiÓu h×nh ®ét biÕn dÔ xuÊt hiÖn. §Õn nay ®· cã nhiÒu
®ét biÕn do ho¹t ®éng cña TE ®−îc t×m thÊy ë ng«, ruåi giÊm, E. coli vµ c¸c loµi sinh vËt
kh¸c. Trong thùc tÕ, alen quy ®Þnh tÝnh tr¹ng h¹t nh¨n ë ®Ëu Hµ lan trong thÝ nghiÖm
cña Menden vµ ®ét biÕn mµu m¾t tr¾ng ë ruåi giÊm ®−îc ph¸t hiÖn lÇn ®Çu tiªn ®Òu lµ
c¸c ®ét biÕn do ho¹t ®éng cña gen nh¶y. C¬ chÕ ho¹t ®éng cña c¸c yÕu tè di truyÒn vËn
®éng vµ hiÖu øng g©y ®ét biÕn cña chóng ®−îc m« t¶ ë phÇn cuèi ch−¬ng nµy.

6.4.5. Sù lÆp l¹i c¸c bé ba nucleotide vµ c¸c bÖnh di truyÒn ë ng−êi


TÊt c¶ c¸c lo¹i ®ét biÕn ®−îc m« t¶ ë c¸c phÇn trªn cña ch−¬ng nµy ®Òu xuÊt hiÖn ë
ng−êi. Ngoµi ra, cã mét lo¹i ®ét biÕn g¾n liÒn víi nhiÒu bÖnh di truyÒn ë ng−êi, ®ã lµ c¸c
tr×nh tù lÆp l¹i víi mçi ®¬n vÞ lÆp l¹i gåm tõ 1 ®Õn 6 nucleotide ®−îc gäi lµ c¸c tr×nh tù
®¬n gi¶n lÆp l¹i liªn tiÕp (simple tandem repeats). Nh÷ng tr×nh tù lÆp l¹i kiÓu nh−
vËy ®−îc t×m thÊy ph©n bè kh¾p hÖ gen. C¸c tr×nh tù lÆp l¹i víi ®¬n vÞ lÆp l¹i gåm 3
nucleotide (gäi t¾t lµ c¸c tr×nh tù 3 nucleotide lÆp l¹i liªn tiÕp) ®−îc t×m thÊy cã liªn
quan ®Õn mét sè bÖnh di truyÒn ë ng−êi. Ch¼ng h¹n sè l−îng ®¬n vÞ lÆp l¹i cña tr×nh tù
[CGG] t¨ng lªn t¹i vÞ trÝ FRAXA thuéc NST X liªn quan ®Õn Héi chøng NST X dÔ g·y
(fragile X syndrome), lµ bÖnh thiÓu n¨ng trÝ tuÖ di truyÒn phæ biÕn nhÊt ë ng−êi. NST X
b×nh th−êng cã tõ 6 ®Õn 50 b¶n sao liªn tiÕp cña tr×nh tù [CGG], nh−ng NST ®ét biÕn
chøa tíi 1.000 b¶n sao liªn tiÕp cña ®¬n vÞ lÆp l¹i gåm 3 nucleotide nµy.
C¸c ®o¹n tr×nh tù lÆp l¹i cña [CAG] vµ [CTG] liªn quan ®Õn mét sè bÖnh thÇn kinh
di truyÒn ë ng−êi, bao gåm bÖnh móa giËt Huntingt¬n, bÖnh lo¹n d−ìng c¬, bÖnh
Kennedy, bÖnh teo c¬ delta vµng da, bÖnh mÊt ®iÒu hßa tiÓu n·o ®Ønh. ë tÊt c¶ nh÷ng
bÖnh nµy, møc ®é nghiªm träng cña bÖnh cã liªn quan trùc tiÕp ®Õn sè ®ét biÕn lÆp l¹i

196
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

cña c¸c tr×nh tù. Khi sè b¶n sao cña tr×nh tù ba nucleotide cµng cao, møc ®é nghiªm
träng cña bÖnh cµng t¨ng. Ngoµi ra sè lÇn lÆp l¹i cña c¸c tr×nh tù nucleotide liªn quan
®Õn c¸c bÖnh nµy cã thÓ kh«ng æn ®Þnh gi÷a c¸c tÕ bµo soma kh¸c nhau vµ gi÷a c¸c thÕ
hÖ. C¬ chÕ lµm t¨ng sè l−îng c¸c bé ba nucleotide g©y nªn c¸c bÖnh di truyÒn ®Õn nay
ch−a râ, nh−ng còng cã thÓ liªn quan ®Õn c¬ chÕ sao chÐp tr−ît ®−îc nªu ë môc 6.4.1
(h×nh 6.10).

6.5. C¸c c¬ chÕ söa ch÷a ADN


PhÇn lín c¸c ®ét biÕn tù ph¸t vµ g©y t¹o nh×n chung cã thÓ coi lµ c¸c sai háng cña
gen hay ADN. §Æc biÖt khi xö lý víi liÒu cao cña c¸c t¸c nh©n ®ét biÕn th× sù sai háng lµ
®¸ng kÓ. Trong thùc tÕ, ë gãc ®é nµo ®ã, chóng ta cã thÓ coi ®ét biÕn lµ nh÷ng biÕn ®æi
cña ADN mµ kh«ng ®−îc c¸c hÖ thèng söa ch÷a ADN kh¸c nhau phôc håi. Trªn c¬ së ®ã,
ta cã thÓ viÕt c«ng thøc: “®ét biÕn = sai háng ADN – söa ch÷a ADN”. C¶ sinh vËt
prokaryote vµ eukaryote ®Òu cã mét sè hÖ thèng söa ch÷a ADN víi sù huy ®éng nhiÒu
enzym kh¸c nhau. NÕu hÖ thèng söa ch÷a kh«ng kh¾c phôc ®−îc c¸c sai háng th× dÉn
®Õn sù h×nh thµnh c¸c tÕ bµo hay c¬ thÓ ®ét biÕn; hoÆc nÕu cã qu¸ nhiÒu sai háng th× c¸c
c¬ thÓ vµ tÕ bµo ®ét biÕn th−êng chÕt. Sù sèng lµ kÕt qu¶ c©n b»ng gi÷a sù chÝnh x¸c
trong sao chÐp vµ truyÒn ®¹t th«ng tin di truyÒn trong ADN tíi c¸c tÕ bµo vµ c¬ thÓ thÕ
hÖ con víi nh÷ng ®ét biÕn ®«i khi x¶y ra trong vai trß lµ nguån nguyªn liÖu s¬ cÊp cña
tiÕn hãa. C¸c hÖ thèng söa ch÷a ADN chÝnh lµ c«ng cô gióp duy tr× sù hµi hßa nµy.
Dùa trªn c¬ chÕ ho¹t ®éng, chóng ta cã thÓ chia c¸c c¬ chÕ söa ch÷a ADN thµnh ba
nhãm chÝnh: 1) c¸c c¬ chÕ phôc håi trùc tiÕp, 2) c¸c c¬ chÕ söa ch÷a b»ng c¾t bá, vµ 3) mét
sè c¬ chÕ söa ch÷a kh¸c. Sau ®©y lµ mét sè m« h×nh söa ch÷a ADN.

6.5.1. C¸c c¬ chÕ phôc håi trùc tiÕp

6.5.1.1. C¬ chÕ söa ch÷a ghÐp ®«i sai nhê chøc n¨ng ®äc söa cña ADN polymerase
TÇn sè ®ét biÕn thay thÕ nucleotide ë c¸c gen vi khuÈn vµo kho¶ng 10-11 ®Õn 10-7
mçi lÇn ph©n bµo. Tuy vËy, thùc nghiÖm cho thÊy lçi sao chÐp cña ADN polymerase cã
thÓ cao h¬n, kho¶ng 10-5. Sù kh¸c biÖt gi÷a nh÷ng con sè nµy ®−îc gi¶i thÝch lµ nhê chøc
n¨ng ®äc söa cña ho¹t tÝnh exonuclease 3’→5’ ®−îc tÝch hîp trong hÇu hÕt (nÕu kh«ng
ph¶i lµ tÊt c¶) c¸c enzym ADN polymerase ë prokaryote còng nh− eukaryote. Khi mét
nucleotide ®−îc kÕt cÆp sai trong qu¸ tr×nh sao chÐp ADN, nã cã thÓ ®−îc enzym ADN
polymerase nhËn ra. Lóc nµy, sù sao chÐp ADN t¹m dõng l¹i cho ®Õn khi nucleotide kÕt
cÆp sai ®−îc lo¹i bá vµ thay thÕ. Sau khi nucleotide sai háng ®−îc söa ch÷a, enzym ADN
polymerase tiÕp tôc tr−ît trªn m¹ch ADN lµm khu«n vµ kh«i phôc ho¹t ®éng sao chÐp.
TÇm quan träng cña ho¹t tÝnh ®äc söa ®i kÌm víi ho¹t tÝnh exonuclease 3’→5’ cña
ADN polymerase ®−îc chøng minh bëi c¸c ®ét biÕn g©y ®ét biÕn (mutator mutation)
t×m thÊy ë E. coli. C¸c chñng vi khuÈn mang c¸c ®ét biÕn nµy cã tÇn sè ®ét biÕn ë tÊt c¶
c¸c gen cao h¬n h¼n so víi c¸c chñng ®èi chøng. Nh÷ng ®ét biÕn g©y ®ét biÕn liªn quan
®Õn c¸c gen m· hãa cho c¸c protein thiÕt yÕu tham gia söa ch÷a ADN. Ch¼ng han nh−,
gen g©y ®ét biÕn mutD cña E. coli m· hãa cho tiÓu phÇn ε cña enzym ADN polymerase
III ë E. coli. §ét biÕn mutD lµm mÊt ho¹t tÝnh ®äc söa chiÒu 3’→5’ cña ADN polymerase.
Do vËy, nhiÒu nucleotide ®−îc l¾p r¸p sai mµ kh«ng ®−îc söa ch÷a, dÉn ®Õn ®ét biÕn.

197
§inh §oµn Long

6.5.1.2. Söa ch÷a phøc kÐp pyrimidine b»ng c¬ chÕ quang phôc ho¹t
Theo c¬ chÕ quang phôc ho¹t (photoreactivation repair, hay söa ch÷a ADN nhê
¸nh s¸ng), c¸c ®ét biÕn phøc kÐp pyrimidine (phæ biÕn nhÊt lµ T::T) cã thÓ ®−îc phôc håi
trùc tiÕp trë vÒ d¹ng nguyªn thñy, nÕu chóng ®−îc ®−a ®Õn gÇn vïng ¸nh s¸ng cã b−íc
sãng trong kho¶ng 320 - 370nm. Lóc nµy, c¬ chÕ quang phôc ho¹t ho¹t ®éng nÕu enzym
photolyase (do gen phr m· hãa) ®−îc ho¹t hãa bëi ph«t«n ¸nh s¸ng. Sù ho¹t ®éng cña hÖ
thèng söa ch÷a nµy lµm “ph¸ vì” liªn kÕt céng hãa trÞ gi÷a c¸c pyrimidine liÒn kÒ trªn
khung cña ph©n tö ADN. C¸c chñng vi khuÈn mang ®ét biÕn ë gen phr th−êng ®ång thêi
bÞ háng c¬ chÕ söa ch÷a quang phôc ho¹t. Enzym photolyase ®−îc t×m thÊy ë vi khuÈn vµ
mét sè eukaryote, nh−ng kh«ng thÊy cã ë ng−êi vµ c¸c ®éng vËt cã vó kh¸c.
6.5.1.3. Söa ch÷a sai háng ADN g©y ra do alkyl hãa
Nh− ®· nãi ë trªn c¸c hîp chÊt alkyl hãa, nh− MMS hay EMS, cã kh¶ n¨ng chuyÓn
nhãm alkyl vµo c¸c baz¬ nit¬ ë c¸c vÞ trÝ kh¸c nhau, vÝ nh− nguyªn tö O cña C-6 ë
guanine. ë E. coli, nh÷ng sai háng ADN g©y ra bëi sù alkyl hãa ë vÞ trÝ nµy cña guanine
®−îc söa ch÷a bëi mét enzym cã tªn gäi lµ a) C¸c vÞ trÝ c¾t baz¬ sai háng theo kiÓu BER
O6-methylguanine methyltransferase, ®−îc gen Baz¬ sai háng
ada m· hãa. Enzym nµy cã kh¶ n¨ng nhËn ra
O6-methylguanine vµ lo¹i bá nhãm methyl,
VÞ trÝ c¾t 1
qua ®ã chuyÓn baz¬ nit¬ nµy trë vÒ d¹ng gèc
cña nã. Mét c¬ chÕ t−¬ng tù còng ®−îc t×m Baz¬
thÊy ®Ó söa ch÷a c¸c thymine bÞ alkyl hãa.
Nh÷ng ®ét biÕn ë nh÷ng gen m· hãa nh÷ng VÞ trÝ
enzym söa ch÷a ADN nµy th−êng lµm t¨ng c¾t 2
tÇn sè ®ét biÕn tù ph¸t.
6.5.2. C¬ chÕ söa ch÷a b»ng c¾t bá
Cã lÏ c¬ chÕ söa ch÷a lo¹i bá c¸c baz¬
nit¬ sai háng phæ biÕn nhÊt lµ c¬ chÕ c¾t bá c¸c b) C¸c b−íc cña qu¸ tr×nh söa ch÷a kiÓu BER
baz¬ nit¬ vµ nucleotide sai háng, råi thay vµo
Baz¬ sai
®ã c¸c baz¬ nit¬ vµ nucleotide ®óng. Do thµnh ADN
phÇn vµ c¸ch thøc ho¹t ®éng kh¸c nhau, ng−êi
ta chia thµnh c¸c c¬ chÕ söa ch÷a b»ng c¾t bá ADN glycosylase c¾t
(1)
baz¬ nit¬ vµ söa ch÷a b»ng c¾t bá nucleotide. baz¬ sai háng (c¾t 1)
6.5.2.1. Söa ch÷a b»ng c¾t bá baz¬ nit¬ (BER) +
VÞ trÝ thiÕu baz¬ (2) AP endonuclease c¾t khung
Trong c¬ chÕ söa ch÷a b»ng c¾t bá (kÝ hiÖu AP) ADN t¹i vÞ trÝ thiÕu baz¬ (c¾t 2)
baz¬ nit¬ - BER (base excision repair), mét
enzym (trong hä lín enzym) glycosylase nhËn
(3) ADN phosphodiesterase c¾t mét
ra baz¬ sai háng vµ lo¹i nã ra khái ph©n tö ®o¹n khung t¹i vÞ trÝ sai háng
ADN b»ng viÖc c¾t bá liªn kÕt glycoside gi÷a
+
baz¬ vµ ®−êng deoxyribose cña nucleotide sai
háng. C¸c enzym kh¸c sau ®ã ®−îc huy ®éng (4) ADN polymeraseI tæng hîp
theo chiÒu 5’ → 3’
®Ó c¾t bá phÇn khung ®−êng-phosphate ë tr−íc
vµ sau vÞ trÝ cã cÊu tróc khung ®−êng thiÕu
baz¬ nit¬, gi¶i phãng khung ®−êng nµy vµ mét (5) ADN ligase “hµn kÝn” m¹ch
®o¹n m¹ch ADN ®¬n “rçng” (h×nh 6.14). §o¹n ADN ®−îc söa ch÷a
ADN rçng nµy sau sÏ ®−îc lÊp l¹i b»ng c¸c
nucleotide kÕt cÆp ®óng nhê ho¹t ®éng cña
enzym ADN polymerase (dïng m¹ch ADN ®èi H×nh 6.14. S¬ ®å minh häa m« h×nh söa ch÷a
diÖn lµm khu«n) vµ ADN ligase. ADN b»ng c¾t bá baz¬ nit¬ (BER) ë E. coli.

198
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

6.5.2.2. Söa ch÷a b»ng c¾t bá nucleotide (NER)


N¨m 1964, hai nhãm nghiªn cøu, gåm Boyce cïng Howard-Flander vµ Setlow cïng
Carrier, ®· ph©n lËp ®−îc mét sè ®ét biÕn mÉn c¶m chiÕu x¹ UV ë E. coli. C¸c d¹ng ®ét
biÕn nµy cã tÇn sè ®ét biÕn cao bÊt th−êng so víi c¸c chñng kh¸c khi xö lý chiÕu x¹ UV
trong bãng tèi. Nh÷ng ®ét biÕn nµy ®−îc gäi lµ c¸c thÓ ®ét biÕn uvrA (uvr lµ tõ viÕt t¾t
cña “UV repair”). C¸c thÓ ®ét biÕn uvrA chØ söa ch÷a ®−îc c¸c sai háng ADN kiÓu “phøc
kÐp thymine” khi ®−îc chiÕu s¸ng; ®iÒu nµy cho thÊy, c¬ chÕ söa ch÷a ho¹t ®éng ë ®©y cã
lÏ lµ quang phôc ho¹t. Tuy nhiªn, ®iÒu ®¸ng chó ý lµ c¸c chñng kiÓu d¹i cã thÓ söa ch÷a
nh÷ng sai háng nµy ngay c¶ khi ®−îc nu«i trong tèi. Qua ®ã, c¸c nhµ nghiªn cøu cho
r»ng, ®· tån t¹i mét hÖ thèng söa ch÷a ADN kh¸c kh«ng phô thuéc vµo ¸nh s¸ng. HÖ
thèng nµy lóc ®ã ®−îc gäi lµ hÖ thèng söa ch÷a trong tèi, hiÖn nay ®−îc gäi lµ hÖ
thèng söa ch÷a b»ng c¾t bá nucleotide - NER (nucleotidede excision repair).
HÖ thèng NER kh«ng chØ söa ch÷a sai háng kiÓu “phøc kÐp thymine” mµ cßn söa
ch÷a c¸c sai háng nghiªm träng kh¸c trong ph©n tö ADN sîi kÐp. H×nh 6.15 m« t¶ hÖ
thèng NER ho¹t ®éng ë E. coli. HÖ thèng nµy cã 4 protein UvrA, UvrB, UvrC vµ UvrD
®−îc m· hãa t−¬ng øng bëi c¸c gen uvrA, uvrB, uvrC vµ uvrD. Mét phøc hÖ gåm hai tiÓu
phÇn UvrA vµ mét tiÓu phÇn UvrB (Uvr2A-B) tr−ît däc ph©n tö ADN. Khi phøc hÖ nµy
nhËn ra “phøc kÐp
Phøc hÖ
pyrimidine” hay mét sai  UvrAB tr−ît
háng nghiªm träng nµo kh¸c däc ph©n tö Phøc hÖ
th× c¸c tiÓu phÇn UvrA sÏ ADN vµ ph¸t Uvr2A-B
t¸ch ra khëi phøc hÖ Uvr2A- hiÖn vÞ trÝ sai
háng
B, vµ thay vµo ®ã lµ sù ®Ýnh
kÕt cña 1 UvrC.
UvrA ®−îc
Sù liªn kÕt cña UvrB-C  gi¶i phãng;
t¹i vÞ trÝ sai háng dÉn ®Õn UvrC thay thÕ
viÖc c¾t m¹ch ®¬n ADN UvrA t¹i vÞ tri
sai háng
kho¶ng 4 nucleotide vÒ phÝa
®Çu 3’ (thùc hiÖn bëi UvrB) VÞ trÝ c¾t ®Çu 5’ VÞ trÝ c¾t ®Çu 3’
vµ 7 nucleotide vÒ phÝa ®Çu C¾t ®o¹n ADN
5’ (thùc hiÖn bëi UvrC).  sai háng t¹i
UvrB sau ®ã rêi khái ph©n c¸c ®Çu 5’ vµ
3’ t−¬ng øng
tö ADN vµ UrvD liªn kÕt vµo bëi UvrB vµ UvrD
®o¹n phÝa ®Çu 5’ cã ®Çu 3’- UvrC ADN polymerase I
OH tù do. UvrD thùc chÊt lµ (pol I)
mét helicase, cã vai trß gi·n
xo¾n ADN t¹i tr×nh tù gi÷a UvrD gi·n xo¾n
 vïng ADN bÞ
hai vÞ trÝ c¾t vµ gi¶i phãng ra c¾t, gi¶i phãng
®o¹n c¾t. Sau ®ã, ADN ®o¹n sai háng.
polymerase I sÏ lÊp ®Çy ®o¹n ADN pol I tæng
ADN ligase
rçng b»ng c¸c nucleotide kÕt hîp bï ®o¹n
ADN rçng
cÆp ®óng b»ng ho¹t tÝnh
ADN ligase nèi
tæng hîp theo chiÒu 5’→3’;  ®o¹n söa ®æi.
råi ADN ligase nèi liªn kÕt Qu¸ tr×nh söa
phosphodieste cuèi cïng ADN kÕt thóc
gi÷a hai ®o¹n ADN. HÖ H×nh 6.15. S¬ ®å minh häa m« h×nh söa ch÷a ADN b»ng c¾t bá
thèng söa ch÷a b»ng c¾t bá nucleotide (NER) ë E. coli.
nucleotide ®−îc t×m thÊy ë

199
§inh §oµn Long

hÇu hÕt c¸c loµi sinh vËt ®· tõng ®−îc nghiªn cøu. ë nÊm men vµ ®éng vËt cã vó, cã
kho¶ng 12 gen m· hãa protein liªn quan ®Õn ho¹t ®éng söa ch÷a ADN b»ng c¾t bá
nucleotide.

6.5.3. C¸c c¬ chÕ söa ch÷a kh¸c

6.5.3.1. C¬ chÕ söa ch÷a kÕt cÆp sai nhê m¹ch ADN khu«n ®−îc methyl hãa (MMR)
MÆc dï c¸c enzym ADN polymerase cã ho¹t tÝnh ®äc söa, nh−ng sau qu¸ tr×nh sao
chÐp ADN, vÉn tån t¹i mét sè baz¬ nit¬ kÕt cÆp sai kh«ng söa ch÷a hÕt. Trong lÇn sao
chÐp tiÕp theo, nÕu nh÷ng sai háng nµy kh«ng ®−îc kh¾c phôc th× ®ét biÕn sÏ h×nh
thµnh.
Thùc tÕ, nhiÒu baz¬ nit¬ kÕt cÆp sai ®−îc söa ch÷a sau qu¸ tr×nh sao chÐp bëi mét
hÖ thèng söa ch÷a ADN kh¸c, gäi lµ söa ch÷a kÕt cÆp sai nhê m¹ch ADN khu«n
®−îc methyl hãa – MMR (methyl-directed mismatch repair). HÖ thèng nµy nhËn ra c¸c
baz¬ nit¬ kÕt cÆp sai, c¾t bá c¸c baz¬ nit¬ sai háng vµ tiÕn hµnh tæng hîp thay thÕ. ë E.
coli, giai ®o¹n ®Çu cña c¬ chÕ MMR liªn quan ®Õn 3 gen lµ mutS, mutL vµ mutH, m· hãa
cho 3 protein t−¬ng øng lµ MutS, MutL vµ MutH. §Çu tiªn, MutS sÏ liªn kÕt vµo baz¬
nit¬ kÕt cÆp sai. Sau ®ã hÖ thèng söa ch÷a nhËn ra baz¬ nµo ®óng vµ baz¬ nµo sai t−¬ng
øng víi m¹ch nµo lµm khu«n vµ m¹ch nµo ®−îc tæng hîp míi. ë E. coli, hai m¹ch nµy
®−îc ph©n biÖt bëi sù methyl hãa nucleotide A t¹i tr×nh tù [GATC]. Tr×nh tù nµy cã trôc
®èi xøng, nghÜa lµ tr×nh tù ®äc theo chiÒu 5’→3’ trªn c¶ hai m¹ch gièng nhau. C¶ hai
nucleotide A trªn c¶ hai m¹ch cña ph©n tö ADN lµm khu«n th«ng th−êng ®−îc methyl
hãa. Tuy vËy, khi sù sao chÐp ADN võa kÕt thóc th× chØ cã A trªn m¹ch lµm khu«n ®−îc
methyl hãa cßn A trªn m¹ch míi tæng hîp ch−a ®−îc methyl hãa (xÐt t¹i vÞ trÝ tr×nh tù
[GATC]). Lóc nµy, MutS (®· liªn kÕt vµo baz¬ nit¬ kÕt cÆp sai) sÏ t¹o phøc víi MutL vµ
MutH ®Ó mang tr×nh tù [GATC] ch−a ®−îc methyl hãa ë gÇn tíi vÞ trÝ kÕt cÆp sai. MutH
sÏ lµm ®øt m¹ch kh«ng ®−îc methyl hãa t¹i tr×nh tù [GATC]. Tõ vÞ trÝ ®ã, mét enzym
exonuclease sÏ c¾t m¹ch ADN kh«ng ®−îc methyl hãa, ®Õn hÕt vÞ trÞ nucleotide kÕt cÆp
sai. Råi c¸c enzym ADN polymerase III vµ ligase sÏ tæng hîp bï vµ lÊp ®o¹n ADN rçng.
C¬ chÕ MMR còng ho¹t ®éng ë eukaryote. Tuy vËy, c¬ chÕ ®Ó nhËn biÕt m¹ch lµm
khu«n vµ m¹ch míi ch−a s¸ng tá hoµn toµn. ë ng−êi, ®· x¸c ®Þnh ®−îc 4 gen liªn quan
®Õn ho¹t ®éng cña c¬ chÕ MMR gåm cã hMSH2, hMLH1, hPMS1 vµ hPMS2; trong ®ã
hMSH2 cã chøc n¨ng t−¬ng ®−¬ng víi mutS ë E. coli, cßn 3 gen cßn l¹i t−íng øng víi
mutL ë E. coli. C¸c gen nµy ®−îc gäi lµ c¸c gen g©y ®ét biÕn, bëi viÖc mÊt chøc n¨ng cña
chóng dÉn ®Õn sù tÝch lòy t¨ng lªn cña c¸c ®ét biÕn trong hÖ gen. C¸c ®ét biÕn x¶y ra ë
mét trong bèn gen nµy lµm t¨ng nguy c¬ m¾c mét sè bÖnh di truyÒn, trong ®ã cã bÖnh
ung th− ruét kÕt di truyÒn kh«ng polip. HiÖu øng cña c¸c gen g©y ®ét biÕn trong sù ph¸t
sinh ung th− ®−îc nªu thªm ë ch−¬ng 8.
6.5.3.2. Sù tæng hîp ADN bá qua sai háng vµ c¬ chÕ söa ch÷a SOS
Nh− chóng ta ®· biÕt, mét sè sai háng cña ADN trong qu¸ tr×nh sao chÐp cã thÓ
ng¨n c¶n viÖc tiÕp tôc chuyÓn ®éng cña bé m¸y sao chÐp trªn ph©n tö ADN khu«n. NÕu
kh«ng ®−îc kh¾c phôc, tÕ bµo sÏ bÞ chÕt. Trong tr−êng hîp nµy, cã mét ph−¬ng tiÖn söa
ch÷a “cøu c¸nh” ®−îc gäi lµ sù tæng hîp ADN bá qua sai háng, cho phÐp sù sao chÐp
cã thÓ bá qua sai háng vµ tiÕp tôc. Qu¸ tr×nh nµy liªn quan ®Õn mét nhãm ADN
polymerase ®Æc biÖt chØ ®−îc tæng hîp khi cã tÝn hiÖu ADN sai háng. ë E. coli, nh÷ng sai
háng ADN nh− vËy ho¹t hãa mét hÖ thèng phøc t¹p ®−îc gäi lµ c¬ chÕ söa ch÷a SOS (gäi
nh− vËy cã lÏ do nã lµ ph−¬ng tiÖn “cøu c¸nh” cuèi cïng vµ th−êng ®−îc huy ®éng khÈn

200
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

cÊp). HÖ thèng SOS cho phÐp tÕ bµo sèng sãt (thay cho bÞ chÕt), mÆc dï nã th−êng t¹o
nªn nh÷ng ®ét biÕn míi (nªn c¬ chÕ nµy cßn ®−îc gäi lµ c¬ chÕ söa ch÷a dÔ g©y ®ét biÕn).
ë E. coli, cã hai gen liªn quan ®Õn ho¹t ®éng cña c¬ chÕ SOS lµ lexA vµ recA, m·
hãa t−¬ng øng cho c¸c protein LexA vµ RecA. §©y lµ nh÷ng gen ho¹t ®éng theo kiÓu c¶m
øng (xem ch−¬ng 5). C¸c tÕ bµo mang c¸c gen lexA vµ recA ®ét biÕn cã hÖ thèng SOS ho¹t
®éng liªn tôc. HÖ thèng nµy ho¹t ®éng nh− sau: khi kh«ng cã ADN sai háng, LexA øc chÕ
sù phiªn m· cña kho¶ng 17 gen liªn quan ®Õn söa ch÷a c¸c d¹ng ADN sai háng kh¸c
nhau. Nh−ng khi cã sai háng ADN, RecA ®−îc ho¹t hãa. Lóc nµy RecA thóc ®Èy LexA tù
biÕn tÝnh, qua ®ã t¨ng c−êng sù phiªn m· cña c¸c gen liªn quan ®Õn söa ch÷a ADN. Sau
khi ho¹t ®éng söa ch÷a kÕt thóc, RecA trë l¹i tr¹ng th¸i bÊt ho¹t cßn LexA ®−îc tæng hîp
míi sÏ øc chÕ c¸c gen söa ch÷a ADN. Trong sè c¸c gen ®−îc phiªn m· khi kh«ng cã Lex A
cã gen m· hãa cho enzym ADN polymerase ®Æc biÖt cã thÓ bá qua vÞ trÝ sai háng ®Ó tiÕp
tôc tæng hîp m¹ch ADN míi. Enzym nµy ho¹t ®éng theo kiÓu bæ sung nucleotide kh«ng
®Æc hiÖu (ngÉu nhiªn) vµo vÞ trÝ sai háng råi tiÕp tôc ph¶n øng trïng hîp ADN. Nh÷ng
nucleotide ®−îc bæ sung ngÉu nhiªn cã thÓ kh«ng kÕt cÆp ®óng nªn dÉn ®Õn ®ét biÕn (vÒ
lý thuyÕt, x¸c suÊt kÕt cÆp sai t¹i mçi nucleotide lµ 75%). Nh−ng dï sao, víi tÕ bµo th×
nh÷ng ®ét biÕn nµy cßn Ýt nguy hiÓm h¬n so víi hiÖu øng g©y chÕt cña c¸c sai háng ADN.

6.6. C¸c bÖnh di truyÒn ë ng−êi do sai háng trong bé m¸y söa ch÷a ADN
Mét trong nh÷ng bÖnh di truyÒn ë ng−êi ®−îc ph¸t hiÖn ®Çu tiªn do sai háng trong
bé m¸y söa ch÷a ADN lµ bÖnh kh« da s¾c tè, kÝ hiÖu lµ XP (xeroderma pigmentosum. C¸c
bÖnh nh©n XP cã nguy c¬ bÞ ung th− da cao khi ph¬i n¾ng. C¸c bÖnh nh©n nµy bÞ háng c¬
chÕ söa ch÷a ADN sai háng do tia UV g©y ra (ch¼ng h¹n nh− “phøc kÐp thymine”). §Õn
nay, héi chøng XP ®−îc chØ ra lµ cã liªn quan tíi ®ét biÕn Ýt nhÊt ë 9 gen kh¸c nhau. S¶n
phÈm cña 6 trong 9 gen nµy, gåm XPA, XPB, XPC, XPD, XPF vµ XPG lµ thiÕt yÕu víi hÖ
thèng söa ch÷a ADN kiÓu NER. C¸c nghiªn cøu hãa sinh cho thÊy chóng lµ thµnh phÇn
cña phøc hÖ NER cã ho¹t tÝnh excinulase. Phøc hÖ nµy cã Ýt nhÊt 17 chuçi polypeptide,
nªn danh s¸ch c¸c gen võa nªu cã lÏ ch−a ®Çy ®ñ. ë ng−êi, cßn cã hai héi chøng n÷a liªn
quan ®Õn sai háng c¬ chÕ NER lµ héi chøng Cockayne vµ chøng lo¹n d−ìng biÓu b× l«ng.
TrÎ m¾c héi chøng Cockayne sinh tr−ëng chËm vµ thiÓu n¨ng trÝ tuÖ (nh−ng kh«ng t¨ng
nguy c¬ m¾c bÖnh ung th− da). TrÎ m¾c chøng lo¹n d−ìng biÓu b× l«ng th−êng lïn, tãc dÔ
g·y, da “®ãng v¶y” vµ trÝ tuÖ kÐm ph¸t triÓn. BÖnh nh©n cña c¶ hai bÖnh nµy ®Òu bÞ háng
c¬ chÕ söa ch÷a NER liªn quan ®Õn b−íc phiªn m· c¸c gen cã liªn quan.
Ngoµi nh÷ng bÊt th−êng liªn quan ®Õn tÕ bµo da, mét sè bÖnh nh©n XP cßn cã c¸c
rèi lo¹n vÒ thÇn kinh (do sù chÕt sím cña c¸c tÕ bµo thÇn kinh). HiÖu øng nµy ë c¸c tÕ
bµo thÇn kinh cña bÖnh XP lµ ®èi t−îng nghiªn cøu vÒ sù giµ hãa. Trong ®ã, mét gi¶
thiÕt cho r»ng sù tÝch lòy c¸c ®ét biÕn tÕ bµo soma lµ mét nguyªn nh©n dÉn ®Õn sù giµ
hãa. NÕu ®óng nh− vËy th× sù sai háng trong c¸c hÖ thèng söa ch÷a ADN sÏ trùc tiÕp
thóc ®Èy sù giµ hãa. §iÒu nµy Ýt nhÊt tá ra lµ ®óng ë bÖnh nh©n XP. Nh−ng, nh×n
chung ®Õn nay míi cã rÊt Ýt dÉn chøng vÒ sù t−¬ng quan gi÷a sù tÝch lòy ®ét biÕn soma
vµ qu¸ tr×nh giµ hãa.
Cã ba bÖnh di truyÒn kh¸c ë ng−êi còng ®· ®−îc t×m thÊy cã liªn quan ®Õn nh÷ng
sai háng trong söa ch÷a ADN, bao gåm bÖnh mÊt ®iÒu hßa gi·n m¹ch (ataxia-
telangiecsia), bÖnh thiÕu m¸u Fanconi vµ héi chøng Bloom. C¶ ba bÖnh nµy ®Òu liªn
quan ®Õn c¸c alen ®ét biÕn lÆn trªn NST th−êng, víi nguy c¬ m¾c ung th− ¸c tÝnh cao ë
ng−êi bÖnh. Trong ®ã ®Æc biÖt lµ nguy c¬ m¾c bÖnh b¹ch cÇu ¸c tÝnh ë c¸c bÖnh nh©n mÊt
®iÒu hßa gi·n m¹ch vµ thiÕu m¸u Fanconi. C¸c bÖnh nh©n mÊt ®iÒu hßa gi·n m¹ch trë
nªn mÉn c¶m cao víi c¸c tia x¹ ion hãa, do sù sai háng trong c¸c c¬ chÕ söa ch÷a ADN sai
háng g©y ra bëi c¸c bøc x¹ ion hãa. TÕ bµo bÖnh nh©n thiÕu m¸u Fanconi bÞ suy yÕu vÒ

201
§inh §oµn Long

kh¶ n¨ng lo¹i bá c¸c cÊu tróc v¾t chÐo bÊt th−êng gi÷a hai m¹ch ADN (ch¼ng h¹n, mét
sè cÊu tróc g©y ra bëi mitomycin C). C¸c tÕ bµo bÖnh nh©n m¾c héi chøng Bloom cã
nguy c¬ ®øt g·y NST cao dÉn ®Õn c¸c biÕn d¹ng NST vµ/hoÆc trao ®æi chÐo gi÷a c¸c
nhiÔm s¾c tö. VÒ c¬ chÕ, mét d¹ng bÖnh mÊt ®iÒu hßa gi·n m¹ch lµ do sai háng cña mét
enzym kinase tham gia ®iÒu khiÓn chu tr×nh tÕ bµo; héi chøng Bloom do sù sai háng
cña mét enzym ADN helicase (RecQ helicase). C¬ chÕ g©y bÖnh ung th− ruét kÕt di
truyÒn kh«ng polip (®· nªu ë môc 6.5.3.1 trªn ®©y) lµ do sai háng trong c¬ chÕ söa ch÷a
MMR. §iÒu nµy cho thÊy nh÷ng sai háng trong c¸c c¬ chÕ söa ch÷a ADN kh¸c còng cã
thÓ lµ nguyªn nh©n dÉn ®Õn c¸c d¹ng ung th− kh¸c nhau ë ng−êi (ch−¬ng 8). §Ó t×m
c¸c gen liªn quan ®Õn c¸c tÝnh tr¹ng vµ bÖnh ë ng−êi, cã thÓ tham kh¶o trang Web:
www3.ncbi.nlm.nih.gov/OMIM/.

6.7. C¸c c¬ chÕ t¸i tæ hîp ADN


Trong gi¶m ph©n, mét sù kiÖn quan träng gãp phÇn lµm t¨ng biÕn dÞ tæ hîp ë c¸c
loµi sinh s¶n h÷u tÝnh lµ hiÖn t−îng trao ®æi chÐo gi÷a c¸c NST t−¬ng ®ång. Trong thùc
tÕ, nhiÒu gen cã liªn quan ®Õn ho¹t ®éng söa ch÷a c¸c ADN ®−îc t×m thÊy ®Òu cã vai trß
thiÕt yÕu trong sù trao ®æi chÐo gi÷a c¸c NST t−¬ng ®ång trong qu¸ tr×nh nµy. Ngoµi ra,
c¸c c¬ chÕ t¸i tæ hîp cã lÏ lu«n cã liªn quan ®Õn mét sè c¬ chÕ söa ch÷a ADN, nªn ë ®©y
chóng ta ®Ò cËp mét sè ®Æc ®iÓm c¬ b¶n cña qu¸ tr×nh t¸i tæ hîp ADN.
ë eukaryote, trao ®æi chÐo liªn quan ®Õn sù h×nh thµnh phøc hÖ tiÕp hîp trong k×
®Çu cña gi¶m ph©n I. Phøc hÖ nµy cã b¶n chÊt lµ ribonucleoprotein (gåm protein vµ
ARN). V× mét nguyªn nh©n nµo ®ã, hiÖn t−îng trao ®æi chÐo hÇu nh− kh«ng x¶y ra ë ruåi
giÊm ®ùc (víi phÇn lín c¸c loµi, hiÖn t−îng nµy x¶y ra ë c¶ hai giíi). §iÒu ®¸ng chó ý lµ
trong qu¸ tr×nh ph¸t sinh giao tö ®ùc (tinh trïng) ë ruåi giÊm, phøc hÖ tiÕp hîp kh«ng
thÊy h×nh thµnh ë k× ®Çu gi¶m ph©n I. Ngoµi ra, c¸c ®ét biÕn liªn quan ®Õn gen c3G ë
ruåi giÊm c¸i dÉn ®Õn phøc hÖ tiÕp hîp kh«ng h×nh thµnh vµ kh«ng cã trao ®æi chÐo. Nh−
vËy, sù h×nh thµnh phøc hÖ tiÕp hîp cã lÏ cã liªn quan mËt thiÕt víi hiÖn t−îng trao ®æi
chÐo vµ t¸i tæ hîp ADN.

6.7.1. Trao ®æi chÐo lµ sù ®øt - nèi cña c¸c ®o¹n ADN t−¬ng ®ång
PhÇn lín c¸c hiÓu biÕt vÒ trao ®æi chÐo gi÷a c¸c ph©n tö ADN ®Õn nay chñ yÕu dùa
trªn c¸c nghiªn cøu ë E. coli vµ S. cerevisiae. C¸c nghiªn cøu hãa sinh vÒ c¸c dßng ®ét
biÕn nµy cho thÊy chóng thiÕu mét sè protein vµ enzym cÇn cho sù t¸i tæ hîp ADN.
NhiÒu m« h×nh nghiªn cøu vÒ t¸i tæ hîp ADN ®−îc sö dông réng r·i hiÖn nay dùa
trªn m« h×nh ®−îc Holliday c«ng bè n¨m 1964. Cã lÏ, Holliday lµ mét trong nh÷ng ng−êi
®Çu tiªn gi¶i thÝch ®−îc hiÖn t−îng ®øt ra, nèi l¹i vµ söa ch÷a ADN. H×nh 6.16 minh
häa m« h×nh ®−îc Holliday ®−a ra cïng víi nh÷ng söa ®æi nhê nh÷ng hiÓu biÕt gÇn ®©y.
Sù trao ®æi chÐo gi÷a hai ph©n tö ADN b¾t ®Çu b»ng viÖc mét enzym endonuclease lµm
®øt mét m¹ch ®¬n trªn c¶ hai ph©n tö ADN mang ®o¹n t−¬ng ®ång. C¸c ph©n ®o¹n m¹ch
®¬n ADN ë hai phÝa cña vÞ trÝ c¾t chuyÓn chç cho nhau nhê c¸c protein liªn kÕt m¹ch ®¬n
(SSB) vµ enzym helicase. Enym helicase lµm gi·n xo¾n ph©n tö ADN sîi kÐp ë vÞ trÝ gÇn
víi ®iÓm c¾t m¹ch ®¬n. ë E. coli, mét phøc hÖ gäi lµ RecBCD ®ång thêi cã hai ho¹t tÝnh
cña endonuclease (lµm ®øt m¹ch ®¬n ADN) vµ helicase (gi·n xo¾n ADN t¹i vÞ trÝ ®øt).
C¸c m¹ch ®¬n ®æi chç cho nhau sau ®ã sÏ trao ®æi thµnh phÇn kÕt cÆp bæ sung cña
chóng t−¬ng øng trªn hai m¹ch bæ sung nguyªn vÑn (h×nh 6.16c/d). Qu¸ tr×nh nµy ®−îc
xóc t¸c bëi c¸c protein kiÓu RecA ë E. coli. C¸c protein kiÓu RecA ®−îc t×m thÊy ë nhiÒu
sinh vËt kh¸c nhau, ë c¶ prokaryote vµ eukaryote. C¸c protein kiÓu RecA thóc ®Èy sù t¸i
tæ hîp m¹ch ®¬n, nghÜa lµ mét m¹ch ®¬n cña ph©n tö ADN sîi kÐp nµy ®æi chç cho mét
®o¹n t−¬ng ®ång víi nã trªn ph©n tö ADN sîi kÐp kh¸c. Trong thùc tÕ, c¸c protein kiÓu

202
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

RecA thóc ®Èy sù NST t−¬ng


trao ®æi t−¬ng ®ång A ®ång 1 B a B
gi÷a c¸c m¹ch ®¬n
cña hai ph©n tö
A (j)
ADN sîi kÐp t−¬ng a NST t−¬ng b NST t¸i tæ hîp b
®ång qua hai b−íc. ®ång 2 ADN ligase (cã thÓ cã
(a) KÕt cÆp NST t−¬ng ®ång exonuclease vµ ADN
Trong b−íc thø polymerase ho¹t
nhÊt, mét m¹ch ®¬n Endonuclease
®éng tr−íc ®ã)
cña chuçi xo¾n kÐp A B a B
®øt ra råi ®æi chç
víi m¹ch t−¬ng
a b A b
®ång hoµn toµn
(b) H×nh thµnh “vÕt ®øt" trªn mçi (i) H×nh ¶nh 2-D
(hoÆc mét phÇn lín) m¹ch ®¬n
víi nã, råi kÕt cÆp Helicase vµ protein
liªn kÕt m¹ch ®¬n B
bæ sung víi m¹ch A
nguyªn vÑn cßn l¹i. A B

ë b−íc thø hai, x¶y (h) §øt cÇu m¹ch ®¬n


ra mét sù ®æi chç
t−¬ng tù trªn m¹ch a b
a
®¬n ë vÞ trÝ ®æi chç (c) C¸c m¹ch ®¬n ®æi chç sau
khi ®øt b Endonuclease
thø nhÊt. Protein
RecA ®iÒu hßa sù Protein kiÓu RecA
B
trao ®æi chÐo b»ng A B
A
c¸ch liªn kÕt vµo
m¹ch ADN kh«ng (g) CÊu h×nh kh«ng
kÕt cÆp, thóc ®Èy a b gian t−¬ng øng
m¹ch nµy t×m tr×nh (d) C¸c m¹ch ®¬n trao ®æi chÐo
a
tù t−¬ng ®ång víi ADN ligase (cã thÓ cã PhÇn ®Çu d−íi quay
exonuclease vµ ADN b
nã; vµ mét khi tr×nh 180o
polymerase ho¹t
tù t−¬ng ®ång ®−îc ®éng tr−íc ®ã) B
t×m thÊy, nã thóc A B A (f) CÊu h×nh kh«ng
®Èy sù ®æi chç cña
gian 3-D sau khi
mét m¹ch ®¬n h×nh thµnh “cÇu”
thuéc tr×nh tù võa a b liªn kÕt
t×m thÊy víi m¹ch (e) H×nh thµnh “cÇu” liªn kÕt
kh«ng kÕt cÆp. NÕu céng hãa trÞ m¹ch ®¬n a
tr×nh tù t−¬ng ®ång b
t×m thÊy s½n cã ë
d¹ng m¹ch ®¬n th×
hiÖu lùc t¹o “trao
H×nh 6.16. C¬ chÕ t¸i tæ hîp gi÷a c¸c nhiÔm s¾c thÓ t−¬ng ®ång trªn c¬ së m«
®æi chÐo” cña RecA
t¨ng trªn 50 lÇn. h×nh cña Robin Holliday (1964) ®−îc bæ sung b»ng nh÷ng hiÓu biÕt gÇn ®©y.

C¸c m¹ch ®¬n bÞ ®øt th−êng ®−îc nèi l¹i (qua liªn kÕt phosphodiester) nhê ADN
ligase. NÕu nh− c¸c vÞ trÝ ®øt trªn c¸c m¹ch ®¬n cña hai ph©n tö ADN kh«ng t−¬ng ®ång
(kh«ng trïng vÞ trÝ), th× cÇn cã mét sè biÕn ®æi bæ sung kh¸c tr−íc khi ADN ligase cã thÓ
xóc t¸c ph¶n øng nèi. Nh÷ng biÕn ®æi nµy bao gåm viÖc c¾t bá mét sè nucleotide bëi mét
enzym exonuclease vµ ho¹t ®éng tæng hîp söa ch÷a cña ADN polymerase. C¸c sù kiÖn
nµy ®−îc m« t¶ th«ng qua c¸c d¹ng t¸i tæ hîp trung gian ®−îc gäi lµ c¸c d¹ng χ (®äc lµ
“khi”, h×nh 6.16g) t×m thÊy ë nhiÒu sinh vËt kh¸c nhau khi ph©n tÝch NST cña chóng
b»ng kÝnh hiÓn vi ®iÖn tö. C¸c d¹ng χ nµy sau ®ã ®−îc gi¶i phãng bëi ph¶n øng ®øt-nèi

203
§inh §oµn Long

c¸c m¹ch ADN kÕt cÆp bæ sung míi nhê ho¹t ®éng cña c¸c enzym ®Ó h×nh thµnh nªn hai
ph©n tö ADN t¸i tæ hîp (h×nh 6.16j). ë E. coli, sù gi¶i phãng d¹ng χ nh− vËy lµ nhê biÓu
hiÖn cña gen recG hoÆc cña gen ruvC (söa ch÷a sai háng ADN do tia UV). Mçi gen m·
hãa mét endonuclease xóc t¸c ph¶n øng c¾t m¹ch ®¬n t¹i vÞ trÝ ®øt-nèi.
Mét sè b»ng chøng cho thÊy cã thÓ cã nhiÒu c¬ chÕ t¸i tæ hîp t−¬ng ®ång kh¸c n÷a.
Ch¼ng h¹n, theo Jack Szostak, Frlanklin Stahl vµ ®ång nghiÖp (1983), ë S. cerevisiae cã
m« h×nh ®øt-nèi m¹ch kÐp. Theo m« h×nh nµy, sù ®øt-nèi x¶y ra trªn mét trong hai
ph©n tö ADN t−¬ng ®ång (nh−ng trªn c¶ hai m¹ch, chø kh«ng ph¶i trªn mét m¹ch nh−
m« h×nh Holliday). Tõ vÞ trÝ ®øt nèi cã sù më réng ®Ó h×nh thµnh mét ®o¹n ADN “rçng”
(gièng nh− minh häa trªn h×nh 6.15) trªn c¶ hai m¹ch. Mçi ®Çu cña mét m¹ch ®¬n t¹i vÞ
trÝ ®øt “x©m lÊn” sang chuçi kÐp nguyªn vÑn vµ thay thÕ c¸c m¹ch t−¬ng ®ång trong
vïng nµy. C¸c tr×nh tù m¹ch ®¬n “rçng” sau ®ã ®−îc lÊp ®Çy bëi ho¹t ®éng tæng hîp cña
hÖ thèng söa ch÷a ADN. Sù kh¸c biÖt cña m« h×nh nµy lµ cã sù h×nh thµnh ®ång thêi hai
“cÇu” trao ®æi chÐo trªn hai m¹ch ®¬n cña c¸c ®o¹n NST t−¬ng ®ång. C¸c “cÇu” trao ®æi
chÐo nµy sau ®ã bÞ ®øt bëi ho¹t ®éng cña enzym endonuclease gièng nh− m« h×nh
Holliday. C¶ hai m« h×nh Holliday vµ ®øt-nèi m¹ch kÐp ®Òu gióp gi¶i thÝch ®−îc sù xuÊt
hiÖn c¸c d¹ng t¸i tæ hîp cña c¸c dÊu chuÈn di truyÒn bªn c¹nh c¸c vÞ trÝ trao ®æi chÐo.

6.7.2. Trao ®æi chÐo trong c¬ chÕ söa ch÷a ADN


§Õn ®©y, chóng ta míi chØ nãi ®Õn sù t¸i tæ hîp di truyÒn do sù ®øt-nèi cña c¸c
nhiÔm s¾c tö vµ sù trao ®æi t−¬ng hç gi÷a c¸c phÇn t−¬ng ®ång cña chóng. Tuy vËy, c¸c
ph©n tÝch bé bèn ë Ascomycetes cho thÊy sù trao ®æi nh− vËy kh«ng ph¶i lóc nµo còng
t−¬ng hç. §iÒu nµy ®−îc ph¸t hiÖn thÊy trong phÐp lai gi÷a hai d¹ng ®ét biÕn liªn kÕt
gÇn ë Neurospora. Cô thÓ lµ, khi ng−êi ta tiÕn hµnh lai hai d¹ng ®ét biÕn liªn kÕt gÇn m1
vµ m2 lµ m1m2+ víi m1+m2 (alen cã dÊu “ + ” lµ kiÓu +
a) a m
+
b
+
d¹i), ng−êi ta thu ®−îc 4 cÆp nang cã kiÓu h×nh
sau: 1) cÆp sè 1 lµ m1+m2; 2) cÆp sè 2 lµ m1+m2+; 3) +
m kÕt cÆp sai
+ +
cÆp sè 3 lµ m1m2 vµ 4) cÆp sè 4 lµ m1m2 (gièng cÆp + +
a b
sè 3). Nh− vËy, xuÊt hiÖn kiÓu h×nh kiÓu d¹i C¸c chuçi dÞ m
+
xo¾n kÐp a m b
m1+m2+, nh−ng ®¸ng l−u ý nhÊt lµ kh«ng xuÊt hiÖn
kiÓu h×nh ®ét biÕn kÐp m1m2. NÕu sù t¸i tæ hîp m kÕt cÆp sai
t−¬ng ®ång x¶y ra, th× bÊt cø khi nµo thu ®−îc kiÓu
a m b
h×nh kiÓu d¹i m1+m2+ th× còng ph¶i thu ®−îc kiÓu
h×nh ®ét biÕn kÐp m1m2. ë ®©y, ®iÒu nµy kh«ng x¶y b) + + +
ra; ®ång thêi, tØ lÖ kiÓu h×nh m2+ : m2 ®−îc mong a m b
®îi lµ 2 : 2, mµ trong thùc tÕ l¹i lµ 3 : 1. C¸c nghiªn m+
+

m
cøu ph©n tö sau nµy cho thÊy, ®· cã hiÖn t−îng
+ + + +
“chuyÓn ®æi” mét alen m2 thµnh m2 , vµ sù t¸i tæ a m b
hîp kh«ng t−¬ng ®ång nµy ®−îc gäi lµ sù ®æi gen. a m
+
b C¾t bá vµ tæng
Sù ®æi gen ë ®©y kh«ng ph¶i do ®ét biÕn ng−îc (do m
+ hîp söa sai
kh«ng xuÊt hiÖn alen míi); ®ång thêi tÇn sè t¸i tæ m
hîp cña mét sè dÊu chuÈn gÇn vÞ trÝ trao ®æi chÐo a m b
lµ 50%. Trong thùc tÕ, ®· diÔn ra hiÖn t−îng söa H×nh 6.17. Söa ch÷a ADN kiÓu “®æi gen”
ch÷a ADN ®ång thêi víi trao ®æi chÐo (h×nh 6.17). ®ång thêi víi trao ®æi chÐo t−¬ng ®ång.

204
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

Víi c¸c dÊu chuÈn liªn kÕt gÇn, b


+
ng−êi ta thÊy viÖc ®æi gen cßn x¶y ra
th−êng xuyªn h¬n t¸i tæ hîp t−¬ng a+ m
+

®ång. Trong mét nghiªn cøu ph©n tÝch m


+

®ét biÕn his1 ë nÊm men, 980 trong sè Söa ch÷a ADN
1081 nang ph©n tÝch cã kiÓu h×nh kiÓu m
+
d¹i his1+ lµ do ®æi gen, trong khi chØ cã m
+ a
101 nang lµ kÕt qu¶ cña t¸i tæ hîp Söa ch÷a ADN
t−¬ng ®ång. b
§Æc ®iÓm næi bËt nhÊt cña viÖc Endonuclease
+
“®æi gen” lµ tØ lÖ alen ban ®Çu cña b
+ b
phÐp lai (1 : 1) kh«ng ®−îc duy tr× ë +
m
+ a+ m
thÕ hÖ con. §iÒu nµy ®−îc gi¶i thÝch a+ +
m
+ m
bëi c¸c ph©n ®o¹n ng¾n ADN mang
alen ®ét biÕn cña bè/mÑ bÞ ph©n gi¶i
sau ®ã ®−îc tæng hîp l¹i dùa trªn m
+
m
+
+ a + a
m¹ch khu«n lµ ®o¹n ADN mang alen m m
kiÓu d¹i cña mÑ/bè t−¬ng øng. Trªn
h×nh 6.16d-i, cã mét ph©n ®o¹n ADN b b
gi÷a c¸c locut A vµ B (n¬i cã c¸c ®o¹n
ADN m¹ch ®¬n cña hai NST t−¬ng + + + +
®ång) kÕt cÆp bæ sung víi nhau. NÕu a m b a+ m b
mét cÆp alen thø 3 n»m trong ph©n m
+
m
+

®o¹n nµy ph©n li trong trao ®æi chÐo vµ + vµ +


m m
th× sù kÕt cÆp sai cã thÓ x¶y ra ë hai + +
chuçi xo¾n kÐp (t−¬ng øng víi 2 nhiÔm a+ m b a m b
s¾c tö, h×nh 6.17a). Ph©n tö ADN ADN ligase ADN ligase
chøa c¸c alen kh¸c nhau trªn hai a m
+
b
+
a+ m
+
b
+

m¹ch ®¬n cña chóng ®−îc gäi lµ chuçi + +


dÞ xo¾n kÐp. Khi sù kÕt cÆp sai cña m m
vµ + vµ +
ADN ®−îc söa ch÷a b»ng c¬ chÕ c¾t bá m m
(xem môc 6.5.2 ë trªn), trong ®ã m¹ch a+ m
+
b a m
+
b
m ®−îc c¾t bá vµ tæng hîp l¹i thµnh
C¸c dÊu chuÈn bªn C¸c dÊu chuÈn bªn
m¹ch m+, th× thÓ tø trÞ thu ®−îc sÏ ngoµi t¸i tæ hîp ngoµi gièng bè, mÑ
gièng víi h×nh 6.17b. Trªn c¬ së ®ã,
trong lÇn ph©n bµo tiÕp theo, sù sao H×nh 6.18. Söa ch÷a ADN kiÓu “®æi gen” liªn kÕt víi c¸c
chÐp ADN theo c¬ chÕ b¸n b¶o toµn sÏ dÊu chuÈn (gen) bªn ngoµi theo kiÓu gièng bè, mÑ hoÆc
dÉn ®Õn h×nh thµnh 6 nang mang alen theo kiÓu t¸i tæ hîp.
m+ vµ chØ cã 2 nang mang alen m (v×
vËy, tØ lÖ ph©n li kiÓu h×nh lµ 3 : 1).
NÕu chØ cã 1 trong 2 vÞ trÝ kÕt cÆp sai trong thÓ tø trÞ ®−îc söa ch÷a tr−íc lÇn ph©n
bµo nguyªn nhiÔm, th× sù sao chÐp b¸n b¶o toµn cña chuçi dÞ xo¾n kÐp kh«ng ®−îc söa
ch÷a sÏ thu ®−îc mét chuçi nguyªn xo¾n kÐp mang alen m+ vµ mét mang alen m. Lóc
nµy tØ lÖ ph©n li sÏ lµ 5 m+ : 3 m.
HiÖn t−îng “®æi gen” còng liªn quan ®Õn sù t¸i tæ hîp t−¬ng ®ång cña c¸c dÊu
chuÈn ë c¹nh vÞ trÝ trao ®æi chÐo víi tØ lÖ xÊp xØ 50%. Mèi quan hÖ nµy ®−îc gi¶i thÝch bëi
m« h×nh t¸i tæ hîp cña Holliday (h×nh 6.16). Bëi v×, nÕu c¶ hai nhiÔm s¾c tö thuéc cïng
mét thÓ tø trÞ ë d¹ng gièng nh− trªn h×nh th× sù “®æi gen” ®ång thêi ®i kÌm víi sù t¸i tæ
hîp t−¬ng ®ång cña c¸c dÊu chuÈn ë gÇn vÞ trÝ trao ®æi chÐo lµ dÔ x¶y ra (h×nh 6.18). CÇu
liªn kÕt m¹ch ®¬n gi÷a hai nhiÔm s¾c tö ®−îc ph©n gi¶i bëi enzym endonuclease hoÆc

205
§inh §oµn Long

theo chiÒu däc, hoÆc theo chiÒu ngang (theo chiÒu h×nh vÏ). NÕu vÕt c¾t theo chiÒu däc,
th× c¸c nang sÏ mang c¶ 2 alen bÞ ®æi vµ sù t¸i tæ hîp t−¬ng ®ång c¸c gen ë gÇn vÞ trÝ ®øt-
nèi. Nh−ng nÕu vÕt c¾t theo chiÒu ngang th× mét nang mang gen bÞ ®æi vµ sù tæ hîp c¸c
dÊu chuÈn ë gÇn vÞ trÝ ®øt-nèi theo kiÓu gen cña bè/mÑ. V× vËy, nÕu tÇn sè c¾t däc vµ c¾t
ngang lµ t−¬ng ®−¬ng (50% mçi lo¹i) th× sù ®æi gen ®i kÌm víi t¸i tæ hîp t−¬ng ®ång cña
c¸c dÊu chuÈn gÇn vÞ trÝ ®øt-nèi lµ xÊp xØ 50%, phï hîp víi kÕt qu¶ thùc nghiÖm.

6.8. C¸c yÕu tè di truyÒn vËn ®éng (TE)

6.8.1. C©y ng« vµ hiÖn t−îng “gen nh¶y”


Ng« lµ mét trong nh÷ng c©y l−¬ng thùc quan träng hµng ®Çu ë n−íc ta vµ nhiÒu
n−íc trªn thÕ giíi. LÞch sö trång ng« b¾t ®Çu kho¶ng 5000 n¨m tr−íc ë Trung Mü, sau ®ã
ph¸t triÓn ra c¸c vïng kh¸c trªn thÕ giíi. Khi Columbus ph¸t hiÖn ra Ch©u Mü, ng−êi
d©n b¶n ®Þa ë ®©y ®· cã nhiÒu gièng ng« kh¸c nhau. Trong sè ®ã, nhiÒu gièng víi kiÓu
mµu h¹t kh¸c nhau nh− ®á, xanh lam, vµng, tr¾ng, tÝm, säc, ®èm... N¨m 1948, nhµ khoa
häc n÷ ng−êi Mü lµ Barbara McClintock ®· c«ng bè nghiªn cøu nhËn ®Þnh r»ng c¸c gièng
ng« “säc” vµ “®èm” lµ kÕt qu¶ ®ét biÕn do ho¹t ®éng cña yÕu tè di truyÒn vËn ®éng. §Õn
n¨m 1983, bµ ®−îc trao gi¶i th−ëng Nobel nhê c«ng bè nµy. Sau c©y ng«, ng−êi ta ®· t×m
thÊy c¸c tr×nh tù ADN cã thÓ vËn ®éng trong hÖ gen ë hÇu hÕt c¸c loµi sinh vËt kh¸c.
Trong hÖ gen cña nhiÒu loµi, chóng chiÕm mét tØ lÖ ®¸ng kÓ. Ch¼ng h¹n ë ng«, h¬n mét
nöa hÖ gen liªn quan ®Õn ho¹t ®éng cña c¸c TE. ë ng−êi, kho¶ng 40% tr×nh tù hÖ gen cã
liªn quan ®Õn c¸c yÕu tè TE.

6.8.2. C¸c lo¹i yÕu tè di truyÒn vËn ®éng


Cã nhiÒu lo¹i TE víi cÊu
tróc vµ ®Æc ®iÓm ho¹t ®éng B¶ng 6.1. Ph©n lo¹i c¸c yÕu tè di truyÒn vËn ®éng (TE)
kh¸c nhau ®−îc t×m thÊy ë vi theo c¬ chÕ vËn ®éng
khuÈn, nÊm, sinh vËt ®¬n bµo, KiÓu vÝ dô Sinh vËt chñ
thùc vËt còng nh− ®éng vËt.
I. C¸c TE kiÓu c¾t - d¸n
Khi c¸c TE vËn ®éng, chóng
C¸c lo¹i yÕu tè IS (vÝ dô: IS50) Vi khuÈn
cã thÓ lµm ®øt ®o¹n NST vµ
C¸c yÕu tè composite (vi dô: Tn5) Vi khuÈn
g©y ®ét biÕn. Dï mçi lo¹i TE C¸c yÕu tè Ac/Ds Ng«
cã nh÷ng ®Æc tÝnh riªng, C¸c yÕu tè P Ruåi giÊm
nh−ng dùa vµo c¸ch thøc vËn C¸c yÕu tè mariner Ruåi giÊm
®éng trong hÖ gen cña chóng, C¸c yÕu tè hobo Ruåi giÊm
ng−êi ta chia lµm ba nhãm C¸c yÕu tè Tc1 Giun trßn
chÝnh (b¶ng 6.1). Nhãm 1 II. C¸c TE kiÓu sao chÐp
gåm c¸c TE kiÓu c¾t-d¸n. C¸c yÕu tè Tn3 Vi khuÈn
Gäi nh− vËy, bëi sù vËn ®éng III. C¸c TE kiÓu phiªn mt ng−îc
A. C¸c TE kiÓu phiªn m· ng−îc
cña chóng ®i liÒn víi sù “®øt”
(cßn gäi lµ retrotransposon, hay LTR = long tandem repeats)
ra cña tr×nh tù gèc vµ “g¾n” Ty1 NÊm men
vµo mét vÞ trÝ kh¸c trong hÖ copia Ruåi giÊm
gen. Sù c¾t-d¸n cña c¸c TE cã gypsy Ruåi giÊm
thÓ diÔn ra trªn cïng mét B. C¸c retrosposon
NST hoÆc gi÷a c¸c NST kh¸c C¸c yÕu tè F, G vµ I Ruåi giÊm
nhau, nh−ng lu«n ®−îc xóc C¸c retrosposon kÐo dµi ®Çu mót Ruåi giÊm
t¸c bëi enzym ®Æc biÖt lµ nhiÔm s¾c thÓ (vÝ dô: HeT-A, TART)
transposase. Nhãm thø hai LINE (vÝ dô: L1) Ng−êi
gåm c¸c yÕu tè TE khi vËn SINE (vÝ dô: Alu) Ng−êi
®éng chóng ®ång thêi sao

206
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

chÐp (t¸i b¶n) tr×nh tù gèc. Gièng nhãm thø nhÊt, nhãm TE thø hai nµy còng th−êng m·
hãa cho enzym transposase cã vai trß ®iÒu khiÓn sù t−¬ng t¸c cña nã víi vÞ trÝ “®Ých” mµ nã
vËn ®éng tíi. Trong qu¸ tr×nh t−¬ng t¸c, TE ®−îc sao chÐp vµ mét b¶n sao cña nã ®−îc “g¾n”
vµo vÞ trÝ míi; cßn b¶n “gèc” vÉn duy tr× ë vÞ trÝ cò. Nhãm nµy ®−îc gäi lµ c¸c TE kiÓu sao
chÐp. Trong nhãm thø ba, qu¸ tr×nh vËn ®éng cña TE ®−îc thùc hiÖn th«ng qua viÖc “g¾n”
mét b¶n sao cña mét tr×nh tù TE ®−îc phiªn m· ng−îc tõ ph©n tö ARN t−¬ng øng cña nã
vµo vÞ trÝ míi trong hÖ gen. Trong qu¸ tr×nh nµy, cã sù tham gia cña enzym phiªn m· ng−îc
reverse transcriptase, nªn c¸c yÕu tè TE nµy ®−îc gäi lµ c¸c TE phiªn m· ng−îc hay
retrotransposon. NhiÒu TE thuéc nhãm nµy liªn quan ®Õn c¸c retrovirut, v× vËy còng cßn
®−îc gäi lµ c¸c TE kiÓu retrovirut. Mét sè lo¹i TE kh¸c cã cÊu tróc “gi¶n l−îc” ®−îc gäi lµ
retroposon. §Õn nay, nÕu nh− c¸c TE kiÓu c¾t-d¸n ®−îc t×m thÊy ë c¶ prokaryote vµ
eukaryote, th× c¸c TE kiÓu sao chÐp míi chØ thÊy ë prokaryote, cßn c¸c TE kiÓu phiªn m·
ng−îc chØ thÊy ë eukaryote.

6.8.3. C¸c yÕu tè di truyÒn vËn ®éng ë prokaryote


MÆc dï c¸c TE ®Çu tiªn ®−îc t×m thÊy ë c¸c loµi eukaryote, nh−ng nh÷ng TE ®−îc
hiÓu râ ë møc ®é ph©n tö ®Çu tiªn l¹i lµ c¸c TE ë vi khuÈn. ë vi khuÈn, cã ba lo¹i TE
chÝnh: (1) c¸c tr×nh tù cµi, cßn gäi lµ c¸c yÕu tè IS (insertion sequence); (2) c¸c yÕu tè
composite, cßn gäi lµ d¹ng tÝch hîp vµ (3) c¸c yÕu tè Tn3. C¸c yÕu tè IS cã cÊu tróc ®¬n
gi¶n nhÊt, chØ chøa gen m· hãa cho c¸c protein tham gia vµo qu¸ tr×nh vËn ®éng cña TE.
C¸c yÕu tè composite vµ Tn3 cã cÊu t¹o phøc t¹p h¬n, chøa mét sè gen m· hãa cho c¸c
s¶n phÈm kh«ng liªn quan ®Õn ho¹t ®éng vËn ®éng cña TE.
6.8.3.1. C¸c yÕu tè cµi IS
§©y lµ c¸c TE cã cÊu t¹o ®¬n gi¶n nhÊt. Chóng ®−îc gäi lµ c¸c yÕu tè cµi v× chóng cã
thÓ g¾n vµo nhiÒu vÞ trÝ kh¸c nhau trªn NST hoÆc trªn plasmid cña vi khuÈn. C¸c yÕu tè
IS ®Çu tiªn ®−îc t×m thÊy ë E. coli (dßng ®ét biÕn lac-). C¸c dßng vi khuÈn nµy cã kh¶
n¨ng ®ét biÕn phôc håi cao. C¸c nghiªn cøu ë møc ®é ph©n tö cho thÊy, c¸c ®ét biÕn “kÐm
bÒn” nµy lµ do cã c¸c ®o¹n tr×nh tù ADN “bæ sung” vµo mét sè vÞ trÝ c¹nh gen lac. Sau ®ã,
sù phôc håi ®ét biÕn x¶y ra do chÝnh sù rêi khái vÞ trÝ ®· g¾n vµo cña c¸c ®o¹n tr×nh tù bæ
sung nµy. KiÓu vËn ®éng nh− vËy cña c¸c yÕu tè IS sau nµy ®−îc t×m thÊy ë nhiÒu vi
khuÈn kh¸c.
C¸c yÕu tè IS cã cÊu t¹o gän, phÇn lín cã kÝch th−íc nhá h¬n 2500 bp vµ chØ chøa
c¸c gen liªn quan trùc tiÕp tíi sù vËn ®éng cña chóng. §Õn nay, ®· ph¸t hiÖn ®−îc nhiÒu
lo¹i yÕu tè IS kh¸c nhau. Lo¹i nhá nhÊt, IS1, cã kÝch th−íc 768 bp, ®−îc x¸c ®Þnh ranh
giíi bëi hai tr×nh tù ng¾n lÆp l¹i ng−îc chiÒu ë hai ®Çu, kÝ hiÖu lµ ITR (inverted
terminal repeat). Mçi yÕu tè IS th−êng cã tr×nh tù ITR ®Æc thï (nh−ng kh«ng nhÊt thiÕt),
víi chiÒu dµi tõ 9 ®Õn 40 bp. Khi tr×nh tù ITR bÞ ®ét biÕn, yÕu tè IS th−êng mÊt kh¶ n¨ng
vËn ®éng. §iÒu nµy cho thÊy, c¸c tr×nh tù ITR cã vai trß quyÕt ®Þnh trong sù vËn ®éng
cña c¸c yÕu tè IS.
Ýt nhÊt mét sè yÕu tè IS ®−îc t×m thÊy mang gen m· hãa cho mét enzym ®Æc biÖt cã
vai trß quan träng trong sù vËn ®éng cña b¶n th©n chóng lµ transposase. Trong qu¸
tr×nh vËn ®éng cña IS, transposase d−êng nh− g¾n vµo vÞ trÞ ë phÝa ®Çu hoÆc gÇn ®Çu cña
tr×nh tù vËn ®éng, ®ång thêi c¾t m¹ch ADN sîi kÐp t¹i vÞ trÝ gèc. ViÖc c¾t ph©n tö ADN
sîi kÐp ë vÞ trÝ nµy lµm t¸ch tr×nh tù vËn ®éng khái NST hoÆc plasmid, nhê vËy chóng cã
thÓ “vËn ®éng” tíi mét vÞ trÝ kh¸c trong hÖ gen. Khi c¸c IS g¾n vµo mét vÞ trÝ míi trªn
NST hoÆc plasmid, nã sÏ g©y ra sù nh©n ®«i mét tr×nh tù ng¾n ë hai ®Çu t¹i vÞ trÝ nã g¾n
vµo (do t¹i vÞ trÝ nµy, ph©n tö ADN sîi kÐp th−êng bÞ c¾t theo kiÓu ch÷ chi). Trong ®ã mçi
b¶n sao cña tr×nh tù ®−îc nh©n ®«i n»m vÒ mét phÝa cña yÕu tè di truyÒn vËn ®éng.

207
§inh §oµn Long

Nh÷ng tr×nh tù nµy (th−êng gåm


 Hai m¹ch ®¬n cña tr×nh tù ADN ®Ých
tõ 2 ®Õn 13 cÆp nucleotide) ®−îc ®−îc c¾t t¹i c¸c vÞ trÝ kh¸c nhau (mòi tªn)
gäi lµ c¸c tr×nh tù nh©n ®«i t¹i vÞ
trÝ ®Ých (h×nh 6.19).
NST vi khuÈn cã thÓ cã  YÕu tè IS cµi vµo ®o¹n rçng ADN ®−îc
nhiÒu b¶n sao kh¸c nhau cña t¹o ra do enzym c¾t kiÓu ch÷ chi

cïng mét lo¹i yÕu tè IS. Ch¼ng


h¹n, mçi tÕ bµo E. coli th−êng cã
Sù tæng hîp ADN lÊp ®Çy c¸c vÞ trÝ rçng
tõ 6 tíi 10 b¶n sao yÕu tè IS1.  b»ng c¸c nucleotide cßn thiÕu (mµu ghi) ë
Plasmid còng cã thÓ mang yÕu tè hai ®Çu cña yÕu tè IS. §iÒu nµy dÉn ®Õn
IS. Ch¼ng h¹n, plasmid F ®iÓn sù hai tr×nh tù ng¾n lÆp l¹i cïng chiÒu ë
hai vïng biªn cña tr×nh tù ®Ých
h×nh th−êng chøa Ýt nhÊt hai yÕu
tè IS kh¸c nhau lµ IS2 vµ IS3.
Khi mét lo¹i yÕu tè IS cã mÆt H×nh 6.19. Sù nh©n ®«i tr×nh tù ë hai vïng biªn c¹nh vÞ trÝ cµi
trªn c¶ NST vµ plasmid, chóng cña c¸c yÕu tè di truyÒn vËn ®éng kiÓu c¾t – d¸n (IS).
g©y nªn hiÖn t−îng “t¸i tæ hîp
t−¬ng ®ång” gi÷a c¸c ph©n tö ADN kh¸c nhau. Sù t¸i tæ hîp nh− vËy ®ãng vai trß trong
sù kÕt hîp plasmid F vµo NST ë E. coli. §Õn ®©y, chóng ta nhí r»ng, c¶ NST vµ plasmid
F ë E. coli ®Òu cã cÊu tróc ph©n tö ADN sîi kÐp, m¹ch vßng. Khi NST vµ plasmid t¸i tæ
hîp ë vïng t−¬ng ®ång (t¹i vÞ trÝ IS cã mÆt trªn c¶ hai ph©n tö ADN), th× plasmid cã kÝch
th−íc nhá sÏ kÕt hîp vµo NST, t¹o nªn mét ph©n tö ADN sîi kÐp vßng trßn duy nhÊt
trong tÕ bµo. Sù kÕt hîp nµy t¹o nªn c¸c dßng Hfr cã kh¶ n¨ng chuyÓn NST cña chóng
sang tÕ bµo kh¸c qua tiÕp hîp. C¸c dßng Hfr kh¸c nhau cã thÓ kh¸c nhau vÒ vÞ trÝ g¾n
kÕt cña plasmid F trªn NST, bëi v× c¸c yÕu tè IS ®iÒu hßa ho¹t ®éng g¾n kÕt cã thÓ n»m ë
c¸c vÞ trÝ kh¸c nhau trªn NST cña c¸c dßng vi khuÈn kh¸c nhau. V× cã vai trß trong viÖc
h×nh thµnh c¸c dßng Hfr nh− vËy, c¸c yÕu tè IS lµm t¨ng kh¶ n¨ng trao ®æi gen gi÷a c¸c
chñng vi khuÈn vµ t¹o ra nhiÒu biÕn dÞ tæ hîp. V× vËy, cïng c¸c ®ét biÕn, ®©y chÝnh lµ
mét c¬ chÕ c¬ b¶n t¹o nguyªn liÖu phong phó cho sù tiÕn hãa ë vi khuÈn.
6.8.3.2. C¸c TE kiÓu composite
C¸c TE kiÓu composite (cßn gäi lµ gen nh¶y tÝch hîp) lµ c¸c tr×nh tù vËn ®éng kiÓu
c¾t – d¸n cã ë vi khuÈn, ký hiÖu Tn, ®−îc h×nh thµnh do sù cã mÆt cña hai tr×nh tù IS
n»m gÇn nhau. C¸c vïng tr×nh tù n»m gi÷a hai yÕu tè IS còng sÏ ®−îc “vËn ®éng” cïng
víi chóng khi c¸c tr×nh tù nµy vËn ®éng trong hÖ gen. Nh− vËy, hËu qu¶ lµ hai yÕu tè IS
cã kh¶ n¨ng “b¾t gi÷” mét ®o¹n tr×nh tù ADN n»m gi÷a vèn b×nh th−êng kh«ng cã kh¶
n¨ng vËn ®éng, vµ “truyÒn” kh¶ n¨ng vËn ®éng cho ®o¹n tr×nh tù nµy. H×nh 6.20 minh
häa 3 vÝ dô. Víi Tn9, hai yÕu tè IS vïng biªn (768 bp) n»m cïng chiÒu víi nhau. Trong
khi ®ã, ë Tn5, hai yÕu tè IS (1533 bp) vïng biªn n»m ng−îc chiÒu. §o¹n tr×nh tù n»m
gi÷a hai yÕu tè IS cã thÓ chøa c¸c gen kh«ng liªn quan ®Õn sù vËn ®éng cña gen. Trong
thùc tÕ, ®o¹n tr×nh tù gi÷a hai yÕu tè IS ë c¶ ba lo¹i yÕu tè Tn ë h×nh 6.20 ®Òu mang c¸c
gen kh¸ng chÊt kh¸ng sinh.
Trong mét sè tr−êng hîp, c¸c yÕu tè IS ë hai ®Çu vïng biªn cña tr×nh tù vËn ®éng
kiÓu composite kh«ng gièng nhau. Ch¼ng h¹n nh− ë yÕu tè Tn5, tr×nh tù IS vïng biªn
ph¶i lµ IS50R cã tr×nh tù m· hãa cho transposase thóc ®Èy sù vËn ®éng cña gen, trong
khi ®ã tr×nh tù IS vïng biªn tr¸i (IS50L) kh«ng cã ®Æc tÝnh nµy. Sù kh¸c biÖt lµ ë mét cÆp
nucleotide duy nhÊt cã vai trß x¸c ®Þnh ho¹t tÝnh cña transposase.

208
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

YÕu tè Tn5
a) b)
còng minh häa cho ~ 2500 bp ~ 5700 bp
mét ®Æc tÝnh kh¸c r r
Gen cam r Gen ble
cña c¸c gen nh¶y Gen kan Gen str
r

kiÓu composite, ®ã lµ 768 bp 768 bp 1533 bp 1533 bp


qu¸ tr×nh vËn ®éng
cña chóng ®−îc ®iÒu IS1 IS1 IS50L IS50R
khiÓn bëi mét sù ®iÒu
§o¹n tr×nh tù hai §o¹n tr×nh tù hai
hßa (h×nh 6.21). Khi ®Çu lÆp l¹i ng−îc ®Çu lÆp l¹i ng−îc
mét thùc khuÈn thÓ chiÒu 23 bp chiÒu 23 bp
mang yÕu tè Tn5 l©y c) ~ 9300 bp
nhiÔm tÕ bµo vi Gen tet
r
khuÈn (vµ kh«ng g©y 1329 bp 1329 bp
tan), th× tÇn sè vËn
IS10L IS10R
®éng cña yÕu tè Tn5
sÏ gi¶m ®i râ rÖt
§o¹n tr×nh tù hai ®Çu lÆp l¹i ng−îc chiÒu 23 bp
trong tr−êng hîp
NST vi khuÈn còng H×nh 6.20. CÊu tróc cña mét sè yÕu tè di truyÒn vËn ®éng kiÓu tÝch hîp
mang mét b¶n sao (composite transposon). KÝch th−íc vµ h−íng cña c¸c tr×nh tù thµnh phÇn ®−îc
cña Tn5. HiÖn t−îng biÓu diÔn b»ng c¸c chØ sè (cÆp baz¬ nit¬, bp) vµ mòi tªn. a) YÕu tè Tn9 mang hai
nµy cho thÊy, viÖc cã yÕu tè cµi IS1 cã tr×nh tù cïng chiÒu n»m ë hai ®Çu cña gen kh¸ng
s½n mét b¶n sao cña chloramphenicol; b) YÕu tè Tn5 mang hai yÕu tè IS50 cã tr×nh tù ng−îc chiÒu n»m
TE trong tÕ bµo chñ ë hai ®Çu côm gen gåm c¸c gen kh¸ng kanamycin, bleomycin vµ streptomycin (L =
cã t¸c dông øc chÕ sù bªn tr¸i, R = bªn ph¶i); c) YÕu tè Tn10 chøa gåm hai yÕu tè IS10 n»m ë hai ®Çu
vËn ®éng trong hÖ mét ®o¹n ADN mang gen kh¸ng tetracyclin (theo Snudtard, 2004).
gen cña nã. HiÖn
t−îng nµy cã thÓ do sù tæng hîp mét chÊt øc chÕ nµo ®ã g©y ra. Gi¶ thiÕt nµy sau ®ã ®−îc
chøng minh bëi c¸c nghiªn cøu cña Michael Syvaen, William Reznikoff vµ c¸c céng sù.
YÕu tè IS50R cña Tn5 trong thùc tÕ ®· m· hãa cho hai protein. Mét lo¹i lµ transposase
xóc t¸c qu¸ tr×nh vËn ®éng cña gen. Lo¹i thø hai lµ protein transposase bÞ c¾t mét phÇn
do ®−îc phiªn m· tõ mét tr×nh tù khëi ®éng n»m bªn trong tr×nh tù m· hãa transposase
®Çy ®ñ, lµm øc chÕ sù vËn ®éng cña gen. Do protein thø hai nµy ng¾n h¬n vµ phæ biÕn
h¬n, nªn sù vËn ®éng cña Tn5 bÞ øc chÕ.

a) b)
IS10L IS10R

Transposase

YÕu tè
YÕu tè Tn5 YÕu tè Tn5 IS50R ®ång
thØnh tho¶ng hiÕm khi ChÊt øc chÕ thêi s¶n sinh
vËn ®éng vËn ®éng hai lo¹i protein
kh¸c nhau do sù dÞch
m· b¾t ®Çu tõ hai bé
ba më ®Çu kh¸c nhau

H×nh 6.21. Sù ®iÒu hßa ho¹t ®éng cña yÕu tè Tn5. a) TÕ bµo E. coli bÞ g©y nhiÔm bëi virut mang yÕu tè
Tn5. C¸c tÕ bµo ®· s½n cã Tn5 trªn nhiÔm s¾c thÓ h¹n chÕ sù vËn ®éng cña c¸c yÕu tè nµy. b) C¬ së di
truyÒn ®iÒu hßa ho¹t ®éng cña Tn5: Mét lo¹i protein do Tn5 m· hãa lµ transposase xóc t¸c (thóc ®Èy) sù
vËn ®éng cña cña chÝnh nã, nh−ng mét protein kh¸c (chÊt øc chÕ) l¹i øc chÕ qu¸ tr×nh nµy. Protein øc chÕ
cã kÝch th−íc nhá h¬n, phæ biÕn h¬n, nªn chiÕm −u thÕ ®Æc biÖt khi cã nhiÒu b¶n sao Tn5 trong tÕ bµo.

209
§inh §oµn Long

6.8.3.3. C¸c TE kiÓu Tn3 a) CÊu tróc cña yÕu tè Tn3.


C¸c TE thuéc nhãm nµy th−êng 4957 bp
cã kÝch th−íc lín h¬n c¸c yÕu tè IS vµ
chøa c¸c gen kh«ng liªn quan ®Õn tnpA tnpR bla
qu¸ tr×nh vËn ®éng cña chóng. §Æc
VÞ trÝ res
®iÓm nµy gièng víi c¸c yÕu tè kiÓu
composite. Tuy vËy, kh«ng gièng nh− Transposase Resolvase β-lactamase
(chÊt øc chÕ)
c¸c yÕu tè composite, c¸c yÕu tè Tn3
kh«ng cã c¸c tr×nh tù IS ë c¸c ®Çu §o¹n tr×nh tù hai ®Çu lÆp
l¹i ng−îc chiÒu 38 bp
tËn cïng cña chóng. Thay vµo ®ã, c¸c
b) Sù vËn ®éng cña Tn3 qua sù h×nh thµnh ADN tÝch hîp
yÕu tè nµy cã c¸c tr×nh tù lÆp l¹i
ng−îc chiÒu ë hai ®Çu víi chiÒu dµi Plasmid thÓ cho Plasmid thÓ nhËn
kho¶ng tõ 38 ®Õn 40 nucleotide. Khi Tn3
vËn ®éng vµo vÞ trÝ ®Ých, c¸c yÕu tè
Tn3 còng t¹o ra sù nh©n ®«i tr×nh tù
ng¾n t¹i vïng biªn t¹i vÞ trÝ chóng
xen vµo. H×nh 6.22a minh häa cÊu
Transposase  Transposase do Tn3 m· hãa xóc t¸c
tróc cña mét yÕu tè Tn3 ®iÓn h×nh. sù h×nh thµnh ph©n tö ADN tÝch hîp
YÕu tè nµy gåm cã ba gen tnpA, tnpR gi÷a plasmid thÓ cho vµ plasmid thÓ
nhËn. Trong qu¸ tr×nh nµy, yÕu tè Tn3
vµ bla m· hãa t−¬ng øng cho c¸c ®ång thêi sao chÐp, dÉn ®Õn ë mçi
protein lµ transposase, protein øc ®Çu nèi gi÷a plasmid thÓ cho vµ thÓ
chÕ gäi lµ resolvase, vµ mét enzym nhËn cã mét b¶n sao cña yÕu tè Tn3.
gäi lµ β-lactamase. β-lactamase t¹o
nªn tÝnh kh¸ng kh¸ng sinh Ph©n tö
ampicillin cña vi khuÈn, cßn hai ADN
protein kia cã vai trß trong ®iÒu hßa tÝch hîp
sù vËn ®éng cña gen.
Sù vËn ®éng cña yÕu tè Tn3
diÔn ra qua hai giai ®o¹n (h×nh do gen tnpR m· hãa ph©n
6.22b). Trong giai ®o¹n ®Çu, Resolvase
 Resolvase
t¸ch ph©n tö tÝch hîp qua ®iÒu tiÕt sù
transposase ®iÒu hßa sù dung hîp t¸i tæ hîp gi÷a hai yÕu tè Tn3.
cña hai ph©n tö ADN cã cÊu tróc
vßng, mét lo¹i mang yÕu tè Tn3, cßn
lo¹i kia th× kh«ng. KÕt qu¶ cña qu¸
tr×nh ®ã lµ sù h×nh thµnh ph©n tö
ADN tÝch hîp. Trong khi qu¸ tr×nh
nµy diÔn ra, b¶n th©n tr×nh tù Tn3
®−îc sao chÐp vµ mçi b¶n sao cña
chóng ®−îc g¾n vµo mét ®Çu t¹i chç  Plasmid thÓ cho vµ thÓ
nèi cña hai ph©n tö ADN ban ®Çu. nhËn t¸ch nhau ra, mçi
plasmid cã mét b¶n
Hai b¶n sao tr×nh tù Tn3 n»m trong sao cña Tn3
ph©n tö ADN tÝch hîp cã chiÒu gièng
nhau. Trong giai ®o¹n sau, protein
resolvase ®−îc m· hãa bëi gen tnpR
cã t¸c dông ®iÒu hßa sù t¸i tæ hîp t¹i H×nh 6.22. CÊu tróc vµ sù vËn ®éng cña c¸c yÕu tè kiÓu Tn3.
mét vÞ trÝ ®Æc hiÖu n»m gi÷a hai b¶n
sao cña tr×nh tù Tn3, gäi lµ vÞ trÝ t¸i tæ hîp res (recombination site), ®Ó t¹o thµnh hai
ph©n tö ADN míi. Mçi ph©n tö mang mét b¶n sao cña Tn3. Nh− vËy, sù vËn ®éng cña

210
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

c¸c yÕu tè Tn3 diÔn ra theo kiÓu sao chÐp liªn quan ®Õn sù h×nh thµnh cña mét ph©n tö
ADN tÝch hîp trung gian.
S¶n phÈm cña gen tnpR trong yÕu tè Tn3 cßn cã mét chøc n¨ng n÷a, ®ã lµ nã øc chÕ
sù tæng hîp cña c¶ hai protein transposase vµ resolvase. Ho¹t ®éng øc chÕ x¶y ra do vÞ trÝ
res n»m ë gi÷a hai gen tnpA vµ tnpR. Khi liªn kÕt vµo vÞ trÝ res, protein tnpR ng¨n c¶n sù
phiªn m· cña hai gen tnpA vµ tnpR. Lóc nµy, yÕu tè Tn3 trë vÒ tr¹ng th¸i tÜnh (kh«ng
vËn ®éng).

6.8.3.4. ý nghÜa y häc cña c¸c yÕu tè di truyÒn vËn ®éng ë vi khuÈn
NhiÒu lo¹i TE ë vi khuÈn mang c¸c gen kh¸ng kh¸ng sinh. HËu qu¶ lµ, viÖc vËn
®éng cña c¸c yÕu tè nµy dÔ dµng chuyÓn c¸c gen kh¸ng kh¸ng sinh tõ ph©n tö ADN nµy
sang ph©n tö ADN kh¸c (vÝ dô nh− gi÷a NST vµ plasmid). Dßng vËn ®éng cña th«ng tin
di truyÒn nh− vËy cã ý nghÜa y häc hÕt søc quan träng do nhiÒu ph©n tö ADN sau khi
®−îc bæ sung c¸c gen kh¸ng kh¸ng sinh cã thÓ ®−îc chuyÓn sang c¸c tÕ bµo kh¸c. Kh¶
n¨ng kh¸ng kh¸ng sinh cã thÓ ®−îc lan truyÒn gi÷a c¸c quÇn thÓ hoÆc gi÷a c¸c thÕ hÖ tÕ
bµo kh¸c nhau cña vi khuÈn. KÕt qu¶ cuèi cïng cña qu¸ tr×nh nµy lµ tÊt c¶ (hoÆc hÇu
hÕt) c¸c tÕ bµo vi khuÈn trong quÇn thÓ ®Òu cã kh¶ n¨ng kh¸ng kh¸ng sinh.

HiÖn t−îng kh¸ng kh¸ng sinh do ho¹t ®éng cña TE ®−îc t×m thÊy mét sè vi khuÈn
g©y bÖnh ë ng−êi, bao gåm c¸c chñng cña Staphylococcus, Enterococcus, Neisseria,
Plasmid mang gen kh¸ng chÊt
YÕu tè x¸c ®Þnh tÝnh kh¸ng (R) kh¸ng sinh streptomycin

 Sù t¸i tæ hîp gi÷a c¸c yÕu tè


IS1 n»m trong mét plasmid
kh«ng cã kh¶ n¨ng t¹o cÇu
tiÕp hîp nh−ng mang gen
r
kh¸ng streptomycin (str ) víi
mét plasmid cã kh¶ n¨ng tiÕp
hîp t¹o nªn mét yÕu tè cã kh¶
n¨ng tiÕp hîp mang gen kh¸ng
chÊt kh¸ng sinh (yÕu tè truyÒn
tÝnh kh¸ng – RTF).

Thµnh phÇn yÕu tè truyÒn RTF


tÝnh kh¸ng (RTF) Plasmid tiÕp hîp
Plasmid tiÕp hîp R
Plasmid mang gen kh¸ng chÊt
kh¸ng sinh tetracyclin
 Sù t¸i tæ hîp th«ng qua sù ®iÒu
tiÕt cña yÕu tè IS1 gi÷a plasmid
tiÕp hîp R kh¸ng streptomycin
vµ mét plasmid mang gen
r
kh¸ng tetracyclin (tet ) t¹o nªn
mét plasmid R tÝch hîp míi
mang c¶ hai gen kh¸ng c¸c
chÊt kh¸ng sinh lµ streptomycin
vµ tetracyclin

RTF
Plasmid tiÕp hîp R mang
gen kh¸ng streptomycin RTF
H×nh 6.23. Sù tiÕn hãa cña c¸c
Plasmid tiÕp hîp R mang gen kh¸ng
plasmid tiÕp hîp mang c¸c gen streptomycin vµ tetracyclin
kh¸ng kh¸ng sinh.

211
§inh §oµn Long

Shigella vµ Salmonella. HiÖn nay, mét sè bÖnh do vi khuÈn g©y nªn, bao gåm kiÕt lþ, lao
vµ lËu, trë nªn khã ®iÒu trÞ do hiÖn t−îng kh¸ng kh¸ng sinh cña vi khuÈn. Trong mét sè
tr−êng hîp, c¸c vi khuÈn g©y bÖnh cã thÓ cïng lóc kh¸ng l¹i nhiÒu chÊt kh¸ng sinh kh¸c
nhau vµ trë thµnh c¸c t¸c nh©n g©y bÖnh cùc kú nguy hiÓm. H×nh 6.23 minh häa c¬ chÕ
truyÒn tÝnh kh¸ng kh¸ng sinh phæ biÕn ë vi khuÈn qua c¸c TE n»m trong plasmid.
Sù ph¸t triÓn vµ lan trµn kh¶ n¨ng kh¸ng nhiÒu chÊt kh¸ng sinh trong c¸c quÇn thÓ
vi khuÈn cµng ®−îc thóc ®Èy do sù cã mÆt cña plasmid tiÕp hîp R th−êng mang c¸c gen
kh¸ng kh¸ng sinh. C¸c plasmid lo¹i nµy cã hai thµnh phÇn. Mét thµnh phÇn gäi lµ yÕu tè
truyÒn tÝnh kh¸ng RTF (resistance transfer factor) chøa c¸c gen cÇn thiÕt cho qu¸ tr×nh
tiÕp hîp gi÷a c¸c tÕ bµo vi khuÈn. Thµnh phÇn thø hai lµ yÕu tè x¸c ®Þnh tÝnh kh¸ng R
chøa c¸c gen kh¸ng kh¸ng sinh. Trong quÇn thÓ vi khuÈn, sù ph¸t t¸n c¸c plasmid R diÔn
ra víi tèc ®é nhanh, thËm chÝ chóng ®−îc truyÒn tõ loµi nµy sang loµi kh¸c, nh− gi÷a vi
khuÈn coccus vµ vi khuÈn bacillus. V× vËy, nÕu nh− tÝnh kh¸ng kh¸ng sinh ®· xuÊt hiÖn ë
mét vi khuÈn nµo ®ã, th× nã cã thÓ lan trµn ra toµn giíi vi khuÈn.

6.8.4. C¸c yÕu tè di truyÒn vËn ®éng ë ThÓ giao tö ♀ ThÓ giao tö ♂
eukaryote C
I
RÊt nhiÒu lo¹i TE còng ®· ®−îc t×m C Ds
thÊy ë sinh vËt nh©n thËt. Nh÷ng yÕu tè
nµy kh¸c nhau vÒ kÝch th−íc, cÊu tróc vµ C C¸c nhiÔm s¾c thÓ cña
®Æc tÝnh vËn ®éng. Mét sè lo¹i phæ biÕn  bè (h¹t phÊn) vµ mÑ
kh¾p hÖ gen, mét sè chØ hiÕm gÆp. Trong (nh©n sinh d−ìng 2n
phÇn nµy, chóng ta sÏ t×m hiÓu mét sè cña no·n) kÕt hîp trong
Thô phÊn qu¸ tr×nh thô phÊn h×nh
lo¹i TE kiÓu c¾t - d¸n. C¸c yÕu tè TE nµy thµnh nªn tÕ bµo néi
cã tr×nh tù lÆp l¹i ng−îc chiÒu ë hai ®Çu C nhò tam béi.
vµ mçi lÇn xen vµo mét ph©n tö ADN,
C
chóng t¹o ra c¸c tr×nh tù nh©n ®«i t¹i vÞ
trÝ ®Ých. C¸c TE kiÓu c¾t-d¸n th−êng m· I
C Ds
hãa cho enzym transposase xóc t¸c sù
vËn ®éng cña chóng trong hÖ gen. Sù “®øt g·y” nhiÔm s¾c
VÞ trÝ nhiÔm  thÓ x¶y ra ë vÞ trÝ cña
6.8.4.1. C¸c yÕu tè Ac vµ Ds ë c©y ng« s¾c thÓ bÞ ®øt yÕu tè (tr×nh tù) Ds.
C¸c yÕu tè Ac vµ Ds ®−îc ph¸t hiÖn
®Çu tiªn n¨m 1948 bëi Barbara C
McClintock. Qua ph©n tÝch di truyÒn,
McClintock chøng minh ®−îc ho¹t ®éng C
cña c¸c yÕu tè nµy lµ nguyªn nh©n g©y
C Ds
I
nªn c¸c tÝnh tr¹ng h¹t “säc” vµ “®èm” ë
ng«. Nh−ng ph¶i nhiÒu n¨m sau ®ã, c¸c
§o¹n nhiÔm s¾c thÓ
nghiªn cøu cña Nina Federoff, Joachim §o¹n nhiÔm  mang
Nguyªn gen øc chÕ h×nh
Messing, Peter Starlinger, Heinz s¾c thÓ kh«ng
ph©n thµnh s¾c tè bÞ mÊt, nªn
Saedler, Susan Wessler vµ céng sù míi t©m bÞ mÊt h×nh thµnh dßng tÕ bµo
lµm s¸ng tá cÊu tróc vµ c¬ chÕ ho¹t ®éng chøa s¾c tè (cã mµu).
ë møc ph©n tö cña chóng. Dßng c¸c tÕ bµo cã mµu
(kiÓu gen –CC)
McClintock ®· ph¸t hiÖn ra c¸c yÕu
tè Ac vµ Ds nhê nghiªn cøu sù “®øt ®o¹n” H×nh 6.24. Sù “®øt gty” nhiÔm s¾c thÓ g©y ra do sù
NST. Bµ ®· dïng c¸c dÊu chuÈn di ho¹t ®éng cña gen nh¶y Ds ë ng«. Alen C trªn vai ng¾n
truyÒn liªn quan ®Õn mµu s¾c h¹t ng« ®Ó cña NST sè 9 t¹o ra mµu s¾c b×nh th−êng ë protein h¹t
I
ph¸t hiÖn hiÖn t−îng ®øt ®o¹n nµy. Khi (al¬ron), nh−ng alen C øc chÕ qu¸ tr×nh h×nh thµnh c¸c
mét dÊu chuÈn nµo ®ã mÊt ®i, s¾c tè nh− vËy, nªn chóng trë nªn kh«ng mµu.

212
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

McClintock cho r»ng ®o¹n NST mang gen t−¬ng øng bÞ mÊt, vµ cã hiÖn t−îng “®øt ®o¹n”
x¶y ra. DÊu chuÈn bÞ mÊt mµ McClintock quan s¸t ®−îc khi ph©n tÝch lµ mµu cña líp vá
h¹t thuéc phÇn néi nhò tam béi cña ng«.
Trong mét d·y c¸c thÝ nghiÖm, dÊu chuÈn di truyÒn mµ McClintock ®· theo dâi lµ
mét alen thuéc locus C n»m trªn vai ng¾n cña NST sè 9. Do alen CI nµy lµ mét alen tréi
øc chÕ sù t¹o s¾c tè h¹t ng«, nªn mäi h¹t ng« mang alen nµy ®Òu kh«ng cã mµu.
McClintock ®· tiÕn hµnh thô phÊn hoa c¸i c©y ng« cã kiÓu gen CC víi h¹t phÊn cña c©y
cã kiÓu gen CI CI, ®Ó t¹o ra h¹t ng« cã phÇn néi nhò mang kiÓu gen CICC (tÕ bµo néi nhò
nhËn hai alen tõ mÑ, vµ mét alen tõ bè). MÆc dï, McClintock ph¸t hiÖn thÊy phÇn lín c¸c
h¹t ng« kh«ng mµu nh− mong ®îi, nh−ng mét sè h¹t cã c¸c vïng mang s¾c tè tÝm - n©u.
McClinctock cho r»ng hiÖn t−îng kh¶m mµu nh− vËy lµ do alen CI bÞ mÊt ®i trong qu¸
tr×nh ph¸t triÓn néi nhò, dÉn ®Õn sù h×nh thµnh mét sè m« cã kh¶ n¨ng tæng hîp s¾c tè.
KiÓu gen cña kiÓu m« nµy sÏ lµ -CC (trong ®ã dÊu “-”biÓu diÔn cho alen CI bÞ mÊt).
C¬ chÕ mµ McClintock ®· dïng ®Ó gi¶i thÝch cho hiÖn t−îng mÊt ®i cña alen CI ®−îc
m« t¶ trªn h×nh 6.24. Mét “vÕt ®øt” x¶y ra ë vÞ trÝ mòi tªn lµm rêi mét ®o¹n NST khái
t©m ®éng cña nã vµ h×nh thµnh nªn ®o¹n NST kh«ng t©m. §o¹n NST nµy cã xu h−íng
mÊt ®i trong qu¸ tr×nh ph©n bµo. V× vËy, tÊt c¶ c¸c tÕ bµo con sinh ra tõ tÕ bµo nµy sÏ
mÊt ®i mét phÇn NST ban ®Çu. Do ®o¹n bÞ mÊt mang alen CI nªn kh«ng mét tÕ bµo nµo
trong dßng tÕ bµo con nµy bÞ øc chÕ qu¸ tr×nh h×nh thµnh s¾c tè, v× vËy t¹o nªn hiÖn
t−îng h¹t cã mµu kh¶m nh− quan s¸t thÊy trong tù nhiªn.
McClintock ®ång thêi ph¸t hiÖn ra r»ng sù ®øt ®o¹n g©y nªn hiÖn t−îng h¹t cã mµu
kh¶m xuÊt hiÖn ë mét vÞ trÝ nhÊt ®Þnh trªn NST sè 9. Bµ ®Æt tªn cho yÕu tè t¹o ra hiÖn
t−îng ®øt ®o¹n nµy lµ Ds (viÕt t¾t cña tõ Dissociation). Tuy vËy, b¶n th©n yÕu tè Ds
kh«ng thÓ g©y nªn hiÖn t−îng “®øt ®o¹n” NST, mµ nã cÇn ®−îc ho¹t hãa bëi mét yÕu tè
kh¸c gäi lµ Ac (viÕt t¾t cña tõ Activator). YÕu tè Ac cã mÆt trong mét sè gièng ng«. Khi
tiÕn hµnh lai gi÷a c¸c gièng nµy víi nhau, yÕu tè Ac kÕt hîp víi Ds ®Ó t¹o ®iÒu kiÖn cho
sù “®øt ®o¹n” x¶y ra.
HÖ thèng hai yÕu tè Ac/Ds gióp gi¶i thÝch cho hiÖn t−îng “di truyÒn kh«ng æn ®Þnh”
mµ McClintock quan s¸t thÊy ë NST sè 9. C¸c thÝ nghiÖm bæ sung sau ®ã ®· chøng minh
®©y chØ lµ mét trong rÊt nhiÒu hiÖn t−îng “di truyÒn kh«ng æn ®Þnh” cã mÆt trong hÖ gen
ë c©y ng«. Ngoµi ra, sau ®ã McClintock ph¸t hiÖn thÊy hiÖn t−îng “®øt ®o¹n” cßn x¶y ra ë
c¸c NST kh¸c, ngoµi NST sè 9. Do nh÷ng “®øt ®o¹n” nµy còng phô thuéc vµo yÕu tè Ac,
nªn bµ ®· kÕt luËn r»ng cã sù tån t¹i cña yÕu tè Ds ë c¸c vÞ trÝ kh¸c nhau trong hÖ gen.
§Ó cã thÓ gi¶i thÝch cho tÊt c¶ c¸c hiÖn t−îng nµy, McClintock cho r»ng Ds cã mÆt ë nhiÒu
vÞ trÝ kh¸c nhau trong hÖ gen vµ cã thÓ vËn ®éng tõ vÞ trÝ nµy s¸ng vÞ trÝ kh¸c. C¸c
nghiªn cøu sau nµy ®· chøng minh gi¶ thiÕt cña McClintock lµ ®óng. C¸c yÕu tè Ac vµ
Ds cïng thuéc mét hä c¸c yÕu tè di truyÒn vËn ®éng. C¸c yÕu tè nµy vÒ mÆt cÊu tróc cã
liªn quan víi nhau vµ cã thÓ xen vµo nhiÒu vÞ trÝ kh¸c nhau trªn NST. Trong hÖ gen ng«,
cã nhiÒu b¶n sao kh¸c nhau cña c¸c yÕu tè Ac vµ Ds. Qua ph©n tÝch di truyÒn,
McClintock chøng minh nh÷ng yÕu tè nµy cã thÓ vËn ®éng trong hÖ gen. Bµ còng ph¸t
hiÖn ra r»ng: khi mét yÕu tè nµy g¾n vµo trong hoÆc gÇn mét gen nµo ®ã, th× chøc n¨ng
cña gen ®ã thay ®æi, thËm chÝ ®«i khi mÊt chøc n¨ng. Nãi c¸ch kh¸c, c¸c yÕu tè Ac vµ Ds
cã kh¶ n¨ng g©y ra c¸c ®ét biÕn khi xen vµo mét gen nµo ®ã. §Ó nhÊn m¹nh vai trß cña
c¸c yÕu tè Ac vµ Ds trong ®iÒu hßa sù biÓu hiÖn cña gen, McClintock gäi c¸c yÕu tè Ac vµ
Ds lµ c¸c yÕu tè ®iÒu hßa.
C¸c nghiªn cøu gi¶i tr×nh tù ADN sau nµy cho thÊy tr×nh tù yÕu tè Ac gåm 4563 bp
cã hai ®Çu tr×nh tù lÆp l¹i ng−îc chiÒu gåm 11 bp (h×nh 6.25a). C¸c tr×nh tù lÆp l¹i ë hai
®Çu lµ cÇn thiÕt ®Ó qu¸ tr×nh vËn ®éng cña yÕu tè Ac cã thÓ diÔn ra. Mçi mét yÕu tè Ac cã
hai vïng biªn ë hai ®Çu lµ c¸c tr×nh tù lÆp l¹i cïng chiÒu gåm 8 bp. Bëi v× c¸c tr×nh tù lÆp

213
§inh §oµn Long

l¹i nµy ®−îc t¹o ra khi yÕu tè Ac xen vµo ph©n a) YÕu tè Ac - cã tr×nh tù ®Çy ®ñ
tö ADN, nªn b¶n th©n chóng lµ s¶n phÈm 4563 bp
nh©n ®«i tr×nh tù t¹i vÞ trÝ ®Ých, chø kh«ng
ph¶i tr×nh tù lÆp l¹i cã trong hÖ gen.
Kh«ng gièng Ac, c¸c yÕu tè Ds cã tÝnh ®a §o¹n tr×nh tù hai ®Çu lÆp l¹i
d¹ng vÒ mÆt cÊu tróc. Chóng còng mang c¸c ng−îc chiÒu 11 bp
tr×nh tù lÆp l¹i ng−îc chiÒu ë hai ®Çu gièng b) YÕu tè Ds - mÊt mét phÇn tr×nh tù bªn trong
hÖt nh− c¸c yÕu tè Ac, chøng tá hai yÕu tè di
truyÒn vËn ®éng nµy thuéc vÒ cïng mét hä,
nh−ng tr×nh tù bªn trong cña chóng th× kh¸c
nhau. Mét sè yÕu tè Ds d−êng nh− cã nguån
gèc tõ c¸c yÕu tè Ac, ®−îc h×nh thµnh do sù
c) YÕu tè Ds dÞ biÖt - cã tr×nh tù bªn trong kh«ng
mÊt ®i mét phÇn tr×nh tù bªn trong (h×nh liªn quan ®Õn yÕu tè Ac
6.25b). Sù mÊt ®i mét phÇn nh÷ng tr×nh tù
nµy cã thÓ lµ do sù sao chÐp ADN kh«ng toµn
vÑn hoÆc do chÝnh qu¸ tr×nh vËn ®éng trong §o¹n tr×nh tù kh«ng t−¬ng ®ång
hÖ gen cña chóng g©y ra. Tuy vËy, mét sè lo¹i
d) YÕu tè Ds kÐp - Mét yÕu tè Ds nµy lång vµo
yÕu tè Ds kh¸c kh«ng thÊy cã tr×nh tù Ac bªn gi÷a mét yÕu tè Ds kh¸c
trong chuçi (h×nh 6.25c). Nh÷ng thµnh viªn
kh¸c th−êng nh− vËy cña hä Ac/Ds ®−îc gäi
lµ c¸c yÕu tè Ds dÞ biÖt. Mét nhãm yÕu tè Ds §o¹n Ds cµi
thø ba cã ®Æc ®iÓm ®Æc tr−ng lµ gåm c¸c tr×nh H×nh 6.25. S¬ ®å cÊu tróc hä c¸c yÕu tè di
tù cña c¸c yÕu tè Ds kh¸c nhau n»m gèi lªn truyÒn vËn ®éng Ac/Ds ë ng«.
nhau (h×nh 6.25d), trong ®ã mét yÕu tè Ds n»m xen vµo gi÷a mét yÕu tè Ds kh¸c víi
chiÒu tr×nh tù ®¶o ng−îc. Nh÷ng yÕu tè Ds lo¹i nµy cßn ®−îc gäi lµ nh÷ng yÕu tè Ds kÐp,
lµ nh÷ng yÕu tè lµm “®øt ®o¹n” NST mµ McClintock ®· quan s¸t thÊy trong c¸c thÝ
nghiÖm cña bµ.
C¸c ho¹t ®éng cña c¸c yÕu tè Ac/Ds (gåm c¸c ho¹t ®éng ®øt khái NST vµ vËn ®éng
trong hÖ gen; còng nh− c¸c hËu qu¶ di truyÒn cã liªn quan gåm sù ®øt ®o¹n NST vµ ®ét
biÕn) ®−îc xóc t¸c bëi transposase do tr×nh tù gen trong yÕu tè Ac m· hãa. Protein
transposase sau khi ®−îc h×nh thµnh cã sù t−¬ng t¸c râ rÖt víi c¸c tr×nh tù ë hai ®Çu
hoÆc gÇn hai ®Çu cña c¸c yÕu tè Ac vµ Ds, thóc ®Èy qu¸ tr×nh vËn ®éng cña c¸c yÕu tè
nµy. Sù ®ét biÕn hoÆc mÊt nucleotide trong tr×nh tù m· hãa transposase lµm mÊt chøc
n¨ng xóc t¸c cña enzym nµy. NÕu c¸c yÕu tè Ds còng cã nh÷ng th−¬ng tæn t−¬ng tù th×
chóng kh«ng thÓ tù ho¹t hãa. Nh−ng, nÕu trong hÖ gen tån t¹i tr×nh tù m· hãa
transposase cña yÕu tè Ac, th× chóng l¹i ®−îc ho¹t hãa. Enzym transposase cã thÓ x©m
nhËp vµo nh©n tÕ bµo, g¾n vµo yÕu tè Ds vµ ho¹t hãa sù vËn ®éng cña yÕu tè nµy. V× vËy
transposase do yÕu tè Ac m· hãa ®−îc gäi lµ protein t¸c ®éng xa (trans-acting protein).
§Õn nay, c¸c TE cã liªn quan ®Õn Ac/Ds ®· ®−îc t×m thÊy ë nhiÒu loµi kh¸c, kÓ c¶ ë
®éng vËt. Trong ®ã, TE ë ®éng vËt nh− vËy ®−îc nghiªn cøu kü nhÊt lµ hä hobo ë ruåi
Drosophila.

6.8.4.2. YÕu tè P vµ hiÖn t−îng con lai v« sinh ë c¸c loµi ruåi Drosophila
Mét sè nghiªn cøu tËp trung ®· ®−îc tiÕn hµnh trªn c¸c yÕu tè di truyÒn vËn ®éng
P t×m thÊy ë c¸c loµi ruåi Drosophila. N¨m 1977, Margaret, James Kidwell vµ John Sved
ph¸t hiÖn thÊy viÖc lai gi÷a c¸c dßng ruåi giÊm t¹o ra mét nhãm c¸c con lai cã c¸c tÝnh
tr¹ng dÞ biÖt, nh− tÇn sè ®ét biÕn cao, cã hiÖn t−îng ®øt ®o¹n NST, vµ ®Æc tÝnh v« sinh.

214
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

Kidwell vµ céng sù sau ®ã nhËn thÊy cã thÓ ph©n


lo¹i c¸c dßng nµy thµnh hai nhãm dùa trªn kh¶ Con c¸i (♀, mÑ)
n¨ng t¹o ra con lai v« sinh cña chóng. Hai nhãm
nµy ®−îc ký hiÖu lµ M vµ P. ChØ cã phÐp lai gi÷a M P
con ®ùc dßng P víi con c¸i dßng M míi t¹o ra c¸c
Sinh s¶n
con lai v« sinh. ViÖc tiÕn hµnh lai gi÷a c¸c c¸ thÓ Sinh s¶n
M b×nh
trong cïng nhãm (hoÆc M hoÆc P) ®Òu t¹o ra con b×nh th−êng
Con th−êng
lai h÷u thô b×nh th−êng. KiÓu h×nh con lai tõ c¸c
®ùc
phÐp lai gi÷a hai nhãm M vµ P ®−îc nªu trªn (♂,bè)
h×nh 6.26. Sinh s¶n
P V« sinh
Kidwell vµ céng sù cho r»ng, NST cña b×nh th−êng
dßng P ®· mang c¸c yÕu tè di truyÒn ®−îc ho¹t
hãa khi tinh trïng cña nã x©m nhËp vµo trøng H×nh 6.26. KiÓu h×nh cña c¸c con lai tõ phÐp
cña dßng M; sau ®ã, nh÷ng yÕu tè ®−îc ho¹t hãa lai gi÷a c¸c dßng P vµ M ë ruåi Drosophila.
g©y nªn ®ét biÕn vµ ®øt ®o¹n NST. TiÕp nèi
nghiªn cøu cña Kidwell, n¨m 1979 Engels (mét a) YÕu tè P cã tr×nh tù ®Çy ®ñ
nghiªn cøu sinh t¹i §¹i häc Winconsin) ®· ph¸t 2907 bp
hiÖn thÊy mét ®ét biÕn ®Æc biÖt cã kh¶ n¨ng ®ét
biÕn phôc håi cao. HiÖn t−îng thiÕu æn ®Þnh di Gen m· hãa transposase
truyÒn nµy gîi ý Engels vÒ nh÷ng ®ét biÕn g©y ra
bëi yÕu tè IS ë E. coli, ®ång thêi cho thÊy nh÷ng
®ét biÕn nµy nhiÒu kh¶ n¨ng liªn quan ®Õn mét
§o¹n tr×nh tù hai ®Çu lÆp l¹i
yÕu tè di truyÒn vËn ®éng nµo ®ã. Nh÷ng nghiªn ng−îc chiÒu 31 bp
cøu sau nµy (vµo nh÷ng n¨m 1980) ®· chøng b) C¸c yÕu tè P mÊt mét phÇn tr×nh tù
minh ®óng lµ cã sù tån t¹i cña nhiÒu b¶n sao c¸c
yÕu tè TE trong hÖ gen c¸c dßng P; nh−ng, kh«ng
cã ë c¸c dßng M. V× vËy, c¸c TE nµy ®−îc gäi lµ
c¸c yÕu tè P.
ViÖc ph©n tÝch tr×nh tù ADN cho thÊy c¸c H×nh 6.27. CÊu tróc vÒ h−íng vµ kÝch th−íc
yÕu tè P rÊt kh¸c nhau vÒ kÝch th−íc. C¸c yÕu tè tr×nh tù ADN cña c¸c yÕu tè P ë ruåi giÊm.
P cã kÝch th−íc lín nhÊt dµi 2907 bp, gåm c¸c tr×nh tù lÆp l¹i ë hai ®Çu dµi 31 bp. C¸c
yÕu tè P hoµn chØnh mang mét gen m· hãa cho transposase. Khi transposase cña yÕu tè P
g¾n vµo ®o¹n ®u«i cña mét yÕu tè P hoµn chØnh (cã tr×nh tù ®Çy ®ñ), nã cã kh¶ n¨ng “vËn
chuyÓn” yÕu tè P nµy ®Õn mét vÞ trÝ kh¸c trong hÖ gen. C¸c yÕu tè P kh«ng hoµn chØnh
(h×nh 6.27) thiÕu kh¶ n¨ng tæng hîp transposase do mÊt ®i mét sè tr×nh tù bªn trong
vïng m· hãa enzym nµy, nh−ng chóng vÉn cã c¸c vïng tËn cïng vµ gÇn tËn cïng lµ vÞ trÝ
g¾n cña transposase. KÕt qu¶ lµ, nh÷ng yÕu tè P kh«ng hoµn chØnh nµy vÉn cã kh¶ n¨ng
vËn ®éng trong hÖ gen, nÕu nh− ë ®©u ®ã trong hÖ gen cã tr×nh tù m· hãa cho
transposase.
C¸c nghiªn cøu ë c¸c quÇn thÓ ruåi Drosophila kh¸c trong tù nhiªn sau nµy ®· chøng
minh cã nhiÒu yÕu tè P kh¸c nhau tån t¹i trong hÖ gen víi sè l−îng biÕn ®éng. Mét sè loµi
ruåi cã sè b¶n sao cña yÕu tè P lªn ®Õn 50, trong khi ®ã mét sè loµi kh¸c chØ cã mét vµi b¶n
sao. Tuy vËy, mét ®Æc ®iÓm ®¸ng ng¹c nhiªn lµ tÊt c¶ c¸c dßng thu ®−îc tr−íc n¨m 1950
kh«ng cã bÊt cø mét yÕu tè P nµo. Trªn c¬ së ®ã, Marganet Kidwell ®· ®−a ra gi¶ thiÕt lµ c¸c
yÕu tè P ®· “x©m nhËp” vµo c¸c loµi ruåi Drosophila chØ trong thêi gian gÇn ®©y. §¸ng chó ý
h¬n n÷a lµ hÖ gen cña c¸c loµi ruåi cã quan hÖ gÇn gòi nhÊt víi ruåi dÊm l¹i kh«ng cã yÕu tè
P, trong khi nh÷ng loµi cã kho¶ng c¸ch xa h¬n l¹i cã yÕu tè nµy. §Õn nay chóng ta ch−a biÕt
râ b»ng c¬ chÕ nµo yÕu tè P ®· x©m nhËp vµo c¸c loµi Drosophila, nh−ng cã mét gi¶ thiÕt cho

215
§inh §oµn Long

r»ng nh÷ng yÕu tè nµy ®−îc virut vËn chuyÓn vµo hÖ gen cña c¸c loµi ruåi Drosophila. Qu¸
tr×nh nµy cã thÓ gièng víi viÖc phag¬ “t¶i n¹p” c¸c yÕu tè IS vµo hÖ gen E. coli.
C¸c quÇn thÓ Drosophila chøa yÕu tè P ®· cã sù ph¸t triÓn c¬ chÕ ®iÒu hßa vËn ®éng
cña nh÷ng yÕu tè nµy. ë mét sè dßng, sù ®iÒu hßa nµy phô thuéc vµo kiÓu tÕ bµo
(cytotype), tøc lµ ®Æc ®iÓm tÕ bµo ®−îc truyÒn tõ tÕ bµo mÑ sang tÕ bµo con th«ng qua tÕ bµo
chÊt cña trøng. KiÓu tÕ bµo häc P øc chÕ sù vËn ®éng cña yÕu tè P, cßn kiÓu tÕ bµo M t¹o
®iÒu kiÖn cho yÕu tè P vËn ®éng. KiÓu tÕ bµo P lµ ®Æc tÝnh cña tÕ bµo mang gen m· hãa yÕu
tè P trªn NST, trong khi ®ã kiÓu tÕ bµo M lµ ®Æc tÝnh cña tÕ bµo kh«ng mang gen m· hãa
yÕu tè P. Khi yÕu tè P ®−îc kÕt hîp víi kiÓu tÕ bµo M th«ng qua mét phÐp lai phï hîp th×
sù vËn ®éng cña yÕu tè P ®−îc thóc ®Èy. MÆc dï c¬ chÕ ®iÒu hßa sù vËn ®éng cña yÕu tè P bëi
kiÓu tÕ bµo ®· ®−îc mét sè nhãm quan t©m nghiªn cøu, nh−ng ®Õn nay vÉn ch−a s¸ng tá.
Ph−¬ng thøc di truyÒn theo dßng mÑ cña kiÓu tÕ bµo ®−îc nhËn thÊy trong c¸c phÐp
lai thuËn nghÞch gi÷a c¸c dßng P vµ M (h×nh 6.28). Cã hai phÐp lai: 1) [KiÓu tÕ bµo P , ♀] x
[KiÓu tÕ bµo M, ♂], vµ 2) [KiÓu tÕ bµo P , ♂] x [KiÓu tÕ bµo M, ♀]. ThÕ hÖ con sinh ra tõ hai
phÐp lai ®Òu mang gen m· hãa yÕu tè P vµ gièng nhau vÒ hÖ gen nh©n. Nh−ng, chØ c¸c con
lai tõ phÐp lai 2 míi x¶y ra hiÖn t−îng “gen nh¶y”. §iÒu ®ã cho thÊy, ®Æc tÝnh cho phÐp yÕu
tè P vËn ®éng hay kh«ng lµ ®Æc tÝnh ®−îc di truyÒn theo dßng mÑ (do tÕ bµo chÊt quy ®Þnh).
Trong phÐp lai 1, tÕ bµo mÑ truyÒn kiÓu tÕ bµo P cho con vµ sù vËn ®éng cña yÕu tè P bÞ øc
chÕ. Trong phÐp lai 2, tÕ bµo mÑ truyÒn kiÓu tÕ bµo M cho con, cho phÐp yÕu tè P vËn ®éng.
Cã mét ®iÒu ng¹c nhiªn lµ kÓ c¶ khi hÖ gen bÞ biÕn ®æi ®¸ng kÓ do sù vËn ®éng ë møc
®é lín cña c¸c yÕu tè P, th× phÐp lai [KiÓu tÕ bµo P , ♂] x [KiÓu tÕ bµo M, ♀] vÉn cã thÓ t¹o
ra c¸c c¸ thÓ con sèng b×nh C¸c phÐp lai thuËn, nghÞch gi÷a c¸c dßng P vµ M
th−êng. C¸c nghiªn cøu cña
PhÐp lai 1 PhÐp lai 2
Donald Rio, Frank Laski vµ
Gerald Rubin cho thÊy C¸i §ùc C¸i §ùc
nh÷ng c¸c c¸ thÓ con nµy
kháe m¹nh bëi c¸c yÕu tè P Trøng Trøng
chØ vËn ®éng trong c¸c dßng Tinh trïng Tinh trïng
tÕ bµo sinh dôc (qu¸ tr×nh
ph¸t sinh giao tö). Cßn ë c¸c
tÕ bµo soma, sù vËn ®éng C¸c giao tö mang
cña yÕu tè P vèn cã kh¶ nhiÔm s¾c thÓ cã hoÆc
kh«ng cã c¸c yÕu tè P
n¨ng g©y ra nh÷ng rèi lo¹n
lín chØ hiÕm x¶y ra, do
transposase P kh«ng ®−îc
tæng hîp trong nh÷ng tÕ bµo
YÕu tè P bÞ øc chÕ YÕu tè P ®−îc ho¹t hãa
nµy. Sù tæng hîp protein
trong kiÓu tÕ bµo P trong kiÓu tÕ bµo M
nµy bÞ øc chÕ ë b−íc hoµn
thiÖn mARN. Cô thÓ, mét
®o¹n intron ®−îc gi÷ l¹i HiÖn t−îng v« sinh
trong ph©n tö mARN m· xuÊt hiÖn ë con lai
sinh ra tõ phÐp lai 2
hãa transposase, t¹o nªn
Con lai sinh s¶n Con lai v« sinh
mét bé ba m· kÕt thóc sím.
b×nh th−êng
HËu qu¶ lµ tÕ bµo soma
H×nh 6.28. HiÖn t−îng con lai v« sinh do ho¹t ®éng cña yÕu tè P ë
kh«ng tæng hîp ®−îc
Drosophila. KiÓu tÕ bµo ®−îc di truyÒn theo dßng mÑ. Theo ®ã, kiÓu tÕ
transposase, mµ thay vµo bµo P øc chÕ ho¹t ®éng cña c¸c yÕu tè P, trong khi kiÓu tÕ bµo M ho¹t
®ã lµ mét ph©n tö protein hãa chóng. HiÖn t−îng v« sinh chØ xuÊt hiÖn ë con lai cã kiÓu tÕ bµo M.

216
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

ng¾n kh«ng cã ho¹t tÝnh xóc t¸c yÕu tè P vËn ®éng. KÕt qu¶ lµ, yÕu tè P kh«ng vËn ®éng vµ
c¸c tÕ bµo soma tr¸nh ®−îc nh÷ng sai háng di truyÒn do sù vËn ®éng cña yÕu tè P.

6.8.4.3. YÕu tè di truyÒn vËn ®éng cã tÝnh cæ x−a vµ phæ biÕn mariner
Hai loµi ruåi cã quan hÖ gÇn gòi nhÊt víi ruåi giÊm (Drosophila melanogaster) lµ
D. simulans vµ D. mauritiana, cã mét TE kÝch th−íc nhá lµ mariner (dµi 1286 bp víi tr×nh
tù lÆp l¹i ng−îc chiÒu ë hai ®Çu gåm 28 bp). MÆc dï yÕu tè mariner kh«ng thÊy cã ë
D. melanogaster, nh−ng nh÷ng yÕu tè t−¬ng tù l¹i thÊy cã ë nhiÒu loµi, nh− giun trßn, nÊm,
thËm trÝ c¶ ë ng−êi. Hugh Robertson còng ph¸t hiÖn thÊy nhiÒu TE kiÓu mariner cã mÆt ë
c¸c bé c«n trïng kh¸c nhau. Mét ®iÓm ®¸ng l−u ý lµ ®«i khi c¸c yÕu tè mariner ë c¸c loµi
c¸ch xa nhau l¹i gièng nhau h¬n gi÷a c¸c loµi cã quan hÖ gÇn gòi. VÝ dô nh− yÕu tè mariner
ë loµi ruåi qu¶ §Þa trung h¶i rÊt gièng víi ë loµi ong mËt, dï hai loµi nµy ®· t¸ch ly tiÕn hãa
khái nhau tõ hµng tr¨m triÖu n¨m tr−íc. ChØ cã mét gi¶ thiÕt hîp lý lµ c¸c yÕu tè mariner
®· x©m nhËp vµo hai loµi c«n trïng nµy trong thêi gian gÇn ®©y h¬n tõ mét vÐct¬ nµo ®ã, cã
thÓ tõ mét loµi c«n trïng kh¸c hoÆc qua sù l©y nhiÔm cña c¸c virut c«n trïng cã phæ vËt
chñ réng. Trong qu¸ tr×nh l©y nhiÔm, hÖ gen virut cã thÓ tiÕp nhËn vµ truyÒn yÕu tè TE.
§Õn nay, b»ng kü thuËt gi¶i tr×nh tù ADN ng−êi ta ®· x¸c ®Þnh ®−îc c¸c yÕu tè
mariner th−êng cã kÝch th−íc kh¸ lín (kho¶ng 1,6 - 1,7 kb) víi hai tr×nh tù lÆp l¹i ng−îc
chiÒu ë hai ®Çu. Tr×nh tù lÆp l¹i ë hai ®Çu ®iÓn h×nh cña chóng cã chiÒu dµi tõ 54 ®Õn 234
bp. YÕu tè mariner ®−îc nghiªn cøu kü nhÊt ®Õn nay lµ Tc1, t×m thÊy ë giun trßn
(Caenorhabditis elegans). C¸c TE gièng Tc1 cßn thÊy cã ë ®éng vËt cã x−¬ng sèng. Nh− vËy
cã thÓ nãi c¸c TE lo¹i Tc1 vµ mariner thuéc mét hä TE cã tÝnh cæ x−a vµ phæ biÕn cao.

6.8.5. C¸c yÕu tè di truyÒn vËn ®éng kiÓu phiªn m· ng−îc


Ngoµi c¸c yÕu tè TE nh− Ac, P vµ mariner, hÖ gen sinh vËt nh©n thËt cßn cã c¸c yÕu
tè TE mµ sù vËn ®éng cña chóng trong hÖ gen phô thuéc vµo sù phiªn m· ng−îc ARN →
ADN. V× vËy, c¸c yÕu tè TE nµy ®−îc gäi lµ c¸c TE kiÓu phiªn m· ng−îc. Cã hai nhãm
retrotransposon chñ yÕu: c¸c TE kiÓu retrovirut vµ retrosposon. C¸c TE thuéc nhãm thø
nhÊt gièng víi NST cña mét nhãm retrovirut, cßn c¸c TE thuéc nhãm thø hai cã cÊu tróc
gièng víi ph©n tö mARN cã ®Çu 3’-poly(A).
6.8.5.1. YÕu tè TE kiÓu retrovirut
C¸c yÕu tè di truyÒn vËn ®éng (TE) kiÓu retrovirut ®−îc t×m thÊy ë nhiÒu sinh
vËt kh¸c nhau, gåm c¶ ®éng vËt, thùc vËt vµ nÊm men. MÆc dï, chóng cã kÝch th−íc vµ tr×nh
tù c¸c nucleotide kh¸c nhau, nh−ng tÊt c¶ nh÷ng TE nµy ®Òu cã ®Æc ®iÓm chung lµ: cã mét
vïng m· hãa trung t©m ®−îc giíi h¹n bëi hai vïng biªn gäi lµ c¸c tr×nh tù lÆp l¹i dµi ë
®Çu tËn cïng - LTR (long terminal repeats), cã tr×nh tù gièng nhau cïng chiÒu. C¸c LTR
®iÓn h×nh th−êng gåm vµi tr¨m bp. Víi mçi lo¹i LTR, nã l¹i ®−îc giíi h¹n bëi c¸c tr×nh tù ë
hai ®Çu lÆp l¹i ng−îc chiÒu (gièng nh− c¸c transposon kiÓu IS). Do cã cÊu t¹o ®Æc tr−ng víi
cÊu tróc LTR, nh÷ng TE kiÓu retrovirut ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng LTR.
Vïng m· hãa trung t©m cña TE kiÓu retrovirut chøa mét sè Ýt gen, th−êng lµ hai gen.
Nh÷ng gen nµy gièng víi gen gag vµ pol t×m thÊy ë retrovirut (xem thªm ch−¬ng 3); trong
®ã, gen gag m· hãa cho protein vá virut, cßn gen pol m· hãa cho enzym reverse
transcriptase (cã thÓ c¶ integrase). C¸c retrovirut th−êng cã mét gen thø ba lµ env m· hãa
cho mét protein còng lµ thµnh phÇn bao ngoµi virut. §èi víi c¸c TE kiÓu retrovirut, c¸c s¶n
phÈm cña gen gag vµ pol gi÷ vai trß quan träng trong qu¸ tr×nh vËn ®éng cña chóng trong
hÖ gen.

217
§inh §oµn Long

Mét trong nh÷ng TE kiÓu retrovirut a)


~ 5900 bp
®−îc nghiªn cøu kü nhÊt ®Õn nay lµ Ty1 ë
nÊm men S. cerevisae (h×nh 6.29a). YÕu tè δ δ
~340 TyA = gag TyB = pol ~340
nµy cã chiÒu dµi 5,9 kbp; cÊu tróc LTR cña bp bp
chóng cã chiÒu dµi kho¶ng 340 bp. Mçi lÇn
yÕu tè nµy xen vµo tr×nh tù ®Ých, nã t¹o ra LTR LTR
hai vïng biªn lËp l¹i cïng chiÒu gåm 5 bp.
PhÇn lín c¸c chñng nÊm men chøa kho¶ng
b)
35 b¶n sao cña yÕu tè Ty1; ®«i khi, chóng
chøa c¸c cÊu tróc LTR n»m t¸ch khái c¸c
yÕu tè Ty1. C¸c cÊu tróc LTR riªng lÎ nh−
vËy (®«i khi cßn gäi lµ c¸c tr×nh tù delta - δ)
râ rµng ®−îc h×nh thµnh do qu¸ tr×nh t¸i tæ δ
hîp gi÷a c¸c LTR cña c¸c yÕu tè Ty1 hoµn δ
chØnh (h×nh 6.29b). Qu¸ tr×nh t¸i tæ hîp
lµm cho vïng m· hãa vµ mét phÇn cña cÊu
tróc LTR h×nh thµnh ph©n tö vßng khÐp δ δ ®¬n lÎ
kÝn. Khi ph©n tö ADN vßng nµy t¸ch khái
NST, phÇn cßn l¹i cña LTR sÏ hßa hîp víi c) Protein Reverse
phÇn NST cßn l¹i, t¹o nªn cÊu tróc δ riªng cÊu tróc transcriptase
lÎ. PhÇn tö ADN vßng bÞ mÊt ®i sau khi tÕ
bµo ph©n chia.
C¸c yÕu tè Ty1 chØ cã hai gen, TyA vµ
TyB, lµ c¸c gen t−¬ng øng gièng víi c¸c gen Gen TyA Gen TyB
gag vµ pol ë retrovirut. C¸c nghiªn cøu hãa δ δ
sinh cho thÊy s¶n phÈm cña hai gen nµy
còng cã thÓ gióp h×nh thµnh h¹t virut trong
tÕ bµo chÊt cña nÊm men. Sù vËn ®éng cña  Ty1 ®−îc phiªn m·
yÕu tè Ty1 liªn quan ®Õn qu¸ tr×nh phiªn thµnh ARN.
m· ng−îc ARN (h×nh 6.29c). Sau khi ARN Ty1 ARN
®−îc tæng hîp tõ gen Ty1, enzym reverse
transcriptase do gen TyB m· hãa sÏ sö ARN ®−îc phiªn m·
 ng−îc thµnh cADN bëi
dông ph©n tö ARN lµm sîi khu«n ®Ó tæng enzym do TyB m· hãa.
hîp nªn ph©n tö ADN sîi kÐp bæ trî t−¬ng
øng (cã thÓ tån t¹i trong d¹ng mét h¹t Ty1 cADN
virut). Sau ®ã ph©n tö ADN sîi kÐp võa
 Ty1 cADN ®−îc cµi vµo
tæng hîp ®−îc vËn chuyÓn vµo trong nh©n nhiÔm s¾c thÓ, t¹o nªn
vµ xen vµo mét vÞ trÝ nµo ®ã trong hÖ gen, mét b¶n sao míi cña Ty1.
t¹o nªn mét yÕu tè Ty1 míi.
C¸c TE kiÓu retrovirut còng ®−îc t×m H×nh 6.29. CÊu tróc di truyÒn vµ c¬ chÕ ho¹t ®éng
thÊy ë ruåi giÊm. Mét trong nh÷ng yÕu tè cña yÕu tè Ty1 ë nÊm men (xem m« t¶ trong tµi liÖu).
nh− vËy ®−îc ph¸t hiÖn ®Çu tiÒn lµ copia.
Së dÜ gäi tªn nh− vËy, bëi yÕu tè nµy cã kh¶ n¨ng t¹o ra mét sè lín b¶n sao (copy) cña
ph©n tö ARN. C¸c yÕu tè copia cã cÊu t¹o gièng víi c¸c yÕu tè Ty1 ë nÊm men. ë ruåi
giÊm, cßn cã mét TE kiÓu retrovirut kh¸c gäi lµ yÕu tè gypsy cã kÝch th−íc lín h¬n copia
do chóng chøa thªm gen gièng víi env ë retrovirut (gäi lµ gen gypsy-env). C¶ hai yÕu tè
copia vµ gypsy ®Òu cã kh¶ n¨ng h×nh thµnh h¹t virut trong c¸c tÕ bµo ruåi giÊm; tuy vËy,
chØ cã c¸c h¹t virut h×nh thµnh tõ ARN gypsy míi cã kh¶ n¨ng v−ît qua mµng tÕ bµo chñ
(cã thÓ lµ do chóng cã chøa s¶n phÈm cña gen gypsy-env). YÕu tè gypsy v× vËy lµ mét virut
thùc sù. Cßn cã nhiÒu hä TE kiÓu retrovirut kh¸c ®−îc t×m thÊy ë ruåi giÊm, nh−ng c¬ chÕ
vËn ®éng cña chóng ®Õn nay ch−a biÕt ®Çy ®ñ.

218
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

6.8.5.2. C¸c retrosposon


C¸c retrosposon lµ c¸c TE kiÓu retrovirut ph©n bè réng r·i vµ ®a d¹ng, nh−ng
kh«ng cã cÊu tróc LTR. Mét sè vÝ dô thuéc nhãm nµy cã thÓ kÓ ®Õn lµ c¸c yÕu tè F, G vµ I
t×m thÊy ë ruåi giÊm vµ mét sè yÕu tè kh¸c t×m thÊy ë ®éng vËt cã vó. Nh÷ng yÕu tè nµy vËn
®éng trong hÖ gen qua mét ph©n tö ARN ®−îc phiªn m· ng−îc thµnh ADN, cã thÓ do ho¹t
®éng cña c¸c protein do chÝnh TE m· hãa. MÆc dï c¸c retrosposon còng t¹o ra tr×nh tù lÆp
l¹i t¹i vÞ trÝ trªn ph©n tö ADN mµ nã xen vµo, nh−ng b¶n th©n chóng kh«ng cã c¸c tr×nh tù
lÆp l¹i ng−îc chiÒu hoÆc cïng chiÒu ë hai ®Çu tr×nh tù cña b¶n th©n chóng. Thay vµo ®ã,
chóng cã ®Æc ®iÓm ®Æc tr−ng lµ cã tr×nh tù poly(A = T) ë mét ®Çu. Tr×nh tù nµy lµ dÊu hiÖu
cho thÊy, cã lÏ chóng lµ kÕt qu¶ cña s¶n phÈm phiªn m· ng−îc ph©n tö ARN cã ®Çu 3’-
Poly(A). V× vËy, c¸c retrosposon ph¶n ¸nh nguån gèc cña chóng vèn lµ c¸c tr×nh tù phiªn
m· ng−îc cña c¸c ph©n tö mARN ®· tr¶i qua giai ®o¹n hoµn thiÖn (xem ch−¬ng 3).
ë ruåi giÊm, ng−êi ta cßn t×m thÊy mét nhãm retrosposon ®Æc biÖt t¹i c¸c ®Çu mót
NST cã kh¶ n¨ng kÐo dµi phÇn ®Çu mót nµy sau mçi lÇn nã bÞ ng¾n do sù sao chÐp ADN.
Nhí r»ng, víi ph©n tö ADN sîi kÐp m¹ch th¼ng, sau mçi lÇn sao chÐp, ph©n tö ADN l¹i
ng¾n ®i mét sè cÆp nucleotide. HiÖn t−îng ph©n tö ADN bÞ ng¾n l¹i lµ do enzym ADN
polymerase lu«n ®ßi hái cã s½n mét ®o¹n måi cã ®Çu 3’-OH tù do. Th«ng th−êng ®o¹n måi
nµy cã b¶n chÊt lµ ARN vµ bÞ lo¹i bá sau qu¸ tr×nh sao chÐp ADN (®Ó l¹i mét vïng ®Çu NST
lµ m¹ch ®¬n). Trong lÇn sao chÐp ADN tiÕp theo, khi sîi ng¾n h¬n (míi ®−îc tæng hîp)
®−îc sö dông lµm khu«n, nã sÏ t¹o nªn mét ph©n tö ADN míi ng¾n h¬n ph©n tö ADN gèc.
Nh− vËy, sau mçi lÇn sao chÐp ADN, ph©n tö ADN (NST) ngµy cµng trë nªn ng¾n h¬n ë
hai phÇn ®Çu mót.
§Ó kh¾c phôc hiÖn t−îng mÊt ®o¹n ®Çu mót NST nh− vËy, ë ruåi dÊm cã m«t c¬ chÕ
®Æc biÖt liªn quan ®Õn Ýt nhÊt hai lo¹i retrosposon kh¸c nhau, ®−îc gäi lµ HeT-A vµ TART
(viÕt t¾t cña telomere associated retrosposon). C¸c yÕu tè nµy cã xu h−íng vËn ®éng vÒ
phÝa ®Çu mót NST vµ kÐo dµi tr×nh tù ®Çu mót kho¶ng vµi kb. Cuèi cïng th× c¸c tr×nh tù do
c¸c yÕu tè TE xen vµo còng sÏ bÞ mÊt ®i do sù sao chÐp ADN vèn kh«ng hoµn chØnh ë ®Çu
mót. Nh−ng, mét sù vËn ®éng kh¸c cña nh÷ng yÕu tè nµy l¹i bï ®¾p phÇn tr×nh tù bÞ mÊt ®i.
Nh− vËy, ë ®©y c¸c yÕu tè HeT-A vµ TART cã chøc n¨ng quan träng lµ t¸i t¹o ®Çu mót NST.

6.8.6. C¸c yÕu tè di truyÒn vËn ®éng ë ng−êi


Tõ kÕt qu¶ dù ¸n gi¶i tr×nh tù hÖ gen ng−êi, −íc tÝnh cã Ýt nhÊt 44% sè tr×nh tù hÖ
gen ng−êi cã xuÊt xø hoÆc cã liªn quan víi c¸c yÕu tè di truyÒn vËn ®éng, bao gåm c¸c TE
kiÓu retrovirut (∼ 8%), retrosposon (∼ 33%) vµ mét sè hä TE kiÓu c¾t-d¸n (∼3%).
YÕu tè di truyÒn vËn ®éng phæ biÕn nhÊt lµ L1. YÕu tè nµy thuéc mét líp c¸c tr×nh tù
gäi lµ c¸c yÕu tè tr×nh tù dµi n»m d¶i r¸c trong nh©n LINE (long interspersed nuclear
element). C¸c yÕu tè LINE hoµn chØnh cã kÝch th−íc kho¶ng 6 kb, chóng chøa mét
promoter ®−îc nhËn biÕt bëi enzym ARN polymerase II, vµ cã hai khung ®äc më (ORF).
Trong ®ã ORF1 m· hãa cho mét protein liªn kÕt víi c¸c axit nucleic, cßn ORF2 m· hãa cho
mét protein cã ho¹t tÝnh endonuclease vµ reverse transcriptase. HÖ gen ng−êi chøa
kho¶ng 3000 ®Õn 5000 b¶n sao yÕu tè L1 hoµn chØnh. Ngoµi ra, nã cßn chøa kho¶ng
500.000 b¶n sao c¸c yÕu tè L1 bÞ c¾t xÐn mét phÇn ë ®Çu 5’; nh÷ng yÕu tè L1 kh«ng hoµn
chØnh nµy kh«ng cßn kh¶ n¨ng vËn ®éng. C¸c yÕu tè L1 trong hÖ gen, kÓ c¶ lo¹i hoµn chØnh
vµ kh«ng hoµn chØnh, th−êng cã hai vïng biªn lµ c¸c tr×nh tù lÆp l¹i cïng chiÒu.
C¸c yÕu tè L1 lµ c¸c yÕu tè retrosposon thùc sù. Sù vËn ®éng cña chóng trong hÖ gen
liªn quan ®Õn sù phiªn m· L1 thµnh ph©n tö ARN vµ phiªn m· ng−îc ph©n tö nµy thµnh
tr×nh tù ADN (h×nh 6.30). C¶ hai qu¸ tr×nh ®ã ®Òu diÔn ra trong nh©n. Tuy vËy, tr−íc khi
ph©n tö ARN L1 ®−îc phiªn m· ng−îc, ph©n tö nµy ®−îc vËn chuyÓn ra tÕ bµo chÊt ®Ó tiÕn
hµnh dÞch m· tæng hîp c¸c chuçi polypeptide mµ nã m· hãa vµ ph©n tö protein nµy liªn kÕt

219
§inh §oµn Long

víi nã khi ®−îc vËn chuyÓn trë l¹i nh©n. C¸c chuçi polypeptide ®−îc m· hãa bëi ORF2
mang mét enzym endonuclease xóc t¸c viÖc c¾t mét m¹ch ®¬n cña sîi kÐp ADN t¹i vÞ trÝ
®Ých cã thÓ g¾n vµo cña TE trªn NST. §Çu 3’ tù do cña m¹ch ADN võa bÞ c¾t ®−îc dïng lµm
måi ®Ó tiÕn hµnh tæng hîp m¹ch ADN míi sö dông ph©n tö ARN lµm khu«n, vµ chuçi
polypeptide ®−îc tæng hîp b»ng ORF2 cung cÊp ho¹t tÝnh reverse transcriptase cho ho¹t
®éng nµy. B»ng c¸ch ®ã, mét tr×nh tù ADN L1 ®−îc tæng hîp t¹i ®iÓm trªn NST n¬i chuçi
polypeptide ORF2 ®· t¹o ra vÕt ®øt trªn sîi ®¬n. Ph©n tö ADN L1 míi ®−îc tæng hîp m¹ch
®¬n sau ®ã ®−îc “chuyÓn sang” d¹ng sîi kÐp nhê c¬ chÕ tæng hîp ADN th«ng th−êng. Ph©n
®o¹n ADN sîi kÐp míi sÏ kÕt hîp vµo NST vµ t¹o ra mét b¶n sao míi cña yÕu tè L1 trong
hÖ gen. §«i khi vïng ®Çu 5’ cña ARN L1 kh«ng ®−îc phiªn m· thµnh ADN. Khi ®ã, ®o¹n cµi
L1 thiÕu c¸c tr×nh tù ë ®Çu 5’, ®−îc gäi lµ yÕu tè L1 kh«ng hoµn chØnh.

TÕ bµo chÊt Nh©n tÕ bµo

YÕu tè L1

ADN nhiÔm s¾c thÓ

YÕu tè L1 míi cµi vµo NST

Ribosom

Protein cña ORF1

Protein cña ORF2 ADN nhiÔm s¾c thÓ

H×nh 6.30. Gi¶ thiÕt vÒ c¬ chÕ vËn ®éng cña c¸c yÕu tè L1 trong hÖ gen ng−êi. YÕu tè L1 cã kÝch th−íc kho¶ng
6 kb chøa 2 khung ®äc më (ORF1 vµ ORF2) ®−îc phiªn m· tõ cïng mét promoter (P). Chuçi polypeptide do ORF1
m· hãa liªn kÕt ngay víi L1 ARN vµ cã thÓ cã vai trß vËn chuyÓn ARN vµo nh©n tÕ bµo. Chuçi polypeptide do ORF2
m· hãa cã Ýt nhÊt hai chøc n¨ng. §ã lµ 1) ho¹t tÝnh endonuclease c¾t ADN vµ 2) ho¹t tÝnh cña enzym phiªn m·
ng−îc (tæng hîp ADN tõ m¹ch khu«n ARN). KÝch th−íc cña yÕu tè L1 míi phô thuéc vµo ph¶n øng phiªn m· ng−îc
kÐo dµi bao l©u däc theo m¹ch khu«n L1 mARN. NÕu sù phiªn m· ng−îc kh«ng kÐo dµi hÕt ®Çu 5’ cña ph©n tö L1
mARN th× sÏ t¹o ra c¸c ®o¹n cµi L1 cã tr×nh tù kh«ng ®Çy ®ñ. C¸c ®o¹n cµi L1 kh«ng ®Çy ®ñ th−êng kh«ng mang
promoter (®o¹n P) nªn kh«ng tæng hîp ®−îc ph©n tö L1 ARN vµ mÊt kh¶ n¨ng vËn ®éng.

220
Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

Trong hÖ gen ng−êi, chØ cã mét sè Ýt yÕu tè L1 hoµn chØnh cßn vËn ®éng. Sù vËn ®éng
cña chóng ®−îc t×m thÊy khi ph©n tÝch bÖnh di truyÒn ë mét sè c¸ thÓ. §Õn nay, ®· ph¸t
hiÖn ®−îc 14 bÖnh di truyÒn do ®ét biÕn gen liªn quan ®Õn ho¹t ®éng vËn ®éng cña yÕu tè
L1, nh− c¸c ®ét biÕn ë gen m· hãa yÕu tè VIII (g©y bÖnh m¸u lo·ng). Nh×n chung, sù vËn
®éng cña yÕu tè L1 hiÕm gÆp. Ngoµi L1, hÖ gen ng−êi cßn hai tr×nh tù LINE kh¸c n÷a lµ
L2 (315.000 b¶n sao) vµ L3 (37.000 b¶n sao). Tuy vËy, kh«ng cã lo¹i nµo vËn ®éng tÝch cùc.
C¸c yÕu tè tr×nh tù ng¾n n»m r¶i r¸c trong nh©n SINE lµ nhãm yÕu tè di truyÒn
vËn ®éng phæ biÕn thø hai ë ng−êi. Nh÷ng yÕu tè nµy th−êng cã tr×nh tù ng¾n h¬n 400 bp
vµ kh«ng m· hãa cho protein. Gièng nh− c¸c retrosposon kh¸c, chóng cã mét tr×nh tù
poly(A=T) ë mét ®Çu. C¸c yÕu tè SINE vËn ®éng qua mét sù phiªn m· ng−îc mét ph©n tö
ARN b¾t ®Çu tõ mét promoter n»m bªn trong tr×nh tù cña chóng. MÆc dï chi tiÕt qu¸ tr×nh
vËn ®éng cña c¸c yÕu tè SINE ®Õn nay ch−a râ, nh−ng d−êng nh− enzym reverse
transcriptase lµ thiÕt yÕu cho sù tæng hîp ADN tõ ARN SINE. Do vËy, c¸c yÕu tè SINE
chØ vËn ®éng khi cã mÆt cña c¸c yÕu tè LINE. Víi ý nghÜa ®ã, SINE ®−îc xem lµ c¸c yÕu tè
retrosposon “ký sinh” trªn c¸c yÕu tè retrosposon kh¸c. HÖ gen ng−êi chøa ba hä c¸c yÕu tè
SINE, lµ hä Alu, MIR vµ Ther2/MIR3. Tuy vËy, chØ c¸c yÕu tè Alu (gäi nh− vËy, v× tÊt c¶
c¸c TE thuéc hä nµy ®Òu cã vÞ trÝ c¾t cña enzym giíi h¹n AluI) cßn ho¹t ®éng.
HÖ gen ng−êi chøa h¬n 400.000 ph©n ®o¹n xuÊt ph¸t tõ c¸c yÕu tè gièng virut. PhÇn
lín c¸c tr×nh tù nµy lµ c¸c tr×nh tù LTR ®éc nhÊt. MÆc dï cã h¬n 100 hä c¸c yÕu tè TE kh¸c
nhau gièng virut ®· ®−îc t×m thÊy trong hÖ gen ng−êi, nh−ng chØ cã mét sè Ýt vËn tÝch cùc
trong tiÕn hãa cËn ®¹i. Gièng víi c¸c yÕu tè SINE vµ LINE bÊt ho¹t, hÇu hÕt c¸c tr×nh tù
nµy chØ lµ c¸c “dÊu vÕt cßn l¹i” cña c¸c yÕu tè TE vËn ®éng tÝch cùc tr−íc ®©y trong tiÕn hãa.
C¸c yÕu tè TE ho¹t ®éng m¹nh kiÓu c¾t - d¸n (gièng Ac/Ds ë ng«) ®−îc xóc t¸c bëi
enzym transposase do chÝnh yÕu tè ®ã m· hãa, còng cã mét tØ lÖ nhá trong hÖ gen ng−êi.
Trong ®ã, cã hai yÕu tè cã quan hÖ xa víi Ac/Ds vµ mét sè yÕu tè thuéc hä Tc1/mariner
®−îc t×m thÊy. TÊt c¶ c¸c b»ng chøng thùc nghiÖm cho thÊy nh÷ng yÕu tè TE nµy ®· trë nªn
“bÊt ho¹t” tõ hµng triÖu n¨m tr−íc trong qu¸ tr×nh tiÕn hãa h×nh thµnh loµi ng−êi.

221
Ch−¬ng 7

C¥ Së DI TRUYÒN HäC NHIÔM S¾C THÓ

Trong tÕ bµo, mçi ph©n tö ADN th−êng liªn kÕt víi c¸c protein t¹o thµnh cÊu tróc
®−îc gäi lµ nhiÔm s¾c thÓ (viÕt t¾t lµ NST). Tæ chøc NST nh− vËy kh«ng chØ cã ë c¸c tÕ
bµo eukaryote vµ prokaryote mµ thËm chÝ ë c¶ virut. ViÖc ®ãng gãi trong c¸c NST lµ ®iÒu
kiÖn ®Ó ADN thùc hiÖn ®−îc c¸c chøc n¨ng quan träng cña nã. Thø nhÊt, NST chøa ADN
®−îc ®ãng gãi chÆt míi cã thÓ n»m gän ®−îc trong nh©n tÕ bµo. Thø hai, sù ®ãng gãi ADN
trong NST nh»m b¶o vÖ ADN khái bÞ tæn th−¬ng. C¸c ph©n tö ADN trÇn trong tÕ bµo
th−êng kÐm bÒn; trong khi ADN n»m trong cÊu tróc NST rÊt bÒn v÷ng, cho phÐp th«ng tin
mµ nã m· hãa ®−îc truyÒn l¹i chÝnh x¸c. Thø ba, chØ ADN ®−îc ®ãng gãi trong NST míi cã
thÓ ®−îc di truyÒn mét c¸ch hiÖu qu¶ cho c¸c tÕ bµo con sau mçi lÇn ph©n chia tÕ bµo. Cuèi
cïng, NST lµ sù kh¼ng ®Þnh tæ chøc nhÊt qu¸n ®Æc thï víi mçi ph©n tö ADN. Tæ chøc ®ã
lµm cho sù biÓu hiÖn cña c¸c gen còng nh− sù t¸i tæ hîp gi÷a c¸c NST bè, mÑ (t¹o nªn sù ®a
d¹ng di truyÒn) cã thÓ diÔn ra thuËn lîi vµ cã tÝnh ®Æc tr−ng.
Kho¶ng mét nöa khèi l−îng NST ë tÕ bµo eukaryote lµ protein. Trong c¸c tÕ bµo
eukaryote, vïng ADN liªn kÕt víi c¸c protein ®−îc gäi lµ chÊt nhiÔm s¾c. C¸c protein liªn
kÕt víi ADN trong chÊt nhiÔm s¾c chñ yÕu lµ c¸c protein kiÒm, kÝch th−íc nhá, gäi lµ c¸c
histon. Ngoµi ra, trong chÊt nhiÔm s¾c cßn cã c¸c protein phi histon cã vai trß trong c¸c
qu¸ tr×nh ph©n chia tÕ bµo, phiªn m·, sao chÐp, söa ch÷a vµ t¸i tæ hîp ADN.
Trong chÊt nhiÔm s¾c, c¸c protein cã mét chøc n¨ng quan träng lµ nÐn chÆt ph©n tö
ADN. TÝnh to¸n sau ®©y cho thÊy tÇm quan träng cña chøc n¨ng nµy. Bé NST ®¬n béi cña
tÕ bµo ng−êi chøa trªn 3 tû cÆp baz¬ nit¬ (nucleotide). Mçi cÆp baz¬ nit¬ cã kÝch th−íc
kho¶ng 3,4 Ao. NÕu nèi c¸c ph©n tö ADN cña bé NST ®¬n béi cña ng−êi l¹i víi nhau th×
chóng cã ®é dµi trªn 1 m. Víi c¸c tÕ bµo l−ìng béi, chiÒu dµi ®ã lµ trªn 2 m. V× ®−êng kÝnh
cña nh©n tÕ bµo ng−êi ®iÓn h×nh chØ kho¶ng 10 µm; nªn râ rµng, ADN ph¶i ®−îc nÐn chÆt
theo nhiÒu møc ®é kh¸c nhau míi cã thÓ n»m gän trong kho¶ng kh«ng gian nhá bÐ ®ã. Møc
®é nÐn ADN ®Çu tiªn ë c¸c tÕ bµo ng−êi (còng nh− ë c¸c tÕ bµo eukaryote kh¸c) lµ ADN liªn
kÕt víi histon t¹o nªn cÊu tróc gäi lµ nucleosome (thÓ nh©n). Nucleosome lµ b−íc ®ãng
xo¾n ADN ®Çu tiªn gióp gi¶m chiÒu dµi cña nã xuèng kho¶ng 10.000 lÇn. Sù nÐn kÝch
th−íc ADN trong nucleosome ph¶i “tr¶ mét chi phÝ” lµ lµm gi¶m kh¶ n¨ng tiÕp cËn ADN
cña c¸c protein ®iÒu hßa c¸c qu¸ tr×nh sao chÐp, söa ch÷a, t¸i tæ hîp ADN, vµ ®Æc biÖt
quan träng lµ c¸c protein ®iÒu hßa qu¸ tr×nh phiªn m·. MÆc dï so víi eukaryote, c¸c tÕ bµo
prokaryote th−êng cã hÖ gen nhá h¬n, nh−ng ADN cña chóng còng cÇn ®−îc nÐn chÆt. Vi
khuÈn E. coli ph¶i bao gãi ADN cña nã dµi kho¶ng 1 mm vµo trong tÕ bµo cã kÝch th−íc chØ
1 µm. C¸c møc cÊu tróc NST ë prokaryote ®Õn nay ch−a ®−îc biÕt ®Çy ®ñ. MÆc dï kh«ng
cã histon, nh−ng c¸c tÕ bµo vi khuÈn còng cã c¸c protein liªn kÕt ADN cã tÝnh kiÒm, khèi
l−îng nhá, cã lÏ ®Ó ®¶m nhËn chøc n¨ng t−¬ng tù.
Sù ®èi nghÞch vÒ nhu cÇu “nÐn vËt chÊt di truyÒn” vµ nhu cÇu “tiÕp cËn ADN” cña
c¸c bé m¸y sao chÐp, phiªn m·, söa ch÷a vµ t¸i tæ hîp ADN dÉn ®Õn viÖc cÇn t×m hiÓu cÊu
tróc vµ ho¹t ®éng cña chÊt nhiÔm s¾c. Thùc tÕ cho thÊy, sù thay ®æi lu©n phiªn cÊu tróc
nucleosome cho phÐp nh÷ng vïng riªng biÖt cña NST t−¬ng t¸c ®−îc víi c¸c protein. Sù
thay ®æi lu©n phiªn ®ã ®−îc xóc t¸c bëi c¸c enzym c¶i biÕn vµ t¸i cÊu tróc nucleosome. Qu¸
tr×nh ®ã cã tÝnh côc bé, cho phÐp c¸c enzym vµ c¸c protein ®iÒu hßa tiÕp cËn ®−îc nh÷ng

222
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

vïng kh¸c nhau cña NST vµo c¸c thêi ®iÓm kh¸c nhau. §©y lµ ®iÓm “cèt yÕu” gióp gi¶i
thÝch nhiÒu sù kiÖn diÔn ra trong ho¹t ®éng ®iÒu hßa gen ë eukaryote.
Trong ch−¬ng nµy, chóng ta sÏ ®Ò cËp ®Õn cÊu tróc NST vµ mét sè c¬ chÕ chung gióp
gi¶i thÝch b»ng c¸ch nµo c¸c NST ®−îc di truyÒn trän vÑn tíi c¸c tÕ bµo con sau mçi lÇn
ph©n chia tÕ bµo. §ång thêi, chóng ta còng sÏ ®Ò cËp ®Õn cÊu tróc vµ sù ®iÒu hßa ho¹t ®éng
cña chÊt nhiÔm s¾c qua sù c¶i biÕn vµ t¸i cÊu tróc nucleosome vèn ®−îc xem lµ ®¬n vÞ cÊu
tróc c¬ b¶n vµ quan träng nhÊt cña chÊt nhiÔm s¾c ë tÕ bµo eukaryote.

7.1. Sù ®a d¹ng vÒ cÊu tróc cña nhiÔm s¾c thÓ (NST)

7.1.1. C¸c nhiÔm s¾c thÓ cã thÓ ë d¹ng m¹ch th¼ng hoÆc vßng
Tr−íc ®©y, ng−êi ta tõng cho r»ng c¸c tÕ bµo prokaryote chØ cã mét NST m¹ch vßng,
trong khi c¸c tÕ bµo eukaryote cã nhiÒu NST m¹ch th¼ng. Nh−ng, khi cµng cã nhiÒu loµi
prokaryote ®−îc nghiªn cøu th× quan ®iÓm nµy kh«ng cßn chÝnh x¸c n÷a. Tuy hÇu hÕt c¸c
prokaryote ®−îc nghiªn cøu (nh− E. coli vµ B. subtilis) thùc sù chØ cã mét NST m¹ch vßng,
nh−ng còng cã nhiÒu tÕ bµo prokaryote chøa nhiÒu NST m¹ch th¼ng, hoÆc thËm chÝ ®ång
thêi mang c¶ hai lo¹i. Sè l−îng NST ë c¸c sinh vËt prokaryote cã thÓ dao ®éng tõ 2 ®Õn
d−íi 50. ë mét sè eukaryote, sè l−îng NST trong mçi tÕ bµo cã thÓ ®Õn hµng ngh×n (vÝ dô:
®éng vËt nguyªn sinh Tetrahynema, xem B¶ng 7.1).

B¶ng 7.1. Sè l−îng nhiÔm s¾c thÓ (NST) ë c¸c sinh vËt kh¸c nhau

Sè l−îng Sè b¶n sao D¹ng KÝch th−íc


Loµi
NST mçi NST NST hÖ gen (Mb)
Prokaryote
Mycoplasma genitalium 1 1 vßng 0,58
Escherichia coli K12 1 1 vßng 4,6
3 vßng
Agrobacterium tumefaciens 4 1 5,67
1 th¼ng
Sinorhizobium meliloti 3 1 vßng 6,7
Eukaryote
Saccharomyces cerevisiae 16 1 hoÆc 2 th¼ng 12,1
Schizosaccharomyces pombe 3 1 hoÆc 2 th¼ng 12,5
Caenorhabditis elegans (giun trßn) 6 2 th¼ng 97
Arabidopsis thaliana (c¶i d¹i) 5 2 th¼ng 125
Drosophila melanogaster (ruåi giÊm) 4 2 th¼ng 180
Nh©n nhá: 2
Nh©n nhá: 5 220
Tetrahynema thermophilus Nh©n lín: 10 - th¼ng
Nh©n lín: 225 (nh©n nhá)
10.000
Fugu rubripes (c¸ xem sao) 22 2 th¼ng 365
Mus musculus (chuét) 19 + X vµ Y 2 th¼ng 2500
Homo sapiens (ng−êi) 22 + X vµ Y 2 th¼ng 2900

Dï ë d¹ng m¹ch th¼ng hay vßng, NST ®Òu gÆp nh÷ng “trë ng¹i” riªng trong qu¸
tr×nh sao chÐp vµ duy tr× th«ng tin di truyÒn. NST m¹ch vßng cÇn enzym topoisomerase
®Ó t¸ch c¸c ph©n tö ADN con sau khi kÕt thóc qu¸ tr×nh sao chÐp. NÕu kh«ng cã c¸c

223
§ç Lª Th¨ng - §inh §oµn Long

enzym nµy, c¸c ph©n tö ADN con cã thÓ lång vµo nhau hoÆc “®Ýnh” víi nhau thµnh
chuçi. Ng−îc l¹i, c¸c ph©n tö ADN cña c¸c NST m¹ch th¼ng trong qu¸ tr×nh sao chÐp cÇn
®−îc b¶o vÖ khái c¸c enzym ph©n gi¶i (nuclease) vèn cã s½n trong tÕ bµo.
7.1.2. §Æc tr−ng sè l−îng nhiÔm s¾c thÓ cña tÕ bµo
C¸c tÕ bµo prokaryote th−êng chØ cã mét b¶n sao NST hoµn chØnh n»m trong cÊu tróc
®−îc gäi lµ vïng nh©n (nucleoid, xem h×nh 7.1b). Tuy nhiªn, khi c¸c tÕ bµo prokaryote
ph©n chia nhanh th× nhiÒu phÇn cña NST ®ang sao chÐp sÏ tån t¹i ë d¹ng hai hay thËm chÝ
bèn b¶n sao. C¸c tÕ bµo prokaryote còng th−êng cã mét hoÆc mét sè ph©n tö ADN d¹ng
vßng kÝch th−íc nhá, tån t¹i ®éc lËp, gäi lµ c¸c plasmid. Plasmid th−êng kh«ng mang c¸c
gen thiÕt yÕu ®èi víi sù sinh tr−ëng cña vi khuÈn, nh−ng chóng mang c¸c gen cÇn cho mét
sè ho¹t ®éng kh¸c cña vi khuÈn, nh− kh¶ n¨ng kh¸ng kh¸ng sinh. Trong mét tÕ bµo vi
khuÈn cã thÓ cã nhiÒu b¶n sao hoµn chØnh cña c¸c plasmid.
PhÇn lín c¸c tÕ bµo eukaryote lµ l−ìng béi, nghÜa lµ chóng chøa hai b¶n sao cña mçi
NST (h×nh 7.1c). Hai b¶n sao cña mçi NST ®−îc gäi lµ hai NST t−¬ng ®ång; mét chiÕc cã
nguån gèc tõ bè, mét chiÕc cã nguån gèc tõ mÑ. Tuy nhiªn, kh«ng ph¶i mäi tÕ bµo
eukaryote ®Òu lµ l−ìng béi; mét sè cã (b)
thÓ lµ ®¬n béi hoÆc ®a béi. C¸c tÕ bµo
Vi khuÈn ®¬n béi
®¬n béi (nh− tinh trïng vµ trøng) chØ cã
mét b¶n sao duy nhÊt cña mçi NST vµ
tham gia vµo qu¸ tr×nh sinh s¶n h÷u
tÝnh. C¸c tÕ bµo ®a béi cã nhiÒu h¬n
hai b¶n sao cña mçi NST. Trong thùc Vá
tÕ, mét sè sinh vËt duy tr× phÇn lín c¸c Roi b¬i
tÕ bµo tr−ëng thµnh cña chóng ë d¹ng Vïng nh©n
NhiÔm s¾c thÓ
(a)
®a béi. Cã nh÷ng tr−êng hîp sè b¶n
Prokaryote (c)
sao cña mçi NST trong tÕ bµo lªn ®Õn
hµng tr¨m, thËm chÝ hµng ngh×n. KiÓu TÕ bµo l−ìng béi
Bé m¸y Golgi
t¨ng theo béi sè cña hÖ gen nh− vËy 1 µm
cho phÐp tÕ bµo s¶n sinh nhanh mét Nh©n
Eukaryote
l−îng lín ARN vµ protein. VÝ dô, tÕ bµo NhiÔm
nh©n khæng lå (megakaryocyte) cã s¾c thÓ
trong tñy x−¬ng ë ng−êi lµ c¸c tÕ bµo M¹ng l−íi
®a béi chuyªn hãa (chøa kho¶ng 128 10 µm néi chÊt
Ti thÓ
b¶n sao cña mçi NST). Mçi tÕ bµo
nh©n khæng lå cã thÓ s¶n sinh hµng TÕ bµo ®¬n béi
ngh×n tiÓu cÇu kh«ng cã NST nh−ng lµ
thµnh phÇn quan träng trong m¸u (cã
kho¶ng 200.000 tiÓu cÇu/ml m¸u). ë
d¹ng ®a béi, c¸c tÕ bµo nh©n khæng lå
lu«n duy tr× ®−îc møc ®é trao ®æi chÊt
cao ®Ó cã thÓ s¶n sinh nhanh mét
l−îng lín c¸c tiÓu cÇu. Sù ph©n ly sè
l−îng lín NST nh− vËy theo c¸c c¬ chÕ
chung sÏ rÊt khã kh¨n nªn c¸c tÕ bµo ë H×nh 7.1. So s¸nh tÕ bµo prokaryote (nh©n s¬) vµ
d¹ng ®a béi, nh− tÕ bµo nh©n khæng eukaryote (nh©n thËt) ®iÓn h×nh. (a) §−êng kÝnh tÕ bµo
eukaryote kho¶ng 10 µm vµ tÕ bµo prokaryote kho¶ng 1µm.
lå, sau khi biÖt hãa sÏ ngõng ph©n (b) NST eukaryote n»m ë vïng nh©n vµ chiÕm phÇn ®¸ng kÓ
chia. Dï sè l−îng lµ bao nhiªu th× c¸c trong tÕ bµo. Vïng nh©n kh«ng cã mµng bao bäc. Ngoµi ra, tÕ
NST ë tÕ bµo eukaryote lu«n ®−îc “bao bµo prokaryote cßn cã plasmid. (c) C¸c NST tÕ bµo eukaryote
gãi” trong nh©n tÕ bµo. n»m trong nh©n tÕ bµo cã mµng bao bäc. TÕ bµo ®¬n béi cã mét
b¶n sao cña mçi NST, cßn c¸c tÕ bµo l−ìng béi cã hai b¶n sao.

224
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

7.1.3. NghÞch lý gi¸ trÞ C


ADN tæng sè cña hÖ gen ®¬n béi cña mét loµi ®−îc gäi lµ gi¸ trÞ C cña loµi ®ã. B¶ng
7.2 liÖt kª gi¸ trÞ C, sè l−îng gen −íc tÝnh vµ mËt ®é gen/Mb cña mét sè loµi prokaryote vµ
eukaryote. Nh÷ng sè liÖu nµy nh×n chung ph¶n ¸nh mèi t−¬ng quan gi÷a kÝch th−íc hÖ
gen víi møc ®é tæ chøc phøc t¹p cña c¬ thÓ sinh vËt. C¸c loµi prokaryote th−êng cã hÖ gen
nhá h¬n 10 Mb. HÖ gen cña c¸c eukaryote ®¬n bµo th−êng nhá h¬n 50 Mb, trong khi nh÷ng
nguyªn sinh ®éng vËt cã cÊu tróc c¬ thÓ phøc t¹p h¬n cã thÓ cã hÖ gen lín h¬n 200 Mb. C¸c
sinh vËt ®a bµo cã hÖ gen lín h¬n nhiÒu. HÖ gen cña nh÷ng sinh vËt nµy cã thÓ ®¹t tíi
100.000 Mb.
Tuy vËy, mèi t−¬ng quan gi÷a kÝch th−íc hÖ gen víi møc ®é tæ chøc phøc t¹p cña c¬
thÓ kh«ng hoµn toµn tuyÖt ®èi. NhiÒu sinh vËt cã møc ®é tæ chøc gÇn t−¬ng ®−¬ng nhau
nh−ng cã kÝch th−íc hÖ gen rÊt kh¸c nhau. VÝ dô, ruåi giÊm cã hÖ gen nhá h¬n ch©u chÊu
25 lÇn; cßn lóa n−íc cã hÖ gen nhá h¬n lóa m× 40 lÇn. §iÒu nµy cho thÊy, cã lÏ sè l−îng
gen, chø kh«ng ph¶i kÝch th−íc hÖ gen cã quan hÖ mËt thiÕt víi møc ®é tæ chøc phøc t¹p
cña sinh vËt. Ph©n tÝch mËt ®é gen cña c¸c hÖ gen cho thÊy râ xu h−íng nµy.

B¶ng 7.2. Gi¸ trÞ C, sè gen −íc tÝnh vµ mËt ®é gen ë mét sè loµi sinh vËt
Gi¸ trÞ C Sè gen MËt ®é gen
Loµi
(Mb) −íc tÝnh (sè gen / Mb)
Prokaryote (Vi khuÈn)
Mycoplasma genitalium 0,58 500 860
Streptococcus pneumonia 2,2 2.300 1.060
Escherichia coli K12 4,6 4.400 950
Agrobacterium tumefaciens 5,7 5.400 960
Sinorhhizobium meliloti 6,7 6.200 930
Eukaryote
a) NÊm
Saccharomyces cerevisiae 12 5.800 480
Schizosaccharomyces pombe 12 4.900 410
b) §éng vËt nguyªn sinh
Tetrahynema thermophilus 220 > 20.000 >90
c) §éng vËt kh«ng x−¬ng sèng
C. elegans (giun trßn) 97 19.000 200
D. melanogaster (ruåi giÊm) 180 13.700 80
Strongylocentrotus purpuratus 845 ~ 22.000 ~26
Locusta migratoria 5.000 Ch−a x¸c ®Þnh Ch−a x¸c ®Þnh
d) §éng vËt cã x−¬ng sèng
Fugu rubripes (c¸ xem sao) 365 > 31.000 >85
Homo sapiens (ng−êi) 2.900 25.000 8,6
Mus musculus (chuét) 2.500 23.000 9,2
e) Thùc vËt
Arabidopsis thaliana (c¶i d¹i) 125 25.500 200
Oryza saliva (lóa) 430 > 45.000 >100
Zea mays (ng«) 2.200 > 45.000 >20
Fritilaria assyriaca (tulip) 120.000 Ch−a x¸c ®Þnh Ch−a x¸c ®Þnh

225
§ç Lª Th¨ng - §inh §oµn Long

7.1.4. C¸c gen chiÕm hÇu hÕt hÖ gen vi khuÈn


PhÇn lín nh÷ng hiÓu biÕt ®Õn nay vÒ hÖ gen vi khuÈn lµ tõ c¸c nghiªn cøu ë vi
khuÈn “m« h×nh” E. coli. C¸c gen m· ho¸ protein chiÕm phÇn lín hÖ gen cña vi khuÈn nµy.
Tr×nh tù kh«ng m· ho¸ chñ yÕu lµ c¸c tr×nh tù ®iÒu hoµ phiªn m·. V× mét vÞ trÝ khëi ®Çu
phiªn m· th−êng ®−îc E. coli sö dông ®Ó ®iÒu khiÓn sù biÓu hiÖn ®ång thêi cña mét sè gen
(cÊu tróc mARN ®a cistron) nªn sè l−îng tr×nh tù khëi ®Çu phiªn m· trong hÖ gen còng rÊt
Ýt. §iÓm khëi ®Çu sao chÐp trªn NST cña E. coli kh«ng ph¶i lµ mét ®o¹n tr×nh tù trong gen
mµ lµ mét vïng tr×nh tù ng¾n trªn NST ®−îc dïng ®Ó ®iÒu khiÓn bé m¸y sao chÐp ADN.
MÆc dï cã vai trß quan träng nh−ng vïng nµy cã kÝch th−íc kh¸ nhá, chØ chiÕm vµi tr¨m
cÆp baz¬ nit¬ trong tæng sè 4,6 Mb cña hÖ gen.

7.1.5. C¸c sinh vËt bËc cao cã mËt ®é gen trong hÖ gen gi¶m
T¹i sao mËt ®é gen trong hÖ Intron 1 2
gen sinh vËt bËc cao l¹i gi¶m? Cã ADN
hai yÕu tè chÝnh dÉn ®Õn hiÖn Exon 1 2 3
t−¬ng nµy. §ã lµ kÝch th−íc mçi
gen vµ chiÒu dµi ®o¹n tr×nh tù TiÒn-mARN 1 2 3
liªn gen (gi÷a c¸c gen) cã xu 5’ 3’
h−íng t¨ng lªn. §é dµi mçi gen
t¨ng lªn v× hai lý do. Thø nhÊt, c¸c mARN hoµn thiÖn 5’ 3’
sinh vËt trë nªn ngµy cµng phøc t¹p (sau c¾t intron)
vµ c¸c gen cña nã ®−îc ®iÒu khiÓn H×nh 7.2. S¬ ®å hãa qu¸ tr×nh xÐn intron (hoµn thiÖn mARN).
biÓu hiÖn bëi nhiÒu c¬ chÕ ®iÒu hßa
nghiªm ngÆt vµ phøc t¹p h¬n nªn ®é dµi c¸c ®o¹n tr×nh tù ADN ®iÒu hoµ phiªn m· (gäi t¾t
lµ c¸c tr×nh tù ®iÒu hoµ) còng t¨ng lªn (tøc lµ tÝch lòy thªm th«ng tin). Thø hai, c¸c gen
m· ho¸ protein ë c¸c eukaryote th−êng cã tÝnh “ph©n m¶nh”, nghÜa lµ xen kÏ gi÷a c¸c
tr×nh tù m· hãa - exon - lµ c¸c tr×nh tù kh«ng m· hãa axit amin trªn ph©n tö protein -
intron. C¸c intron ®−îc c¾t bá khái ph©n tö tiÒn-mARN sau phiªn m· bëi qu¸ tr×nh xÐn
intron lµ mét b−íc cña qu¸ tr×nh hoµn thiÖn mARN (h×nh 7.2). Sù cã mÆt cña c¸c intron
lµm t¨ng ®¸ng kÓ ®é dµi cña gen (b¶ng 7.3). Ch¼ng h¹n ë ng−êi, ®o¹n tr×nh tù ®−îc phiªn
m· cña mét gen (®Ó tæng hîp tiÒn-mARN) cã kÝch th−íc trung b×nh kho¶ng 27 kb, th×
®o¹n tr×nh tù m· ho¸ (®−îc dÞch m· thµnh protein) chØ dµi kho¶ng 1,3 kb. Nãi c¸ch kh¸c,
chØ cã kho¶ng 5% sè nucleotide trong tr×nh tù c¸c gen ë ng−êi lµ c¸c tr×nh tù m· ho¸. C¸c
gen ë eukaryote bËc thÊp cã xu h−íng mang Ýt intron h¬n. VÝ dô, ë nÊm men
Saccharomyces cerevisiae, chØ cã kho¶ng 3% sè gen chøa intron vµ kh«ng cã intron nµo dµi
qu¸ 1 kb.
C¸c ®o¹n tr×nh tù liªn gen ë c¸c sinh vËt bËc cao còng lµ nguyªn nh©n quan träng lµm
gi¶m mËt ®é gen. ADN liªn gen lµ phÇn cña hÖ gen kh«ng trùc tiÕp liªn quan ®Õn sù biÓu
hiÖn cña gen (tæng hîp protein hoÆc c¸c ARN cÊu tróc). H¬n 60% hÖ gen ng−êi lµ c¸c ®o¹n
tr×nh tù liªn gen vµ phÇn lín c¸c tr×nh tù ®ã ®Õn nay ch−a biÕt râ vÒ chøc n¨ng (h×nh 7.3).
Cã hai lo¹i tr×nh tù ADN liªn gen: c¸c tr×nh tù ®¬n nhÊt vµ c¸c tr×nh tù lÆp l¹i. Kho¶ng 1/4
sè tr×nh tù ADN liªn gen lµ c¸c tr×nh tù ®¬n nhÊt. Chóng bao gåm c¶ c¸c ®o¹n tr×nh tù
ADN lµ “vÕt tÝch” cña gen kh«ng cßn ho¹t ®éng chøc n¨ng, nh− c¸c gen ®ét biÕn mÊt chøc
n¨ng, c¸c ph©n ®o¹n cña gen vµ c¸c gen gi¶. C¸c gen ®ét biÕn mÊt chøc n¨ng vµ c¸c ph©n
®o¹n cña gen xuÊt hiÖn do c¸c ®ét biÕn ngÉu nhiªn hoÆc do sai sãt trong qu¸ tr×nh t¸i tæ
hîp ADN. Mét c¬ chÕ ph¸t sinh c¸c gen gi¶ lµ do ho¹t ®éng cña c¸c enzym phiªn m·
ng−îc. ChØ mét sè virut nhÊt ®Þnh trong qu¸ tr×nh sinh s¶n sö dông lo¹i enzym nµy ®Ó sao
chÐp ARN thµnh ADN sîi kÐp (cßn gäi lµ cADN). Khi bÞ nhiÔm nh÷ng virut nµy, c¸c
mARN cña tÕ bµo chñ cã thÓ bÞ sao chÐp thµnh cADN råi ®o¹n cADN võa t¹o ra ®−îc lång
ghÐp vµo hÖ gen nh−ng kh«ng biÓu hiÖn ®−îc chøc n¨ng.

226
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

C¸c tr×nh tù
®¬n nhÊt
(510 Mb)
C¸c tr×nh tù
liªn gen kh¸c
(600 Mb) C¸c tr×nh tù lÆp l¹i
Tr×nh tù ADN
sè l−îng biÕn ®éng
liªn gen
- microsatellite
(2.000 Mb) C¸c tr×nh tù lÆp l¹i (90 Mb)
ph©n bè kh¾p hÖ
gen (1.400 Mb)

Intron vµ c¸c tr×nh


HÖ gen ng−êi
tù kh«ng ®−îc
(3.200 Mb)
phiªn m\ cña gen

C¸c tr×nh tù liªn C¸c ph©n ®o¹n


quan ®Õn gen kh«ng hoµn chØnh
(1.152 Mb) cña gen
Gen vµ tr×nh tù
liªn quan ®Õn gen
H×nh 7.3. Tæ chøc hÖ gen ng−êi. (1.200 Mb) Gen gi¶
GEN
HÖ gen ng−êi gåm nhiÒu lo¹i tr×nh
tù ADN kh¸c nhau, trong ®ã phÇn (48 Mb)
lín kh«ng m· hãa protein.

B¶ng 7.3. Intron vµ tr×nh tù lÆp l¹i trong hÖ gen c¸c sinh vËt kh¸c nhau
MËt ®é gen Sè intron trung Tû lÖ tr×nh tù ADN
Loµi
(sè gen / Mb) b×nh ë mçi gen lÆp l¹i (%)
Prokaryote (Vi khuÈn)
Escherichia coli K12 950 0 <1
Eukaryote
a) NÊm
Saccharomyces cerevisiae 480 0,04 3,4
b) §éng vËt kh«ng x−¬ng sèng
Caenorhabditis elegans 200 5 6,3
Drosophila melanogaster 60 3 12
c) §éng vËt cã x−¬ng sèng
Fugu rubripes 75 5 2,7
Homo sapiens 8 6 46
d) Thùc vËt
Arabidopsis thaliana 125 3 Ch−a x¸c ®Þnh
Oryza sativa 470 Ch−a x¸c ®Þnh 42

C¸c ®o¹n tr×nh tù liªn gen ë c¸c sinh vËt bËc cao còng lµ nguyªn nh©n quan träng lµm
gi¶m mËt ®é gen. ADN liªn gen lµ phÇn cña hÖ gen kh«ng trùc tiÕp liªn quan ®Õn sù biÓu
hiÖn cña gen (tæng hîp protein hoÆc c¸c ARN cÊu tróc). H¬n 60% hÖ gen ng−êi lµ c¸c ®o¹n
tr×nh tù liªn gen vµ phÇn lín c¸c tr×nh tù ®ã ®Õn nay ch−a biÕt râ vÒ chøc n¨ng (h×nh 7.3).
Cã hai lo¹i tr×nh tù ADN liªn gen: c¸c tr×nh tù ®¬n nhÊt vµ c¸c tr×nh tù lÆp l¹i. Kho¶ng 1/4
sè tr×nh tù ADN liªn gen lµ c¸c tr×nh tù ®¬n nhÊt. Chóng bao gåm c¶ c¸c ®o¹n tr×nh tù
ADN lµ “vÕt tÝch” cña gen kh«ng cßn ho¹t ®éng chøc n¨ng, nh− c¸c gen ®ét biÕn mÊt chøc
n¨ng, c¸c ph©n ®o¹n cña gen vµ c¸c gen gi¶. C¸c gen ®ét biÕn mÊt chøc n¨ng vµ c¸c ph©n
®o¹n cña gen xuÊt hiÖn do c¸c ®ét biÕn ngÉu nhiªn hoÆc do sai sãt trong qu¸ tr×nh t¸i tæ
hîp ADN. Mét c¬ chÕ ph¸t sinh c¸c gen gi¶ lµ do ho¹t ®éng cña c¸c enzym phiªn m·
ng−îc. ChØ mét sè virut nhÊt ®Þnh trong qu¸ tr×nh sinh s¶n sö dông lo¹i enzym nµy ®Ó sao
chÐp ARN thµnh ADN sîi kÐp (cßn gäi lµ cADN). Khi bÞ nhiÔm nh÷ng virut nµy, c¸c

227
§ç Lª Th¨ng - §inh §oµn Long

mARN cña tÕ bµo chñ cã thÓ bÞ sao chÐp thµnh cADN råi ®o¹n cADN võa t¹o ra ®−îc lång
ghÐp vµo hÖ gen nh−ng kh«ng biÓu hiÖn ®−îc chøc n¨ng.

7.1.6. PhÇn lín c¸c tr×nh tù liªn gen ë ng−êi lµ c¸c ®o¹n tr×nh tù lÆp l¹i
Kho¶ng mét nöa hÖ gen ng−êi lµ c¸c ®o¹n tr×nh tù ADN lÆp l¹i nhiÒu lÇn trong hÖ
gen. Cã hai lo¹i tr×nh tù lÆp l¹i chñ yÕu: c¸c ADN tiÓu vÖ tinh (microsatellite) vµ c¸c
®o¹n tr×nh tù lÆp l¹i kh¾p hÖ gen. ADN tiÓu vÖ tinh lµ c¸c ®o¹n tr×nh tù lÆp l¹i kÕ tiÕp
nhau víi ®¬n vÞ lÆp l¹i cã kÝch th−íc ng¾n (d−íi 13 bp). C¸c tr×nh tù ADN tiÓu vÖ tinh phæ
biÕn nhÊt cã ®¬n vÞ lÆp l¹i gåm hai nucleotide (vÝ dô, CACACACACACA). Nh÷ng ®o¹n lÆp
l¹i nµy xuÊt hiÖn do nh÷ng sai sãt trong qu¸ tr×nh sao chÐp ADN vµ chiÕm kho¶ng 3% hÖ
gen. Nh÷ng “®o¹n tr×nh tù lÆp l¹i kh¾p hÖ gen” cã kÝch th−íc lín h¬n nhiÒu c¸c ADN tiÓu
vÖ tinh. Mçi ®¬n vÞ lÆp l¹i cña chóng th−êng lín h¬n 100 bp, thËm chÝ h¬n 1 kb. Nh÷ng
tr×nh tù nµy cã thÓ tån t¹i ®éc lËp nh−ng ph©n t¸n kh¾p hÖ gen, hoÆc kÕt côm thµnh tõng
nhãm xen kÏ gi÷a c¸c tr×nh tù ®Öm. Cã thÓ ph©n chóng thµnh nhiÒu lo¹i tr×nh tù kh¸c
nhau, song cã ®Æc ®iÓm chung lµ chóng ®Òu cã thÓ lµ c¸c yÕu tè di truyÒn vËn ®éng (xem
ch−¬ng 6). C¸c yÕu tè di truyÒn vËn ®éng (kÝ hiÖu TE) lµ c¸c ®o¹n tr×nh tù cã thÓ vËn ®éng
tõ vÞ trÝ nµy sang vÞ trÝ kh¸c trong hÖ gen. Th−êng th× khi vËn ®éng, c¸c yÕu tè TE ®Ó l¹i
b¶n sao gèc ë vÞ trÝ cò (nhê vËy, nã ®−îc nh©n lªn vµ tÝch lòy thµnh nhiÒu b¶n sao kh¾p hÖ
gen). Sù vËn ®éng cña c¸c yÕu tè TE trong hÖ gen ng−êi lµ sù kiÖn hiÕm x¶y ra. Tuy vËy,
tr¶i qua hµng triÖu n¨m tiÕn hãa, c¸c yÕu tè nµy ®· tù nh©n lªn vµ duy tr× hiÖu qu¶ tíi møc
hiÖn nay chóng chiÕm tíi 44% hÖ gen ng−êi.
B¶n chÊt cña c¸c tr×nh tù liªn gen ë c¸c sinh vËt kh¸c còng cã c¸c ®Æc ®iÓm chung
gièng víi ng−êi. ë nh÷ng loµi thùc vËt cã hÖ gen lín (nh− ng«), tû lÖ c¸c yÕu tè TE cßn cao
h¬n. Ngay c¸c hÖ gen nhá (nh− E. coli vµ S. cerevisiae) còng cã c¸c yÕu tè TE. Sù kh¸c biÖt
chØ ë chç, nh÷ng yÕu tè nµy cã sè l−îng b¶n sao trong hÖ gen thÊp h¬n. MÆc dï cã xu
h−íng coi c¸c tr×nh tù ADN lÆp l¹i lµ c¸c tr×nh tù ADN “Ýt gi¸ trÞ”, song viÖc chóng ®−îc duy
tr× æn ®Þnh qua hµng triÖu n¨m tiÕn hãa th× cã thÓ dù ®o¸n r»ng c¸c tr×nh tù ADN liªn gen
ph¶i cã mét ý nghÜa (hoÆc −u thÕ chän läc) nµo ®ã ®èi víi sinh vËt.

7.2. Sù nh©n ®«i vµ ph©n ly cña c¸c nhiÔm s¾c thÓ

7.2.1. T©m ®éng, ®Çu mót vµ c¸c ®iÓm khëi ®Çu sao chÐp cÇn thiÕt ®Ó duy tr× c¸c
nhiÔm s¾c thÓ trong qu¸ tr×nh ph©n bµo ë eukaryote
Trªn mçi NST cña eukaryote, c¸c ®iÓm khëi ®Çu sao chÐp c¸ch nhau kho¶ng 30 - 40
kb. Th−êng th× c¸c ®iÓm khëi ®Çu sao chÐp ®−îc t×m thÊy trong c¸c vïng tr×nh tù kh«ng
m· ho¸. C¸c NST ë prokaryote th−êng chØ cã mét ®iÓm khëi ®Çu sao chÐp duy nhÊt. T©m
®éng cÇn cho sù ph©n ly chÝnh x¸c c¸c nhiÔm s¾c tö vÒ hai tÕ bµo con trong qu¸ tr×nh ph©n
bµo. T©m ®éng ®iÒu khiÓn sù h×nh thµnh phøc hÖ nucleoprotein ®−îc gäi lµ thÓ ®éng. ThÓ
®éng t−¬ng t¸c víi bé m¸y ph©n chia tÕ bµo ®Ó ®Èy c¸c nhiÔm s¾c tö t¸ch khái nhau vÒ hai tÕ
bµo con. Mçi NST b×nh th−êng chØ cã mét t©m ®éng. NÕu kh«ng cã t©m ®éng, c¸c NST
ph©n ly ngÉu nhiªn, dÉn ®Õn mÊt hoÆc lÆp ®o¹n NST. NÕu cã nhiÒu t©m ®éng, NST cã thÓ
®ång thêi bÞ kÐo vÒ hai phÝa, dÉn ®Õn ®øt g·y (h×nh 7.4). T©m ®éng cã kÝch th−íc rÊt kh¸c
nhau, tõ d−íi 200 bp nh− ë S. serevisiae, hoÆc lín h¬n (®Õn vµi Mb) ë phÇn lín c¸c
eukaryote kh¸c vµ th−êng gåm c¸c ®o¹n ADN lÆp l¹i (h×nh 7.5).

228
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

a) NST cã mét t©m ®éng

Mçi nhiÔm s¾c tö ph©n ly vÒ mét tÕ bµo con


b) NST kh«ng cã t©m ®éng

Sù ph©n ly ngÉu nhiªn cña nhiÔm s¾c thÓ


c) NST cã hai t©m ®éng

Sù ®øt g·y NST x¶y ra do cã nhiÒu h¬n mét t©m ®éng

H×nh 7.4. Vai trß cña t©m ®éng trong sù ph©n ly nhiÔm s¾c thÓ (NST) vÒ c¸c tÕ bµo con trong qu¸
tr×nh ph©n bµo. a) Mçi NST trong cÆp t−¬ng ®ång cã mét t©m ®éng ph©n ly vÒ mét tÕ bµo con trong qu¸
tr×nh ph©n bµo; b) Sù ph©n ly ngÉu nhiªn cña NST kh«ng cã t©m ®éng dÉn ®Õn mÊt NST; c) Cã nhiÒu t©m
®éng dÉn ®Õn sù ®øt g·y cña NST sau qu¸ tr×nh ph©n bµo.

125 bp

I II III

a) S. cerevisiae

b) S. pombe cen1

40 - 100 Kb

c) D. melanogaster

~ 400 Kb
d) H. sapiens

Tõ 240 Kb ®Õn vµi Mb

H×nh 7.5. KÝch th−íc vµ cÊu tróc t©m ®éng cña mét sè loµi. T©m ®éng ë S. cerevisiae cã kÝch th−íc
nhá vµ kh«ng cã tr×nh tù lÆp l¹i. Ng−îc l¹i, t©m ®éng ë phÇn lín c¸c loµi kh¸c (nh− S. pombe,
D. melanogaster vµ ng−êi) cã kÝch th−íc lín h¬n nhiÒu vµ mang nhiÒu tr×nh tù lÆp l¹i, trõ mét ®o¹n ng¾n
(4 – 7 kb) ë gi÷a t©m ®éng – cen 1 - cña S. pombe kh«ng cã tr×nh tù lÆp l¹i.

229
§ç Lª Th¨ng - §inh §oµn Long

Gièng c¸c ®iÓm khëi ®Çu sao


chÐp vµ t©m ®éng, c¸c ®Çu mót cña a) Vïng T - loop YÕu tè liªn kÕt tr×nh tù
NST còng ®−îc g¾n kÕt bëi nhiÒu lÆp l¹i ®Çu mót NST
protein. C¸c protein ë ®Çu mót Vïng D - loop
thùc hiÖn hai chøc n¨ng quan
träng. Thø nhÊt, c¸c protein nµy
ph©n biÖt c¸c ®Çu mót thùc sù cña 5’
NST víi c¸c ®o¹n ®øt g·y kh¸c trªn 3’
§o¹n m¹ch
cïng NST hoÆc tõ c¸c NST kh¸c Sù b¾t cÆp gi÷a 2 ®¬n ®Çu 3’ Sù b¾t cÆp gi÷a 2
trong tÕ bµo. Th«ng th−êng, ADN ë ®o¹n ADN sîi kÐp ®o¹n ADN sîi kÐp
®Çu mót cã tÇn sè t¸i tæ hîp cao vµ b)
dÔ bÞ ph©n gi¶i. C¸c protein g¾n 5’
kÕt víi chóng t¹o nªn cÊu tróc 3’
chèng l¹i c¸c sù kiÖn trªn. Thø hai,
®Çu mót ho¹t ®éng nh− ®iÓm khëi H×nh 7.6. CÊu tróc ®Çu mót nhiÔm s¾c thÓ ®iÓn h×nh ë
eukaryote. a) CÊu tróc “thßng läng” ë ®Çu mót NST víi ®Çu 3’
®Çu sao chÐp ®−îc biÖt ho¸, cho cña m¹ch ®¬n cã thÓ dµi hµng tr¨m nucleotide. b) tr×nh tù ®¬n vÞ
phÐp tÕ bµo sao chÐp ®−îc phÇn lÆp l¹i ë ®Çu mót NST ë ng−êi lµ 5’- [TTAGGG]n - 3’.
®Çu mót nµy. Chóng ta ®· biÕt, bé
m¸y sao chÐp ADN th«ng th−êng kh«ng thÓ sao chÐp hoµn chØnh c¸c ®Çu mót cña NST
m¹ch th¼ng. Qu¸ tr×nh sao chÐp “bï” phÇn ®Çu mót ®−îc thùc hiÖn bëi enzym
telomerase. Kh«ng nh− c¸c phÇn kh¸c cña NST, phÇn quan träng cña ®Çu mót NST chØ ë
tr¹ng th¸i m¹ch ®¬n (h×nh 7.6). HÇu hÕt c¸c ®Çu mót cã tr×nh tù lÆp l¹i ®¬n gi¶n nh−ng
kh¸c nhau ë c¸c loµi kh¸c nhau. Tr×nh tù lÆp l¹i nµy th−êng ng¾n, giµu TC. VÝ dô, ®Çu mót
NST ë ng−êi cã ®¬n vÞ tr×nh tù lÆp l¹i lµ 5’-TTAGGG-3’.

7.2.2. Sù sao chÐp vµ ph©n ly Pha G1


nhiÔm s¾c thÓ trong chu Pha
tr×nh tÕ bµo M
Pha Pha
G2 G1
H×nh 7.7 tãm t¾t 4 pha (giai
®o¹n) c¬ b¶n cña chu tr×nh tÕ bµo. Pha S G0
Pha S
Trong qu¸ tr×nh ph©n bµo (pha M),
(sao chÐp
c¸c NST ph¶i ®−îc nh©n ®«i vµ ADN)
ph©n ly vÒ c¸c tÕ bµo con. ë vi
khuÈn, sù nh©n ®«i vµ ph©n li
NST diÔn ra ®ång thêi. Qu¸ tr×nh
nµy ®−îc ®iÒu hoµ chÆt chÏ, nh−ng
c¬ chÕ ®iÒu hßa chi tiÕt ch−a ®−îc Pha G2
biÕt ®Çy ®ñ. ë eukaryote, hai qu¸
tr×nh nµy diÔn ra t¸ch biÖt ë c¸c
pha kh¸c nhau cña chu tr×nh tÕ Pha M
bµo. ADN ®−îc tæng hîp ë pha S
dÉn ®Õn sù nh©n ®«i NST. Mçi NST
cña cÆp NST nh©n ®«i ®−îc gäi lµ
mét nhiÔm s¾c tö vµ hai nhiÔm H×nh 7.7. Chu tr×nh tÕ bµo ë
s¾c tö ®ã ®−îc gäi lµ hai nhiÔm s¾c eukaryote. Bèn giai ®o¹n (pha) cña
tö chÞ em. Hai nhiÔm s¾c tö chÞ chu tr×nh tÕ bµo: NST ®−îc sao chÐp
em kÕt dÝnh víi nhau nhê mét ë pha S vµ ph©n ly vÒ c¸c tÕ bµo con
ë pha M. Pha G1 vµ G2 lµ c¸c giai
nhãm ph©n tö gäi lµ cohesin vµ ®o¹n tÕ bµo chuÈn bÞ cho hai sù kiÖn
duy tr× sù kÕt dÝnh cho ®Õn khi trªn. G0 lµ khi tÕ bµo chuyÓn sang
ph©n ly ë pha M. tr¹ng th¸i biÖt hãa vµ kh«ng tiÕp tôc
ph©n chia.

230
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

Qu¸ tr×nh ph©n ly a) C¸c sù kiÖn chÝnh x¶y ra trong pha S


NST diÔn ra ë pha M (hay Ph©n tö 2 m¹ch
nguyªn ph©n) cña chu ADN sîi kÐp Cohesin ®¬n ADN
tr×nh tÕ bµo. Cã hai sù kiÖn
chÝnh liªn quan ®Õn sù
ph©n ly NST (h×nh 7.8).
Sù kiÖn thø nhÊt lµ cÆp Sù khëi ®Çu Sao chÐp kÐo dµi vµ
nhiÔm s¾c tö chÞ em g¾n víi
sao chÐp ADN h×nh thµnh cohesin
thoi v« s¾c (thoi ph©n
bµo). Thoi v« s¾c ®−îc cÊu
t¹o tõ c¸c sîi protein dµi
d¹ng vi èng. Mét ®Çu cña
vi èng g¾n víi mét trong
hai trung t©m tæ chøc vi
NhiÔm s¾c tö chÞ em
èng (cßn ®−îc gäi lµ trung b) C¸c sù kiÖn chÝnh x¶y ra trong pha M
tö ë ®éng vËt hay thÓ cùc Cohesin
cña thoi v« s¾c ë nÊm ThÓ ®éng
men vµ c¸c nÊm kh¸c) ë hai Thoi
cùc ®èi diÖn cña tÕ bµo. Sù ph©n bµo
g¾n kÕt c¸c nhiÔm s¾c tö víi Ph©n gi¶i
thoi v« s¾c ®−îc thùc hiÖn cohesin
nhê thÓ ®éng t¹i t©m ®éng. Trung t©m tæ
chøc vi èng
Thø hai lµ sù gi¶i kÕt dÝnh
(trung tö)
c¸c nhiÔm s¾c tö dÉn ®Õn
mét sù kiÖn quan träng thø H×nh 7.8. C¸c sù kiÖn chÝnh x¶y ra trong pha S vµ pha M. a) Pha S:
ba lµ sù ph©n ly cña c¸c §Çu tiªn, ph©n tö ADN sîi kÐp nh©n ®«i; ngay sau ®ã, protein yÕu tè
nhiÔm s¾c tö. Theo ®ã, g¾n cohesin cã cÊu tróc d¹ng vßng quÊn quanh hai ph©n tö ADN võa
mçi nhiÔm s¾c tö chÞ em ®−îc nh©n ®«i h×nh thµnh nªn phøc hÖ gåm hai nhiÔm s¾c tö chÞ em.
b) Pha M: §Çu tiªn, thÓ ®éng g¾n vµo thoi v« s¾c; sau ®ã lµ sù gi¶i kÕt
®−îc kÐo vÒ c¸c cùc ®èi diÖn dÝnh cña cohesin vµ sù ph©n ly c¸c nhiÔm s¾c tö vÒ hai cùc tÕ bµo.
cña thoi v« s¾c. C¸c sù kiÖn
trªn ®−îc ®iÒu hoµ chÆt chÏ ®Ó sù ph©n ly NST diÔn ra chÝnh x¸c vµ hoµn h¶o.

7.2.3. CÊu tróc nhiÔm s¾c thÓ thay ®æi khi tÕ bµo eukaryote ph©n chia
Qua c¸c pha cña chu tr×nh tÕ bµo, cÊu tróc NST thay ®æi liªn tôc. Tuy nhiªn, cã hai
tr¹ng th¸i chÝnh ®Æc tr−ng cho cÊu tróc cña NST. Khi tÕ bµo nguyªn ph©n hoÆc gi¶m ph©n,
c¸c NST tr¶i qua qu¸ tr×nh kÕt ®Æc, t¹o ra c¸c NST xo¾n chÆt ®Ó qu¸ tr×nh ph©n ly NST
trong ph©n bµo diÔn ra thuËn lîi. ë giai ®o¹n gian k× (k× trung gian) gi÷a hai chu tr×nh tÕ
bµo kÕ tiÕp (gåm 3 pha G1, S vµ G2), NST gi·n xo¾n ®Ó sao chÐp vµ phiªn m·.

7.2.4. Sù kÕt dÝnh c¸c nhiÔm s¾c tö vµ kÕt ®Æc nhiÔm s¾c thÓ do c¸c protein duy tr×
cÊu tróc nhiÔm s¾c thÓ (SMC) thùc hiÖn
C¸c phøc hÖ protein thùc hiÖn sù kÕt dÝnh nhiÔm s¾c tö vµ kÕt ®Æc NST cã quan hÖ
víi nhau, chóng ®Òu chøa c¸c protein SMC (structural maintanance of chromosome). C¸c
protein SMC ë d¹ng phøc, t−¬ng t¸c “më réng” víi nhau th«ng qua c¸c miÒn xo¾n-xo¾n
kÝch th−íc dµi (xem thªm ch−¬ng 1). C¸c protein SMC kÕt hîp víi c¸c protein kh¸c t¹o
thµnh phøc hÖ kÕt dÝnh hai chuçi ADN víi nhau. Mét phøc hÖ chøa SMC (®−îc gäi lµ
cohesin) lµ thiÕt yÕu ®Ó g¾n kÕt hai nhiÔm s¾c tö chÞ em víi nhau. VÒ cÊu tróc, ng−êi ta
cho r»ng, cohesin lµ mét vßng lín ®−îc cÊu t¹o tõ hai ph©n tö protein SMC vµ mét protein
phi-SMC. Mét sè b»ng chøng cho thÊy, sù kÕt dÝnh hai nhiÔm s¾c tö chÞ em lµ nhê hai
ph©n tö ADN nµy cïng “chui” qua trung t©m vßng cohesin (h×nh 7.9). Sù ph©n gi¶i tiÓu

231
§ç Lª Th¨ng - §inh §oµn Long

phÇn protein phi-SMC nhê enzym sÏ më vßng cohesin. Sù kÕt ®Æc NST còng cÇn phøc hÖ
chøa protein SMC ®−îc gäi lµ condensin. Dï cÊu tróc vµ chøc n¨ng cña condensin cßn
ch−a râ, nh−ng cã lÏ nã cã ®Æc ®iÓm gièng cohesin vµ còng cã d¹ng vßng. Nhê cÊu tróc d¹ng
vßng, nã cã thÓ gióp co ng¾n (gi¶m chiÒu dµi) NST b»ng c¸ch ®ång thêi liªn kÕt víi c¸c
vïng kh¸c nhau cña NST.

ChÊt nhiÔm s¾c Cohesin

Codensin

Kú ®Çu Kú gi÷a Kú sau


H×nh 7.9. M« h×nh dù ®o¸n vÒ vai trß cña cohesin vµ codensin trong qu¸ tr×nh ph©n bµo. Cohesin vµ
codensin lµ thµnh phÇn cña bé khung tÕ bµo. M« h×nh nµy cho r»ng chóng cã cÊu tróc vßng. Nhê vËy, cohesin
vµ codensin cã thÓ liªn kÕt chÆt nh−ng vÉn linh ho¹t ®ång thêi víi c¸c vïng kh¸c nhau cña nhiÔm s¾c thÓ.

7.3. CÊu tróc vµ vai trß cña nucleosome (thÓ nh©n)

7.3.1. Nucleosome lµ ®¬n vÞ cÊu tróc c¬ b¶n cña nhiÔm s¾c thÓ ë eukaryote
ADN cña c¸c eukaryote ®−îc bao B¶ng 7.4. MËt ®é nucleosome vµ chiÒu dµi trung
gãi thµnh c¸c nucleosome (cßn ®−îc gäi b×nh c¸c ®o¹n ADN nèi ë mét sè loµi sinh vËt
lµ thÓ nh©n). §©y chÝnh lµ møc cuén
Loµi MËt ®é nucleosome §é dµi trung
xo¾n ®Çu tiªn cña ADN ®Ó t¹o thµnh
theo chiÒu dµi lÆp b×nh ®o¹n
NST. Nucleosome gåm phÇn lâi h×nh
l¹i trªn ADN (bp) ADN nèi (bp)
thµnh nªn tõ 8 ph©n tö protein histon
vµ ADN bao quanh chóng. ë mäi loµi NÊm men 160 - 165 13 -18
eukaryote, ®o¹n ADN quÊn quanh lâi NhÝm biÓn ~ 260 ~ 110
protein (kho¶ng 1,65 vßng) ®−îc gäi lµ Ruåi giÊm ~ 180 ~ 33
ADN lâi lu«n cã chiÒu dµi æn ®Þnh gåm Ng−êi 185 - 200 38 - 53
147 cÆp baz¬ nit¬ (h×nh 7.10). Ng−îc l¹i,
®o¹n ADN nèi gi÷a c¸c nucleosome, ®−îc Nucleosome
gäi lµ ADN nèi cã chiÒu dµi bÊt ®Þnh,
th−êng dao ®éng tõ 20 - 60 cÆp baz¬ nit¬
vµ cã gi¸ trÞ trung b×nh ®Æc tr−ng cho mçi Lâi Histon
ADN lâi
(147 bp)
loµi eukaryote (b¶ng 7.4). CÊu tróc
nucleosome lµm cho chiÒu dµi ph©n tö
ADN gi¶m ®i kho¶ng s¸u lÇn. Tuy møc
®é “nÐn” nh− vËy ch−a thËt cao nh−ng
nucleosome cßn cã vai trß quyÕt ®Þnh ë
c¸c møc cÊu tróc tiÕp theo cña NST.
ADN nèi
ë mäi tÕ bµo ®Òu cã mét phÇn ADN (20 - 60 bp)
kh«ng ®−îc bao gãi trong nucleosome. §ã lµ H×nh 7.10. S¬ ®å tæ chøc nucleosome
nh÷ng vïng ADN tham gia vµo qu¸ tr×nh (nucleosome)
biÓu hiÖn gen, sao chÐp hoÆc t¸i tæ hîp. Tuy kh«ng n»m trong cÊu tróc nucleosome nh−ng
nh÷ng vïng nµy th−êng liªn kÕt víi c¸c protein phi histon lµm nhiÖm vô ®iÒu hoµ trùc tiÕp
hoÆc tham gia vµo c¸c sù kiÖn ®ã.

232
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

Cã thÓ nãi, ë eukaryote, histon lµ nhãm protein liªn kÕt ADN phæ biÕn nhÊt. Cã n¨m
lo¹i histon lµ H1, H2A, H2B, H3 vµ H4. Trong ®ã, bèn lo¹i H2A, H2B, H3 vµ H4 cÊu t¹o
nªn lâi nucleosome, ®−îc gäi lµ c¸c histon lâi; mçi nucleosome gåm 8 ph©n tö histon
(octamer), mçi lo¹i ®ãng gãp 2 ph©n tö. Cßn mét ph©n tö histon H1 liªn kÕt vµo vïng ADN
nèi; v× vËy nã ®−îc gäi lµ histon nèi. Víi ®Æc ®iÓm nh− vËy, trong tÕ bµo c¸c histon lâi cã
mÆt víi sè l−îng b»ng nhau, cßn H1 chØ cã víi sè l−îng b»ng mét nöa so víi c¸c lo¹i histon
kh¸c. C¸c histon chøa nhiÒu axit amin tÝch ®iÖn d−¬ng, nªn nã cã thÓ liªn kÕt æn ®Þnh víi
ph©n tö ADN tÝch ®iÖn ©m. Kho¶ng h¬n 20% sè axit amin cña c¸c histon lµ Lys vµ Arg.
C¸c protein lâi lµ nh÷ng protein nhá, khèi l−îng dao ®éng kho¶ng 11 - 15 kD trong khi
histon H1 cã khèi l−îng kho¶ng 20 kDa (b¶ng 7.5).

B¶ng 7.5. C¸c ®Æc ®iÓm c¬ b¶n cña c¸c protein histon

Lo¹i histon Histon Khèi l−îng l−îng ph©n tö (Da) TØ lÖ lysine vµ arginine
Histon lâi H2A 14.000 20%
H2B 13.900 22%
H3 15.400 23%
H4 11.400 24%
Histon nèi H1 20.000 32%

Lâi nucleosome cã cÊu


a) §u«i Histon (®Çu N) MiÒn gÊp nÕp histon
tróc h×nh ®Üa vµ chØ h×nh
thµnh khi liªn kÕt víi ADN.
H2A N C
Khi kh«ng liªn kÕt víi
ADN, c¸c histon h×nh thµnh H2B N C
c¸c tËp hîp ë møc thÊp h¬n
C
(nh− c¸c phøc kÐp). Mäi H3 N
histon lâi ®Òu chøa mét H4 N C
vïng cã tÝnh b¶o thñ cao
®−îc gäi lµ miÒn gÊp nÕp b) “Phøc kÐp” H2A-H2B “Tø phøc” H3-H4
histon (h×nh 7.11a). MiÒn C N H3 N
H2A
nµy gåm ba chuçi xo¾n α,
c¸ch nhau b»ng hai ®o¹n H2B
nèi kh«ng ®Æc tr−ng. Sù gÊp
nÕp gi÷a c¸c cÆp histon t¹o
N
nªn c¸c “dÞ phøc kÐp”
N N N
(heterodimer), cã phÇn ®Çu
C vµ ®u«i N kh¸c nhau. H3
H4
vµ H4 t¹o thµnh “dÞ phøc
H×nh 7.11. CÊu tróc vµ sù t¹o phøc kÐp cña c¸c histon lâi. a) S¬ ®å
kÐp H3 – H4”, råi hai “dÞ
duçi th¼ng cña bèn histon lâi. Vïng xo¾n α ®−îc thÓ hiÖn b»ng h×nh èng
phøc kÐp” nh− vËy kÕt hîp (®Ó ý r»ng, liÒn kÒ víi vïng cã cÊu tróc xo¾n α gièng nhau, c¸c histon cßn
víi nhau t¹o nªn “tø phøc” cã mét vïng xo¾n α bæ sung). b) C¸c d¹ng phøc kÐp cña histon lâi.
(tetramer). Trong khi ®ã,
H2A vµ H2B còng kÕt hîp víi nhau t¹o nªn “dÞ phøc kÐp H2A - H2B”, nh−ng kh«ng t¹o
thµnh “tø phøc”.
C¸c phøc kÐp nªu trªn kÕt hîp víi nhau vµ víi ADN theo mét trËt tù nhÊt ®Þnh ®Ó
t¹o thµnh nucleosome. Theo ®ã, tr−íc tiªn “tø phøc H3 - H4” g¾n kÕt vµo ADN, råi c¸c
“phøc kÐp H2A-H2B” míi kÕt hîp vµo ®Ó t¹o nªn nucleosome hoµn chØnh.
§u«i N cña histon (gäi t¾t lµ ®u«i histon) cã cÊu tróc dÔ biÕn ®æi vµ trong dung dÞch
nã lµ phÇn thuéc nucleosome dÔ tiÕp cËn nhÊt. Kh¶ n¨ng tiÕp cËn nµy cã thÓ nhËn thÊy dÔ

233
§ç Lª Th¨ng - §inh §oµn Long

dµng nÕu xö lý nucleosome víi enzym H3


trypsin (lo¹i protease nµy c¾t protein ngay
sau c¸c axit amin tÝch ®iÖn d−¬ng). Trypsin H3
dÔ dµng c¾t ®−îc phÇn ®u«i cña histon
nh−ng kh«ng thÓ c¾t ®−îc miÒn cuén xo¾n H4
chÆt (nh− miÒn gÊp nÕp). §u«i N kh«ng
ph¶i lµ vïng thiÕt yÕu cho sù liªn kÕt gi÷a
ADN lâi víi octamer histon. Thay vµo ®ã,
vai trß quan träng h¬n cña nã cã lÏ lµ tham
gia ®iÒu hßa biÓu hiÖn c¸c gen qua sù biÕn
®æi cÊu tróc nucleosome. Nh÷ng biÕn ®æi ®ã
bao gåm c¸c qu¸ tr×nh phosphoryl ho¸,
acetyl ho¸ vµ methyl ho¸ c¸c gèc Ser vµ Lys
n»m ë vïng ®Çu N cña c¸c histon.
H2B H2B
7.3.2. CÊu tróc ph©n tö cña nucleosome
CÊu tróc ba chiÒu cña h¹t lâi H×nh 7.12. C¸c ®u«i histon (®ÇuH2A N) ë c¸c vÞ trÝ ®Æc
nucleosome (h×nh 7.12) cho biÕt ho¹t ®éng biÖt cña nucleosome. §u«i histon H3 vµ H2B næi lªn
chøc n¨ng cña nã. B¶n chÊt mèi t−¬ng t¸c tõ gi÷a hai ®o¹n chuçi xo¾n kÐp ADN quÊn quanh
gi÷a histon víi ADN gióp gi¶i thÝch cho lùc nucleosome. Ng−îc l¹i, c¸c ®u«i H4 vµ H2A næi lªn ë
hÊp dÉn cao gi÷a nucleosome (tÝch ®iÖn c¶ mÆt trªn vµ d−íi cña phÇn ADN xo¾n kÐp quÊn
quanh nucleosome. C¸c ®u«i nµy lµm ADN quÊn
d−¬ng) víi ADN (tÝch ®iÖn ©m), kh¶ n¨ng quanh nucleosome theo mét trËt tù nhÊt ®Þnh.
biÕn d¹ng cña ADN khi g¾n vµo nucleosome
vµ sù thiÕu tÝnh ®Æc hiÖu trong c¸c tr×nh tù ADN lâi n»m trong cÊu tróc Ra Vµo
nucleosome. Ngoµi ra, mèi t−¬ng t¸c histon víi ADN cßn gióp gi¶i
12
thÝch b¶n chÊt ®éng häc cña nucleosome vµ qu¸ tr×nh l¾p r¸p
nucleosome. Tuy kh«ng hoµn toµn ®èi xøng nh−ng cã thÓ coi
nucleosome cã tÝnh ®èi xøng hai bªn. Cã thÓ thÊy sù ®èi xøng ®ã nÕu H3 H4
9 3
h×nh dung bÒ mÆt ®Üa octamer nh− mÆt mét chiÕc ®ång hå víi ®iÓm H2A H2B
gi÷a cña ®o¹n 147 bp n»m ë vÞ trÝ 12 giê (h×nh 7.13). Hai ®Çu ph©n tö
ADN sÏ ë c¸c vÞ trÝ 1 giê vµ 11 giê. Quay nucleosome quanh trôc ®ã 6
o
180 sÏ thu ®−îc h×nh ¶nh gièng víi tr−íc khi quay. Mçi “tø phøc H3-
H4” vµ “phøc kÐp H2A-H2B” t−¬ng t¸c víi nh÷ng vïng kh¸c nhau trªn
ph©n tö ADN. Trong ®ã, vïng gÊp nÕp histon cña “tø phøc H3-H4”
t−¬ng t¸c víi vïng trung t©m gåm 60 bp trong sè 147 bp cña
nucleosome. Vïng ®Çu N cña H3 (®o¹n xa vïng gÊp nÕp histon nhÊt)
t¹o chuçi xo¾n α thø t− (h×nh 7.11a) ®Ó t−¬ng t¸c víi 13 bp cuèi cïng ë
mçi ®Çu cña ®o¹n ADN liªn kÕt. NÕu chóng ta t−ëng t−îng octamer
histon nh− mÆt ®ång hå th× “tø phøc H3-H4” chiÕm nöa trªn cña ®ång
hå. Nh− vËy, “tø phøc H3-H4” chiÕm vÞ trÝ chñ chèt trong nucleosome
v× nã võa g¾n víi ®o¹n gi÷a võa g¾n víi hai ®Çu cña ADN lâi. Mçi
“phøc kÐp H2A-H2B” liªn kÕt víi kho¶ng 30 bp ë mét phÝa cña ®o¹n
Vµo Ra
trung t©m gåm 60 bp. NÕu h×nh dung trªn mÆt ®ång hå th× vÞ trÝ g¾n
12
kÕt cña ADN víi “phøc kÐp H2A-H2B” t−¬ng øng víi vÞ trÝ tõ 5 giê ®Õn
9 giê trªn c¶ hai mÆt ®ång hå. Nh− vËy 2 phøc kÐp H2A-H2B t¹o nªn
phÇn ®¸y cña octamer. Sù t−¬ng t¸c ë ph¹m vi réng h¬n gi÷a “tø phøc H3 H4
3 9
H3-H4” vµ ADN so víi gi÷a “phøc kÐp H2A-H2B” víi ADN gióp gi¶i H2A H2B
thÝch thø tù l¾p r¸p c¸c histon vµo nucleosome. Khi “tø phøc H3-H4”
®· g¾n kÕt víi ®o¹n gi÷a vµ hai ®Çu cña ADN lâi, nã sÏ bÎ cong ph©n tö 6
ADN ®Ó “phøc kÐp H2A-H2B” dÔ dµng g¾n vµo. Nh−ng nÕu “phøc kÐp H×nh 7.13. Sù ®èi xøng
H2A-H2B” liªn kÕt víi ADN tr−íc, th× ®o¹n ADN liªn kÕt t−¬ng ®èi cña nucleosome.

234
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

ng¾n kh«ng ®ñ bÎ cong ph©n tö ADN ®Ó “tø phøc H3-H4” cã thÓ liªn kÕt vµo n÷a. Nh−ng
ng−êi ta cho r»ng, kiÓu liªn kÕt h¹n chÕ gi÷a “phøc kÐp H2A-H2B” víi ADN l¹i phï hîp
cho sù gi¶i phãng ADN khái nucleosome trong qu¸ tr×nh phiªn m·. C¬ chÕ ®ã cho phÐp
ADN polymerase cã thÓ tiÕp cËn ADN khi phiªn m·.

7.3.3. Histon t−¬ng t¸c víi ADN ë nhiÒu tiÕp ®iÓm kh«ng phô thuéc vµo tr×nh tù
cña c¸c axit amin vµ nucleotide
ViÖc xem xÐt chi tiÕt h¬n mèi t−¬ng t¸c gi÷a c¸c histon víi ADN ở nucleosome cho
thÊy cã 14 tiÕp ®iÓm kh¸c nhau gi÷a ADN víi c¸c histon lâi. ë mçi tiÕp ®iÓm, khe phô cña
ADN ë vÞ trÝ trùc diÖn víi octamer. Trong ®ã, sè liªn kÕt hydro h×nh thµnh gi÷a ADN víi
histon ë mçi tiÕp ®iÓm lµ kh¸ lín (~140). PhÇn lín c¸c liªn kÕt hydro ®ã ®−îc h×nh thµnh
gi÷a c¸c nguyªn tö hydro cña c¸c histon víi c¸c nguyªn tö oxy trong liªn kÕt
phosphodieste cña khung ®−êng-phosphate n»m ë khe phô trªn chuçi xo¾n kÐp ADN.

7.3.4. §u«i histon cã vai trß “cè ®Þnh” ADN quanh octamer
Còng cã ®«i ®iÒu cÇn nãi vÒ vai trß ®o¹n ®u«i N cña histon trong cÊu tróc nucleosome.
NÕu coi octamer nh− mÆt ®ång hå, th× mét ®iÓm ®¸ng chó ý lµ bèn ®u«i H2B vµ H3 næi lªn
tõ kho¶ng c¸ch t−¬ng ®èi ®Òu nhau quanh octamer. Trong ®ã c¸c ®u«i cña H2B t¹i c¸c vÞ trÝ
t−¬ng øng víi kho¶ng 4 giê vµ 8 giê; cßn H3 t¹i c¸c vÞ trÝ 1 giê vµ 11 giê (h×nh 7.13). §iÓm
®Æc biÖt lµ c¸c ®u«i histon H3 vµ H2B ®i ra tõ phÇn gi÷a cña chuçi xo¾n kÐp ADN quÊn
quanh nucleosome. “§−êng dÉn” h×nh thµnh bëi hai vßng cuèn liÒn kÒ cña ADN quanh
octamer t¹o nªn “kho¶ng trèng” ®ñ cho mét chuçi polypeptide ®i ra. Ng−îc l¹i, c¸c ®u«i N
cña c¸c histon H2A vµ H4 næi lªn ë hai mÆt trªn vµ d−íi cña “®Üa” octamer; H4 ë vÞ trÝ 3 giê
vµ 9 giê, cßn H2A ë c¸c vÞ trÝ 5 giê vµ 7 giê. B»ng viÖc næi lªn ë c¶ gi÷a vµ vÒ c¶ hai phÝa cña
chuçi xo¾n kÐp ADN, c¸c ®u«i histon t¹o nªn cÊu tróc gièng nh− “ren” cña chiÕc “èc vÝt”, l¸i
ph©n tö ADN quÊn quanh octamer theo chiÒu tõ tr¸i sang ph¶i.

7.4. C¸c bËc cÊu tróc cao h¬n cña chÊt nhiÔm s¾c

7.4.1. Histon H1 g¾n víi ®o¹n ADN nèi


H1 lµ protein nhá, tÝch ®iÖn d−¬ng, liªn kÕt víi vïng ADN nèi gi÷a c¸c nucleosome
lµm t¨ng c−êng sù liªn kÕt gi÷a ADN vµ nucleosome. Nh− vËy, ngoµi 147 bp thuéc phÇn
ADN lâi quÊn quanh c¸c histon lâi, histon H1 b¶o vÖ thªm kho¶ng 20 bp trong ®o¹n ADN
nèi khái sù ph©n huû bëi nuclease. H1 liªn kÕt víi ADN t¹i hai vÞ trÝ kh¸c biÖt cña chuçi
xo¾n kÐp ADN cïng quÊn quanh mét nucleosome (h×nh 7.14). Mét vÞ trÝ ë ®Çu ra/vµo cña
nucleosome, cßn vÞ trÝ kia n»m gi÷a ®o¹n tr×nh tù trung t©m gåm 147 bp cña ADN lâi.
Nh− vËy, sù b¶o vÖ ADN bæ sung cña H1 chØ ®−îc thùc hiÖn ë mét phÝa cña nucleosome.
B»ng c¸ch kÐo hai vïng ADN l¹i gÇn nhau, H1 t¨ng sù quÊn chÆt ADN quanh octamer
histon. Sù g¾n kÕt cña H1 t¹o cho phÇn ADN ®i vµo vµ ra khái nucleosome h×nh thµnh mét
gãc æn ®Þnh vµ ®Òu ®Æn. Tuy vËy, gãc nµy cã thÓ bÞ ¶nh h−ëng bëi mét sè yÕu tè (nh− nång
®é muèi, ®é pH, sù cã mÆt cña c¸c protein kh¸c).

7.4.2. Sù s¾p xÕp c¸c nucleosome h×nh thµnh sîi nhiÔm s¾c 30 nm
Histon H1 gióp duy tr× æn ®Þnh cÊu tróc bËc cao h¬n cña chÊt nhiÔm s¾c. Trong èng
nghiÖm, khi t¨ng nång ®é muèi vµ bæ sung thªm H1 th× c¸c nucleosome t¹o sîi cã ®−êng
kÝnh 30 nm. §ã chÝnh lµ bËc cÊu tróc tiÕp theo trong qu¸ tr×nh ®ãng gãi ADN. NhiÒu
enzym, nh− ARN polymerase, kh«ng tiÕp cËn ®−îc ADN tõ bËc cÊu tróc nµy.

235
§ç Lª Th¨ng - §inh §oµn Long

Cã hai m« h×nh gi¶i thÝch cho bËc cÊu tróc nµy. Trong m« h×nh solenoid, c¸c
nucleosome h×nh thµnh cÊu tróc siªu xo¾n, mçi b−íc xo¾n chøa kho¶ng s¸u nucleosome.
¶nh hiÓn vi ®iÖn tö vµ nhiÔu x¹ tia X cho thÊy sîi 30 nm cã d¶i xo¾n réng 11 nm. KÝch
th−íc ®ã xÊp xØ b»ng ®−êng kÝnh ®Üa nucleosome, cho phÐp gi¶ thiÕt r»ng, sîi 30 nm gåm
c¸c ®Üa nucleosome lÇn l−ît xo¾n vµ chång lªn nhau (h×nh 7.15a). Trong m« h×nh nµy,
ADN n»m ë phÝa ngoµi c¸c ®Üa octamer histon, cßn ADN nèi n»m ë gi÷a nh−ng kh«ng ®i
qua trôc cña sîi 30 nm mµ c¸c vßng ADN nèi ch¹y quanh trôc chÝnh. M« h×nh thø hai ®−îc
gäi lµ m« h×nh zigzag (h×nh 7.15b). M« h×nh nµy dùa trªn d¹ng zigzag ®−îc t¹o ra khi H1
g¾n vµo ADN nèi cña nucleosome. CÊu tróc sîi 30 nm (d¹ng gièng “lß xo”) phï hîp víi m«
h×nh nµy. Tuy nhiªn, ®Ó cã cÊu tróc zigzag th× ADN nèi ph¶i ®i qua trôc trung t©m cña sîi
30 nm vµ ë d¹ng th¼ng. Nh− vËy, ADN nèi kÝch th−íc dµi tá ra phï hîp h¬n víi m« h×nh
nµy. V× ®é dµi trung b×nh cña ADN nèi kh¸c nhau ë nh÷ng loµi kh¸c nhau nªn cÊu tróc sîi
30 nm cã thÓ kh¸c nhau Ýt nhiÒu gi÷a c¸c loµi.

Lâi histon ADN

a) M« h×nh solenoid

H1

Nucleosome Lâi histon ADN ADN nèi


b) M« h×nh zigzag

Nucleosome sau khi H1 liªn kÕt ADN nèi


H×nh 7.14. Histon H1 cè H×nh 7.15. Hai m« h×nh sîi nhiÔm s¾c 30 nm. a) M« h×nh
®Þnh chuçi xo¾n ADN víi solenoid. §iÒu ®¸ng l−u ý lµ ADN nèi kh«ng di qua trôc trung
nucleosome. H1 cã hai vÞ t©m vµ kh«ng tiÕp cËn ®−îc víi c¸c phÝa, c¸c ®iÓm vµo vµ ra
trÝ liªn kÕt ADN: mét ë ®Çu khái nucleosome cña ADN. b) M« h×nh zigzag. Trong m« h×nh
ra/vµo nucleosome, mét ë nµy, ADN nèi ph¶i ®i qua trôc trung t©m vµ dÔ tiÕp cËn h¬n víi
vïng trung t©m nucleosome. c¸c phÝa, c¸c ®iÓm vµo vµ ra khái nucleosome cña ADN.

7.4.3. §Ó h×nh thµnh sîi nhiÔm s¾c 30 nm cÇn cã


®u«i N cña histon
NÕu histon lâi kh«ng cã ®u«i N th× sîi nhiÔm
s¾c 30 nm kh«ng thÓ h×nh thµnh. Cã lÏ vai trß cña Sîi
®u«i N lµ lµm æn ®Þnh sîi 30 nm b»ng c¸ch t−¬ng t¸c 30 nm
víi nucleosome liÒn kÒ. H×nh ¶nh cÊu tróc ba chiÒu
cña nucleosome cho thÊy c¸c ®u«i N cña c¸c histon
H2A, H2B, H3 vµ H4 t−¬ng t¸c víi nucleosome liÒn
kÒ (h×nh 7.16). Ch¼ng h¹n, ®Çu N cña H4 t¹o nhiÒu
liªn kÕt hydro víi H2A vµ H2B trªn bÒ mÆt cña H×nh 7.16. M« h×nh vÒ sù æn ®Þnh sîi
nhiÔm s¾c 30 nm nhê ®u«i N cña histon.
nucleosome bªn c¹nh. C¸c vïng cña c¸c histon H2A
H×nh minh häa sù t−¬ng t¸c cña c¸c ®u«i N
vµ H2B t−¬ng t¸c víi ®u«i N cña H4 cã tÝnh b¶o thñ thuéc histon ë c¸c nucleosome gÇn nhau,
cao khi ph©n tÝch ë c¸c sinh vËt kh¸c nhau nh−ng nh−ng sù t−¬ng t¸c nµy còng cã thÓ x¶y ra
chóng kh«ng liªn quan ®Õn kh¶ n¨ng liªn kÕt ADN gi÷a c¸c histon xa nhau h¬n.

236
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

còng nh− sù h×nh thµnh octamer. Cã lÏ, nh÷ng vïng nµy cña H2A vµ H2B ®−îc “b¶o tån” ®Ó
duy tr× sù t−¬ng t¸c gi÷a c¸c nucleosome th«ng qua ®u«i N cña H4. ë ch−¬ng 5, chóng ta
®· biÕt sù c¶i biÕn ®u«i N cña histon lµ mét c¬ chÕ ®iÒu hßa biÓu hiÖn gen ë eukaryote.
Nh÷ng c¶i biÕn nµy ®ång thêi cã ¶nh h−ëng ®Õn sù h×nh thµnh c¸c sîi nhiÔm s¾c cã kÝch
th−íc 30 nm vµ mét sè cÊp cÊu tróc nucleosome bËc cao h¬n.

7.4.4. C¸c cÊu tróc thßng läng gåm nhiÒu nucleosome lµm ADN tiÕp tôc kÕt ®Æc h¬n
Nucleosome vµ sîi 30 nm gióp lµm gi¶m chiÒu dµi ph©n tö ADN xuèng kho¶ng 40
lÇn. Tuy nhiªn, ADN cÇn ®−îc kÕt ®Æc h¬n ®Ó n»m trän vÑn ®−îc trong nh©n tÕ bµo. Theo
mét sè m« h×nh th× c¸c sîi 30 nm tiÕp tôc ®−îc cuén xo¾n thµnh c¸c thßng läng gåm
kho¶ng 40 - 90 kb to¶ ra tõ mét cÊu tróc protein ®−îc gäi lµ khung nh©n (khung x−¬ng
NST, h×nh 7.17). B¶n chÊt cña sù cuén xo¾n trªn nÒn khung nh©n ch−a râ. Nh−ng vÒ c¬
b¶n, ng−êi ta ®· x¸c ®Þnh ®−îc hai líp protein tham gia vµo cÊu tróc ®ã lµ topoisomerase II
vµ protein duy tr× cÊu tróc nhiÔm s¾c thÓ SMC ®· ®−îc nªu ë môc 7.2.4 trªn ®©y.

ADN trÇn

Sîi nhiÔm s¾c


CÊu tróc
thßng läng

Khung nh©n
(khung x−¬ng nhiÔm s¾c thÓ)

ADN
Sîi 30 nm Sîi 10 nm trÇn

H×nh 7.17. CÊu tróc bËc cao cña sîi nhiÔm s¾c. ADN ®−îc bao gãi thµnh c¸c thßng läng tõ sîi 30 nm
g¾n vµo nÒn lµ bé khung nh©n. ADN ho¹t ®éng cã cÊu tróc sîi 10 nm hoÆc thËm chÝ lµ ADN trÇn.

7.4.5. C¸c d¹ng biÕn ®æi cña histon lµm thay ®æi chøc n¨ng nucleosome
C¸c histon lâi thuéc nhãm c¸c protein cã tÝnh b¶o thñ cao nhÊt (xem thªm ch−¬ng
10), nªn nucleosome cña mäi eukaryote rÊt gièng nhau. Tuy nhiªn, cã mét sè d¹ng biÕn ®æi
nhá cña histon ®−îc t×m thÊy ë c¸c eukaryote. C¸c histon bÊt th−êng ®ã cã thÓ thay thÕ mét
trong bèn lo¹i histon chuÈn ®Ó t¹o nªn mét sè d¹ng nucleosome biÕn ®æi. C¸c d¹ng
nucleosome biÕn ®æi ®ã cã thÓ gióp ph©n biÖt c¸c vïng NST kh¸c nhau, hoÆc t¹o nªn chøc
n¨ng chuyªn biÖt míi cho nucleosome. VÝ dô H2A.z lµ mét d¹ng biÕn ®æi cña H2A ®−îc t×m
thÊy phæ biÕn trong c¸c nucleosome cña mét sè loµi eukaryote vµ th−êng liªn quan ®Õn
c¸c vïng ADN ®−îc phiªn m·. H2A.z Ýt lµm thay ®æi cÊu tróc chung cña nucleosome
nh−ng thay vµo ®ã, nã øc chÕ hiÖn t−îng “nÐn” chÊt nhiÔm s¾c qua nucleosome (xem
ch−¬ng 5). Nhê vËy, bé m¸y phiªn m· dÔ dµng tiÕp cËn ®−îc ADN.
Mét kiÓu biÕn ®æi thø hai cña histon ®· ®−îc biÕt lµ CENP-A thay thÕ cho H3 ë c¸c
nucleosome vïng t©m ®éng. C¸c nucleosome nµy kÕt hîp víi nhau thµnh thÓ ®éng
(kinetochore) thóc ®Èy sù g¾n kÕt NST vµo thoi ph©n bµo. Gièng nh− H2A.z, CENP-A
kh«ng lµm thay ®æi cÊu tróc nucleosome nh−ng nã cã phÇn ®u«i N më réng mang mét sè
vÞ trÝ liªn kÕt míi cho c¸c protein thuéc thÓ ®éng. ThÕ nªn, nh÷ng thay ®æi ë phÇn ®u«i N
cña histon nµy ë t©m ®éng kh«ng chØ ¶nh h−ëng ®Õn cÊu tróc nucleosome thuéc vïng
nµy, mµ cßn ¶nh h−ëng ®Õn sù t−¬ng t¸c gi÷a nucleosome vµ thÓ ®éng.

237
§ç Lª Th¨ng - §inh §oµn Long

7.5. §iÒu hoµ biÓu hiÖn gen qua cÊu tróc chÊt nhiÔm s¾c

7.5.1. T−¬ng t¸c gi÷a ADN víi octamer histon lµ linh ho¹t
Chóng ta biÕt r»ng, sù kÕt hîp cña ADN vµo nucleosome cã ¶nh h−ëng ®Õn sù ®iÒu
hßa biÓu hiÖn gen. Trong nhiÒu tr−êng hîp, ®Ó gen ®−îc biÓu hiÖn, nucleosome ph¶i dÞch
chuyÓn hoÆc c¸c r·nh cuèn ADN cÇn trë nªn láng lÎo ®Ó bé m¸y phiªn m· cã thÓ tiÕp cËn
®−îc ADN. V× thÕ, sù liªn kÕt gi÷a ADN víi octamer histon cã tÝnh linh ho¹t. Ngoµi ra,
trong nh©n tÕ bµo cßn cã c¸c yÕu tè kh¸c cã thÓ t¸c ®éng ®Õn nucleosome, lµm t¨ng hoÆc
gi¶m sù linh ho¹t cña mèi t−¬ng t¸c nµy. C¸c yÕu tè ®ã kÕt hîp l¹i cho phÐp nucleosome
thay ®æi vÞ trÝ vµ møc ®é t−¬ng t¸c ®Ó ®¸p øng nhu cÇu cÇn biÕn ®æi th−êng xuyªn cña chÊt
nhiÔm s¾c. Gièng nh− c¸c t−¬ng t¸c qua c¸c liªn kÕt yÕu kh¸c (xem ch−¬ng 1), sù liªn kÕt
cña ADN víi octamer histon lµ kh«ng bÒn v÷ng (vïng nµo trªn ADN còng cã thÓ ®−îc lu©n
chuyÓn gi¶i phãng khái tr¹ng th¸i liªn kÕt). B¶n chÊt linh ho¹t ®ã cã vai trß quan träng, v×
nhiÒu protein liªn kÕt ADN cÇn cã ADN ë tr¹ng th¸i kh«ng liªn kÕt víi histon. C¸c
protein nµy chØ cã thÓ tiÕp cËn ®−îc c¸c vÞ trÝ liªn kÕt cña chóng khi kh«ng cã octamer
histon hoÆc qua c¸c ®o¹n ADN nèi. Nhê sù gi¶i xo¾n ngÉu nhiªn vµ kh«ng liªn tôc cña
ADN khái nucleosome mµ protein cã thÓ tiÕp cËn vÞ trÝ liªn kÕt trªn ADN cña chóng víi
tÇn sè tõ 1/100.000 ®Õn 1/1.000 tuú
thuéc vµo vÞ trÝ liªn kÕt n»m ë ®©u
trong nucleosome. VÞ trÝ liªn kÕt cµng Protein 1
gÇn vïng trung t©m ADN lâi Sù kiÖn
nucleosome cµng khã tiÕp cËn. Nh− th−êng x¶y ra
vËy, vÞ trÝ liªn kÕt n»m ë kho¶ng cÆp
VÞ trÝ liªn kÕt
baz¬ tõ 73 ®Õn 147 khã tiÕp cËn nhÊt. protein 1
Trong khi ®ã, c¸c vÞ trÝ gÇn ®Çu (vÝ trÝ 1 Sù kiÖn
hoÆc 147) dÔ tiÕp cËn h¬n. §iÒu nµy cho Ýt x¶y ra
thÊy, d−êng nh− c¬ chÕ béc lé ADN chñ VÞ trÝ liªn kÕt
protein 2
yÕu lµ do sù “cëi bá” ADN khái Protein 2
nucleosome chø kh«ng ph¶i lµ do sù
“níi láng” ADN (h×nh 7.18). Nh−ng,
®©y chØ lµ m« h×nh t×m thÊy trong
®iÒu kiÖn invitro víi nh÷ng
nucleosome ®¬n lÎ. Sù gi¶i phãng H×nh 7.18. M« h×nh tiÕp cËn ADN nucleosome cña
ADN khái nucleosome trong tÕ bµo cã protein. §Ó protein tiÕp cËn ADN, ADN cÇn ®−îc “cëi bá” khái
thÓ phøc t¹p h¬n. octamer.

7.5.2. Phøc hÖ c¶i biÕn nucleosome thóc ®Èy sù dÞch chuyÓn cña nucleosome
TÝnh bÒn v÷ng cña liªn kÕt histon-ADN chÞu t¸c ®éng cña c¸c phøc hÖ protein lín,
®−îc gäi lµ c¸c phøc hÖ t¸i cÊu tróc nucleosome. C¸c phøc hÖ gåm nhiÒu protein nµy sö
dông n¨ng l−îng tõ ATP t−¬ng t¸c víi ADN hoÆc lµm thay ®æi vÞ trÝ nucleosome. Cã ba
kiÓu c¶i biÕn nucleosome c¬ b¶n: 1) octamer tr−ît däc ph©n tö ADN, 2) octamer ®−îc
chuyÓn tõ ph©n tö (hoÆc ®o¹n) ADN nµy sang ph©n tö (hoÆc ®o¹n) ADN kh¸c, vµ
3) nucleosome ®−îc cÊu tróc l¹i ®Ó lµm t¨ng kh¶ n¨ng tiÕp cËn ADN (mµ kh«ng lµm
thay ®æi vÞ trÝ cña nã trªn ADN). Mäi phøc hÖ t¸i cÊu tróc nucleosome ®Òu cã thÓ lµm nã
tr−ît däc ph©n tö ADN, nh−ng chØ cã rÊt Ýt phøc hÖ cã kh¶ n¨ng chuyÓn hoÆc cÊu tróc l¹i
nucleosome. Sù c¶i biÕn nucleosome chi tiÕt thÕ nµo cßn ch−a biÕt ®Çy ®ñ. Nh−ng ®iÒu ®·
®−îc x¸c nhËn lµ ADN ®−îc tiÕp cËn nhiÒu h¬n sau sù c¶i biÕn nucleosome.
Trong tÕ bµo, cã nhiÒu lo¹i phøc hÖ t¸i cÊu tróc nucleosome (b¶ng 7.6). Chóng cã thÓ
®−îc cÊu t¹o tõ 2 ®Õn 10 tiÓu ®¬n vÞ (chuçi polypeptide). Ngoµi tiÓu ®¬n vÞ thuû ph©n ATP
cã mÆt ë hÇu hÕt c¸c lo¹i phøc hÖ, mçi phøc hÖ cßn cã c¸c tiÓu ®¬n vÞ kh¸c gióp thùc hiÖn c¸c

238
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

chøc n¨ng chuyªn biÖt. VÝ dô, nh÷ng tiÓu ®¬n vÞ gióp g¾n phøc hÖ vµo nh÷ng vÞ trÝ ®Ých ®Æc
thï trªn ADN hoÆc t−¬ng t¸c víi c¸c yÕu tè liªn kÕt ADN cña bé m¸y phiªn m·.

B¶ng 7.6. Mét sè phøc hÖ c¶i biÕn vµ t¸i cÊu tróc nucleosome sö dông n¨ng l−îng tõ ATP

Sè tiÓu §Æc ®iÓm cÊu t¹o KiÓu c¶i biÕn nucleosome


Phøc hÖ
®¬n vÞ MiÒn bromo / MiÒn chromo Tr−ît ChuyÓn CÊu tróc l¹i
SWI/SNF 8 -11 MiÒn bromo Cã Cã Cã
ISWI 2-4 Kh«ng cã Cã Kh«ng Kh«ng
Mi2/NuRD 8 -10 MiÒn chromo Cã Kh«ng Kh«ng

7.5.3. Sù ®Þnh vÞ nucleosome


Do sù “n¨ng ®éng” trong t−¬ng t¸c histon - ADN nªn trªn NST hÇu nh− c¸c
nucleosome kh«ng cã vÞ trÝ cè ®Þnh. Nh−ng trong nhiÒu tr−êng hîp, sù giíi h¹n vÞ trÝ
nucleosome, hay cßn gäi lµ sù ®Þnh vÞ nucleosome, lµ cÇn thiÕt. VÝ dô ®iÓn h×nh lµ sù
®Þnh vÞ nucleosome ®Ó duy tr× mét vÞ trÝ liªn kÕt cña protein ®iÒu hßa lu«n n»m trªn
vïng ADN nèi; nhê vËy, protein ®iÒu hßa cã thÓ dÔ dµng tiÕp cËn ADN. C¸c protein liªn
kÕt ADN hoÆc c¸c tr×nh tù ADN ®Æc thï cã thÓ ®iÒu khiÓn sù ®Þnh vÞ nucleosome. Trong tÕ
bµo, th−êng cã sù c¹nh tranh gi÷a nucleosome a)
vµ c¸c protein liªn kÕt ADN kh¸c. NÕu cã mét
ph©n tö protein liªn kÕt vµo ADN tr−íc, th× nã
sÏ ng¨n c¶n sù liªn kÕt cña histon lâi víi ADN
130 bp
vµ ng−îc l¹i. Trong tr−êng hîp cã hai protein
L¾p r¸p
nh− vËy cïng liªn kÕt ë hai vÞ trÝ thuéc vïng nucleosome
ADN lâi nucleosome, th× nucleosome kh«ng
h×nh thµnh (h×nh 7.19a). Sù liªn kÕt liªn tôc
cña nhiÒu protein kh¸c vµo c¸c vïng ADN liÒn
kÒ lµm gia t¨ng chiÒu dµi sîi ADN kh«ng t¹o
nucleosome. Ng−îc víi c¬ chÕ nµy, cã mét sè
protein liªn kÕt ADN kh¸c l¹i thóc ®Èy Vïng ADN kh«ng
nucleosome
nucleosome h×nh thµnh ngay c¹nh vÞ trÝ b)
chóng liªn kÕt (h×nh 7.19b).
Mét c¬ chÕ thø hai ®Ó ®Þnh vÞ nucleosome
lµ cã nh÷ng vïng ADN cã ¸i lùc cao ®Æc biÖt víi L¾p r¸p
nucleosome
octamer histon. V× ADN g¾n vµo octamer bÞ
uèn cong, nªn nucleosome th−êng “−u tiªn”
nh÷ng vïng ADN dÔ bÞ uèn cong h¬n. Nh÷ng
®o¹n ADN giµu A:T t¹i c¸c khe phô cã xu
h−íng uèn cong ®èi diÖn octamer, cßn nh÷ng
®o¹n ADN giµu G:C ë c¸c khe phô cã xu h−íng Nucleosome
ng−îc l¹i (h×nh 7.20). Nucleosome ®−îc h×nh ®−îc “cè ®Þnh”
thµnh tèi −u theo xu h−íng s¾p xÕp nµy. Tuy H×nh 7.19. Hai m« h×nh ®Þnh vÞ nucleosome phô
vËy, cÇn l−u ý lµ nh÷ng ®o¹n ADN cã sù lu©n thuéc protein liªn kÕt ADN. a) Hai protein liªn kÕt
chuyÓn ®Òu ®Æn gi÷a c¸c khe phô giµu A:T vµ ADN c¹nh tranh víi histon. V× nucleosome cÇn ®o¹n
ADN dµi h¬n 147 bp nªn nucleosome kh«ng h×nh
G:C nh− vËy lµ rÊt hiÕm. Vµ, nh÷ng tr×nh tù
thµnh ®−îc ë ®o¹n ADN chØ cã 130 bp gi÷a hai
nh− vËy kh«ng ph¶i lµ b¾t buéc ®Ó h×nh thµnh protein. b) Mét sè protein liªn kÕt ADN thóc ®Èy sù
nucleosome. h×nh thµnh nucleosome c¹nh vÞ trÝ liªn kÕt cña chóng.

239
§ç Lª Th¨ng - §inh §oµn Long
Giµu G:C
C¸c c¬ chÕ ®Þnh vÞ nucleosome nªu trªn
¶nh h−ëng ®Õn sù tæ chøc nucleosome trong hÖ Gi
µu
gen. Dï sao th× phÇn lín nucleosome lµ kh«ng G:
C
cè ®Þnh. C¸c nucleosome cè ®Þnh th−êng n»m ë
c¸c vÞ trÝ khëi ®Çu phiªn m·. Sù cè ®Þnh
A:T Giµu
nucleosome gióp ng¨n c¶n sù tiÕp cËn ADN Giµu A:T
mét c¸ch liªn tôc. Nh− vËy, sù ®Þnh vÞ
nucleosome võa cã thÓ cã t¸c ®éng d−¬ng tÝnh
hoÆc ©m tÝnh ®Õn kh¶ n¨ng tiÕp cËn ADN cña Octamer histon
c¸c protein. H×nh 7.20. Nucleosome “−u tiªn” h×nh thµnh ë
nh÷ng vïng ADN dÔ uèn cong
7.5.4. Sù söa ®æi ®u«i N cña histon lµm
thay ®æi kh¶ n¨ng tiÕp cËn ADN p
MiÒn gÊp nÕp histon
Khi c¸c histon ®−îc t¸ch khái tÕ bµo,
phÇn ®u«i N cña chóng th−êng ë d¹ng ®−îc
biÕn ®æi (h×nh 7.21). Lysine (Lys, K) th−êng
®−îc biÕn ®æi nhê viÖc g¾n thªm nhãm acetyl
(acetyl hãa) hoÆc methyl (methyl hãa); cßn
serine (Ser, S) th−êng ®−îc biÕn ®æi b»ng g¾n
thªm nhãm photsphate (phosphoryl hãa).
Th−êng th× c¸c nucleosome ®−îc acetyl ho¸
t−¬ng øng víi nh÷ng vïng NST ®−îc phiªn
m· tÝch cùc, cßn c¸c nucleosome bÞ khö acetyl
t−¬ng øng víi nh÷ng vïng bÞ øc chÕ phiªn m·. Chøc n¨ng cña
Kh«ng gièng sù acetyl ho¸, sù methyl ho¸ "T¾t""m\"
gen
nh÷ng phÇn kh¸c nhau cña ®u«i N cã thÓ dÉn
®Õn c¸c hiÖu øng kh¸c nhau, hoÆc t¨ng c−êng "BËt" gen
hoÆc øc chÕ phiªn m· tïy thuéc vµo axit “BËt” gen
amin nµo ®−îc methyl hãa. HiÖn t−îng "T¾t" gen /
phosphoryl ho¸ ®u«i N cña H3 th−êng thÊy ë dÞ nhiÔm s¾c
vïng chÊt nhiÔm s¾c kÕt ®Æc cao trong nguyªn "NÐn" NST
ph©n. Ng−êi ta cho r»ng, nh÷ng c¶i biÕn ë
®u«i histon lµ mét d¹ng “m·” mµ c¸c protein "BËt" gen
®iÒu hßa biÓu hiÖn c¸c gen cã thÓ “hiÓu” ®−îc ?
(h×nh 7.21). Nguyªn
nhiÔm s¾c
Sù söa ®æi histon lµm thay ®æi chøc
n¨ng cña nucleosome nh− thÕ nµo? C©u tr¶
lêi lµ: sù thay ®æi râ rÖt nhÊt liªn quan ®Õn
®iÖn tÝch tæng céng cña ®u«i histon. Qu¸
Chøc n¨ng cña
tr×nh acetyl ho¸ (vÝ dô: trung hßa ®iÖn tÝch "m\"
d−¬ng cña Lys) vµ phosphoryl ho¸ (t¨ng ®iÖn "T¾t" gen
tÝch ©m) ®Òu lµm gi¶m ®iÖn tÝch d−¬ng tæng Lo¹i histon
céng cña ®u«i histon (h×nh 7.22). ViÖc mÊt
®iÖn tÝch d−¬ng ®· lµm gi¶m ¸i lùc t−¬ng t¸c "BËt" gen
gi÷a ®u«i N cña histon víi bé khung ®−êng- H×nh 7.21. Sù söa ®æi ®u«i N cña histon lµm thay
phosphate cña ADN mang ®iÖn ©m. Nh− vËy, ®æi chøc n¨ng chÊt nhiÔm s¾c. C¸c vÞ trÝ söa ®æi
sù söa ®æi ®u«i histon ¶nh h−ëng ®Õn kh¶ histon ®· biÕt ®−îc minh ho¹ trªn h×nh. PhÇn lín c¸c
n¨ng s¾p xÕp c¸c nucleosome ®Ó t¹o nªn c¸c bËc söa ®æi x¶y ra ë vïng ®u«i nh−ng còng cã mét vµi söa
®æi n»m trong vïng gÊp nÕp cña histon. HiÖu øng cña
cÊu tróc chÊt nhiÔm s¾c cao h¬n. Nh− ®· nªu ë sù söa ®æi phô thuéc vµo kiÓu söa ®æi còng nh− vÞ trÝ
trªn, ®u«i N cña histon cÇn thiÕt ®Ó t¹o nªn sîi söa ®æi. Trªn h×nh thÓ hiÖn c¸c kiÓu söa ®æi kh¸c nhau
30 nm vµ sù söa ®æi ®u«i N sÏ lµm thay ®æi ph¸t hiÖn ®−îc ë ®u«i N cña histon H3 vµ H4.

240
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

chøc n¨ng nµy. Cô thÓ, nÕu c¸c nucleosome mang c¸c ®u«i N ®−îc acetyl ho¸ (vïng hÖ gen
biÓu hiÖn m¹nh) xÕp liÒn kÒ nhau sÏ kh«ng h×nh thµnh nªn sîi nhiÔm s¾c 30 nm.
Ngoµi nh÷ng ¶nh h−ëng trùc tiÕp ®Õn chøc n¨ng cña nucleosome, viÖc söa ®æi ®u«i
histon còng t¹o ra nh÷ng vÞ trÝ ®Ýnh kÕt cho protein (h×nh 7.22b). Nh÷ng miÒn protein
chuyªn hãa ®−îc gäi lµ miÒn bromo vµ miÒn chromo thóc ®Èy sù t−¬ng t¸c nµy. C¸c
protein chøa miÒn bromo t−¬ng t¸c víi ®u«i histon bÞ acetyl ho¸; trong khi c¸c protein chøa
miÒn chromo t−¬ng t¸c víi ®u«i histon bÞ methyl ho¸. NhiÒu protein chøa miÒn bromo liªn
kÕt tù ph¸t víi enzym acetylase cã ®u«i histon ®Æc hiÖu (b¶ng 7.7). Nh÷ng phøc hÖ nµy cã
thÓ t¨ng c−êng duy tr× chÊt nhiÔm s¾c bÞ acetyl ho¸ b»ng c¸ch söa ®æi tiÕp nh÷ng vïng ®·
®−îc acetyl ho¸ mét phÇn. Theo c¬ chÕ t−¬ng tù, c¸c protein chøa miÒn chromo liªn kÕt víi
c¸c enzym methyl ho¸ cã ®u«i histon ®Æc hiÖu còng gióp duy tr× c¸c nucleosome ®· ®−îc
methyl ho¸ mét phÇn (xem thªm ch−¬ng 5).
Ngoµi ra, cßn cã c¸c protein chøa miÒn bromo vµ chromo kh¸c kh«ng ph¶i lµ nh÷ng
protein söa ®æi histon. Thay vµo ®ã, chóng tham gia vµo qu¸ tr×nh ®iÒu hoµ phiªn m· hoÆc
h×nh thµnh chÊt dÞ nhiÔm s¾c. Ch¼ng h¹n nh−, mét thµnh phÇn chÝnh cña bé m¸y phiªn m·
lµ TFIID còng chøa miÒn bromo. MiÒn nµy huy ®éng bé m¸y phiªn m· ®Õn c¸c vÞ trÝ chÊt
nhiÔm s¾c mang nhiÒu nucleosome ®−îc acetyl ho¸, dÉn ®Õn sù t¨ng c−êng phiªn m· liªn
quan ®Õn hiÖn t−îng acetyl ho¸ nucleosome. Theo c¸ch t−¬ng tù, c¸c phøc hÖ t¸i cÊu tróc
nucleosome còng chøa c¸c protein chøa miÒn bromo.

a)
Nucleosome Nucleosome
acetyl hãa Nucleosome kh«ng söa ®æi
methyl hãa

Protein mang Protein mang


miÒn bromo miÒn chromo
b)

H×nh 7.22. HiÖu øng cña sù söa ®æi ®u«i histon. a) ¶nh h−ëng ®Õn sù liªn kÕt ADN: ®u«i histon kh«ng bÞ söa
®æi vµ bÞ methyl ho¸ g¾n kÕt ADN víi nucleosome chÆt h¬n ®u«i histon bÞ acetyl ho¸. b) ¶nh h−ëng ®Õn sù liªn
kÕt cña protein: Sù söa ®æi ®u«i histon t¹o ra c¸c vÞ trÝ liªn kÕt míi cho enzym c¶i biÕn chÊt nhiÔm s¾c.

241
§ç Lª Th¨ng - §inh §oµn Long

B¶ng 7.7. C¸c enzym c¶i biÕn nucleosome


C¸c phøc hÖ histon acetyltransferase
Lo¹i Sè tiÓu ®¬n vÞ TiÓu ®¬n vÞ xóc t¸c MiÒn bromo / Histon ®Ých
(chuçi polypeptide) miÒn chromo
SAGA 15 Gen5 MiÒn bromo H3 vµ H2B
PCAF 11 PCAF MiÒn bromo H3 vµ H4
NuA3 3 Sas3 Kh«ng cã H3
NuA4 6 Esa1 MiÒn chromo H4
P300/CBP 1 P300/CBP MiÒn bromo H2A, H2B, H3 vµ H4
C¸c phøc hÖ histon deacetylase
Lo¹i Sè tiÓu ®¬n vÞ TiÓu ®¬n vÞ xóc t¸c MiÒn bromo /
(chuçi polypeptide) miÒn chromo
Phøc hÖ Sin3 7 HDAC1/HDAC2 Kh«ng cã
NuRD 9 HDAC1/HDAC2 MiÒn chromo
Phøc hÖ SIR2 3 Sir2 Kh«ng cã
C¸c enzym histon ethylase
Tªn enzym MiÒn bromo / Histon ®Ých
miÒn chromo
SUV39 MiÒn chromo H3 (Lysine 9)
SET1 Kh«ng cã H3 (Lysine 4)
PRMT Kh«ng cã H3 (Arginine 3)

7.5.5. C¸c enzym c¶i biÕn histon


Sù c¶i biÕn histon diÔn ra linh ho¹t do mét sè enzym chuyªn hãa xóc t¸c. C¸c enzym
histon acetylase xóc t¸c bæ sung nhãm acetyl cho lysine (Lys) ë ®u«i N cña histon, n¬i mµ
c¸c enzym histon deacetylase cã t¸c dông ng−îc l¹i (lo¹i bá nhãm acetyl). Trong khi ®ã,
c¸c enzym histon methylase xóc t¸c bæ sung nhãm methyl cho histon. C¸c histon
acetylase kh¸c biÖt nhau vÒ kh¶ n¨ng nhËn biÕt c¸c lo¹i histon ®Ých kh¸c nhau, hoÆc c¸c
axit amin lysine kh¸c nhau trªn cïng ®u«i N. T−¬ng tù nh− vËy, mçi lo¹i histon
methylase còng nhËn biÕt mét lysine hoÆc arginine (Arg) ®Ých kh¸c nhau trªn mçi lo¹i
histon (b¶ng 7.7). V× hiÖu øng ¶nh h−ëng ®Õn chøc n¨ng cña nucleosome do nh÷ng biÕn
®æi nµy lµ kh¸c nhau, nªn c¸c biÕn ®æi do nh÷ng enzym kh¸c nhau thùc hiÖn cã t¸c ®éng
kh¸c nhau ®Õn sù biÓu hiÖn chøc n¨ng cña chÊt nhiÔm s¾c.
C¸c phøc hÖ t¸i cÊu tróc nucleosome th−êng lµ c¸c phøc hÖ lín gåm nhiÒu lo¹i
protein mang c¸c enzym t¸i cÊu tróc nucleosome. Ngoµi ra, cßn cã nh÷ng tiÓu ®¬n vÞ
(protein) bæ sung kh¸c gióp enzym nhËn ra c¸c vïng ®Æc hiÖu trªn ADN. Kh¶ n¨ng liªn
kÕt cña c¸c enzym nµy vµo nh÷ng vïng ADN ®Æc hiÖu ®Ó c¶i biÕn nucleosome däc theo chÊt
nhiÔm s¾c lµ mét c¬ chÕ ®iÒu hßa biÓu hiÖn gen c¬ b¶n ë eukaryote.

7.5.6. Sù c¶i biÕn kÕt hîp t¸i cÊu tróc nucleosome lµm thay ®æi kh¶ n¨ng tiÕp cËn ADN
Sù kÕt hîp c¶ hai c¬ chÕ c¶i biÕn histon víi t¸i cÊu tróc nucleosome cã thÓ lµm t¨ng
®ét ngét kh¶ n¨ng tiÕp cËn mét vïng ADN nhÊt ®Þnh nµo ®ã. T¸c ®éng phèi hîp nµy cã thÓ
lµm thay ®æi râ rÖt, nh−ng th−êng cã tÝnh côc bé. Sù c¶i biÕn ®u«i N cã thÓ ng¨n c¶n c¸c
nucleosome xÕp “chång” lªn nhau ®Ó h×nh thµnh c¸c bËc cÊu tróc cao h¬n cña chÊt nhiÔm
s¾c, qua ®ã t¹o ra nh÷ng vÞ trÝ t−¬ng t¸c ®−îc víi c¸c protein kh¸c nhau (nh− c¸c enzym
vµ yÕu tè phiªn m·), bao gåm c¶ c¸c protein t¸i cÊu tróc nucleosome kh¸c. Sau ®ã, chÝnh
sù t¸i cÊu tróc nucleosome lµm t¨ng c−êng kh¶ n¨ng tiÕp cËn ADN thuéc nucleosome, cho
phÐp c¸c protein liªn kÕt ADN liªn kÕt ®−îc víi c¸c tr×nh tù ADN nµy. Nh÷ng thay ®æi

242
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

nh− vËy dÉn ®Õn viÖc nucleosome “tr−ît däc” hoÆc ®−îc Sîi nhiÔm Phøc hÖ t¸i
“gi¶i phãng” khái ADN. NÕu nh÷ng thay ®æi nµy ®−îc s¾c 30nm cÊu tróc chÊt
thùc hiÖn bëi c¸c protein liªn kÕt ADN ®Æc hiÖu vµ chØ nhiÔm s¾c
diÔn ra ë nh÷ng tr×nh tù ADN nhÊt ®Þnh, th× sù ®Þnh vÞ
hay gi¶i phãng nucleosome sÏ cã tÝnh ®Æc thï ë nh÷ng Protein liªn
vÞ trÝ nhÊt ®Þnh trªn ph©n tö ADN (h×nh 7.23). kÕt ADN 1

7.6. Sù l¾p r¸p nucleosome


7.6.1. Nucleosome ®−îc l¾p r¸p ngay sau khi T¸i cÊu tróc
ADN ®−îc sao chÐp
Sù nh©n ®«i NST kh«ng chØ ®ßi hái sù nh©n ®«i
ADN, vµ cßn ®ßi hái sù nh©n ®«i vµ l¾p r¸p trë l¹i cña
c¸c lo¹i protein cÊu tróc nªn NST, gåm c¶ c¸c protein Protein liªn
histon vµ phi-histon, vµo mçi ph©n tö ADN con võa kÕt ADN 2

®−îc h×nh thµnh.


Trong qu¸ tr×nh nh©n ®«i NST ë eukaryote, ®Ó
qu¸ tr×nh sao chÐp ADN cã thÓ diÔn ra, c¸c
nucleosome ®−îc “gì bá” t¹m thêi trong thêi gian Protein liªn kÕt ADN 2
ng¾n. Sau ®ã, khi ADN ®· ®−îc sao chÐp, c¸c ph©n tö huy ®éng enzym histon
ADN con gÇn nh− ngay lËp tøc ®−îc ®ãng gãi trë l¹i Histon acetylase acetylase
th«ng qua mét lo¹t c¸c sù kiÖn x¶y ra theo trËt tù
nhÊt ®Þnh. Nh− ®· nªu trªn, b−íc ®Çu tiªn trong l¾p
r¸p nucleosome lµ sù liªn kÕt vµo ADN cña mét “tø
phøc H3-H4”. Khi tø phøc nµy ®· liªn kÕt víi ADN th×
“phøc kÐp H2A-H2B” sÏ kÕt hîp vµo ®Ó h×nh thµnh
nucleosome míi hoµn chØnh. Trong qu¸ tr×nh h×nh
thµnh c¸c cÊu tróc bËc cao h¬n cña chÊt nhiÔm s¾c, cã
lÏ H1 sÏ g¾n vµo phøc hÖ nucleosome cuèi cïng.
§Ó nh©n ®«i NST, Ýt nhÊt ph¶i cã mét nöa sè
nucleosome trªn c¸c NST con ®−îc tæng hîp míi. VËy, Sîi nhiÔm
liÖu cã ph¶i tÊt c¶ c¸c nucleosome cò ®Òu mÊt ®i vµ s¾c 10nm
c¸c nucleosome ë tÕ bµo con ®Òu ®−îc tæng hîp míi?
NÕu kh«ng ®óng nh− vËy, th× c¸c histon cò ®ãng gãp
thÕ nµo vµo thµnh phÇn nucleosome míi? ë ®©y,
chóng ta sÏ thÊy sù tham gia cña c¸c histon cò vµo
nucleosome míi cã vai trß quan träng, v× hiÖu qu¶ c¶i
biÕn nucleosome cã ¶nh h−ëng trùc tiÕp ®Õn kh¶ H×nh 7.23. C¸c phøc hÖ t¸i cÊu tróc
n¨ng tiÕp cËn cña chÊt nhiÔm s¾c míi h×nh thµnh. chÊt nhiÔm s¾c vµ c¸c enzym c¶i biÕn
NÕu c¸c histon cò bÞ “lo¹i bá” hoµn toµn, th× cã nghÜa histon kÕt hîp víi nhau lµm thay ®æi
lµ sù sao chÐp NST ®· xãa bá “b¶n ghi nhí” vÒ sù c¶i cÊu tróc nucleosome. C¸c protein liªn
biÕn nucleosome tr−íc ®ã. Ng−îc l¹i, nÕu c¸c kÕt ADN g¾n vµo nh÷ng vïng ®Æc hiÖu
trªn NST. Trªn h×nh, protein 1 g¾n vµo
nucleosome cò chØ ®−îc gi÷ l¹i ë mét trong hai ph©n ADN råi huy ®éng phøc hÖ t¸i cÊu tróc
tö ADN con míi h×nh thµnh th× hai b¶n sao NST míi chÊt nhiÔm s¾c lµm thay ®æi nucleosome
sÏ cã hai kiÓu tËp hîp c¸c nucleosome cã sù c¶i biÕn bªn c¹nh, dÉn ®Õn kh¶ n¨ng tiÕp cËn ADN
hÇu nh− hoµn toµn kh¸c nhau. t¨ng lªn. Sù kiÖn ®ã ®ång thêi cho phÐp
protein thø hai (histon acetylase) g¾n vµo
C¸c kÕt qu¶ thùc nghiÖm ®· chøng minh r»ng, ADN. B»ng viÖc söa ®æi ®u«i N cña c¸c
nucleosome liÒn kÒ, enzym nµy lµm thay
c¸c histon cò tham gia vµo cÊu tróc nucleosome t−¬ng ®æi cÊu h×nh chÊt nhiÔm s¾c tõ d¹ng 30
®èi ®ång ®Òu ë c¶ hai tÕ bµo con. Trong ®ã, cã sù l¾p nm thµnh d¹ng 10 nm dÔ tiÕp cËn.

243
§ç Lª Th¨ng - §inh §oµn Long

r¸p nucleosome míi gåm c¶ histon cò vµ histon míi. Tuy vËy, sù tæ hîp míi nµy kh«ng
ph¶i ngÉu nhiªn hoµn toµn. C¸c “tø phøc H3-H4” vµ “phøc kÐp H2A-H2B” lu«n ë d¹ng
phøc hîp hoµn toµn cò hoÆc hoµn toµn míi. Nh−ng, “tø phøc H2A-H2B” cã thÓ võa cò
võa míi, hoÆc hoµn toµn míi, hoÆc hoµn toµn cò. Nh− vËy, trong qu¸ tr×nh sao chÐp
ADN, tuy nucleosome bÞ “ph¸ vì”, nh−ng “tø phøc H3-H4” cã xu h−íng duy tr× nguyªn
vÑn vµ liªn kÕt vµo mét trong hai ph©n tö ADN con mét c¸ch ngÉu nhiªn mµ kh«ng bao
giê gi¶i phãng hoµn toµn khái ph©n tö ADN. Ng−îc l¹i “phøc kÐp H2A-H2B”, tuy ®−îc
duy tr× ë d¹ng phøc hîp, nh−ng chóng ®−îc gi¶i phãng khái ADN vµ tham gia vµo “quü
dù trù” histon tù do ®Ó ®−îc dïng cho viÖc tæng hîp c¸c nucleosome míi.
Sù ph©n phèi c¸c histon cò vµo c¸c nucleosome ë c¸c tÕ bµo con nªu trªn lµ c¬ chÕ
®¶m b¶o sù s¶n sinh ra c¸c NST ë c¸c tÕ bµo con duy tr× ®−îc kiÓu c¶i biÕn histon cña c¸c
NST ë tÕ bµo mÑ. B»ng c¬ chÕ nµy, c¸c histon cò dï ®−îc ph©n chia vµo tÕ bµo con nµo
còng cã xu h−íng liªn kÕt vµo ®óng vïng ADN mµ chóng ®· liªn kÕt ë tÕ bµo mÑ. Sù di
truyÒn côc bé vÒ kiÓu c¶i biÕn histon nh− vËy dÉn ®Õn sù c¶i biÕn histon chØ cÇn diÔn ra
h¹n chÕ t¹i c¸c vÞ trÝ NST t−¬ng øng ë tÕ bµo con. §ã lµ do mçi kiÓu c¶i biÕn histon cã xu
h−íng “huy ®éng” chÝnh c¸c enzym xóc t¸c ho¹t ®éng ®ã tíi c¸c nucleosome l©n cËn vµ
tiÕn hµnh c¶i biÕn t−¬ng tù. §©y lµ mét c¬ chÕ ®¬n gi¶n gióp duy tr× tr¹ng th¸i c¶i biÕn
nucleosome gièng nhau gi÷a c¸c tÕ bµo con còng nh− gi÷a chóng víi tÕ bµo mÑ sau sù
nh©n ®«i NST. Nã còng chÝnh lµ c¬ chÕ c¬ b¶n nhÊt gióp duy tr× tr¹ng th¸i chÊt nhiÔm
s¾c qua nhiÒu thÕ hÖ ph©n bµo ë eukaryote ®a bµo.

7.6.2. Sù l¾p r¸p nucleosome cÇn “histon chaperon”


Sù l¾p r¸p nucleosome kh«ng diÔn ra tù ph¸t. Thùc nghiÖm cho thÊy, viÖc bæ sung
c¸c histon tù do vµo ADN trong ®iÒu kiÖn invitro th«ng th−êng kh«ng dÉn ®Õn sù h×nh
thµnh nucleosome. Lóc ®ã, hÇu hÕt c¸c histon dÝnh kÕt víi nhau thµnh mét phøc hîp
kh«ng cã vai trß sinh häc. §Ó sù l¾p r¸p nucleosome diÔn ra, nång ®é muèi ph¶i t¨ng lªn
rÊt cao (> 1M NaCl) råi gi¶m ®i tõ tõ sau nhiÒu giê. MÆc dï vËy, trong ®iÒu kiÖn invivo
sù l¾p r¸p nucleosome l¹i kh«ng liªn quan ®Õn sù thay ®æi nång ®é muèi.
Nh−ng tõ viÖc ph¸t hiÖn ra ¶nh h−ëng cña nång ®é muèi ®Õn sù l¾p r¸p
nucleosome, ng−êi ta ®· x¸c ®Þnh ®−îc trong tÕ bµo cã mét sè yÕu tè thiÕt yÕu cÇn cho sù
h×nh thµnh nucleosome xuÊt ph¸t tõ c¸c phøc hÖ “tø phøc H3-H4” còng nh− “phøc kÐp
H2A-H2B” (b¶ng 7.8). §©y lµ nh÷ng protein tÝch ®iÖn ©m lµm nhiÖm vô “dÉn ®−êng” vµ
“hé tèng” c¸c tø phøc H3-H4 vµ phøc kÐp H2A-H2B ®Õn c¸c vÞ trÝ l¾p r¸p nucleosome
trªn ph©n tö ADN. Chóng ®−îc gäi lµ c¸c histon chaperone.
VËy, c¸c histon chaperone ®iÒu khiÓn sù l¾p r¸p nucleosome ë c¸c vÞ trÝ nhÊt ®Þnh
trªn ph©n tö ADN nh− thÕ nµo? C¸c nghiªn cøu vÒ chaperone CAF-1 ®iÒu khiÓn “tø
phøc H3-H4” cho thÊy sù l¾p r¸p nucleosome do chaperone nµy ®iÒu khiÓn cÇn ®iÒu
kiÖn ®Çu tiªn lµ ADN ®ang sao
B¶ng 7.8. Thuéc tÝnh cña c¸c histon chaperone
chÐp. CAF-1 nhËn ra ADN
Tªn Sè tiÓu Lo¹i histon T−¬ng t¸c víi thµnh phÇn
®ang sao chÐp qua mét sè c¬ ®¬n vÞ liªn kÕt cña bé m¸y sao chÐp (PCNA)
chÕ ®¸nh dÊu ADN. §iÒu thó
CAF-1 4 H3 - H4 Cã
vÞ lµ c¸c yÕu tè ®¸nh dÊu nµy
RCAF 1 H3 - H4 Kh«ng
mÊt dÇn ®i khi qu¸ tr×nh sao
NAP-1 1 H2A - H2B Kh«ng
chÐp kÕt thóc. YÕu tè ®¸nh dÊu

244
Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

ADN ®ang sao chÐp ®iÒu khiÓn ho¹t ®éng cña CAF-1 lµ PCNA. §©y lµ mét protein d¹ng
vßng cã thÓ tr−ît däc ph©n tö ADN vµ th«ng th−êng cã vai trß gi÷ ADN polymerase g¾n
vµo ADN trong qu¸ tr×nh sao chÐp. Khi ADN polymerase ®· kÕt thóc sao chÐp ë mét vÞ
trÝ nhÊt ®Þnh, PCNA rêi khái ADN polymerase nh−ng vÉn liªn kÕt víi ADN. Trong ®iÒu
kiÖn ®ã, PCNA cã thÓ t−¬ng t¸c víi c¸c protein kh¸c, trong ®ã cã CAF-1. CAF-1 sau khi
liªn kÕt víi PCNA sÏ huy ®éng “tø phøc H3-H4” ®Õn vÞ trÝ ADN ®ang liªn kÕt víi PCNA.
Nh− vËy, th«ng qua viÖc t−¬ng t¸c víi mét thµnh phÇn cña bé m¸y sao chÐp, CAF-1 ®iÒu
khiÓn sù l¾p r¸p nucleosome t¹i vÞ trÝ ADN võa míi sao chÐp xong.

245
Ch−¬ng 8

Chu tr×nh tÕ bµo vµ


cë së Di truyÒn häc ung th−
Theo thèng kª cña tæ chøc y tÕ thÕ giíi, hµng n¨m cã trªn d−íi 9 triÖu ng−êi chÕt do
c¸c bÖnh ung th−, ch−a kÓ kho¶ng 15 triÖu ng−êi kh¸c míi m¾c bÖnh. VËy, ung th− xuÊt
hiÖn nh− thÕ nµo? T¹i sao bÖnh nµy ®−îc coi lµ bÖnh nan y nguy hiÓm nhÊt cña thÕ kû
XXI? T¹i sao mét sè bÖnh ung th− cã biÓu hiÖn di truyÒn theo dßng hä? Cã hay kh«ng sù
di truyÒn cña tÊt c¶ c¸c bÖnh ung th−? C¸c yÕu tè m«i tr−êng cã vai trß thÕ nµo trong sù
ph¸t sinh ung th−? Trong nh÷ng n¨m gÇn ®©y, c¸c phßng thÝ nghiÖm trªn thÕ giíi ®· cã
nhiÒu nghiªn cøu c¬ b¶n vÒ b¶n chÊt, c¬ chÕ ph¸t sinh c¸c bÖnh ung th− kh¸c nhau vµ
nhê ®ã gÇn ®©y chóng ta ®· cã nh÷ng hiÓu biÕt c¬ b¶n vÒ c¨n bÖnh nµy. Dï cßn nhiÒu chi
tiÕt cÇn tiÕp tôc lµm s¸ng tá nh−ng nh÷ng hiÓu biÕt ®Õn nay cho thÊy ung th− xuÊt hiÖn
chñ yÕu do c¸c rèi lo¹n di truyÒn. Trong mét sè tr−êng hîp, c¸c rèi lo¹n nµy h×nh thµnh
vµ tiÕn triÓn do c¸c yÕu tè m«i tr−êng, nh− chÕ ®é dinh d−ìng, tia cùc tÝm (UV) tõ ¸nh
s¸ng mÆt trêi, hoÆc do c¸c t¸c nh©n « nhiÔm m«i tr−êng. C¸c d¹ng ung th− th−êng xuÊt
hiÖn do ®ét biÕn x¶y ra ë c¸c gen thiÕt yÕu, cã thÓ lµm sai háng c¸c qu¸ tr×nh trao ®æi
chÊt vµ dÉn ®Õn viÖc lµm c¬ thÓ mÊt kh¶ n¨ng kiÓm so¸t sù ph©n chia tÕ bµo (gäi t¾t lµ
sù ph©n bµo). Lóc nµy, c¸c tÕ bµo ung th− ph©n chia kh«ng ngõng, dÇn dÇn h×nh thµnh
nªn khèi u gåm nhiÒu líp tÕ bµo chång chÊt lªn nhau. Khi c¸c tÕ bµo t¸ch khái khèi u vµ
x©m lÊn ra c¸c vïng m« xung quanh, khèi u chuyÓn sang d¹ng u ¸c tÝnh. Cßn nÕu khi
c¸c tÕ bµo khèi u kh«ng cã biÓu hiÖn x©m lÊn c¸c m« xung quanh th× ®−îc gäi lµ u lµnh.
B¶ng 8.1 nªu c¸c ®Æc ®iÓm ph©n biÖt
c¬ b¶n gi÷a u ¸c tÝnh vµ u lµnh tÝnh. B¶ng 8.1. Ph©n biÖt u lµnh vµ u ¸c theo ®Æc ®iÓm sinh häc
U ¸c tÝnh cã thÓ ph¸t t¸n tíi c¸c
U lµnh tÝnh U ¸c tÝnh
vïng kh¸c nhau cña c¬ thÓ vµ h×nh
thµnh c¸c khèi u thø cÊp. Qu¸ tr×nh TÕ bµo biÖt hãa cao TÕ bµo Ýt biÖt hãa
nµy ®−îc gäi lµ sù di c¨n. C¶ hai Ph©n bµo Ýt vµ chËm Ph©n chia nguyªn ph©n liªn tôc
d¹ng khèi u lµnh tÝnh vµ ¸c tÝnh ®Òu Kh«ng x©m lÊn xung quanh X©m lÊn lan réng
th−êng cã nh÷ng sai háng trong c¸c Kh«ng cã ho¹i tö Th−êng cã ho¹i tö trung t©m
c¬ chÕ ®iÒu khiÓn sù ph©n bµo. Nh×n Cã vá bäc Kh«ng cã vá bäc
chung c¸c nghiªn cøu vÒ ung th− RÊt Ýt t¸i ph¸t Lu«n t¸i ph¸t
trªn 30 n¨m qua cho thÊy, viÖc mÊt Kh«ng di c¨n Di c¨n
kh¶ n¨ng ®iÒu khiÓn ph©n bµo ®Òu Ýt ¶nh h−ëng ®Õn c¬ thÓ ¶nh h−ëng nÆng ®Õn c¬ thÓ
liªn quan ®Õn c¸c sai háng di truyÒn.

8.1. C¸c d¹ng biÓu hiÖn cña bÖnh ung th−


Ung th− kh«ng ph¶i lµ mét bÖnh duy nhÊt mµ thuËt ng÷ nµy ph¶n ¸nh mét nhãm
c¸c d¹ng bÖnh lý kh¸c nhau (®Õn nay ®· cã trªn 200 d¹ng bÖnh ung th− ®−îc m« t¶). C¸c
d¹ng ung th− cã thÓ xuÊt hiÖn tõ nhiÒu lo¹i m« kh¸c nhau cña c¬ thÓ. Mét sè d¹ng ph¸t
triÓn nhanh, trong khi mét sè d¹ng kh¸c ph¸t triÓn chËm h¬n. Mét sè d¹ng cã thÓ ng¨n
chÆn ®−îc nhê c¸c ph¸c ®å ®iÒu trÞ thÝch hîp, nh−ng còng cã nh÷ng d¹ng ®Õn nay ch−a
®iÒu trÞ ®−îc. Trong c¸c d¹ng ung th− kh¸c nhau (h×nh 8.1), ung th− tiÒn liÖt tuyÕn ë
nam giíi lµ phæ biÕn nhÊt, sau ®ã lµ ung th− vó ë phô n÷. D¹ng ung th− phæ biÕn nhÊt cã
c¶ ë hai giíi lµ ung th− phæi. Trong mét sè tr−êng hîp, nguy c¬ m¾c ung th− biÓu hiÖn

246
Ch−¬ng 8. Chu tr×nh tÕ bµo vµ c¬ së di truyÒn häc ung th−

nh− mét tÝnh tr¹ng di truyÒn. Tuy vËy, ë phÇn lín tr−êng hîp, ung th− xuÊt hiÖn nh−
hËu qu¶ tÝch lòy ngÉu nhiªn c¸c ®ét biÕn trong tÕ bµo soma.
Dï r»ng ®Õn nay tØ lÖ bÖnh nh©n ung th− tö vong vÉn cßn cao. Nh−ng ph¶i kh¼ng
®Þnh r»ng nh÷ng tiÕn bé khoa häc kü thuËt trong kho¶ng 20 n¨m qua ®· ®¹t ®−îc nh÷ng
b−íc tiÕn v−ît bËc vÒ kh¶ n¨ng chÈn ®o¸n sím vµ ph−¬ng ph¸p ®iÒu trÞ c¸c bÖnh ung th−
kh¸c nhau. C¸c ph−¬ng ph¸p di truyÒn ph©n tö cho phÐp chÈn ®o¸n nguy c¬ m¾c mét sè
bÖnh ung th− vèn tr−íc ®©y kh«ng thùc hiÖn ®−îc; qua ®ã ®Þnh h−íng c¸c biÖn ph¸p
ng¨n ngõa, phßng chèng vµ ®iÒu trÞ bÖnh.
Trong phßng thÝ nghiÖm, c¸c tÕ bµo ung th− cã thÓ ®−îc thu nhËn b»ng viÖc nu«i
cÊy c¸c tÕ bµo b×nh th−êng (lµ c¸c tÕ bµo ®éng vËt ®−îc thuÇn hãa) råi xö lý chóng b»ng
c¸c t¸c nh©n g©y ung th− (carcinogen). Nh÷ng t¸c nh©n nµy còng th−êng lµ c¸c t¸c
nh©n g©y ®ét biÕn, nh− c¸c t¸c nh©n vËt lý (chiÕu x¹, phãng x¹), hoÆc c¸c t¸c nh©n hãa
häc (hãa chÊt g©y ®ét biÕn) hay t¸c nh©n sinh häc (virut). C¸c tÕ bµo b×nh th−êng vµ tÕ
bµo ung th− trong qu¸ tr×nh nu«i cÊy cã thÓ ph©n biÖt ®−îc qua sù biÓu hiÖn cña chóng.
Th«ng th−êng, nÕu c¸c tÕ bµo b×nh th−êng chØ h×nh thµnh mét líp tÕ bµo trªn bÒ mÆt m«i
tr−êng nu«i cÊy, th× c¸c tÕ bµo ung th− xuÊt hiÖn thµnh nhiÒu líp kÕt côm víi nhau, t¹o
nªn nh÷ng khèi tÕ bµo lín. Së dÜ nh− vËy lµ do c¸c ®¸m tÕ bµo ung th− kh«ng ph¶n øng
víi c¸c tÝn hiÖu øc chÕ ph©n bµo mµ chóng h×nh thµnh nªn nh÷ng cÊu tróc kh«ng cã tæ
chøc (kh«ng ®Þnh h×nh), ®ång thêi th−êng cã sù tæng hîp c¸c protein bÊt th−êng, hoÆc cã
nh÷ng biÕn ®æi vÒ cÊu tróc vµ sè l−îng nhiÔm s¾c thÓ.

Nhãm bÖnh Nam giíi N÷ giíi


MiÖng vµ vßm häng
D¹ dµy
Ruét kÕt
Tôy
C¸c èng tiªu hãa kh¸c
KhÝ qu¶n, phÕ qu¶n, phæi
C¸c phÇn kh¸c cña hÖ h« hÊp
X−¬ng vµ c¸c m« liªn kÕt
Da
Ngùc (nam) / vó (n÷)
TuyÕn tiÒn liÖt (nam) / Tö cung (n÷)
C¸c phÇn kh¸c cña hÖ sinh dôc
Bµng quang
ThËn vµ c¸c èng tiÕt niÖu
M¾t, n·o vµ thÇn kinh trung −¬ng
Ghi chó
H¹ch b¹ch huyÕt Sè ng−êi m¾c bÖnh
B¹ch cÇu (m¸u tr¾ng) Sè ng−êi tö vong
C¸c bÖnh kh¸c

TØ lÖ t−¬ng ®èi gi÷a c¸c nhãm bÖnh ung th− kh¸c nhau
H×nh 8.1. TÇn sè m¾c bÖnh vµ tØ lÖ tö vong cña c¸c bÖnh nh©n thuéc c¸c nhãm bÖnh ung th− kh¸c nhau.
(theo thèng kª cña Së y tÕ Bang Winconsin, Hoa Kú, n¨m 1999).

247
§inh §oµn Long

8.2. Ung th− lµ hËu qu¶ cña sai háng trong ®iÒu hßa chu tr×nh tÕ bµo
Mét chu tr×nh tÕ bµo b×nh th−êng (h×nh 8.2) §iÓm kiÓm tra G1
gåm hai pha sinh tr−ëng (G1 vµ G2) xen kÏ bëi mét (®iÓm START)
pha sao chÐp ADN (pha S) vµ mét pha ph©n bµo (pha
M). Thêi gian kÐo dµi cña mçi chu tr×nh tÕ bµo còng
nh− tõng pha cña nã ®−îc ®iÒu khiÓn “chÆt chÏ” bëi HÖ thèng
c¸c ph©n tö tÝn hiÖu néi bµo vµ ngo¹i bµo. Sù chuyÓn ®iÒu khiÓn
®æi tõ pha nµy sang pha kia trong chu tr×nh tÕ bµo do
sù ®iÒu khiÓn phèi hîp cña nhiÒu ph©n tö tÝn hiÖu
nhÊt ®Þnh vµ biÓu hiÖn b»ng nh÷ng ®¸p øng chÝnh
x¸c vµ ®Æc tr−ng cña tÕ bµo víi tõng lo¹i ph©n tö tÝn
§iÓm
hiÖu t−¬ng øng. NÕu cã sai sãt trong qu¸ tr×nh kiÓm tra M §iÓm kiÓm tra G2
truyÒn tÝn hiÖu, hoÆc ®¸p øng cña tÕ bµo thiÕu chÝnh
x¸c, c¸c tÕ bµo cã thÓ ph©n chia v« h¹n vµ chuyÓn H×nh 8.2. Chu tr×nh tÕ bµo ë sinh vËt ®a bµo
sang tr¹ng th¸i ung th−.
Nh×n chung, cã thÓ nãi sù Cdk4/6- Cdk2- Cdk2- Cdk1-
chuyÓn tiÕp tõ pha nµy sang pha CyclinD CyclinE CyclinA CyclinB
L−îng phøc hÖ

kh¸c trong chu tr×nh tÕ bµo ®−îc


kiÓm so¸t bëi c¸c ®iÓm kiÓm tra
chu tr×nh tÕ bµo. T¹i mçi ®iÓm
kiÓm tra, d−êng nh− tÕ bµo thùc
hiÖn b−íc “t¹m dõng” ®Ó kiÓm tra G1 S G2 M
xem `tÕ bµo ®· s½n sµng cho pha
§iÓm b¾t ®Çu (START)
tiÕp theo hay ch−a (vÝ dô: sù sao
chÐp ADN ®· hoµn thµnh hay C¸c pha cña chu tr×nh tÕ bµo
nh÷ng sai háng ADN ®· ®−îc söa H×nh 8.3. Sù biÕn thiªn hµm l−îng c¸c phøc hÖ protein Cyclin
ch÷a ch−a). C¬ chÕ ph©n tö t¹i vµ c¸c enzym kinase phô thuéc cyclin (CDK) qua c¸c pha cña
mçi ®iÓm kiÓm tra lµ t−¬ng ®èi chu tr×nh tÕ bµo (vÝ dô nµy ë ®éng vËt cã x−¬ng sèng).
phøc t¹p. Tuy vËy, cã hai nhãm protein ®· biÕt cã vai trß chñ yÕu trong qu¸ tr×nh nµy lµ
c¸c protein cyclin vµ c¸c kinase phô thuéc cyclin, ®−îc viÕt t¾t lµ CDK (cyclin-
dependent kinase).
C¸c CDK lµ thµnh phÇn tham gia ®iÒu hßa chu tr×nh tÕ bµo qua ho¹t ®éng xóc t¸c.
C¸c enzym nµy ®iÒu hßa ho¹t tÝnh cña c¸c protein kh¸c b»ng viÖc phosphoryl hãa ph©n
tö protein ®Ých. Tuy vËy, ho¹t tÝnh phosphoryl hãa cña CDK l¹i phô thuéc vµo sù cã mÆt
cña c¸c cyclin. Nång ®é c¸c cyclin thay ®æi cã tÝnh chu kú qua c¸c pha cña chu tr×nh tÕ
bµo (h×nh 8.3). C¸c protein cyclin gióp c¸c CDK cã thÓ thùc hiÖn ®−îc chøc n¨ng cña
chóng qua sù h×nh thµnh phøc hÖ cyclin/CDK. Khi kh«ng cã cyclin, phøc hÖ nµy kh«ng
h×nh thµnh vµ CDK ë d¹ng kh«ng ho¹t ®éng. Sù chuyÓn tiÕp tõ pha nµy sang pha kh¸c
cña chu tr×nh tÕ bµo phô thuéc vµo chu kú h×nh thµnh vµ biÕn tÝnh cña c¸c phøc hÖ
cyclin/CDK kh¸c nhau.
Mét trong nh÷ng ®iÓm kiÓm tra quan träng nhÊt trong chu tr×nh tÕ bµo ®−îc gäi lµ
®iÓm b¾t ®Çu, gäi t¾t lµ ®iÓm START, ë gÇn cuèi pha G1 (h×nh 8.2). Lóc nµy, tÕ bµo
nhËn ®−îc c¸c tÝn hiÖu néi bµo vµ ngo¹i bµo x¸c ®Þnh tÕ bµo ®· s½n sµng cho viÖc chuyÓn
sang pha S hay ch−a. §iÓm START ®−îc ®iÒu khiÓn bëi protein cyclin lo¹i D (cyclinD) cã
vai trß ho¹t hãa enzym CDK4. Khi phøc hÖ cyclinD/CDK4 h×nh thµnh ®Õn mét l−îng nhÊt
®Þnh, tÕ bµo v−ît ®iÓm START vµ chuyÓn sang pha S. Trong ®iÒu kiÖn tÕ bµo ch−a s½n
sµng cho mét chu tr×nh míi, ch¼ng h¹n do m«i tr−êng thiÕu dinh d−ìng hay ADN sai
háng ch−a ®−îc kh¾c phôc, mét sè protein øc chÕ ®−îc ho¹t hãa ®Ó ph¸ hñy phøc hÖ
cyclinD/CDK4. KÕt qu¶ lµ tÕ bµo kh«ng ®−îc chuyÓn vµo pha S. Khi ®· ®¸p øng ®−îc c¸c

248
Ch−¬ng 8. Chu tr×nh tÕ bµo vµ c¬ së di truyÒn häc ung th−

®iÒu kiÖn cÇn thiÕt, hoÆc khi c¸c sai háng ADN ®· ®−îc söa ch÷a, c¸c yÕu tè øc chÕ bÞ
ph©n hñy; nhê vËy, phøc hÖ cyclin D/CDK4 h×nh thµnh sÏ “thóc ®Èy” tÕ bµo kÕt thóc pha
G1 vµ chuyÓn sang pha S. KÕt qu¶ lµ ADN ®−îc sao chÐp vµ lµ tiÒn ®Ò cho mét chu tr×nh
tÕ bµo míi.
ë nhiÒu tÕ bµo ung th−, ng−êi ta t×m thÊy sù ®iÒu khiÓn ë c¸c ®iÓm kiÓm tra nh−
vËy kh«ng diÔn ra hoÆc diÔn ra kh«ng chÝnh x¸c. Sù mÊt kh¶ n¨ng ®iÒu hßa chu tr×nh tÕ
bµo cã thÓ do c¸c sai háng di truyÒn lµm t¨ng hoÆc gi¶m bÊt th−êng phøc hÖ
cyclinD/CDK4. Ch¼ng h¹n, trong c¸c tr−êng hîp c¸c gen m· hãa cyclinD vµ CDK4 còng
nh− c¸c gen m· hãa c¸c protein ®iÒu hßa phøc hÖ cyclinD/CDK4 bÞ ®ét biÕn ®Òu cã thÓ
dÉn ®Õn nh÷ng biÕn ®æi lµm mÊt kh¶ n¨ng ®iÒu khiÓn t¹i ®iÓm START. NghÜa lµ, cã
nhiÒu kiÓu sai háng kh¸c nhau trong hÖ gen cã thÓ lµm “háng” bé m¸y ®iÒu hßa chu tr×nh
tÕ bµo vµ tõ ®ã dÉn ®Õn hËu qu¶ cuèi cïng lµ chuyÓn c¸c tÕ bµo sang tr¹ng th¸i ung th−.
So víi c¸c ®iÓm kiÓm tra chu tr×nh tÕ bµo kh¸c, sù rèi lo¹n (hay sai háng) t¹i ®iÓm
kiÓm tra START cã xu h−íng chuyÓn tÕ bµo sang tr¹ng th¸i ung th− víi nguy c¬ cao ®Æc
biÖt. Do ®iÓm kiÓm tra START quyÕt ®Þnh viÖc tÕ bµo cã chuyÓn vµo pha S hay kh«ng,
nªn nÕu ®iÓm kiÓm tra nµy ho¹t ®éng kh«ng chÝnh x¸c, th× kh¶ n¨ng ADN sai háng ®−îc
sao chÐp vµ truyÒn cho c¸c tÕ bµo thÕ hÖ con lµ cao. Nh− vËy, nÕu nh− c¸c tÕ bµo b×nh
th−êng vèn ®−îc “lËp tr×nh” ®Ó t¹m dõng chu tr×nh tÕ bµo ë ®iÓm kiÓm tra START nh»m
®¶m b¶o cho viÖc söa ch÷a c¸c sai háng ADN; th× nh÷ng tÕ bµo biÓu hiÖn chøc n¨ng sai
t¹i ®iÓm kiÓm tra START sÏ b−íc vµo pha S víi nguy c¬ mang c¸c sai háng ADN. Qua
nhiÒu chu tr×nh tÕ bµo kh¸c nhau, c¸c ®ét biÕn sai háng ADN ®−îc tÝch luü vµ dÉn ®Õn
lµm mÊt kh¶ n¨ng ®iÒu hßa qu¸ tr×nh ph©n bµo b×nh th−êng. V× vËy, mét dßng c¸c tÕ bµo
háng chøc n¨ng t¹i ®iÓm kiÓm tra START cã nguy c¬ trë thµnh c¸c tÕ bµo ung th− ph¸t
triÓn m¹nh.

8.3. B¶n chÊt di truyÒn cña ung th−


C¸c b»ng chøng thùc nghiÖm d−íi ®©y ®· chøng minh phÇn nµo b¶n chÊt di truyÒn
cña c¸c bÖnh ung th−:
- Thø nhÊt, khi nu«i cÊy c¸c tÕ bµo ung th−, tÊt c¶ c¸c tÕ bµo con h×nh thµnh ®Òu lµ
c¸c tÕ bµo ung th−. Nh− vËy, tr¹ng th¸i ung th− ®· ®−îc di truyÒn tõ thÕ hÖ tÕ bµo nµy
sang thÕ hÖ tÕ bµo kh¸c. HiÖn t−îng nµy cho thÊy ung th− cã b¶n chÊt di truyÒn.
- Thø hai, mét sè lo¹i virut cã thÓ g©y ung th− do c¸c gen virut m· hãa mét sè
protein cã liªn quan chÆt chÏ víi sù ph¸t sinh c¸c tÕ bµo ung th−.
- Thø ba, c¸c hîp chÊt g©y ®ét biÕn m¹nh th−êng lµ c¸c hîp chÊt g©y ung th−. C¸c
hîp chÊt ®ét biÕn vµ c¸c t¸c nh©n chiÕu x¹ ion hãa tá ra lµ c¸c t¸c nh©n g©y ung th−
m¹nh trong ung th− thùc nghiÖm. Ng−îc l¹i, mét sè ®iÒu tra cho thÊy c¸c t¸c nh©n g©y
ung th− trong m«i tr−êng sèng ®Òu cã t¸c ®éng g©y ®ét biÕn m¹nh trong phßng thÝ
nghiÖm.
- Thø t−, mét sè d¹ng ung th− cho thÊy râ xu h−íng di truyÒn theo dßng hä, ®−îc
gäi lµ ung th− theo dßng hä (hay ung th− di truyÒn), vÝ dô nh− mét sè d¹ng ung th− ruét
kÕt hay ung th− nguyªn bµo vâng m¹c. Nh÷ng bÖnh ung th− kh¸c d−êng nh− kh«ng biÓu
hiÖn di truyÒn theo dßng hä ®−îc gäi lµ ung th− ®¬n ph¸t (vÒ biÓu hiÖn, ung th− ®¬n ph¸t
xuÊt hiÖn víi tÇn sè cao h¬n ung th− theo dßng hä).

249
§inh §oµn Long

- Thø n¨m, mét sè d¹ng −ng th− m¸u liªn quan chÆt chÏ ®Õn c¸c sai háng cña
nh÷ng nhiÔm s¾c thÓ nhÊt ®Þnh. C¸c bÖnh ung th− kh¸c nhau ®−îc x¸c ®Þnh cã liªn quan
trùc tiÕp ®Õn c¸c sai háng nhiÔm s¾c thÓ vµ c¸c ®ét biÕn gen (®−îc nªu ë phÇn sau).
Vµo c¸c n¨m 1980 - 1990, khi c¸c kü thuËt di truyÒn ®−îc sö dông lÇn ®Çu tiªn ®Ó
nghiªn cøu tÕ bµo ung th−, c¸c nhµ nghiªn cøu ®· ph¸t hiÖn ra r»ng, nhiÒu d¹ng ung th−
thùc chÊt lµ do c¸c sai háng cña gen. Tuy vËy, th«ng th−êng ph¶i cã vµi sai háng x¶y ra
®ång thêi míi chuyÓn mét tÕ bµo b×nh th−êng sang tr¹ng th¸i ung th−. C¸c nhµ ung th−
häc ®· ph©n lo¹i hai nhãm gen chÝnh khi bÞ ®ét biÕn trùc tiÕp cã liªn quan ®Õn sù ph¸t
sinh c¸c tÕ bµo ung th−. Nhãm thø nhÊt bao gåm c¸c gen thóc ®Èy qu¸ tr×nh ph©n chia tÕ
bµo mét c¸ch kh«ng kiÓm so¸t ®−îc, gäi lµ c¸c gen g©y khèi u (hay gen ung th−,
oncogene). C¸c gen g©y khèi u ®iÓn h×nh nhÊt ®−îc t×m thÊy ®Çu tiªn ë c¸c retrovirut.
Liªn quan ®Õn nh÷ng gen nµy lµ c¸c tiÒn gen g©y khèi u (proto-oncogen) ®−îc t×m thÊy
ë c¸c tÕ bµo chñ (®éng vËt vµ ng−êi). C¸c tiÒn gen g©y khèi u cã thÓ ®ét biÕn thµnh c¸c
gen g©y khèi u. Nhãm thø hai bao gåm c¸c gen khi ë d¹ng b×nh th−êng cã vai trß kiÓm
so¸t sù ph©n chia tÕ bµo, ®−îc gäi lµ c¸c gen øc chÕ khèi u (cßn gäi lµ gen kiÒm chÕ
gen ung th−, tumor suppressor gene). Mét nhãm c¸c gen nµy trùc tiÕp tham gia vµo c¸c
c¬ chÕ söa ch÷a ADN, nªn khi bÞ ®ét biÕn chóng lµm t¨ng tÇn sè ®ét biÕn cña nh÷ng gen
kh¸c, v× vËy d¹ng ®ét biÕn cña chóng ®−îc gäi lµ c¸c gen g©y ®ét biÕn (mutator gene).
D−íi ®©y, chóng ta sÏ ®Ò cËp ®Õn t¸c ®éng cña c¸c nhãm gen nµy tíi sù ph¸t sinh ung th−
trong ph¹m vi hiÓu biÕt ®Õn nay.

8.4. Kh¸i niÖm vÒ c¸c gen g©y khèi u


C¸c gen g©y khèi u (oncogene) bao gåm mét nhãm ®a d¹ng c¸c gen mµ s¶n phÈm
cña chóng cã vai trß quan träng trong ®iÒu hßa c¸c ho¹t ®éng sinh hãa cña tÕ bµo liªn
quan ®Õn sù ph©n bµo. Nh÷ng gen nµy lÇn ®Çu tiªn ®−îc ph¸t hiÖn ë hÖ gen cña c¸c
retrovirut cã kh¶ n¨ng g©y khèi u ë c¸c c¬ thÓ vËt chñ khi l©y nhiÔm. Sau nµy, c¸c gen
t−¬ng tù ®−îc t×m thÊy ë nhiÒu sinh vËt kh¸c, kÓ c¶ tõ ruåi giÊm cho ®Õn con ng−êi.

8.4.1. Retrovirut vµ c¸c gen g©y khèi u ë virut


Nh÷ng hiÓu biÕt ®Çu tiªn vÒ c¬ chÕ ph©n tö cña ung th− b¾t nguån tõ c¸c nghiªn
cøu vÒ c¸c virut g©y khèi u. NhiÒu virut nh− vËy cã vËt chÊt di truyÒn lµ ARN thuéc
nhãm retrovirut, vÝ dô nh− virut RSV ®−îc nªu d−íi ®©y. C¸c virut thuéc nhãm nµy sau
khi x©m nhËp vµo tÕ bµo chñ dïng c¸c ph©n tö ARN cña chóng lµm khu«n ®Ó tæng hîp
nªn m¹ch ADN bæ sung (cADN) qua qu¸ tr×nh phiªn m· ng−îc (xem thªm ch−¬ng 3 vÒ c¬
chÕ sao chÐp axit nucleic ë retrovirut). Tuy nhiªn, trong thùc tÕ còng cã nhiÒu virut g©y
khèi u cã hÖ gen lµ ADN, ch¼ng h¹n nh− HPV (virut g©y ung th− cæ tö cung, d−¬ng vËt),
EBV (virut g©y ung th− tÕ bµo lympho Burkitt) vµ HBV (g©y ung th− gan). C¬ chÕ g©y
ung th− cña mçi nhãm virut n»m ngoµi ph¹m vi cña gi¸o tr×nh nµy.
Virut g©y khèi u ®Çu tiªn ®−îc Peyton Rous ph¸t hiÖn n¨m 1910 lµ virut sac«m ë
gµ ®−îc ®Æt tªn lµ virut Rous sac«m (viÕt t¾t lµ RSV). HÖ gen ARN cña RSV chØ cã 4 gen:
gen gag m· hãa cho protein vá virut; gen pol m· hãa cho enzym reverse transcriptase;
gen env m· hãa cho protein mµng trong cña virut vµ gen v-src m· hãa cho mét enzym
kinase. §iÓm ®Æc tr−ng cña enzym kinase ë virut lµ nã cã kh¶ n¨ng phosphryl hãa nhiÒu
protein kh¸c nhau. Trong sè 4 gen cña virut, v-src lµ gen trùc tiÕp liªn quan ®Õn sù h×nh
thµnh khèi u cña tÕ bµo chñ. Khi gen v-src cña virut bÞ c¾t bá, virut vÉn cã kh¶ n¨ng l©y
nhiÔm nh−ng khèi u kh«ng h×nh thµnh. Gen v-src lµ mét vÝ dô vÒ gen g©y khèi u.

250
Ch−¬ng 8. Chu tr×nh tÕ bµo vµ c¬ së di truyÒn häc ung th−

C¸c nghiªn cøu liªn quan ®Õn c¸c lo¹i virut g©y khèi u kh¸c ®Õn nay ®· ph¸t hiÖn
ra nhiÒu gen g©y khèi u kh¸c nhau; theo qui −íc, chóng ®−îc viÕt t¾t lµ v-onc (b¶ng 8.2).
Mét sè trong nh÷ng gen nµy liªn quan ®Õn c¸c yÕu tè t¨ng tr−ëng. Ch¼ng h¹n v-sis lµ gen
g©y khèi u sac«m ë khØ m· hãa cho mét yÕu tè t¨ng tr−ëng cã nguån gèc tõ tiÓu cÇu lµ
PDGF (platelet-derived growth factor). PDGF b×nh th−êng ®−îc sinh ra tõ c¸c tÕ bµo tiÓu
cÇu tham gia vµo qu¸ tr×nh lµm lµnh vÕt th−¬ng b»ng viÖc thóc ®Èy tÕ bµo ph©n chia ë vÞ
trÝ vÕt th−¬ng x¶y ra. Gen v-sis cña virut m· hãa cho mét protein gièng PDGF nh−ng khi
l©y nhiÔm tÕ bµo chñ, gen nµy ®−îc biÓu hiÖn theo kiÓu kh«ng ®−îc kiÓm so¸t, dÉn ®Õn
sù ph©n chia hçn lo¹n cña tÕ bµo vµ h×nh thµnh khèi u.
C¸c gen g©y khèi u kh¸c m· hãa cho c¸c lo¹i protein cã tÝnh chÊt gièng yÕu tè t¨ng
tr−ëng hoÆc gièng víi c¸c thô thÓ cña hoocm«n. Ch¼ng h¹n nh− gen v-erbB t×m thÊy ë
virut g©y t¨ng hång cÇu ë chim m· hãa cho mét lo¹i protein gièng thô thÓ cña tÕ bµo ®Æc
hiÖu víi yÕu tè t¨ng tr−ëng biÓu m« - EGF (epidermal growth factor); hoÆc nh− gen v-
fms t×m thÊy ë virut g©y khèi u sac«m ë mÌo m· hãa cho protein gièng víi thô thÓ ®Æc
hiÖu cña yÕu tè t¨ng tr−ëng CSF-1. C¶ hai thô thÓ cña c¸c yÕu tè t¨ng tr−ëng trªn ®Òu lµ
c¸c protein xuyªn mµng tÕ bµo cã vÞ trÝ ®Ýnh kÕt cña yÕu tè t¨ng tr−ëng ë ngoµi mµng vµ
miÒn ho¹t tÝnh kinase ë bªn trong mµng. MiÒn ho¹t tÝnh kinase cã chøc n¨ng phosphoryl
hãa mét sè lo¹i axit amin nhÊt ®Þnh (phæ biÕn nhÊt lµ Tyr) khi nã t−¬ng t¸c víi mét ph©n
tö protein.

B¶ng 8.2. Mét sè gen g©y khèi u (oncogene) ë retrovirut


Tªn gen Lo¹i virut VËt chñ Chøc n¨ng s¶n phÈm cña gen
abl Virut b¹ch cÇu Abelson Chuét protein kinase ®Æc hiÖu tyrosine
erbA Virut g©y t¨ng hång cÇu ë chim Gµ gièng víi thô thÓ hoocm«n thyroid
erbB Virut g©y t¨ng hång cÇu ë chim Gµ yÕu tè t¨ng tr−ëng biÓu m« (EGF) bÞ c¾t ng¾n
fes Virut sac«m ST ë mÌo MÌo kinase ®Æc hiÖu tyrosine
fgr Virut sac«m Gardner-Rasheed MÌo kinase ®Æc hiÖu tyrosine
fms Virut sac«m McDonough MÌo kinase ®Æc hiÖu tyrosine
fos Virut sac«m x−¬ng FJB Chuét protein ho¹t hãa phiªn m·
fps Virut sac«m Fuginami Gµ kinase ®Æc hiÖu tyrosine
jun Virut sac«m 17 ë chim Gµ protein ho¹t hãa phiªn m·
mil (mbt) Virut MH2 Gµ kinase ®Æc hiÖu serine/threonine
mos Virut sac«m Moloney Chuét kinase ®Æc hiÖu serine/threonine
myb Virut tÕ bµo tñy x−¬ng ë chim Gµ protein yÕu tè phiªn m·
myc Virut tÕ bµo m¸u MC29 Gµ protein yÕu tè phiªn m·
raf Virut sac«m 3611 Chuét kinase ®Æc hiÖu serine/threonine
H-ras Virut sac«m Harvey Chuét ®ång protein liªn kÕt GTP
K-ras Virut sac«m Kirsten Chuét ®ång protein liªn kÕt GTP
rel Virut l−íi néi m« Gµ t©y protein yÕu tè phiªn m·
ros Virut sac«m URII Gµ kinase ®Æc hiÖu tyrosine
sis Virut sac«m khØ KhØ gièng yÕu tè sinh tr−ëng cã nguån gèc tiÓu cÇu (PDGF)
src Virut sac«m gµ Gµ kinase ®Æc hiÖu tyrosine
yes Virut sac«m Y73 Gµ kinase ®Æc hiÖu tyrosine

NhiÒu gen g©y khèi u kh¸c cña virut nh− v-src m· ho¸ cho enzym tyrosine kinase
kh«ng ph¶i lµ protein xuyªn mµng. Thay vµo ®ã, protein nµy n»m ë mÆt trong cña mµng
tÕ bµo, nh−ng còng cã chøc n¨ng phosphoryl hãa. Mét sè gen g©y khèi u kh¸c nh− v-ras
m· hãa cho protein ®Ýnh kÕt GTP (rÊt gièng víi c¸c G-protein cña tÕ bµo) tham gia ®iÒu
hoµ l−îng cAMP trong tÕ bµo (ë ch−¬ng 6, chóng ta biÕt r»ng cAMP lµ mét ph©n tö tÝn
hiÖu néi bµo tham gia ®iÒu khiÓn sù biÓu hiÖn cña c¸c gen).

251
§inh §oµn Long

Mét nhãm gen g©y khèi u kh¸c cña virut m· hãa cho c¸c protein cã vai trß lµ c¸c
yÕu tè ®iÒu hoµ phiªn m·. Nh÷ng gen nµy bao gåm v-jun, v-fos, v-erbA, vµ v-myc ®−îc
ph¸t hiÖn ë c¸c lo¹i virut kh¸c nhau. Nh−ng protein ®−îc m· hãa bëi nh÷ng gen nµy
gièng víi c¸c protein liªn kÕt ®Æc hiÖu ADN vµ tham gia vµo sù ®iÒu hoµ phiªn m·.
Nh− vËy, cã thÓ nãi phÇn lín c¸c gen virut g©y khèi u ®Òu m· hãa cho c¸c protein
trùc tiÕp hay gi¸n tiÕp tham gia ®iÒu khiÓn sù biÓu hiÖn cña c¸c gen cã vai trß trong sù
t¨ng tr−ëng hay ®iÒu khiÓn sù ph©n bµo. Mét sè protein nµy trùc tiÕp lµ c¸c ph©n tö tÝn
hiÖu thóc ®Èy c¸c ho¹t ®éng cña tÕ bµo; mét sè kh¸c cã vai trß nh− c¸c thô thÓ ®ãn nhËn
c¸c tÝn hiÖu t¨ng sinh tÕ bµo; hay chóng trë thµnh c¸c ph©n tö truyÒn tÝn hiÖu tõ tÕ bµo
chÊt vµo nh©n; trong khi mét sè protein kh¸c ®−îc m· hãa bëi c¸c gen g©y khèi u cã vai
trß lµ c¸c yÕu tè ®iÒu hßa phiªn m· thóc ®Èy sù biÓu hiÖn cña c¸c gen kh¸c.

8.4.2. C¸c tiÒn gen g©y khèi u cña tÕ bµo chñ


Nh− tr×nh bµy ë trªn, c¸c gen g©y khèi u cña virut th−êng gièng víi c¸c gen m· hãa
cho c¸c protein cã chøc n¨ng ®iÒu hoµ quan träng trong tÕ bµo chñ. Trong thùc tÕ, nhiÒu
protein nh− vËy cña c¸c tÕ bµo chñ chØ ®−îc x¸c ®Þnh khi ph©n lËp c¸c gen g©y khèi u ë
virut. VÝ dô nh− gen t−¬ng ®ång cña gen v-src trong tÕ bµo chñ (gµ) ®−îc t×m thÊy khi
sµng läc th− viÖn ADN ®−îc t¹o ra tõ c¸c con gµ nhiÔm virut sac«m gµ - RSV. §Ó sµng läc
®−îc c¸c gen nµy, gen v-src ®−îc dïng lµm mÉu dß ®Ó lai víi th− viÖn hÖ gen gµ. Qua ®ã,
ng−êi ta ph¸t hiÖn ra tÕ bµo chñ chøa nh÷ng gen cã tr×nh tù gièng víi gen v-src. Tuy
nhiªn, nh÷ng gen t−¬ng ®ång ë tÕ bµo chñ kh¸c víi gen v-src ë mét ®iÓm rÊt quan träng
lµ chóng chøa thªm c¸c ®o¹n tr×nh tù intron (h×nh 8.4). Trong thùc tÕ, gen t−¬ng ®ång ë
gµ cã chøa 11 intron trong khi gen v-src cña virut kh«ng chøa tr×nh tù intron nµo. Ph¸t
hiÖn nµy cho thÊy cã kh¶ n¨ng chÝnh c¸c gen v-src cã nguån gèc tõ c¸c gen b×nh th−êng
vèn cã trong c¸c tÕ bµo chñ nh−ng ®· ®−îc xÐn bá c¸c intron.
C¸c gen trong tÕ bµo chñ t−¬ng ®ång víi c¸c gen g©y khèi u ë virut ®−îc gäi lµ c¸c
tiÒn gen g©y khèi u cña tÕ bµo chñ, hay cßn gäi lµ c¸c tiÒn gen ung th− ®−îc viÕt t¾t
lµ c-onc (t−¬ng øng víi c¸c v-onc ë virut). Theo nguyªn t¾c ®Æt tªn nµy, tiÒn gen g©y khèi
u cña tÕ bµo chñ t−¬ng ®ång víi v-src lµ c-src. Tr×nh tù m· hãa cña hai gen nµy rÊt gièng
nhau, chØ kh¸c nhau ë 18 nucleotide: v-src m· hãa cho mét protein chøa 526 axit amin,
cßn c-src m· hãa cho mét protein chøa 533 axit amin. Nhê viÖc dïng c¸c gen v-onc lµm
mÉu dß, ng−êi ta ®· ph©n lËp ®−îc nhiÒu gen c-onc kh¸c nhau tõ c¸c c¬ thÓ vËt chñ kh¸c
nhau, trong ®ã cã c¶ ë ng−êi. Mét ph¸t hiÖn quan träng tõ nh÷ng nghiªn cøu nµy lµ c¸c
tiÒn gen g©y khèi u ®−îc ph©n lËp tõ c¸c tÕ bµo chñ kh¸c nhau l¹i cã c¸c ®Æc ®iÓm cÊu
tróc gièng nhau. Ch¼ng h¹n nh− c¸c tiÒn gen g©y khèi u ë ruåi giÊm rÊt gièng víi c¸c
tiÒn gen g©y khèi u t×m thÊy trong tÕ bµo cña c¸c ®éng vËt cã x−¬ng sèng kh¸c, bao gåm
c¸c gen c-abl, c-erbB, c-fps, c-raf, vµ c-myb. Sù gièng nhau cña c¸c tiÒn gen g©y khèi u ë
c¸c loµi kh¸c nhau cho thÊy
chóng th−êng lµ c¸c gen cã HÖ gen retrovirut (ARN)
gag pol env
chøc n¨ng quan träng.
Mét c©u hái ®Æt ra lµ: t¹i
Intron Intron Intron Intron ADN vËt chñ
sao c-onc cã intron cßn v-onc Exon1 Exon5
Exon2 Exon3 Exon4 (gen c-src)
kh«ng cã intron? Lêi gi¶i thÝch
hîp lý h¬n c¶ lµ c¸c v-onc cã
nguån gèc tõ chÝnh c¸c c-onc Virut RSV
t−¬ng øng th«ng qua qu¸ tr×nh gag pol Gen v-src env
phiªn m·, ë ®ã mét b¶n phiªn
m· ARN cña c-onc sau khi H×nh 8.4. C¸c gen g©y khèi u (oncogene) ë virut RSV vµ tiÒn gen
g©y khèi u (proto-oncogene) ë c¬ thÓ chñ (gµ).
h×nh thµnh ®· g¾n vµo hÖ gen

252
Ch−¬ng 8. Chu tr×nh tÕ bµo vµ c¬ së di truyÒn häc ung th−

cña retrovirut (hÖ gen cña nh÷ng virut nµy lµ ARN). Khi virut ®ãng gãi, nã sÏ mang vËt
chÊt di truyÒn t¸i tæ hîp cïng b¶n phiªn m· cña gen c-onc (lóc nµy ®· trë thµnh v-onc v×
®· ®−îc xÐn bá c¸c intron). Trong c¸c lÇn l©y nhiÔm tÕ bµo chñ sau ®ã, virut cã thÓ truyÒn
gen v-onc sang c¸c tÕ bµo míi bÞ l©y nhiÔm. Trong qu¸ tr×nh ®ã, ph©n tö ARN t¸i tæ hîp
®−îc phiªn m· ng−îc thµnh ADN råi g¾n vµo hÖ gen tÕ bµo chñ. D−íi d¹ng th«ng tin cña
virut, gen v-onc t¸i tæ hîp khi phiªn m· kh«ng cßn bÞ c¾t intron n÷a.
VËy, t¹i sao gen v-onc g©y khèi u, trong khi gen c-onc th−êng kh«ng g©y khèi u?
Trong nhiÒu tr−êng hîp, c¸c gen v-onc cã hiÖu suÊt tæng hîp protein cao h¬n so víi gen c-
onc t−¬ng øng; ®iÒu nµy x¶y ra cã lÏ lµ do ho¹t ®éng cña c¸c tr×nh tù t¨ng c−êng cã trong
hÖ gen virut. Ch¼ng h¹n nh− ë tÕ bµo khèi u ë gµ, ng−êi ta t×m thÊy gen v-src tæng hîp
enzym tyrosine kinase m¹nh gÊp 100 lÇn so víi c-src t−¬ng øng. L−îng kinase t¨ng ®ét
ngét cã thÓ lµ nguyªn nh©n g©y rèi lo¹n c¬ chÕ truyÒn tÝn hiÖu tham gia ®iÒu khiÓn sù
ph©n bµo, dÉn ®Õn viÖc t¨ng sinh kh«ng kiÓm so¸t ®−îc cña tÕ bµo. C¸c gen v-onc kh¸c cã
thÓ g©y khèi u do c¸c protein cña nã ®−îc tæng hîp vµo c¸c thêi ®iÓm kh«ng phï hîp víi
chu tr×nh tÕ bµo cña c¬ thÓ chñ (ë ch−¬ng 6, chóng ta ®· biÕt phÇn lín c¸c gen eukaryote
®−îc ®iÒu khiÓn chØ biÓu hiÖn vµo ®óng thêi ®iÓm vµ vÞ trÝ nhÊt ®Þnh trong qu¸ tr×nh
ph¸t triÓn), hoÆc do c¸c ®ét biÕn gen dÉn ®Õn h×nh thµnh c¸c d¹ng biÕn ®æi kh¸c nhau cña
protein mµ nã m· hãa.

8.4.3. C¸c tiÒn gen g©y khèi u cã thÓ ®ét biÕn thµnh gen g©y khèi u
C¸c tiÒn gen g©y khèi u (c-onc) th−êng m· hãa cho c¸c s¶n phÈm gi÷ vai trß quan
träng trong ®iÒu hßa c¸c ho¹t ®éng t¨ng sinh tÕ bµo. V× vËy, nÕu mét trong nh÷ng gen
nµy bÞ ®ét biÕn, nã cã thÓ dÉn ®Õn sù mÊt c©n b»ng trong c¸c qu¸ tr×nh sinh hãa vµ
chuyÓn tÕ bµo sang tr¹ng th¸i ung th−. NhiÒu nghiªn cøu cho thÊy sù xuÊt hiÖn tr¹ng
th¸i ung th− cña tÕ bµo cã liªn quan trùc tiÕp ®Õn sù ®ét biÕn cña c¸c tiÒn gen g©y khèi u.
Ch¼ng h¹n, khi nghiªn cøu ë c¸c bÖnh nh©n ung th− bµng quang, Robert Weinber vµ
céng sù ®· x¸c ®Þnh ®−îc ®ét biÕn gen c-onc lµ c-H-ras lµ nguyªn nh©n trùc tiÕp g©y ra
bÖnh nµy.
C¸c nghiªn cøu di truyÒn häc sau nµy cïng gãp phÇn tiÕp tôc lµm s¸ng tá thªm c¬
chÕ g©y ung th− cña mét sè ®ét biÕn gen. Kh«ng gièng nh− c¸c v-onc cña virut, c¸c c-onc
®ét biÕn th−êng kh«ng tæng hîp ra mét l−îng lín bÊt th−êng protein. Thay vµo ®ã, nã
th−êng lµ c¸c ®ét biÕn lµm thay thÕ axit amin trong s¶n phÈm gen. VÝ dô nh− ®ét biÕn
gen c-H-ras dÉn ®Õn sù thay thÕ axit amin Val → Gly ë vÞ trÝ axit amin sè 12 trªn ph©n
tö protein lµm gi¶m ho¹t tÝnh cña protein nµy trong ph¶n øng thñy ph©n GTP. Khi ho¹t
tÝnh cña protein nµy gi¶m, qu¸ tr×nh truyÒn tÝn hiÖu kÝch thÝch tÕ bµo ph©n chia kh«ng
kiÓm so¸t ®−îc vµ lµ nguyªn nh©n chuyÓn tÕ bµo sang tr¹ng th¸i ung th−.
C¸c d¹ng ®ét biÕn cña tiÒn gen g©y khèi u c-ras ë ng−êi ®Õn nay ®· ®−îc t×m thÊy ë
nhiÒu lo¹i tÕ bµo ung th− kh¸c nhau, bao gåm ung th− phæi, ung th− ruét kÕt, ung th−
vó, ung th− tiÒn liÖt tuyÕn, ung th− bµng quang, ung th− n·o, ung th− m« liªn kiÕt, ...
Trong tÊt c¶ c¸c tr−êng hîp nµy, c¸c ®ét biÕn ®Òu liªn quan ®Õn sù thay thÕ cña c¸c axit
amin ë ba vÞ trÝ axit amin sè 12, 59 vµ 61. Sù thay thÕ axit amin ë c¸c vÞ trÝ nµy ®Òu
chuyÓn protein Ras ®ét biÕn thµnh d¹ng ph©n tö tÝn hiÖu kÝch thÝch ph©n bµo. V× vËy,
nh÷ng ®ét biÕn nµy cã thÓ xem lµ nh÷ng ®ét biÕn tréi g©y nªn sù ph©n chia kh«ng kiÓm
so¸t cña tÕ bµo.
C¸c d¹ng ®ét biÕn gen ph¸t sinh tõ c¸c gen c-onc dÉn ®Õn sù h×nh thµnh c¸c tÕ bµo
ung th− hiÕm khi ®−îc di truyÒn sang thÕ hÖ sau v× rÊt Ýt khi xuÊt hiÖn ë tÕ bµo sinh dôc;
thay vµo ®ã, trong phÇn lín tr−êng hîp, chóng xuÊt hiÖn ngÉu nhiªn vµ ®−îc tÝch lòy ë
c¸c tÕ bµo soma. Do sè lÇn ph©n bµo trong mét c¬ thÓ ng−êi lµ rÊt lín (h¬n 1016 lÇn) nªn
hµng ngµn ®ét biÕn liªn quan ®Õn gen c-onc cã thÓ x¶y ra, vµ nÕu mét trong nh÷ng ®ét

253
§inh §oµn Long

biÕn ®ã lµ ®ét biÕn tréi ho¹t hãa sù ph©n bµo kh«ng kiÓm so¸t th× sù h×nh thµnh khèi u lµ
khã tr¸nh khái. Tuy nhiªn, ë phÇn lín c¸ thÓ b×nh th−êng, khèi u kh«ng ph¸t triÓn.
NghÞch lý nµy ®−îc gi¶i thÝch lµ do ë ng−êi, tÕ bµo b×nh th−êng cã c¸c c¬ chÕ söa ch÷a c¸c
®ét biÕn ®iÓm xuÊt hiÖn trªn c¸c gen c-onc (xem ch−¬ng 6). Nh−ng nÕu nhiÒu ®ét biÕn (cã
h¹i) cïng x¶y ra mét lóc th× kh¶ n¨ng kh¾c phôc cña tÕ bµo gÆp khã kh¨n, dÉn ®Õn sù
t¨ng sinh kh«ng kiÓm so¸t cña tÕ bµo vµ tÕ bµo chuyÓn sang tr¹ng th¸i ung th−. ë phÇn
lín khèi u, ng−êi ta thÊy cã Ýt nhÊt mét ®ét biÕn liªn quan ®Õn c-onc. Tõ nh÷ng hiÓu biÕt
®ã, cã thÓ nãi c¸c tiÒn gen g©y khèi u cã vai trß quan träng trong sù ph¸t sinh ung th− vµ
d−êng nh− sù h×nh thµnh c¸c khèi u chñ yÕu lµ do c¸c ®ét biÕn ngÉu nhiªn th−êng x¶y ra
ë tÕ bµo soma cïng víi c¸c sai háng trong c¸c c¬ chÕ söa ch÷a ADN.

8.4.4. §ét biÕn nhiÔm s¾c thÓ trong c¸c tÕ bµo ung th−
Mét sè bÖnh ung th− xuÊt hiÖn ë ng−êi C¸c NST b×nh th−êng C¸c NST chuyÓn ®o¹n
liªn quan trùc tiÕp ®Õn ®ét biÕn hoÆc sù “s¾p Sè 9 Sè 22 9q+ 22q-
xÕp l¹i” c¸c NST. Ch¼ng h¹n, bÖnh ung th−
b¹ch cÇu thÓ tñy tr−êng diÔn - CML (chronic
myelogenous) liªn quan ®Õn sù biÕn ®æi ë
NST sè 22. KiÓu h×nh NST bÊt th−êng nµy
bcr
®−îc ph¸t hiÖn lÇn ®Çu tiªn ë thµnh phè
Philadelphia (Mü) nªn ®−îc gäi lµ nhiÔm NST
s¾c thÓ Philadelphia. Ban ®Çu, ng−êi ta philadelphia
cho r»ng NST nµy chØ bÞ mÊt ®o¹n ®¬n trªn
vai dµi (kÝ hiÖu q) cña nã, nh−ng sau ®ã c¸c c-abl
nghiªn cøu s©u h¬n cho thÊy NST
Philadelphia thùc chÊt h×nh thµnh do sù
chuyÓn ®o¹n gi÷a hai NST sè 9 vµ sè 22 H×nh 8.5. ChuyÓn ®o¹n t−¬ng hç liªn quan ®Õn
nhiÔm s¾c thÓ Philadelphia lµ nguyªn nh©n g©y
(h×nh 8.5). Trong tr−êng hîp chuyÓn ®o¹n ung th− b¹ch cÇu thÓ tñy tr−êng diÔn - CML
Philadelphia, phÇn ®Çu cña vai dµi NST sè 9
dÝnh vµo phÇn th©n cña NST sè 22, trong khi ®ã phÇn th©n cña NST sè 9 g¾n víi phÇn
®Çu mót cña NST sè 22. §iÓm ®øt g·y trªn NST sè 9 x¶y ra ®óng ë vÞ trÝ tiÒn gen g©y
khèi u c-abl m· hãa cho mét protein kinase, cßn ®iÓm ®øt g·y trªn NST sè 22 x¶y ra t¹i
vÞ trÝ gen ký hiÖu lµ bcr. Sau khi x¶y ra chuyÓn ®o¹n NST, hai gen bcr vµ c-abl t¹o thµnh
mét gen “dung hîp” mµ s¶n phÈm cña nã lµ mét chuçi polypeptide cã ®Çu N tËn cïng cña
gen bcr cßn ®Çu C tËn cïng cña gen c-abl. ChÝnh sù dung hîp hai gen nµy lµ nguyªn
nh©n g©y nªn bÖnh ung th− cña NST philadelphia.
BÖnh m¸u tr¾ng liªn quan ®Õn ung th− tÕ bµo lympho Burkitt lµ mét vÝ dô kh¸c vÒ
hiÖn t−îng chuyÓn ®o¹n NST g©y ung th−. ChuyÓn ®o¹n nµy x¶y ra gi÷a NST sè 8 vµ
mét trong ba NST sè 2, 14 vµ 22 lµ c¸c NST mang c¸c gen m· hãa cho c¸c chuçi
polypeptide h×nh thµnh kh¸ng thÓ (xem ch−¬ng 9). Trong ®ã, chuyÓn ®o¹n gi÷a NST sè 8
vµ 14 x¶y ra phæ biÕn h¬n c¶. Khi chuyÓn ®o¹n x¶y ra, tiÒn gen g©y khèi u c-myc trªn
NST sè 8 ®−îc chuyÓn ®Õn n»m gÇn gen m· hãa cho chuçi nÆng cña kh¸ng thÓ trªn NST
sè 14. Sù s¾p xÕp l¹i NST nh− vËy dÉn ®Õn viÖc t¨ng c−êng sù biÓu hiÖn cña gen c-myc
trong tÕ bµo lympho B. §©y ®−îc coi lµ nguyªn nh©n trùc tiÕp lµm tÕ bµo chuyÓn sang
tr¹ng th¸i ung th−.

254
Ch−¬ng 8. Chu tr×nh tÕ bµo vµ c¬ së di truyÒn häc ung th−

8.5. Kh¸i niÖm vÒ c¸c gen øc chÕ khèi u


C¸c alen b×nh th−êng cña c¸c gen c-ras vµ c-myc m· hãa cho c¸c ph©n tö protein
tham gia ®iÒu hßa d−¬ng tÝnh sù ph©n bµo (thóc ®Èy sù t¨ng sinh tÕ bµo). Khi c¸c gen
nµy ®−îc biÓu hiÖn ë møc ®é cao bÊt th−êng, hoÆc khi chóng s¶n sinh ra c¸c protein cã
t¸c ®éng nh− nh÷ng chÊt ho¹t hãa m¹nh bÊt th−êng th× c¸c tÕ bµo cã xu h−íng h×nh
thµnh khèi u. Tuy vËy, mét tÕ bµo b×nh th−êng khi chuyÓn sang tr¹ng th¸i ung th−
th−êng kh«ng chØ do sù t¨ng møc biÓu hiÖn cña nh÷ng gen ®¬n lÎ mµ cÇn ph¶i cã mét sè
®ét biÕn bæ sung x¶y ra ë c¸c gen øc chÕ ph©n bµo. Nh÷ng gen thuéc nhãm thø hai nµy
®−îc gäi lµ c¸c gen øc chÕ khèi u (tumor suppressor gene) hay gen chèng ung th−
(anti-oncogene).

8.5.1. C¸c bÖnh ung th− theo dßng hä vµ gi¶ thiÕt hai môc tiªu cña Knudson
RÊt nhiÒu gen øc chÕ khèi u ®−îc Alen 1 Alen 2
ph¸t hiÖn khi ph©n tÝch c¸c bÖnh ung th−
hiÕm gÆp cã biÓu hiÖn di truyÒn theo dßng KiÓu d¹i
hä. Trong c¸c ph¶ hÖ, sù xuÊt hiÖn cña
nh÷ng bÖnh ung th− nµy biÓu hiÖn nh− mét Sù ®iÒu khiÓn chu tr×nh
tÕ bµo b×nh th−êng
kiÓu h×nh tréi/lÆn. Trong nh÷ng tr−êng hîp
®ã, ng−êi ta ®Òu thÊy ung th− x¶y ra hoÆc Sù kiÖn thø nhÊt
®−îc di truyÒn tõ nh÷ng c¸ thÓ dÞ hîp tö
mang alen ®ét biÕn lµm mÊt chøc n¨ng cña §ét biÕn
c¸c gen øc chÕ khèi u. Tuy nhiªn, ung th− Khèi u bÞ øc chÕ
chØ xuÊt hiÖn khi mét ®ét biÕn thø hai xuÊt
hiÖn trong tÕ bµo soma lµm háng hoµn toµn Sù kiÖn thø hai
chøc n¨ng b×nh th−êng cña alen kiÓu d¹i
cßn l¹i (ë ®éng vËt vµ ng−êi, chóng ta nhí
r»ng hÇu hÕt c¸c gen ®Òu cã hai b¶n sao
trong mét tÕ bµo soma b×nh th−êng, trong
T¸i tæ hîp trong nguyªn MÊt nhiÔm s¾c thÓ
®ã cã c¶ c¸c gen øc chÕ khèi u). V× vËy, sù ph©n / ®ét biÕn thø 2 do rèi lo¹n ph©n bµo
ph¸t sinh khèi u ph¶i cã Ýt nhÊt hai ®ét
biÕn mÊt chøc n¨ng cïng xuÊt hiÖn, mçi
®ét biÕn x¶y ra ë mét trong hai b¶n sao cña
gen øc chÕ khèi u.
C¶ 2 alen mÊt chøc n¨ng
N¨m 1971, Knudson lµ ng−êi ®Çu tiªn
®−a ra gi¶ thiÕt nµy ®Ó gi¶i thÝch nguyªn
nh©n g©y nªn mét bÖnh ung th− m¾t hiÕm Khèi u
g¾p ë trÎ em lµ bÖnh u nguyªn bµo vâng H×nh 8.6. Gi¶ thiÕt hai môc tiªu cña Knudson gi¶i
m¹c (retinoblasma). ë phÇn lín c¸c quÇn thÝch vÒ sù bÊt ho¹t cña c¶ 2 b¶n sao gen øc chÕ
thÓ ng−êi, bÖnh nµy xuÊt hiÖn víi tÇn suÊt khèi u (tumor repressor gene) dÉn ®Õn bÖnh ung th−.
lµ 5/100.000. PhÐp ph©n tÝch ph¶ hÖ cho
thÊy kho¶ng 40% c¸c tr−êng hîp lµ cã xu h−íng di truyÒn; cßn 60% sè tr−êng hîp cßn
l¹i kh«ng cã c¨n nguyªn di truyÒn râ rÖt, ®−îc gäi lµ nhãm bÞ bÖnh ®¬n ph¸t. Dùa trªn
ph©n tÝch thèng kª, Knudson nhËn ®Þnh r»ng c¶ hai nhãm dï theo xu h−íng di truyÒn
hay ®¬n ph¸t ®Òu do ®ét biÕn kÐp (®ång thêi ë 2 alen) x¶y ë mét gen øc chÕ khèi u (h×nh
8.6). Trong tr−êng hîp di truyÒn, mét trong nh÷ng ®ét biÕn nµy ®−îc truyÒn tõ bè, mÑ
sang con c¸i qua sinh s¶n h÷u tÝnh. Cßn trong tr−êng hîp ®¬n ph¸t, c¶ hai ®ét biÕn ®Òu
xuÊt hiÖn ngÉu nhiªn vµ ®−îc tÝch lòy ë tÕ bµo soma trong qu¸ tr×nh ph¸t triÓn cña m¾t.
Nãi c¸ch kh¸c, trong c¶ hai tr−êng hîp ®Òu cÇn cã 2 ®ét biÕn x¶y ra ®ång thêi lµm bÊt
ho¹t hai b¶n sao cña gen øc chÕ khèi u.

255
§inh §oµn Long

NhiÒu nghiªn cøu sau nµy ®· ñng hé nhËn ®Þnh cña Knudson. §Çu tiªn, ng−êi ta
thÊy mét sè tr−êng hîp m¾c bÖnh u nguyªn bµo vâng m¹c ®−îc ph¸t hiÖn cïng víi ®ét
biÕn mÊt ®o¹n NST sè 13, lµm mÊt gen øc chÕ khèi u (ký hiÖu lµ RB). C¸c nghiªn cøu lËp
b¶n ®å gen sau nµy cho thÊy gen RB n»m ë vÞ trÝ 13q14.2. TiÕp theo, ng−êi ta x¸c ®Þnh
®−îc tr×nh tù vµ ®Æc ®iÓm biÓu hiÖn cña gen RB, råi ph©n lËp nã tõ tÕ bµo m« m¾t bÞ ung
th−. C¸c thÝ nghiÖm nu«i cÊy tÕ bµo ®· chøng minh r»ng, mét tr×nh tù cADN tõ alen kiÓu
d¹i cña gen RB khi chuyÓn vµo tÕ bµo ung th− ®· chuyÓn ®æi tr¹ng th¸i cña tÕ bµo tõ
d¹ng ung th− (ph¸t triÓn thµnh khèi u) vÒ d¹ng b×nh th−êng. C¸c nghiªn cøu sau nµy
cho thÊy s¶n phÈm protein cña gen RB (ký hiÖu lµ pRB) lµ mét protein ®−îc tæng hîp phæ
biÕn vµ tham gia ®iÒu hßa chu tr×nh tÕ bµo ë nhiÒu m« kh¸c nhau th«ng qua t−¬ng t¸c
víi c¸c yÕu tè phiªn m·.
Gi¶ thiÕt “hai môc tiªu” cña Knudson sau nµy còng tá ra phï hîp khi ®−îc dïng ®Ó
gi¶i thÝch sù xuÊt hiÖn cña nhiÒu bÖnh ung th− theo dßng hä, bao gåm mét sè d¹ng ung
th− ruét kÕt vµ ung th− vó. Tuy nhiªn ë nh÷ng bÖnh ung th− nµy, c¸c gen øc chÕ khèi u
th−êng cã liªn quan ®Õn c¸c bÖnh ung th− ®Æc thï (b¶ng 8.3).

B¶ng 8.3. C¸c héi chøng ung th− di truyÒn vµ c¸c gen øc chÕ khèi u cã liªn quan
Tªn héi chøng VÞ trÝ u nguyªn ph¸t Gen VÞ trÝ trªn NST Chøc n¨ng protein t−¬ng øng trong tÕ bµo
U nguyªn bµo §iÒu hßa phiªn m· vµ ®iÒu hßa chu tr×nh
Nguyªn bµo l−íi RB 13q14.3
l−íi di truyÒn tÕ bµo
Héi chøng TÕ bµo sac«m
TP53 17p13.1 YÕu tè phiªn m·
Li-Frameni U vó
Héi chøng u
tuyÕn kh«ng
U ruét kÕt APC 5q21 §iÒu hßa β-catenin
polyp theo
dßng hä (FAP)
Ung th− ruét MSH2 2p16
kÕt kh«ng polyp MLH1 3q21 Tham gia söa ch÷a ADN theo c¬ chÕ
U ruét kÕt
di truyÒn PMS1 2q32 MMR (xem ch−¬ng 6)
(HNPCC) PMS2 7p22
U x¬ thÇn kinh §iÒu hßa qu¸ tr×nh truyÒn tÝn hiÖu qua
U x¬ thÇn kinh NF1 17q11.2
kiÓu 1 protein Ras
U x¬ thÇn kinh U x¬ thÇn kinh thÝnh gi¸c U Liªn kÕt protein mµng tÕ bµo víi phÇn
NF2 22q12.2
kiÓu 2 mµng n·o khung x−¬ng tÕ bµo
Ung th− vó di
U vó BRCA1 17q21 Söa ch÷a ADN
truyÒn kiÓu 1
Ung th− vó di
U vó BRCA2 13q12 Söa ch÷a ADN
truyÒn kiÓu 2
BÖnh Hippel-
U tÕ bµo thËn VHL 3p25 §iÒu hßa sù kÐo dµi phiªn m·
Lindau
BÖnh h¾c tè ¸c
U tÕ bµo melanin p16 9p21 ChÊt øc chÕ CDK
tÝnh di truyÒn
MÊt ®iÒu hßa
U tÕ bµo lymph« ATM 11q22 Söa ch÷a ADN
gi·n m¹ch
Héi chøng
U cøng BLM 15q26.1 Lµ mét enzym ADN helicase
Bloom

8.5.2. Vai trß cña mét sè gen øc chÕ khèi u trong tÕ bµo
MÆc dï chØ chiÕm kho¶ng 1% c¸c tr−êng hîp ung th−, nh−ng hÇu hÕt c¸c bÖnh
nh©n ung th− cã biÓu hiÖn di truyÒn theo dßng hä ®Òu mang ®ét biÕn ë c¸c gen øc chÕ
khèi u (chø kh«ng ph¶i ë c¸c tiÒn gen g©y khèi u). C¸c protein ®−îc c¸c gen øc chÕ khèi u
m· ho¸ tham gia vµo nhiÒu ho¹t ®éng kh¸c nhau cña tÕ bµo, tõ c¸c ho¹t ®éng ®iÒu khiÓn

256
Ch−¬ng 8. Chu tr×nh tÕ bµo vµ c¬ së di truyÒn häc ung th−

ph©n bµo ®Õn sù biÖt hãa tÕ bµo, c¸c c¬ chÕ söa ch÷a ADN vµ sù chÕt theo ch−¬ng tr×nh
cña tÕ bµo. D−íi ®©y lµ ho¹t ®éng chøc n¨ng cña mét sè protein do c¸c gen øc chÕ khèi u
m· hãa.
8.5.2.1. Protein pRB
C¸c nghiªn cøu gÇn ®©y cho thÊy protein øc chÕ khèi u cña gen RB (kÝ hiÖu protein
lµ pRB) gi÷ vai trß quan träng trong ®iÒu hßa chu tr×nh tÕ bµo. MÆc dï lÇn ®Çu tiªn ®−îc
t×m thÊy ë bÖnh ung th− m¾t ë trÎ em, nh−ng ®ét biÕn gen RB sau nµy ®−îc x¸c ®Þnh lµ
nguyªn nh©n g©y −ng th− ë nhiÒu lo¹i m« vµ c¬ quan kh¸c n÷a, bao gåm ung th− phæi,
ung th− thùc qu¶n, ung th− bµng quang, ung th− cæ tö cung vµ ung th− tiÒn liÖt tuyÕn.
Ngoµi ra, nghiªn cøu ë chuét bÞ bÊt ho¹t gen RB cho thÊy hÇu hÕt chuét chÕt ngay ë giai
®o¹n ph«i. Râ rµng, protein pRB cã vai trß quan träng trong qu¸ tr×nh ph¸t triÓn c¸ thÓ.
Protein pRB lµ mét protein tËp trung trong nh©n cã khèi l−îng 105 kDa. Trong hÖ
gen cña ®éng vËt cã vó, ngoµi gen RB cßn cã hai gen kh¸c cã liªn quan tíi gen nµy mµ
c¸c s¶n phÈm cña chóng ®−îc ký hiÖu lÇn l−ît lµ p107 vµ p130 (t−¬ng øng víi khèi
l−îng ph©n tö lµ 107 vµ 130 kDa). Trong thùc nghiÖm, khi chuét bÞ bÊt ho¹t mét trong
hai gen, chóng cã thÓ sèng, nh−ng nÕu bÞ bÊt ho¹t c¶ hai gen th× ®Òu bÞ chÕt sau khi
sinh. §iÒu nµy cho thÊy, hai protein nµy cã lÏ còng tham gia ®iÒu hßa chu tr×nh tÕ bµo
(dï vËy, ®Õn nay ë ng−êi ch−a cã b¸o c¸o nµo vÒ bÖnh nh©n ung th− g©y ra bëi ®ét biÕn
®ång thêi ë hai gen nµy).
CyclinD
Ph©n hñy
Cdk2
CyclinD vµ E
CyclinE
Cdk4/6 Sau khi ®−îc
ho¹t hãa, E2F
P Cdk2 Tæng hîp
P bËt c¸c gen
CyclinA
pRB sao chÐp
ADN
P CyclinA Thóc ®Èy
pRB pRB E2F sao chÐp
E2F E2F ADN

Pha G1 Pha S

H×nh 8.7. Vai trß cña pRB trong ®iÒu hßa chu tr×nh tÕ bµo t¹i ®iÓm kiÓm tra gi÷a pha G1 vµ pha S.
Khi liªn kÕt víi c¸c yÕu tè phiªn m· E2F, pRB lµm “dõng” tÕ bµo ë cuèi pha G1. Nh−ng, khi pRB bÞ
phosphoryl hãa (+) bëi phøc hÖ enzym Cyclin/CDK, nã “gi¶i phãng” c¸c yÕu tè phiªn m· nµy. ë d¹ng tù
do, E2F ho¹t hãa c¸c gen ®Ých m· hãa c¸c protein thóc ®Èy tÕ bµo v−ît ®iÓm kiÓm tra G1 ®Ó vµo pha S.

C¸c nghiªn cøu sinh häc ph©n tö ®· lµm râ vai trß cña pRB trong ®iÒu hßa chu
tr×nh tÕ bµo (h×nh 8.7). ë tÕ bµo b×nh th−êng, vµo giai ®o¹n sím cña pha G1, pRB liªn
kÕt víi c¸c yÕu tè E2F. §©y lµ mét hä c¸c yÕu tè phiªn m· ®iÒu khiÓn sù biÓu hiÖn cña
c¸c gen mµ s¶n phÈm cña chóng thóc ®Èy tÕ bµo chuyÓn qua c¸c pha kh¸c nhau trong
chu tr×nh tÕ bµo. Khi yÕu tè E2F liªn kÕt víi pRB, chóng kh«ng thÓ liªn kÕt ®−îc vµo
tr×nh tù t¨ng c−êng vµ ho¹t hãa c¸c gen cÊu tróc. V× vËy, c¸c protein tham gia thóc ®Èy
tÕ bµo v−ît qua ®iÓm kiÓm tra kh«ng ®−îc t¹o ra. Vµo cuèi pha G1, pRB bÞ phosphoryl
hãa nhê ho¹t ®éng cña c¸c phøc hÖ Cyclin/CDK; lóc nµy, pRB “nh¶” c¸c yÕu tè phiªn m·
E2F. ë d¹ng tù do, E2F ho¹t hãa c¸c gen m· ho¸ c¸c protein thóc ®Èy tÕ bµo chuyÓn tõ
pha G1 sang pha S, råi sau ®ã chuyÓn sang pha M. Sau khi pha M (sù ph©n bµo) kÕt
thóc, pRB bÞ “lo¹i” nhãm phosphate vµ tÕ bµo trë vÒ tr¹ng th¸i cña pha G1 vµ b¾t ®Çu
mét chu tr×nh tÕ bµo míi.

257
§inh §oµn Long

ë nhiÒu tÕ bµo ung th− (kh«ng chØ ë u nguyªn bµo vâng m¹c), c¸c ho¹t ®éng ®−îc
®iÒu khiÓn “chÆt chÏ” vµ diÔn ra ®Òu ®Æn nh− trªn bÞ ph¸ vì do chóng mang c¶ hai b¶n
sao gen RB mÊt chøc n¨ng, hoÆc do mÊt ®o¹n NST, hoÆc do ®ét biÕn lµm mÊt kh¶ n¨ng
liªn kÕt cña pRB vµo E2F. Khi pRB mÊt kh¶ n¨ng liªn kÕt víi E2F, yÕu tè phiªn m· E2F
lu«n ë d¹ng tù do sÏ ho¹t hãa liªn tôc c¸c gen ®Ých; v× vËy, sù tæng hîp ADN vµ ph©n bµo
diÔn ra liªn tôc. Trong ®iÒu kiÖn b×nh th−êng, tÕ bµo cã c¬ chÕ tù nhiªn lµm dõng chu
tr×nh tÕ bµo vµ tiÕn hµnh söa ch÷a, hoÆc ®−a tÕ bµo vµo con ®−êng “chÕt theo ch−¬ng
tr×nh”. Nh−ng khi c¸c c¬ chÕ nµy còng bÞ háng, tÕ bµo sÏ ph©n chia liªn tôc vµ chuyÓn sang
tr¹ng th¸i ung th−.
8.5.2.2. Protein p53
Protein øc a) CÊu tróc c¸c miÒn cña protein p53
chÕ khèi u p53 cã C¸c ®ét biÕn lÆn C¸c ®ét biÕn tréi
khèi l−îng 53 mÊt chøc n¨ng øc chÕ ho¹t ®éng
kDa ®−îc t×m TAD DBD OD
thÊy khi nghiªn 1 42 113 290 330 360 390
cøu sù ph¸t sinh
khèi u g©y nªn b) C¬ chÕ ho¹t ®éng cña p53 trong ®¸p øng cña tÕ bµo víi sai háng ADN
bëi c¸c virut cã Sai háng ADN lµm t¨ng sù
hÖ gen ADN. biÓu hiÖn cña gen TP53
Protein nµy ®−îc
m· hãa bëi gen p53 Con ®−êng "tÕ bµo chÕt
Con ®−êng "dõng"
TP53. §ét biÕn ë chu tr×nh tÕ bµo theo ch−¬ng tr×nh”
TP53 lµ nguyªn
nh©n c¬ b¶n g©y  Víi vai trß yÕu tè phiªn m·, p21 BAX  Víi vai trß yÕu tè phiªn m·,
p53 lµm t¨ng sù tæng hîp p21 p53 lµm t¨ng sù tæng hîp
nªn héi chøng gen m· hãa protein BAX
Li-Fraumeni.  p21 øc chÕ ho¹t tÝnh phosphoryl
 BAX lµ chÊt ®èi vËn cña
§©y lµ héi chøng hãa cña c¸c enzym CDK
C¸c CDK BCL-2; trong khi BCL-2 lµ
tréi hiÕm gÆp, protein øc chÕ ho¹t ®éng
 Protein pRB ë tr¹ng th¸i
th−êng ®i kÌm kh«ng ®−îc phosphoryl hãa cña con ®−êng "TÕ bµo chÕt
BCL-2 theo ch−¬ng tr×nh"
víi kh¶ n¨ng hoÆc chØ ®−îc phosphoryl
hãa ë møc thÊp pRB
m¾c c¸c bÖnh pRB-  Khi thiÕu BCL-2, con
ung th− kh¸c  pRB kh«ng ®−îc phosphoryl ®−êng "diÖt” tÕ bµo
øc chÕ ho¹t ®éng cña yÕu tè theo ch−¬ng tr×nh
nhau. Khi nghiªn E2F ho¹t ®éng vµ tÕ bµo
phiªn m· E2F TÕ bµo chÕt theo
cøu nh÷ng ng−êi ch−¬ng tr×nh chøa ADN sai háng
m¾c héi chøng  ThiÕu E2F, c¸c gen ®Ých (thóc ®Èy bÞ tiªu diÖt.
sù diÔn tiÕn cña chu tr×nh tÕ bµo) TÕ bµo bÞ tiªu diÖt
nµy, ng−êi ta kh«ng ®−îc biÓu hiÖn C¸c gen ®Ých
thÊy c¸c ®ét biÕn
soma lµm bÊt  C¸c gen ®Ých cña E2F m· hãa
ho¹t c¶ hai b¶n kh«ng ®−îc biÓu hiÖn dÉn ®Õn sù C¸c protein thóc
“dõng l¹i” cña chu tr×nh tÕ bµo. ®Èy chu tr×nh tÕ bµo
sao cña gen
TP53. Sau nµy, Chu tr×nh tÕ bµo
nh÷ng ®ét biÕn bÞ chÆn l¹i
t−¬ng tù liªn H×nh 8.8. CÊu tróc vµ c¬ chÕ ho¹t ®éng cña protein øc chÕ khèi u p53. Trªn s¬ ®å ë
quan ®Õn p53 phÇn (a), TAD lµ miÒn ho¹t hãa phiªn m·, DBD lµ miÒn lâi liªn kÕt ADN vµ OD lµ miÒn
®ång hãa oligo ®Çu C. ë phÇn (b), c¸c ®−êng dÉn cã mòi tªn chØ t¸c ®éng "kÝch thÝch",
®−îc t×m thÊy ë c¸c ®−êng dÉn ®Çu tï chØ t¸c ®éng "øc chÕ", g¹ch chÐo gi÷a c¸c ®−êng dÉn biÓu diÔn
hÇu hÕt c¸c bÖnh c¸c tr−êng hîp khi c¸c t¸c ®éng (kÝch thÝch hoÆc øc chÕ) bÞ "chÆn l¹i".

258
Ch−¬ng 8. Chu tr×nh tÕ bµo vµ c¬ së di truyÒn häc ung th−

ung th− kh¸c nhau ë ng−êi. Nh− vËy, sù mÊt chøc n¨ng cña protein p53 cã vai trß quan
träng trong sù ph¸t sinh nhiÒu bÖnh ung th− kh¸c nhau.
C¸c nghiªn cøu sinh häc ph©n tö cho thÊy protein p53 thùc chÊt lµ mét yÕu tè
phiªn m· cã chiÒu dµi 393 axit amin víi 3 miÒn chøc n¨ng kh¸c biÖt (h×nh 8.8a), ®ã lµ:
(1) miÒn ho¹t hãa phiªn m· ®Çu N (kÝ hiÖu lµ TDA), (2) MiÒn lâi liªn kÕt ADN (kÝ hiÖu lµ
DBD) vµ (3) miÒn ®ång hãa oligo ®Çu C (kÝ hiÖu lµ OD). PhÇn lín c¸c ®ét biÕn lµm bÊt
ho¹t p53 ë miÒn liªn kÕt ADN (miÒn DBD). Nh÷ng ®ét biÕn ë miÒn nµy lµm suy yÕu hoÆc
lµm mÊt kh¶ n¨ng liªn kÕt cña p53 vµo c¸c tr×nh tù ADN ®Æc hiÖu thuéc c¸c gen ®Ých,
dÉn ®Õn viÖc c¸c gen nµy kh«ng ®−îc phiªn m·. V× vËy, c¸c ®ét biÕn ë vïng DBD cã biÓu
hiÖn ®Æc tr−ng nh− mét ®ét biÕn lÆn mÊt chøc n¨ng. Mét sè kiÓu ®ét biÕn kh¸c ®−îc t×m
thÊy ë gen TP53 liªn quan ®Õn miÒn OD. C¸c chuçi polypeptide p53 ®ét biÕn ë miÒn OD
th−êng t−¬ng t¸c víi p53 kiÓu d¹i vµ ng¨n c¶n protein nµy thùc hiÖn chøc n¨ng ho¹t hãa
phiªn m· th«ng th−êng. V× vËy, c¸c alen ®ét biÕn ë miÒn OD th−êng lµ tréi so víi c¸c alen
kiÓu d¹i.
Trong tÕ bµo, protein p53 cßn cã vai trß quan träng trong ®iÒu khiÓn sù ®¸p øng cña
tÕ bµo víi c¸c yÕu tè stress tõ m«i tr−êng. Trong ®iÒu kiÖn b×nh th−êng, tÕ bµo chØ chøa
mét l−îng nhá protein p53. Nh−ng khi ®−îc xö lý víi c¸c t¸c nh©n g©y sai háng ADN
(nh− chiÕu x¹), l−îng p53 t¨ng lªn ®¸ng kÓ. §¸p øng nµy cña tÕ bµo ®èi víi sai háng ADN
®−îc ®iÒu hßa bëi mét qu¸ tr×nh truyÒn tÝn hiÖu (ch−a biÕt ®Çy ®ñ) lµm t¨ng sù biÓu hiÖn
cña gen TP53. Con ®−êng truyÒn tÝn hiÖu nµy ®ång thêi chuyÓn protein p53 vÒ d¹ng ho¹t
®éng m¹nh (nhê sù phosphoryl hãa). Sau khi ®−îc ho¹t hãa, p53 cã thÓ ®ång thêi tham
gia vµo ba qu¸ tr×nh (h×nh 8.8b): (1) thóc ®Èy sù phiªn m· cña c¸c gen ®Ých lµm dõng
chu tr×nh tÕ bµo, (2) kÝch ho¹t hÖ thèng söa ch÷a ADN (kh«ng minh häa trªn h×nh), (3)
ho¹t hãa mét sè gen ®Ých mµ s¶n phÈm cña chóng cã thÓ tiªu diÖt tÕ bµo qua c¬ chÕ gäi lµ
con ®−êng “chÕt theo ch−¬ng tr×nh cña tÕ bµo”.
Mét protein ®iÓn h×nh lµm dõng chu tr×nh tÕ bµo lµ p21. Gen m· hãa protein nµy
®−îc ho¹t hãa bëi p53. Protein p21 lµ chÊt øc chÕ h×nh thµnh c¸c phøc hÖ cyclin/CDK. Nã
®−îc tæng hîp m¹nh khi tÕ bµo ph¶i ®¸p øng l¹i c¸c sai háng ADN. Lóc nµy, sù h×nh
thµnh phøc hÖ cyclin/CDK bÞ øc chÕ vµ chu tr×nh tÕ bµo bÞ chÆn l¹i ®Ó tiÕn hµnh söa ch÷a
c¸c phÇn ADN bÞ sai háng. Nh− vËy, cã thÓ vÝ p53 cã vai trß nh− yÕu tè kÝch ho¹t “hÖ
thèng phanh” cña chu tr×nh tÕ bµo. “HÖ thèng phanh” nµy gióp tÕ bµo duy tr× tÝnh æn
®Þnh cña vËt chÊt di truyÒn. NÕu thiÕu p53, tÕ bµo sÏ kh«ng khëi ®éng ®−îc “hÖ thèng
phanh” vµ tiÕp tôc ®i vµo qu¸ tr×nh sao chÐp ADN vµ ph©n bµo bÊt kÓ mang theo c¸c ®ét
biÕn vµ sai háng ADN. C¸c ®ét biÕn vµ sai háng ADN sÏ tiÕp tôc ®−îc tÝch lòy qua mçi
chu tr×nh tÕ bµo vµ ®Õn mét lóc nµo ®ã tÕ bµo kh«ng cßn kiÓm so¸t ®−îc ho¹t ®éng ph©n
bµo n÷a vµ chuyÓn sang tr¹ng th¸i ung th−. Víi vai trß vµ c¬ chÕ ho¹t ®éng nh− vËy, cã
thÓ gi¶i thÝch ®−îc t¹i sao c¸c ®ét biÕn lµm bÊt ho¹t protein p53 cã thÓ g©y nªn nhiÒu
bÖnh ung th− kh¸c nhau.
Protein p53, ngoµi viÖc ®iÒu khiÓn nh÷ng ho¹t ®éng ®ång bé cña tÕ bµo nh»m söa
ch÷a ADN cßn khëi ®éng mét lo¹t c¸c ph¶n øng ®−îc “lËp tr×nh” s½n ®Ó “tiªu diÖt” c¸c tÕ
bµo mang c¸c sai háng ADN kh«ng söa ch÷a ®−îc, gäi lµ c¬ chÕ “chÕt theo ch−¬ng tr×nh
cña tÕ bµo”. Chi tiÕt cña c¸c con ®−êng tÕ bµo chÕt theo ch−¬ng tr×nh ®Õn nay ch−a biÕt
®Çy ®ñ. Nh−ng, mét trong nh÷ng con ®−êng nh− vËy liªn quan ®Õn protein do gen BAX
m· hãa. Protein BAX lµ chÊt ®èi vËn cña protein BCL-2 vèn cã vai trß øc chÕ sù “chÕt
theo ch−¬ng tr×nh cña tÕ bµo”. Khi gen BAX ®−îc p53 ho¹t hãa, s¶n phÈm protein cña nã
sÏ gi¶i phãng BCL-2 khái phøc hÖ øc chÕ. Nhê vËy, lóc nµy con ®−êng “chÕt theo ch−¬ng
tr×nh” ho¹t ®éng vµ tÕ bµo ®i vµo con ®−êng tù hñy diÖt.

259
§inh §oµn Long

“ChÕt theo ch−¬ng tr×nh” lµ mét kiÓu ®¸p øng cña c¬ thÓ ®èi víi c¸c yÕu tè stress tõ
m«i tr−êng. §¸p øng nµy rÊt cã ý nghÜa nhê kh¶ n¨ng tù lo¹i bá c¸c tÕ bµo bÞ háng
nghiªm träng mµ sù tån t¹i cña chóng cã thÓ g©y h¹i cho c¬ thÓ. Tuy vËy, chÕt theo
ch−¬ng tr×nh cßn x¶y ra ngay c¶ khi kh«ng cã c¸c yÕu tè stress trong m«i tr−êng. Cô thÓ,
trong giai ®o¹n ph¸t triÓn ph«i-thai, nhiÒu tÕ bµo tù ®éng chÕt sau khi chóng ®· hoµn
thµnh c¸c "nhiÖm vô" sinh häc cña m×nh. §iÒu nµy còng cÇn thiÕt cho mét qu¸ tr×nh ph¸t
triÓn ph«i - thai b×nh th−êng. Ch¼ng h¹n, trong giai ®o¹n h×nh thµnh c¸c chi ë bµo thai
®éng vËt cã vó, c¸c tÕ bµo n»m gi÷a c¸c ngãn tay vµ ngãn ch©n ph¶i tù chÕt ®i; nÕu
kh«ng, sÏ cã hiÖn t−îng "dÝnh" c¸c ngãn tay hoÆc c¸c ngãn ch©n víi nhau.
Cã mét ®iÓm ®¸ng chó ý lµ protein p53 kh«ng tham gia vµo qu¸ tr×nh chÕt theo
ch−¬ng tr×nh tù nhiªn cña c¸c tÕ bµo trong giai ®o¹n ph«i. ThÝ nghiÖm g©y ®ét biÕn bÊt
ho¹t gen p53 ®ång hîp tö ë chuét cho thÊy ph«i ph¸t triÓn b×nh th−êng (chuét chØ bÞ
ung th− khi tr−ëng thµnh). §iÒu nµy cho thÊy d−êng nh− p53 kh«ng liªn quan ®Õn sù
"chÕt theo ch−¬ng tr×nh" cña c¸c tÕ bµo trong qu¸ tr×nh ph¸t triÓn ph«i tù nhiªn ë ®éng
vËt cã vó.

8.5.2.3. Protein pAPC


Protein pAPC lµ mét protein cã kÝch th−íc lín, khèi l−îng 310 kDa, gåm 2843 axit
amin. Protein nµy gi÷ vai trß quan träng trong ®iÒu hoµ sù thay thÕ c¸c tÕ bµo biÓu m«
vµ tÕ bµo lãt ë ruét giµ. MÆc dï c¬ chÕ ®iÒu hoµ qu¸ tr×nh nãi trªn ch−a biÕt ®Çy ®ñ
nh−ng cã c¸c b»ng chøng cho thÊy pAPC tham gia ®iÒu khiÓn sù nh©n lªn vµ biÖt hãa
cña c¸c tÕ bµo biÓu m« ruét. Khi pAPC mÊt chøc n¨ng, c¸c tÕ bµo biÓu m« ruét sÏ ph¸t
triÓn thµnh khèi tÕ bµo låi (tr«ng gièng nh− ®Çu ngãn tay) trªn bÒ mÆt biÓu m« ruét vµ ë
tr¹ng th¸i kh«ng biÖt hãa. Khi c¸c tÕ bµo nµy tiÕp tôc ph©n chia, chóng h×nh thµnh nªn
nhiÒu khèi u lµnh tÝnh cã kÝch th−íc nhá trªn bÒ mÆt biÓu m« ruét. C¸c khèi u nµy ®−îc
gäi lµ c¸c u b−íu (polyp) hay u tuyÕn (adenoma). Héi chøng nµy gäi lµ héi chøng u tuyÕn
kh«ng polyp theo dßng hä - FAP (familial adenomatous polyposis). Xu h−íng bÞ m¾c héi
chøng FAP biÓu hiÖn nh− mét tÝnh tr¹ng di truyÒn tréi n»m trªn NST th−êng víi tÇn sè
m¾c bÖnh kho¶ng 1/7.000.
C¸c bÖnh nh©n bÞ m¾c héi chøng FAP th−êng cã biÓu hiÖn ph¸t triÓn c¸c u tuyÕn
lóc b−íc vµo tuæi vÞ thµnh niªn. MÆc dï c¸c u tuyÕn lóc ®Çu lµ c¸c khèi u lµnh nh−ng mét
tû lÖ nµo ®ã nh÷ng khèi u nµy cã thÓ chuyÓn sang tr¹ng th¸i ¸c tÝnh. V× vËy, khi ë ®é tuæi
cao h¬n (trung b×nh lµ 42 tuæi), ng−êi m¾c héi chøng FAP cã thÓ bÞ m¾c chøng ung th− ¸c
tÝnh. NhiÒu u tuyÕn ph¸t triÓn trong ruét cña nh÷ng ng−êi mang locut gen APC dÞ hîp tö
(l−u ý: c¸c alen kiÓu d¹i cã thÓ ®ét biÕn nhiÒu lÇn trong qu¸ tr×nh t¸i sinh tù nhiªn ë c¸c
tÕ bµo biÓu m« ruét). Khi ®ét biÕn xuÊt hiÖn, c¸c tÕ bµo mÊt kh¶ n¨ng tæng hîp protein
pAPC kiÓu d¹i. Sù v¾ng mÆt cña protein nµy lµm “hÖ thèng phanh” chu tr×nh tÕ bµo
chuyÓn vÒ t×nh tr¹ng kh«ng ®iÒu khiÓn ®−îc. Nh− vËy, sù h×nh thµnh cña c¸c khèi u lµnh
trong ruét cña c¸c c¸ thÓ dÞ hîp tö vÒ locut APC lµ do sù xuÊt hiÖn ®éc lËp cña mét ®ét
biÕn thø hai liªn quan ®Õn alen kiÓu d¹i cßn l¹i trong tÕ bµo. C¸c c¸ thÓ khi sinh ra
kh«ng mang bÊt cø mét alen ®ét biÕn nµo t¹i locut APC rÊt hiÕm khi h×nh thµnh cña c¸c
u tuyÕn. Tuy nhiªn, ®«i khi còng cã thÓ cã mét hoÆc mét vµi u tuyÕn h×nh thµnh do c¶ hai
alen kiÓu d¹i t¹i locut APC ®Òu bÞ “bÊt ho¹t” bëi c¸c ®ét biÕn ngÉu nhiªn x¶y ra kÕ tiÕp
nhau trong tÕ bµo soma.
Protein pAPC d−êng nh− ®iÒu khiÓn sù ph©n bµo qua t−¬ng t¸c víi β-catenin lµ
mét protein cã mÆt trong tÕ bµo chÊt. β-catenin b×nh th−êng cã kh¶ n¨ng liªn kÕt víi
nhiÒu lo¹i protein kh¸c, bao gåm mét sè yÕu tè phiªn m· cã vai trß t¨ng c−êng sù biÓu
hiÖn cña c¸c gen thóc ®Èy ph©n bµo. Sù t−¬ng t¸c víi c¸c yÕu tè phiªn m· nµy ®−îc t¨ng
c−êng khi c¸c ph©n tö tÝn hiÖu trªn bÒ mÆt tÕ bµo ra tÝn hiÖu cho tÕ bµo ph©n chia. Sù
ph©n bµo ®−îc kÝch ho¹t bëi ph©n tö tÝn hiÖu lµ mét c¬ chÕ cÇn thiÕt trong biÓu m« ruét,

260
Ch−¬ng 8. Chu tr×nh tÕ bµo vµ c¬ së di truyÒn häc ung th−

v× m« nµy hµng ngµy mÊt ®i mét l−îng tÕ bµo rÊt lín (ë ng−êi kho¶ng 1011 tÕ bµo) vµ c¸c
tÕ bµo mÊt ®i cÇn ®−îc thay thÕ b»ng c¸c tÕ bµo míi. Th«ng th−êng, c¸c tÕ bµo míi ®−îc
h×nh thµnh sÏ mÊt kh¶ n¨ng ph©n chia khi nã rêi khái m« ph©n sinh cña biÓu m« ruét vµ
chuyÓn vÒ tr¹ng th¸i tÕ bµo tr−ëng thµnh. Lóc nµy, mét sù chuyÓn ®æi tõ tÕ bµo cã kh¶
n¨ng ph©n chia thµnh tÕ bµo kh«ng cã kh¶ n¨ng ph©n chia biÓu hiÖn qua viÖc tÕ bµo
tr−ëng thµnh kh«ng tiÕp nhËn tÝn hiÖu kÝch thÝch ph©n bµo n÷a. Khi v¾ng mÆt c¸c ph©n
tö tÝn hiÖu, pAPC t¹o phøc víi β-catenin trong tÕ bµo chÊt vµ øc chÕ sù h×nh thµnh c¸c
phøc gi÷a β-catenin víi c¸c protein kh¸c dÉn ®Õn h¹n chÕ sù ph©n bµo. Nh−ng, nÕu tÕ
bµo mang c¸c alen pAPC ®ét biÕn th× chóng bÞ mÊt kh¶ n¨ng ®iÒu hßa β-catenin; dÉn ®Õn
viÖc tÕ bµo sÏ ph©n chia kh«ng giíi h¹n, ®ång thêi tÕ bµo míi kh«ng ®−îc biÖt hãa thµnh
tÕ bµo tr−ëng thµnh. HËu qu¶ lµ c¸c khèi u h×nh thµnh trong líp biÓu m« ruét vµ cã thÓ
tiÕn triÓn thµnh ung th−. Nh− vËy, pAPC (kiÓu d¹i) cã vai trß trong viÖc øc chÕ sù ph¸t
sinh c¸c khèi u ë ruét.
8.5.2.4. C¸c protein pBRCA1 vµ pBRCA2
C¸c d¹ng ®ét biÕn vÒ gen øc chÕ khèi u BRCA1 vµ BRCA2 ®−îc ph¸t hiÖn lÇn ®Çu
tiªn khi nghiªn cøu vÒ c¸c tr−êng hîp ung th− vó vµ ung th− buång trøng cã biÓu hiÖn di
truyÒn theo dßng hä. Gen BRCA1 ®−îc lËp b¶n ®å trªn NST 17 n¨m 1990 vµ t¸ch dßng
lÇn ®Çu tiªn vµo n¨m 1994, cßn gen BRCA2 ®−îc lËp b¶n ®å trªn NST 13 n¨m 1994 vµ
t¸ch dßng vµo n¨m 1995. C¶ hai gen nµy ®Òu m· hãa cho c¸c protein cã kÝch th−íc lín:
pBRCA1 lµ protein cã khèi l−îng 220 kDa, cßn pBRCA2 cã khèi l−îng 384 kDa. C¸c
nghiªn cøu sinh häc ph©n tö cho thÊy ë d¹ng b×nh th−êng, c¸c protein nµy tËp trung
trong nh©n tÕ bµo vµ cã mét miÒn ho¹t hãa phiªn m·. Tuy vËy, ®Õn nay c¸c b»ng chøng
vÉn ch−a ®ñ kh¼ng ®Þnh c¸c protein nµy cã ph¶i lµ c¸c yÕu tè phiªn m· thùc sù hay
kh«ng. Ngoµi ra, c¸c protein pBRCA1 vµ pBRCA2 cßn cã mét miÒn t−¬ng t¸c víi c¸c
protein kh¸c, ®Æc biÖt lµ víi pRAD51. pRAD51 lµ mét protein ë eukaryote gièng víi
protein söa ch÷a ADN cã tªn lµ RecA ë vi khuÈn (xem ch−¬ng 6). V× vËy, ng−êi ta cho
r»ng pBRCA1 vµ pBRCA2 cã liªn quan ®Õn c¸c c¬ chÕ söa ch÷a ADN sai háng ë ng−êi.
C¶ hai protein pBRCA1 vµ pBRCA2 ®Òu cã chøc n¨ng quan träng trong tÕ bµo.
Chuét thÝ nghiÖm bÞ g©y ®ét biÕn ®ång hîp tö lµm bÊt ho¹t mét trong hai gen ®Òu chÕt
ngay ë giai ®o¹n ph«i. Tuy nhiªn, chi tiÕt t¸c ®éng cña c¸c d¹ng ®ét biÕn ë c¸c gen
BRCA1 vµ BRCA2 ®Õn sù ph¸t sinh ung th− cho ®Õn nay vÉn ch−a râ. Mét gi¶ thiÕt cho
r»ng c¸c ®ét biÕn ë nh÷ng gen nµy lµm thay ®æi kh¶ n¨ng nhËn biÕt vµ söa ch÷a ADN sai
háng trong tÕ bµo.
C¸c ®ét biÕn ë c¸c gen BRCA1 vµ BRCA2 ®−îc t×m thÊy ë kho¶ng 7% bÖnh nh©n
ung th− vó vµ 10% sè bÖnh nh©n ung th− buång trøng. §ét biÕn c¸c gen BRCA1 vµ
BRCA2 cã biÓu hiÖn di truyÒn nh− c¸c alen tréi. §èi víi nh÷ng ng−êi mang c¸c ®ét biÕn ë
nh÷ng gen nµy, nguy c¬ m¾c c¸c bÖnh ung th− buång trøng hoÆc ung th− vó t¨ng lªn 10
®Õn 25 lÇn. Ngoµi ra, ë mét sè dßng hä cã c¸c alen ®ét biÕn, nguy c¬ bÞ ung th− ruét kÕt
vµ ung th− tiÒn liÖt tuyÕn còng t¨ng lªn. Nh−ng do cho ®Õn nay ®· t×m thÊy rÊt nhiÒu
d¹ng ®ét biÕn kh¸c nhau ë c¸c locut gen BRCA1 vµ BRCA2, nªn viÖc ph©n tÝch di truyÒn
d¹ng ®ét biÕn ë c¸c gen nµy theo nguyªn t¾c ph¶ hÖ lµ t−¬ng ®èi phøc t¹p.

8.5.3. C¸c gen g©y ®ét biÕn


Gen g©y ®ét biÕn (mutator gene) lµ gen mµ thÓ ®ét biÕn cña nã th−êng lµm t¨ng
tÇn sè ®ét biÕn tù ph¸t ë nh÷ng gen kh¸c. Trong tÕ bµo, c¸c alen kiÓu d¹i cña c¸c gen g©y
®ét biÕn th−êng cã vai trß quan träng trong ®iÒu khiÓn c¸c qu¸ tr×nh sao chÐp vµ söa
ch÷a ADN. V× vËy, nh÷ng ®ét biÕn liªn quan ®Õn chóng th−êng dÉn ®Õn hiÖn t−îng tÕ
bµo cã xu h−íng tÝch lòy nhanh c¸c ®ét biÕn ë nh÷ng gen kh¸c. Mét vÝ dô ®iÓn h×nh vÒ

261
§inh §oµn Long

gen g©y ®ét biÕn lµ c¸c gen g©y ra c¸c d¹ng kh¸c nhau cña héi chøng ung th− ruét kÕt
kh«ng polyp di truyÒn - HNPCC (hereditary nonpolyposis colorectal cancer).
Héi chøng HNPCC lµ mét bÖnh di truyÒn tréi liªn kÕt NST th−êng, víi biÓu hiÖn ë
ng−êi bÖnh lµ sím m¾c chøng ung th− ruét kÕt. Nh−ng kh«ng gièng víi bÖnh FAP,
HNPCC cã ®iÓm ®Æc tr−ng lµ kh«ng cã sù xuÊt hiÖn cña c¸c tÕ bµo u tuyÕn hay u b−íu (v×
vËy, ®−îc gäi lµ ung th− ruét kÕt kh«ng polyp).
Cã bèn gen ë ng−êi, bao gåm hMSH2, hMLH1, hPMS1 vµ hPMS2, ®−îc x¸c ®Þnh lµ
nguyªn nh©n g©y nªn bèn d¹ng bÖnh HNPCC kh¸c nhau. Trong ®ã, trªn 90% bÖnh nh©n
m¾c bÖnh lµ do c¸c ®ét biÕn liªn quan ®Õn hai locut gen ®Çu tiªn. C¸c ®ét biÕn liªn quan
®Õn hai gen cßn l¹i lµ nguyªn nh©n g©y bÖnh ë kho¶ng 5% bÖnh nh©n. Riªng ®ét biÕn gen
hMSH2 cã tÇn sè ®¹t ®Õn 1/500 ë nhiÒu quÇn thÓ. Do chØ cÇn mét ®ét biÕn duy nhÊt ë
alen kiÓu d¹i cßn l¹i lµ ®ñ ®Ó dÉn ®Õn sù h×nh thµnh khèi u, nªn trong c¸c ph¶ hÖ, biÓu
hiÖn cña bÖnh HNPCC th−êng theo kiÓu di truyÒn tréi. C¶ bèn gen ë ng−êi ®Òu cã c¸c
gen t−¬ng ®ång nh− ë vi khuÈn E. coli vµ nÊm men vèn ®−îc biÕt cã vai trß trong c¸c ho¹t
®éng söa ch÷a ADN. VÝ dô nh− gen hMSH2 t−¬ng øng víi gen mutS ë E. coli, trong khi
ba gen cßn l¹i t−¬ng øng víi gen mutL còng ë vi khuÈn nµy. Vai trß cña c¸c gen ë E. coli
®· ®−îc biÕt râ trong qu¸ tr×nh söa ch÷a ADN sau sao chÐp theo c¬ chÕ MMR (xem
ch−¬ng 6). C¸c gen ë nÊm men còng cã chøc n¨ng t−¬ng tù. Nãi c¸ch kh¸c, tÊt c¶ c¸c gen
cña ng−êi, nÊm men vµ E. coli trong vÝ dô ë ®©y ®Òu ®−îc xÕp vµo nhãm c¸c gen g©y ®ét
biÕn. §ét biÕn ë nh÷ng gen nµy ®Òu cã xu h−íng dÉn ®Õn sù tÝch lòy c¸c sai sãt trong sao
chÐp ADN vµ tÇn sè ®ét biÕn trong c¸c tÕ bµo (®Æc biÖt lµ tÕ bµo soma) t¨ng lªn nhanh
chãng. C¸c thÝ nghiÖm "cµi" cADN cña gen hMSH2 cña ng−êi vµo E. coli còng ®· x¸c
nhËn vai trß cña gen nµy trong söa ch÷a ADN. C¸c d¹ng ®ét biÕn cña gen hMSH2 lµm
t¨ng tÇn sè sai sãt trong sao chÐp ADN lªn kho¶ng 10 lÇn. HiÖn nay, ë nhiÒu n−íc ph¸t
triÓn c¸c ph−¬ng ph¸p ph©n tÝch ADN nh»m x¸c ®Þnh ®ét biÕn cña bèn gen trªn còng
nh− cña nhiÒu gen øc chÕ khèi u kh¸c ë ng−êi ®· ®−îc thiÕt lËp vµ ®−îc sö dông trong
chÈn ®o¸n sím nguy c¬ m¾c c¸c bÖnh ung th−.

8.6. C¸c c¬ chÕ di truyÒn liªn quan ®Õn sù ph¸t sinh ung th−
Trong phÇn lín tr−êng hîp, sù h×nh thµnh c¸c khèi u ¸c tÝnh vµ hiÖn t−îng di c¨n
th−êng phô thuéc vµo sù tÝch lòy ®ång thêi cña nhiÒu ®ét biÕn liªn quan ®Õn c¸c tiÒn gen
g©y khèi u vµ c¸c gen øc chÕ khèi u. D−êng nh− ®Ó mét tÕ bµo chuyÓn sang tr¹ng th¸i
ung th−, cÇn ph¶i cã Ýt nhÊt 6 hoÆc 7 ®ét biÕn x¶y ra vµ ®−îc tÝch lòy ®éc lËp qua vµi chôc
n¨m. C¸c ®ét biÕn nµy hoÆc liªn quan ®Õn sù thay ®æi ë c¸c gen g©y khèi u, c¸c tiÒn gen
g©y khèi u hoÆc liªn quan ®Õn sù bÊt ho¹t cña c¸c gen øc chÕ khèi u, dÉn ®Õn hµng lo¹t
c¸c sai háng trong sù ®iÒu hßa sinh tr−ëng, ph¸t triÓn vµ söa ch÷a ADN trong tÕ bµo. VÒ
nguån gèc, nh÷ng ®ét biÕn nµy cã thÓ xuÊt hiÖn do c¸c ®ét biÕn tù ph¸t, hoÆc do c¸c ®ét
biÕn g©y t¹o bëi c¸c t¸c nh©n tõ m«i tr−êng sèng, hoÆc ®−îc di truyÒn tõ c¸c thÕ hÖ tr−íc.
Nh− vËy, cã thÓ thÊy c¸c c¬ chÕ di truyÒn dÉn ®Õn ung th− lµ ®a d¹ng vµ phøc t¹p.
Chóng ta cã thÓ thÊy møc ®é ®a d¹ng vµ phøc t¹p biÓu hiÖn qua sù h×nh thµnh vµ
ph¸t triÓn cña nhiÒu lo¹i ung th− kh¸c nhau. Ch¼ng h¹n, c¸c khèi u lµnh ë ruét giµ cã
thÓ xuÊt hiÖn ®¬n thuÇn do ®ét biÕn bÊt ho¹t APC; nh−ng sù ph¸t triÓn cña khèi u lµnh
thµnh u ¸c tÝnh cÇn c¸c ®ét biÕn ë c¸c gen kh¸c n÷a. C¬ chÕ ®ét biÕn g©y ung th− trong
tr−êng hîp nµy ®−îc minh häa trªn h×nh 8.9a. C¸c ®ét biÕn bÊt ho¹t gen APC khëi ®Çu
cho qu¸ tr×nh h×nh thµnh c¸c tÕ bµo khèi u do sù ph¸t triÓn bÊt b×nh th−êng cña c¸c tÕ
bµo thuéc phÇn biÓu m« ruét. C¸c m« bÊt th−êng nµy mang c¸c tÕ bµo sinh s¶n hçn lo¹n
(cã kÝch th−íc tÕ bµo bÊt th−êng vµ kÝch th−íc nh©n lín) sau ®ã cã thÓ ph¸t triÓn thµnh
c¸c u tuyÕn s¬ khai. NÕu nh−, tiÒn gen g©y khèi u K-ras ®−îc ho¹t hãa ë mét trong sè c¸c
tÕ bµo u tuyÕn s¬ khai nµy, th× tÕ bµo u tuyÕn ®ã sÏ cã thÓ trë thµnh tÕ bµo khèi u thùc

262
Ch−¬ng 8. Chu tr×nh tÕ bµo vµ c¬ së di truyÒn häc ung th−

a) Con ®−êng h×nh thµnh ung th− ruét kÕt di c¨n


Gen øc chÕ Sù ho¹t hãa BÊt ho¹t gen BÊt ho¹t gen BÊt ho¹t c¸c
khèi u pAPC cña gen g©y øc chÕ khèi u øc chÕ khèi u gen øc chÕ
bÞ bÊt ho¹t khèi u K-ras trªn NST 18q TP53 khèi u kh¸c

TÕ bµo biÓu TÕ bµo biÓu TÕ bµo TÕ bµo TÕ bµo TÕ bµo TÕ bµo


m« ruét m« rèi lo¹n u tuyÕn u tuyÕn u tuyÕn khèi u ung th−
b×nh th−êng ph©n bµo nguyªn ph¸t trung gian thø ph¸t ¸c tÝnh di c¨n

b) Con ®−êng h×nh thµnh ung th− tuyÕn tiÒn liÖt “v« c¶m” víi androgen
• BÊt ho¹t gen øc • BÊt ho¹t mét sè • BÊt ho¹t gen øc • BiÓu hiÖn m¹nh
chÕ khèi u HPC1 gen øc chÕ khèi chÕ khèi u CDH1 cña gen g©y khèi
• Gen øc chÕ khèi u kh¸c (vÝ dô RB) • BÊt ho¹t gen øc u BCL-2
u TP53 bÞ bÊt chÕ khèi u TP53 • BiÕn ®æi thô thÓ
ho¹t bëi ho¹t • BÊt ho¹t gen øc adrogen
®éng methyl hãa chÕ di c¨n KAI1

TÕ bµo biÓu m« TÕ bµo ung th− TÕ bµo ung th− TÕ bµo ung th− TÕ bµo ung th−
tuyÕn tiÒn liÖt quan s¸t ®−îc tuyÕn tiÒn liÖt tuyÕn tiÒn liÖt “v« c¶m” víi
b×nh th−êng d−íi kÝnh hiÓn vi ®Þnh vÞ di c¨n androgen

c) C¸c con ®−êng h×nh thµnh c¸c bÖnh ung th− tÕ bµo xèp thÇn kinh s¬ cÊp vµ thø cÊp
• Sù t¨ng b¶n sao • BÊt ho¹t c¸c gen øc • Sù t¨ng b¶n sao
cña gen g©y khèi chÕ khèi u trªn c¸c cña gen g©y khèi
u MDM2 NST 10 p vµ 10q u EGFR

Ung th− tÕ bµo


xèp thÇn kinh
s¬ cÊp

TÕ bµo
thÇn kinh ®Öm
b×nh th−êng

TÕ bµo u TÕ bµo u Ung th− tÕ bµo


thÇn kinh ¸c tÝnh thÇn kinh ¸c tÝnh xèp thÇn kinh
cÊp II cÊp III thø cÊp

• BiÓu hiÖn cao bÊt • Sù t¨ng b¶n sao • BÊt ho¹t c¸c gen øc
th−êng cña gen cña gen g©y khèi u chÕ khèi u trªn c¸c
g©y khèi u PDGF CDK4 NST 10 p vµ 10q
• BÊt ho¹t gen øc • BÊt ho¹t c¸c gen øc
chÕ khèi u TP53 chÕ khèi u trªn c¸c
• BÊt ho¹t gen øc NST 13q (RB?), 9p
chÕ khèi u trªn (p15/p16?) vµ 19q
NST 22q (NF2?)

H×nh 8.9. Mét sè vÝ dô minh häa vÒ c¸c c¬ chÕ di truyÒn ph¸t sinh ung th−.

sù. C¸c ®ét biÕn bÊt ho¹t mét trong c¸c gen øc chÕ khèi u, ch¼ng h¹n ë gen trªn vai dµi
cña NST 18, lµm cho c¸c tÕ bµo u tuyÕn nµy tiÕp tôc ph¸t triÓn thªm n÷a vµ mét ®ét biÕn
bÊt ho¹t tiÕp theo ë gen øc chÕ khèi u TP53 trªn NST 17 sÏ chuyÓn tÕ bµo u tuyÕn sang
d¹ng tÕ bµo khèi u ph¸t triÓn m¹nh. C¸c ®ét biÕn kh¸c liªn quan ®Õn c¸c gen øc chÕ khèi
u sÏ t¹o ®iÒu kiÖn cho c¸c tÕ bµo u tuyÕn tho¸t khái sù kiÓm so¸t vµ di c¨n. Nh− vËy,
trong m« h×nh ph¸t sinh ung th− nªu trªn, cã Ýt nhÊt 7 ®ét biÕn ®−îc tÝch lòy (2 ®ét biÕn
bÊt ho¹t APC, 1 ®ét biÕn ho¹t hãa gen K-ras, 2 ®ét biÕn bÊt ho¹t gen øc chÕ khèi u trªn

263
§inh §oµn Long

NST 18 vµ 2 ®ét biÕn bÊt ho¹t gen øc chÕ khèi u TP53). Ngoµi ra, qu¸ tr×nh di c¨n cã thÓ
cßn cÇn mét sè ®ét biÕn gen kh¸c n÷a.
Mét sè c¬ chÕ di truyÒn dÉn ®Õn ung th− gÇn ®©y ®· ®−îc lµm râ (nh− vÝ dô ë c¸c
h×nh 8.9b vµ 8.9c). Ch¼ng h¹n, liªn quan ®Õn ung th− tiÒn liÖt tuyÕn, mét ®ét biÕn ë gen
HPC1 trªn vai dµi cña NST sè 1 ®−îc t×m thÊy lµ c¨n nguyªn g©y bÖnh. C¸c ®ét biÕn ë c¸c
gen øc chÕ khèi u n»m trªn c¸c NST sè 13, 16, 17 vµ 18 cã thÓ chuyÓn c¸c d¹ng khèi u tiÒn
liÖt tuyÕn nguyªn ph¸t (lµnh tÝnh) thµnh d¹ng ¸c tÝnh di c¨n; thËm chÝ sù biÓu hiÖn t¨ng
c−êng cña c¸c tiÒn gen ung th−, nh− BCL-2, cã thÓ lµm cho c¸c tÕ bµo ung th− trë nªn “v«
c¶m” víi c¸c liÖu ph¸p c¾t gi¶m hoocm«n androgen (mét liÖu ph¸p trong ®iÒu trÞ ung th−
tiÒn liÖt tuyÕn). Hoocm«n androgen cÇn thiÕt cho qu¸ tr×nh sinh s¶n cña c¸c tÕ bµo biÓu m«
tiÒn luyÖt tuyÕn. Th−êng th×, khi thiÕu hoocm«n nµy, c¸c tÕ bµo sÏ chÕt theo ch−¬ng tr×nh.
Tuy nhiªn, ë bÖnh nh©n ung th−, c¸c tÕ bµo ung th− l¹i cã thÓ sèng ngay c¶ khi thiÕu
androgen; cã thÓ do sù biÓu hiÖn t¨ng c−êng cña gen BCL-2 ®· lµm øc chÕ qu¸ tr×nh tù
chÕt theo ch−¬ng tr×nh cña tÕ bµo. C¸c d¹ng ung th− tiÒn liÖt tuyÕn ®· chuyÓn sang giai
®o¹n kh«ng cßn ®¸p øng víi liÖu ph¸p hoocm«n androgen phÇn lín ®Òu g©y tö vong.
Douglas vµ Robert Weinberg ®Ò xuÊt s¸u giai ®o¹n trong qu¸ tr×nh ph¸t sinh ung
th− ¸c tÝnh. Cã thÓ tãm t¾t nh− sau:
1. Giai ®o¹n khëi ph¸t. C¸c tÕ bµo ung th− nhËn ®−îc c¸c tÝn hiÖu thóc ®Èy sù t¨ng
sinh vµ ph©n bµo. C¸c tÝn hiÖu nµy cã thÓ xuÊt hiÖn do sù thay ®æi cña c¸c yÕu tè
ngo¹i bµo hoÆc do sù thay ®æi bªn trong hÖ thèng truyÒn tÝn hiÖu néi bµo dÉn
®Õn thóc ®Èy sù t¨ng sinh vµ ph©n bµo. Trong nh÷ng tr−êng hîp “cùc ®oan”
nhÊt, c¸c tÝn hiÖu kÝch thÝch ph©n bµo l¹i do chÝnh c¸c tÕ bµo ung th− tù s¶n sinh
ra. Lóc ®ã, tÕ bµo ®−îc kÝch thÝch ph©n chia kh«ng giíi h¹n.
2. Giai ®o¹n thóc ®Èy. C¸c tÕ bµo trë nªn v« c¶m mét c¸ch bÊt th−êng víi c¸c tÝn
hiÖu øc chÕ ph©n bµo. Nh− ®· tr×nh bµy ë trªn, trong c¸c tÕ bµo b×nh th−êng, sù
ph©n bµo th−êng ®−îc kÝch ho¹t bëi c¸c tÝn hiÖu nhÊt ®Þnh; vµ tån t¹i song song
víi chóng lµ c¸c tÝn hiÖu øc chÕ ph©n bµo. B×nh th−êng, hai c¬ chÕ nµy phèi hîp
víi nhau ë møc c©n b»ng, nhê vËy sù ph©n bµo diÔn ra æn ®Þnh, cã tæ chøc. Trong
khi ®ã, ë c¸c tÕ bµo ung th−, sù t¨ng sinh vµ ph©n bµo kh«ng kiÓm so¸t ®−îc do
c¸c tÝn hiÖu kÝch thÝch trë nªn cã −u thÕ v−ît tréi. Trong qu¸ tr×nh di c¨n, hÇu
hÕt c¸c tÕ bµo ung th− mÊt hoµn toµn kh¶ n¨ng ®¸p øng c¸c tÝn hiÖu øc chÕ ph©n
bµo. Ch¼ng h¹n, c¸c tÕ bµo ung th− ruét th−êng kh«ng ®¸p øng víi yÕu tè TGFβ
lµ yÕu tè “dÉn ®−êng” ®Ó pRB lµm ngõng qu¸ tr×nh ph©n bµo. Khi sù ng¨n c¶n
ph©n bµo bÞ tª liÖt, tÕ bµo sÏ lu«n ®−îc chuyÓn tõ pha G1 sang pha S ®Ó tiÕn
hµnh sao chÐp ADN vµ b−íc vµo mét chu tr×nh tÕ bµo míi bÊt kÓ c¸c sai háng
ADN cã ®−îc kh¾c phôc hay kh«ng. C¸c tÕ bµo sau giai ®o¹n t¨ng tr−ëng nµy sÏ
tiÕp tôc ph¸t triÓn thµnh c¸c khèi u ¸c tÝnh.
3. Giai ®o¹n chuyÓn biÕn. C¸c tÕ bµo ung th− tho¸t khái c¬ chÕ “chÕt theo ch−¬ng
tr×nh”. Nh− chóng ta ®· biÕt, protein p53 gi÷ vai trß quan träng trong qu¸ tr×nh
b¶o vÖ c¬ thÓ chèng l¹i sù tÝch lòy c¸c sai háng ADN cã thÓ g©y nguy hiÓm cho c¬
thÓ. Tuy ch−a biÕt ®Çy ®ñ vÒ c¬ chÕ ph©n tö, nh−ng mét chøc n¨ng cña p53 ®·
biÕt lµ chuyÓn c¸c tÕ bµo bÞ sai háng vµo mét qu¸ tr×nh tù ph¸ hñy vµ nhê vËy
lo¹i bá chóng ra khái c¬ thÓ. Khi protein p53 mÊt chøc n¨ng nµy th× con ®−êng
tù ph¸ hñy cña c¸c tÕ bµo háng kh«ng ho¹t ®éng. V× vËy, tÕ bµo háng cã thÓ sèng
vµ tiÕp tôc nh©n lªn nhanh chãng. Nh÷ng tÕ bµo nµy cã xu h−íng t¹o ra c¸c thÕ

264
Ch−¬ng 8. Chu tr×nh tÕ bµo vµ c¬ së di truyÒn häc ung th−

hÖ tÕ bµo con cã møc ®é sai háng cßn cao h¬n chÝnh nã. HËu qu¶ lµ mçi tÕ bµo
con h×nh thµnh ®Òu cã nguy c¬ chuyÓn thµnh c¸c tÕ bµo ung th−. Nh− vËy, cã thÓ
nãi, kh¶ n¨ng tho¸t khái c¬ chÕ chÕt theo ch−¬ng tr×nh lµ “cét mèc” quan träng
®Ó mét tÕ bµo khèi u ph¸t triÓn thµnh ung th− ¸c tÝnh.
4. Giai ®o¹n lan trµn. C¸c tÕ bµo ung th− cã kh¶ n¨ng sao chÐp v« tËn. ë ng−êi, mçi
tÕ bµo soma th−êng chØ cã kh¶ n¨ng sao chÐp kho¶ng 60 - 70 lÇn. Giíi h¹n vÒ
kh¶ n¨ng sao chÐp lµ do sù mÊt dÇn ®i cña ADN ë vïng ®Çu mót NST sau mçi
chu kú sao chÐp ADN (xem ch−¬ng 3). C¬ chÕ nµy dÉn ®Õn viÖc mäi tÕ bµo chØ cã
mét sè lÇn ph©n bµo giíi h¹n. C¸c tÕ bµo ®· v−ît qua møc giíi h¹n vÒ sè lÇn
ph©n bµo th−êng kÐm æn ®Þnh vµ chÕt. Tuy nhiªn, c¸c tÕ bµo ung th− l¹i cã thÓ
v−ît qua giíi h¹n ph©n bµo nµy nhê viÖc ADN phÇn ®Çu mót NST ®−îc kÐo dµi
nhê ho¹t ®éng m¹nh cña enzym ADN telomerase. Khi c¸c tÕ bµo ung th− ®¹t ®Õn
giai ®o¹n nµy, chóng ®−îc gäi lµ c¸c tÕ bµo bÊt tö.
5. Giai ®o¹n cñng cè. C¸c tÕ bµo ung th− ph¸t triÓn hÖ thèng tù nu«i d−ìng. C¸c
m« trong c¬ thÓ ®a bµo ®Òu cÇn mét hÖ thèng m¹ch m¸u cung cÊp chÊt dinh
d−ìng. C¸c tÕ bµo khèi u tiÒn ¸c tÝnh th−êng t¨ng tr−ëng chËm do chóng ®−îc
nu«i d−ìng bëi hÖ tuÇn hoµn b×nh th−êng (cã giíi h¹n ph©n bè nhÊt ®Þnh).
Nh−ng, ë c¸c tÕ bµo ung th−, khi khèi u ®· ph¸t triÓn ®Õn mét møc nhÊt ®Þnh th×
xuÊt hiÖn sù h×nh thµnh c¸c m¹ch m¸u míi. Lóc nµy, c¸c khèi u ®−îc nu«i d−ìng
vµ ph¸t triÓn rÊt m¹nh. Nh− vËy, mét trong nh÷ng b−íc “cñng cè” c¸c tÕ bµo ung
th− ¸c tÝnh lµ sù h×nh thµnh c¸c m¹ch m¸u míi nu«i d−ìng c¸c khèi u. Liªn
quan ®Õn sù h×nh thµnh c¸c m¹ch m¸u cã c¸c yÕu tè t¨ng c−êng vµ c¸c yÕu tè øc
chÕ sù h×nh thµnh c¸c m¹ch m¸u. ë c¸c m« b×nh th−êng, c¸c yÕu tè nµy ®−îc duy
tr× ë møc c©n b»ng, nhê vËy c¸c m¹ch m¸u ®−îc h×nh thµnh phï hîp víi yªu cÇu
cña c¬ thÓ. Nh−ng ë c¸c khèi u ¸c tÝnh, sù c©n b»ng nµy mÊt ®i theo chiÒu h−íng
chiÕm −u thÕ cña c¸c yÕu tè kÝch thÝch h×nh thµnh m¹ch m¸u. V× vËy, sù h×nh
thµnh m¹ch m¸u ë c¸c tÕ bµo ung th− diÔn ra nhanh vµ m¹nh. Khi ®· ®−îc cung
cÊp ®ñ chÊt dinh d−ìng, c¸c tÕ bµo ung th− tiÕp tôc ph¸t triÓn m¹nh vµ g©y nguy
hiÓm cho c¬ thÓ.
6. Giai ®o¹n x©m lÊn vµ di c¨n. ë giai ®o¹n nµy, c¸c tÕ bµo ung th− cã kh¶ n¨ng
x©m lÊn vµo c¸c vïng m« kh¸c vµ h×nh thµnh æ ung th− míi. H¬n 90% sè bÖnh
nh©n bÞ ung th− ®Òu chÕt vµo giai ®o¹n khi c¸c tÕ bµo ung th− ®· di c¨n tíi c¸c
phÇn kh¸c nhau cña c¬ thÓ. Khi c¸c khèi u di c¨n, c¸c tÕ bµo ung th− rêi khái
khèi u nguyªn ph¸t vµ di chuyÓn däc theo ®−êng m¸u (hay gÆp trong ung th− tÕ
bµo liªn kÕt) hoÆc ®−êng b¹ch huyÕt (hay gÆp trong ung th− tÕ bµo biÓu m«) tíi
c¸c vÞ trÝ kh¸c trong c¬ thÓ tr−íc khi chóng tró ngô ë vÞ trÝ míi vµ h×nh thµnh æ
ung th− míi. Nh− vËy, kÕt qu¶ cña sù di c¨n lµ sù h×nh thµnh c¸c khèi u thø cÊp
ë vÞ trÝ cã thÓ c¸ch rÊt xa vÞ trÝ khèi u nguyªn ph¸t ban ®Çu. Khi ung th− ®· tiÕn
triÓn ®Õn giai ®o¹n nµy, sù kiÓm so¸t vµ ®iÒu trÞ sÏ cùc kú khã kh¨n. V× vËy, cã
thÓ nãi di c¨n lµ giai ®o¹n cuèi cïng vµ nguy hiÓm nhÊt trong qu¸ tr×nh ph¸t
triÓn cña ung th−.
Víi nh÷ng hiÓu biÕt c¬ b¶n vÒ qu¸ tr×nh ph¸t sinh ung th− nªu trªn, hiÖn nay ë mét
sè n−íc ph¸t triÓn, ng−êi ta ®· triÓn khai th−êng xuyªn c¸c ch−¬ng tr×nh chÈn ®o¸n sím
c¸c t¸c nh©n g©y ®ét biÕn vµ ung th− (vÝ dô phÐp thö Ames ®Ó x¸c ®Þnh c¸c t¸c nh©n g©y
®ét biÕn hãa häc) trong m«i tr−êng sèng vµ lµm viÖc. Khi ph¸t hiÖn thÊy c¸c t¸c nh©n
nµy, ng−êi ta sÏ ®Ò ra c¸c biÖn ph¸p phßng trõ nh»m ng¨n ngõa kh¶ n¨ng tiÕp xóc cña

265
§inh §oµn Long

con ng−êi víi c¸c t¸c nh©n ®ã. Tuy vËy, còng ph¶i nãi r»ng hÇu nh− kh«ng cã m«i tr−êng
sèng nµo trong x· héi hiÖn ®¹i ngµy nay l¹i tr¸nh ®−îc hoµn toµn c¸c t¸c nh©n g©y ®ét
biÕn vµ ung th−; ®ã lµ ch−a kÓ ®Õn nhiÒu thãi quen sinh ho¹t cña con ng−êi còng lµm
t¨ng kh¶ n¨ng bÞ ung th− nh− hót thuèc, ph¬i n¾ng qu¸ møc, chÕ ®é dinh d−ìng kh«ng
phï hîp, x¶ chÊt th¶i ®éc h¹i ra m«i tr−êng, v.v…
Cã thÓ nãi, nh÷ng nghiªn cøu di truyÒn ph©n tö trong ba thËp kû gÇn ®©y ®· gióp
chóng ta cã mét sè hiÓu biÕt c¬ b¶n vÒ qu¸ tr×nh ph¸t sinh ung th−. Nh−ng còng cßn
nhiÒu néi dung cÇn tiÕp tôc lµm s¸ng tá. C¸c nhµ y, sinh vµ d−îc häc hy väng r»ng: víi
nh÷ng hiÓu biÕt míi cña con ng−êi vÒ ung th− trong thËp kû tíi sÏ gãp phÇn ®Ò ra c¸c
biÖn ph¸p phßng, chèng vµ ®iÒu trÞ bÖnh ung th− hiÖu qu¶ h¬n so víi hiÖn nay.

266
Ch−¬ng 9

§iÒu hßa gen hÖ miÔn dÞch


ë ®éng vËt cã x−¬ng sèng

9.1. Tæng quan vÒ ho¹t ®éng miÔn dÞch


Khi c¬ thÓ ®éng vËt cã vó bÞ l©y nhiÔm bëi c¸c t¸c nh©n sinh häc g©y bÖnh nh− nÊm,
vi khuÈn, virut, hoÆc cã sù x©m nhËp cña c¸c tÕ bµo ngo¹i lai, chóng sÏ ®¸p øng l¹i b»ng
c¸c ®¸p øng miÔn dÞch. Qu¸ tr×nh ®¸p øng miÔn dÞch th−êng diÔn ra qua ba b−íc c¬ b¶n:
1. NhËn ra sù x©m nhËp cña c¸c thÓ l©y nhiÔm (vÝ dô: tÕ bµo hoÆc virut).
2. TruyÒn tÝn hiÖu nhËn biÕt tíi nh÷ng tÕ bµo thÝch hîp cña hÖ miÔn dÞch.
3. Lo¹i bá c¸c thùc thÓ l¹.
Mét sè thµnh phÇn cña hÖ miÔn dÞch ®−îc ®iÒu khiÓn chèng l¹i c¸c t¸c nh©n l©y
nhiÔm theo mét c¸ch chung ®−îc gäi lµ ®¸p øng miÔn dÞch kh«ng ®Æc hiÖu. Trong sè
c¸c ho¹t ®éng nµy cã sù t¨ng tuÇn hoµn m¸u vµ huy ®éng sù ho¹t ®éng cña mét lo¹i tÕ
bµo ®Æc biÖt gäi lµ thÓ thùc bµo (phagocyte) ®Õn vïng m« bÞ l©y nhiÔm. Trong ®ã, c¸c thÓ
thùc bµo cã thÓ “bao v©y” vµ tiªu diÖt mét l−îng nhÊt ®Þnh c¸c virut, vi khuÈn, nÊm vµ
c¸c tÕ bµo ngo¹i lai mét c¸ch kh«ng ®Æc hiÖu. MÆc dï vËy, trong ho¹t ®éng sèng cña ®éng
vËt cã x−¬ng sèng, ®¸p øng miÔn dÞch quan träng nhÊt lµ c¸c ®¸p øng cã tÝnh ®Æc hiÖu
cña hÖ miÔn dÞch víi tõng thÓ l©y nhiÔm (thËm chÝ tõng chÊt l©y nhiÔm) ®−îc gäi lµ c¸c
®¸p øng miÔn dÞch ®Æc hiÖu. Trong ch−¬ng nµy, chóng ta chØ ®Ò cËp ®Õn hai kiÓu ®¸p
øng miÔn dÞch ®Æc hiÖu c¬ b¶n: (1) sù tæng hîp c¸c protein ®Æc hiÖu; vµ (2) sù s¶n sinh
c¸c tÕ bµo ®Æc hiÖu cã kh¶ n¨ng b¶o vÖ c¬ thÓ khái mçi lo¹i t¸c nh©n l©y nhiÔm. §¸ng chó
ý lµ trong c¬ thÓ, hai kiÓu ®¸p øng miÔn dÞch nµy th−êng kh«ng diÔn ra ®éc lËp; mµ thay
vµo ®ã, chóng cã sù liªn l¹c vµ ®−îc ®iÒu phèi chung ®Ó ®¸p øng miÔn dÞch ®¹t hiÖu qu¶
cao. VÒ c¬ chÕ, ®¸p øng miÔn dÞch ®èi víi sù x©m nhËp cña c¸c t¸c nh©n ngo¹i lai lµ mét
qu¸ tr×nh phøc t¹p. Tr−íc tiªn, chóng ta sÏ tãm l−îc vÒ c¸c thµnh phÇn tham gia trùc
tiÕp vµo c¸c ®¸p øng miÔn dÞch, tr−íc khi ®Ò cËp tíi c¸c qu¸ tr×nh cña ®¸p øng miÔn dÞch
vµ sù ®iÒu hßa c¸c gen cña hÖ miÔn dÞch.

9.2. C¸c thµnh phÇn tham gia ®¸p øng miÔn dÞch ë ®éng vËt cã vó
§Æc ®iÓm næi bËt cña ®¸p øng miÔn dÞch lµ tÝnh ®Æc hiÖu. TÝnh ®Æc hiÖu nµy ®−îc
quy ®Þnh bëi ba thµnh phÇn cña hÖ miÔn dÞch. §ã lµ: (1) mét nhãm c¸c tÕ bµo biÖt hãa,
trong ®ã mçi lo¹i tÕ bµo cã chøc n¨ng riªng nh−ng ho¹t ®éng theo mét c¬ chÕ ®iÒu phèi
chung, (2) hai nhãm protein chøc n¨ng lµ c¸c kh¸ng thÓ vµ c¸c thô thÓ tÕ bµo T, mçi
lo¹i cã thÓ nhËn biÕt ®Æc hiÖu nh−ng kh«ng giíi h¹n c¸c lo¹i hîp chÊt l¹ kh¸c nhau, vµ
(3) mét tËp hîp c¸c protein biÖt hãa ®−îc gäi lµ c¸c kh¸ng nguyªn t−¬ng hîp m«
(MHC), ®©y lµ c¸c protein cã vai trß liªn l¹c gi÷a c¸c tÕ bµo vµ gióp hÖ miÔn dÞch nhËn ra
c¸c hîp chÊt l¹ vµ ph©n biÖt c¸c tÕ bµo cña b¶n th©n víi c¸c tÕ bµo ngo¹i lai. B¶ng 9.1
liÖt kª c¸c nhãm protein vµ tÕ bµo quan träng nhÊt cña hÖ miÔn dÞch cïng víi c¸c chøc
n¨ng c¬ b¶n cña chóng. HÖ miÔn dÞch cña mét ng−êi tr−ëng thµnh trung b×nh chøa
kho¶ng 1012 tÕ bµo b¹ch cÇu vµ kho¶ng 1015 hoÆc nhiÒu h¬n c¸c protein ®Æc thï; tÊt c¶

267
§inh §oµn Long

®Òu ®−îc ®iÒu phèi ho¹t ®éng chung vµ thèng nhÊt víi nhau ®Ó cã thÓ lo¹i bá c¸c t¸c
nh©n l©y nhiÔm khái c¬ thÓ.
Ch¼ng h¹n, khi mét t¸c nh©n l¹ (vÝ dô: virut hay vi khuÈn) x©m nhËp vµo c¬ thÓ
ng−êi, c¸c tÕ bµo cña hÖ miÔn dÞch cã thÓ nhËn biÕt ra nã vµ thóc ®Èy c¬ thÓ s¶n sinh c¸c
kh¸ng thÓ vµ protein thô thÓ tÕ bµo T liªn kÕt ®Æc hiÖu ®Ó “b¾t gi÷” t¸c nh©n l¹ l©y
nhiÔm. Hîp chÊt l¹ (thuéc t¸c nh©n l©y nhiÔm) ®−îc mçi lo¹i kh¸ng thÓ hoÆc thô thÓ tÕ
bµo T liªn kÕt ®Æc hiÖu ®−îc gäi lµ kh¸ng nguyªn (antigen). C¸c kh¸ng nguyªn cã thÓ
khëi ®Çu mét ®¸p øng miÔn dÞch ®−îc gäi lµ c¸c chÊt sinh miÔn dÞch (immunogen).
Nh×n chung, hÇu hÕt c¸c cao ph©n tö sinh häc, nh− c¸c chuçi polypeptide, c¸c ph©n tö
polysaccharide, axit nucleic vµ c¸c hîp chÊt tæng hîp kh¸c cã nguån gèc ngo¹i lai ®Òu cã
thÓ ho¹t ®éng nh− c¸c kh¸ng nguyªn vµ phÇn lín lµ c¸c chÊt sinh miÔn dÞch sau khi x©m
nhËp vµo c¬ thÓ vËt chñ.
§¸p øng miÔn dÞch ë ®éng vËt cã vó gåm hai thµnh phÇn chÝnh: (1) ®¸p øng miÔn
dÞch ®−îc ®iÒu khiÓn bëi kh¸ng thÓ hay cßn gäi lµ ®¸p øng miÔn dÞch thÓ dÞch, vµ (2)
®¸p øng ®−îc ®iÒu khiÓn bëi tÕ bµo lympho T hay cßn gäi lµ ®¸p øng miÔn dÞch tÕ bµo.
§¸p øng miÔn dÞch thÓ dÞch liªn quan ®Õn sù s¶n xuÊt vµ tiÕt ra c¸c kh¸ng thÓ tr−íc khi

B¶ng 9.1. C¸c thµnh phÇn cña hÖ thèng miÔn dÞch ë ®éng vËt cã vó
Tªn thµnh phÇn Chøc n¨ng c¬ b¶n
I. C¸c lo¹i protein
Kh¸ng nguyªn lµ c¸c chÊt kÝch ho¹t ®¸p øng miÔn dÞch, cßn ®−îc gäi lµ c¸c chÊt ho¹t hãa s¶n sinh
kh¸ng thÓ.
Kh¸ng thÓ lµ c¸c protein ®−îc hÖ miÔn dÞch s¶n sinh cã thÓ nhËn biÕt vµ liªn kÕt ®Æc hiÖu víi c¸c
kh¸ng nguyªn, qua ®ã thóc ®Èy hÖ miÔn dÞch ph©n gi¶i c¸c kh¸ng nguyªn.
Thô thÓ tÕ bµo T lµ c¸c protein ®−îc hÖ miÔn dÞch s¶n sinh nh»m ®¸p øng l¹i c¸c kh¸ng nguyªn; sau khi
®−îc tæng hîp, protein nµy g¾n lªn bÒ mÆt tÕ bµo ®éc T vµ cã thÓ liªn kÕt ®Æc hiÖu víi
c¸c kh¸ng nguyªn víi sù "trî gióp" cña c¸c kh¸ng nguyªn phøc hÖ t−¬ng hîp m« (MHC)
Kh¸ng nguyªn phøc lµ c¸c protein bÒ mÆt tÕ bµo cã hai chøc n¨ng: (1) gióp c¸c tÕ bµo cña hÖ miÔn dÞch ph©n
hÖ t−¬ng hîp m« biÖt ®−îc c¸c hîp chÊt l¹ (ngo¹i lai) víi c¸c chÊt cña b¶n th©n chóng, vµ (2) thóc ®Èy sù
(MHC) truyÒn tin (tÝn hiÖu) gi÷a c¸c tÕ bµo.
II. C¸c lo¹i tÕ bµo
TÕ bµo gèc lµ c¸c tÕ bµo tñy x−¬ng ch−a biÖt hãa; tõ ®ã, s¶n sinh ra c¸c lo¹i tÕ bµo chuyªn hãa kh¸c
nhau cña hÖ miÔn dÞch (bao gåm tÊt c¶ c¸c tÕ bµo nªu d−íi ®©y).
ThÓ thùc bµo lµ c¸c tÕ bµo kÝch th−íc lín cã kh¶ n¨ng b¾t gi÷, “tiªu hãa” vµ ph©n hñy c¸c t¸c nh©n l¹
x©m nhËp vµo tÕ bµo, bao gåm c¸c lo¹i virus, vi khuÈn vµ nÊm.
§¹i thùc bµo lµ mét nhãm thÓ thùc bµo cã thÓ “tiªu hãa” c¸c kh¸ng nguyªn vµ “béc lé” c¸c kh¸ng
nguyªn (hoÆc mét phÇn cña chóng) lªn bÒ mÆt tÕ bµo; t¹i ®ã, chóng cã thÓ t−¬ng t¸c víi
c¸c tÕ bµo kh¸c cña hÖ miÔn dÞch.
TÕ bµo lympho B lµ c¸c tÕ bµo sau khi biÖt hãa (trong tñy x−¬ng cña ®éng vËt cã vó) sÏ trë thµnh c¸c tÕ
bµo huyÕt t−¬ng (t−¬ng bµo) s¶n sinh kh¸ng thÓ vµ c¸c tÕ bµo nhí B.
T−¬ng bµo lµ c¸c tÕ bµo b¹ch cÇu sinh kh¸ng thÓ cã nguån gèc tõ c¸c tÕ bµo lympho B.
TÕ bµo nhí B lµ nhãm tÕ bµo B cã thÓ s¶n xuÊt nhanh mét lo¹i kh¸ng thÓ nhÊt ®Þnh khi c¬ thÓ bÞ l©y
nhiÔm víi mét kh¸ng nguyªn ®· biÕt (®¸p øng miÔn dÞch thø cÊp).
TÕ bµo lympho T lµ c¸c tÕ bµo ®−îc biÖt hãa trong tuyÕn øc, råi sau ®ã tiÕp tôc biÖt hãa thµnh c¸c lo¹i tÕ
bµo T kh¸c nhau (gåm 4 lo¹i tÕ bµo T nªu d−íi ®©y).
Trî bµo T lµ nhãm tÕ bµo T sau khi nhËn biÕt c¸c kh¸ng nguyªn ®−îc “béc lé” bëi ®¹i thùc bµo sÏ
thóc ®Èy tÕ bµo lympho B s¶n sinh kh¸ng thÓ, ®ång thêi thóc ®Èy tÕ bµo lympho T s¶n
sinh thô thÓ tÕ bµo T.
TÕ bµo øc chÕ T lµ nhãm tÕ bµo T cã vai trß øc chÕ tÕ bµo B s¶n sinh kh¸ng thÓ vµ øc chÕ tÕ bµo T s¶n
sinh thô thÓ tÕ bµo T sau khi ®¸p øng miÔn dÞch kÕt thóc.
TÕ bµo ®éc T lµ nhãm tÕ bµo T mang c¸c thô thÓ tÕ bµo T cã nhiÖm vô "tiªu diÖt" c¸c tÕ bµo mang c¸c
kh¸ng nguyªn ®−îc nhËn diÖn (tªn gäi kh¸c lµ tÕ bµo giÕt T).
TÕ bµo nhí T lµ nhãm tÕ bµo T cã thÓ s¶n xuÊt nhanh mét lo¹i thô thÓ cña tÕ bµo T nhÊt ®Þnh trong ®¸p
øng miÔn dÞch thø cÊp.

268
Ch−¬ng 9. §iÒu hoµ gen hÖ miÔn dÞch ë ®éng vËt cã x−¬ng sèng

chóng ®−îc chuyÓn vµo hÖ tuÇn hoµn n¬i mµ chóng liªn kÕt vµ “c« lËp” (b¾t gi÷) c¸c
kh¸ng nguyªn. Phøc hÖ “kh¸ng nguyªn - kh¸ng thÓ” sau ®ã ®−îc “tiªu hãa” (ph©n hñy)
bëi mét nhãm tÕ bµo b¹ch cÇu ®Æc biÖt. HÖ thèng ®¸p øng miÔn dÞch thÓ dÞch gi÷ vai trß
b¶o vÖ s¬ cÊp (vßng ngoµi) c¬ thÓ sinh vËt khái sù x©m nhËp cña c¸c tÕ bµo l¹ (nh− vi
khuÈn vµ nÊm) hoÆc c¸c virut tr−íc khi chóng cã thÓ x©m nhËp s©u h¬n vµo bªn trong
c¸c tÕ bµo cña c¬ thÓ vËt chñ. §¸p øng miÔn dÞch tÕ bµo liªn quan ®Õn viÖc s¶n xuÊt c¸c
thô thÓ tÕ bµo T bao bäc bÒ mÆt cña c¸c tÕ bµo lympho T; ë ®ã nh÷ng tÕ bµo b¹ch cÇu ®Æc
biÖt nµy cã thÓ nhËn biÕt vµ tiªu diÖt c¸c tÕ bµo l¹ l©y nhiÔm. B»ng c¬ chÕ ®ã, hÖ thèng
®¸p øng miÔn dÞch tÕ bµo cã vai trß b¶o vÖ c¬ thÓ ®éng vËt khái sù l©y nhiÔm cña virut.
Trong phÇn tiÕp theo, chóng ta sÏ ®Ò cËp ®Õn c¸c lo¹i tÕ bµo vµ c¸c ®¹i ph©n tö tham gia
vµo c¸c qu¸ tr×nh ®¸p øng miÔn dÞch.

9.2.1. C¸c tÕ bµo chuyªn hãa ®iÒu hßa ®¸p øng miÔn dÞch
§¸p øng miÔn dÞch ®èi víi mét hîp chÊt l¹ phô thuéc vµo hµng lo¹t c¸c ho¹t ®éng
®−îc ®iÒu phèi chung gi÷a c¸c tÕ bµo biÖt hãa cña hÖ miÔn dÞch. TÊt c¶ nh÷ng tÕ bµo biÖt
hãa nh− vËy ®Òu cã nguån gèc tõ mét nhãm tÕ bµo tiÒn th©n gäi lµ tÕ bµo gèc ë tñy
x−¬ng (h×nh 9.1).
Mét phÇn chÝnh cña ®¸p øng miÔn dÞch ®−îc thùc hiÖn bëi c¸c tÕ bµo lympho B,
cßn ®−îc gäi t¾t lµ c¸c tÕ bµo B (së dÜ gäi lµ tÕ bµo B v× ë chim c¸c tÕ bµo nµy ®−îc biÖt
hãa trong c¸c tói Bursa lµ c¬ quan t−¬ng ®ång víi tñy x−¬ng ë ®éng vËt cã vó). PhÇn

Tñy x−¬ng

TÕ bµo gèc t¹o m¸u

Tñy x−¬ng

TÕ bµo gèc lympho TÕ bµo gèc tñy Nguyªn


TÕ bµo nh©n hång cÇu
khæng lå

M¸u
C¸c tÕ bµo b¹ch cÇu ®a d¹ng nh©n

TÕ bµo B TÕ bµo T −a kiÒm trung tÝnh ®¬n nh©n TiÓu cÇu Hång cÇu

TÕ bµo g©y hiÖu øng C¸c M«

TÕ bµo T
T−¬ng bµo ho¹t hãa TÕ bµo mast §¹i thùc bµo

H×nh 9.1. Nguån gèc c¸c tÕ bµo chÝnh cña hÖ miÔn dÞch ë ®éng vËt cã vó. PhÇn lín c¸c tÕ bµo thuéc hÖ
miÔn dÞch cã nguån gèc tõ tÕ bµo gèc ë tñy x−¬ng. Trong ®ã, cã 3 con ®−êng biÖt hãa: (1) h×nh thµnh tÕ bµo B
tiÒn th©n; c¸c tÕ bµo B tiÒn th©n di tró tíi tôy vµ c¸c h¹ch lympho, ë ®ã chóng tiÕp tôc biÖt hãa thµnh t−¬ng bµo,
s¶n sinh kh¸ng thÓ vµ tÕ bµo nhí B, (2) h×nh thµnh c¸c thÓ thùc bµo bao gåm c¸c ®¹i thùc bµo, vµ (3) h×nh
thµnh tÕ bµo T tiÒn th©n; c¸c tÕ bµo T tiÒn th©n di tró tíi tuyÕn øc (thymus), ë ®ã chóng tiÕp tôc biÖt hãa thµnh 4
lo¹i tÕ bµo T kh¸c lµ tÕ bµo ®éc T, trî bµo T, tÕ bµo øc chÕ T vµ tÕ bµo nhí T (b−íc cuèi kh«ng vÏ trªn h×nh).

269
§inh §oµn Long

chÝnh cßn l¹i cña ®¸p øng miÔn dÞch ®−îc thùc hiÖn bëi c¸c tÕ bµo lympho T, cßn ®−îc
gäi lµ c¸c tÕ bµo T (së dÜ gäi lµ c¸c tÕ bµo T v× c¸c thÕ bµo nµy ®−îc biÖt hãa trong tuyÕn
øc, tiÕng Anh lµ Thymus). Ngoµi ra, c¸c tÕ bµo B vµ T cßn ®−îc gäi chung lµ c¸c tÕ bµo
lympho (tõ nµy gèc Latin cã nghÜa lµ kh«ng mµu, ph¶n ¸nh ®Æc ®iÓm cña c¸c tÕ bµo b¹ch
cÇu). Mét nhãm tÕ bµo kh¸c cña hÖ miÔn dÞch lµ thÓ thùc bµo (phagocyte). Trong c¸c
thÓ thùc bµo, cã mét nhãm tÕ bµo kÝch th−íc lín gäi lµ ®¹i thùc bµo (macrophage) gi÷
vai trß quyÕt ®Þnh c¸c ho¹t ®éng khëi ®Çu ®¸p øng miÔn dÞch cña c¶ hai phÇn nªu trªn.
Sau khi nhËn ®−îc tÝn hiÖu khëi ®Çu ®¸p øng miÔn dÞch, c¸c tÕ bµo B biÖt hãa
thµnh c¸c t−¬ng bµo (®©y lµ c¸c tÕ bµo s¶n sinh kh¸ng thÓ cã nhiÖm vô “b¾t gi÷” kh¸ng
nguyªn), vµ mét lo¹i tÕ bµo thø hai ®−îc gäi lµ c¸c tÕ bµo nhí B (tÕ bµo nµy thóc ®Èy
sù s¶n sinh nhanh c¸c kh¸ng thÓ khi hÖ miÔn dÞch gÆp l¹i cïng lo¹i kh¸ng nguyªn trong
c¸c lÇn l©y nhiÔm vÒ sau). Trong khi ®ã, c¸c tÕ bµo T biÖt hãa thµnh bèn lo¹i tÕ bµo T
quan träng, bao gåm:
- TÕ bµo ®éc T: lµ nhãm tÕ bµo mµ bÒ mÆt cña chóng mang c¸c protein liªn kÕt
kh¸ng nguyªn ®−îc gäi lµ thô thÓ tÕ bµo T. Nh÷ng tÕ bµo nµy cã vai trß “tiªu
diÖt” c¸c tÕ bµo mang c¸c kh¸ng nguyªn t−¬ng øng, v× vËy ®−îc gäi lµ c¸c tÕ bµo
®éc T hay tÕ bµo giÕt T.
- Trî bµo T: lµ nhãm tÕ bµo thóc ®Èy c¸c tÕ bµo lympho B vµ T biÖt hãa thµnh c¸c
t−¬ng bµo vµ c¸c tÕ bµo ®éc T sau khi nhËn ®−îc c¸c tÝn hiÖu cña ®¸p øng miÔn
dÞch.
- TÕ bµo øc chÕ T: lµ nhãm tÕ bµo cã vai trß ®iÒu hßa ©m tÝnh sù ho¹t ®éng cña
c¸c tÕ bµo huyÕt t−¬ng vµ c¸c tÕ bµo ®éc T; nghÜa lµ øc chÕ sù tæng hîp c¸c kh¸ng
nguyªn vµ c¸c thô thÓ tÕ bµo T.
- TÕ bµo nhí T: lµ nhãm tÕ bµo cã vai trß “ghi nhí” kh¸ng nguyªn vµ thóc ®Èy sù
s¶n sinh nhanh c¸c tÕ bµo ®éc T khi hÖ miÔn dÞch gÆp l¹i cïng lo¹i kh¸ng
nguyªn sau nµy.
Mét sè bÖnh liªn quan ®Õn hÖ miÔn dÞch g©y ra bëi c¬ chÕ di truyÒn. Trong c¸c bÖnh
nh− vËy, cã lÏ bÖnh nghiªm träng nhÊt lµ bÖnh suy gi¶m miÔn dÞch kÕt hîp nghiªm
träng - SCID. Cßn bÖnh liªn quan ®Õn hÖ miÔn dÞch nguy hiÓm nhÊt g©y ra bëi t¸c nh©n
l©y nhiÔm lµ héi chøng suy gi¶m miÔn dÞch m¾c ph¶i - AIDS (do sù l©y nhiÔm cña
HIV). C¸c bÖnh nh©n m¾c héi chøng SCID mÊt kh¶ n¨ng thùc hiÖn c¸c ®¸p øng miÔn
dÞch theo c¶ hai c¬ chÕ miÔn dÞch thÓ dÞch vµ miÔn dÞch tÕ bµo. Trong thùc tÕ, cã nhiÒu
d¹ng bÖnh SCID kh¸c nhau; trong ®ã, kho¶ng mét nöa sè bÖnh nh− vËy lµ do c¸c ®ét
biÕn lÆn liªn kÕt NST X cßn mét nöa lµ do c¸c ®ét biÕn lÆn liªn kÕt NST th−êng.

9.2.2. C¸c protein chuyªn hãa t¹o nªn sù ®Æc hiÖu cña ®¸p øng miÔn dÞch
Sù ®Æc hiÖu cña mçi ®¸p øng miÔn dÞch ®−îc quyÕt ®Þnh bëi hai nhãm protein, ®ã lµ
c¸c kh¸ng thÓ vµ c¸c thô thÓ tÕ bµo T. C¸c protein nµy ®iÒu hßa hai phÇn chÝnh cña ®¸p
øng miÔn dÞch, gåm (1) ®¸p øng miÔn dÞch ®−îc ®iÒu hßa bëi kh¸ng thÓ gäi lµ ®¸p øng
miÔn dÞch thÓ dÞch, vµ (2) ®¸p øng miÔn dÞch ®−îc ®iÒu hßa bëi tÕ bµo T (qua thô thÓ tÕ
bµo T) gäi lµ ®¸p øng miÔn dÞch tÕ bµo. MÆc dï c¶ hai nhãm protein nµy ®Òu cã ®Æc tÝnh
"b¾t gi÷" kh¸ng nguyªn ®Æc hiÖu, nghÜa lµ mçi lo¹i kh¸ng thÓ vµ thô thÓ tÕ bµo T hÇu
nh− chØ liªn kÕt víi mét lo¹i kh¸ng nguyªn duy nhÊt; nh−ng, tËp hîp c¸c kh¸ng thÓ vµ
thô thÓ tÕ bµo T kh¸c nhau l¹i cã sù ®a d¹ng vÒ kh¶ n¨ng liªn kÕt c¸c kh¸ng nguyªn
d−êng nh− kh«ng cã giíi h¹n. C¬ chÕ di truyÒn t¹o nªn sù ®a d¹ng vÒ cÊu tróc cña c¸c
kh¸ng thÓ vµ thô thÓ tÕ bµo T chÝnh lµ c¬ chÕ t¹o nªn kh¶ n¨ng liªn kÕt kh¸ng nguyªn ®a
d¹ng.

270
Ch−¬ng 9. §iÒu hoµ gen hÖ miÔn dÞch ë ®éng vËt cã x−¬ng sèng

C¸c kh¸ng thÓ thuéc mét nhãm protein chøc n¨ng ®−îc gäi chung lµ
immunoglobulin. Mçi kh¸ng thÓ ®iÓn h×nh lµ mét ph©n tö protein gåm bèn chuçi
polypeptide, chia lµm hai cÆp gièng hÖt nhau, gäi lµ cÆp chuçi nÆng vµ cÆp chuçi nhÑ.
C¸c chuçi nÆng vµ nhÑ g¾n kÕt víi nhau qua c¸c liªn kÕt disulfide (-S-S-). C¸c chuçi nhÑ
gåm kho¶ng 220 axit amin, cßn c¸c chuçi nÆng gåm kho¶ng 440 - 450 axit amin. C¶ hai
lo¹i chuçi nÆng vµ nhÑ ®Òu cã vïng ®Çu N mang tr×nh tù rÊt biÕn ®æi dµi kho¶ng 110 axit
amin (chÝnh tr×nh tù vïng ®Çu N nµy qui ®Þnh tÝnh ®Æc hiÖu cña mçi lo¹i kh¸ng thÓ víi
mét kh¸ng nguyªn nhÊt ®Þnh) vµ vïng ®Çu C cã tr×nh tù æn ®Þnh (tr×nh tù ®Çu C nµy qui
®Þnh líp Ig cña immunoglobulin).
Mçi kh¸ng thÓ cã c¸c miÒn (domain) chøc n¨ng kh¸c nhau (h×nh 9.2). Cô thÓ, vÒ
phÝa ®Çu N, c¸c kh¸ng thÓ ®Òu cã hai miÒn liªn kÕt kh¸ng nguyªn. Mçi miÒn nµy ®−îc
t¹o ra tõ vïng biÕn ®æi cña mét cÆp chuçi nÆng vµ nhÑ. Hai vïng biÕn ®æi nh− vËy t¹o
nªn hai vÞ trÝ liªn kÕt kh¸ng nguyªn theo kiÓu "ch×a khãa tra vµo æ khãa". Trong khi ®ã,
vÒ phÝa ®Çu C, vïng æn ®Þnh cña hai chuçi nÆng liªn kÕt víi nhau h×nh thµnh nªn miÒn
ho¹t hãa cã vai trß lµ "cÇu nèi" t−¬ng t¸c gi÷a kh¸ng thÓ víi c¸c thµnh phÇn kh¸c cña hÖ
miÔn dÞch.
Chuçi nhÑ cña c¸c kh¸ng thÓ gåm hai nhãm kh¸c biÖt nhau ë vïng æn ®Þnh, ®−îc
gäi lµ c¸c chuçi kappa vµ lambda. D−íi ®©y, chóng ta sÏ thÊy tÝnh ®Æc hiÖu liªn kÕt
kh¸ng nguyªn cña kh¸ng thÓ do vïng biÕn ®æi cña c¶ bèn chuçi quy ®Þnh, cßn chøc n¨ng
ho¹t ®éng miÔn dÞch kh¸c nhau (ph©n chia thµnh 5 líp kh¸ng thÓ) lµ do sù kh¸c biÖt vÒ
cÊu tróc vïng æn ®Þnh cña hai chuçi nÆng quy ®Þnh (b¶ng 9.2).
Cã 5 líp kh¸ng thÓ kh¸c nhau, gåm IgA, IgD, IgE, IgG vµ IgM. C¸c líp kh¸ng thÓ
nµy kh¸c nhau vÒ chøc n¨ng miÔn dÞch. Sù kh¸c biÖt nµy lµ do vïng æn ®Þnh cña chuçi
nÆng quy ®Þnh. C¸c kh¸ng thÓ IgA, IgD, IgE, IgG vµ IgM lÇn l−ît mang c¸c chuçi nÆng lµ
α, δ, ε, γ vµ µ (h×nh 9.2). ë ng−êi, cã hai líp phô kh¸ng thÓ IgA vµ bèn líp phô kh¸ng thÓ
IgG. C¸c líp phô nµy kh¸c nhau chót Ýt vÒ cÊu tróc chuçi nÆng. Líp kh¸ng thÓ ®Çu tiªn
lu«n ®−îc tÕ bµo B t¹o ra lµ IgM. C¸c kh¸ng thÓ IgM ®Çu tiªn g¾n kÕt trªn bÒ mÆt tÕ bµo
cïng víi c¸c thô thÓ kh¸ng nguyªn bÒ mÆt. Khi ®¸p øng miÔn dÞch s¬ cÊp x¶y ra, tÕ bµo
B s¶n sinh vµ tiÕt ra ngoµi bÒ mÆt tÕ bµo kh¸ng thÓ IgM (cßn gäi lµ kh¸ng thÓ IgM
tiÕt). IgM lµ mét phøc hÖ kh¸ng thÓ gåm 5 tiÓu phÇn (phøc n¨m) víi 10 vÞ trÝ liªn kÕt
kh¸ng nguyªn. Sau ®¸p øng miÔn dÞch ®Çu tiªn (s¶n sinh kh¸ng thÓ IgM), c¸c tÕ bµo B cã
thÓ chuyÓn sang s¶n xuÊt c¸c líp kh¸ng thÓ kh¸c, gäi lµ sù chuyÓn ®æi líp kh¸ng thÓ.

B¶ng 9.2. C¸c líp kh¸ng thÓ (immunoglobulin)


Lo¹i Chuçi nÆng CÊu tróca TØ lÖ N¬i ho¹t ®éng Vai trß vµ chøc n¨ng
IgA α α2L2 14% C¸c dÞch tiÕt (nh− s÷a, Gióp c¬ thÓ tr¸nh khái vi sinh vËt t¹i nh÷ng vïng vi
n−íc bät, n−íc m¾t) sinh vËt dÔ x©m nhËp
IgD δ δ2L2 1% M¸u; c¸c lo¹i tÕ bµo B Ch−a biÕt ch¾c ch¾n; cã thÓ cã vai trß thóc ®Èy c¸c tÕ
bµo B s¶n sinh ra c¸c líp kh¸ng thÓ kh¸c nhau
IgE ε ε2 L 2 < 1% ë c¸c m«; c¸c tÕ bµo Lµ thô thÓ cña c¸c kh¸ng nguyªn, thóc ®Èy c¸c tÕ bµo
mastb mast tiÕt ra histamine
IgG γ γ2 L 2 80% M¸u; C¸c ®¹i thùc bµo; Ho¹t hãa c¸c bæ thÓ trong ®¸p øng miÔn dÞch thø cÊpc
c¸c t−¬ng bµo
IgM µ µ2L2 5% M¸u; c¸c lo¹i tÕ bµo B Ho¹t hãa c¸c bæ thÓ trong ®¸p øng miÔn dÞch s¬ cÊpc
a b
L lµ chuçi nhÑ, thuéc mét trong hai lo¹i kappa hoÆc lambda. C¸c tÕ bµo mast ph©n bè ë nhiÒu m« kh¸c nhau, tiÕt ra histamine
trong ®¸p øng miÔn dÞch kh«ng ®Æc hiÖu sau khi tÕ bµo bÞ l©y nhiÔm. c Bæ thÓ gåm kho¶ng 20 lo¹i protein hßa tan trong m¸u,
kÕt hîp víi nhau ®Ó h×nh thµnh nªn mét phøc hÖ protein lín mçi khi xuÊt hiÖn phøc hÖ “kh¸ng nguyªn/kh¸ng thÓ”. Phøc hÖ
protein bæ thÓ cã thÓ “tiªu diÖt” c¸c tÕ bµo theo mét sè c¸ch, ch¼ng h¹n nh− “®ôc lç” trªn mµng tÕ bµo. C¸c protein nµy ®−îc gäi
lµ “bæ thÓ” v× chóng bæ sung cho ho¹t ®éng cña kh¸ng thÓ nh»m chèng l¹i sù l©y nhiÔm cña c¸c tÕ bµo l¹.

271
§inh §oµn Long

a) C¸c phÇn cÊu tróc cña kh¸ng nguyªn c) CÊu tróc cña c¸c líp kh¸ng nguyªn (immunoglobulin)
C¸c vÞ trÝ liªn kÕt kh¸ng nguyªn VH VH VH
VL VL VL Cε1
Vïng biÕn ®æi Cγ1 Cδ1
CL CL CL
®Çu N

Cγ2 Cδ2 Cε2


Cγ3 IgG Cδ3 IgD IgE
Cε3
VL VH
VH
Chuçi nhÑ VL CL Cµ1
Cα1 Cµ3
CL Cµ2
Cµ4
Chuçi nÆng Vïng nèi
Cα2
Vïng æn
Cα3
®Þnh ®Çu C Chuçi J
Chuçi J

b) CÇu liªn kÕt disulfide gi÷a c¸c chuçi nÆng vµ nhÑ


VÞ trÝ liªn kÕt
kh¸ng nguyªn IgA (phøc ®«i) IgM (phøc n¨m)
Chuçi nÆng

Kh¸ng VH
nguyªn H×nh 9.2. CÊu tróc cña mçi kh¸ng thÓ vµ c¸c líp kh¸ng thÓ.
Chuçi H×nh (a) minh häa c¸c phÇn cÊu tróc cña kh¸ng thÓ ®iÓn h×nh.
nhÑ H×nh (b) m« t¶ cÇu liªn kÕt disulfide (-S-S-) gi÷a c¸c phÇn cña
chuçi nÆng vµ chuçi nhÑ trong ph©n tö kh¸ng thÓ; VH chØ vïng
VL biÕn ®æi cña chuçi nÆng, VL chØ vïng biÕn ®æi cña chuçi nhÑ.
H×nh (c) m« t¶ cÊu tróc vµ thµnh phÇn cña c¸c líp kh¸ng thÓ,
C¸c cÇu liªn
gåm IgA, IgD, IgE, IgM vµ IgG. L−u ý: IgA gåm hai ph©n tö
kÕt disulfide
kh¸ng thÓ liªn kÕt víi nhau (phøc ®«i), v× vËy cã 4 vÞ trÝ liªn kÕt
5 nm kh¸ng nguyªn; trong khÝ ®ã, IgM cã 5 ph©n tö kh¸ng thÓ liªn kÕt
víi nhau (phøc n¨m) nªn cã 10 vÞ trÝ liªn kÕt kh¸ng nguyªn, c¸c
líp kh¸ng thÓ kh¸c chØ cã 2 vÞ trÝ liªn kÕt kh¸ng nguyªn.
Chuçi α
Trong m¸u, c¸c kh¸ng thÓ IgG chiÕm phÇn chñ yÕu
(80%). Khi c¬ thÓ l©y nhiÔm lÆp l¹i víi cïng lo¹i kh¸ng Vïng biÕn
nguyªn, chóng ®−îc t¹o ra víi mét l−îng lín. Lóc nµy, ®¸p ®æi ®Çu N
øng miÔn dÞch ®−îc gäi lµ ®¸p øng miÔn dÞch thø cÊp. IgA
lµ líp kh¸ng thÓ phæ biÕn nhÊt trong c¸c dÞch tiÕt (n−íc Chuçi β
Vïng æn
bät, n−íc m¾t, s÷a mÑ); trong khi ®ã, IgE biÓu hiÖn chøc ®Þnh ®Çu C
n¨ng liªn kÕt kh¸ng nguyªn gièng nh− thô thÓ mµng tÕ BÒ mÆt tÕ bµo T
bµo ë c¸c tÕ bµo mast thuéc mét sè m«. Khi c¸c kh¸ng
nguyªn ®−îc c¸c IgE b¾t gi÷, c¸c tÕ bµo mast tiÕt ra
histamine vµ mét sè dÉn xuÊt amin kh¸c ®−îc coi lµ
nguyªn nh©n chÝnh g©y ra c¸c ph¶n øng dÞ øng th−êng
gÆp ë bÖnh hen suyÔn hay bÖnh sèt mïa hÌ.
Bªn trong tÕ bµo T
Khi so s¸nh cÊu tróc, tÊt c¶ c¸c kh¸ng thÓ ®Òu cã H×nh 9.3. CÊu tróc mét thô thÓ tÕ
tr×nh tù axit amin ®Æc thï vµ chóng lu«n kh¸c nhau ë bµo T liªn kÕt xuyªn mµng tÕ bµo.
vïng biÕn ®æi. NÕu nh− mçi chuçi polypeptide cña kh¸ng
thÓ ®Òu ®−îc m· hãa bëi c¸c gen riªng lÎ, th× sè l−îng gen m· hãa c¸c kh¸ng thÓ cña hÖ
miÔn dÞch sÏ rÊt lín. Nh−ng thùc tÕ kh«ng ®óng nh− vËy. C¸c gen m· hãa kh¸ng thÓ
®−îc tæ chøc theo mét c¸ch ®Æc biÖt. Cô thÓ, côm c¸c locut gen m· hãa kh¸ng thÓ ®−îc
“l÷u gi÷” trong nh©n tÕ bµo gèc ®−îc ph©n thµnh c¸c “ph©n ®o¹n gen”; c¸c ph©n ®o¹n gen
nµy chØ ®−îc c¾t ra vµ tæ hîp l¹i víi nhau khi biÖt hãa thµnh c¸c t−¬ng bµo s¶n sinh

272
Ch−¬ng 9. §iÒu hoµ gen hÖ miÔn dÞch ë ®éng vËt cã x−¬ng sèng

kh¸ng thÓ. Chóng ta sÏ ®Ò cËp ®Õn c¸c b−íc cña qu¸ tr×nh nµy trong phÇn sau cña
ch−¬ng nµy.
§Ó chèng l¹i sù l©y nhiÔm cña c¸c t¸c nh©n g©y bÖnh, ®¸p øng miÔn dÞch tÕ bµo
còng cã tÝnh ®Æc hiÖu kh¸ng nguyªn cao vµ cã vai trß quan träng t−¬ng ®−¬ng nh− ®¸p
øng miÔn dÞch thÓ dÞch. Trong ®¸p øng miÔn dÞch tÕ bµo, c¸c thô thÓ tÕ bµo T quyÕt
®Þnh tÝnh ®Æc hiÖu kh¸ng nguyªn. Mçi thô thÓ cña tÕ bµo T lµ mét ph©n tö protein kÐp
gåm mét chuçi α vµ mét chuçi β (h×nh 9.3). C¶ hai chuçi polypeptide nµy ®Òu cã tr×nh tù
axit amin vïng ®Çu N biÕn ®æi, cßn vïng ®Çu C æn ®Þnh. Nh− vËy, thô thÓ tÕ bµo T còng
cã ®Æc ®iÓm cÊu tróc gièng kh¸ng thÓ. Nh−ng, ®iÓm kh¸c biÖt lµ mçi thô thÓ tÕ bµo T chØ
cã mét vÞ trÝ liªn kÕt kh¸ng nguyªn, trong khi mçi kh¸ng thÓ (trõ líp IgA vµ IgM) cã hai
vÞ trÝ. Nh− tªn gäi, thô thÓ tÕ bµo T g¾n trªn mµng tÕ bµo T nhê vïng æn ®Þnh. Chóng cã
mÆt ë c¶ hai lo¹i tÕ bµo T lµ tÕ bµo ®éc T vµ trî bµo T. ë ®©y, khi kÕt hîp víi c¸c kh¸ng
nguyªn t−¬ng hîp m« (MHC), c¸c tÕ bµo T "b¾t gi÷" kh¸ng nguyªn vµ tham gia vµo c¸c
ho¹t ®éng miÔn dÞch.

9.2.3. C¸c kh¸ng nguyªn t−¬ng hîp m« (MHC)


ViÖc ghÐp m« vµ c¬ quan gi÷a nh÷ng c¸ thÓ kh«ng cïng huyÕt thèng th−êng dÉn
®Õn hiÖn t−îng th¶i lo¹i do miÔn dÞch. Ng−îc l¹i, viÖc ghÐp m« vµ c¬ quan gi÷a c¸c cÆp
song sinh th−êng thµnh c«ng. B»ng c¬ chÕ t−¬ng tù, viÖc ghÐp da tõ vïng nµy sang vïng
kh¸c cña cïng c¬ thÓ còng th−êng kh«ng dÉn ®Õn hiÖn t−îng th¶i lo¹i. Nh÷ng vÝ dô nµy
cho thÊy hÖ miÔn dÞch cña mét c¬ thÓ cã thÓ ph©n biÖt ®−îc tÕ bµo cña nã víi tÕ bµo cña
c¬ thÓ kh¸c (hay nãi chÝnh x¸c h¬n lµ cña c¸c hÖ gen kh¸c). C¸c nghiªn cøu ë møc ph©n
tö cho thÊy viÖc nhËn ra c¸c tÕ bµo l¹ do ho¹t ®éng cña mét phøc hÖ gåm c¸c ®¹i ph©n tö
n»m trªn bÒ mÆt tÕ bµo gäi lµ phøc hÖ t−¬ng hîp m« - MHC (major histo-compability
complex). Trong phøc hÖ t−¬ng hîp m«, quan träng nhÊt lµ c¸c protein t−¬ng hîp m«.
C¸c protein nµy ®−îc m· hãa bëi c¸c locut gen MHC biÓu hiÖn tÝnh chÊt kh¸ng thÓ
(kh«ng t−¬ng hîp) m¹nh víi c¸c tÕ bµo mang MHC cña c¬ thÓ kh¸c. ë ng−êi, c¸c protein
MHC cßn ®−îc gäi lµ c¸c kh¸ng nguyªn liªn kÕt tÕ bµo lympho – HLA (human
leukocyte antigen) v× chóng ®−îc t×m thÊy ®Çu tiªn ë tÕ bµo lympho. C¸c HLA ®−îc m·
hãa bëi mét côm gen, gäi lµ locut HLA, n»m trªn NST sè 6 (h×nh 9.4). Côm gen nµy cã
chiÒu dµi kho¶ng 3,5 kb.
C¸c gen t¹i locut HLA cã tÝnh ®a h×nh rÊt cao, phÇn lín mçi gen trong côm gen cã tõ
10 ®Õn 50 alen kh¸c nhau; mét sè thËm chÝ cã trªn 100 alen. ChÝnh v× lý do nµy, kh¶ n¨ng
hai c¸ thÓ kh«ng cïng huyÕt thèng ngÉu nhiªn cã b¶n sao gièng hÖt nhau ë tÊt c¶ c¸c gen
cña locut HLA hÇu nh− kh«ng thÓ x¶y ra. Còng v× vËy, trong ghÐp m« vµ t¹ng, viÖc t×m
®−îc ng−êi cho cã kh¸ng nguyªn HLA phï hîp víi ng−êi nhËn th−êng gÆp khã kh¨n.
Cã ba nhãm protein MHC kh¸c nhau vÒ chøc n¨ng miÔn dÞch. C¸c gen HLA
nhãm I m· hãa cho c¸c protein gäi lµ c¸c kh¸ng nguyªn cÊy ghÐp, v× chóng cã vai trß
quan träng trong sù th¶i lo¹i m« trong ghÐp t¹ng. C¸c HLA nhãm I cã b¶n chÊt lµ c¸c
glycoprotein liªn kÕt mµng tÕ bµo víi miÒn x¸c ®Þnh ®Æc tÝnh kh¸ng nguyªn béc lé ra
ngoµi tÕ bµo. HÇu nh− chóng cã mÆt ë mäi tÕ bµo cña mét c¬ thÓ vµ gióp tÕ bµo ®éc T
nhËn ra c¸c tÕ bµo l¹ x©m nhËp vµo c¬ thÓ. Mçi lo¹i protein MHC nhãm I cã thÓ liªn kÕt
víi nhiÒu lo¹i kh¸ng nguyªn kh¸c nhau vµ béc lé c¸c kh¸ng nguyªn nµy cho c¸c tÕ bµo
®éc T. C¸c gen HLA nhãm II m· hãa cho c¸c protein liªn kÕt mµng tÕ bµo lympho B,
c¸c ®¹i thùc bµo vµ c¸c tÕ bµo t−¬ng t¸c víi c¸c trî bµo T. C¸c protein MHC nhãm II chøa
c¸c “khe” liªn kÕt kh¸ng nguyªn cho phÐp c¸c tÕ bµo mang chóng liªn kÕt ®−îc víi c¸c
protein cã quan hÖ víi nhau (cã cÊu tróc mét phÇn gièng nhau) vµ béc lé chóng víi c¸c trî
bµo T (h×nh 9.5). C¸c gen HLA nhãm III m· hãa cho c¸c protein bæ thÓ lµ c¸c protein
t−¬ng t¸c víi phøc hÖ kh¸ng nguyªn/kh¸ng thÓ vµ thóc ®Èy sù ph©n hñy chóng qua qu¸

273
§inh §oµn Long

tr×nh ph©n hñy protein. C¸c protein bæ thÓ cßn cã kh¶ n¨ng tiªu diÖt c¸c tÕ bµo l©y nhiÔm
b»ng c¸ch ph¸ vì c¸c liªn kÕt trªn mµng tÕ bµo. Nh− vËy, kh«ng gièng víi c¸c HLA nhãm
I vµ II, c¸c protein HLA nhãm III kh«ng ph¶i lµ c¸c protein liªn kÕt mµng tÕ bµo vµ lµm
nhiÖm vô nhËn diÖn kh¸ng nguyªn.
Trong mét sè tr−êng hîp, hÖ thèng nhËn diÖn tÕ bµo cã thÓ bÞ sai háng vµ c¸c tÕ bµo
trong c¬ thÓ cã thÓ sinh ra c¸c kh¸ng thÓ chèng l¹i chÝnh kh¸ng nguyªn cña c¬ thÓ ®ã.
BÖnh lý nµy ®−îc gäi lµ bÖnh tù miÔn. C¸c kh¸ng thÓ ®−îc sinh ra ë bÖnh nh©n tù miÔn
cã thÓ lµm háng mét sè m« vµ c¬ quan, thËm chÝ biÓu hiÖn trªn toµn c¬ thÓ (th−êng g©y
®au cÊp tÝnh). VÝ dô nh− ë mét sè d¹ng bÖnh tù miÔn, c¸c kh¸ng thÓ tù miÔn cã thÓ tÊn
c«ng vµ lµm háng c¸c tÕ bµo β s¶n sinh insulin ë tuyÕn tôy, dÉn ®Õn triÖu chøng tiÓu

a) Côm locus HLA

SBα SBβ DCα DCβ DRα DRβ C4F C4S C2 Bf B C A


II II II II II II III III III III I I I
C¸c nhãm kh¸ng nguyªn t−¬ng hîp m«

b) Côm c¸c gen vµ


gen gi¶ ë mét locus

c) E1 I1 E2 I2 E3 I3 E4 I4 E5 I5 E6 I6 E7 I7 E8
Mét gen

C¸c miÒn cÊu tróc §o¹n MiÒn ngo¹i bµo MiÒn xuyªn MiÒn néi bµo
cña kh¸ng nguyªn tÝn hiÖu mµng tÕ bµo

H×nh 9.4. CÊu tróc cña côm locus kh¸ng nguyªn t−¬ng hîp m« (HLA) trªn NST sè 6 ë ng−êi. H×nh (a)
biÓu diÔn vÞ trÝ trªn b¶n ®å di truyÒn cña c¸c locus m· hãa c¸c protein MHC nhãm I, II vµ III trong côm locus
HLA. H×nh (b) cho thÊy mçi locus gåm nhiÒu gen (mét sè cã thÓ lµ gen gi¶) m· hãa c¸c protein MHC nhãm I.
H×nh (c) m« t¶ c¸c miÒn cÊu tróc cña mét kh¸ng nguyªn MHC nhãm I; trong ®ã E lµ exon, I lµ intron.

Ngo¹i bµo MiÒn liªn kÕt c¸c Ngo¹i bµo


®o¹n peptide
(kh¸ng nguyªn)

MiÒn cÊu tróc


gièng c¸c
immunoglobulin

β2-microglobulin
MiÒn cÊu tróc
xuyªn mµng tÕ bµo

Chuçi α
MiÒn trong
Chuçi α Chuçi β
tÕ bµo chÊt
Protein MHC Protein MHC
nhãm I Néi bµo nhãm II Néi bµo

H×nh 9.5. CÊu tróc cña c¸c protein MHC nhãm I vµ II. C¶ hai lo¹i protein ®Òu ®−îc cÊu t¹o tõ hai chuçi
polypeptide. Tuy nhiªn, protein MHC nhãm I (h×nh tr¸i) gåm mét chuçi α do locus MHC m· hãa, cßn chuçi thø 2
(β2-microglobulin) ®−îc m· hãa bëi mét gen kh¸c trong hÖ gen. Vïng ngo¹i bµo gåm 3 miÒn cÊu tróc α1, α2 vµ
α3; mçi miÒn cã 90 axit amin. "Khe" h×nh thµnh gi÷a α1 vµ α2 (25Å x 10 Å x 10 Å) t¹o nªn vÞ trÝ liªn kÕt kh¸ng
nguyªn (th−êng lµ ®o¹n peptide dµi 10 - 20 axit amin). C¸c protein MHC nhãm II (h×nh ph¶i) gåm hai chuçi
polypeptide (α vµ β). Mçi chuçi cã 2 miÒn cÊu tróc (α1/α2 vµ β1/β2); mçi miÒn còng cã 90 axit amin vµ mét miÒn
xuyªn mµng gåm 25 axit amin. C¶ hai nhãm protein MHC ®Òu cã miÒn liªn kÕt kh¸ng nguyªn rÊt biÕn ®æi.

274
Ch−¬ng 9. §iÒu hoµ gen hÖ miÔn dÞch ë ®éng vËt cã x−¬ng sèng

®−êng; lóc nµy, ng−êi bÖnh cÇn ®−îc bæ sung insulin tõ bªn ngoµi. NÕu kh«ng ®−îc bæ
sung insulin hîp lý, bÖnh nh©n cã thÓ bÞ m¾c c¸c biÕn chøng mï, c¸c bÖnh thËn, tim
m¹ch vµ chÕt sím.

9.3. §¸p øng miÔn dÞch thÓ dÞch (®iÒu hßa trung gian bëi kh¸ng thÓ)
Khi mét kh¸ng Sù x©m nhËp MHC
nguyªn l¹ (ch¼ng h¹n cña thÓ l©y Phøc hÖ
nhiÔm Kh¸ng thÓ MHC/kh¸ng nguyªn
nh− mét ph©n tö
glycoprotein trªn bÒ mÆt
Vi khuÈn §¹i thùc bµo
tÕ bµo vi khuÈn) x©m
nhËp vµo m¹ch m¸u Kh¸ng nguyªn
®éng vËt cã vó, nã sÏ liªn kÕt mµng
kÝch ho¹t mét hÖ thèng Thô thÓ
ph¶n vÖ gäi lµ ®¸p øng TÕ bµo B MHC
miÔn dÞch thÓ dÞch thuÇn khiÕt
(ch−a biÖt hãa) TÕ bµo nhí B
(hay ®¸p øng miÔn Trî bµo T
dÞch ®iÒu hßa trung TÕ bµo B
gian bëi kh¸ng thÓ) ho¹t hãa Kh¸ng thÓ
víi sù h×nh thµnh c¸c
kh¸ng thÓ. C¸c kh¸ng T−¬ng bµo (s¶n sinh kh¸ng thÓ)
thÓ sau khi h×nh thµnh
liªn kÕt ®Æc hiÖu víi c¸c H×nh 9.6. Sù biÖt hãa c¸c tÕ bµo B trong ®¸p øng miÔn dÞch thÓ dÞch.
kh¸ng nguyªn sÏ thóc ®Èy sù tiªu diÖt vµ th¶i lo¹i c¸c t¸c nh©n l©y nhiÔm khái hÖ tuÇn
hoµn. HÖ thèng miÔn dÞch thÓ dÞch gi÷ vai trß chÝnh trong viÖc b¶o vÖ c¬ thÓ khái sù l©y
nhiÔm cña c¸c lo¹i vi khuÈn, nÊm vµ lo¹i bá nhiÒu virut tr−íc khi chóng kÞp x©m nhËp
vµo c¸c tÕ bµo. Qu¸ tr×nh nµy ®−îc “®iÒu hßa” qua vai trß trung gian cña c¸c kh¸ng thÓ
®−îc t¹o ra tõ c¸c t−¬ng bµo cã nguån gèc tõ c¸c tÕ bµo B, vµ cã liªn quan ®Õn ho¹t ®éng
phèi hîp cña nhiÒu nhãm tÕ bµo kh¸c nhau thuéc hÖ miÔn dÞch (h×nh 9.6).
§¸p øng miÔn dÞch thÓ dÞch b¾t ®Çu khi ®¹i thùc bµo b¾t ®Çu ph¸t hiÖn mét hîp
chÊt l¹. Chóng tiÕn hµnh “nuèt” vµ ph¸ hñy hîp chÊt l¹, ®ång thêi béc lé “mét phÇn” hîp
chÊt l¹ bÞ ph©n hñy lªn bÒ mÆt tÕ bµo, gäi lµ epitop, ®Ó c¸c trî bµo T cã thÓ nhËn ra. Lóc
nµy, c¸c trî bµo T ë d¹ng ho¹t hãa sÏ thóc ®Èy c¸c tÕ bµo B biÖt hãa hoÆc thµnh c¸c t−¬ng
bµo (tÕ bµo sinh kh¸ng thÓ) hoÆc thµnh c¸c tÕ bµo nhí B (tÕ bµo thóc ®Èy ®¸p øng miÔn
dÞch nhanh h¬n khi c¬ thÓ bÞ nhiÔm trë l¹i víi cïng lo¹i kh¸ng nguyªn). ë c¸c bÖnh nh©n
AIDS, virut HIV ph¸ hñy c¸c trî bµo T, lµm suy yÕu hÖ miÔn dÞch cña ng−êi bÖnh vµ lµm
ng−êi bÖnh trë nªn mÉn c¶m víi c¸c t¸c nh©n g©y bÖnh truyÒn nhiÔm kh¸c.
Trong ®¸p øng miÔn dÞch, epitop chÝnh lµ phÇn kh¸ng nguyªn thóc ®Èy sù s¶n
sinh kh¸ng thÓ. Nhê cÊu tróc nµy, kh¸ng thÓ nhËn biÕt vµ g¾n ®Æc hiÖu ®−îc víi kh¸ng
nguyªn. Mét kh¸ng nguyªn cã thÓ cã mét hay nhiÒu epitop. Epitop cña mét protein
kh¸ng nguyªn cã thÓ lµ mét ®o¹n peptide ng¾n (®«i khi chØ gåm kho¶ng 6 axit amin).
C¸c kh¸ng thÓ sau khi g¾n vµo c¸c kh¸ng nguyªn sÏ kÝch ho¹t ®¸p øng miÔn dÞch
lµm bÊt ho¹t chóng vµ lo¹i bá chóng khái c¬ thÓ. Phøc hÖ kh¸ng nguyªn/kh¸ng thÓ cã thÓ
bÞ lo¹i bá bëi mét trong hai cßn ®−êng chÝnh: 1) c¸c phøc hÖ kh¸ng nguyªn/kh¸ng thÓ bÞ
“nuèt” vµ bÞ ph©n hñy bëi c¸c thùc bµo; 2) C¸c kh¸ng thÓ IgG vµ IgM huy ®éng c¸c
protein bæ thÓ h×nh thµnh phøc hÖ ph©n hñy c¸c virut vµ c¸c hîp chÊt protein kh¸c th«ng

275
§inh §oµn Long

qua qu¸ tr×nh ph©n hñy protein vµ/hoÆc tiªu diÖt c¸c vi khuÈn vµ nÊm qua sù ph©n gi¶i
tÕ bµo.
Khi c¸c tÕ bµo lympho B biÖt hãa, mçi t−¬ng bµo chØ tæng hîp mét lo¹i kh¸ng thÓ
®Æc hiÖu. Nãi c¸ch kh¸c, tÊt c¶ c¸c kh¸ng thÓ ®−îc sinh ra tõ cïng mét t−¬ng bµo ®Òu
gièng hÖt nhau vµ cã tÝnh ®Æc hiÖu liªn kÕt kh¸ng nguyªn gièng nhau. Mét c©u hái ®Æt ra
lµ: b»ng c¸ch nµo c¬ thÓ cã thÓ s¶n sinh mét l−îng lín kh¸ng thÓ nhÊt ®Þnh ®Ó chèng l¹i
sù l©y nhiÔm cña mét t¸c nh©n g©y bÖnh nµo ®ã? Lóc nµy, chóng ta nhí l¹i r»ng hÖ tuÇn
hoµn ë ®éng vËt cã vó th−êng cã hµng triÖu tÕ bµo B. V× vËy, quÇn thÓ gåm hµng triÖu tÕ
bµo B cña mét c¬ thÓ cã thÓ t¹o ra hµng triÖu t−¬ng bµo vµ c¸c lo¹i kh¸ng thÓ kh¸c nhau.
NÕu mét tÕ bµo B t¹o ra mét lo¹i kh¸ng thÓ nµo ®ã mµ kh¸ng thÓ nµy ë tr¹ng th¸i g¾n
kÕt víi kh¸ng nguyªn th× tÕ bµo B ®ã sÏ ®−îc ho¹t hãa ®Ó ph©n chia vµ biÖt hãa thµnh
mét quÇn thÓ lín c¸c t−¬ng bµo s¶n sinh cïng mét lo¹i kh¸ng thÓ. Do qu¸ tr×nh nµy thùc
chÊt lµ sù nh©n dßng c¸c t−¬ng bµo s¶n sinh cïng mét lo¹i kh¸ng thÓ nªn cßn ®−îc gäi lµ
sù nh©n dßng chän läc tÕ bµo B. Do mçi t−¬ng bµo hoµn thiÖn cã thÓ tæng hîp ®−îc tõ
2000 ®Õn 20.000 kh¸ng thÓ mçi gi©y nªn mçi dßng t−¬ng bµo trong mét c¬ thÓ cã thÓ
cung cÊp ®ñ kh¸ng thÓ ®Ó chèng l¹i c¸c thÓ l©y nhiÔm. Sau khi c¸c kh¸ng nguyªn l¹ ®·
®−îc lo¹i khái c¬ thÓ, c¸c tÕ bµo øc chÕ T sÏ göi tÝn hiÖu ®Ó c¸c t−¬ng bµo “ngõng” s¶n
sinh c¸c kh¸ng thÓ t−¬ng øng cho ®Õn khi c¬ thÓ bÞ nhiÔm trë l¹i víi cïng lo¹i kh¸ng
nguyªn ®ã.
Cã mét sè bÖnh di truyÒn liªn quan ®Õn ®¸p øng miÔn dÞch thÓ dÞch. Trong nh÷ng
bÖnh ®ã, cã lÏ nghiªm träng nhÊt lµ bÖnh thiÕu gamma globulin liªn kÕt NST X.
BÖnh nh©n m¾c bÖnh nµy kh«ng cã kh¶ n¨ng tæng hîp bÊt cø lo¹i kh¸ng thÓ nµo do thiÕu
h¼n c¸c tÕ bµo lympho B; hoÆc ®«i khi cã thÓ cã tÕ bµo B nh−ng nh÷ng tÕ bµo B nµy
kh«ng hoµn thiÖn hoÆc kh«ng biÖt hãa ®−îc thµnh c¸c t−¬ng bµo s¶n sinh kh¸ng thÓ. Do
bÖnh nµy liªn quan ®Õn sai háng gen trªn NST X nªn phÇn lín bÖnh nh©n lµ nam giíi.
C¸c bÖnh nh©n m¾c bÖnh nµy rÊt mÉn c¶m víi c¸c t¸c nh©n g©y bÖnh lµ vi khuÈn vµ
nÊm. Nh−ng, nhê hä vÉn cã thÓ cã hÖ thèng bæ thÓ ë c¸c tÕ bµo T b×nh th−êng vµ hÖ thèng
miÔn dÞch tÕ bµo (xem d−íi ®©y) vÉn ho¹t ®éng b×nh th−êng, nªn c¬ thÓ ®−îc b¶o vÖ khái
c¸c thÓ l©y nhiÔm lµ virut.

9.4. §¸p øng miÔn dÞch tÕ bµo (®iÒu hßa trung gian bëi tÕ bµo T)
Ngoµi hÖ thèng ®¸p øng miÔn dÞch thÓ dÞch, ®éng vËt cã vó cßn cã mét hÖ thèng b¶o
vÖ mang tÝnh ®Æc hiÖu kh¸ng nguyªn thø hai ®−îc gäi lµ hÖ thèng ®¸p øng miÔn dÞch tÕ
bµo hay ®¸p øng miÔn dÞch ®−îc ®iÒu hßa bëi tÕ bµo T (h×nh 9.7). Nh− tªn gäi cña nã, c¬
chÕ ®¸p øng miÔn dÞch nµy ®−îc ®iÒu hßa qua trung gian tÕ bµo, mµ cô thÓ lµ c¸c tÕ bµo
®éc T. C¸c tÕ bµo ®éc T tÊn c«ng vµ ph¸ hñy c¸c tÕ bµo béc lé c¸c kh¸ng nguyªn ®Æc hiÖu
trªn bÒ mÆt tÕ bµo cña chóng. Qua c¬ chÕ ®¸p øng miÔn dÞch tÕ bµo, c¸c tÕ bµo ®éc T cã
kh¶ n¨ng t×m kiÕm vµ ph¸ hñy c¸c tÕ bµo bÞ l©y nhiÔm bëi virut, vi khuÈn, c¸c t¸c nh©n
g©y bÖnh kh¸c vµ mét sè lo¹i tÕ bµo ung th−. C¸c tÕ bµo ®éc T cã c¸c thô thÓ tÕ bµo T
(gièng kh¸ng thÓ) trªn bÒ mÆt tÕ bµo cña chóng; nhê nh÷ng thô thÓ nµy, tÕ bµo ®éc T t×m
ra c¸c tÕ bµo bÞ l©y nhiÔm mang c¸c kh¸ng nguyªn ®−îc béc lé trªn bÒ mÆt tÕ bµo. C¸c
kh¸ng nguyªn ®−îc nhËn biÕt bëi thô thÓ tÕ bµo T th−êng lµ c¸c ®o¹n peptide ®Æc thï
cña vi khuÈn vµ virut; chóng ®−îc béc lé trªn bÒ mÆt c¸c tÕ bµo bÞ l©y nhiÔm cïng víi c¸c
protein MHC.
Gièng nh− ®¸p øng miÔn dÞch thÓ dÞch, ®¸p øng miÔn dÞch tÕ bµo ®−îc b¾t ®Çu ngay
khi mét ®¹i thùc bµo “nuèt” vµ ph©n hñy tõng phÇn hîp chÊt l¹ nµo ®ã. C¸c epitop ®−îc
t¹o ra do sù ph©n hñy mét phÇn hîp chÊt l¹ ®−îc “béc lé” trªn bÒ mÆt cña ®¹i thùc bµo
bëi c¸c protein MHC. C¸c kh¸ng nguyªn sau ®ã ®−îc nhËn ra bëi c¸c tÕ bµo ®éc T vµ c¸c
trî bµo T. Lóc nµy c¸c trî bµo T chuyÓn sang tr¹ng th¸i ho¹t hãa vµ thóc ®Èy sù hoµn

276
Ch−¬ng 9. §iÒu hoµ gen hÖ miÔn dÞch ë ®éng vËt cã x−¬ng sèng

thiÖn c¸c tÕ bµo B vµ T b»ng viÖc tiÕt ra


mét lo¹t c¸c ph©n tö tÝn hiÖu ®−îc gäi
chung lµ c¸c cytokine, lymphokine vµ
interleukin. Khi ®−îc ho¹t hãa, c¸c tÕ
bµo T sÏ biÖt hãa thµnh c¸c tÕ bµo ®éc T C¸c vi sinh vËt l©y nhiÔm
hoµn thiÖn vµ c¸c tÕ bµo nhí T. KÕt hîp (vÝ dô: virut)
TÕ bµo béc lé
víi c¸c tÕ bµo lympho B, mét “quÇn thÓ”
kh¸ng nguyªn
c¸c tÕ bµo ®éc T t¹o nªn mét sè l−îng TÕ bµo T
lín thô thÓ tÕ bµo T ®Æc hiÖu kh¸ng
nguyªn. Ngoµi ra, khi cã sù liªn kÕt
gi÷a thô thÓ tÕ bµo T víi kh¸ng nguyªn MHC
®Æc hiÖu, mét qu¸ tr×nh nh©n dßng Kh¸ng nguyªn
Thô thÓ ®−îc béc lé (epitop)
chän läc tÕ bµo T còng diÔn ra gièng tÕ bµo T
nh− ë c¸c tÕ bµo B trong ®¸p øng miÔn C¸c hîp chÊt
dÞch thÓ dÞch. cytokine ®−îc tiÕt ra
Thô thÓ
C¸c tÕ bµo ®éc T hoµn thiÖn sÏ g¾n Sù nh©n dßng cytokine
vµ ho¹t hãa
vµo c¸c tÕ bµo ®Ých béc lé kh¸ng nguyªn nhanh c¸c tÕ
vµ tiªu diÖt chóng b»ng mét sè c¬ chÕ bµo ®éc T vµ
ph©n hñy tÕ bµo. Ch¼ng h¹n, c¸c tÕ bµo c¸c thùc bµo

®éc tiÕt ra mét sè protein gäi lµ c¸c


perforin; c¸c protein nµy cã thÓ xen vµo
mµng cña c¸c tÕ bµo ®Ých vµ t¹o nªn c¸c
lç thñng. Sinh chÊt cña c¸c tÕ bµo ®Ých Ph©n gi¶i c¸c tÕ
bµo bÞ l©y nhiÔm
tho¸t ra ngoµi qua c¸c lç thñng vµ lµm
chÕt tÕ bµo.
H×nh 9.7. §¸p øng miÔn dÞch trung gian tÕ bµo.
9.5. Sù ghi nhí cña hÖ miÔn dÞch
Khi c¬ thÓ bÞ nhiÔm lÇn ®Çu víi mét kh¸ng nguyªn l¹, hÖ miÔn dÞch th−êng cÇn tõ
7 ®Õn 10 ngµy ®Ó s¶n sinh mét l−îng kh¸ng thÓ ®ñ lín ®Æc hiÖu kh¸ng nguyªn ®ã vµ
cÇn 2 - 3 tuÇn ®Ó ®¹t møc tæng hîp kh¸ng thÓ tèi ®a. LÇn ®Çu b¾t gÆp mét kh¸ng
nguyªn l¹ th−êng chØ dÉn ®Õn ®¸p øng miÔn dÞch ë møc thÊp, gäi lµ ®¸p øng miÔn
dÞch s¬ cÊp (hay nguyªn ph¸t). Trong nh÷ng lÇn c¬ thÓ bÞ nhiÔm trë l¹i víi cïng lo¹i
kh¸ng nguyªn (thùc chÊt lµ víi cïng lo¹i t¸c nh©n g©y bÖnh), ®¸p øng miÔn dÞch x¶y ra
nhanh h¬n nhiÒu vµ ®−îc gäi lµ ®¸p øng miÔn dÞch thø cÊp (hay thø ph¸t). §iÒu
®¸ng chó ý lµ ®¸p øng miÔn dÞch thø cÊp kh«ng chØ nhanh h¬n mµ l−îng kh¸ng thÓ
sinh ra còng nhiÒu h¬n. Së dÜ nh− vËy lµ nhê hÖ miÔn dÞch cã kh¶ n¨ng “ghi nhí” vµ
®©y chÝnh lµ c¬ së cña biÖn ph¸p tiªm phßng v¨cxin rÊt hiÖu qu¶ trong phßng chèng
phÇn lín c¸c bÖnh truyÒn nhiÔm.
§Õn nay, chóng ta ®· biÕt c¬ së tÕ bµo häc liªn quan ®Õn kh¶ n¨ng ghi nhí cña hÖ
miÔn dÞch nh−ng ch−a biÕt ®Çy ®ñ c¬ së ph©n tö cña nã. C¸c tÕ bµo lympho B vµ T ch−a
tõng b¾t gÆp mét kh¸ng nguyªn (ch−a biÖt hãa) ®−îc gäi lµ c¸c tÕ bµo thuÇn khiÕt. Sau
khi ®−îc béc lé víi mét lo¹i kh¸ng nguyªn, c¸c tÕ bµo thuÇn khiÕt ®−îc biÖt hãa thµnh
hai lo¹i tÕ bµo: c¸c tÕ bµo ghi nhí vµ c¸c tÕ bµo B hoÆc T ho¹t hãa. C¸c tÕ bµo ho¹t
hãa sau ®ã ph©n chia nguyªn ph©n nhiÒu lÇn liªn tiÕp vµ tiÕp tôc biÖt hãa t−¬ng øng
thµnh c¸c t−¬ng bµo sinh kh¸ng thÓ vµ c¸c tÕ bµo T sinh thô thÓ.

277
§inh §oµn Long

Kh«ng gièng c¸c t−¬ng bµo hay tÕ bµo ®éc T vèn chØ tån t¹i vµi ngµy ®Õn mét tuÇn,
c¸c tÕ bµo ghi nhí cã thêi gian sèng rÊt dµi (tõ vµi th¸ng ®Õn vµi n¨m). Ngoµi ra, c¸c tÕ
bµo ghi nhí B vµ T th−êng lu«n ë tr¹ng th¸i ho¹t hãa. V× vËy, chóng cã thÓ ph¸t triÓn
t−¬ng øng thµnh t−¬ng bµo sinh kh¸ng thÓ vµ c¸c tÕ bµo ®éc T sinh thô thÓ ngay khi c¬
thÓ bÞ l©y nhiÔm trë l¹i víi cïng lo¹i kh¸ng nguyªn. Lóc nµy, c¸c tÕ bµo nhí B vµ T sÏ
®−îc kÝch ho¹t ®Ó ph©n chia vµ biÖt hãa thµnh c¸c t−¬ng bµo vµ c¸c tÕ bµo ®éc T t−¬ng
øng. Nhê vËy, ®¸p øng miÔn dÞch thø cÊp trë nªn rÊt nhanh vµ kÕt qu¶ lµ mét l−îng lín
c¸c t−¬ng bµo vµ tÕ bµo ®éc T ®−îc t¹o ra víi mËt ®é lín trong thêi gian ng¾n.

9.6. Sù s¾p xÕp l¹i hÖ gen trong qu¸ tr×nh biÖt hãa tÕ bµo lympho B
VÒ mÆt di truyÒn häc, ®iÓm ®¸ng chó ý nhÊt cña hÖ miÔn dÞch lµ c¸ch c¬ thÓ tæng
hîp c¸c kh¸ng thÓ ®Æc thï víi mçi lo¹i kh¸ng nguyªn vèn cã møc ®é ®a d¹ng d−êng nh−
kh«ng giíi h¹n. Mét c©u hái ®Æt ra lµ: b»ng c¸ch nµo hÖ gen ng−êi cã thÓ l÷u gi÷ mét
l−îng th«ng tin di truyÒn ®ñ lín ®Ó cã thÓ m· hãa cho tÊt c¶ c¸c lo¹i kh¸ng thÓ? C©u tr¶
lêi lµ nhê c¬ chÕ “s¾p xÕp l¹i hÖ gen” trong qu¸ tr×nh biÖt hãa c¸c tÕ bµo cña hÖ miÔn dÞch.
Trong hÖ gen, th«ng tin di truyÒn (trªn ADN) m· hãa cho c¸c chuçi nÆng vµ nhÑ
cña kh¸ng thÓ ®−îc l−u gi÷ thµnh c¸c ph©n ®o¹n nhá; nh÷ng ph©n ®o¹n nµy cã thÓ tæ
hîp theo c¸c c¸ch kh¸c nhau thµnh c¸c tr×nh tù phï hîp trong qu¸ tr×nh biÖt hãa c¸c tÕ
bµo s¶n sinh kh¸ng thÓ. TÕ bµo gèc chøa ®Çy ®ñ th«ng tin di truyÒn m· hãa cho tÊt c¶ c¸c
lo¹i kh¸ng thÓ, nh−ng ë d¹ng c¸c ph©n ®o¹n. Trong qu¸ tr×nh tÕ bµo gèc biÖt hãa thµnh
c¸c tÕ bµo lympho B vµ t−¬ng bµo ë tñy x−¬ng, c¸c ph©n ®o¹n gen ®−îc “c¾t” vµ “l¾p
ghÐp” l¹i víi nhau thµnh c¸c gen m· hãa tõng lo¹i kh¸ng thÓ. Trong qu¸ tr×nh t¸i s¾p
xÕp hÖ gen nh− vËy, c¸c ph©n ®o¹n gen ®−îc nèi víi nhau theo kiÓu t¸i tæ hîp, trong khi
c¸c ph©n ®o¹n ADN ë gi÷a ®−îc c¾t bá mét c¸ch ®Æc thï t−¬ng øng víi tõng lo¹i kh¸ng
nguyªn.
Nh×n chung, c¸c gen m· hãa c¸c chuçi nhÑ lambda, chuçi nhÑ kappa còng nh− c¸c
chuçi nÆng ®Òu ®−îc “c¾t” vµ “t¸i tæ hîp” theo c¬ chÕ gièng nhau. §iÓm kh¸c biÖt c¬ b¶n
nhÊt lµ sè ph©n ®o¹n ADN ®−îc dïng ®Ó tæ hîp nªn c¸c gen m· hãa cho c¸c chuçi nµy
t−¬ng øng lµ 2 (chuçi nhÑ lambda), 3 (chuçi nhÑ kappa) vµ 4 (chuçi nÆng). Ngoµi ra, côm
c¸c locut gen m· hãa c¸c chuçi lambda, kappa vµ chuçi nÆng t−¬ng øng n»m trªn ba NST
kh¸c nhau ë ng−êi, lµ c¸c NST sè 22, 2 vµ 14. §iÒu nµy cho thÊy, sù l¾p r¸p cña c¸c gen
m· hãa c¸c chuçi lambda, kappa vµ c¸c chuçi nÆng diÔn ra ®éc lËp víi nhau.

9.6.1. C¸c gen m· hãa chuçi nhÑ lambda (λ) ®−îc r¸p nèi tõ hai ph©n ®o¹n gen
ë c¸c tÕ bµo gèc, c¸c tr×nh tù ADN m· hãa cho c¸c chuçi nhÑ λ gåm hai ph©n ®o¹n
kh¸c nhau (h×nh 9.8a). Ph©n ®o¹n thø nhÊt ®−îc gäi lµ LλVλ m· hãa cho hai ®o¹n tr×nh
tù polypeptide. Tr×nh tù thø nhÊt lµ ®o¹n polypeptide ®Çu N kÞ n−íc, gäi lµ ®o¹n dÉn
®Çu (kÝ hiÖu lµ Lλ); ®o¹n nµy ®−îc c¾t bá khi chuçi λ sau dÞch m· ®i qua m¹ng l−íi néi
chÊt. Tr×nh tù thø hai lµ vïng biÕn ®æi (kÝ hiÖu Vλ) gåm 97 axit amin ®Çu tiªn ë ®Çu N
cña chuçi nhÑ lambda (sau khi Lλ ®· ®−îc c¾t bá). Ph©n ®o¹n thø hai ®−îc gäi lµ JλCλ,
m· hãa cho hai tr×nh tù, ®−îc gäi lµ tr×nh tù kÕt nèi (Jλ) vµ tr×nh tù vïng æn ®Þnh ®Çu
C cña chuçi nhÑ lambda (Cλ). Jλ m· hãa cho ®o¹n polypeptide gåm 13 - 15 axit amin tËn
cïng thuéc vïng biÕn ®æi cña chuçi lambda. Gen m· hãa chuçi nhÑ λ hoµn chØnh ®−îc l¾p
r¸p b»ng viÖc “c¾t vµ nèi” mét ph©n ®o¹n LλVλ víi ph©n ®o¹n gen JλVλ (trªn NST sè 22),
®ång thêi c¾t bá ®o¹n tr×nh tù ë gi÷a. Sù c¾t - nèi gen nh− vËy x¶y ra trong qu¸ tr×nh
biÖt hãa tÕ bµo lympho B. Qu¸ tr×nh l¾p r¸p c¸c gen ®−îc ®iÒu khiÓn b»ng c¸c sù kiÖn t¸i
tæ hîp dùa trªn c¸c tr×nh tù ADN ®Æc thï thuéc c¸c locut gen m· hãa c¸c chuçi
immunoglobulin cña kh¸ng thÓ.

278
Ch−¬ng 9. §iÒu hoµ gen hÖ miÔn dÞch ë ®éng vËt cã x−¬ng sèng

ë ng−êi, mçi tÕ bµo gèc cã kho¶ng 300 ph©n ®o¹n LλVλ kh¸c nhau (mét sè kh«ng
cßn ho¹t ®éng) n»m gÇn t©m ®éng cña NST sè 22, ®ång thêi cã 9 ph©n ®o¹n JλCλ (Ýt nhÊt
cã 6 ph©n ®o¹n ho¹t ®éng) còng n»m trªn NST sè 22 nh−ng xa t©m ®éng h¬n. Trong qu¸
tr×nh biÖt hãa tÕ bµo lympho B, mét ph©n ®o¹n LλVλ ®−îc nèi víi mét ph©n ®o¹n JλCλ vµ
c¾t bá ®o¹n ADN n»m gi÷a. Mçi ph©n ®o¹n LλVλ ®Òu cã thÓ nèi víi mét ph©n ®o¹n JλCλ
theo tæ hîp bÊt kú. Tæ hîp gen míi h×nh thµnh (LλVλJλCλ) ban ®Çu cã hai intron; mét
intron cã kÝch th−íc 93 bp n»m gi÷a hai exon m· hãa Lλ vµ Vλ; cßn intron thø hai dµi
1200 bp n»m gi÷a c¸c exon m· hãa Jλ vµ Cλ. Hai intron nµy ®−îc c¾t bá khái tiÒn-mARN
trong qu¸ tr×nh hoµn thiÖn mARN m· hãa kh¸ng thÓ gièng nh− hÇu hÕt c¸c mARN kh¸c
ë eukaryote.
a) C¸c gen mW hãa chuçi nhÑ lambda (λ
λ), n = 300
L Vλ1 L Vλ2 L Vλn Jλ1 Cλ1 Jλ2 Cλ2 Jλ3 Cλ3 Jλ4 Cλ4

P P P E E E E
D D D

b) C¸c gen mW hãa chuçi nhÑ kappa (κ


κ), n = 300

L Vκ1 L Vκ2 L Vkn Jκ1 Jκ2 Jκ3 Jκ4 Jκ5 Cκ

P P P E
S¾p xÕp l¹i c¸c gen trong tÕ bµo lympho B
L V1 V2J4 J5 C
ADN tÕ bµo lympho B

Phiªn m·

TiÒn-mARN

Hoµn thiÖn mARN

mARN hoµn thiÖn


DÞch m·
L V J C
Protein chuçi nhÑ (L) tiÒn th©n
Hoµn thiÖn protein
(c¾t bá ®o¹n dÉn ®Çu vµ glycosyl hãa)

V J C
Protein chuçi nhÑ (L)

H×nh 9.8. Sù t¸i tæ hîp ADN trong qu¸ tr×nh biÖt hãa tÕ bµo lympho B vµ sù dÞch mW protein chuçi nhÑ

λ hoÆc κ) cña kh¸ng thÓ. Mét sè ch÷ viÕt t¾t trªn h×nh: P lµ promoter, E lµ tr×nh tù t¨ng c−êng (enhancer).
C¸c gen m· hãa chuçi nhÑ JλCλ cã 9 ph©n ®o¹n; trªn h×nh (a) chØ minh häa 4 ph©n ®o¹n JλCλ ®Çu tiªn.

9.6.2. C¸c gen m· hãa chuçi nhÑ kappa (κ) ®−îc r¸p nèi tõ ba ph©n ®o¹n gen
ViÖc tæng hîp c¸c chuçi κ ®−îc ®iÒu khiÓn bëi ba ph©n ®o¹n gen, ®ã lµ (1) ph©n
®o¹n LκVκ m· hãa ®o¹n polypeptide dÉn ®Çu (Lκ) vµ ®o¹n 95 axit amin tËn cïng ®Çu N
cña vïng biÕn ®æi (Vκ), (2) ph©n ®o¹n Jκ m· hãa cho chuçi 13 axit amin cña vïng biÕn
®æi, (3) ph©n ®o¹n Cκ m· hãa cho vïng æn ®Þnh ®Çu C cña chuçi κ. ë ng−êi, NST sè 2
chøa 300 ph©n ®o¹n gen LκVκ kh¸c nhau (mét sè cã thÓ kh«ng cßn ho¹t ®éng), 5 ph©n
®o¹n gen Jκ vµ mét ph©n ®o¹n Cκ duy nhÊt. C¸c ph©n ®o¹n Jk n»m gi÷a c¸c ph©n ®o¹n
LκVκ vµ Cκ (h×nh 9.8b).

279
§inh §oµn Long

Trong c¸c tÕ bµo gèc, 5 ph©n ®o¹n Jk ®−îc ng¨n c¸ch víi c¸c ph©n ®o¹n LkVk bëi mét
®o¹n tr×nh tù ADN dµi kh«ng m· hãa n»m xu«i dßng, c¸ch biÖt víi ph©n ®o¹n Cκ bëi mét
tr×nh tù ng−îc dßng kh«ng m· hãa dµi kho¶ng 2000 bp. Trong qu¸ tr×nh biÖt hãa tÕ bµo
B, gen m· hãa chuçi nhÑ λ cã thÓ ®−îc h×nh thµnh tõ mét tæ hîp bÊt kú cña mét ph©n
®o¹n LkVk víi mét ph©n ®o¹n Jk vµ ph©n ®o¹n Ck duy nhÊt. Trong qu¸ tr×nh t¸i tæ hîp
ADN nh− vËy, bÊt kú mét ph©n ®o¹n LkVk nµo trong sè 300 ph©n ®o¹n LkVk cã trong tÕ
bµo ®Òu cã thÓ nèi víi bÊt kú mét trong n¨m ph©n ®o¹n Jk vµ c¾t bá ®o¹n tr×nh tù ADN
n»m gi÷a ®Ó t¹o nªn gen dung hîp LkVkJk m· hãa cho toµn bé vïng biÕn ®æi cña chuçi
nhÑ κ. Vïng kh«ng m· hãa n»m gi÷a c¸c ph©n ®o¹n Jk vµ Ck (tøc lµ ph©n ®o¹n n»m gi÷a
gen dung hîp LkVkJk vµ Ck) ®−îc duy tr× trong cÊu tróc ADN cña c¸c t−¬ng bµo. Tr×nh tù
ADN ®Çy ®ñ nµy (LkVkJk - ®o¹n kh«ng m· hãa - Ck) sau ®ã sÏ ®−îc phiªn m· vµ ®o¹n
kh«ng m· hãa sÏ ®−îc c¾t bá trong qu¸ tr×nh hoµn thiÖn mARN sau phiªn m· gièng nh−
mét intron. Ph©n tö mARN hoµn thiÖn sÏ ®−îc dïng ®Ó dÞch m· vµ ®o¹n polypeptide dÉn
®Çu (Lκ) ®−îc c¾t khái chuçi κ khi nã ®−îc vËn chuyÓn qua m¹ng l−íi néi chÊt.

a) Locut gen mW hãa chuçi nÆng trªn NST sè 14


L VH1 L VH2 L VHn D1 D2 D2 Dn JH1 JH2 JH3 JH4 JH5

P P P E
Cµ Cδ Cγ3 Cγ1 Cγ2 Cγ4 Cε Cα1 Cα2

CH1 CH2 C 3 CH4 CH5


H

C¸c intron ph©n t¸ch c¸c exon(vÝ dô : CH1-5) m· hãa vïng C cña chuçi nÆng
b) S¾p xÕp l¹i hÖ gen trong qu¸ tr×nh biÖt hãa tÕ bµo lympho B

Nèi ®o¹n V-D-J

ADN

c) Sù biÓu hiÖn gen mW hãa chuçi nÆng trong t−¬ng bµo

TiÒn - mARN

Hoµn thiÖn mARN

mARN hoµn thiÖn

DÞch m·

Protein chuçi nÆng (H) tiÒn th©n


Hoµn thiÖn protein
(c¾t bá ®o¹n dÉn ®Çu vµ glycosyl hãa)

Protein chuçi nÆng (H)

H×nh 9.9. Sù t¸i tæ hîp c¸c gen mW hãa chuçi nÆng cña kh¸ng thÓ vµ sù biÓu hiÖn chóng trong tÕ bµo B.
Mét sè ch÷ viÕt t¾t: P lµ promoter, E lµ tr×nh tù t¨ng c−êng (enhancer). C¸c kÝ hiÖu kh¸c ®−îc gi¶i thÝch trong bµi.
280
Ch−¬ng 9. §iÒu hoµ gen hÖ miÔn dÞch ë ®éng vËt cã x−¬ng sèng

9.6.3. C¸c gen m· hãa chuçi nÆng ®−îc r¸p nèi tõ bèn ph©n ®o¹n gen
Th«ng tin di truyÒn m· hãa cho c¸c chuçi nÆng cña kh¸ng thÓ ®−îc tæ chøc thµnh 4
ph©n ®o¹n gen, gåm LHVH, JH, CH (3 ph©n ®o¹n nµy cã tæ chøc gièng víi c¸c locut gen m·
hãa chuçi nhÑ κ) vµ ph©n ®o¹n thø t− lµ D (ph©n ®o¹n nµy m· hãa cho chuçi ®o¹n
peptide gåm 2 - 13 axit amin thuéc vïng biÕn ®æi). Nh− vËy, vïng biÕn ®æi cña chuçi
nÆng ®−îc m· hãa bëi ba ph©n ®o¹n t¸ch biÖt lµ LHVH, JH, vµ D. C¸c ph©n ®o¹n nµy ®−îc
nèi víi nhau trong qu¸ tr×nh biÖt hãa cña tÕ bµo B. Ngoµi ra, cßn cã tõ 1 ®Õn 4 ph©n ®o¹n
CH ë mçi líp Ig.
ë ng−êi, trªn NST sè 14 cã 9 ph©n ®o¹n gen CH, ®−îc kÝ hiÖu theo thø tù lµ CHµ,
CHδ, CHγ3, CHγ1, CHα1, CHγ2, CHγ4, CHε, vµ CHα2. Ngoµi ra, trªn vïng 957 Kb cña NST nµy cßn
cã 123 ph©n ®o¹n LHVH kh¸c nhau (nh−ng d−êng nh− chØ cã 39 ph©n ®o¹n cßn ho¹t ®éng;
cßn l¹i lµ c¸c gen gi¶). Trªn c¸c NST sè 15 vµ 16 còng cã mét sè ph©n ®o¹n LHVH, nh−ng
cã vÎ chóng kh«ng ho¹t ®éng. NST sè 14 ®ång thêi cßn cã 27 ph©n ®o¹n D kh¸c nhau,
trong ®ã cã 25 ph©n ®o¹n cßn ho¹t ®éng vµ 2 ph©n ®o¹n kh«ng ho¹t ®éng, cïng víi 6
ph©n ®o¹n JH (h×nh 9.9). Trong qu¸ tr×nh biÖt hãa tÕ bµo B, sù t¸i tæ hîp c¸c gen trong tÕ
bµo soma tiÕn hµnh b»ng viÖc ghÐp nèi mét ph©n ®o¹n LHVH víi mét ph©n ®o¹n D vµ mét
ph©n ®o¹n JH, ®ång thêi c¾t bá hai ®o¹n ADN n»m gi÷a chóng ®Ó h×nh thµnh nªn mét
tr×nh tù ADN liªn tôc (LHVHDJH) m· hãa cho toµn bé vïng biÕn ®æi cña chuçi nÆng.
9.6.4. Sù t¸i tæ hîp c¸c gen trong qu¸ tr×nh biÖt hãa c¸c tÕ bµo sinh kh¸ng thÓ
®−îc ®iÒu khiÓn bëi c¸c "tÝn hiÖu" trªn ADN
Mét c©u hái ®Æt ra lµ: §o¹n ADN §o¹n ADN kh«ng m· hãa
b»ng c¸ch nµo hÖ gen ®iÒu m· hãa TÝn hiÖu 9 bp C¸c tr×nh tù
TÝn hiÖu 7 bp tÝn hiÖu kÕt
khiÓn ®−îc c¸c b−íc t¸i tæ hîp
nèi V-D
ADN ®Ó ®¶m b¶o mét ph©n
®o¹n V lu«n nèi vµo mét ph©n ADN
®o¹n J chø kh«ng nèi víi mét V
§o¹n ADN ®Öm
ph©n ®o¹n V kh¸c hoÆc nèi trùc §o¹n ADN m· hãa
tiÕp víi ph©n ®o¹n C? Trong §o¹n ADN kh«ng m· hãa
thùc tÕ, c¸c qu¸ tr×nh t¸i tæ hîp
D
nµy ®−îc ®iÒu khiÓn bëi c¸c ADN ®Öm ADN ®Öm
tr×nh tù tÝn hiÖu kÕt nèi lµ V-D
vµ D-J (h×nh 9.10). C¸c tÝn hiÖu
t¸i tæ hîp gièng nhau ®−îc t×m J
thÊy ë vïng biªn cña tÊt c¶ c¸c T¸i tæ hîp ADN T¸i tæ hîp ADN

ph©n ®o¹n gen V. T−¬ng tù nh−


vËy, tÊt c¶ c¸c ph©n ®o¹n J ®Òu V D J D J D J
Nèi ®o¹n D víi ®o¹n
cã tÝn hiÖu t¸i tæ hîp gièng J
nhau; tuy nhiªn, c¸c tÝn hiÖu t¸i
tæ hîp cña J kh¸c víi tÝn hiÖu
t¸i tæ hîp cña V. C¸c ph©n ®o¹n
D vµ C còng cã c¸c tr×nh tù tÝn
hiÖu ®Æc thï cña chóng.
Nèi ®o¹n V víi ®o¹n D-J
C¸c tÝn hiÖu t¸i tæ hîp
®iÒu khiÓn sù kÕt nèi V-D vµ D- V D J
J cã chiÒu dµi 7 bp vµ 9 bp n»m H×nh 9.10. C¸c tr×nh tù ADN lµ tÝn hiÖu nhËn biÕt trong qu¸ tr×nh
c¸ch biÖt bëi c¸c ®o¹n ADN ®Öm t¸i tæ hîp c¸c ph©n ®o¹n V, D vµ J cña gen mW hãa chuçi nÆng.

281
§inh §oµn Long

cã chiÒu dµi kh¸c nhau nh−ng rÊt ®Æc thï. §Ó kÕt nèi D víi J, ®o¹n tr×nh tù ®Öm trong
®o¹n tÝn hiÖu t¸i tæ hîp cña D dµi 12 bp, trong khi ®o¹n nµy ë ®o¹n tÝn hiÖu t¸i tæ hîp J
dµi 23 bp. C¸c tÝn hiÖu dµi 7 bp vµ 9 bp kÓ trªn n»m xu«i dßng ph©n ®o¹n V cã tr×nh tù
bæ sung víi c¸c tr×nh tù tÝn hiÖu cã mÆt ë c¶ hai phÝa cña ph©n ®o¹n J. Sù kÕt nèi gi÷a
ph©n ®o¹n D víi ph©n ®o¹n J chØ diÔn ra khi mét tr×nh tù tÝn hiÖu mang ®o¹n ADN ®Öm
12 bp vµ tr×nh tù tÝn hiÖu cßn l¹i mang ®o¹n ADN ®Öm 23 bp. §©y lµ ®iÒu kiÖn ®Ó mét
phøc hÖ protein cã tªn lµ RAG1/RAG2 (kh«ng vÏ trªn h×nh) cã thÓ liªn kÕt vµo ADN vµ
thùc hiÖn chøc n¨ng "c¾t nèi" cña chóng. Ho¹t ®éng "c¾t nèi" cña RAG1/RAG2 b¾t ®Çu
khi RAG1 nhËn ra hai tr×nh tù tÝn hiÖu 7 bp vµ 9 bp vµ liªn kÕt vµo. TiÕp theo ®ã, RAG2
g¾n kÕt víi RAG1 vµ phøc hÖ hai protein nµy trë nªn cã ho¹t tÝnh cña mét endonuclease
®Ó c¾t ®o¹n tr×nh tù ADN n»m gi÷a hai ph©n ®o¹n D vµ J hoÆc gi÷a V vµ D-J. Ho¹t ®éng
kÕt nèi gi÷a ph©n ®o¹n J vµ C còng diÔn ra theo nguyªn t¾c t−¬ng tù.
Sau ho¹t ®éng kÕt nèi gi÷a c¸c ph©n ®o¹n ®−îc thùc hiÖn bëi phøc hÖ RAG1/RAG2,
cã mét sè protein tham gia ho¹t ®éng chØnh söa ADN. Mét trong nh÷ng protein nµy lµ
artemis. NÕu thiÕu hôt protein nµy sÏ g©y nªn héi chøng suy gi¶m miÔn dÞch nghiªm
träng kÕt hîp mÉn c¶m chiÕu x¹ RS-SCID (radiation-sensitive severe combined
immunodeficiency disease).
9.6.5. Sù ®a d¹ng cña kh¸ng thÓ do tÝnh ®a d¹ng vÞ trÝ g¾n kÕt c¸c ph©n ®o¹n
gen m· hãa kh¸ng thÓ vµ kh¶ n¨ng siªu ®ét biÕn cña chóng
Sù ®a d¹ng vÒ c¸c lo¹i kh¸ng thÓ ®−îc t¹o ra bëi sù tæ hîp kh¸c nhau gi÷a c¸c
ph©n ®o¹n m· hãa c¸c phÇn thuéc chuçi nÆng vµ chuçi nhÑ cña kh¸ng thÓ. Ch¼ng h¹n,
tõ 300 ph©n ®o¹n LκVκ vµ 5 ph©n ®o¹n Jκ cã thÓ t¹o ra 1500 lo¹i ®o¹n gen dung hîp
LκVκJκ kh¸c nhau. T−¬ng tù nh− vËy, tõ 300 ph©n ®o¹n LλVλ vµ 6 ph©n ®o¹n JλCλ cã
thÓ t¹o ra 1800 lo¹i chuçi nhÑ lambda kh¸c nhau. Vïng biÕn ®æi cña chuçi nÆng ®−îc
t¨ng thªm tÝnh ®a d¹ng bëi cã nhiÒu ph©n ®o¹n D kh¸c nhau. Gi¶ sö, nÕu cã 40 ph©n
®o¹n VH ho¹t ®éng, 25 ph©n ®o¹n D vµ 6 ph©n ®o¹n JH ë c¸c tÕ bµo gèc m¸u ë ng−êi, th×
cã thÓ t¹o ra 6000 lo¹i vïng biÕn ®æi cña chuçi nÆng
kh¸c nhau. Tõ 3300 (= 1500+1800) lo¹i chuçi nhÑ vµ
6000 lo¹i chuçi nÆng, cã thÓ cã (3300 x 6000 =)
TÝn hiÖu nhËn biÕt 7 bp G ≡ C
19.800.000 lo¹i kh¸ng thÓ kh¸c nhau ®−îc t¹o ra T=A
theo nguyªn t¾c tæ hîp ngÉu nhiªn. Tuy nhiªn, c¸c G≡C
A=T
nghiªn cøu cßn cho thÊy, sù ®a d¹ng cña c¸c kh¸ng C≡G
A=T
thÓ cßn lín h¬n nhiÒu do mét sè c¬ chÕ kh¸c n÷a. V 5’ – C – C – T – C – C - C ≡ G – G – T – G - G – 3’ J
1 2 3 4
Mét trong nh÷ng c¬ chÕ ®ã lµ sù thay ®æi c¸c
vÞ trÝ t¸i tæ hîp. Mét vÝ dô vÒ c¬ chÕ nµy ®−îc minh
häa trªn h×nh 9.11. Ngoµi c¬ chÕ thay ®æi vÞ trÝ t¸i tæ 1 V 5’ – C – C – T – T – G - G – 3’ J
hîp, mét c¬ chÕ kh¸c lµm t¨ng sù ®a d¹ng cña c¸c Pro Trp
kh¸ng thÓ lµ tÇn sè ®ét biÕn tÕ bµo soma cao 2 V 5’ – C – C – T – C – G - G – 3’ J
trong c¸c tr×nh tù ADN m· hãa vïng biÕn ®æi cña c¸c Pro Arg
chuçi nÆng vµ nhÑ cña kh¸ng thÓ. Do nh÷ng vïng 3 V 5’ – C – C – T – C – C - G – 3’ J
nµy cã tÇn sè ®ét biÕn rÊt cao nªn chóng ®−îc gäi lµ Pro Pro
vïng siªu ®ét biÕn ë tÕ bµo soma. §Õn nay, c¬ chÕ 4 V 5’ – C – C – T – C – C - C – 3’ J
"siªu ®ét biÕn" cßn ch−a râ (mét sè nghiªn cøu cho Pro Pro
thÊy chóng cã liªn quan ®Õn c¸c c¬ chÕ söa ch÷a Sè thø tù axit amin 95 96
ADN kiÓu kÕt cÆp sai - MMR). H×nh 9.11. TÝnh ®a d¹ng cña kh¸ng thÓ
t¨ng lªn nhê thay ®æi vÞ trÝ t¸i tæ hîp.
Kh¶ n¨ng siªu ®ét biÕn ë c¸c vïng m· hãa vÞ trÝ VÝ dô nµy ë ®o¹n nèi Vκ - Jκ ë chuét (cã
liªn kÕt kh¸ng nguyªn cña kh¸ng thÓ cã vai trß quan 4 vÞ trÝ "c¾t - nèi" kh¸c nhau, kÝ hiÖu 1-4).

282
Ch−¬ng 9. §iÒu hoµ gen hÖ miÔn dÞch ë ®éng vËt cã x−¬ng sèng

träng. NÕu kh«ng cã kh¶ n¨ng nµy, sù ®a d¹ng cña kh¸ng thÓ chØ ®¬n thuÇn phô thuéc
vµo sù t¸i tæ hîp ADN trong qu¸ tr×nh biÖt hãa c¸c tÕ bµo thuéc hÖ miÔn dÞch. Trong khi
®ã, virut vµ t¸c nh©n g©y bÖnh vèn cã thÓ biÕn ®æi kh«ng ngõng ®· t¹o nªn v« sè c¸c d¹ng
x¸c ®Þnh kh¸ng nguyªn kh¸c nhau. §Ó cã hÖ thèng phßng thñ ®ñ m¹nh chèng l¹i nh÷ng
biÕn ®æi nµy, c¸c gen m· hãa kh¸ng thÓ ®−îc trang bÞ mét c¬ chÕ bæ sung lµ kh¶ n¨ng
siªu ®ét biÕn. Nhê vËy c¬ thÓ cã thÓ ®¸p øng ®−îc c¸c lo¹i kh¸ng nguyªn míi xuÊt hiÖn
sau nµy.

9.7. Sù chuyÓn ®æi líp kh¸ng thÓ


Vµo thêi ®iÓm mµ sù tæng hîp c¸c kh¸ng thÓ b¾t ®Çu diÔn ra ë c¸c tÕ bµo lympho
B ®ang biÖt hãa, th× hÖ gen cã ®Çy ®ñ c¸c ph©n ®o¹n CH n»m c¸ch biÖt khái ph©n ®o¹n
ADN dung hîp LHVHDJH (h×nh 9.12). Do líp kh¸ng thÓ ®−îc qui ®Þnh bëi tr×nh tù m·
hãa vïng æn ®Þnh (CH) gÇn ph©n ®o¹n LHVHDJH nhÊt nªn líp kh¸ng thÓ ®Çu tiªn ®−îc
s¶n sinh nh»m ®¸p øng mét kh¸ng nguyªn míi lu«n lµ IgM (s¶n phÈm cña ph©n ®o¹n
CHµ). Tuy nhiªn, sau ®ã c¸c t−¬ng bµo b¾t ®Çu t¹o ra c¸c líp kh¸ng thÓ kh¸c (mang mét
trong c¸c chuçi nÆng IgD, IgG, IgE vµ IgA). Qu¸ tr×nh nµy ®−îc gäi lµ sù chuyÓn ®æi
líp kh¸ng thÓ.
Sù chuyÓn ®æi líp kh¸ng thÓ ban ®Çu diÔn IgM IgG IgA
IgD IgE
ra khi mét sè t−¬ng bµo nhÊt ®Þnh cã thÓ ®ång
thêi t¹o ra c¶ hai lo¹i kh¸ng thÓ lµ IgM vµ IgD.
§iÓm ®¸ng l−u ý lµ hai lo¹i kh¸ng thÓ nµy chØ LHVHDJH CH TÕ bµo B s¶n sinh
kh¸c nhau ë vïng ®¸p øng miÔn dÞch (vïng æn kh¸ng thÓ IgM
ChuyÓn ®æi thµnh
®Þnh ®Çu C), cßn gièng nhau ë vïng liªn kÕt líp kh¸ng thÓ IgG
kh¸ng nguyªn (do ®Òu lµ kÕt qu¶ dung hîp gi÷a IgG
IgE IgA
c¸c ph©n ®o¹n VκJκ hoÆc VλJλ víi c¸c ph©n ®o¹n
VHDJH cïng lo¹i). ë c¸c tÕ bµo nµy, mét tiÒn- T−¬ng bµo s¶n sinh
mARN duy nhÊt bao gåm c¶ hai ®o¹n CHµ vµ CHδ ChuyÓn ®æi thµnh kh¸ng thÓ IgG
líp kh¸ng thÓ IgE
®−îc h×nh thµnh trong qu¸ tr×nh phiªn m·.
Trong giai ®o¹n hoµn thiÖn mARN, tr×nh tù IgE IgA
T−¬ng bµo s¶n sinh
VHDJH ®−îc ghÐp nèi hoÆc víi CHµ hoÆc víi CHδ kh¸ng thÓ IgE
t¹o nªn hai lo¹i mARN hoµn thiÖn kh¸c nhau. ChuyÓn ®æi thµnh
KÕt qu¶ lµ, c¶ hai lo¹i kh¸ng thÓ ®Òu ®−îc t¹o ra líp kh¸ng thÓ IgE
trong cïng tÕ bµo. IgA
T−¬ng bµo s¶n sinh
kh¸ng thÓ IgA
ë c¸c t−¬ng bµo kh¸c, sù chuyÓn ®æi líp
kh¸ng thÓ lµ tõ IgM sang IgG, IgE vµ IgA. KiÓu H×nh 9.12. Sù chuyÓn ®æi c¸c líp kh¸ng thÓ
chuyÓn líp kh¸ng thÓ nµy còng do sù t¸i tæ hîp theo c¬ chÕ t¸i tæ hîp ADN ë tÕ bµo soma.
Líp kh¸ng thÓ ®−îc x¸c ®Þnh bëi tr×nh tù m· hãa
hÖ gen theo kiÓu c¾t bá c¸c ph©n ®o¹n CH n»m vïng æn ®Þnh cña chuçi nÆng (CH) ë gÇn ph©n
gÇn ®o¹n LHVHDJH nhÊt. Líp kh¸ng thÓ ®−îc t¹o ®o¹n LHVHDJH nhÊt. Do vËy, líp kh¸ng thÓ ®Çu
tiªn ®−îc s¶n sinh ®Ó ®¸p øng víi mét kh¸ng
ra sau mçi lÇn t¸i tæ hîp ®−îc qui ®Þnh bëi ph©n nguyªn míi lu«n lµ IgM. Sù chuyÓn ®æi líp kh¸ng
®o¹n CH cßn l¹i n»m gÇn ph©n ®o¹n LHVHDJH thÓ lµ do sù c¾t bá c¸c ®o¹n tr×nh tù n»m gi÷a
ph©n ®o¹n J vµ c¸c ph©n ®o¹n CH kh¸c lo¹i.
h¬n c¶.

9.8. Sù t¸i tæ hîp ë c¸c gen m· hãa thô thÓ tÕ bµo T


Gièng nh− c¸c chuçi nÆng cña kh¸ng thÓ, hai chuçi polypeptide cña thô thÓ tÕ bµo
T ®−îc m· hãa bëi c¸c ph©n ®o¹n L-V, D, J vµ C. Vïng biÕn ®æi cña thô thÓ tÕ bµo T ®−îc
m· hãa bëi nhiÒu lo¹i ph©n ®o¹n L-V, D vµ J kh¸c nhau; trong khi vïng æn ®Þnh ®−îc m·
hãa bëi mét sè Ýt c¸c ph©n ®o¹n C. C¸c gen m· hãa thô thÓ tÕ bµo T ®−îc r¸p nèi b»ng

283
§inh §oµn Long

viÖc s¾p xÕp l¹i c¸c ph©n ®o¹n ADN trong tÕ bµo soma cïng víi qu¸ tr×nh biÖt hãa c¸c tÕ
bµo T tõ c¸c tÕ bµo gèc, còng gièng nh− c¸ch c¸c gen m· hãa kh¸ng thÓ h×nh thµnh trong
qu¸ tr×nh biÖt hãa c¸c tÕ bµo lympho B. C¸c chuçi polypeptide thô thÓ kiÓu α vµ β ®−îc
m· hãa bëi c¸c ph©n ®o¹n gen ®−îc s¾p xÕp trong c¸c côm locut gièng nh− c¸c ph©n ®o¹n
ADN m· hãa cho c¸c chuçi nÆng vµ nhÑ cña kh¸ng thÓ. ë ng−êi, côm locut gen m· hãa
cho c¸c chuçi α vµ β cña thô thÓ tÕ bµo T n»m t−¬ng øng trªn c¸c NST sè 14 vµ 7.

9.9. §iÒu hßa sù biÓu hiÖn cña c¸c gen m· hãa kh¸ng thÓ
Trong tÕ bµo gèc m¸u, th«ng th−êng c¸c ph©n ®o¹n gen m· hãa kh¸ng thÓ chØ ®−îc
phiªn m· ë møc rÊt thÊp, thËm chÝ kh«ng ®−îc phiªn m·. Trong khi ë c¸c t−¬ng bµo, 10 -
20% tæng sè mARN lµ b¶n phiªn m· cña gen m· hãa kh¸ng thÓ. YÕu tè nµo ®· ho¹t hãa
c¸c gen m· hãa kh¸ng thÓ trong qu¸ tr×nh biÖt hãa c¸c tÕ bµo lympho? T¹i sao mçi lo¹i
t−¬ng bµo chØ s¶n sinh mét lo¹i kh¸ng thÓ ®Æc tr−ng cho kh¸ng nguyªn duy nhÊt?

9.9.1. Lo¹i bá alen lµ c¬ chÕ ®Ó mçi tÕ bµo chØ biÓu hiÖn mét b¶n sao cña gen
T¹i sao mçi t−¬ng bµo chØ t¹o ra mét lo¹i kh¸ng thÓ? Chóng ta biÕt r»ng, c¸c tÕ bµo
soma ë ®éng vËt cã vó th−êng ë d¹ng l−ìng béi. Chóng mang hai b¶n sao kh¸c nhau cña
gen m· hãa c¸c chuçi polypeptide kh¸ng thÓ. Tuy vËy, sau qu¸ tr×nh biÖt hãa c¸c tÕ bµo
B, chØ cã mét chuçi nhÑ duy nhÊt vµ chuçi nÆng duy nhÊt ®−îc t¹o ra. HiÖn t−îng nµy
®−îc gäi lµ sù lo¹i bá alen (v× mét trong hai b¶n sao kh«ng biÓu hiÖn). §iÒu nµy x¶y ra
nh− thÕ nµo? C¬ chÕ chi tiÕt liªn quan ®Õn hiÖn t−îng nµy ®Õn nay ch−a râ. Nh−ng, mét
sè b»ng chøng cho thÊy, ë phÇn lín tr−êng hîp sù t¸i tæ hîp tr×nh tù ADN x¶y ra trªn c¶
hai alen trong mét tÕ bµo (theo c¬ chÕ m« t¶ ë trªn), tuy vËy chØ cã mét kiÓu t¸i tæ hîp
(mét alen) ®−îc biÓu hiÖn. C¸c alen kh«ng biÓu hiÖn th−êng chØ ®−îc r¸p nèi mét phÇn
hoÆc bÞ c¾t bá ®i mét sè tr×nh tù quan träng. HËu qu¶ cña sù lo¹i bá alen lµ nguyªn lý c¬
b¶n cña viÖc cã thÓ t¹o ra mét l−îng lín kh¸ng thÓ nhÊt ®Þnh cã kh¶ n¨ng g¾n kÕt ®Æc
thï víi mét lo¹i epitop nµo ®ã. Kh¸ng thÓ ®−îc t¹o ra nh− vËy ®−îc gäi lµ c¸c kh¸ng
thÓ ®¬n dßng.

9.9.2. Sù t¨ng c−êng biÓu hiÖn c¸c gen m· hãa chuçi nÆng ë c¸c m«
B»ng c¬ chÕ nµo c¸c gen m· hãa kh¸ng thÓ ®−îc ho¹t hãa (biÓu hiÖn m¹nh) sau qu¸
tr×nh r¸p nèi c¸c ph©n ®o¹n gen? Trong c¶ hai tr−êng hîp c¸c gen m· hãa chuçi nÆng vµ
nhÑ, c©u tr¶ lêi lµ sù r¸p nèi c¸c ph©n ®o¹n gen m· hãa kh¸ng thÓ ®· ®−a c¸c promoter
n»m ng−îc dßng ph©n ®o¹n LV ®Õn gÇn mét tr×nh tù enhancer (®−îc kÝ hiÖu lµ E trªn c¸c
h×nh 9.8 vµ 9.9) ho¹t ®éng m¹nh trong vïng intron gi÷a hai ph©n ®o¹n J vµ C. Mçi ph©n
®o¹n LV chøa mét promoter (kÝ hiÖu P trªn h×nh). Tr−íc khi x¶y ra c¸c qu¸ tr×nh t¸i tæ
hîp hÖ gen, c¸c promoter n»m c¸ch xa c¸c enhancer (kÝ hiÖu E trªn h×nh) hµng tr¨m
ngµn baz¬ nit¬; lóc nµy, c¸c enhancer kh«ng thÓ ho¹t hãa ®−îc c¸c promoter, nªn c¸c
kh¸ng thÓ kh«ng ®−îc tæng hîp. Trong qu¸ tr×nh biÖt hãa tÕ bµo B, sù ghÐp nèi c¸c ph©n
®o¹n gen ®· ®−a c¸c promoter ®Õn gÇn c¸c enhancer (kho¶ng c¸ch < 2 Kb). Lóc nµy,
enhancer ho¹t hãa m¹nh c¸c promoter nªn sù tæng hîp c¸c kh¸ng thÓ diÔn ra m¹nh mÏ.
§iÓm ®¸ng chó ý lµ ho¹t ®éng cña enhancer th−êng cã tÝnh ®Æc tr−ng m«; nghÜa lµ, nã chØ
“ho¹t ®éng” ë c¸c tÕ bµo B vµ t−¬ng bµo, mµ kh«ng ho¹t ®éng ë c¸c tÕ bµo kh¸c. Cã thÓ dù
®o¸n sù ho¹t hãa nµy cÇn mét hoÆc mét sè c¸c yÕu tè phiªn m· chØ ®−îc tæng hîp trong
c¸c tÕ bµo cña hÖ miÔn dÞch.

284
Ch−¬ng 10

di truyÒn häc ph©n tö vµ tiÕn hãa


N¨m 1859, Charles Darwin c«ng bè t¸c phÈm “Nguån gèc c¸c loµi” vµ ®−îc coi lµ
thuyÕt tiÕn hãa quan träng bËc nhÊt ®Õn nay. Trong 6 n¨m (1931 - 1936), Darwin ®· ®i
cïng ®oµn th¸m hiÓm cña Beagle vµ thu thËp ®−îc nhiÒu sè liÖu, h×nh ¶nh, mÉu hãa
th¹ch cña c¸c loµi ®éng, thùc vËt tõ nhiÒu vïng ®Þa lý kh¸c nhau trªn Tr¸i ®Êt. Sau nµy,
«ng sö dông nhiÒu n¨m ®Ó so s¸nh, ph©n tÝch c¸c sè liÖu vµ mÉu vËt. Trªn c¬ së c¸c
nghiªn cøu cña m×nh, Darwin lµ ng−êi ®Çu tiªn ®−a ra nhËn ®Þnh r»ng “tÊt c¶ c¸c d¹ng
sèng ®· vµ ®ang tån t¹i trªn Tr¸i ®Êt cã lÏ ®Òu xuÊt ph¸t tõ mét tæ tiªn nguyªn thñy nµo
®ã” vµ “mçi loµi sinh vËt kh«ng bÊt biÕn mµ c¸c quÇn thÓ cña chóng biÕn ®æi dÇn dµ liªn
tôc qua thêi gian lµ nguyªn nh©n dÉn ®Õn sù h×nh thµnh c¸c loµi míi d−íi t¸c ®éng cña
chän läc tù nhiªn”. §ã còng chÝnh lµ nh÷ng néi dung c¬ b¶n cña ThuyÕt tiÕn hãa Darwin.
Dï ngay trong ngµy ®Çu c«ng bè, t¸c phÈm cña «ng víi 1250 b¶n in ®· ®−îc b¸n hÕt,
nh−ng thùc tÕ lý thuyÕt mµ Darwin ®−a ra lóc ®ã ®· g©y nªn nhiÒu hoµi nghi.
§Õn nay, dï ®· trßn 150 n¨m kÓ tõ ngµy t¸c phÈm “Nguån gèc c¸c loµi” ®−îc c«ng
bè, thuyÕt tiÕn hãa Darwin vÉn ®−îc xem lµ mét lý thuyÕt c¬ b¶n cña sinh häc hiÖn ®¹i.
Tuy vËy, tõ n¨m 1953 khi Watson vµ Crick lµm s¸ng tá cÊu tróc cña vËt chÊt di truyÒn
(ADN), c¸c nghiªn cøu di truyÒn häc ph©n tö ®· “bïng næ” vµ bæ sung ngµy cµng ®Çy ®ñ
h¬n c¸c c¬ së khoa häc cho thÊy sù tiÕn hãa thùc chÊt b¾t ®Çu tõ cÊp ph©n tö, mµ cô thÓ
lµ tõ bªn trong c¸c chuçi xo¾n kÐp ADN (ë hÇu hÕt sinh vËt) vµ ARN (ë mét sè virut).
Trong ch−¬ng nµy, chóng ta sÏ ®Ò cËp ®Õn mét sè néi dung c¬ b¶n cña TiÕn hãa ph©n tö.

10.1. Sù gièng nhau trong hÖ gen hÇu hÕt c¸c loµi ®éng vËt
ViÖc so s¸nh hÖ gen gi÷a c¸c loµi ®éng vËt trong thêi gian gÇn ®©y ®−a ®Õn mét
nhËn ®Þnh chung næi bËt lµ c¸c loµi ®éng vËt cã phÇn lín gen gièng nhau. C¶ ba hÖ gen
®éng vËt cã x−¬ng sèng (§VCXS) ®· ®−îc gi¶i tr×nh tù hoµn chØnh, gåm c¸ nãc (Fugu
rubripes), chuét (Mus musculus) vµ ng−êi (Homo sapiens) ®Òu chøa kho¶ng 20.000 –
25.000 gen. Trõ mét vµi ngo¹i lÖ, hÇu hÕt c¸c gen ®−îc t×m thÊy ë ng−êi ®Òu cã “b¶n sao”
t−¬ng øng ë chuét. Nãi c¸ch kh¸c, hÇu nh− kh«ng cã mét “ph¸t minh” nµo míi trong
kho¶ng 50 triÖu n¨m kÓ tõ khi chuét vµ ng−êi t¸ch li tiÕn hãa tõ tæ tiªn chung. T−¬ng tù
nh− vËy, hÖ gen ng−êi vµ c¸ nãc cïng së h÷u mét l−îng lín c¸c gen gièng nhau ®−îc h×nh
thµnh tõ kho¶ng 400 triÖu n¨m tr−íc. Mét ®iÒu ng¹c nhiªn lµ sè gen trong hÖ gen ng−êi
vµ c¸ nãc gÇn t−¬ng ®−¬ng nhau, trong ®ã 3/4 sè gen cña hai loµi t−¬ng ®ång víi nhau.
Sù b¶o thñ trong hÖ gen c¸c loµi §VCXS thËm chÝ cßn më réng ®Õn mét sè loµi kh¸c
thuéc ngµnh d©y sèng, nh− søa biÓn Ciona intestinalis. Mét nöa sè gen trong hÖ gen loµi
søa nµy ®−îc t×m thÊy ë c¸c loµi §VCXS vµ tæ tiªn chung cña chóng ph©n li kho¶ng 500
triÖu n¨m tr−íc. C¸c nghiªn cøu di truyÒn gÇn ®©y cho thÊy, viÖc t¨ng sè l−îng c¸c gen ë
§VCXS chñ yÕu lµ do sù lÆp l¹i cña c¸c gen vèn ®· cã s½n tõ thêi kú xuÊt hiÖn tæ tiªn
chung cña §VCXS vµ søa biÓn. Ch¼ng h¹n, søa biÓn cã 6 gen m· hãa yÕu tè t¨ng tr−ëng
nguyªn bµo sîi FGF. Mçi gen nµy ®−îc lÆp l¹i trung b×nh kho¶ng 4 lÇn ë c¸c hÖ gen ®éng
vËt cã vó nãi chung; trong ®ã, c¸c hÖ gen chuét vµ ng−êi chøa Ýt nhÊt 22 gen FGF. Sù b¶o
thñ trong hÖ gen c¸c loµi thuéc ngµnh d©y sèng cßn më réng tíi c¸c ngµnh kh¸c. HÖ gen
cña ba loµi ®éng vËt thuéc liªn ngµnh ®éng vËt lét x¸c (Ecdysozoa) lµ giun trßn, ruåi
giÊm vµ muçi, ®· ®−îc gi¶i tr×nh tù hoµn chØnh. KÕt qu¶ so s¸nh hÖ gen cña chóng cho
thÊy: hÖ gen mçi loµi ®Òu chøa kho¶ng 15.000 gen, t−¬ng ®−¬ng víi hÖ gen cña søa biÓn.
285
§inh §oµn Long

Sù t¨ng lªn vÒ sè l−îng gen ë §VCXS t−¬ng ®ång víi c¸c loµi ®éng vËt lét x¸c nªu trªn
còng chñ yÕu lµ do sù lÆp l¹i cña c¸c gen chø kh«ng ph¶i do sù h×nh thµnh c¸c gen míi.
Mét c©u hái ®Æt ra lµ: b»ng c¸ch nµo sù lÆp l¹i cña c¸c gen l¹i t¹o ®−îc sù ®a d¹ng
phong phó ë ®éng vËt nh− chóng ta thÊy hiÖn nay? Cã hai c¸ch gi¶i thÝch ®iÒu nµy:
- Theo c¸ch thø nhÊt, gen nguyªn thñy qua nhiÒu lÇn nh©n ®«i (lÆp l¹i) t¹o nªn
nhiÒu b¶n sao kh¸c nhau. Sau ®ã, vïng m· hãa cña c¸c b¶n sao nµy bÞ ®ét biÕn,
dÉn ®Õn sù thay ®æi ho¹t tÝnh hoÆc ®«i chót vÒ chøc n¨ng gen. Trong nhiÒu
tr−êng hîp, kiÓu thay ®æi nµy kh«ng nhÊt thiÕt dÉn ®Õn sù h×nh thµnh c¸c gen
cã chøc n¨ng hoµn toµn míi. Thay vµo ®ã, nã th−êng t¹o nªn c¸c lo¹i protein cã
chøc n¨ng liªn quan tíi nhau, chØ kh¸c nhau chñ yÕu vÒ ho¹t tÝnh hoÆc ho¹t lùc.
- Theo c¸ch thø hai, c¸c gen sau khi ®−îc lÆp l¹i còng bÞ ®ét biÕn nh−ng kh«ng
liªn quan ®Õn vïng m· hãa. Thay vµo ®ã, nã ®−îc tæ hîp víi c¸c tr×nh tù ADN
®iÒu hßa míi (hoÆc tr×nh tù ®iÒu hßa cò bÞ biÕn ®æi ®i). Qua ®ã, c¸c b¶n sao
kh¸c nhau cña gen ®−îc biÓu hiÖn theo c¸ch míi trong qu¸ tr×nh ph¸t triÓn c¸
thÓ ë mçi loµi.
VÝ dô ë gen FGF cña §VCXS nªu trªn, víi 22 b¶n sao cã trong tÕ bµo, c¸ch biÓu
hiÖn cña gen nµy ë c¸c loµi §VCXS ®a d¹ng h¬n nhiÒu so víi khi nã chØ cã mét b¶n sao
duy nhÊt ë ruåi Drosophila. NÕu nh− ë c¬ quan h« hÊp trong qu¸ tr×nh ph¸t triÓn ph«i
cña c¶ ruåi giÊm vµ §VCXS, gen FGF ®Òu ®−îc biÓu hiÖn; th× ë §VCXS, gen nµy cßn
®−îc biÓu hiÖn ë ch©n, trong khi ë ruåi giÊm th× kh«ng. Nh− vËy, ë ®©y, sù “tiÕn hãa” cña
c¸c tr×nh tù ®iÒu hßa cã vai trß quyÕt ®Þnh vµ lµm thay ®æi c¸ch biÓu hiÖn cña c¸c b¶n sao
kh¸c nhau cña cïng mét gen ë c¸c m«, c¬ quan kh¸c nhau; còng nh− lµ kh¸c nhau ë c¸c
loµi kh¸c nhau.
Víi hai c¸ch tiÕn hãa nªu trªn, chóng ta thÊy: sù ®a d¹ng sinh häc cã thÓ ®−îc t¹o
ra tõ sù lÆp l¹i cña c¸c gen. Theo c¸ch thø nhÊt, chøc n¨ng cña gen ®−îc c¶i biÕn ®«i chót
bëi c¸c ®ét biÕn trong vïng m· hãa gen. Cßn theo c¸ch thø hai, c¸c b¶n sao kh¸c nhau
cña gen ®−îc biÓu hiÖn theo c¸ch kh¸c nhau ë c¸c c¬ quan kh¸c nhau trªn cïng c¬ thÓ.
Víi mét sè gen, ng−êi ta thÊy c¶ hai c¬ chÕ nµy cïng ho¹t ®éng. VÝ dô nh− ë côm gen m·
hãa globin cña ng−êi, sù lÆp l¹i cña c¸c gen kh«ng chØ t¹o nªn sù ®a d¹ng vÒ chøc n¨ng
cña c¸c lo¹i globin kh¸c nhau, mµ c¸ch biÓu hiÖn cña chóng còng kh¸c nhau. TÊt c¶ c¸c
protein do c¸c gen globin m· hãa ®Òu cã chøc n¨ng (trong hemoglobin) liªn kÕt vµ vËn
chuyÓn oxy. Tuy nhiªn, mçi lo¹i globin kh¸c nhau vÒ ¸i lùc liªn kÕt víi oxy vµ chóng ®−îc
biÓu hiÖn vµo c¸c giai ®o¹n kh¸c nhau cña qu¸ tr×nh ph¸t triÓn c¬ thÓ. H×nh 10.1 minh

C¸c loµi c¸ mËp


β (c¸ mËp)
L−ìng c− vµ chim
β (gµ)
Gen β
Thó ®¬n huyÖt
§éng vËt cã x−¬ng sèng β (r¸i c¸)
gen ε
gen γ ε (ng−êi)
γ (ng−êi)
Thó cã gen “γ”
§éng vËt
guèc "γ" (bß)
cã vó
β (bß)
gen δ-globin
Thó cã Linh tr−ëng δ (ng−êi)
nhau thai β (ng−êi)
β (khØ rezut)

H×nh 10.1. Sù lÆp l¹i c¸c gen thuéc hä gen β-globin trong qu¸ tr×nh tiÕn hãa ë ®éng vËt cã x−¬ng sèng
(theo Griffiths et al, 2000, An Introduction to genetic analysis, tr.787)

286
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

häa sù tiÕn hãa c¸c gen β-globin. ë ng−êi, bèn gen cã liªn quan ®Õn β-globin ®−îc h×nh
thµnh theo c¬ chÕ lÆp l¹i, gåm ε-, γ-, δ- vµ β-globin. Bèn gen nµy kh¸c nhau ®«i chót vÒ
c¸ch biÓu hiÖn vµ cÊu tróc cña protein mµ chóng m· hãa. C¸c chuçi ε- vµ γ-globin cã ¸i
lùc víi oxy lín h¬n δ vµ β. Nh÷ng chuçi nµy ®−îc tæng hîp vµ sö dông trong giai ®o¹n bµo
thai (lµ lóc mµ chøc n¨ng phæi ch−a ®Çy ®ñ vµ sù hÊp thu khÝ oxy cña bµo thai chñ yÕu
qua m¸u cña mÑ). C¸c chuçi δ- vµ β-globin liªn kÕt víi oxy víi ¸i lùc thÊp h¬n, ®−îc tæng
hîp ë giai ®o¹n s¬ sinh vµ tr−ëng thµnh. Nh− vËy, víi c¸c gen m· hãa globin, sù “tiÕn
hãa” trong tr×nh tù m· hãa còng nh− trong tr×nh tù ®iÒu hßa cña c¸c gen ®Òu gãp phÇn
vµo sù chuyªn hãa cña c¸c lo¹i chuçi globin kh¸c nhau ®−îc t¹o ra ë §VCXS.
Nh−ng, cÇn kh¼ng ®Þnh r»ng sù tiÕn hãa cña c¸c sinh vËt nãi chung ®Ó cã ®−îc sù
®a d¹ng nh− ngµy nay kh«ng nhÊt thiÕt ph¶i th«ng qua sù lÆp l¹i cña c¸c gen. Cô thÓ lµ,
trong tÊt c¶ c¸c c¬ thÓ sèng, vi khuÈn cã hÖ gen ®a d¹ng nhÊt vµ chóng cã kh¶ n¨ng sèng
trong nh÷ng ®iÒu kiÖn m«i tr−êng rÊt kh¸c nhau. C¸c vi khuÈn ®¬n gi¶n nhÊt h×nh
thµnh c¸ch ®©y kho¶ng 3 tØ n¨m, trong khi c¸c loµi ®éng vËt cæ x−a nhÊt h×nh thµnh c¸ch
®©y kho¶ng trªn d−íi 500 triÖu n¨m. §Æc ®iÓm tiÕn hãa nhanh cña hÖ gen vi khuÈn, cïng
víi lÞch sö tiÕn hãa l©u dµi cña chóng ®· gióp chóng cã ®−îc nhiÒu c¬ chÕ trao ®æi chÊt
kh¸c nhau. Nhê vËy, chóng sèng ®−îc ë nhiÒu m«i tr−êng sèng rÊt kh¸c nhau. Mét sè vi
khuÈn cã kh¶ sèng ®−îc trong m«i tr−êng nhiÖt ®é cao ë gÇn c¸c miÖng nói löa n»m s©u
d−íi ®¸y biÓn, mét sè kh¸c cã thÓ sèng ë c¸c suèi n−íc nãng cã hµm l−îng l−u huúnh (S)
cao. Sè l−îng gen vµ lo¹i gen (chuyªn hãa vÒ chøc n¨ng) trong hÖ gen cña c¸c loµi vi
khuÈn kh¸c nhau lµ rÊt kh¸c nhau. C¸c vi khuÈn ®¬n gi¶n nhÊt (mycoplasma) chØ cã
kho¶ng 500 gen, trong khi nh÷ng vi khuÈn phøc t¹p nhÊt (nh− Streptomyces) cã trªn
7000 gen. Nh− vËy, sù kh¸c biÖt vÒ sè l−îng gen trong hÖ gen c¸c loµi vi khuÈn lªn ®Õn
hµng chôc lÇn. §iÒu nµy lµ kh¸c víi c¸c hÖ gen ®éng vËt vèn cã sè gen kh¸c biÖt tèi ®a chØ
kho¶ng 2 lÇn. ë vi khuÈn, thËm chÝ c¸c loµi cã quan hÖ gÇn còng cã møc ®é kh¸c biÖt lín
vÒ hÖ gen. Ch¼ng h¹n, vi khuÈn Staphococcus vµ E. coli t¸ch ra tõ tæ tiªn chung c¸ch ®©y
kho¶ng 50 triÖu n¨m, tøc lµ t−¬ng ®−¬ng víi thêi gian ph©n li gi÷a tæ tiªn cña ng−êi vµ
chuét. Nh−ng, c¸c gen m· hãa protein cña hai vi khuÈn nµy chØ gièng nhau 75%, cßn 25%
sè gen cßn l¹i cña chóng lµ ®Æc thï vµ kh«ng cã ë loµi kia.
Nh− vËy, nÕu nh− ®éng vËt vèn cã m«i tr−êng sèng h¹n chÕ vµ c¸c con ®−êng trao
®æi chÊt gièng nhau vµ sù ®a d¹ng kiÓu h×nh cña chóng cã xu h−íng phô thuéc vµo sù lÆp
l¹i vµ thay ®æi ho¹t tÝnh (chø kh«ng ph¶i chøc n¨ng) cña c¸c “tæ hîp” gen vèn cã; th×,
ng−îc l¹i, hÖ gen cña c¸c loµi vi khuÈn cã møc ®é t−¬ng ®ång rÊt thÊp. D−êng nh− ®Ó tån
t¹i vµ ph¸t triÓn ®−îc trong c¸c m«i tr−êng sèng kh¸c nhau, sù h×nh thµnh c¸c gen míi
(vÒ chøc n¨ng) gi÷ vai trß quyÕt ®Þnh.

10.2. C¸c con ®−êng thay ®æi sù biÓu hiÖn cña gen trong tiÕn hãa
C¸c gen ®−îc thay ®æi c¸ch ®iÒu hßa biÓu hiÖn trong qu¸ tr×nh tiÕn hãa nh− thÕ
nµo? ë ch−¬ng 5, chóng ta ®· biÕt, hÖ gen cña mäi sinh vËt ®Òu chøa c¸c gen m· hãa
protein cã vai trß ®iÒu khiÓn sù biÓu hiÖn cña c¸c gen kh¸c trong hÖ gen, gäi lµ c¸c gen
®iÒu hßa. PhÇn lín c¸c protein do c¸c gen nµy m· hãa lµ c¸c yÕu tè ®iÒu hßa phiªn m·,
nh−ng còng cã mét sè protein t¸c ®éng vµo c¸c b−íc kh¸c cña qu¸ tr×nh biÓu hiÖn gen (tõ
phiªn m· ®Õn sau dÞch m·). Mét nhãm gen ®iÒu hßa ®−îc t×m thÊy gÇn ®©y ®−îc gäi lµ
“c¸c gen quy ®Þnh kiÓu biÓu hiÖn”. Sù thay ®æi vÒ ho¹t tÝnh còng nh− kiÓu biÓu hiÖn cña
nh÷ng gen nµy trong qu¸ tr×nh tiÕn hãa ®· dÉn ®Õn sù thay ®æi c¸c ®Æc ®iÓm ph¸t sinh
h×nh th¸i vµ ph¸t triÓn ë ®éng vËt. Chøc n¨ng ®Æc thï cña nh÷ng gen thuéc nhãm nµy lµ
®iÒu khiÓn sù h×nh thµnh chÝnh x¸c c¸c cÊu tróc trong qu¸ tr×nh ph¸t triÓn c¬ thÓ. Nªn,
nÕu nh÷ng gen nµy ho¹t ®éng kh«ng chÝnh x¸c, th× c¸c cÊu tróc c¬ thÓ cã thÓ ®−îc h×nh
thµnh sai vÞ trÝ. VÝ dô nh− ë ruåi giÊm, mét gen quy ®Þnh kiÓu biÓu hiÖn kÝ hiÖu lµ Pax6

287
§inh §oµn Long

khi kh«ng biÓu hiÖn ®óng, dÉn ®Õn “®ét biÕn” h×nh thµnh m¾t ë ch©n. Trong phÇn sau,
chóng ta sÏ thÊy mét sè vÝ dô kh¸c n÷a.
Mét hÖ gen ®éng vËt trung b×nh chøa kho¶ng 1000 gen m· hãa c¸c protein ®iÒu hßa
kh¸c nhau. §Õn nay, ch−a cã sè liÖu vÒ sè l−îng c¸c “gen x¸c ®Þnh kiÓu biÓu hiÖn” cã mÆt
trong mçi hÖ gen. Nh−ng, chóng ®−îc xÕp lµ mét nhãm nhá cña c¸c gen ®iÒu hßa. §Ó x¸c
®Þnh ®−îc sè l−îng c¸c “gen quy ®Þnh kiÓu biÓu hiÖn”, cã lÏ ph¶i t¹o ra c¸c ®ét biÕn mang
c¸c gen ®iÒu hßa biÓu hiÖn sai, råi theo dâi c¸c bÊt th−êng xuÊt hiÖn trong qu¸ tr×nh ph¸t
sinh h×nh th¸i cña ®éng vËt. HiÖn nay, ng−êi ta −íc ®o¸n cã kho¶ng 10% gen ®iÒu hßa ë
®éng vËt cã thÓ lµ c¸c “gen quy ®Þnh kiÓu biÓu hiÖn”. NghÜa lµ, mét hÖ gen ®éng vËt trung
b×nh sÏ cã kho¶ng 100 gen cã chøc n¨ng quy ®Þnh kiÓu biÓu hiÖn cña nh÷ng gen kh¸c
trong hÖ gen. ë phÇn tiÕp theo, chóng ta sÏ thÊy b»ng c¸ch nµo sù thay ®æi ho¹t tÝnh vµ
c¸ch huy ®éng c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” l¹i cã thÓ t¹o ra sù ®a d¹ng sinh häc
trong qu¸ tr×nh tiÕn hãa.
Nh×n chung, cã ba c¸ch c¬ b¶n lµm thay ®æi ho¹t tÝnh cña gen quy ®Þnh kiÓu biÓu hiÖn:
1) B¶n th©n mét “gen quy ®Þnh kiÓu biÓu hiÖn” cã thÓ ®−îc biÓu hiÖn theo mét c¸ch
míi. Sù thay ®æi nµy dÉn ®Õn viÖc nh÷ng gen kh¸c mµ nã ®iÒu khiÓn (gäi lµ c¸c
gen ®Ých) còng sÏ biÓu hiÖn theo c¸c c¸ch míi.
2) C¸c protein ®iÒu hßa ®−îc c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” m· hãa cã thÓ cã
chøc n¨ng míi. Ch¼ng h¹n, miÒn ho¹t hãa phiªn m· cña mét yÕu tè phiªn m· trë
thµnh mét miÒn øc chÕ phiªn m·. V× vËy, mét protein ®iÒu hßa vèn lµ yÕu tè
ho¹t hãa phiªn m· cña mét nhãm gen trë thµnh yÕu tè øc chÕ phiªn m· cña
chÝnh nhãm gen ®ã. Mét ®iÓm ®¸ng chó ý lµ sù thay ®æi ë ®©y liªn quan ®Õn chøc
n¨ng cña protein ®iÒu hßa, nh−ng hËu qu¶ g©y ra ®èi víi qu¸ tr×nh tiÕn hãa l¹i
lµ sù thay ®æi kiÓu biÓu hiÖn cña c¸c gen ®Ých.
3) C¸c gen ®Ých cña mét “gen quy ®Þnh kiÓu biÓu hiÖn” cã thÓ “nhËn” mét tr×nh tù
(ADN) ®iÒu hßa míi, dÉn ®Õn viÖc nã ®−îc ®iÒu khiÓn bëi mét gen ®iÒu hßa míi.
B»ng c¸ch nµy, kiÓu biÓu hiÖn cña gen ®Ých còng thay ®æi.

10.2.1. §ét biÕn “gen quy ®Þnh kiÓu biÓu hiÖn” lµm thay ®æi h×nh th¸i ®éng vËt

10.2.1.1. Sù thay ®æi kiÓu biÓu hiÖn cña gen Pax6 g©y nªn sù h×nh thµnh m¾t sai vÞ trÝ
“Gen quy ®Þnh kiÓu biÓu hiÖn” ®−îc biÕt ®Õn réng r·i nhÊt cã lÏ lµ gen Pax6. Gen
nµy ®iÒu khiÓn sù h×nh thµnh vµ ph¸t triÓn cña m¾t ë phÇn lín (còng cã thÓ lµ tÊt c¶) c¸c
loµi ®éng vËt. Sù thay ®æi vÒ kiÓu biÓu hiÖn cña gen Pax6 cã thÓ lµ nguyªn nh©n c¬ b¶n
dÉn ®Õn sù ®a d¹ng vÒ kiÓu h×nh m¾t gi÷a c¸c loµi ®éng vËt kh¸c nhau.
Th«ng th−êng gen Pax6 chØ ®−îc biÓu hiÖn trong m« m¾t trong qu¸ tr×nh ph¸t triÓn
cña ph«i. Nh−ng, khi ®−îc biÓu hiÖn ë mét m« kh¸c, gen Pax6 cã thÓ lµm h×nh thµnh
“m¾t phô” ë vÞ trÝ m« bÊt th−êng (h×nh 10.2). Thùc nghiÖm ë ruåi giÊm cho thÊy sù thay
®æi biÓu hiÖn gen Pax6 cã thÓ dÉn ®Õn sù h×nh thµnh “m¾t” ë c¸nh vµ ch©n. §iÒu nµy chØ
ra r»ng, cã thÓ sù thay ®æi biÓu hiÖn cña gen Pax6 ®· dÉn ®Õn viÖc m¾t ®−îc h×nh thµnh
t¹i c¸c vÞ trÝ kh¸c nhau ë c¸c ®éng vËt kh¸c nhau. HÇu hÕt c¸c ®éng vËt ®Òu cã mét cÆp
m¾t n»m trong hép sä. Nh−ng sù thay ®æi biÓu hiÖn gen Pax6 cã thÓ lµ nguyªn nh©n dÉn
®Õn sù h×nh thµnh “®iÓm m¾t” ë phÇn ch©n ®Çu cña èc.
Sù thay ®æi kiÓu biÓu hiÖn cña gen Pax6 d−êng nh− kh«ng lµm thay ®æi chøc n¨ng
cña protein Pax6, mµ chñ yÕu t¹o nªn sù ®a d¹ng vÒ vÞ trÝ h×nh thµnh m¾t ë c¸c loµi kh¸c
nhau. §iÒu nµy ®−îc chøng minh bëi nghiªn cøu chuyÓn gen Pax6 tõ mùc èng vµo ruåi
giÊm ®· t¹o nªn c¸ thÓ ruåi giÊm cã “m¾t phô” ë c¸nh vµ ch©n gièng víi c¸ thÓ ruåi giÊm

288
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

cã gen Pax6 cña chÝnh nã ®−îc biÓu hiÖn bÊt th−êng ë nh÷ng m« nµy, dï r»ng hai protein
Pax6 cña mùc èng vµ ruåi giÊm chØ cã 30% tr×nh tù axit amin gièng nhau.

(a) §Üa mÇm ch©n (b)


§Üa mÇm m¾t

Êu trïng
Drosophila

Drosophila
tr−ëng thµnh

C¸ thÓ b×nh th−êng (kiÓu d¹i) C¸ thÓ mang gen "h×nh thµnh m¾t" Pax6 ®−îc
biÓu hiÖn ë tÕ bµo tiÒn ph«i h×nh thµnh ch©n

TÕ bµo tiÒn ph«i m¾t TÕ bµo tiÒn ph«i ch©n TÕ bµo tiÒn ph«i ch©n cã gen Pax6 ®−îc biÓu hiÖn “bÊt th−êng”

H×nh 10.2. Sù biÓu hiÖn gen Pax6 (cßn gäi lµ gen ey) vµ h×nh thµnh “m¾t phô” ë ruåi giÊm.
(a) Sù h×nh thµnh m¾t ë ruåi kiÓu d¹i (b×nh th−êng); (b) "M¾t phô" bÊt th−êng h×nh thµnh ë ch©n do sù
biÓu hiÖn sai vÞ trÞ cña gen Pax6 (theo Albert B. et al, 2002, Molecular Biology of the Cell, tr.426)

10.2.1.2. Sù thay ®æi kiÓu biÓu hiÖn cña gen Antp lµm "¨ngten" chuyÓn thµnh "ch©n"
Mét gen quy ®Þnh kiÓu biÓu hiÖn thø hai ®−îc t×m thÊy ë ruåi giÊm lµ gen Antp.
Gen nµy ®iÒu khiÓn sù ph¸t triÓn phÇn th©n gi÷a cña c«n trïng trong qu¸ tr×nh ph¸t
triÓn ph«i. Tõ phÇn th©n gi÷a nµy h×nh thµnh nªn mét cÆp ch©n cã h×nh th¸i kh¸c biÖt
víi c¸c ch©n tr−íc vµ ch©n sau. Gen Antp m· hãa mét protein ®iÒu hßa b×nh th−êng chØ
®−îc biÓu hiÖn ë phÇn th©n gi÷a, nh−ng kh«ng ®−îc biÓu hiÖn ë phÇn ®Çu. Nh−ng nÕu
mét ®ét biÕn tréi g©y ra bëi ®¶o ®o¹n NST ®−a tr×nh tù m· hãa protein Antp tíi gÇn mét
tr×nh tù ADN ®iÒu hßa míi vèn cã vai trß ®iÒu hßa biÓu hiÖn c¸c gen ë phÇn ®Çu (bao gåm
c¶ ¨ngten) th× ch©n sÏ h×nh thµnh thay cho ¨ng ten t¹i vÞ trÝ ¨ngten.
10.2.1.3. ChuyÓn ®o¹n t−¬ng hç gi÷a hai gen ftz vµ Antp cho thÊy vai trß quan träng vÒ
chøc n¨ng cña protein ®iÒu hßa
§Ó t¹o ra sù ®a d¹ng h×nh th¸i, c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” kh«ng nhÊt thiÕt
ph¶i ho¹t ®éng t¹i c¸c vÞ trÝ kh¸c nhau trong c¬ thÓ. Mét c¬ chÕ thø hai t¹o nªn sù ®a
d¹ng trong qu¸ tr×nh tiÕn hãa lµ nh÷ng thay ®æi vÒ tr×nh tù axit amin vµ chøc n¨ng cña
c¸c protein ®iÒu hßa do nh÷ng gen nµy m· hãa.
ë ®©y, chóng ta sÏ xem vÝ dô vÒ hai “gen quy ®Þnh kiÓu biÓu hiÖn” cã liªn quan víi
nhau ë ruåi giÊm lµ ftz (®iÒu khiÓn sù ph©n ®èt) vµ Antp (®iÒu khiÓn sù h×nh thµnh c¸c c¬
quan phÇn th©n gi÷a). Hai gen nµy h×nh thµnh vµ ph©n li xuÊt ph¸t tõ mét sù kiÖn
“nh©n ®«i” gen tæ tiªn x¶y ra tr−íc khi cã sù t¸ch li tiÕn hãa gi÷a c¸c loµi gi¸p x¸c vµ c«n
trïng kho¶ng 400 triÖu n¨m tr−íc. Hai protein t−¬ng øng ®−îc c¸c gen nµy m· hãa (lµ

289
§inh §oµn Long

Ftz vµ Antp) cã liªn quan víi nhau vµ miÒn liªn kÕt ADN cña chóng rÊt gièng nhau. Tuy
vËy, Ftz vµ Antp l¹i nhËn ra c¸c ®o¹n tr×nh tù ADN kh¸c nhau trong hÖ gen, v× khi ho¹t
®éng, chóng t¹o “dÞ phøc kÐp” víi hai lo¹i protein kh¸c nhau. Mèi t−¬ng t¸c protein –
protein ®−îc quy ®Þnh bëi mét mÉu h×nh (motif) peptide ng¾n n»m ngoµi miÒn liªn kÕt
ADN cña hai protein. Antp chøa motif gåm 4 axit amin lµ YPWM quyÕt ®Þnh sù t¹o “dÞ
phøc kÐp” cña protein nµy víi mét protein ®iÒu hßa phæ biÕn gäi lµ Exd. Ng−îc l¹i, Ftz
mang mét motif gåm 5 axit amin lµ LRALL quyÕt ®Þnh sù t−¬ng t¸c cña protein nµy víi
mét protein ®iÒu hßa phæ biÕn kh¸c cã tªn lµ FtzF1.
DÞ phøc kÐp Ftz-FtzF1 nhËn ra tr×nh tù ADN kh¸c víi Antp-Exd. V× vËy, Ftz vµ
Antp ®iÓu khiÓn sù biÓu hiÖn cña c¸c gen ®Ých kh¸c nhau. Cã mét ®iÒu thó vÞ lµ gen ftz ë
mét sè loµi c«n trïng cæ x−a (nh− loµi mät ngò cèc Tribolium castaneum) cã ®ång thêi hai
motif LRALL vµ YPWM. §iÒu nµy cho thÊy Ftz cña Tribolium cã ®Æc ®iÓm “lai”. Trong
thùc tÕ, khi ng−êi ta chuyÓn gen Ftz cña Tribolium vµo ruåi giÊm, th× c¸ thÓ biÕn ®æi gen
®ång thêi bÞ háng c¶ qu¸ tr×nh ph©n ®èt lÉn sù ph¸t triÓn phÇn th©n gi÷a.

10.2.1.4. BiÕn ®æi nhá trong tr×nh tù t¨ng c−êng cã thÓ t¹o ra kiÓu biÓu hiÖn gen míi
Mét c¬ chÕ thø ba t¹o nªn sù ®a d¹ng trong qu¸ tr×nh tiÕn hãa lµ nh÷ng thay ®æi
trong c¸c enhancer (tr×nh tù t¨ng c−êng) cña c¸c gen ®Ých ®−îc ®iÒu khiÓn bëi c¸c “gen
quy ®Þnh kiÓu biÓu hiÖn”. Trong tr−êng hîp nµy, hoÆc lµ gen ®Ých kh«ng ®−îc biÓu hiÖn
b×nh th−êng, hoÆc lµ chøc n¨ng (hoÆc ho¹t tÝnh) cña protein ®iÒu hßa bÞ thay ®æi.
C¸c nghiªn cøu trªn mét “gen quy ®Þnh kiÓu biÓu hiÖn” ë ruåi giÊm lµ Ubx ®ång
thêi minh häa cho ba c¬ chÕ tiÕn hãa: c¸c gen ®Ých cã kiÓu biÓu hiÖn míi khi gen Ubx cã
sù thay ®æi kiÓu biÓu hiÖn, hoÆc s¶n phÈm protein mµ gen nµy m· hãa thay ®æi, hoÆc cã
sù thay ®æi trong tr×nh tù enhancer cña nã. Gen Ubx b×nh th−êng m· hãa cho mét protein
®iÒu hßa ®iÒu khiÓn sù ph¸t triÓn ®èt th©n thø ba trong qu¸ tr×nh ph¸t triÓn ph«i cña
ruåi giÊm. Gen nµy øc chÕ ®Æc hiÖu sù biÓu hiÖn cña c¸c gen cÇn cho sù ph¸t triÓn ®èt
th©n thø hai (trong ®ã cã Antp). §Ó biÖt hãa ®èt th©n thø ba, Ubx øc chÕ sù biÓu hiÖn cña
Antp ë ®èt th©n nµy. §ét biÕn thiÕu protein øc chÕ Ubx lµm gen Antp ®−îc biÓu hiÖn
m¹nh ë c¶ ®èt th©n thø hai vµ ®èt th©n (a) (b)
thø ba, dÉn ®Õn sù h×nh thµnh hai ®èt
th©n gièng nhau.
10.2.1.5. Sù biÓu hiÖn bÊt th−êng cña gen
Ubx lµm thay ®æi h×nh th¸i ë ruåi giÊm
H×nh 10.3. ThÓ ®ét biÕn Ubx cã ®èt th©n thø hai (T2)
ë ruåi giÊm tr−ëng thµnh b×nh
ph¸t triÓn gièng ®èt th©n thø ba (T3). (a) Ruåi kiÓu d¹i
th−êng, ®èt th©n thø hai (T2) mang mét cã mét ®«i c¸nh thËt (®èt T2) vµ mét ®«i c¸nh phô ë phÝa
®«i ch©n vµ mét ®«i c¸nh, trong khi ®èt sau (®èt T3); (b) Ruåi cã gen Ubx kh«ng biÓu hiÖn ë ®èt
th©n thø ba (T3) chØ mang mét ®«i ch©n T3 h×nh thµnh hai ®«i c¸nh thËt (ë c¶ hai ®èt T2,T3).
vµ mét ®«i c¸nh phô. C¸nh phô cã kÝch
th−íc nhá h¬n nhiÒu so víi c¸nh thËt vµ (a) (b)
chØ cã vai trß gi÷ th¨ng b»ng khi bay
(h×nh 10.3). §ét biÕn gen Ubx dÉn ®Õn
thÓ ®ét biÕn cã kiÓu h×nh gåm 4 c¸nh
thËt. KiÓu h×nh ®ét biÕn nµy mét phÇn do
sù biÓu hiÖn bÊt th−êng cña gen Antp. H×nh 10.4. BiÓu hiÖn sai vÞ trÝ cña gen Ubx dÉn ®Õn
Gen Ubx ®iÒu khiÓn sù h×nh thµnh c¸nh thÓ ®ét biÕn mÊt c¸nh thËt ë ruåi giÊm. (a) C¸ thÓ kiÓu
phô th«ng qua øc chÕ mét sè gen ®Ých d¹i cã gen Ubx chØ biÓu hiÖn ë ®èt T3; (b) C¸ thÓ mang
thiÕt yÕu cho sù ph¸t triÓn cña c¸nh thËt, ®ét biÕn Cbx "ph¸ háng" vïng ®iÒu hßa cña gen Ubx,
lµm gen nµy biÓu hiÖn sai vÞ trÝ (ë c¶ hai ®èt T2 vµ T3),
bao gåm gen Antp.
dÉn ®Õn sù h×nh thµnh nªn hai ®«i c¸nh phô.

290
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

Sù biÓu hiÖn cña gen Ubx ë ®èt th©n T3 phô thuéc vµo mét tr×nh tù ®iÒu hßa cã
kÝch th−íc kho¶ng 80 kb. Cã mét ®ét biÕn gäi lµ Cbx lµm háng tr×nh tù ®iÒu hßa nµy
cña gen Ubx nh−ng kh«ng lµm thay ®æi vïng m· hãa protein Ubx. §ét biÕn Cbx lµm
gen Ubx biÓu hiÖn sai vÞ trÝ ë ®èt th©n T2, ngoµi vÞ trÝ biÓu hiÖn b×nh th−êng cña nã lµ ë
®èt th©n T3 (h×nh 10.4). Lóc nµy, gen Ubx sÏ øc chÕ sù biÓu hiÖn cña gen Antp còng
nh− c¸c gen kh¸c cÇn cho sù ph¸t triÓn b×nh th−êng cña ®èt th©n T2. KÕt qu¶ lµ ®èt
th©n T2 trë thµnh mét “b¶n sao” cña ®èt th©n T3. ThÓ ®ét biÕn nµy gåm tÊt c¶ c¸c c¸nh
®Òu lµ c¸nh phô.
10.2.1.6. Sù thay ®æi chøc n¨ng protein Ubx ¶nh h−ëng ®Õn h×nh th¸i ph«i ruåi giÊm
Trªn ®©y, chóng ta ®· nãi ®Õn chøc n¨ng cña protein Ubx nh− yÕu tè phiªn m· øc
chÕ sù biÓu hiÖn cña gen Antp vµ c¸c “gen ®èt th©n thø hai” trong qu¸ tr×nh ph¸t triÓn
cña ®èt th©n thø ba. Nh−ng theo mét c¬ chÕ kh¸c, mét ®ét biÕn chuyÓn hãa Ubx thµnh
mét yÕu tè ho¹t hãa phiªn m· nh÷ng “gen ®èt th©n thø hai” ®· lµm gen nµy cã chøc n¨ng
gièng gen Antp lµ thóc ®Èy sù ph¸t triÓn cña ®èt th©n thø hai. VÝ dô nµy cho thÊy, sù
thay ®æi chøc n¨ng protein ®iÒu hßa cã thÓ trùc tiÕp lµm thay ®æi kiÓu h×nh.
Protein øc chÕ Ubx ®−îc chuyÓn thµnh protein ho¹t hãa b»ng c¸ch kÕt hîp miÒn
liªn kÕt ADN cña gen Ubx víi miÒn ho¹t hãa cña protein virut VP16. §o¹n gen m· hãa
protein øc chÕ Ubx b×nh th−êng n»m ngoµi miÒn liªn kÕt ADN cña Ubx vµ kh«ng n»m
trong ®o¹n kÕt hîp Ubx-VP16. Sù biÓu hiÖn bÊt th−êng cña protein “dung hîp” Ubx-
VP16 lµm cho tÊt c¶ c¸c ®èt th©n ®Òu ph¸t triÓn gièng ®èt th©n thø hai, chø kh«ng gièng
®èt th©n thø ba nh− trong tr−êng hîp gen Ubx biÓu hiÖn bÊt th−êng. Nh− vËy, chøc n¨ng
cña protein dung hîp Ubx-VP16 gièng protein Antp, chø kh«ng gièng Ubx.
10.2.1.7. Sù thay ®æi tr×nh tù t¨ng c−êng cña gen Ubx lµm thay ®æi kiÓu biÓu hiÖn gen
Gièng víi protein Antp (môc 10.2.1.3),
(a) VÞ trÝ liªn kÕt VÞ trÝ liªn kÕt
Ubx chøa mét motif gåm 4 axit amin YPMM
protein Exd protein HOX
lµ vÞ trÝ t−¬ng t¸c víi Exd. Protein Antp liªn
kÕt víi ADN d−íi d¹ng dÞ phøc kÐp Antp-
TGAT NNATKR
Exd. T−¬ng tù nh− vËy, Ubx liªn kÕt ADN ë
d¹ng dÞ phøc kÐp Ubx-Exd. NhiÒu protein ADN
®iÒu hßa liªn kÕt ADN th«ng qua sù t¹o phøc (b)
kÐp víi protein Exd. Phøc hÖ nµy (gäi t¾t lµ Exd Ubx
Exd-HOX) liªn kÕt vµo mét tr×nh tù nhËn TGAT TT ATKR
biÕt “lai ghÐp”, nghÜa lµ Exd liªn kÕt vµo mét ADN
bªn cña tr×nh tù nhËn biÕt (TGAT), cßn c¸c
protein HOX (nh− Ubx) liªn kÕt vµo bªn liÒn (c)
Exd Labial
kÒ cßn l¹i cña tr×nh tù nhËn biÕt (cã tr×nh tù
A-T-T/G-A/G, xem h×nh 10.5). Hai nöa cña T G A T GG A T K R
tr×nh tù nhËn biÕt (cßn gäi lµ tr×nh tù liªn ADN
øng) th−êng t¸ch biÖt nhau bëi 2 nucleotide. H×nh 10.5. Sù ho¸n ®æi vÞ trÝ liªn kÕt cña c¸c
Hai nucleotide nµy cã vai trß x¸c ®Þnh phøc protein Ubx vµ Labial. HÇu hÕt cña protein HOX
®Òu chøa mét miÒn motif YPWM t−¬ng t¸c víi Exd.
hÖ Exd-HOX nµo ®−îc −u tiªn liªn kÕt. VÝ Mçi tiÓu phÇn cña "dÞ phøc kÐp" Exd-HOX nhËn biÕt
dô, phøc hÖ Exd-Ubx −u tiªn tr×nh tù liªn mét bªn cña tr×nh tù liªn øng. Trong ®ã, Exd liªn kÕt
øng cã vÞ trÝ trung t©m T-T, cßn phøc hÖ vµo tr×nh tù TGAT, cßn protein HOX liªn kÕt vµo
Exd-Labial −u tiªn vÞ trÝ trung t©m lµ G-G. ATKR (K = T/G; R = A/G). HOX ®ång thêi cã liªn kÕt
thø cÊp vµo 2 nucleotide trung t©m (NN). Hai
§iÒu nµy cho thÊy sù thay ®æi trong tr×nh tù nucleotide nµy x¸c ®Þnh tÝnh ®Æc tr−ng cña protein
t¨ng c−êng vèn ®−îc ®iÒu khiÓn bëi mét HOX thuéc "dÞ phøc kÐp". VÝ dô: Exd-Ubx liªn kÕt khi
protein HOX nµy cã thÓ trë thµnh tr×nh tù tr×nh tù liªn øng cã hai nucleotide trung t©m lµ TT,
®iÒu hßa ®−îc ®iÒu khiÓn bëi mét protein cßn Exd-Labial liªn kÕt khi hai nucleotide nµy lµ GG.

291
§inh §oµn Long

HOX kh¸c. Nguyªn lý nµy gióp gi¶i thÝch sù ®a d¹ng vÒ h×nh th¸i c¸nh ë ruåi giÊm vµ
c¸c loµi b−ím (®−îc nªu ë môc d−íi ®©y). Nh÷ng vÝ dô trªn còng cho thÊy sù thay ®æi
chøc n¨ng, hay sù biÓu hiÖn cña protein Ubx, hoÆc tr×nh tù enhancer ®Ých cña nã ®Òu cã
thÓ trùc tiÕp dÉn ®Õn nh÷ng thay ®æi lín vÒ h×nh th¸i ph¸t triÓn ph«i ë ruåi giÊm.

10.2.2. Sù biÕn ®æi h×nh th¸i ë c¸c loµi gi¸p x¸c vµ c«n trïng

10.2.2.1. Sù ®a d¹ng h×nh th¸i ë ®éng vËt ch©n ®èt


C¸c ®éng vËt ch©n ®èt gåm 5 nhãm chÝnh: bä ba thïy (®· tuyÖt chñng), bä s¸u ch©n
(c«n trïng), gi¸p x¸c (t«m, cua,...), bä nhiÒu ch©n (nh− rÕt) vµ c¸c loµi ch©n k×m (nh− cua
mãng ngùa, nhÖn, bä c¹p,...). C¸c loµi ch©n ®èt ®· thÝch nghi “thµnh c«ng” trong suèt qu¸
tr×nh tiÕn hãa l©u dµi mét phÇn lµ nhê cÊu tróc kiÓu m«®un cña chóng. C¬ thÓ cña chóng
®−îc cÊu tróc tõ c¸c ®èt th©n lÆp l¹i nh−ng cã sù biÕn ®æi d−êng nh− kh«ng giíi h¹n. Mét
sè ®èt th©n mang c¸nh, trong khi c¸c ®èt th©n kh¸c mang ¨ngten, ch©n, hµm, hay c¬
quan giao phèi. §Õn nay, hiÓu biÕt vÒ sù tiÕn hãa dÉn ®Õn sù ®a d¹ng cña c¸c ®éng vËt
ch©n ®èt lµ râ h¬n bÊt cø nhãm ®éng vËt nµo kh¸c.
10.2.2.2. Thay ®æi biÓu hiÖn gen Ubx dÉn ®Õn sù ®a d¹ng h×nh th¸i ch©n ë gi¸p x¸c
Gi¸p x¸c bao gåm hÇu hÕt (nh−ng kh«ng ph¶i tÊt c¶) c¸c loµi ®éng vËt ch©n ®èt cã
thÓ b¬i trong n−íc. Mét sè sèng ë biÓn, mét sè sèng trong m«i tr−êng n−íc ngät (phæ biÕn
nhÊt lµ t«m vµ cua). Mét trong nh÷ng nhãm gi¸p x¸c ®−îc nghiªn cøu kü nhÊt ®Õn nay lµ
Artemia. Ph«i cña chóng ngõng ph¸t triÓn ë d¹ng bµo tö cøng, nh−ng nÕu ®−a c¸c bµo tö
nµy vµo n−íc muèi, chóng sÏ ph¸t triÓn trë l¹i. PhÇn ®Çu cña c¸c loµi t«m nµy chøa c¸c
phÇn phô miÖng. §èt th©n gÇn ®Çu nhÊt (T1) cã phÇn phô b¬i (ch©n b¬i) còng gièng nh−
c¸c ®èt th©n kh¸c tõ thø hai ®Õn m−êi mét (T2 – T11). Artemia thuéc bé branchiopod
(ch©n mang) vµ ®−îc ph©n biÖt víi bé isopod
PhÇn ®Çu PhÇn th©n
(®¼ng tóc). Isopod kh¸c biÖt branchiopod ë
chç chóng chØ cã ch©n b¬i gièng branchiopod
ë c¸c ®èt th©n tõ T2 ®Õn T8; cßn ë ®èt T1,
ch©n nµy cã kÝch th−íc nhá vµ cã chøc n¨ng T1 T2 T3 T4 T5
Blanchiopod
b¾t thøc ¨n, nªn ®−îc gäi lµ “ch©n miÖng” (Bé ch©n mang)
hay “ch©n hµm” (h×nh 10.6). Ch©n miÖng
nµy gièng víi phÇn phô miÖng ë ®Çu (kh«ng
vÏ trªn h×nh).
Lý do dÉn ®Õn sù h×nh thµnh c¸c lo¹i
“ch©n” kh¸c nhau ë ®èt th©n thø nhÊt (T1) T1 T2 T3 T4 T5
gi÷a isopod vµ branchipod lµ do sù biÓu hiÖn Isopod
kh¸c nhau cña gen Ubx ë hai bé gi¸p x¸c nµy. (Bé ®¼ng tóc)
Cã lÏ, tæ tiªn chung cña chóng cã ch©n b¬i ë
Ch©n hµm C¸c ch©n b¬i
tÊt c¶ c¸c ®èt th©n (gièng branchipod). Trong
qu¸ tr×nh tiÕn hãa ph©n li cña isopod vµ C¸c ®èt biÓu hiÖn Scr C¸c ®èt biÓu hiÖn Ubx
branchipod, tr×nh tù ®iÒu hßa cña gen Ubx ®·
biÕn ®æi ë c¸c loµi isopod. KÕt qu¶ cña sù H×nh 10.6. Sù thay ®æi h×nh th¸i ë gi¸p x¸c.
ë blanchiopod, protein Scr chØ ®−îc biÓu hiÖn ë phÇn
thay ®æi nµy lµ gen Ubx kh«ng ®−îc biÓu ®Çu (protein Scr cã vai trß thóc ®Èy sù ph¸t triÓn cña
hiÖn ë ®èt T1, mµ chØ ®−îc biÓu hiÖn ë c¸c ®èt c¸c phÇn phô miÖng); cßn protein Ubx ®−îc biÓu
T2 - T8. Còng cã thÓ gi¶i thÝch lµ, gen Ubx cã hiÖn ë c¸c ®èt th©n (thóc ®Èy sù ph¸t triÓn cña c¸c
t¸c ®éng øc chÕ lªn c¸c “gen quy ®Þnh kiÓu "ch©n b¬i"). ë isopod, protein Scr ®−îc biÓu hiÖn ë
biÓu hiÖn” ë phÇn ®Çu. ThÕ nªn, ë c¸c loµi c¶ phÇn ®Çu vµ ®èt th©n thø nhÊt (T1), dÉn ®Õn
"ch©n b¬i" ë T1 chuyÓn thµnh "ch©n hµm" cã chøc
Artemia, nh÷ng gen phÇn ®Çu nµy bÞ øc chÕ ë n¨ng nh− mét phÇn phô miÖng bæ sung. Sù biÓu hiÖn
tÊt c¶ 11 ®èt th©n (T1-T11); trong khi ë c¸c cña Scr ë ®©y lµ do ®ét biÕn bÊt ho¹t Ubx (Ubx lµ
loµi isopod, c¸c gen phÇn ®Çu kh«ng bÞ øc chÕ protein øc chÕ ho¹t ®éng cña Scr).

292
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

ë ®èt T1 do thiÕu protein øc chÕ Ubx. Trong thùc tÕ, ë isopod, ng−êi ta ®· x¸c ®Þnh ®−îc
protein Src ho¹t ®éng c¶ ë phÇn ®Çu vµ ®èt th©n T1 dÉn ®Õn sù h×nh thµnh ch©n hµm ë
®èt th©n nµy.
C¬ chÕ ph©n tö nµo dÉn ®Õn sù biÓu hiÖn cña gen Ubx kh¸c nhau ë isopod vµ
branchipod? Cã mét sè gi¶ thiÕt, nh−ng gi¶ thiÕt ®−îc chÊp nhËn réng r·i h¬n cho r»ng
®ét biÕn ®· x¶y ra trong tr×nh tù ®iÒu hßa cña gen Ubx ë c¸c loµi isopod. Theo gi¶ thiÕt
nµy, tr×nh tù t¨ng c−êng cña gen Ubx kh«ng cßn ®iÒu khiÓn ®−îc sù biÓu hiÖn cña gen
nµy ë ®èt T1. Tõ thùc tÕ, ng−êi ta thÊy cã mèi t−¬ng quan chÆt gi÷a sù bÊt ho¹t gen Ubx
víi sù ph¸t triÓn c¸c d¹ng cÊu tróc ch©n hµm ë c¸c loµi gi¸p x¸c. Ch¼ng h¹n, ph«i cña
t«m hïm thiÕu sù biÓu hiÖn gen Ubx ë hai ®èt th©n ®Çu tiªn dÉn ®Õn sù h×nh thµnh hai
®«i ch©n hµm. T−¬ng tù nh− vËy, mét sè loµi t«m thiÕu sù biÓu hiÖn cña gen Ubx ë ba ®èt
th©n ®Çu tiªn, nªn cã ®Õn ba ®«i ch©n hµm.
10.2.2.3. T¹i sao c«n trïng thiÕu ch©n bông ?
TÊt c¶ c«n trïng ®Òu cã 6 ch©n; mçi ®èt th©n trong ba ®èt th©n cña chóng ®Òu
mang mét ®«i ch©n. TÊt c¶ c¸c loµi c«n trïng (−íc l−îng trªn 1 triÖu loµi) ®Òu cã ®Æc ®iÓm
chung nµy. §iÒu ng¹c nhiªn lµ ë c¸c loµi ch©n ®èt kh¸c (nh− gi¸p x¸c), sè l−îng ch©n l¹i
rÊt biÕn ®éng. Trong ®ã, mét sè loµi gi¸p x¸c cã ch©n ë mäi ®èt th©n vµ ®èt bông. Sù tiÕn
hãa dÉn ®Õn sù thiÕu ch©n ë bông cña c¸c loµi c«n trïng kh«ng ph¶i do sù thay ®æi biÓu
hiÖn cña c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” nh− tr−êng hîp h×nh thµnh ch©n miÖng ë c¸c
loµi isopod nªu trªn. Thay vµo ®ã, sù thiÕu ch©n bông ë c«n trïng lµ kÕt qu¶ cña sù thay
®æi chøc n¨ng protein ®iÒu hßa Ubx.
ë c«n trïng, hai gen Ubx vµ abd-A øc chÕ sù biÓu hiÖn cña mét gen quy ®Þnh sù
ph¸t triÓn cña c¸c ch©n ë mçi ®èt th©n, gäi lµ gen Dll. Trong qu¸ tr×nh ph¸t triÓn ph«i
ruåi giÊm, gen Ubx ®−îc biÓu hiÖn ë møc cao t¹i ®èt th©n thø ba vµ c¸c ®èt bông phÝa
tr−íc; riªng sù biÓu hiÖn cña gen abd-A cßn më réng tiÕp ®Õn c¸c ®èt bông phÝa sau. KÕt
hîp víi nhau, c¸c gen Ubx vµ abd-A øc chÕ sù biÓu hiÖn cña gen Dll t¹i 7 ®èt bông ®Çu
tiªn. MÆc dï gen Ubx còng biÓu hiÖn ë ®èt th©n T3, nh−ng nã kh«ng øc chÕ sù biÓu hiÖn
cña gen Dll còng nh− sù h×nh thµnh ch©n ë ®èt th©n nµy; bëi v×, ë ®©y trong qu¸ tr×nh
ph¸t triÓn ph«i, gen Dll ®−îc ho¹t hãa tr−íc khi gen Ubx ®−îc biÓu hiÖn.
ë c¸c loµi gi¸p x¸c, ch¼ng h¹n nh− bé branchiopod, c¶ hai gen Ubx vµ Dll ®Òu ®−îc
biÓu hiÖn ë møc cao t¹i tÊt c¶ 11 ®èt th©n. Sù biÓu hiÖn m¹nh cña gen Dll thóc ®Èy sù
h×nh thµnh ch©n b¬i ë c¶ 11 ®èt th©n nµy. VËy, t¹i sao gen Ubx kh«ng øc chÕ ®−îc sù
biÓu hiÖn cña gen Dll ë c¸c ®èt bông cña gi¸p x¸c? C©u tr¶ lêi thùc thÕ lµ ®· cã sù tiÕn
hãa ph©n li (vÒ cÊu tróc vµ chøc n¨ng) cña protein Ubx ë c«n trïng vµ gi¸p x¸c.
C¸c thÝ nghiÖm ho¹t hãa vµ bÊt ho¹t gen ë ruåi giÊm cho thÊy: nÕu gen Ubx cña
ruåi giÊm ®−îc biÓu hiÖn ë tÊt c¶ c¸c m« thuéc phÇn bông th× ch©n kh«ng h×nh thµnh
®−îc do gen Dll bÞ øc chÕ. Nh−ng nÕu gen Ubx nµy cã nguån gèc tõ gi¸p x¸c th× nã kh«ng
øc chÕ sù biÓu hiÖn cña gen Dll vµ tÊt c¶ c¸c ch©n ®Òu h×nh thµnh b×nh th−êng. §iÒu nµy
chøng tá “chøc n¨ng” cña protein Ubx cña ruåi giÊm vµ gi¸p x¸c lµ kh¸c nhau. Protein
cña ruåi giÊm øc chÕ biÓu hiÖn gen Dll, nh−ng protein cña gi¸p x¸c th× kh«ng.
Nguyªn nh©n nµo lµm chøc n¨ng cña protein Ubx ë ruåi giÊm vµ gi¸p x¸c biÓu hiÖn
kh¸c nhau? Ph©n tÝch tr×nh tù axit amin cña hai protein nµy cho thÊy, chóng chØ gièng
nhau 32%, nh−ng 59/60 axit amin thuéc vïng liªn kÕt ADN lµ gièng nhau hoµn toµn.
Protein Ubx ë gi¸p x¸c cã mét motif ng¾n gåm 29 axit amin cã vai trß “ph¶n øc chÕ”. Khi
motif nµy bÞ lo¹i bá, protein Ubx cña gi¸p x¸c biÓu hiÖn chøc n¨ng gièng nh− cña ruåi
giÊm vµ g©y øc chÕ biÓu hiÖn gen Dll.
Protein Ubx cña c¶ ruåi giÊm vµ gi¸p x¸c ®Òu chøa nhiÒu miÒn øc chÕ kh¸c nhau.
Nh÷ng miÒn nµy cã kh¶ n¨ng t−¬ng t¸c víi mét hoÆc nhiÒu phøc hÖ øc chÕ phiªn m·.

293
§inh §oµn Long

§o¹n peptide “ph¶n øc chÕ” cã mÆt trong cÊu tróc protein Ubx cña gi¸p x¸c ng¨n c¶n sù
huy ®éng phøc hÖ øc chÕ cña protein nµy. Khi chuçi peptide “ph¶n øc chÕ” nµy ®−îc g¾n
vµo protein Ubx cña ruåi giÊm, th× ph©n tö protein lai biÓu hiÖn chøc n¨ng gièng protein
Ubx cña gi¸p x¸c (tøc lµ mÊt kh¶ n¨ng øc chÕ gen Dll).
10.2.2.4. KiÓu h×nh c¸nh ®a d¹ng ë c¸c loµi ch©n ®èt do biÕn ®æi c¸c tr×nh tù ®iÒu hßa
ë c¸c môc trªn, chóng ta ®· ®Ò cËp ®Õn vai trß cña gen Ubx trong viÖc t¹o ra sù ®a
d¹ng c¸c kiÓu h×nh ch©n bông vµ ch©n miÖng ë c¸c loµi gi¸p x¸c vµ c«n trïng. Trong thùc
tÕ, sù thay ®æi tr×nh tù ®iÒu hßa cña gen nµy cßn gióp gi¶i thÝch tÝnh ®a d¹ng kiÓu h×nh
c¸nh (“ch©n bay”) ë ruåi giÊm vµ c¸c loµi b−ím (h×nh 10.7).
ë ruåi giÊm, Ubx cã vai trß lµ protein øc chÕ sù h×nh thµnh c¸nh thËt (c¸nh ®Çy
®ñ). Trong qu¸ tr×nh nµy, Ubx øc chÕ kho¶ng tõ 5 ®Õn 10 gen ®Ých kh¸c nhau. Nh÷ng gen
nµy m· hãa c¸c protein thiÕt yÕu thóc ®Èy sù h×nh thµnh vµ ph¸t triÓn c¸nh thËt. ë c¸nh
phô (®èt T3), nh÷ng gen nµy bÞ øc chÕ bëi Ubx. Nh−ng khi gen Ubx bÞ ®ét biÕn, “c¸nh
phô” ph¸t triÓn thµnh “c¸nh thËt”, dÉn ®Õn thÓ ®ét biÕn cã bèn c¸nh thËt.
Ruåi giÊm thuéc bé c«n trïng hai c¸nh - Dipteran. C¸c loµi thuéc bé nµy cã ®Æc ®iÓm
chung lµ chØ cã mét ®«i c¸nh thËt duy nhÊt bªn c¹nh mét hoÆc mét sè ®«i c¸nh phô.
Protein Ubx ho¹t ®éng víi vai trß lµ protein øc chÕ h×nh thµnh c¸nh thËt ë Dipteran. C¸c
loµi b−ím thuéc mét bé c«n trïng kh¸c, gäi lµ bé c¸nh v¶y (hay c¸nh phÊn) -
Lepidopteran. C¸c loµi Lepidopteran ®Òu cã hai ®«i c¸nh thËt vµ mét hoÆc mét sè ®«i
c¸nh phô. Nguyªn nh©n nµo dÉn ®Õn kh¸c biÖt nµy?
Trong lÞch sö, hai bé c«n trïng nµy tiÕn hãa t¸ch li khái nhau kho¶ng trªn 250
triÖu n¨m tr−íc. §ã còng lµ kho¶ng thêi gian c¸c loµi ®éng vËt cã x−¬ng sèng (bao gåm
ng−êi) vµ kh«ng x−¬ng sèng (nh− Õch) t¸ch li khái nhau. Trong thêi kú nµy, d−êng nh−
gen Ubx tÝch lòy ®ñ c¸c ®ét biÕn (cã thÓ theo mét hoÆc c¶ ba c¬ chÕ tiÕn hãa) ®Õn møc
chøc n¨ng cña nã thay ®æi. Gi¶ thiÕt ®¬n gi¶n nhÊt ®−îc ®−a ra lµ sù thay ®æi kiÓu biÓu
hiÖn cña gen Ubx (lµm gen nµy kh«ng biÓu hiÖn ë c¸c c«n trïng c¸nh v¶y) dÉn ®Õn sù
h×nh thµnh ®«i c¸nh thø hai. HiÖn t−îng “ch©n b¬i” biÕn thµnh “ch©n miÖng” ë bé ®¼ng
tóc (isopod) ®· tõng ®−îc
gi¶i thÝch bëi c¬ chÕ nµy. (a)
Tuy vËy, trong thùc tÕ ®·
kh«ng t×m thÊy sù kh¸c
biÖt râ rÖt vÒ kiÓu biÓu hiÖn
cña gen Ubx gi÷a ruåi giÊm
vµ c¸c loµi b−ím. Cô thÓ, lµ C«n trïng hai c¸nh C«n trïng c¸nh phÊn
gen Ubx ®−îc biÓu hiÖn ë (Dipteran) (Lepidopteran)
møc cao trong suèt qu¸ (b)
tr×nh ph¸t triÓn ®«i c¸nh
thø hai ë c¸c loµi b−ím. Ubx "T¾t" "BËt"
§iÒu nµy cho thÊy cã hai wg
kh¶ n¨ng. Kh¶ n¨ng thø +1 +1
nhÊt lµ sù biÓu hiÖn chøc Ubx "T¾t" "BËt"
n¨ng cña protein Ubx DSRF
kh«ng gièng nhau ë ruåi +1 +1
giÊm vµ ë b−ím. Kh¶ n¨ng H×nh 10.7. Sù thay ®æi tr×nh tù ®iÒu hßa cña c¸c gen ®Ých lµ môc tiªu
thø hai lµ c¸c gen ®Ých t¸c ®éng cña protein Ubx. (a) Protein øc chÕ Ubx ®−îc biÓu hiÖn ë ®«i
thiÕt yÕu cho sù ph¸t triÓn "c¸nh phô" cña c«n trïng hai c¸nh, vµ ë ®«i c¸nh sau (mµu sÉm) cña c«n
c¸nh thËt vèn bÞ øc chÕ bëi trïng c¸nh phÊn. (b) ë c«n trïng hai c¸nh, c¸c gen ®Ých mang c¸c tr×nh tù
®iÒu hßa lµ vÞ trÝ g¾n cña protein Ubx (h×nh tr¸i); trong khi, ë c«n trïng
protein Ubx (ë c«n trïng) c¸nh phÊn (b−ím, h×nh ph¶i), c¸c tr×nh tù g¾n protein Ubx bÞ mÊt, dÉn ®Õn
cã tr×nh tù ®iÒu hßa bÞ biÕn c¸c gen ph¸t triÓn c¸nh thËt ®−îc biÓu hiÖn (theo Watson, 2004).

294
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

®æi khi c¸c loµi b−ím tiÕn hãa ph©n li, dÉn ®Õn viÖc c¸c gen ®Ých nµy ë b−ím kh«ng cßn bÞ
øc chÕ bëi protein Ubx n÷a. Cã lÏ phÇn lín chóng ta ®Òu cho r»ng kh¶ n¨ng thø nhÊt dÔ
x¶y ra h¬n, bëi kh¶ n¨ng thø hai chØ x¶y ra khi ®ång thêi cã tõ 5 ®Õn 10 gen ®Ých (thiÕt
yÕu cho sù ph¸t triÓn c¸nh ë b−ím) ®Òu cã sù biÕn ®æi trong tr×nh tù ®iÒu hßa cña chóng.
Nh−ng thËt ng¹c nhiªn, sù biÕn ®æi tr×nh tù ®iÒu hßa cña c¸c gen ®Ých cña protein
Ubx l¹i ®−îc t×m thÊy lµ nguyªn nh©n chÝnh dÉn ®Õn sù ®a h×nh kiÓu c¸nh ë b−ím, cßn
protein Ubx biÓu hiÖn sù duy tr× chøc n¨ng gièng nhau ë ruåi giÊm vµ ë b−ím.

10.2.3. Xu h−íng ®ét biÕn thay thÕ trong c¸c tr×nh tù ADN vµ protein
Mét c©u hái ®−îc ®Æt ra tõ l©u trong c¸c nghiªn cøu tiÕn hãa lµ: kiÓu ®ét biÕn vµ
tÇn sè ®ét biÕn cã gièng nhau ë c¸c phÇn kh¸c nhau cña gen kh«ng? Ngay tõ nh÷ng n¨m
70 cña thÕ kû tr−íc, ®· cã nh÷ng nghiªn cøu so s¸nh tr×nh tù axit amin trong c¸c ph©n tö
protein cã chøc n¨ng gièng nhau. C¸c nghiªn cøu nµy ®· chØ ra r»ng, cã mét sè kiÓu thay
®æi vÒ axit amin gi÷a c¸c protein t−¬ng ®ång th−êng x¶y ra h¬n so víi c¸c kiÓu thay
®æi kh¸c. §Æc biÖt, c¸c axit amin thay thÕ nhau th−êng cã tÝnh chÊt hãa häc gièng nhau
vµ thuéc cïng nhãm ph©n lo¹i (xem b¶ng 1.5, ch−¬ng 1). Xu h−íng thay thÕ axit amin
nh− vËy cñng cè hai nguyªn t¾c tiÕn hãa quan träng, ®ã lµ: 1) c¸c ®ét biÕn chØ xuÊt hiÖn ë
tÇn sè thÊp, vµ 2) hÇu hÕt c¸c ®ét biÕn thay ®æi lín (ch¼ng h¹n, do thay thÕ c¸c axit amin
thuéc c¸c nhãm kh¸c nhau) ®Òu bÞ chän läc tù nhiªn ®µo th¶i.
C¸c axit amin cã tÝnh chÊt hãa häc gièng nhau cßn cã xu h−íng ®−îc m· hãa bëi c¸c
m· bé ba gièng nhau (xem b¶ng 4.5, ch−¬ng 4). Nhê vËy, sù xuÊt hiÖn c¸c ®ét biÕn thay
thÕ gi÷a c¸c axit amin cïng lo¹i dÔ x¶y ra h¬n. Ch¼ng h¹n nh− ®Ó xuÊt hiÖn ®ét biÕn Leu
↔ Ile chØ cÇn mét nucleotide trong gen ®−îc thay thÕ (CUU ↔ AUU); nh−ng ®Ó x¶y ra
®ét biÕn Leu ↔ Arg, cÇn ®Õn sù thay thÕ cña hai nucleotide trong gen (CUU ↔ AAU).
C¸c enzym ADN polymerase cã lçi sao chÐp vµo kho¶ng 10-9 – 10-6. NghÜa lµ, cø kho¶ng 1
triÖu ®Õn 1 tØ nucleotide, chóng míi sao chÐp sai mét lÇn. Do vËy, kh¶ n¨ng xuÊt hiÖn c¸c
®ét biÕn thay thÕ hai hay nhiÒu nucleotide t¹i cïng mét vÞ trÝ trong qu¸ tr×nh sao chÐp lµ
rÊt thÊp. H¬n n÷a, chän läc tù nhiªn ®· t¸c ®éng trªn c¸c hÖ thèng sinh häc qua hµng
triÖu n¨m tiÕn hãa, nªn phÇn lín c¸c protein hiÖn cã (kiÓu d¹i) ë c¸c sinh vËt lµ d¹ng cã
biÓu hiÖn chøc n¨ng thÝch nghi cao víi m«i tr−êng sèng hiÖn t¹i. Nªn, phÇn lín c¸c thay
®æi râ rÖt trong cÊu tróc bËc 1 cña ph©n tö protein ®Òu lµm gi¶m sù biÓu hiÖn chøc n¨ng
cña nã vµ g©y h¹i cho sinh vËt. KÕt qu¶ lµ chóng th−êng bÞ chän läc tù nhiªn ®µo th¶i
nhanh chãng.

10.3. C¸c h−íng nghiªn cøu tiÕn hãa ph©n tö


10.3.1. So s¸nh c¸c tr×nh tù ADN

10.3.1.1. Sù thay thÕ c¸c nucleotide vµ m« h×nh Jukes - Cantor


Trong qu¸ tr×nh tiÕn hãa, sau khi hai tr×nh tù nucleotide t¸ch li khái nhau (ch¼ng
h¹n, 2 gen t−¬ng ®ång ë 2 loµi cïng t¸ch li tõ tæ tiªn chung), chóng b¾t ®Çu tÝch lòy c¸c
®ét biÕn ®éc lËp víi nhau. Trong c¸c nghiªn cøu tiÕn hãa dïng phÐp so s¸nh tr×nh tù
ADN, sè nucleotide thay thÕ (K) th−êng lµ th«ng sè c¬ b¶n ®Ó nhËn ®Þnh sù kh¸c biÖt
gi÷a c¸c gen cña c¸c loµi hoÆc c¸ thÓ kh¸c nhau. Theo ®ã, c¸c gen cã Ýt nucleotide thay
thÕ ®−îc xem lµ cã quan hÖ gÇn, vµ ng−îc l¹i. Tuy vËy, ngay tõ n¨m 1969, T. Jukes vµ C.
Cantor ®· nhËn ®Þnh r»ng “viÖc so s¸nh c¸c tr×nh tù chØ dùa trªn c¸c ®¬n ph©n ®¬n lÎ cã
thÓ dÉn ®Õn viÖc ®¸nh gi¸ sai vÒ quan hÖ di truyÒn gi÷a chóng”. Cô thÓ trong ph©n tö
ADN, ë vÞ trÝ dÔ x¶y ra sù thay thÕ nucleotide, th× rÊt cã thÓ t¹i vÞ trÝ ®ã ®· x¶y ra mét
hoÆc nhiÒu lÇn c¸c ®ét biÕn thuËn vµ ®ét biÕn ng−îc (h×nh 10.8). §Ó ph¶n ¸nh kh¶ n¨ng
®ã, Jukes vµ Cantor ®· gi¶ thiÕt r»ng: mçi lo¹i nucleotide ®Òu cã thÓ ®−îc thay thÕ bëi 3
lo¹i nucleotide kh¸c víi kh¶ n¨ng nh− nhau; trong ®ã, qui −íc tØ lÖ thay thÕ mét

295
§inh §oµn Long

nucleotide thµnh mét trong 3 lo¹i nucleotide cßn


l¹i lµ α. Khi ®ã, tØ lÖ thay thÕ mét nucleotide nãi T×nh huèng 1 T×nh huèng 2
chung lµ 3α. Theo m« h×nh nµy, nÕu mét vÞ trÝ C C
t=0
nucleotide trªn gen t¹i thêi ®iÓm 0 (t = 0) lµ C,
th× x¸c suÊt (P) t¹i thêi ®iÓm 1 (t = 1) vÞ trÝ
nucleotide ®ã vÉn lµ C sÏ lµ PC(1) = 1 – 3α. Vµo
c¸c thêi ®iÓm sau ®ã (vÝ dô: t = 2), ph¶i tÝnh ®Õn
kh¶ n¨ng ®ét biÕn “ng−îc” (®ét biÕn “phôc håi”). t=1 A T
NÕu nucleotide gèc lµ C chuyÓn thµnh mét
nucleotide kh¸c (vÝ dô lµ A) t¹i t = 1, th× t¹i t =
2, gi¸ trÞ PC(2) sÏ b»ng (1 - 3α)PC(1) + α[1 – PA(1)].
TiÕp tôc më réng c«ng thøc nµy, vµo thêi ®iÓm T C
t=2
bÊt kú trong t−¬ng lai (t), kh¶ n¨ng mét vÞ trÝ
trªn m¹ch ADN mang nucleotide C sÏ lµ:
H×nh 10.8. Hai t×nh huèng thay thÕ
1 3 nucleotide x¶y ra t¹i cïng mét vÞ trÝ cã thÓ
PC(t) = /4 = ( /4)e -4α
(ph−¬ng tr×nh 10.1)
dÉn ®Õn viÖc −íc l−îng sai sè lÇn ®ét biÕn
C«ng thøc nµy cã thÓ dïng ®Ó tÝnh gi¸ trÞ thay thÕ nucleotide ®Z x¶y ra ë mét gen (t lµ
thêi gian).
cña α, qua ®ã ph¶n ¸nh tÇn sè (tèc ®é) thay thÕ
nucleotide t¹i mét vÞ trÝ trªn ph©n tö ADN.
Tuy vËy, so víi thùc tÕ, c«ng thøc Jukes - Cantor lµ mét c«ng thøc qu¸ gi¶n l−îc.
Ch¼ng h¹n, c¸c ®ét biÕn ®ång ho¸n (thay thÕ purine nµy b»ng purine kh¸c, hoÆc
pyrimidine nµy b»ng pyrimidine kh¸c) trong thùc tÕ th−êng dÔ x¶y ra h¬n so víi c¸c ®ét
biÕn dÞ ho¸n (thay thÕ mét purine b»ng mét pyrimidine hoÆc ng−îc l¹i). Dï vËy, tõ viÖc
më réng c«ng thøc Jukes – Cantor cã thÓ x¸c ®Þnh ®−îc sè lÇn thay thÕ nucleotide thùc
sù ®· x¶y ra (K) t¹i mét vÞ trÝ nucleotide trªn m¹ch ADN dùa theo ph−¬ng tr×nh sau:
K = -3/4 ln [1 – (4/3)p] (ph−¬ng tr×nh 10.2)
trong ®ã, p lµ tØ sè c¸c nucleotide kh¸c nhau gi÷a hai tr×nh tù ADN ®−îc so s¸nh sau mét
lÇn ®Õm ®éc lËp. C«ng thøc nµy phï hîp víi quan ®iÓm cho r»ng nÕu hai tr×nh tù ADN
chØ cã Ýt vÞ trÝ kh¸c biÖt, th× gi¸ trÞ p nhá vµ kh¶ n¨ng thay thÕ nhiÒu lÇn t¹i mét vÞ trÝ lµ
thÊp (vÝ dô: trªn m¹ch ADN cã 100 nucleotide, nÕu p = 0,02 th× K = 0,02). §ång thêi c«ng
thøc nµy cho thÊy: nÕu sè nucleotide kh¸c nhau gi÷a hai tr×nh tù ADN cµng lín, th× tÇn
sè nucleotide thay thÕ thËt cµng lín h¬n tÇn sè quan s¸t (vÝ dô: trªn m¹ch ADN cã 100
nucleotide, nÕu p = 0,50 th× K = 0,82).

10.3.1.2. Tèc ®é thay thÕ c¸c nucleotide


Sè lÇn thay thÕ nucleotide mµ hai tr×nh tù ADN ®· tr¶i qua tõ khi chóng t¸ch li
khái tr×nh tù tæ tiªn ®−îc xem lµ th«ng sè quan träng nhÊt trong nghiªn cøu tiÕn hãa sö
dông phÐp so s¸nh ADN. Khi kÕt hîp sè lÇn thay thÕ nucleotide (K) víi kho¶ng thêi gian
tiÕn hãa (T) th× x¸c ®Þnh ®−îc tÇn sè thay thÕ nucleotide (r). V×, sù thay thÕ nucleotide
x¶y ra ®ång thêi vµ ®éc lËp ë c¶ hai tr×nh tù, nªn r ®−îc tÝnh b»ng c«ng thøc:
r = K/(2T) (ph−¬ng tr×nh 10.3)
§iÒu cÇn l−u ý lµ ®Ó −íc tÝnh ®−îc gi¸ trÞ K, ph¶i thu thËp ®−îc d÷ liÖu vÒ tr×nh tù
ADN tõ Ýt nhÊt 2 loµi trë lªn. ViÖc so s¸nh tÇn sè thay thÕ nucleotide trong ph¹m vi mét
gen hay gi÷a c¸c gen kh¸c nhau cho phÐp dù ®o¸n c¬ chÕ ph©n tö dÉn ®Õn sù thay thÕ
nucleotide trong c¸c tr×nh tù ADN. NÕu tèc ®é tiÕn hãa trong mét nhãm loµi lµ æn ®Þnh
th× tÇn sè thay thÕ nucleotide cã thÓ gióp dù ®o¸n thêi gian x¶y ra mét sù kiÖn tiÕn hãa.

296
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

10.3.1.3. Tèc ®é tiÕn hãa cña c¸c phÇn kh¸c nhau trong gen
KÕt qu¶ so s¸nh tr×nh tù ADN ë nhiÒu gen kh¸c nhau ®· x¸c nhËn r»ng: c¸c phÇn
kh¸c nhau trong gen cã tÇn sè biÕn ®æi kh¸c nhau. Nãi c¸ch kh¸c, chän läc tù nhiªn t¸c
®éng víi møc ®é kh¸c nhau lªn c¸c phÇn kh¸c nhau cña gen. Chóng ta biÕt r»ng, mét gen
sinh vËt nh©n thËt ®iÓn h×nh bao gåm c¸c tr×nh tù m· hãa (quy ®Þnh c¸c axit amin trong
ph©n tö protein) vµ c¸c tr×nh tù kh«ng m· hãa. C¸c tr×nh tù kh«ng m· hãa bao gåm c¸c
intron, c¸c ®o¹n dÉn ®Çu vµ theo sau vïng m· hãa (®−îc phiªn m·, nh−ng kh«ng ®−îc
dÞch m·) vµ c¸c ®o¹n vïng biªn kh«ng ®−îc phiªn m· n»m ng−îc dßng (®Çu 5’) vµ xu«i
dßng (®Çu 3’) cña gen (dï chóng cÇn thiÕt cho sù phiªn m·). Ngoµi ra, trong hÖ gen cßn cã
c¸c gen gi¶ (cïng lµ tr×nh tù kh«ng m· hãa) vèn kh«ng cßn kh¶ n¨ng biÓu hiÖn vµ cho ra
c¸c s¶n phÈm ho¹t ®éng chøc n¨ng b×nh th−êng bëi chóng ®· tÝch lòy nhiÒu ®ét biÕn lµm
mÊt chøc n¨ng trong qu¸ tr×nh tiÕn hãa. Ngay trong tr×nh tù m· hãa cña gen, kh«ng ph¶i
mäi thay thÕ nucleotide ®Òu dÉn ®Õn thay ®æi axit amin trong ph©n tö protein. NhÊt lµ, sù
thay thÕ nucleotide t¹i vÞ trÝ thø ba trong mét m· bé ba (codon) nhiÒu khi kh«ng lµm ¶nh
h−ëng ®Õn thµnh phÇn vµ tr×nh tù axit amin trªn ph©n tö protein do hiÖn t−îng “tho¸i
hãa” cña m· bé ba (xem thªm ch−¬ng 4).
10.3.1.4. C¸c vÞ trÝ ®ång nghÜa vµ kh¸c nghÜa trong gen
B¶ng 10.1 cho thÊy tèc ®é thay ®æi t−¬ng ®èi ë c¸c phÇn kh¸c nhau cña c¸c gen
®éng vËt cã vó. §iÓm ®¸ng chó ý ë c¸c gen biÓu hiÖn chøc n¨ng lµ tÇn sè thay thÕ
nucleotide cao nhÊt t¹i c¸c vÞ trÝ ®ång nghÜa trong vïng m· hãa cña gen. TÇn sè thay thÕ
nucleotide ®ång nghÜa cao gÊp 5 lÇn so víi tÇn sè thay thÕ nucleotide kh¸c nghÜa quan
s¸t ®−îc. C¸c ®ét biÕn thay thÕ nucleotide ®ång nghÜa lµ c¸c ®ét biÕn kh«ng lµm thay ®æi
tr×nh tù axit amin trªn ph©n tö protein; do vËy, kh«ng lµm thay ®æi sù biÓu hiÖn chøc
n¨ng cña protein. §Õn ®©y, chóng ta nhí l¹i: c¸c biÕn ®æi trong tr×nh tù nucleotide cã thÓ
xuÊt hiÖn nh− thÕ nµo? VÒ tæng thÓ, cã thÓ nãi tÊt c¶ nh÷ng thay ®æi nucleotide trong
tr×nh tù ADN lµ do sai sãt cña qu¸ tr×nh sao chÐp hoÆc söa ch÷a ADN. TÊt c¶ c¸c enzym
tham gia sao chÐp vµ söa ch÷a ADN
®Òu kh«ng cã kh¶ n¨ng ph©n biÖt B¶ng 10.1. Tèc ®é thay thÕ nucleotide trung b×nh trong c¸c
mét ®ét biÕn lµ ®ång nghÜa hay vïng tr×nh tù ADN kh¸c nhau thuéc gen ë ®éng vËt cã vó
kh¸c nghÜa. Do vËy, cã thÓ suy ®o¸n Sè nucleotide trung b×nh
r»ng: kh¶ n¨ng xuÊt hiÖn cña c¸c Tr×nh tù ADN thay thÕ t¹i mçi vÞ trÝ
®ét biÕn thay thÕ nucleotide ®ång hµng n¨m (x 10-9)
nghÜa vµ kh¸c nghÜa lµ nh− nhau. C¸c gen biÓu hiÖn chøc n¨ng
Nh−ng, c¸c ®ét biÕn kh¸c nghÜa Vïng biªn ®Çu 5’ cña gen 2,36
th−êng g©y h¹i nªn cã xu h−íng bÞ
§o¹n tr×nh tù dÉn ®Çu gen 1,74
chän läc tù nhiªn ®µo th¶i; trong khi
Tr×nh tù m· hãa, ®ång nghÜa 4,65
®ã, c¸c ®ét biÕn ®ång nghÜa v−ît qua
®−îc c¸c “hµng rµo” chän läc, nªn Tr×nh tù m· hãa, kh¸c nghÜa 0,88
®−îc duy tr×. Nhê vËy, chÝnh c¸c ®ét C¸c tr×nh tù intron 3,70
biÕn ®ång nghÜa cã ý nghÜa ph¶n ¸nh §o¹n tr×nh tù theo sau gen 1,88
tèc ®é ®ét biÕn x¶y ra ë mét hÖ gen, Vïng biªn ®Çu 3’ cña gen 4,46
trong khi c¸c ®ét biÕn kh¸c nghÜa th× C¸c gen gi¶ 4,85
kh«ng.
10.3.1.5. Sù biÕn ®æi ë c¸c vïng biªn cña gen
B¶ng 10.1 cho thÊy møc ®é biÕn ®æi ë vïng biªn ®Çu 3’ cña c¸c gen còng rÊt cao.
Gièng nh− c¸c ®ét biÕn ®ång nghÜa, c¸c tr×nh tù vïng biªn ®Çu 3’ kh«ng ¶nh h−ëng ®Õn
tr×nh tù axit amin cña protein vµ Ýt ¶nh h−ëng ®Õn qu¸ tr×nh biÓu hiÖn cña gen. KÕt qu¶
lµ, phÇn lín c¸c ®ét biÕn thay thÕ ë vïng nµy ®−îc duy tr× qua chän läc tù nhiªn. TÇn sè
thay thÕ nucleotide trong vïng intron cña gen còng cao, nh−ng thÊp h¬n ®ét biÕn ®ång

297
§inh §oµn Long

nghÜa vµ ®ét biÕn thay thÕ ë vïng biªn ®Çu 3’. MÆc dï c¸c tr×nh tù intron kh«ng ph¶i
tr×nh tù m· hãa c¸c axit amin trong protein, nh−ng vïng tiÕp gi¸p gi÷a chóng víi c¸c
exon liÒn kÒ cã vai trß ®¶m b¶o cho qu¸ tr×nh c¾t intron vµ kÕt nèi exon diÔn ra chÝnh
x¸c. Mét sè tr×nh tù bªn trong intron, nh− tr×nh tù ph©n nh¸nh, lµ thiÕt yÕu cho qu¸
tr×nh c¾t intron. Mét sè intron bÞ c¾t bá t¹i m« nµy, nh−ng l¹i ®−îc dïng ®Ó m· hãa axit
amin t¹i m« kh¸c trong m« h×nh “c¸c c¸ch c¾t intron kh¸c nhau” (xem thªm ch−¬ng 5).
Ngoµi ra, ë mét sè gen, intron cßn lµ vÞ trÝ liªn kÕt cña mét sè yÕu tè phiªn m· nªn cã ¶nh
h−ëng ®Õn kh¶ n¨ng vµ tèc ®é phiªn m· cña gen. Do vËy, kh«ng ph¶i mäi thay ®æi trong
tr×nh tù intron cña tÊt c¶ c¸c gen ®Òu v−ît qua ®−îc “hµng rµo” chän läc tù nhiªn.
Nh−ng, nh×n chung tÇn sè thay ®æi cña chóng chØ thÊp h¬n ®«i chót so víi c¸c ®ét biÕn
®ång nghÜa vµ ®ét biÕn thay thÕ ë vïng biªn ®Çu 3’ cña gen.
So víi vïng biªn ®Çu 3’ cña gen, vïng biªn ®Çu 5’ cã møc ®é thay ®æi thÊp h¬n. MÆc
dï vïng nµy còng kh«ng ®−îc phiªn m· vµ dÞch m·, nh−ng nã mang tr×nh tù khëi ®Çu
phiªn m· (promoter) bªn c¹nh c¸c tr×nh tù ®iÒu hßa phiªn m· kh¸c cña gen; v× vËy, vïng
nµy rÊt quan träng cho sù biÓu hiÖn cña gen. ThËm chÝ, nh÷ng thay ®æi nhá trong
promoter, nh− hép TATA, cã thÓ ng¨n c¶n sù phiªn m· cña gen vµ th−êng cã h¹i cho thÓ
®ét biÕn. Chän läc tù nhiªn th−êng ®µo th¶i nh÷ng ®ét biÕn nµy vµ gi¶m thiÓu tèi ®a
nh÷ng thay ®æi trong c¸c vïng quan träng cña hÖ gen, trong ®ã cã c¸c promoter.
Trong c¸c gen, tÇn sè biÕn ®æi thÊp h¬n n÷a thuéc vÒ c¸c vïng dÉn ®Çu vµ theo sau
vïng m· hãa cña gen. MÆc dï nh÷ng vïng nµy kh«ng ®−îc dÞch m· nh−ng chóng ®−îc
phiªn m·, vµ tr×nh tù cña chóng th−êng cã vai trß mang tÝn hiÖu ®iÒu khiÓn hoÆc qu¸
tr×nh hoµn thiÖn mARN (trong nh©n tÕ bµo) hoÆc qu¸ tr×nh dÞch m· tæng hîp protein (ë
tÕ bµo chÊt). Do vËy, c¸c ®ét biÕn thay thÕ nucleotide ë c¸c vïng tr×nh tù nµy Ýt ®−îc duy
tr× còng lµ ®iÒu dÔ hiÓu. Trong ph¹m vi mét gen, tÇn sè c¸c ®ét biÕn thay thÕ thÊp nhÊt
lµ c¸c ®ét biÕn kh¸c nghÜa x¶y ra trong vïng m· hãa cña gen. Nh− chóng ta ®· biÕt,
phÇn lín c¸c protein kiÓu d¹i cña sinh vËt cã tr×nh tù axit amin ®· ®−îc chän läc tù nhiªn
sµng läc nªn th−êng ë d¹ng thÝch nghi nhÊt víi m«i tr−êng sèng hiÖn t¹i; thÕ nªn, phÇn
lín c¸c thay ®æi tr×nh tù axit amin ®Òu dÉn ®Õn sù kÐm thÝch nghi h¬n vµ bÞ chän läc tù
nhiªn ®µo th¶i. TÊt nhiªn møc ®é t¸c ®éng cña chän läc tù nhiªn lµ kh«ng gièng nhau ë
c¸c axit amin kh¸c nhau trong ph©n tö protein, còng nh− cßn phô thuéc vµo viÖc axit
amin thay thÕ cã tÝnh chÊt hãa häc gièng hay kh¸c axit amin gèc.
10.3.1.6. Gen gi¶
TÇn sè ®ét biÕn ®−îc t×m thÊy cao nhÊt ë c¸c gen gi¶. VÝ dô, ë c¸c gen gi¶ globin cña
ng−êi, tÇn sè thay ®æi nucleotide cao gÊp 5 lÇn so víi tÇn sè thay thÕ nucleotide kh¸c
nghÜa ë vïng m· hãa cña gen globin thËt. Së dÜ c¸c gen gi¶ cã tÇn sè thay thÕ nucleotide
cao, v× chóng kh«ng cßn ®−îc dïng ®Ó tæng hîp protein. ThÕ nªn, nh÷ng thay ®æi trong
gen gi¶ hÇu nh− kh«ng bÞ t¸c ®éng bëi chän läc tù nhiªn.
Nãi tãm l¹i, mét xu h−íng dÔ nhËn thÊy trong qu¸ tr×nh tiÕn hãa lµ: c¸c vïng tr×nh tù
(nucleotide hoÆc axit amin) cµng cã vai trß quan träng trong biÓu hiÖn chøc n¨ng cña c¸c
®¹i ph©n tö sinh häc (ADN, ARN vµ protein) cµng cã tèc ®é tiÕn hãa chËm.
10.3.1.7. Xu h−íng chän läc c¸c m· bé ba ®ång nghÜa
Xu h−íng chän läc c¸c m· bé ba ®ång nghÜa lµ vÝ dô cho thÊy nh÷ng thay ®æi dï rÊt
nhá vÒ kh¶ n¨ng thÝch nghi ë sinh vËt ®Òu ®−îc chän läc tù nhiªn t¸c ®éng qua hµng
ngh×n, hµng triÖu thÕ hÖ. B¶ng 10.1 cho thÊy, tèc ®é tiÕn hãa cña c¸c ®ét biÕn ®ång
nghÜa chØ chËm h¬n chót Ýt so víi tèc ®é biÕn ®æi cña c¸c gen gi¶. §iÒu nµy còng ph¶n
¸nh r»ng, c¸c ®ét biÕn ®ång nghÜa kh«ng ph¶i lóc nµo còng lµ trung tÝnh; cô thÓ, mét sè
m· bé ba ®−îc chän läc tù nhiªn d−êng nh− “−u tiªn” chän lùa h¬n nh÷ng m· bé ba ®ång
nghÜa kh¸c. Gi¶ thiÕt nµy ®−îc cñng cè b»ng hiÖn t−îng c¸c m· bé ba ®ång nghÜa ®−îc sö

298
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

dông víi tÇn sè kh¸c nhau trong vïng m· hãa cña hÖ gen nhiÒu loµi sinh vËt. Ch¼ng
h¹n, tÝnh tho¸i hãa cña m· bé ba biÓu hiÖn ë 6 m· bé ba cïng m· hãa axit amin Leu lµ
UUA, UUG, CUU, CUC, CUA vµ CUG. Nh−ng trong thùc tÕ, 60% m· bé ba ®−îc dïng ®Ó
m· hãa Leu ë E. coli lµ CUG, vµ 80% m· bé ba ®−îc dïng m· hãa axit amin nµy ë nÊm
men lµ UUG. §Õn ®©y, chóng ta nhí r»ng: thùc tÕ c¸c m· bé ba ®ång nghÜa “kÕt cÆp” víi
bé ba ®èi m· cña c¸c ph©n tö tARN kh¸c nhau nh−ng cïng vËn chuyÓn mét lo¹i axit
amin (nãi c¸ch kh¸c, së dÜ cã tÝnh tho¸i hãa cña m· bé ba lµ do cã nhiÒu lo¹i tARN tuy
kh¸c nhau ë c¸c bé ba ®èi m· nh−ng cïng vËn chuyÓn mét lo¹i axit amin). V× vËy, cã thÓ
c¸c m· bé ba ®ång nghÜa kh«ng lµm thay ®æi c¸c axit amin trong ph©n tö protein, nh−ng
chóng lµm thay ®æi lo¹i tARN mµ ribosome sö dông trong qu¸ tr×nh dÞch m·. C¸c nghiªn
cøu nh×n chung cho thÊy: sè l−îng c¸c lo¹i tARN ®ång ®¼ng (cïng vËn chuyÓn mét lo¹i
axit amin) kh«ng gièng nhau; vµ lo¹i tARN phæ biÕn nhÊt còng chÝnh lµ lo¹i mang bé ba
®èi m· t−¬ng øng víi m· bé ba ®ång nghÜa ®−îc dïng phæ biÕn nhÊt. Chän läc tù nhiªn cã
lÏ ®· “−u tiªn” lùa chän mét sè m· bé ba ®ång nghÜa nµy so víi c¸c m· bé ba ®ång nghÜa
kh¸c v× lo¹i tARN t−¬ng øng víi m· bé ba ®−îc lùa chän lµ phæ biÕn h¬n. Ngoµi ra, n¨ng
l−îng liªn kÕt gi÷a c¸c m· bé ba trªn mARN víi bé ba ®èi m· trªn tARN lµ kh«ng gièng
nhau do thµnh phÇn cña c¸c baz¬ nit¬. Sù kh¸c biÖt vÒ n¨ng l−îng liªn kÕt trong qu¸
tr×nh dÞch m· cã thÓ lµ ®èi t−îng chÞu t¸c ®éng cña chän läc tù nhiªn. §iÒu nµy ®Æc biÖt
®óng ë nh÷ng gen ®−îc biÓu hiÖn m¹nh vµ ë c¸c loµi cã vßng ®êi ng¾n, kÝch th−íc quÇn
thÓ lín (nh− vi khuÈn, nÊm men vµ ruåi dÊm). Xu h−íng chän läc c¸c m· bé ba ®ång
nghÜa nh− vËy lµ mét b»ng chøng cho thÊy “søc m¹nh” cña chän läc tù nhiªn trong tiÕn
hãa. Ch¼ng h¹n, ngay gi÷a hai chñng vi khuÈn gièng nhau hoµn toµn vÒ mäi ho¹t ®éng
sèng, ngoµi mét kh¸c biÖt duy nhÊt ë mét bé ba m· ®ång nghÜa, th× kh¸c biÖt nhá ®ã còng
®ñ dÉn ®Õn viÖc chØ mét trong hai chñng tÕ bµo ®−îc duy tr× qua hµng triÖu thÕ hÖ tiÕn
hãa d−íi t¸c ®éng cña chän läc tù nhiªn. Chóng ta cã thÓ liªn t−ëng ®iÒu nµy qua h×nh
¶nh: mét c«ng ty A ph¶i tr¶ gi¸ cao 1% cho mét mÆt hµng mµ mçi n¨m hä ph¶i mua hµng
ngµn lÇn, víi mét c«ng ty B ph¶i tr¶ gi¸ cao 30% cho mét mÆt hµng hä chØ ph¶i mua mét
vµi lÇn, th× “lîi nhuËn” ®Çu t− cña c«ng ty B vÉn cao h¬n c«ng ty A vµ søc c¹nh tranh cña
c«ng ty B lµ lín h¬n.
B¶ng 10.2 cho thÊy, c¸c gen biÓu hiÖn m¹nh cã xu h−íng “−u tiªn” sö dông c¸c axit
amin cã chi phÝ n¨ng l−îng tæng hîp thÊp nÕu chóng cã cïng tÝnh chÊt hãa häc vµ cã thÓ
thay thÕ ®−îc. Trong tÕ bµo, n¨ng l−îng tiªu hao cho sù tæng hîp 20 lo¹i axit amin kh¸c
nhau lµ kh¸c nhau. VÝ dô, ®Ó tæng hîp mét ph©n tö Gly cÇn n¨ng l−îng t−¬ng ®−¬ng lµ
11,7 ph©n tö ATP; cßn ®Ó tæng hîp mét ph©n tö Trp cÇn n¨ng l−îng t−¬ng ®−¬ng lµ 78,3
ph©n tö ATP. Trong cÊu tróc cña c¸c protein, cã nh÷ng vÞ trÝ kh«ng thÓ thay thÕ ®−îc
axit amin Trp, nh−ng ë bÊt cø vÞ trÝ Trp nµo cã thÓ thay thÕ ®−îc b»ng Gly (hoÆc thËm
chÝ xãa bá hoµn toµn) th× chän läc tù nhiªn cã xu h−íng “−u tiªn” cho sù thay ®æi nh−
vËy. ë c¸c gen ®−îc biÓu hiÖn m¹nh, sù thay ®æi nµy t¹o ra hiÖu qu¶ tiÕt kiÖm n¨ng
l−îng cao nhÊt. ViÖc gi¶i tr×nh tù hoµn chØnh hµng tr¨m hÖ gen vi khuÈn gÇn ®©y ®· x¸c
nhËn nhËn ®Þnh nµy.

10.3.1.8. Trong hÖ gen, c¸c gen cã tèc ®é tiÕn hãa kh¸c nhau
Tèc ®é tiÕn hãa gi÷a c¸c gen trong hÖ gen, thËm chÝ gi÷a c¸c vïng kh¸c nhau trong
mét gen, lµ kh«ng gièng nhau. Sù kh¸c nhau nµy phô thuéc vµo hai yÕu tè: 1) sù kh¸c
nhau trong tÇn sè ®ét biÕn ë mçi gen, vµ 2) møc ®é t¸c ®éng cña chän läc tù nhiªn lªn mçi
locut. §Ó x¸c ®Þnh mét thay ®æi nucleotide trong hÖ gen lµ do tÝnh thÝch nghi hay chØ lµ
sù kiÖn ngÉu nhiªn, McDonald-Kreitman (1991) ®−a ra m« h×nh so s¸nh sù ®a h×nh di
truyÒn trong ph¹m vi mét loµi víi sù ph©n li gi÷a c¸c loµi kh¸c nhau t¹i c¸c vÞ trÝ ®ét
biÕn ®ång nghÜa vµ kh¸c nghÜa trong vïng m· hãa cña gen. NÕu ë mét gen, tØ sè gi÷a ®ét
biÕn kh¸c nghÜa so víi ®ét biÕn ®ång nghÜa trong ph¹m vi mét loµi t−¬ng ®−¬ng víi gi÷a

299
§inh §oµn Long

B¶ng 10.2. TÇn sè sö dông axit amin trong 10% c¸c s¶n phÈm cña gen cã møc biÓu hiÖn cao nhÊt vµ
10% c¸c s¶n phÈm cña gen cã møc biÓu hiÖn ë møc thÊp nhÊt ë 3 loµi sinh vËt nh©n s¬

Streptococcus Bacillus subtilis subsp.


§é lÖch tõ Escherichia coli K12
Chi phÝ n¨ng pneumonia R6 subtilis str. 168
Axit chi phÝ
l−îng tæng §é lÖch §é lÖch §é lÖch
amin(*) n¨ng l−îng
hîp (sè ATP) ThÊp Cao tÇn sè ThÊp Cao tÇn sè ThÊp Cao tÇn sè
trung b×nh
sö dông sö dông sö dông
Gly (G) 11,7 - 15,66 6,40 8,16 1,76 6,01 8,30 2,29 6,12 8,11 1,99
Ser (S) 11,7 - 15,66 6,65 4,99 - 1,67 6,47 4,96 - 1,51 6,24 5,84 - 0,40
Ala (A) 11,7 - 15,66 8,48 9,76 1,27 5,85 9,80 3,95 7,40 8,70 1,30
Asp (D) 12,7 - 14,66 4,81 5,95 1,15 4,85 6,04 1,19 5,06 5,42 0,36
Asn (N) 14,7 - 12,66 4,45 3,92 - 0,52 3,64 4,60 0,96 3,32 4,24 0,92
Glu (E) 15,3 - 12,06 5,23 7,10 1,87 6,54 7,91 1,37 6,71 8,11 1,40
Gln (Q) 16,3 - 11,06 4,48 3,83 - 0,66 4,43 3,33 - 1,10 3,98 3,46 - 0,52
Thr (T) 18,7 - 8,66 5,41 5,22 - 0,19 4,78 5,97 1,19 4,92 5,82 0,89
Pro (P) 20,3 - 7,06 4,22 4,08 - 0,15 3,17 3,72 0,55 3,87 3,62 - 0,25
Val (V) 23,3 - 4,06 6,24 7,64 1,39 6,54 8,13 1,59 6,59 7,94 1,35
Cys (C) 24,7 - 2,66 1,50 0,92 - 0,57 0,88 0,33 - 0,55 1,02 0,52 - 0,50
Arg (R) 27,3 - 0,06 5,38 5,45 0,07 4,61 4,21 - 0,40 4,71 3,99 - 0,72
Leu (L) 27,3 - 0,06 11,56 8,96 - 2,59 12,70 7,97 - 4,73 10,85 8,40 - 2,45
Lys (K) 30,3 + 2,94 4,34 5,66 1,32 5,96 7,16 1,19 6,25 7,55 1,30
Ile (I) 32,3 + 4,94 6,72 6,03 - 0,69 7,74 6,41 - 1,33 6,79 7,14 0,35
Met (M) 34,3 + 6,94 2,39 2,70 0,31 2,29 2,07 - 0,22 2,65 2,28 - 0,37
His (H) 38,3 + 10,94 2,50 2,05 - 0,45 2,21 1,61 - 0,60 2,74 1,80 - 0,93
Tyr (Y) 50,0 + 22,64 3,15 2,82 - 0,34 4,44 2,96 - 1,48 3,94 2,85 - 1,09
Phe (F) 52,0 + 24,64 4,35 3,71 - 0,64 5,76 3,69 - 2,07 5,56 3,53 - 2,04
Trp (W) 74,3 + 46,94 1,73 1,05 - 0,69 1,13 0,81 - 0,32 1,27 0,67 - 0,60
( )
* C¸c axit amin ®−îc xÕp theo thø tù møc chi phÝ n¨ng l−îng cÇn ®Ó tæng hîp nªn mét ph©n tö axit amin t¨ng dÇn (tÝnh t−¬ng ®−¬ng víi sè liªn kÕt
pyrophosphate cÇn “®øt g·y” tõ ATP ®Ó gi¶i phãng n¨ng l−îng tù do cÇn cho qu¸ tr×nh tæng hîp)(theo Akashi vµ Gojobori, 2002)

c¸c loµi kh¸c nhau, th× hÇu hÕt c¸c ®ét B¶ng 10.3. Tèc ®é thay thÕ nucleotide trung b×nh
biÕn ë gen nµy lµ trung tÝnh; tøc lµ, sù trong tr×nh tù ADN cña c¸c gen ®éng vËt cã vó
thay thÕ nucleotide cã khuynh h−íng Tèc ®é ®ét biÕn(*) Tèc ®é ®ét biÕn
ngÉu nhiªn. Nh−ng nÕu nh÷ng tØ sè nµy C¸c gen
kh¸c nghÜa ®ång nghÜa
kh¸c nhau, th× cã sù t¸c ®éng cña chän Histone H4 0,004 1,43
läc tù nhiªn lªn locut. Nãi c¸ch kh¸c, sù Insulin 0,16 5,41
thay thÕ nucleotide ë ®©y cã khuynh Prolactin 1,29 5,59
h−íng lµm t¨ng tÝnh thÝch nghi cña sinh α-Globin 0,56 3,94
vËt. β-Globin 0,87 2,96
Albumin 0,92 6,72
ë ®éng vËt cã vó, tØ sè gi÷a ®ét
α-Fetoprotein 1,21
4,90
biÕn thay thÕ kh¸c nghÜa víi ®ång nghÜa
MHC 5,10 2,40
lµ kh¸c nhau râ rÖt ë c¸c locut kh¸c
Apolipoprotein E 0,98 4,04
nhau (b¶ng 10.3). §iÒu nµy ph¶n ¸nh, ( )
* Tèc ®é ®ét biÕn ë ®©y lµ sè lÇn thay ®æi nucleotide t¹i mçi vÞ trÝ nucleotide
chän läc tù nhiªn t¸c ®éng víi “c−êng ®é” trªn gen x¶y ra trung b×nh hµng n¨m (x 10-9)
kh¸c nhau lªn mçi locut. VÝ dô vÒ hai
nhãm gen m· hãa cho protein lµ histone vµ apolipoprotein minh häa cho thÊy hiÖu qu¶
t¸c ®éng cña chän läc tù nhiªn cßn tïy thuéc vµo chøc n¨ng cña protein. Cô thÓ, histone
lµ c¸c protein tÝch ®iÖn d−¬ng, cã chøc n¨ng liªn kÕt ADN vµ lµ thµnh phÇn thiÕt yÕu cña

300
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

chÊt nhiÔm s¾c ë tÊt c¶ c¸c sinh vËt nh©n thËt. HÇu nh− tÊt c¶ c¸c axit amin cã trong
ph©n tö histone (vÝ dô H4) ®Òu t−¬ng t¸c víi c¸c gèc hãa häc kh¸c nhau trªn ph©n tö
ADN tÝch ®iÖn ©m. V× vËy, gÇn nh− tÊt c¶ mäi sù thay ®æi trªn ph©n tö histone H4 ®Òu
¶nh h−ëng ®Õn kh¶ n¨ng t−¬ng t¸c cña protein nµy víi ADN. Nh− vËy, histone lµ mét
trong nh÷ng nhãm protein cã tèc ®é tiÕn hãa chËm nhÊt. ThËm chÝ, cã thÓ thay thÕ
histone H4 cña ng−êi b»ng histone H4 cña nÊm men mµ kh«ng lµm thay ®æi hiÖu qu¶
kiÓu h×nh (dï r»ng nÊm men vµ ng−êi ®· t¸ch li tiÕn hãa tõ hµng tr¨m triÖu n¨m). §iÒu
nµy ng−îc víi c¸c apolipoprotein phæ biÕn trong hÖ miÔn dÞch ë §VCXS, vèn cã chøc n¨ng
t−¬ng t¸c vµ vËn chuyÓn kh«ng ®Æc hiÖu nhiÒu hîp chÊt lipide kh¸c nhau. MiÒn liªn kÕt
lipide cña protein nµy gåm thµnh phÇn chñ yÕu lµ c¸c axit amin kÞ n−íc. C¸c axit amin
cã tÝnh kÞ n−íc (vÝ dô: Leu, Ile vµ Val) ®Òu cã thÓ thay thÕ nhau trong miÒn liªn kÕt nµy
mµ kh«ng lµm thay ®æi chøc n¨ng cña protein. KÕt qu¶ lµ, nÕu nh− histone H4 chØ thÊy
cã mét d¹ng duy nhÊt ë ng−êi, th× apolipoprotein cã hµng chôc d¹ng kh¸c nhau.
MÆc dï phÇn lín nh÷ng thay ®æi axit amin ë hÇu hÕt protein th−êng lµ cã h¹i vµ bÞ
chän läc tù nhiªn ®µo th¶i, nh−ng còng cã mét sè locut gen chän läc tù nhiªn l¹i “−u tiªn”
t¨ng sù biÕn ®æi. VÝ dô ®iÓn h×nh vÒ xu h−íng nµy lµ c¸c nhãm gen cña hÖ thèng miÔn
dÞch, bao gåm phøc hÖ t−¬ng hîp m«, c¸c côm gen m· hãa kh¸ng thÓ hoÆc thô thÓ tÕ bµo
T (xem ch−¬ng 9). Ch¼ng h¹n, c¸c gen m· hãa phøc hÖ t−¬ng hîp m« MHC lu«n kh¸c
nhau gi÷a mçi c¸ thÓ (trõ tr−êng hîp ®a sinh cïng trøng). V× vËy, tØ lÖ ®é biÕn kh¸c
nghÜa trong c¸c gen MHC lín h¬n nhiÒu so víi tØ lÖ ®ét biÕn ®ång nghÜa (b¶ng 10.3).
MHC lµ mét hä lín cña nhiÒu gen mµ s¶n phÈm do chóng m· hãa quyÕt ®Þnh kh¶ n¨ng
nhËn biÕt c¸c kh¸ng nguyªn l¹ cña hÖ thèng miÔn dÞch. Trong c¸c quÇn thÓ ng−êi,
kho¶ng 90% c¸c c¸ thÓ nhËn c¸c nhãm gen MHC kh¸c nhau tõ bè vµ mÑ. Khi ph©n tÝch
mét nhãm bÊt kú gåm kho¶ng 200 c¸ thÓ, sè alen kh¸c biÖt cña locut MHC dao ®éng tõ
15 ®Õn 30 alen. Møc ®é ®a d¹ng cao cña nh÷ng vïng gen nµy ®−îc chän läc tù nhiªn duy
tr×. Bëi v× sè lo¹i virut vµ c¸c thÓ g©y nhiÔm lµ rÊt lín, nªn viÖc duy tr×nh tÝnh ®a h×nh
cao sÏ gióp t¨ng sè c¸ thÓ (trong quÇn thÓ) cã kh¶ n¨ng kh¸ng víi nhiÒu lo¹i virut (thùc
chÊt lµ ph¸t hiÖn ®−îc kh¸ng nguyªn cña virut ®ã). Nh−ng, trong qu¸ tr×nh tiÕn hãa,
song song víi viÖc c¸c quÇn thÓ vËt chñ duy tr× tÝnh ®a d¹ng cao cña hÖ thèng miÔn dÞch
th× c¸c virut còng cã tèc ®é tiÕn hãa rÊt nhanh. C¸c gen virut cóm cã tèc ®é thay thÕ
nucleotide ®¹t 1,9x10-3 nucleotide mçi n¨m, tøc lµ gÊp 1 triÖu lÇn tèc ®é ®ét biÕn ®ång
nghÜa ë vïng m· hãa cña c¸c gen ®éng vËt cã vó.

10.3.2. So s¸nh c¸c hÖ gen


10.3.2.1. So s¸nh hÖ gen lµ c«ng cô nghiªn cøu tiÕn hãa vµ x¸c ®Þnh chøc n¨ng gen
Xu h−íng tiÕn hãa chËm cña c¸c tr×nh tù ADN lµ c¬ së cña lÜnh vùc nghiªn cøu hÖ
gen häc so s¸nh (comparative genomics). Trong ®ã, toµn bé hÖ gen cña c¸c loµi kh¸c
nhau ®−îc so s¸nh víi nhau. Mét trong nh÷ng môc tiªu cña c¸c dù ¸n gi¶i tr×nh tù hÖ
gen ë mçi loµi sinh vËt lµ lËp b¶n ®å ®Çy ®ñ cña c¸c gen, nghÜa lµ x¸c ®Þnh vÞ trÝ cña
chóng trªn mçi NST. ViÖc lËp b¶n ®å c¸c gen trong hÖ gen ng−êi ®−îc coi lµ nÒn t¶ng cho
tiÒm n¨ng øng dông kü thuËt thuËt di truyÒn vµ liÖu ph¸p gen trong viÖc ch÷a trÞ c¸c
gen sai háng ë c¸c bÖnh do ®ét biÕn g©y ra, nh− bÖnh hãa x¬ nang hay c¸c bÖnh ung th−.
Nh−ng trong thùc tÕ, nÕu chØ x¸c ®Þnh ®−îc vÞ trÝ mét gen nµo ®ã trªn NST th× kh«ng ®ñ
®Ó chØ ra chøc n¨ng cña gen ®ã, còng nh− kh«ng râ gen ®ã t−¬ng t¸c thÕ nµo víi c¸c gen
vµ c¸c tr×nh tù kh¸c trong hÖ gen. Cã ®Õn 95% tr×nh tù ADN thuéc c¸c hÖ gen sinh vËt
bËc cao lµ c¸c tr×nh tù kh«ng m· hãa. V× vËy, ngay c¶ khi toµn bé tr×nh tù mét hÖ gen ®·
®−îc gi¶i m·, th× viÖc x¸c ®Þnh ph©n ®o¹n nµo lµ vïng m· hãa vµ chøc n¨ng cña s¶n
phÈm do chóng m· hãa th−êng kh«ng dÔ dµng. Trong bèi c¶nh ®ã, viÖc so s¸nh c¸c tr×nh

301
§inh §oµn Long

tù hÖ gen lµ mét trong nh÷ng c¸ch tèt nhÊt ®Ó dù ®o¸n chøc n¨ng cña mét tr×nh tù nhÊt
®Þnh trong hÖ gen. Cô thÓ lµ, viÖc ph¸t hiÖn ra c¸c tr×nh tù gièng nhau ë hai loµi kh¸c xa
nhau lµ dÊu hiÖu cho thÊy vai trß rÊt quan träng cña nh÷ng tr×nh tù nµy. VÝ dô, ng−êi vµ
chuét cã tæ tiªn chung c¸ch ®©y kho¶ng 80 – 100 triÖu n¨m. NÕu c¸c gen gi¶ cã tèc ®é thay
thÕ nucleotide lµ 5x10-9 t¹i mçi nucleotide mçi n¨m, th× gÇn 1/2 tæng sè nucleotide cña
nh÷ng gen nµy (kh«ng bÞ chän läc tù nhiªn ®µo th¶i) sÏ biÕn ®æi Ýt nhÊt mét lÇn kÓ tõ khi
tæ tiªn cña ng−êi vµ chuét b¾t ®Çu t¸ch li. Trªn c¬ së ®ã, khi so s¸nh c¸c hÖ gen, cã thÓ
nhËn biÕt c¸c vïng cã vai trß quan träng, nh− c¸c ®o¹n m· hãa hay c¸c tr×nh tù liªn kÕt
protein ®iÒu hßa t¹i promoter,...
Ph−¬ng ph¸p so s¸nh hÖ gen lµ mét c«ng cô kh«ng chØ h÷u hiÖu trong viÖc x¸c ®Þnh
vai trß c¸c tr×nh tù trong hÖ gen mµ cßn trong c¸c nghiªn cøu tiÕn hãa. Tuy vËy, ph−¬ng
ph¸p so s¸nh hÖ gen còng cã mét sè h¹n chÕ. Ch¼ng h¹n, mét sè gen ë ng−êi kh«ng t×m
thÊy gen “®èi t¸c” ë mét sè ®éng vËt bËc thÊp nªn kh«ng thÓ so s¸nh. Ngoµi ra, mét sè
protein cã vai trß ®a chøc n¨ng nh−ng sù biÓu hiÖn chøc n¨ng cña nh÷ng protein ®ã
kh«ng gièng nhau ë tÊt c¶ c¸c loµi.

10.3.2.2. Tèc ®é tiÕn hãa cña hÖ gen ti thÓ


So víi hÖ gen nh©n, hÖ gen ti thÓ cã ph−¬ng thøc sao chÐp vµ di truyÒn kh¸c biÖt.
Do vËy, hËu qu¶ cña c¸c ®ét biÕn thay thÕ trong hÖ gen ti thÓ vÒ c¨n b¶n còng kh¸c hÖ
gen nh©n. HÖ gen ti thÓ ®éng vËt cã vó chøa mét ph©n tö ADN (kÝ hiÖu lµ mtADN) cã
d¹ng sîi kÐp, m¹ch vßng, dµi kho¶ng 15.000 bp. Ph©n tö mtARN cña ng−êi kh¸ ®Æc
tr−ng víi kÝch th−íc b»ng kho¶ng 1/10.000 hÖ gen nh©n; m· hãa cho 2 lo¹i rARN, 22 lo¹i
tARN vµ 13 lo¹i protein. Víi kÝch th−íc nhá vµ tØ lÖ ®ét biÕn thay thÕ nucleotide ®Æc biÖt
cao, hÖ gen ti thÓ lµ mét ®èi t−îng nghiªn cøu tiÕn hãa phï hîp.
TØ lÖ ®ét biÕn thay thÕ nucleotide ®ång nghÜa ë c¸c gen ti thÓ ng−êi vµo kho¶ng
5,7x10-8 nucleotide mçi n¨m, gÊp 10 lÇn tØ lÖ ®ét biÕn ®ång nghÜa trung b×nh trong vïng
m· hãa cña hÖ gen nh©n. TØ lÖ ®ét biÕn kh¸c nghÜa ë c¸c gen m· hãa protein thuéc hÖ gen
ti thÓ rÊt kh¸c nhau. Nh−ng, trong mäi tr−êng hîp, tØ lÖ nµy ®Òu cao h¬n nhiÒu tØ lÖ ®ét
biÕn kh¸c nghÜa ë c¸c gen thuéc hÖ gen nh©n. C¬ chÕ nµo dÉn ®Õn viÖc mtADN cã tèc ®é
thay ®æi nucleotide lín h¬n nhiÒu so víi ADN hÖ gen nh©n ®Õn nay ch−a râ, nh−ng cã thÓ
liªn quan ®Õn tÇn sè sai sãt cao trong qu¸ tr×nh sao chÐp vµ söa ch÷a mtADN (ti thÓ
kh«ng cã nhiÒu c¬ chÕ söa ch÷a ADN nh− hÖ gen nh©n). Ngoµi ra, nång ®é cao h¬n cña
c¸c chÊt g©y ®ét biÕn, bao gåm c¸c gèc tù do chøa oxy (nh− O2-) vèn lµ s¶n phÈm cña qu¸
tr×nh trao ®æi chÊt diÔn ra trong ti thÓ còng cã thÓ lµ mét nguyªn nh©n dÉn ®Õn tÇn sè
®ét biÕn trong c¸c gen ti thÓ cao h¬n. Mét nguyªn nh©n kh¸c còng cã thÓ lµ do ¸p lùc
thÊp h¬n cña chän läc tù nhiªn ®èi víi hÖ gen ti thÓ v× trong mçi tÕ bµo cã hµng chôc ti
thÓ kh¸c nhau, trong ®ã trung b×nh mçi ti thÓ chøa 2 b¶n sao mtADN. §ã lµ ch−a kÓ ®Õn
c¸c thay ®æi x¶y ra trong phÇn lín c¸c protein, tARN vµ rARN ®−îc hÖ gen ti thÓ m· hãa
Ýt g©y ¶nh h−ëng tíi søc sèng cña c¬ thÓ sinh vËt h¬n so víi nh÷ng thay ®æi t−¬ng tù
trong hÖ gen nh©n (®Æc biÖt ë c¸c sinh vËt ®a bµo). Mét kh¸c biÖt n÷a gi÷a hÖ gen ti thÓ
vµ hÖ gen nh©n lµ hÖ gen ti thÓ chñ yÕu ®−îc di truyÒn theo dßng mÑ. Ti thÓ n»m trong tÕ
bµo chÊt, mµ hÇu nh− chØ cã tÕ bµo chÊt tõ trøng (cña mÑ) ®ãng gãp vµo tÕ bµo chÊt hîp
tö. KÕt qu¶ lµ, mtADN kh«ng tr¶i qua gi¶m ph©n mµ cã kiÓu gen gièng mÑ. ViÖc hÖ gen
ti thÓ tån t¹i ë tr¹ng th¸i ®¬n béi vµ kh«ng tr¶i qua gi¶m ph©n (nghÜa lµ kh«ng cã t¸i tæ
hîp do trao ®æi chÐo nh− cÆp NST t−¬ng ®ång trong hÖ gen nh©n) dÉn ®Õn quan ®iÓm cho
r»ng hÇu hÕt c¸c ®ét biÕn thay thÕ nucleotide trong hÖ gen ti thÓ lµ do ®ét biÕn (chø
kh«ng ph¶i do t¸i tæ hîp di truyÒn) sinh ra. KiÓu di truyÒn nµy cïng víi tèc ®é thay ®æi
nhanh cña hÖ gen ti thÓ cung cÊp mét c«ng cô hiÖu qu¶ cho nghiªn cøu tiÕn hãa vµ so
s¸nh hÖ gen gi÷a c¸c loµi; hoÆc gi÷a c¸c dßng, gièng, chñng téc … cña cïng mét loµi.

302
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

10.3.3. So s¸nh nhiÔm s¾c thÓ


ViÖc so s¸nh kiÓu h×nh NST gi÷a c¸c loµi, ®Æc biÖt ë sinh vËt nh©n thËt, lµ mét
ph−¬ng ph¸p nghiªn cøu c¬ b¶n ®· cung cÊp nhiÒu th«ng tin quan träng vÒ qu¸ tr×nh
h×nh thµnh c¸c loµi. C¸c ®o¹n NST, c¸c gen (hoÆc c¸c ph©n ®o¹n gen) vµ protein (hoÆc
c¸c ®o¹n tr×nh tù axit amin) gièng nhau ë nhiÒu loµi kh¸c nhau ®−îc gäi lµ c¸c ®o¹n
tr×nh tù b¶o thñ cao. KiÓu h×nh nhuém b¨ng NST (cßn gäi lµ “kiÓu nh©n”) cña ng−êi
gièng víi tinh tinh h¬n c¶, sau ®ã lµ víi khØ Gorilla vµ ®−êi −¬i (h×nh 10.9). KiÓu nh©n
cña ng−êi, tinh tinh vµ c¸c loµi v−în ng−êi chñ yÕu kh¸c nhau do mét sè ®ét biÕn ®¶o
®o¹n NST (x¶y ra trªn cïng NST). Cßn sù kh¸c biÖt chñ yÕu gi÷a kiÓu nh©n cña ng−êi vµ
ba loµi v−în ng−êi nµy víi c¸c loµi linh tr−ëng l©u ®êi h¬n chñ yÕu lµ do c¸c ®ét biÕn
chuyÓn ®o¹n NST (x¶y ra gi÷a c¸c NST). NÕu c¶ hai b¶n sao NST sè 2 cña ng−êi bÞ “®øt”
lµm ®«i th× kiÓu nh©n cña ng−êi sÏ cã 48 NST vµ lóc ®ã sÏ gièng víi kiÓu nh©n cña c¸c
loµi v−în ng−êi. KiÓu h×nh nhuém b¨ng NST sè 1 cña ng−êi, tinh tinh, khØ Gorilla vµ
®−êi −¬i gièng víi kiÓu h×nh nhuém b¨ng cña hai NST nhá t×m thÊy ë mét loµi khØ ®u«i
xanh Ch©u Phi. §iÒu nµy cho thÊy, loµi khØ nµy cã quan hÖ di truyÒn, hoÆc thËm chÝ lµ tæ
tiªn cña c¸c loµi linh tr−ëng kh¸c. Khi so s¸nh kiÓu h×nh nhuém b¨ng NST cña c¸c loµi
cã quan hÖ xa h¬n, ng−êi ta nhËn thÊy kiÓu h×nh nhuém b¨ng cña NST X gièng nhau ë
tÊt c¶ c¸c loµi ®éng vËt cã vó.
KiÓu h×nh nhuém b¨ng NST gièng nhau ë nhiÒu loµi ®éng vËt rÊt kh¸c nhau vÒ
h×nh th¸i lµ mét b»ng chøng cho thÊy nguån gèc chung cña c¸c sinh vËt trªn Tr¸i ®Êt.
Nh−ng, v× c¸c ®o¹n NST cã kiÓu h×nh nhuém b¨ng gièng nhau nh−ng ch−a ch¾c mang
c¸c gen cã tr×nh tù hoµn toµn gièng nhau nªn viÖc so s¸nh NST kh«ng ph¶i lµ ph−¬ng
ph¸p lý t−ëng ®Ó x¸c ®Þnh kho¶ng c¸ch di truyÒn gi÷a c¸c loµi. Kü thuËt nhuém b¨ng
NST theo nguyªn t¾c lai huúnh quang t¹i chç - FISH (xem ch−¬ng 11), sö dông c¸c
mÉu dß ADN ®¸nh dÊu huúnh quang, cho phÐp so s¸nh c¸c NST t¹i c¸c vÞ trÝ gen ®Æc
thï. Sù t−¬ng quan vÒ trËt tù c¸c gen trªn NST gi÷a c¸c loµi lµ c¬ së x¸c ®Þnh mèi quan
hÖ tiÕn hãa gi÷a chóng. Ch¼ng h¹n, mét nhãm gåm 11 gen liªn kÕt ®−îc t×m thÊy ®ång
thêi trªn vai dµi NST sè 11 cña ng−êi, trªn NST sè 16 cña chuét vµ NST U10 ë bß. Tuy
vËy, mét sè gen liªn kÕt trªn NST sè 3 vµ NST sè 21 cña ng−êi ®−îc t×m thÊy cïng n»m

N T G§ N T G § N T G § N T G § N T G § N T G §
NST sè 1 NST sè 2 NST sè 3 NST sè 4 NST sè 5 NST sè 6
H×nh 10.9. Sù gièng nhau vÒ kiÓu h×nh nhuém b¨ng NST gi÷a ng−êi vµ c¸c loµi linh tr−ëng. NST c¸c loµi
®−îc xÕp theo thø tù tõ tr¸i qua ph¶i gåm ng−êi (N), tinh tinh (T), khØ Gorilla (G) vµ ®−êi −¬i (§). §©y lµ c¸c NST
t−¬ng øng víi c¸c NST tõ 1 ®Õn 6 cña ng−êi. C¸c NST kh¸c gi÷a c¸c loµi nµy còng cã sù t−¬ng ®ång cao. NÕu
NST sè 2 cña ng−êi “®øt” lµm ®«i th× ng−êi còng cã kiÓu nh©n gåm 48 NST nh− c¸c loµi linh tr−ëng kh¸c.

303
§inh §oµn Long

trªn mét NST ë chuét vµ bß. §iÒu nµy ®−a ®Õn gi¶ thiÕt lµ: loµi ®éng vËt cã vó vèn lµ tæ
tiªn chung cña ba loµi nªu trªn cïng cã c¸c gen nµy liªn kÕt víi nhau trªn mét NST; sau
®ã, chóng “ph¸t t¸n” ®Õn c¸c NST kh¸c trong qu¸ tr×nh tiÕn hãa.

10.3.4. So s¸nh c¸c tr×nh tù protein


Sù kiÖn tÊt c¶ mäi d¹ng sèng trªn Tr¸i ®Êt ®Òu sö dông mét m· di truyÒn chung ®Ó
tæng hîp nªn c¸c lo¹i protein lµ b»ng chøng cho thÊy tÊt c¶ mäi d¹ng sèng trªn Tr¸i ®Êt
cã chung mét tæ tiªn. ViÖc so s¸nh c¸c tr×nh tù protein gi÷a c¸c loµi sinh vËt kh¸c nhau
còng bæ sung thªm d÷ liÖu ñng hé gi¶ thiÕt nµy. VÝ dô, c¸c gen m· hãa keratin tæng hîp
protein l«ng cõu cã ®o¹n t−¬ng ®ång n»m trªn NST sè 11 cña ng−êi. Sù gièng nhau vÒ
thµnh phÇn vµ tr×nh tù axit amin trong c¸c lo¹i protein t−¬ng øng ë ng−êi vµ tinh tinh lµ
®¸ng ng¹c nhiªn (kho¶ng 99%). Mét sè protein cña hai loµi gièng nhau hoµn toµn. Trªn
c¬ së ®ã, khi ph©n tÝch chøc n¨ng cña mét gen míi, c¸c nhµ nghiªn cøu cã thÓ tham kh¶o
c¸c d÷ liÖu cã s½n vÒ nh÷ng gen ®· biÕt ë c¸c sinh vËt kh¸c. Hai vÝ dô d−íi ®©y lµ vÒ hai
trong sè nh÷ng lo¹i protein cã tÝnh b¶o thñ nhÊt

10.3.4.1. Cytochrome C
Cã lÏ, cytochrome C lµ mét protein ®−îc
B¶ng 10.4. Sù tiÕn hãa trong tr×nh tù axit
nghiªn cøu kü nhÊt ®Õn nay vÒ khÝa c¹nh tiÕn amin cña protein cytochrom C
hãa. Protein nµy cã vai trß “b¾t gi÷” n¨ng l−îng Sè axit amin kh¸c biÖt víi
Loµi
tõ c¸c chÊt dinh d−ìng trong qu¸ tr×nh h« hÊp tÕ cytochrom C cña ng−êi
bµo ë ti thÓ. 20 trong tæng sè 104 axit amin cña Tinh tinh 0
protein nµy cã vÞ trÝ gièng hÖt nhau ë tÊt c¶ c¸c KhØ Rhesus 1
loµi eukaryote. Hai loµi cµng cã quan hÖ gÇn, th× Thá 9
Bß 10
cã møc ®é gièng nhau vÒ tr×nh tù axit amin trªn
Chim bå c©u 12
ph©n tö cytochrome C cµng cao. VÝ dô,
Õch 20
cytochrome C cña ng−êi kh¸c cña ngùa lµ 12 axit
Ruåi giÊm 24
amin, kh¸c víi cytochrome C cña k¨ng¬ru lµ 8 Lóa m× 37
axit amin, nh−ng gièng hÖt cytochrome C cña NÊm men 42
tinh tinh (b¶ng 10.4).

10.3.4.2. C¸c protein homeobox


Mét nhãm gen kh¸c còng thay ®æi rÊt Ýt trong suèt qu¸ tr×nh tiÕn hãa ®−îc gäi lµ
c¸c gen homeobox, gäi t¾t lµ HOX. C¸c gen nµy m· hãa cho c¸c yÕu tè phiªn m· ®iÒu
khiÓn thø tù “bËt” vµ “t¾t” c¸c gen trong qu¸ tr×nh ph¸t triÓn ph«i. Sù phèi hîp gi÷a c¸c
yÕu tè phiªn m· nµy víi c¸c yÕu tè phiªn m· kh¸c quy ®Þnh vÞ trÝ vµ thêi ®iÓm ph¸t sinh
c¸c c¬ quan ë ph«i. C¸c protein homeobox cã mét ®o¹n tr×nh tù b¶o thñ cao gåm 60 axit
amin, gäi lµ miÒn homeo (hay cßn gäi lµ miÒn ®ång h×nh, homeodomain), ®−îc m· hãa bëi
mét ®o¹n tr×nh tù 180 nucleotide trªn ADN (còng ®−îc gäi lµ homeobox). TÊt c¶ c¸c gen
mang ®o¹n tr×nh tù homeobox ®−îc gäi lµ c¸c gen kiÓu homeo. C¸c gen kiÓu homeo
®−îc t×m thÊy ë c¶ ®éng bËc thÊp (cã cÊu t¹o c¬ thÓ ®¬n gi¶n nh− søa) còng nh− ë ®éng
vËt bËc cao (cã cÊu t¹o c¬ thÓ phøc t¹p nh− con ng−êi). ë tÊt c¶ c¸c loµi mµ c¸c gen
HOX ®· ®−îc gi¶i tr×nh tù, c¸c gen nµy ®Òu cã vai trß “bè trÝ cÊu tróc c¬ thÓ”. HÖ gen
ng−êi vµ c¸c loµi ®éng vËt cã x−¬ng sèng cã 39 gen HOX, ®−îc tæ chøc thµnh 4 côm gen,
kÝ hiÖu lµ A, B, C vµ D. C¸c gen nµy ®Òu chøa rÊt Ýt intron. §iÓm ®¸ng l−u ý ë c¸c côm
gen HOX lµ mçi gen chØ ®−îc biÓu hiÖn vµo mét thêi ®iÓm nhÊt ®Þnh vµ theo mét trËt tù
nhÊt ®Þnh ®−îc ®iÒu khiÓn nghiªm ngÆt trong qu¸ tr×nh ph¸t triÓn ph«i. Thø tù biÓu
hiÖn c¸c gen t−¬ng øng ®óng víi thø tù vÞ trÝ cña chóng trªn NST. C¸c thuËt ng÷

304
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

“homeobox” vµ “homeodomain” cã xuÊt xø tõ “homeotic” nghÜa lµ “thuéc phÇn ®ét biÕn”.


Së dÜ nh− vËy, v× nh÷ng gen homeobox ®Çu tiªn ®−îc t×m thÊy liªn quan ®Õn c¸c ®ét
biÕn g©y rèi lo¹n cÊu tróc th©n ë ruåi giÊm. Vai trß trong tiÕn hãa cña mét sè gen
homeobox ®· ®−îc nªu ë môc 10.2.
C¸c ®ét biÕn ë c¸c gen homeobox g©y nªn mét sè bÖnh di truyÒn ë ng−êi. ë mét
d¹ng bÖnh “m¸u tr¾ng”, mét ®ét biÕn gen homeobox lµm cho mét sè tÕ bµo b¹ch cÇu ch−a
thµnh thôc (ch−a chÝn) chuyÓn sang con ®−êng ph¸t triÓn c¬ quan bÊt th−êng. TÕ bµo bÊt
th−êng nµy duy tr× tèc ®é ph©n chia nhanh vèn cã cña tÕ bµo b¹ch cÇu ch−a chÝn dÉn ®Õn
bÖnh ung th−. Mét bÖnh kh¸c còng cã nguyªn nh©n tõ ®ét biÕn gen homeobox ®−îc gäi lµ
Héi chøng §i-Gioãcd¬ (DiGeorge). MÆc dï c¸c c¸ thÓ bÞ bÖnh nµy kh«ng cã kiÓu h×nh
“ch©n mäc tõ ®Çu” nh− ë c«n trïng (xem môc 10.2) nh−ng kiÓu biÓu hiÖn th× t−¬ng tù.
Nh÷ng c¸ thÓ m¾c héi chøng nµy th−êng thiÕu tuyÕn øc vµ tuyÕn cËn gi¸p; c¸c c¬ quan
nh− tai, mòi, miÖng, cæ ... ph¸t triÓn bÊt th−êng. Nh− vËy, vÞ trÝ cña c¸c c¬ quan bÊt
th−êng nµy còng t−¬ng quan víi c¸c ®èt th©n phÝa tr−íc ë c«n trïng.
Mét sè thÝ nghiÖm chuyÓn gen homeobox tõ loµi nµy sang loµi kh¸c cho thÊy vai trß
thiÕt yÕu vµ chøc n¨ng gièng nhau cña c¸c gen homeobox cã nguån gèc tõ c¸c loµi kh¸c
nhau. Khi ruåi giÊm ®−îc chuyÓn gen homeobox tõ chuét, kiÓu h×nh ®ét biÕn xuÊt hiÖn
còng gièng hÖt nh− khi gen homeobox cña chÝnh ruåi giÊm biÓu hiÖn bÊt th−êng. T−¬ng
tù nh− vËy, khi gen homeobox cña ng−êi ®−îc chuyÓn vµo chuét, sù biÓu hiÖn chøc n¨ng
cña nã gièng víi gen “®èi t¸c” cña chuét. Nh− vËy, ho¹t ®éng cña c¸c gen homeobox cã lÏ
lµ c¬ chÕ c¬ b¶n ®iÒu khiÓn qu¸ tr×nh ph¸t triÓn ë mäi sinh vËt ®a bµo.

10.4. §ång hå ph©n tö vµ x©y dùng c©y chñng lo¹i ph¸t sinh
10.4.1. ThuyÕt ®ång hå ph©n tö
10.4.1.1. C¬ së h×nh thµnh thuyÕt ®ång hå ph©n tö
Nh− nªu ë trªn, møc ®é thay thÕ nucleotide t¹i mçi vïng ADN cña hÖ gen còng nh−
sù thay thÕ axit amin trong c¸c ph©n tö protein ®−îc c¸c gen m· hãa lµ kh¸c nhau, vµ
phô thuéc vµo ¸p lùc cña chän läc tù nhiªn lªn mçi locut vµ chøc n¨ng cña c¸c s¶n phÈm
gen. Tuy vËy, ë c¸c locut cã ¸p lùc chän läc t−¬ng ®−¬ng th× tèc ®é thay ®æi trong c¸c
tr×nh tù ADN lµ æn ®Þnh, khi xÐt trong qu·ng thêi gian tiÕn hãa l©u dµi.
Vµo nh÷ng n¨m 1960, Zuckerkandl vµ Linus Pauling lµ nh÷ng ng−êi ®Çu tiªn tiÕn
hµnh so s¸nh tr×nh tù c¸c protein vµ rót ra nhËn xÐt r»ng: tèc ®é thay thÕ c¸c axit amin
trong cïng ph©n tö protein vÒ c¬ b¶n lµ æn ®Þnh qua hµng triÖu n¨m tiÕn hãa. Trªn c¬ së
nhËn ®Þnh nµy, hä ®· vÝ sù tÝch lòy c¸c ®ét biÕn thay thÕ axit amin nh− nhÞp ®Õm cña
®ång hå tiÕn hãa vµ gäi lµ thuyÕt ®ång hå ph©n tö. §ång hå ph©n tö cã thÓ ch¹y víi tèc
®é kh¸c nhau khi xÐt ë c¸c protein kh¸c nhau, nh−ng sù kh¸c nhau gi÷a hai protein
t−¬ng ®ång th× t−¬ng quan chÆt víi kho¶ng thêi gian kÓ tõ khi hai loµi (mang hai lo¹i
protein t−¬ng ®ång) t¸ch li tiÕn hãa tõ tæ tiªn chung (h×nh 10.10). ThuyÕt ®ång hå ph©n
tö ngay lËp tøc ®· thóc ®Èy c¸c nghiªn cøu tiÕn hãa. Tèc ®é thay ®æi æn ®Þnh gi÷a c¸c
tr×nh tù t−¬ng ®ång kh«ng chØ gióp x¸c ®Þnh ®−îc mèi quan hÖ di truyÒn gi÷a c¸c loµi,
mµ cßn gióp −íc tÝnh qu·ng thêi gian mµ chóng ph©n li khái nhau (gièng nh− c¸ch ®ång
vÞ phãng x¹ ®−îc dïng ®Ó x¸c ®Þnh tuæi hãa th¹ch). Dï vËy, trong thùc tÕ thuyÕt ®ång hå
ph©n tö còng nhËn ®−îc nh÷ng ý kiÕn kh«ng ®ång t×nh. Ch¼ng h¹n, c¸c nhµ tiÕn hãa
kinh ®iÓn cho r»ng nhÞp ®iÖu tiÕn hãa thÊt th−êng cña nhiÒu ®Æc ®iÓm h×nh th¸i kh«ng
t−¬ng ®ång víi tèc ®é thay ®æi æn ®Þnh ë møc ph©n tö. Trong mét sè tr−êng hîp, kÕt qu¶
−íc tÝnh thêi gian ph©n li tiÕn hãa dùa trªn c¸c ph−¬ng ph¸p kinh ®iÓn vµ ph©n tö kh«ng
thèng nhÊt víi nhau.

305
§inh §oµn Long

Chim/ bß s¸t (240 triÖu n¨m)

§éng vËt cã x−¬ng sèng /


Bß s¸t / c¸ (400 triÖu n¨m)
Ph©n li tiÕn hãa cña c¸c

C¸ x−¬ng / c¸ miÖng trßn

c«n trïng (600 triÖu n¨m)


§éng vËt cã vó / bß s¸t
loµi ®éng vËt cã vó

(300 triÖu n¨m)

(500 triÖu n¨m)


Sù t¸ch li tæ tiªn
thùc vËt vµ ®éng
vËt (1,2 tû n¨m)
Sè axit amin thay ®æi trong 100 axit amin

C¸c
fibrinopeptide Hemoglobin
(1,1 triÖu n¨m) (5,8 triÖu n¨m)

Cytochrome C
(20 triÖu n¨m)

TriÖu n¨m tiÕn hãa


H×nh 10.10. Tèc ®é tiÕn hãa kh¸c nhau cña c¸c protein. C¸c protein Fibrinogen chÞu ¸p lùc chän läc tù
nhiªn thÊp h¬n vµ cã tÇn sè ®ét biÕn trung tÝnh thay thÕ nucleotide cao, cßn cytochrom C chÞu ¸p lùc chän
läc tù nhiªn cao h¬n vµ cã tÇn sè ®ét biÕn trung tÝnh thÊp. Sè liÖu tÝnh trung b×nh tõ nhiÒu sinh vËt kh¸c nhau.

10.4.1.2. C¸ch tÝnh tèc ®é tiÕn hãa t−¬ng ®èi


PhÇn lín kho¶ng thêi gian tiÕn hãa ph©n li (biÕn sè T trong ph−¬ng tr×nh 10.3)
gi÷a c¸c loµi hoÆc nhãm loµi sinh vËt trong c¸c nghiªn cøu tiÕn hãa ®−îc tÝnh to¸n dùa
trªn c¸c mÉu hãa th¹ch kh«ng hoµn chØnh ®· cã tuæi hµng ngh×n thËm chÝ hµng triÖu
n¨m. Do ®ã, gi¸ trÞ T x¸c ®Þnh ®−îc th−êng chØ lµ gi¸ trÞ t−¬ng ®èi vµ ®«i khi cã sai sè lín.
§Ó gi¶m thiÓu sai sè nµy, Sarich vµ Wilson (1973) ®· ®Ò ra mét c¸ch tÝnh ®¬n gi¶n gäi lµ
c¸ch tÝnh tèc ®é tiÕn hãa t−¬ng ®èi. Theo m« h×nh nµy, ®Ó x¸c ®Þnh tèc ®é thay thÕ
nucleotide t−¬ng ®èi ë hai loµi (1) vµ (2) thuéc cïng mét dßng tiÕn hãa, ng−êi ta sö dông
mét loµi thø (3) cã quan hÖ xa h¬n hai loµi (1) vµ (2), ®−îc gäi lµ loµi ngoµi nhãm (h×nh
10.11). Ch¼ng h¹n, nÕu loµi (1) vµ (2) lÇn l−ît lµ ng−êi vµ khØ Gorilla, th× loµi thø (3) cã
thÓ lµ mét loµi linh tr−ëng nµo ®ã, ch¼ng h¹n nh− khØ ®Çu chã - Papio. NÕu thêi ®iÓm
trong qu¸ tr×nh tiÕn hãa mµ loµi (1) vµ (2) t¸ch li khái nhau ®−îc kÝ hiÖu lµ A, th× sè
nucleotide kh¸c biÖt (d) cã thÓ cã gi÷a hai loµi sÏ b»ng tæng sè nucleotide thay ®æi xuÊt
hiÖn ë mçi loµi kÓ tõ thêi ®iÓm A, v× vËy:
d13 = dA1 + dA3 (ph−¬ng tr×nh 10.4)
d23 = dA2 + dA3 (ph−¬ng tr×nh 10.5)
d12 = dA1 + dA2 (ph−¬ng tr×nh 10.6)
trong ®ã, sè nucleotide kh¸c biÖt gi÷a c¸c loµi (1), (2) vµ (3) (tøc lµ d13, d23 vµ d12) cã thÓ
x¸c ®Þnh ®−îc tõ thùc nghiÖm. Khai triÓn c¸c ph−¬ng tr×nh ®¹i sè ®¬n gi¶n trªn, ta sÏ thu

306
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

®−îc sè nucleotide thay ®æi t−¬ng ®èi ë mçi loµi (1) vµ (2) kÓ tõ thêi ®iÓm A (tøc lµ tõ khi
chóng b¾t ®Çu ph©n li tõ tæ tiªn chung) lµ:
dA1 = (d12 + d13 – d23)/2 (ph−¬ng tr×nh 10.7)
dA2 = (d12 + d23 – d13)/2 (ph−¬ng tr×nh 10.8)
Theo thuyÕt ®ång hå ph©n tö, kho¶ng thêi gian tÝnh tõ thêi ®iÓm A cña hai loµi (1)
vµ (2) lµ nh− nhau, nªn dA1 = dA2. Khi d÷ liÖu vÒ tr×nh tù hÖ gen cña c¸c loµi còng nh− sè
l−îng loµi ®−îc gi¶i m· tr×nh tù hÖ gen ngµy cµng t¨ng vµ ®Çy ®ñ th× tiÒn ®Ò cña thuyÕt
®ång hå ph©n tö cho r»ng tèc ®é tiÕn hãa cña mçi gen nhÊt ®Þnh sÏ æn ®Þnh qua thêi gian
ë tÊt c¶ c¸c dßng tiÕn hãa. Thùc nghiÖm thùc tÕ cho thÊy tèc ®é thay thÕ nucleotide trong
c¸c gen ë chuét ®ång vµ chuét nh¾t nh×n chung lµ t−¬ng ®−¬ng nhau. Nh−ng ng−îc l¹i, ë
nhãm loµi linh tr−ëng, ng−êi vµ c¸c loµi v−în ng−êi cã møc ®é thay thÕ nucleotide chØ
b»ng mét nöa so víi c¸c loµi khØ kÓ tõ khi cã sù ph©n li tiÕn hãa tõ tæ tiªn chung. T−¬ng
tù nh− vËy, khi sö dông c¸ch tÝnh tèc ®é tiÕn hãa t−¬ng ®èi dùa trªn so s¸nh c¸c gen
t−¬ng ®ång gi÷a ng−êi vµ chuét ®ång, th× tèc ®é thay
thÕ nucleotide cña c¸c loµi linh tr−ëng d−êng nh− chØ 1 2 3
b»ng mét nöa so víi c¸c loµi gÆm nhÊm kÓ tõ khi cã sù
ph©n li tiÕn hãa cña c¸c ®éng vËt cã vó (c¸ch ®©y tõ 80
®Õn 100 triÖu n¨m). Nh− vËy, cã sù kh¸c nhau vÒ tèc
®é cña ®ång hå ph©n tö ë c¸c nhãm loµi kh¸c nhau. V×
A
lý do ®ã, ®é lÖch thùc tÕ tõ tèc ®é tiÕn hãa trung b×nh ë
mçi nhãm ph©n lo¹i (cña c¸c loµi ®ang tån t¹i) lµ mét
khã kh¨n ®Ó cã thÓ x¸c ®Þnh chÝnh x¸c thêi ®iÓm xuÊt
hiÖn vµ qu·ng thêi gian tån t¹i cña c¸c loµi tæ tiªn, tõ
®ã tiÕn hãa ph©n li thµnh c¸c loµi sinh vËt ngµy nay.
§Ó cã thÓ tÝnh to¸n ®−îc ®óng, cÇn x¸c ®Þnh c¸c loµi H×nh 10.11. X©y dùng c©y tiÕn hãa
®−îc ®em so s¸nh vµ ®èi chiÕu víi nhau cã dïng dïng loµi ®èi chøng ngoµi nhãm. Loµi
3 lµ loµi ®èi chøng ngoµi nhãm (tiÕn hãa
“chung” mét ®ång hå ph©n tö (nh− c¸c loµi chuét nªu ®éc lËp tr−íc khi cã sù ph©n li cña hai loµi 1
trªn) hay kh«ng? vµ 2). A lµ tæ tiªn chung cña hai loµi 1 vµ 2.

10.4.1.3. T¹i sao tèc ®é tiÕn hãa l¹i kh¸c nhau gi÷a c¸c nhãm loµi?
Cã mét sè nguyªn nh©n cã thÓ gióp gi¶i thÝch hiÖn t−îng nµy. Ch¼ng h¹n, yÕu tè
vßng ®êi vµ chu tr×nh sinh s¶n ng¾n cña c¸c loµi khØ vµ chuét so víi ng−êi cã thÓ lµ
nguyªn nh©n lµm tèc ®é tiÕn hãa t−¬ng ®èi cña chóng nhanh h¬n. Trong mçi thÕ hÖ, cã
thÓ sè lÇn sao chÐp ADN cña c¸c dßng tÕ bµo ph¸t sinh giao tö (vèn kh¸c biÖt lín gi÷a c¸c
nhãm loµi) míi thùc sù cã t−¬ng quan chÆt víi tÇn sè thay thÕ nucleotide cña c¸c gen,
chø kh«ng ph¶i lµ kho¶ng thêi gian tiÕn hãa ph©n li. Mét nguyªn nh©n kh¸c lµ: kÓ tõ khi
tiÕn hãa ph©n li, c¸c nhãm loµi (thËm chÝ c¸c loµi trong cïng nhãm) ngµy cµng cã nhiÒu
kh¸c biÖt trong c¸c c¬ chÕ di truyÒn vµ sinh s¶n, bao gåm hiÖu qu¶ cña c¸c c¬ chÕ söa
ch÷a ADN, tèc ®é vµ qui m« sinh s¶n, møc ph¬i nhiÔm víi c¸c t¸c nh©n ®ét biÕn vµ kh¶
n¨ng thÝch nghi víi c¸c æ sinh th¸i trong m«i tr−êng sèng cña chóng, v.v...
10.4.2. X©y dùng c©y tiÕn hãa dùa trªn c¸c dÊu hiÖu ph©n tö
10.4.2.1. C¸c dÊu hiÖu ®−îc dïng ®Ó x©y dùng c©y ph¸t sinh chñng lo¹i
Trªn c¬ së thuyÕt ®ång hå ph©n tö, mèi quan hÖ di truyÒn gi÷a tÊt c¶ c¸c d¹ng sèng
®Òu cã thÓ ®−îc x¸c ®Þnh dùa trªn viÖc so s¸nh c¸c dÊu hiÖu ph©n tö gi÷a chóng víi
nhau. Theo ®ã, c¸c loµi cµng cã nhiÒu dÊu hiÖu gièng nhau, cµng cã quan hÖ gÇn.

307
§inh §oµn Long

Tr−íc ®©y, khi ch−a cã c¸c c«ng cô sinh häc ph©n tö, mèi quan hÖ di truyÒn gi÷a
c¸c loµi ®−îc x¸c ®Þnh chñ yÕu dùa trªn viÖc so s¸nh c¸c dÊu hiÖu h×nh th¸i. NÒn t¶ng
cña viÖc sö dông c¸c dÊu hiÖu h×nh th¸i lµ quan ®iÓm cho r»ng: nÕu c¸c dÊu hiÖu h×nh
th¸i gièng nhau th× c¸c gen chi phèi c¸c ®Æc ®iÓm h×nh th¸i ®ã còng gièng nhau, vµ ng−îc
l¹i. Bªn c¹nh c¸c dÊu hiÖu h×nh th¸i, mét sè dÊu hiÖu kh¸c, bao gåm tËp tÝnh, cÊu tróc tÕ
bµo, hãa sinh … còng ®−îc kÕt hîp sö dông trong c¸c nghiªn cøu tiÕn hãa. ViÖc sö dông
c¸c dÊu hiÖu nµy cã hiÖu qu¶ khi nghiªn cøu tiÕn hãa ë nhiÒu nhãm ®éng vËt vµ thùc vËt
bËc cao; vµ hiÖn nay vÉn lµ mét ph−¬ng ph¸p nghiªn cøu tiÕn hãa c¬ b¶n.
Tuy vËy, viÖc sö dông ®¬n thuÇn c¸c dÊu hiÖu h×nh th¸i béc lé mét sè h¹n chÕ. Cô
thÓ, kiÓu h×nh gièng nhau cã thÓ thÊy ë nh÷ng loµi rÊt xa nhau do hiÖn t−îng tiÕn hãa
®ång qui. Ch¼ng h¹n nh−, c¸c loµi chim, d¬i vµ c«n trïng cã thÓ ®−îc xÕp vµo cïng mét
nhãm, bëi v× chóng ®Òu “cã c¸nh”. Nh−ng thùc tÕ ®©y lµ nh÷ng loµi cã quan hÖ rÊt xa
nhau. VÝ dô nµy kh«ng chØ cho thÊy viÖc sö dông dÊu hiÖu h×nh th¸i ®¬n thuÇn cã thÓ x¸c
®Þnh nhÇm mèi quan hÖ di truyÒn gi÷a mét sè loµi, mµ ®ång thêi cho thÊy, mét sè kiÓu
h×nh gièng nhau kh«ng nhÊt thiÕt ph¶i cã kiÓu gen gièng nhau. Ngoµi ra, ë mét sè ®èi
t−îng sinh vËt, ®Æc ®iÓm kiÓu h×nh cña chóng rÊt khã quan s¸t vµ so s¸nh. VÝ dô ®iÓn
h×nh vÒ ®iÒu nµy lµ c¸c vi sinh vËt (nh− vi khuÈn vµ virut) cã c¸c ®Æc ®iÓm h×nh th¸i khã
quan s¸t, hay viÖc so s¸nh gi÷a c¸c loµi ®éng vËt cã vó vµ vi khuÈn hÇu nh− kh«ng t×m
thÊy ®Æc ®iÓm h×nh th¸i nµo lµ gièng nhau. Trong nh÷ng tr−êng hîp nµy, c¸c dÊu hiÖu
ph©n tö (chñ yÕu lµ ADN) cã thÓ gióp kh¾c phôc c¸c khã kh¨n nªu trªn. Dï vËy, kh«ng
cã nghÜa lµ c¸c dÊu hiÖn ph©n tö cã thÓ thay thÕ hoµn toµn c¸c dÊu hiÖu h×nh th¸i, tËp
tÝnh hay hãa sinh trong c¸c nghiªn cøu tiÕn hãa.
ViÖc sö dông c¸c dÊu hiÖu ph©n tö cho thÊy, tèc ®é tiÕn hãa cã kh¸c nhau ë c¸c
dßng tiÕn hãa kh¸c nhau. Do vËy, viÖc x¸c ®Þnh thêi ®iÓm ph©n li tiÕn hãa cña nhiÒu
nhãm sinh vËt cÇn kÕt hîp sö dông c¸c dÊu hiÖu ph©n tö víi c¸c lo¹i dÊu hiÖu kh¸c.
Trong thùc tÕ, c¸c dÊu hiÖu ADN gióp x©y dùng c©y ph¸t sinh chñng lo¹i hiÖu qu¶ vµ
chÝnh x¸c nhÊt khi chóng ®−îc sö dông trong ph¹m vi c¸c nhãm loµi ®· ®−îc ph©n lo¹i s¬
bé b»ng c¸c dÊu hiÖu h×nh th¸i vµ hãa sinh. Trong mét sè tr−êng hîp, khi c¸c dÊu hiÖu
h×nh th¸i vµ ph©n tö kh«ng ®−a ra kÕt luËn thèng nhÊt, th× chÝnh lµ c¬ héi ®Ó x¸c ®Þnh
møc ®é t¸c ®éng cña chän läc tù nhiªn ®Õn c¸c kiÓu h×nh th¸i kh¸c nhau nh− thÕ nµo.
10.4.2.2. C¸c lo¹i c©y ph¸t sinh chñng lo¹i
Tr−íc khi cã c¸c c«ng cô sinh häc ph©n tö, ®· cã nhiÒu ph−¬ng ph¸p kh¸c ®−îc thiÕt
lËp nh»m x¸c ®Þnh mèi quan hÖ di truyÒn gi÷a c¸c loµi. Mét trong nh÷ng ph−¬ng ph¸p c¬
b¶n nhÊt lµ x©y dùng s¬ ®å h×nh c©y ®Ó m« t¶ mèi quan hÖ gi÷a c¸c loµi, gäi lµ c©y ph¸t
sinh chñng lo¹i hay c©y tiÕn hãa. C¸c b»ng chøng sinh häc ®Õn nay ®Òu cho r»ng: mäi
d¹ng sèng trªn Tr¸i ®Êt, kÓ c¶ ®ang tån t¹i hay ®· tuyÖt chñng, ®Òu cã mét tæ tiªn chung
duy nhÊt cã mÆt trªn Tr¸i ®Êt c¸ch ®©y kho¶ng 4 tØ n¨m. Mçi c©y ph¸t sinh chñng lo¹i
th−êng chØ lµ mét phÇn cña c©y tiÕn hãa xuÊt ph¸t tõ tæ tiªn chung ®ã. Nãi c¸ch kh¸c, nã
th−êng chØ gåm mét hay mét sè nh¸nh tiÕn hãa. Mçi cµnh tËn cïng cña mét c©y tiÕn hãa
th−êng gåm mét hoÆc mét sè taxon (®¬n vÞ ph©n lo¹i). §iÓm ph©n nh¸nh n»m ë gi÷a c©y
tiÕn hãa ®¹i diÖn cho tæ tiªn chung tr−íc khi cã sù ph©n li tiÕn hãa thµnh c¸c nhãm loµi
riªng biÖt. ChiÒu dµi cña mçi cµnh ph¶n ¸nh møc ®é kh¸c biÖt gi÷a c¸c taxon. C©y tiÕn
hãa nµo cã ®iÓm x¸c ®Þnh tæ tiªn chung cña c¸c nh¸nh cßn l¹i (phÇn ngän) trong c©y tiÕn
hãa th× ®−îc gäi lµ c©y tiÕn hãa cã gèc. Ng−îc l¹i, c©y tiÕn hãa kh«ng gèc chØ ph¶n
¸nh mèi quan hÖ vµ sù kh¸c biÖt gi÷a c¸c taxon (t−¬ng øng víi c¸c cµnh) mµ kh«ng ph¶n
¸nh sù tiÕn hãa tõ gèc nh− thÕ nµo. ViÖc x©y dùng c©y tiÕn hãa cã gèc hay kh«ng gèc ®Òu
cÇn ®Õn c¸c mÉu taxon ®èi chøng ngoµi nhãm. Ch¼ng h¹n, khi nghiªn cøu mèi quan hÖ di

308
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

truyÒn gi÷a ng−êi vµ khØ Gorilla, ng−êi ta cã thÓ dïng loµi khØ Papio lµm loµi ®èi chøng
ngoµi nhãm.
VÒ sè l−îng c©y ph¸t sinh chñng lo¹i. Sè l−îng c©y tiÕn hãa t¨ng lªn cïng sè
l−îng taxon ®−îc ®em so s¸nh (b¶ng 10.5). Cô thÓ, khi nghiªn cøu ®ång thêi n taxon, th×
sè c©y tiÕn hãa cã gèc (NR) vµ kh«ng gèc (NU) t−¬ng øng cã thÓ cã lµ:
NR = (2n – 3)!/[2n-2(n-2)!] (ph−¬ng tr×nh 10.9)
Nu = (2n – 5)!/[2n-3(n-3)!] (ph−¬ng tr×nh 10.10)
Trong ®ã, ph−¬ng tr×nh 10.9 ®−îc ¸p dông víi n ≥ 2, cßn ph−¬ng tr×nh 10.10
®−îc ¸p dông víi n ≥ 3. Tuy nhiªn, trong thùc tÕ, c©y tiÕn hãa th−êng ®−îc vÏ ®Ó ph¶n
¸nh mèi quan hÖ gi÷a mét sè l−îng lín c¸c mÉu kh¸c nhau, bao gåm tõ hµng chôc ®Õn
hµng tr¨m c¸ thÓ hoÆc taxon. ThÕ nªn sè c©y tiÕn hãa cã thÓ cã thùc tÕ lµ rÊt lín.

B¶ng 10.5. Sè l−îng c©y tiÕn hãa cã gèc vµ kh«ng


gèc cã thÓ cã t¨ng lªn cïng víi sè l−îng taxon
Sè c©y tiÕn hãa Sè c©y tiÕn hãa
Sè taxon
cã gèc kh«ng gèc
2 1 1
3 3 1
4 15 3
5 105 15 C¸c alen chung
10 34.459.425 2.027.025 H×nh 10.12. HiÖn t−îng giao thoa gi÷a c¸c loµi
20 21 20
8,20 x 10 2,22 x 10 cã thÓ x¶y ra nÕu loµi tæ tiªn mang locut ®a
30 4,95 x 10
38
8,69 x 10
36 h×nh gåm hai hay nhiÒu alen, vµ c¸c alen nµy
®Òu ®−îc duy tr× ë c¸c loµi míi sau khi t¸ch li.

VÒ c©y tiÕn hãa gen vµ c©y tiÕn hãa loµi. Mét c©y ph¸t sinh chñng lo¹i ®−îc x©y
dùng trªn c¬ së so s¸nh tr×nh tù mét nhãm gen t−¬ng ®ång gi÷a c¸c loµi hoÆc c¸ thÓ kh¸c
nhau ®−îc gäi lµ c©y tiÕn hãa gen. Lo¹i c©y tiÕn hãa nµy cã thÓ ph¶n ¸nh lÞch sö tiÕn
hãa cña mét gen, nh−ng kh«ng nhÊt thiÕt t−¬ng quan víi sù ph¸t sinh cña c¸c loµi t−¬ng
øng. Ng−îc l¹i, c¸c c©y tiÕn hãa loµi th−êng thu ®−îc tõ viÖc kÕt hîp ph©n tÝch nhiÒu
gen kh¸c nhau vµ ph¶n ¸nh sù ph¸t sinh cña c¸c loµi. Nghe qua, d−êng nh− c©y tiÕn hãa
gen vµ c©y tiÕn hãa loµi “kh«ng t−¬ng ®ång” víi nhau. Nh−ng ®iÒu nµy lµ hîp logic, bëi
sù “ph©n li” cña c¸c gen th−êng xuÊt hiÖn tr−íc sù “c¸ch li” cña c¸c quÇn thÓ dÉn ®Õn sù
“ph©n li tiÕn hãa” h×nh thµnh c¸c loµi míi. H×nh 10.12 minh häa sù ph©n li cña mét
locut. Khi ph©n tÝch locut nµy, mét sè c¸ thÓ cña loµi 1 vµ loµi 2 cßn gièng nhau h¬n khi
so s¸nh chóng víi mét sè c¸ thÓ kh¸c cïng loµi. Ch¼ng h¹n nh− locut MHC (xem ch−¬ng
9) vèn cã tÝnh ®a h×nh rÊt cao. NÕu sö dông c¸c alen cña locut nµy ®Ó vÏ c©y tiÕn hãa loµi,
th× mét sè c¸ thÓ cña ng−êi vµ khØ Gorilla cã thÓ ®−îc xÕp chung cïng mét nhãm do kiÓu
alen cña c¸c c¸ thÓ nµy rÊt gièng nhau.
Tõ c¸c ph−¬ng tr×nh 10.9 vµ 10.10, cã thÓ thÊy vÒ lý thuyÕt sè c©y tiÕn hãa cã thÓ
cã gi÷a c¸c taxon lµ rÊt lín, nh−ng thùc tÕ bao giê còng chØ cã mét c©y ph¶n ¸nh ®óng
mèi quan hÖ gi÷a c¸c taxon. §Ó x¸c ®Þnh ®−îc c©y tiÕn hãa nµy, c¸c d÷ liÖu ph©n tö
th−êng ®−îc ph©n tÝch b»ng c¸c thuËt to¸n x¸c suÊt. C©y tiÕn hãa thu ®−îc tõ viÖc ph©n
tÝch c¸c d÷ liÖu nh− vËy ®−îc gäi lµ c¸c c©y tiÕn hãa néi suy. Th−êng th× viÖc xö lý c¸c d÷
liÖu kh¸ phøc t¹p (do l−îng d÷ liÖu lín) vµ cÇn sù hç trî cña c¸c hÖ thèng m¸y tÝnh vµ

309
§inh §oµn Long

c¸c phÇn mÒm tin sinh häc. Cã 3 d¹ng thuËt to¸n phæ biÕn h¬n c¶ ®−îc dïng trong c¸c
phÇn mÒm m¸y tÝnh nh»m x©y dùng c¸c c©y tiÕn hãa, gåm ma trËn kho¶ng c¸ch
(distance matrix), tÝch ph©n tiÕn hãa (parsimony-based) vµ hîp lý tèi ®a (maximum
likelihood).

10.4.2.3. C¸c ph−¬ng ph¸p x©y dùng c©y ph¸t sinh chñng lo¹i
a) Ph−¬ng ph¸p "Ma trËn kho¶ng c¸ch"
“Ma trËn kho¶ng c¸ch” lµ nhãm c¸c thuËt to¸n ®¬n gi¶n nhÊt, ®−îc sö dông tõ l©u
trong c¸c nghiªn cøu tiÕn hãa. §−îc b¾t ®Çu sö dông tõ nh÷ng n¨m 1960, c¸c thuËt to¸n
nµy ®−îc dïng ®Ó x¸c ®Þnh mèi quan hÖ gi÷a c¸c loµi dùa trªn c¸c dÊu hiÖu h×nh th¸i.
Trong sè ®ã, thuËt to¸n UPGMA (unweighted pair group with arthmetic mean) ph©n tÝch
tÊt c¶ c¸c dÊu hiÖu, qua ®ã x¸c ®Þnh kho¶ng c¸ch di truyÒn gi÷a tÊt c¶ c¸c cÆp mÉu; råi
gép nhãm tõng cÆp mÉu cã kho¶ng c¸ch di truyÒn thÊp nhÊt. §Ó minh häa cho viÖc ¸p
dông thuËt to¸n UPGMA, gi¶ sö chóng ta ph©n tÝch 4 taxon kÝ hiÖu lµ A, B, C vµ D, biÕt
r»ng kho¶ng c¸ch gi÷a tõng cÆp taxon ®−îc x¸c ®Þnh nh− sau:
Taxon A B C
B dAB - -
C dAC dBC -
D dAD dBD dCD
Trong ma trËn nµy, dAB lµ kho¶ng c¸ch di truyÒn ®−îc x¸c ®Þnh b»ng so s¸nh trùc
tiÕp c¸c dÊu hiÖu gi÷a taxon A vµ B (cã thÓ tÝnh theo c«ng thøc Jukes-Carton), cßn dAC
ph¶n ¸nh kho¶ng c¸ch gi÷a taxon A vµ C, v.v… ThuËt to¸n UPGMA ®Çu tiªn sÏ gép
nhãm 2 taxon cã kho¶ng c¸ch nhá nhÊt thµnh mét nhãm (taxon phøc hîp) míi. Gi¶ sö
gi¸ trÞ dAB lµ nhá nhÊt, th× taxon phøc hîp ®Çu tiªn sÏ lµ (AB). Sau lÇn gép nhãm ®Çu
tiªn nµy, kho¶ng c¸ch gi÷a c¸c taxon sÏ ®−îc tÝnh l¹i gi÷a taxon phøc hîp (AB) víi c¸c
taxon cßn l¹i (C vµ D), theo c«ng thøc: d(AB)C = 1/2 (dAC + dBC) vµ d(AB)D = 1/2(dAD + dBD).
C¸c taxon cã kho¶ng c¸ch nhá nhÊt l¹i tiÕp tôc ®−îc gép nhãm thµnh mét taxon phøc hîp
thø hai. Ch¼ng h¹n ë ®©y d(AB)C < d(AB)D th× phøc hîp tiÕp theo sÏ lµ (ABC), tøc lµ C cã
kho¶ng c¸ch di truyÒn gÇn A vµ B h¬n D. Qu¸ tr×nh gép nhãm nh− vËy cø tiÕp tôc cho
®Õn khi tÊt c¶ c¸c taxon ®Òu ®−îc ph©n nhãm hÕt. Trong c©y tiÕn hãa ®−îc x©y dùng theo
ph−¬ng thøc UPGMA, nÕu chiÒu dµi mçi cµnh ph¶n ¸nh kho¶ng c¸ch gi÷a c¸c taxon, th×
®iÓm xuÊt ph¸t cña mçi cµnh lu«n ë trung ®iÓm kho¶ng c¸ch gi÷a chóng (vÝ dô: dAB/2 cho
cÆp taxon A vµ B). ¦u ®iÓm cña thuËt to¸n UPGMA lµ phÐp ph©n tÝch nhanh vµ ®¬n
gi¶n. Nh−ng nh−îc ®iÓm cña UPGMA lµ nã coi tèc ®é tiÕn hãa lµ gièng nhau ë mäi nh¸nh
tiÕn hãa (®iÒu nµy kh«ng ph¶i lóc nµo còng ®óng). §iÒu nµy cã nghÜa lµ, UPGMA sÏ phï
hîp nhÊt khi x©y dùng c©y tiÕn hãa ë c¸c nh¸nh cã tèc ®é tiÕn hãa t−¬ng ®èi æn ®Þnh.
Trong c¸c thuËt to¸n “ma trËn kho¶ng c¸ch”, ngoµi UPGMA, cßn cã mét sè thuËt to¸n
kh¸c, nh− “kho¶ng c¸ch khai triÓn” (transformed distance) hay “kÕt nèi l©n cËn”
(neighbor-joining, NJ). Nh÷ng thuËt to¸n nµy cho phÐp kÕt hîp tèc ®é tiÕn hãa kh¸c
nhau ë c¸c nh¸nh tiÕn hãa vµo cïng c©y tiÕn hãa.
Nh×n chung, c¸c thuËt to¸n dùa trªn “ma trËn kho¶ng c¸ch” cho kÕt qu¶ ph©n tÝch
nhanh, phï hîp ®Ó xö lý mét l−îng d÷ liÖu lín; cho biÕt kho¶ng c¸ch di truyÒn t−¬ng ®èi
gi÷a c¸c loµi, nh−ng kh«ng ph¶n ¸nh ®−îc sù tiÕn hãa ë mçi gen. §«i khi, do sù “gi¶n

310
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

l−îc hãa” qu¸ møc c¸c d÷ liÖu nªn kÕt qu¶ ph©n tÝch kh«ng thèng nhÊt khi dïng c¸c
thuËt to¸n kh¸c nhau (ch¼ng h¹n, khi dïng UPGMA vµ NJ). Th−êng th× NJ ®−îc coi lµ
cho kÕt qu¶ chi tiÕt h¬n UPGMA.
b) Ph−¬ng ph¸p "TÝch ph©n tiÕn hãa" (tiÕt kiÖm tèi ®a)
NÕu nh− c¸c thuËt to¸n “ma trËn kho¶ng c¸ch” ®¬n thuÇn lµ c¸c thuËt to¸n x¸c
suÊt th× “tÝch ph©n tiÕn hãa” dùa trªn nguyªn t¾c sinh häc lµ “®ét biÕn hiÕm khi x¶y ra”.
ThuËt to¸n nµy cho r»ng: c©y tiÕn hãa phï hîp nhÊt lµ c©y cã sè ®ét biÕn thÊp nhÊt trong
tÊt c¶ nh÷ng c©y tiÕn hãa cã thÓ cã gi÷a c¸c taxon ®−îc ph©n tÝch. Do vËy, c©y tiÕn hãa
thu ®−îc tõ “tÝch ph©n tiÕn hãa” ®−îc gäi lµ c©y tÝch ph©n tiÕn hãa tèi −u.
§Ó minh häa ph−¬ng ph¸p “tÝch ph©n tiÕn hãa”, h·y xem vÝ dô vÒ 4 tr×nh tù sau ®©y:
VÞ trÝ
1 2 3 4 5(*) 6(*)
Tr×nh tù G C G A T G
G T G T T G
G T T G C A
G T C C C A

Khi so s¸nh gi÷a c¸c tr×nh tù nµy, chØ hai vÞ trÝ 5 vµ 6 (®¸nh dÊu *) ®−îc xem lµ “cã
t¸c dông th«ng tin”. H×nh 10.13 (trang sau) cho thÊy: cã thÓ cã 3 lo¹i c©y tiÕn hãa kh«ng
gèc ph¶n ¸nh mèi quan hÖ gi÷a 4 taxon. C¸c c©y tiÕn hãa kh«ng gèc gép nhãm tr×nh tù 1
víi 2, t¸ch biÖt víi nhãm tr×nh tù 3 víi 4, vµ chØ ®ßi hái mét ®ét biÕn duy nhÊt ®Ó nèi gi÷a
hai nhãm. Khi ph©n tÝch tõng vÞ trÝ, chóng ta sÏ thÊy: vÞ trÝ sè 1 “kh«ng cã t¸c dông
th«ng tin” bëi v× ®ét biÕn kh«ng x¶y ra ë vÞ trÝ nµy, nªn kh«ng ph©n biÖt ®−îc c¸c taxon.
VÞ trÝ sè 2 còng vËy, bëi c¶ ba c©y tiÕn hãa ®Òu chØ cÇn 1 ®ét biÕn. Cßn c¸c c©y tiÕn hãa
dùa trªn vÞ trÝ sè 3 ®Òu cÇn 2 ®ét biÕn ; trong khi c¸c c©y tiÕn hãa dùa trªn vÞ trÝ sè 4 ®Òu
cÇn 3 ®ét biÕn. V× kh«ng x¸c ®Þnh ®−îc c©y tiÕn hãa nµo cã kh¶ n¨ng x¶y ra h¬n, nªn c¸c
vÞ trÝ 1, 2, 3 vµ 4 ®−îc xem lµ “kh«ng cã t¸c dông th«ng tin”.
ThuËt to¸n “tÝch ph©n tiÕn hãa” ®Çu tiªn x¸c ®Þnh tÊt c¶ c¸c vÞ trÝ cã t¸c dông th«ng
tin b»ng c¸ch so s¸nh tÊt c¶ c¸c tr×nh tù t¹i mçi vÞ trÝ, råi x¸c ®Þnh c©y tiÕn hãa nµo cÇn
Ýt ®ét biÕn nhÊt t¹i mçi vÞ trÝ. C©y tiÕn hãa nµo cÇn Ýt ®ét biÕn nhÊt khi xÐt ë tÊt c¶ c¸c vÞ
trÝ ®−îc gäi lµ c©y tiÕn hãa "pháng ®o¸n". Ngoµi viÖc x©y dùng ®−îc c©y tiÕn hãa, thuËt
to¸n “tÝch ph©n cùc ®¹i” cßn cung cÊp mét th«ng tin h÷u Ých kh¸c. §ã lµ, nã cã thÓ pháng
®o¸n tr×nh tù tæ tiªn ë mçi nh¸nh cña c©y tiÕn hãa, bao gåm c¶ c¸c tr×nh tù ë c¸c loµi ®·
tuyÖt chñng. §©y lµ mét −u ®iÓm cña phÐp “tÝch ph©n tiÕn hãa”. Trong vÝ dô nªu trªn,
phÐp “tÝch ph©n tiÕn hãa” ®· gi¶ thiÕt mçi nucleotide ®Òu cã kh¶ n¨ng ®ét biÕn thay thÕ
thµnh mét trong ba lo¹i nucleotide kh¸c víi "tÇn suÊt" nh− nhau. Trong thùc tÕ, mét sè
phÐp “tÝch ph©n tiÕn hãa” phøc t¹p h¬n ®· ®−îc söa ®æi ®Ó ph¶n ¸nh sù kh¸c nhau gi÷a
tÇn sè ®ét biÕn ®ång ho¸n vµ dÞ ho¸n. Tuy vËy, phÐp “tÝch ph©n tiÕn hãa” ®«i khi ch−a
ph¶n ¸nh thËt chÝnh x¸c vÒ thêi gian x¶y ra sù t¸ch li tiÕn hãa gi÷a c¸c loµi v× tèc ®é thay
thÕ nucleotide gi÷a c¸c nh¸nh tiÕn hãa cã thÓ kh¸c nhau.
c) Ph−¬ng ph¸p "Hîp lý tèi ®a"
Ph−¬ng ph¸p “hîp lý tèi ®a” lµ mét ph−¬ng ph¸p x¸c suÊt thuÇn tóy, th−êng ®−îc
sö dông ®Ó kiÓm chøng l¹i c¸c c©y tiÕn hãa ®−îc x©y dùng bëi c¸c ph−¬ng ph¸p kh¸c.

311
§inh §oµn Long

Ph−¬ng ph¸p nµy ®¸nh


C©y 1 C©y 2 C©y 3
gi¸ mét gi¶ thiÕt tiÕn
hãa b»ng viÖc x©y dùng G G G G G G
g g g g g g
tÊt c¶ c¸c c©y tiÕn hãa VÞ trÝ 1
cã thÓ cã trªn c¬ së gi¶ G G G G G G
thiÕt ®ã, råi x¸c ®Þnh C T T C T T
c©y tiÕn hãa néi suy lµ t t t t t t
VÞ trÝ 2
c©y cã x¸c suÊt x¶y ra T T T T C T
cao nhÊt qua viÖc ph©n
G T T G G C
tÝch c¸c yÕu tè tiÕn hãa. g g g g g g
VÞ trÝ 3
Ch¼ng h¹n, vÒ ®¹i thÓ
G C G C T G
tÇn sè c¸c ®ét biÕn ®ång
ho¸n cao h¬n kho¶ng 3 A T T A A G
g g g g g g
lÇn so víi c¸c ®ét biÕn dÞ VÞ trÝ 4
ho¸n. Trong mét nhãm G C G C T C
cã 3 tr×nh tù kh¸c nhau T T C T T C
ë mét vÞ trÝ nucleotide t t t t t c
VÞ trÝ 5
mang c¸c baz¬ t−¬ng C C T C T C
øng lµ C, T vµ A. Tr×nh
G G A A G A
tù mang c¸c baz¬ C vµ T g g g g g a
VÞ trÝ 6
®−îc xem lµ cã quan hÖ
A A G G G A
di truyÒn gÇn nhau h¬n
so víi tr×nh tù mang
baz¬ A. Ph−¬ng ph¸p H×nh 10.13. Gi÷a 4 taxon, t¹i mçi vÞ trÝ (nucleotide), cã thÓ cã 3 c©y tiÕn
“hîp lý tèi ®a” th−êng hãa kh«ng gèc kh¸c nhau. C¸c nucleotide viÕt b»ng ch÷ in hoa lµ c¸c
nucleotide ®−îc t×m thÊy ë mçi taxon t−¬ng øng víi tõng vÞ trÝ. C¸c nucleotide
®−îc xem lµ ph−¬ng viÕt b»ng ch÷ th−êng biÓu diÔn lo¹i nucleotide cã ë tæ tiªn "pháng ®o¸n".
ph¸p cung cÊp th«ng tin §−êng liÒn nÐt cã vßng trßn biÓu diÔn lo¹i ®ét biÕn thay thÕ nucleotide cÇn x¶y
chÝnh x¸c vµ chi tiÕt h¬n ra ®Ó thu ®−îc sù ®a h×nh tr×nh tù ADN thùc tÕ. C¶ 3 c©y tiÕn hãa cã thÓ cã ë
vÞ trÝ 1 ®Òu kh«ng cÇn ®ét biÕn nµo; trong khi ë vÞ trÝ 2 ®Òu cÇn mét ®ét biÕn, ë
c¶ so víi c¸c ph−¬ng vÞ trÝ 3 ®Òu cÇn 2 ®ét biÕn vµ vÞ trÝ 4 ®Òu cÇn 3 ®ét biÕn. V× vËy, tõ sù thay thÕ
ph¸p kh¸c. Nh−ng thùc nucleotide ë c¸c vÞ trÝ 1, 2, 3 vµ 4 kh«ng x¸c ®Þnh ®−îc c©y tiÕn hãa nµo "dÔ"
tÕ, tèc ®é xö lý th«ng tin x¶y ra h¬n. Trong ph−¬ng ph¸p tÝch ph©n tiÕn hãa, c¸c vÞ trÝ nµy ®−îc coi lµ
"kh«ng cã t¸c dông th«ng tin". Ng−îc l¹i, c¸c vÞ trÝ 5 vµ 6 cho thÊy mét c©y tiÕn
theo ph−¬ng ph¸p nµy hãa cÇn Ýt ®ét biÕn h¬n so víi nh÷ng c©y kh¸c; nªn nh÷ng vÞ trÝ nµy ®−îc xem
rÊt chËm vµ kh«ng “kh¶ lµ "cã t¸c dông th«ng tin". C©y tiÕn hãa "pháng ®o¸n" lµ c©y cÇn sè ®ét biÕn Ýt
thi” khi ph©n tÝch mét nhÊt trong tÊt c¶ c¸c c©y tiÕn hãa cã thÓ cã khi xÐt ë tÊt c¶ c¸c vÞ trÝ.
sè l−îng d÷ liÖu lín, kÓ
c¶ khi sö dông c¸c hÖ thèng m¸y tÝnh m¹nh nhÊt hiÖn nay (vÝ dô: tõ b¶ng 10.5 ta thÊy,
nÕu sè taxon ≥ 30, th× sè c©y tiÕn hãa cã thÓ cã ≥ 5x1038). Tuy vËy, víi tèc ®é ph¸t triÓn
nhanh chãng cña lÜnh vùc tin sinh häc vµ c¸c “c¶i tiÕn” trong øng dông c¸c thuËt to¸n,
ph−¬ng ph¸p “hîp lý tèi ®a” cã tiÒm n¨ng øng dông ngµy cµng réng r·i. Tuy vËy, hiÖn
nay nh×n chung ch−a cã m« h×nh nµo −u thÕ h¬n h¼n c¸c m« h×nh kh¸c. Nh− mét qui −íc
chung, nÕu mét tËp hîp sè liÖu nhÊt ®Þnh khi ®−îc ph©n tÝch bëi hay ba thuËt to¸n (m«
h×nh) kh¸c nhau cïng ®−a ®Õn mét kiÓu h×nh c©y tiÕn hãa, th× c©y tiÕn hãa ®ã cã thÓ tin
cËy ®−îc. Trong nh÷ng tr−êng hîp kh¸c, c¸c m« h×nh cã thÓ dÉn ®Õn c¸c kÕt luËn kh¸c
nhau. V× vËy, víi tõng ®èi t−îng cô thÓ, cÇn c©n nh¾c lùa chän m« h×nh phï hîp vµ cÇn
m« t¶ m« h×nh ®−îc sö dông trong c¸c b¸o c¸o khoa häc.

312
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

10.5. TiÕn hãa hÖ gen vµ nguån gèc loµi ng−êi

10.5.1. HÖ gen ng−êi chøa mét sè gen Ýt ®Õn ng¹c nhiªn


Nh÷ng n¨m cuèi cña thÓ kû XX ®¸nh dÊu mét b−íc ngoÆt quan träng trong c¸c
nghiªn cøu tiÕn hãa häc vµ ph©n tÝch chøc n¨ng hÖ gen ë ng−êi hiÖn ®¹i (Homo sapiens,
gäi t¾t lµ ng−êi). §ã lµ viÖc hÖ gen ng−êi ®−îc gi¶i tr×nh tù hoµn chØnh nhê thµnh qu¶ cña
Dù ¸n hÖ gen ng−êi (HGP) ®−îc triÓn khai tõ n¨m 1990 tíi n¨m 2006. C¸c môc tiªu cña
dù ¸n HGP bao gåm: 1) x¸c ®Þnh tr×nh tù cña toµn bé hÖ gen ng−êi (kho¶ng trªn 3 triÖu
cÆp nucleotide), 2) x¸c ®Þnh tÊt c¶ c¸c gen cã trong hÖ gen ng−êi, 3) l−u gi÷ th«ng tin hÖ
gen ng−êi trong c¸c hÖ thèng c¬ së d÷ liÖu, 4) c¶i tiÕn c¸c c«ng cô qu¶n lý vµ ph©n tÝch d÷
liÖu liªn quan ®Õn hÖ gen ng−êi, 5) chuyÓn giao c«ng nghÖ vµ tuyªn truyÒn c¸c nguyªn
t¾c ®¹o ®øc sinh häc trong viÖc khai th¸c th«ng tin tõ hÖ gen ng−êi. MÆc dï ngµy 26
th¸ng 6 n¨m 2000, Tæng thèng Mü Bill Clinton vµ Thñ t−íng Anh Tony Blair ®· tuyªn bè
b¶n th¶o ®Çu tiªn hÖ gen ng−êi ®· hoµn thµnh, nh−ng thùc tÕ ®Õn cuèi n¨m 2003, dù ¸n
hÖ gen ng−êi míi kÕt thóc; vµ ®Õn th¸ng 6/2006, viÖc gi¶i m· vµ lËp b¶n ®å NST lín nhÊt
cña hÖ gen ng−êi (NST sè 1) míi thùc sù hoµn thµnh.
§Õn nay, mÆc dï hÖ gen ng−êi ®· ®−îc gi¶i tr×nh tù hoµn chØnh, th× sè gen trong hÖ
gen ng−êi vÉn chØ lµ −íc tÝnh (kho¶ng 20.000 – 25.000 gen). Con sè nµy ban ®Çu ®· thùc
sù g©y “sèc” nhiÒu nhµ di truyÒn häc. Bëi, tr−íc khi triÓn khai dù ¸n, trªn c¬ së cÊu tróc
phøc t¹p cña c¬ thÓ ng−êi, sù ®a d¹ng cao cña h×nh th¸i vµ tËp tÝnh, phÇn lín c¸c nhµ di
truyÒn ®Òu dù ®o¸n hÖ gen ng−êi chøa trªn d−íi 100.000 gen. NhiÒu phÇn mÒm m¸y tÝnh
®· ®−îc dïng ®Ó dù ®o¸n sè gen trong hÖ gen ng−êi, chñ yÕu dùa vµo c¸c dÊu hiÖu cña
gen, nh− khung ®äc më (ORF), c¸c tÝn hiÖu nhËn biÕt intron, promoter ... Sau ®ã, c¸c gen
dù ®o¸n th−êng ®−îc kiÓm chøng bëi c¸c nghiªn cøu ®éc lËp, nh− qua viÖc t¸ch dßng c¸c
ph©n tö cADN xuÊt ph¸t tõ b¶n phiªn m· (mARN) t−¬ng øng cña gen. Nh−ng, nh×n
chung ch−a cã phÇn mÒm m¸y tÝnh nµo ®Õn nay cã thÓ x¸c ®Þnh ®−îc ®Çy ®ñ tÊt c¸c gen
tõ toµn bé tr×nh tù hÖ gen ®· biÕt. Bëi v×, c¸c ORF ng¾n, ngÉu nhiªn cã thÓ ®−îc x¸c ®Þnh
nhÇm lµ gen. Ng−îc l¹i, c¸c gen “thËt” vèn gåm nhiÒu exon ng¾n kh«ng cã cÊu tróc ORF
râ rµng cã thÓ bÞ bá sãt. Ngoµi ra, còng cßn nh÷ng “lçi” kh¸c n÷a mµ chóng ta ch−a biÕt
®Çy ®ñ trong c¸c d¹ng cÊu tróc exon-intron cña c¸c gen, hoÆc do “tÝnh tho¸i hãa” cña c¸c
tr×nh tù tÝn hiÖu ®iÒu khiÓn sù c¾t – nèi cña c¸c intron vµ exon trong qu¸ tr×nh hoµn
thiÖn mARN.
Trªn c¬ së c¸c th«ng tin mµ chóng ta ®· nªu, mét ®iÓm ®¸ng l−u ý lµ c¸c loµi ®éng
vËt cã vó (gåm c¶ loµi ng−êi) cã c¸c c¬ chÕ ®iÒu khiÓn gen phøc t¹p ®Ó cã thÓ ®ång thêi cã
nhiÒu kiÓu biÓu hiÖn gen kh¸c nhau. Nãi c¸ch kh¸c lµ d−êng nh−, tÝnh phøc t¹p cña c¬
thÓ kh«ng nhÊt thiÕt t−¬ng quan víi sè gen cã trong hÖ gen, mµ thay vµo ®ã, nã phô
thuéc vµo sè kiÓu biÓu hiÖn cña gen. H·y chó ý lËp luËn sau ®©y: giun trßn (C. elegans) cã
kho¶ng 20.000 gen, trong khi ruåi giÊm (D. melanogaster) cã sè gen Ýt h¬n ®¸ng kÓ (d−íi
14.000 gen). Nh−ng, trong thùc tÕ, sù ®a d¹ng vÒ h×nh th¸i vµ tËp tÝnh cña ruåi giÊm l¹i
cao h¬n nhiÒu so víi giun trßn. Sù phøc t¹p trong biÓu hiÖn kiÓu h×nh nh− vËy cã thÓ lµ
do sù t¨ng lªn vÒ sè kiÓu biÓu hiÖn cña gen. VÝ dô, mét gen ë ruåi giÊm trung b×nh cã thÓ
®−îc ®iÒu khiÓn bëi tõ 3 ®Õn 4 tr×nh tù enhancer kh¸c nhau (t¹i c¸c vÞ trÝ kh¸c nhau cña
c¬ thÓ), t¹o nªn kho¶ng 50.000 kiÓu biÓu hiÖn cña gen kh¸c nhau. Ng−îc l¹i, mçi gen ë
giun trßn trung b×nh chØ ®−îc ®iÒu khiÓn bëi 1 ®Õn 2 tr×nh tù enhancer. V× vËy, giun trßn
chØ cã kho¶ng 30.000 kiÓu biÓu hiÖn gen kh¸c nhau, Ýt h¬n nhiÒu so víi ruåi giÊm (mÆc
dï chóng cã nhiÒu gen h¬n).

313
§inh §oµn Long

10.5.2. HÖ gen ng−êi gièng hÖ gen chuét vµ kh«ng kh¸c mÊy hÖ gen tinh tinh
Ng−êi vµ chuét chøa mét sè l−îng gen t−¬ng ®èi gièng nhau (−íc l−îng ®Òu vµo
kho¶ng 20.000 – 25.000 gen). Kho¶ng 80% sè gen trong hÖ gen cña hai loµi t−¬ng ®ång
víi nhau. C¸c protein ®−îc m· hãa bëi c¸c gen t−¬ng ®ång nµy cã tÝnh b¶o thñ cao vµ cã
®Õn 80% tr×nh tù axit amin lµ gièng nhau hoµn toµn. PhÇn lín sù kh¸c nhau trong sè
20% c¸c gen cßn l¹i gi÷a ng−êi vµ chuét lµ do c¸c sù kiÖn lÆp ®o¹n ë nh÷ng tr×nh tù nhÊt
®Þnh. VÝ dô, chuét cã nhiÒu b¶n sao gen cytochrome P450 h¬n so víi ng−êi. TÊt nhiªn,
ng−îc l¹i, cã nhiÒu vÝ dô cho thÊy c¸c hä gen ë ng−êi cã møc ®é “më réng” cao h¬n ë
chuét. Nh−ng, nh×n chung ®iÓm næi bËt nhÊt khi so s¸nh hÖ gen ng−êi vµ chuét lµ chØ cã
rÊt Ýt gen “míi” (nÕu cã) trong hÖ gen ng−êi.
Sù gièng nhau gi÷a hÖ gen ng−êi víi hÖ gen c¸c loµi linh tr−ëng, ®iÓn h×nh lµ tinh
tinh, thËm chÝ cßn cao h¬n nhiÒu. ChØ cã kho¶ng 2% tr×nh tù hÖ gen gi÷a ng−êi vµ tinh
tinh lµ kh¸c nhau. NghÜa lµ trong mét ®o¹n tr×nh tù 100bp ngÉu nhiªn, trung b×nh chØ cã
2 nucleotide thay ®æi. §iÒu nµy cho thÊy tÝnh b¶o thñ cao trong hÖ gen c¸c ®éng vËt cã
x−¬ng sèng. Trong khi ®ã, viÖc so s¸nh ngÉu nhiªn hai c¸ thÓ mùc èng trong cïng mét
quÇn thÓ cho thÊy hÖ gen cña chóng kh¸c nhau kho¶ng 1%, cßn gi÷a hai quÇn thÓ kh¸c
nhau vµo kho¶ng 2,5%. ë ng−êi vµ tinh tinh, tÝnh b¶o thñ trong liªn kÕt gen còng rÊt
cao. TrËt tù vµ kho¶ng c¸ch gi÷a c¸c gen liªn kÕt lµ rÊt gièng nhau. Thùc tÕ, c¸c tr×nh tù
ADN ®iÒu hßa cã tèc ®é biÕn ®æi (tiÕn hãa) nhanh h¬n so víi c¸c tr×nh tù protein. Cã lÏ,
sù tiÕn hãa ph©n li gi÷a ng−êi vµ tinh tinh chØ lµ nh÷ng thay ®æi nhá trong hÖ gen nh−ng
®ñ lµm thay ®æi ho¹t tÝnh cña c¸c tr×nh tù ADN ®iÒu hßa chñ chèt.

10.5.3. Ng−êi vµ mèi quan hÖ di truyÒn víi c¸c loµi linh tr−ëng cì lín
Ng−êi ph©n biÖt víi c¸c loµi linh tr−ëng cì lín kh¸c, nh− tinh tinh hay khØ Gorilla,
ë mét sè ®Æc ®iÓm ngo¹i h×nh. Trong ®ã c¸c loµi v−în ng−êi cã r¨ng cöa vµ r¨ng nanh lín
h¬n nhiÒu so víi ng−êi; x−¬ng hµm cña chóng còng lín h¬n vµ nÆng h¬n. N·o cña v−în
ng−êi nhá h¬n n·o ng−êi. §iÓm g¾n gi÷a n·o vµ tñy sèng ë v−în ng−êi bÞ “®Èy” vÒ phÝa
sau hép sä, xa h¬n so víi ë ng−êi. H×nh d¸ng vµ tØ lÖ gi÷a c¸c phÇn c¬ thÓ cña ng−êi kh¸c
biÖt víi v−în ng−êi; trong ®ã, nÕu ë v−în ng−êi phÇn th©n cã xu h−íng më réng vÒ phÝa
d−íi th× ë ng−êi trung b×nh kÝch th−íc phÇn th©n cña c¬ thÓ cã xu h−íng æn ®Þnh tõ vai
cho ®Õn th¾t l−ng. TØ sè chiÒu dµi ch©n/th©n cña v−în ng−êi nhá h¬n so víi ng−êi khi ®¹t
tuæi tr−ëng thµnh; x−¬ng chËu cña chóng kh«ng cã cÊu tróc phï hîp cho t− thÕ ®øng
th¼ng. MÆc dï c¸c loµi v−în ng−êi còng cã thÓ ®i b»ng hai ch©n, nh−ng bµn ch©n cña
chóng kh«ng ®ñ v÷ng ®Ó duy tr× viÖc ®i th¼ng l−ng mét c¸ch liªn tôc vµ l©u dµi. Ng−îc
l¹i, ng−êi hoµn toµn ®i b»ng hai ch©n (tÊt nhiªn, trõ trÎ s¬ sinh). Bµn tay vµ bµn ch©n
ng−êi vµ v−în ng−êi kh¸c nhau; trong ®ã, ngãn tay c¸i cña v−în ng−êi kh«ng «m ®−îc
vµo lßng bµn tay vµ n¾m lÊy c¸c ngãn tay kh¸c nh− ë ng−êi.
Nh− ®· nªu ë trªn, dï cã nhiÒu ®Æc ®iÓm h×nh th¸i kh¸c nhau nh− vËy, nh−ng hÖ
gen ng−êi kh«ng kh¸c mÊy hÖ gen v−în ng−êi, ®Æc biÖt lµ tinh tinh. Sù gièng nhau ®Õn
98 - 99% gi÷a hÖ gen ng−êi vµ tinh tinh cho thÊy sù ph©n li tiÕn hãa cña hai loµi tõ tæ
tiªn chung chØ x¶y ra gÇn ®©y (−íc tÝnh tõ 5 ®Õn 9 triÖu n¨m tr−íc). So víi tinh tinh, c¸c
loµi v−în ng−êi kh¸c (nh− khØ Gorilla) cã mèi quan hÖ di truyÒn víi ng−êi xa h¬n.

10.5.4. Nguån gèc loµi ng−êi theo b»ng chøng hãa th¹ch
MÆc dï hiÕm c¸c b»ng chøng hãa th¹ch ®· cung cÊp nh÷ng th«ng tin quan träng vÒ
nguån gèc vµ sù tiÕn hãa cña loµi ng−êi (h×nh 10.14, trang sau). B»ng chøng hãa th¹ch
l©u ®êi nhÊt liªn quan ®Õn dßng tiÕn hãa cña loµi ng−êi t×m thÊy ë Ch©u Phi cã tuæi niªn
®¹i kho¶ng 4 - 5 triÖu n¨m. Sinh vËt cã d¹ng gièng ng−êi (hominid) ®Çu tiªn nµy ®−îc gäi

314
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

lµ ng−êi v−în A®ipitÕc Homo


(Ardipithecus ramidus). Hãa 0 sapiens
Homo
th¹ch cã tuæi niªn ®¹i l©u ®êi tiÕp erectus
theo h×nh thµnh c¸ch ®©y kho¶ng 1 Homo
3 - 4 triÖu n¨m thuéc mét d¹ng ergaster Homo Homo

TriÖu n¨m tr−íc


habilis rudolfensis
hominid kh¸c, ®−îc ®Æt tªn lµ 2 Dßng
ng−êi v−în ¤xtral«pitÕc tiÕn hãa
? Australopithecus
(Australopithecus afarensis). Ng−êi ? afarensis
ng−êi
3 Tinh tinh
v−în ¤xtral«pitÕc cã chiÒu cao
Ardipithecus
kho¶ng 1 – 1,5m, ®i b»ng hai ch©n ramidus
4
(Ýt nhÊt mét ®o¹n ng¾n).
?
Dßng
C¸c loµi ®Çu tiªn ®−îc xÕp 5 tiÕn hãa
cïng chi Homo víi ng−êi hiÖn ®¹i v−în ng−êi
(H. sapiens) cã hãa th¹ch h×nh
thµnh c¸ch ®©y kho¶ng 2 – 2,5
Tæ tiªn chung
triÖu n¨m, ®−îc ®Æt tªn lµ H. cña ng−êi, ng−êi
rudolfensis (gäi lµ ng−êi rudolfen) v−în vµ tinh tinh
vµ H. habilis (gäi lµ ng−êi H×nh 10.14. C©y ph¸t sinh loµi ng−êi trªn c¬ së b»ng chøng
habilis). C¶ hai loµi ng−êi v−în hãa th¹ch. Tæ tiªn chung cña ng−êi, c¸c d¹ng ng−êi v−în vµ tinh tinh
“xuÊt hiÖn sím” nµy cã nhiÒu ®Æc ®· tiÕn hãa theo hai dßng ®éc lËp h×nh thµnh nªn ng−êi hiÖn ®¹i -
sapiens ( dßng tiÕn hãa ng−êi) vµ tinh tinh (dßng tiÕn hãa v−în
®iÓm h×nh th¸i gièng v−în ng−êi. Homo
ng−êi). DÊu hái ph¶n ¸nh "b−íc" tiÕn hãa ch−a ®−îc kh¼ng ®Þnh.
Tuy vËy, so víi ng−êi v−în
¤xtral«pitÕc, hai d¹ng ng−êi v−în nµy cã ®iÓm tiÕp xóc gi÷a n·o bé vµ tñy sèng ë gÇn
gi÷a hép sä h¬n; ngoµi ra, hép sä gi¶m chiÒu dµi vµ t¨ng chiÒu réng (gièng ng−êi h¬n).
MÆc dï vËy, còng cã nhiÒu nhµ cæ sinh vËt häc kh«ng nhÊt trÝ xÕp hai loµi nµy vµo chi
Homo, mµ thay vµo ®ã lµ chi Australopithecus. Loµi cã b»ng chøng hãa th¹ch ®−îc kh¼ng
®Þnh ch¾c ch¾n thuéc chi Homo lµ Homo ergaster, gäi lµ ng−êi Egaxt¬, cã mÉu hãa th¹ch
h×nh thµnh c¸ch ®©y 1,5 – 1,9 triÖu n¨m. Ng−êi Egaxt¬ cã nhiÒu ®Æc ®iÓm h×nh th¸i
gièng víi ng−êi h¬n, bao gåm h×nh d¸ng c¬ thÓ, tØ lÖ kÝch th−íc ch©n-th©n, ®Æc ®iÓm cÊu
tróc hµm vµ kÝch th−íc r¨ng.
TÊt c¶ c¸c mÉu hãa th¹ch trªn ®©y ®Òu ®−îc t×m thÊy ë Ch©u Phi. MÉu hãa th¹ch
hominid ®Çu tiªn ®−îc t×m thÊy ë ngoµi Ch©u Phi thuéc vÒ ng−êi Homo erectus, gäi lµ
ng−êi £rec hay ng−êi ®øng th¼ng. Hãa th¹ch ng−êi £rec, cã tuæi kho¶ng 1 triÖu n¨m,
®−îc t×m thÊy ë nhiÒu vïng thuéc khu vùc §«ng-Nam Ch©u ¸, trong ®ã cã Ên §é,
In®«nªsia, Trung Quèc, ViÖt Nam... §iÒu nµy cho thÊy H. erectus ®· cã ph¹m vi ph©n bè
réng vµ cã thÓ lµ nguån gèc h×nh thµnh nªn c¸c quÇn thÓ ng−êi “cæ x−a” ë Ch©u ¢u, Ch©u
¸ vµ Ch©u Phi. Ng−êi cæ x−a ®−îc biÕt ®Õn nhiÒu nhÊt lµ ng−êi Nªan®ectan (H.
neanderthalensis) ph¸t triÓn kh¸ h−ng thÞnh ë Ch©u ¢u vµ vïng CËn §«ng c¸ch ®©y vµi
tr¨m ngh×n n¨m. Dùa vµo ®Æc ®iÓm h×nh th¸i vµ tæ chøc x· héi gÇn gièng víi ng−êi, tr−íc
®©y ng−êi ta tõng cho r»ng ng−êi Nªan®ectan cã kh¶ n¨ng lµ tæ tiªn cña ng−êi hiÖn ®¹i.
Nh−ng, nh÷ng b»ng chøng ph©n tö (so s¸nh ADN hÖ gen ti thÓ gi÷a hai loµi) gÇn ®©y cho
thÊy ng−êi Nªan®ectan kh«ng hÒ ®ãng gãp vËt chÊt di truyÒn vµo vèn gen ng−êi hiÖn ®¹i.
ThÕ nªn, nhiÒu kh¶ n¨ng, ng−êi Nªan®ectan chÝnh lµ “®èi thñ” c¹nh tranh víi ng−êi cæ
x−a vèn lµ tæ tiªn cña ng−êi hiÖn ®¹i. Trong cuéc c¹nh tranh ®ã, ng−êi Nªan®ectan tá ra
kÐm thÝch nghi h¬n vµ bÞ tuyÖt chñng.
Ng−êi hiÖn ®¹i cã thÓ ®· tiÕn hãa ®ång thêi tõ c¸c quÇn thÓ ng−êi cæ x−a vèn ®·
h×nh thµnh tõ tr−íc ë Ch©u ¢u, Ch©u ¸ vµ Ch©u Phi; hoÆc còng cã thÓ chØ tõ mét ch©u

315
§inh §oµn Long

lôc (nhiÒu kh¶ n¨ng lµ Ch©u Phi), sau ®ã ph¸t t¸n ra c¸c vïng kh¸c trªn Tr¸i ®Êt qua sù
di c−. Gi¶ thiÕt thø nhÊt ®−îc gäi lµ “gi¶ thiÕt ®a vïng”, cßn gi¶ thiÕt thø hai ®−îc gäi lµ
“gi¶ thiÕt ngoµi Ch©u Phi”. TiÕc r»ng, c¸c b»ng chøng hãa th¹ch thu ®−îc ®Òu kh«ng
kh¼ng ®Þnh ®−îc gi¶ thiÕt nµo phï hîp h¬n. Nh−ng gÇn ®©y, viÖc ph©n tÝch vµ so s¸nh
c¸c tr×nh tù ADN ë ng−êi ®−¬ng thêi ®· phÇn nµo tr¶ lêi ®−îc c©u hái nµy.

10.5.5. Nguån gèc loµi ng−êi theo b»ng chøng ph©n tö


Trong vßng 20 n¨m qua, c¸c b»ng chøng ph©n tö (ADN, protein) ®· cung cÊp nhiÒu
th«ng tin bæ sung quan träng vÒ qu¸ tr×nh h×nh thµnh ng−êi hiÖn ®¹i. NhiÒu dÊu hiÖu
ph©n tö kh¸c nhau ®· ®−îc sö dông, nh− c¸c dÊu hiÖu ®a h×nh nhãm m¸u vµ isozyme, ®a
h×nh c¸c ®o¹n giíi h¹n (RFLP), ®a h×nh chiÒu dµi c¸c ®o¹n lÆp l¹i kÕ tiÕp (SSR, VNTR),
v.v... C¶ hai hÖ gen nh©n vµ ti thÓ ®Òu ®−îc “huy ®éng” trong nh÷ng nghiªn cøu nµy. HÖ
gen nh©n cã “−u thÕ” khi ®¸nh gi¸ tÝnh ®a d¹ng di truyÒn chung cña vèn gen loµi ng−êi;
nh−ng hÖ gen ti thÓ cã “−u thÕ” trong viÖc ph©n tÝch di truyÒn theo dßng mÑ, vµ x¸c ®Þnh
thêi ®iÓm ph©n li tiÕn hãa cña c¸c chñng téc.
So víi phÇn lín c¸c ®éng vËt kh¸c, hÖ gen ng−êi cã tÝnh ®ång nhÊt kh¸ cao. Khi so
s¸nh c¸c tr×nh tù ADN, sù thay thÕ c¸c nucleotide ë hÖ gen ng−êi thÊp h¬n 4 lÇn so víi
tinh tinh vµ b»ng 1/10 so víi ruåi giÊm. PhÇn lín (85 – 95%) c¸c d¹ng biÕn dÞ di truyÒn
(c¸c alen) ë ng−êi biÓu hiÖn ngay trong mçi quÇn thÓ, chø kh«ng ph¶i gi÷a c¸c quÇn thÓ
kh¸c nhau. TÇn sè biÕn dÞ t−¬ng ®èi thÊp gi÷a c¸c quÇn thÓ ng−êi cho thÊy: trong qu¸
tr×nh tiÕn hãa cña ng−êi hiÖn ®¹i, kÝch th−íc c¸c quÇn thÓ “tiÒn th©n” ®−îc duy tr× vÒ sau
®· rÊt nhá, −íc tÝnh chØ cã tõ 10.000 ®Õn 100.000 c¸ thÓ. Cã thÓ kÝch th−íc thùc cña c¸c
quÇn thÓ “tiÒn th©n” nµy lµ lín h¬n, nh−ng do mét sè yÕu tè nh− tËp tÝnh kÕt cÆp giao
phèi (®Æc ®iÓm tæ chøc x· Vèn gen
héi), ¸p lùc cña chän läc tù hiÖn t¹i
nhiªn lªn qu¸ tr×nh sinh
s¶n, “hiÖu øng th¾t cæ chai”
g©y ra bëi hµng lo¹t dÞch
bÖnh, n¹n ®ãi, thiªn tai...
dÉn ®Õn kÝch th−íc quÇn
thÓ di truyÒn hiÖu qu¶
(®ãng gãp vµo vèn gen
ng−êi ®−¬ng thêi) ®· lu«n
nhá h¬n 100.000 c¸ thÓ. Thêi
Trong nh÷ng quÇn thÓ nhá gian
nh− vËy, hiÖn t−îng “l¹c
dßng di truyÒn” ®· −u thÕ
h¬n so víi ®ét biÕn trong
viÖc quy ®Þnh sù c©n b»ng
gi÷a møc ®é biÕn dÞ vµ tØ lÖ
c¸c alen trung tÝnh ®−îc
chän läc duy tr×.
Tæ tiªn
Khi ph©n tÝch c¸c chung cña
quÇn thÓ ng−êi kh¸c nhau, c¸c c¸ thÓ
biÕn dÞ di truyÒn ë c¸c ®ang sèng
chñng téc ng−êi Ch©u Phi
cao h¬n h¼n c¸c ch©u lôc H×nh 10.15. Qu¸ tr×nh “dÝnh chËp”. NÕu c¸c dßng tr×nh tù ADN ®−îc t×m
thÊy trong c¸c c¸ thÓ ®ang sèng (vèn gen hiÖn t¹i) ®−îc truy nguyªn vÒ qu¸
kh¸c. §iÒu nµy ñng hé gi¶
khø, th× sÏ thÊy tÊt c¶ c¸c c¸ thÓ hiÖn ®ang tån t¹i ®Òu cã mét tæ tiªn chung.
thiÕt “ngoµi Ch©u Phi”. C¸c tr×nh tù ADN kh¸c ®· tõng cã trong qu¸ khø nh−ng hiÖn nay kh«ng
Ngoµi ra, c¸c kÕt qu¶ so cßn tån t¹i lµ do sù tuyÖt chñng ®−îc kÝ hiÖu b»ng vßng trßn ®en (•).

316
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

s¸nh hÖ gen ti thÓ gi÷a c¸c quÇn thÓ ng−êi kh¸c nhau còng ®· ñng hé gi¶ thiÕt nµy,
nghÜa lµ ban ®Çu chØ cã mét quÇn thÓ ng−êi hiÖn ®¹i ë Ch©u Phi råi di c− tíi c¸c ch©u lôc
kh¸c vµ h×nh thµnh nªn c¸c quÇn thÓ míi (h×nh 10.15).
B»ng viÖc ph©n tÝch hÖ gen ti thÓ gi÷a c¸c chñng téc ng−êi, mét sè nhµ tiÕn hãa −íc
tÝnh tæ tiªn chung cña toµn bé ng−êi ®−¬ng thêi (gäi lµ “£va”, do di truyÒn theo dßng mÑ)
sèng c¸ch ®©y tõ 100.000 ®Õn 200.000 n¨m. §iÒu ®¸ng chó ý lµ sau ®ã viÖc so s¸nh vïng
kh«ng t−¬ng ®ång trªn NST Y (di truyÒn theo dßng bè) ë ®µn «ng tõ c¸c quÇn thÓ kh¸c
nhau còng cho kÕt qu¶ t−¬ng tù (“Adam” sèng c¸ch ®©y kho¶ng 150.000 n¨m). KÕt hîp
c¸c sè liÖu nµy, cã thÓ nhËn ®Þnh r»ng mäi ng−êi sèng trªn Tr¸i ®Êt hiÖn nay ®Òu lµ hËu
duÖ cña mét cÆp “£va - Adam” sèng ë Ch©u Phi c¸ch ®©y kho¶ng 150.000 ®Õn 200.000
n¨m. Nãi nh− vËy, kh«ng cã nghÜa lµ vµo thêi ®iÓm ®ã, chØ cã hai c¸ thÓ nµy tån t¹i; mµ
cßn nhiÒu c¸ thÓ kh¸c. Nh−ng, c¸c dßng di truyÒn kh¸c kh«ng ®−îc duy tr× ®Õn ngµy nay.
NÕu tÊt c¶ nh÷ng gi¶ thiÕt vµ kÕt qu¶ ph©n tÝch trªn ®©y lµ ®óng (bëi còng cßn mét
sè yÕu tè ch−a ch¾c ch¾n vÒ gi¶ thiÕt “®ång hå ph©n tö” vµ ®é chÝnh x¸c cña ph−¬ng ph¸p
ph©n tÝch), th× qu¶ thËt loµi ng−êi cßn rÊt trÎ. Cã lÏ, b¾t nguån tõ mét quÇn thÓ “tiÒn
th©n” nhá ë Ch©u Phi; råi tõ Ch©u Phi, loµi ng−êi di c− tíi Ch©u ¸ vµ Ch©u ¢u, sau ®ã
tíi Ch©u óc vµ Ch©u Mü; cuèi cïng, trë thµnh loµi “thèng trÞ” Tr¸i ®Êt nh− hiÖn nay.

10.6. Sù tiÕn hãa lêi nãi (ng«n ng÷) ë ng−êi

10.6.1. TÝnh tr¹ng “lêi nãi” ë ng−êi vµ gen FOX2P


NÕu nh− cÊu tróc di truyÒn hÖ gen ng−êi vµ c¸c loµi ®éng vËt cã vó kh¸c (nh−
chuét, tinh tinh) lµ gièng nhau, th× mét c©u hái ®Æt ra lµ: sù s¸ng t¹o tiÕn hãa “xuÊt
chóng” nµo ®· lµm cho loµi ng−êi rÊt kh¸c biÖt víi nh÷ng loµi cßn l¹i? Chóng ta h·y dù
®o¸n vÒ nguån gèc mét tÝnh (a)
tr¹ng ph¶n ¸nh sù kh¸c biÖt Chuét
cña loµi ng−êi, ®ã lµ “lêi nãi” Tæ tiªn
chung §−êi −¬i
hay “ng«n ng÷”. §Õn nay,
loµi ng−êi lµ loµi duy nhÊt cã KhØ Gorilla
thÓ giao tiÕp b»ng c¶ hÖ Tinh tinh lïn 3
thèng ng«n ng÷ nãi vµ viÕt.
Tinh tinh 2
Loµi ®éng vËt gÇn ng−êi
nhÊt lµ tinh tinh còng cã kh¶ Ng−êi
n¨ng giao tiÕp qua mét d¹ng
(b)
ng«n ng÷ ®¬n gi¶n, nh−ng s¬ 80 303 325
khai h¬n rÊt nhiÒu so víi loµi N D N S C
ng−êi. VËy, ng«n ng÷ ®· Ng−êi
h×nh thµnh nh− thÕ nµo
trong qu¸ tr×nh ph¸t sinh N D T N C
Tinh tinh
loµi ng−êi?
Kh¶ n¨ng nãi phô
N E T A C
Chuét
thuéc vµo sù ®iÒu phèi ho¹t
®éng chÝnh x¸c cña c¸c c¬ H×nh 10.16. Sù tiÕn hãa cña protein FOX2P. (a) Mèi quan hÖ gi÷a
c¸c loµi ®−îc x¸c ®Þnh dùa trªn sù sai kh¸c vÒ tr×nh tù axit amin trong
trong thanh qu¶n vµ miÖng. protein FOX2P ë chuét vµ c¸c loµi linh tr−ëng; c¸c chØ sè (2, 3) lµ sè
Sù biÓu hiÖn gi¶m ®i cña mét axit amin ®−îc thay thÕ. (b) C¸c axit amin ®−îc thay thÕ trong protein
protein ®iÒu hßa cã tªn lµ FOX2P ë chuét, tinh tinh vµ ng−êi.

317
§inh §oµn Long

FOXP2 ®−îc t×m thÊy lµ nguyªn nh©n dÉn ®Õn nhiÒu d¹ng sai háng kh¸c nhau vÒ kh¶
n¨ng nãi. Nh÷ng c¸ thÓ thiÕu hôt protein nµy gÆp khã kh¨n trong viÖc ph¸t ©m vµ diÔn
®¹t ng«n ng÷. Gen FOXP2 còng ®−îc t×m thÊy vµ ph©n lËp tõ c¸c ®éng vËt kh¸c nh−
chuét, tinh tinh vµ ®−êi −¬i (h×nh 10.16a). Nh−ng d¹ng protein FOXP2 cña ng−êi kh¸c
biÖt ®«i chót so víi c¸c d¹ng t×m thÊy ë c¸c loµi linh tr−ëng vµ ®éng vËt cã vó kh¸c. §Æc
biÖt, cã hai sù thay thÕ axit amin chØ cã ë protein FOX2P cña ng−êi, ®ã lµ: Thr → Asn t¹i
vÞ trÝ 303, vµ Asn → Ser t¹i vÞ trÝ 325 (h×nh 10.16b). Cã lÏ, nh÷ng ®ét biÕn nµy ®· lµm
thay ®æi chøc n¨ng protein FOX2P cña ng−êi. Mét sè b»ng chøng cho thÊy vïng ®iÒu hßa
øc chÕ cña protein nµy mÊt kh¶
n¨ng ®iÒu khiÓn mét sè gen ®Ých
vèn bÞ øc chÕ ë tinh tinh vµ Vá n·o míi
chuét. HiÖn t−îng nµy d−êng ë c¸c loµi
nh− gièng víi sù xuÊt hiÖn ®o¹n linh tr−ëng
peptide “ph¶n øc chÕ” cña
protein Ubx t×m thÊy ë gi¸p x¸c
(xem môc 10.2). Ngoµi ra,
nh÷ng thay ®æi trong kiÓu biÓu
hiÖn cña gen FOX2P hoÆc trong N MiÒn
chÝnh tr×nh tù c¸c gen ®Ých còng ho¹t hãa
Protein
cã thÓ lµ nguyªn nh©n dÉn ®Õn FOX2P
sù ph¸t triÓn kh¶ n¨ng nãi ë MiÒn liªn kÕt
ng−êi. ADN sîi kÐp
C
10.6.2. Gen FOX2P thóc ®Èy
sù ph¸t triÓn ng«n ng÷ Ng−êi Tinh tinh
ë ng−êi nh− thÕ nµo?
ë ®©y, chóng ta còng ®Ò Gen A Gen A
cËp ®Õn 3 c¬ chÕ lµm thay ®æi “BËt” “T¾t”
chøc n¨ng protein ®iÒu hßa vèn +1 +1
®· ®−îc nªu trong tr−êng hîp
gen Ubx. Nh÷ng nguyªn lý nµy
còng ®−îc ¸p dông ®èi víi gen Gen B Gen B
FOX2P. Cã lÏ ®· cã mét sù kÕt “BËt” “T¾t”
hîp ®ång thêi 3 c¬ chÕ (thay ®æi +1 +1
kiÓu biÓu hiÖn cña gen ®iÒu hßa,
thay ®æi tr×nh tù axit amin cña
protein ®iÒu hßa do gen ®iÒu
Gen C Gen C
hßa m· hãa vµ nh÷ng thay ®æi
“BËt” “BËt”
ngay trong tr×nh tù c¸c gen +1 +1
®Ých) dÉn ®Õn viÖc protein H×nh 10.17. FOX2P vµ thuyÕt tiÕn hãa "ng«n ng÷" ë ng−êi.
FOX2P “®ét xuÊt” trë thµnh mét Protein ®iÒu hßa FOX2P ®−îc biÓu hiÖn trong vá n·o ë ng−êi còng
chÊt “m«i giíi” quan träng cho nh− ë tinh tinh. Tuy nhiªn, ho¹t tÝnh cña protein nµy ë hai loµi cã ®iÓm
sù h×nh thµnh ng«n ng÷ ë ng−êi. kh¸c nhau. Gen ë ng−êi ®−îc biÓu hiÖn m¹nh vµo ®óng thêi ®iÓm cña
Cô thÓ, mét ®ét biÕn trong tr×nh qu¸ tr×nh ph¸t triÓn trung khu “nãi”, trong ®ã cã sù ho¹t hãa 3 gen
®Ých (gi¶ ®Þnh lµ A, B vµ C) trong vïng vá n·o. Nh÷ng gen ®Ých nµy
tù ®iÒu hßa cña gen FOX2P ®· m· hãa c¸c chÊt dÉn truyÒn thÇn kinh quan träng quyÕt ®Þnh sù h×nh
®−îc ph¸t hiÖn lµ nguyªn nh©n thµnh trung khu “nãi”. Ng−îc l¹i, ë tinh tinh, gen FOX2P kh«ng ®−îc
lµm thay ®æi kiÓu biÓu hiÖn cña biÓu hiÖn vµo ®óng thêi ®iÓm tèi −u nhÊt cña qu¸ tr×nh ph¸t triÓn trung
khu “nãi”; ngoµi ra, ngay c¶ khi ®−îc biÓu hiÖn ®óng thêi ®iÓm, sù
gen FOX2P trong n·o ng−êi. ë kh¸c biÖt vÒ mét sè axit amin trong protein FOX2P cña tinh tinh lµm
tinh tinh, gen nµy kh«ng ®−îc gi¶m ho¹t tÝnh ho¹t hãa c¸c gen ®Ých. KÕt qu¶ lµ, tinh tinh chØ cã kh¶
biÓu hiÖn t¹i vÞ trÝ thÝch hîp n¨ng giao tiÕp b»ng ng«n ng÷ “cæ x−a”.

318
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

trong n·o vµ vµo mét thêi ®iÓm phï hîp cña qu¸ tr×nh ph¸t triÓn. Ng−îc l¹i, ë ng−êi gen
nµy ®−îc biÓu hiÖn ë vÞ trÝ vµ thêi ®iÓm rÊt phï hîp cho sù ph¸t triÓn kh¶ n¨ng nãi ë trÎ
em. Ngoµi ra, ë phÇn sau, chóng ta sÏ thÊy protein FOX2P ë ng−êi vµ tinh tinh cã c¸c
nhãm gen ®Ých kh¸c nhau. Gi¶ thiÕt nµy mÆc dï chØ lµ suy ®o¸n, nh−ng nã gióp gi¶i
thÝch t¹i sao chØ mét sè thay ®æi nhá trong c¸c gen ®iÒu hßa vµ gen ®Ých cña chóng l¹i cã
thÓ t¹o nªn ®−îc mét tÝnh tr¹ng “®éc ®¸o” nh− ng«n ng÷ ë ng−êi.
Trong sè c¸c gen ®Ých ®−îc gen FOX2P ®iÒu khiÓn cã c¸c gen m· hãa c¸c chÊt dÉn
truyÒn thÇn kinh vµ c¸c protein tÝn hiÖu quan träng cho sù ph¸t triÓn thanh qu¶n.
Nh÷ng biÕn ®æi ë nh÷ng gen nµy cã thÓ lµm thay ®æi thêi ®iÓm biÓu hiÖn vµ t¨ng møc
biÓu hiÖn cña c¸c gen, sao cho c¸c tÝn hiÖu thiÕt yÕu ®−îc h×nh thµnh ë thanh qu¶n vµo
®óng thêi ®iÓm trÎ ®ang ph¸t triÓn kh¶ n¨ng nãi trë nªn nh¹y c¶m nhÊt víi kh¶ n¨ng
tiÕp thu ng«n ng÷. C¸c gen t−¬ng øng ë tinh tinh chØ biÓu hiÖn ë møc thÊp, sai vÞ trÝ vµ ë
thêi ®iÓm muén h¬n trong qu¸ tr×nh ph¸t triÓn thanh qu¶n (h×nh 10.17).
FOX2P chØ lµ mét vÝ dô vÒ gen ®iÒu hßa tham gia vµo sù ph¸t triÓn “kh¶ n¨ng nãi”
ë ng−êi. ThËt khã ®Ó −íc l−îng cã bao nhiªu “gen ®iÒu hßa ng«n ng÷” kÓ tõ khi cã sù
ph©n li tiÕn hãa gi÷a ng−êi vµ tinh tinh. Tuy vËy, ë ®Çu ch−¬ng nµy chóng ta ®· thÊy chØ
cÇn Ýt h¬n 100 “gen ®iÒu hßa quy ®Þnh kiÓu biÓu hiÖn gen” còng ®ñ ®Ó t¹o nªn mét sù ®a
d¹ng h×nh th¸i rÊt lín ë c¸c loµi ®éng vËt ch©n ®èt. V× vËy, cã lÏ chØ cÇn mét sè gen ®iÒu
hßa lµ ®ñ ®Ó dÉn ®Õn sù ph¸t triÓn ng«n ng÷ ë ng−êi.

10.7. Sù tiÕn hãa c¸c gen c¶m nhËn mµu s¾c vµ bÖnh di truyÒn liªn quan

10.7.1. C¬ së tÕ bµo cña sù c¶m nhËn mµu s¾c ë m¾t


Chóng ta c¶m nhËn ®−îc h×nh ¶nh qua c¸c n¬ron thÇn kinh vâng m¹c ë phÝa sau
nh·n cÇu (h×nh 10.18). Nh÷ng n¬ron nµy cã hai lo¹i: tÕ bµo h×nh nãn vµ tÕ bµo h×nh que.
C¸c tÕ bµo h×nh que chiÕm 95% sè l−îng c¸c tÕ bµo c¶m nhËn ¸nh s¸ng vµ ®−îc kÝch
thÝch bëi c¸c ¸nh s¸ng yÕu. ë c−êng ®é s¸ng m¹nh h¬n, c¸c tÕ bµo h×nh que bÞ b·o hßa vµ
kh«ng cßn chøc n¨ng göi c¸c tÝn hiÖu bæ sung thªm vÒ n·o bé. Lóc nµy, c¸c tÕ bµo h×nh
nãn sÏ tiÕp qu¶n chøc n¨ng nµy, xö lý c¸c b−íc sãng cña ¸nh s¸ng m¹nh, göi tÝn hiÖu vÒ
n·o bé vµ gióp chóng ta ph©n biÖt ®−îc mµu s¾c. C¸c tÕ bµo h×nh nãn cã ba lo¹i. Lo¹i thø
nhÊt chuyªn hãa ®Ó c¶m nhËn ¸nh s¸ng ®á, lo¹i thø hai c¶m nhËn ¸nh s¸ng xanh lôc vµ
lo¹i thø ba c¶m nhËn ¸nh s¸ng xanh lam. §èi víi mçi tÕ bµo thô quan ¸nh s¸ng nh− vËy,
ho¹t ®éng c¶m nhËn ¸nh s¸ng bao gåm sù hÊp thô c¸c photon tõ ¸nh s¸ng ë mét d¶i b−íc
sãng nhÊt ®Þnh, chuyÓn th«ng tin vÒ sè l−îng vµ n¨ng l−îng cña c¸c photon thµnh c¸c tÝn
hiÖu ®iÖn tö vµ chuyÓn c¸c tÝn hiÖu ®ã qua tÕ bµo thÇn kinh thÞ gi¸c tíi bé n·o.

10.7.2. HÖ gen ng−êi cã bèn gen m· hãa bèn protein c¶m nhËn mµu s¾c
C¸c protein c¶m nhËn photon vµ khëi ®Çu sù truyÒn tÝn hiÖu ë c¸c tÕ bµo h×nh nãn
lµ rhodopsin. Protein nµy cã mét chuçi polypeptide duy nhÊt gåm 348 axit amin gÊp nÕp
thµnh chuçi zigzag xuyªn mµng tÕ bµo (h×nh 10.18). Mét axit amin Lys n»m trong chuçi
liªn kÕt víi mét ph©n tö carotenoid s¾c tè trªn vâng m¹c cã kh¶ n¨ng hÊp thô photon.
C¸c axit amin gÇn vïng liªn kÕt vâng m¹c t¹o nªn miÒn ho¹t ®éng cña rhodopsin. Nhê
viÖc thay ®æi vÞ trÝ vâng m¹c qua mét c¬ chÕ ®Æc biÖt, rhodopsin quy ®Þnh kiÓu ®¸p øng
¸nh s¸ng cña tÕ bµo vâng m¹c. Mçi tÕ bµo h×nh que chøa kho¶ng 100 triÖu ph©n tö
rhodopsin. Gen m· hãa rhodopsin ë ng−êi n»m trªn NST sè 3.
Protein cã vai trß c¶m nhËn vµ khëi ®Çu qu¸ tr×nh truyÒn tÝn hiÖu ë c¸c tÕ bµo h×nh
nãn ®èi víi photon mµu xanh lam cã quan hÖ tiÕn hãa víi rhodopsin. Protein nµy còng chØ

319
§inh §oµn Long

cã mét chuçi polypeptide duy a)


nhÊt gåm 348 axit amin vµ bao C¸c tÕ bµo h×nh BiÓu m«
quanh mét ph©n tö s¾c tè ë nãn vµ h×nh que s¾c tè
vâng m¹c. GÇn 50% tr×nh tù
axit amin trªn ph©n tö protein
Vâng m¹c
c¶m nhËn ¸nh s¸ng xanh lam
gièng rhodopsin; phÇn cßn l¹i
kh¸c víi rhodopsin lµ phÇn TÕ bµo thô
chuyªn hãa cho sù c¶m nhËn ¸nh s¸ng c¶m ¸nh s¸ng
¸nh s¸ng xanh lam (h×nh H×nh que
10.18b). Gen m· hãa protein
nµy n»m trªn NST sè 7.
H×nh nãn
Còng cã quan hÖ tiÕn hãa
víi protein rhodopsin lµ c¸c
protein c¶m nhËn ¸nh s¸ng ®á Vâng
vµ xanh lôc n»m trong c¸c tÕ ¸nh s¸ng
m¹c
bµo h×nh nãn mµu ®á vµ xanh Rhodopsin
lôc. Hai protein nµy còng chØ cã
mét chuçi polypeptide duy b) 1- Protein Rhodopsin 2- Protein c¶m nhËn mµu xanh lam
nhÊt, nh−ng chiÒu dµi lµ 364
axit amin. Chóng còng liªn kÕt
víi vâng m¹c vµ n»m xuyªn
mµng tÕ bµo (h×nh 10.18b). 3-Protein c¶m nhËn mµu lôc 4-Protein c¶m nhËn mµu ®á
Còng gièng nh− protein c¶m
nhËn mµu xanh lam, c¸c
protein c¶m nhËn mµu ®á vµ
xanh lôc cã gÇn 50% tr×nh tù
axit amin gièng rhodopsin; c¸c c) C¸c gen m· hãa protein c¶m nhËn mµu ®á
d) Sù tiÕn hãa cña c¸c gen
protein nµy chØ kh¸c nhau c¶m nhËn mµu s¾c
(1) vµ lôc (2) trªn NST X
trung b×nh 4 / 100 axit amin. Gen tiÒn th©n
MÆc dï chØ kh¸c biÖt nhá nh−
vËy nh−ng c¸c protein nµy ®·
biÖt hãa c¸c tÕ bµo h×nh nãn 1 2 2 2 §á Lôc Lam Rhodopsin
thµnh hai lo¹i c¶m øng víi c¸c
photon ¸nh s¸ng cã b−íc sãng H×nh 10.18. C¬ së ph©n tö cña sù c¶m nhËn mµu s¾c. (a) c¸c tÕ
kh¸c nhau, gäi lµ c¸c tÕ bµo bµo h×nh nãn vµ h×nh que ë vâng m¹c chøa hµng triÖu protein thô
h×nh nãn mµu ®á vµ xanh lôc. thÓ liªn kÕt mµng tÕ bµo cã vai trß c¶m nhËn ¸nh s¸ng. (b) c¸c thô
C¶ hai gen m· hãa cho c¸c thÓ c¶m nhËn ¸nh s¸ng ë tÕ bµo h×nh que lµ rhodopsin. C¸c protein
protein c¶m nhËn mµu ®á vµ thô thÓ c¶m nhËn mµu ®á, xanh lam vµ lôc cã ë c¸c tÕ bµo h×nh nãn
gièng víi rhodopsin ë phÇn lín tr×nh tù, nh−ng vÉn ®ñ kh¸c biÖt dÉn
xanh lôc ®Òu n»m trªn NST X, ®Õn kh¶ n¨ng thô c¶m mµu s¾c kh¸c nhau. (c) c¸c gen m· hãa
vµ xÕp thµnh mét chuçi kÕ tiÕp protein c¶m nhËn mµu ®á (1) vµ lôc (2) n»m thµnh chuçi trªn NST
nhau. Mçi NST X ë ng−êi X. Ng−êi b×nh th−êng cã 1 b¶n sao gen m· hãa protein c¶m nhËn
th−êng mang 1 gen m· hãa mµu ®á vµ tõ 1 ®Õn 5 b¶n sao gen m· hãa protein c¶m nhËn mµu
protein c¶m nhËn ¸nh s¸ng ®á lôc. (d) sù tiÕn hãa cña c¸c protein c¶m nhËn mµu s¾c cho thÊy
chóng cïng xuÊt ph¸t tõ mét gen tiÒn th©n, tr¶i qua ba ®ét biÕn lÆp
duy nhÊt, nh−ng cã 1 - 5 b¶n ®o¹n gen ®éc lËp, sau ®ã lµ sù ph©n ly vÒ chøc n¨ng cña c¸c gen.
sao gen m· hãa protein c¶m
nhËn ¸nh s¸ng xanh lôc n»m liÒn kÒ nhau (h×nh 10.18c).

10.7.3. Hä gen rhodopsin tiÕn hãa do hiÖn t−îng lÆp ®o¹n vµ ph©n li chøc n¨ng
Sù gièng nhau vÒ cÊu tróc vµ chøc n¨ng gi÷a bèn lo¹i protein rhodopsin cho thÊy
c¸c gen m· hãa c¸c protein nµy xuÊt hiÖn do hiÖn t−îng lÆp ®o¹n cña mét gen thô thÓ

320
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸

c¶m nhËn ¸nh s¸ng tiÒn th©n, råi tiÕp tôc ph©n li do sù tÝch lòy ®ét biÕn. C¸c ®ét biÕn t¹o
nªn kh¶ n¨ng c¶m nhËn mµu s¾c ®−îc −u tiªn chän läc qua hµng triÖu n¨m tiÕn hãa. C¸c
protein c¶m nhËn ¸nh s¸ng ®á vµ xanh lôc gièng nhau h¬n c¶ (chØ kh¸c nhau 15 axit
amin), cho thÊy chóng ®−îc ph©n li gÇn ®©y. Cßn sù gièng nhau vµ kh¸c nhau gi÷a hai
lo¹i protein c¶m nhËn mµu xanh lam vµ rhodopsin, còng nh− so s¸nh víi hai lo¹i protein
cßn l¹i, cho thÊy hai lo¹i protein ®−îc nh¾c ®Õn tr−íc xuÊt hiÖn vµ ph©n li sím h¬n trong
qu¸ tr×nh tiÕn hãa (h×nh 10.18d).

10.7.4. §ét biÕn ë hä gen rhodopsin ¶nh h−ëng ®Õn thÞ lùc vµ kh¶ n¨ng nhËn
biÕt mµu

10.7.4.1. NhiÒu ®ét biÕn thay thÕ axit amin ë rhodopsin g©y mï toµn phÇn hay mét phÇn
Ng−êi ta ®· ph¸t hiÖn ®−îc Ýt nhÊt 29 d¹ng ®ét biÕn thay thÕ axit amin trong
protein rhodopsin g©y nªn mét nhãm bÖnh di truyÒn tréi n»m trªn NST th−êng (gäi
chung lµ c¸c bÖnh lo¹n s¾c tè vâng m¹c, retinitis pigmentosa) víi biÓu hiÖn lµ: ban ®Çu
c¸c tÕ bµo h×nh que mÊt chøc n¨ng, råi dÇn dÇn c¸c tÕ bµo vâng m¹c ngo¹i vi bÞ tho¸i hãa.
Nh÷ng ®ét biÕn nµy g©y nªn sù gÊp nÕp sai cña rhodopsin, hoÆc lµm protein nµy trë nªn
kÐm bÒn. B×nh th−êng, protein rhodopsin ph¶i g¾n vµo mµng tÕ bµo h×nh que, nh−ng khi
bÞ ®ét biÕn chóng kh«ng g¾n ®−îc vµo mµng tÕ bµo vµ kh«ng biÓu hiÖn ®−îc chøc n¨ng
b×nh th−êng. Khi kh«ng cã ®ñ rhodopsin trªn mµng tÕ bµo, tÕ bµo h×nh que th−êng bÞ
chÕt. Tïy theo sè tÕ bµo h×nh que chÕt, ng−êi bÖnh cã thÓ bÞ mï hoµn toµn hay mét phÇn.
C¸c ®ét biÕn kh¸c ë gen m· hãa rhodopsin cßn g©y nªn mét d¹ng bÖnh lý Ýt nghiªm
träng h¬n lµ bÖnh mï ban ®ªm. C¸c ®ét biÕn nµy lµm thay ®æi tr×nh tù cña c¸c axit amin
trong ph©n tö protein theo h−íng lµm t¨ng ng−ìng ¸nh s¸ng kÝch thÝch cÇn thiÕt ®Ó khëi
®Çu chuçi truyÒn tÝn hiÖu c¶m nhËn ¸nh s¸ng. Víi nh÷ng thay ®æi nµy, khi c−êng ®é ¸nh
s¸ng yÕu, m¾t kh«ng c¶m nhËn ®−îc mµu s¾c.
10.7.4.2. C¸c ®ét biÕn gen ë tÕ bµo h×nh nãn lµm gi¶m thÞ lùc theo kiÓu dù ®o¸n ®−îc
C¸c rèi lo¹n thÞ lùc g©y ra bëi c¸c ®ét biÕn liªn quan ®Õn c¸c gen s¾c tè thuéc tÕ bµo
h×nh nãn Ýt nghiªm träng h¬n so víi c¸c rèi lo¹n thÞ lùc g©y ra bëi c¸c ®ét biÕn t−¬ng tù
x¶y ra víi c¸c gen rhodopsin trong c¸c tÕ bµo h×nh que. Nguyªn nh©n chñ yÕu cã lÏ bëi v×
c¸c tÕ bµo h×nh que chiÕm ®Õn 95% sè n¬ron thÇn kinh c¶m nhËn mµu s¾c ë ng−êi, trong
khi c¸c tÕ bµo h×nh nãn chØ chiÕm 5%. Mét sè ®ét biÕn liªn quan ®Õn gen m· hãa protein
c¶m nhËn mµu xanh lam n»m trªn NST sè 7 g©y nªn héi chøng rèi lo¹n thÞ lùc s¾c tè
xanh (tritanopia). C¸c ®ét biÕn ë gen m· hãa protein c¶m nhËn s¾c tè ®á trªn NST X cã
thÓ lµm mÊt chøc n¨ng c¶m nhËn mµu ®á cña c¸c tÕ bµo h×nh nãn vµ g©y bÖnh mï mµu
®á. Mét sè ®ét biÕn nhá kh¸c liªn quan ®Õn gen quy ®Þnh protein c¶m nhËn mµu ®á cã thÓ
g©y nªn bÖnh mï mµu ®á mét phÇn hoÆc hoµn toµn tïy vµo vÞ trÝ ®ét biÕn.
10.7.4.3. Trao ®æi chÐo kh«ng c©n gi÷a c¸c gen m· hãa protein c¶m nhËn mµu xanh lôc
vµ ®á trªn NST X g©y ra phÇn lín c¸c rèi lo¹n thÞ lùc vÒ c¶m nhËn mµu
Mét ng−êi b×nh th−êng chØ cã mét gen duy nhÊt m· hãa protein c¶m nhËn mµu ®á
n»m trªn NST X; nh−ng n»m kÒ gen nµy cã tõ mét ®Õn n¨m b¶n sao gen m· hãa protein
c¶m nhËn mµu xanh lôc. C¸c gen ®á vµ xanh lôc cã tr×nh tù ADN gièng nhau 96%. C¸c
b¶n sao kh¸c nhau cña gen xanh lôc gièng nhau ®Õn 99,9%. Sù gièng nhau vµ n»m gÇn
nhau cña nh÷ng gen nµy lµm hiÖn t−îng trao ®æi chÐo kh«ng c©n rÊt dÔ x¶y ra. Cã lÏ v×
vËy, nhiÒu ®ét biÕn mÊt gen mµu ®á ®· ®−îc t×m thÊy lµ do sù trao ®æi chÐo kh«ng c©n ë
vïng gen nµy. KÕt qu¶ cña nh÷ng trao ®æi chÐo nµy lµ sù tæ hîp l¹i cña c¸c gen xanh lôc,
hoÆc t¹o ra c¸c gen lai míi “xanh lôc - ®á”. Do kh¶ n¨ng c¶m nhËn mµu ®á vµ xanh lôc
phô thuéc vµo tØ lÖ ¸nh s¸ng ®á vµ xanh lôc ®−îc ph¶n chiÕu tõ h×nh ¶nh, nh÷ng ng−êi
thiÕu c¸c gen nµy sÏ c¶m nhËn hai mµu ®á vµ xanh lôc nh− mét mµu gièng nhau.

321
§inh §oµn Long

10.7.4.4. Mét sè ®ét biÕn cã thÓ lµm mÊt kh¶ n¨ng c¶m nhËn mµu ®á vµ xanh lôc
§Õn nay, ®· ph¸t hiÖn cã b¶y d¹ng ®ét biÕn mÊt ®o¹n NST g©y bÖnh mï mµu ®á vµ
xanh lôc liªn kÕt víi NST giíi tÝnh X. BÖnh lý nµy ®−îc gäi lµ héi chøng tÕ bµo h×nh nãn
®¬n s¾c xanh lam (blue cone monochromacy). Nh÷ng ng−êi m¾c héi chøng nµy chØ c¶m
nhËn ®−îc mµu liªn quan ®Õn mµu xanh lam. Nghiªn cøu ph©n tö cho thÊy: c¶ b¶y ®ét
biÕn mÊt ®o¹n nµy ®Òu liªn quan ®Õn mét tr×nh tù gåm 600 bp n»m ngoµi vïng m· hãa
cña c¸c gen ®á vµ xanh lôc. §iÒu nµy cho thÊy ®©y cã thÓ lµ ®o¹n tr×nh tù ®iÒu hßa dµi
cÇn cho sù biÓu hiÖn cña chuçi c¸c gen c¶m nhËn mµu ®á vµ xanh lôc.
Nh− vËy, chóng ta nh×n vµ c¶m nhËn ®−îc c¸c mµu s¾c ®a d¹ng, phong phó cña
v¹n vËt mét phÇn lµ nhê bèn gen trùc tiÕp m· hãa bèn lo¹i protein trong c¸c tÕ bµo
h×nh que vµ h×nh nãn ë vâng m¹c m¾t. C¸c ®ét biÕn lµm thay ®æi nh÷ng gen nµy hoÆc
sè l−îng cña chóng cã thÓ lµm gi¶m thÞ lùc, thËm chÝ lµm háng kh¶ n¨ng c¶m nhËn
mµu s¾c cña m¾t.

322
Ch−¬ng 11

Ph©n tÝch gen vµ s¶n phÈm cña gen

11.1. Giíi thiÖu chung


ë c¸c ch−¬ng tr−íc, chóng ta ®· ®Ò cËp ®Õn c¸c c¬ chÕ cña c¸c hiÖn t−îng di truyÒn
ë cÊp ph©n tö vµ tÕ bµo, trong ®ã cã sù ®iÒu hßa biÓu hiÖn cña c¸c gen, phÇn nµo gi¶i
thÝch ®−îc sù tiÕn hãa cña sinh vËt trªn c¬ së c¸c quy luËt biÕn ®æi cña vËt chÊt di truyÒn
(ADN vµ NST). Ch−¬ng nµy ®Ò cËp ®Õn mét sè ph−¬ng ph¸p c¬ b¶n cña sinh häc ph©n tö
vµ hãa sinh häc ®−îc dïng trong viÖc ph©n tÝch gen (ADN) vµ s¶n phÈm cña gen (ARN vµ
protein).
Trong bèi c¶nh c«ng nghÖ sinh häc vµ sinh häc ph©n tö ph¸t triÓn hÕt søc m¹nh mÏ
trong nh÷ng n¨m qua, ch¾c ch¾n gi¸o tr×nh nµy kh«ng thÓ ph¶n ¸nh ®Çy ®ñ c¸c ph−¬ng
ph¸p ®· ®−îc sö dông trong c¸c nghiªn cøu vÒ gen vµ s¶n phÈm cña gen, mµ chØ cã thÓ ®Ò
cËp ®Õn nguyªn lý cña mét sè ph−¬ng ph¸p c¬ b¶n ®−îc dïng phæ biÕn hiÖn nay trong c¸c
nghiªn cøu di truyÒn häc ë cÊp ®é ph©n tö. PhÇn ®Çu cña ch−¬ng m« t¶ c¸c ph−¬ng ph¸p
®−îc dïng trong ph©n tÝch c¸c axit nucleic, bao gåm tõ t¸ch chiÕt ADN, ph©n lËp gen ®Õn
gi¶i tr×nh tù vµ so s¸nh c¸c hÖ gen (genomics). PhÇn sau cña ch−¬ng ®Ò cËp ®Õn c¸c kü
thuËt t¸ch chiÕt vµ ph©n tÝch protein lµ s¶n phÈm cña hÇu hÕt c¸c gen, bao gåm tõ viÖc
tinh s¹ch protein ®Õn c¸c kü thuËt ph©n tÝch ho¹t tÝnh protein ë c¸c tÕ bµo vµ m«
(proteomics). Tuy ®−îc ®Ò cËp ë c¸c phÇn t¸ch biÖt, nh−ng thùc tÕ c¸c kü thuËt ph©n tÝch
ADN vµ protein ®Òu dùa trªn mét sè nguyªn lý chung vµ th−êng ®−îc sö dông phèi hîp
trong c¸c nghiªn cøu.

11.2. C¸c kü thuËt ph©n tÝch axit nucleic

11.2.1. T¸ch chiÕt vµ tinh s¹ch ADN


HÇu hÕt c¸c nghiªn cøu ph©n tÝch gen ®Òu b¾t ®Çu b»ng viÖc ph¶i t¸ch chiÕt vµ tinh
s¹ch ADN tõ c¸c ®èi t−îng nghiªn cøu. Dï lµ t¸ch chiÕt ADN tõ vi khuÈn, ®éng vËt hay
thùc vËt th× mét sè b−íc ®Çu tiªn cña qui tr×nh ®Òu cÇn “gi¶i phãng” c¸c thµnh phÇn cña
tÕ bµo vµo dung dÞch. Do vi khuÈn th−êng tån t¹i ë d¹ng c¸c tÕ bµo ®¬n, kh«ng cã cÊu
tróc x−¬ng, kh«ng tÝch lòy chÊt bÐo, Ýt hîp chÊt sinh häc thø cÊp ... nªn viÖc t¸ch chiÕt
ADN th−êng t−¬ng ®èi ®¬n gi¶n. Ng−îc l¹i, phÇn lín c¸c m« thùc vËt vµ ®éng vËt th−êng
cÇn ph¶i nghiÒn nhá trong nit¬ láng thµnh nh÷ng h¹t mÞn tr−íc khi cã thÓ t¸ch ADN.
ViÖc t¸ch chiÕt ADN tõ tÕ bµo ®éng vËt (vÝ dô: tõ ®u«i chuét) ®«i khi cÇn c¸c enzym ph©n
hñy c¸c m« liªn kÕt gióp t¨ng hiÖu qu¶ gi¶i phãng c¸c tÕ bµo vµ thµnh phÇn cña chóng
vµo dÞch chiÕt. §Æc biÖt, c¸c tÕ bµo thùc vËt cã thµnh cøng, nªn th−êng ph¶i sö dông c¸c
biÖn ph¸p c¬ häc (vÝ dô: sö dông m¸y xay, nghiÒn b»ng cèi) hoÆc sö dông mét sè enzym
®Æc hiÖu ph©n hñy thµnh tÕ bµo tr−íc khi cã thÓ t¸ch ADN. C¸c tÕ bµo thùc vËt cßn cã
®Æc ®iÓm phæ biÕn lµ tÝch lòy c¸c hîp chÊt sinh häc thø cÊp ë hµm l−îng cao, nªn ®Ó lo¹i
bá c¸c hîp chÊt nµy th−êng ph¶i bæ sung vµo dung dÞch chiÕt mét sè hîp chÊt, vÝ dô nh−
CTAB (cetyltrimethylammonium bromide) gióp t¨ng hiÖu qu¶ lo¹i bá c¸c hîp chÊt
polysaccharide vµ polyphenol. C¸c qui tr×nh t¸ch chiÕt ADN ®¬n gi¶n nhÊt lµ ë vi khuÈn.
§Çu tiªn c¸c tÕ bµo vi khuÈn cã thÓ ®−îc xö lý víi enzym lysozyme gióp ph©n hñy líp
petidoglycan trªn thµnh tÕ bµo. Sau ®ã, mÉu ®−îc xö lý tiÕp víi c¸c hîp chÊt tÈy lµm

323
§inh §oµn Long

ph©n r· c¸c cÊu tróc lipid trªn


ADN vµ ARN
mµng tÕ bµo. C¸c hîp chÊt t¹o trong n−íc
phøc kiÓu EDTA (ethylene
diamine tetraacetate) còng
Bæ sung L¾c Ly t©m
th−êng ®−îc dïng ®Ó lo¹i bá Phenol m¹nh
c¸c ion kim lo¹i. Trong c¸c
b−íc nh− vËy, ADN ®−îc gi¶i
phãng vµo dÞch chiÕt vµ sau ®ã Phenol
ADN, ARN vµ Protein
®−îc tinh s¹ch. protein trong trong
pha n−íc phenol
Cã hai ph−¬ng ph¸p phæ
biÕn ®−îc dïng phèi hîp ®Ó H×nh 11.1. Dïng phenol lo¹i protein khái dÞch chiÕt ADN vµ ARN.
tinh s¹ch ADN lµ ly t©m vµ
chiÕt xuÊt bëi dung m«i. Nguyªn lý cña ph−¬ng ph¸p ly t©m lµ khi dÞch chiÕt tÕ bµo
®−îc “quay” ë tèc ®é cao th× lùc ly t©m lµm l¾ng ®äng c¸c thµnh phÇn tÕ bµo cã khèi
l−îng vµ kÝch th−íc lín. Ch¼ng h¹n, khi thµnh tÕ bµo cña vi khuÈn ®· bÞ ph©n gi¶i th×
hÇu hÕt c¸c thµnh phÇn tÕ bµo cña nã ë d¹ng hßa tan trong dÞch chiÕt bëi chóng cã kÝch
th−íc nhá, cßn ADN vµ mét sè chÊt cã khèi l−îng ph©n tö lín sÏ l¾ng xuèng ®¸y èng ly
t©m. Lóc nµy, dÞch chiÕt mang c¸c thµnh phÇn tÕ bµo bÞ ph©n hñy dÔ dµng ®−îc hót ra
vµ lo¹i bá.
H¹t kÕt tña mang ADN sau ®ã ®−îc hßa tan trë l¹i trong dung dÞch ®Öm phï hîp.
Tuy nhiªn, nã th−êng cßn lÉn ARN vµ protein. C¸c hîp chÊt nµy sau ®ã cã thÓ ®−îc lo¹i
bá nhê sö dông c¸c dung m«i thÝch hîp. Trong b−íc tinh s¹ch ADN, phenol lµ mét dung
m«i cã hiÖu qu¶ cao vµ ®−îc dïng réng r·i, tuy nã kh¸ ®éc bëi kh¶ n¨ng hßa tan vµ g©y
biÕn tÝnh m¹nh protein. ViÖc sö dông phenol gióp hßa tan vµ t¸ch bá protein khái ADN.
Khi bæ sung phenol vµo n−íc, hai chÊt láng nµy kh«ng thÓ trén víi nhau thµnh dung dÞch
®ång nhÊt, mµ thay vµo ®ã phenol sÏ t¸ch ra thµnh líp riªng ë d−íi líp n−íc (h×nh 11.1).
Tuy vËy, khi l¾c m¹nh, hai líp dÞch nµy cã thÓ hßa vµo nhau thµnh hçn hîp “t¹m thêi”;
lóc ®ã, protein sÏ hßa tan vµo phenol. Sau ®ã, khi ®−a dung dÞch hçn hîp vÒ tr¹ng th¸i
tÜnh, hai pha phenol vµ n−íc l¹i t¸ch nhau ra. Lóc nµy, pha phenol mang nhiÒu ph©n tö
protein ë d¹ng hßa tan, cßn hÇu hÕt ADN vµ ARN chØ cã ë pha n−íc. ViÖc hót n−íc (líp ë
trªn) ra khái hçn hîp sÏ gióp t¸ch axit nucleic khái protein. §Ó gi¶m tèi ®a l−îng protein
cßn sãt l¹i, b−íc chiÕt xuÊt b»ng phenol cã thÓ ®−îc thùc hiÖn lÆp l¹i nhiÒu lÇn. Mét sè
quy tr×nh t¸ch chiÕt ADN gÇn ®©y nh»m tr¸nh phenol (v× tÝnh ®éc cña nã) ®· cã mét sè
c¶i tiÕn. Phæ biÕn nhÊt lµ viÖc sö dông c¸c cét chøa chÊt nÒn liªn kÕt ®Æc hiÖu ADN.
Trong ®ã, hai nhãm chÊt nÒn th«ng dông nhÊt lµ silic dioxide vµ c¸c hîp chÊt trao ®æi
anion. C¸c chÊt nÒn dùa trªn silic dioxide cã kh¶ n¨ng liªn kÕt ®Æc hiÖu víi ADN ë nång
®é muèi thÊp vµ pH cao. Trong khi ®ã, c¸c chÊt nÒn trao ®æi anion, nh−
diethylaminoethyl-cellulose, tÝch ®iÖn d−¬ng liªn kÕt m¹nh víi khung ®−êng-phosphate
cña ph©n tö ADN. Khi sö dông c¸c chÊt nÒn trao ®æi anion ë nång ®é muèi thÊp, ADN
®−îc “b¾t gi÷” trong cét; nh−ng khi nång ®é muèi t¨ng, ADN sÏ ®−îc röa tr«i khái cét bëi
nång ®é muèi cao lµm ph¸ vì c¸c liªn kÕt ion gi÷a ADN vµ chÊt nÒn.
B−íc tiÕp theo cña viÖc tinh s¹ch ADN lµ cÇn lo¹i bá ARN. ViÖc nµy th−êng ®−îc
thùc hiÖn nhê c¸c enzym ribonuclease (vÝ dô: RNase A). Nhãm enzym nµy cã kh¶ n¨ng
nhËn biÕt ®Æc hiÖu ARN (qua nhãm C2’-OH) vµ ph©n gi¶i chóng thµnh nh÷ng ®o¹n nhá,
mµ hÇu nh− kh«ng t¸c ®éng ®Õn c¸c ph©n tö ADN. Trong b−íc xö lý ribonuclease, hçn
hîp ADN vµ ARN ®−îc ñ ë nhiÖt ®é tèi −u cña enzym. Sau ®ã, dÞch chiÕt ®−îc bæ sung
mét thÓ tÝch t−¬ng ®−¬ng cña alcohol (etanol hay isoamylalcohol). C¸c hîp chÊt alcohol
lµm kÕt tña c¸c ph©n tö kÝch th−íc lín mµ lóc nµy trong dÞch chiÕt chØ cßn chñ yÕu lµ
ADN. C¸c ®o¹n ARN nhá ë d¹ng hßa tan nªn cã thÓ dÔ dµng hót ra vµ lo¹i bá. §iÓm ®¸ng
l−u ý lµ c¸c alcohol lµm kÕt tña c¸c ®¹i ph©n tö mét c¸ch kh«ng ®Æc hiÖu, nªn c¸c hîp

324
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

chÊt nh− hydrat carbon vµ protein cã thÓ cïng kÕt tña víi ADN vµ ARN. ThÕ nªn, b−íc
kÕt tña b»ng alcohol th−êng chØ ®−îc thùc hiÖn sau khi c¸c thµnh phÇn kh¸c cña tÕ bµo
®· ®−îc lo¹i bá khái dÞch chiÕt nhê ly t©m vµ/hoÆc chiÕt xuÊt bëi phenol.
Hçn hîp ADN vµ ARN sau khi ®−îc xö lý b»ng ribonuclease råi bæ sung etanol ®−îc
ly t©m ®Ó thu kÕt tña ADN, cßn ARN ë d¹ng hßa tan trong dÞch chiÕt ®−îc hót ra vµ lo¹i
bá. H¹t ADN kÕt tña ë ®¸y èng ly t©m ®«i khi rÊt nhá (thËm chÝ kh«ng nh×n thÊy b»ng
m¾t th−êng), nh−ng ®· chøa hµng triÖu ph©n tö ADN vµ th−êng lµ ®ñ cho c¸c nghiªn
cøu tiÕp theo. ADN lóc nµy cã møc ®é tinh s¹ch cao, ®−îc hßa tan trë l¹i trong dung dÞch
®Öm n−íc vµ cã thÓ sö dông cho c¸c thÝ nghiÖm ph©n tÝch ADN sau ®ã.

11.2.2. Sö dông quang phæ ®Ó x¸c ®Þnh nång ®é ADN vµ ARN


C¸c cÊu tróc vßng th¬m (purine vµ pyrimidine) cña c¸c nucleotide cÊu t¹o nªn ADN
vµ ARN t¹o cho c¸c ph©n tö nµy cã c−êng ®é hÊp thô tia tö ngo¹i cùc ®¹i ë vïng b−íc
sãng 260 nm (t−¬ng øng víi tia UV). Khi tia UV ®−îc chiÕu qua dung dÞch axit nucleic,
møc hÊp thô tia UV (A260 hay OD260) phô thuéc vµo nång ®é cña c¸c axit nucleic. TÝnh
chÊt nµy lµ nguyªn lý c¬ b¶n cña viÖc dïng m¸y quang phæ ®Ó x¸c ®Þnh nång ®é ADN vµ
ARN trong dung dÞch. Theo ®ã, dùa trªn nång ®é ADN hoÆc ARN cña c¸c dung dÞch
chuÈn biÕt tr−íc, c¸c gi¸ trÞ A260 t−¬ng øng ®−îc dïng ®Ó vÏ ®−êng tuyÕn tÝnh chuÈn
t−¬ng quan gi÷a nång ®é axit nucleic víi chØ sè A260. Dùa trªn ®−êng chuÈn nµy, cã thÓ
x¸c ®Þnh ®−îc nång ®é ADN hoÆc ARN cã trong dung dÞch mÉu sau khi ®o ®−îc chØ sè A260
cña nã.
Kh¸c víi ADN vµ ARN, protein hÊp thô tia tö ngo¹i cùc ®¹i ë b−íc sãng 280nm
(®iÒu nµy chñ yÕu lµ do cÊu tróc vßng th¬m cña axit amin tryptophan). §é tinh s¹ch cña
dÞch chiÕt ADN cã thÓ x¸c ®Þnh qua tØ sè A260/A280. DÞch chiÕt chØ chøa ADN tinh s¹ch cã tØ
sè A260/A280 xÊp xØ 1,8. NÕu cã protein, tØ sè nµy th−êng thÊp h¬n 1,8. Cßn nÕu cã ARN, tØ
sè nµy lín h¬n 1,8. DÞch chiÕt chØ chøa ARN tinh s¹ch cã tØ sè A260/A280 xÊp xØ 2,0.
Trong dung dÞch chØ chøa c¸c nucleotide ®¬n lÎ, v× c¸c nucleotide hßa tan kh¾p
dung dÞch, nªn c−êng ®é hÊp thô cña chóng lín h¬n khi chóng ë trong c¸c ph©n tö ADN
vµ ARN. Së dÜ nh− vËy lµ do c−êng ®é hÊp thô tia UV chñ yÕu do c¸c vßng purine vµ
pyrimidine chø kh«ng ph¶i do phÇn ®−êng vµ phosphate. Trong ph©n tö ADN sîi kÐp,
c¸c vßng purine vµ pyrimidine bÞ “ch¾n” bëi khung ®−êng-phosphate, nªn c−êng ®é hÊp
thô tia UV gi¶m. C¸c ph©n tö ARN vµ ADN cã cÊu tróc d¹ng m¹ch ®¬n víi mét sè vïng
cã thÓ cã cÊu tróc sîi kÐp nªn cã møc hÊp thô trung b×nh. Hµm l−îng ADN vµ ARN trong
dung dÞch th−êng ®−îc qui ®æi trªn c¬ së chØ sè A260 theo c«ng thøc:
1 A260 cña dung dÞch ADN sîi kÐp (dsADN) = 50 µg
1 A260 cña dung dÞch ADN m¹ch ®¬n (ssADN)/ARN = 40 µg
1 A260 cña dung dÞch dNTP/oligonucleotide = 33 µg

11.2.3. §iÖn di ph©n tÝch axit nucleic


Cã nhiÒu ph−¬ng ph¸p kh¸c nhau cã thÓ dïng ®Ó ph©n tÝch ADN, nh−ng ®Õn nay
®iÖn di trªn gel lµ ph−¬ng ph¸p ®−îc dïng phæ biÕn nhÊt nhê −u ®iÓm nhanh vµ ®¬n
gi¶n. Nguyªn t¾c cña ph−¬ng ph¸p lµ: d−íi t¸c ®éng cña ®iÖn tr−êng, c¸c ph©n tö axit
nucleic (tÝch ®iÖn ©m) kh¸c nhau vÒ kÝch th−íc, ®iÖn tÝch, møc ®é cuén xo¾n vµ d¹ng
ph©n tö (m¹ch th¼ng hay vßng) sÏ di chuyÓn qua hÖ m¹ng cña gel tõ cùc ©m (cathode)
sang cùc d−¬ng (anode) víi tèc ®é di chuyÓn kh¸c nhau. V× vËy, chóng dÇn dÇn t¸ch nhau
ra trªn tr−êng ®iÖn di; qua ®ã, ng−êi ta cã thÓ thu thËp vµ ph©n tÝch ®−îc tõng ph©n
®o¹n ADN hoÆc gen riªng rÏ. Trªn tr−êng ®iÖn di, c¸c ph©n ®o¹n ADN cã kÝch th−íc cµng
nhá cµng di chuyÓn nhanh. Sau khi ®iÖn di kÕt thóc, c¸c ph©n tö ADN cã thÓ quan s¸t

325
§inh §oµn Long

®−îc nhê sö dông thuèc nhuém ph¸t huúnh quang, nh− ethidium bromide (EtBr, xem c¬
chÕ ë ch−¬ng 3). Mçi b¨ng ®iÖn di th−êng ph¶n ¸nh mét tËp hîp c¸c ph©n tö ADN cã
cïng kÝch th−íc.
Cã hai lo¹i gel ®iÖn di ®−îc dïng phæ biÕn lµ agarose vµ polyacrylamide. Trong
®ã, gel polyacrylamide cã ®é ph©n gi¶i cao, nh−ng vïng kÝch th−íc ADN cã thÓ ph©n tÝch
hÑp. Cô thÓ, ph−¬ng ph¸p nµy cã thÓ ph©n t¸ch c¸c ®o¹n ADN kh¸c nhau thËm chÝ chØ
mét cÆp nucleotide (1 bp), nh−ng th−êng chØ dïng ®Ó ph©n tÝch c¸c ®o¹n ADN kÝch th−íc
nhá (tõ 5 ®Õn 1000 bp). Trong khi ®ã, gel agarose cã ®é ph©n gi¶i thÊp ®èi víi c¸c ®o¹n
ADN kÝch th−íc nhá, nh−ng rÊt hiÖu qu¶ khi ph©n t¸ch c¸c ®o¹n ADN kÝch th−íc lín
(kho¶ng tõ 200 bp ®Õn 20 kb; 1 kb = 1000 bp).
C¸c ®o¹n ADN kÝch th−íc lín kh«ng thÓ “lät” qua c¸c lç nhá trªn c¸c b¶n gel, kÓ c¶
gel agarose. Thay vµo ®ã, chóng (th−êng ë d¹ng m¹ch th¼ng) “tr−ên” qua m¹ng l−íi gel
b»ng c¸ch ®Çu nµy cña ph©n tö ®i tr−íc, cßn ®Çu kia theo sau. HËu qu¶ lµ c¸c ®o¹n ADN
lín (tõ 10 kb ®Õn 10 Mb; 1 Mb = 1000 kb) cã tèc ®é dÞch chuyÓn trªn tr−êng ®iÖn di gÇn
t−¬ng ®−¬ng vµ khã ph©n t¸ch nhê ®iÖn di th«ng th−êng. §èi víi c¸c ®o¹n ADN lín nh−
vËy, ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®iÖn di xung tr−êng (PFGE, pulsed-field gel
electrophoresis). Trong ph−¬ng ph¸p nµy, 2 cÆp ®iÖn cùc ®−îc ®Æt chÐo gãc trªn b¶n ®iÖn
di (h×nh 11.2). ViÖc “bËt” vµ “t¾t” lu©n phiªn 2 cÆp ®iÖn cùc lµm c¸c ®o¹n ADN lín thay
®æi chiÒu dÞch chuyÓn nh− m×nh häa trªn h×nh. C¸c ®o¹n ADN cã kÝch th−íc cµng lín
cµng chËm h¬n trong qu¸ tr×nh ®æi chiÒu dÞch chuyÓn. Nhê vËy, c¸c ®o¹n kÝch th−íc kh¸c
nhau sÏ t¸ch khái nhau. Kü thuËt PFGE trong thùc tÕ cã thÓ dïng ®Ó x¸c ®Þnh trùc tiÕp
kÝch th−íc cña nhiÔm s¾c thÓ (NST) vi khuÈn, hoÆc NST sinh vËt nh©n thËt bËc thÊp,
nh− nÊm men hoÆc mét sè nguyªn sinh ®éng vËt. KÝch th−íc hÖ gen cña nh÷ng loµi nµy
kho¶ng vµi Mb.
§èi víi c¸c ®o¹n ADN kÝch th−íc nhá chØ kh¸c nhau mét vµi bp, vÝ dô nh− c¸c s¶n
phÈm PCR cña c¸c alen thuéc cïng locut, ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®iÖn di
biÕn tÝnh gradient (DGGE). Trong kü thuËt DGGE, c¸c ph©n tö ADN sîi kÐp ®−îc g©y
biÕn tÝnh bëi nhiÖt hoÆc hãa chÊt, nh− urª hay formamide (®«i khi phèi hîp c¶ hai
ph−¬ng ph¸p) ®ång thêi víi qu¸ tr×nh diÖn di. NhiÖt ®é th−êng ®−îc duy tr× cao (50 –
§iÖn cùc 0% Gradient biÕn tÝnh 70% C¸c giÕng tra mÉu

ThÓ ®ét biÕn 1 40%


ChiÒu dÞch chuyÓn cña ADN

Gradient biÕn tÝnh


dÔ biÕn tÝnh h¬n

ADN
kiÓu d¹i

ThÓ ®ét biÕn 2


khã biÕn tÝnh h¬n
70%

DGGE vu«ng gãc DGGE song song

H×nh 11.2. Kü thuËt ®iÖn di xung tr−êng. H×nh 11.3 C¸c kü thuËt ®iÖn di biÕn tÝnh gradient DGGE
A vµ B lµ hai bé ®iÖn cùc. Chóng ®−îc bËt vµ t¾t (Denaturing gradient gel electrophoresis). Trong DGGE vu«ng gãc,
lu©n phiªn. Khi bËt A, ph©n tö ADN di chuyÓn vÒ hçn hîp 3 ®o¹n ADN (kiÓu d¹i, ®ét biÕn 1 vµ 2) ®−îc tra vµo mét
gãc ph¶i phÝa d−íi. Khi A t¾t vµ B bËt, ph©n tö giÕng dµi n»m ngang b¶n gel. Do t¸c ®éng cña chÊt g©y biÕn tÝnh ë
ADN di chuyÓn vÒ gãc tr¸i phÝa d−íi. Mòi tªn m« nång ®é kh¸c nhau, sù ®Þnh vÞ cña c¸c ®o¹n ADN t¹o nªn d¹ng
t¶ h−íng di chuyÓn cña ph©n tö ADN trong ®iÖn ®−êng cong sigma. §iÖn di DGGE song song t¹o nªn phæ ®iÖn di
di xung tr−êng. gièng ®iÖn di trªn gel th«ng th−êng.

326
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

65oC) vµ æn ®Þnh, trong khi nång ®é urª vµ formamide ®−îc t¨ng dÇn theo chiÒu song
song (DGGE song song) hoÆc vu«ng gãc (DGGE vu«ng gãc) víi chiÒu ®iÖn di. Trong
DGGE song song, kÕt qu¶ ®iÖn di h×nh thµnh c¸c b¨ng t¸ch biÖt gièng ®iÖn di trªn gel
agarose. Trong DGGE vu«ng gãc, hçn hîp c¸c ph©n tö ADN chØ kh¸c biÖt nhau mét hoÆc
mét vµi bp ph©n t¸n kh¾p b¶n gel vµ t¹o nªn mét chuçi b¨ng d¹ng ®−êng cong sigma
(h×nh 11.3).
§iÖn di kh«ng nh÷ng cã thÓ ph©n t¸ch c¸c ®o¹n ADN kh¸c nhau vÒ kÝch th−íc mµ
c¶ vÒ h×nh d¹ng vµ cÊu h×nh cña chóng. C¸c ph©n tö ADN ë d¹ng m¹ch vßng duçi xo¾n
hoÆc bÞ “®øt g·y” ë mét sè nucleotide di chuyÓn chËm h¬n trªn tr−êng ®iÖn di so víi c¸c
ph©n tö ADN ë d¹ng m¹ch th¼ng cã cïng khèi l−îng. Trong khi ®ã, c¸c ph©n tö ADN ë
d¹ng siªu xo¾n (kÝch th−íc thu nhá) th−êng di chuyÓn nhanh h¬n trªn tr−êng ®iÖn di so
víi c¸c ph©n tö ADN d¹ng m¹ch vßng duçi xo¾n hoÆc cã møc ®é cuén xo¾n thÊp h¬n cã
cïng khèi l−îng.
Kü thuËt ®iÖn di còng ®−îc dïng ®Ó ph©n t¸ch ARN. Gièng ADN, c¸c ph©n tö ARN
còng tÝch ®iÖn ©m. Tuy nhiªn, nÕu nh− c¸c ®o¹n ADN sîi kÐp th¼ng th−êng cã cÊu tróc
bËc hai ®ång nhÊt (nªn tèc ®é dÞch chuyÓn trªn tr−êng ®iÖn di t−¬ng quan víi khèi l−îng
cña chóng), th× ARN ngoµi cÊu tróc m¹ch ®¬n, cßn cã c¸c cÊu tróc bËc 2 vµ 3 ¶nh h−ëng
®Õn tèc ®é dÞch chuyÓn cña chóng trªn tr−êng ®iÖn di. §Ó h¹n chÕ ®iÒu nµy, ng−êi ta
th−êng xö lý ARN víi mét sè hãa chÊt ph¸ vì liªn kÕt côc bé trong ph©n tö, nh− glyoxal.
Hîp chÊt nµy liªn kÕt vµo nhãm -NH2 cña c¸c baz¬ nit¬ vµ ng¨n c¶n sù kÕt cÆp gi÷a
chóng. C¸c ARN ®−îc xö lý glyoxal kh«ng h×nh thµnh c¸c cÊu tróc bËc cao, nªn tèc ®é di
chuyÓn trªn tr−êng ®iÖn di phô thuéc chñ yÕu vµo khèi l−îng ph©n tö cña chóng. ë phÇn
sau cña ch−¬ng nµy, chóng ta sÏ thÊy kü thuËt ®iÖn di còng ®−îc dïng phæ biÕn trong
ph©n tÝch protein.

11.2.4. Sö dông enzym giíi h¹n trong ph©n tÝch ADN


HÇu hÕt c¸c ph©n tö ADN trong tù nhiªn ®Òu lín h¬n nhiÒu so víi kÝch th−íc cã
thÓ thao t¸c thuËn lîi trong phßng thÝ nghiÖm. Trong tÕ bµo, phÇn lín NST lµ mét ph©n
tö ADN chøa hµng tr¨m, thËm chÝ hµng ngh×n gen kh¸c nhau. V× vËy, ®Ó ph©n lËp vµ
ph©n tÝch tõng gen, ng−êi ta th−êng ph¶i c¾t c¸c ph©n tö ADN kÝch th−íc lín thµnh c¸c
®o¹n nhá. C«ng viÖc nµy ®−îc thùc hiÖn bëi mét nhãm enzym ®Æc biÖt gäi lµ c¸c enzym
giíi h¹n.
TÊt c¶ c¸c enzym giíi h¹n ®Òu cã hai ®Æc tÝnh: 1) nhËn biÕt mét tr×nh tù ®Æc hiÖu
trªn ADN (gäi lµ vÞ trÝ giíi h¹n); vµ 2) c¾t trong ph©n tö ADN t¹i vÞ trÝ ®Æc hiÖu (hoÆc
ngay t¹i vÞ trÝ giíi h¹n nh− c¸c enzym giíi h¹n lo¹i II, hoÆc c¸ch vÞ trÝ giíi h¹n mét sè
nucleotide nhÊt ®Þnh nh− c¸c enzym giíi h¹n lo¹i I, III vµ IV). Trong kü thuËt di truyÒn,
c¸c enzym giíi h¹n lo¹i II (chiÕm kho¶ng 40%) ®−îc dïng phæ biÕn h¬n c¶ v× tr×nh tù
ADN t¹i vÞ trÝ c¾t cña chóng lµ x¸c ®Þnh. C¸c vÞ trÝ giíi h¹n cña nhãm enzym nµy th−êng
gåm 4 - 8 bp, th−êng cã tÝnh ®èi xøng vµ ®iÓm c¾t trong tr×nh tù giíi h¹n. VÝ dô nh−
EcoRI t×m thÊy ë E. coli cã tr×nh tù giíi h¹n lµ 5’-G↓AATTC-3’ víi vÞ trÝ c¾t ë gi÷a G vµ
A. Tªn enzym gåm 3 ký tù ®Çu chØ tªn loµi vi khuÈn tõ ®ã enzym ®−îc t×m ra (Eco =
Escherichia coli), c¸c ký tù sau chØ chñng vi khuÈn (vÝ dô: R) vµ sè thø tù enzym ®−îc
thÊy ë vi khuÈn ®ã (EcoRI lµ enzym giíi h¹n ®Çu tiªn ph¸t hiÖn ®−îc ë E. coli).
Mét enzym giíi h¹n cã tr×nh tù giíi h¹n gåm 6 bp gièng nh− EcoRI th−êng ®−îc
tr«ng ®îi cã trung b×nh mét vÞ trÝ c¾t trong mçi ®o¹n ADN cã kÝch th−íc kho¶ng 4 kb (bëi
theo x¸c suÊt, t¹i mét vÞ trÝ nhÊt ®Þnh trªn ADN, x¸c suÊt ®Ó cã mét lo¹i nucleotide nhÊt

327
§inh §oµn Long

®Þnh lµ 1/4, v× vËy x¸c suÊt ®Ó cã mét tr×nh tù nhÊt ®Þnh gåm 6 bp sÏ lµ 1/46 = 1/4096).
Nãi c¸ch kh¸c, kÝch th−íc trung b×nh cña c¸c ®o¹n ADN ®−îc c¾t bëi EcoRI lµ 4096 bp.
Gi¶ sö mét ph©n tö ADN m¹ch th¼ng cã 6 vÞ trÝ c¾t cña EcoRI, th× ph©n tö nµy sau khi
®−îc xö lý víi enzym sÏ cho 7 ph©n ®o¹n ADN kh¸c nhau. Trªn tr−êng ®iÖn di, s¶n phÈm
c¾t gåm 7 ph©n ®o¹n ADN nµy sÏ ph©n t¸ch nhau ra do kh¸c nhau vÒ khèi l−îng.
ViÖc sö dông mét enzym giíi h¹n kh¸c, ch¼ng h¹n HindIII còng cã tr×nh tù giíi h¹n
gåm 6 bp, nh−ng cã tr×nh tù giíi h¹n thay ®æi (5’-A↓AGCTT-3’) sÏ cho ra c¸c s¶n phÈm
c¾t kh¸c víi khi sö dông EcoRI. Víi mét sè enzym giíi h¹n kh¸c, ch¼ng h¹n nh− Sau3AI
(t×m thÊy ë vi khuÈn Staphylococcus aureus) cã tr×nh tù giíi h¹n ng¾n h¬n (5’-GA↓TC-
3’), nªn tÇn sè c¾t cña chóng th−êng cao h¬n c¸c enzym cã tr×nh tù giíi h¹n dµi. Theo x¸c
suÊt, c¸c ®o¹n ADN sîi kÐp ®−îc Sau3AI c¾t cã kÝch th−íc trung b×nh kho¶ng 250 bp
(1/44 = 1/256). Ng−îc l¹i, enzym NotI cã tr×nh tù giíi h¹n dµi (5’-GC↓GGCCGC-3’) t¹o ra
c¸c ®o¹n c¾t trung b×nh dµi 65 kb (1/48 = 1/65.536). Nh− vËy, viÖc sö dông ®ång thêi
nhiÒu enzym giíi h¹n sÏ t¹o ra mét phæ c¸c kiÓu h×nh ®iÖn di ®Æc thï ®èi víi mçi gen
®−îc ph©n tÝch.
C¸c enzym giíi h¹n kh«ng chØ kh¸c nhau vÒ tr×nh tù giíi h¹n vµ ®é dµi ®o¹n tr×nh
tù giíi h¹n ®Æc tr−ng cña chóng, mµ cßn kh¸c nhau vÒ c¸ch “c¾t” ph©n tö ADN. Ch¼ng
h¹n nh− Sau3AI nªu trªn t¹o ra c¸c ph©n tö ADN d¹ng ®Çu b»ng (®Çu tï), cßn c¸c
enzym EcoRI, HindIII vµ NotI c¾t ph©n tö ADN t¹o ra c¸c ph©n ®o¹n cã ®Çu dÝnh. Së dÜ
gäi lµ “®Çu dÝnh” v× hai ®Çu ph©n tö ADN sau khi ®−îc enzym c¾t cã tr×nh tù bæ sung víi
nhau theo nguyªn t¾c Chargaff; v× vËy, chóng cã xu h−íng “dÝnh” l¹i víi nhau, hoÆc
“dÝnh” víi c¸c ph©n tö ADN kh¸c ®−îc c¾t bëi cïng enzym giíi h¹n. TÝnh chÊt nµy ®−îc
dïng trong nh©n dßng ph©n tö vµ ADN t¸i tæ hîp. Mét sè enzym giíi h¹n kh¸c c¾t ®Æc
hiÖu ADN m¹ch ®¬n.

11.2.5. C¸c ph−¬ng ph¸p lai axit nucleic vµ mÉu dß


Nh− ®· nªu ë ch−¬ng 2 (môc 2.1.4.3), c¸c ph©n tö ADN sîi kÐp cã tÝnh chÊt ®Æc biÖt
lµ kh¶ n¨ng biÕn tÝnh (t¸ch thµnh hai m¹ch ®¬n) vµ håi tÝnh (hai m¹ch ®¬n cã tr×nh tù bæ
sung liªn kÕt trë l¹i khi lo¹i bá c¸c yÕu tè g©y biÕn tÝnh). Kh¶ n¨ng liªn kÕt bæ sung gi÷a
c¸c baz¬ nit¬ cho phÐp hai m¹ch ADN cã nguån gèc kh¸c nhau nh−ng cã tr×nh tù bæ trî
liªn kÕt víi nhau trong ®iÒu kiÖn phï hîp (vÒ nhiÖt ®é, ®é pH, …) ®Ó t¹o nªn mét ph©n tö
ADN míi. HiÖn t−îng liªn kÕt nh− vËy cã thÓ x¶y ra gi÷a hai m¹ch ADN víi nhau, hoÆc
gi÷a hai m¹ch ARN hoÆc gi÷a ADN vµ ARN. Ph©n tö axit nucleic sîi kÐp míi h×nh thµnh
®−îc gäi lµ ph©n tö lai vµ qu¸ tr×nh kÕt cÆp gi÷a c¸c baz¬ thuéc hai m¹ch ®¬n axit
nucleic cã nguån gèc kh¸c nhau theo nguyªn t¾c bæ sung nh− vËy ®−îc gäi lµ qu¸ tr×nh
lai ph©n tö.
NhiÒu nghiªn cøu di truyÒn ph©n tö hiÖn nay dùa trªn ph−¬ng ph¸p lai ph©n tö. VÝ
dô: b»ng ph−¬ng ph¸p nµy, ng−êi ta cã thÓ dïng mét ®o¹n ADN cã tr×nh tù biÕt tr−íc, gäi
lµ mÉu dß, ®Ó x¸c ®Þnh mét tr×nh tù bæ sung t−¬ng øng cã trong hÖ gen ®−îc quan t©m
nghiªn cøu. C¸c mÉu dß cã thÓ cã nguån gèc tù nhiªn hoÆc ®−îc tæng hîp hãa häc; ®Ó dÔ
ph¸t hiÖn, c¸c mÉu dß th−êng ®−îc ®¸nh dÊu bëi chÊt phãng x¹ hoÆc chÊt ph¸t quang.
Cã hai ph−¬ng ph¸p ®¸nh dÊu mÉu dß ADN. Ph−¬ng ph¸p thø nhÊt dùa trªn
nguyªn t¾c tæng hîp hãa häc ADN sö dông tiÒn chÊt lµ c¸c ph©n tö ®−îc ®¸nh dÊu phãng
x¹ hoÆc ph¸t quang. Ph−¬ng ph¸p thø hai dùa trªn nguyªn t¾c g¾n mét ph©n tö ®¸nh
dÊu vµo ®u«i cña mét tr×nh tù ADN cã s½n. VÝ dô, nhê sö dông enzym polynucleotide
kinase, ng−êi ta cã thÓ g¾n nhãm γ cña ATP vµo nhãm 5’-OH cña ®o¹n ADN lµm mÉu
dß. NÕu nhãm γ nµy ®−îc ®¸nh dÊu b»ng ®ång vÞ 32P th× ADN mÉu dß sÏ ph¸t phãng x¹.
Trong ph−¬ng ph¸p cßn l¹i (sö dông c¸c tiÒn chÊt ®¸nh dÊu), ng−êi ta cã thÓ thùc hiÖn
ph¶n øng PCR víi mét trong 4 tiÒn chÊt dNTP ®−îc ®¸nh dÊu víi chÊt ph¸t quang hoÆc

328
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

phãng x¹. Trong ph−¬ng ph¸p nµy, chØ cÇn 25% nucleotide cña mÉu dß ADN ®−îc ®¸nh
dÊu lµ ®ñ ®Ó ph©n tÝch.
C¸c mÉu dß ADN ®−îc ®¸nh dÊu b»ng chÊt ph¸t quang cã thÓ ph¸t hiÖn d−íi nguån
s¸ng UV, cßn c¸c mÉu dß ®¸nh dÊu phãng x¹ ®−îc ph¸t hiÖn b»ng ph−¬ng ph¸p phãng x¹
tù chôp nhê phim tia X, hoÆc ®o b»ng m¸y khuÕch ®¹i tÝn hiÖu h¹t β víi hai ®ång vÞ
phãng x¹ ®−îc dïng phæ biÕn lµ 32P vµ 35S. Cã nhiÒu c¸ch ®Ó x¸c ®Þnh c¸c ph©n ®o¹n ADN
vµ ARN ®Æc hiÖu dùa trªn lai ph©n tö. D−íi ®©y, chóng ta chØ ®Ò cËp ®Õn hai ph−¬ng
ph¸p phæ biÕn.

11.2.5.1. X¸c ®Þnh c¸c ®o¹n ADN b»ng ®iÖn di vµ mÉu dß - lai Southern
Sö dông mÉu dß kÕt hîp víi ®iÖn di lµ ph−¬ng ph¸p c¬ b¶n ®ång thêi cã thÓ gióp
x¸c ®Þnh møc ®é phæ biÕn vµ kÝch th−íc cña mét ®o¹n ADN hoÆc ARN ®−îc quan t©m
nghiªn cøu. VÝ dô: b»ng ph−¬ng ph¸p nµy, ng−êi ta cã thÓ x¸c ®Þnh vµ so s¸nh ®−îc møc
biÓu hiÖn cña mét gen ë c¸c lo¹i m« vµ tÕ bµo qua viÖc x¸c ®Þnh sè l−îng b¶n phiªn m·
mARN t−¬ng øng cña gen cã t¹i mçi lo¹i m« vµ tÕ bµo t−¬ng øng.
Gi¶ sö chóng ta c¾t hÖ gen cña nÊm men b»ng EcoRI vµ cÇn x¸c ®Þnh kÝch th−íc
cña ®o¹n ADN mang tr×nh tù gen A. ADN tæng sè sau khi ®−îc c¾t b»ng EcoRI sÏ t¹o nªn
mét hçn hîp c¸c ph©n ®o¹n cã kÝch th−íc trung b×nh 4 kb (v× 46 = 4.096 bp). V× vËy, nÕu
®em s¶n phÈm c¾t giíi h¹n nhuém víi EtBr, th× s¶n phÈm ®iÖn di sÏ lµ mét d¶i c¸c ®o¹n
liªn tôc cã kÝch th−íc quanh vïng 4 kb vµ kh«ng thÓ x¸c ®Þnh ®−îc chÝnh x¸c ph©n ®o¹n
nµo mang gen A. Trong tr−êng hîp nµy, kü thuËt lai Southern (cßn gäi lµ thÈm t¸ch
Southern) cã thÓ ®−îc dïng ®Ó x¸c ®Þnh ®o¹n ADN mang gen ®ã (h×nh 11.4). Ng−êi ta
mang gel ®iÖn di chøa c¸c s¶n phÈm c¾t ng©m vµo dung dÞch kiÒm nhÑ ®Ó lµm biÕn tÝnh
ADN. Råi c¸c ®o¹n ADN ®−îc chuyÓn sang mét mµng tÝch ®iÖn d−¬ng gäi lµ mµng lai
theo kiÓu “®ãng dÊu”. NghÜa lµ c¸c ®o¹n ADN ®Þnh vÞ trªn mµng lai sÏ t−¬ng øng víi c¸c
®o¹n ADN trªn gel ®iÖn di. Mµng lai sau ®ã ®−îc ñ víi mÉu dß cã tr×nh tù ADN bæ sung
víi tr×nh tù cña gen A. Qu¸ tr×nh ñ ®−îc tiÕn hµnh trong ®iÒu kiÖn nhiÖt ®é vµ nång ®é
muèi phï hîp cho sù håi tÝnh cña axit nucleic. Trong ®iÒu kiÖn ®ã, c¸c mÉu dß sÏ chØ t¹o
liªn kÕt ®Æc hiÖu víi ph©n ®o¹n ADN mang gen A. Do c¸c ®o¹n gen th−êng cã kÝch th−íc
lín h¬n nhiÒu so víi mÉu dß, nªn kh¶ n¨ng håi tÝnh cña c¸c ®o¹n gen sÏ khã x¶y ra h¬n
so víi “ph¶n øng”
lai gi÷a mÉu dß víi a) C¸c b−íc trong ph−¬ng ph¸p lai Southern
gen. C¸c ®o¹n ADN C¸c mÉu dß ADN ®−îc ®¸nh
dÊu phãng x¹ hoÆc ph¸t quang VÞ trÝ ®o¹n ADN
mang tr×nh tù gen lai víi mÉu dß
cÇn nghiªn cøu sau ADN C¸c ®o¹n ADN
®ã ®−îc ph¸t hiÖn
vµ ph©n lËp nhê c¸c
C¾t b»ng §iÖn di
ph−¬ng ph¸p ph¸t enzym giíi h¹n Lai vµ röa
hiÖn mÉu dß ®· nªu mÉu dß
ë trªn. thõa
Mét ph−¬ng
BiÕn tÝnh ADN vµ
ph¸p c¶i tiÕn cña lai chuyÓn lªn mµng lai
Southern ®−îc dïng
®Ó x¸c ®Þnh vïng b) B−íc chuyÓn ADN tõ gel ®iÖn di sang mµng lai
Qu¶ nÆng
m· hãa (exon) cña
gen ®−îc gäi lµ
ph−¬ng ph¸p lai
Zoo. Ph−¬ng ph¸p Dung dÞch ®Öm Mµng lai
GiÊy läc
Gel
lai nµy dùa trªn H×nh 11.4. Ph−¬ng ph¸p
hiÖn t−îng lµ trong lai (thÈm t¸ch) Southern.

329
§inh §oµn Long

qu¸ tr×nh tiÕn hãa, c¸c tr×nh tù nucleotide trong c¸c vïng kh«ng m· hãa th−êng biÕn ®æi
nhanh h¬n so víi c¸c vïng m· hãa ë cïng mét gen, khi so s¸nh gi÷a c¸c loµi cã quan hÖ
gÇn gòi. Ch¼ng h¹n, ë mét nghiªn cøu, ng−êi ta t¸ch chiÕt ADN tõ mét nhãm c¸c loµi
kh¸c nhau gåm ng−êi, v−în, khØ, chuét, bß, v.v... ADN cña mçi loµi sau ®ã ®−îc c¾t bëi
cïng enzym giíi h¹n phï hîp; råi c¸c ®o¹n c¾t ®−îc ph©n t¸ch trªn ®iÖn di vµ chuyÓn lªn
mµng lai. C¸c ®o¹n ADN nµy sau ®ã ®−îc lai víi mÉu dß cã nguån gèc ng−êi ®−îc “gi¶
thiÕt” lµ tr×nh tù m· hãa. NÕu ®ã thùc sù lµ tr×nh tù m· hãa th× ph¶n øng lai sÏ x¶y ra
víi tÊt c¶ hoÆc hÇu hÕt c¸c mÉu ADN; nÕu kh«ng, nhiÒu kh¶ n¨ng tr×nh tù t−¬ng øng víi
mÉu dß kh«ng ph¶i lµ tr×nh tù m· hãa.
11.2.5.2. X¸c ®Þnh c¸c ®o¹n ARN b»ng ®iÖn di vµ mÉu dß - lai Northern
Víi cïng nguyªn t¾c, mét ph−¬ng ph¸p lai ®−îc dïng ®Ó ph©n tÝch s¶n phÈm phiªn
m· mARN ®−îc gäi lµ ph−¬ng ph¸p lai Northern (hay thÈm t¸ch Northern). Tuy
nhiªn, v× mARN th−êng ng¾n h¬n nhiÒu so víi ADN, nªn trong lai Northern, kh«ng cÇn
c¾t mARN. Hçn hîp mARN sau khi ph©n t¸ch b»ng ®iÖn di ®−îc chuyÓn lªn mµng lai víi
mÉu dß ADN t−¬ng øng víi ®o¹n mARN ®−îc t×m kiÕm. S¶n phÈm lai ë ®©y lµ
ARN/ADN.
Trong thùc tiÔn, lai Northern th−êng ®−îc dïng ®Ó ®Þnh l−îng mét lo¹i ph©n tö
mARN nµo ®ã cã trong mÉu ph©n tÝch h¬n lµ ®Ó x¸c ®Þnh kÝch th−íc cña nã. §Ó ®Þnh
l−îng mARN, mÉu dß th−êng ®−îc ®−a vµo ph¶n øng lai víi mét l−îng d− võa ®ñ nh»m
®¶m b¶o l−îng ph©n tö lai t¹o thµnh tØ lÖ thuËn víi l−îng mARN. L−îng mARN cã trong
m« ®−îc coi lµ th«ng sè ph¶n ¸nh møc ®é biÓu hiÖn cña gen t−¬ng øng. Ch¼ng h¹n, b»ng
lai Northern, c¸c nhµ nghiªn cøu cã thÓ ®¸nh gi¸ ®−îc ¶nh h−ëng cña mét yÕu tè phiªn
m· tíi sù biÓu hiÖn cña gen nhÊt ®Þnh khi so s¸nh l−îng mARN do gen ®ã m· hãa cã
trong c¸c m« ®−îc xö lý vµ kh«ng ®−îc xö lý víi yÕu tè phiªn m·. T−¬ng tù nh− vËy, kü
thuËt nµy cho phÐp so s¸nh møc ®é biÓu hiÖn cña gen ë c¸c giai ®o¹n ph¸t triÓn kh¸c
nhau cña c¬ thÓ.

11.2.5.3. Ph−¬ng ph¸p lai vi d·y (microarray)


Nguyªn lý cña c¸c ph−¬ng ph¸p lai Southern còng chÝnh lµ c¬ së cña kü thuËt
ph©n tÝch ADN b»ng vi d·y (DNA microarray) ®−îc ph¸t triÓn vµ ngµy cµng ®−îc
dïng réng r·i trong c¸c nghiªn cøu di truyÒn ë cÊp ph©n tö. Trong ph−¬ng ph¸p lai vi
d·y, c¸c mÉu dß th−êng lµ c¸c ®o¹n cADN ®−îc t¹o ra tõ phiªn m· ng−îc c¸c mARN
t−¬ng øng ®−îc t¸ch chiÕt tõ c¸c m« hoÆc tÕ bµo. C¸c mÉu dß nµy sau ®ã ®−îc dïng ®Ó lai
víi mét d·y “giÕng thö” chøa c¸c ph©n tö ADN ®−îc t¸ch chiÕt tõ c¸c mÉu sinh vËt kh¸c
nhau, trong ®ã mçi d·y th−êng ®−îc bæ sung mÉu dß liªn quan ®Õn mét hoÆc mét sè gen
nhÊt ®Þnh. C−êng ®é biÓu hiÖu cña s¶n phÈm lai (®o ®−îc qua mÉu dß) ë mçi d·y vµ ®èi
chiÕu gi÷a c¸c d·y gióp ph¶n ¸nh møc ®é biÓu hiÖn cña gen trong c¸c ®iÒu kiÖn hoÆc ë
c¸c mÉu sinh vËt kh¸c nhau.

11.2.5.4. Lai huúnh quang t¹i chç - FISH


NÕu nh− c¸c ph−¬ng ph¸p lai ®−îc nªu ë trªn ®Òu cÇn t¸ch chiÕt ADN vµ ARN tõ tÕ
bµo, th× ph−¬ng ph¸p lai huúnh quang t¹i chç, ®−îc gäi t¾t lµ lai FISH (fluorescence in
situ hybridization), sö dông mÉu dß ®Ó ph¸t hiÖn trùc tiÕp sù cã mÆt cña mét gen hay
b¶n phiªn m· mARN cña nã trong tÕ bµo mµ kh«ng cÇn qua b−íc t¸ch chiÕt axit nucleic
(h×nh 11.5). Trong b−íc ®Çu tiªn, mÉu dß cã tr×nh tù t−¬ng øng víi gen quan t©m ®−îc
t¹o ra hoÆc b»ng kü thuËt nh©n dßng ph©n tö hoÆc b»ng PCR. Th−êng th× chØ mét phÇn
tr×nh tù ADN cña gen lµ ®ñ ®Ó lµm mÉu dß. Trong ph−¬ng ph¸p nµy, c¸c mÉu dß lu«n
®−îc ®¸nh dÊu b»ng chÊt ph¸t quang ®Ó sau qu¸ tr×nh lai chóng dÔ dµng ®−îc ph¸t hiÖn
b»ng kÝnh hiÓn vi huúnh quang. Gièng c¸c ph−¬ng ph¸p lai kh¸c, trong lai FISH, ADN

330
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

vµ ARN còng cÇn ®−îc g©y biÕn


tÝnh; nh−ng, viÖc g©y biÕn tÝnh MÉu dß ADN ChÊt ph¸t quang
®−îc thùc hiÖn ngay trªn c¸c
mÉu m« vµ tÕ bµo nªn ADN
®−îc duy tr× t¹i chç (in situ)
trong nh©n tÕ bµo. §Ó thùc hiÖn BiÕn tÝnh Quan s¸t b»ng kÝnh
vµ trén hiÓn vi huúnh quang
"ph¶n øng" lai, c¸c mÉu m« ®−îc
c¾t thµnh c¸c l¸t máng nhê dao
c¾t chuyªn dông (microtome)
tr−íc khi ®−îc chuyÓn vµo dung H×nh 11.5. Ph−¬ng ph¸p lai huúnh quang t¹i chç (FISH).
dÞch biÕn tÝnh vµ lai víi mÉu dß.
Mét sè øng dông c¬ b¶n cña ph−¬ng ph¸p lai FISH cã thÓ kÓ ®Õn nh− sau:
1) Cã thÓ sö dông mét sè tr×nh tù gen cña virut lµm mÉu dß ®Ó x¸c ®Þnh xem tÕ
bµo cã mang c¸c gen cña virut hay kh«ng, còng nh− ®Ó x¸c ®Þnh gen cña mét
virut nµo ®ã chØ giíi h¹n trong tÕ bµo chÊt hay th©m nhËp ®−îc vµo trong nh©n
tÕ bµo chñ.
2) Bªn c¹nh ADN trong nh©n tÕ bµo, lai FISH cã thÓ dïng ®Ó x¸c ®Þnh vÞ trÝ cña mét
gen trªn NST th«ng qua viÖc lai mÉu dß víi tÕ bµo ë kú gi÷a cña nguyªn ph©n.
3) MÉu dß ADN cã thÓ dïng ®Ó ph¸t hiÖn mét lo¹i mARN cã trong mét m« nhÊt
®Þnh. Do mARN th−êng ë d¹ng m¹ch ®¬n nªn mÉu m« kh«ng cÇn ph¶i g©y biÕn
tÝnh bëi nhiÖt ®é cao hay hãa chÊt. C¸c tÕ bµo ®ang phiªn m· vµ tæng hîp m¹nh
lo¹i mARN ®−îc quan t©m nghiªn cøu sÏ cã mËt ®é liªn kÕt mÉu dß cao vµ ph¸t
quang m¹nh. Gen biÓu hiÖn cµng m¹nh, th× tÕ bµo ph¸t quang cµng s¸ng. ViÖc so
s¸nh c¸c mÉu nh− vËy tõ c¸c m« kh¸c nhau cã thÓ gióp x¸c ®Þnh chøc n¨ng cña
mét gen nhÊt ®Þnh. Tuy vËy, trong mét sè tr−êng hîp gen nghiªn cøu thuéc
nhãm lu«n biÓu hiÖn yÕu (chØ cã vµi b¶n sao mARN trong mçi tÕ bµo), th× tÝn
hiÖu FISH th−êng yÕu vµ kh«ng ®ñ ®Ó ph©n tÝch. Lóc nµy, viÖc ph¸t hiÖn mARN
®−îc thùc hiÖn bëi mét sè ph−¬ng ph¸p nh¹y h¬n,nh− ph−¬ng ph¸p PCR ®Þnh
l−îng (RT-PCR) hoÆc microarray.
Nh»m t¨ng c−êng hiÖu qu¶ cña ph−¬ng ph¸p lai FISH, mét sè mÉu dß cã thiÕt kÕt
®Æc biÖt ®−îc gäi lµ nhÊp nh¸y ph©n tö (molecular beacon). §©y lµ lo¹i mÉu dß chØ ph¸t
quang sau khi ®· liªn kÕt vµo tr×nh tù ADN ®Ých. MÉu dß nhÊp nh¸y ph©n tö th−êng
mang hai “gèc”: mét “gèc” ph¸t quang, gäi lµ nh©n ph¸t quang (fluorophore), ë mét ®Çu
ph©n tö; cßn ®Çu kia mang “gèc” øc chÕ sù ph¸t quang,
gäi lµ nh©n t¾t quang (quenching group). Mçi mÉu ADN
dß nhÊp nh¸y ph©n tö cã tr×nh tù trung t©m dµi MÉu dß nhÊp
kho¶ng 20 – 30 nucleotide bæ sung víi tr×nh tù gen cÇn nh¸y ph©n tö
ph©n tÝch. Ngoµi ra, ë hai ®Çu nã cã hai tr×nh tù gåm
kho¶ng 6 baz¬ nit¬ bæ sung víi nhau. Khi mÉu dß ë PT
d¹ng tù do (kh«ng liªn kÕt víi tr×nh tù gen ®Ých), hai
®Çu mÉu dß t¹o liªn kÕt Chargaff víi nhau, dÉn ®Õn
viÖc nh©n t¾t quang tiÕp xóc ®−îc víi nh©n ph¸t Lai víi mÉu dß
quang vµ øc chÕ sù ph¸t quang cña mÉu dß (h×nh Nh©n t¾t quang (T)
11.6). Khi mÉu dß ®· liªn kÕt vµo tr×nh tù ADN ®Ých, Nh©n ph¸t
T
tr×nh tù mÉu dß ®−îc duçi th¼ng, nªn nh©n t¾t quang P quang (P) tù do
kh«ng tiÕp xóc vµ øc chÕ ®−îc sù ph¸t quang cña nh©n
ph¸t quang. V× vËy, mÉu dß sÏ ph¸t quang m¹nh. Tuy Ph©n tö lai ADN – mÉu dß
nhiªn, ®iÒu cÇn l−u ý khi sö dông mÉu dß nhÊp nh¸y H×nh 11.6. Nguyªn t¾c lai ADN
ph©n tö lµ cÇn duy tr× tÝnh æn ®Þnh cña c¸c ®o¹n bæ dïng mÉu dß nhÊp nh¸y ph©n tö.

331
§inh §oµn Long

sung ng¾n ë hai ®Çu, v× nhiÖt ®é cao cã thÓ g©y biÕn tÝnh ®o¹n nµy vµ dÉn ®Õn hiÖn t−îng
"d−¬ng tÝnh gi¶".

11.2.6. Nh©n dßng ph©n tö vµ x©y dùng ng©n hµng gen

11.2.6.1. Mét sè kh¸i niÖm chung


Nh©n dßng ph©n tö (molecular cloning) chØ mét nhãm c¸c ph−¬ng ph¸p nh»m: (1)
ph©n lËp mét ®o¹n gen (ADN) ®Æc hiÖu tõ hçn hîp c¸c ph©n tö ADN ban ®Çu ®−îc t¸ch
chiÕt tõ c¸c mÉu sinh häc cã thµnh phÇn phøc t¹p; vµ (2) nh©n b¶n ®o¹n tr×nh tù ADN
®−îc quan t©m lªn mét l−îng ®ñ lín ®Ó cã thÓ tiÕn hµnh ph©n tÝch vÒ cÊu tróc vµ chøc
n¨ng gen t−¬ng øng.
ViÖc tinh s¹ch c¸c ®o¹n ADN ®Æc hiÖu ®¹t l−îng ®ñ lín lµ cÇn thiÕt ®Ó thùc hiÖn c¸c
b−íc nghiªn cøu tiÕp theo. Ch¼ng h¹n, tõ ®o¹n ADN ®−îc tinh s¹ch, ng−êi ta cã thÓ t¹o
nªn c¸c ph©n tö ADN t¸i tæ hîp. C¸c ph©n tö ADN t¸i tæ hîp míi cã thÓ lµm thay ®æi
møc biÓu hiÖn cña mét gen (ch¼ng h¹n, khi mét tr×nh tù m· hãa cña loµi nµy ®−îc “ghÐp”
víi promoter cña loµi kh¸c) hoÆc thËm chÝ tæng hîp nªn mét protein “dung hîp” míi
(protein lai) chøa tr×nh tù axit amin cã nguån gèc tõ c¸c loµi kh¸c nhau. Qu¸ tr×nh nh©n
dßng ph©n tö vµ t¹o ra ph©n tö ADN hoÆc protein t¸i tæ hîp th−êng liªn quan ®Õn c¸c
vect¬ nh©n dßng hoÆc c¸c vect¬ biÓu hiÖn. “C«ng cô” chÝnh ®Ó t¹o ADN t¸i tæ hîp lµ
c¸c enzym giíi h¹n gióp c¾t ADN t¹i c¸c vÞ trÝ x¸c ®Þnh vµ ghÐp nèi c¸c ®o¹n ADN cã
nguån gèc kh¸c nhau t¹i c¸c vÞ trÝ mong muèn. B»ng viÖc t¹o nªn c¸c ph©n tö ADN t¸i tæ
hîp cã kh¶ n¨ng tù sao chÐp trong tÕ bµo chñ, ®o¹n ADN cµi dÔ dµng ®−îc nh©n lªn
thµnh mét l−îng lín b¶n sao.
D−íi ®©y, chóng ta sÏ m« t¶ b»ng c¸ch nµo c¸c ph©n tö ADN ®−îc c¾t, t¸i tæ hîp vµ
nh©n lªn, ®ång thêi còng ®Ò cËp ®Õn viÖc x©y dùng th− viÖn hÖ gen gåm tËp hîp c¸c
dßng tÕ bµo mang c¸c ®o¹n ADN kh¸c nhau cña mét hÖ gen gióp ph©n tÝch chøc n¨ng
cña mçi gen, còng nh− ®Ó sö dông chóng trong c¸c øng dông cña di truyÒn häc.
11.2.6.2. Nh©n dßng ADN nhê vect¬ plasmid
Sau khi mét ®o¹n ADN ®−îc c¾t khái mét ph©n tö ADN cã kÝch th−íc lín h¬n b»ng
enzym giíi h¹n, ®o¹n ADN ®ã cÇn ®−îc “cµi” vµo mét vect¬ ®Ó cã thÓ nh©n lªn. §Õn nay,
tÕ bµo chñ ®−îc dïng réng r·i nhÊt trong c«ng nghÖ ADN t¸i tæ hîp lµ vi khuÈn E. coli.
C¸c vect¬ nh©n dßng ADN ®iÓn h×nh th−êng cã 3 ®Æc tÝnh:
1) Chóng ph¶i cã mét tr×nh tù khëi ®Çu sao chÐp (vÝ trÝ t¸i b¶n), gióp ph©n tö ADN
t¸i tæ hîp cã thÓ tù sao chÐp ®éc lËp víi NST cña tÕ bµo chñ.
2) Chóng ph¶i mang mét dÊu chuÈn chän läc cho phÐp ph©n biÖt ®−îc c¸c tÕ bµo
mang vect¬ t¸i tæ hîp vµ c¸c tÕ bµo kh«ng mang vect¬ t¸i tæ hîp.
3) Chóng th−êng cã vÞ trÝ c¾t cña mét hay nhiÒu enzym giíi h¹n kh¸c nhau. §©y
chÝnh lµ vÞ trÝ cµi cña ph©n ®o¹n ADN cÇn nh©n dßng vµo vect¬.
Vect¬ nh©n dßng phæ biÕn nhÊt lµ c¸c ph©n tö ADN sîi kÐp, m¹ch vßng, kÝch th−íc
nhá (kho¶ng 3 Kb) cã nguån gèc tõ c¸c plasmid vi khuÈn, mét sè tõ nÊm men. Trong
nhiÒu tr−êng hîp, c¸c ph©n tö ADN nµy vèn cã s½n hai thuéc tÝnh tù nhiªn, ®ã lµ: (1) kh¶
n¨ng tù sao chÐp trong tÕ bµo chñ, vµ (2) mang gen kh¸ng kh¸ng sinh; gen nµy ®−îc
dïng lµm dÊu hiÖu chän läc. Ngoµi ra, c¸c vect¬ plasmid cßn mét −u ®iÓm n÷a lµ chóng
cã thÓ nh©n lªn vµ tån t¹i thµnh nhiÒu b¶n sao trong mçi tÕ bµo. §iÒu nµy gióp dÔ dµng
nh©n b¶n vµ ph©n lËp ®−îc mét l−îng lín ®o¹n ADN cµi mµ chØ cÇn nu«i mét sè Ýt tÕ bµo
vi khuÈn.

332
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

C¸c vect¬ plasmid ®Çu tiªn chØ cã mét vÞ trÝ giíi h¹n duy nhÊt. Nh−ng cïng víi thêi
gian, cÊu tróc cña c¸c vect¬ plasmid ®−îc c¶i tiÕn theo h−íng bá bít c¸c tr×nh tù kh«ng
cÇn thiÕt vµ g¾n thªm ®o¹n tr×nh tù cã thÓ ®−îc c¾t b»ng nhiÒu enzym giíi h¹n kh¸c
nhau. Tr×nh tù mang nhiÒu vÞ trÝ giíi h¹n nh− vËy ®−îc gäi lµ tr×nh tù ®a nh©n dßng
(polycloning site). Cã nh÷ng tr×nh tù ®a nh©n dßng ®−îc thiÕt kÕ chØ dµi vµi tr¨m bp,
nh−ng cã trªn 20 vÞ trÝ giíi h¹n kh¸c nhau. Nhê ®Æc ®iÓm nµy, mét vect¬ cã thÓ ®−îc
dïng ®Ó nh©n dßng nhiÒu ®o¹n ADN kh¸c nhau. Dùa trªn nguyªn t¾c t−¬ng tù, ngoµi
vect¬ plasmid, ng−êi ta ®· ph¸t triÓn ®−îc c¸c lo¹i vect¬ kh¸c cã nguån gèc tõ phag¬,
hoÆc lµ ph©n tö lai gi÷a vi khuÈn vµ phag¬ (nh− phagemid, cosmid …), hoÆc cã nguån gèc
tõ nÊm men (vÝ dô: YAC).
ViÖc cµi mét ®o¹n ADN vµo vect¬ th−êng lµ c«ng viÖc t−¬ng ®èi ®¬n gi¶n. Ng−êi ta
sö dông cïng mét enzym giíi h¹n ®Ó c¾t vect¬ vµ ®o¹n ADN cµi. Ch¼ng h¹n, khi xö lý
vect¬ plasmid b»ng enzym EcoRI, vect¬ sÏ tõ d¹ng “vßng” chuyÓn sang d¹ng “th¼ng” víi
hai ®Çu dÝnh. Do ®−îc c¾t bëi cïng enzym, ®o¹n ADN cµi còng cã hai ®Çu dÝnh víi tr×nh
tù bæ sung víi tr×nh tù ®Çu dÝnh cña vect¬. C¸c ®Çu dÝnh cña vect¬ vµ ®o¹n ADN cµi
trªn c¬ së nguyªn t¾c Chargaff sÏ ®Ýnh kÕt víi nhau ®Ó t¹o nªn ph©n tö ADN t¸i tæ hîp
d¹ng vßng chØ cßn thiÕu mét liªn kÕt phosphodiester duy nhÊt ë mçi m¹ch. Liªn kÕt
cuèi cïng nµy ®−îc h×nh thµnh bëi enzym ADN ligase xóc t¸c. §Ó h¹n chÕ kh¶ n¨ng
“tù ®éng” g¾n kÕt trë l¹i gi÷a hai ®Çu dÝnh cña chÝnh vect¬, trong hçn hîp vect¬ vµ
®o¹n cµi, ng−êi ta th−êng cho d− thõa l−îng ADN cµi ®Ó t¨ng kh¶ n¨ng t¸i tæ hîp gi÷a
vect¬ vµ ®o¹n ADN cµi.
Mét sè lo¹i vect¬ kh«ng chØ cho phÐp nh©n dßng mét ®o¹n ADN cµi nµo ®ã, mµ cßn
cã thÓ ®iÒu khiÓn sù biÓu hiÖn cña gen trong ®o¹n ADN cµi. Nh÷ng vect¬ nh− vËy ®−îc
gäi lµ c¸c vect¬ biÓu hiÖn. C¸c vect¬ biÓu hiÖn th−êng ph¶i cã promoter n»m ng−îc
dßng so víi vÞ trÝ cµi gen. Vïng m· hãa cña gen cÇn ®−îc g¾n vµo vect¬ theo ®óng khung
®äc th× gen míi ®−îc biÓu hiÖn. C¸c vect¬ biÓu hiÖn th−êng ®−îc dïng ®Ó biÓu hiÖn c¸c
gen ®ét biÕn hoÆc c¸c gen lai nh»m ph©n tÝch chøc n¨ng cña chóng, hoÆc còng cã thÓ
®−îc dïng ®Ó s¶n xuÊt tËp trung mét lo¹i protein nµo ®ã vèn kh«ng thu ®−îc víi hiÖu
suÊt t−¬ng tù trong tù nhiªn. Ngoµi ra, promoter trong c¸c vect¬ biÓu hiÖn cã thÓ ®−îc
lùa chän sao cho sù biÓu hiÖn cña gen cµi cã thÓ ®−îc ®iÒu khiÓn b»ng viÖc bæ sung mét
chÊt ®¬n gi¶n vµo m«i tr−êng (ch¼ng h¹n nh− mét lo¹i ®−êng hay axit amin). ViÖc cã thÓ
®iÒu khiÓn chñ ®éng sù biÓu hiÖn cña mét gen nµo ®ã cã ý nghÜa quan träng trong nghiªn
cøu chøc n¨ng gen, nhÊt lµ víi c¸c gen g©y ®éc.
11.2.6.3. BiÕn n¹p c¸c vect¬ t¸i tæ hîp vµo tÕ bµo chñ
BiÕn n¹p lµ qu¸ tr×nh tÕ bµo chñ cã thÓ tiÕp nhËn ph©n tö ADN ngo¹i lai hoÆc theo
c¬ chÕ tù nhiªn hoÆc nhê c¸c kü thuËt “chuyÓn gen”. Trong tù nhiªn, mét sè vi khuÈn,
bao gåm Streptoccocus pneumoniae, Bacillus subtilis, Haemophilus influenzae vµ Neisseria
gonorrhoeae, cã c¸c c¬ chÕ tiÕp nhËn ADN tõ m«i tr−êng ngoµi. Chóng ®−îc gäi lµ c¸c vi
khuÈn kh¶ biÕn tù nhiªn. MÆc dï trong tù nhiªn, E. coli th−êng kh«ng cã tÝnh kh¶
biÕn, nh−ng khi ®−îc xö lý víi ion Ca2+, vi khuÈn nµy cã thÓ tiÕp nhËn ADN tõ m«i
tr−êng ngo¹i bµo. Cã thÓ ion Ca2+ víi kh¶ n¨ng “bao bäc” ph©n tö ADN tÝch ®iÖn ©m ®·
t¨ng c−êng kh¶ n¨ng “x©m nhËp” qua mµng tÕ bµo cña ADN. C¸c tÕ bµo E. coli sau khi
®−îc xö lý víi Ca2+ nh− vËy còng ®−îc gäi lµ c¸c tÕ bµo kh¶ biÕn. §Ó t×m ra vµ ph©n lËp
c¸c tÕ bµo kh¶ biÕn mang vect¬ t¸i tæ hîp, ng−êi ta th−êng nu«i cÊy c¸c vi khuÈn trªn
m«i tr−êng chän läc chøa c¸c chÊt kh¸ng sinh t−¬ng øng víi gen ®¸nh dÊu cã mÆt trong
vect¬.
Nh×n chung, hiÖu suÊt cña qu¸ tr×nh biÕn n¹p th−êng kh«ng cao. ChØ mét tØ lÖ nhá
c¸c tÕ bµo ®−îc xö lý biÕn n¹p cã thÓ tiÕp nhËn plasmid t¸i tæ hîp. Nh−ng, chÝnh hiÖu
qu¶ biÕn n¹p thÊp nh− vËy gióp cho hÇu hÕt c¸c tÕ bµo mang vect¬ t¸i tæ hîp th−êng chØ

333
§inh §oµn Long

mang mét b¶n sao duy nhÊt. Thuéc tÝnh nµy gióp cho c¸c tÕ bµo biÕn n¹p vµ dßng tÕ bµo
do chóng sinh ra (do ph©n chia trùc ph©n) chØ mang mét vect¬ ADN t¸i tæ hîp duy nhÊt
vµ gióp c¸c nhµ nghiªn cøu cã thÓ ph©n lËp vµ tinh s¹ch ®−îc dÔ dµng c¸c gen hoÆc s¶n
phÈm cña c¸c gen mét c¸ch riªng rÏ tõ hçn hîp biÕn n¹p vèn chøa nhiÒu ®o¹n tr×nh tù
ADN kh¸c nhau.

11.2.6.4. ThiÕt lËp ng©n hµng hÖ gen vµ th− viÖn cADN


Víi c¸c hÖ gen nhá, chiÕn l−îc nh©n dßng th−êng t−¬ng ®èi ®¬n gi¶n. Ch¼ng h¹n
nh− hÖ gen virut cã kÝch th−íc kho¶ng 10 kb, ng−êi ta cã thÓ trùc tiÕp tinh s¹ch ADN, c¾t
chóng b»ng enzym giíi h¹n råi tiÕn hµnh ®iÖn di. C¸c ph©n ®o¹n ADN ph©n t¸ch trªn gel
®iÖn di ®−îc th«i khái gel, tinh s¹ch råi cµi vµo vect¬ nh©n dßng.
Tuy nhiªn, víi c¸c hÖ gen lín, nh− hÖ gen ng−êi, viÖc c¾t ADN tæng sè b»ng enzym
giíi h¹n råi ph©n t¸ch b»ng ®iÖn di chØ dÉn ®Õn sù h×nh thµnh mét d¶i b¨ng ®iÖn di dµi
liªn tôc däc b¶n gel (c¸c b¨ng kh«ng ph©n t¸ch) v× sè ®o¹n c¾t qu¸ lín vµ chóng lµ mét
chuçi c¸c ®o¹n ADN chØ kh¸c nhau vµi nucleotide. Trong chiÕn l−îc nh©n dßng nh÷ng hÖ
gen lín nh− vËy, ng−êi ta cµi toµn bé c¸c ®o¹n ADN cña hÖ gen (sau khi ®· c¾t b»ng
enzym giíi h¹n) vµo vect¬ nh©n dßng råi biÕn n¹p c¸c vect¬ t¸i tæ hîp vµo tÕ bµo chñ (ë ®ã
vect¬ cã kh¶ n¨ng tù sao chÐp) mµ kh«ng qua ®iÖn di. TËp hîp c¸c dßng tÕ bµo mang
vect¬ t¸i tæ hîp chøa c¸c ®o¹n ADN kh¸c nhau cña mét hÖ gen nh− vËy ®−îc gäi lµ ng©n
hµng hÖ gen.
§Ó thiÕt lËp ng©n hµng hÖ gen, ADN tæng sè cña tÕ bµo ®Ých (vÝ dô: tõ ng−êi) ®−îc
c¾t b»ng enzym giíi h¹n ®Ó t¹o nªn c¸c ®o¹n cã kÝch th−íc trung b×nh dao ®éng tõ 100 bp
®Õn 1 Mb. C¸c ®o¹n ADN sau ®ã ®−îc cµi vµo vect¬ phï hîp nhê ADN ligase. KÕt qu¶ cña
b−íc nµy lµ t¹o ra mét tËp hîp cña c¸c vect¬ mang c¸c ®o¹n ADN cµi kh¸c nhau.
Ng©n hµng hÖ gen ®−îc t¹o ra nhê sö dông enzym giíi h¹n vµ c¸c vect¬ nh©n dßng
cã øng dông râ rÖt nhÊt lµ nh»m gi¶i tr×nh tù c¸c hÖ gen lín. Dù ¸n gi¶i m· hÖ gen ng−êi
(hoµn thµnh vµo n¨m 2006 võa qua) còng ®−îc thùc hiÖn theo chiÕn l−îc nµy. Tuy nhiªn,
c¸c ®o¹n cµi ADN trong c¸c dßng tÕ bµo thuéc ng©n hµng hÖ gen cña eukaryote th−êng
kh«ng ph¶i lµ c¸c ®o¹n tr×nh tù m· hãa, bëi v× chóng ®−îc c¾t ngÉu nhiªn bëi c¸c enzym
giíi h¹n trong khi phÇn lín hÖ gen lµ c¸c tr×nh tù kh«ng m· hãa.
ThÕ nªn, ®Ó t¹o ra c¸c dßng tÕ bµo mang c¸c ®o¹n ADN cµi t−¬ng øng víi c¸c tr×nh
tù m· hãa protein, ng−êi ta thiÕt lËp mét d¹ng ng©n hµng hÖ gen kh¸c gäi lµ th− viÖn
cADN. §Ó thiÕt lËp th− viÖn cADN, trong b−íc ®Çu tiªn thay v× b¾t ®Çu tõ ADN, ng−êi
ta tiÕn hµnh phiªn m· ng−îc mARN thµnh cADN. §¸ng l−u ý lµ cADN t−¬ng øng ®óng
víi tr×nh tù m· hãa cña protein (ngoµi mét sè tr×nh tù xu«i dßng vµ ng−îc dßng tham gia
vµo qu¸ tr×nh dÞch m·). Ph¶n øng phiªn m· ng−îc ®−îc thùc hiÖn nhê reverse
transcriptase. Enzym nµy cã kh¶ n¨ng tæng hîp ADN dùa trªn m¹ch khu«n lµ ARN.
Khi cã mÆt reverse transcriptase, mARN ®−îc phiªn m· ng−îc thµnh c¸c ph©n tö ADN
sîi kÐp; nh÷ng ph©n tö nµy sau ®ã ®−îc g¾n vµo c¸c vect¬ råi biÕn n¹p vµo c¸c tÕ bµo chñ
lµm nhiÖm vô nh©n dßng. Víi tr×nh tù xuÊt ph¸t lµ mARN, cã thÓ nhËn thÊy, kh¸c víi
ng©n hµng hÖ gen, mét c¬ thÓ sinh vËt cã thÓ cho ra nhiÒu th− viÖn cADN kh¸c nhau, bëi
v× mçi m« trong c¬ thÓ ph¶n ¸nh mét tËp hîp c¸c gen ®−îc biÓu hiÖn kh¸c nhau nªn sÏ cã
mét tËp hîp c¸c mARN kh¸c nhau (trong khi ng©n hµng hÖ gen dï ®−îc t¹o ra tõ lo¹i m«
hoÆc tÕ bµo nµo cña cïng mét c¬ thÓ ®Òu gièng nhau). B¶ng 11.1 nªu mét sè ®Æc ®iÓm
kh¸c biÖt c¬ b¶n gi÷a “ng©n hµng hÖ gen” vµ “th− viÖn cADN”.
MÆc dï, trong gi¸o tr×nh nµy, cã sù ph©n biÖt khi dïng thuËt ng÷ “ng©n hµng” vµ
“th− viÖn”; trong ®ã “ng©n hµng” chØ tËp hîp ®Çy ®ñ tr×nh tù ADN cña mét hÖ gen, cßn
“th− viÖn” chØ ®¹i diÖn cho c¸c tr×nh tù ADN m· hãa cho c¸c protein ®−îc biÓu hiÖn t¹i
mét m« nhÊt ®Þnh. Nh−ng, trong thùc tÕ hai thuËt ng÷ nµy ®«i khi ®−îc dïng ®ång

334
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

nghÜa, thÕ nªn “ng©n hµng hÖ gen” cã khi ®−îc gäi lµ “th− viÖn hÖ gen” vµ ng−îc l¹i.
ThuËt ng÷ “ng©n hµng gen” ®−îc dïng chung ®Ó chØ c¶ hai lo¹i “ng©n hµng hÖ gen” vµ
“th− viÖn cADN”.
Còng gièng nh− c¸c tÕ bµo trong ng©n hµng hÖ gen, mçi tÕ bµo biÕn n¹p trong th−
viÖn cADN th−êng chØ mang duy nhÊt mét vect¬ chøa ®o¹n ADN cµi. V× vËy, sau khi c¸c
tÕ bµo nh©n lªn, chóng sÏ t¹o ra nhiÒu dßng tÕ bµo, mçi dßng chøa b¶n sao cña mét
cADN m· hãa t−¬ng øng cho mét protein. ViÖc cÇn lµm sau khi ®· x©y dùng ®−îc ng©n
hµng hÖ gen vµ th− viÖn cADN lµ x¸c ®Þnh dßng tÕ bµo nµo mang ®o¹n ADN ®−îc quan
t©m nghiªn cøu.
B¶ng 11.1. Mét sè ®Æc ®iÓm kh¸c biÖt gi÷a ng©n hµng hÖ gen vµ th− viÖn cADN

Ng©n hµng hÖ gen


1. Cã mÆt ®Çy ®ñ tÊt c¶ c¸c tr×nh tù ADN trong tÕ bµo.
2. C¸c ®o¹n ADN cã tr×nh tù nucleotide gièng hÖ gen cña tÕ bµo trong tù nhiªn, gåm c¶ c¸c tr×nh tù ADN
kh«ng m· hãa cña hÖ gen (vÝ dô: c¸c ®o¹n tr×nh tù liªn gen, ADN ®Öm, intron).
3. ë eukaryote, ngoµi c¸c tr×nh tù m· hãa, phÇn lín c¸c tr×nh tù ADN trong ng©n hµng lµ c¸c tr×nh tù kh«ng
m· hãa, gåm nhiÒu ®o¹n tr×nh tù lÆp l¹i, c¸c tr×nh tù liªn gen, c¸c tr×nh tù ®iÒu hßa ho¹t ®«ng gen, ...
4. Sè l−îng c¸c dßng tÕ bµo mang c¸c ®o¹n cµi nhiÒu.
Th− viÖn cADN
1. ChØ lµ tËp hîp mét phÇn c¸c tr×nh tù ADN cña hÖ gen.
2. cADN ph¶n ¸nh tr×nh tù b¶n phiªn m· mARN hoµn thiÖn cña gen, kh«ng ph¶i lµ tr×nh tù ADN ®Çy ®ñ cña
gen trªn NST.
3. C¸c protein ®−îc m· hãa bëi cADN cã thÓ ®−îc tæng hîp (dÞch m·) trong mét tÕ bµo chñ mµ ë ®ã kh«ng
cÇn cã bé m¸y hoµn thiÖn ph©n tö mARN (bëi c¸c intron ®· ®−îc c¾t bá).
4. Sè l−îng c¸c dßng tÕ bµo mang c¸c ®o¹n cµi Ýt.

11.2.6.5. Sö dông mÉu dß ®Ó x¸c ®Þnh c¸c dßng tÕ bµo trong ng©n hµng gen
§Ó x¸c ®Þnh dßng tÕ bµo nµo trong ng©n hµng gen mang ®o¹n ADN ®−îc quan t©m
nghiªn cøu (vÝ dô ë ®©y lµ ng©n hµng sö dông vect¬ plasmid), ng−êi ta tiÕn hµnh lai mÉu
dß (nguyªn t¾c ®−îc nªu ë môc 11.2.5) víi c¸c khuÈn l¹c cña c¸c dßng vi khuÈn tõ ng©n
hµng gen. Kü thuËt nµy ®−îc gäi lµ ph−¬ng ph¸p lai khuÈn l¹c.
Mét th− viÖn cADN ®iÓn h×nh chøa Ýt nhÊt hµng ngµn dßng vi khuÈn kh¸c nhau,
mçi dßng mang mét ®o¹n cµi cADN ®Æc tr−ng. Sau khi vect¬ ®−îc biÕn n¹p vµo vi khuÈn,
c¸c tÕ bµo vi khuÈn ®−îc cÊy trªn bÒ mÆt m«i tr−êng chøa agar. Mçi tÕ bµo sau ®ã sÏ
ph¸t triÓn thµnh mét khuÈn l¹c riªng rÏ. C¸c tÕ bµo trong cïng mét khuÈn l¹c ®Òu mang
cïng lo¹i vect¬ vµ ®o¹n gen cµi gièng nhau. Trong kü thuËt lai khuÈn l¹c, ng−êi ta cã thÓ
dïng mµng lai gièng nh− trong c¸c ph−¬ng ph¸p lai Southern ®Ó thu håi mét l−îng “vÕt”
ADN trùc tiÕp tõ khuÈn l¹c, nh−ng ®ñ cho sù kÕt cÆp víi mÉu dß. Cô thÓ, ng−êi ta dïng
mµng lai Ðp lªn bÒ mÆt m«i tr−êng nu«i cÊy chøa khuÈn l¹c vµ “in h×nh” chóng lªn mµng
lai (cïng víi ADN cña chóng) theo kiÓu “®ãng dÊu”. Khi kÕt qu¶ lai mÉu dß/khuÈn l¹c
cho kÕt qu¶ “d−¬ng tÝnh”, sÏ x¸c ®Þnh ®−îc vÞ trÝ khuÈn l¹c mang dßng tÕ bµo chøa ®o¹n
ADN (gen) cµi mong muèn.
Mµng lai ®−îc ®em lai víi mÉu dß nh− sau: ng−êi ta tiÕn hµnh xö lý mµng lai sao
cho mµng tÕ bµo vì ra vµ c¸c ph©n tö ADN tho¸t ra ngoµi vµ g¾n lªn mµng lai t¹i chÝnh
vÞ trÝ tÕ bµo cña chóng. C¸c mµng lai sau ®ã ®−îc ñ víi c¸c mÉu dß ®−îc ®¸nh dÊu tõ
tr−íc trong c¸c ®iÒu kiÖn gièng nh− khi tiÕn hµnh c¸c kü thuËt lai Northern hay
Southern.
§Ó x©y dùng ng©n hµng gen, ngoµi c¸c vect¬ plasmid cã nguån gèc vi khuÈn, ng−êi
ta cßn dïng nhiÒu lo¹i vect¬ kh¸c cã nguån gèc virut (phag¬), hoÆc tõ c¸c sinh vËt bËc cao
h¬n nh− NST nh©n t¹o cña nÊm men (YAC), hoÆc c¸c d¹ng vect¬ lai nh− phagemid,

335
§inh §oµn Long

cosmid, NST nh©n t¹o vi khuÈn (BAC), v.v ... Trong c¸c vect¬ virut, c¸c vect¬ cã nguån
gèc phag¬ λ lµ phæ biÕn h¬n c¶. ADN hÖ gen cña virut nµy ®−îc lo¹i bá c¸c phÇn g©y ®éc
vµ th−êng ®−îc dïng nh− vect¬ nh©n dßng. Nguyªn t¾c sö dông vect¬ nµy ®Ó nh©n dßng
trong c¸c th− viÖn hÖ gen gièng nh− vect¬ plasmid. ChØ cã mét ®iÓm kh¸c lµ khi tiÕn
hµnh lai víi mÉu dß ®Ó x¸c ®Þnh c¸c dßng gen biÕn n¹p th× vÞ trÝ c¸c mÉu dß ®−îc x¸c
®Þnh trªn mµng lai t−¬ng øng víi vÞ trÝ c¸c vÕt tan thay cho vÞ trÝ c¸c khuÈn l¹c nh− khi
dïng vect¬ plasmid.

11.2.7. Tæng hîp hãa häc vµ sö dông c¸c ®o¹n oligonucleotide


C¸c ®o¹n ADN ng¾n cã tr×nh tù x¸c ®Þnh Nhãm khãa
®−îc dïng nhiÒu trong c¸c nghiªn cøu kh¸c ®Çu C5’-OH
nhau cña di truyÒn häc ph©n tö, ch¼ng h¹n nh−
Nucleotide tiÕp Deoxyribose
dïng lµm mÉu dß trong c¸c ph−¬ng ph¸p lai, theo nèi vµo ®©y
dïng lµm måi trong c¸c ph¶n øng PCR vµ gi¶i
tr×nh tù ADN. C¸c ®o¹n tr×nh tù nµy th−êng
®−îc tæng hîp hãa häc (phæ biÕn b»ng m¸y tæng
Phosphoamidite
hîp ADN tù ®éng) vµ ®−îc gäi lµ c¸c ®o¹n
oligonucleotide. TiÒn chÊt ®Ó t¹o nªn c¸c Nhãm diisopropylamino
nucleotide lÇn l−ît g¾n vµo chuçi oligonucleotide
H×nh 11.7. Phosphoamidine lµ tiÒn chÊt
lµ c¸c phosphoamidine (h×nh 11.7). Ph¶n øng tæng hîp hãa häc c¸c oligonucleotide.
kÐo dµi chuçi oligonucleotide diÔn ra b»ng viÖc Nhãm DMT (dimethoxytrityl) cã vai trß khãa
g¾n thªm nucleotide míi vµo ®Çu 5’ (tøc lµ chiÒu ®Çu C5'-OH vµ chØ ph¶n øng víi nhãm
phosphoamidite theo chiÒu 3' → 5'.
3’ → 5’) cña ®o¹n oligonucleotide cã s½n, nh−
vËy ng−îc chiÒu víi ph¶n øng kÐo dµi chuçi
a) Tæng hîp ADN hoµn b) Tæng hîp tõng phÇn råi
ADN ®−îc thùc hiÖn bëi enzym ADN chØnh trªn c¶ 2 m¹ch tæng hîp b»ng ADN pol
polymerase. Tæng hîp c¸c
oligonucleotide Tæng hîp c¸c
Ph−¬ng ph¸p tæng hîp hãa häc cã hiÖu oligonucleotide
qu¶ vµ ®é tin cËy cao khi tæng hîp c¸c ®o¹n
ADN ng¾n, m¹ch ®¬n cã ®é dµi tíi 30 B¾t cÆp gi÷a c¸c
nucleotide. §Ó tæng hîp c¸c ®o¹n ADN b»ng ®o¹n oligonucleotide B¾t cÆp gi÷a c¸c
®o¹n oligonucleotide
m¸y tæng hîp tù ®éng, c¸c nhµ nghiªn cøu chØ
cÇn “nhËp” vµo phÇn mÒm tr×nh tù nucleotide
Nèi bëi ADN ligase C¸c ®o¹n rçng ®−îc
cÇn tæng hîp vµ m¸y sÏ tù ®éng tæng hîp tõ c¸c tæng hîp bëi ADN pol
tiÒn chÊt ®−îc chuÈn bÞ s½n. Tuy nhiªn, khi
ph©n tö ADN ®−îc tæng hîp cã kÝch th−íc lín
§o¹n tæng hîp bëi ADN pol
th× ®é chÝnh x¸c cña tr×nh tù vµ ®é ®ång ®Òu Nèi bëi ADN ligase
cña s¶n phÈm gi¶m ®i do c¸c h¹n chÕ mang
tÝnh kü thuËt. Thùc tÕ, c¸c ph©n tö ADN cã
tr×nh tù dµi trªn 100 nucleotide khã cã thÓ tæng H×nh 11.8. Hai ph−¬ng ph¸p tæng hîp hãa häc
hîp chÝnh x¸c b»ng m¸y tæng hîp tù ®éng. c¸c ®o¹n ADN dµi (hoÆc gen ®Çy ®ñ).

Tuy vËy, b»ng c¸ch kÕt hîp mét sè kü thuËt, c¸c ®o¹n ADN (thËm chÝ gen ®Çy ®ñ)
cã chiÒu dµi h¬n 100 nucleotide còng cã thÓ tæng hîp b»ng ph−¬ng ph¸p hãa häc. Cô thÓ,
tr−íc tiªn ng−êi ta ph¶i tæng hîp c¸c ®o¹n ADN ng¾n, m¹ch ®¬n cã tr×nh tù gèi lªn nhau;
sau ®ã tinh s¹ch råi nèi c¸c ®o¹n ADN víi nhau (h×nh 11.8). ViÖc nèi c¸c ®o¹n ADN cã
thÓ thùc hiÖn theo hai c¸ch. Trong c¸ch thø nhÊt, c¸c ®o¹n ADN riªng rÏ chøa tr×nh tù
®Çy ®ñ cña ph©n tö ADN cÇn tæng hîp, chØ thiÕu liªn kÕt phosphodiester g¾n kÕt c¸c
®o¹n víi nhau. Lóc nµy, enzym ADN ligase ®−îc dïng ®Ó nèi c¸c ®o¹n víi nhau (h×nh

336
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

11.8a). Trong c¸ch thø hai, c¸c ®o¹n ADN ®−îc tæng hîp chØ chiÕm mét phÇn tr×nh tù cña
mçi m¹ch ADN cÇn tæng hîp. Khi c¸c ®o¹n ADN ®−îc cho b¾t cÆp víi nhau, trªn mçi
m¹ch cßn tån t¹i nhiÒu ®o¹n tr×nh tù “trèng”. Lóc nµy, ADN pol I ®−îc dïng ®Ó lÊp kÝn
c¸c ®o¹n “trèng” tr−íc khi ADN ligase nèi c¸c ®o¹n ADN víi nhau ®Ó t¹o nªn ph©n tö ADN
cã tr×nh tù ®Çy ®ñ (h×nh 11.8b). Trong qu¸ tr×nh tæng hîp ADN nh− vËy, còng cã thÓ kÕt hîp
c¸c tr×nh tù ®iÒu hßa cña gen víi c¸c tr×nh tù m· hãa. Ngoµi ra, còng cã thÓ bæ sung vÞ trÝ
c¾t cña c¸c enzym giíi h¹n ë vïng biªn cña tr×nh tù m· hãa, ®Ó sau ®ã cã thÓ cµi c¸c ®o¹n
ADN nµy vµo c¸c vect¬ nh©n dßng hay vect¬ biÓu hiÖn.
C¸c ®o¹n ADN ®−îc tæng hîp hãa häc ngoµi c¸c øng dông lµm mÉu dß hoÆc lµm måi
cho ph¶n øng PCR vµ gi¶i tr×nh tù, cßn cã thÓ ®−îc dïng cho c¸c nghiªn cøu kh¸c. Ch¼ng
h¹n, cã thÓ tæng hîp c¸c ®o¹n ADN mang mét (hoÆc mét sè) nucleotide biÕn ®æi so víi
tr×nh tù ADN cña gen ®· biÕt, vµ dïng ®o¹n ADN nµy trong ph−¬ng ph¸p g©y ®ét
biÕn ®Þnh vÞ trÝ. Trong ph−¬ng ph¸p nµy, ®o¹n ADN tæng hîp mang nucleotide biÕn ®æi
®−îc dïng lµm måi ®Ó nh©n ®o¹n gen ®Ých b»ng ph¶n øng PCR. V× trong ph©n tö ADN
sîi kÐp h×nh thµnh cã mét (hoÆc mét sè) vÞ trÝ kÕt cÆp sai, nªn s¶n phÈm PCR h×nh thµnh
lµ c¸c ®o¹n ADN cã tr×nh tù gen mang nucleotide biÕn ®æi ë vÞ trÝ x¸c ®Þnh. C¸c ®o¹n
oligonucleotide còng cã thÓ ®−îc dïng theo c¸ch t−¬ng tù ®Ó t¹o nªn mét ®iÓm giíi h¹n
míi trªn ph©n tö ADN, ®Ó råi sau ®ã ®iÓm giíi h¹n nµy ®−îc dïng ®Ó cµi gen ®Ých vµo
®óng vÞ trÝ cÇn thiÕt, vÝ dô: sau promoter hay sau vÞ trÝ g¾n cña ribosome, v.v…

11.2.8. Ph¶n øng PCR


Ngoµi kü thuËt nh©n dßng gen sö dông c¸c tÕ ADN khu«n
Måi ng−îc
bµo (in vivo), mét ph−¬ng ph¸p nh©n dßng gen
5’ 3’
invitro ®¬n gi¶n, hiÖu qu¶ ®−îc sö dông phæ biÕn 3’
§o¹n ADN 5’
hiÖn nay ë hÇu hÕt c¸c phßng thÝ nghiÖm di truyÒn
häc vµ sinh häc ph©n tö lµ ph¶n øng chuçi trïng Måi xu«i

hîp - PCR (polymerase chain reaction). Kü thuËt


Ph¶n øng PCR
PCR dïng ADN polymerase ®Ó tæng hîp ph©n tö
ADN míi tõ tr×nh tù cña ph©n tö ADN lµm khu«n
víi tiÒn chÊt lµ c¸c dNTP. Nh− ®· nªu ë ch−¬ng 3, §o¹n ADN ®Ých
c¸c ADN polymerase tæng hîp ADN theo chiÒu 5’→ 3’
§o¹n ADN ®Ých
vµ cã thÓ xóc t¸c g¾n nucleotide vµo ®Çu 3’ cña mét
®o¹n oligonucleotide cã s½n. ThÕ nªn, nÕu ta ®· cã §o¹n ADN ®Ých
®o¹n oligonucleotide g¾n vµo mét m¹ch ADN lµm NhiÒu b¶n sao ®o¹n ADN ®Ých
khu«n, th× ADN polymerase cã thÓ dïng ®o¹n ®ã H×nh 11.9. Nh©n dßng ADN b»ng PCR.
nh− måi ®Ó xóc t¸c ph¶n øng kÐo dµi chuçi ADN vÒ
phÝa ®Çu 3’ cho ®Õn hÕt tr×nh tù m¹ch khu«n.
C©u hái ®Æt ra lµ: b»ng c¸ch nµo cã thÓ dïng ph¶n øng PCR ®Ó nh©n dßng mét
®o¹n tr×nh tù ADN ®Æc hiÖu? Lóc nµy, ng−êi ta sÏ tæng hîp vµ sö dông hai ®o¹n
oligonuleotide cã vÞ trÝ liªn kÕt chÆn ë hai ®Çu cña ®o¹n ADN cÇn nh©n dßng. §o¹n
oligonucleotide thø nhÊt cã tr×nh tù bæ sung víi ®Çu 5’ cña m¹ch m· hãa, ®−îc gäi lµ måi
xu«i; ®o¹n thø hai cã tr×nh tù bæ sung víi ®Çu 5’ cña m¹ch ®èi m·, ®−îc gäi lµ måi
ng−îc (h×nh 11.9). Ph©n tö ADN lµm khu«n ®−îc g©y biÕn tÝnh bëi nhiÖt, t¹o ®iÒu kiÖn
cho c¸c måi xu«i vµ måi ng−îc ®Ýnh kÕt vµo c¸c vÞ trÝ ë hai ®Çu ®o¹n ADN cÇn nh©n dßng.
Víi sù cã mÆt cña c¸c tiÒn chÊt lµ dNTP, ADN polymerase sÏ nh©n dßng ®o¹n tr×nh tù
ADN ®−îc giíi h¹n bëi hai ®o¹n måi.

337
§inh §oµn Long

Trong ph¶n øng PCR, ph©n tö ADN ®−îc g©y biÕn tÝnh vµ sù tæng hîp ADN diÔn ra
lÆp l¹i qua nhiÒu chu kú nhê kh¶ n¨ng ®iÒu nhiÖt cña m¸y. KÕt qu¶ lµ: sau mçi chu kú
®iÒu nhiÖt, sè ph©n tö ADN l¹i t¨ng gÊp ®«i. §©y lµ mét ph¶n øng cã ®é nh¹y cao. ChØ
cÇn mét vµi b¶n sao ADN cã trong mÉu nghiªn cøu, chóng ta cã thÓ thu ®−îc hµng tØ b¶n
sao sau kho¶ng trªn d−íi 30 chu kú ph¶n øng (sè b¶n sao ADN = 2n víi n lµ sè chu kú
ph¶n øng).

11.2.9. Gi¶i tr×nh tù ADN Baz¬ Baz¬

Trong phÇn nµy chóng ta sÏ xem


b»ng c¸ch nµo cã thÓ x¸c ®Þnh ®−îc
tr×nh tù nucleotide cña c¸c ®o¹n ADN
ng¾n hoÆc toµn bé ph©n tö ADN dµi. H×nh 11.10. CÊu tróc cña dNTP (tr¸i) vµ ddNTP (ph¶i).

Nguyªn t¾c cña hÇu hÕt c¸c ph−¬ng


ph¸p gi¶i tr×nh tù ADN hiÖn nay ®Òu dùa
trªn ph−¬ng ph¸p ®−îc Sanger vµ céng sù
c«ng bè n¨m 1977, ®−îc gäi lµ ph−¬ng ph¸p
dideoxyribonucleotide (gäi t¾t lµ ph−¬ng ph¸p
dideoxy). Nguyªn t¾c cña ph−¬ng ph¸p
dideoxy dùa trªn viÖc bæ sung c¸c dÉn xuÊt
t−¬ng øng cña c¸c dNTP lµ 2’,3’-
dideoxynucleotide (viÕt t¾t lµ ddNTP, h×nh
11.10) vµo thµnh phÇn ph¶n øng tæng hîp
ADN trong èng nghiÖm. Do ddNTP thiÕu
nhãm C3’-OH, nªn mét khi nã ®−îc g¾n vµo
m¹ch ADN ®ang tæng hîp, th× qu¸ tr×nh tæng
hîp ADN sÏ dõng l¹i. Trong ph−¬ng ph¸p
Sanger, sù sao chÐp ADN ®−îc b¾t ®Çu b»ng
viÖc g¾n mét ®o¹n oligonucleotide cã tr×nh tù
bæ sung víi tr×nh tù ADN cÇn gi¶i m· råi ñ
chóng cïng víi enzym ADN pol. Ph©n tö
ADN tæng hîp míi sÏ cã tr×nh tù bæ sung víi
m¹ch ADN lµm khu«n. C¸c ph¶n øng gi¶i m·
tr×nh tù ®−îc chia lµm bèn èng nghiÖm t¸ch
biÖt. Mçi èng ®−îc bæ sung mét hçn hîp gåm
ChiÒu ®iÖn di

4 lo¹i dNTP th«ng th−êng (vèn cÇn cho sù


tæng hîp m¹ch ADN míi); mét trong nh÷ng
lo¹i dNTP nµy ®−îc ®¸nh dÊu phãng x¹ ®Ó
ph¸t hiÖn m¹ch míi ®ang tæng hîp. Ngoµi ra,
tõng lo¹i trong 4 lo¹i ddNTP (ddATP, ddGTP,
ddCTP vµ ddTTP) sÏ ®−îc bæ sung lÇn l−ît
t−¬ng øng vµo mçi èng nghiÖm nªu trªn víi
nång ®é b»ng 1/10 so víi nång ®é lo¹i dNTP H×nh 11.11. Gi¶i tr×nh tù ADN nhê sö dông ddNTP.
t−¬ng øng. Víi thµnh phÇn ph¶n øng nh− Sù sao chÐp ADN sÏ kÕt thóc khi ddNTP ®−îc kÕt
vËy, trong phÇn lín tr−êng hîp, dNTP sÏ liªn hîp vµo chuçi. Tr×nh tù m¹ch ADN míi tæng hîp
®−îc ®äc theo chiÒu 5’ → 3’ t−¬ng øng tõ ®¸y lªn
kÕt vµo m¹ch ADN ®ang tæng hîp, nh−ng ®Ønh cña b¶n ®iÖn di.

338
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

ddNTP (ë nång ®é thÊp) còng sÏ liªn kÕt vµo mét sè m¹ch ADN ®ang tæng hîp vµ lµm
kÕt thóc qu¸ tr×nh sao chÐp. Do cã nhiÒu ph©n tö ADN ®−îc tæng hîp ®ång thêi nªn qu¸
tr×nh nµy dÉn ®Õn sù h×nh thµnh cña mét hçn hîp nhiÒu ph©n tö ADN ®−îc sao chÐp
kh«ng hoµn chØnh gièng nhau ë ®Çu 5’ ®−îc ®¸nh dÊu vµ kh¸c nhau ë ®Çu 3’ vÒ chiÒu
dµi vµ lo¹i nucleotide
kÕt thóc chuçi (h×nh 11.11). C¸c s¶n phÈm nµy sau ®ã ®−îc ph©n t¸ch trªn gel
polyacrylamide vµ ®äc tr×nh tù theo thø tù c¸c b¨ng xuÊt hiÖn trªn b¶n ®iÖn di theo
chiÒu tõ cùc d−¬ng sang cùc ©m.
§· cã nhiÒu c¶i tiÕn ®−îc ®−a ra nh»m n©ng cao hiÖu qu¶ cña ph−¬ng ph¸p dideoxy
kÓ tõ khi Sanger c«ng bè. Trong ph−¬ng ph¸p cña Sanger, enzym ADN pol I cña E. coli
®−îc dïng lµm enzym sao chÐp. Sau ®ã, nã ®−îc thay b»ng ADN pol cã nguån gèc tõ
phag¬ T7 cã hiÖu qu¶ sao chÐp c¸c ADN m¹ch dµi tèt h¬n. Ngµy nay, phÇn lín viÖc gi¶i
tr×nh tù ADN ®Òu dùa trªn ph−¬ng ph¸p dideoxy kÕt hîp víi ph¶n øng PCR sö dông c¸c
enzym chÞu nhiÖt, nh− Taq ADN pol, hoÆc −u viÖt h¬n lµ enzym cã tªn th−¬ng m¹i lµ
“sequenase”. §©y lµ enzym t¸i tæ hîp cã nguån gèc tõ ADN pol cña phag¬ T7. Enzym
nµy cã hiÖu qu¶ sao chÐp tèt c¸c m¹ch ADN dµi, cã tÝnh chÞu nhiÖt, cã ho¹t tÝnh ®äc söa
vµ cã thÓ l¾p r¸p c¸c lo¹i nucleotide c¶i biÕn (ngoµi 4 lo¹i nucleotide c¬ b¶n) vµo m¹ch
ADN ®ang tæng hîp. ViÖc kÕt hîp víi ph−¬ng ph¸p PCR cho phÐp gi¶i tr×nh tù ADN tõ
mét l−îng rÊt nhá ADN sîi kÐp, ®ång thêi còng cho phÐp gi¶i tr×nh tù trùc tiÕp mét sè hÖ
gen kÝch th−íc nhá, nh− virut vµ vi
a)
khuÈn. Trong khi ®ã, viÖc gi¶i tr×nh tù
RE ChÊt nhËn dRhodamine
hÖ gen c¸c sinh vËt bËc cao (cã kÝch
th−íc hÖ gen lín) cÇn ph¶i qua b−íc
nh©n dßng hoÆc sö dông c¸c ng©n hµng
gen.
ChÊt ph¸t quang
11.2.9.1. Gi¶i tr×nh tù ADN tù ®éng §o¹n nèi

Kü thuËt gi¶i tr×nh tù ®−îc Sanger


m« t¶ cã thÓ x¸c ®Þnh chÝnh x¸c tr×nh tù
nucleotide cña mét ®o¹n ADN dµi tíi
300 bp. Tuy nhiªn, ph−¬ng ph¸p nµy b)

cÇn nhiÒu thao t¸c kü thuËt. Cô thÓ,


C−êng ®é ph¸t quang

nhiÒu b−íc pipet chÝnh x¸c ph¶i ®−îc


thùc hiÖn ®ång thêi míi cho kÕt qu¶ tèt;
mçi mÉu ph©n tÝch ph¶i ®ång thêi ch¹y
trªn 4 lµn ®iÖn di kh¸c nhau. Ngoµi ra,
viÖc ®äc kÕt qu¶ ®iÖn di b»ng m¾t ®«i
khi vÉn cã sai sãt. HiÖn nay, ®Ó cã thÓ
gi¶i tr×nh tù ADN c¸c hÖ gen lín (nh− ë B−íc sãng (nm)

ng−êi, ~3,2x109 bp) ®Òu dùa vµo ph−¬ng H×nh 11.12. Thuèc nhuém g¾n víi ddNTP ®−îc dïng
cho gi¶i tr×nh tù ADN. a) CÊu tróc hãa häc cña chÊt kÕt
ph¸p gi¶i tr×nh tù tù ®éng. thóc chuçi BigDyeTM. Trong ®ã, c¸c ddNTP kÕt thóc chuçi
kh¸c nhau cã thuéc tÝnh ph¸t quang kh¸c nhau phô thuéc
Ph−¬ng ph¸p gi¶i tr×nh tù tù ®éng
vµo c¸c gèc R. b) Phæ ph¸t quang cña 4 gèc BigDyeTM
kÕt hîp ®ång thêi 4 ph¶n øng ®éc lËp g¾n vµo 4 lo¹i ddNTP lµ kh¸c nhau.

339
§inh §oµn Long

vµo mét ph¶n øng chung. Trong ®iÒu kiÖn nh− vËy, viÖc dïng c¸c nucleotide ®−îc ®¸nh
dÊu phãng x¹ (g¾n vµo ®Çu 5’ cña m¹ch ADN tæng hîp míi) lµ kh«ng phï hîp v× c¸c ®o¹n
ADN míi tæng hîp chØ kh¸c nhau mét nucleotide nªn khã ph©n t¸ch b»ng ®iÖn di th«ng
th−êng. Tuy nhiªn, trë ng¹i nµy cã thÓ ®−îc kh¾c phôc nÕu nh− ®Çu 3’ cña c¸c ®o¹n ADN
tæng hîp míi ®−îc “®¸nh dÊu” vµ “ph¸t tÝn hiÖu”. §Ó lµm ®iÒu ®ã, ng−êi ta dïng mét bé
c¸c ddNTP ®−îc g¾n chÊt ph¸t quang (Glazer vµ Mathies, 1997). C¸c ddNTP lóc nµy vÉn
cã thÓ liªn kÕt vµo m¹ch ADN ®ang kÐo dµi vµ lµm ngõng ph¶n øng sao chÐp. CÊu tróc
phÇn ph¸t quang cña ddNTP gåm mét “gèc ph¸t quang” liªn kÕt víi mét trong bèn gèc
dichlororhodamine (viÕt t¾t lµ dRhodamine, lµ chÊt nhËn n¨ng l−îng quang) kh¸c nhau
qua mét ®o¹n nèi (h×nh 11.12). Bèn gèc dRhodamine khi bÞ “gèc ph¸t quang” kÝch thÝch
(bëi nguån s¸ng laser th−êng tõ Argon) nhËn n¨ng l−îng råi ph¸t quang ë c¸c b−íc sãng
kh¸c nhau. Nhê vËy, mçi mét lo¹i ddNTP khi ®−îc kÝch thÝch bëi nguån s¸ng Argon cña
m¸y gi¶i tr×nh tù sÏ ph¸t ra “tÝn hiÖu” kh¸c nhau. Th«ng tin nµy ®−îc mét c¶m biÕn tÝn
hiÖu kÕt hîp víi m¸y tÝnh xö lý vµ tù ®éng chuyÓn thµnh tr×nh tù ADN (h×nh 11.13). C¸c
ddNTP ®−îc g¾n chÊt ph¸t quang theo nguyªn lý nªu trªn ®−îc gäi lµ c¸c yÕu tè kÕt thóc
chuçi BigDyeTM.
Gi¶i tr×nh tù tù ®éng cã nhiÒu −u ®iÓm h¬n so víi ph−¬ng ph¸p thñ c«ng cña
Sanger. ¦u ®iÓm lín nhÊt lµ kh¶ n¨ng tù
a)
®éng hãa phÇn lín c¸c b−íc cña qu¸ tr×nh
ph©n tÝch. NhiÒu b−íc cña ph¶n øng gi¶i
Måi ®Ó gi¶i tr×nh tù
tr×nh tù cã thÓ thùc hiÖn b»ng r«bèt, kÓ
tõ viÖc pipet mÉu ®Õn ph¶n øng PCR.
C¸c s¶n phÈm sau ®ã ®−îc tinh s¹ch vµ
Tr×nh tù thu ®−îc
cho ch¹y qua c¸c cét ®iÖn di mao qu¶n
mµ kh«ng cÇn bÊt cø mét thao t¸c trùc
tiÕp nµo cña con ng−êi. Tèc ®é ®äc vµ
møc ®é chÝnh x¸c cña ph−¬ng ph¸p tù
®éng rÊt cao, ®Æc biÖt ®èi víi c¸c ®o¹n
ADN dµi tõ 30 ®Õn d−íi 1000 bp (®é
chÝnh x¸c cao nhÊt lµ ®èi víi c¸c ®o¹n cã
tr×nh tù trªn d−íi 600 bp). Mét hÖ thèng
gi¶i tr×nh tù ADN hiÖn nay trung b×nh cã
ChuyÓn thµnh tr×nh
thÓ ®äc ®−îc 1 - 2 triÖu bp trong mét tù m¹ch m· hãa
ngµy víi ®é chÝnh x¸c 99%. Ngoµi ra,
ViÕt l¹i theo
ph−¬ng ph¸p nµy cã ®é nh¹y cao mµ
chiÒu 5’ →3’
kh«ng cÇn ph¶i sö dông c¸c chÊt phãng
x¹. Tuy nhiªn, còng ph¶i nãi r»ng kü
thuËt gi¶i tr×nh tù ADN tù ®éng kh«ng
b)
ph¶i lóc nµo còng cho kÕt qu¶ ph©n tÝch
hoµn toµn chÝnh x¸c. Mét sè h¹n chÕ cña
ph−¬ng ph¸p nµy gåm cã: nã kh«ng ®äc
®−îc c¸c tr×nh tù qu¸ ng¾n (d−íi 30 bp,
bëi v× hiÖu suÊt PCR cña c¸c ph©n ®o¹n
ADN nµy thÊp, b¶n th©n chóng kÐm bÒn
vµ ph¸t tÝn hiÖu yÕu); sai sè ®äc t¨ng lªn H×nh 11.13. Gi¶i tr×nh tù ADN tù ®éng. a) Sö dông måi
®Ó tæng hîp ADN. Qu¸ tr×nh nµy kÕt thóc b»ng ddNTP ph¸t
khi gi¶i tr×nh tù c¸c ®o¹n ADN trªn 1000 quang. Chuçi c¸c pic t¸ch biÖt cho biÕt tr×nh tù ADN.
bp; ngoµi ra, c¸c ®o¹n ADN mang nhiÒu b) Phæ tr×nh tù ®−îc gi¶i m· b»ng m¸y ABI Prism377.

340
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

tr×nh tù lÆp kÕ tiÕp cã xu h−íng bÞ “nÐn” l¹i khi ch¹y qua cét chøa gel (l¾p trong m¸y),
dÉn ®Õn hiÖn t−îng c¸c pic ë c¸c vïng tr×nh tù lÆp l¹i cã xu h−íng lång vµo nhau (kh«ng
ph©n t¸ch) nªn khã x¸c ®Þnh tr×nh tù chÝnh x¸c. C¸c tr×nh tù nµy th−êng cÇn ®−îc kiÓm
tra l¹i b»ng c¸c ph−¬ng ph¸p thñ c«ng. Trong thùc tÕ, nh÷ng ®o¹n ADN cuèi cïng ®−îc
gi¶i tr×nh tù trong dù ¸n hÖ gen ng−êi (hoµn thµnh n¨m 2006) lµ c¸c ®o¹n ADN cã møc
®é lÆp l¹i lín thuéc NST sè 1.

11.2.9.2. Gi¶i tr×nh tù toµn hÖ gen


Nh− nªu ë trªn, viÖc gi¶i tr×nh tù c¸c ®o¹n ADN ng¾n hiÖn nay cã thÓ thùc hiÖn
®−îc t−¬ng ®èi dÔ dµng nhê m¸y gi¶i tr×nh tù tù ®éng. Tuy vËy, nh÷ng hÖ gen lín ®−îc
gi¶i tr×nh tù nh− thÕ nµo? D−íi ®©y lµ mét sè ph−¬ng ph¸p gi¶i tr×nh tù c¸c hÖ gen.
Tõ phÇn trªn, chóng ta biÕt r»ng để xây dựng ng©n hµng hÖ gen, toàn bộ ADN hệ
gen được cắt thành các đoạn ng¾n trước khi được nh©n dòng vµ duy tr× nhê c¸c vect¬. MÆc
dù về nguyên tắc, việc giải trình tự có thể thực hiện trực tiếp trên ADN hệ gen, nhưng thùc
tế kh«ng ph¶i vËy v× cần ph¶i biết tr−íc nhiều trình tự cña hÖ gen míi cã thÓ thiÕt kÕ mồi
để nhân các ®o¹n kh¸c nhau nằm dọc hệ gen. Để khắc phục khã kh¨n này, người ta nh©n
dòng các đoạn ADN b»ng các véctơ, rồi mỗi đoạn cµi sau đó được giải trình tự nhờ dïng mồi
oligonucleotide kết cặp với trình tự ®· biÕt của véctơ. Vấn đề còn lại là bằng cách nào tái tổ
chức lại các đoạn ADN riêng rẽ thành một trình tự đầy đủ và liên tục của hệ gen. Cã thÓ
thùc hiÖn ®−îc viÖc ®ã b»ng một số cách sau ®©y:
• Tách dòng các trình tự nằm gối lên nhau (contig). Cách đơn giản nhất để tạo ra các
trình tự nằm gối lên nhau là phân lập và giải trình tự một dòng từ ng©n hµng hệ
gen, rồi dïng trình tự của dòng thứ nhất ®Ó xác định dòng thứ hai có một phần
đoạn cài nằm gối lên đoạn thứ nhất (nhê lai víi mÉu dß). Dòng thứ hai lại được giải
trình tự và thông tin về trình tự của nó lại được dùng để xác định đoạn thứ ba nằm
gối lên đoạn thứ hai, v.v... Nguyên tắc này là cơ sở của phương pháp bước nối tiếp
trên nhiễm sắc thể được dïng để xây dựng các trình tự ADN nằm gối lên nhau
(contig) xuất phát từ các đoạn ADN ngắn được tách dòng nhê các véctơ. Tuy vậy,
phương pháp này tốn nhiều công sức. Một dòng phải được phân lập và giải trình tự
trước khi tìm thấy dòng tiÕp theo. Ngoài ra, các trình tự lặp lại kÕ tiếp (phæ biÕn)
trong hệ gen dễ g©y ra sự sắp xếp nhầm.
• Giải trình tự ngẫu nhiên toàn hệ gen (kü thuËt "shortgun"). Toµn bé các đoạn ADN
trong hệ gen được nh©n dòng nhê Gi¶i tr×nh tù ngÉu
Gi¶i tr×nh tù ngÉu
vect¬ và giải trình tự ngẫu nhiên. nhiªn toµn hÖ gen nhiªn ph©n cÊp
Các trình tự sau đó mới được phân ADN hÖ gen
tích b»ng phÇn mÒm m¸y tÝnh về
khả năng nằm gối lên nhau của
chúng (tức là các trình tự cùng xuất
hiện ở nhiều phân đoạn khác nhau) Gi¶i tr×nh tù
và trình tự toàn hệ gen được xây ngÉu nhiªn
dựng dựa trên tổ hợp đồng thời của S¾p xÕp
các trình tự nằm gối lên nhau c¸c tr×nh tù
(hình 11.14). Phương pháp này lần Tr×nh tù hÖ
đầu tiên được dïng để giải tr×nh tù gen ®−îc
hệ gen vi khuẩn Haemophilus x¸c ®Þnh
influenzae. Toàn bộ hệ gen của vi H×nh 11.14. Gi¶i tr×nh tù hÖ gen b»ng c¸c ph−¬ng
khuÈn này được phân cắt ngẫu ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen vµ gi¶i
nhiên thành những ®o¹n nhá b»ng tr×nh tù ngÉu nhiªn ph©n cÊp.

341
§inh §oµn Long

phương pháp “siêu âm”, rồi từng đoạn nhỏ (1,5 – 2 Kb) được nh©n dòng b»ng véctơ
plasmid pUC18. Tổng cộng thư viện hệ gen của loài này gồm khoảng 20.000 dòng
vi khuẩn khác nhau. Mỗi dòng (tương ứng với một đoạn ADN) sau đó được giải
trình tự để rồi tổ hợp lại và tạo nên tập hợp thông tin về trình tự ADN gồm 12
triệu bp. Độ dài của toàn bộ các trình tự ®−îc gi¶i m· gấp 6 lần độ dài hÖ gen của vi
khuẩn. Trình tự hệ gen cuối cùng thu được là nhờ sự tổ hợp các đoạn ADN ngắn
thành các đoạn contig. Các đoạn rçng gi÷a c¸c contig cuối cùng được “lấp đầy” bằng
việc xác định các dòng bổ sung từ một sè ng©n hµng hÖ gen khác (thùc tÕ, ®Ó gi¶i
tr×nh tù mét hÖ gen, ng−êi ta cÇn x©y dùng Ýt nhÊt 2 – 3 ng©n hµng gen mang
c¸c ®o¹n cµi cã kÝch th−íc trung b×nh kh¸c nhau, vÝ dô: 1, 5 vµ 10 Kb). Ưu điểm
râ nhất của phương pháp “shortgun” là không cần biết trước trình tự của hệ gen vµ
tèc ®é gi¶i tr×nh tù nhanh, ®Æc biÖt víi c¸c hÖ gen nhá (nh− vi khuÈn). Phần lớn
các hệ gen vi khuẩn có thể giải mã xong chỉ trong vài tuần bằng phương pháp giải
trình tự ngÉu nhiªn. Tuy vậy, khi gi¶i tr×nh tù nh÷ng hÖ gen lín (nh− ng−êi),
phương pháp này có nhược điểm là gÆp khã kh¨n khi xác định trËt tù c¸c ®o¹n
contig ở các vïng hÖ gen mang nhiÒu trình tự lặp lại liªn tiếp; ngoµi ra, sè l−îng
contig rÊt lín nªn cÇn c¸c phÇn mÒm vµ hÖ thèng m¸y tÝnh cã hiÖu n¨ng rÊt cao
®Ó xö lý d÷ liÖu.
• Giải trình tự ngẫu nhiên phân cấp. Để gi¶i tr×nh tù c¸c hÖ gen lín, có một cải tiến
là ADN toàn hệ gen ban đầu được cắt thành các đoạn lớn rồi tách dòng vào các NST
nhân tạo vi khuẩn (BAC). Sau đó, mçi dßng BAC ®−îc dïng ®Ó x©y dùng c¸c ng©n
hµng “con” mang c¸c ®o¹n ADN cµi kÝch th−íc ng¾n h¬n (vÝ dô: b»ng vect¬
pUC18). ViÖc giải trình tự ngẫu nhiên ®−îc tiÕn hµnh lÇn l−ît b¾t ®Çu tõ c¸c
ng©n hµng “con”. Phương pháp giải trình tự ngẫu nhiên phân cấp giúp việc sắp xếp
các contig dÔ dµng hơn.

11.2.9.3. T×m gen tõ c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù


Sau khi hệ gen của một sinh vật đã được giải tr×nh tù xong, người ta có thể dùng một
số phương pháp khác nhau để tìm và xác định vị trí các gen trên NST, bao gồm:
• Duyệt trình tự. Các gen mã hóa cho protein phải chứa một khung đọc mở (ORF)
mang một chuỗi (không dấu “phảy”) các bộ ba (codon) mã hóa tương ứng cho một
trình tự axit amin của protein. Khung đọc mở sẽ bắt ®Çu bởi mã mở đầu 5’-ATG-
3’ của mạch mã hóa (tương ứng với 3’-TAC-5’ của mạch không mã hóa, tức mạch
làm khuôn; và mã 5’-AUG-3’ của mARN), đồng thời kết thúc ở một trong các mã
bộ ba (TAA, TAG hoặc TGA). Chiều dài trung bình của mỗi ORF khác nhau giữa
các loài. Ở E. coli, chiều dài trung bình của một ORF là 317 codon; trong khi ở
nấm men, chiều dài trung bình của một ORF là 483 codon. Nhưng nhìn chung,
mỗi ORF thường chứa nhiều hơn 50 codon. Vì vậy, để tìm các gen trong hệ gen, có
thể áp dụng phương pháp duyệt trình tự theo kiểu trượt dọc mỗi mạch ADN và tìm
các codon mở đầu và codon kết thúc cách nhau trên 100 codon. Phương pháp này
hiệu quả khi duyệt trình c¸c hÖ gen prokaryote v× hÖ gen cña chóng kh«ng cã
tÝnh ph©n m¶nh. Nhưng, với hệ gen eukaryote, phương pháp này gặp khó khăn vì
các ORF thường bị phân mảnh thành exon và intron. Việc duyệt trình tù hệ gen
eukaryote, kể cả ng−êi th−êng ph¶i nhê c¸c phÇn mÒm m¸y tÝnh nh− Grail,
Genemark, v.v… Nh÷ng phÇn mÒm nµy x¸c ®Þnh c¸c ORF kh«ng chØ dùa trªn
c¸c m· më ®Çu vµ kÕt thóc dÞch m·, mµ cßn dùa trªn mét sè thuËt to¸n thèng
kª x¸c ®Þnh nh÷ng ®o¹n cã tiÒm n¨ng m· hãa, còng nh− c¸c tr×nh tù vïng biªn
cña c¸c exon vµ intron, c¸c tr×nh tù ®iÒu hßa phiªn m·, nh− hộp TATA, INR,
DPE … lµ nh÷ng tr×nh tù cÇn thiÕt cho sù g¾n kÕt cña yÕu tè TFIID vµ phøc hÖ
phiªn m· cña ARN pol II (xem ch−¬ng 3). Tuy vËy, ngoµi c¸c m· më ®Çu vµ kÕt
thóc dÞch m·, c¸c tr×nh tù kh¸c cã møc ®é biÕn ®æi lín, nªn viÖc x¸c ®Þnh chÝnh

342
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

x¸c mét gen kh«ng ph¶i lóc nµo còng ®óng. §Ó h¹n chÕ nh−îc ®iÓm nµy, mét
ph−¬ng ph¸p bæ sung lµ gen ®−îc x¸c ®Þnh trªn c¬ së c¸c gen ®· biÕt ë c¸c loµi
sinh vËt kh¸c (v× chóng th−êng cã tr×nh tù t−¬ng ®ång hoÆc gièng nhau). Tuy
vËy, ph−¬ng ph¸p ®èi chiÕu nµy còng cã nguy c¬ lµ c¸c gen gi¶ (pseudogene,
th−êng kh«ng ®−îc phiªn m·) ®−îc tÝnh nhÇm lµ gen.
• So s¸nh cADN. Mét c¸ch hiÖu qu¶ ®Ó x¸c ®Þnh mét gen trong hÖ gen lµ so s¸nh
tr×nh tù cña nã víi mét b¶n sao cADN t−¬ng øng. Chóng ta biÕt r»ng, cADN
®−îc t¹o ra tõ mARN vµ chñ yÕu chøa c¸c tr×nh tù exon cña ORF. ViÖc so s¸nh
tr×nh tù cã thÓ thùc hiÖn nhê phÇn mÒm m¸y tÝnh hoÆc sö dông ph−¬ng ph¸p lai
gi÷a c¸c ®o¹n ADN hÖ gen víi mARN (ph−¬ng ph¸p lai Northern). C¸c ®o¹n
®¸nh dÊu tr×nh tù biÓu hiÖn - EST (expressed sequence tag) th−êng ®−îc sö
dông cho môc ®Ých nµy. EST thùc chÊt lµ c¸c ®o¹n tr×nh tù ng¾n (thường dài 200 –
500 bp) th−êng ®−îc t¹o ra trªn c¬ së gi¶i tr×nh tù tõ mét trong hai ®Çu cña mét
cADN. Nhê c¸c EST cã tÝnh ®¹i diÖn cho phÇn hÖ gen ®−îc biÓu hiÖn nªn chóng
rÊt hiÖu qu¶ ®Ó t×m kiÕm c¸c gen. Trong thùc nghiÖm, c¸c EST cßn nhiÒu −u ®iÓm
kh¸c n÷a, ®ã lµ: (1) c¸c ®o¹n EST ®−îc t¹o ra t−¬ng ®èi dÔ dµng vµ chi phÝ thÊp;
(2) chØ cÇn gi¶i tr×nh tù mét lÇn duy nhÊt lµ ®ñ ®Ó t¹o ra c¸c EST ®Æc thï víi mét
cADN, tøc lµ mét gen; (3) c¸c lçi g©y ra do gi¶i tr×nh tù th−êng kh«ng cÇn kiÓm tra
l¹i, bëi c¸c EST còng chØ ®−îc dïng ®Ó t×m c¸c tr×nh tù gÇn gièng. C¸c c¬ së d÷
liÖu EST hiÖn nay (vÝ dô: http://www.ncbi.nlm.nih.gov/dbEST/) cung cÊp trªn 5
triÖu tr×nh tù EST kh¸c nhau cña ng−êi. TÊt nhiªn, trong ®ã cã nhiÒu tr×nh tù
trïng nhiÒu lÇn (®Æc biÖt lµ c¸c gen cã møc ®é biÓu hiÖn cao vµ phæ biÕn); vµ cã
thÓ cßn thiÕu mét sè EST t−¬ng øng víi c¸c gen cã møc ®é biÓu hiÖn thÊp hoÆc
hiÕm gÆp (vÝ dô: chØ ë mét tÕ bµo, hoÆc
chØ biÓu hiÖn trong ®iÒu kiÖn ®Æc biÖt). a)

11.2.10. X¸c ®Þnh vai trß vµ chøc n¨ng gen


C¸c dù ¸n gi¶i tr×nh tù c¸c hÖ gen ®· dÉn Galactokinase
®Õn nhiÒu kÕt qu¶ thó vÞ vµ kh«ng Ýt bÊt ngê.
Ch¼ng h¹n nh−, c¸c nghiªn cøu ë E. coli vµ S.
cereviseae d−êng nh− ®· tiÕn hµnh chi tiÕt trong b)
hµng chôc n¨m, nh−ng khi gi¶i tr×nh tù xong hÖ
gen cña chóng, ng−êi ta míi biÕt r»ng míi chØ cã
30 - 40% sè gen cña chóng ®· tõng ®−îc nghiªn
cøu. ë nh÷ng loµi kh¸c, bao gåm c¶ con ng−êi, tØ lÖ
c¸c gen ®· tõng ®−îc nghiªn cøu cßn thÊp h¬n
nhiÒu. Tuy vËy, sau khi hÖ gen ®· ®−îc gi¶i tr×nh
tù xong, cã mét sè ph−¬ng ph¸p kh¸c gióp nhanh
chãng x¸c ®Þnh ®−îc vai trß vµ chøc n¨ng cña H×nh 11.15. So s¸nh tr×nh tù cña
nhiÒu gen trong hÖ gen, bao gåm: galactokinase tõ c¸c loµi kh¸c nhau.
a) Ph¶n øng xóc t¸c bëi enzym galactokinase.
• T×m kiÕm nh÷ng tr×nh tù gièng nhau. b) So s¸nh mét ®o¹n tr×nh tù axit amin cña
Còng gièng nh− viÖc sö dông c¸c c«ng cô galactokinase gi÷a c¸c loµi.
tin häc trong viÖc t×m kiÕm c¸c tr×nh tù Hs: Homo sapiens,
m· hãa cña hÖ gen, c¸c c¬ së d÷ liÖu vÒ c¸c Sc: Saccharomyces cerevisiae,
gen ®· biÕt (ë c¸c loµi sinh vËt kh¸c nhau) Ec: Escherichia coli,
Bs: Bacillus subtilis,
cã thÓ dïng ®Ó x¸c ®Þnh vai trß vµ chøc
Ca: Candida albicans,
n¨ng cña c¸c gen ch−a biÕt. ViÖc t×m kiÕm Hi: Haemophilus influenza,
c¸c tr×nh tù gièng nhau nµy th−êng dùa St: Salmonella typhimurium,
trªn c¸c tr×nh tù axit amin t−¬ng øng víi Kl: Kluyveromyces lactis,
c¸c tr×nh tù gen, v× tÝnh ®a d¹ng cña tr×nh At: Arabidopsis thaliana.

343
§inh §oµn Long

tù ADN th−êng cao h¬n tr×nh tù polypeptide t−¬ng øng do tÝnh tho¸i hãa cña m·
bé ba. Thùc nghiÖm còng x¸c nhËn r»ng, c¸c gen cã cïng chøc n¨ng ë c¸c sinh
vËt kh¸c nhau lu«n cã ®Æc ®iÓm chung. Ch¼ng h¹n nh−, hÇu hÕt c¸c loµi ®Òu cã
kh¶ n¨ng chuyÓn hãa galactose → glucose-6-P, trong ®ã enzym tham gia b−íc
®Çu tiªn cña con ®−êng chuyÓn hãa nµy (galactose → galactose-1-P) lµ mét
galactose kinase cã tÝnh ®Æc thï ë mçi loµi, nh−ng chóng ®Òu cã mét sè ®o¹n
tr×nh tù gièng nhau (hình 11.15). Nh− trªn ®· nãi, tr−íc khi gi¶i xong tr×nh tù
hÖ gen nÊm men, chØ cã kho¶ng 30% trong tæng sè 6000 gen cña nÊm men ®·
®−îc biÕt. Nh−ng, sau khi gi¶i m· xong hÖ gen nÊm men, b»ng ph−¬ng ph¸p t×m
kiÕm c¸c tr×nh tù gièng nhau, ng−êi ta x¸c ®Þnh ®−îc thªm chøc n¨ng cña
kho¶ng 30% gen n÷a. Nh− vËy, cßn kho¶ng 40% gen ch−a râ chøc n¨ng. TÊt
nhiªn, trong sè nµy cã thÓ cã mét sè gen gi¶. ViÖc x¸c ®Þnh chøc n¨ng gen v× vËy
cßn cÇn c¸c ph−¬ng ph¸p phèi hîp kh¸c n÷a.
• X¸c ®Þnh chøc n¨ng gen b»ng thùc nghiÖm. ë c¸c loµi sinh vËt m« h×nh, nh− E.
coli hay S. cereviseae, mét trong nh÷ng ph−¬ng ph¸p c¬ b¶n ®Ó x¸c ®Þnh chøc
n¨ng cña mét gen ch−a biÕt lµ lµm bÊt ho¹t gen b»ng kü thuËt “knock-out”.
Trong kü thuËt nµy, ng−êi ta dïng nguyªn t¾c t¸i tæ hîp t−¬ng ®ång ®Ó lµm háng
c¸c b¶n sao b×nh th−êng cña gen. KiÓu h×nh cña c¸c thÓ ®ét biÕn ®−îc kiÓm tra
vµ ®èi chiÕu víi kiÓu d¹i ®Ó x¸c ®Þnh chøc n¨ng gen. Ph−¬ng ph¸p nµy cã hiÖu
qu¶ trong nghiªn cøu x¸c ®Þnh vai trß cña nhiÒu gen. Ch¼ng h¹n nh− ë nÊm
men, viÖc so s¸nh tr×nh tù kh«ng gióp x¸c ®Þnh ®−îc chøc n¨ng cña mét gen cã
tªn lµ SNU17, do tr×nh tù cña nã rÊt kh¸c víi tr×nh tù c¸c gen ®· biÕt. Nh−ng
khi gen nµy bÞ háng, tÕ bµo nÊm men chØ ph¸t triÓn chËm vµ th−êng cã nhiÒu
sai háng trong qu¸ tr×nh hoµn thiÖn mARN. Qua ®ã, chøc n¨ng cña SNU17 ®−îc
t×m thÊy lµ yÕu tè tham gia hoµn thiÖn mARN. §iÓm khã cña ph−¬ng ph¸p nµy
lµ trong nhiÒu tr−êng hîp, c¸c c¸ thÓ mang gen bÞ háng hoÆc chÕt sím hoÆc
kh«ng biÓu hiÖn kiÓu h×nh kh¸c biÖt. C¶ hai tr−êng hîp nµy ®Òu kh«ng dÉn ®Õn
kÕt luËn ch¾c ch¾n nµo. Khi gen bÞ “knock-out” g©y chÕt cã thÓ suy luËn r»ng
protein do gen m· hãa cã vai trß sèng cßn ®èi víi sinh vËt, nh−ng vai trß cô thÓ
thÕ nµo th× kh«ng râ. Mét ph−¬ng ph¸p c¶i tiÕn kh¸c ®Ó x¸c ®Þnh vai trß cña gen
lµ lµm t¨ng møc biÓu hiÖn cña nã, råi theo dâi kiÓu h×nh thÓ ®ét biÕn.
MÆc dï ®· cã c¸c ph−¬ng ph¸p ph¸t hiÖn chøc n¨ng gen nh− trªn, nh−ng nh×n chung
ë nhiÒu gen, chøc n¨ng gen ph¶i ®−îc ph©n tÝch trªn c¬ së tõng gen riªng rÏ. ThÕ nªn, khèi
l−îng c«ng viÖc cho m¶ng nghiªn cøu nµy cßn rÊt lín. Riªng nÊm men, cßn kho¶ng Ýt nhÊt
2000 gen ch−a ®−îc x¸c ®Þnh chøc n¨ng, cßn ë ng−êi vµo kho¶ng 20.000 gen.

11.3. C¸c kü thuËt ph©n tÝch protein


MÆc dï sù biÓu hiÖn cña gen th−êng ®−îc ®¸nh gi¸ ë møc ®é phiªn m· th«ng qua
viÖc ph©n tÝch s¶n phÈm phiªn m· lµ mARN (ch¼ng h¹n b»ng ph−¬ng ph¸p lai Northern
®· nªu ë trªn), nh−ng thùc tÕ l−îng mARN cã trong tÕ bµo kh«ng ph¶i lóc nµo còng
t−¬ng ®ång víi l−îng protein s¶n phÈm cuèi cïng cña gen vµ ho¹t tÝnh cña nã. Sù kh«ng
t−¬ng ®ång gi÷a l−îng s¶n phÈm phiªn m· víi l−îng vµ ho¹t tÝnh cña s¶n phÈm dÞch m·
cã thÓ do nhiÒu nguyªn nh©n, bao gåm:
a) Mét sè ARN kh«ng ®−îc dïng ®Ó dÞch m· nªn kh«ng t¹o bÊt cø protein nµo.
b) Mét sè tiÒn-ARN cã c¸ch xÐn intron biÕn ®æi nªn mét gen cã thÓ ®−îc dïng m·
hãa nhiÒu protein kh¸c nhau.
c) Tèc ®é dÞch m· vµ biÕn tÝnh c¸c mARN kh¸c nhau cã thÓ kh¸c nhau, nªn l−îng
mARN cã trong tÕ bµo ch−a ch¾c ®· t−¬ng quan víi l−îng protein.

344
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

d) Ho¹t tÝnh cña nhiÒu protein thay ®æi do nh÷ng c¶i biÕn protein sau dÞch m·,
ch¼ng h¹n nh− sù biÕn ®æi mét sè axit amin, sù bæ sung hay mÊt ®i mét sè nhãm
chøc (nh− acetyl, phosphate, AMP, ADP-ribose, v.v...).
e) NhiÒu protein ®−îc “c¾t tØa” sau dÞch m·, hoÆc ®−îc bæ sung thªm c¸c gèc ®−êng
hay lipid ®Ó t¹o thµnh c¸c glycoprotein vµ lipoprotein.
f) B¶n th©n c¸c protein cã ®é bÒn vµ tèc ®é ph©n hñy rÊt kh¸c nhau.
g) §ã lµ ch−a kÓ ®Õn nh÷ng biÕn ®æi cña protein cßn phô thuéc vµo c¸c ®iÒu kiÖn
sinh tr−ëng, ph¸t triÓn cña tÕ bµo; phô thuéc vµo c¸c ho¹t ®éng t−¬ng t¸c cña
protein víi c¸c gen vµ c¸c protein kh¸c. V× vËy, ®Ó ®¸nh gi¸ møc ®é biÓu hiÖn cña
mét gen, kh«ng thÓ chØ dõng ë møc phiªn m· vµ cßn cÇn ®¸nh gi¸ ë møc dÞch
m·. Ngoµi ra, sau giai ®o¹n nhiÒu hÖ gen sinh vËt m« h×nh vµ ng−êi ®· ®−îc gi¶i
tr×nh tù, vÊn ®Ò tån t¹i l¹i lµ phÇn lín c¸c gen cña chóng ch−a râ chøc n¨ng. VÝ
lý do nµy, nhiÒu nhµ khoa häc cho r»ng thÕ kû 21 lµ thÕ kû cña hÖ protein häc.
D−íi ®©y lµ mét sè ph−¬ng ph¸p ph©n tÝch protein c¬ b¶n.

11.3.1. ChuÈn bÞ dÞch nghiÒn tÕ bµo ®Ó tinh s¹ch protein


ViÖc ph©n lËp vµ tinh s¹ch c¸c protein riªng rÏ cã ý nghÜa quyÕt ®Þnh ®Õn kh¶ n¨ng
t×m hiÓu chøc n¨ng cña chóng. MÆc dï trong mét sè tr−êng hîp, chóng ta cã thÓ nghiªn
cøu chøc n¨ng cña protein ë d¹ng hçn hîp phøc t¹p, nh−ng phÇn lín nh÷ng nghiªn cøu
nµy th−êng dÉn ®Õn nh÷ng kÕt luËn kh«ng râ rµng. Ch¼ng h¹n nh− khi chóng ta nghiªn
cøu vÒ ho¹t tÝnh cña mét enzym ADN pol trong mét hçn hîp protein th« (ch¼ng h¹n tõ
dÞch ph©n gi¶i tÕ bµo), c¸c enzym ADN pol vµ protein thµnh phÇn kh¸c còng cã thÓ ¶nh
h−ëng ®Õn hiÖu suÊt tæng hîp ADN quan s¸t ®−îc trong thùc nghiÖm. V× vËy, viÖc tinh
s¹ch c¸c protein lµ mét b−íc quan träng trong qu¸ tr×nh t×m hiÓu chøc n¨ng cña chóng.
Mçi mét protein th−êng cã mét sè ®Æc tÝnh riªng nªn qui tr×nh tinh s¹ch chóng
th−êng cã tÝnh ®Æc thï. §iÒu nµy th× tr¸i ng−îc víi ADN, vèn nh×n chung gièng nhau vÒ
cÊu tróc vµ thµnh phÇn, chØ kh¸c nhau vÒ tr×nh tù nucleotide. C¸c b−íc tinh s¹ch protein
th−êng dùa trªn c¸c ®Æc tÝnh cña chóng vÒ kÝch th−íc, h×nh d¹ng, ®iÖn tÝch vµ nhiÒu khi
lµ chøc n¨ng.
VËt liÖu khëi ®Çu cho hÇu hÕt c¸c qu¸ tr×nh tinh s¹ch protein tõ sinh vËt lµ c¸c dÞch
nghiÒn tÕ bµo. Kh«ng gièng ADN vèn cã kh¶ n¨ng håi tÝnh kÓ c¶ khi ë ngoµi tÕ bµo,
protein rÊt dÔ bÞ biÕn tÝnh vµ bÞ ph©n hñy sau khi bÞ gi¶i phãng khái tÕ bµo. V× lý do nµy,
hÇu hÕt qu¸ tr×nh chuÈn bÞ c¸c dÞch chiÕt vµ tinh s¹ch protein cÇn ®−îc tiÕn hµnh ë nhiÖt
®é l¹nh (d−íi 4oC). Cã mét sè c¸ch chuÈn bÞ dÞch nghiÒn tÕ bµo. C¸c tÕ bµo cã thÓ ®−îc
ph©n gi¶i b»ng hãa chÊt, b»ng c¸c biÖn ph¸p c¬ häc lµm vì thµnh tÕ bµo, b»ng xö lý víi
dung dÞch nh−îc tr−¬ng (lµm tÕ bµo tr−¬ng lªn do n−íc ®i vµo vµ vì ra), v.v... §iÓm chung
cña c¸c ph−¬ng ph¸p lµ lµm thµnh tÕ bµo vì ra vµ gi¶i phãng c¸c protein. Trong nhiÒu
tr−êng hîp, c¸c tÕ bµo cÇn ®−îc chuyÓn vÒ tr¹ng th¸i ®«ng l¹nh, vÝ dô: b»ng m¸y c« l¹nh
ch©n kh«ng, sau ®ã ®−îc nghiÒn b»ng m¸y nghiÒn mÉu tr−íc khi tiÕn hµnh chiÕt xuÊt vµ
tinh s¹ch protein.

11.3.2. Sö dông s¾c ký cét ®Ó tinh s¹ch protein


C¸ch tinh s¹ch protein phæ biÕn nhÊt lµ sö dông c¸c ph−¬ng ph¸p s¾c ký cét.
Trong c¸c ph−¬ng ph¸p nµy, c¸c protein ®−îc cho ch¹y qua cét chøa hÖ thèng m¹ng l−íi
h×nh thµnh bëi c¸c h¹t agarose, polyacrylamide hoÆc dextran (Sephadex). Tïy thuéc vµo
®Æc tÝnh cña protein, cã thÓ sö dông mét sè ph−¬ng ph¸p vµ qui tr×nh kü thuËt kh¸c
nhau. Cã ba ph−¬ng ph¸p s¾c ký cét c¬ b¶n lµ s¾c ký trao ®æi ion, s¾c ký läc gel vµ s¾c ký
¸i lùc.

345
§inh §oµn Long

11.3.2.1. S¾c ký trao ®æi ion


Trong ph−¬ng a) b)
ph¸p nµy, c¸c protein ++-
®−îc ph©n t¸ch dùa -
+ -
trªn ®iÖn tÝch ion hãa -+

bÒ mÆt cña chóng


b»ng viÖc sö dông c¸c -++-
vËt liÖu nhåi cét (cßn
®−îc gäi lµ pha tÜnh) Protein tÝch
®iÖn d−¬ng
lµ c¸c h¹t mang c¸c
nhãm tÝch ®iÖn ©m H¹t nhåi cét
hoÆc d−¬ng (h×nh tÝch ®iÖn ©m

11.16a). C¸c protein Protein tÝch


t−¬ng t¸c yÕu víi pha ®iÖn ©m
tÜnh (ch¼ng h¹n,
protein tÝch ®iÖn
d−¬ng ®−îc cho ch¹y
qua pha tÜnh mang
®iÖn ©m) ban ®Çu
®−îc gi÷ l¹i trong cét, H×nh 11.16. S¾c ký cét ®Ó tinh s¹ch protein. a) S¾c ký trao ®æi ion, b) S¾c ký läc
sau ®ã sÏ ®−îc röa gel (vÏ theo Watson et al., 2004)
chiÕt b»ng mét dung dÞch muçi lo·ng ch¶y qua cét (dung dÞch ®Öm ch¹y mÉu ®−îc gäi lµ
pha ®éng). C¸c protein t−¬ng t¸c víi pha tÜnh cµng m¹nh, cµng cÇn nång ®é muèi cao ®Ó
röa chiÕt. B»ng viÖc t¨ng gradient nång ®é muèi trong c¸c dung dÞch ®Öm röa chiÕt, c¸c
protein kh¸c nhau vÒ kÝch th−íc, khèi l−îng vµ møc ®é ion hãa bÒ mÆt sÏ ph©n t¸ch khái
nhau thµnh c¸c ph©n ®o¹n khi chóng ®i qua cét.
11.3.2.2. S¾c ký läc gel
S¾c ký läc gel (h×nh 11.16b) cho phÐp ph©n t¸ch c¸c protein chñ yÕu kh¸c nhau vÒ
h×nh d¹ng vµ kÝch th−íc. Kh¸c víi s¾c ký trao ®æi ion, vËt liÖu ®Ó nhåi cét kh«ng mang
c¸c nhãm tÝch ®iÖn mµ thay vµo ®ã chóng t¹o nªn hÖ thèng m¹ng cã kÝch th−íc lç kh¸c
nhau (gièng gel, v× vËy gäi lµ s¾c ký läc gel). C¸c ph©n tö protein cµng nhá cµng cã kh¶
n¨ng th©m nhËp vµo tÊt c¶ c¸c lç cã kÝch th−íc kh¸c nhau; v× vËy, thêi gian ch¹y qua cét
sÏ dµi h¬n vµ ®−îc röa chiÕt muén h¬n. Ng−îc l¹i, c¸c ph©n tö protein cµng lín cµng ®−îc
röa chiÕt sím.
Trong s¾c ký cét, c¸c ph©n ®o¹n thu ®−îc ë nång ®é muèi kh¸c nhau hoÆc ë thêi
gian kh¸c nhau, ®ång thêi cã ho¹t tÝnh protein mong ®îi cao nhÊt ®−îc tÝch lòy vµ tinh
s¹ch bæ sung. Møc ®é tinh s¹ch cña protein cã xu h−íng t¨ng lªn khi c¸c ph©n ®o¹n
protein ®−îc cho ch¹y qua nhiÒu lo¹i cét s¾c ký kh¸c nhau. Th−êng th× mét cét s¾c ký
®¬n lÎ kh«ng ®ñ ®Ó tinh s¹ch mét lo¹i protein mong muèn dï qui tr×nh s¾c ký ®ã ®−îc lÆp
l¹i nhiÒu lÇn. Thay vµo ®ã, ng−êi ta th−êng ¸p dông mét lo¹t c¸c kü thuËt ®Ó cã thÓ thu
håi mét ph©n ®o¹n chøa mét l−îng lín protein ®−îc quan t©m. Nãi c¸ch kh¸c, tuy cã
nhiÒu ph©n tö protein ®−îc röa chiÕt trong dung dÞch muèi ®Ëm ®Æc tõ cét tÝch ®iÖn
d−¬ng (vÝ dô tr−êng hîp protein tÝch ®−îc ©m) hoÆc ®−îc röa chiÕt trong s¾c ký läc gel
(víi protein kÝch th−íc nhá), c¸c kü thuËt ®¬n lÎ nµy th−êng kh«ng ®ñ ®Ó cã thÓ thu ®−îc
mét s¶n phÈm protein tinh s¹ch hoµn toµn.
11.3.2.3. S¾c ký ¸i lùc hç trî tinh s¹ch protein
§Æc tÝnh cña mçi lo¹i protein cã thÓ ®−îc dïng nh»m lµm tinh s¹ch lo¹i protein
t−¬ng øng. Ch¼ng h¹n, nÕu mét lo¹i protein cã tÝnh liªn kÕt ®Æc hiÖu víi ATP, th× cã thÓ

346
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

dïng cét s¾c ký mang vËt liÖu g¾n kÕt víi ATP ®Ó ph©n t¸ch protein ®ã. ChØ cã protein
liªn kÕt víi ATP míi ®−îc cét gi÷ l¹i, cßn hÇu hÕt c¸c protein kh«ng liªn kÕt víi ATP bÞ
röa tr«i khái cét. Kü thuËt tinh s¹ch nµy ®−îc gäi lµ s¾c ký ¸i lùc. Cã nhiÒu chÊt kh¸c
nhau cã thÓ ®−îc dïng ®Ó g¾n kÕt víi vËt liÖu nhåi cét vµ gióp qu¸ tr×nh tinh s¹ch
protein ®¹t hiÖu qu¶ cao h¬n. C¸c chÊt nµy bao gåm c¶ ADN (®Ó tinh s¹ch protein liªn
kÕt ADN) hay thËm chÝ lµ protein (®Ó tinh s¹ch mét lo¹i protein kh¸c t−¬ng t¸c ®Æc thï
víi nã). Nh− vËy, ®Ó tinh s¹ch mét protein nµo ®ã, cÇn ph¶i cã nh÷ng hiÓu biÕt c¬ b¶n vÒ
®Æc tÝnh lý hãa cña protein ®ã.
Mét d¹ng cña s¾c ký ¸i lùc ®−îc dïng phæ biÕn lµ s¾c ký ¸i lùc miÔn dÞch. Trong
ph−¬ng ph¸p nµy, ng−êi ta g¾n kh¸ng thÓ ®Æc hiÖu víi protein ®Ých lªn vËt liÖu lµm cét.
Trong tr−êng hîp lý t−ëng, lo¹i kh¸ng thÓ nµy chØ liªn kÕt ®óng víi protein cÇn tinh
s¹ch. Lo¹i protein liªn kÕt víi kh¸ng thÓ sau ®ã ®−îc röa chiÕt b»ng c¸ch cho ch¶y qua
cét dung dÞch muèi hoÆc chÊt tÈy nhÑ. Khã kh¨n gÆp ph¶i víi ph−¬ng ph¸p nµy lµ ®«i khi
liªn kÕt kh¸ng thÓ - protein bÒn v÷ng ®Õn møc ph¶i g©y biÕn tÝnh protein míi thu håi
®−îc s¶n phÈm. Nh−ng, kh«ng gièng ADN, protein sau khi biÕn tÝnh th−êng kh«ng håi
tÝnh trong ®iÒu kiÖn in vitro, nªn protein thu ®−îc nhiÒu khi kh«ng ë d¹ng ho¹t ®éng
chøc n¨ng.
§Ó t¨ng hiÖu suÊt tinh s¹ch, còng cã thÓ c¶i biÕn protein. Mét vÝ dô vÒ sù c¶i biÕn
nµy lµ bæ sung mét ®o¹n peptide ng¾n vµo ®Çu C hoÆc ®Çu N cña ph©n tö protein cÇn
ph©n tÝch. ViÖc bæ sung “tr×nh tù ®¸nh dÊu” nµy cã thÓ thùc hiÖn ®−îc b»ng kü thuËt di
truyÒn. C¸c tr×nh tù peptide ®¸nh dÊu lµm thay ®æi mét sè thuéc tÝnh cña protein vµ
gióp viÖc tinh chÕ dÔ dµng h¬n. VÝ dô, mét sè protein sau khi ®−îc bæ sung mét chuçi
peptide gåm 6 His trë nªn t−¬ng t¸c víi cét Ni2+ tèt h¬n vµ dÔ ph©n t¸ch h¬n (trong khi
nh÷ng protein kh¸c kh«ng cã ®Æc tÝnh nµy). Còng cã thÓ sö dông epitop ®Æc hiÖu
(th−êng lµ mét ®o¹n peptide cã 5 - 7 axit amin x¸c ®Þnh kh¸ng nguyªn) ®Ó tinh s¹ch lo¹i
protein cã ¸i lùc cao víi nã. C¸c c¶i tiÕn nµy cho phÐp tinh s¹ch c¸c protein trªn c¬ së
nguyªn t¾c miÔn dÞch. ¦u ®iÓm cña ph−¬ng ph¸p nµy lµ: c¸c epitop cã thÓ thay ®æi tÝnh
liªn kÕt kh¸ng thÓ tïy thuéc vµo ®iÒu kiÖn m«i tr−êng (ch¼ng h¹n, ¸i lùc gi¶m khi cã
Ca2+, vµ t¨ng khi kh«ng cã Ca2+). §iÒu nµy gióp h¹n chÕ viÖc sö dông c¸c yÕu tè g©y biÕn
tÝnh kh¸c.
Nguyªn t¾c s¾c ký ¸i lùc miÔn dÞch còng ®−îc dïng ®Ó g©y kÕt tña nhanh mét lo¹i
protein ®Æc hiÖu nµo ®ã tõ dÞch chiÕt th«. Trong tr−êng hîp nµy, ph¶n øng kÕt tña miÔn
dÞch x¶y ra do kh¸ng thÓ ®−îc g¾n vµo cïng lo¹i vËt liÖu lµm pha tÜnh trong s¾c ký cét.
Do c¸c h¹t nµy cã kÝch th−íc lín nªn chóng l¾ng rÊt nhanh trong èng nghiÖm chøa dung
dÞch ®Öm vµ mang theo c¸c protein liªn kÕt víi chóng (qua kh¸ng thÓ). Kü thuËt nµy
®−îc gäi lµ kÕt tña miÔn dÞch, còng ®−îc dïng ngµy cµng phæ biÕn trong c¸c thÝ nghiÖm
cÇn tinh s¹ch protein. MÆc dï nÕu chØ dïng riªng rÏ ph−¬ng ph¸p nµy, hiÕm khi thu ®−îc
s¶n phÈm protein tinh s¹ch hoµn toµn, song ph−¬ng ph¸p nµy rÊt hiÖu qu¶ ®Ó x¸c ®Þnh
c¸c lo¹i protein hoÆc hîp chÊt kh¸c (vÝ dô mét tr×nh tù ADN) cã t−¬ng t¸c víi mét lo¹i
protein ®Ých nµo ®ã.

11.3.3. Ph©n tÝch protein trªn gel polyacrylamide

11.3.3.1. Kü thuËt ®iÖn di trªn gel polyacrylamide (PAGE)


Kh«ng gièng c¸c axit nucleic, protein th−êng kh«ng mang ®iÖn tÝch ®ång ®Òu hay cã
cÊu tróc bËc hai ®ång nhÊt däc chiÒu dµi ph©n tö. Thay vµo ®ã, tõ 20 lo¹i axit amin c¬
b¶n (trong ®ã cã 15 axit amin trung tÝnh, 3 axit amin tÝch ®iÖn d−¬ng, 2 axit amin tÝch
®iÖn ©m; xem ch−¬ng 1) phÇn lín c¸c protein lµ trung tÝnh, mét sè kh¸c tÝch ®iÖn d−¬ng,
sè cßn l¹i tÝch ®iÖn ©m. Ngoµi cÊu tróc bËc 2, protein ë d¹ng ho¹t ®éng th−êng cã cÊu tróc
bËc 3 hoÆc 4 ®iÓn h×nh. Nh−ng khi ®−îc ®−îc xö lý víi c¸c chÊt tÈy (ion hãa) m¹nh nh−

347
§inh §oµn Long

SDS (sodium dodecyl sulphate, c«ng thøc lµ CH3-(CH2)11SO4-) hay c¸c chÊt khö nhãm
sulfhydryl, nh− β -mercapthoethanol (HS-CH2CH2OH) th× c¸c cÊu tróc bËc 2, 3 vµ 4
cña protein bÞ ph¸ vì. Lóc nµy, SDS t¹o thµnh líp vá ion ©m bao bäc protein lµm protein
trë nªn tÝch ®iÖn ©m ®ång ®Òu däc ph©n tö. β-mecarptoethanol lµm “®øt g·y” c¸c liªn kÕt
disulfide (S-S) gi÷a c¸c Cys. Trªn c¬ së nµy, nÕu c¸c ph©n tö protein ®−îc g©y biÕn tÝnh
bëi SDS vµ β-mercaptoethanol, th× sù ph©n t¸ch protein trong ®iÖn di chñ yÕu lµ do sù
kh¸c biÖt vÒ kÝch th−íc vµ khèi l−îng ph©n tö. Khi kh«ng cã SDS vµ β-mercaptoethanol,
c¸c protein vÉn cã thÓ ph©n t¸ch b»ng ®iÖn di, nh−ng lóc nµy sù ph©n t¸ch cña chóng cßn
phô thuéc vµo nhiÒu yÕu tè kh¸c nh− cÊu h×nh, ®iÓm ®¼ng ®iÖn, sù t−¬ng t¸c ph©n tö ...
Mét ®iÓm kh¸c biÖt n÷a so víi c¸c axit nucleic lµ protein th−êng cã kÝch th−íc trung
b×nh nhá h¬n nhiÒu so víi c¸c axit nucleic, nªn gel ®iÖn di protein th−êng ®−îc lµm tõ
polyacrylamide. HÖ thèng “m¹ng” mµ hîp chÊt polyme nh©n t¹o nµy t¹o ra nhá h¬n so
víi gel agarose. Kü thuËt ®iÖn di trªn gen polyacrylamide ®−îc viÕt t¾t lµ PAGE. Sau khi
®iÖn di, ®Ó quan s¸t c¸c protein ®−îc nhuém víi mét trong hai chÊt nhuém phæ biÕn lµ
Coomassie blue hoÆc b¹c (Ag2+). Coomassie blue liªn kÕt chÆt víi protein t¹o nªn c¸c
b¨ng ®iÖn di cã mµu xanh; c¸c nguyªn tö b¹c còng liªn kÕt m¹nh víi protein t¹o nªn
phøc hÖ cã mµu n©u – ®en. Nhuém b¹c th−êng nh¹y h¬n coomassie blue, nh−ng ®¾t h¬n.
11.3.3.2. §iÖn di protein trªn gel polyacrylamide hai chiÒu (2D-PAGE)
Do sè l−îng c¸c ph©n tö protein trong c¸c mÉu sinh häc th−êng rÊt lín nªn ph−¬ng
ph¸p ®iÖn di th«ng th−êng kh«ng ®ñ ®Ó ph©n t¸ch c¸c protein gièng nhau ra khái nhau.
V× vËy, c¸c ph©n tö protein th−êng ®−îc t¸ch tr−íc tiªn dùa trªn sù kh¸c biÖt vµ ®iÖn
tÝch bÒ mÆt cña chóng (gäi lµ chiÒu thø nhÊt); sau ®ã, dùa trªn sù kh¸c biÖt vÒ kÝch th−íc
(gäi lµ chiÒu thø hai). Ph−¬ng ph¸p ®iÖn di nµy ®−îc tiÕn hµnh trªn gel polyacrylamide
vµ ®−îc gäi t¾t lµ 2D-PAGE. Trong chiÒu thø nhÊt, mét gradient pH (tõ ~3 ®Õn 10)
®−îc t¹o ra däc b¶n gel. C¸c protein tïy theo ®iÖn tÝch bÒ mÆt cña chóng sÏ dÞch chuyÓn
trªn gel ®iÖn di vÒ vÞ trÝ cã ®é pH t−¬ng ®−¬ng víi ®iÓm ®¼ng ®iÖn (pI) cña chóng (lµ
®iÓm mµ ®iÖn tÝch cña chóng ®−îc trung hßa). C¸c protein cã cïng ®iÓm ®¼ng ®iÖn sau ®ã
®−îc ph©n t¸ch nhê sù kh¸c nhau vÒ kÝch th−íc theo ph−¬ng ph¸p ®iÖn di th«ng th−êng.
C¸c kü thuËt 2D-PAGE c¶i tiÕn gÇn ®©y cho phÐp ph©n t¸ch ®ång thêi trªn 10.000
protein kh¸c nhau. Trªn b¶n ®iÖn di 2D-PAGE, mçi lo¹i protein th−êng "héi tô" thµnh
nh÷ng "vÕt ®èm". Mçi vÕt ®èm nµy sau ®ã cã thÓ ®−îc c¾t ra khái gel, xö lý víi protease,
råi ph©n tÝch b»ng ph−¬ng ph¸p khèi phæ (xem d−íi ®©y) ®Ó x¸c ®Þnh lo¹i protein.

11.3.4. §Þnh tÝnh protein dùa trªn thÈm t¸ch miÔn dÞch – lai Western
Tuy cã b¶n chÊt kh¸c ADN vµ ARN, viÖc x¸c ®Þnh sù cã mÆt mét lo¹i protein trong
mÉu sinh häc còng ®−îc thùc hiÖn theo nguyªn t¾c lai vµ ®−îc gäi lµ lai Western. Tuy
nhiªn, kh«ng gièng c¸c ph−¬ng ph¸p lai axit nucleic dùa trªn nguyªn t¾c liªn kÕt
Chargaff (b¶ng 11.2), lai Western lµ ph−¬ng ph¸p ®Þnh tÝnh protein dùa trªn nguyªn t¾c
miÔn dÞch; v× vËy, nã
cßn ®−îc gäi lµ thÈm B¶ng 11.2. C¸c ph−¬ng ph¸p lai ®Ó ph©n tÝch ADN, ARN vµ protein
t¸ch miÔn dÞch
(immunoblotting). Ph−¬ng ph¸p lai Lo¹i ph©n tö cÇn ph©n tÝch B¶n chÊt mÉu dß
Trong lai Western,
Southern ADN ADN (m¹ch ®¬n)
c¸c ph©n tö protein
sau khi ®−îc ph©n Northern ARN ADN (m¹ch ®¬n)
t¸ch trªn ®iÖn di
Western Protein Kh¸ng thÓ
®−îc chuyÓn lªn
mµng. Mµng nµy sau South-Western Protein ADN (sîi kÐp)
®ã ®−îc ñ trong mét

348
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

dung dÞch chøa kh¸ng thÓ ®Æc hiÖu víi protein ®−îc quan t©m nghiªn cøu. Kh¸ng thÓ sÏ
g¾n vµo lo¹i protein t−¬ng øng ë trªn mµng. Cuèi cïng, b»ng ph¶n øng enzym hiÖn mµu,
ng−êi ta cã thÓ quan s¸t ®−îc vÞ trÝ kh¸ng thÓ ë trªn mµng, qua ®ã cho biÕt sù cã mÆt vµ
khèi l−îng ph©n tö cña protein. Nh− vËy, ®iÓm chung cña tÊt c¶ c¸c ph−¬ng ph¸p lai
Southern, Northern vµ Western lµ sö dông c¸c hîp chÊt chän läc ®Ó ph¸t hiÖn sù cã mÆt
cña mét hoÆc mét sè lo¹i ph©n tö ®Æc thï trong c¸c hçn hîp phøc t¹p.
Mét ph−¬ng ph¸p lai c¶i tiÕn kh¸c ®−îc dïng ®Ó ph¸t hiÖn c¸c protein liªn kÕt ADN
lµ lai South-Western. Trong ph−¬ng ph¸p nµy, ng−êi ta dïng mÉu dß ADN (thay cho
kh¸ng thÓ trong lai Western) ®Ó lai víi c¸c protein. NÕu nh− trong lai Southern, mÉu dß
ADN th−êng ë d¹ng m¹ch ®¬n, th× mÉu dß trong lai South-Western th−êng ë d¹ng sîi kÐp,
v× phÇn lín protein liªn kÕt víi ADN sîi kÐp.

11.3.5. §Þnh lo¹i vµ gi¶i tr×nh tù protein


MÆc dï cã cÊu t¹o phøc t¹p h¬n so víi c¸c axit nucleic, c¸c ph©n tö protein còng cã
thÓ gi¶i tr×nh tù trùc tiÕp. Cã hai ph−¬ng ph¸p ®−îc sö dông phæ biÕn h¬n c¶ lµ: (1)
ph−¬ng ph¸p biÕn tÝnh Edman vµ (2) ph−¬ng ph¸p khèi phæ.
11.3.5.1. Gi¶i tr×nh tù protein b»ng ph−¬ng ph¸p g©y biÕn tÝnh Edman
Ph−¬ng ph¸p g©y biÕn tÝnh Edman lµ ph−¬ng ph¸p gi¶i tr×nh tù axit amin cña
c¸c ®o¹n peptide ng¾n, dùa trªn viÖc ®¸nh dÊu vµ c¾t axit amin ®Çu N lÇn l−ît khái
chuçi peptide mµ kh«ng ¶nh h−ëng ®Õn c¸c liªn kÕt peptide kh¸c trong ph©n tö protein.
Ph¶n øng c¾t ®−îc thùc hiÖn bëi phenylisothyocyanate (PITC, h×nh 11.17). Trong
dung dÞch kiÒm nhÑ, PITC ph¶n øng víi axit amin ®Çu N ®Ó h×nh thµnh nªn dÉn xuÊt
phenylthiocarbamoyl. Khi chuyÓn sang m«i tr−êng axit, axit amin ®Çu N bÞ “®øt ra” ë
d¹ng dÉn xuÊt axit amin thiazolinone. Axit amin thiazolinone sau ®ã ®−îc chiÕt xuÊt
chän läc b»ng dung m«i h÷u c¬, råi xö lý víi mét lo¹i axit ®Ó h×nh thµnh nªn dÉn xuÊt
bÒn v÷ng cña axit amin lµ phenylthiohydantoin (PTH). ChÊt nµy cã thÓ x¸c ®Þnh b»ng
s¾c ký hoÆc ®iÖn di. Quy tr×nh nµy ®−îc lÇn l−ît lÆp l¹i cho ®Õn axit amin cuèi cïng trong
chuçi polypeptide ®Ó gi¶i tr×nh tù. H¹n chÕ lín nhÊt cña kü thuËt nµy lµ hiÖu qu¶ gi¶i
tr×nh tù thÊp ë c¸c ®o¹n peptide dµi trªn 30 axit amin. Së dÜ nh− vËy, v× ph¶n øng biÕn
tÝnh c¸c axit amin ë c¸c ®o¹n peptide dµi th−êng kh«ng triÖt ®Ó. Mét h¹n chÕ kh¸c lµ kü
thuËt nµy gÆp trë ng¹i khi axit amin ®Çu N bÞ c¶i biÕn hãa häc (vÝ dô ®−îc g¾n thªm
nhãm acetyl hoÆc formyl) mµ hiÖn t−îng nµy vèn cã thÓ x¶y ra tù nhiªn trong ®iÒu kiÖn
in vivo, hoÆc trong qu¸ tr×nh t¸ch chiÕt vµ tinh s¹ch protein. Tuy vËy, c¶ hai h¹n chÕ nµy
Ph¶n øng biÕn tÝnh Edman Phenylisothiocyanate Alanine
Chu kú biÕn tÝnh 2 Chu kú biÕn tÝnh 1

§¸nh dÊu axit


amin ®Çu N
§¸nh dÊu axit
amin ®Çu N
Gi¶i phãng axit
amin ®Çu N

§¸nh dÊu axit


amin ®Çu N Gi¶i phãng axit
PITC-alanine amin ®Çu N
Gi¶i phãng axit
amin ®Çu N

§o¹n peptide ng¾n ®i 1 axit amin

H×nh 11.17. Gi¶i tr×nh tù protein trùc tiÕp b»ng ph−¬ng ph¸p biÕn tÝnh Edman (vÏ theo Watson vµ cs, 2004)

349
§inh §oµn Long

®Òu cã thÓ ®−îc kh¾c phôc b»ng c¸ch dïng protease c¾t c¸c ®o¹n peptide lín thµnh c¸c
®o¹n peptide nhá h¬n tr−íc khi gi¶i tr×nh tù. Víi ®o¹n peptide dµi 30 axit amin, ®é chÝnh
x¸c trong gi¶i tr×nh tù cña ph−¬ng ph¸p Edman lµ 98%. Dùa trªn nguyªn lý biÕn tÝnh
Edman, m¸y gi¶i tr×nh tù protein tù ®éng còng ®· ®−îc ph¸t triÓn vµ dïng réng r·i.

11.3.5.2. Gi¶i tr×nh tù protein b»ng ph−¬ng ph¸p khèi phæ


ViÖc ph©n tÝch c¸c protein hoÆc c¸c ®o¹n peptide b»ng ph−¬ng ph¸p khèi phæ
(MS) dùa trªn c¸c kü thuËt hãa ph©n tÝch cã ®é chÝnh x¸c cao; vµ gÇn ®©y ®−îc thiÕt kÕ
thµnh c¸c hÖ thèng tù ®éng do m¸y tÝnh ®iÒu khiÓn. Trong ph−¬ng ph¸p nµy, cã hai kü
thuËt c¬ b¶n quan träng nhÊt lµ ph©n hñy laser trong chÊt mang (th−êng gäi t¾t lµ
MALDI) vµ ion hãa phun ®iÖn (gäi t¾t lµ ESI). Kü thuËt MS gióp ®o tØ sè [khèi l−îng /
®iÖn tÝch] (m/z) cña ion, tõ ®ã x¸c ®Þnh ®−îc khèi l−îng ph©n tö. Nh−ng nÕu kh«ng cã c¸c
kü thuËt MALDI vµ ESI, MS kh«ng trùc tiÕp ph©n tÝch ®−îc c¸c ph©n tö lín nh− protein.
Trong kü thuËt MALDI (h×nh 11.18a), c¸c xung laser ®−îc dïng ®Ó “b¾n ph¸” c¸c
tinh thÓ chÊt r¾n vµ truyÒn n¨ng l−îng ®Ó c¸c ion cña tinh thÓ “b¾n ra” ë d¹ng khÝ. §èi
víi protein, ®Çu tiªn c¸c mÉu ®−îc “tinh thÓ” hãa (chuyÓn sang d¹ng r¾n) b»ng viÖc sö
dông chÊt nÒn. ChÊt nÒn ®−îc dïng trong kü thuËt MALDI th−êng lµ c¸c axit th¬m nh−
4-methoxy cinnamic acid. Sau khi bÞ tia laser “b¾n ph¸”, chÊt nÒn truyÒn n¨ng l−îng cho
“tinh thÓ” protein, lµm gi¶i phãng c¸c ion mµ kÝch th−íc vµ ®iÖn tÝch cña chóng ®Æc thï
víi mçi lo¹i protein. C¸c ion (lóc nµy ë d¹ng khÝ) ®−îc gia tèc trong mét tr−êng ®iÖn tõ cã
hiÖu ®iÖn thÕ cao sÏ bay qua mét èng ch©n kh«ng tíi c¶m biÕn tÝn hiÖu. ThiÕt bÞ c¶m biÕn
nµy ®o ®−îc kho¶ng thêi gian bay cña ion tõ nguån ph¸t sinh ion (tinh thÓ protein) tíi
®iÓm c¶m biÕn. Thêi gian ion bay tØ lÖ thuËn víi c¨n bËc hai cña tØ sè m/z. ThÕ nªn, tõ
thêi gian bay cã thÓ x¸c ®Þnh ®−îc tØ sè m/z cña mçi ion; tËp hîp c¸c tÝn hiÖu cña c¸c ion
cho phÐp x¸c ®Þnh tr×nh tù axit amin cña protein. Ph−¬ng ph¸p x¸c ®Þnh tØ sè m/z qua
thêi gian bay cña c¸c ion ®−îc gäi lµ kü thuËt t¸ch thêi gian bay (gäi t¾t lµ TOF).
Ph−¬ng ph¸p MS dùa trªn hai kü thuËt MALDI vµ TOF ®−îc gäi chung lµ MALDI-TOF.
V× kü thuËt MALDI-TOF rÊt nh¹y nªn l−îng mÉu ®−a vµo ph©n tÝch hiÖn nay cÇn
nhá h¬n 10-12mole. §Ó cã ®−îc mÉu protein tinh s¹ch ë l−îng nhá, ng−êi ta th−êng tiÕn
hµnh ®iÖn di 2D-PAGE ®Ó ph©n t¸ch protein; råi mçi protein ®−îc th«i khái gel vµ c¾t
b»ng protease (vÝ dô trypsin) thµnh mét tËp hîp c¸c ®o¹n peptide (th−êng ng¾n h¬n 20
axit amin) ®Æc thï cña mçi protein. Ngoµi viÖc x¸c ®Þnh ®−îc tr×nh tù axit amin, kü thuËt
MALDI-TOF ®ång thêi cho phÐp ph¸t hiÖn ®−îc c¸c protein ®−îc biÕn ®æi sau dÞch m·,
ch¼ng h¹n x¸c ®Þnh ®−îc c¸c axit amin ®−îc g¾n thªm c¸c gèc phosphate hoÆc gèc ®−êng.
Kü thuËt MALDI-TOF hiÖn nay cho phÐp gi¶i tr×nh tù cña protein cã khèi l−îng tíi

a) b)
Ph©n tö mÉu ë
C¶m biÕn tø cùc (bÉy ion)

Tia laser Vïng chuyÓn


d¹ng tinh thÓ
®−îc g¾n lªn tr¹ng th¸i
chÊt mang Mao qu¶n dÉn mÉu

Vïng chuyÓn
tr¹ng th¸i
C¶m biÕn TOF

Dung dÞch Giät dÞch H¹t ion


Giät dÞch L−íi
chøa mÉu mang mÉu trÇn
mang mÉu tÝch ®iÖn
nhá h¬n
ChÊt mang H×nh 11.18. C¸c ph−¬ng ph¸p khèi phæ. a) Ph−¬ng ph¸p khèi phæ
Ph©n tö mÉu L−íi ph©n hñy laser trong chÊt mang kÕt hîp víi thêi gian bay
bÞ ion hãa tÝch ®iÖn (MALDI/TOF), b) Ph−¬ng ph¸p ion hãa phun ®iÖn (ESI).

350
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

100.000 Da trong mét lÇn “c«ng ph¸” mÉu. Tuy vËy, víi c¸c c¶i tiÕn kü thuËt kh«ng
ngõng, cã lÏ thêi gian tíi, giíi h¹n ph©n tÝch protein cña MALDI-TOF sÏ cßn tiÕp tôc
t¨ng lªn.
NÕu MALDI lµ kü thuËt ®−îc dïng ®Ó t¹o ra c¸c ion ë d¹ng khÝ tõ chÊt r¾n, th× ESI
®−îc dïng ®Ó t¹o ra c¸c ion ë d¹ng khÝ tõ dÞch láng. Trong ESI, ng−êi ta dïng mét mao
qu¶n ®Ó nhá giät chÊt láng vµo tr−êng ®iÖn tõ cã hiÖu ®iÖn thÕ cao (h×nh 11.18b). Dung
m«i sÏ bay h¬i nhanh vµ giät nhá sÏ “vì ra”. Sù vì ra nh− vËy diÔn ra nhiÒu lÇn liªn tiÕp
t¹o nªn c¸c ion ®éc lËp (ion trÇn). C¸c h¹t ion ®−îc gia tèc bay trong èng ch©n kh«ng ®Õn
khi tiÕp cËn vµ ®−îc ®o khèi l−îng bëi bé c¶m biÕn tø cùc, cßn gäi lµ bÉy ion. Nh− vËy,
bÉy ion th−êng ®−îc dïng víi khèi phæ ESI. Khèi phæ ESI cã −u ®iÓm lµ nã th−êng ®−îc
nèi trùc tiÕp víi mét hÖ thèng ph©n t¸ch dÞch láng, bao gåm c¸c kü thuËt ®iÖn di mao
qu¶n (CE) hoÆc s¾c ký láng cao ¸p (HPLC). MÆc dï th«ng th−êng kh«ng ®−îc nèi trùc
tiÕp víi c¸c hÖ thèng MALDI-TOF, nh−ng c¸c kü thuËt CE vµ HPLC còng cã thÓ ®−îc
dïng ®Ó tinh s¹ch protein tr−íc khi ph©n tÝch b»ng MALDI-TOF.
Ngoµi ra, trong kü thuËt MS, do hiÖn t−îng c¸c ion “gèc” cã thÓ ph©n r· thµnh c¸c
ion “con”, nªn kü thuËt khèi phæ cã thÓ ®−îc thùc hiÖn nhiÒu lÇn kÕ tiÕp ®Ó thu ®−îc c¸c
sè liÖu ph©n tÝch chi tiÕt h¬n vÒ mçi ph©n tö protein. Kü thuËt nµy ®−îc gäi lµ khèi
phæ kÕ tiÕp (viÕt t¾t lµ MS/MS). Kü thuËt nµy cho phÐp ph©n biÖt ®−îc hai ion cã cïng
khèi l−îng (vÝ dô: ®Ó ph©n biÖt hai ®o¹n peptide ng¾n cã cïng thµnh phÇn axit amin
nh−ng kh¸c nhau vÒ tr×nh tù). Trong thùc tÕ, ®Ó gi¶i
tr×nh tù c¸c ®o¹n peptide hoÆc protein míi, ng−êi ta a)
YÕu tè phiªn m·
th−êng ph¶i dïng ph−¬ng ph¸p khèi phæ kÕ tiÕp. MiÒn liªn MiÒn ho¹t
kÕt ADN hãa enzym
11.3.6. Ph©n tÝch t−¬ng t¸c protein - protein
Däc theo gi¸o tr×nh nµy, chóng ta nhËn thÊy ADN ARN pol

c¸c mèi t−¬ng t¸c gi÷a c¸c ®¹i ph©n tö (ADN, ARN Gen chØ thÞ
vµ protein) cã vai trß trung t©m ®iÒu hßa hÇu hÕt c¸c VÞ trÝ Gen biÓu hiÖn
ho¹t ®éng sèng cña tÕ bµo vµ c¬ thÓ sinh vËt. Trong nhËn biÕt
®ã, t−¬ng t¸c gi÷a c¸c protein víi nhau cã vai trß b)
quyÕt ®Þnh trùc tiÕp ®ång thêi cã tÝnh ®a d¹ng vµ “VËt s¨n måi”
MiÒn ho¹t
phøc t¹p nhÊt. Cã nhiÒu ph−¬ng ph¸p kh¸c nhau hãa enzym
®−îc dïng ®Ó ®¸nh gi¸ t−¬ng t¸c gi÷a c¸c protein nh»m
“Måi”
gãp phÇn lµm s¸ng tá chøc n¨ng cña chóng. ë ®©y, MiÒn liªn
chóng ta chØ ®Ò cËp ®Õn 3 ph−¬ng ph¸p lµ: (1) hÖ kÕt ADN “VËt s¨n måi”
thèng lai hai dßng ë nÊm men, (2) ®ång kÕt tña miÔn kh«ng b¾t
dÞch vµ (3) kü thuËt vi d·y protein. ARN pol ®−îc “måi”
Gen chØ thÞ
11.3.6.1. HÖ thèng lai hai dßng ë nÊm men Gen kh«ng biÓu hiÖn
HÖ thèng lai hai dßng dùa trªn ®Æc ®iÓm cÊu
tróc ph©n tö cña phÇn lín protein ho¹t hãa phiªn m·. c)
“VËt s¨n måi”
Tõ ch−¬ng 5 chóng ta biÕt r»ng, nhiÒu protein ho¹t “Måi”
MiÒn ho¹t
hãa phiªn m· cã hai miÒn ho¹t tÝnh: miÒn liªn kÕt hãa enzym
MiÒn liªn
ADN, viÕt t¾t lµ DBD (th−êng nhËn ra c¸c ®o¹n tr×nh kÕt ADN
tù ®Æc hiÖu ng−îc dßng promoter) vµ miÒn ho¹t hãa, “VËt s¨n måi”
ARN pol b¾t ®−îc “måi”
viÕt t¾t lµ AD (cã vai trß thóc ®Èy phiªn m· sau khi Gen chØ thÞ
®Ýnh kÕt víi ARN polymerase). Khi hai miÒn nµy
Gen biÓu hiÖn
t−¬ng t¸c víi nhau, chóng ho¹t hãa sù phiªn m· cña
gen. VÒ nguyªn t¾c, hai miÒn AD vµ DBD kh«ng nhÊt H×nh 11.19. Nguyªn t¾c cña hÖ thèng lai
thiÕt ph¶i liªn kÕt céng hãa trÞ trªn cïng ph©n tö hai dßng. Xem néi dung trong phÇn diÔn
gi¶i (vÏ theo Clark, 2006).

351
§inh §oµn Long

protein. ThÕ nªn, trong hÖ thèng lai hai dßng, hai miÒn AD vµ DBD ®−îc "dung hîp" víi
hai protein kh¸c nhau, gi¶ sö ®−îc kÝ hiÖu lµ A vµ B (h×nh 11.19). Hai protein lai nµy
®−îc coi lµ "måi" (AD-A) vµ "vËt s¨n måi" (DBD-B). NÕu "vËt s¨n måi" b¾t ®−îc "måi", tøc
lµ A vµ B t−¬ng t¸c víi nhau, mét phøc hÖ sÏ h×nh thµnh vµ ho¹t hãa gen. Ng−êi ta sö
dông mét gen chØ thÞ ®Ó x¸c nhËn cã hay kh«ng sù t−¬ng t¸c gi÷a hai protein lai.
M« h×nh lai hai dßng ®−îc ph¸t triÓn ë nÊm men vµ ®−îc dïng ®Ó kiÓm tra mèi
t−¬ng t¸c gi÷a kho¶ng 6000 lo¹i protein kh¸c nhau ë sinh vËt nµy. Theo lý thuyÕt, sÏ
ph¶i kiÓm tra 6000x6000 tæ hîp protein kh¸c nhau. §Ó thùc hiÖn ®−îc ®iÒu ®ã, mçi ORF
cña hÖ gen nÊm men ®Òu ®−îc nh©n dßng vµo hai lo¹i vect¬ kh¸c nhau: mét vect¬ mang
miÒn AD, cßn mét vect¬ mang miÒn DBD. Nãi c¸ch kh¸c, mçi protein cña nÊm men ®Òu
®−îc kiÓm tra trong vai trß lµ "måi" vµ "vËt b¾t måi". C¸c vect¬ ®Òu ®−îc thiÕt kÕ sao cho
c¸c ORF t−¬ng øng víi hai miÒn AD vµ DBD ®Òu ®−îc ho¹t hãa biÓu hiÖn bëi cïng mét
yÕu tè ho¹t hãa phiªn m·, vÝ dô nh− GAL4 (h×nh 11.20). Vect¬ A cã vÞ trÝ "®a nh©n dßng"
n»m ng−îc dßng ®o¹n gen GAL4-AD gióp t¹o nªn ph©n tö lai A-GAL4-AD, cßn vect¬ B
cã vÞ trÝ n»m xu«i dßng ®o¹n gen GAL4-DBD gióp t¹o nªn ph©n tö lai GAL4-DBD-B.
Hai vect¬ plasmid lai ®−îc biÕn n¹p vµo c¸c tÕ bµo nÊm men kh¸c giíi tÝnh. KÕt qu¶
lµ h×nh thµnh hai nhãm giíi tÝnh, mçi nhãm gåm 6000 dßng tÕ bµo nÊm men mang c¸c
vect¬ biÕn n¹p kh¸c nhau. Sau ®ã, mçi dßng tÕ bµo thuéc nhãm nµy (giíi tÝnh nµy) ®−îc
®em lai víi mçi dßng thuéc
§iÓm khëi ®Çu sao
nhãm kia (giíi tÝnh kia). §iÓm chÐp ë vi khuÈn
NghÜa lµ mäi kh¶ n¨ng tæ khëi ®Çu
hîp gi÷a c¸c AD vµ DBD sao chÐp
ë nÊm Vect¬ Vect¬
thuéc c¸c protein kh¸c nhau men “vËt b¾t måi” “måi”
®Òu x¶y ra. Khi c¸c dßng (B) (A)
nÊm men "lai" víi nhau,
chóng h×nh thµnh nªn d¹ng Promoter Tr×nh tù “vËt b¾t måi” Tr×nh tù “måi”
bµo tö l−ìng béi (2n) mang
c¶ hai plasmid "måi" vµ "vËt
s¨n måi". NÕu hai protein “vËt b¾t måi”
“måi”
lai lµ A vµ B t−¬ng t¸c víi
nhau, gen chØ thÞ sÏ biÓu T−¬ng t¸c ¸i
hiÖn. Trong m« h×nh ë nÊm lùc cao gi÷a
men, hai gen chØ thÞ ®−îc sö c¸c protein
dông lµ HIS3 vµ URA3. NÕu
gen HIS3 vµ URA3 kh«ng
®−îc ho¹t hãa, tÕ bµo nÊm
men sÏ chÕt nÕu m«i tr−êng
kh«ng cã t−¬ng øng histidine
(His) vµ uracine (U). Nh−
vËy, nÕu tÕ bµo nÊm men lai
(2n) cã thÓ sinh tr−ëng ®−îc
trªn m«i tr−êng kh«ng cã
ARN ARN
His hoÆc U th× chøng tá c¸c ADN pol pol
ADN
gen chØ thÞ HIS3 vµ URA3 ®·
®−îc ho¹t hãa; tøc lµ hai
protein A vµ B ®· t−¬ng t¸c
víi nhau. Trªn m« h×nh ë
Chän läc trªn m«i Chän khuÈn l¹c mµu xanh lam
h×nh 11.20, hai gen chØ thÞ tr−êng thiÕu His (His-) trªn m«i tr−êng cã X-gal
®−îc dïng lµ HIS3 vµ LacZ.
Trong ®ã, gen LacZ m· hãa H×nh 11.20. C¸c vect¬ ®−îc thiÕt kÕ cho hÖ thèng lai hai dßng.
Xem néi dung trong phÇn diÔn gi¶i (vÏ theo Clark, 2006).
cho β-galactosidase. Enzym

352
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

nµy chuyÓn hãa hîp chÊt kh«ng mµu lµ X-gal (5- Ph©n tö ARN
brom-4-chlor-3-idolyl-β-D-galactoside) thµnh
hîp chÊt cã mµu xanh lam lµ 5-brom-4-chlor-
MiÒn liªn MiÒn ho¹t
indigo. V× vËy, khi gen chØ thÞ lµ LacZ, nÕu cã kÕt ADN hãa enzym
t−¬ng t¸c gi÷a c¸c protein, tÕ bµo sÏ cã mµu
xanh lam khi nu«i trong m«i tr−êng cã X-gal. ADN ARN pol
¦u ®iÓm næi bËt nhÊt cña hÖ thèng lai Gen chØ thÞ
kÐp ë nÊm men lµ cho phÐp ®¸nh gi¸ sù t−¬ng VÞ trÝ
t¸c protein – protein trong tÕ bµo. Tuy vËy, nã nhËn biÕt
còng cã mét sè h¹n chÕ. KiÓu t−¬ng t¸c protein H×nh 11.21. M« h×nh lai ba dßng.
- protein nµy chØ giíi h¹n trong nh©n tÕ bµo.
HÇu hÕt c¸c protein mµng tÕ bµo "gÊp nÕp" sai Gen ®ang Tr×nh tù FLAG
khi ë trong nh©n; ng−îc l¹i, c¸c protein trong nghiªn cøu
nh©n cã xu h−íng bÞ “biÕn ®æi” sai khi ë tÕ bµo
chÊt. §éc tÝnh t¹o ra do sù t−¬ng t¸c gi÷a c¸c ADN
protein lín (c¸c protein lai th−êng cã kÝch plasmid
BiÕn n¹p vµo tÕ
th−íc lín h¬n d¹ng tù nhiªn) cã thÓ dÉn ®Õn bµo ®éng vËt
viÖc ®¸nh gi¸ sai mét sè t−¬ng t¸c quan träng. Promoter nu«i cÊy in vitro
Ngoµi ra, mét sè t−¬ng t¸c protein-protein cßn ®éng vËt cã vó
Thu tÕ bµo vµ
phô thuéc vµo sù cã mÆt cña ARN hoÆc mét sè t¸ch tÕ bµo chÊt
ph©n tö nhá kh¸c kh«ng chøng minh ®−îc
b»ng m« h×nh nµy. Protein Kh¸ng thÓ
kh¸c
cña FLAG
Mét hÖ thèng lai ®−îc c¶i tiÕn nh»m kh¾c
Phøc hÖ
phôc h¹n chÕ trªn ®−îc gäi lµ hÖ thèng lai ba protein
H¹t ®−îc
dßng (h×nh 11.21). Trong hÖ thèng nµy, hai “bäc” b»ng
protein (AD-A vµ DBD-B) ®−îc ®¸nh gi¸ t−¬ng protein A
t¸c ®ång thêi víi ph©n tö ARN mµ c¶ hai
protein cïng liªn kÕt. M« h×nh nµy cã thÓ ®−îc
dïng ®Ó sµng läc c¸c protein t−¬ng t¸c ARN. Ly t©m thu h¹t vµ ch¹y
®iÖn di trªn gel SDS-PAGE
HÖ thèng lai hai dßng ë nÊm men còng cã
thÓ ¸p dông víi c¸c gen tõ c¸c loµi kh¸c. Ngoµi
ra, mét sè h·ng (nh− Stratagene, Mü) ®· thiÕt 3 lo¹i protein liªn kÕt trong phøc hÖ
lËp hÖ thèng lai hai dßng dïng vi khuÈn E.
coli. Trong m« h×nh ë E. coli, hai gen chØ thÞ Protein ®−îc ®¸nh dÊu bëi FLAG
®−îc dïng lµ bla (kh¸ng ampicillin) vµ lacZ.
H×nh 11.22. Ph−¬ng ph¸p ®ång kÕt tña miÔn dÞch.
11.3.6.2. Ph−¬ng ph¸p ®ång kÕt tña miÔn dÞch
ë ®éng vËt cã vó, sù t−¬ng t¸c gi÷a c¸c protein cã thÓ x¸c ®Þnh ®−îc b»ng ph−¬ng
ph¸p ®ång kÕt tña miÔn dÞch (h×nh 11.22). Gen m· hãa cho protein ®−îc biÕn n¹p vµ
biÓu hiÖn trong tÕ bµo ®éng vËt; sau ®ã, ph©n lËp lo¹i protein ®−îc quan t©m nghiªn cøu
võa tæng hîp tõ tÕ bµo chÊt nhê kh¸ng thÓ. Trong tr−êng hîp ch−a cã kh¸ng thÓ t−¬ng
øng, th× protein ®−îc “g¾n” víi mét peptide ®¸nh dÊu, gäi lµ FLAG. Sau ®ã, kh¸ng thÓ
t−¬ng øng víi FLAG ®−îc dïng ®Ó ph©n lËp protein cÇn nghiªn cøu. Th−êng th× viÖc
ph©n lËp protein dùa trªn nguyªn t¾c “kh¸ng nguyªn - kh¸ng thÓ” ®−îc thùc hiÖn trong
®iÒu kiÖn in-vitro gièng víi ®iÒu kiÖn in-vivo. V× vËy, sau khi ph©n lËp, protein nghiªn
cøu ngoµi liªn kÕt víi kh¸ng thÓ cßn ®ång thêi ë d¹ng phøc hÖ víi c¸c protein kh¸c. Phøc
hÖ protein nµy sau ®ã ®−îc ph©n t¸ch bëi ®iÖn di SDS-PAGE nh»m x¸c ®Þnh xem cã bao
nhiªu protein thµnh phÇn tham gia vµo phøc hÖ. ViÖc x¸c ®Þnh protein thµnh phÇn cã thÓ
thùc hiÖn b»ng ph−¬ng ph¸p khèi phæ hoÆc gi¶i tr×nh tù protein.

353
§inh §oµn Long

Ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®ång kÕt tña Th− viÖn protein
miÔn dÞch ®Ó kiÓm tra mèi t−¬ng t¸c protein – protein HHHHHH ®¸nh dÊu bëi His6
trong hÖ thèng lai hai dßng. Tr−íc tiªn, mçi lo¹i
HHHHHH
protein ®−îc quan t©m nghiªn cøu sÏ ®−îc “g¾n” t−¬ng HHHHHH
øng víi c¸c peptide ®¸nh dÊu lµ FLAG vµ His6. Hai
HHHHHH
cÊu tróc ADN m· hãa t−¬ng øng cho c¸c protein “dung HHHHHH
hîp” nµy ®−îc “®ång biÕn n¹p” vµo tÕ bµo ®éng vËt. His6 HHHHHH
Sau ®ã, lÇn l−ît mçi lo¹i kh¸ng thÓ t−¬ng øng víi tõng
peptide ®¸nh dÊu ®−îc dïng ®Ó ph©n lËp phøc hÖ
protein; phøc hÖ nµy sau ®ã ®−îc tiÕn hµnh ®iÖn di
+
SDS-PAGE. Gel ®iÖn di sau ®ã ®−îc chuyÓn lªn mµng
nitrocellulose vµ ®−îc lai víi “mÉu dß” kh¸ng thÓ
t−¬ng øng víi His6 (anti-His6) vµ FLAG (anti-FLAG).
NÕu hai lo¹i protein t−¬ng t¸c víi nhau, chóng xuÊt
Lam kÝnh
hiÖn trªn c¶ hai b¶n gel trong lai Western. g¾n ion Niken

11.3.6.3. Vi d·y protein (protein microarray)


Protein liªn kÕt víi
C¸c ph−¬ng ph¸p nghiªn cøu protein tr−íc ®©y Ni qua His6
th−êng ph©n tÝch tõng lo¹i protein riªng lÎ. Cïng víi
nh÷ng tiÕn bé gÇn ®©y trong gi¶i tr×nh tù hÖ gen, còng
cã nhiÒu ph−¬ng ph¸p ®−îc c¶i tiÕn cho phÐp ph©n
tÝch ®ång thêi nhiÒu protein. Trong ®ã, cã c¸c ph−¬ng
ph¸p vi d·y protein.
C¸c ph−¬ng ph¸p vi d·y protein ®−îc dïng phæ
biÕn trong c¸c nghiªn cøu hãa sinh vµ x¸c ®Þnh ho¹t
®é enzym; ®ång thêi ®Ó x¸c ®Þnh sù t−¬ng t¸c gi÷a c¸c
protein víi nhau. §Õn nay, phÇn lín qui tr×nh vi d·y
protein dùa trªn m« h×nh ë nÊm men S. cerevisiae.
H×nh 11.23. Kü thuËt g¾n protein lªn
§Ó nghiªn cøu t−¬ng t¸c cña hÖ protein nÊm lam kÝnh trong vi dny protein.
men (gåm kho¶ng 6000 protein), 90% sè gen m· hãa
protein tõ ng©n hµng hÖ gen ®· ®−îc t¸i tæ hîp víi ®o¹n ADN m· hãa peptide ®¸nh dÊu
His6. §o¹n peptide ®¸nh dÊu nµy cho phÐp protein "g¾n lªn" chÊt nÒn qua liªn kÕt gi÷a
His vµ Ni (h×nh 11.23). T−¬ng t¸c protein cã thÓ ph©n tÝch gi÷a tõng cÆp protein riªng
biÖt, hoÆc ®−îc "sµng läc" víi hçn hîp toµn bé hÖ protein; sau ®ã ph©n thµnh c¸c nhãm
nhá ®Ó tiÕp tôc ph©n tÝch nÕu kÕt qu¶ t−¬ng t¸c lµ d−¬ng tÝnh.
C¸c thÝ nghiÖm ph©n tÝch chøc n¨ng ®−îc thiÕt kÕ sao cho viÖc ph©n tÝch c¸c d·y
ph¶n øng thuËn tiÖn nhÊt (th−êng dïng c¸c chÊt ph¸t quang, ®«i khi dïng ®ång vÞ phãng
x¹).VÝ dô: ®Ó t×m c¸c protein nÊm men ®Ýnh kÕt víi calmodulin (mét protein liªn kÕt
Ca2+) hay phospholipid (thµnh phÇn mµng tÕ bµo), ng−êi ta sö dông vi d·y protein ®¸nh
®Êu b»ng His6 ®Ýnh kÕt lªn lam kÝnh g¾n Ni. C¶ calmodulin vµ phospholipide ®Òu ®−îc
®¸nh dÊu b»ng biotin. C¸c protein t−¬ng t¸c calmodulin vµ phospholipide ®−îc nhËn diÖn
nhê streptavidin mang chÊt ph¸t quang Cy3 (h×nh 11.24). B»ng ph−¬ng ph¸p nµy, mét
phßng thÝ nghiÖm t¹i §¹i häc Yale (Mü) trong mét thÝ nghiÖm vi d·y protein ®· t×m ®−îc
139 protein liªn kÕt calmodulin vµ 150 protein liªn kÕt phospholipid tõ nÊm men.

11.3.7. VÒ hÖ protein häc (proteomics) vµ hÖ chuyÓn hãa häc (metabolomics)


ViÖc ph¸t triÓn cña c¸c kü thuËt gi¶i tr×nh tù ADN, kÕt hîp víi t¸ch chiÕt, tinh s¹ch
vµ gi¶i tr×nh tù protein ®· më ®−êng cho sù ra ®êi mét chuyªn ngµnh míi gäi lµ hÖ
protein häc (proteomics). HÖ protein häc nghiªn cøu vÒ toµn bé c¸c protein ®−îc mét

354
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

m«, tÕ bµo hoÆc c¬ thÓ t¹o ra trong ®iÒu kiÖn nhÊt ®Þnh, ®ång thêi x¸c ®Þnh møc ®é phæ
biÕn cña mçi lo¹i protein vµ sù t−¬ng t¸c cña chóng víi nhau vµ víi c¸c ph©n tö kh¸c
(nh− ADN hay ARN). NÕu nh− c¸c kü thuËt vi d·y ADN cã thÓ gióp x¸c ®Þnh ®−îc sù
biÓu hiÖn cña c¸c gen trªn cë së ph©n tÝch hÖ gen, th× c¸c kü thuËt proteomics cho phÐp
x¸c ®Þnh ®−îc bøc tranh tæng thÓ vÒ toµn bé protein cña mçi tÕ bµo, m« hoÆc c¬ thÓ.
Proteomics dùa trªn ba ph−¬ng ph¸p chÝnh, bao gåm: (1) 2D-PAGE ®Ó ph©n t¸ch
c¸c protein, (2) MS ®Ó x¸c ®Þnh khèi l−îng ph©n tö vµ tr×nh tù axit amin, (3) tin sinh häc
®Ó so s¸nh gi÷a c¸c ph©n tö protein vµ c¸c ®o¹n peptide víi c¸c tr×nh tù m· hãa chóng
trong hÖ gen. Trong thùc tÕ, c¸c nghiªn cøu hÖ gen häc (genomics) vµ hÖ protein häc
(proteomics) th−êng ®−îc phèi hîp víi nhau trong c¸c nghiªn cøu di truyÒn häc ph©n tö
hiÖn ®¹i.
Bªn c¹nh hÖ gen häc vµ hÖ protein häc, gÇn ®©y mét lÜnh vùc nghiªn cøu míi còng
th−êng ®−îc phèi hîp víi hai chuyªn ngµnh nªu trªn ®−îc gäi lµ hÖ chuyÓn hãa häc
hay hÖ trao ®æi chÊt häc (metabolomics). HÖ chuyÓn hãa häc nghiªn cøu toµn bé c¸c
chÊt chuyÓn hãa ®−îc tÝch lòy trong mét m«, tÕ bµo hoÆc c¬ thÓ ë nh÷ng ®iÒu kiÖn nhÊt
®Þnh. HÇu hÕt c¸c chÊt chuyÓn hãa hiÖn nay ®Òu cã thÓ x¸c ®Þnh ®−îc b»ng ph−¬ng ph¸p
khèi phæ (MS), hoÆc ®«i khi b»ng ph−¬ng ph¸p céng
h−ëng tõ h¹t nh©n (NMR). Ph−¬ng ph¸p MS cã ®é nh¹y
C¸c protein ®−îc sµng läc cao vµ cã thÓ dïng ph©n tÝch nhiÒu nhãm ph©n tö kh¸c
nhau. 12C cã khèi l−îng ®óng 12 Da. Trong khi ®ã, khèi
His6 l−îng cña c¸c nguyªn tö kh¸c, nh− 14N hay 16O, kh«ng
ph¶i lµ mét sè nguyªn. C¸c ph−¬ng ph¸p MS sö dông ®é
Ni Ni Ni Ni Ni Ni
ph©n gi¶i khèi l−îng cùc cao, gäi lµ EHMR, cã thÓ gióp
Lam x¸c ®Þnh chÝnh x¸c c«ng thøc ph©n tö cña hÇu hÕt mäi
ñ víi phospholipid ®−îc kÝnh
®¸nh dÊu b»ng Biotin chÊt chuyÓn hãa trong tÕ bµo sinh vËt, kÓ c¶ c¸c ®ång
ph©n (cã c«ng thøc ph©n tö gièng nhau).
Biotin
Phospholipid C¸c ph©n tÝch hÖ chuyÓn hãa ®Æc biÖt h÷u Ých
trong nghiªn cøu c¸c chÊt sinh häc thø cÊp (nh− c¸c chÊt
t¹o mµu, t¹o mïi, c¸c alkaloid, saponin, v.v…) vèn ®Æc
Ni Ni Ni Ni Ni Ni thï ë thùc vËt. VÝ dô, khi sö dông c¶ hai dÞch chiÕt n−íc
vµ h÷u c¬ tõ qu¶ d©u t©y, ng−êi ta ®· x¸c ®Þnh ®−îc
Bæ sung avidin g¾n víi kho¶ng 7000 chÊt chuyÓn hãa kh¸c nhau. NÕu in ra th×
chÊt ph¸t quang Cy3 phæ EHMR cã thÓ dµi vµi ba km. ViÖc so s¸nh hÖ chuyÓn
hãa gi÷a mét d¹ng ®ét biÕn qu¶ tr¾ng víi d¹ng kiÓu d¹i
ChÊt ph¸t quang qu¶ ®á ®· trùc tiÕp cho thÊy sù kh¸c nhau vÒ hµm l−îng
Avidin Avidin
mét sè chÊt chuyÓn hãa trung gian trong con ®−êng tæng
hîp c¸c chÊt t¹o mµu (s¾c tè) nãi chung vµ s¾c tè ®á nãi
riªng (h×nh 11.25).

Ni Ni Ni Ni Ni Ni Qu¶ tr¾ng

Qu¶ ®á

X
Y
H×nh 11.24. Sµng läc protein b»ng
ph−¬ng ph¸p vi dny sö dông H×nh 11.25. Phæ MS cho biÕt thµnh phÇn c¸c chÊt chuyÓn hãa kh¸c
Biotin / Streptavidin. nhau gi÷a d¹ng kiÓu d¹i (qu¶ ®á) vµ ®ét biÕn (qu¶ tr¾ng) ë d©u t©y.

355

You might also like