Chương11 CONGNGHEGEN

You might also like

You are on page 1of 33

Ch−¬ng 11

Ph©n tÝch gen vµ s¶n phÈm cña gen

11.1. Giíi thiÖu chung


ë c¸c ch−¬ng tr−íc, chóng ta ®· ®Ò cËp ®Õn c¸c c¬ chÕ cña c¸c hiÖn t−îng di truyÒn
ë cÊp ph©n tö vµ tÕ bµo, trong ®ã cã sù ®iÒu hßa biÓu hiÖn cña c¸c gen, phÇn nµo gi¶i
thÝch ®−îc sù tiÕn hãa cña sinh vËt trªn c¬ së c¸c quy luËt biÕn ®æi cña vËt chÊt di truyÒn
(ADN vµ NST). Ch−¬ng nµy ®Ò cËp ®Õn mét sè ph−¬ng ph¸p c¬ b¶n cña sinh häc ph©n tö
vµ hãa sinh häc ®−îc dïng trong viÖc ph©n tÝch gen (ADN) vµ s¶n phÈm cña gen (ARN vµ
protein).
Trong bèi c¶nh c«ng nghÖ sinh häc vµ sinh häc ph©n tö ph¸t triÓn hÕt søc m¹nh mÏ
trong nh÷ng n¨m qua, ch¾c ch¾n gi¸o tr×nh nµy kh«ng thÓ ph¶n ¸nh ®Çy ®ñ c¸c ph−¬ng
ph¸p ®· ®−îc sö dông trong c¸c nghiªn cøu vÒ gen vµ s¶n phÈm cña gen, mµ chØ cã thÓ ®Ò
cËp ®Õn nguyªn lý cña mét sè ph−¬ng ph¸p c¬ b¶n ®−îc dïng phæ biÕn hiÖn nay trong c¸c
nghiªn cøu di truyÒn häc ë cÊp ®é ph©n tö. PhÇn ®Çu cña ch−¬ng m« t¶ c¸c ph−¬ng ph¸p
®−îc dïng trong ph©n tÝch c¸c axit nucleic, bao gåm tõ t¸ch chiÕt ADN, ph©n lËp gen ®Õn
gi¶i tr×nh tù vµ so s¸nh c¸c hÖ gen (genomics). PhÇn sau cña ch−¬ng ®Ò cËp ®Õn c¸c kü
thuËt t¸ch chiÕt vµ ph©n tÝch protein lµ s¶n phÈm cña hÇu hÕt c¸c gen, bao gåm tõ viÖc
tinh s¹ch protein ®Õn c¸c kü thuËt ph©n tÝch ho¹t tÝnh protein ë c¸c tÕ bµo vµ m«
(proteomics). Tuy ®−îc ®Ò cËp ë c¸c phÇn t¸ch biÖt, nh−ng thùc tÕ c¸c kü thuËt ph©n tÝch
ADN vµ protein ®Òu dùa trªn mét sè nguyªn lý chung vµ th−êng ®−îc sö dông phèi hîp
trong c¸c nghiªn cøu.

11.2. C¸c kü thuËt ph©n tÝch axit nucleic

11.2.1. T¸ch chiÕt vµ tinh s¹ch ADN


HÇu hÕt c¸c nghiªn cøu ph©n tÝch gen ®Òu b¾t ®Çu b»ng viÖc ph¶i t¸ch chiÕt vµ tinh
s¹ch ADN tõ c¸c ®èi t−îng nghiªn cøu. Dï lµ t¸ch chiÕt ADN tõ vi khuÈn, ®éng vËt hay
thùc vËt th× mét sè b−íc ®Çu tiªn cña qui tr×nh ®Òu cÇn “gi¶i phãng” c¸c thµnh phÇn cña
tÕ bµo vµo dung dÞch. Do vi khuÈn th−êng tån t¹i ë d¹ng c¸c tÕ bµo ®¬n, kh«ng cã cÊu
tróc x−¬ng, kh«ng tÝch lòy chÊt bÐo, Ýt hîp chÊt sinh häc thø cÊp ... nªn viÖc t¸ch chiÕt
ADN th−êng t−¬ng ®èi ®¬n gi¶n. Ng−îc l¹i, phÇn lín c¸c m« thùc vËt vµ ®éng vËt th−êng
cÇn ph¶i nghiÒn nhá trong nit¬ láng thµnh nh÷ng h¹t mÞn tr−íc khi cã thÓ t¸ch ADN.
ViÖc t¸ch chiÕt ADN tõ tÕ bµo ®éng vËt (vÝ dô: tõ ®u«i chuét) ®«i khi cÇn c¸c enzym ph©n
hñy c¸c m« liªn kÕt gióp t¨ng hiÖu qu¶ gi¶i phãng c¸c tÕ bµo vµ thµnh phÇn cña chóng
vµo dÞch chiÕt. §Æc biÖt, c¸c tÕ bµo thùc vËt cã thµnh cøng, nªn th−êng ph¶i sö dông c¸c
biÖn ph¸p c¬ häc (vÝ dô: sö dông m¸y xay, nghiÒn b»ng cèi) hoÆc sö dông mét sè enzym
®Æc hiÖu ph©n hñy thµnh tÕ bµo tr−íc khi cã thÓ t¸ch ADN. C¸c tÕ bµo thùc vËt cßn cã
®Æc ®iÓm phæ biÕn lµ tÝch lòy c¸c hîp chÊt sinh häc thø cÊp ë hµm l−îng cao, nªn ®Ó lo¹i
bá c¸c hîp chÊt nµy th−êng ph¶i bæ sung vµo dung dÞch chiÕt mét sè hîp chÊt, vÝ dô nh−
CTAB (cetyltrimethylammonium bromide) gióp t¨ng hiÖu qu¶ lo¹i bá c¸c hîp chÊt
polysaccharide vµ polyphenol. C¸c qui tr×nh t¸ch chiÕt ADN ®¬n gi¶n nhÊt lµ ë vi khuÈn.
§Çu tiªn c¸c tÕ bµo vi khuÈn cã thÓ ®−îc xö lý víi enzym lysozyme gióp ph©n hñy líp
petidoglycan trªn thµnh tÕ bµo. Sau ®ã, mÉu ®−îc xö lý tiÕp víi c¸c hîp chÊt tÈy lµm

323
§inh §oµn Long

ph©n r· c¸c cÊu tróc lipid trªn


ADN vµ ARN
mµng tÕ bµo. C¸c hîp chÊt t¹o trong n−íc
phøc kiÓu EDTA (ethylene
diamine tetraacetate) còng
Bæ sung L¾c Ly t©m
th−êng ®−îc dïng ®Ó lo¹i bá Phenol m¹nh
c¸c ion kim lo¹i. Trong c¸c
b−íc nh− vËy, ADN ®−îc gi¶i
phãng vµo dÞch chiÕt vµ sau ®ã Phenol
ADN, ARN vµ Protein
®−îc tinh s¹ch. protein trong trong
pha n−íc phenol
Cã hai ph−¬ng ph¸p phæ
biÕn ®−îc dïng phèi hîp ®Ó H×nh 11.1. Dïng phenol lo¹i protein khái dÞch chiÕt ADN vµ ARN.
tinh s¹ch ADN lµ ly t©m vµ
chiÕt xuÊt bëi dung m«i. Nguyªn lý cña ph−¬ng ph¸p ly t©m lµ khi dÞch chiÕt tÕ bµo
®−îc “quay” ë tèc ®é cao th× lùc ly t©m lµm l¾ng ®äng c¸c thµnh phÇn tÕ bµo cã khèi
l−îng vµ kÝch th−íc lín. Ch¼ng h¹n, khi thµnh tÕ bµo cña vi khuÈn ®· bÞ ph©n gi¶i th×
hÇu hÕt c¸c thµnh phÇn tÕ bµo cña nã ë d¹ng hßa tan trong dÞch chiÕt bëi chóng cã kÝch
th−íc nhá, cßn ADN vµ mét sè chÊt cã khèi l−îng ph©n tö lín sÏ l¾ng xuèng ®¸y èng ly
t©m. Lóc nµy, dÞch chiÕt mang c¸c thµnh phÇn tÕ bµo bÞ ph©n hñy dÔ dµng ®−îc hót ra
vµ lo¹i bá.
H¹t kÕt tña mang ADN sau ®ã ®−îc hßa tan trë l¹i trong dung dÞch ®Öm phï hîp.
Tuy nhiªn, nã th−êng cßn lÉn ARN vµ protein. C¸c hîp chÊt nµy sau ®ã cã thÓ ®−îc lo¹i
bá nhê sö dông c¸c dung m«i thÝch hîp. Trong b−íc tinh s¹ch ADN, phenol lµ mét dung
m«i cã hiÖu qu¶ cao vµ ®−îc dïng réng r·i, tuy nã kh¸ ®éc bëi kh¶ n¨ng hßa tan vµ g©y
biÕn tÝnh m¹nh protein. ViÖc sö dông phenol gióp hßa tan vµ t¸ch bá protein khái ADN.
Khi bæ sung phenol vµo n−íc, hai chÊt láng nµy kh«ng thÓ trén víi nhau thµnh dung dÞch
®ång nhÊt, mµ thay vµo ®ã phenol sÏ t¸ch ra thµnh líp riªng ë d−íi líp n−íc (h×nh 11.1).
Tuy vËy, khi l¾c m¹nh, hai líp dÞch nµy cã thÓ hßa vµo nhau thµnh hçn hîp “t¹m thêi”;
lóc ®ã, protein sÏ hßa tan vµo phenol. Sau ®ã, khi ®−a dung dÞch hçn hîp vÒ tr¹ng th¸i
tÜnh, hai pha phenol vµ n−íc l¹i t¸ch nhau ra. Lóc nµy, pha phenol mang nhiÒu ph©n tö
protein ë d¹ng hßa tan, cßn hÇu hÕt ADN vµ ARN chØ cã ë pha n−íc. ViÖc hót n−íc (líp ë
trªn) ra khái hçn hîp sÏ gióp t¸ch axit nucleic khái protein. §Ó gi¶m tèi ®a l−îng protein
cßn sãt l¹i, b−íc chiÕt xuÊt b»ng phenol cã thÓ ®−îc thùc hiÖn lÆp l¹i nhiÒu lÇn. Mét sè
quy tr×nh t¸ch chiÕt ADN gÇn ®©y nh»m tr¸nh phenol (v× tÝnh ®éc cña nã) ®· cã mét sè
c¶i tiÕn. Phæ biÕn nhÊt lµ viÖc sö dông c¸c cét chøa chÊt nÒn liªn kÕt ®Æc hiÖu ADN.
Trong ®ã, hai nhãm chÊt nÒn th«ng dông nhÊt lµ silic dioxide vµ c¸c hîp chÊt trao ®æi
anion. C¸c chÊt nÒn dùa trªn silic dioxide cã kh¶ n¨ng liªn kÕt ®Æc hiÖu víi ADN ë nång
®é muèi thÊp vµ pH cao. Trong khi ®ã, c¸c chÊt nÒn trao ®æi anion, nh−
diethylaminoethyl-cellulose, tÝch ®iÖn d−¬ng liªn kÕt m¹nh víi khung ®−êng-phosphate
cña ph©n tö ADN. Khi sö dông c¸c chÊt nÒn trao ®æi anion ë nång ®é muèi thÊp, ADN
®−îc “b¾t gi÷” trong cét; nh−ng khi nång ®é muèi t¨ng, ADN sÏ ®−îc röa tr«i khái cét bëi
nång ®é muèi cao lµm ph¸ vì c¸c liªn kÕt ion gi÷a ADN vµ chÊt nÒn.
B−íc tiÕp theo cña viÖc tinh s¹ch ADN lµ cÇn lo¹i bá ARN. ViÖc nµy th−êng ®−îc
thùc hiÖn nhê c¸c enzym ribonuclease (vÝ dô: RNase A). Nhãm enzym nµy cã kh¶ n¨ng
nhËn biÕt ®Æc hiÖu ARN (qua nhãm C2’-OH) vµ ph©n gi¶i chóng thµnh nh÷ng ®o¹n nhá,
mµ hÇu nh− kh«ng t¸c ®éng ®Õn c¸c ph©n tö ADN. Trong b−íc xö lý ribonuclease, hçn
hîp ADN vµ ARN ®−îc ñ ë nhiÖt ®é tèi −u cña enzym. Sau ®ã, dÞch chiÕt ®−îc bæ sung
mét thÓ tÝch t−¬ng ®−¬ng cña alcohol (etanol hay isoamylalcohol). C¸c hîp chÊt alcohol
lµm kÕt tña c¸c ph©n tö kÝch th−íc lín mµ lóc nµy trong dÞch chiÕt chØ cßn chñ yÕu lµ
ADN. C¸c ®o¹n ARN nhá ë d¹ng hßa tan nªn cã thÓ dÔ dµng hót ra vµ lo¹i bá. §iÓm ®¸ng
l−u ý lµ c¸c alcohol lµm kÕt tña c¸c ®¹i ph©n tö mét c¸ch kh«ng ®Æc hiÖu, nªn c¸c hîp

324
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

chÊt nh− hydrat carbon vµ protein cã thÓ cïng kÕt tña víi ADN vµ ARN. ThÕ nªn, b−íc
kÕt tña b»ng alcohol th−êng chØ ®−îc thùc hiÖn sau khi c¸c thµnh phÇn kh¸c cña tÕ bµo
®· ®−îc lo¹i bá khái dÞch chiÕt nhê ly t©m vµ/hoÆc chiÕt xuÊt bëi phenol.
Hçn hîp ADN vµ ARN sau khi ®−îc xö lý b»ng ribonuclease råi bæ sung etanol ®−îc
ly t©m ®Ó thu kÕt tña ADN, cßn ARN ë d¹ng hßa tan trong dÞch chiÕt ®−îc hót ra vµ lo¹i
bá. H¹t ADN kÕt tña ë ®¸y èng ly t©m ®«i khi rÊt nhá (thËm chÝ kh«ng nh×n thÊy b»ng
m¾t th−êng), nh−ng ®· chøa hµng triÖu ph©n tö ADN vµ th−êng lµ ®ñ cho c¸c nghiªn
cøu tiÕp theo. ADN lóc nµy cã møc ®é tinh s¹ch cao, ®−îc hßa tan trë l¹i trong dung dÞch
®Öm n−íc vµ cã thÓ sö dông cho c¸c thÝ nghiÖm ph©n tÝch ADN sau ®ã.

11.2.2. Sö dông quang phæ ®Ó x¸c ®Þnh nång ®é ADN vµ ARN


C¸c cÊu tróc vßng th¬m (purine vµ pyrimidine) cña c¸c nucleotide cÊu t¹o nªn ADN
vµ ARN t¹o cho c¸c ph©n tö nµy cã c−êng ®é hÊp thô tia tö ngo¹i cùc ®¹i ë vïng b−íc
sãng 260 nm (t−¬ng øng víi tia UV). Khi tia UV ®−îc chiÕu qua dung dÞch axit nucleic,
møc hÊp thô tia UV (A260 hay OD260) phô thuéc vµo nång ®é cña c¸c axit nucleic. TÝnh
chÊt nµy lµ nguyªn lý c¬ b¶n cña viÖc dïng m¸y quang phæ ®Ó x¸c ®Þnh nång ®é ADN vµ
ARN trong dung dÞch. Theo ®ã, dùa trªn nång ®é ADN hoÆc ARN cña c¸c dung dÞch
chuÈn biÕt tr−íc, c¸c gi¸ trÞ A260 t−¬ng øng ®−îc dïng ®Ó vÏ ®−êng tuyÕn tÝnh chuÈn
t−¬ng quan gi÷a nång ®é axit nucleic víi chØ sè A260. Dùa trªn ®−êng chuÈn nµy, cã thÓ
x¸c ®Þnh ®−îc nång ®é ADN hoÆc ARN cã trong dung dÞch mÉu sau khi ®o ®−îc chØ sè A260
cña nã.
Kh¸c víi ADN vµ ARN, protein hÊp thô tia tö ngo¹i cùc ®¹i ë b−íc sãng 280nm
(®iÒu nµy chñ yÕu lµ do cÊu tróc vßng th¬m cña axit amin tryptophan). §é tinh s¹ch cña
dÞch chiÕt ADN cã thÓ x¸c ®Þnh qua tØ sè A260/A280. DÞch chiÕt chØ chøa ADN tinh s¹ch cã tØ
sè A260/A280 xÊp xØ 1,8. NÕu cã protein, tØ sè nµy th−êng thÊp h¬n 1,8. Cßn nÕu cã ARN, tØ
sè nµy lín h¬n 1,8. DÞch chiÕt chØ chøa ARN tinh s¹ch cã tØ sè A260/A280 xÊp xØ 2,0.
Trong dung dÞch chØ chøa c¸c nucleotide ®¬n lÎ, v× c¸c nucleotide hßa tan kh¾p
dung dÞch, nªn c−êng ®é hÊp thô cña chóng lín h¬n khi chóng ë trong c¸c ph©n tö ADN
vµ ARN. Së dÜ nh− vËy lµ do c−êng ®é hÊp thô tia UV chñ yÕu do c¸c vßng purine vµ
pyrimidine chø kh«ng ph¶i do phÇn ®−êng vµ phosphate. Trong ph©n tö ADN sîi kÐp,
c¸c vßng purine vµ pyrimidine bÞ “ch¾n” bëi khung ®−êng-phosphate, nªn c−êng ®é hÊp
thô tia UV gi¶m. C¸c ph©n tö ARN vµ ADN cã cÊu tróc d¹ng m¹ch ®¬n víi mét sè vïng
cã thÓ cã cÊu tróc sîi kÐp nªn cã møc hÊp thô trung b×nh. Hµm l−îng ADN vµ ARN trong
dung dÞch th−êng ®−îc qui ®æi trªn c¬ së chØ sè A260 theo c«ng thøc:
1 A260 cña dung dÞch ADN sîi kÐp (dsADN) = 50 µg
1 A260 cña dung dÞch ADN m¹ch ®¬n (ssADN)/ARN = 40 µg
1 A260 cña dung dÞch dNTP/oligonucleotide = 33 µg

11.2.3. §iÖn di ph©n tÝch axit nucleic


Cã nhiÒu ph−¬ng ph¸p kh¸c nhau cã thÓ dïng ®Ó ph©n tÝch ADN, nh−ng ®Õn nay
®iÖn di trªn gel lµ ph−¬ng ph¸p ®−îc dïng phæ biÕn nhÊt nhê −u ®iÓm nhanh vµ ®¬n
gi¶n. Nguyªn t¾c cña ph−¬ng ph¸p lµ: d−íi t¸c ®éng cña ®iÖn tr−êng, c¸c ph©n tö axit
nucleic (tÝch ®iÖn ©m) kh¸c nhau vÒ kÝch th−íc, ®iÖn tÝch, møc ®é cuén xo¾n vµ d¹ng
ph©n tö (m¹ch th¼ng hay vßng) sÏ di chuyÓn qua hÖ m¹ng cña gel tõ cùc ©m (cathode)
sang cùc d−¬ng (anode) víi tèc ®é di chuyÓn kh¸c nhau. V× vËy, chóng dÇn dÇn t¸ch nhau
ra trªn tr−êng ®iÖn di; qua ®ã, ng−êi ta cã thÓ thu thËp vµ ph©n tÝch ®−îc tõng ph©n
®o¹n ADN hoÆc gen riªng rÏ. Trªn tr−êng ®iÖn di, c¸c ph©n ®o¹n ADN cã kÝch th−íc cµng
nhá cµng di chuyÓn nhanh. Sau khi ®iÖn di kÕt thóc, c¸c ph©n tö ADN cã thÓ quan s¸t

325
§inh §oµn Long

®−îc nhê sö dông thuèc nhuém ph¸t huúnh quang, nh− ethidium bromide (EtBr, xem c¬
chÕ ë ch−¬ng 3). Mçi b¨ng ®iÖn di th−êng ph¶n ¸nh mét tËp hîp c¸c ph©n tö ADN cã
cïng kÝch th−íc.
Cã hai lo¹i gel ®iÖn di ®−îc dïng phæ biÕn lµ agarose vµ polyacrylamide. Trong
®ã, gel polyacrylamide cã ®é ph©n gi¶i cao, nh−ng vïng kÝch th−íc ADN cã thÓ ph©n tÝch
hÑp. Cô thÓ, ph−¬ng ph¸p nµy cã thÓ ph©n t¸ch c¸c ®o¹n ADN kh¸c nhau thËm chÝ chØ
mét cÆp nucleotide (1 bp), nh−ng th−êng chØ dïng ®Ó ph©n tÝch c¸c ®o¹n ADN kÝch th−íc
nhá (tõ 5 ®Õn 1000 bp). Trong khi ®ã, gel agarose cã ®é ph©n gi¶i thÊp ®èi víi c¸c ®o¹n
ADN kÝch th−íc nhá, nh−ng rÊt hiÖu qu¶ khi ph©n t¸ch c¸c ®o¹n ADN kÝch th−íc lín
(kho¶ng tõ 200 bp ®Õn 20 kb; 1 kb = 1000 bp).
C¸c ®o¹n ADN kÝch th−íc lín kh«ng thÓ “lät” qua c¸c lç nhá trªn c¸c b¶n gel, kÓ c¶
gel agarose. Thay vµo ®ã, chóng (th−êng ë d¹ng m¹ch th¼ng) “tr−ên” qua m¹ng l−íi gel
b»ng c¸ch ®Çu nµy cña ph©n tö ®i tr−íc, cßn ®Çu kia theo sau. HËu qu¶ lµ c¸c ®o¹n ADN
lín (tõ 10 kb ®Õn 10 Mb; 1 Mb = 1000 kb) cã tèc ®é dÞch chuyÓn trªn tr−êng ®iÖn di gÇn
t−¬ng ®−¬ng vµ khã ph©n t¸ch nhê ®iÖn di th«ng th−êng. §èi víi c¸c ®o¹n ADN lín nh−
vËy, ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®iÖn di xung tr−êng (PFGE, pulsed-field gel
electrophoresis). Trong ph−¬ng ph¸p nµy, 2 cÆp ®iÖn cùc ®−îc ®Æt chÐo gãc trªn b¶n ®iÖn
di (h×nh 11.2). ViÖc “bËt” vµ “t¾t” lu©n phiªn 2 cÆp ®iÖn cùc lµm c¸c ®o¹n ADN lín thay
®æi chiÒu dÞch chuyÓn nh− m×nh häa trªn h×nh. C¸c ®o¹n ADN cã kÝch th−íc cµng lín
cµng chËm h¬n trong qu¸ tr×nh ®æi chiÒu dÞch chuyÓn. Nhê vËy, c¸c ®o¹n kÝch th−íc kh¸c
nhau sÏ t¸ch khái nhau. Kü thuËt PFGE trong thùc tÕ cã thÓ dïng ®Ó x¸c ®Þnh trùc tiÕp
kÝch th−íc cña nhiÔm s¾c thÓ (NST) vi khuÈn, hoÆc NST sinh vËt nh©n thËt bËc thÊp,
nh− nÊm men hoÆc mét sè nguyªn sinh ®éng vËt. KÝch th−íc hÖ gen cña nh÷ng loµi nµy
kho¶ng vµi Mb.
§èi víi c¸c ®o¹n ADN kÝch th−íc nhá chØ kh¸c nhau mét vµi bp, vÝ dô nh− c¸c s¶n
phÈm PCR cña c¸c alen thuéc cïng locut, ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®iÖn di
biÕn tÝnh gradient (DGGE). Trong kü thuËt DGGE, c¸c ph©n tö ADN sîi kÐp ®−îc g©y
biÕn tÝnh bëi nhiÖt hoÆc hãa chÊt, nh− urª hay formamide (®«i khi phèi hîp c¶ hai
ph−¬ng ph¸p) ®ång thêi víi qu¸ tr×nh diÖn di. NhiÖt ®é th−êng ®−îc duy tr× cao (50 –
§iÖn cùc 0% Gradient biÕn tÝnh 70% C¸c giÕng tra mÉu

ThÓ ®ét biÕn 1 40%


ChiÒu dÞch chuyÓn cña ADN

Gradient biÕn tÝnh


dÔ biÕn tÝnh h¬n

ADN
kiÓu d¹i

ThÓ ®ét biÕn 2


khã biÕn tÝnh h¬n
70%

DGGE vu«ng gãc DGGE song song

H×nh 11.2. Kü thuËt ®iÖn di xung tr−êng. H×nh 11.3 C¸c kü thuËt ®iÖn di biÕn tÝnh gradient DGGE
A vµ B lµ hai bé ®iÖn cùc. Chóng ®−îc bËt vµ t¾t (Denaturing gradient gel electrophoresis). Trong DGGE vu«ng gãc,
lu©n phiªn. Khi bËt A, ph©n tö ADN di chuyÓn vÒ hçn hîp 3 ®o¹n ADN (kiÓu d¹i, ®ét biÕn 1 vµ 2) ®−îc tra vµo mét
gãc ph¶i phÝa d−íi. Khi A t¾t vµ B bËt, ph©n tö giÕng dµi n»m ngang b¶n gel. Do t¸c ®éng cña chÊt g©y biÕn tÝnh ë
ADN di chuyÓn vÒ gãc tr¸i phÝa d−íi. Mòi tªn m« nång ®é kh¸c nhau, sù ®Þnh vÞ cña c¸c ®o¹n ADN t¹o nªn d¹ng
t¶ h−íng di chuyÓn cña ph©n tö ADN trong ®iÖn ®−êng cong sigma. §iÖn di DGGE song song t¹o nªn phæ ®iÖn di
di xung tr−êng. gièng ®iÖn di trªn gel th«ng th−êng.

326
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

65oC) vµ æn ®Þnh, trong khi nång ®é urª vµ formamide ®−îc t¨ng dÇn theo chiÒu song
song (DGGE song song) hoÆc vu«ng gãc (DGGE vu«ng gãc) víi chiÒu ®iÖn di. Trong
DGGE song song, kÕt qu¶ ®iÖn di h×nh thµnh c¸c b¨ng t¸ch biÖt gièng ®iÖn di trªn gel
agarose. Trong DGGE vu«ng gãc, hçn hîp c¸c ph©n tö ADN chØ kh¸c biÖt nhau mét hoÆc
mét vµi bp ph©n t¸n kh¾p b¶n gel vµ t¹o nªn mét chuçi b¨ng d¹ng ®−êng cong sigma
(h×nh 11.3).
§iÖn di kh«ng nh÷ng cã thÓ ph©n t¸ch c¸c ®o¹n ADN kh¸c nhau vÒ kÝch th−íc mµ
c¶ vÒ h×nh d¹ng vµ cÊu h×nh cña chóng. C¸c ph©n tö ADN ë d¹ng m¹ch vßng duçi xo¾n
hoÆc bÞ “®øt g·y” ë mét sè nucleotide di chuyÓn chËm h¬n trªn tr−êng ®iÖn di so víi c¸c
ph©n tö ADN ë d¹ng m¹ch th¼ng cã cïng khèi l−îng. Trong khi ®ã, c¸c ph©n tö ADN ë
d¹ng siªu xo¾n (kÝch th−íc thu nhá) th−êng di chuyÓn nhanh h¬n trªn tr−êng ®iÖn di so
víi c¸c ph©n tö ADN d¹ng m¹ch vßng duçi xo¾n hoÆc cã møc ®é cuén xo¾n thÊp h¬n cã
cïng khèi l−îng.
Kü thuËt ®iÖn di còng ®−îc dïng ®Ó ph©n t¸ch ARN. Gièng ADN, c¸c ph©n tö ARN
còng tÝch ®iÖn ©m. Tuy nhiªn, nÕu nh− c¸c ®o¹n ADN sîi kÐp th¼ng th−êng cã cÊu tróc
bËc hai ®ång nhÊt (nªn tèc ®é dÞch chuyÓn trªn tr−êng ®iÖn di t−¬ng quan víi khèi l−îng
cña chóng), th× ARN ngoµi cÊu tróc m¹ch ®¬n, cßn cã c¸c cÊu tróc bËc 2 vµ 3 ¶nh h−ëng
®Õn tèc ®é dÞch chuyÓn cña chóng trªn tr−êng ®iÖn di. §Ó h¹n chÕ ®iÒu nµy, ng−êi ta
th−êng xö lý ARN víi mét sè hãa chÊt ph¸ vì liªn kÕt côc bé trong ph©n tö, nh− glyoxal.
Hîp chÊt nµy liªn kÕt vµo nhãm -NH2 cña c¸c baz¬ nit¬ vµ ng¨n c¶n sù kÕt cÆp gi÷a
chóng. C¸c ARN ®−îc xö lý glyoxal kh«ng h×nh thµnh c¸c cÊu tróc bËc cao, nªn tèc ®é di
chuyÓn trªn tr−êng ®iÖn di phô thuéc chñ yÕu vµo khèi l−îng ph©n tö cña chóng. ë phÇn
sau cña ch−¬ng nµy, chóng ta sÏ thÊy kü thuËt ®iÖn di còng ®−îc dïng phæ biÕn trong
ph©n tÝch protein.

11.2.4. Sö dông enzym giíi h¹n trong ph©n tÝch ADN


HÇu hÕt c¸c ph©n tö ADN trong tù nhiªn ®Òu lín h¬n nhiÒu so víi kÝch th−íc cã
thÓ thao t¸c thuËn lîi trong phßng thÝ nghiÖm. Trong tÕ bµo, phÇn lín NST lµ mét ph©n
tö ADN chøa hµng tr¨m, thËm chÝ hµng ngh×n gen kh¸c nhau. V× vËy, ®Ó ph©n lËp vµ
ph©n tÝch tõng gen, ng−êi ta th−êng ph¶i c¾t c¸c ph©n tö ADN kÝch th−íc lín thµnh c¸c
®o¹n nhá. C«ng viÖc nµy ®−îc thùc hiÖn bëi mét nhãm enzym ®Æc biÖt gäi lµ c¸c enzym
giíi h¹n.
TÊt c¶ c¸c enzym giíi h¹n ®Òu cã hai ®Æc tÝnh: 1) nhËn biÕt mét tr×nh tù ®Æc hiÖu
trªn ADN (gäi lµ vÞ trÝ giíi h¹n); vµ 2) c¾t trong ph©n tö ADN t¹i vÞ trÝ ®Æc hiÖu (hoÆc
ngay t¹i vÞ trÝ giíi h¹n nh− c¸c enzym giíi h¹n lo¹i II, hoÆc c¸ch vÞ trÝ giíi h¹n mét sè
nucleotide nhÊt ®Þnh nh− c¸c enzym giíi h¹n lo¹i I, III vµ IV). Trong kü thuËt di truyÒn,
c¸c enzym giíi h¹n lo¹i II (chiÕm kho¶ng 40%) ®−îc dïng phæ biÕn h¬n c¶ v× tr×nh tù
ADN t¹i vÞ trÝ c¾t cña chóng lµ x¸c ®Þnh. C¸c vÞ trÝ giíi h¹n cña nhãm enzym nµy th−êng
gåm 4 - 8 bp, th−êng cã tÝnh ®èi xøng vµ ®iÓm c¾t trong tr×nh tù giíi h¹n. VÝ dô nh−
EcoRI t×m thÊy ë E. coli cã tr×nh tù giíi h¹n lµ 5’-G↓AATTC-3’ víi vÞ trÝ c¾t ë gi÷a G vµ
A. Tªn enzym gåm 3 ký tù ®Çu chØ tªn loµi vi khuÈn tõ ®ã enzym ®−îc t×m ra (Eco =
Escherichia coli), c¸c ký tù sau chØ chñng vi khuÈn (vÝ dô: R) vµ sè thø tù enzym ®−îc
thÊy ë vi khuÈn ®ã (EcoRI lµ enzym giíi h¹n ®Çu tiªn ph¸t hiÖn ®−îc ë E. coli).
Mét enzym giíi h¹n cã tr×nh tù giíi h¹n gåm 6 bp gièng nh− EcoRI th−êng ®−îc
tr«ng ®îi cã trung b×nh mét vÞ trÝ c¾t trong mçi ®o¹n ADN cã kÝch th−íc kho¶ng 4 kb (bëi
theo x¸c suÊt, t¹i mét vÞ trÝ nhÊt ®Þnh trªn ADN, x¸c suÊt ®Ó cã mét lo¹i nucleotide nhÊt

327
§inh §oµn Long

®Þnh lµ 1/4, v× vËy x¸c suÊt ®Ó cã mét tr×nh tù nhÊt ®Þnh gåm 6 bp sÏ lµ 1/46 = 1/4096).
Nãi c¸ch kh¸c, kÝch th−íc trung b×nh cña c¸c ®o¹n ADN ®−îc c¾t bëi EcoRI lµ 4096 bp.
Gi¶ sö mét ph©n tö ADN m¹ch th¼ng cã 6 vÞ trÝ c¾t cña EcoRI, th× ph©n tö nµy sau khi
®−îc xö lý víi enzym sÏ cho 7 ph©n ®o¹n ADN kh¸c nhau. Trªn tr−êng ®iÖn di, s¶n phÈm
c¾t gåm 7 ph©n ®o¹n ADN nµy sÏ ph©n t¸ch nhau ra do kh¸c nhau vÒ khèi l−îng.
ViÖc sö dông mét enzym giíi h¹n kh¸c, ch¼ng h¹n HindIII còng cã tr×nh tù giíi h¹n
gåm 6 bp, nh−ng cã tr×nh tù giíi h¹n thay ®æi (5’-A↓AGCTT-3’) sÏ cho ra c¸c s¶n phÈm
c¾t kh¸c víi khi sö dông EcoRI. Víi mét sè enzym giíi h¹n kh¸c, ch¼ng h¹n nh− Sau3AI
(t×m thÊy ë vi khuÈn Staphylococcus aureus) cã tr×nh tù giíi h¹n ng¾n h¬n (5’-GA↓TC-
3’), nªn tÇn sè c¾t cña chóng th−êng cao h¬n c¸c enzym cã tr×nh tù giíi h¹n dµi. Theo x¸c
suÊt, c¸c ®o¹n ADN sîi kÐp ®−îc Sau3AI c¾t cã kÝch th−íc trung b×nh kho¶ng 250 bp
(1/44 = 1/256). Ng−îc l¹i, enzym NotI cã tr×nh tù giíi h¹n dµi (5’-GC↓GGCCGC-3’) t¹o ra
c¸c ®o¹n c¾t trung b×nh dµi 65 kb (1/48 = 1/65.536). Nh− vËy, viÖc sö dông ®ång thêi
nhiÒu enzym giíi h¹n sÏ t¹o ra mét phæ c¸c kiÓu h×nh ®iÖn di ®Æc thï ®èi víi mçi gen
®−îc ph©n tÝch.
C¸c enzym giíi h¹n kh«ng chØ kh¸c nhau vÒ tr×nh tù giíi h¹n vµ ®é dµi ®o¹n tr×nh
tù giíi h¹n ®Æc tr−ng cña chóng, mµ cßn kh¸c nhau vÒ c¸ch “c¾t” ph©n tö ADN. Ch¼ng
h¹n nh− Sau3AI nªu trªn t¹o ra c¸c ph©n tö ADN d¹ng ®Çu b»ng (®Çu tï), cßn c¸c
enzym EcoRI, HindIII vµ NotI c¾t ph©n tö ADN t¹o ra c¸c ph©n ®o¹n cã ®Çu dÝnh. Së dÜ
gäi lµ “®Çu dÝnh” v× hai ®Çu ph©n tö ADN sau khi ®−îc enzym c¾t cã tr×nh tù bæ sung víi
nhau theo nguyªn t¾c Chargaff; v× vËy, chóng cã xu h−íng “dÝnh” l¹i víi nhau, hoÆc
“dÝnh” víi c¸c ph©n tö ADN kh¸c ®−îc c¾t bëi cïng enzym giíi h¹n. TÝnh chÊt nµy ®−îc
dïng trong nh©n dßng ph©n tö vµ ADN t¸i tæ hîp. Mét sè enzym giíi h¹n kh¸c c¾t ®Æc
hiÖu ADN m¹ch ®¬n.

11.2.5. C¸c ph−¬ng ph¸p lai axit nucleic vµ mÉu dß


Nh− ®· nªu ë ch−¬ng 2 (môc 2.1.4.3), c¸c ph©n tö ADN sîi kÐp cã tÝnh chÊt ®Æc biÖt
lµ kh¶ n¨ng biÕn tÝnh (t¸ch thµnh hai m¹ch ®¬n) vµ håi tÝnh (hai m¹ch ®¬n cã tr×nh tù bæ
sung liªn kÕt trë l¹i khi lo¹i bá c¸c yÕu tè g©y biÕn tÝnh). Kh¶ n¨ng liªn kÕt bæ sung gi÷a
c¸c baz¬ nit¬ cho phÐp hai m¹ch ADN cã nguån gèc kh¸c nhau nh−ng cã tr×nh tù bæ trî
liªn kÕt víi nhau trong ®iÒu kiÖn phï hîp (vÒ nhiÖt ®é, ®é pH, …) ®Ó t¹o nªn mét ph©n tö
ADN míi. HiÖn t−îng liªn kÕt nh− vËy cã thÓ x¶y ra gi÷a hai m¹ch ADN víi nhau, hoÆc
gi÷a hai m¹ch ARN hoÆc gi÷a ADN vµ ARN. Ph©n tö axit nucleic sîi kÐp míi h×nh thµnh
®−îc gäi lµ ph©n tö lai vµ qu¸ tr×nh kÕt cÆp gi÷a c¸c baz¬ thuéc hai m¹ch ®¬n axit
nucleic cã nguån gèc kh¸c nhau theo nguyªn t¾c bæ sung nh− vËy ®−îc gäi lµ qu¸ tr×nh
lai ph©n tö.
NhiÒu nghiªn cøu di truyÒn ph©n tö hiÖn nay dùa trªn ph−¬ng ph¸p lai ph©n tö. VÝ
dô: b»ng ph−¬ng ph¸p nµy, ng−êi ta cã thÓ dïng mét ®o¹n ADN cã tr×nh tù biÕt tr−íc, gäi
lµ mÉu dß, ®Ó x¸c ®Þnh mét tr×nh tù bæ sung t−¬ng øng cã trong hÖ gen ®−îc quan t©m
nghiªn cøu. C¸c mÉu dß cã thÓ cã nguån gèc tù nhiªn hoÆc ®−îc tæng hîp hãa häc; ®Ó dÔ
ph¸t hiÖn, c¸c mÉu dß th−êng ®−îc ®¸nh dÊu bëi chÊt phãng x¹ hoÆc chÊt ph¸t quang.
Cã hai ph−¬ng ph¸p ®¸nh dÊu mÉu dß ADN. Ph−¬ng ph¸p thø nhÊt dùa trªn
nguyªn t¾c tæng hîp hãa häc ADN sö dông tiÒn chÊt lµ c¸c ph©n tö ®−îc ®¸nh dÊu phãng
x¹ hoÆc ph¸t quang. Ph−¬ng ph¸p thø hai dùa trªn nguyªn t¾c g¾n mét ph©n tö ®¸nh
dÊu vµo ®u«i cña mét tr×nh tù ADN cã s½n. VÝ dô, nhê sö dông enzym polynucleotide
kinase, ng−êi ta cã thÓ g¾n nhãm γ cña ATP vµo nhãm 5’-OH cña ®o¹n ADN lµm mÉu
dß. NÕu nhãm γ nµy ®−îc ®¸nh dÊu b»ng ®ång vÞ 32P th× ADN mÉu dß sÏ ph¸t phãng x¹.
Trong ph−¬ng ph¸p cßn l¹i (sö dông c¸c tiÒn chÊt ®¸nh dÊu), ng−êi ta cã thÓ thùc hiÖn
ph¶n øng PCR víi mét trong 4 tiÒn chÊt dNTP ®−îc ®¸nh dÊu víi chÊt ph¸t quang hoÆc

328
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

phãng x¹. Trong ph−¬ng ph¸p nµy, chØ cÇn 25% nucleotide cña mÉu dß ADN ®−îc ®¸nh
dÊu lµ ®ñ ®Ó ph©n tÝch.
C¸c mÉu dß ADN ®−îc ®¸nh dÊu b»ng chÊt ph¸t quang cã thÓ ph¸t hiÖn d−íi nguån
s¸ng UV, cßn c¸c mÉu dß ®¸nh dÊu phãng x¹ ®−îc ph¸t hiÖn b»ng ph−¬ng ph¸p phãng x¹
tù chôp nhê phim tia X, hoÆc ®o b»ng m¸y khuÕch ®¹i tÝn hiÖu h¹t β víi hai ®ång vÞ
phãng x¹ ®−îc dïng phæ biÕn lµ 32P vµ 35S. Cã nhiÒu c¸ch ®Ó x¸c ®Þnh c¸c ph©n ®o¹n ADN
vµ ARN ®Æc hiÖu dùa trªn lai ph©n tö. D−íi ®©y, chóng ta chØ ®Ò cËp ®Õn hai ph−¬ng
ph¸p phæ biÕn.
11.2.5.1. X¸c ®Þnh c¸c ®o¹n ADN b»ng ®iÖn di vµ mÉu dß - lai Southern
Sö dông mÉu dß kÕt hîp víi ®iÖn di lµ ph−¬ng ph¸p c¬ b¶n ®ång thêi cã thÓ gióp
x¸c ®Þnh møc ®é phæ biÕn vµ kÝch th−íc cña mét ®o¹n ADN hoÆc ARN ®−îc quan t©m
nghiªn cøu. VÝ dô: b»ng ph−¬ng ph¸p nµy, ng−êi ta cã thÓ x¸c ®Þnh vµ so s¸nh ®−îc møc
biÓu hiÖn cña mét gen ë c¸c lo¹i m« vµ tÕ bµo qua viÖc x¸c ®Þnh sè l−îng b¶n phiªn m·
mARN t−¬ng øng cña gen cã t¹i mçi lo¹i m« vµ tÕ bµo t−¬ng øng.
Gi¶ sö chóng ta c¾t hÖ gen cña nÊm men b»ng EcoRI vµ cÇn x¸c ®Þnh kÝch th−íc
cña ®o¹n ADN mang tr×nh tù gen A. ADN tæng sè sau khi ®−îc c¾t b»ng EcoRI sÏ t¹o nªn
mét hçn hîp c¸c ph©n ®o¹n cã kÝch th−íc trung b×nh 4 kb (v× 46 = 4.096 bp). V× vËy, nÕu
®em s¶n phÈm c¾t giíi h¹n nhuém víi EtBr, th× s¶n phÈm ®iÖn di sÏ lµ mét d¶i c¸c ®o¹n
liªn tôc cã kÝch th−íc quanh vïng 4 kb vµ kh«ng thÓ x¸c ®Þnh ®−îc chÝnh x¸c ph©n ®o¹n
nµo mang gen A. Trong tr−êng hîp nµy, kü thuËt lai Southern (cßn gäi lµ thÈm t¸ch
Southern) cã thÓ ®−îc dïng ®Ó x¸c ®Þnh ®o¹n ADN mang gen ®ã (h×nh 11.4). Ng−êi ta
mang gel ®iÖn di chøa c¸c s¶n phÈm c¾t ng©m vµo dung dÞch kiÒm nhÑ ®Ó lµm biÕn tÝnh
ADN. Råi c¸c ®o¹n ADN ®−îc chuyÓn sang mét mµng tÝch ®iÖn d−¬ng gäi lµ mµng lai
theo kiÓu “®ãng dÊu”. NghÜa lµ c¸c ®o¹n ADN ®Þnh vÞ trªn mµng lai sÏ t−¬ng øng víi c¸c
®o¹n ADN trªn gel ®iÖn di. Mµng lai sau ®ã ®−îc ñ víi mÉu dß cã tr×nh tù ADN bæ sung
víi tr×nh tù cña gen A. Qu¸ tr×nh ñ ®−îc tiÕn hµnh trong ®iÒu kiÖn nhiÖt ®é vµ nång ®é
muèi phï hîp cho sù håi tÝnh cña axit nucleic. Trong ®iÒu kiÖn ®ã, c¸c mÉu dß sÏ chØ t¹o
liªn kÕt ®Æc hiÖu víi ph©n ®o¹n ADN mang gen A. Do c¸c ®o¹n gen th−êng cã kÝch th−íc
lín h¬n nhiÒu so víi mÉu dß, nªn kh¶ n¨ng håi tÝnh cña c¸c ®o¹n gen sÏ khã x¶y ra h¬n
so víi “ph¶n øng”
lai gi÷a mÉu dß víi a) C¸c b−íc trong ph−¬ng ph¸p lai Southern
gen. C¸c ®o¹n ADN C¸c mÉu dß ADN ®−îc ®¸nh
dÊu phãng x¹ hoÆc ph¸t quang VÞ trÝ ®o¹n ADN
mang tr×nh tù gen lai víi mÉu dß
cÇn nghiªn cøu sau ADN C¸c ®o¹n ADN
®ã ®−îc ph¸t hiÖn
vµ ph©n lËp nhê c¸c
C¾t b»ng §iÖn di
ph−¬ng ph¸p ph¸t enzym giíi h¹n Lai vµ röa
hiÖn mÉu dß ®· nªu mÉu dß
ë trªn. thõa
Mét ph−¬ng
BiÕn tÝnh ADN vµ
ph¸p c¶i tiÕn cña lai chuyÓn lªn mµng lai
Southern ®−îc dïng
®Ó x¸c ®Þnh vïng b) B−íc chuyÓn ADN tõ gel ®iÖn di sang mµng lai
Qu¶ nÆng
m· hãa (exon) cña
gen ®−îc gäi lµ
ph−¬ng ph¸p lai
Zoo. Ph−¬ng ph¸p Dung dÞch ®Öm Mµng lai
GiÊy läc
Gel
lai nµy dùa trªn H×nh 11.4. Ph−¬ng ph¸p
hiÖn t−îng lµ trong lai (thÈm t¸ch) Southern.

329
§inh §oµn Long

qu¸ tr×nh tiÕn hãa, c¸c tr×nh tù nucleotide trong c¸c vïng kh«ng m· hãa th−êng biÕn ®æi
nhanh h¬n so víi c¸c vïng m· hãa ë cïng mét gen, khi so s¸nh gi÷a c¸c loµi cã quan hÖ
gÇn gòi. Ch¼ng h¹n, ë mét nghiªn cøu, ng−êi ta t¸ch chiÕt ADN tõ mét nhãm c¸c loµi
kh¸c nhau gåm ng−êi, v−în, khØ, chuét, bß, v.v... ADN cña mçi loµi sau ®ã ®−îc c¾t bëi
cïng enzym giíi h¹n phï hîp; råi c¸c ®o¹n c¾t ®−îc ph©n t¸ch trªn ®iÖn di vµ chuyÓn lªn
mµng lai. C¸c ®o¹n ADN nµy sau ®ã ®−îc lai víi mÉu dß cã nguån gèc ng−êi ®−îc “gi¶
thiÕt” lµ tr×nh tù m· hãa. NÕu ®ã thùc sù lµ tr×nh tù m· hãa th× ph¶n øng lai sÏ x¶y ra
víi tÊt c¶ hoÆc hÇu hÕt c¸c mÉu ADN; nÕu kh«ng, nhiÒu kh¶ n¨ng tr×nh tù t−¬ng øng víi
mÉu dß kh«ng ph¶i lµ tr×nh tù m· hãa.
11.2.5.2. X¸c ®Þnh c¸c ®o¹n ARN b»ng ®iÖn di vµ mÉu dß - lai Northern
Víi cïng nguyªn t¾c, mét ph−¬ng ph¸p lai ®−îc dïng ®Ó ph©n tÝch s¶n phÈm phiªn
m· mARN ®−îc gäi lµ ph−¬ng ph¸p lai Northern (hay thÈm t¸ch Northern). Tuy
nhiªn, v× mARN th−êng ng¾n h¬n nhiÒu so víi ADN, nªn trong lai Northern, kh«ng cÇn
c¾t mARN. Hçn hîp mARN sau khi ph©n t¸ch b»ng ®iÖn di ®−îc chuyÓn lªn mµng lai víi
mÉu dß ADN t−¬ng øng víi ®o¹n mARN ®−îc t×m kiÕm. S¶n phÈm lai ë ®©y lµ
ARN/ADN.
Trong thùc tiÔn, lai Northern th−êng ®−îc dïng ®Ó ®Þnh l−îng mét lo¹i ph©n tö
mARN nµo ®ã cã trong mÉu ph©n tÝch h¬n lµ ®Ó x¸c ®Þnh kÝch th−íc cña nã. §Ó ®Þnh
l−îng mARN, mÉu dß th−êng ®−îc ®−a vµo ph¶n øng lai víi mét l−îng d− võa ®ñ nh»m
®¶m b¶o l−îng ph©n tö lai t¹o thµnh tØ lÖ thuËn víi l−îng mARN. L−îng mARN cã trong
m« ®−îc coi lµ th«ng sè ph¶n ¸nh møc ®é biÓu hiÖn cña gen t−¬ng øng. Ch¼ng h¹n, b»ng
lai Northern, c¸c nhµ nghiªn cøu cã thÓ ®¸nh gi¸ ®−îc ¶nh h−ëng cña mét yÕu tè phiªn
m· tíi sù biÓu hiÖn cña gen nhÊt ®Þnh khi so s¸nh l−îng mARN do gen ®ã m· hãa cã
trong c¸c m« ®−îc xö lý vµ kh«ng ®−îc xö lý víi yÕu tè phiªn m·. T−¬ng tù nh− vËy, kü
thuËt nµy cho phÐp so s¸nh møc ®é biÓu hiÖn cña gen ë c¸c giai ®o¹n ph¸t triÓn kh¸c
nhau cña c¬ thÓ.

11.2.5.3. Ph−¬ng ph¸p lai vi d·y (microarray)


Nguyªn lý cña c¸c ph−¬ng ph¸p lai Southern còng chÝnh lµ c¬ së cña kü thuËt
ph©n tÝch ADN b»ng vi d·y (DNA microarray) ®−îc ph¸t triÓn vµ ngµy cµng ®−îc
dïng réng r·i trong c¸c nghiªn cøu di truyÒn ë cÊp ph©n tö. Trong ph−¬ng ph¸p lai vi
d·y, c¸c mÉu dß th−êng lµ c¸c ®o¹n cADN ®−îc t¹o ra tõ phiªn m· ng−îc c¸c mARN
t−¬ng øng ®−îc t¸ch chiÕt tõ c¸c m« hoÆc tÕ bµo. C¸c mÉu dß nµy sau ®ã ®−îc dïng ®Ó lai
víi mét d·y “giÕng thö” chøa c¸c ph©n tö ADN ®−îc t¸ch chiÕt tõ c¸c mÉu sinh vËt kh¸c
nhau, trong ®ã mçi d·y th−êng ®−îc bæ sung mÉu dß liªn quan ®Õn mét hoÆc mét sè gen
nhÊt ®Þnh. C−êng ®é biÓu hiÖu cña s¶n phÈm lai (®o ®−îc qua mÉu dß) ë mçi d·y vµ ®èi
chiÕu gi÷a c¸c d·y gióp ph¶n ¸nh møc ®é biÓu hiÖn cña gen trong c¸c ®iÒu kiÖn hoÆc ë
c¸c mÉu sinh vËt kh¸c nhau.

11.2.5.4. Lai huúnh quang t¹i chç - FISH


NÕu nh− c¸c ph−¬ng ph¸p lai ®−îc nªu ë trªn ®Òu cÇn t¸ch chiÕt ADN vµ ARN tõ tÕ
bµo, th× ph−¬ng ph¸p lai huúnh quang t¹i chç, ®−îc gäi t¾t lµ lai FISH (fluorescence in
situ hybridization), sö dông mÉu dß ®Ó ph¸t hiÖn trùc tiÕp sù cã mÆt cña mét gen hay
b¶n phiªn m· mARN cña nã trong tÕ bµo mµ kh«ng cÇn qua b−íc t¸ch chiÕt axit nucleic
(h×nh 11.5). Trong b−íc ®Çu tiªn, mÉu dß cã tr×nh tù t−¬ng øng víi gen quan t©m ®−îc
t¹o ra hoÆc b»ng kü thuËt nh©n dßng ph©n tö hoÆc b»ng PCR. Th−êng th× chØ mét phÇn
tr×nh tù ADN cña gen lµ ®ñ ®Ó lµm mÉu dß. Trong ph−¬ng ph¸p nµy, c¸c mÉu dß lu«n
®−îc ®¸nh dÊu b»ng chÊt ph¸t quang ®Ó sau qu¸ tr×nh lai chóng dÔ dµng ®−îc ph¸t hiÖn
b»ng kÝnh hiÓn vi huúnh quang. Gièng c¸c ph−¬ng ph¸p lai kh¸c, trong lai FISH, ADN

330
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

vµ ARN còng cÇn ®−îc g©y biÕn


tÝnh; nh−ng, viÖc g©y biÕn tÝnh MÉu dß ADN ChÊt ph¸t quang
®−îc thùc hiÖn ngay trªn c¸c
mÉu m« vµ tÕ bµo nªn ADN
®−îc duy tr× t¹i chç (in situ)
trong nh©n tÕ bµo. §Ó thùc hiÖn BiÕn tÝnh Quan s¸t b»ng kÝnh
vµ trén hiÓn vi huúnh quang
"ph¶n øng" lai, c¸c mÉu m« ®−îc
c¾t thµnh c¸c l¸t máng nhê dao
c¾t chuyªn dông (microtome)
tr−íc khi ®−îc chuyÓn vµo dung H×nh 11.5. Ph−¬ng ph¸p lai huúnh quang t¹i chç (FISH).
dÞch biÕn tÝnh vµ lai víi mÉu dß.
Mét sè øng dông c¬ b¶n cña ph−¬ng ph¸p lai FISH cã thÓ kÓ ®Õn nh− sau:
1) Cã thÓ sö dông mét sè tr×nh tù gen cña virut lµm mÉu dß ®Ó x¸c ®Þnh xem tÕ
bµo cã mang c¸c gen cña virut hay kh«ng, còng nh− ®Ó x¸c ®Þnh gen cña mét
virut nµo ®ã chØ giíi h¹n trong tÕ bµo chÊt hay th©m nhËp ®−îc vµo trong nh©n
tÕ bµo chñ.
2) Bªn c¹nh ADN trong nh©n tÕ bµo, lai FISH cã thÓ dïng ®Ó x¸c ®Þnh vÞ trÝ cña mét
gen trªn NST th«ng qua viÖc lai mÉu dß víi tÕ bµo ë kú gi÷a cña nguyªn ph©n.
3) MÉu dß ADN cã thÓ dïng ®Ó ph¸t hiÖn mét lo¹i mARN cã trong mét m« nhÊt
®Þnh. Do mARN th−êng ë d¹ng m¹ch ®¬n nªn mÉu m« kh«ng cÇn ph¶i g©y biÕn
tÝnh bëi nhiÖt ®é cao hay hãa chÊt. C¸c tÕ bµo ®ang phiªn m· vµ tæng hîp m¹nh
lo¹i mARN ®−îc quan t©m nghiªn cøu sÏ cã mËt ®é liªn kÕt mÉu dß cao vµ ph¸t
quang m¹nh. Gen biÓu hiÖn cµng m¹nh, th× tÕ bµo ph¸t quang cµng s¸ng. ViÖc so
s¸nh c¸c mÉu nh− vËy tõ c¸c m« kh¸c nhau cã thÓ gióp x¸c ®Þnh chøc n¨ng cña
mét gen nhÊt ®Þnh. Tuy vËy, trong mét sè tr−êng hîp gen nghiªn cøu thuéc
nhãm lu«n biÓu hiÖn yÕu (chØ cã vµi b¶n sao mARN trong mçi tÕ bµo), th× tÝn
hiÖu FISH th−êng yÕu vµ kh«ng ®ñ ®Ó ph©n tÝch. Lóc nµy, viÖc ph¸t hiÖn mARN
®−îc thùc hiÖn bëi mét sè ph−¬ng ph¸p nh¹y h¬n,nh− ph−¬ng ph¸p PCR ®Þnh
l−îng (RT-PCR) hoÆc microarray.
Nh»m t¨ng c−êng hiÖu qu¶ cña ph−¬ng ph¸p lai FISH, mét sè mÉu dß cã thiÕt kÕt
®Æc biÖt ®−îc gäi lµ nhÊp nh¸y ph©n tö (molecular beacon). §©y lµ lo¹i mÉu dß chØ ph¸t
quang sau khi ®· liªn kÕt vµo tr×nh tù ADN ®Ých. MÉu dß nhÊp nh¸y ph©n tö th−êng
mang hai “gèc”: mét “gèc” ph¸t quang, gäi lµ nh©n ph¸t quang (fluorophore), ë mét ®Çu
ph©n tö; cßn ®Çu kia mang “gèc” øc chÕ sù ph¸t quang,
gäi lµ nh©n t¾t quang (quenching group). Mçi mÉu ADN
dß nhÊp nh¸y ph©n tö cã tr×nh tù trung t©m dµi MÉu dß nhÊp
kho¶ng 20 – 30 nucleotide bæ sung víi tr×nh tù gen cÇn nh¸y ph©n tö
ph©n tÝch. Ngoµi ra, ë hai ®Çu nã cã hai tr×nh tù gåm
kho¶ng 6 baz¬ nit¬ bæ sung víi nhau. Khi mÉu dß ë PT
d¹ng tù do (kh«ng liªn kÕt víi tr×nh tù gen ®Ých), hai
®Çu mÉu dß t¹o liªn kÕt Chargaff víi nhau, dÉn ®Õn
viÖc nh©n t¾t quang tiÕp xóc ®−îc víi nh©n ph¸t Lai víi mÉu dß
quang vµ øc chÕ sù ph¸t quang cña mÉu dß (h×nh Nh©n t¾t quang (T)
11.6). Khi mÉu dß ®· liªn kÕt vµo tr×nh tù ADN ®Ých, Nh©n ph¸t
T
tr×nh tù mÉu dß ®−îc duçi th¼ng, nªn nh©n t¾t quang P quang (P) tù do
kh«ng tiÕp xóc vµ øc chÕ ®−îc sù ph¸t quang cña nh©n
ph¸t quang. V× vËy, mÉu dß sÏ ph¸t quang m¹nh. Tuy Ph©n tö lai ADN – mÉu dß
nhiªn, ®iÒu cÇn l−u ý khi sö dông mÉu dß nhÊp nh¸y H×nh 11.6. Nguyªn t¾c lai ADN
ph©n tö lµ cÇn duy tr× tÝnh æn ®Þnh cña c¸c ®o¹n bæ dïng mÉu dß nhÊp nh¸y ph©n tö.

331
§inh §oµn Long

sung ng¾n ë hai ®Çu, v× nhiÖt ®é cao cã thÓ g©y biÕn tÝnh ®o¹n nµy vµ dÉn ®Õn hiÖn t−îng
"d−¬ng tÝnh gi¶".

11.2.6. Nh©n dßng ph©n tö vµ x©y dùng ng©n hµng gen

11.2.6.1. Mét sè kh¸i niÖm chung


Nh©n dßng ph©n tö (molecular cloning) chØ mét nhãm c¸c ph−¬ng ph¸p nh»m: (1)
ph©n lËp mét ®o¹n gen (ADN) ®Æc hiÖu tõ hçn hîp c¸c ph©n tö ADN ban ®Çu ®−îc t¸ch
chiÕt tõ c¸c mÉu sinh häc cã thµnh phÇn phøc t¹p; vµ (2) nh©n b¶n ®o¹n tr×nh tù ADN
®−îc quan t©m lªn mét l−îng ®ñ lín ®Ó cã thÓ tiÕn hµnh ph©n tÝch vÒ cÊu tróc vµ chøc
n¨ng gen t−¬ng øng.
ViÖc tinh s¹ch c¸c ®o¹n ADN ®Æc hiÖu ®¹t l−îng ®ñ lín lµ cÇn thiÕt ®Ó thùc hiÖn c¸c
b−íc nghiªn cøu tiÕp theo. Ch¼ng h¹n, tõ ®o¹n ADN ®−îc tinh s¹ch, ng−êi ta cã thÓ t¹o
nªn c¸c ph©n tö ADN t¸i tæ hîp. C¸c ph©n tö ADN t¸i tæ hîp míi cã thÓ lµm thay ®æi
møc biÓu hiÖn cña mét gen (ch¼ng h¹n, khi mét tr×nh tù m· hãa cña loµi nµy ®−îc “ghÐp”
víi promoter cña loµi kh¸c) hoÆc thËm chÝ tæng hîp nªn mét protein “dung hîp” míi
(protein lai) chøa tr×nh tù axit amin cã nguån gèc tõ c¸c loµi kh¸c nhau. Qu¸ tr×nh nh©n
dßng ph©n tö vµ t¹o ra ph©n tö ADN hoÆc protein t¸i tæ hîp th−êng liªn quan ®Õn c¸c
vect¬ nh©n dßng hoÆc c¸c vect¬ biÓu hiÖn. “C«ng cô” chÝnh ®Ó t¹o ADN t¸i tæ hîp lµ
c¸c enzym giíi h¹n gióp c¾t ADN t¹i c¸c vÞ trÝ x¸c ®Þnh vµ ghÐp nèi c¸c ®o¹n ADN cã
nguån gèc kh¸c nhau t¹i c¸c vÞ trÝ mong muèn. B»ng viÖc t¹o nªn c¸c ph©n tö ADN t¸i tæ
hîp cã kh¶ n¨ng tù sao chÐp trong tÕ bµo chñ, ®o¹n ADN cµi dÔ dµng ®−îc nh©n lªn
thµnh mét l−îng lín b¶n sao.
D−íi ®©y, chóng ta sÏ m« t¶ b»ng c¸ch nµo c¸c ph©n tö ADN ®−îc c¾t, t¸i tæ hîp vµ
nh©n lªn, ®ång thêi còng ®Ò cËp ®Õn viÖc x©y dùng th− viÖn hÖ gen gåm tËp hîp c¸c
dßng tÕ bµo mang c¸c ®o¹n ADN kh¸c nhau cña mét hÖ gen gióp ph©n tÝch chøc n¨ng
cña mçi gen, còng nh− ®Ó sö dông chóng trong c¸c øng dông cña di truyÒn häc.
11.2.6.2. Nh©n dßng ADN nhê vect¬ plasmid
Sau khi mét ®o¹n ADN ®−îc c¾t khái mét ph©n tö ADN cã kÝch th−íc lín h¬n b»ng
enzym giíi h¹n, ®o¹n ADN ®ã cÇn ®−îc “cµi” vµo mét vect¬ ®Ó cã thÓ nh©n lªn. §Õn nay,
tÕ bµo chñ ®−îc dïng réng r·i nhÊt trong c«ng nghÖ ADN t¸i tæ hîp lµ vi khuÈn E. coli.
C¸c vect¬ nh©n dßng ADN ®iÓn h×nh th−êng cã 3 ®Æc tÝnh:
1) Chóng ph¶i cã mét tr×nh tù khëi ®Çu sao chÐp (vÝ trÝ t¸i b¶n), gióp ph©n tö ADN
t¸i tæ hîp cã thÓ tù sao chÐp ®éc lËp víi NST cña tÕ bµo chñ.
2) Chóng ph¶i mang mét dÊu chuÈn chän läc cho phÐp ph©n biÖt ®−îc c¸c tÕ bµo
mang vect¬ t¸i tæ hîp vµ c¸c tÕ bµo kh«ng mang vect¬ t¸i tæ hîp.
3) Chóng th−êng cã vÞ trÝ c¾t cña mét hay nhiÒu enzym giíi h¹n kh¸c nhau. §©y
chÝnh lµ vÞ trÝ cµi cña ph©n ®o¹n ADN cÇn nh©n dßng vµo vect¬.
Vect¬ nh©n dßng phæ biÕn nhÊt lµ c¸c ph©n tö ADN sîi kÐp, m¹ch vßng, kÝch th−íc
nhá (kho¶ng 3 Kb) cã nguån gèc tõ c¸c plasmid vi khuÈn, mét sè tõ nÊm men. Trong
nhiÒu tr−êng hîp, c¸c ph©n tö ADN nµy vèn cã s½n hai thuéc tÝnh tù nhiªn, ®ã lµ: (1) kh¶
n¨ng tù sao chÐp trong tÕ bµo chñ, vµ (2) mang gen kh¸ng kh¸ng sinh; gen nµy ®−îc
dïng lµm dÊu hiÖu chän läc. Ngoµi ra, c¸c vect¬ plasmid cßn mét −u ®iÓm n÷a lµ chóng
cã thÓ nh©n lªn vµ tån t¹i thµnh nhiÒu b¶n sao trong mçi tÕ bµo. §iÒu nµy gióp dÔ dµng
nh©n b¶n vµ ph©n lËp ®−îc mét l−îng lín ®o¹n ADN cµi mµ chØ cÇn nu«i mét sè Ýt tÕ bµo
vi khuÈn.

332
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

C¸c vect¬ plasmid ®Çu tiªn chØ cã mét vÞ trÝ giíi h¹n duy nhÊt. Nh−ng cïng víi thêi
gian, cÊu tróc cña c¸c vect¬ plasmid ®−îc c¶i tiÕn theo h−íng bá bít c¸c tr×nh tù kh«ng
cÇn thiÕt vµ g¾n thªm ®o¹n tr×nh tù cã thÓ ®−îc c¾t b»ng nhiÒu enzym giíi h¹n kh¸c
nhau. Tr×nh tù mang nhiÒu vÞ trÝ giíi h¹n nh− vËy ®−îc gäi lµ tr×nh tù ®a nh©n dßng
(polycloning site). Cã nh÷ng tr×nh tù ®a nh©n dßng ®−îc thiÕt kÕ chØ dµi vµi tr¨m bp,
nh−ng cã trªn 20 vÞ trÝ giíi h¹n kh¸c nhau. Nhê ®Æc ®iÓm nµy, mét vect¬ cã thÓ ®−îc
dïng ®Ó nh©n dßng nhiÒu ®o¹n ADN kh¸c nhau. Dùa trªn nguyªn t¾c t−¬ng tù, ngoµi
vect¬ plasmid, ng−êi ta ®· ph¸t triÓn ®−îc c¸c lo¹i vect¬ kh¸c cã nguån gèc tõ phag¬,
hoÆc lµ ph©n tö lai gi÷a vi khuÈn vµ phag¬ (nh− phagemid, cosmid …), hoÆc cã nguån gèc
tõ nÊm men (vÝ dô: YAC).
ViÖc cµi mét ®o¹n ADN vµo vect¬ th−êng lµ c«ng viÖc t−¬ng ®èi ®¬n gi¶n. Ng−êi ta
sö dông cïng mét enzym giíi h¹n ®Ó c¾t vect¬ vµ ®o¹n ADN cµi. Ch¼ng h¹n, khi xö lý
vect¬ plasmid b»ng enzym EcoRI, vect¬ sÏ tõ d¹ng “vßng” chuyÓn sang d¹ng “th¼ng” víi
hai ®Çu dÝnh. Do ®−îc c¾t bëi cïng enzym, ®o¹n ADN cµi còng cã hai ®Çu dÝnh víi tr×nh
tù bæ sung víi tr×nh tù ®Çu dÝnh cña vect¬. C¸c ®Çu dÝnh cña vect¬ vµ ®o¹n ADN cµi
trªn c¬ së nguyªn t¾c Chargaff sÏ ®Ýnh kÕt víi nhau ®Ó t¹o nªn ph©n tö ADN t¸i tæ hîp
d¹ng vßng chØ cßn thiÕu mét liªn kÕt phosphodiester duy nhÊt ë mçi m¹ch. Liªn kÕt
cuèi cïng nµy ®−îc h×nh thµnh bëi enzym ADN ligase xóc t¸c. §Ó h¹n chÕ kh¶ n¨ng
“tù ®éng” g¾n kÕt trë l¹i gi÷a hai ®Çu dÝnh cña chÝnh vect¬, trong hçn hîp vect¬ vµ
®o¹n cµi, ng−êi ta th−êng cho d− thõa l−îng ADN cµi ®Ó t¨ng kh¶ n¨ng t¸i tæ hîp gi÷a
vect¬ vµ ®o¹n ADN cµi.
Mét sè lo¹i vect¬ kh«ng chØ cho phÐp nh©n dßng mét ®o¹n ADN cµi nµo ®ã, mµ cßn
cã thÓ ®iÒu khiÓn sù biÓu hiÖn cña gen trong ®o¹n ADN cµi. Nh÷ng vect¬ nh− vËy ®−îc
gäi lµ c¸c vect¬ biÓu hiÖn. C¸c vect¬ biÓu hiÖn th−êng ph¶i cã promoter n»m ng−îc
dßng so víi vÞ trÝ cµi gen. Vïng m· hãa cña gen cÇn ®−îc g¾n vµo vect¬ theo ®óng khung
®äc th× gen míi ®−îc biÓu hiÖn. C¸c vect¬ biÓu hiÖn th−êng ®−îc dïng ®Ó biÓu hiÖn c¸c
gen ®ét biÕn hoÆc c¸c gen lai nh»m ph©n tÝch chøc n¨ng cña chóng, hoÆc còng cã thÓ
®−îc dïng ®Ó s¶n xuÊt tËp trung mét lo¹i protein nµo ®ã vèn kh«ng thu ®−îc víi hiÖu
suÊt t−¬ng tù trong tù nhiªn. Ngoµi ra, promoter trong c¸c vect¬ biÓu hiÖn cã thÓ ®−îc
lùa chän sao cho sù biÓu hiÖn cña gen cµi cã thÓ ®−îc ®iÒu khiÓn b»ng viÖc bæ sung mét
chÊt ®¬n gi¶n vµo m«i tr−êng (ch¼ng h¹n nh− mét lo¹i ®−êng hay axit amin). ViÖc cã thÓ
®iÒu khiÓn chñ ®éng sù biÓu hiÖn cña mét gen nµo ®ã cã ý nghÜa quan träng trong nghiªn
cøu chøc n¨ng gen, nhÊt lµ víi c¸c gen g©y ®éc.
11.2.6.3. BiÕn n¹p c¸c vect¬ t¸i tæ hîp vµo tÕ bµo chñ
BiÕn n¹p lµ qu¸ tr×nh tÕ bµo chñ cã thÓ tiÕp nhËn ph©n tö ADN ngo¹i lai hoÆc theo
c¬ chÕ tù nhiªn hoÆc nhê c¸c kü thuËt “chuyÓn gen”. Trong tù nhiªn, mét sè vi khuÈn,
bao gåm Streptoccocus pneumoniae, Bacillus subtilis, Haemophilus influenzae vµ Neisseria
gonorrhoeae, cã c¸c c¬ chÕ tiÕp nhËn ADN tõ m«i tr−êng ngoµi. Chóng ®−îc gäi lµ c¸c vi
khuÈn kh¶ biÕn tù nhiªn. MÆc dï trong tù nhiªn, E. coli th−êng kh«ng cã tÝnh kh¶
biÕn, nh−ng khi ®−îc xö lý víi ion Ca2+, vi khuÈn nµy cã thÓ tiÕp nhËn ADN tõ m«i
tr−êng ngo¹i bµo. Cã thÓ ion Ca2+ víi kh¶ n¨ng “bao bäc” ph©n tö ADN tÝch ®iÖn ©m ®·
t¨ng c−êng kh¶ n¨ng “x©m nhËp” qua mµng tÕ bµo cña ADN. C¸c tÕ bµo E. coli sau khi
®−îc xö lý víi Ca2+ nh− vËy còng ®−îc gäi lµ c¸c tÕ bµo kh¶ biÕn. §Ó t×m ra vµ ph©n lËp
c¸c tÕ bµo kh¶ biÕn mang vect¬ t¸i tæ hîp, ng−êi ta th−êng nu«i cÊy c¸c vi khuÈn trªn
m«i tr−êng chän läc chøa c¸c chÊt kh¸ng sinh t−¬ng øng víi gen ®¸nh dÊu cã mÆt trong
vect¬.
Nh×n chung, hiÖu suÊt cña qu¸ tr×nh biÕn n¹p th−êng kh«ng cao. ChØ mét tØ lÖ nhá
c¸c tÕ bµo ®−îc xö lý biÕn n¹p cã thÓ tiÕp nhËn plasmid t¸i tæ hîp. Nh−ng, chÝnh hiÖu
qu¶ biÕn n¹p thÊp nh− vËy gióp cho hÇu hÕt c¸c tÕ bµo mang vect¬ t¸i tæ hîp th−êng chØ

333
§inh §oµn Long

mang mét b¶n sao duy nhÊt. Thuéc tÝnh nµy gióp cho c¸c tÕ bµo biÕn n¹p vµ dßng tÕ bµo
do chóng sinh ra (do ph©n chia trùc ph©n) chØ mang mét vect¬ ADN t¸i tæ hîp duy nhÊt
vµ gióp c¸c nhµ nghiªn cøu cã thÓ ph©n lËp vµ tinh s¹ch ®−îc dÔ dµng c¸c gen hoÆc s¶n
phÈm cña c¸c gen mét c¸ch riªng rÏ tõ hçn hîp biÕn n¹p vèn chøa nhiÒu ®o¹n tr×nh tù
ADN kh¸c nhau.

11.2.6.4. ThiÕt lËp ng©n hµng hÖ gen vµ th− viÖn cADN


Víi c¸c hÖ gen nhá, chiÕn l−îc nh©n dßng th−êng t−¬ng ®èi ®¬n gi¶n. Ch¼ng h¹n
nh− hÖ gen virut cã kÝch th−íc kho¶ng 10 kb, ng−êi ta cã thÓ trùc tiÕp tinh s¹ch ADN, c¾t
chóng b»ng enzym giíi h¹n råi tiÕn hµnh ®iÖn di. C¸c ph©n ®o¹n ADN ph©n t¸ch trªn gel
®iÖn di ®−îc th«i khái gel, tinh s¹ch råi cµi vµo vect¬ nh©n dßng.
Tuy nhiªn, víi c¸c hÖ gen lín, nh− hÖ gen ng−êi, viÖc c¾t ADN tæng sè b»ng enzym
giíi h¹n råi ph©n t¸ch b»ng ®iÖn di chØ dÉn ®Õn sù h×nh thµnh mét d¶i b¨ng ®iÖn di dµi
liªn tôc däc b¶n gel (c¸c b¨ng kh«ng ph©n t¸ch) v× sè ®o¹n c¾t qu¸ lín vµ chóng lµ mét
chuçi c¸c ®o¹n ADN chØ kh¸c nhau vµi nucleotide. Trong chiÕn l−îc nh©n dßng nh÷ng hÖ
gen lín nh− vËy, ng−êi ta cµi toµn bé c¸c ®o¹n ADN cña hÖ gen (sau khi ®· c¾t b»ng
enzym giíi h¹n) vµo vect¬ nh©n dßng råi biÕn n¹p c¸c vect¬ t¸i tæ hîp vµo tÕ bµo chñ (ë ®ã
vect¬ cã kh¶ n¨ng tù sao chÐp) mµ kh«ng qua ®iÖn di. TËp hîp c¸c dßng tÕ bµo mang
vect¬ t¸i tæ hîp chøa c¸c ®o¹n ADN kh¸c nhau cña mét hÖ gen nh− vËy ®−îc gäi lµ ng©n
hµng hÖ gen.
§Ó thiÕt lËp ng©n hµng hÖ gen, ADN tæng sè cña tÕ bµo ®Ých (vÝ dô: tõ ng−êi) ®−îc
c¾t b»ng enzym giíi h¹n ®Ó t¹o nªn c¸c ®o¹n cã kÝch th−íc trung b×nh dao ®éng tõ 100 bp
®Õn 1 Mb. C¸c ®o¹n ADN sau ®ã ®−îc cµi vµo vect¬ phï hîp nhê ADN ligase. KÕt qu¶ cña
b−íc nµy lµ t¹o ra mét tËp hîp cña c¸c vect¬ mang c¸c ®o¹n ADN cµi kh¸c nhau.
Ng©n hµng hÖ gen ®−îc t¹o ra nhê sö dông enzym giíi h¹n vµ c¸c vect¬ nh©n dßng
cã øng dông râ rÖt nhÊt lµ nh»m gi¶i tr×nh tù c¸c hÖ gen lín. Dù ¸n gi¶i m· hÖ gen ng−êi
(hoµn thµnh vµo n¨m 2006 võa qua) còng ®−îc thùc hiÖn theo chiÕn l−îc nµy. Tuy nhiªn,
c¸c ®o¹n cµi ADN trong c¸c dßng tÕ bµo thuéc ng©n hµng hÖ gen cña eukaryote th−êng
kh«ng ph¶i lµ c¸c ®o¹n tr×nh tù m· hãa, bëi v× chóng ®−îc c¾t ngÉu nhiªn bëi c¸c enzym
giíi h¹n trong khi phÇn lín hÖ gen lµ c¸c tr×nh tù kh«ng m· hãa.
ThÕ nªn, ®Ó t¹o ra c¸c dßng tÕ bµo mang c¸c ®o¹n ADN cµi t−¬ng øng víi c¸c tr×nh
tù m· hãa protein, ng−êi ta thiÕt lËp mét d¹ng ng©n hµng hÖ gen kh¸c gäi lµ th− viÖn
cADN. §Ó thiÕt lËp th− viÖn cADN, trong b−íc ®Çu tiªn thay v× b¾t ®Çu tõ ADN, ng−êi
ta tiÕn hµnh phiªn m· ng−îc mARN thµnh cADN. §¸ng l−u ý lµ cADN t−¬ng øng ®óng
víi tr×nh tù m· hãa cña protein (ngoµi mét sè tr×nh tù xu«i dßng vµ ng−îc dßng tham gia
vµo qu¸ tr×nh dÞch m·). Ph¶n øng phiªn m· ng−îc ®−îc thùc hiÖn nhê reverse
transcriptase. Enzym nµy cã kh¶ n¨ng tæng hîp ADN dùa trªn m¹ch khu«n lµ ARN.
Khi cã mÆt reverse transcriptase, mARN ®−îc phiªn m· ng−îc thµnh c¸c ph©n tö ADN
sîi kÐp; nh÷ng ph©n tö nµy sau ®ã ®−îc g¾n vµo c¸c vect¬ råi biÕn n¹p vµo c¸c tÕ bµo chñ
lµm nhiÖm vô nh©n dßng. Víi tr×nh tù xuÊt ph¸t lµ mARN, cã thÓ nhËn thÊy, kh¸c víi
ng©n hµng hÖ gen, mét c¬ thÓ sinh vËt cã thÓ cho ra nhiÒu th− viÖn cADN kh¸c nhau, bëi
v× mçi m« trong c¬ thÓ ph¶n ¸nh mét tËp hîp c¸c gen ®−îc biÓu hiÖn kh¸c nhau nªn sÏ cã
mét tËp hîp c¸c mARN kh¸c nhau (trong khi ng©n hµng hÖ gen dï ®−îc t¹o ra tõ lo¹i m«
hoÆc tÕ bµo nµo cña cïng mét c¬ thÓ ®Òu gièng nhau). B¶ng 11.1 nªu mét sè ®Æc ®iÓm
kh¸c biÖt c¬ b¶n gi÷a “ng©n hµng hÖ gen” vµ “th− viÖn cADN”.
MÆc dï, trong gi¸o tr×nh nµy, cã sù ph©n biÖt khi dïng thuËt ng÷ “ng©n hµng” vµ
“th− viÖn”; trong ®ã “ng©n hµng” chØ tËp hîp ®Çy ®ñ tr×nh tù ADN cña mét hÖ gen, cßn
“th− viÖn” chØ ®¹i diÖn cho c¸c tr×nh tù ADN m· hãa cho c¸c protein ®−îc biÓu hiÖn t¹i
mét m« nhÊt ®Þnh. Nh−ng, trong thùc tÕ hai thuËt ng÷ nµy ®«i khi ®−îc dïng ®ång

334
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

nghÜa, thÕ nªn “ng©n hµng hÖ gen” cã khi ®−îc gäi lµ “th− viÖn hÖ gen” vµ ng−îc l¹i.
ThuËt ng÷ “ng©n hµng gen” ®−îc dïng chung ®Ó chØ c¶ hai lo¹i “ng©n hµng hÖ gen” vµ
“th− viÖn cADN”.
Còng gièng nh− c¸c tÕ bµo trong ng©n hµng hÖ gen, mçi tÕ bµo biÕn n¹p trong th−
viÖn cADN th−êng chØ mang duy nhÊt mét vect¬ chøa ®o¹n ADN cµi. V× vËy, sau khi c¸c
tÕ bµo nh©n lªn, chóng sÏ t¹o ra nhiÒu dßng tÕ bµo, mçi dßng chøa b¶n sao cña mét
cADN m· hãa t−¬ng øng cho mét protein. ViÖc cÇn lµm sau khi ®· x©y dùng ®−îc ng©n
hµng hÖ gen vµ th− viÖn cADN lµ x¸c ®Þnh dßng tÕ bµo nµo mang ®o¹n ADN ®−îc quan
t©m nghiªn cøu.
B¶ng 11.1. Mét sè ®Æc ®iÓm kh¸c biÖt gi÷a ng©n hµng hÖ gen vµ th− viÖn cADN

Ng©n hµng hÖ gen


1. Cã mÆt ®Çy ®ñ tÊt c¶ c¸c tr×nh tù ADN trong tÕ bµo.
2. C¸c ®o¹n ADN cã tr×nh tù nucleotide gièng hÖ gen cña tÕ bµo trong tù nhiªn, gåm c¶ c¸c tr×nh tù ADN
kh«ng m· hãa cña hÖ gen (vÝ dô: c¸c ®o¹n tr×nh tù liªn gen, ADN ®Öm, intron).
3. ë eukaryote, ngoµi c¸c tr×nh tù m· hãa, phÇn lín c¸c tr×nh tù ADN trong ng©n hµng lµ c¸c tr×nh tù kh«ng
m· hãa, gåm nhiÒu ®o¹n tr×nh tù lÆp l¹i, c¸c tr×nh tù liªn gen, c¸c tr×nh tù ®iÒu hßa ho¹t ®«ng gen, ...
4. Sè l−îng c¸c dßng tÕ bµo mang c¸c ®o¹n cµi nhiÒu.
Th− viÖn cADN
1. ChØ lµ tËp hîp mét phÇn c¸c tr×nh tù ADN cña hÖ gen.
2. cADN ph¶n ¸nh tr×nh tù b¶n phiªn m· mARN hoµn thiÖn cña gen, kh«ng ph¶i lµ tr×nh tù ADN ®Çy ®ñ cña
gen trªn NST.
3. C¸c protein ®−îc m· hãa bëi cADN cã thÓ ®−îc tæng hîp (dÞch m·) trong mét tÕ bµo chñ mµ ë ®ã kh«ng
cÇn cã bé m¸y hoµn thiÖn ph©n tö mARN (bëi c¸c intron ®· ®−îc c¾t bá).
4. Sè l−îng c¸c dßng tÕ bµo mang c¸c ®o¹n cµi Ýt.

11.2.6.5. Sö dông mÉu dß ®Ó x¸c ®Þnh c¸c dßng tÕ bµo trong ng©n hµng gen
§Ó x¸c ®Þnh dßng tÕ bµo nµo trong ng©n hµng gen mang ®o¹n ADN ®−îc quan t©m
nghiªn cøu (vÝ dô ë ®©y lµ ng©n hµng sö dông vect¬ plasmid), ng−êi ta tiÕn hµnh lai mÉu
dß (nguyªn t¾c ®−îc nªu ë môc 11.2.5) víi c¸c khuÈn l¹c cña c¸c dßng vi khuÈn tõ ng©n
hµng gen. Kü thuËt nµy ®−îc gäi lµ ph−¬ng ph¸p lai khuÈn l¹c.
Mét th− viÖn cADN ®iÓn h×nh chøa Ýt nhÊt hµng ngµn dßng vi khuÈn kh¸c nhau,
mçi dßng mang mét ®o¹n cµi cADN ®Æc tr−ng. Sau khi vect¬ ®−îc biÕn n¹p vµo vi khuÈn,
c¸c tÕ bµo vi khuÈn ®−îc cÊy trªn bÒ mÆt m«i tr−êng chøa agar. Mçi tÕ bµo sau ®ã sÏ
ph¸t triÓn thµnh mét khuÈn l¹c riªng rÏ. C¸c tÕ bµo trong cïng mét khuÈn l¹c ®Òu mang
cïng lo¹i vect¬ vµ ®o¹n gen cµi gièng nhau. Trong kü thuËt lai khuÈn l¹c, ng−êi ta cã thÓ
dïng mµng lai gièng nh− trong c¸c ph−¬ng ph¸p lai Southern ®Ó thu håi mét l−îng “vÕt”
ADN trùc tiÕp tõ khuÈn l¹c, nh−ng ®ñ cho sù kÕt cÆp víi mÉu dß. Cô thÓ, ng−êi ta dïng
mµng lai Ðp lªn bÒ mÆt m«i tr−êng nu«i cÊy chøa khuÈn l¹c vµ “in h×nh” chóng lªn mµng
lai (cïng víi ADN cña chóng) theo kiÓu “®ãng dÊu”. Khi kÕt qu¶ lai mÉu dß/khuÈn l¹c
cho kÕt qu¶ “d−¬ng tÝnh”, sÏ x¸c ®Þnh ®−îc vÞ trÝ khuÈn l¹c mang dßng tÕ bµo chøa ®o¹n
ADN (gen) cµi mong muèn.
Mµng lai ®−îc ®em lai víi mÉu dß nh− sau: ng−êi ta tiÕn hµnh xö lý mµng lai sao
cho mµng tÕ bµo vì ra vµ c¸c ph©n tö ADN tho¸t ra ngoµi vµ g¾n lªn mµng lai t¹i chÝnh
vÞ trÝ tÕ bµo cña chóng. C¸c mµng lai sau ®ã ®−îc ñ víi c¸c mÉu dß ®−îc ®¸nh dÊu tõ
tr−íc trong c¸c ®iÒu kiÖn gièng nh− khi tiÕn hµnh c¸c kü thuËt lai Northern hay
Southern.
§Ó x©y dùng ng©n hµng gen, ngoµi c¸c vect¬ plasmid cã nguån gèc vi khuÈn, ng−êi
ta cßn dïng nhiÒu lo¹i vect¬ kh¸c cã nguån gèc virut (phag¬), hoÆc tõ c¸c sinh vËt bËc cao
h¬n nh− NST nh©n t¹o cña nÊm men (YAC), hoÆc c¸c d¹ng vect¬ lai nh− phagemid,

335
§inh §oµn Long

cosmid, NST nh©n t¹o vi khuÈn (BAC), v.v ... Trong c¸c vect¬ virut, c¸c vect¬ cã nguån
gèc phag¬ λ lµ phæ biÕn h¬n c¶. ADN hÖ gen cña virut nµy ®−îc lo¹i bá c¸c phÇn g©y ®éc
vµ th−êng ®−îc dïng nh− vect¬ nh©n dßng. Nguyªn t¾c sö dông vect¬ nµy ®Ó nh©n dßng
trong c¸c th− viÖn hÖ gen gièng nh− vect¬ plasmid. ChØ cã mét ®iÓm kh¸c lµ khi tiÕn
hµnh lai víi mÉu dß ®Ó x¸c ®Þnh c¸c dßng gen biÕn n¹p th× vÞ trÝ c¸c mÉu dß ®−îc x¸c
®Þnh trªn mµng lai t−¬ng øng víi vÞ trÝ c¸c vÕt tan thay cho vÞ trÝ c¸c khuÈn l¹c nh− khi
dïng vect¬ plasmid.

11.2.7. Tæng hîp hãa häc vµ sö dông c¸c ®o¹n oligonucleotide


C¸c ®o¹n ADN ng¾n cã tr×nh tù x¸c ®Þnh Nhãm khãa
®−îc dïng nhiÒu trong c¸c nghiªn cøu kh¸c ®Çu C5’-OH
nhau cña di truyÒn häc ph©n tö, ch¼ng h¹n nh−
Nucleotide tiÕp Deoxyribose
dïng lµm mÉu dß trong c¸c ph−¬ng ph¸p lai, theo nèi vµo ®©y
dïng lµm måi trong c¸c ph¶n øng PCR vµ gi¶i
tr×nh tù ADN. C¸c ®o¹n tr×nh tù nµy th−êng
®−îc tæng hîp hãa häc (phæ biÕn b»ng m¸y tæng
Phosphoamidite
hîp ADN tù ®éng) vµ ®−îc gäi lµ c¸c ®o¹n
oligonucleotide. TiÒn chÊt ®Ó t¹o nªn c¸c Nhãm diisopropylamino
nucleotide lÇn l−ît g¾n vµo chuçi oligonucleotide
H×nh 11.7. Phosphoamidine lµ tiÒn chÊt
lµ c¸c phosphoamidine (h×nh 11.7). Ph¶n øng tæng hîp hãa häc c¸c oligonucleotide.
kÐo dµi chuçi oligonucleotide diÔn ra b»ng viÖc Nhãm DMT (dimethoxytrityl) cã vai trß khãa
g¾n thªm nucleotide míi vµo ®Çu 5’ (tøc lµ chiÒu ®Çu C5'-OH vµ chØ ph¶n øng víi nhãm
phosphoamidite theo chiÒu 3' → 5'.
3’ → 5’) cña ®o¹n oligonucleotide cã s½n, nh−
vËy ng−îc chiÒu víi ph¶n øng kÐo dµi chuçi
a) Tæng hîp ADN hoµn b) Tæng hîp tõng phÇn råi
ADN ®−îc thùc hiÖn bëi enzym ADN chØnh trªn c¶ 2 m¹ch tæng hîp b»ng ADN pol
polymerase. Tæng hîp c¸c
oligonucleotide Tæng hîp c¸c
Ph−¬ng ph¸p tæng hîp hãa häc cã hiÖu oligonucleotide
qu¶ vµ ®é tin cËy cao khi tæng hîp c¸c ®o¹n
ADN ng¾n, m¹ch ®¬n cã ®é dµi tíi 30 B¾t cÆp gi÷a c¸c
nucleotide. §Ó tæng hîp c¸c ®o¹n ADN b»ng ®o¹n oligonucleotide B¾t cÆp gi÷a c¸c
®o¹n oligonucleotide
m¸y tæng hîp tù ®éng, c¸c nhµ nghiªn cøu chØ
cÇn “nhËp” vµo phÇn mÒm tr×nh tù nucleotide
Nèi bëi ADN ligase C¸c ®o¹n rçng ®−îc
cÇn tæng hîp vµ m¸y sÏ tù ®éng tæng hîp tõ c¸c tæng hîp bëi ADN pol
tiÒn chÊt ®−îc chuÈn bÞ s½n. Tuy nhiªn, khi
ph©n tö ADN ®−îc tæng hîp cã kÝch th−íc lín
§o¹n tæng hîp bëi ADN pol
th× ®é chÝnh x¸c cña tr×nh tù vµ ®é ®ång ®Òu Nèi bëi ADN ligase
cña s¶n phÈm gi¶m ®i do c¸c h¹n chÕ mang
tÝnh kü thuËt. Thùc tÕ, c¸c ph©n tö ADN cã
tr×nh tù dµi trªn 100 nucleotide khã cã thÓ tæng H×nh 11.8. Hai ph−¬ng ph¸p tæng hîp hãa häc
hîp chÝnh x¸c b»ng m¸y tæng hîp tù ®éng. c¸c ®o¹n ADN dµi (hoÆc gen ®Çy ®ñ).

Tuy vËy, b»ng c¸ch kÕt hîp mét sè kü thuËt, c¸c ®o¹n ADN (thËm chÝ gen ®Çy ®ñ)
cã chiÒu dµi h¬n 100 nucleotide còng cã thÓ tæng hîp b»ng ph−¬ng ph¸p hãa häc. Cô thÓ,
tr−íc tiªn ng−êi ta ph¶i tæng hîp c¸c ®o¹n ADN ng¾n, m¹ch ®¬n cã tr×nh tù gèi lªn nhau;
sau ®ã tinh s¹ch råi nèi c¸c ®o¹n ADN víi nhau (h×nh 11.8). ViÖc nèi c¸c ®o¹n ADN cã
thÓ thùc hiÖn theo hai c¸ch. Trong c¸ch thø nhÊt, c¸c ®o¹n ADN riªng rÏ chøa tr×nh tù
®Çy ®ñ cña ph©n tö ADN cÇn tæng hîp, chØ thiÕu liªn kÕt phosphodiester g¾n kÕt c¸c
®o¹n víi nhau. Lóc nµy, enzym ADN ligase ®−îc dïng ®Ó nèi c¸c ®o¹n víi nhau (h×nh

336
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

11.8a). Trong c¸ch thø hai, c¸c ®o¹n ADN ®−îc tæng hîp chØ chiÕm mét phÇn tr×nh tù cña
mçi m¹ch ADN cÇn tæng hîp. Khi c¸c ®o¹n ADN ®−îc cho b¾t cÆp víi nhau, trªn mçi
m¹ch cßn tån t¹i nhiÒu ®o¹n tr×nh tù “trèng”. Lóc nµy, ADN pol I ®−îc dïng ®Ó lÊp kÝn
c¸c ®o¹n “trèng” tr−íc khi ADN ligase nèi c¸c ®o¹n ADN víi nhau ®Ó t¹o nªn ph©n tö ADN
cã tr×nh tù ®Çy ®ñ (h×nh 11.8b). Trong qu¸ tr×nh tæng hîp ADN nh− vËy, còng cã thÓ kÕt hîp
c¸c tr×nh tù ®iÒu hßa cña gen víi c¸c tr×nh tù m· hãa. Ngoµi ra, còng cã thÓ bæ sung vÞ trÝ
c¾t cña c¸c enzym giíi h¹n ë vïng biªn cña tr×nh tù m· hãa, ®Ó sau ®ã cã thÓ cµi c¸c ®o¹n
ADN nµy vµo c¸c vect¬ nh©n dßng hay vect¬ biÓu hiÖn.
C¸c ®o¹n ADN ®−îc tæng hîp hãa häc ngoµi c¸c øng dông lµm mÉu dß hoÆc lµm måi
cho ph¶n øng PCR vµ gi¶i tr×nh tù, cßn cã thÓ ®−îc dïng cho c¸c nghiªn cøu kh¸c. Ch¼ng
h¹n, cã thÓ tæng hîp c¸c ®o¹n ADN mang mét (hoÆc mét sè) nucleotide biÕn ®æi so víi
tr×nh tù ADN cña gen ®· biÕt, vµ dïng ®o¹n ADN nµy trong ph−¬ng ph¸p g©y ®ét
biÕn ®Þnh vÞ trÝ. Trong ph−¬ng ph¸p nµy, ®o¹n ADN tæng hîp mang nucleotide biÕn ®æi
®−îc dïng lµm måi ®Ó nh©n ®o¹n gen ®Ých b»ng ph¶n øng PCR. V× trong ph©n tö ADN
sîi kÐp h×nh thµnh cã mét (hoÆc mét sè) vÞ trÝ kÕt cÆp sai, nªn s¶n phÈm PCR h×nh thµnh
lµ c¸c ®o¹n ADN cã tr×nh tù gen mang nucleotide biÕn ®æi ë vÞ trÝ x¸c ®Þnh. C¸c ®o¹n
oligonucleotide còng cã thÓ ®−îc dïng theo c¸ch t−¬ng tù ®Ó t¹o nªn mét ®iÓm giíi h¹n
míi trªn ph©n tö ADN, ®Ó råi sau ®ã ®iÓm giíi h¹n nµy ®−îc dïng ®Ó cµi gen ®Ých vµo
®óng vÞ trÝ cÇn thiÕt, vÝ dô: sau promoter hay sau vÞ trÝ g¾n cña ribosome, v.v…

11.2.8. Ph¶n øng PCR


Ngoµi kü thuËt nh©n dßng gen sö dông c¸c tÕ ADN khu«n
Måi ng−îc
bµo (in vivo), mét ph−¬ng ph¸p nh©n dßng gen
5’ 3’
invitro ®¬n gi¶n, hiÖu qu¶ ®−îc sö dông phæ biÕn 3’
§o¹n ADN 5’
hiÖn nay ë hÇu hÕt c¸c phßng thÝ nghiÖm di truyÒn
häc vµ sinh häc ph©n tö lµ ph¶n øng chuçi trïng Måi xu«i

hîp - PCR (polymerase chain reaction). Kü thuËt


Ph¶n øng PCR
PCR dïng ADN polymerase ®Ó tæng hîp ph©n tö
ADN míi tõ tr×nh tù cña ph©n tö ADN lµm khu«n
víi tiÒn chÊt lµ c¸c dNTP. Nh− ®· nªu ë ch−¬ng 3, §o¹n ADN ®Ých
c¸c ADN polymerase tæng hîp ADN theo chiÒu 5’→ 3’
§o¹n ADN ®Ých
vµ cã thÓ xóc t¸c g¾n nucleotide vµo ®Çu 3’ cña mét
®o¹n oligonucleotide cã s½n. ThÕ nªn, nÕu ta ®· cã §o¹n ADN ®Ých
®o¹n oligonucleotide g¾n vµo mét m¹ch ADN lµm NhiÒu b¶n sao ®o¹n ADN ®Ých
khu«n, th× ADN polymerase cã thÓ dïng ®o¹n ®ã H×nh 11.9. Nh©n dßng ADN b»ng PCR.
nh− måi ®Ó xóc t¸c ph¶n øng kÐo dµi chuçi ADN vÒ
phÝa ®Çu 3’ cho ®Õn hÕt tr×nh tù m¹ch khu«n.
C©u hái ®Æt ra lµ: b»ng c¸ch nµo cã thÓ dïng ph¶n øng PCR ®Ó nh©n dßng mét
®o¹n tr×nh tù ADN ®Æc hiÖu? Lóc nµy, ng−êi ta sÏ tæng hîp vµ sö dông hai ®o¹n
oligonuleotide cã vÞ trÝ liªn kÕt chÆn ë hai ®Çu cña ®o¹n ADN cÇn nh©n dßng. §o¹n
oligonucleotide thø nhÊt cã tr×nh tù bæ sung víi ®Çu 5’ cña m¹ch m· hãa, ®−îc gäi lµ måi
xu«i; ®o¹n thø hai cã tr×nh tù bæ sung víi ®Çu 5’ cña m¹ch ®èi m·, ®−îc gäi lµ måi
ng−îc (h×nh 11.9). Ph©n tö ADN lµm khu«n ®−îc g©y biÕn tÝnh bëi nhiÖt, t¹o ®iÒu kiÖn
cho c¸c måi xu«i vµ måi ng−îc ®Ýnh kÕt vµo c¸c vÞ trÝ ë hai ®Çu ®o¹n ADN cÇn nh©n dßng.
Víi sù cã mÆt cña c¸c tiÒn chÊt lµ dNTP, ADN polymerase sÏ nh©n dßng ®o¹n tr×nh tù
ADN ®−îc giíi h¹n bëi hai ®o¹n måi.

337
§inh §oµn Long

Trong ph¶n øng PCR, ph©n tö ADN ®−îc g©y biÕn tÝnh vµ sù tæng hîp ADN diÔn ra
lÆp l¹i qua nhiÒu chu kú nhê kh¶ n¨ng ®iÒu nhiÖt cña m¸y. KÕt qu¶ lµ: sau mçi chu kú
®iÒu nhiÖt, sè ph©n tö ADN l¹i t¨ng gÊp ®«i. §©y lµ mét ph¶n øng cã ®é nh¹y cao. ChØ
cÇn mét vµi b¶n sao ADN cã trong mÉu nghiªn cøu, chóng ta cã thÓ thu ®−îc hµng tØ b¶n
sao sau kho¶ng trªn d−íi 30 chu kú ph¶n øng (sè b¶n sao ADN = 2n víi n lµ sè chu kú
ph¶n øng).

11.2.9. Gi¶i tr×nh tù ADN Baz¬ Baz¬

Trong phÇn nµy chóng ta sÏ xem


b»ng c¸ch nµo cã thÓ x¸c ®Þnh ®−îc
tr×nh tù nucleotide cña c¸c ®o¹n ADN
ng¾n hoÆc toµn bé ph©n tö ADN dµi. H×nh 11.10. CÊu tróc cña dNTP (tr¸i) vµ ddNTP (ph¶i).

Nguyªn t¾c cña hÇu hÕt c¸c ph−¬ng


ph¸p gi¶i tr×nh tù ADN hiÖn nay ®Òu dùa
trªn ph−¬ng ph¸p ®−îc Sanger vµ céng sù
c«ng bè n¨m 1977, ®−îc gäi lµ ph−¬ng ph¸p
dideoxyribonucleotide (gäi t¾t lµ ph−¬ng ph¸p
dideoxy). Nguyªn t¾c cña ph−¬ng ph¸p
dideoxy dùa trªn viÖc bæ sung c¸c dÉn xuÊt
t−¬ng øng cña c¸c dNTP lµ 2’,3’-
dideoxynucleotide (viÕt t¾t lµ ddNTP, h×nh
11.10) vµo thµnh phÇn ph¶n øng tæng hîp
ADN trong èng nghiÖm. Do ddNTP thiÕu
nhãm C3’-OH, nªn mét khi nã ®−îc g¾n vµo
m¹ch ADN ®ang tæng hîp, th× qu¸ tr×nh tæng
hîp ADN sÏ dõng l¹i. Trong ph−¬ng ph¸p
Sanger, sù sao chÐp ADN ®−îc b¾t ®Çu b»ng
viÖc g¾n mét ®o¹n oligonucleotide cã tr×nh tù
bæ sung víi tr×nh tù ADN cÇn gi¶i m· råi ñ
chóng cïng víi enzym ADN pol. Ph©n tö
ADN tæng hîp míi sÏ cã tr×nh tù bæ sung víi
m¹ch ADN lµm khu«n. C¸c ph¶n øng gi¶i m·
tr×nh tù ®−îc chia lµm bèn èng nghiÖm t¸ch
biÖt. Mçi èng ®−îc bæ sung mét hçn hîp gåm
ChiÒu ®iÖn di

4 lo¹i dNTP th«ng th−êng (vèn cÇn cho sù


tæng hîp m¹ch ADN míi); mét trong nh÷ng
lo¹i dNTP nµy ®−îc ®¸nh dÊu phãng x¹ ®Ó
ph¸t hiÖn m¹ch míi ®ang tæng hîp. Ngoµi ra,
tõng lo¹i trong 4 lo¹i ddNTP (ddATP, ddGTP,
ddCTP vµ ddTTP) sÏ ®−îc bæ sung lÇn l−ît
t−¬ng øng vµo mçi èng nghiÖm nªu trªn víi
nång ®é b»ng 1/10 so víi nång ®é lo¹i dNTP H×nh 11.11. Gi¶i tr×nh tù ADN nhê sö dông ddNTP.
t−¬ng øng. Víi thµnh phÇn ph¶n øng nh− Sù sao chÐp ADN sÏ kÕt thóc khi ddNTP ®−îc kÕt
vËy, trong phÇn lín tr−êng hîp, dNTP sÏ liªn hîp vµo chuçi. Tr×nh tù m¹ch ADN míi tæng hîp
®−îc ®äc theo chiÒu 5’ → 3’ t−¬ng øng tõ ®¸y lªn
kÕt vµo m¹ch ADN ®ang tæng hîp, nh−ng ®Ønh cña b¶n ®iÖn di.

338
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

ddNTP (ë nång ®é thÊp) còng sÏ liªn kÕt vµo mét sè m¹ch ADN ®ang tæng hîp vµ lµm
kÕt thóc qu¸ tr×nh sao chÐp. Do cã nhiÒu ph©n tö ADN ®−îc tæng hîp ®ång thêi nªn qu¸
tr×nh nµy dÉn ®Õn sù h×nh thµnh cña mét hçn hîp nhiÒu ph©n tö ADN ®−îc sao chÐp
kh«ng hoµn chØnh gièng nhau ë ®Çu 5’ ®−îc ®¸nh dÊu vµ kh¸c nhau ë ®Çu 3’ vÒ chiÒu
dµi vµ lo¹i nucleotide
kÕt thóc chuçi (h×nh 11.11). C¸c s¶n phÈm nµy sau ®ã ®−îc ph©n t¸ch trªn gel
polyacrylamide vµ ®äc tr×nh tù theo thø tù c¸c b¨ng xuÊt hiÖn trªn b¶n ®iÖn di theo
chiÒu tõ cùc d−¬ng sang cùc ©m.
§· cã nhiÒu c¶i tiÕn ®−îc ®−a ra nh»m n©ng cao hiÖu qu¶ cña ph−¬ng ph¸p dideoxy
kÓ tõ khi Sanger c«ng bè. Trong ph−¬ng ph¸p cña Sanger, enzym ADN pol I cña E. coli
®−îc dïng lµm enzym sao chÐp. Sau ®ã, nã ®−îc thay b»ng ADN pol cã nguån gèc tõ
phag¬ T7 cã hiÖu qu¶ sao chÐp c¸c ADN m¹ch dµi tèt h¬n. Ngµy nay, phÇn lín viÖc gi¶i
tr×nh tù ADN ®Òu dùa trªn ph−¬ng ph¸p dideoxy kÕt hîp víi ph¶n øng PCR sö dông c¸c
enzym chÞu nhiÖt, nh− Taq ADN pol, hoÆc −u viÖt h¬n lµ enzym cã tªn th−¬ng m¹i lµ
“sequenase”. §©y lµ enzym t¸i tæ hîp cã nguån gèc tõ ADN pol cña phag¬ T7. Enzym
nµy cã hiÖu qu¶ sao chÐp tèt c¸c m¹ch ADN dµi, cã tÝnh chÞu nhiÖt, cã ho¹t tÝnh ®äc söa
vµ cã thÓ l¾p r¸p c¸c lo¹i nucleotide c¶i biÕn (ngoµi 4 lo¹i nucleotide c¬ b¶n) vµo m¹ch
ADN ®ang tæng hîp. ViÖc kÕt hîp víi ph−¬ng ph¸p PCR cho phÐp gi¶i tr×nh tù ADN tõ
mét l−îng rÊt nhá ADN sîi kÐp, ®ång thêi còng cho phÐp gi¶i tr×nh tù trùc tiÕp mét sè hÖ
gen kÝch th−íc nhá, nh− virut vµ vi
a)
khuÈn. Trong khi ®ã, viÖc gi¶i tr×nh tù
RE ChÊt nhËn dRhodamine
hÖ gen c¸c sinh vËt bËc cao (cã kÝch
th−íc hÖ gen lín) cÇn ph¶i qua b−íc
nh©n dßng hoÆc sö dông c¸c ng©n hµng
gen.
ChÊt ph¸t quang
11.2.9.1. Gi¶i tr×nh tù ADN tù ®éng §o¹n nèi

Kü thuËt gi¶i tr×nh tù ®−îc Sanger


m« t¶ cã thÓ x¸c ®Þnh chÝnh x¸c tr×nh tù
nucleotide cña mét ®o¹n ADN dµi tíi
300 bp. Tuy nhiªn, ph−¬ng ph¸p nµy b)

cÇn nhiÒu thao t¸c kü thuËt. Cô thÓ,


C−êng ®é ph¸t quang

nhiÒu b−íc pipet chÝnh x¸c ph¶i ®−îc


thùc hiÖn ®ång thêi míi cho kÕt qu¶ tèt;
mçi mÉu ph©n tÝch ph¶i ®ång thêi ch¹y
trªn 4 lµn ®iÖn di kh¸c nhau. Ngoµi ra,
viÖc ®äc kÕt qu¶ ®iÖn di b»ng m¾t ®«i
khi vÉn cã sai sãt. HiÖn nay, ®Ó cã thÓ
gi¶i tr×nh tù ADN c¸c hÖ gen lín (nh− ë B−íc sãng (nm)

ng−êi, ~3,2x109 bp) ®Òu dùa vµo ph−¬ng H×nh 11.12. Thuèc nhuém g¾n víi ddNTP ®−îc dïng
cho gi¶i tr×nh tù ADN. a) CÊu tróc hãa häc cña chÊt kÕt
ph¸p gi¶i tr×nh tù tù ®éng. thóc chuçi BigDyeTM. Trong ®ã, c¸c ddNTP kÕt thóc chuçi
kh¸c nhau cã thuéc tÝnh ph¸t quang kh¸c nhau phô thuéc
Ph−¬ng ph¸p gi¶i tr×nh tù tù ®éng
vµo c¸c gèc R. b) Phæ ph¸t quang cña 4 gèc BigDyeTM
kÕt hîp ®ång thêi 4 ph¶n øng ®éc lËp g¾n vµo 4 lo¹i ddNTP lµ kh¸c nhau.

339
§inh §oµn Long

vµo mét ph¶n øng chung. Trong ®iÒu kiÖn nh− vËy, viÖc dïng c¸c nucleotide ®−îc ®¸nh
dÊu phãng x¹ (g¾n vµo ®Çu 5’ cña m¹ch ADN tæng hîp míi) lµ kh«ng phï hîp v× c¸c ®o¹n
ADN míi tæng hîp chØ kh¸c nhau mét nucleotide nªn khã ph©n t¸ch b»ng ®iÖn di th«ng
th−êng. Tuy nhiªn, trë ng¹i nµy cã thÓ ®−îc kh¾c phôc nÕu nh− ®Çu 3’ cña c¸c ®o¹n ADN
tæng hîp míi ®−îc “®¸nh dÊu” vµ “ph¸t tÝn hiÖu”. §Ó lµm ®iÒu ®ã, ng−êi ta dïng mét bé
c¸c ddNTP ®−îc g¾n chÊt ph¸t quang (Glazer vµ Mathies, 1997). C¸c ddNTP lóc nµy vÉn
cã thÓ liªn kÕt vµo m¹ch ADN ®ang kÐo dµi vµ lµm ngõng ph¶n øng sao chÐp. CÊu tróc
phÇn ph¸t quang cña ddNTP gåm mét “gèc ph¸t quang” liªn kÕt víi mét trong bèn gèc
dichlororhodamine (viÕt t¾t lµ dRhodamine, lµ chÊt nhËn n¨ng l−îng quang) kh¸c nhau
qua mét ®o¹n nèi (h×nh 11.12). Bèn gèc dRhodamine khi bÞ “gèc ph¸t quang” kÝch thÝch
(bëi nguån s¸ng laser th−êng tõ Argon) nhËn n¨ng l−îng råi ph¸t quang ë c¸c b−íc sãng
kh¸c nhau. Nhê vËy, mçi mét lo¹i ddNTP khi ®−îc kÝch thÝch bëi nguån s¸ng Argon cña
m¸y gi¶i tr×nh tù sÏ ph¸t ra “tÝn hiÖu” kh¸c nhau. Th«ng tin nµy ®−îc mét c¶m biÕn tÝn
hiÖu kÕt hîp víi m¸y tÝnh xö lý vµ tù ®éng chuyÓn thµnh tr×nh tù ADN (h×nh 11.13). C¸c
ddNTP ®−îc g¾n chÊt ph¸t quang theo nguyªn lý nªu trªn ®−îc gäi lµ c¸c yÕu tè kÕt thóc
chuçi BigDyeTM.
Gi¶i tr×nh tù tù ®éng cã nhiÒu −u ®iÓm h¬n so víi ph−¬ng ph¸p thñ c«ng cña
Sanger. ¦u ®iÓm lín nhÊt lµ kh¶ n¨ng tù
a)
®éng hãa phÇn lín c¸c b−íc cña qu¸ tr×nh
ph©n tÝch. NhiÒu b−íc cña ph¶n øng gi¶i
Måi ®Ó gi¶i tr×nh tù
tr×nh tù cã thÓ thùc hiÖn b»ng r«bèt, kÓ
tõ viÖc pipet mÉu ®Õn ph¶n øng PCR.
C¸c s¶n phÈm sau ®ã ®−îc tinh s¹ch vµ
Tr×nh tù thu ®−îc
cho ch¹y qua c¸c cét ®iÖn di mao qu¶n
mµ kh«ng cÇn bÊt cø mét thao t¸c trùc
tiÕp nµo cña con ng−êi. Tèc ®é ®äc vµ
møc ®é chÝnh x¸c cña ph−¬ng ph¸p tù
®éng rÊt cao, ®Æc biÖt ®èi víi c¸c ®o¹n
ADN dµi tõ 30 ®Õn d−íi 1000 bp (®é
chÝnh x¸c cao nhÊt lµ ®èi víi c¸c ®o¹n cã
tr×nh tù trªn d−íi 600 bp). Mét hÖ thèng
gi¶i tr×nh tù ADN hiÖn nay trung b×nh cã
ChuyÓn thµnh tr×nh
thÓ ®äc ®−îc 1 - 2 triÖu bp trong mét tù m¹ch m· hãa
ngµy víi ®é chÝnh x¸c 99%. Ngoµi ra,
ViÕt l¹i theo
ph−¬ng ph¸p nµy cã ®é nh¹y cao mµ
chiÒu 5’ →3’
kh«ng cÇn ph¶i sö dông c¸c chÊt phãng
x¹. Tuy nhiªn, còng ph¶i nãi r»ng kü
thuËt gi¶i tr×nh tù ADN tù ®éng kh«ng
b)
ph¶i lóc nµo còng cho kÕt qu¶ ph©n tÝch
hoµn toµn chÝnh x¸c. Mét sè h¹n chÕ cña
ph−¬ng ph¸p nµy gåm cã: nã kh«ng ®äc
®−îc c¸c tr×nh tù qu¸ ng¾n (d−íi 30 bp,
bëi v× hiÖu suÊt PCR cña c¸c ph©n ®o¹n
ADN nµy thÊp, b¶n th©n chóng kÐm bÒn
vµ ph¸t tÝn hiÖu yÕu); sai sè ®äc t¨ng lªn H×nh 11.13. Gi¶i tr×nh tù ADN tù ®éng. a) Sö dông måi
®Ó tæng hîp ADN. Qu¸ tr×nh nµy kÕt thóc b»ng ddNTP ph¸t
khi gi¶i tr×nh tù c¸c ®o¹n ADN trªn 1000 quang. Chuçi c¸c pic t¸ch biÖt cho biÕt tr×nh tù ADN.
bp; ngoµi ra, c¸c ®o¹n ADN mang nhiÒu b) Phæ tr×nh tù ®−îc gi¶i m· b»ng m¸y ABI Prism377.

340
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

tr×nh tù lÆp kÕ tiÕp cã xu h−íng bÞ “nÐn” l¹i khi ch¹y qua cét chøa gel (l¾p trong m¸y),
dÉn ®Õn hiÖn t−îng c¸c pic ë c¸c vïng tr×nh tù lÆp l¹i cã xu h−íng lång vµo nhau (kh«ng
ph©n t¸ch) nªn khã x¸c ®Þnh tr×nh tù chÝnh x¸c. C¸c tr×nh tù nµy th−êng cÇn ®−îc kiÓm
tra l¹i b»ng c¸c ph−¬ng ph¸p thñ c«ng. Trong thùc tÕ, nh÷ng ®o¹n ADN cuèi cïng ®−îc
gi¶i tr×nh tù trong dù ¸n hÖ gen ng−êi (hoµn thµnh n¨m 2006) lµ c¸c ®o¹n ADN cã møc
®é lÆp l¹i lín thuéc NST sè 1.

11.2.9.2. Gi¶i tr×nh tù toµn hÖ gen


Nh− nªu ë trªn, viÖc gi¶i tr×nh tù c¸c ®o¹n ADN ng¾n hiÖn nay cã thÓ thùc hiÖn
®−îc t−¬ng ®èi dÔ dµng nhê m¸y gi¶i tr×nh tù tù ®éng. Tuy vËy, nh÷ng hÖ gen lín ®−îc
gi¶i tr×nh tù nh− thÕ nµo? D−íi ®©y lµ mét sè ph−¬ng ph¸p gi¶i tr×nh tù c¸c hÖ gen.
Tõ phÇn trªn, chóng ta biÕt r»ng để xây dựng ng©n hµng hÖ gen, toàn bộ ADN hệ
gen được cắt thành các đoạn ng¾n trước khi được nh©n dòng vµ duy tr× nhê c¸c vect¬. MÆc
dù về nguyên tắc, việc giải trình tự có thể thực hiện trực tiếp trên ADN hệ gen, nhưng thùc
tế kh«ng ph¶i vËy v× cần ph¶i biết tr−íc nhiều trình tự cña hÖ gen míi cã thÓ thiÕt kÕ mồi
để nhân các ®o¹n kh¸c nhau nằm dọc hệ gen. Để khắc phục khã kh¨n này, người ta nh©n
dòng các đoạn ADN b»ng các véctơ, rồi mỗi đoạn cµi sau đó được giải trình tự nhờ dïng mồi
oligonucleotide kết cặp với trình tự ®· biÕt của véctơ. Vấn đề còn lại là bằng cách nào tái tổ
chức lại các đoạn ADN riêng rẽ thành một trình tự đầy đủ và liên tục của hệ gen. Cã thÓ
thùc hiÖn ®−îc viÖc ®ã b»ng một số cách sau ®©y:
• Tách dòng các trình tự nằm gối lên nhau (contig). Cách đơn giản nhất để tạo ra các
trình tự nằm gối lên nhau là phân lập và giải trình tự một dòng từ ng©n hµng hệ
gen, rồi dïng trình tự của dòng thứ nhất ®Ó xác định dòng thứ hai có một phần
đoạn cài nằm gối lên đoạn thứ nhất (nhê lai víi mÉu dß). Dòng thứ hai lại được giải
trình tự và thông tin về trình tự của nó lại được dùng để xác định đoạn thứ ba nằm
gối lên đoạn thứ hai, v.v... Nguyên tắc này là cơ sở của phương pháp bước nối tiếp
trên nhiễm sắc thể được dïng để xây dựng các trình tự ADN nằm gối lên nhau
(contig) xuất phát từ các đoạn ADN ngắn được tách dòng nhê các véctơ. Tuy vậy,
phương pháp này tốn nhiều công sức. Một dòng phải được phân lập và giải trình tự
trước khi tìm thấy dòng tiÕp theo. Ngoài ra, các trình tự lặp lại kÕ tiếp (phæ biÕn)
trong hệ gen dễ g©y ra sự sắp xếp nhầm.
• Giải trình tự ngẫu nhiên toàn hệ gen (kü thuËt "shortgun"). Toµn bé các đoạn ADN
trong hệ gen được nh©n dòng nhê Gi¶i tr×nh tù ngÉu
Gi¶i tr×nh tù ngÉu
vect¬ và giải trình tự ngẫu nhiên. nhiªn toµn hÖ gen nhiªn ph©n cÊp
Các trình tự sau đó mới được phân ADN hÖ gen
tích b»ng phÇn mÒm m¸y tÝnh về
khả năng nằm gối lên nhau của
chúng (tức là các trình tự cùng xuất
hiện ở nhiều phân đoạn khác nhau) Gi¶i tr×nh tù
và trình tự toàn hệ gen được xây ngÉu nhiªn
dựng dựa trên tổ hợp đồng thời của S¾p xÕp
các trình tự nằm gối lên nhau c¸c tr×nh tù
(hình 11.14). Phương pháp này lần Tr×nh tù hÖ
đầu tiên được dïng để giải tr×nh tù gen ®−îc
hệ gen vi khuẩn Haemophilus x¸c ®Þnh
influenzae. Toàn bộ hệ gen của vi H×nh 11.14. Gi¶i tr×nh tù hÖ gen b»ng c¸c ph−¬ng
khuÈn này được phân cắt ngẫu ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen vµ gi¶i
nhiên thành những ®o¹n nhá b»ng tr×nh tù ngÉu nhiªn ph©n cÊp.

341
§inh §oµn Long

phương pháp “siêu âm”, rồi từng đoạn nhỏ (1,5 – 2 Kb) được nh©n dòng b»ng véctơ
plasmid pUC18. Tổng cộng thư viện hệ gen của loài này gồm khoảng 20.000 dòng
vi khuẩn khác nhau. Mỗi dòng (tương ứng với một đoạn ADN) sau đó được giải
trình tự để rồi tổ hợp lại và tạo nên tập hợp thông tin về trình tự ADN gồm 12
triệu bp. Độ dài của toàn bộ các trình tự ®−îc gi¶i m· gấp 6 lần độ dài hÖ gen của vi
khuẩn. Trình tự hệ gen cuối cùng thu được là nhờ sự tổ hợp các đoạn ADN ngắn
thành các đoạn contig. Các đoạn rçng gi÷a c¸c contig cuối cùng được “lấp đầy” bằng
việc xác định các dòng bổ sung từ một sè ng©n hµng hÖ gen khác (thùc tÕ, ®Ó gi¶i
tr×nh tù mét hÖ gen, ng−êi ta cÇn x©y dùng Ýt nhÊt 2 – 3 ng©n hµng gen mang
c¸c ®o¹n cµi cã kÝch th−íc trung b×nh kh¸c nhau, vÝ dô: 1, 5 vµ 10 Kb). Ưu điểm
râ nhất của phương pháp “shortgun” là không cần biết trước trình tự của hệ gen vµ
tèc ®é gi¶i tr×nh tù nhanh, ®Æc biÖt víi c¸c hÖ gen nhá (nh− vi khuÈn). Phần lớn
các hệ gen vi khuẩn có thể giải mã xong chỉ trong vài tuần bằng phương pháp giải
trình tự ngÉu nhiªn. Tuy vậy, khi gi¶i tr×nh tù nh÷ng hÖ gen lín (nh− ng−êi),
phương pháp này có nhược điểm là gÆp khã kh¨n khi xác định trËt tù c¸c ®o¹n
contig ở các vïng hÖ gen mang nhiÒu trình tự lặp lại liªn tiếp; ngoµi ra, sè l−îng
contig rÊt lín nªn cÇn c¸c phÇn mÒm vµ hÖ thèng m¸y tÝnh cã hiÖu n¨ng rÊt cao
®Ó xö lý d÷ liÖu.
• Giải trình tự ngẫu nhiên phân cấp. Để gi¶i tr×nh tù c¸c hÖ gen lín, có một cải tiến
là ADN toàn hệ gen ban đầu được cắt thành các đoạn lớn rồi tách dòng vào các NST
nhân tạo vi khuẩn (BAC). Sau đó, mçi dßng BAC ®−îc dïng ®Ó x©y dùng c¸c ng©n
hµng “con” mang c¸c ®o¹n ADN cµi kÝch th−íc ng¾n h¬n (vÝ dô: b»ng vect¬
pUC18). ViÖc giải trình tự ngẫu nhiên ®−îc tiÕn hµnh lÇn l−ît b¾t ®Çu tõ c¸c
ng©n hµng “con”. Phương pháp giải trình tự ngẫu nhiên phân cấp giúp việc sắp xếp
các contig dÔ dµng hơn.

11.2.9.3. T×m gen tõ c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù


Sau khi hệ gen của một sinh vật đã được giải tr×nh tù xong, người ta có thể dùng một
số phương pháp khác nhau để tìm và xác định vị trí các gen trên NST, bao gồm:
• Duyệt trình tự. Các gen mã hóa cho protein phải chứa một khung đọc mở (ORF)
mang một chuỗi (không dấu “phảy”) các bộ ba (codon) mã hóa tương ứng cho một
trình tự axit amin của protein. Khung đọc mở sẽ bắt ®Çu bởi mã mở đầu 5’-ATG-
3’ của mạch mã hóa (tương ứng với 3’-TAC-5’ của mạch không mã hóa, tức mạch
làm khuôn; và mã 5’-AUG-3’ của mARN), đồng thời kết thúc ở một trong các mã
bộ ba (TAA, TAG hoặc TGA). Chiều dài trung bình của mỗi ORF khác nhau giữa
các loài. Ở E. coli, chiều dài trung bình của một ORF là 317 codon; trong khi ở
nấm men, chiều dài trung bình của một ORF là 483 codon. Nhưng nhìn chung,
mỗi ORF thường chứa nhiều hơn 50 codon. Vì vậy, để tìm các gen trong hệ gen, có
thể áp dụng phương pháp duyệt trình tự theo kiểu trượt dọc mỗi mạch ADN và tìm
các codon mở đầu và codon kết thúc cách nhau trên 100 codon. Phương pháp này
hiệu quả khi duyệt trình c¸c hÖ gen prokaryote v× hÖ gen cña chóng kh«ng cã
tÝnh ph©n m¶nh. Nhưng, với hệ gen eukaryote, phương pháp này gặp khó khăn vì
các ORF thường bị phân mảnh thành exon và intron. Việc duyệt trình tù hệ gen
eukaryote, kể cả ng−êi th−êng ph¶i nhê c¸c phÇn mÒm m¸y tÝnh nh− Grail,
Genemark, v.v… Nh÷ng phÇn mÒm nµy x¸c ®Þnh c¸c ORF kh«ng chØ dùa trªn
c¸c m· më ®Çu vµ kÕt thóc dÞch m·, mµ cßn dùa trªn mét sè thuËt to¸n thèng
kª x¸c ®Þnh nh÷ng ®o¹n cã tiÒm n¨ng m· hãa, còng nh− c¸c tr×nh tù vïng biªn
cña c¸c exon vµ intron, c¸c tr×nh tù ®iÒu hßa phiªn m·, nh− hộp TATA, INR,
DPE … lµ nh÷ng tr×nh tù cÇn thiÕt cho sù g¾n kÕt cña yÕu tè TFIID vµ phøc hÖ
phiªn m· cña ARN pol II (xem ch−¬ng 3). Tuy vËy, ngoµi c¸c m· më ®Çu vµ kÕt
thóc dÞch m·, c¸c tr×nh tù kh¸c cã møc ®é biÕn ®æi lín, nªn viÖc x¸c ®Þnh chÝnh

342
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

x¸c mét gen kh«ng ph¶i lóc nµo còng ®óng. §Ó h¹n chÕ nh−îc ®iÓm nµy, mét
ph−¬ng ph¸p bæ sung lµ gen ®−îc x¸c ®Þnh trªn c¬ së c¸c gen ®· biÕt ë c¸c loµi
sinh vËt kh¸c (v× chóng th−êng cã tr×nh tù t−¬ng ®ång hoÆc gièng nhau). Tuy
vËy, ph−¬ng ph¸p ®èi chiÕu nµy còng cã nguy c¬ lµ c¸c gen gi¶ (pseudogene,
th−êng kh«ng ®−îc phiªn m·) ®−îc tÝnh nhÇm lµ gen.
• So s¸nh cADN. Mét c¸ch hiÖu qu¶ ®Ó x¸c ®Þnh mét gen trong hÖ gen lµ so s¸nh
tr×nh tù cña nã víi mét b¶n sao cADN t−¬ng øng. Chóng ta biÕt r»ng, cADN
®−îc t¹o ra tõ mARN vµ chñ yÕu chøa c¸c tr×nh tù exon cña ORF. ViÖc so s¸nh
tr×nh tù cã thÓ thùc hiÖn nhê phÇn mÒm m¸y tÝnh hoÆc sö dông ph−¬ng ph¸p lai
gi÷a c¸c ®o¹n ADN hÖ gen víi mARN (ph−¬ng ph¸p lai Northern). C¸c ®o¹n
®¸nh dÊu tr×nh tù biÓu hiÖn - EST (expressed sequence tag) th−êng ®−îc sö
dông cho môc ®Ých nµy. EST thùc chÊt lµ c¸c ®o¹n tr×nh tù ng¾n (thường dài 200 –
500 bp) th−êng ®−îc t¹o ra trªn c¬ së gi¶i tr×nh tù tõ mét trong hai ®Çu cña mét
cADN. Nhê c¸c EST cã tÝnh ®¹i diÖn cho phÇn hÖ gen ®−îc biÓu hiÖn nªn chóng
rÊt hiÖu qu¶ ®Ó t×m kiÕm c¸c gen. Trong thùc nghiÖm, c¸c EST cßn nhiÒu −u ®iÓm
kh¸c n÷a, ®ã lµ: (1) c¸c ®o¹n EST ®−îc t¹o ra t−¬ng ®èi dÔ dµng vµ chi phÝ thÊp;
(2) chØ cÇn gi¶i tr×nh tù mét lÇn duy nhÊt lµ ®ñ ®Ó t¹o ra c¸c EST ®Æc thï víi mét
cADN, tøc lµ mét gen; (3) c¸c lçi g©y ra do gi¶i tr×nh tù th−êng kh«ng cÇn kiÓm tra
l¹i, bëi c¸c EST còng chØ ®−îc dïng ®Ó t×m c¸c tr×nh tù gÇn gièng. C¸c c¬ së d÷
liÖu EST hiÖn nay (vÝ dô: http://www.ncbi.nlm.nih.gov/dbEST/) cung cÊp trªn 5
triÖu tr×nh tù EST kh¸c nhau cña ng−êi. TÊt nhiªn, trong ®ã cã nhiÒu tr×nh tù
trïng nhiÒu lÇn (®Æc biÖt lµ c¸c gen cã møc ®é biÓu hiÖn cao vµ phæ biÕn); vµ cã
thÓ cßn thiÕu mét sè EST t−¬ng øng víi c¸c gen cã møc ®é biÓu hiÖn thÊp hoÆc
hiÕm gÆp (vÝ dô: chØ ë mét tÕ bµo, hoÆc
chØ biÓu hiÖn trong ®iÒu kiÖn ®Æc biÖt). a)

11.2.10. X¸c ®Þnh vai trß vµ chøc n¨ng gen


C¸c dù ¸n gi¶i tr×nh tù c¸c hÖ gen ®· dÉn Galactokinase
®Õn nhiÒu kÕt qu¶ thó vÞ vµ kh«ng Ýt bÊt ngê.
Ch¼ng h¹n nh−, c¸c nghiªn cøu ë E. coli vµ S.
cereviseae d−êng nh− ®· tiÕn hµnh chi tiÕt trong b)
hµng chôc n¨m, nh−ng khi gi¶i tr×nh tù xong hÖ
gen cña chóng, ng−êi ta míi biÕt r»ng míi chØ cã
30 - 40% sè gen cña chóng ®· tõng ®−îc nghiªn
cøu. ë nh÷ng loµi kh¸c, bao gåm c¶ con ng−êi, tØ lÖ
c¸c gen ®· tõng ®−îc nghiªn cøu cßn thÊp h¬n
nhiÒu. Tuy vËy, sau khi hÖ gen ®· ®−îc gi¶i tr×nh
tù xong, cã mét sè ph−¬ng ph¸p kh¸c gióp nhanh
chãng x¸c ®Þnh ®−îc vai trß vµ chøc n¨ng cña H×nh 11.15. So s¸nh tr×nh tù cña
nhiÒu gen trong hÖ gen, bao gåm: galactokinase tõ c¸c loµi kh¸c nhau.
a) Ph¶n øng xóc t¸c bëi enzym galactokinase.
• T×m kiÕm nh÷ng tr×nh tù gièng nhau. b) So s¸nh mét ®o¹n tr×nh tù axit amin cña
Còng gièng nh− viÖc sö dông c¸c c«ng cô galactokinase gi÷a c¸c loµi.
tin häc trong viÖc t×m kiÕm c¸c tr×nh tù Hs: Homo sapiens,
m· hãa cña hÖ gen, c¸c c¬ së d÷ liÖu vÒ c¸c Sc: Saccharomyces cerevisiae,
gen ®· biÕt (ë c¸c loµi sinh vËt kh¸c nhau) Ec: Escherichia coli,
Bs: Bacillus subtilis,
cã thÓ dïng ®Ó x¸c ®Þnh vai trß vµ chøc
Ca: Candida albicans,
n¨ng cña c¸c gen ch−a biÕt. ViÖc t×m kiÕm
Hi: Haemophilus influenza,
c¸c tr×nh tù gièng nhau nµy th−êng dùa St: Salmonella typhimurium,
trªn c¸c tr×nh tù axit amin t−¬ng øng víi Kl: Kluyveromyces lactis,
c¸c tr×nh tù gen, v× tÝnh ®a d¹ng cña tr×nh At: Arabidopsis thaliana.

343
§inh §oµn Long

tù ADN th−êng cao h¬n tr×nh tù polypeptide t−¬ng øng do tÝnh tho¸i hãa cña m·
bé ba. Thùc nghiÖm còng x¸c nhËn r»ng, c¸c gen cã cïng chøc n¨ng ë c¸c sinh
vËt kh¸c nhau lu«n cã ®Æc ®iÓm chung. Ch¼ng h¹n nh−, hÇu hÕt c¸c loµi ®Òu cã
kh¶ n¨ng chuyÓn hãa galactose → glucose-6-P, trong ®ã enzym tham gia b−íc
®Çu tiªn cña con ®−êng chuyÓn hãa nµy (galactose → galactose-1-P) lµ mét
galactose kinase cã tÝnh ®Æc thï ë mçi loµi, nh−ng chóng ®Òu cã mét sè ®o¹n
tr×nh tù gièng nhau (hình 11.15). Nh− trªn ®· nãi, tr−íc khi gi¶i xong tr×nh tù
hÖ gen nÊm men, chØ cã kho¶ng 30% trong tæng sè 6000 gen cña nÊm men ®·
®−îc biÕt. Nh−ng, sau khi gi¶i m· xong hÖ gen nÊm men, b»ng ph−¬ng ph¸p t×m
kiÕm c¸c tr×nh tù gièng nhau, ng−êi ta x¸c ®Þnh ®−îc thªm chøc n¨ng cña
kho¶ng 30% gen n÷a. Nh− vËy, cßn kho¶ng 40% gen ch−a râ chøc n¨ng. TÊt
nhiªn, trong sè nµy cã thÓ cã mét sè gen gi¶. ViÖc x¸c ®Þnh chøc n¨ng gen v× vËy
cßn cÇn c¸c ph−¬ng ph¸p phèi hîp kh¸c n÷a.
• X¸c ®Þnh chøc n¨ng gen b»ng thùc nghiÖm. ë c¸c loµi sinh vËt m« h×nh, nh− E.
coli hay S. cereviseae, mét trong nh÷ng ph−¬ng ph¸p c¬ b¶n ®Ó x¸c ®Þnh chøc
n¨ng cña mét gen ch−a biÕt lµ lµm bÊt ho¹t gen b»ng kü thuËt “knock-out”.
Trong kü thuËt nµy, ng−êi ta dïng nguyªn t¾c t¸i tæ hîp t−¬ng ®ång ®Ó lµm háng
c¸c b¶n sao b×nh th−êng cña gen. KiÓu h×nh cña c¸c thÓ ®ét biÕn ®−îc kiÓm tra
vµ ®èi chiÕu víi kiÓu d¹i ®Ó x¸c ®Þnh chøc n¨ng gen. Ph−¬ng ph¸p nµy cã hiÖu
qu¶ trong nghiªn cøu x¸c ®Þnh vai trß cña nhiÒu gen. Ch¼ng h¹n nh− ë nÊm
men, viÖc so s¸nh tr×nh tù kh«ng gióp x¸c ®Þnh ®−îc chøc n¨ng cña mét gen cã
tªn lµ SNU17, do tr×nh tù cña nã rÊt kh¸c víi tr×nh tù c¸c gen ®· biÕt. Nh−ng
khi gen nµy bÞ háng, tÕ bµo nÊm men chØ ph¸t triÓn chËm vµ th−êng cã nhiÒu
sai háng trong qu¸ tr×nh hoµn thiÖn mARN. Qua ®ã, chøc n¨ng cña SNU17 ®−îc
t×m thÊy lµ yÕu tè tham gia hoµn thiÖn mARN. §iÓm khã cña ph−¬ng ph¸p nµy
lµ trong nhiÒu tr−êng hîp, c¸c c¸ thÓ mang gen bÞ háng hoÆc chÕt sím hoÆc
kh«ng biÓu hiÖn kiÓu h×nh kh¸c biÖt. C¶ hai tr−êng hîp nµy ®Òu kh«ng dÉn ®Õn
kÕt luËn ch¾c ch¾n nµo. Khi gen bÞ “knock-out” g©y chÕt cã thÓ suy luËn r»ng
protein do gen m· hãa cã vai trß sèng cßn ®èi víi sinh vËt, nh−ng vai trß cô thÓ
thÕ nµo th× kh«ng râ. Mét ph−¬ng ph¸p c¶i tiÕn kh¸c ®Ó x¸c ®Þnh vai trß cña gen
lµ lµm t¨ng møc biÓu hiÖn cña nã, råi theo dâi kiÓu h×nh thÓ ®ét biÕn.
MÆc dï ®· cã c¸c ph−¬ng ph¸p ph¸t hiÖn chøc n¨ng gen nh− trªn, nh−ng nh×n chung
ë nhiÒu gen, chøc n¨ng gen ph¶i ®−îc ph©n tÝch trªn c¬ së tõng gen riªng rÏ. ThÕ nªn, khèi
l−îng c«ng viÖc cho m¶ng nghiªn cøu nµy cßn rÊt lín. Riªng nÊm men, cßn kho¶ng Ýt nhÊt
2000 gen ch−a ®−îc x¸c ®Þnh chøc n¨ng, cßn ë ng−êi vµo kho¶ng 20.000 gen.

11.3. C¸c kü thuËt ph©n tÝch protein


MÆc dï sù biÓu hiÖn cña gen th−êng ®−îc ®¸nh gi¸ ë møc ®é phiªn m· th«ng qua
viÖc ph©n tÝch s¶n phÈm phiªn m· lµ mARN (ch¼ng h¹n b»ng ph−¬ng ph¸p lai Northern
®· nªu ë trªn), nh−ng thùc tÕ l−îng mARN cã trong tÕ bµo kh«ng ph¶i lóc nµo còng
t−¬ng ®ång víi l−îng protein s¶n phÈm cuèi cïng cña gen vµ ho¹t tÝnh cña nã. Sù kh«ng
t−¬ng ®ång gi÷a l−îng s¶n phÈm phiªn m· víi l−îng vµ ho¹t tÝnh cña s¶n phÈm dÞch m·
cã thÓ do nhiÒu nguyªn nh©n, bao gåm:
a) Mét sè ARN kh«ng ®−îc dïng ®Ó dÞch m· nªn kh«ng t¹o bÊt cø protein nµo.
b) Mét sè tiÒn-ARN cã c¸ch xÐn intron biÕn ®æi nªn mét gen cã thÓ ®−îc dïng m·
hãa nhiÒu protein kh¸c nhau.
c) Tèc ®é dÞch m· vµ biÕn tÝnh c¸c mARN kh¸c nhau cã thÓ kh¸c nhau, nªn l−îng
mARN cã trong tÕ bµo ch−a ch¾c ®· t−¬ng quan víi l−îng protein.

344
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

d) Ho¹t tÝnh cña nhiÒu protein thay ®æi do nh÷ng c¶i biÕn protein sau dÞch m·,
ch¼ng h¹n nh− sù biÕn ®æi mét sè axit amin, sù bæ sung hay mÊt ®i mét sè nhãm
chøc (nh− acetyl, phosphate, AMP, ADP-ribose, v.v...).
e) NhiÒu protein ®−îc “c¾t tØa” sau dÞch m·, hoÆc ®−îc bæ sung thªm c¸c gèc ®−êng
hay lipid ®Ó t¹o thµnh c¸c glycoprotein vµ lipoprotein.
f) B¶n th©n c¸c protein cã ®é bÒn vµ tèc ®é ph©n hñy rÊt kh¸c nhau.
g) §ã lµ ch−a kÓ ®Õn nh÷ng biÕn ®æi cña protein cßn phô thuéc vµo c¸c ®iÒu kiÖn
sinh tr−ëng, ph¸t triÓn cña tÕ bµo; phô thuéc vµo c¸c ho¹t ®éng t−¬ng t¸c cña
protein víi c¸c gen vµ c¸c protein kh¸c. V× vËy, ®Ó ®¸nh gi¸ møc ®é biÓu hiÖn cña
mét gen, kh«ng thÓ chØ dõng ë møc phiªn m· vµ cßn cÇn ®¸nh gi¸ ë møc dÞch
m·. Ngoµi ra, sau giai ®o¹n nhiÒu hÖ gen sinh vËt m« h×nh vµ ng−êi ®· ®−îc gi¶i
tr×nh tù, vÊn ®Ò tån t¹i l¹i lµ phÇn lín c¸c gen cña chóng ch−a râ chøc n¨ng. VÝ
lý do nµy, nhiÒu nhµ khoa häc cho r»ng thÕ kû 21 lµ thÕ kû cña hÖ protein häc.
D−íi ®©y lµ mét sè ph−¬ng ph¸p ph©n tÝch protein c¬ b¶n.

11.3.1. ChuÈn bÞ dÞch nghiÒn tÕ bµo ®Ó tinh s¹ch protein


ViÖc ph©n lËp vµ tinh s¹ch c¸c protein riªng rÏ cã ý nghÜa quyÕt ®Þnh ®Õn kh¶ n¨ng
t×m hiÓu chøc n¨ng cña chóng. MÆc dï trong mét sè tr−êng hîp, chóng ta cã thÓ nghiªn
cøu chøc n¨ng cña protein ë d¹ng hçn hîp phøc t¹p, nh−ng phÇn lín nh÷ng nghiªn cøu
nµy th−êng dÉn ®Õn nh÷ng kÕt luËn kh«ng râ rµng. Ch¼ng h¹n nh− khi chóng ta nghiªn
cøu vÒ ho¹t tÝnh cña mét enzym ADN pol trong mét hçn hîp protein th« (ch¼ng h¹n tõ
dÞch ph©n gi¶i tÕ bµo), c¸c enzym ADN pol vµ protein thµnh phÇn kh¸c còng cã thÓ ¶nh
h−ëng ®Õn hiÖu suÊt tæng hîp ADN quan s¸t ®−îc trong thùc nghiÖm. V× vËy, viÖc tinh
s¹ch c¸c protein lµ mét b−íc quan träng trong qu¸ tr×nh t×m hiÓu chøc n¨ng cña chóng.
Mçi mét protein th−êng cã mét sè ®Æc tÝnh riªng nªn qui tr×nh tinh s¹ch chóng
th−êng cã tÝnh ®Æc thï. §iÒu nµy th× tr¸i ng−îc víi ADN, vèn nh×n chung gièng nhau vÒ
cÊu tróc vµ thµnh phÇn, chØ kh¸c nhau vÒ tr×nh tù nucleotide. C¸c b−íc tinh s¹ch protein
th−êng dùa trªn c¸c ®Æc tÝnh cña chóng vÒ kÝch th−íc, h×nh d¹ng, ®iÖn tÝch vµ nhiÒu khi
lµ chøc n¨ng.
VËt liÖu khëi ®Çu cho hÇu hÕt c¸c qu¸ tr×nh tinh s¹ch protein tõ sinh vËt lµ c¸c dÞch
nghiÒn tÕ bµo. Kh«ng gièng ADN vèn cã kh¶ n¨ng håi tÝnh kÓ c¶ khi ë ngoµi tÕ bµo,
protein rÊt dÔ bÞ biÕn tÝnh vµ bÞ ph©n hñy sau khi bÞ gi¶i phãng khái tÕ bµo. V× lý do nµy,
hÇu hÕt qu¸ tr×nh chuÈn bÞ c¸c dÞch chiÕt vµ tinh s¹ch protein cÇn ®−îc tiÕn hµnh ë nhiÖt
®é l¹nh (d−íi 4oC). Cã mét sè c¸ch chuÈn bÞ dÞch nghiÒn tÕ bµo. C¸c tÕ bµo cã thÓ ®−îc
ph©n gi¶i b»ng hãa chÊt, b»ng c¸c biÖn ph¸p c¬ häc lµm vì thµnh tÕ bµo, b»ng xö lý víi
dung dÞch nh−îc tr−¬ng (lµm tÕ bµo tr−¬ng lªn do n−íc ®i vµo vµ vì ra), v.v... §iÓm chung
cña c¸c ph−¬ng ph¸p lµ lµm thµnh tÕ bµo vì ra vµ gi¶i phãng c¸c protein. Trong nhiÒu
tr−êng hîp, c¸c tÕ bµo cÇn ®−îc chuyÓn vÒ tr¹ng th¸i ®«ng l¹nh, vÝ dô: b»ng m¸y c« l¹nh
ch©n kh«ng, sau ®ã ®−îc nghiÒn b»ng m¸y nghiÒn mÉu tr−íc khi tiÕn hµnh chiÕt xuÊt vµ
tinh s¹ch protein.

11.3.2. Sö dông s¾c ký cét ®Ó tinh s¹ch protein


C¸ch tinh s¹ch protein phæ biÕn nhÊt lµ sö dông c¸c ph−¬ng ph¸p s¾c ký cét.
Trong c¸c ph−¬ng ph¸p nµy, c¸c protein ®−îc cho ch¹y qua cét chøa hÖ thèng m¹ng l−íi
h×nh thµnh bëi c¸c h¹t agarose, polyacrylamide hoÆc dextran (Sephadex). Tïy thuéc vµo
®Æc tÝnh cña protein, cã thÓ sö dông mét sè ph−¬ng ph¸p vµ qui tr×nh kü thuËt kh¸c
nhau. Cã ba ph−¬ng ph¸p s¾c ký cét c¬ b¶n lµ s¾c ký trao ®æi ion, s¾c ký läc gel vµ s¾c ký
¸i lùc.

345
§inh §oµn Long

11.3.2.1. S¾c ký trao ®æi ion


Trong ph−¬ng a) b)
ph¸p nµy, c¸c protein ++-
®−îc ph©n t¸ch dùa -
+ -
trªn ®iÖn tÝch ion hãa -+

bÒ mÆt cña chóng


b»ng viÖc sö dông c¸c -++-
vËt liÖu nhåi cét (cßn
®−îc gäi lµ pha tÜnh) Protein tÝch
®iÖn d−¬ng
lµ c¸c h¹t mang c¸c
nhãm tÝch ®iÖn ©m H¹t nhåi cét
hoÆc d−¬ng (h×nh tÝch ®iÖn ©m
11.16a). C¸c protein Protein tÝch
t−¬ng t¸c yÕu víi pha ®iÖn ©m
tÜnh (ch¼ng h¹n,
protein tÝch ®iÖn
d−¬ng ®−îc cho ch¹y
qua pha tÜnh mang
®iÖn ©m) ban ®Çu
®−îc gi÷ l¹i trong cét, H×nh 11.16. S¾c ký cét ®Ó tinh s¹ch protein. a) S¾c ký trao ®æi ion, b) S¾c ký läc
sau ®ã sÏ ®−îc röa gel (vÏ theo Watson et al., 2004)
chiÕt b»ng mét dung dÞch muçi lo·ng ch¶y qua cét (dung dÞch ®Öm ch¹y mÉu ®−îc gäi lµ
pha ®éng). C¸c protein t−¬ng t¸c víi pha tÜnh cµng m¹nh, cµng cÇn nång ®é muèi cao ®Ó
röa chiÕt. B»ng viÖc t¨ng gradient nång ®é muèi trong c¸c dung dÞch ®Öm röa chiÕt, c¸c
protein kh¸c nhau vÒ kÝch th−íc, khèi l−îng vµ møc ®é ion hãa bÒ mÆt sÏ ph©n t¸ch khái
nhau thµnh c¸c ph©n ®o¹n khi chóng ®i qua cét.
11.3.2.2. S¾c ký läc gel
S¾c ký läc gel (h×nh 11.16b) cho phÐp ph©n t¸ch c¸c protein chñ yÕu kh¸c nhau vÒ
h×nh d¹ng vµ kÝch th−íc. Kh¸c víi s¾c ký trao ®æi ion, vËt liÖu ®Ó nhåi cét kh«ng mang
c¸c nhãm tÝch ®iÖn mµ thay vµo ®ã chóng t¹o nªn hÖ thèng m¹ng cã kÝch th−íc lç kh¸c
nhau (gièng gel, v× vËy gäi lµ s¾c ký läc gel). C¸c ph©n tö protein cµng nhá cµng cã kh¶
n¨ng th©m nhËp vµo tÊt c¶ c¸c lç cã kÝch th−íc kh¸c nhau; v× vËy, thêi gian ch¹y qua cét
sÏ dµi h¬n vµ ®−îc röa chiÕt muén h¬n. Ng−îc l¹i, c¸c ph©n tö protein cµng lín cµng ®−îc
röa chiÕt sím.
Trong s¾c ký cét, c¸c ph©n ®o¹n thu ®−îc ë nång ®é muèi kh¸c nhau hoÆc ë thêi
gian kh¸c nhau, ®ång thêi cã ho¹t tÝnh protein mong ®îi cao nhÊt ®−îc tÝch lòy vµ tinh
s¹ch bæ sung. Møc ®é tinh s¹ch cña protein cã xu h−íng t¨ng lªn khi c¸c ph©n ®o¹n
protein ®−îc cho ch¹y qua nhiÒu lo¹i cét s¾c ký kh¸c nhau. Th−êng th× mét cét s¾c ký
®¬n lÎ kh«ng ®ñ ®Ó tinh s¹ch mét lo¹i protein mong muèn dï qui tr×nh s¾c ký ®ã ®−îc lÆp
l¹i nhiÒu lÇn. Thay vµo ®ã, ng−êi ta th−êng ¸p dông mét lo¹t c¸c kü thuËt ®Ó cã thÓ thu
håi mét ph©n ®o¹n chøa mét l−îng lín protein ®−îc quan t©m. Nãi c¸ch kh¸c, tuy cã
nhiÒu ph©n tö protein ®−îc röa chiÕt trong dung dÞch muèi ®Ëm ®Æc tõ cét tÝch ®iÖn
d−¬ng (vÝ dô tr−êng hîp protein tÝch ®−îc ©m) hoÆc ®−îc röa chiÕt trong s¾c ký läc gel
(víi protein kÝch th−íc nhá), c¸c kü thuËt ®¬n lÎ nµy th−êng kh«ng ®ñ ®Ó cã thÓ thu ®−îc
mét s¶n phÈm protein tinh s¹ch hoµn toµn.

11.3.2.3. S¾c ký ¸i lùc hç trî tinh s¹ch protein


§Æc tÝnh cña mçi lo¹i protein cã thÓ ®−îc dïng nh»m lµm tinh s¹ch lo¹i protein
t−¬ng øng. Ch¼ng h¹n, nÕu mét lo¹i protein cã tÝnh liªn kÕt ®Æc hiÖu víi ATP, th× cã thÓ

346
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

dïng cét s¾c ký mang vËt liÖu g¾n kÕt víi ATP ®Ó ph©n t¸ch protein ®ã. ChØ cã protein
liªn kÕt víi ATP míi ®−îc cét gi÷ l¹i, cßn hÇu hÕt c¸c protein kh«ng liªn kÕt víi ATP bÞ
röa tr«i khái cét. Kü thuËt tinh s¹ch nµy ®−îc gäi lµ s¾c ký ¸i lùc. Cã nhiÒu chÊt kh¸c
nhau cã thÓ ®−îc dïng ®Ó g¾n kÕt víi vËt liÖu nhåi cét vµ gióp qu¸ tr×nh tinh s¹ch
protein ®¹t hiÖu qu¶ cao h¬n. C¸c chÊt nµy bao gåm c¶ ADN (®Ó tinh s¹ch protein liªn
kÕt ADN) hay thËm chÝ lµ protein (®Ó tinh s¹ch mét lo¹i protein kh¸c t−¬ng t¸c ®Æc thï
víi nã). Nh− vËy, ®Ó tinh s¹ch mét protein nµo ®ã, cÇn ph¶i cã nh÷ng hiÓu biÕt c¬ b¶n vÒ
®Æc tÝnh lý hãa cña protein ®ã.
Mét d¹ng cña s¾c ký ¸i lùc ®−îc dïng phæ biÕn lµ s¾c ký ¸i lùc miÔn dÞch. Trong
ph−¬ng ph¸p nµy, ng−êi ta g¾n kh¸ng thÓ ®Æc hiÖu víi protein ®Ých lªn vËt liÖu lµm cét.
Trong tr−êng hîp lý t−ëng, lo¹i kh¸ng thÓ nµy chØ liªn kÕt ®óng víi protein cÇn tinh
s¹ch. Lo¹i protein liªn kÕt víi kh¸ng thÓ sau ®ã ®−îc röa chiÕt b»ng c¸ch cho ch¶y qua
cét dung dÞch muèi hoÆc chÊt tÈy nhÑ. Khã kh¨n gÆp ph¶i víi ph−¬ng ph¸p nµy lµ ®«i khi
liªn kÕt kh¸ng thÓ - protein bÒn v÷ng ®Õn møc ph¶i g©y biÕn tÝnh protein míi thu håi
®−îc s¶n phÈm. Nh−ng, kh«ng gièng ADN, protein sau khi biÕn tÝnh th−êng kh«ng håi
tÝnh trong ®iÒu kiÖn in vitro, nªn protein thu ®−îc nhiÒu khi kh«ng ë d¹ng ho¹t ®éng
chøc n¨ng.
§Ó t¨ng hiÖu suÊt tinh s¹ch, còng cã thÓ c¶i biÕn protein. Mét vÝ dô vÒ sù c¶i biÕn
nµy lµ bæ sung mét ®o¹n peptide ng¾n vµo ®Çu C hoÆc ®Çu N cña ph©n tö protein cÇn
ph©n tÝch. ViÖc bæ sung “tr×nh tù ®¸nh dÊu” nµy cã thÓ thùc hiÖn ®−îc b»ng kü thuËt di
truyÒn. C¸c tr×nh tù peptide ®¸nh dÊu lµm thay ®æi mét sè thuéc tÝnh cña protein vµ
gióp viÖc tinh chÕ dÔ dµng h¬n. VÝ dô, mét sè protein sau khi ®−îc bæ sung mét chuçi
peptide gåm 6 His trë nªn t−¬ng t¸c víi cét Ni2+ tèt h¬n vµ dÔ ph©n t¸ch h¬n (trong khi
nh÷ng protein kh¸c kh«ng cã ®Æc tÝnh nµy). Còng cã thÓ sö dông epitop ®Æc hiÖu
(th−êng lµ mét ®o¹n peptide cã 5 - 7 axit amin x¸c ®Þnh kh¸ng nguyªn) ®Ó tinh s¹ch lo¹i
protein cã ¸i lùc cao víi nã. C¸c c¶i tiÕn nµy cho phÐp tinh s¹ch c¸c protein trªn c¬ së
nguyªn t¾c miÔn dÞch. ¦u ®iÓm cña ph−¬ng ph¸p nµy lµ: c¸c epitop cã thÓ thay ®æi tÝnh
liªn kÕt kh¸ng thÓ tïy thuéc vµo ®iÒu kiÖn m«i tr−êng (ch¼ng h¹n, ¸i lùc gi¶m khi cã
Ca2+, vµ t¨ng khi kh«ng cã Ca2+). §iÒu nµy gióp h¹n chÕ viÖc sö dông c¸c yÕu tè g©y biÕn
tÝnh kh¸c.
Nguyªn t¾c s¾c ký ¸i lùc miÔn dÞch còng ®−îc dïng ®Ó g©y kÕt tña nhanh mét lo¹i
protein ®Æc hiÖu nµo ®ã tõ dÞch chiÕt th«. Trong tr−êng hîp nµy, ph¶n øng kÕt tña miÔn
dÞch x¶y ra do kh¸ng thÓ ®−îc g¾n vµo cïng lo¹i vËt liÖu lµm pha tÜnh trong s¾c ký cét.
Do c¸c h¹t nµy cã kÝch th−íc lín nªn chóng l¾ng rÊt nhanh trong èng nghiÖm chøa dung
dÞch ®Öm vµ mang theo c¸c protein liªn kÕt víi chóng (qua kh¸ng thÓ). Kü thuËt nµy
®−îc gäi lµ kÕt tña miÔn dÞch, còng ®−îc dïng ngµy cµng phæ biÕn trong c¸c thÝ nghiÖm
cÇn tinh s¹ch protein. MÆc dï nÕu chØ dïng riªng rÏ ph−¬ng ph¸p nµy, hiÕm khi thu ®−îc
s¶n phÈm protein tinh s¹ch hoµn toµn, song ph−¬ng ph¸p nµy rÊt hiÖu qu¶ ®Ó x¸c ®Þnh
c¸c lo¹i protein hoÆc hîp chÊt kh¸c (vÝ dô mét tr×nh tù ADN) cã t−¬ng t¸c víi mét lo¹i
protein ®Ých nµo ®ã.

11.3.3. Ph©n tÝch protein trªn gel polyacrylamide

11.3.3.1. Kü thuËt ®iÖn di trªn gel polyacrylamide (PAGE)


Kh«ng gièng c¸c axit nucleic, protein th−êng kh«ng mang ®iÖn tÝch ®ång ®Òu hay cã
cÊu tróc bËc hai ®ång nhÊt däc chiÒu dµi ph©n tö. Thay vµo ®ã, tõ 20 lo¹i axit amin c¬
b¶n (trong ®ã cã 15 axit amin trung tÝnh, 3 axit amin tÝch ®iÖn d−¬ng, 2 axit amin tÝch
®iÖn ©m; xem ch−¬ng 1) phÇn lín c¸c protein lµ trung tÝnh, mét sè kh¸c tÝch ®iÖn d−¬ng,
sè cßn l¹i tÝch ®iÖn ©m. Ngoµi cÊu tróc bËc 2, protein ë d¹ng ho¹t ®éng th−êng cã cÊu tróc
bËc 3 hoÆc 4 ®iÓn h×nh. Nh−ng khi ®−îc ®−îc xö lý víi c¸c chÊt tÈy (ion hãa) m¹nh nh−

347
§inh §oµn Long

SDS (sodium dodecyl sulphate, c«ng thøc lµ CH3-(CH2)11SO4-) hay c¸c chÊt khö nhãm
sulfhydryl, nh− β -mercapthoethanol (HS-CH2CH2OH) th× c¸c cÊu tróc bËc 2, 3 vµ 4
cña protein bÞ ph¸ vì. Lóc nµy, SDS t¹o thµnh líp vá ion ©m bao bäc protein lµm protein
trë nªn tÝch ®iÖn ©m ®ång ®Òu däc ph©n tö. β-mecarptoethanol lµm “®øt g·y” c¸c liªn kÕt
disulfide (S-S) gi÷a c¸c Cys. Trªn c¬ së nµy, nÕu c¸c ph©n tö protein ®−îc g©y biÕn tÝnh
bëi SDS vµ β-mercaptoethanol, th× sù ph©n t¸ch protein trong ®iÖn di chñ yÕu lµ do sù
kh¸c biÖt vÒ kÝch th−íc vµ khèi l−îng ph©n tö. Khi kh«ng cã SDS vµ β-mercaptoethanol,
c¸c protein vÉn cã thÓ ph©n t¸ch b»ng ®iÖn di, nh−ng lóc nµy sù ph©n t¸ch cña chóng cßn
phô thuéc vµo nhiÒu yÕu tè kh¸c nh− cÊu h×nh, ®iÓm ®¼ng ®iÖn, sù t−¬ng t¸c ph©n tö ...
Mét ®iÓm kh¸c biÖt n÷a so víi c¸c axit nucleic lµ protein th−êng cã kÝch th−íc trung
b×nh nhá h¬n nhiÒu so víi c¸c axit nucleic, nªn gel ®iÖn di protein th−êng ®−îc lµm tõ
polyacrylamide. HÖ thèng “m¹ng” mµ hîp chÊt polyme nh©n t¹o nµy t¹o ra nhá h¬n so
víi gel agarose. Kü thuËt ®iÖn di trªn gen polyacrylamide ®−îc viÕt t¾t lµ PAGE. Sau khi
®iÖn di, ®Ó quan s¸t c¸c protein ®−îc nhuém víi mét trong hai chÊt nhuém phæ biÕn lµ
Coomassie blue hoÆc b¹c (Ag2+). Coomassie blue liªn kÕt chÆt víi protein t¹o nªn c¸c
b¨ng ®iÖn di cã mµu xanh; c¸c nguyªn tö b¹c còng liªn kÕt m¹nh víi protein t¹o nªn
phøc hÖ cã mµu n©u – ®en. Nhuém b¹c th−êng nh¹y h¬n coomassie blue, nh−ng ®¾t h¬n.

11.3.3.2. §iÖn di protein trªn gel polyacrylamide hai chiÒu (2D-PAGE)


Do sè l−îng c¸c ph©n tö protein trong c¸c mÉu sinh häc th−êng rÊt lín nªn ph−¬ng
ph¸p ®iÖn di th«ng th−êng kh«ng ®ñ ®Ó ph©n t¸ch c¸c protein gièng nhau ra khái nhau.
V× vËy, c¸c ph©n tö protein th−êng ®−îc t¸ch tr−íc tiªn dùa trªn sù kh¸c biÖt vµ ®iÖn
tÝch bÒ mÆt cña chóng (gäi lµ chiÒu thø nhÊt); sau ®ã, dùa trªn sù kh¸c biÖt vÒ kÝch th−íc
(gäi lµ chiÒu thø hai). Ph−¬ng ph¸p ®iÖn di nµy ®−îc tiÕn hµnh trªn gel polyacrylamide
vµ ®−îc gäi t¾t lµ 2D-PAGE. Trong chiÒu thø nhÊt, mét gradient pH (tõ ~3 ®Õn 10)
®−îc t¹o ra däc b¶n gel. C¸c protein tïy theo ®iÖn tÝch bÒ mÆt cña chóng sÏ dÞch chuyÓn
trªn gel ®iÖn di vÒ vÞ trÝ cã ®é pH t−¬ng ®−¬ng víi ®iÓm ®¼ng ®iÖn (pI) cña chóng (lµ
®iÓm mµ ®iÖn tÝch cña chóng ®−îc trung hßa). C¸c protein cã cïng ®iÓm ®¼ng ®iÖn sau ®ã
®−îc ph©n t¸ch nhê sù kh¸c nhau vÒ kÝch th−íc theo ph−¬ng ph¸p ®iÖn di th«ng th−êng.
C¸c kü thuËt 2D-PAGE c¶i tiÕn gÇn ®©y cho phÐp ph©n t¸ch ®ång thêi trªn 10.000
protein kh¸c nhau. Trªn b¶n ®iÖn di 2D-PAGE, mçi lo¹i protein th−êng "héi tô" thµnh
nh÷ng "vÕt ®èm". Mçi vÕt ®èm nµy sau ®ã cã thÓ ®−îc c¾t ra khái gel, xö lý víi protease,
råi ph©n tÝch b»ng ph−¬ng ph¸p khèi phæ (xem d−íi ®©y) ®Ó x¸c ®Þnh lo¹i protein.

11.3.4. §Þnh tÝnh protein dùa trªn thÈm t¸ch miÔn dÞch – lai Western
Tuy cã b¶n chÊt kh¸c ADN vµ ARN, viÖc x¸c ®Þnh sù cã mÆt mét lo¹i protein trong
mÉu sinh häc còng ®−îc thùc hiÖn theo nguyªn t¾c lai vµ ®−îc gäi lµ lai Western. Tuy
nhiªn, kh«ng gièng c¸c ph−¬ng ph¸p lai axit nucleic dùa trªn nguyªn t¾c liªn kÕt
Chargaff (b¶ng 11.2), lai Western lµ ph−¬ng ph¸p ®Þnh tÝnh protein dùa trªn nguyªn t¾c
miÔn dÞch; v× vËy, nã
cßn ®−îc gäi lµ thÈm B¶ng 11.2. C¸c ph−¬ng ph¸p lai ®Ó ph©n tÝch ADN, ARN vµ protein
t¸ch miÔn dÞch
(immunoblotting). Ph−¬ng ph¸p lai Lo¹i ph©n tö cÇn ph©n tÝch B¶n chÊt mÉu dß
Trong lai Western,
Southern ADN ADN (m¹ch ®¬n)
c¸c ph©n tö protein
sau khi ®−îc ph©n Northern ARN ADN (m¹ch ®¬n)
t¸ch trªn ®iÖn di
Western Protein Kh¸ng thÓ
®−îc chuyÓn lªn
mµng. Mµng nµy sau South-Western Protein ADN (sîi kÐp)
®ã ®−îc ñ trong mét

348
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

dung dÞch chøa kh¸ng thÓ ®Æc hiÖu víi protein ®−îc quan t©m nghiªn cøu. Kh¸ng thÓ sÏ
g¾n vµo lo¹i protein t−¬ng øng ë trªn mµng. Cuèi cïng, b»ng ph¶n øng enzym hiÖn mµu,
ng−êi ta cã thÓ quan s¸t ®−îc vÞ trÝ kh¸ng thÓ ë trªn mµng, qua ®ã cho biÕt sù cã mÆt vµ
khèi l−îng ph©n tö cña protein. Nh− vËy, ®iÓm chung cña tÊt c¶ c¸c ph−¬ng ph¸p lai
Southern, Northern vµ Western lµ sö dông c¸c hîp chÊt chän läc ®Ó ph¸t hiÖn sù cã mÆt
cña mét hoÆc mét sè lo¹i ph©n tö ®Æc thï trong c¸c hçn hîp phøc t¹p.
Mét ph−¬ng ph¸p lai c¶i tiÕn kh¸c ®−îc dïng ®Ó ph¸t hiÖn c¸c protein liªn kÕt ADN
lµ lai South-Western. Trong ph−¬ng ph¸p nµy, ng−êi ta dïng mÉu dß ADN (thay cho
kh¸ng thÓ trong lai Western) ®Ó lai víi c¸c protein. NÕu nh− trong lai Southern, mÉu dß
ADN th−êng ë d¹ng m¹ch ®¬n, th× mÉu dß trong lai South-Western th−êng ë d¹ng sîi kÐp,
v× phÇn lín protein liªn kÕt víi ADN sîi kÐp.

11.3.5. §Þnh lo¹i vµ gi¶i tr×nh tù protein


MÆc dï cã cÊu t¹o phøc t¹p h¬n so víi c¸c axit nucleic, c¸c ph©n tö protein còng cã
thÓ gi¶i tr×nh tù trùc tiÕp. Cã hai ph−¬ng ph¸p ®−îc sö dông phæ biÕn h¬n c¶ lµ: (1)
ph−¬ng ph¸p biÕn tÝnh Edman vµ (2) ph−¬ng ph¸p khèi phæ.
11.3.5.1. Gi¶i tr×nh tù protein b»ng ph−¬ng ph¸p g©y biÕn tÝnh Edman
Ph−¬ng ph¸p g©y biÕn tÝnh Edman lµ ph−¬ng ph¸p gi¶i tr×nh tù axit amin cña
c¸c ®o¹n peptide ng¾n, dùa trªn viÖc ®¸nh dÊu vµ c¾t axit amin ®Çu N lÇn l−ît khái
chuçi peptide mµ kh«ng ¶nh h−ëng ®Õn c¸c liªn kÕt peptide kh¸c trong ph©n tö protein.
Ph¶n øng c¾t ®−îc thùc hiÖn bëi phenylisothyocyanate (PITC, h×nh 11.17). Trong
dung dÞch kiÒm nhÑ, PITC ph¶n øng víi axit amin ®Çu N ®Ó h×nh thµnh nªn dÉn xuÊt
phenylthiocarbamoyl. Khi chuyÓn sang m«i tr−êng axit, axit amin ®Çu N bÞ “®øt ra” ë
d¹ng dÉn xuÊt axit amin thiazolinone. Axit amin thiazolinone sau ®ã ®−îc chiÕt xuÊt
chän läc b»ng dung m«i h÷u c¬, råi xö lý víi mét lo¹i axit ®Ó h×nh thµnh nªn dÉn xuÊt
bÒn v÷ng cña axit amin lµ phenylthiohydantoin (PTH). ChÊt nµy cã thÓ x¸c ®Þnh b»ng
s¾c ký hoÆc ®iÖn di. Quy tr×nh nµy ®−îc lÇn l−ît lÆp l¹i cho ®Õn axit amin cuèi cïng trong
chuçi polypeptide ®Ó gi¶i tr×nh tù. H¹n chÕ lín nhÊt cña kü thuËt nµy lµ hiÖu qu¶ gi¶i
tr×nh tù thÊp ë c¸c ®o¹n peptide dµi trªn 30 axit amin. Së dÜ nh− vËy, v× ph¶n øng biÕn
tÝnh c¸c axit amin ë c¸c ®o¹n peptide dµi th−êng kh«ng triÖt ®Ó. Mét h¹n chÕ kh¸c lµ kü
thuËt nµy gÆp trë ng¹i khi axit amin ®Çu N bÞ c¶i biÕn hãa häc (vÝ dô ®−îc g¾n thªm
nhãm acetyl hoÆc formyl) mµ hiÖn t−îng nµy vèn cã thÓ x¶y ra tù nhiªn trong ®iÒu kiÖn
in vivo, hoÆc trong qu¸ tr×nh t¸ch chiÕt vµ tinh s¹ch protein. Tuy vËy, c¶ hai h¹n chÕ nµy
Ph¶n øng biÕn tÝnh Edman Phenylisothiocyanate Alanine
Chu kú biÕn tÝnh 2 Chu kú biÕn tÝnh 1

§¸nh dÊu axit


amin ®Çu N
§¸nh dÊu axit
amin ®Çu N
Gi¶i phãng axit
amin ®Çu N

§¸nh dÊu axit


amin ®Çu N Gi¶i phãng axit
PITC-alanine amin ®Çu N
Gi¶i phãng axit
amin ®Çu N

§o¹n peptide ng¾n ®i 1 axit amin

H×nh 11.17. Gi¶i tr×nh tù protein trùc tiÕp b»ng ph−¬ng ph¸p biÕn tÝnh Edman (vÏ theo Watson vµ cs, 2004)

349
§inh §oµn Long

®Òu cã thÓ ®−îc kh¾c phôc b»ng c¸ch dïng protease c¾t c¸c ®o¹n peptide lín thµnh c¸c
®o¹n peptide nhá h¬n tr−íc khi gi¶i tr×nh tù. Víi ®o¹n peptide dµi 30 axit amin, ®é chÝnh
x¸c trong gi¶i tr×nh tù cña ph−¬ng ph¸p Edman lµ 98%. Dùa trªn nguyªn lý biÕn tÝnh
Edman, m¸y gi¶i tr×nh tù protein tù ®éng còng ®· ®−îc ph¸t triÓn vµ dïng réng r·i.

11.3.5.2. Gi¶i tr×nh tù protein b»ng ph−¬ng ph¸p khèi phæ


ViÖc ph©n tÝch c¸c protein hoÆc c¸c ®o¹n peptide b»ng ph−¬ng ph¸p khèi phæ
(MS) dùa trªn c¸c kü thuËt hãa ph©n tÝch cã ®é chÝnh x¸c cao; vµ gÇn ®©y ®−îc thiÕt kÕ
thµnh c¸c hÖ thèng tù ®éng do m¸y tÝnh ®iÒu khiÓn. Trong ph−¬ng ph¸p nµy, cã hai kü
thuËt c¬ b¶n quan träng nhÊt lµ ph©n hñy laser trong chÊt mang (th−êng gäi t¾t lµ
MALDI) vµ ion hãa phun ®iÖn (gäi t¾t lµ ESI). Kü thuËt MS gióp ®o tØ sè [khèi l−îng /
®iÖn tÝch] (m/z) cña ion, tõ ®ã x¸c ®Þnh ®−îc khèi l−îng ph©n tö. Nh−ng nÕu kh«ng cã c¸c
kü thuËt MALDI vµ ESI, MS kh«ng trùc tiÕp ph©n tÝch ®−îc c¸c ph©n tö lín nh− protein.
Trong kü thuËt MALDI (h×nh 11.18a), c¸c xung laser ®−îc dïng ®Ó “b¾n ph¸” c¸c
tinh thÓ chÊt r¾n vµ truyÒn n¨ng l−îng ®Ó c¸c ion cña tinh thÓ “b¾n ra” ë d¹ng khÝ. §èi
víi protein, ®Çu tiªn c¸c mÉu ®−îc “tinh thÓ” hãa (chuyÓn sang d¹ng r¾n) b»ng viÖc sö
dông chÊt nÒn. ChÊt nÒn ®−îc dïng trong kü thuËt MALDI th−êng lµ c¸c axit th¬m nh−
4-methoxy cinnamic acid. Sau khi bÞ tia laser “b¾n ph¸”, chÊt nÒn truyÒn n¨ng l−îng cho
“tinh thÓ” protein, lµm gi¶i phãng c¸c ion mµ kÝch th−íc vµ ®iÖn tÝch cña chóng ®Æc thï
víi mçi lo¹i protein. C¸c ion (lóc nµy ë d¹ng khÝ) ®−îc gia tèc trong mét tr−êng ®iÖn tõ cã
hiÖu ®iÖn thÕ cao sÏ bay qua mét èng ch©n kh«ng tíi c¶m biÕn tÝn hiÖu. ThiÕt bÞ c¶m biÕn
nµy ®o ®−îc kho¶ng thêi gian bay cña ion tõ nguån ph¸t sinh ion (tinh thÓ protein) tíi
®iÓm c¶m biÕn. Thêi gian ion bay tØ lÖ thuËn víi c¨n bËc hai cña tØ sè m/z. ThÕ nªn, tõ
thêi gian bay cã thÓ x¸c ®Þnh ®−îc tØ sè m/z cña mçi ion; tËp hîp c¸c tÝn hiÖu cña c¸c ion
cho phÐp x¸c ®Þnh tr×nh tù axit amin cña protein. Ph−¬ng ph¸p x¸c ®Þnh tØ sè m/z qua
thêi gian bay cña c¸c ion ®−îc gäi lµ kü thuËt t¸ch thêi gian bay (gäi t¾t lµ TOF).
Ph−¬ng ph¸p MS dùa trªn hai kü thuËt MALDI vµ TOF ®−îc gäi chung lµ MALDI-TOF.
V× kü thuËt MALDI-TOF rÊt nh¹y nªn l−îng mÉu ®−a vµo ph©n tÝch hiÖn nay cÇn
nhá h¬n 10-12mole. §Ó cã ®−îc mÉu protein tinh s¹ch ë l−îng nhá, ng−êi ta th−êng tiÕn
hµnh ®iÖn di 2D-PAGE ®Ó ph©n t¸ch protein; råi mçi protein ®−îc th«i khái gel vµ c¾t
b»ng protease (vÝ dô trypsin) thµnh mét tËp hîp c¸c ®o¹n peptide (th−êng ng¾n h¬n 20
axit amin) ®Æc thï cña mçi protein. Ngoµi viÖc x¸c ®Þnh ®−îc tr×nh tù axit amin, kü thuËt
MALDI-TOF ®ång thêi cho phÐp ph¸t hiÖn ®−îc c¸c protein ®−îc biÕn ®æi sau dÞch m·,
ch¼ng h¹n x¸c ®Þnh ®−îc c¸c axit amin ®−îc g¾n thªm c¸c gèc phosphate hoÆc gèc ®−êng.
Kü thuËt MALDI-TOF hiÖn nay cho phÐp gi¶i tr×nh tù cña protein cã khèi l−îng tíi

a) b)
Ph©n tö mÉu ë
C¶m biÕn tø cùc (bÉy ion)

Tia laser Vïng chuyÓn


d¹ng tinh thÓ
®−îc g¾n lªn tr¹ng th¸i
chÊt mang Mao qu¶n dÉn mÉu

Vïng chuyÓn
tr¹ng th¸i
C¶m biÕn TOF

Dung dÞch Giät dÞch H¹t ion


Giät dÞch L−íi
chøa mÉu mang mÉu trÇn
mang mÉu tÝch ®iÖn
nhá h¬n
ChÊt mang H×nh 11.18. C¸c ph−¬ng ph¸p khèi phæ. a) Ph−¬ng ph¸p khèi phæ
Ph©n tö mÉu L−íi ph©n hñy laser trong chÊt mang kÕt hîp víi thêi gian bay
bÞ ion hãa tÝch ®iÖn (MALDI/TOF), b) Ph−¬ng ph¸p ion hãa phun ®iÖn (ESI).

350
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

100.000 Da trong mét lÇn “c«ng ph¸” mÉu. Tuy vËy, víi c¸c c¶i tiÕn kü thuËt kh«ng
ngõng, cã lÏ thêi gian tíi, giíi h¹n ph©n tÝch protein cña MALDI-TOF sÏ cßn tiÕp tôc
t¨ng lªn.
NÕu MALDI lµ kü thuËt ®−îc dïng ®Ó t¹o ra c¸c ion ë d¹ng khÝ tõ chÊt r¾n, th× ESI
®−îc dïng ®Ó t¹o ra c¸c ion ë d¹ng khÝ tõ dÞch láng. Trong ESI, ng−êi ta dïng mét mao
qu¶n ®Ó nhá giät chÊt láng vµo tr−êng ®iÖn tõ cã hiÖu ®iÖn thÕ cao (h×nh 11.18b). Dung
m«i sÏ bay h¬i nhanh vµ giät nhá sÏ “vì ra”. Sù vì ra nh− vËy diÔn ra nhiÒu lÇn liªn tiÕp
t¹o nªn c¸c ion ®éc lËp (ion trÇn). C¸c h¹t ion ®−îc gia tèc bay trong èng ch©n kh«ng ®Õn
khi tiÕp cËn vµ ®−îc ®o khèi l−îng bëi bé c¶m biÕn tø cùc, cßn gäi lµ bÉy ion. Nh− vËy,
bÉy ion th−êng ®−îc dïng víi khèi phæ ESI. Khèi phæ ESI cã −u ®iÓm lµ nã th−êng ®−îc
nèi trùc tiÕp víi mét hÖ thèng ph©n t¸ch dÞch láng, bao gåm c¸c kü thuËt ®iÖn di mao
qu¶n (CE) hoÆc s¾c ký láng cao ¸p (HPLC). MÆc dï th«ng th−êng kh«ng ®−îc nèi trùc
tiÕp víi c¸c hÖ thèng MALDI-TOF, nh−ng c¸c kü thuËt CE vµ HPLC còng cã thÓ ®−îc
dïng ®Ó tinh s¹ch protein tr−íc khi ph©n tÝch b»ng MALDI-TOF.
Ngoµi ra, trong kü thuËt MS, do hiÖn t−îng c¸c ion “gèc” cã thÓ ph©n r· thµnh c¸c
ion “con”, nªn kü thuËt khèi phæ cã thÓ ®−îc thùc hiÖn nhiÒu lÇn kÕ tiÕp ®Ó thu ®−îc c¸c
sè liÖu ph©n tÝch chi tiÕt h¬n vÒ mçi ph©n tö protein. Kü thuËt nµy ®−îc gäi lµ khèi
phæ kÕ tiÕp (viÕt t¾t lµ MS/MS). Kü thuËt nµy cho phÐp ph©n biÖt ®−îc hai ion cã cïng
khèi l−îng (vÝ dô: ®Ó ph©n biÖt hai ®o¹n peptide ng¾n cã cïng thµnh phÇn axit amin
nh−ng kh¸c nhau vÒ tr×nh tù). Trong thùc tÕ, ®Ó gi¶i
tr×nh tù c¸c ®o¹n peptide hoÆc protein míi, ng−êi ta a)
YÕu tè phiªn m·
th−êng ph¶i dïng ph−¬ng ph¸p khèi phæ kÕ tiÕp. MiÒn liªn MiÒn ho¹t
kÕt ADN hãa enzym
11.3.6. Ph©n tÝch t−¬ng t¸c protein - protein
Däc theo gi¸o tr×nh nµy, chóng ta nhËn thÊy ADN ARN pol

c¸c mèi t−¬ng t¸c gi÷a c¸c ®¹i ph©n tö (ADN, ARN Gen chØ thÞ
vµ protein) cã vai trß trung t©m ®iÒu hßa hÇu hÕt c¸c VÞ trÝ Gen biÓu hiÖn
ho¹t ®éng sèng cña tÕ bµo vµ c¬ thÓ sinh vËt. Trong nhËn biÕt
®ã, t−¬ng t¸c gi÷a c¸c protein víi nhau cã vai trß b)
quyÕt ®Þnh trùc tiÕp ®ång thêi cã tÝnh ®a d¹ng vµ “VËt s¨n måi”
MiÒn ho¹t
phøc t¹p nhÊt. Cã nhiÒu ph−¬ng ph¸p kh¸c nhau hãa enzym
®−îc dïng ®Ó ®¸nh gi¸ t−¬ng t¸c gi÷a c¸c protein nh»m
“Måi”
gãp phÇn lµm s¸ng tá chøc n¨ng cña chóng. ë ®©y, MiÒn liªn
chóng ta chØ ®Ò cËp ®Õn 3 ph−¬ng ph¸p lµ: (1) hÖ kÕt ADN “VËt s¨n måi”
thèng lai hai dßng ë nÊm men, (2) ®ång kÕt tña miÔn kh«ng b¾t
dÞch vµ (3) kü thuËt vi d·y protein. ARN pol ®−îc “måi”
Gen chØ thÞ
11.3.6.1. HÖ thèng lai hai dßng ë nÊm men Gen kh«ng biÓu hiÖn
HÖ thèng lai hai dßng dùa trªn ®Æc ®iÓm cÊu
tróc ph©n tö cña phÇn lín protein ho¹t hãa phiªn m·. c)
“VËt s¨n måi”
Tõ ch−¬ng 5 chóng ta biÕt r»ng, nhiÒu protein ho¹t “Måi”
MiÒn ho¹t
hãa phiªn m· cã hai miÒn ho¹t tÝnh: miÒn liªn kÕt hãa enzym
MiÒn liªn
ADN, viÕt t¾t lµ DBD (th−êng nhËn ra c¸c ®o¹n tr×nh kÕt ADN
tù ®Æc hiÖu ng−îc dßng promoter) vµ miÒn ho¹t hãa, “VËt s¨n måi”
ARN pol b¾t ®−îc “måi”
viÕt t¾t lµ AD (cã vai trß thóc ®Èy phiªn m· sau khi Gen chØ thÞ
®Ýnh kÕt víi ARN polymerase). Khi hai miÒn nµy
Gen biÓu hiÖn
t−¬ng t¸c víi nhau, chóng ho¹t hãa sù phiªn m· cña
gen. VÒ nguyªn t¾c, hai miÒn AD vµ DBD kh«ng nhÊt H×nh 11.19. Nguyªn t¾c cña hÖ thèng lai
thiÕt ph¶i liªn kÕt céng hãa trÞ trªn cïng ph©n tö hai dßng. Xem néi dung trong phÇn diÔn
gi¶i (vÏ theo Clark, 2006).

351
§inh §oµn Long

protein. ThÕ nªn, trong hÖ thèng lai hai dßng, hai miÒn AD vµ DBD ®−îc "dung hîp" víi
hai protein kh¸c nhau, gi¶ sö ®−îc kÝ hiÖu lµ A vµ B (h×nh 11.19). Hai protein lai nµy
®−îc coi lµ "måi" (AD-A) vµ "vËt s¨n måi" (DBD-B). NÕu "vËt s¨n måi" b¾t ®−îc "måi", tøc
lµ A vµ B t−¬ng t¸c víi nhau, mét phøc hÖ sÏ h×nh thµnh vµ ho¹t hãa gen. Ng−êi ta sö
dông mét gen chØ thÞ ®Ó x¸c nhËn cã hay kh«ng sù t−¬ng t¸c gi÷a hai protein lai.
M« h×nh lai hai dßng ®−îc ph¸t triÓn ë nÊm men vµ ®−îc dïng ®Ó kiÓm tra mèi
t−¬ng t¸c gi÷a kho¶ng 6000 lo¹i protein kh¸c nhau ë sinh vËt nµy. Theo lý thuyÕt, sÏ
ph¶i kiÓm tra 6000x6000 tæ hîp protein kh¸c nhau. §Ó thùc hiÖn ®−îc ®iÒu ®ã, mçi ORF
cña hÖ gen nÊm men ®Òu ®−îc nh©n dßng vµo hai lo¹i vect¬ kh¸c nhau: mét vect¬ mang
miÒn AD, cßn mét vect¬ mang miÒn DBD. Nãi c¸ch kh¸c, mçi protein cña nÊm men ®Òu
®−îc kiÓm tra trong vai trß lµ "måi" vµ "vËt b¾t måi". C¸c vect¬ ®Òu ®−îc thiÕt kÕ sao cho
c¸c ORF t−¬ng øng víi hai miÒn AD vµ DBD ®Òu ®−îc ho¹t hãa biÓu hiÖn bëi cïng mét
yÕu tè ho¹t hãa phiªn m·, vÝ dô nh− GAL4 (h×nh 11.20). Vect¬ A cã vÞ trÝ "®a nh©n dßng"
n»m ng−îc dßng ®o¹n gen GAL4-AD gióp t¹o nªn ph©n tö lai A-GAL4-AD, cßn vect¬ B
cã vÞ trÝ n»m xu«i dßng ®o¹n gen GAL4-DBD gióp t¹o nªn ph©n tö lai GAL4-DBD-B.
Hai vect¬ plasmid lai ®−îc biÕn n¹p vµo c¸c tÕ bµo nÊm men kh¸c giíi tÝnh. KÕt qu¶
lµ h×nh thµnh hai nhãm giíi tÝnh, mçi nhãm gåm 6000 dßng tÕ bµo nÊm men mang c¸c
vect¬ biÕn n¹p kh¸c nhau. Sau ®ã, mçi dßng tÕ bµo thuéc nhãm nµy (giíi tÝnh nµy) ®−îc
®em lai víi mçi dßng thuéc
§iÓm khëi ®Çu sao
nhãm kia (giíi tÝnh kia). §iÓm chÐp ë vi khuÈn
NghÜa lµ mäi kh¶ n¨ng tæ khëi ®Çu
hîp gi÷a c¸c AD vµ DBD sao chÐp
ë nÊm Vect¬ Vect¬
thuéc c¸c protein kh¸c nhau men “måi”
“vËt b¾t måi”
®Òu x¶y ra. Khi c¸c dßng (B) (A)
nÊm men "lai" víi nhau,
chóng h×nh thµnh nªn d¹ng Promoter Tr×nh tù “vËt b¾t måi” Tr×nh tù “måi”
bµo tö l−ìng béi (2n) mang
c¶ hai plasmid "måi" vµ "vËt
s¨n måi". NÕu hai protein “vËt b¾t måi”
“måi”
lai lµ A vµ B t−¬ng t¸c víi
nhau, gen chØ thÞ sÏ biÓu T−¬ng t¸c ¸i
hiÖn. Trong m« h×nh ë nÊm lùc cao gi÷a
men, hai gen chØ thÞ ®−îc sö c¸c protein
dông lµ HIS3 vµ URA3. NÕu
gen HIS3 vµ URA3 kh«ng
®−îc ho¹t hãa, tÕ bµo nÊm
men sÏ chÕt nÕu m«i tr−êng
kh«ng cã t−¬ng øng histidine
(His) vµ uracine (U). Nh−
vËy, nÕu tÕ bµo nÊm men lai
(2n) cã thÓ sinh tr−ëng ®−îc
trªn m«i tr−êng kh«ng cã
ARN ARN
His hoÆc U th× chøng tá c¸c ADN pol pol
ADN
gen chØ thÞ HIS3 vµ URA3 ®·
®−îc ho¹t hãa; tøc lµ hai
protein A vµ B ®· t−¬ng t¸c
víi nhau. Trªn m« h×nh ë
Chän läc trªn m«i Chän khuÈn l¹c mµu xanh lam
h×nh 11.20, hai gen chØ thÞ tr−êng thiÕu His (His-) trªn m«i tr−êng cã X-gal
®−îc dïng lµ HIS3 vµ LacZ.
Trong ®ã, gen LacZ m· hãa H×nh 11.20. C¸c vect¬ ®−îc thiÕt kÕ cho hÖ thèng lai hai dßng.
Xem néi dung trong phÇn diÔn gi¶i (vÏ theo Clark, 2006).
cho β-galactosidase. Enzym

352
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

nµy chuyÓn hãa hîp chÊt kh«ng mµu lµ X-gal (5- Ph©n tö ARN
brom-4-chlor-3-idolyl-β-D-galactoside) thµnh
hîp chÊt cã mµu xanh lam lµ 5-brom-4-chlor-
MiÒn liªn MiÒn ho¹t
indigo. V× vËy, khi gen chØ thÞ lµ LacZ, nÕu cã kÕt ADN hãa enzym
t−¬ng t¸c gi÷a c¸c protein, tÕ bµo sÏ cã mµu
xanh lam khi nu«i trong m«i tr−êng cã X-gal. ADN ARN pol
¦u ®iÓm næi bËt nhÊt cña hÖ thèng lai Gen chØ thÞ
kÐp ë nÊm men lµ cho phÐp ®¸nh gi¸ sù t−¬ng VÞ trÝ
t¸c protein – protein trong tÕ bµo. Tuy vËy, nã nhËn biÕt
còng cã mét sè h¹n chÕ. KiÓu t−¬ng t¸c protein H×nh 11.21. M« h×nh lai ba dßng.
- protein nµy chØ giíi h¹n trong nh©n tÕ bµo.
HÇu hÕt c¸c protein mµng tÕ bµo "gÊp nÕp" sai Gen ®ang Tr×nh tù FLAG
khi ë trong nh©n; ng−îc l¹i, c¸c protein trong nghiªn cøu
nh©n cã xu h−íng bÞ “biÕn ®æi” sai khi ë tÕ bµo
chÊt. §éc tÝnh t¹o ra do sù t−¬ng t¸c gi÷a c¸c ADN
protein lín (c¸c protein lai th−êng cã kÝch plasmid
BiÕn n¹p vµo tÕ
th−íc lín h¬n d¹ng tù nhiªn) cã thÓ dÉn ®Õn bµo ®éng vËt
viÖc ®¸nh gi¸ sai mét sè t−¬ng t¸c quan träng. Promoter nu«i cÊy in vitro
Ngoµi ra, mét sè t−¬ng t¸c protein-protein cßn ®éng vËt cã vó
Thu tÕ bµo vµ
phô thuéc vµo sù cã mÆt cña ARN hoÆc mét sè t¸ch tÕ bµo chÊt
ph©n tö nhá kh¸c kh«ng chøng minh ®−îc
b»ng m« h×nh nµy. Protein Kh¸ng thÓ
kh¸c
cña FLAG
Mét hÖ thèng lai ®−îc c¶i tiÕn nh»m kh¾c
Phøc hÖ
phôc h¹n chÕ trªn ®−îc gäi lµ hÖ thèng lai ba protein
H¹t ®−îc
dßng (h×nh 11.21). Trong hÖ thèng nµy, hai “bäc” b»ng
protein (AD-A vµ DBD-B) ®−îc ®¸nh gi¸ t−¬ng protein A
t¸c ®ång thêi víi ph©n tö ARN mµ c¶ hai
protein cïng liªn kÕt. M« h×nh nµy cã thÓ ®−îc
dïng ®Ó sµng läc c¸c protein t−¬ng t¸c ARN. Ly t©m thu h¹t vµ ch¹y
®iÖn di trªn gel SDS-PAGE
HÖ thèng lai hai dßng ë nÊm men còng cã
thÓ ¸p dông víi c¸c gen tõ c¸c loµi kh¸c. Ngoµi
ra, mét sè h·ng (nh− Stratagene, Mü) ®· thiÕt 3 lo¹i protein liªn kÕt trong phøc hÖ
lËp hÖ thèng lai hai dßng dïng vi khuÈn E.
coli. Trong m« h×nh ë E. coli, hai gen chØ thÞ Protein ®−îc ®¸nh dÊu bëi FLAG
®−îc dïng lµ bla (kh¸ng ampicillin) vµ lacZ.
H×nh 11.22. Ph−¬ng ph¸p ®ång kÕt tña miÔn dÞch.
11.3.6.2. Ph−¬ng ph¸p ®ång kÕt tña miÔn dÞch
ë ®éng vËt cã vó, sù t−¬ng t¸c gi÷a c¸c protein cã thÓ x¸c ®Þnh ®−îc b»ng ph−¬ng
ph¸p ®ång kÕt tña miÔn dÞch (h×nh 11.22). Gen m· hãa cho protein ®−îc biÕn n¹p vµ
biÓu hiÖn trong tÕ bµo ®éng vËt; sau ®ã, ph©n lËp lo¹i protein ®−îc quan t©m nghiªn cøu
võa tæng hîp tõ tÕ bµo chÊt nhê kh¸ng thÓ. Trong tr−êng hîp ch−a cã kh¸ng thÓ t−¬ng
øng, th× protein ®−îc “g¾n” víi mét peptide ®¸nh dÊu, gäi lµ FLAG. Sau ®ã, kh¸ng thÓ
t−¬ng øng víi FLAG ®−îc dïng ®Ó ph©n lËp protein cÇn nghiªn cøu. Th−êng th× viÖc
ph©n lËp protein dùa trªn nguyªn t¾c “kh¸ng nguyªn - kh¸ng thÓ” ®−îc thùc hiÖn trong
®iÒu kiÖn in-vitro gièng víi ®iÒu kiÖn in-vivo. V× vËy, sau khi ph©n lËp, protein nghiªn
cøu ngoµi liªn kÕt víi kh¸ng thÓ cßn ®ång thêi ë d¹ng phøc hÖ víi c¸c protein kh¸c. Phøc
hÖ protein nµy sau ®ã ®−îc ph©n t¸ch bëi ®iÖn di SDS-PAGE nh»m x¸c ®Þnh xem cã bao
nhiªu protein thµnh phÇn tham gia vµo phøc hÖ. ViÖc x¸c ®Þnh protein thµnh phÇn cã thÓ
thùc hiÖn b»ng ph−¬ng ph¸p khèi phæ hoÆc gi¶i tr×nh tù protein.

353
§inh §oµn Long

Ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®ång kÕt tña Th− viÖn protein
miÔn dÞch ®Ó kiÓm tra mèi t−¬ng t¸c protein – protein HHHHHH ®¸nh dÊu bëi His6
trong hÖ thèng lai hai dßng. Tr−íc tiªn, mçi lo¹i
HHHHHH
protein ®−îc quan t©m nghiªn cøu sÏ ®−îc “g¾n” t−¬ng HHHHHH
øng víi c¸c peptide ®¸nh dÊu lµ FLAG vµ His6. Hai
HHHHHH
cÊu tróc ADN m· hãa t−¬ng øng cho c¸c protein “dung HHHHHH
hîp” nµy ®−îc “®ång biÕn n¹p” vµo tÕ bµo ®éng vËt. His6 HHHHHH
Sau ®ã, lÇn l−ît mçi lo¹i kh¸ng thÓ t−¬ng øng víi tõng
peptide ®¸nh dÊu ®−îc dïng ®Ó ph©n lËp phøc hÖ
protein; phøc hÖ nµy sau ®ã ®−îc tiÕn hµnh ®iÖn di
+
SDS-PAGE. Gel ®iÖn di sau ®ã ®−îc chuyÓn lªn mµng
nitrocellulose vµ ®−îc lai víi “mÉu dß” kh¸ng thÓ
t−¬ng øng víi His6 (anti-His6) vµ FLAG (anti-FLAG).
NÕu hai lo¹i protein t−¬ng t¸c víi nhau, chóng xuÊt
Lam kÝnh
hiÖn trªn c¶ hai b¶n gel trong lai Western. g¾n ion Niken

11.3.6.3. Vi d·y protein (protein microarray)


Protein liªn kÕt víi
C¸c ph−¬ng ph¸p nghiªn cøu protein tr−íc ®©y Ni qua His6
th−êng ph©n tÝch tõng lo¹i protein riªng lÎ. Cïng víi
nh÷ng tiÕn bé gÇn ®©y trong gi¶i tr×nh tù hÖ gen, còng
cã nhiÒu ph−¬ng ph¸p ®−îc c¶i tiÕn cho phÐp ph©n
tÝch ®ång thêi nhiÒu protein. Trong ®ã, cã c¸c ph−¬ng
ph¸p vi d·y protein.
C¸c ph−¬ng ph¸p vi d·y protein ®−îc dïng phæ
biÕn trong c¸c nghiªn cøu hãa sinh vµ x¸c ®Þnh ho¹t
®é enzym; ®ång thêi ®Ó x¸c ®Þnh sù t−¬ng t¸c gi÷a c¸c
protein víi nhau. §Õn nay, phÇn lín qui tr×nh vi d·y
protein dùa trªn m« h×nh ë nÊm men S. cerevisiae.
H×nh 11.23. Kü thuËt g¾n protein lªn
§Ó nghiªn cøu t−¬ng t¸c cña hÖ protein nÊm lam kÝnh trong vi dny protein.
men (gåm kho¶ng 6000 protein), 90% sè gen m· hãa
protein tõ ng©n hµng hÖ gen ®· ®−îc t¸i tæ hîp víi ®o¹n ADN m· hãa peptide ®¸nh dÊu
His6. §o¹n peptide ®¸nh dÊu nµy cho phÐp protein "g¾n lªn" chÊt nÒn qua liªn kÕt gi÷a
His vµ Ni (h×nh 11.23). T−¬ng t¸c protein cã thÓ ph©n tÝch gi÷a tõng cÆp protein riªng
biÖt, hoÆc ®−îc "sµng läc" víi hçn hîp toµn bé hÖ protein; sau ®ã ph©n thµnh c¸c nhãm
nhá ®Ó tiÕp tôc ph©n tÝch nÕu kÕt qu¶ t−¬ng t¸c lµ d−¬ng tÝnh.
C¸c thÝ nghiÖm ph©n tÝch chøc n¨ng ®−îc thiÕt kÕ sao cho viÖc ph©n tÝch c¸c d·y
ph¶n øng thuËn tiÖn nhÊt (th−êng dïng c¸c chÊt ph¸t quang, ®«i khi dïng ®ång vÞ phãng
x¹).VÝ dô: ®Ó t×m c¸c protein nÊm men ®Ýnh kÕt víi calmodulin (mét protein liªn kÕt
Ca2+) hay phospholipid (thµnh phÇn mµng tÕ bµo), ng−êi ta sö dông vi d·y protein ®¸nh
®Êu b»ng His6 ®Ýnh kÕt lªn lam kÝnh g¾n Ni. C¶ calmodulin vµ phospholipide ®Òu ®−îc
®¸nh dÊu b»ng biotin. C¸c protein t−¬ng t¸c calmodulin vµ phospholipide ®−îc nhËn diÖn
nhê streptavidin mang chÊt ph¸t quang Cy3 (h×nh 11.24). B»ng ph−¬ng ph¸p nµy, mét
phßng thÝ nghiÖm t¹i §¹i häc Yale (Mü) trong mét thÝ nghiÖm vi d·y protein ®· t×m ®−îc
139 protein liªn kÕt calmodulin vµ 150 protein liªn kÕt phospholipid tõ nÊm men.

11.3.7. VÒ hÖ protein häc (proteomics) vµ hÖ chuyÓn hãa häc (metabolomics)


ViÖc ph¸t triÓn cña c¸c kü thuËt gi¶i tr×nh tù ADN, kÕt hîp víi t¸ch chiÕt, tinh s¹ch
vµ gi¶i tr×nh tù protein ®· më ®−êng cho sù ra ®êi mét chuyªn ngµnh míi gäi lµ hÖ
protein häc (proteomics). HÖ protein häc nghiªn cøu vÒ toµn bé c¸c protein ®−îc mét

354
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen

m«, tÕ bµo hoÆc c¬ thÓ t¹o ra trong ®iÒu kiÖn nhÊt ®Þnh, ®ång thêi x¸c ®Þnh møc ®é phæ
biÕn cña mçi lo¹i protein vµ sù t−¬ng t¸c cña chóng víi nhau vµ víi c¸c ph©n tö kh¸c
(nh− ADN hay ARN). NÕu nh− c¸c kü thuËt vi d·y ADN cã thÓ gióp x¸c ®Þnh ®−îc sù
biÓu hiÖn cña c¸c gen trªn cë së ph©n tÝch hÖ gen, th× c¸c kü thuËt proteomics cho phÐp
x¸c ®Þnh ®−îc bøc tranh tæng thÓ vÒ toµn bé protein cña mçi tÕ bµo, m« hoÆc c¬ thÓ.
Proteomics dùa trªn ba ph−¬ng ph¸p chÝnh, bao gåm: (1) 2D-PAGE ®Ó ph©n t¸ch
c¸c protein, (2) MS ®Ó x¸c ®Þnh khèi l−îng ph©n tö vµ tr×nh tù axit amin, (3) tin sinh häc
®Ó so s¸nh gi÷a c¸c ph©n tö protein vµ c¸c ®o¹n peptide víi c¸c tr×nh tù m· hãa chóng
trong hÖ gen. Trong thùc tÕ, c¸c nghiªn cøu hÖ gen häc (genomics) vµ hÖ protein häc
(proteomics) th−êng ®−îc phèi hîp víi nhau trong c¸c nghiªn cøu di truyÒn häc ph©n tö
hiÖn ®¹i.
Bªn c¹nh hÖ gen häc vµ hÖ protein häc, gÇn ®©y mét lÜnh vùc nghiªn cøu míi còng
th−êng ®−îc phèi hîp víi hai chuyªn ngµnh nªu trªn ®−îc gäi lµ hÖ chuyÓn hãa häc
hay hÖ trao ®æi chÊt häc (metabolomics). HÖ chuyÓn hãa häc nghiªn cøu toµn bé c¸c
chÊt chuyÓn hãa ®−îc tÝch lòy trong mét m«, tÕ bµo hoÆc c¬ thÓ ë nh÷ng ®iÒu kiÖn nhÊt
®Þnh. HÇu hÕt c¸c chÊt chuyÓn hãa hiÖn nay ®Òu cã thÓ x¸c ®Þnh ®−îc b»ng ph−¬ng ph¸p
khèi phæ (MS), hoÆc ®«i khi b»ng ph−¬ng ph¸p céng
h−ëng tõ h¹t nh©n (NMR). Ph−¬ng ph¸p MS cã ®é nh¹y
C¸c protein ®−îc sµng läc cao vµ cã thÓ dïng ph©n tÝch nhiÒu nhãm ph©n tö kh¸c
nhau. 12C cã khèi l−îng ®óng 12 Da. Trong khi ®ã, khèi
His6 l−îng cña c¸c nguyªn tö kh¸c, nh− 14N hay 16O, kh«ng
ph¶i lµ mét sè nguyªn. C¸c ph−¬ng ph¸p MS sö dông ®é
Ni Ni Ni Ni Ni Ni
ph©n gi¶i khèi l−îng cùc cao, gäi lµ EHMR, cã thÓ gióp
Lam x¸c ®Þnh chÝnh x¸c c«ng thøc ph©n tö cña hÇu hÕt mäi
ñ víi phospholipid ®−îc kÝnh
®¸nh dÊu b»ng Biotin chÊt chuyÓn hãa trong tÕ bµo sinh vËt, kÓ c¶ c¸c ®ång
ph©n (cã c«ng thøc ph©n tö gièng nhau).
Biotin
Phospholipid C¸c ph©n tÝch hÖ chuyÓn hãa ®Æc biÖt h÷u Ých
trong nghiªn cøu c¸c chÊt sinh häc thø cÊp (nh− c¸c chÊt
t¹o mµu, t¹o mïi, c¸c alkaloid, saponin, v.v…) vèn ®Æc
Ni Ni Ni Ni Ni Ni thï ë thùc vËt. VÝ dô, khi sö dông c¶ hai dÞch chiÕt n−íc
vµ h÷u c¬ tõ qu¶ d©u t©y, ng−êi ta ®· x¸c ®Þnh ®−îc
Bæ sung avidin g¾n víi kho¶ng 7000 chÊt chuyÓn hãa kh¸c nhau. NÕu in ra th×
chÊt ph¸t quang Cy3 phæ EHMR cã thÓ dµi vµi ba km. ViÖc so s¸nh hÖ chuyÓn
hãa gi÷a mét d¹ng ®ét biÕn qu¶ tr¾ng víi d¹ng kiÓu d¹i
ChÊt ph¸t quang qu¶ ®á ®· trùc tiÕp cho thÊy sù kh¸c nhau vÒ hµm l−îng
Avidin Avidin
mét sè chÊt chuyÓn hãa trung gian trong con ®−êng tæng
hîp c¸c chÊt t¹o mµu (s¾c tè) nãi chung vµ s¾c tè ®á nãi
riªng (h×nh 11.25).

Ni Ni Ni Ni Ni Ni Qu¶ tr¾ng

Qu¶ ®á

X
Y
H×nh 11.24. Sµng läc protein b»ng
ph−¬ng ph¸p vi dny sö dông H×nh 11.25. Phæ MS cho biÕt thµnh phÇn c¸c chÊt chuyÓn hãa kh¸c
Biotin / Streptavidin. nhau gi÷a d¹ng kiÓu d¹i (qu¶ ®á) vµ ®ét biÕn (qu¶ tr¾ng) ë d©u t©y.

355

You might also like