Professional Documents
Culture Documents
Chương11 CONGNGHEGEN
Chương11 CONGNGHEGEN
Chương11 CONGNGHEGEN
323
§inh §oµn Long
324
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
chÊt nh− hydrat carbon vµ protein cã thÓ cïng kÕt tña víi ADN vµ ARN. ThÕ nªn, b−íc
kÕt tña b»ng alcohol th−êng chØ ®−îc thùc hiÖn sau khi c¸c thµnh phÇn kh¸c cña tÕ bµo
®· ®−îc lo¹i bá khái dÞch chiÕt nhê ly t©m vµ/hoÆc chiÕt xuÊt bëi phenol.
Hçn hîp ADN vµ ARN sau khi ®−îc xö lý b»ng ribonuclease råi bæ sung etanol ®−îc
ly t©m ®Ó thu kÕt tña ADN, cßn ARN ë d¹ng hßa tan trong dÞch chiÕt ®−îc hót ra vµ lo¹i
bá. H¹t ADN kÕt tña ë ®¸y èng ly t©m ®«i khi rÊt nhá (thËm chÝ kh«ng nh×n thÊy b»ng
m¾t th−êng), nh−ng ®· chøa hµng triÖu ph©n tö ADN vµ th−êng lµ ®ñ cho c¸c nghiªn
cøu tiÕp theo. ADN lóc nµy cã møc ®é tinh s¹ch cao, ®−îc hßa tan trë l¹i trong dung dÞch
®Öm n−íc vµ cã thÓ sö dông cho c¸c thÝ nghiÖm ph©n tÝch ADN sau ®ã.
325
§inh §oµn Long
®−îc nhê sö dông thuèc nhuém ph¸t huúnh quang, nh− ethidium bromide (EtBr, xem c¬
chÕ ë ch−¬ng 3). Mçi b¨ng ®iÖn di th−êng ph¶n ¸nh mét tËp hîp c¸c ph©n tö ADN cã
cïng kÝch th−íc.
Cã hai lo¹i gel ®iÖn di ®−îc dïng phæ biÕn lµ agarose vµ polyacrylamide. Trong
®ã, gel polyacrylamide cã ®é ph©n gi¶i cao, nh−ng vïng kÝch th−íc ADN cã thÓ ph©n tÝch
hÑp. Cô thÓ, ph−¬ng ph¸p nµy cã thÓ ph©n t¸ch c¸c ®o¹n ADN kh¸c nhau thËm chÝ chØ
mét cÆp nucleotide (1 bp), nh−ng th−êng chØ dïng ®Ó ph©n tÝch c¸c ®o¹n ADN kÝch th−íc
nhá (tõ 5 ®Õn 1000 bp). Trong khi ®ã, gel agarose cã ®é ph©n gi¶i thÊp ®èi víi c¸c ®o¹n
ADN kÝch th−íc nhá, nh−ng rÊt hiÖu qu¶ khi ph©n t¸ch c¸c ®o¹n ADN kÝch th−íc lín
(kho¶ng tõ 200 bp ®Õn 20 kb; 1 kb = 1000 bp).
C¸c ®o¹n ADN kÝch th−íc lín kh«ng thÓ “lät” qua c¸c lç nhá trªn c¸c b¶n gel, kÓ c¶
gel agarose. Thay vµo ®ã, chóng (th−êng ë d¹ng m¹ch th¼ng) “tr−ên” qua m¹ng l−íi gel
b»ng c¸ch ®Çu nµy cña ph©n tö ®i tr−íc, cßn ®Çu kia theo sau. HËu qu¶ lµ c¸c ®o¹n ADN
lín (tõ 10 kb ®Õn 10 Mb; 1 Mb = 1000 kb) cã tèc ®é dÞch chuyÓn trªn tr−êng ®iÖn di gÇn
t−¬ng ®−¬ng vµ khã ph©n t¸ch nhê ®iÖn di th«ng th−êng. §èi víi c¸c ®o¹n ADN lín nh−
vËy, ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®iÖn di xung tr−êng (PFGE, pulsed-field gel
electrophoresis). Trong ph−¬ng ph¸p nµy, 2 cÆp ®iÖn cùc ®−îc ®Æt chÐo gãc trªn b¶n ®iÖn
di (h×nh 11.2). ViÖc “bËt” vµ “t¾t” lu©n phiªn 2 cÆp ®iÖn cùc lµm c¸c ®o¹n ADN lín thay
®æi chiÒu dÞch chuyÓn nh− m×nh häa trªn h×nh. C¸c ®o¹n ADN cã kÝch th−íc cµng lín
cµng chËm h¬n trong qu¸ tr×nh ®æi chiÒu dÞch chuyÓn. Nhê vËy, c¸c ®o¹n kÝch th−íc kh¸c
nhau sÏ t¸ch khái nhau. Kü thuËt PFGE trong thùc tÕ cã thÓ dïng ®Ó x¸c ®Þnh trùc tiÕp
kÝch th−íc cña nhiÔm s¾c thÓ (NST) vi khuÈn, hoÆc NST sinh vËt nh©n thËt bËc thÊp,
nh− nÊm men hoÆc mét sè nguyªn sinh ®éng vËt. KÝch th−íc hÖ gen cña nh÷ng loµi nµy
kho¶ng vµi Mb.
§èi víi c¸c ®o¹n ADN kÝch th−íc nhá chØ kh¸c nhau mét vµi bp, vÝ dô nh− c¸c s¶n
phÈm PCR cña c¸c alen thuéc cïng locut, ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®iÖn di
biÕn tÝnh gradient (DGGE). Trong kü thuËt DGGE, c¸c ph©n tö ADN sîi kÐp ®−îc g©y
biÕn tÝnh bëi nhiÖt hoÆc hãa chÊt, nh− urª hay formamide (®«i khi phèi hîp c¶ hai
ph−¬ng ph¸p) ®ång thêi víi qu¸ tr×nh diÖn di. NhiÖt ®é th−êng ®−îc duy tr× cao (50 –
§iÖn cùc 0% Gradient biÕn tÝnh 70% C¸c giÕng tra mÉu
ADN
kiÓu d¹i
H×nh 11.2. Kü thuËt ®iÖn di xung tr−êng. H×nh 11.3 C¸c kü thuËt ®iÖn di biÕn tÝnh gradient DGGE
A vµ B lµ hai bé ®iÖn cùc. Chóng ®−îc bËt vµ t¾t (Denaturing gradient gel electrophoresis). Trong DGGE vu«ng gãc,
lu©n phiªn. Khi bËt A, ph©n tö ADN di chuyÓn vÒ hçn hîp 3 ®o¹n ADN (kiÓu d¹i, ®ét biÕn 1 vµ 2) ®−îc tra vµo mét
gãc ph¶i phÝa d−íi. Khi A t¾t vµ B bËt, ph©n tö giÕng dµi n»m ngang b¶n gel. Do t¸c ®éng cña chÊt g©y biÕn tÝnh ë
ADN di chuyÓn vÒ gãc tr¸i phÝa d−íi. Mòi tªn m« nång ®é kh¸c nhau, sù ®Þnh vÞ cña c¸c ®o¹n ADN t¹o nªn d¹ng
t¶ h−íng di chuyÓn cña ph©n tö ADN trong ®iÖn ®−êng cong sigma. §iÖn di DGGE song song t¹o nªn phæ ®iÖn di
di xung tr−êng. gièng ®iÖn di trªn gel th«ng th−êng.
326
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
65oC) vµ æn ®Þnh, trong khi nång ®é urª vµ formamide ®−îc t¨ng dÇn theo chiÒu song
song (DGGE song song) hoÆc vu«ng gãc (DGGE vu«ng gãc) víi chiÒu ®iÖn di. Trong
DGGE song song, kÕt qu¶ ®iÖn di h×nh thµnh c¸c b¨ng t¸ch biÖt gièng ®iÖn di trªn gel
agarose. Trong DGGE vu«ng gãc, hçn hîp c¸c ph©n tö ADN chØ kh¸c biÖt nhau mét hoÆc
mét vµi bp ph©n t¸n kh¾p b¶n gel vµ t¹o nªn mét chuçi b¨ng d¹ng ®−êng cong sigma
(h×nh 11.3).
§iÖn di kh«ng nh÷ng cã thÓ ph©n t¸ch c¸c ®o¹n ADN kh¸c nhau vÒ kÝch th−íc mµ
c¶ vÒ h×nh d¹ng vµ cÊu h×nh cña chóng. C¸c ph©n tö ADN ë d¹ng m¹ch vßng duçi xo¾n
hoÆc bÞ “®øt g·y” ë mét sè nucleotide di chuyÓn chËm h¬n trªn tr−êng ®iÖn di so víi c¸c
ph©n tö ADN ë d¹ng m¹ch th¼ng cã cïng khèi l−îng. Trong khi ®ã, c¸c ph©n tö ADN ë
d¹ng siªu xo¾n (kÝch th−íc thu nhá) th−êng di chuyÓn nhanh h¬n trªn tr−êng ®iÖn di so
víi c¸c ph©n tö ADN d¹ng m¹ch vßng duçi xo¾n hoÆc cã møc ®é cuén xo¾n thÊp h¬n cã
cïng khèi l−îng.
Kü thuËt ®iÖn di còng ®−îc dïng ®Ó ph©n t¸ch ARN. Gièng ADN, c¸c ph©n tö ARN
còng tÝch ®iÖn ©m. Tuy nhiªn, nÕu nh− c¸c ®o¹n ADN sîi kÐp th¼ng th−êng cã cÊu tróc
bËc hai ®ång nhÊt (nªn tèc ®é dÞch chuyÓn trªn tr−êng ®iÖn di t−¬ng quan víi khèi l−îng
cña chóng), th× ARN ngoµi cÊu tróc m¹ch ®¬n, cßn cã c¸c cÊu tróc bËc 2 vµ 3 ¶nh h−ëng
®Õn tèc ®é dÞch chuyÓn cña chóng trªn tr−êng ®iÖn di. §Ó h¹n chÕ ®iÒu nµy, ng−êi ta
th−êng xö lý ARN víi mét sè hãa chÊt ph¸ vì liªn kÕt côc bé trong ph©n tö, nh− glyoxal.
Hîp chÊt nµy liªn kÕt vµo nhãm -NH2 cña c¸c baz¬ nit¬ vµ ng¨n c¶n sù kÕt cÆp gi÷a
chóng. C¸c ARN ®−îc xö lý glyoxal kh«ng h×nh thµnh c¸c cÊu tróc bËc cao, nªn tèc ®é di
chuyÓn trªn tr−êng ®iÖn di phô thuéc chñ yÕu vµo khèi l−îng ph©n tö cña chóng. ë phÇn
sau cña ch−¬ng nµy, chóng ta sÏ thÊy kü thuËt ®iÖn di còng ®−îc dïng phæ biÕn trong
ph©n tÝch protein.
327
§inh §oµn Long
®Þnh lµ 1/4, v× vËy x¸c suÊt ®Ó cã mét tr×nh tù nhÊt ®Þnh gåm 6 bp sÏ lµ 1/46 = 1/4096).
Nãi c¸ch kh¸c, kÝch th−íc trung b×nh cña c¸c ®o¹n ADN ®−îc c¾t bëi EcoRI lµ 4096 bp.
Gi¶ sö mét ph©n tö ADN m¹ch th¼ng cã 6 vÞ trÝ c¾t cña EcoRI, th× ph©n tö nµy sau khi
®−îc xö lý víi enzym sÏ cho 7 ph©n ®o¹n ADN kh¸c nhau. Trªn tr−êng ®iÖn di, s¶n phÈm
c¾t gåm 7 ph©n ®o¹n ADN nµy sÏ ph©n t¸ch nhau ra do kh¸c nhau vÒ khèi l−îng.
ViÖc sö dông mét enzym giíi h¹n kh¸c, ch¼ng h¹n HindIII còng cã tr×nh tù giíi h¹n
gåm 6 bp, nh−ng cã tr×nh tù giíi h¹n thay ®æi (5’-A↓AGCTT-3’) sÏ cho ra c¸c s¶n phÈm
c¾t kh¸c víi khi sö dông EcoRI. Víi mét sè enzym giíi h¹n kh¸c, ch¼ng h¹n nh− Sau3AI
(t×m thÊy ë vi khuÈn Staphylococcus aureus) cã tr×nh tù giíi h¹n ng¾n h¬n (5’-GA↓TC-
3’), nªn tÇn sè c¾t cña chóng th−êng cao h¬n c¸c enzym cã tr×nh tù giíi h¹n dµi. Theo x¸c
suÊt, c¸c ®o¹n ADN sîi kÐp ®−îc Sau3AI c¾t cã kÝch th−íc trung b×nh kho¶ng 250 bp
(1/44 = 1/256). Ng−îc l¹i, enzym NotI cã tr×nh tù giíi h¹n dµi (5’-GC↓GGCCGC-3’) t¹o ra
c¸c ®o¹n c¾t trung b×nh dµi 65 kb (1/48 = 1/65.536). Nh− vËy, viÖc sö dông ®ång thêi
nhiÒu enzym giíi h¹n sÏ t¹o ra mét phæ c¸c kiÓu h×nh ®iÖn di ®Æc thï ®èi víi mçi gen
®−îc ph©n tÝch.
C¸c enzym giíi h¹n kh«ng chØ kh¸c nhau vÒ tr×nh tù giíi h¹n vµ ®é dµi ®o¹n tr×nh
tù giíi h¹n ®Æc tr−ng cña chóng, mµ cßn kh¸c nhau vÒ c¸ch “c¾t” ph©n tö ADN. Ch¼ng
h¹n nh− Sau3AI nªu trªn t¹o ra c¸c ph©n tö ADN d¹ng ®Çu b»ng (®Çu tï), cßn c¸c
enzym EcoRI, HindIII vµ NotI c¾t ph©n tö ADN t¹o ra c¸c ph©n ®o¹n cã ®Çu dÝnh. Së dÜ
gäi lµ “®Çu dÝnh” v× hai ®Çu ph©n tö ADN sau khi ®−îc enzym c¾t cã tr×nh tù bæ sung víi
nhau theo nguyªn t¾c Chargaff; v× vËy, chóng cã xu h−íng “dÝnh” l¹i víi nhau, hoÆc
“dÝnh” víi c¸c ph©n tö ADN kh¸c ®−îc c¾t bëi cïng enzym giíi h¹n. TÝnh chÊt nµy ®−îc
dïng trong nh©n dßng ph©n tö vµ ADN t¸i tæ hîp. Mét sè enzym giíi h¹n kh¸c c¾t ®Æc
hiÖu ADN m¹ch ®¬n.
328
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
phãng x¹. Trong ph−¬ng ph¸p nµy, chØ cÇn 25% nucleotide cña mÉu dß ADN ®−îc ®¸nh
dÊu lµ ®ñ ®Ó ph©n tÝch.
C¸c mÉu dß ADN ®−îc ®¸nh dÊu b»ng chÊt ph¸t quang cã thÓ ph¸t hiÖn d−íi nguån
s¸ng UV, cßn c¸c mÉu dß ®¸nh dÊu phãng x¹ ®−îc ph¸t hiÖn b»ng ph−¬ng ph¸p phãng x¹
tù chôp nhê phim tia X, hoÆc ®o b»ng m¸y khuÕch ®¹i tÝn hiÖu h¹t β víi hai ®ång vÞ
phãng x¹ ®−îc dïng phæ biÕn lµ 32P vµ 35S. Cã nhiÒu c¸ch ®Ó x¸c ®Þnh c¸c ph©n ®o¹n ADN
vµ ARN ®Æc hiÖu dùa trªn lai ph©n tö. D−íi ®©y, chóng ta chØ ®Ò cËp ®Õn hai ph−¬ng
ph¸p phæ biÕn.
11.2.5.1. X¸c ®Þnh c¸c ®o¹n ADN b»ng ®iÖn di vµ mÉu dß - lai Southern
Sö dông mÉu dß kÕt hîp víi ®iÖn di lµ ph−¬ng ph¸p c¬ b¶n ®ång thêi cã thÓ gióp
x¸c ®Þnh møc ®é phæ biÕn vµ kÝch th−íc cña mét ®o¹n ADN hoÆc ARN ®−îc quan t©m
nghiªn cøu. VÝ dô: b»ng ph−¬ng ph¸p nµy, ng−êi ta cã thÓ x¸c ®Þnh vµ so s¸nh ®−îc møc
biÓu hiÖn cña mét gen ë c¸c lo¹i m« vµ tÕ bµo qua viÖc x¸c ®Þnh sè l−îng b¶n phiªn m·
mARN t−¬ng øng cña gen cã t¹i mçi lo¹i m« vµ tÕ bµo t−¬ng øng.
Gi¶ sö chóng ta c¾t hÖ gen cña nÊm men b»ng EcoRI vµ cÇn x¸c ®Þnh kÝch th−íc
cña ®o¹n ADN mang tr×nh tù gen A. ADN tæng sè sau khi ®−îc c¾t b»ng EcoRI sÏ t¹o nªn
mét hçn hîp c¸c ph©n ®o¹n cã kÝch th−íc trung b×nh 4 kb (v× 46 = 4.096 bp). V× vËy, nÕu
®em s¶n phÈm c¾t giíi h¹n nhuém víi EtBr, th× s¶n phÈm ®iÖn di sÏ lµ mét d¶i c¸c ®o¹n
liªn tôc cã kÝch th−íc quanh vïng 4 kb vµ kh«ng thÓ x¸c ®Þnh ®−îc chÝnh x¸c ph©n ®o¹n
nµo mang gen A. Trong tr−êng hîp nµy, kü thuËt lai Southern (cßn gäi lµ thÈm t¸ch
Southern) cã thÓ ®−îc dïng ®Ó x¸c ®Þnh ®o¹n ADN mang gen ®ã (h×nh 11.4). Ng−êi ta
mang gel ®iÖn di chøa c¸c s¶n phÈm c¾t ng©m vµo dung dÞch kiÒm nhÑ ®Ó lµm biÕn tÝnh
ADN. Råi c¸c ®o¹n ADN ®−îc chuyÓn sang mét mµng tÝch ®iÖn d−¬ng gäi lµ mµng lai
theo kiÓu “®ãng dÊu”. NghÜa lµ c¸c ®o¹n ADN ®Þnh vÞ trªn mµng lai sÏ t−¬ng øng víi c¸c
®o¹n ADN trªn gel ®iÖn di. Mµng lai sau ®ã ®−îc ñ víi mÉu dß cã tr×nh tù ADN bæ sung
víi tr×nh tù cña gen A. Qu¸ tr×nh ñ ®−îc tiÕn hµnh trong ®iÒu kiÖn nhiÖt ®é vµ nång ®é
muèi phï hîp cho sù håi tÝnh cña axit nucleic. Trong ®iÒu kiÖn ®ã, c¸c mÉu dß sÏ chØ t¹o
liªn kÕt ®Æc hiÖu víi ph©n ®o¹n ADN mang gen A. Do c¸c ®o¹n gen th−êng cã kÝch th−íc
lín h¬n nhiÒu so víi mÉu dß, nªn kh¶ n¨ng håi tÝnh cña c¸c ®o¹n gen sÏ khã x¶y ra h¬n
so víi “ph¶n øng”
lai gi÷a mÉu dß víi a) C¸c b−íc trong ph−¬ng ph¸p lai Southern
gen. C¸c ®o¹n ADN C¸c mÉu dß ADN ®−îc ®¸nh
dÊu phãng x¹ hoÆc ph¸t quang VÞ trÝ ®o¹n ADN
mang tr×nh tù gen lai víi mÉu dß
cÇn nghiªn cøu sau ADN C¸c ®o¹n ADN
®ã ®−îc ph¸t hiÖn
vµ ph©n lËp nhê c¸c
C¾t b»ng §iÖn di
ph−¬ng ph¸p ph¸t enzym giíi h¹n Lai vµ röa
hiÖn mÉu dß ®· nªu mÉu dß
ë trªn. thõa
Mét ph−¬ng
BiÕn tÝnh ADN vµ
ph¸p c¶i tiÕn cña lai chuyÓn lªn mµng lai
Southern ®−îc dïng
®Ó x¸c ®Þnh vïng b) B−íc chuyÓn ADN tõ gel ®iÖn di sang mµng lai
Qu¶ nÆng
m· hãa (exon) cña
gen ®−îc gäi lµ
ph−¬ng ph¸p lai
Zoo. Ph−¬ng ph¸p Dung dÞch ®Öm Mµng lai
GiÊy läc
Gel
lai nµy dùa trªn H×nh 11.4. Ph−¬ng ph¸p
hiÖn t−îng lµ trong lai (thÈm t¸ch) Southern.
329
§inh §oµn Long
qu¸ tr×nh tiÕn hãa, c¸c tr×nh tù nucleotide trong c¸c vïng kh«ng m· hãa th−êng biÕn ®æi
nhanh h¬n so víi c¸c vïng m· hãa ë cïng mét gen, khi so s¸nh gi÷a c¸c loµi cã quan hÖ
gÇn gòi. Ch¼ng h¹n, ë mét nghiªn cøu, ng−êi ta t¸ch chiÕt ADN tõ mét nhãm c¸c loµi
kh¸c nhau gåm ng−êi, v−în, khØ, chuét, bß, v.v... ADN cña mçi loµi sau ®ã ®−îc c¾t bëi
cïng enzym giíi h¹n phï hîp; råi c¸c ®o¹n c¾t ®−îc ph©n t¸ch trªn ®iÖn di vµ chuyÓn lªn
mµng lai. C¸c ®o¹n ADN nµy sau ®ã ®−îc lai víi mÉu dß cã nguån gèc ng−êi ®−îc “gi¶
thiÕt” lµ tr×nh tù m· hãa. NÕu ®ã thùc sù lµ tr×nh tù m· hãa th× ph¶n øng lai sÏ x¶y ra
víi tÊt c¶ hoÆc hÇu hÕt c¸c mÉu ADN; nÕu kh«ng, nhiÒu kh¶ n¨ng tr×nh tù t−¬ng øng víi
mÉu dß kh«ng ph¶i lµ tr×nh tù m· hãa.
11.2.5.2. X¸c ®Þnh c¸c ®o¹n ARN b»ng ®iÖn di vµ mÉu dß - lai Northern
Víi cïng nguyªn t¾c, mét ph−¬ng ph¸p lai ®−îc dïng ®Ó ph©n tÝch s¶n phÈm phiªn
m· mARN ®−îc gäi lµ ph−¬ng ph¸p lai Northern (hay thÈm t¸ch Northern). Tuy
nhiªn, v× mARN th−êng ng¾n h¬n nhiÒu so víi ADN, nªn trong lai Northern, kh«ng cÇn
c¾t mARN. Hçn hîp mARN sau khi ph©n t¸ch b»ng ®iÖn di ®−îc chuyÓn lªn mµng lai víi
mÉu dß ADN t−¬ng øng víi ®o¹n mARN ®−îc t×m kiÕm. S¶n phÈm lai ë ®©y lµ
ARN/ADN.
Trong thùc tiÔn, lai Northern th−êng ®−îc dïng ®Ó ®Þnh l−îng mét lo¹i ph©n tö
mARN nµo ®ã cã trong mÉu ph©n tÝch h¬n lµ ®Ó x¸c ®Þnh kÝch th−íc cña nã. §Ó ®Þnh
l−îng mARN, mÉu dß th−êng ®−îc ®−a vµo ph¶n øng lai víi mét l−îng d− võa ®ñ nh»m
®¶m b¶o l−îng ph©n tö lai t¹o thµnh tØ lÖ thuËn víi l−îng mARN. L−îng mARN cã trong
m« ®−îc coi lµ th«ng sè ph¶n ¸nh møc ®é biÓu hiÖn cña gen t−¬ng øng. Ch¼ng h¹n, b»ng
lai Northern, c¸c nhµ nghiªn cøu cã thÓ ®¸nh gi¸ ®−îc ¶nh h−ëng cña mét yÕu tè phiªn
m· tíi sù biÓu hiÖn cña gen nhÊt ®Þnh khi so s¸nh l−îng mARN do gen ®ã m· hãa cã
trong c¸c m« ®−îc xö lý vµ kh«ng ®−îc xö lý víi yÕu tè phiªn m·. T−¬ng tù nh− vËy, kü
thuËt nµy cho phÐp so s¸nh møc ®é biÓu hiÖn cña gen ë c¸c giai ®o¹n ph¸t triÓn kh¸c
nhau cña c¬ thÓ.
330
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
331
§inh §oµn Long
sung ng¾n ë hai ®Çu, v× nhiÖt ®é cao cã thÓ g©y biÕn tÝnh ®o¹n nµy vµ dÉn ®Õn hiÖn t−îng
"d−¬ng tÝnh gi¶".
332
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
C¸c vect¬ plasmid ®Çu tiªn chØ cã mét vÞ trÝ giíi h¹n duy nhÊt. Nh−ng cïng víi thêi
gian, cÊu tróc cña c¸c vect¬ plasmid ®−îc c¶i tiÕn theo h−íng bá bít c¸c tr×nh tù kh«ng
cÇn thiÕt vµ g¾n thªm ®o¹n tr×nh tù cã thÓ ®−îc c¾t b»ng nhiÒu enzym giíi h¹n kh¸c
nhau. Tr×nh tù mang nhiÒu vÞ trÝ giíi h¹n nh− vËy ®−îc gäi lµ tr×nh tù ®a nh©n dßng
(polycloning site). Cã nh÷ng tr×nh tù ®a nh©n dßng ®−îc thiÕt kÕ chØ dµi vµi tr¨m bp,
nh−ng cã trªn 20 vÞ trÝ giíi h¹n kh¸c nhau. Nhê ®Æc ®iÓm nµy, mét vect¬ cã thÓ ®−îc
dïng ®Ó nh©n dßng nhiÒu ®o¹n ADN kh¸c nhau. Dùa trªn nguyªn t¾c t−¬ng tù, ngoµi
vect¬ plasmid, ng−êi ta ®· ph¸t triÓn ®−îc c¸c lo¹i vect¬ kh¸c cã nguån gèc tõ phag¬,
hoÆc lµ ph©n tö lai gi÷a vi khuÈn vµ phag¬ (nh− phagemid, cosmid …), hoÆc cã nguån gèc
tõ nÊm men (vÝ dô: YAC).
ViÖc cµi mét ®o¹n ADN vµo vect¬ th−êng lµ c«ng viÖc t−¬ng ®èi ®¬n gi¶n. Ng−êi ta
sö dông cïng mét enzym giíi h¹n ®Ó c¾t vect¬ vµ ®o¹n ADN cµi. Ch¼ng h¹n, khi xö lý
vect¬ plasmid b»ng enzym EcoRI, vect¬ sÏ tõ d¹ng “vßng” chuyÓn sang d¹ng “th¼ng” víi
hai ®Çu dÝnh. Do ®−îc c¾t bëi cïng enzym, ®o¹n ADN cµi còng cã hai ®Çu dÝnh víi tr×nh
tù bæ sung víi tr×nh tù ®Çu dÝnh cña vect¬. C¸c ®Çu dÝnh cña vect¬ vµ ®o¹n ADN cµi
trªn c¬ së nguyªn t¾c Chargaff sÏ ®Ýnh kÕt víi nhau ®Ó t¹o nªn ph©n tö ADN t¸i tæ hîp
d¹ng vßng chØ cßn thiÕu mét liªn kÕt phosphodiester duy nhÊt ë mçi m¹ch. Liªn kÕt
cuèi cïng nµy ®−îc h×nh thµnh bëi enzym ADN ligase xóc t¸c. §Ó h¹n chÕ kh¶ n¨ng
“tù ®éng” g¾n kÕt trë l¹i gi÷a hai ®Çu dÝnh cña chÝnh vect¬, trong hçn hîp vect¬ vµ
®o¹n cµi, ng−êi ta th−êng cho d− thõa l−îng ADN cµi ®Ó t¨ng kh¶ n¨ng t¸i tæ hîp gi÷a
vect¬ vµ ®o¹n ADN cµi.
Mét sè lo¹i vect¬ kh«ng chØ cho phÐp nh©n dßng mét ®o¹n ADN cµi nµo ®ã, mµ cßn
cã thÓ ®iÒu khiÓn sù biÓu hiÖn cña gen trong ®o¹n ADN cµi. Nh÷ng vect¬ nh− vËy ®−îc
gäi lµ c¸c vect¬ biÓu hiÖn. C¸c vect¬ biÓu hiÖn th−êng ph¶i cã promoter n»m ng−îc
dßng so víi vÞ trÝ cµi gen. Vïng m· hãa cña gen cÇn ®−îc g¾n vµo vect¬ theo ®óng khung
®äc th× gen míi ®−îc biÓu hiÖn. C¸c vect¬ biÓu hiÖn th−êng ®−îc dïng ®Ó biÓu hiÖn c¸c
gen ®ét biÕn hoÆc c¸c gen lai nh»m ph©n tÝch chøc n¨ng cña chóng, hoÆc còng cã thÓ
®−îc dïng ®Ó s¶n xuÊt tËp trung mét lo¹i protein nµo ®ã vèn kh«ng thu ®−îc víi hiÖu
suÊt t−¬ng tù trong tù nhiªn. Ngoµi ra, promoter trong c¸c vect¬ biÓu hiÖn cã thÓ ®−îc
lùa chän sao cho sù biÓu hiÖn cña gen cµi cã thÓ ®−îc ®iÒu khiÓn b»ng viÖc bæ sung mét
chÊt ®¬n gi¶n vµo m«i tr−êng (ch¼ng h¹n nh− mét lo¹i ®−êng hay axit amin). ViÖc cã thÓ
®iÒu khiÓn chñ ®éng sù biÓu hiÖn cña mét gen nµo ®ã cã ý nghÜa quan träng trong nghiªn
cøu chøc n¨ng gen, nhÊt lµ víi c¸c gen g©y ®éc.
11.2.6.3. BiÕn n¹p c¸c vect¬ t¸i tæ hîp vµo tÕ bµo chñ
BiÕn n¹p lµ qu¸ tr×nh tÕ bµo chñ cã thÓ tiÕp nhËn ph©n tö ADN ngo¹i lai hoÆc theo
c¬ chÕ tù nhiªn hoÆc nhê c¸c kü thuËt “chuyÓn gen”. Trong tù nhiªn, mét sè vi khuÈn,
bao gåm Streptoccocus pneumoniae, Bacillus subtilis, Haemophilus influenzae vµ Neisseria
gonorrhoeae, cã c¸c c¬ chÕ tiÕp nhËn ADN tõ m«i tr−êng ngoµi. Chóng ®−îc gäi lµ c¸c vi
khuÈn kh¶ biÕn tù nhiªn. MÆc dï trong tù nhiªn, E. coli th−êng kh«ng cã tÝnh kh¶
biÕn, nh−ng khi ®−îc xö lý víi ion Ca2+, vi khuÈn nµy cã thÓ tiÕp nhËn ADN tõ m«i
tr−êng ngo¹i bµo. Cã thÓ ion Ca2+ víi kh¶ n¨ng “bao bäc” ph©n tö ADN tÝch ®iÖn ©m ®·
t¨ng c−êng kh¶ n¨ng “x©m nhËp” qua mµng tÕ bµo cña ADN. C¸c tÕ bµo E. coli sau khi
®−îc xö lý víi Ca2+ nh− vËy còng ®−îc gäi lµ c¸c tÕ bµo kh¶ biÕn. §Ó t×m ra vµ ph©n lËp
c¸c tÕ bµo kh¶ biÕn mang vect¬ t¸i tæ hîp, ng−êi ta th−êng nu«i cÊy c¸c vi khuÈn trªn
m«i tr−êng chän läc chøa c¸c chÊt kh¸ng sinh t−¬ng øng víi gen ®¸nh dÊu cã mÆt trong
vect¬.
Nh×n chung, hiÖu suÊt cña qu¸ tr×nh biÕn n¹p th−êng kh«ng cao. ChØ mét tØ lÖ nhá
c¸c tÕ bµo ®−îc xö lý biÕn n¹p cã thÓ tiÕp nhËn plasmid t¸i tæ hîp. Nh−ng, chÝnh hiÖu
qu¶ biÕn n¹p thÊp nh− vËy gióp cho hÇu hÕt c¸c tÕ bµo mang vect¬ t¸i tæ hîp th−êng chØ
333
§inh §oµn Long
mang mét b¶n sao duy nhÊt. Thuéc tÝnh nµy gióp cho c¸c tÕ bµo biÕn n¹p vµ dßng tÕ bµo
do chóng sinh ra (do ph©n chia trùc ph©n) chØ mang mét vect¬ ADN t¸i tæ hîp duy nhÊt
vµ gióp c¸c nhµ nghiªn cøu cã thÓ ph©n lËp vµ tinh s¹ch ®−îc dÔ dµng c¸c gen hoÆc s¶n
phÈm cña c¸c gen mét c¸ch riªng rÏ tõ hçn hîp biÕn n¹p vèn chøa nhiÒu ®o¹n tr×nh tù
ADN kh¸c nhau.
334
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
nghÜa, thÕ nªn “ng©n hµng hÖ gen” cã khi ®−îc gäi lµ “th− viÖn hÖ gen” vµ ng−îc l¹i.
ThuËt ng÷ “ng©n hµng gen” ®−îc dïng chung ®Ó chØ c¶ hai lo¹i “ng©n hµng hÖ gen” vµ
“th− viÖn cADN”.
Còng gièng nh− c¸c tÕ bµo trong ng©n hµng hÖ gen, mçi tÕ bµo biÕn n¹p trong th−
viÖn cADN th−êng chØ mang duy nhÊt mét vect¬ chøa ®o¹n ADN cµi. V× vËy, sau khi c¸c
tÕ bµo nh©n lªn, chóng sÏ t¹o ra nhiÒu dßng tÕ bµo, mçi dßng chøa b¶n sao cña mét
cADN m· hãa t−¬ng øng cho mét protein. ViÖc cÇn lµm sau khi ®· x©y dùng ®−îc ng©n
hµng hÖ gen vµ th− viÖn cADN lµ x¸c ®Þnh dßng tÕ bµo nµo mang ®o¹n ADN ®−îc quan
t©m nghiªn cøu.
B¶ng 11.1. Mét sè ®Æc ®iÓm kh¸c biÖt gi÷a ng©n hµng hÖ gen vµ th− viÖn cADN
11.2.6.5. Sö dông mÉu dß ®Ó x¸c ®Þnh c¸c dßng tÕ bµo trong ng©n hµng gen
§Ó x¸c ®Þnh dßng tÕ bµo nµo trong ng©n hµng gen mang ®o¹n ADN ®−îc quan t©m
nghiªn cøu (vÝ dô ë ®©y lµ ng©n hµng sö dông vect¬ plasmid), ng−êi ta tiÕn hµnh lai mÉu
dß (nguyªn t¾c ®−îc nªu ë môc 11.2.5) víi c¸c khuÈn l¹c cña c¸c dßng vi khuÈn tõ ng©n
hµng gen. Kü thuËt nµy ®−îc gäi lµ ph−¬ng ph¸p lai khuÈn l¹c.
Mét th− viÖn cADN ®iÓn h×nh chøa Ýt nhÊt hµng ngµn dßng vi khuÈn kh¸c nhau,
mçi dßng mang mét ®o¹n cµi cADN ®Æc tr−ng. Sau khi vect¬ ®−îc biÕn n¹p vµo vi khuÈn,
c¸c tÕ bµo vi khuÈn ®−îc cÊy trªn bÒ mÆt m«i tr−êng chøa agar. Mçi tÕ bµo sau ®ã sÏ
ph¸t triÓn thµnh mét khuÈn l¹c riªng rÏ. C¸c tÕ bµo trong cïng mét khuÈn l¹c ®Òu mang
cïng lo¹i vect¬ vµ ®o¹n gen cµi gièng nhau. Trong kü thuËt lai khuÈn l¹c, ng−êi ta cã thÓ
dïng mµng lai gièng nh− trong c¸c ph−¬ng ph¸p lai Southern ®Ó thu håi mét l−îng “vÕt”
ADN trùc tiÕp tõ khuÈn l¹c, nh−ng ®ñ cho sù kÕt cÆp víi mÉu dß. Cô thÓ, ng−êi ta dïng
mµng lai Ðp lªn bÒ mÆt m«i tr−êng nu«i cÊy chøa khuÈn l¹c vµ “in h×nh” chóng lªn mµng
lai (cïng víi ADN cña chóng) theo kiÓu “®ãng dÊu”. Khi kÕt qu¶ lai mÉu dß/khuÈn l¹c
cho kÕt qu¶ “d−¬ng tÝnh”, sÏ x¸c ®Þnh ®−îc vÞ trÝ khuÈn l¹c mang dßng tÕ bµo chøa ®o¹n
ADN (gen) cµi mong muèn.
Mµng lai ®−îc ®em lai víi mÉu dß nh− sau: ng−êi ta tiÕn hµnh xö lý mµng lai sao
cho mµng tÕ bµo vì ra vµ c¸c ph©n tö ADN tho¸t ra ngoµi vµ g¾n lªn mµng lai t¹i chÝnh
vÞ trÝ tÕ bµo cña chóng. C¸c mµng lai sau ®ã ®−îc ñ víi c¸c mÉu dß ®−îc ®¸nh dÊu tõ
tr−íc trong c¸c ®iÒu kiÖn gièng nh− khi tiÕn hµnh c¸c kü thuËt lai Northern hay
Southern.
§Ó x©y dùng ng©n hµng gen, ngoµi c¸c vect¬ plasmid cã nguån gèc vi khuÈn, ng−êi
ta cßn dïng nhiÒu lo¹i vect¬ kh¸c cã nguån gèc virut (phag¬), hoÆc tõ c¸c sinh vËt bËc cao
h¬n nh− NST nh©n t¹o cña nÊm men (YAC), hoÆc c¸c d¹ng vect¬ lai nh− phagemid,
335
§inh §oµn Long
cosmid, NST nh©n t¹o vi khuÈn (BAC), v.v ... Trong c¸c vect¬ virut, c¸c vect¬ cã nguån
gèc phag¬ λ lµ phæ biÕn h¬n c¶. ADN hÖ gen cña virut nµy ®−îc lo¹i bá c¸c phÇn g©y ®éc
vµ th−êng ®−îc dïng nh− vect¬ nh©n dßng. Nguyªn t¾c sö dông vect¬ nµy ®Ó nh©n dßng
trong c¸c th− viÖn hÖ gen gièng nh− vect¬ plasmid. ChØ cã mét ®iÓm kh¸c lµ khi tiÕn
hµnh lai víi mÉu dß ®Ó x¸c ®Þnh c¸c dßng gen biÕn n¹p th× vÞ trÝ c¸c mÉu dß ®−îc x¸c
®Þnh trªn mµng lai t−¬ng øng víi vÞ trÝ c¸c vÕt tan thay cho vÞ trÝ c¸c khuÈn l¹c nh− khi
dïng vect¬ plasmid.
Tuy vËy, b»ng c¸ch kÕt hîp mét sè kü thuËt, c¸c ®o¹n ADN (thËm chÝ gen ®Çy ®ñ)
cã chiÒu dµi h¬n 100 nucleotide còng cã thÓ tæng hîp b»ng ph−¬ng ph¸p hãa häc. Cô thÓ,
tr−íc tiªn ng−êi ta ph¶i tæng hîp c¸c ®o¹n ADN ng¾n, m¹ch ®¬n cã tr×nh tù gèi lªn nhau;
sau ®ã tinh s¹ch råi nèi c¸c ®o¹n ADN víi nhau (h×nh 11.8). ViÖc nèi c¸c ®o¹n ADN cã
thÓ thùc hiÖn theo hai c¸ch. Trong c¸ch thø nhÊt, c¸c ®o¹n ADN riªng rÏ chøa tr×nh tù
®Çy ®ñ cña ph©n tö ADN cÇn tæng hîp, chØ thiÕu liªn kÕt phosphodiester g¾n kÕt c¸c
®o¹n víi nhau. Lóc nµy, enzym ADN ligase ®−îc dïng ®Ó nèi c¸c ®o¹n víi nhau (h×nh
336
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
11.8a). Trong c¸ch thø hai, c¸c ®o¹n ADN ®−îc tæng hîp chØ chiÕm mét phÇn tr×nh tù cña
mçi m¹ch ADN cÇn tæng hîp. Khi c¸c ®o¹n ADN ®−îc cho b¾t cÆp víi nhau, trªn mçi
m¹ch cßn tån t¹i nhiÒu ®o¹n tr×nh tù “trèng”. Lóc nµy, ADN pol I ®−îc dïng ®Ó lÊp kÝn
c¸c ®o¹n “trèng” tr−íc khi ADN ligase nèi c¸c ®o¹n ADN víi nhau ®Ó t¹o nªn ph©n tö ADN
cã tr×nh tù ®Çy ®ñ (h×nh 11.8b). Trong qu¸ tr×nh tæng hîp ADN nh− vËy, còng cã thÓ kÕt hîp
c¸c tr×nh tù ®iÒu hßa cña gen víi c¸c tr×nh tù m· hãa. Ngoµi ra, còng cã thÓ bæ sung vÞ trÝ
c¾t cña c¸c enzym giíi h¹n ë vïng biªn cña tr×nh tù m· hãa, ®Ó sau ®ã cã thÓ cµi c¸c ®o¹n
ADN nµy vµo c¸c vect¬ nh©n dßng hay vect¬ biÓu hiÖn.
C¸c ®o¹n ADN ®−îc tæng hîp hãa häc ngoµi c¸c øng dông lµm mÉu dß hoÆc lµm måi
cho ph¶n øng PCR vµ gi¶i tr×nh tù, cßn cã thÓ ®−îc dïng cho c¸c nghiªn cøu kh¸c. Ch¼ng
h¹n, cã thÓ tæng hîp c¸c ®o¹n ADN mang mét (hoÆc mét sè) nucleotide biÕn ®æi so víi
tr×nh tù ADN cña gen ®· biÕt, vµ dïng ®o¹n ADN nµy trong ph−¬ng ph¸p g©y ®ét
biÕn ®Þnh vÞ trÝ. Trong ph−¬ng ph¸p nµy, ®o¹n ADN tæng hîp mang nucleotide biÕn ®æi
®−îc dïng lµm måi ®Ó nh©n ®o¹n gen ®Ých b»ng ph¶n øng PCR. V× trong ph©n tö ADN
sîi kÐp h×nh thµnh cã mét (hoÆc mét sè) vÞ trÝ kÕt cÆp sai, nªn s¶n phÈm PCR h×nh thµnh
lµ c¸c ®o¹n ADN cã tr×nh tù gen mang nucleotide biÕn ®æi ë vÞ trÝ x¸c ®Þnh. C¸c ®o¹n
oligonucleotide còng cã thÓ ®−îc dïng theo c¸ch t−¬ng tù ®Ó t¹o nªn mét ®iÓm giíi h¹n
míi trªn ph©n tö ADN, ®Ó råi sau ®ã ®iÓm giíi h¹n nµy ®−îc dïng ®Ó cµi gen ®Ých vµo
®óng vÞ trÝ cÇn thiÕt, vÝ dô: sau promoter hay sau vÞ trÝ g¾n cña ribosome, v.v…
337
§inh §oµn Long
Trong ph¶n øng PCR, ph©n tö ADN ®−îc g©y biÕn tÝnh vµ sù tæng hîp ADN diÔn ra
lÆp l¹i qua nhiÒu chu kú nhê kh¶ n¨ng ®iÒu nhiÖt cña m¸y. KÕt qu¶ lµ: sau mçi chu kú
®iÒu nhiÖt, sè ph©n tö ADN l¹i t¨ng gÊp ®«i. §©y lµ mét ph¶n øng cã ®é nh¹y cao. ChØ
cÇn mét vµi b¶n sao ADN cã trong mÉu nghiªn cøu, chóng ta cã thÓ thu ®−îc hµng tØ b¶n
sao sau kho¶ng trªn d−íi 30 chu kú ph¶n øng (sè b¶n sao ADN = 2n víi n lµ sè chu kú
ph¶n øng).
338
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
ddNTP (ë nång ®é thÊp) còng sÏ liªn kÕt vµo mét sè m¹ch ADN ®ang tæng hîp vµ lµm
kÕt thóc qu¸ tr×nh sao chÐp. Do cã nhiÒu ph©n tö ADN ®−îc tæng hîp ®ång thêi nªn qu¸
tr×nh nµy dÉn ®Õn sù h×nh thµnh cña mét hçn hîp nhiÒu ph©n tö ADN ®−îc sao chÐp
kh«ng hoµn chØnh gièng nhau ë ®Çu 5’ ®−îc ®¸nh dÊu vµ kh¸c nhau ë ®Çu 3’ vÒ chiÒu
dµi vµ lo¹i nucleotide
kÕt thóc chuçi (h×nh 11.11). C¸c s¶n phÈm nµy sau ®ã ®−îc ph©n t¸ch trªn gel
polyacrylamide vµ ®äc tr×nh tù theo thø tù c¸c b¨ng xuÊt hiÖn trªn b¶n ®iÖn di theo
chiÒu tõ cùc d−¬ng sang cùc ©m.
§· cã nhiÒu c¶i tiÕn ®−îc ®−a ra nh»m n©ng cao hiÖu qu¶ cña ph−¬ng ph¸p dideoxy
kÓ tõ khi Sanger c«ng bè. Trong ph−¬ng ph¸p cña Sanger, enzym ADN pol I cña E. coli
®−îc dïng lµm enzym sao chÐp. Sau ®ã, nã ®−îc thay b»ng ADN pol cã nguån gèc tõ
phag¬ T7 cã hiÖu qu¶ sao chÐp c¸c ADN m¹ch dµi tèt h¬n. Ngµy nay, phÇn lín viÖc gi¶i
tr×nh tù ADN ®Òu dùa trªn ph−¬ng ph¸p dideoxy kÕt hîp víi ph¶n øng PCR sö dông c¸c
enzym chÞu nhiÖt, nh− Taq ADN pol, hoÆc −u viÖt h¬n lµ enzym cã tªn th−¬ng m¹i lµ
“sequenase”. §©y lµ enzym t¸i tæ hîp cã nguån gèc tõ ADN pol cña phag¬ T7. Enzym
nµy cã hiÖu qu¶ sao chÐp tèt c¸c m¹ch ADN dµi, cã tÝnh chÞu nhiÖt, cã ho¹t tÝnh ®äc söa
vµ cã thÓ l¾p r¸p c¸c lo¹i nucleotide c¶i biÕn (ngoµi 4 lo¹i nucleotide c¬ b¶n) vµo m¹ch
ADN ®ang tæng hîp. ViÖc kÕt hîp víi ph−¬ng ph¸p PCR cho phÐp gi¶i tr×nh tù ADN tõ
mét l−îng rÊt nhá ADN sîi kÐp, ®ång thêi còng cho phÐp gi¶i tr×nh tù trùc tiÕp mét sè hÖ
gen kÝch th−íc nhá, nh− virut vµ vi
a)
khuÈn. Trong khi ®ã, viÖc gi¶i tr×nh tù
RE ChÊt nhËn dRhodamine
hÖ gen c¸c sinh vËt bËc cao (cã kÝch
th−íc hÖ gen lín) cÇn ph¶i qua b−íc
nh©n dßng hoÆc sö dông c¸c ng©n hµng
gen.
ChÊt ph¸t quang
11.2.9.1. Gi¶i tr×nh tù ADN tù ®éng §o¹n nèi
ng−êi, ~3,2x109 bp) ®Òu dùa vµo ph−¬ng H×nh 11.12. Thuèc nhuém g¾n víi ddNTP ®−îc dïng
cho gi¶i tr×nh tù ADN. a) CÊu tróc hãa häc cña chÊt kÕt
ph¸p gi¶i tr×nh tù tù ®éng. thóc chuçi BigDyeTM. Trong ®ã, c¸c ddNTP kÕt thóc chuçi
kh¸c nhau cã thuéc tÝnh ph¸t quang kh¸c nhau phô thuéc
Ph−¬ng ph¸p gi¶i tr×nh tù tù ®éng
vµo c¸c gèc R. b) Phæ ph¸t quang cña 4 gèc BigDyeTM
kÕt hîp ®ång thêi 4 ph¶n øng ®éc lËp g¾n vµo 4 lo¹i ddNTP lµ kh¸c nhau.
339
§inh §oµn Long
vµo mét ph¶n øng chung. Trong ®iÒu kiÖn nh− vËy, viÖc dïng c¸c nucleotide ®−îc ®¸nh
dÊu phãng x¹ (g¾n vµo ®Çu 5’ cña m¹ch ADN tæng hîp míi) lµ kh«ng phï hîp v× c¸c ®o¹n
ADN míi tæng hîp chØ kh¸c nhau mét nucleotide nªn khã ph©n t¸ch b»ng ®iÖn di th«ng
th−êng. Tuy nhiªn, trë ng¹i nµy cã thÓ ®−îc kh¾c phôc nÕu nh− ®Çu 3’ cña c¸c ®o¹n ADN
tæng hîp míi ®−îc “®¸nh dÊu” vµ “ph¸t tÝn hiÖu”. §Ó lµm ®iÒu ®ã, ng−êi ta dïng mét bé
c¸c ddNTP ®−îc g¾n chÊt ph¸t quang (Glazer vµ Mathies, 1997). C¸c ddNTP lóc nµy vÉn
cã thÓ liªn kÕt vµo m¹ch ADN ®ang kÐo dµi vµ lµm ngõng ph¶n øng sao chÐp. CÊu tróc
phÇn ph¸t quang cña ddNTP gåm mét “gèc ph¸t quang” liªn kÕt víi mét trong bèn gèc
dichlororhodamine (viÕt t¾t lµ dRhodamine, lµ chÊt nhËn n¨ng l−îng quang) kh¸c nhau
qua mét ®o¹n nèi (h×nh 11.12). Bèn gèc dRhodamine khi bÞ “gèc ph¸t quang” kÝch thÝch
(bëi nguån s¸ng laser th−êng tõ Argon) nhËn n¨ng l−îng råi ph¸t quang ë c¸c b−íc sãng
kh¸c nhau. Nhê vËy, mçi mét lo¹i ddNTP khi ®−îc kÝch thÝch bëi nguån s¸ng Argon cña
m¸y gi¶i tr×nh tù sÏ ph¸t ra “tÝn hiÖu” kh¸c nhau. Th«ng tin nµy ®−îc mét c¶m biÕn tÝn
hiÖu kÕt hîp víi m¸y tÝnh xö lý vµ tù ®éng chuyÓn thµnh tr×nh tù ADN (h×nh 11.13). C¸c
ddNTP ®−îc g¾n chÊt ph¸t quang theo nguyªn lý nªu trªn ®−îc gäi lµ c¸c yÕu tè kÕt thóc
chuçi BigDyeTM.
Gi¶i tr×nh tù tù ®éng cã nhiÒu −u ®iÓm h¬n so víi ph−¬ng ph¸p thñ c«ng cña
Sanger. ¦u ®iÓm lín nhÊt lµ kh¶ n¨ng tù
a)
®éng hãa phÇn lín c¸c b−íc cña qu¸ tr×nh
ph©n tÝch. NhiÒu b−íc cña ph¶n øng gi¶i
Måi ®Ó gi¶i tr×nh tù
tr×nh tù cã thÓ thùc hiÖn b»ng r«bèt, kÓ
tõ viÖc pipet mÉu ®Õn ph¶n øng PCR.
C¸c s¶n phÈm sau ®ã ®−îc tinh s¹ch vµ
Tr×nh tù thu ®−îc
cho ch¹y qua c¸c cét ®iÖn di mao qu¶n
mµ kh«ng cÇn bÊt cø mét thao t¸c trùc
tiÕp nµo cña con ng−êi. Tèc ®é ®äc vµ
møc ®é chÝnh x¸c cña ph−¬ng ph¸p tù
®éng rÊt cao, ®Æc biÖt ®èi víi c¸c ®o¹n
ADN dµi tõ 30 ®Õn d−íi 1000 bp (®é
chÝnh x¸c cao nhÊt lµ ®èi víi c¸c ®o¹n cã
tr×nh tù trªn d−íi 600 bp). Mét hÖ thèng
gi¶i tr×nh tù ADN hiÖn nay trung b×nh cã
ChuyÓn thµnh tr×nh
thÓ ®äc ®−îc 1 - 2 triÖu bp trong mét tù m¹ch m· hãa
ngµy víi ®é chÝnh x¸c 99%. Ngoµi ra,
ViÕt l¹i theo
ph−¬ng ph¸p nµy cã ®é nh¹y cao mµ
chiÒu 5’ →3’
kh«ng cÇn ph¶i sö dông c¸c chÊt phãng
x¹. Tuy nhiªn, còng ph¶i nãi r»ng kü
thuËt gi¶i tr×nh tù ADN tù ®éng kh«ng
b)
ph¶i lóc nµo còng cho kÕt qu¶ ph©n tÝch
hoµn toµn chÝnh x¸c. Mét sè h¹n chÕ cña
ph−¬ng ph¸p nµy gåm cã: nã kh«ng ®äc
®−îc c¸c tr×nh tù qu¸ ng¾n (d−íi 30 bp,
bëi v× hiÖu suÊt PCR cña c¸c ph©n ®o¹n
ADN nµy thÊp, b¶n th©n chóng kÐm bÒn
vµ ph¸t tÝn hiÖu yÕu); sai sè ®äc t¨ng lªn H×nh 11.13. Gi¶i tr×nh tù ADN tù ®éng. a) Sö dông måi
®Ó tæng hîp ADN. Qu¸ tr×nh nµy kÕt thóc b»ng ddNTP ph¸t
khi gi¶i tr×nh tù c¸c ®o¹n ADN trªn 1000 quang. Chuçi c¸c pic t¸ch biÖt cho biÕt tr×nh tù ADN.
bp; ngoµi ra, c¸c ®o¹n ADN mang nhiÒu b) Phæ tr×nh tù ®−îc gi¶i m· b»ng m¸y ABI Prism377.
340
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
tr×nh tù lÆp kÕ tiÕp cã xu h−íng bÞ “nÐn” l¹i khi ch¹y qua cét chøa gel (l¾p trong m¸y),
dÉn ®Õn hiÖn t−îng c¸c pic ë c¸c vïng tr×nh tù lÆp l¹i cã xu h−íng lång vµo nhau (kh«ng
ph©n t¸ch) nªn khã x¸c ®Þnh tr×nh tù chÝnh x¸c. C¸c tr×nh tù nµy th−êng cÇn ®−îc kiÓm
tra l¹i b»ng c¸c ph−¬ng ph¸p thñ c«ng. Trong thùc tÕ, nh÷ng ®o¹n ADN cuèi cïng ®−îc
gi¶i tr×nh tù trong dù ¸n hÖ gen ng−êi (hoµn thµnh n¨m 2006) lµ c¸c ®o¹n ADN cã møc
®é lÆp l¹i lín thuéc NST sè 1.
341
§inh §oµn Long
phương pháp “siêu âm”, rồi từng đoạn nhỏ (1,5 – 2 Kb) được nh©n dòng b»ng véctơ
plasmid pUC18. Tổng cộng thư viện hệ gen của loài này gồm khoảng 20.000 dòng
vi khuẩn khác nhau. Mỗi dòng (tương ứng với một đoạn ADN) sau đó được giải
trình tự để rồi tổ hợp lại và tạo nên tập hợp thông tin về trình tự ADN gồm 12
triệu bp. Độ dài của toàn bộ các trình tự ®−îc gi¶i m· gấp 6 lần độ dài hÖ gen của vi
khuẩn. Trình tự hệ gen cuối cùng thu được là nhờ sự tổ hợp các đoạn ADN ngắn
thành các đoạn contig. Các đoạn rçng gi÷a c¸c contig cuối cùng được “lấp đầy” bằng
việc xác định các dòng bổ sung từ một sè ng©n hµng hÖ gen khác (thùc tÕ, ®Ó gi¶i
tr×nh tù mét hÖ gen, ng−êi ta cÇn x©y dùng Ýt nhÊt 2 – 3 ng©n hµng gen mang
c¸c ®o¹n cµi cã kÝch th−íc trung b×nh kh¸c nhau, vÝ dô: 1, 5 vµ 10 Kb). Ưu điểm
râ nhất của phương pháp “shortgun” là không cần biết trước trình tự của hệ gen vµ
tèc ®é gi¶i tr×nh tù nhanh, ®Æc biÖt víi c¸c hÖ gen nhá (nh− vi khuÈn). Phần lớn
các hệ gen vi khuẩn có thể giải mã xong chỉ trong vài tuần bằng phương pháp giải
trình tự ngÉu nhiªn. Tuy vậy, khi gi¶i tr×nh tù nh÷ng hÖ gen lín (nh− ng−êi),
phương pháp này có nhược điểm là gÆp khã kh¨n khi xác định trËt tù c¸c ®o¹n
contig ở các vïng hÖ gen mang nhiÒu trình tự lặp lại liªn tiếp; ngoµi ra, sè l−îng
contig rÊt lín nªn cÇn c¸c phÇn mÒm vµ hÖ thèng m¸y tÝnh cã hiÖu n¨ng rÊt cao
®Ó xö lý d÷ liÖu.
• Giải trình tự ngẫu nhiên phân cấp. Để gi¶i tr×nh tù c¸c hÖ gen lín, có một cải tiến
là ADN toàn hệ gen ban đầu được cắt thành các đoạn lớn rồi tách dòng vào các NST
nhân tạo vi khuẩn (BAC). Sau đó, mçi dßng BAC ®−îc dïng ®Ó x©y dùng c¸c ng©n
hµng “con” mang c¸c ®o¹n ADN cµi kÝch th−íc ng¾n h¬n (vÝ dô: b»ng vect¬
pUC18). ViÖc giải trình tự ngẫu nhiên ®−îc tiÕn hµnh lÇn l−ît b¾t ®Çu tõ c¸c
ng©n hµng “con”. Phương pháp giải trình tự ngẫu nhiên phân cấp giúp việc sắp xếp
các contig dÔ dµng hơn.
342
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
x¸c mét gen kh«ng ph¶i lóc nµo còng ®óng. §Ó h¹n chÕ nh−îc ®iÓm nµy, mét
ph−¬ng ph¸p bæ sung lµ gen ®−îc x¸c ®Þnh trªn c¬ së c¸c gen ®· biÕt ë c¸c loµi
sinh vËt kh¸c (v× chóng th−êng cã tr×nh tù t−¬ng ®ång hoÆc gièng nhau). Tuy
vËy, ph−¬ng ph¸p ®èi chiÕu nµy còng cã nguy c¬ lµ c¸c gen gi¶ (pseudogene,
th−êng kh«ng ®−îc phiªn m·) ®−îc tÝnh nhÇm lµ gen.
• So s¸nh cADN. Mét c¸ch hiÖu qu¶ ®Ó x¸c ®Þnh mét gen trong hÖ gen lµ so s¸nh
tr×nh tù cña nã víi mét b¶n sao cADN t−¬ng øng. Chóng ta biÕt r»ng, cADN
®−îc t¹o ra tõ mARN vµ chñ yÕu chøa c¸c tr×nh tù exon cña ORF. ViÖc so s¸nh
tr×nh tù cã thÓ thùc hiÖn nhê phÇn mÒm m¸y tÝnh hoÆc sö dông ph−¬ng ph¸p lai
gi÷a c¸c ®o¹n ADN hÖ gen víi mARN (ph−¬ng ph¸p lai Northern). C¸c ®o¹n
®¸nh dÊu tr×nh tù biÓu hiÖn - EST (expressed sequence tag) th−êng ®−îc sö
dông cho môc ®Ých nµy. EST thùc chÊt lµ c¸c ®o¹n tr×nh tù ng¾n (thường dài 200 –
500 bp) th−êng ®−îc t¹o ra trªn c¬ së gi¶i tr×nh tù tõ mét trong hai ®Çu cña mét
cADN. Nhê c¸c EST cã tÝnh ®¹i diÖn cho phÇn hÖ gen ®−îc biÓu hiÖn nªn chóng
rÊt hiÖu qu¶ ®Ó t×m kiÕm c¸c gen. Trong thùc nghiÖm, c¸c EST cßn nhiÒu −u ®iÓm
kh¸c n÷a, ®ã lµ: (1) c¸c ®o¹n EST ®−îc t¹o ra t−¬ng ®èi dÔ dµng vµ chi phÝ thÊp;
(2) chØ cÇn gi¶i tr×nh tù mét lÇn duy nhÊt lµ ®ñ ®Ó t¹o ra c¸c EST ®Æc thï víi mét
cADN, tøc lµ mét gen; (3) c¸c lçi g©y ra do gi¶i tr×nh tù th−êng kh«ng cÇn kiÓm tra
l¹i, bëi c¸c EST còng chØ ®−îc dïng ®Ó t×m c¸c tr×nh tù gÇn gièng. C¸c c¬ së d÷
liÖu EST hiÖn nay (vÝ dô: http://www.ncbi.nlm.nih.gov/dbEST/) cung cÊp trªn 5
triÖu tr×nh tù EST kh¸c nhau cña ng−êi. TÊt nhiªn, trong ®ã cã nhiÒu tr×nh tù
trïng nhiÒu lÇn (®Æc biÖt lµ c¸c gen cã møc ®é biÓu hiÖn cao vµ phæ biÕn); vµ cã
thÓ cßn thiÕu mét sè EST t−¬ng øng víi c¸c gen cã møc ®é biÓu hiÖn thÊp hoÆc
hiÕm gÆp (vÝ dô: chØ ë mét tÕ bµo, hoÆc
chØ biÓu hiÖn trong ®iÒu kiÖn ®Æc biÖt). a)
343
§inh §oµn Long
tù ADN th−êng cao h¬n tr×nh tù polypeptide t−¬ng øng do tÝnh tho¸i hãa cña m·
bé ba. Thùc nghiÖm còng x¸c nhËn r»ng, c¸c gen cã cïng chøc n¨ng ë c¸c sinh
vËt kh¸c nhau lu«n cã ®Æc ®iÓm chung. Ch¼ng h¹n nh−, hÇu hÕt c¸c loµi ®Òu cã
kh¶ n¨ng chuyÓn hãa galactose → glucose-6-P, trong ®ã enzym tham gia b−íc
®Çu tiªn cña con ®−êng chuyÓn hãa nµy (galactose → galactose-1-P) lµ mét
galactose kinase cã tÝnh ®Æc thï ë mçi loµi, nh−ng chóng ®Òu cã mét sè ®o¹n
tr×nh tù gièng nhau (hình 11.15). Nh− trªn ®· nãi, tr−íc khi gi¶i xong tr×nh tù
hÖ gen nÊm men, chØ cã kho¶ng 30% trong tæng sè 6000 gen cña nÊm men ®·
®−îc biÕt. Nh−ng, sau khi gi¶i m· xong hÖ gen nÊm men, b»ng ph−¬ng ph¸p t×m
kiÕm c¸c tr×nh tù gièng nhau, ng−êi ta x¸c ®Þnh ®−îc thªm chøc n¨ng cña
kho¶ng 30% gen n÷a. Nh− vËy, cßn kho¶ng 40% gen ch−a râ chøc n¨ng. TÊt
nhiªn, trong sè nµy cã thÓ cã mét sè gen gi¶. ViÖc x¸c ®Þnh chøc n¨ng gen v× vËy
cßn cÇn c¸c ph−¬ng ph¸p phèi hîp kh¸c n÷a.
• X¸c ®Þnh chøc n¨ng gen b»ng thùc nghiÖm. ë c¸c loµi sinh vËt m« h×nh, nh− E.
coli hay S. cereviseae, mét trong nh÷ng ph−¬ng ph¸p c¬ b¶n ®Ó x¸c ®Þnh chøc
n¨ng cña mét gen ch−a biÕt lµ lµm bÊt ho¹t gen b»ng kü thuËt “knock-out”.
Trong kü thuËt nµy, ng−êi ta dïng nguyªn t¾c t¸i tæ hîp t−¬ng ®ång ®Ó lµm háng
c¸c b¶n sao b×nh th−êng cña gen. KiÓu h×nh cña c¸c thÓ ®ét biÕn ®−îc kiÓm tra
vµ ®èi chiÕu víi kiÓu d¹i ®Ó x¸c ®Þnh chøc n¨ng gen. Ph−¬ng ph¸p nµy cã hiÖu
qu¶ trong nghiªn cøu x¸c ®Þnh vai trß cña nhiÒu gen. Ch¼ng h¹n nh− ë nÊm
men, viÖc so s¸nh tr×nh tù kh«ng gióp x¸c ®Þnh ®−îc chøc n¨ng cña mét gen cã
tªn lµ SNU17, do tr×nh tù cña nã rÊt kh¸c víi tr×nh tù c¸c gen ®· biÕt. Nh−ng
khi gen nµy bÞ háng, tÕ bµo nÊm men chØ ph¸t triÓn chËm vµ th−êng cã nhiÒu
sai háng trong qu¸ tr×nh hoµn thiÖn mARN. Qua ®ã, chøc n¨ng cña SNU17 ®−îc
t×m thÊy lµ yÕu tè tham gia hoµn thiÖn mARN. §iÓm khã cña ph−¬ng ph¸p nµy
lµ trong nhiÒu tr−êng hîp, c¸c c¸ thÓ mang gen bÞ háng hoÆc chÕt sím hoÆc
kh«ng biÓu hiÖn kiÓu h×nh kh¸c biÖt. C¶ hai tr−êng hîp nµy ®Òu kh«ng dÉn ®Õn
kÕt luËn ch¾c ch¾n nµo. Khi gen bÞ “knock-out” g©y chÕt cã thÓ suy luËn r»ng
protein do gen m· hãa cã vai trß sèng cßn ®èi víi sinh vËt, nh−ng vai trß cô thÓ
thÕ nµo th× kh«ng râ. Mét ph−¬ng ph¸p c¶i tiÕn kh¸c ®Ó x¸c ®Þnh vai trß cña gen
lµ lµm t¨ng møc biÓu hiÖn cña nã, råi theo dâi kiÓu h×nh thÓ ®ét biÕn.
MÆc dï ®· cã c¸c ph−¬ng ph¸p ph¸t hiÖn chøc n¨ng gen nh− trªn, nh−ng nh×n chung
ë nhiÒu gen, chøc n¨ng gen ph¶i ®−îc ph©n tÝch trªn c¬ së tõng gen riªng rÏ. ThÕ nªn, khèi
l−îng c«ng viÖc cho m¶ng nghiªn cøu nµy cßn rÊt lín. Riªng nÊm men, cßn kho¶ng Ýt nhÊt
2000 gen ch−a ®−îc x¸c ®Þnh chøc n¨ng, cßn ë ng−êi vµo kho¶ng 20.000 gen.
344
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
d) Ho¹t tÝnh cña nhiÒu protein thay ®æi do nh÷ng c¶i biÕn protein sau dÞch m·,
ch¼ng h¹n nh− sù biÕn ®æi mét sè axit amin, sù bæ sung hay mÊt ®i mét sè nhãm
chøc (nh− acetyl, phosphate, AMP, ADP-ribose, v.v...).
e) NhiÒu protein ®−îc “c¾t tØa” sau dÞch m·, hoÆc ®−îc bæ sung thªm c¸c gèc ®−êng
hay lipid ®Ó t¹o thµnh c¸c glycoprotein vµ lipoprotein.
f) B¶n th©n c¸c protein cã ®é bÒn vµ tèc ®é ph©n hñy rÊt kh¸c nhau.
g) §ã lµ ch−a kÓ ®Õn nh÷ng biÕn ®æi cña protein cßn phô thuéc vµo c¸c ®iÒu kiÖn
sinh tr−ëng, ph¸t triÓn cña tÕ bµo; phô thuéc vµo c¸c ho¹t ®éng t−¬ng t¸c cña
protein víi c¸c gen vµ c¸c protein kh¸c. V× vËy, ®Ó ®¸nh gi¸ møc ®é biÓu hiÖn cña
mét gen, kh«ng thÓ chØ dõng ë møc phiªn m· vµ cßn cÇn ®¸nh gi¸ ë møc dÞch
m·. Ngoµi ra, sau giai ®o¹n nhiÒu hÖ gen sinh vËt m« h×nh vµ ng−êi ®· ®−îc gi¶i
tr×nh tù, vÊn ®Ò tån t¹i l¹i lµ phÇn lín c¸c gen cña chóng ch−a râ chøc n¨ng. VÝ
lý do nµy, nhiÒu nhµ khoa häc cho r»ng thÕ kû 21 lµ thÕ kû cña hÖ protein häc.
D−íi ®©y lµ mét sè ph−¬ng ph¸p ph©n tÝch protein c¬ b¶n.
345
§inh §oµn Long
346
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
dïng cét s¾c ký mang vËt liÖu g¾n kÕt víi ATP ®Ó ph©n t¸ch protein ®ã. ChØ cã protein
liªn kÕt víi ATP míi ®−îc cét gi÷ l¹i, cßn hÇu hÕt c¸c protein kh«ng liªn kÕt víi ATP bÞ
röa tr«i khái cét. Kü thuËt tinh s¹ch nµy ®−îc gäi lµ s¾c ký ¸i lùc. Cã nhiÒu chÊt kh¸c
nhau cã thÓ ®−îc dïng ®Ó g¾n kÕt víi vËt liÖu nhåi cét vµ gióp qu¸ tr×nh tinh s¹ch
protein ®¹t hiÖu qu¶ cao h¬n. C¸c chÊt nµy bao gåm c¶ ADN (®Ó tinh s¹ch protein liªn
kÕt ADN) hay thËm chÝ lµ protein (®Ó tinh s¹ch mét lo¹i protein kh¸c t−¬ng t¸c ®Æc thï
víi nã). Nh− vËy, ®Ó tinh s¹ch mét protein nµo ®ã, cÇn ph¶i cã nh÷ng hiÓu biÕt c¬ b¶n vÒ
®Æc tÝnh lý hãa cña protein ®ã.
Mét d¹ng cña s¾c ký ¸i lùc ®−îc dïng phæ biÕn lµ s¾c ký ¸i lùc miÔn dÞch. Trong
ph−¬ng ph¸p nµy, ng−êi ta g¾n kh¸ng thÓ ®Æc hiÖu víi protein ®Ých lªn vËt liÖu lµm cét.
Trong tr−êng hîp lý t−ëng, lo¹i kh¸ng thÓ nµy chØ liªn kÕt ®óng víi protein cÇn tinh
s¹ch. Lo¹i protein liªn kÕt víi kh¸ng thÓ sau ®ã ®−îc röa chiÕt b»ng c¸ch cho ch¶y qua
cét dung dÞch muèi hoÆc chÊt tÈy nhÑ. Khã kh¨n gÆp ph¶i víi ph−¬ng ph¸p nµy lµ ®«i khi
liªn kÕt kh¸ng thÓ - protein bÒn v÷ng ®Õn møc ph¶i g©y biÕn tÝnh protein míi thu håi
®−îc s¶n phÈm. Nh−ng, kh«ng gièng ADN, protein sau khi biÕn tÝnh th−êng kh«ng håi
tÝnh trong ®iÒu kiÖn in vitro, nªn protein thu ®−îc nhiÒu khi kh«ng ë d¹ng ho¹t ®éng
chøc n¨ng.
§Ó t¨ng hiÖu suÊt tinh s¹ch, còng cã thÓ c¶i biÕn protein. Mét vÝ dô vÒ sù c¶i biÕn
nµy lµ bæ sung mét ®o¹n peptide ng¾n vµo ®Çu C hoÆc ®Çu N cña ph©n tö protein cÇn
ph©n tÝch. ViÖc bæ sung “tr×nh tù ®¸nh dÊu” nµy cã thÓ thùc hiÖn ®−îc b»ng kü thuËt di
truyÒn. C¸c tr×nh tù peptide ®¸nh dÊu lµm thay ®æi mét sè thuéc tÝnh cña protein vµ
gióp viÖc tinh chÕ dÔ dµng h¬n. VÝ dô, mét sè protein sau khi ®−îc bæ sung mét chuçi
peptide gåm 6 His trë nªn t−¬ng t¸c víi cét Ni2+ tèt h¬n vµ dÔ ph©n t¸ch h¬n (trong khi
nh÷ng protein kh¸c kh«ng cã ®Æc tÝnh nµy). Còng cã thÓ sö dông epitop ®Æc hiÖu
(th−êng lµ mét ®o¹n peptide cã 5 - 7 axit amin x¸c ®Þnh kh¸ng nguyªn) ®Ó tinh s¹ch lo¹i
protein cã ¸i lùc cao víi nã. C¸c c¶i tiÕn nµy cho phÐp tinh s¹ch c¸c protein trªn c¬ së
nguyªn t¾c miÔn dÞch. ¦u ®iÓm cña ph−¬ng ph¸p nµy lµ: c¸c epitop cã thÓ thay ®æi tÝnh
liªn kÕt kh¸ng thÓ tïy thuéc vµo ®iÒu kiÖn m«i tr−êng (ch¼ng h¹n, ¸i lùc gi¶m khi cã
Ca2+, vµ t¨ng khi kh«ng cã Ca2+). §iÒu nµy gióp h¹n chÕ viÖc sö dông c¸c yÕu tè g©y biÕn
tÝnh kh¸c.
Nguyªn t¾c s¾c ký ¸i lùc miÔn dÞch còng ®−îc dïng ®Ó g©y kÕt tña nhanh mét lo¹i
protein ®Æc hiÖu nµo ®ã tõ dÞch chiÕt th«. Trong tr−êng hîp nµy, ph¶n øng kÕt tña miÔn
dÞch x¶y ra do kh¸ng thÓ ®−îc g¾n vµo cïng lo¹i vËt liÖu lµm pha tÜnh trong s¾c ký cét.
Do c¸c h¹t nµy cã kÝch th−íc lín nªn chóng l¾ng rÊt nhanh trong èng nghiÖm chøa dung
dÞch ®Öm vµ mang theo c¸c protein liªn kÕt víi chóng (qua kh¸ng thÓ). Kü thuËt nµy
®−îc gäi lµ kÕt tña miÔn dÞch, còng ®−îc dïng ngµy cµng phæ biÕn trong c¸c thÝ nghiÖm
cÇn tinh s¹ch protein. MÆc dï nÕu chØ dïng riªng rÏ ph−¬ng ph¸p nµy, hiÕm khi thu ®−îc
s¶n phÈm protein tinh s¹ch hoµn toµn, song ph−¬ng ph¸p nµy rÊt hiÖu qu¶ ®Ó x¸c ®Þnh
c¸c lo¹i protein hoÆc hîp chÊt kh¸c (vÝ dô mét tr×nh tù ADN) cã t−¬ng t¸c víi mét lo¹i
protein ®Ých nµo ®ã.
347
§inh §oµn Long
SDS (sodium dodecyl sulphate, c«ng thøc lµ CH3-(CH2)11SO4-) hay c¸c chÊt khö nhãm
sulfhydryl, nh− β -mercapthoethanol (HS-CH2CH2OH) th× c¸c cÊu tróc bËc 2, 3 vµ 4
cña protein bÞ ph¸ vì. Lóc nµy, SDS t¹o thµnh líp vá ion ©m bao bäc protein lµm protein
trë nªn tÝch ®iÖn ©m ®ång ®Òu däc ph©n tö. β-mecarptoethanol lµm “®øt g·y” c¸c liªn kÕt
disulfide (S-S) gi÷a c¸c Cys. Trªn c¬ së nµy, nÕu c¸c ph©n tö protein ®−îc g©y biÕn tÝnh
bëi SDS vµ β-mercaptoethanol, th× sù ph©n t¸ch protein trong ®iÖn di chñ yÕu lµ do sù
kh¸c biÖt vÒ kÝch th−íc vµ khèi l−îng ph©n tö. Khi kh«ng cã SDS vµ β-mercaptoethanol,
c¸c protein vÉn cã thÓ ph©n t¸ch b»ng ®iÖn di, nh−ng lóc nµy sù ph©n t¸ch cña chóng cßn
phô thuéc vµo nhiÒu yÕu tè kh¸c nh− cÊu h×nh, ®iÓm ®¼ng ®iÖn, sù t−¬ng t¸c ph©n tö ...
Mét ®iÓm kh¸c biÖt n÷a so víi c¸c axit nucleic lµ protein th−êng cã kÝch th−íc trung
b×nh nhá h¬n nhiÒu so víi c¸c axit nucleic, nªn gel ®iÖn di protein th−êng ®−îc lµm tõ
polyacrylamide. HÖ thèng “m¹ng” mµ hîp chÊt polyme nh©n t¹o nµy t¹o ra nhá h¬n so
víi gel agarose. Kü thuËt ®iÖn di trªn gen polyacrylamide ®−îc viÕt t¾t lµ PAGE. Sau khi
®iÖn di, ®Ó quan s¸t c¸c protein ®−îc nhuém víi mét trong hai chÊt nhuém phæ biÕn lµ
Coomassie blue hoÆc b¹c (Ag2+). Coomassie blue liªn kÕt chÆt víi protein t¹o nªn c¸c
b¨ng ®iÖn di cã mµu xanh; c¸c nguyªn tö b¹c còng liªn kÕt m¹nh víi protein t¹o nªn
phøc hÖ cã mµu n©u – ®en. Nhuém b¹c th−êng nh¹y h¬n coomassie blue, nh−ng ®¾t h¬n.
11.3.4. §Þnh tÝnh protein dùa trªn thÈm t¸ch miÔn dÞch – lai Western
Tuy cã b¶n chÊt kh¸c ADN vµ ARN, viÖc x¸c ®Þnh sù cã mÆt mét lo¹i protein trong
mÉu sinh häc còng ®−îc thùc hiÖn theo nguyªn t¾c lai vµ ®−îc gäi lµ lai Western. Tuy
nhiªn, kh«ng gièng c¸c ph−¬ng ph¸p lai axit nucleic dùa trªn nguyªn t¾c liªn kÕt
Chargaff (b¶ng 11.2), lai Western lµ ph−¬ng ph¸p ®Þnh tÝnh protein dùa trªn nguyªn t¾c
miÔn dÞch; v× vËy, nã
cßn ®−îc gäi lµ thÈm B¶ng 11.2. C¸c ph−¬ng ph¸p lai ®Ó ph©n tÝch ADN, ARN vµ protein
t¸ch miÔn dÞch
(immunoblotting). Ph−¬ng ph¸p lai Lo¹i ph©n tö cÇn ph©n tÝch B¶n chÊt mÉu dß
Trong lai Western,
Southern ADN ADN (m¹ch ®¬n)
c¸c ph©n tö protein
sau khi ®−îc ph©n Northern ARN ADN (m¹ch ®¬n)
t¸ch trªn ®iÖn di
Western Protein Kh¸ng thÓ
®−îc chuyÓn lªn
mµng. Mµng nµy sau South-Western Protein ADN (sîi kÐp)
®ã ®−îc ñ trong mét
348
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
dung dÞch chøa kh¸ng thÓ ®Æc hiÖu víi protein ®−îc quan t©m nghiªn cøu. Kh¸ng thÓ sÏ
g¾n vµo lo¹i protein t−¬ng øng ë trªn mµng. Cuèi cïng, b»ng ph¶n øng enzym hiÖn mµu,
ng−êi ta cã thÓ quan s¸t ®−îc vÞ trÝ kh¸ng thÓ ë trªn mµng, qua ®ã cho biÕt sù cã mÆt vµ
khèi l−îng ph©n tö cña protein. Nh− vËy, ®iÓm chung cña tÊt c¶ c¸c ph−¬ng ph¸p lai
Southern, Northern vµ Western lµ sö dông c¸c hîp chÊt chän läc ®Ó ph¸t hiÖn sù cã mÆt
cña mét hoÆc mét sè lo¹i ph©n tö ®Æc thï trong c¸c hçn hîp phøc t¹p.
Mét ph−¬ng ph¸p lai c¶i tiÕn kh¸c ®−îc dïng ®Ó ph¸t hiÖn c¸c protein liªn kÕt ADN
lµ lai South-Western. Trong ph−¬ng ph¸p nµy, ng−êi ta dïng mÉu dß ADN (thay cho
kh¸ng thÓ trong lai Western) ®Ó lai víi c¸c protein. NÕu nh− trong lai Southern, mÉu dß
ADN th−êng ë d¹ng m¹ch ®¬n, th× mÉu dß trong lai South-Western th−êng ë d¹ng sîi kÐp,
v× phÇn lín protein liªn kÕt víi ADN sîi kÐp.
H×nh 11.17. Gi¶i tr×nh tù protein trùc tiÕp b»ng ph−¬ng ph¸p biÕn tÝnh Edman (vÏ theo Watson vµ cs, 2004)
349
§inh §oµn Long
®Òu cã thÓ ®−îc kh¾c phôc b»ng c¸ch dïng protease c¾t c¸c ®o¹n peptide lín thµnh c¸c
®o¹n peptide nhá h¬n tr−íc khi gi¶i tr×nh tù. Víi ®o¹n peptide dµi 30 axit amin, ®é chÝnh
x¸c trong gi¶i tr×nh tù cña ph−¬ng ph¸p Edman lµ 98%. Dùa trªn nguyªn lý biÕn tÝnh
Edman, m¸y gi¶i tr×nh tù protein tù ®éng còng ®· ®−îc ph¸t triÓn vµ dïng réng r·i.
a) b)
Ph©n tö mÉu ë
C¶m biÕn tø cùc (bÉy ion)
Vïng chuyÓn
tr¹ng th¸i
C¶m biÕn TOF
350
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
100.000 Da trong mét lÇn “c«ng ph¸” mÉu. Tuy vËy, víi c¸c c¶i tiÕn kü thuËt kh«ng
ngõng, cã lÏ thêi gian tíi, giíi h¹n ph©n tÝch protein cña MALDI-TOF sÏ cßn tiÕp tôc
t¨ng lªn.
NÕu MALDI lµ kü thuËt ®−îc dïng ®Ó t¹o ra c¸c ion ë d¹ng khÝ tõ chÊt r¾n, th× ESI
®−îc dïng ®Ó t¹o ra c¸c ion ë d¹ng khÝ tõ dÞch láng. Trong ESI, ng−êi ta dïng mét mao
qu¶n ®Ó nhá giät chÊt láng vµo tr−êng ®iÖn tõ cã hiÖu ®iÖn thÕ cao (h×nh 11.18b). Dung
m«i sÏ bay h¬i nhanh vµ giät nhá sÏ “vì ra”. Sù vì ra nh− vËy diÔn ra nhiÒu lÇn liªn tiÕp
t¹o nªn c¸c ion ®éc lËp (ion trÇn). C¸c h¹t ion ®−îc gia tèc bay trong èng ch©n kh«ng ®Õn
khi tiÕp cËn vµ ®−îc ®o khèi l−îng bëi bé c¶m biÕn tø cùc, cßn gäi lµ bÉy ion. Nh− vËy,
bÉy ion th−êng ®−îc dïng víi khèi phæ ESI. Khèi phæ ESI cã −u ®iÓm lµ nã th−êng ®−îc
nèi trùc tiÕp víi mét hÖ thèng ph©n t¸ch dÞch láng, bao gåm c¸c kü thuËt ®iÖn di mao
qu¶n (CE) hoÆc s¾c ký láng cao ¸p (HPLC). MÆc dï th«ng th−êng kh«ng ®−îc nèi trùc
tiÕp víi c¸c hÖ thèng MALDI-TOF, nh−ng c¸c kü thuËt CE vµ HPLC còng cã thÓ ®−îc
dïng ®Ó tinh s¹ch protein tr−íc khi ph©n tÝch b»ng MALDI-TOF.
Ngoµi ra, trong kü thuËt MS, do hiÖn t−îng c¸c ion “gèc” cã thÓ ph©n r· thµnh c¸c
ion “con”, nªn kü thuËt khèi phæ cã thÓ ®−îc thùc hiÖn nhiÒu lÇn kÕ tiÕp ®Ó thu ®−îc c¸c
sè liÖu ph©n tÝch chi tiÕt h¬n vÒ mçi ph©n tö protein. Kü thuËt nµy ®−îc gäi lµ khèi
phæ kÕ tiÕp (viÕt t¾t lµ MS/MS). Kü thuËt nµy cho phÐp ph©n biÖt ®−îc hai ion cã cïng
khèi l−îng (vÝ dô: ®Ó ph©n biÖt hai ®o¹n peptide ng¾n cã cïng thµnh phÇn axit amin
nh−ng kh¸c nhau vÒ tr×nh tù). Trong thùc tÕ, ®Ó gi¶i
tr×nh tù c¸c ®o¹n peptide hoÆc protein míi, ng−êi ta a)
YÕu tè phiªn m·
th−êng ph¶i dïng ph−¬ng ph¸p khèi phæ kÕ tiÕp. MiÒn liªn MiÒn ho¹t
kÕt ADN hãa enzym
11.3.6. Ph©n tÝch t−¬ng t¸c protein - protein
Däc theo gi¸o tr×nh nµy, chóng ta nhËn thÊy ADN ARN pol
c¸c mèi t−¬ng t¸c gi÷a c¸c ®¹i ph©n tö (ADN, ARN Gen chØ thÞ
vµ protein) cã vai trß trung t©m ®iÒu hßa hÇu hÕt c¸c VÞ trÝ Gen biÓu hiÖn
ho¹t ®éng sèng cña tÕ bµo vµ c¬ thÓ sinh vËt. Trong nhËn biÕt
®ã, t−¬ng t¸c gi÷a c¸c protein víi nhau cã vai trß b)
quyÕt ®Þnh trùc tiÕp ®ång thêi cã tÝnh ®a d¹ng vµ “VËt s¨n måi”
MiÒn ho¹t
phøc t¹p nhÊt. Cã nhiÒu ph−¬ng ph¸p kh¸c nhau hãa enzym
®−îc dïng ®Ó ®¸nh gi¸ t−¬ng t¸c gi÷a c¸c protein nh»m
“Måi”
gãp phÇn lµm s¸ng tá chøc n¨ng cña chóng. ë ®©y, MiÒn liªn
chóng ta chØ ®Ò cËp ®Õn 3 ph−¬ng ph¸p lµ: (1) hÖ kÕt ADN “VËt s¨n måi”
thèng lai hai dßng ë nÊm men, (2) ®ång kÕt tña miÔn kh«ng b¾t
dÞch vµ (3) kü thuËt vi d·y protein. ARN pol ®−îc “måi”
Gen chØ thÞ
11.3.6.1. HÖ thèng lai hai dßng ë nÊm men Gen kh«ng biÓu hiÖn
HÖ thèng lai hai dßng dùa trªn ®Æc ®iÓm cÊu
tróc ph©n tö cña phÇn lín protein ho¹t hãa phiªn m·. c)
“VËt s¨n måi”
Tõ ch−¬ng 5 chóng ta biÕt r»ng, nhiÒu protein ho¹t “Måi”
MiÒn ho¹t
hãa phiªn m· cã hai miÒn ho¹t tÝnh: miÒn liªn kÕt hãa enzym
MiÒn liªn
ADN, viÕt t¾t lµ DBD (th−êng nhËn ra c¸c ®o¹n tr×nh kÕt ADN
tù ®Æc hiÖu ng−îc dßng promoter) vµ miÒn ho¹t hãa, “VËt s¨n måi”
ARN pol b¾t ®−îc “måi”
viÕt t¾t lµ AD (cã vai trß thóc ®Èy phiªn m· sau khi Gen chØ thÞ
®Ýnh kÕt víi ARN polymerase). Khi hai miÒn nµy
Gen biÓu hiÖn
t−¬ng t¸c víi nhau, chóng ho¹t hãa sù phiªn m· cña
gen. VÒ nguyªn t¾c, hai miÒn AD vµ DBD kh«ng nhÊt H×nh 11.19. Nguyªn t¾c cña hÖ thèng lai
thiÕt ph¶i liªn kÕt céng hãa trÞ trªn cïng ph©n tö hai dßng. Xem néi dung trong phÇn diÔn
gi¶i (vÏ theo Clark, 2006).
351
§inh §oµn Long
protein. ThÕ nªn, trong hÖ thèng lai hai dßng, hai miÒn AD vµ DBD ®−îc "dung hîp" víi
hai protein kh¸c nhau, gi¶ sö ®−îc kÝ hiÖu lµ A vµ B (h×nh 11.19). Hai protein lai nµy
®−îc coi lµ "måi" (AD-A) vµ "vËt s¨n måi" (DBD-B). NÕu "vËt s¨n måi" b¾t ®−îc "måi", tøc
lµ A vµ B t−¬ng t¸c víi nhau, mét phøc hÖ sÏ h×nh thµnh vµ ho¹t hãa gen. Ng−êi ta sö
dông mét gen chØ thÞ ®Ó x¸c nhËn cã hay kh«ng sù t−¬ng t¸c gi÷a hai protein lai.
M« h×nh lai hai dßng ®−îc ph¸t triÓn ë nÊm men vµ ®−îc dïng ®Ó kiÓm tra mèi
t−¬ng t¸c gi÷a kho¶ng 6000 lo¹i protein kh¸c nhau ë sinh vËt nµy. Theo lý thuyÕt, sÏ
ph¶i kiÓm tra 6000x6000 tæ hîp protein kh¸c nhau. §Ó thùc hiÖn ®−îc ®iÒu ®ã, mçi ORF
cña hÖ gen nÊm men ®Òu ®−îc nh©n dßng vµo hai lo¹i vect¬ kh¸c nhau: mét vect¬ mang
miÒn AD, cßn mét vect¬ mang miÒn DBD. Nãi c¸ch kh¸c, mçi protein cña nÊm men ®Òu
®−îc kiÓm tra trong vai trß lµ "måi" vµ "vËt b¾t måi". C¸c vect¬ ®Òu ®−îc thiÕt kÕ sao cho
c¸c ORF t−¬ng øng víi hai miÒn AD vµ DBD ®Òu ®−îc ho¹t hãa biÓu hiÖn bëi cïng mét
yÕu tè ho¹t hãa phiªn m·, vÝ dô nh− GAL4 (h×nh 11.20). Vect¬ A cã vÞ trÝ "®a nh©n dßng"
n»m ng−îc dßng ®o¹n gen GAL4-AD gióp t¹o nªn ph©n tö lai A-GAL4-AD, cßn vect¬ B
cã vÞ trÝ n»m xu«i dßng ®o¹n gen GAL4-DBD gióp t¹o nªn ph©n tö lai GAL4-DBD-B.
Hai vect¬ plasmid lai ®−îc biÕn n¹p vµo c¸c tÕ bµo nÊm men kh¸c giíi tÝnh. KÕt qu¶
lµ h×nh thµnh hai nhãm giíi tÝnh, mçi nhãm gåm 6000 dßng tÕ bµo nÊm men mang c¸c
vect¬ biÕn n¹p kh¸c nhau. Sau ®ã, mçi dßng tÕ bµo thuéc nhãm nµy (giíi tÝnh nµy) ®−îc
®em lai víi mçi dßng thuéc
§iÓm khëi ®Çu sao
nhãm kia (giíi tÝnh kia). §iÓm chÐp ë vi khuÈn
NghÜa lµ mäi kh¶ n¨ng tæ khëi ®Çu
hîp gi÷a c¸c AD vµ DBD sao chÐp
ë nÊm Vect¬ Vect¬
thuéc c¸c protein kh¸c nhau men “måi”
“vËt b¾t måi”
®Òu x¶y ra. Khi c¸c dßng (B) (A)
nÊm men "lai" víi nhau,
chóng h×nh thµnh nªn d¹ng Promoter Tr×nh tù “vËt b¾t måi” Tr×nh tù “måi”
bµo tö l−ìng béi (2n) mang
c¶ hai plasmid "måi" vµ "vËt
s¨n måi". NÕu hai protein “vËt b¾t måi”
“måi”
lai lµ A vµ B t−¬ng t¸c víi
nhau, gen chØ thÞ sÏ biÓu T−¬ng t¸c ¸i
hiÖn. Trong m« h×nh ë nÊm lùc cao gi÷a
men, hai gen chØ thÞ ®−îc sö c¸c protein
dông lµ HIS3 vµ URA3. NÕu
gen HIS3 vµ URA3 kh«ng
®−îc ho¹t hãa, tÕ bµo nÊm
men sÏ chÕt nÕu m«i tr−êng
kh«ng cã t−¬ng øng histidine
(His) vµ uracine (U). Nh−
vËy, nÕu tÕ bµo nÊm men lai
(2n) cã thÓ sinh tr−ëng ®−îc
trªn m«i tr−êng kh«ng cã
ARN ARN
His hoÆc U th× chøng tá c¸c ADN pol pol
ADN
gen chØ thÞ HIS3 vµ URA3 ®·
®−îc ho¹t hãa; tøc lµ hai
protein A vµ B ®· t−¬ng t¸c
víi nhau. Trªn m« h×nh ë
Chän läc trªn m«i Chän khuÈn l¹c mµu xanh lam
h×nh 11.20, hai gen chØ thÞ tr−êng thiÕu His (His-) trªn m«i tr−êng cã X-gal
®−îc dïng lµ HIS3 vµ LacZ.
Trong ®ã, gen LacZ m· hãa H×nh 11.20. C¸c vect¬ ®−îc thiÕt kÕ cho hÖ thèng lai hai dßng.
Xem néi dung trong phÇn diÔn gi¶i (vÏ theo Clark, 2006).
cho β-galactosidase. Enzym
352
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
nµy chuyÓn hãa hîp chÊt kh«ng mµu lµ X-gal (5- Ph©n tö ARN
brom-4-chlor-3-idolyl-β-D-galactoside) thµnh
hîp chÊt cã mµu xanh lam lµ 5-brom-4-chlor-
MiÒn liªn MiÒn ho¹t
indigo. V× vËy, khi gen chØ thÞ lµ LacZ, nÕu cã kÕt ADN hãa enzym
t−¬ng t¸c gi÷a c¸c protein, tÕ bµo sÏ cã mµu
xanh lam khi nu«i trong m«i tr−êng cã X-gal. ADN ARN pol
¦u ®iÓm næi bËt nhÊt cña hÖ thèng lai Gen chØ thÞ
kÐp ë nÊm men lµ cho phÐp ®¸nh gi¸ sù t−¬ng VÞ trÝ
t¸c protein – protein trong tÕ bµo. Tuy vËy, nã nhËn biÕt
còng cã mét sè h¹n chÕ. KiÓu t−¬ng t¸c protein H×nh 11.21. M« h×nh lai ba dßng.
- protein nµy chØ giíi h¹n trong nh©n tÕ bµo.
HÇu hÕt c¸c protein mµng tÕ bµo "gÊp nÕp" sai Gen ®ang Tr×nh tù FLAG
khi ë trong nh©n; ng−îc l¹i, c¸c protein trong nghiªn cøu
nh©n cã xu h−íng bÞ “biÕn ®æi” sai khi ë tÕ bµo
chÊt. §éc tÝnh t¹o ra do sù t−¬ng t¸c gi÷a c¸c ADN
protein lín (c¸c protein lai th−êng cã kÝch plasmid
BiÕn n¹p vµo tÕ
th−íc lín h¬n d¹ng tù nhiªn) cã thÓ dÉn ®Õn bµo ®éng vËt
viÖc ®¸nh gi¸ sai mét sè t−¬ng t¸c quan träng. Promoter nu«i cÊy in vitro
Ngoµi ra, mét sè t−¬ng t¸c protein-protein cßn ®éng vËt cã vó
Thu tÕ bµo vµ
phô thuéc vµo sù cã mÆt cña ARN hoÆc mét sè t¸ch tÕ bµo chÊt
ph©n tö nhá kh¸c kh«ng chøng minh ®−îc
b»ng m« h×nh nµy. Protein Kh¸ng thÓ
kh¸c
cña FLAG
Mét hÖ thèng lai ®−îc c¶i tiÕn nh»m kh¾c
Phøc hÖ
phôc h¹n chÕ trªn ®−îc gäi lµ hÖ thèng lai ba protein
H¹t ®−îc
dßng (h×nh 11.21). Trong hÖ thèng nµy, hai “bäc” b»ng
protein (AD-A vµ DBD-B) ®−îc ®¸nh gi¸ t−¬ng protein A
t¸c ®ång thêi víi ph©n tö ARN mµ c¶ hai
protein cïng liªn kÕt. M« h×nh nµy cã thÓ ®−îc
dïng ®Ó sµng läc c¸c protein t−¬ng t¸c ARN. Ly t©m thu h¹t vµ ch¹y
®iÖn di trªn gel SDS-PAGE
HÖ thèng lai hai dßng ë nÊm men còng cã
thÓ ¸p dông víi c¸c gen tõ c¸c loµi kh¸c. Ngoµi
ra, mét sè h·ng (nh− Stratagene, Mü) ®· thiÕt 3 lo¹i protein liªn kÕt trong phøc hÖ
lËp hÖ thèng lai hai dßng dïng vi khuÈn E.
coli. Trong m« h×nh ë E. coli, hai gen chØ thÞ Protein ®−îc ®¸nh dÊu bëi FLAG
®−îc dïng lµ bla (kh¸ng ampicillin) vµ lacZ.
H×nh 11.22. Ph−¬ng ph¸p ®ång kÕt tña miÔn dÞch.
11.3.6.2. Ph−¬ng ph¸p ®ång kÕt tña miÔn dÞch
ë ®éng vËt cã vó, sù t−¬ng t¸c gi÷a c¸c protein cã thÓ x¸c ®Þnh ®−îc b»ng ph−¬ng
ph¸p ®ång kÕt tña miÔn dÞch (h×nh 11.22). Gen m· hãa cho protein ®−îc biÕn n¹p vµ
biÓu hiÖn trong tÕ bµo ®éng vËt; sau ®ã, ph©n lËp lo¹i protein ®−îc quan t©m nghiªn cøu
võa tæng hîp tõ tÕ bµo chÊt nhê kh¸ng thÓ. Trong tr−êng hîp ch−a cã kh¸ng thÓ t−¬ng
øng, th× protein ®−îc “g¾n” víi mét peptide ®¸nh dÊu, gäi lµ FLAG. Sau ®ã, kh¸ng thÓ
t−¬ng øng víi FLAG ®−îc dïng ®Ó ph©n lËp protein cÇn nghiªn cøu. Th−êng th× viÖc
ph©n lËp protein dùa trªn nguyªn t¾c “kh¸ng nguyªn - kh¸ng thÓ” ®−îc thùc hiÖn trong
®iÒu kiÖn in-vitro gièng víi ®iÒu kiÖn in-vivo. V× vËy, sau khi ph©n lËp, protein nghiªn
cøu ngoµi liªn kÕt víi kh¸ng thÓ cßn ®ång thêi ë d¹ng phøc hÖ víi c¸c protein kh¸c. Phøc
hÖ protein nµy sau ®ã ®−îc ph©n t¸ch bëi ®iÖn di SDS-PAGE nh»m x¸c ®Þnh xem cã bao
nhiªu protein thµnh phÇn tham gia vµo phøc hÖ. ViÖc x¸c ®Þnh protein thµnh phÇn cã thÓ
thùc hiÖn b»ng ph−¬ng ph¸p khèi phæ hoÆc gi¶i tr×nh tù protein.
353
§inh §oµn Long
Ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®ång kÕt tña Th− viÖn protein
miÔn dÞch ®Ó kiÓm tra mèi t−¬ng t¸c protein – protein HHHHHH ®¸nh dÊu bëi His6
trong hÖ thèng lai hai dßng. Tr−íc tiªn, mçi lo¹i
HHHHHH
protein ®−îc quan t©m nghiªn cøu sÏ ®−îc “g¾n” t−¬ng HHHHHH
øng víi c¸c peptide ®¸nh dÊu lµ FLAG vµ His6. Hai
HHHHHH
cÊu tróc ADN m· hãa t−¬ng øng cho c¸c protein “dung HHHHHH
hîp” nµy ®−îc “®ång biÕn n¹p” vµo tÕ bµo ®éng vËt. His6 HHHHHH
Sau ®ã, lÇn l−ît mçi lo¹i kh¸ng thÓ t−¬ng øng víi tõng
peptide ®¸nh dÊu ®−îc dïng ®Ó ph©n lËp phøc hÖ
protein; phøc hÖ nµy sau ®ã ®−îc tiÕn hµnh ®iÖn di
+
SDS-PAGE. Gel ®iÖn di sau ®ã ®−îc chuyÓn lªn mµng
nitrocellulose vµ ®−îc lai víi “mÉu dß” kh¸ng thÓ
t−¬ng øng víi His6 (anti-His6) vµ FLAG (anti-FLAG).
NÕu hai lo¹i protein t−¬ng t¸c víi nhau, chóng xuÊt
Lam kÝnh
hiÖn trªn c¶ hai b¶n gel trong lai Western. g¾n ion Niken
354
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
m«, tÕ bµo hoÆc c¬ thÓ t¹o ra trong ®iÒu kiÖn nhÊt ®Þnh, ®ång thêi x¸c ®Þnh møc ®é phæ
biÕn cña mçi lo¹i protein vµ sù t−¬ng t¸c cña chóng víi nhau vµ víi c¸c ph©n tö kh¸c
(nh− ADN hay ARN). NÕu nh− c¸c kü thuËt vi d·y ADN cã thÓ gióp x¸c ®Þnh ®−îc sù
biÓu hiÖn cña c¸c gen trªn cë së ph©n tÝch hÖ gen, th× c¸c kü thuËt proteomics cho phÐp
x¸c ®Þnh ®−îc bøc tranh tæng thÓ vÒ toµn bé protein cña mçi tÕ bµo, m« hoÆc c¬ thÓ.
Proteomics dùa trªn ba ph−¬ng ph¸p chÝnh, bao gåm: (1) 2D-PAGE ®Ó ph©n t¸ch
c¸c protein, (2) MS ®Ó x¸c ®Þnh khèi l−îng ph©n tö vµ tr×nh tù axit amin, (3) tin sinh häc
®Ó so s¸nh gi÷a c¸c ph©n tö protein vµ c¸c ®o¹n peptide víi c¸c tr×nh tù m· hãa chóng
trong hÖ gen. Trong thùc tÕ, c¸c nghiªn cøu hÖ gen häc (genomics) vµ hÖ protein häc
(proteomics) th−êng ®−îc phèi hîp víi nhau trong c¸c nghiªn cøu di truyÒn häc ph©n tö
hiÖn ®¹i.
Bªn c¹nh hÖ gen häc vµ hÖ protein häc, gÇn ®©y mét lÜnh vùc nghiªn cøu míi còng
th−êng ®−îc phèi hîp víi hai chuyªn ngµnh nªu trªn ®−îc gäi lµ hÖ chuyÓn hãa häc
hay hÖ trao ®æi chÊt häc (metabolomics). HÖ chuyÓn hãa häc nghiªn cøu toµn bé c¸c
chÊt chuyÓn hãa ®−îc tÝch lòy trong mét m«, tÕ bµo hoÆc c¬ thÓ ë nh÷ng ®iÒu kiÖn nhÊt
®Þnh. HÇu hÕt c¸c chÊt chuyÓn hãa hiÖn nay ®Òu cã thÓ x¸c ®Þnh ®−îc b»ng ph−¬ng ph¸p
khèi phæ (MS), hoÆc ®«i khi b»ng ph−¬ng ph¸p céng
h−ëng tõ h¹t nh©n (NMR). Ph−¬ng ph¸p MS cã ®é nh¹y
C¸c protein ®−îc sµng läc cao vµ cã thÓ dïng ph©n tÝch nhiÒu nhãm ph©n tö kh¸c
nhau. 12C cã khèi l−îng ®óng 12 Da. Trong khi ®ã, khèi
His6 l−îng cña c¸c nguyªn tö kh¸c, nh− 14N hay 16O, kh«ng
ph¶i lµ mét sè nguyªn. C¸c ph−¬ng ph¸p MS sö dông ®é
Ni Ni Ni Ni Ni Ni
ph©n gi¶i khèi l−îng cùc cao, gäi lµ EHMR, cã thÓ gióp
Lam x¸c ®Þnh chÝnh x¸c c«ng thøc ph©n tö cña hÇu hÕt mäi
ñ víi phospholipid ®−îc kÝnh
®¸nh dÊu b»ng Biotin chÊt chuyÓn hãa trong tÕ bµo sinh vËt, kÓ c¶ c¸c ®ång
ph©n (cã c«ng thøc ph©n tö gièng nhau).
Biotin
Phospholipid C¸c ph©n tÝch hÖ chuyÓn hãa ®Æc biÖt h÷u Ých
trong nghiªn cøu c¸c chÊt sinh häc thø cÊp (nh− c¸c chÊt
t¹o mµu, t¹o mïi, c¸c alkaloid, saponin, v.v…) vèn ®Æc
Ni Ni Ni Ni Ni Ni thï ë thùc vËt. VÝ dô, khi sö dông c¶ hai dÞch chiÕt n−íc
vµ h÷u c¬ tõ qu¶ d©u t©y, ng−êi ta ®· x¸c ®Þnh ®−îc
Bæ sung avidin g¾n víi kho¶ng 7000 chÊt chuyÓn hãa kh¸c nhau. NÕu in ra th×
chÊt ph¸t quang Cy3 phæ EHMR cã thÓ dµi vµi ba km. ViÖc so s¸nh hÖ chuyÓn
hãa gi÷a mét d¹ng ®ét biÕn qu¶ tr¾ng víi d¹ng kiÓu d¹i
ChÊt ph¸t quang qu¶ ®á ®· trùc tiÕp cho thÊy sù kh¸c nhau vÒ hµm l−îng
Avidin Avidin
mét sè chÊt chuyÓn hãa trung gian trong con ®−êng tæng
hîp c¸c chÊt t¹o mµu (s¾c tè) nãi chung vµ s¾c tè ®á nãi
riªng (h×nh 11.25).
Ni Ni Ni Ni Ni Ni Qu¶ tr¾ng
Qu¶ ®á
X
Y
H×nh 11.24. Sµng läc protein b»ng
ph−¬ng ph¸p vi dny sö dông H×nh 11.25. Phæ MS cho biÕt thµnh phÇn c¸c chÊt chuyÓn hãa kh¸c
Biotin / Streptavidin. nhau gi÷a d¹ng kiÓu d¹i (qu¶ ®á) vµ ®ét biÕn (qu¶ tr¾ng) ë d©u t©y.
355