You are on page 1of 12

DNA Sequencing

II. Các phương pháp giải trình tự DNA ( DNA Sequencing)


1. Mục đích:
- Trong việc nghiên cứu, việc giải mã bộ gene có thể hỗ trợ xây dựng và định
danh loài sinh vật đó thông qua bản đồ nhiễm sắc thể, thu được thông tin về
cấu trúc, chức năng của đoạn gene mang thông tin di truyền.
- Trong khoa học y tế, con người dựa vào hiểu biết về cấu trúc, chức năng của
các đoạn DNA có thể chuẩn đoán nguy cơ đột biến gene, phát hiện các hội
chứng, bệnh tật để kịp thời và nhanh chóng can thiệp xử lý đoạn gene mang
bệnh.
- Trong khoa học pháp y, việc giải trình tự DNA giúp nhận diện tội phạm và nạn
nhân, xác minh huyết thống và nhiều bằng chứng phục vụ việc điều tra.
2. Các phương pháp phổ biến hiện nay
a. Giải trình tự bằng phương pháp hóa học- Maxam- Gilbert sequencing
+ Giới thiệu:
Được hai nhà khoa học Maxam và Gilbert phát minh vào năm 1977, là một phương
pháp hóa học để giải trình tự DNA. Phương pháp này đã trở nên phổ biến vào thời
điểm đó, nhưng sau đó đã bị thay thế bởi sự cải tiến của phương pháp Sanger.
Dụng cụ điện di mao quản (CE) có khả năng thực hiện cả giải trình tự Sanger và phân
tích đoạn. Trong đó phân tích đoạn là phương pháp các đoạn DNA được dán nhãn
huỳnh quang, phân tách bằng CE và định kích thước bằng cách so sánh với chất chuẩn
nội.
Mặc dù trình tự DNA bằng CE được sử dụng để xác định trình tự cơ sở cụ thể của một
đoạn gen hoặc đoạn gen cụ thể, nhưng kỹ thuật này cũng có thể cung cấp thông tin về
kích thước, định lượng tương đối và kiểu gen cho các đoạn DNA được đánh dấu
huỳnh quang được tạo ra bằng PCR sử dụng các đoạn mồi được thiết kế cho một mục
tiêu DNA cụ thể. .
Phân tích các đoạn DNA cho phép ứng dụng từ xác thực dòng tế bào đến phát hiện dị
tật. Mặc dù các kỹ thuật giải trình tự cũng cho phép các ứng dụng này, nhưng các nhà
nghiên cứu chọn phân tích phân đoạn vì nó có thời gian quay vòng nhanh hơn, độ
nhạy và độ phân giải cao hơn cũng như tiết kiệm chi phí hơn.
+ Cơ chế
- Đánh dấu một đầu 5’ của đoạn DNA cần giải trình tự bằng một gốc Phospho
đồng vị phóng xạ là 32P.
- Xử lý đoạn DNA đánh dấu với chất hóa học có khả năng biến đổi đặc hiệu một
hoặc hai loại base của nucleotide (Ví dụ: Dimethylsulphate, biến đổi Guanine
bằng cách them một gốc methyl ở Nitrogen 7- N7; Hydrazine và NaCl, làm
biến đổi Cytosine; acid làm biến đổi Guanine và Adenine; NaOH làm biến đổi
Adenine và Cytosine với Adenine ưu tiên hơn Cytosine), và cần ít nhất 4 ống
nghiệm để làm thay đổi 4 Nucleotide.
- Các Nucleotide đã bị biến đổi sẽ bị lấy ra khỏi khung sườn đường- Phosphate
(Sugar- Phosphate backbone) của DNA và nhờ đó tách ra được các đoạn mạch
đơn có một đầu đánh dấu 32P và một đầu đã mất base.

- Bắt đầu thực hiện điện mẫu đã xử lý trên hàng của một gel polyacrylamide
biến tính để các mạch đơn trong mẫu di chuyển trong gel không bị biến đổi.
Sau khi hoàn tất, các mạch đơn sẽ dừng lại tại các vị trí khác nhau, tùy thuộc
dài hay ngắn và sắp xếp nối dọc theo chiều dài gel. Áp gel này trên một phim
nhạy tia X, nhờ vào các đầu được đánh dấu phóng xạ 32P, có thể xác định vị trí
dừng lại của các đoạn mạch trên phim tạo thành các vạch phim. Từ các vạch
phim (autoradiography), có thể đọc được các trình tự Nucleotide.
+ Ưu điểm
- Cho phép sử dụng các đoạn ADN mẫu không cần nhân bản thêm
+ Nhược điểm
- Vì phải sử dụng nhãn phóng xạ, các hóa chất gây nguy hiểm cho người dùng
và kỹ thuật có độ phức tạp cao nên phương pháp này thường không được
khuyến khích sử dụng.
b. Giải trình tự bằng phương pháp kết thúc chuỗi – phương pháp Sanger
(Giải trình tự thế hệ thứ 1)
+ Giới thiệu
Trình tự Sanger được phát triển bởi Fred Sanger nhà hóa sinh người Anh và các đồng
nghiệp năm 1977, cùng thời điểm với phương pháp Maxam- Gilbert.
Các nhà nghiên cứu chọn giải trình tự Sanger khi thực hiện giải trình tự thông lượng
thấp, nhắm mục tiêu hoặc đọc ngắn. Do độ nhạy và tính đơn giản tương đối về cả quy
trình làm việc và kỹ thuật, trình tự Sanger vẫn là tiêu chuẩn vàng trong công nghệ giải
trình tự ngày nay và được sử dụng trong nhiều ứng dụng từ giải trình tự mục tiêu đến
xác nhận các biến thể được xác định bằng phương pháp trực giao.
Giải trình tự Sanger sử dụng phương pháp kết thúc chuỗi (chain termination) để cung
cấp nhận dạng và thứ tự của các bazơ nucleotide trong một chuỗi DNA nhất định.
+ Cơ chế
- Phương pháp này sử dụng các chất tương tự hóa học của bốn bazơ nucleotide.
Được gọi là ddNTP, bằng việc sử dụng các deoxy nucleotide đã bị chỉnh sửa
làm mất nhóm hydroxyl ở đầu 3’ của phân tử đường (phân tử dNTP bị xử lý
mất Nhóm 3’-OH trở thành phân tử ddNTP).
- Nhóm 3’-OH đóng vai trò cho phép gắn thêm một nucleotide mới vào chuỗi,
cần thiết để mở rộng chuỗi polynucleotide tạo thành phân tử DNA. Khi một
ddNTP được thêm vào chuỗi, vì không có nhóm 3’-OH nên một nucleotide
không được thêm vào, phản ứng tổng hợp sẽ dừng lại.
- Dựa trên nguyên tắc này, ta tiến hành một phản ứng tổng hợp Bằng cách trộn
một lượng giới hạn ddNTP được đánh dấu phóng xạ với DNA mẫu chứa cả
dNTP, các chuỗi hình thành có độ dài khác nhau có thể được tạo ra khi các
ddNTP được kết hợp ngẫu nhiên, kết thúc chuỗi. Dựa vào sự sai khác về độ dài
các đoạn DNA hiển thị trên bản gel sau điện di để xác định trình tự trong gene.
- Sử dụng 4 ống nghiệm chứa 4 loại ddNTP khác nhau được đánh dấu đồng vị
phóng xạ đồng thời được thực hiện phản ứng tổng hợp. Sau đó sản phẩm của 4
ống nghiệm được điện di hiện đồng vị phóng xạ trên cùng một bản gel để quan
sát các band DNA. Căn cứ vào vị trí các vạch quan sát được trên bản gel mà
xác định trình tự các nucleotide theo chiều từ 5 -3 từ dưới lên trên.
- Ngày nay người ta sử dụng các máy giải trình tự động để sắp xếp trình tự các
band điện di. Kỹ thuật giải trình tự DNA tự động (Dye temination sequencing)
sử dụng các ddNTP có đánh dấu huỳnh quang đã giúp cho việc sắp xếp trình tự
DNA trở nên nhanh chóng và hiệu quả hơn. Mỗi loại ddNTP được gắn một
màu có bước sóng phát xạ huỳnh quang khác nhau cho phép thực hiện giải
trình tự trong một phản ứng duy nhất.
- Hệ thống điện di mao quản được sử dụng để đọc trình tự DNA một cách tự
động. Cấu tạo của máy gồm 4- 24 mao quản chứa gel polyacrylamide cho phép
phân tích nhiều mẫu trong một lần điện di. Hệ thống detector gồm các camera
có chùm tia laser đi qua nó để ghi nhận tín hiệu huỳnh quang một cách chính
xác. Nguyên tắc hoạt động của máy là trong suốt quá trình điện di, khi có một
vạch điện di đi qua chùm tia laser thì vạch điện di sẽ phát sáng và được camera
ghi nhận và lưu lại thành một cường độ đỉnh sáng (peak) trong biểu đồ. Từ
biểu đồ của các đỉnh cường độ sáng này, máy sẽ so dòng của các đỉnh tương
ứng với nhau và phân tích thành trình tự của đoạn DNA.

+ Ưu điểm:
- Mang lại trình tự có độ chính xác cao đối với cho các đoạn DNA có chiều dài
lên đến khoảng 900 bps, thao tác thực hiện đơn giản dễ tiếp cận, được sử dụng
cho các đoạn DNA riêng lẻ, chẳng hạn như plasmid của vi khuẩn hoặc trình
tự DNA đích được khuếch đại sau phản ứng PCR.
+ Nhược điểm:
- Không hiệu quả với các dự án quy mô lớn (giải trình tự toàn bộ gene)

c. Giải trình tự thế hệ mới – Next-generation sequencing (NGS)


+ Giới thiệu:
Giải trình tự thế hệ tiếp theo (NGS) Các kỹ thuật giải trình tự thế hệ mới có thể xem là
sự kết hợp của sinh học, hóa học, công nghệ nano và cả sinh tin học.
Kỹ thuật này được ra đời vào những năm 70 của thế kỷ 20. Trải qua gần 20 năm phát
triển, giải trình tự gen thế hệ mới đã trải qua 4 thế hệ với những bước tiến dài vượt bậc
giúp con người giải mã được nhiều hệ gen.

 Thế hệ 1: Sử dụng phương pháp phân tách ngẫu nhiên một đoạn DNA ngắn bằng
axit deoxyribonucleic để xác định trình tự nucleotide. Phương pháp này có tên
là Sanger. .

 Thế hệ 2: Giai đoạn này có 3 phương pháp nổi bật là Pyrosequencing (Đo lượng
PPi giải phóng trong phản ứng tổng hợp chuỗi DNA), Ion Semiconductor (Đo
tín hiệu ion H+ giải phóng trong phản ứng tổng hợp chuỗi DNA) và Illumina
(Đo tín hiệu từng loại huỳnh quang gắn vào Nucleotide trong phản ứng tổng
hợp chuỗi DNA)

 Thế hệ 3: Giải trình tự gen thế hệ mới sử dụng cách quan sát tín hiệu tức thời của
huỳnh quang đơn phân tử khi tiến sát vào một lỗ có kích thước nano chứa chuỗi
DNA.

 Thế hệ thứ 4: Đây là thế hệ mới nhất và vẫn đang trong quá trình hoàn thiện. Giai
đoạn này, các nhà khoa học sử dụng tín hiệu điện phân tử để phân tách và xác
định trình tự gen.

+ Cơ chế chung:
- Tạo thư viện DNA
- Nhũ tương hóa
- Giải trình tự
- Ghép nối

+ Ưu điểm chung:
- NGS là công nghệ cho phép giải mã đồng thời hàng triệu đoạn ADN trong
cùng lúc, qua đó giúp nâng cao hiệu suất của quá trình giải mã hệ gen người.
- Thời gian đọc nhanh, dữ liệu đầu ra lớn và tiết kiệm chi phí, khắc phục một số
nhược điểm của giải trình tự gen truyền thống (giảm khoảng 50.000 lần chi phí
và tăng từ 100 đến 1000 lưu lượng xử lý so với công nghệ trước đó [2000]).
+ Nhược điểm chung:
- Thời gian đầu, kỹ thuật này dựa trên các phương pháp hóa học rất mất thời
gian và tốn kém, đồng thời bị hạn chế về lưu lượng xử lý.

 Thế hệ 1: Sanger (b)


 Thế hệ 2:
o Pyrosequencing: được coi là một bước nâng cao của phương pháp Sanger. Dựa
trên nguyên lý “ đọc trình tự bằng tổng hợp”
- Trong đó, DNA sẽ cắt thành mảnh nhỏ và gắn lại với nhau bằng phản ứng của
enzyme. Các đoạn DNA sẽ được khuếch đại bằng cách nhũ tương hóa với các
hóa chất và chuyển vào Picotiter.
- Các thiết bị khoa học sẽ giúp nhận biết Pyrophosphate (PPi) đã giải phóng khi
gắn nucleotide. Sau cùng, bằng phần mềm tin sinh, các nhà khoa học sẽ gắn kết
các đoạn DNA đã được với nhau, tạo nên trình tự gen đầy đủ.
- Kỹ thuật này có lưu lượng xử lý dài khoảng 400 bp, giảm bớt chi phí và phân
tích được riêng từng đoạn DNA. Tuy nhiên, với các loại Nucleic acid bị lặp lại
liên tục trên 6 nu thì Pyrosequencing khó cho kết quả phân tích chính xác. Dù
đã có nâng cao so với phương pháp Sanger nhưng Pyrosequencing vẫn được
đánh giá là tốn kém, phức tạp, chưa có tính ứng dụng cao.
Link video: https://youtu.be/bNKEhOGvcaI
+ Ưu điểm:
- Độ dài đọc được là 400bp (tương đối dài) với độ chính xác càng về sau càng
tang
- Công nghệ cao, tạo trình tự hệ gene mà không cần tách dòng tạo thư viện
- Thư viện DNA có thể được mã hóa và tách riêng trong suốt quá trình tphân tích
kết quả.
+ Nhược điểm:
- Khó phân tích chính xác trình của 1 loại nucleotide lặp lại liên tục từ 6 lần trở
lên (TTTTTT)
- Phức tạp, nhiều công đoạn
- Giá thành cao
o Ion Torrent sequencing/Ion semiconductor sequencing
- Phương pháp này sử dụng các máy đo pH có kích thước siêu nhỏ được gắn vào
chip cảm ứng bán dẫn để nhận tín hiệu điện của ion H+. Các ion này sẽ được
giải phóng khi tổng hợp DNA.
- Phương pháp này không sử dụng quang học nên tiết kiệm chi phí đầu tư cho hệ
thống quang học (camera, phin lọc, đèn laser), có thể giải mã thế hệ gen người
trong 2-3 giờ và phân tích được riêng từng đoạn DNA. Tuy nhiên, phương
pháp này có độ chính xác giảm từ base thứ 250, tiến hành phức tạp, khó xác
định trình tự lặp lại liên tiếp của nucleotide và cần nhiều loại hóa chất có giá
thành.
+ Ưu điểm:
- Sử dụng công nghệ bán dẫn để đo tín hiệu thời gian, hệ thống may gọn nhẹ.
- Thời gian nhanh: 2-3h để phân tích gene người
- Giá thành hóa chất rẻ
- Thư viện DNA có thể được mã hóa và tách riêng trong suốt quá trình tphân tích
kết quả.
+ Nhược điểm:
- Chiều dài đọc 100-250bp (độ chính xác 99% tại base 250 và cao hơn tại các
base trước)
- Thao tác phức tạp, nhiều công đoạn
- Khó đếm chính xác trình tự lặp lại liên tục của 1 loại nucleotide ( 7A khó phân
biệt với 8A)

o Illumina
- Phương pháp này sử dụng các loại máy khoa học để xử lý các đoạn DNA và
hợp chất hóa học. Khi đó 1 A được mặc định gắn thêm vào đầu 3′ hoặc 5′ của
chuỗi DNA đang tổng hợp dựa theo nguyên tắc bổ sung.
- Giải trình tự gen thế hệ mới Illumina có ưu điểm nổi bật hơn hẳn Sanger là có
thể giải mã gen song song số lượng lớn các đoạn DNA khác nhau cùng lúc,
giúp tiết kiệm thời gian, đồng thời cho phép phân tích được riêng từng đoạn
DNA. Tuy nhiên, phương pháp này có độ chính xác giảm từ base thứ 250, cần
nhiều loại hóa chất có giá thành cao và cần 23 giờ để có thể thực hiện.
Link video: https://youtu.be/fCd6B5HRaZ8
+ Ưu điểm:
- 4 loại nuclêôtit được gắn hùynh quang khác nhau nên có thể phân tích được
các trình tự của một loại nuclêôtit lặp lại liên tục
- Thư viện DNA có thể được mã hóa và tách riêng trong suốt quá trình phân tích
kết quả
- Cộng đồng các nhà khoa học sử dụng hệ thống này phổ biến hơn
+ Nhược điểm:
- Giá thành hóa chất vẫn cao
- Chiều dài đọc chỉ khoảng 200- 250bp (độ chính xác 99%, tại base 250 và cao
hơn tại các base trước)
- Thời gian lâu: 23 giờ để phân tích bộ gene người

 Thế hệ 3: Single molecular Real Time Sequencing (SMRT)


- Được đánh giá là một trong những công nghệ giải trình tự hiện đại hiện nay.
Trong khi tất cả phương pháp trong các thế hệ trước và cùng thế hệ 3 đều dựa
trên nguyên lý cơ bản “phương pháp gián đoạn chuỗi” do Sanger phát minh thì
SMRT lại xác định trình tự ADN bằng cách “quan sát” sự tổng hợp các chuỗi
ADN bằng cách tạo ra ADN polymerase đơn lẻ.
- Người ta sử dụng 4 loại nucleotide gắn vào mạch và nucleotide có đánh dấu
phosphate để tạo tín hiệu xác định chính xác loại nucleotide trong thời gian
thực.Trong khi các đoạn ADN sao chép thì phần mềm sinh hoạt động song
song xác định trình tự ADN. Hai quá trình này được hoàn thành cùng lúc.
- Nhờ cách “quan sát” này mà quá trình diễn ra nhanh chóng và có lưu lượng xử
lý rất lớn. Hiện nay, kỹ thuật này thường được sử dụng là các sinh vật chưa
nghiên cứu hệ gen.
Link video: https://youtu.be/NHCJ8PtYCFc

 Thế hệ 4: Oxford Nanopore DNA Sequencing Technology


- Oxford Nanopore DNA Sequencing Technology là phương pháp hiện đại sử
dụng tín hiệu điện phân tử để giải trình tự gen. Hiện nay, phương pháp này vẫn
đang được tiếp tục nghiên cứu và phát triển, hứa hẹn những ứng dụng hữu ích
trong tương lai.
- Phương pháp này sử dụng dòng điện để vận chuyển một mẫu chưa biết qua
một lỗ đường kính chỉ 1nm. Một protein nanopore được gắn trên một màng
polimer không dẫn điện. Hệ thống này luôn chứa một dung dịch điện li (khi đặt
vào một điện trường không đổi, một dòng điện có thể xuất hiện trong hệ thống)
Độ lớn của cường độ dòng điện qua bề mặt của lỗ Nano phụ thuộc vào kích
thước lỗ Nano cũng như thành phần của DNA/ARN đang mắc tại lỗ Nano đó.
Khi đủ gần với lỗ các mẫu làm thay đổi đặc trưng về cường độ dòng điện qua
bề mặt lỗ, tổng diện tích qua lỗ bằng tích phân mặt của cường độ dòng điện
chạy qua bề mặt giữa khoảng thời gian t1 và t2.
Link video: https://youtu.be/GUb1TZvMWsw

[1] Viblo.asia, Nguyen Tien Dat, Tìm hiểu về giải trình tự gene- Genome sequencing
16/05/2021
[2] Viện Sinh học phân tử Loci, Giải trình tự DNA- Lịch sử hình thành
[3] Heather JM, Chain B. The sequence of sequencers: The history of sequencing
DNA. Genomics 2016 107:1-8.
[4] Tạp chí sinh học, iceberg, TS. Dang Tran Hoang: Giải trình tự gene thế hệ mới

You might also like