Professional Documents
Culture Documents
WELCOME TO
CLASS – Week 9!!!
DNA sequencing – Giải trình tự DNA
i. Sanger sequencing
• Trong giải trình tự Sanger thủ công, bốn phản ứng PCR được
thiết lập, mỗi phản ứng chỉ có một loại ddNTP duy nhất (ddATP,
ddTTP, ddGTP và ddCTP) được trộn vào.
i. Sanger sequencing
ii. NGS
• Công nghệ giải trình tự SOLiD được thiết kế dựa trên nguyên lý
ghép nối, toàn bộ genome được cắt thành các đoạn ADN ngắn, sau
đó từng đoạn được gắn với các adaptor (như primer trong PCR).
• Quá trình giải trình tự được thực hiện thông qua các oligonucleotide
được đánh dấu huỳnh quang.
• Dữ liệu xuất ra của hệ thống có thể lên tới 60 Gb với khoảng hơn 1
tỷ đoạn được đọc sau mỗi lượt chạy. Kích thước và độ tin cậy của
mỗi đoạn ADN được đánh giá là tương đương so với hệ thống của
Illumina, trong khi đó chi phí thiết bị của công nghệ SOLiD thấp hơn
đáng kể so với các hệ thống khác cùng thế hệ.
Giải mã trình tự bộ gene (genome
sequencing)
• PP xác định trình tự của toàn bộ gen (nhiễm sắc thể) của một
loài sinh vật
Ø Virus = 10 nghìn nucleotide (10 Kbp)
Ø Vi khuẩn = 4 triệu nucleotide (4 Mbp)
Ø Con người = 3 tỷ nucleotide (3 Gbp)
• 1 vài phương pháp phổ biến: giải trình tự Shotgun, wgMLST.
Genome sequencing
• Nguyên lý: Giải trình tự shotgun chia nhỏ các chuỗi DNA một cách
ngẫu nhiên thành nhiều mảnh nhỏ và sau đó tập hợp lại trình tự
bằng cách tìm kiếm các vùng trùng nhau (qua phần mềm)
• Giải trình tự bằng shotgun ban đầu được Fred Sanger sử dụng để
giải trình tự các bộ gen nhỏ như của virus và vi khuẩn.
Ø Phổ biến hơn đối với giải mã gene ĐV và con người → số lượng lớn và
phức tạp.
• Giải trình tự bộ gen shotgun bỏ qua các bước tạo DNA nhân bản
giúp tiết kiệm thời gian và chi phí.
• Những mảnh vỡ DNA thường có kích thước từ 2-20 kilobase (2.000-
20.000 bp) đến 200-300 kilobase (200.000-300.000 bp).
Genome sequencing
h"ps://www.biointerac=ve.org/classroom-resources/shotgun-
sequencing
Genome sequencing
ii. Giải trình tự đa vị trí trên bộ
gene (wgMLST)
• wgMLST: Whole genome mul+-locus sequence typing.
Phương pháp:
• Thu thập toàn bộ trình tự bộ gen bằng NGS, sau đó so sánh trình tự
của tất cả các gen (~ 4000 gen) giữa các dòng phân lập
• Tính phân biệt cao hơn so với MLST (chỉ có 7 gen được giải trình
tự).
• Thông tin về các yếu tố kháng kháng sinh, loại huyết thanh và độc
lực có thể được trích xuất cùng một lúc.
Genome sequencing
ii. Giải trình tự đa vị trí trên bộ
gene (wgMLST)
Ưu điểm:
• Các phương pháp có thể được cải tiến.
• Nó tạo ra kết quả ổn định và di động, có thể dễ dàng chia sẻ và so
sánh.
• Dữ liệu có thể được phân tích mà không cần nhân lực chuyên
ngành về tin sinh học.
Hiện đang được sử dụng bởi:
• PulseNet - phân loại mầm bệnh thực phẩm từ bệnh nhân bị bệnh.
• GenomeTrakr - phân loại mầm bệnh lây truyền qua thức ăn và môi
trường.
Genome sequencing
iii. PP nuôi cấy độc lập (Culture-
independent method)
• Giải trình tự DNA của vi khuẩn được chiết xuất trực tiếp từ các
mẫu môi trường, thực phẩm.
Ø Không nuôi cấy vi khuẩn
o Giải quyết vấn đề <1% vi khuẩn trong môi trường không thể phát triển trên môi
trường nuôi cấy.
Extract DNA
OTU
• Operational taxonomic unit – Đơn vị phân loại hoạt động
• Có thể áp dụng xác định đơn vị từ chi, nhưng tốt hơn nếu nó là
loài → Mục đích cuối cùng là tìm ra chính xác dòng VSV đó
(strain).
Ø Phụ thuộc vào độ dài của trình tự và khu vực
q Khuếch đại và giải trình tự một vùng ngắn hơn trong rDNA 16s
Thiếu in nghiêng
16S rDNA gene - Vùng gene đăc trưng để phân loại VSV
iii. PP nuôi cấy độc lập
Ứng dụng
• Theo dõi vi khuẩn trong quá trình lên men tự nhiên và lên men
bổ sung.
Ø Ví dụ: Phô mai, cocoa, yogurt…
Ø Kiểm tra quá trình hoạt động dựa trên sản phẩm tạo ra.
Ø Xác định các dấu hiệu hư hỏng từ sớm.
Ø Chẩn đoán và cải thiện quy trình.
• Quan sát sự thay đổi của vi khuẩn liên quan đến hư hỏng.
• So sánh sự phân bố theo không gian của vi sinh vật.
• Phân tích thành phần của hệ VSV đường ruột của con người.
iii. PP nuôi cấy độc lập
Phân tích VSV trong 1 loại
phô mai thủ công Irish
https://www.biointeractive.org/classroom-resources/bacterial-
identification-virtual-lab
Chú giải
• Scaffold: là một phần của genome sequence được tái tạo từ
các clones trong kỹ thuật shotgun trên toàn bộ genome tính từ
đầu đến cuối dây DNA. Scaffolds bao gồm tất cả những contigs
và những đoạn hở (gaps). Gaps xảy ra trong quá trình đọc trình
tự của máy từ hai đầu trình tự (two sequenced ends) của ít nhất
một lần trùng lập (overlap) với các kết quả đọc khác giữa hai
contigs khác nhau.
Chú giải