You are on page 1of 6

TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM

TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG


KHOA KHOA HỌC ỨNG DỤNG

BÁO CÁO

TH.THÍ NGHIỆM PHƯƠNG PHÁP SINH TIN VÀ ỨNG DỤNG

BÀI 2

BIOSORTWARE

Người hướng dẫn : Ph.D Nguyễn Ngọc Tuấn

Người thực hành : TRẦN ĐĂNG QUANG

Mssv : 61703184

Thành phố Hồ Chí Minh , năm 2019


BIOSOFTWARE

I) Giới thiệu

-BLAST là một công cụ để so sánh các chuỗi sinh học, như các chuỗi amino-acid của
các protein hay của các chuỗi DNA khác nhau. Khi được cung cấp một thư viện hay
cơ sở dữ liệu các chuỗi đó, một tìm kiếm BLAST sẽ cho phép nhà nghiên cứu tìm
kiếm các chuỗi con giống với chuỗi có sẵn mà ta quan tâm.

1: Vùng chèn trình tự


2:Chọn một trình tự đã có từ file trên máy tính
3:Giới hạn tìm kiếm trong một khoảng vị trí nhất định trên trình tự
4: Đặt tiêu đề
5: Lựa chọn bộ dữ liệu: Human genomic + transcript (ở người); Mouse
genomic + transcript (ở chuột); Others (Các loài sinh vật khác)
6: Đề nghị tìm kiếm khoanh vùng theo tên sinh vật
7: Loại trừ các mẫu không phân lập được
+) Để điều chỉnh thêm chức năng cho thuật toán ta có thể click vào
Algorithm parameters để tiến hành điểu chỉnh như mong muốn

-Clustal X là một phần mềm (giao diện windows) dùng cho việc so sánh sự tương
đồng của hai hay nhiều trình tự sinh học. Phần mềm mô tả kết quả bằng hệ thống màu
sắc và các ký hiệu nổi bậc những nét đặc trưng trong những đoạn tương đồng. Phần
mềm ngày càng trở nên hữu ích cho các nhà nghiên cứu trong việc tìm kiếm những
vùng tương đồng trên những trình tự DNA hoặc protein.

-Njplot là phần mềm cho phép vẽ cây phân loài theo định dạng cây phân loài Newick.

II) Phương pháp


Đầu tiên ta lấy đoạn DNA chuẩn đã được chỉnh sửa lại thông qua phần

mềm mềm bioedit ở bài trước.

-Tiến hành dùng công cụ BLAST của NCBI để định danh loài.

Ta thấy rằng kết quả tìm kiếm đạt trên 99% nên ta có thể kết luận loài có DNA có
nguồn gốc từ chi Acinetobacter loài baumannii.

-Tiến hành tìm kiếm dữ liệu cho 5 loài gồm E.coli; Pseudomonas; Sphingomonas;
Staphyloccocus; Acinetobacter trong đó mỗi loài lựa chọn ra 10 chủng để tiến hành
xây dựng cây phân loài.

+) Ta tiến hành tải dữ liệu từ NCBI; lưu ý khi tải ta không nhất thiết phải tải tải tất cả
dữ liệu(complete sequence) vì dung lượng sẽ rất lớn, ta chỉ cần tải trình tự DNA để
tiến hành so sánh (aligned sequences)

Vì để tránh tình trạng tế bào bị đột biến nên trong tế bào sẽ có nhiều trình tự 16s
rRNA (copy) ta tiến hành loại bỏ và chỉ giữ lại một đoạn để so sánh.
-Tiến hành so sánh tất cả trình tự: Accesssory Application ClustalW Mutiple
alignment Run Clustalw

-Ta thấy rằng score của một số trình tự chỉ ở mức 1,2,3 vì các đoạn này trình tự đang
bị đảo ngược. Ta tiến hành đảo ngược đoạn lại (Sequence Nucleic acidReverse
Compliment) và so sánh toàn bộ trình tự lại một lần nữa.

-Ta tiến hành cắt các trình tự thừa ở đầu và cuối các trình tự để tất cả các trình tự có
kích thước đồng bộ và lưu dưới định dạng FASTA
-Mở ClustalX và mở file FASTA vừa lưu. Tiến hành bỏ các khoảng trống
EditRemove all gaps. Tiến hành so sánh tất cả các trình tự lại một lần nữa.
Alignment  Do complete Alignment

-Tiến hành xây dựng cây phân loài: Trees  Bootstrap N-J Tree. Sau khi xây dựng
xong sẽ có một file phylogeny.phb ta tiến hành mở file đó lên bằng Njplot

III) Kết quả


Đây là cây phân loài sau khi đã xây dựng xong. Ta có thể thấy được mức độ
tiến hóa giữa các loài thông qua mức độ thể hiện của kích thước trong các
nhánh cây (Branch lengths)

Ta cũng có thể thể hiện độ tin cậy trên các nhánh cây(Bootstrap values).

You might also like