Professional Documents
Culture Documents
Protein Docking
Mục tiêu học tập
1. Nêu được định nghĩa vàýnghĩa của phương
pháp Docking.
2. Trình bày được các thành phần cơ bản của
một chương trình Docking.
3. Sử dụng được phần mềm Autodock 4.2 để
tiến hành Docking một số trường hợp đơn
giản.
Câu hỏi suy ngẫm
1 2 3
4 5 6
7 8 9
Định nghĩa
• Protein docking làkỹ thuật môhì nh hóa nhằm
dự đoán vị trí, cấu hình thuận lợi và mức độ
tương tác màphân tử cơ chất cóthể gắn kết
trên phân tử protein.
• Về mặt nhiệt động lực học, mục tiêu của
Docking làtì m ra cấu hình mànăng lượng tự
do của toàn hệ làthấp nhất.
6
Ý nghĩa
•Protein Data Bank (PDB) làkho lưu trữ dữ liệu cấu trúc 3D của
các phân tử sinh học lớn như làprotein vàaxit nucleic.
•Các file dữ liệu cấu trúc được đưa lên bởi các nhàsinh học
phân tử trên khắp thế giới. Các file dữ liệu cấu trúc cóthể truy
cập và tải về miễn phíqua các trang web thành viên PDBe,
PDBj,, RCSB. Dữ liệu đưa lên PDB được kiểm tra lại bằng phần
mềm PDB Validation Suite.
• Việc tì
m kiếm thông thông có thể được tiến hành theo
PDBID, tên, tên tác giả hoặc theo cơ chất.
Độ phân giải
• Là thước đo chất lượng của dữ
liệu được tập hợp
- Nếu độ phân giải lớn hơn 4.0 Ao
thì không thể xác định được tọa
độ riêng rẽ của các nguyên tử.
- Độ phân giải trong khoảng 3.0-
4.0 Ao: cấu trúc bộ khung có thể
đúng nhưng phần mạch nhánh có
cấu dạng không đáng tin cậy.
Độ phân giải
- Độ phân giải trong khoảng 2.5- 3.0 Ao: bộ khung cóthể
xác định đúng, với các nhánh dài vàmảnh của một số
aminoaxit như Lys, Glu, Gln,...vàcác nhánh nhỏ của
Ser, Val, Thr...cócấu dạng không đáng tin cậy.
- Độ phân giải trong khoảng 1.5- 2.0 Ao: chỉ còn lỗi nhỏ
về cấu dạng
- Độ phân giải trong khoảng 0.5- 1.5 Ao: tọa độ của các
nguyên tử được xác định với độ tin cậy cao.
• Docking trở thành bài toán tối ưu, tìm vị trí và
cấu hình phù hợp nhất của một cơ chất gắn kết
lên protein.
Chất ức chế
HIV Protease
2. Protein-Cấu tử
Hàm thích nghi (Scoring function)
• Mục đích: Xác định ái lực liên kết cho protein, phối
tử, pose vàcấu dạng
• Hàm xác lập giữa không gian cấu hình với một tập
hợp số thực
•Gbinding RT ln nghi
Hàm thích đánh giá được tương tác
K affinityphải
giữa cơ chất/ solvvà
Gcomplex protein.
Gligand/ solv G protein/ solv Ginteraction TS
entropy
enthalpy
Yếu tố ảnh hưởng đến ΔG
Yếu tố ảnh hưởng đến ΔG
Tương tác tĩnh điện
• Điện tích – điện tích
phụ thuộc vào pH
• Điện tích – lưỡng cực (dipole)
Empirical methods:
• ChemScore [Eldridge97]
• GlideScore [Friesner04]
• AutoDock [Morris98]
Knowledge-based methods
• PMF [Muegge99]
• Bleep [Mitchell99]
• DrugScore [Gohlke00]
Tính toán hàm thí
ch nghi
• Tính toán dựa trên điểm:
Các phần năng lượng được tí nh toán tại các vị
trícủa các nguyên tử ligand
Tính toán hàm thí
ch nghi
• Tính toán dựa trên lưới (Grid-based calculation)
- Tính toán trước trường lực của từng phần năng
lượng cho từng cấu dạng của protein
- Lấy mẫu trường lực tại vị trí các nguyên tử ligand
Thuật toán tìm kiếm
Searching poses & conformations
• Systematic search
• Molecular dynamics
• Simulated annealing
• Genetic algorithms
• Incremental construction
• Rotamer libraries
Thuật toán tìm kiếm
• Vô vàn khả năng gắn kết không gian tìm kiếm có
rất nhiều cực trị địa phương.
• Từ một quần thể ban đầu, mỗi cáthể sẽ được đánh giá
độ thích nghi, những cáthể cóđộ thí ch nghi cao (tức
năng lượng gằn kết âm hơn) sẽ có cơ hội được chọn
nhiều hơn để tiến hành lai ghép tạo cáthể mới. Một số
cáthể cóđộ thí ch nghi đặc biệt cao sẽ được sao chép
toàn bộ vào thế hệ sau.
Thuật toán tối ưu toàn cục
Thuật giải di truyền
• Một số cáthể mới được tạo ra sẽ bị đột biến tại một hoặc
một số điểm trên nhiễm sắc thể với tỉ lệ đột biến xác định
trước.
• Các cáthể trong thế hệ mới lại được đánh giáđộ thí ch
nghi, qua quátrì nh lai ghép, đột biến để tạo quần thế
mới. Quy trì nh này được lặp đi lặp lại cho đến khi độ
thích nghi trong quần thể ổn định qua các thế hệ hoặc khi
gặp một trong các điều kiện giới hạn về khối lượng tí nh
toán.
• Khi kết hợp với tối ưu cục bộ thìmỗi cáthể mới tạo
thành do lai ghép hay đột biến đều được tối ưu lại trước
khi đánh giáđộ thích nghi.
Docking programs
Autodock
• AutoDock is a suite of automated docking tools. It is
designed to predict how small molecules, such as
substrates or drug candidates, bind to a receptor of
known 3D structure.
• Current distributions of AutoDock consist of two
generations of software: AutoDock 4 and AutoDock
Vina.
• AutoDock 4 actually consists of two main
programs: autodock performs the docking of the ligand
to a set of grids describing the target
protein; autogrid pre-calculates these grids.
• Phần mềm phiên bản mới nhất làAutodock 4.2.
MGLTools
• MGLTools làbộ phần mềm được phát triển tại
Molecular Graphics Laboratory (MGL: phòng
thínghiệm đồ họa phân tử) của viện nghiên
cứu Scripps cho phép hì nh dung vàphân tí
ch
các cấu trúc phân tử.
• Ba ứng dụng chí nh của MGLTools là:
- AutoDock Tools (ADT)
- Python Molecular Viewer (PMV)
- Vision
Autodock Tools
• Giao diện tương tác cho AutoDock, phát triển
bởi cùng một phòng thí nghiệm phát triển
Autodock.
• Được sử dụng để thiết lập, thực thi, phân tích và
lắp ghép tự động đươc thiết kế để dự đoán các
phân tử, cũng như tính toán bề mặt phân tử, hiển
thị băng cấu trúc thứ cấp, tính liên kết
hydro…AutodockTools làgiao diện đồ họa cuối
cùng để thiết lập, khởi động và phân tích
Autodock
Chức năng AutoDockTools
• Xem phân tử trong không gian 3D, xoay vàthu
phóng trong thời gian thực
• Thêm tất cả hydrogens hoặc không phân cực
hydrogens.
• Thiết lập liên kết xoay trong phối tử bằng cách
sử dụng một phiên bản đồ họa của AutoTors
• Khởi chạy AutoGrid vàAutoDock
• Đọc trong các kết quả của AutoDock vàhiển thị
chúng
Các bước thực hiện Docking