You are on page 1of 54

Bài giảng:

Protein Docking
Mục tiêu học tập
1. Nêu được định nghĩa vàýnghĩa của phương
pháp Docking.
2. Trình bày được các thành phần cơ bản của
một chương trình Docking.
3. Sử dụng được phần mềm Autodock 4.2 để
tiến hành Docking một số trường hợp đơn
giản.
Câu hỏi suy ngẫm
1 2 3

4 5 6

7 8 9
Định nghĩa
• Protein docking làkỹ thuật môhì nh hóa nhằm
dự đoán vị trí, cấu hình thuận lợi và mức độ
tương tác màphân tử cơ chất cóthể gắn kết
trên phân tử protein.
• Về mặt nhiệt động lực học, mục tiêu của
Docking làtì m ra cấu hình mànăng lượng tự
do của toàn hệ làthấp nhất.

6
Ý nghĩa

• Docking cóvai tròquan trọng trong việc dự đoán


ái lực và hoạt tí nh của các dược chất đối với
protein, từ đó dự đoán khả năng hoạt hóa hoặc ức
chế một protein chức năng.

• Bên cạnh đó Docking cũng giúp dự đoán trung


tâm hoạt động vàvị trí
, cấu hì
nh thuận lợi của cơ
chất tham gia phản ứng khi xem xét cơ chế xúc
tác của enzyme (cũng là một loại protein chức
năng)
Ý nghĩa
• Docking cóthể đưa ra cơ sở để giải thí ch các
dữ liệu thực nghiệm (vd: sự khác nhau trong ái
lực liên kết vàhỗ trợ thiết kế các cơ chất mới)
Ứng dụng
• Thiết kế thuốc dựa vào cấu trúc (structure-
based drug design);
• Tối ưu hóa cấu trúc hợp chất dẫn đường (lead
optimization);
• Sàng lọc ảo (virtual screening);
• Thiết kế các thư viện liên kết (combinatorial
library design);
• Nghiên cứu cơ chế tác dụng của các thuốc
(chemical mechanism studies).
Nhược điểm của Docking
• Docking cần thông tin về cấu trúc 3D của Protein
• Cơ chất và protein đều có thể thay đổi cấu dạng
– Hàng trăm đến hàng ngàn bậc tự do
– Cấu dạng cơ chất và protein là vô tận
• Giữa cơ chất và enzym còn những tương tác khác
như tương tác Van der Waals, tương tác tĩnh điện,
trong nhiều trường hợp còn có tương tác hóa học.
Protein Data Bank (PDB)
http://www.rcsb.org/pdb/home/home.do
Protein Data Bank (PDB)
http://www.rcsb.org/pdb/home/home.do

•Protein Data Bank (PDB) làkho lưu trữ dữ liệu cấu trúc 3D của
các phân tử sinh học lớn như làprotein vàaxit nucleic.

•Các file dữ liệu cấu trúc được đưa lên bởi các nhàsinh học
phân tử trên khắp thế giới. Các file dữ liệu cấu trúc cóthể truy
cập và tải về miễn phíqua các trang web thành viên PDBe,
PDBj,, RCSB. Dữ liệu đưa lên PDB được kiểm tra lại bằng phần
mềm PDB Validation Suite.

•Dữ liệu tại đây được cập nhật hàng tuần.

•Miễn phítruy vấn cấu trúc.


Protein Data Bank (PDB)
http://www.rcsb.org/pdb/home/home.do

•Tất cả các phân tử được tì m thấy trong các sinh vật từ vi


khuẩn, nấm, thực vật, động vật vàcon người.

• Được xây dựng vào năm 1971 tại Brookhaven National


Laboratory dưới sự lãnh đạo của Walter Hamilton.

• Từ năm 1998, the Research Collaboratory for Structural


Bioinformatics (RCSB) chịu trách nhiệm chí
nh quản lýPBD.

• Việc tì
m kiếm thông thông có thể được tiến hành theo
PDBID, tên, tên tác giả hoặc theo cơ chất.
Độ phân giải
• Là thước đo chất lượng của dữ
liệu được tập hợp
- Nếu độ phân giải lớn hơn 4.0 Ao
thì không thể xác định được tọa
độ riêng rẽ của các nguyên tử.
- Độ phân giải trong khoảng 3.0-
4.0 Ao: cấu trúc bộ khung có thể
đúng nhưng phần mạch nhánh có
cấu dạng không đáng tin cậy.
Độ phân giải
- Độ phân giải trong khoảng 2.5- 3.0 Ao: bộ khung cóthể
xác định đúng, với các nhánh dài vàmảnh của một số
aminoaxit như Lys, Glu, Gln,...vàcác nhánh nhỏ của
Ser, Val, Thr...cócấu dạng không đáng tin cậy.

- Độ phân giải trong khoảng 2.0- 2.5 Ao: số nhánh có


cấu dạng sai í
t hơn đáng kể. Cóthể xác định được các
phân tử nước vàcác phối tử nhỏ.

- Độ phân giải trong khoảng 1.5- 2.0 Ao: chỉ còn lỗi nhỏ
về cấu dạng

- Độ phân giải trong khoảng 0.5- 1.5 Ao: tọa độ của các
nguyên tử được xác định với độ tin cậy cao.
• Docking trở thành bài toán tối ưu, tìm vị trí và
cấu hình phù hợp nhất của một cơ chất gắn kết
lên protein.

Chất ức chế

HIV Protease

Trung tâm hoạt động


(Nhóm Aspartyl)
Docking tối ưu hóa:
• Liên kết giữa 2 phân tử theo cách mà định hướng của
chúng giúp đạt tương tác tối đa
• Năng lượng tổng của phức hợp khi cấu dạng của các
phân tử tạo nên năng lượng liên kết tối thiểu
• Các thay đổi trong cấu trúc gây ra bởi tương tác
Có 2 loại Docking
1. Protein-Protein

2. Protein-Cấu tử
Hàm thích nghi (Scoring function)
• Mục đích: Xác định ái lực liên kết cho protein, phối
tử, pose vàcấu dạng
• Hàm xác lập giữa không gian cấu hình với một tập
hợp số thực
•Gbinding RT ln nghi
Hàm thích  đánh giá được tương tác
K affinityphải
giữa cơ chất/ solvvà
Gcomplex  protein.
Gligand/ solv  G protein/ solv  Ginteraction  TS  

scores <-> Gbinding


Lực liên kết giữa Protein và cấu tử
Liên kết Thuốc - Protein
Lực liên kết
Lực liên kết

entropy
enthalpy
Yếu tố ảnh hưởng đến ΔG
Yếu tố ảnh hưởng đến ΔG
Tương tác tĩnh điện
• Điện tích – điện tích
phụ thuộc vào pH
• Điện tích – lưỡng cực (dipole)

• Điện tích - lưỡng cực


cảm ứng (induced dipole)
Định luật Coulomb
Tương tác lưỡng cực
Liên kết hydro
Năng lượng của 1 liên kết hydro
Salt Bridges
van der Waals Interactions
Solvat hóa vàdesolvat hóa
Solvation and Desolvation
Ảnh hưởng của dung môi
Solvation and Desolvation
Scoring Functions
Molecular mechanics force fields:
• CHARMM [Brooks83]
• AMBER [Cornell95]

Empirical methods:
• ChemScore [Eldridge97]
• GlideScore [Friesner04]
• AutoDock [Morris98]

Knowledge-based methods
• PMF [Muegge99]
• Bleep [Mitchell99]
• DrugScore [Gohlke00]
Tính toán hàm thí
ch nghi
• Tính toán dựa trên điểm:
Các phần năng lượng được tí nh toán tại các vị
trícủa các nguyên tử ligand
Tính toán hàm thí
ch nghi
• Tính toán dựa trên lưới (Grid-based calculation)
- Tính toán trước trường lực của từng phần năng
lượng cho từng cấu dạng của protein
- Lấy mẫu trường lực tại vị trí các nguyên tử ligand
Thuật toán tìm kiếm
Searching poses & conformations

• Systematic search
• Molecular dynamics
• Simulated annealing
• Genetic algorithms
• Incremental construction
• Rotamer libraries
Thuật toán tìm kiếm
• Vô vàn khả năng gắn kết  không gian tìm kiếm có
rất nhiều cực trị địa phương.

• Thuật giải di truyền:

Hàm thích nghi


(f) fmax
Thuật toán tối ưu toàn cục
Thuật giải di truyền
• Mỗi cấu dạng = một cáthể = cấu trúc của một nhiễm
sắc thể. Mỗi nhiễm sắc thể cócác thành phần biểu diễn
vị trí
, định hướng vàgóc xoắn.

• Từ một quần thể ban đầu, mỗi cáthể sẽ được đánh giá
độ thích nghi, những cáthể cóđộ thí ch nghi cao (tức
năng lượng gằn kết âm hơn) sẽ có cơ hội được chọn
nhiều hơn để tiến hành lai ghép tạo cáthể mới. Một số
cáthể cóđộ thí ch nghi đặc biệt cao sẽ được sao chép
toàn bộ vào thế hệ sau.
Thuật toán tối ưu toàn cục
Thuật giải di truyền
• Một số cáthể mới được tạo ra sẽ bị đột biến tại một hoặc
một số điểm trên nhiễm sắc thể với tỉ lệ đột biến xác định
trước.
• Các cáthể trong thế hệ mới lại được đánh giáđộ thí ch
nghi, qua quátrì nh lai ghép, đột biến để tạo quần thế
mới. Quy trì nh này được lặp đi lặp lại cho đến khi độ
thích nghi trong quần thể ổn định qua các thế hệ hoặc khi
gặp một trong các điều kiện giới hạn về khối lượng tí nh
toán.
• Khi kết hợp với tối ưu cục bộ thìmỗi cáthể mới tạo
thành do lai ghép hay đột biến đều được tối ưu lại trước
khi đánh giáđộ thích nghi.
Docking programs
Autodock
• AutoDock is a suite of automated docking tools. It is
designed to predict how small molecules, such as
substrates or drug candidates, bind to a receptor of
known 3D structure.
• Current distributions of AutoDock consist of two
generations of software: AutoDock 4 and AutoDock
Vina.
• AutoDock 4 actually consists of two main
programs: autodock performs the docking of the ligand
to a set of grids describing the target
protein; autogrid pre-calculates these grids.
• Phần mềm phiên bản mới nhất làAutodock 4.2.
MGLTools
• MGLTools làbộ phần mềm được phát triển tại
Molecular Graphics Laboratory (MGL: phòng
thínghiệm đồ họa phân tử) của viện nghiên
cứu Scripps cho phép hì nh dung vàphân tí
ch
các cấu trúc phân tử.
• Ba ứng dụng chí nh của MGLTools là:
- AutoDock Tools (ADT)
- Python Molecular Viewer (PMV)
- Vision
Autodock Tools
• Giao diện tương tác cho AutoDock, phát triển
bởi cùng một phòng thí nghiệm phát triển
Autodock.
• Được sử dụng để thiết lập, thực thi, phân tích và
lắp ghép tự động đươc thiết kế để dự đoán các
phân tử, cũng như tính toán bề mặt phân tử, hiển
thị băng cấu trúc thứ cấp, tính liên kết
hydro…AutodockTools làgiao diện đồ họa cuối
cùng để thiết lập, khởi động và phân tích
Autodock
Chức năng AutoDockTools
• Xem phân tử trong không gian 3D, xoay vàthu
phóng trong thời gian thực
• Thêm tất cả hydrogens hoặc không phân cực
hydrogens.
• Thiết lập liên kết xoay trong phối tử bằng cách
sử dụng một phiên bản đồ họa của AutoTors
• Khởi chạy AutoGrid vàAutoDock
• Đọc trong các kết quả của AutoDock vàhiển thị
chúng
Các bước thực hiện Docking

Chuẩn bị: Chuẩn bị protein và cấu tử

Dock: Thử các cấu dạng của phức


hợp protein và cấu tử

Giải thích Đánh giá các tương


kết quả: tác giữa protein và
cấu tử
Chuẩn bị protein
• PDB (Protein Data Bank, www.rcsb.org/pdb/):
– X-ray crystal: >12,000 structures, 788 have ≤ 1.5 Å, 9,390 between 1.5-
2.5 Å
– NMR: >450 structures, ensemble accuracy of 0.4-1 Å in the backbone
region, 1.5 Å in average side chain position (Billeter 1992; Clore et al.
1993)
– (and high quality homology models built from highly similar sequences)

Histamine H1 receptor Tyrosinase Cyclooxygenase-2


Chuẩn bị cấu tử
(Drug, Chemical & Structural Space)
• Hợp chất giống thuốc: MDDR (MDL Drug Data
Report) >147,000 chất, CMC (Comprehensive Medicinal
Chemistry) >8,600 chất
• Hợp chất không giống thuốc : ACD (Available
Chemicals Directory) ~3 triệu chất
• Cơ sở dữ liệu, Beilstein (>8 million compounds), CAS &
SciFinder
• CSD (Cambridge Structural Database,
www.ccdc.cam.ac.uk): ~3 triệu X-ray cấu trúc, gồm >264,000
hợp chất >128,00 chất hữu cơ
• Hợp chất được bán
– Một vài nhà cung cấp: Maybridge, Array, ChemDiv, WuXi
Pharma, ChemExplorer, etc.
• Cơ sở dữ liệu công nghiệp: vài triệu (các công ty
dược đa quốc gia)
Chuẩn bị cấu trúc 3D cấu tử
• 2D->3D
• Software: CORINA,
OMEGA, CONCORD,
AVOGADRO, MM2/3,
WIZARD, COBRA

• Atoms associated with inter-atom distances,


physical and chemical properties, types, charges,
pharmacophore, etc
• Flexibility: conformation ensemble, fragment-
based
Giới hạn trung tâm tương tác
• Grid Search: Xây dựng mạng lưới các vị trí tương tác có thể
xảy ra dựa trên cấu tử
• Năng lượng ban đầu giữa protein và cấu tử được ước lượng và
đối chiếu trong suốt quá trình mô phỏng
Autogrid
• Preparing the GRID parameter file:
– The grid parameter file tells Autogrid4 which
receptor to compute the potentials around, the
types of maps to compute and the location and
extent of those maps.
• Run autogrid4 to make the grid maps
Preparing the docking parameter file
and running Autodock4
• The docking parameter file tells AutoDock
which map files to use, the ligand molecule to
move, what its center and number of torsions
are, where to start the ligand, the flexible
residues to move if sidechain motion in the
receptor is to be modeled, which docking
algorithm to use and how many runs to do
Analyzing the docking results
• Reading a docking log or a set of docking
logs is the first step in analyzing the results
of docking experiments. (By convention,
these results files have the extension ".dlg".)
• The output includes many details about the
docking which are output as AutoDock
parses the input files and reports what it
finds
Let’s try AUTODOCK 4.2

You might also like