You are on page 1of 30

Bài giảng:

GIỚI THIỆU PHƢƠNG PHÁP


KHẢO SÁT MỐI QUAN HỆ ĐỊNH
LƢỢNG CẤU TRÚC – HOẠT TÍNH
SINH HỌC
(QSAR)
Không cấu trúc 3D Cấu trúc 3D Protein,
Protein, không cấu trúc không cấu trúc phối tử
phối tử (ligand) (ligand)
- Thư viện liên kết (Combichem),
- Sàng lọc định lượng cao (HTS),
Thiết kế tại chỗ (de novo design): Xây
-Sàng lọc ảo bằng filters/quy tắc
dựng cấu trúc phân tử chưa được tổng
(Garbage filters; Druglike filters;
hợp từ trước.
ADME/TOX; antitarget)

Không cấu trúc 3D Cấu trúc 3D Protein, Cấu


Protein, cấu trúc phối tử trúc phối tử (ligand)
(ligand)
-Xây dựng phần cấu trúc mang
dược tính (pharmacophore) Docking
LBVS - Tìm kiếm đồng dạng
Sàng lọc ảo dựa SBVS
(similarity searching)
trên phối tử Sàng lọc ảo dựa
QSAR trên cấu trúc
(Ligand-based Virtual
(Structure-based Virtual
Screening)
Screening)
2
Lịch sử phát triển QSAR
• Vào năm 1868, Crum-Brown và Fraser đã
nhận xét rằng tác dụng sinh học là hàm số của
cấu trúc hóa học. Φ = f(C)
• Đến năm 1893, Richet đã cho rằng sự khác
nhau về tác dụng sinh học là do sự thay đổi về
tính chất hóa học hay hóa lý. ΔΦ = Δf(C)
Lịch sử phát triển QSAR
• Phương trình Hammmett (1935):
log k/ko = ρσ
Với k, ko là hằng số axit. σ là hằng số Hammmet, là
một thông số hóa lý đặc trưng cho khả năng hút đẩy
điện tử của các nhóm thế.
• Vd: Đối với axit benzoic, phương trình
Hammett có dạng như sau: pKa = 4.2 - Σσ.
Như vậy dựa vào phươn trình Hammet ta có thể dự
đoán Ka của các dẫn xuất của axit benzoic khi ta biết
hằng số σ của các nhóm thế
Lịch sử phát triển QSAR
• Mô hình Hansch
log(1/C)= -k1π 2 + k2π+ k3σ + k4Es +k5
trong đó, C: biểu thị đáp ứng sinh học;
π : hằng số thế kỵ nước; σ: hằng số thế Hammet;
Es: hằng số thế Taft.
• VD:
Lịch sử phát triển QSAR
• Mô hình Free- Wilson hay phƣơng pháp de
Novo: BA = Σ aixi + µ
trong đó, BA là hoạt tính sinh học của phân tử
Xi: nhóm thế thứ i với giá trị đóng góp cho
hoạt tính tổng là ai; ai: phần đóng góp cho hoạt
tính tổng của nhóm thế Xi. µ: phần hoạt tính
chung của khung gốc.
What is QSAR ?
Theo tổ chức Hợp tác và Phát triển Kinh tế :
(Organization for Economic Cooperation and Development):

“QSAR là các kỹ thuật nhằm dự đoán các kết quả


trước khi các test được tiến hành trong phòng thí
nghiệm. QSAR cung cấp thông tin dự đoán về kết
quả có thể có của một thử nghiệm nào đó và khả
năng mới này cung cấp các yếu tố liên quan để thiết
lập thứ tự ưu tiên cho một chất mới để các thử
nghiệm.”
QSAR
QSAR bao gồm các phương pháp thống kê
(statistical methods), trong đó hoạt tính sinh học
được liên quan với các đặc điểm cấu trúc (Vd:
Free Wilson analysis), tính chất hóa lý (Vd:
Hansch analysis), hoặc các trường (3D QSAR).
− Classical QSAR analyses (Hansch- and Free Wilson
analyses) chỉ xem xét cấu trúc 2D. Ứng dụng chính trong
nghiên cứu thay đổi nhóm thế trên cùng một sườn cấu trúc.
− 3D-QSAR analysis (CoMFA) có nhiều ứng dụng hơn. Sử
dụng thông tin về cấu trúc 3D và liên quan hoạt tính sinh học
với các trường tính chất 3D.
QSAR
QSAR (Quantitative Structure-Activity Relationships): Mối liên hệ định lượng giữa
cấu trúc và hoạt tính của các hoá chất (xuất hiện từ năm 1868).

Y = f1(x1) + f2(x2)+…+fn(xn)

Trong đó, - Y: Biến đáp ứng (mang giá trị biểu thị tác dụng sinh học)
- x1,x2...xn: Các tham số đặc trưng cho cấu trúc. Được tính toán bằng các phần mềm (tự
xây dựng hoặc thương mại)
- f1,f2,...fn : Các thuật toán thể hiện trọng số của tham số phân tử x, được tính toán bằng
các phần mềm phân tích thống kê: Kỹ thuật xác xuất thống kê hay trí tuệ nhân tạo

9
QSAR
• QSARs dựa trên giả thuyết là cấu trúc của một phân
tử phải chứa những đặc điểm cấu trúc chịu trách
nhiệm cho tính chất hóa học, vật lý, sinh học và dựa
trên khả năng các mô tả phân tử có thể capture những
đặc tính này.

• Bởi các mô hình QSAR, hoạt tính sinh học (hoặc tính
chất…) của một phân tử mới hoặc chưa được kiểm
nghiệm có thể được suy ra từ cấu trúc của các hợp
chất tương tự trong đó tính chất của chúng đã được
kiểm nghiệm.
Basic Requirements in QSAR
Studies
- Tất cả các hợp chất thuộc về một dãy đồng đẳng
(congeneric compounds).
- Tất cả các hợp chất có cơ chế tác dụng tương tự
nhau
- Ảnh hưởng của nhóm thế isosteric có thể dự đoán
trước
- Ái lực liên kết có liên quan đến năng lượng tương
tác.
- Hoạt tính sinh học tương quan đến ái lực liên kết.
Applications of QSAR

1) Classification
2) Diagnosis of Mechanism of Drug Action
B.A. = 0.94 logP + 0.87, r = 0.97, n = 51

3) Prediction of Activity
4) Lead Compound Optimization

S OCH 3 Cl S
S
S

OH H2N SO2NH2
Các bƣớc xây dựng các mô hình QSAR

Tính toán các tham số


Xây dựng cơ sở phân tử đặc trưng cho Xây dựng mô hình
dữ liệu cấu trúc QSAR
Bước 1 Bước 2 Bước 4

Sử dụng mô hình Đánh giá mô


Bước 6 hình
Bước 5
TOOLS AND TECHNIQUES OF QSAR

• Hoạt tính sinh học


- MIC: nồng độ ức chế tối thiểu, hay nồng độ kiềm khuẩn tối thiểu
của vi khuẩn (dùng trong vi sinh)
- MBC: nồng độ diệt khuẩn tối thiểu, là nồng độ thấp nhất làm giảm
99.9% lượng vi khuẩn.
- IC50: Nồng độ ức chế 50% đối tượng thử hay còn gọi là hằng số
Michaelis-Menten
- EC50 (Effective Concentration): nồng độ 50% hiệu quả tối đa.
- ED50 (Effective Dose): liều tác dụng tối đa trên 50% đối tượng thử.
- GI50: nồng độ ức chế 50% sự tăng sinh tế bào (sự phân chia) cell
proliferation, và thường được sử dụng cho các hợp chất cytostatic
(trái ngược với cytotoxic) agents.
- SD50: liều tiêu diệt 50% đối tượng thử.
- LD50: liều gây chế 50% thú thử.
- TI: chỉ số trị liệu (TI càng lớn độ an toàn sử dụng càng cao)
• Hoạt tính hóa học:
- k: hằng số tốc độ phản ứng của các hóa chất
trong một loại phản ứng.
- K: hắng số phân ly của các axit (tính axit)
- Độ chọn lọc
- Tính thân hạnh, thân điện tử...
Các hoạt tính hóa học được quan sát bằng thực
nghiệm hóa học.
Chuẩn bị CSDL
Statistical Methods
• P = f(x1, x2,...,xp)
where P is the molecular property/activity
x1, . . ., xp are the p molecular descriptors,
f is a function representing the relationship between
response and descriptors.

In most of the cases, the function f is not a priori


known and needs to be estimated.
Statistical Methods
• C = f(x1, x2,...,xp)
where where C is the class that each object is
assigned to under the application of the obtained
model,
x1, . . ., xp are the p molecular descriptors,
f is a function representing the relationship between
class assignment and descriptors

Note also that classification models are quantitative


models, only the response C being a qualitative quantity.
Các kỹ thuật thƣờng sử dụng
Đánh giá các mô hình QSAR

1. Có đích xác định (defined endpoint)


2. Sử dụng một thuật toán rõ ràng (mô hình có
thể được tái xây dựng lại cho những hợp chất
mới),
3. Có miền ứng dụng được xác định (sử dụng
phương pháp đòn bẩy).
4. Thỏa mãn các đánh giá nội trên tập TrS để
kiểm tra mức độ khớp (goodness-of-fit), độ
mạnh và ổn định của mô hình (robustness).
Đánh giá các mô hình QSAR

• Các đánh giá nội bao gồm:


– Đánh giá chéo (cross-validation): Để một phần của tập TrS
ở ngoài, xây dụng mô mình với phần còn lại. Kết quả là độ
chính xác của mô hình hầu như không thay đổi, chứng tỏ
mô hình khá ổn định trước những thay đổi của TrS và
không phụ thuộc vào một nhóm chất nào.
– Đánh giá ngẫu nhiên (randomization-test): Thay đổi chỉ
định của các chất (đánh lừa mô hình) tức là chất đang có
hoạt tính được chỉ cho mô hình là không có hoạt tính và
ngược lại. Kết quả là độ chính xác của mô hình giảm đáng
kể khi số lượng các chất được thay đổi ngày càng lớn. Điều
này chứng tỏ độ chính xác của mô hình không phụ thuộc
vào sự tương quan ngẫu nhiên (chance correlation) giữa
các biến độc lập hay sự lặp lại nhiều cấu trúc.
Đánh giá các mô hình QSAR

Thỏa mãn các đánh giá ngoại.


5. Có khả năng giải thích cơ chế.
Dự đoán
P N
P VP FN VP+FN
Thực tế N FP VN FP+VN
VP+FP FN+VN Tổng
Qtotal: Tổng dự đoán chính xác
Tổng số trường hợp
Độ nhạy : Dương tính thật
Dương tính thật+Âm tính giả
Độ đặc hiệu : Âm tính thật
Tổng số âm tính (Âm tính thật+Dương tính giả)
Tỉ lệ dương tính giả: Dương tính giả
Tổng số âm tính

Baldi, P.; Brunak, S.; Chauvin, Y.; et al. Bioinformatics. 2002, 16, 412.
Online program
• https://ochem.eu/home/show.do

• How to use ???

You might also like