You are on page 1of 82

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ

ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH

NGÔ THỊ HẰNG

XÂY DỰNG CÁC MÔ HÌNH SÀNG LỌC ẢO


CHẤT CHỦ VẬN THỤ THỂ APELIN

KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ ĐẠI HỌC

TP. HỒ CHÍ MINH – 2020


BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ

ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH

NGÔ THỊ HẰNG

XÂY DỰNG CÁC MÔ HÌNH SÀNG LỌC ẢO


CHẤT CHỦ VẬN THỤ THỂ APELIN

KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ ĐẠI HỌC

Giảng viên hướng dẫn: ThS. Mai Thành Tấn

PGS. TS. Huỳnh Thị Ngọc Phương

TP. Hồ Chí Minh – 2020


ĐẠI HỌC Y DƯỢC CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
THÀNH PHỐ HỒ CHÍ MINH Độc lập – Tự do – Hạnh phúc
KHOA DƯỢC

TP. Hồ Chí Minh, ngày 18 tháng 08 năm 2020

GIẤY XÁC NHẬN ĐÃ BỔ SUNG, SỬA CHỮA KHÓA LUẬN

THEO Ý KIẾN ĐÓNG GÓP CỦA HỘI ĐỒNG

Tên đề tài: Xây dựng các mô hình sàng lọc ảo chất chủ vận thụ thể apelin

Họ và tên sinh viên: Ngô Thị Hằng

Lớp : Dược chính quy 2015. Mã số sinh viên : 511156062

Giảng viên hướng dẫn: ThS. Mai Thành Tấn

PGS. TS. Huỳnh Thị Ngọc Phương

Khóa luận đã được bổ sung, sửa chữa các nội dung sau:

1. Bản đồ tự tổ chức của tập huấn luyện

2. Lỗi chính tả

Giảng viên hướng dẫn Giảng viên phản biện Chủ tịch hội đồng
XÂY DỰNG MÔ HÌNH SÀNG LỌC ẢO
CHẤT CHỦ VẬN THỤ THỂ APELIN
Sinh viên thực hiện: Ngô Thị Hằng
Giảng viên hướng dẫn: ThS. Mai Thành Tấn; PGS. TS. Huỳnh Thị Ngọc Phương
Đặt vấn đề
Apelin là một phối tử peptid nội sinh của thụ thể apelin, thuộc họ thụ thể bắt cặp G-
protein (GPCR). Các tác dụng có lợi của apelin đối với các bệnh lý tim mạch và bệnh
chuyển hóa đã được chứng minh trên các mô hình động vật và các nghiên cứu lâm
sàn. Đề tài được thực hiện với mục tiêu là tìm kiếm các cấu trúc phân tử nhỏ mới và
có tác dụng chủ vận mạnh trên thụ thể này.
Đối tượng và phương pháp nghiên cứu
Đối tượng của nghiên cứu là cơ sở dữ liệu của các phân tử nhỏ chủ vận thụ thể apelin
đã được công bố tại hai bằng sáng chế US9156796 và WO2017100558A1; cấu trúc
tinh thể của thụ thể apelin được tải từ Ngân hàng dữ liệu protein (PDB ID: 5VBL);
các thư viện ZINC12 và Maybridge Screening and Fragments Collection.
Các phương pháp nghiên cứu được ứng dụng bao gồm 3D-pharmacophore, 2D-
QSAR, docking phân tử và mô phỏng động lực học phân tử.
Kết quả và bàn luận
Đề tài thu thập được 689 chất thuộc hai bằng sáng chế để làm cơ sở dữ liệu xây dựng
các mô hình. Trong ba mô hình 3D-pharmacophore 5 điểm xây dựng được, mô hình
Ph003 là mô hình tốt nhất và đã thể hiện hiệu năng tốt trong quá trình sàng lọc ảo.
Mô hình QSAR-2 theo phương pháp CPG-NN với kết quả đánh giá tương đối tốt,
ứng dụng trong dự đoán tác dụng sinh học của các chất. Một mô hình docking phân
tử cũng đã được xây dựng để đánh giá khả năng gắn kết của chất trên thụ thể apelin.

Ứng dụng sàng lọc ảo và đánh giá ADMET các chất sàng lọc được, kết quả chọn
được 8 chất tiêu biểu có tiềm năng chủ vận thụ thể apelin. Trong đó, hai chất tiềm
năng từ quá trình sàng lọc ảo được mô phỏng động học 10 ns, để khảo sát khả năng
gắn kết của các chất này.
Kết luận và đề nghị
Các mô hình insilico đã được xây dựng và ứng dụng thành công để sàng lọc các chất
có tiềm năng chủ vận thụ thể apelin. Các kết quả sàng lọc chất tiềm năng cần được
tiến hành các thử nghiệm invitro để tìm ra các chất có hoạt tính thực sự.
IN SILICO MODELS FOR VIRTUAL SCREENING OF
APELIN RECEPTOR AGONIST
Student: Ngo Thi Hang
Supervisor: Mai Thanh Tan, MSc.; Huynh Thi Ngoc Phuong, Assoc. Prof. PhD.
Introduction
Apelin is a peptide known as the ligand of the G-protein-couple receptor apelin. The
beneficial effects of apelin on cardiovascular and metabolic diseases have been
demonstrated in animal models and clinical studies. The aim of this study was finding
novel and strong small molecular agonist for apelin receptor.
Materials and Methods
The objects of this study included the database of small molecular apelin receptor
agonists had been published in two patents US9156796 and WO2017100558A1; the
crystal structure of apelin receptor downloaded from the Protein Data Bank (PDB ID:
5VBL); the ZINC12 database and the Maybridge Screening and Fragments Collection.
The methods were used included 3D-pharmacophore, 2D-QSAR, molecular docking
and molecular dynamics simulations.
Results
689 apelin receptor agonist compounds were collected from two patents and used as
a database to build the models. Among the obtained 5-points 3D-pharmacophore
models, the Ph003 model was the best model and had good performance during the
virtual screening. The QSAR-2 model built with CPG-NN method had good
assessment results and was applied to predict the agonist effects of new compounds.
A molecular docking model has also been constructed to evaluate the binding on
apelin receptors of the agonist compounds.
Applying the virtual screening models and ADMET assessment, 8 potential agonists
of apelin receptor were selected. Two potential compounds from virtual screening
were molecular dynamics simulated in 10 ns to further investigate the binding
capacity.
Conclusion
The in silico models have been developed and applied to virtual screen for apelin
receptor agonists. The potential compounds should be evaluated by the in vitro
experiments to discover the real bioactivity.
MỤC LỤC
MỤC LỤC ................................................................................................................... i
DANH MỤC CÁC CHỮ VIẾT TẮT ........................................................................ ii
DANH MỤC CÁC BẢNG........................................................................................ iv
DANH MỤC CÁC HÌNH VÀ BIỂU ĐỒ ...................................................................v
LỜI CẢM ƠN .......................................................................................................... vii
ĐẶT VẤN ĐỀ.............................................................................................................1
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .....................................................................3
1.1. TỔNG QUAN VỀ APELIN.............................................................................3
1.2. ĐƯỜNG TRUYỀN TÍN HIỆU CỦA THỤ THỂ APELIN .............................5
1.3. VAI TRÒ SINH HỌC CỦA APELIN .............................................................6
1.4. PHƯƠNG PHÁP ĐÁNH GIÁ HOẠT TÍNH CHỦ VẬN THỤ THỂ APELIN
.................................................................................................................................8
1.5. CÁC NGHIÊN CỨU VỀ CHẤT CHỦ VẬN THỤ THỂ APELIN HIỆN NAY
.................................................................................................................................9
1.6. CÁC PHƯƠNG PHÁP SÀNG LỌC ẢO .......................................................10
CHƯƠNG 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU ........................12
2.1. ĐỐI TƯỢNG NGHIÊN CỨU .......................................................................12
2.2. PHƯƠNG PHÁP NGHIÊN CỨU..................................................................13
CHƯƠNG 3. KẾT QUẢ VÀ BÀN LUẬN...............................................................28
3.1. MÔ HÌNH 3D-PHARMACOPHORE ...........................................................28
3.2. MÔ HÌNH 2D-QSAR ....................................................................................30
3.3. MÔ HÌNH DOCKING PHÂN TỬ ................................................................36
3.4. ỨNG DỤNG SÀNG LỌC ẢO.......................................................................40
CHƯƠNG 4. KẾT LUẬN VÀ ĐỀ NGHỊ ................................................................58
TÀI LIỆU THAM KHẢO .........................................................................................59
PHỤ LỤC ....................................................................................................................1

i
DANH MỤC CÁC CHỮ VIẾT TẮT

Từ viết tắt Từ viết đầy đủ bằng tiếng Anh Từ viết đầy đủ bằng tiếng Việt
2D Two dimensions 2 chiều
3D Three dimensions 3 chiều
Acc Accuracy Độ đúng
ACE2 Angiotensin Converting Enzym Enzym chuyển đổi angiotensin 2
2
ADMET Absorption, Distribution, Hấp thu, phân bố, chuyển hóa,
Metabolism, Excretion - thải trừ - độc tính
Toxicity
APLNR APj endogenous LigaNd Thụ thể apelin
Receptor
AT1R Angiotensin type 1 Thụ thể angiotensin II loại 1
cAMP Cyclic adenosine AMP vòng
monophosphate
CPG-NN Counter-Propagation Neural Phương pháp mạng neuron
Networks nhiều lớp ngược hướng
CSDL Cơ sở dữ liệu
EC50 Effective Concentration Nồng độ chủ vận 50%
eNOS Endothelial nitric oxide synthase Enzym tổng hợp nitric oxid nội

FN False negative compounds Chất âm tính giả
FP False positive compounds Chất dương tính
GH Goodness of hit list Khả năng phân biệt mô hình
GPCR G-protein coupled receptor Thụ thể bắt cặp G-protein
MDS Molecular Dynamics Simulation Mô phỏng động lực học phân tử
PCA Principal Component Analysis Phân tích thành phần chính
PCR Polymerase Chain Reaction Phản ứng khuếch đại gen hay
phản ứng chuỗi trùng hợp
PDB Protein Data Bank Ngân hàng dữ liệu protein
PLS Partial Least Squares Phương pháp bình phương tối
thiểu từng phần

ii
Từ viết tắt Từ viết đầy đủ bằng tiếng Anh Từ viết đầy đủ bằng tiếng Việt
QSAR Quantitative Structure-Activity Mối quan hệ giữa cấu trúc và tác
Relationship dụng sinh học
RMSD Root mean square deviation Độ lệch bình phương trung bình
RMSE Root mean square error Sai số bình phương trung bình
TN True negative compounds Chất âm tính thật
TP True positive compounds Chất dương tính thật
Ya Yield of actives Tỷ suất hoạt tính

iii
DANH MỤC CÁC BẢNG

Bảng 2.1. Giá trị ngưỡng của các rủi ro được đề nghị bởi ADMET Predictor 9.5TM
...................................................................................................................................26
Bảng 3.1. Ba mô hình 3D-pharmacophore của các chất chủ vận thụ thể .................29
Bảng 3.2. Kết quả đánh giá ba mô hình 3D-pharmacophore theo điểm số GH .......30
Bảng 3.3. Ý nghĩa của các thông số mô tả ...............................................................30
Bảng 3.4. Mức độ tương quan giữa các thông số với nhau và với pEC50. ..............31
Bảng 3.5. Kết quả đánh giá mô hình QSAR-1..........................................................32
Bảng 3.6. Kết quả đánh giá mô hình QSAR-2 theo phương pháp CPG-NN............35
Bảng 3.7. Miền ứng dụng của mô hình QSAR-2......................................................36
Bảng 3.8. Các thư viện hợp chất dùng để sàng lọc ảo chất có tiềm năng chủ vận thụ
thể apelin ...................................................................................................................40
Bảng 3.9. Kết quả sàng lọc ADMET ........................................................................42

iv
DANH MỤC CÁC HÌNH VÀ BIỂU ĐỒ

Hình 1.1. Quá trình sinh tổng hợp tạo thành các dạng apelin [9] ..............................3
Hình 1.2. Cấu trúc tổng thể và sự sắp xếp phối tử AMG3054 trong khoang gắn kết
[10]. .............................................................................................................................4
Hình 1.3. Đường truyền tín hiệu của hệ thống thụ thể apelin [9]...............................6
Hình 2.1. Cấu trúc của thụ thể apelin đồng kết tinh với AMG3054 ........................12
Hình 2.2. Cấu trúc chung của các dẫn chất (A) 1H-benzimidazol-5-carboxamid; (B)
1H-pyrazol-3-carboxamid. ........................................................................................13
Hình 2.3. Quy trình sàng lọc ảo ................................................................................24
Hình 3.1. Ba mô hình 3D-pharmacophore cho chất chủ vận thụ thể apelin ............28
Hình 3.2. Kết quả loại nhiễu bằng PCA ...................................................................31
Hình 3.3. Mối tương quan pEC50 thực nghiệm và dự đoán của mô hình QSAR-1 xây
dựng theo phương pháp PLS .....................................................................................33
Hình 3.4. Bản đồ tự tổ chức của tập huấn luyện và tập kiểm tra ..............................34
Hình 3.5. Mối tương quan pEC50 thực nghiệm và dự đoán của mô hình QSAR-2 xây
dựng theo phương pháp CPG-NN .............................................................................35
Hình 3.6. Mô hình khoang gắn kết của thụ thể apelin..............................................36
Hình 3.7. Phân bố điểm số docking của 689 chất chủ vận thụ thể apelin ................37
Hình 3.8. Biểu đồ tỉ lệ số chất tạo tương tác với các acid amin trong thụ thể apelin
...................................................................................................................................38
Hình 3.9. Biểu đồ tần suất tạo liên kết kỵ nước và liên kết hydro với các acid amin
của thụ thể apelin ......................................................................................................38
Hình 3.10. Biểu đồ tần suất tạo liên kết kỵ nước và liên kết hydro giữa 123 chất chủ
vận mạnh với các acid amin tại khoang gắn kết của thụ thể apelin ..........................39
Hình 3.11. Mô hình gắn kết 3D và tương tác 2D của WO2017100558A1-479 với thụ
thể apelin ...................................................................................................................40
Hình 3.12. Kết quả sàng lọc ảo chất chủ vận thụ thể apelin ....................................41
Hình 3.13. Biểu đồ phân bố điểm số docking trên tập ZINC12 ................................43
Hình 3.14. Biểu đồ phân bố điểm số docking trên tập Maybridge ..........................44

v
Hình 3.15. Mô hình gắn kết 3D và tương tác 2D của ZINC19634420 với thụ thể
apelin .........................................................................................................................45
Hình 3.16. Mô hình gắn kết 3D và tương tác 2D của ZINC02737937 với thụ thể
apelin .........................................................................................................................46
Hình 3.17. Mô hình gắn kết 3D và tương tác 2D của ZINC41124344 với thụ thể
apelin .........................................................................................................................47
Hình 3.18. Mô hình gắn kết 3D và tương tác 2D của ZINC09563058 với thụ thể
apelin .........................................................................................................................48
Hình 3.19. Mô hình gắn kết 3D và tương tác 2D của ZINC04044911 với thụ thể
apelin .........................................................................................................................49
Hình 3.20. Mô hình gắn kết 3D và tương tác 2D của MB-HTS11958 với thụ thể
apelin .........................................................................................................................50
Hình 3.21. Mô hình gắn kết 3D và tương tác 2D của MB-CD01296 với thụ thể apelin
...................................................................................................................................51
Hình 3.22. Mô hình gắn kết 3D và tương tác 2D của BTB02585 với thụ thể apelin
...................................................................................................................................52
Hình 3.23. Mô hình tương tác 2D của ZINC15163181 với thụ thể apelin ..............53
Hình 3.24. Mô hình tương tác 2D của MB-SEW04180 với thụ thể apelin ..............53
Hình 3.25. Đồ thị RMSD của carbon xương sống thụ thể apelin ở dạng apoprotein
(apo-thụ thể apelin) và ở dạng phức hợp với các ligand ...........................................54
Hình 3.26. Tần suất tương tác của các ligand với thụ thể apelin .............................56
Hình 3.27. Sự tương tác của các ligand với thụ thể apelin.......................................57

vi
LỜI CẢM ƠN

Đầu tiên, em xin chân thành gửi lời cảm ơn đến Cô PGS. TS. Huỳnh Thị Ngọc
Phương. Em cảm ơn Cô đã hướng dẫn và dành thời gian quý báu để xem xét, góp ý
và sửa chữa chi tiết cho em hoàn thiện khóa luận.
Em cảm ơn Thầy ThS. Mai Thành Tấn. Thầy đã luôn quan tâm, đồng hành và hướng
dẫn em tận tình từ ngày đầu tiếp cận lĩnh vực này và trong suốt quá trình thực hiện
khóa luận. Thầy đã định hướng cho em nhiều ý tưởng để phát triển đề tài và truyền
đạt những kiến thức quý báu để em thực hiện tốt khóa luận. Em cảm ơn thầy đã dành
nhiều thời gian, tâm huyết để góp ý và chỉnh sửa từng chi tiết nhỏ cho khóa luận của
em được hoàn thiện.
Em xin cảm ơn thầy PGS. TS. Thái Khắc Minh đã tạo điều kiện giúp em tiếp cận với
lĩnh vực nghiên cứu khoa học. Em cảm ơn thầy đã phản biện và góp ý giúp đề tài của
em hoàn thiện hơn.
Con cũng xin gửi lời cảm ơn yêu thương đến bố mẹ, đấng sinh thành ra con. Bố mẹ
luôn quan tâm, chăm sóc con và là chỗ dựa tinh thần cho con hoàn thành tốt khóa
luận.
Em gửi lời cảm ơn đến các Thầy, Cô và các Chị kỹ thuật viên của Bộ môn Hóa Dược.
Em cảm ơn anh DS. Bùi Quốc Dũng, anh ThS. Trần Thái Sơn cùng các bạn trong
phòng Hóa Dược 314 đã sẵn lòng giúp đỡ, giải đáp thắc mắc của mình trong thời gian
qua.
Cuối cùng, cảm ơn em Nguyễn Đắc Nhân, Diệu Linh và các bạn monitor đã hỗ trợ
chị trong giai đoạn cuối của khoá luận.

Thành phố Hồ Chí Minh, ngày 07 tháng 08 năm 2020


Ngô Thị Hằng

vii
Khóa luận tốt nghiệp DSĐH Đặt vấn đề

ĐẶT VẤN ĐỀ
Bệnh lý tim mạch là nguyên nhân gây tử vong hàng đầu trên toàn thế giới. Tại Việt
Nam, theo điều tra quốc gia về yếu tố nguy cơ của bệnh không lây nhiễm năm 2015,
tỷ lệ tăng huyết áp ở người trưởng thành từ 18−69 tuổi là 18,9%, tức cứ 5 người
trưởng thành thì có một người bị tăng huyết áp. Tăng huyết áp làm tăng nguy cơ tử
vong do đột quỵ lên gấp 4 lần và tăng nguy cơ tử vong do bệnh lý tim mạch lên gấp
3 lần so với người không mắc bệnh [1].
Mặc dù đã có nhiều thuốc điều trị, tăng huyết áp và suy tim vẫn gây ra gánh nặng lớn
về sức khỏe và kinh tế. Các thành công đáng kể của các thuốc hạ huyết áp đã được
chứng minh. Tuy nhiên, tình trạng kháng thuốc của thuốc điều trị tăng huyết áp vẫn
là một vấn đề lâm sàng quan trọng. Vì vậy, các hướng trị liệu mới là cần thiết để giúp
cho quá trình điều trị đạt hiệu quả cao hơn, cải thiện sự tổn thương cơ quan đích và
giúp ngăn chặn sự phát triển các biến chứng của bệnh tim mạch như đột quỵ, thiếu
máu tim cục bộ và suy tim [2].
Apelin là một phối tử peptid nội sinh của thụ thể apelin, thuộc họ thụ thể bắt cặp G-
protein (GPCR). Các tác dụng có lợi của apelin đối với các bệnh lý tim mạch và bệnh
chuyển hóa đã được chứng minh trên các mô hình động vật và các nghiên cứu lâm
sàng [3]. Vì thế, các chất chủ vận thụ thể apelin nổi lên trong những năm gần đây như
là những tác nhân tiềm năng để điều trị các bệnh nói trên.
Tuy nhiên, vẫn còn nhiều thách thức để khai thác thụ thể apelin như một mục tiêu
điều trị. Đặc biệt, bản chất peptid của apelin dẫn đến sự hạn chế về tính ổn định và
sinh khả dụng của chất này khi dùng bằng đường uống [4]. Có nhiều nghiên cứu thiết
kế phân tử nhỏ chủ vận thụ thể apelin, nổi bật là các cấu trúc được mô tả trong bằng
sáng chế US9156796 [5] và WO2017100558A1 [6].
Đề tài “Xây dựng các mô hình sàng lọc ảo chất chủ vận thụ thể apelin” được thực
hiện với mục tiêu tổng quát là tìm kiếm các cấu trúc phân tử nhỏ mới và có tác dụng
chủ vận mạnh trên thụ thể này. Các mục tiêu cụ thể của đề tài bao gồm:
1. Thu thập cơ sở dữ liệu cấu trúc và hoạt tính của các chất chủ vận thụ thể apelin từ
hai bằng sáng chế nói trên.
2. Xây dựng mô hình 3D-pharmacophore dựa trên các chất có hoạt tính chủ vận mạnh
để làm công cụ sàng lọc ảo.
3. Xây dựng mô hình 2D-QSAR từ cơ sở dữ liệu để làm công cụ dự đoán hoạt tính in
silico cho các chất mới chủ vận thụ thể apelin.

1
Khóa luận tốt nghiệp DSĐH Đặt vấn đề

4. Xây dựng mô hình mô tả phân tử docking để khảo sát sự gắn kết của các chất chủ
vận trên thụ thể apelin.
5. Ứng dụng 3 mô hình trên để sàng lọc ảo qua thư viện hóa học lớn (ZINC12 và
Maybridge) để tìm kiếm các chất mới có tiềm năng chủ vận mạnh trên thụ thể apelin.

2
Khóa luận tốt nghiệp DSĐH Tổng quan tài liệu

CHƯƠNG 1. TỔNG QUAN TÀI LIỆU


1.1. TỔNG QUAN VỀ APELIN
Năm 1998, Tatemoto và cộng sự đã xác định một peptid 36 acid amin từ dạ dày bò.
Peptid này được xác định là phối tử tự nhiên, liên kết với thụ thể apelin và đặt tên cho
nó là apelin, là chữ viết tắt của từ APj Endogenous LIgaNd [3, 7]. Gen của apelin
nằm trên nhiễm sắc thể X, mã hóa một chuỗi polypeptid 77 acid amin được gọi là
preproapelin (Hình 1.1). Sau khi được cắt bởi các endopeptidase, preproapelin tạo
thành proapelin có chiều dài 55 acid amin. Sau đó, dưới tác dụng của ACE2
(Angiotensin Converting Enzym 2), peptid này tiếp tục được phân cắt tạo ra một số
peptid nhỏ hơn với đầu C tận có kích thước khác nhau. Chúng được phân loại trên số
lượng acid amin: apelin-36, apelin-17, apelin-13, apelin-12. Dạng pyroglutamat của
apelin-13 ([Pyr1]-Apelin-13), trong đó phân tử apelin-13 được pyroglutamyl hóa tại
đầu N tận, là dạng apelin phổ biến nhất trong huyết tương người [8].

Hình 1.1. Quá trình sinh tổng hợp tạo thành các dạng apelin [9]

3
Khóa luận tốt nghiệp DSĐH Tổng quan tài liệu

1.1.1. CẤU TRÚC THỤ THỂ APELIN


Thụ thể apelin là một thụ thể bắt cặp G-protein loại A (G-protein coupled receptor A
- GPCRA). Thụ thể này bao gồm 380 acid amin với 7 miền xuyên màng, trọng lượng
phân tử khoảng 42.660 Da. Được phân lập bằng phương pháp PCR từ ADN bộ gen
người, thụ thể apelin lần đầu tiên được xác định vào năm 1993. Thụ thể apelin được
mã hóa bởi gen APLNR trên nhiễm sắc thể số 11. Việc phát hiện thụ thể apelin dựa
trên sự tương tự trình tự acid amin của nó với thụ thể angiotensin II loại 1 (AT1R)
nhưng nó không được kích hoạt bởi angiotensin II [7, 10, 11].
Thông qua cấu trúc được chụp nhiễu xạ tinh thể tia X của thụ thể apelin đồng kết tinh
với ligand AMG3054 (một peptid bắt chước apelin-17), hai vị trí gắn kết riêng biệt
với thụ thể đã được xác định (Hình 1.2).

Hình 1.2. Cấu trúc tổng thể và sự sắp xếp phối tử AMG3054 trong khoang gắn kết [10].
Hình 1.2A cho thấy vị trí đầu tiên (vị trí 1) nằm sâu trong khoang gắn kết, được phân
định bởi các acid amin Tyr35, Trp85, Tyr88, Tyr93 và Tyr299 xung quanh acid amin

4
Khóa luận tốt nghiệp DSĐH Tổng quan tài liệu

4-Cl-Phe17 của ligand AMG3054 (tương ứng là acid amin Phe17 của apelin-17).
Acid amin Trp24 và Tyr93 tạo thành một túi nhỏ cho Pro16. Acid amin Tyr271 và
Phe291 bao quanh Nle15 (Norleucin). Acid carboxylic cuối cùng của apelin tương
tác với các acid amin Arg168, Lys268 và Tyr264 thông qua liên kết hydro và tương
tác tĩnh điện.
Vị trí liên kết thứ hai rất nông, nằm giữa vùng đầu N tận và vòng ngoại bào 2
(extracellular loop - ECL2). Vị trí này được đặc trưng bởi sự hình thành liên kết hydro
giữa nhóm C=O của Gln5 và Thr177. Một mạng lưới liên kết hydro giữa hArg8
(homoarginin) với Asp23, Lys178ECL2 và Asp92ECL1 cũng được quan sát thấy.
Trên apelin-13, Lys8 tương tác với Asp284.
Hình 1.2B minh họa trình tự acid amin của apelin-17, AMG3054 và apelin-13. Các
acid amin khác nhau giữa các peptid được tô màu đỏ. Các đơn vị hArg, Cha, Oic, Nle
và 4-Cl-Phe là các acid amin không tự nhiên [4].
1.2. ĐƯỜNG TRUYỀN TÍN HIỆU CỦA THỤ THỂ APELIN
Tín hiệu xuôi dòng của thụ thể apelin tương đối phức tạp và các mối quan hệ của nó
với sự kích hoạt của G-protein vẫn đang được làm rõ. Hình 1.3 minh họa đường
truyền tín hiệu của apelin. Để truyền tín hiệu đối với hệ thống thụ thể này, cần có hai
tiểu phần của tiểu đơn vị Gα là Gαi/o và Gαq/11. Tương tự như các hiệu ứng xuôi dòng
trung gian của Gαi/o cổ điển, protein Gαi/o với thụ thể apelin gây ức chế adenylate
cyclase (AC) và do đó giảm sản xuất AMP vòng (cAMP) nội bào và làm bất hoạt
protein kinase A (PKA).
Sự kích hoạt thụ thể apelin còn dẫn đến việc phospholipase Cβ kích hoạt protein
kinase C (PKC) và hệ thống Ras/Raf/MEK/ERK, cùng với Akt thông qua mTOR có
liên quan đến sự kích hoạt P70S6K và hoạt hóa sự tổng hợp nitric oxid nội mô (eNOS)
và thúc đẩy sự giải phóng NO, gây giãn mạch máu, kiểm soát trương lực mạch máu
và tăng sinh tế bào. Việc kích hoạt bộ trao đổi Na/H loại 1 thông qua PKC trong tế
bào cơ tim làm tăng co bóp cơ tim [9].

5
Khóa luận tốt nghiệp DSĐH Tổng quan tài liệu

Hình 1.3. Đường truyền tín hiệu của hệ thống thụ thể apelin [9].

1.3. VAI TRÒ SINH HỌC CỦA APELIN


Đối với hoạt động của tim mạch
Apelin giúp hạ huyết áp động mạch thông qua cơ chế phụ thuộc nitric oxyd. Điều trị
bằng apelin cũng làm giảm trương lực tĩnh mạch toàn thân và ức chế sự giải phóng
arasin vasopressin để thúc đẩy sự lợi tiểu. Mặt khác, tiêm apelin trong phúc mạc làm
giảm tiền tải cho tâm thất trái và không gây phì đại tim. Đây là một trong những chất
có tác dụng tăng co bóp tim (hiệu ứng inotropic dương) [11]. Do đó, chất chủ vận
apelin được đề nghị như tác nhân điều trị tăng huyết áp và suy tim [8].
Đối với suy tim
Vai trò của apelin và thụ thể của nó trong sự tiến triển của bệnh suy tim ngày càng
được quan tâm. Nồng độ apelin trong huyết tương thấp hơn đáng kể ở những bệnh
nhân bị suy tim. Điều này cho thấy rằng sự giảm nồng độ apelin huyết tương có thể
được ứng dụng như một dấu ấn sinh học đáng tin cậy để phát hiện và chẩn đoán suy
tim.
Sự biểu hiện của cả apelin và thụ thể của nó giảm rõ rệt khi bệnh nhân bị suy tim.
Apelin có thể giúp giảm tiền tải và hậu tải tâm thất trái ở chuột, và có tác dụng tăng
mạnh sức co bóp cơ tim. Dựa trên các tác dụng bảo vệ tim mạch của apelin, các chiến

6
Khóa luận tốt nghiệp DSĐH Tổng quan tài liệu

lược để tăng cường tín hiệu của peptid này có thể giúp làm chậm sự tiến triển của suy
tim. Sự tăng cấp tính nồng độ apelin đã được báo cáo là gây giãn mạch ngoại biên và
mạch vành và làm tăng cung lượng tim ở bệnh nhân suy tim mạn tính [11].
Thụ thể apelin đóng một vai trò quan trọng trong hệ thống tim mạch, có thể ức chế
quá trình apoptosis của các tế bào cơ trơn mạch máu (VSMC – Vascular Smooth
Muscle Cells), giúp tăng sinh và có tác dụng kích thích mạnh đối với cơ tim [12].
Tăng huyết áp
Gần đây, một loạt các nghiên cứu đã tập trung vào sự liên quan của hệ thống apelin
với bệnh tăng huyết áp. Tăng huyết áp “đeo mặt nạ” (trường hợp bệnh nhân có huyết
áp bình thường khi đo tại phòng khám nhưng tăng khi đo ở nhà hoặc nơi khác) là một
yếu tố dự báo đáng kể về các bệnh tim mạch. Nồng độ apelin trong huyết tương thấp
hơn đáng kể ở nhóm bệnh nhân tăng huyết áp “đeo mặt nạ”. Ở những bệnh nhân bị
tăng huyết áp, nồng độ apelin tuần hoàn cũng giảm và liên quan độc lập đến sự suy
yếu chức năng tâm thu và tâm trương thất trái.
Alen G212A mã hóa thụ thể aplein có tác dụng bảo vệ, giúp chống lại sự phát triển
của bệnh tăng huyết áp. Apelin được báo cáo là làm giảm huyết áp ở chuột bị tăng
huyết áp do deoxycorticosteron acetat bằng cách ức chế hệ thống Renin-Angiotensin
(RAS). Jia và cộng sự đã quan sát thấy rằng sự giãn mạch do apelin gây ra có liên
quan trực tiếp đến việc kích hoạt enzym L-arginin/nitric oxid synthase (NOS).
Apelin gây giãn mạch dẫn đến sự giảm huyết áp động mạch trung bình (MABP -
Mean Arterial Blood Pressure), từ đó giảm tiền tải và hậu tải. Việc điều trị liên tục
bằng apelin-13 cho thấy sự tăng khả năng co bóp của cơ tim và hạ thấp huyết áp động
mạch trung bình MABP ở bệnh nhân suy tim.
Apelin có thể được sử dụng như một tác nhân trị liệu trong điều trị tăng huyết áp
trong tương lai. Tuy nhiên, cần chú ý đến sự phức tạp của việc điều hòa huyết áp
bằng apelin. Các nghiên cứu sâu hơn cần phải được thực hiện để xác định vai trò
chính xác của tín hiệu apelin trong việc kiểm soát huyết áp [11].
Đối với bệnh tăng áp động mạch phổi
Các thử nghiệm trên bệnh nhân tăng huyết áp động mạch phổi (PAH - Pulmonary
Arterial Hypertension) đã khẳng định tiềm năng trị liệu này. Trong đó, sự truyền tín
hiệu của apelin giúp cải thiện cung lượng tim và giảm sức cản mạch máu phổi [8].
Đối với xơ vữa động mạch
Xơ vữa động mạch là một bệnh viêm mãn tính phức tạp của thành mạch với các tổn
thương do sự lắng đọng của lipid. Sự hình thành các tế bào bọt bởi đại thực bào trong

7
Khóa luận tốt nghiệp DSĐH Tổng quan tài liệu

vùng nội mạc mạch máu là một dấu hiệu chính của các tổn thương xơ vữa động mạch
trong giai đoạn đầu. Apelin-13 chiếm ưu thế trong hệ thống tuần hoàn, thúc đẩy đáng
kể dòng chảy cholesterol nội bào và làm giảm sự hình thành tế bào bọt đại thực bào
bằng cách tăng mức độ protein ABCA1 (ATP Binding Cassette Subfamily A Member
1), một protein vận chuyển màng ngược của cholesterol, tăng tạo lipoprotein tỉ trọng
cao (HDL – High Density Lipoprotein) [11].
1.4. PHƯƠNG PHÁP ĐÁNH GIÁ HOẠT TÍNH CHỦ VẬN THỤ THỂ APELIN
1.4.1. Phương pháp calci huỳnh quang
Nguyên tắc của thử nghiệm này là hoạt tính chủ vận thụ thể apelin dẫn đến sự kích
hoạt enzym ERK (kinase điều hòa tín hiệu ngoại bào) và gây ra sự phóng thích ion
Ca2+ nội bào. Sự huy động calci được theo dõi bằng cách sử dụng thuốc nhuộm huỳnh
quang.
Các nguyên liệu của thử nghiệm gồm tế bào buồng trứng chuột đồng Trung Quốc
(CHO - Chinese Hamster Ovary) biểu hiện gen Gαq16 mã hóa cho thụ thể. Phương
pháp calci huỳnh quang được thực hiện ở bước sóng kích thích 448 nm và bước sóng
phát xạ 520 nm.
Tế bào được đếm bằng hemocytometer. 30.000 tế bào được chuyển đến từng giếng
của của đĩa 96 giếng trong thiết bị Costar Optical. Mỗi đĩa được ủ ở 37°C trong 24
giờ. Các môi trường nuôi cấy được loại bỏ và sau đó các tế bào được nạp với đầu dò
calci huỳnh quang (thuốc nhuộm AM Fluo-4; Invitrogen/Phân tử thăm dò, Eugene,
OR) tại một nồng độ tải cuối cùng của 2 µM trong bộ đệm dựa trên HBSS chứa
HEPES 20 mM, BSA 1% và probenecid 10 probM (Sigma) trong tổng khối lượng
225 µL. Các tế bào được ủ ở 37°C trong 1 giờ và sau đó được kích thích bằng apelin-
13 tổng hợp ở các nồng độ khác nhau bằng cách sử dụng đầu đọc đĩa tự động
Flexstation. Thêm chất chủ vận ở mức 10 lần nồng độ vào từng giếng sau khi đọc các
giá trị cơ bản trong khoảng 17 giây.
Theo dõi trong mỗi giếng tại khoảng thời gian cứ 60 giây và kết quả được báo cáo
cho mỗi giếng. Dữ liệu được thu thập bằng Softmax phiên bản 4.8 (công nghệ phân
tích MDS) và được phân tích bằng phần mềm Prism (GraphPad,La Jolla, CA) [5, 6,
13].
1.4.2. Phương pháp phóng xạ
Các tế bào phôi thận người (HEK293 - Human embryonic Kidney cells 293) được
cấy gen mã hóa thụ thể apelin của người và được nuôi cấy trong môi trường thích
hợp. Thụ thể apelin là một protein trên màng tế bào HEK293. Sau đó, các tế bào này

8
Khóa luận tốt nghiệp DSĐH Tổng quan tài liệu

được phá vỡ và ly tâm để thu lấy protein màng. Protein màng tiếp tục được ủ với chất
phóng xạ và phối tử để thực hiện thử nghiệm gắn kết.
Các phối tử không liên kết được loại bỏ bằng cách lọc và rửa lại bằng dung dịch đệm.
Kết quả được ghi nhận bằng sự phát xạ của tia gamma. Liên kết không đặc hiệu, được
xác định với sự có mặt của 10−5 nM Pyr-apelin-13, không vượt quá 5% tổng tín hiệu.
Các kết quả được vẽ trên đường cong phản ứng nồng độ bằng cách sử dụng phần
mềm GraphPad Prism 7 để tính toán các giá trị EC50. Hằng số phân ly Ki được tính
từ giá trị EC50 bằng phương trình Cheng − Prusoff và kết quả được hiển thị dưới dạng
trung bình của ba thí nghiệm độc lập [8].
1.5. CÁC NGHIÊN CỨU VỀ CHẤT CHỦ VẬN THỤ THỂ APELIN HIỆN NAY
Các peptid apelin dễ dàng chuyển hóa in vivo với chu kỳ bán hủy (T1/2) khoảng 5 phút
[4]. Vì vậy, việc nghiên cứu các chất chủ vận thụ thể apelin giúp đảm bảo tác dụng
sinh học, cũng như tìm hiểu rõ hơn về hệ thống apelinergic. Một số nghiên cứu về
chất chủ vận thụ thể aplein đã được công bố:
1.5.1. Peptid ELA chủ vận thụ thể apelin
Gần đây, ELABELA (còn gọi là Apela/Toddler/ELA) được báo cáo là phối tử nội
sinh thứ hai của thụ thể apelin. ELA ở người là một peptid 54 acid amin bao gồm
peptid tín hiệu và một peptid trưởng thành 32 acid amin (ELA-32). Gen APELA được
mã hóa trên nhiễm sắc thể 4, trước đây được coi là một khu vực không mã hóa. Sự
phân tách bởi furin tạo ra các đồng dạng ngắn hơn cũng cho chức năng hoạt động là
ELA-21 và ELA-11. ELA cho thấy tác dụng có lợi trong một số mô hình động vật
của bệnh mạn tính như suy tim, tăng huyết áp động mạch phổi, béo phì với tình trạng
đề kháng insulin, hoặc các tình trạng cấp tính như thiếu máu cơ tim và rối loạn chức
năng tim do nhiễm trùng huyết ở chuột.
Trong nhiều trường hợp, tác dụng sinh lý của apelin và ELA là tương tự nhau, tuy
nhiên, một số khác biệt đã được báo cáo gần đây. ELA ngăn ngừa tiền sản giật, trong
khi biểu hiện cao của apelin trong quá trình tạo phôi có thể có tác dụng xấu. Trong
mô hình nhiễm trùng huyết, hai phối tử hoạt động khác nhau đối với chức năng thận.
Ngược lại với apelin, ELA không làm thay đổi nồng độ arginin vasopressin [4].
1.5.2. Dẫn chất vòng lớn của apelin-13
Các chất dẫn chất vòng lớn của apelin-13 cho thấy độ ổn định cao hơn đáng kể trong
huyết tương chuột (thời gian bán hủy > 3 giờ so với 24 phút đối với Pyr-apelin-13),
kèm theo ái lực được cải thiện (Ki = 0,15 nM và T1/2 = 6,8 giờ). Một số hợp chất cho
thấy hiệu ứng inotropic dương tính cao hơn trong mô hình tim cô lập Langendorff ở
chuột (đáp ứng tối đa ở 0,003 nM so với 0,03 nM của apelin-13) [8].

9
Khóa luận tốt nghiệp DSĐH Tổng quan tài liệu

1.5.3. Phân tử nhỏ chủ vận thụ thể apelin


Hai khung cấu trúc 1H-benzimidazol-5-carboxamid và 1H-pyrazol-3-carboxamid lần
lượt trong hai bằng sáng chế US9156796 [5] và WO2017100558A [6] thể hiện khả
năng chủ vận thụ thể apelin. Đây là hai trong số ít các nhóm chất thuộc hệ thống non-
peptid cho kết quả gắn kết tốt, khắc phục nhược điểm về thời gian bán hủy (T1/2) của
các apelin nội sinh và có khả năng dùng được bằng đường uống.
1.6. CÁC PHƯƠNG PHÁP SÀNG LỌC ẢO
1.6.1. Mô hình 3D-pharmacophore
Pharmacophore (nhóm quyết định tác dụng sinh học) bao gồm tất cả các yếu tố không
gian (steric) và điện tử (electron) cần thiết để đảm bảo cho sự tương tác của phân tử
hợp chất với cấu trúc mục tiêu sinh học chuyên biệt để gây nên hiệu ứng kích thích
(hay ức chế) đáp ứng sinh học của mục tiêu tác động này. Một pharmacophore không
đại diện bởi một phân tử cụ thể hoặc nhóm chức cụ thể nào mà khái niệm này dùng
để mô tả các cấu trúc có khả năng liên kết của một nhóm hoạt chất lên điểm tác động.
Pharmacophore có thể được xem như là mẫu số chung lớn nhất của các cấu trúc có
tác dụng sinh học (cấu trúc hiện diện ở tất cả các phân tử có hoạt tính) [14].
Pharmacophore được mô tả bằng các yếu tố có khả năng tạo liên kết hydro (cho và
nhận), khả năng tương tác kỵ nước, tương tác vòng thơm, khả năng tích điện… và
được xác định bằng các nguyên tử, các vòng, các điểm giả định (virtual points). Ứng
dụng của mô hình 3D-pharmacophore để tìm những phân tử hợp chất có các đặc tính
cần thiết từ cơ sở dữ liệu cấu trúc 3D một cách nhanh chóng và hiệu quả. Mô hình
3D-pharmacophore có thể được xây dựng bằng các cách như:
i. Dựa trên cấu trúc phối tử (ligand–based): mô hình được tạo ra từ một hợp chất hoặc
từ một dãy các hoạt chất có cùng vị trí gắn kết trên mục tiêu tác động.
ii. Dựa trên cấu trúc của mục tiêu tác động (structure-based): mô hình được xây dựng
dựa trên cấu trúc của đích tác động trong không gian 3 chiều [15].
1.6.2. Mô hình mối quan hệ định lượng giữa cấu trúc và tác dụng (QSAR)
Việc hệ thống hóa các thông tin cấu trúc của phân tử dựa trên các thông số mô tả
phân tử và phân tích dữ liệu cho phép thành lập mô hình QSAR - mối quan hệ định
lượng giữa cấu trúc và hoạt tính. QSAR có khả năng dự đoán các hoạt tính sinh học
(IC50, EC50, MIC hay hằng số gắn kết KD) hoặc phân loại (hoạt tính mạnh hay hoạt
tính yếu) dựa trên các thông số mô tả phân tử của các hợp chất trước khi xác định
bằng thực nghiệm.

10
Khóa luận tốt nghiệp DSĐH Tổng quan tài liệu

SONNIA được phát triển bởi Molecular Networks dựa trên mạng neuron tự tổ chức
(SOM) và mạng neuron nhiều lớp ngược hướng (CPG-NN). Do khả năng xây dựng
các mô hình phi tuyến tính phức tạp, SONNIA có nhiều ứng dụng trong thiết kế thuốc
như ứng dụng trong nghiên cứu QSAR, mô hình hóa tính chất dược động ADMETox
(hấp thu, phân bố, chuyển hóa, thải trừ, độc tính), phân tích dữ liệu của sàng lọc đầu
vào cao, phân tích tính đồng dạng và đa dạng của cơ sở dữ liệu hóa học tổ hợp, lựa
chọn thông số mô tả phân tử, phân loại và dự đoán hoạt tính sinh học,... [16].
1.6.3. Mô hình mô tả phân tử docking
Docking là một phương pháp có vai trò quan trọng trong việc thiết kế thuốc dựa vào
máy tính. Mục đích của docking nhằm đánh giá khả năng gắn kết cũng như dự đoán
được cấu dạng của phối tử (ligand) khi gắn kết với cấu trúc mục tiêu (thường là các
protein). Cùng với sự phát triển không ngừng của công nghệ thông tin trong lĩnh vực
sinh học cũng như các tập cơ sở dữ liệu phân tử nhỏ và các cấu trúc mục tiêu như các
ngân hàng dữ liệu protein, phương pháp docking ngày càng được sử dụng rộng rãi
trong sàng lọc ảo.
Docking có khá nhiều ứng dụng trong thiết kế thuốc hợp lý, như nghiên cứu liên quan
giữa cấu trúc và hoạt tính (SAR), tối ưu hóa chất khởi nguồn (lead), tìm các chất khởi
nguồn tiềm năng thông qua sàng lọc ảo, đưa ra các giả thuyết về gắn kết nhằm đưa ra
các dự đoán cho các nghiên cứu đột biến (mutagenesis studies), hỗ trợ việc phù hợp
hóa các chất nền và chất ức chế vào bản đồ mật độ electron (electron density) trong
cấu trúc nhiễu xạ tinh thể tia X hoặc nghiên cứu cơ chế hóa học [17].

11
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

CHƯƠNG 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU


2.1. ĐỐI TƯỢNG NGHIÊN CỨU
Nghiên cứu này được thực hiện với mục tiêu tìm ra các chất mới có cấu trúc phân tử
nhỏ và có tiềm năng chủ vận thụ thể apelin bằng các mô hình sàng lọc ảo. Đối tượng
của nghiên cứu này bao gồm:
1. Cấu trúc của thụ thể apelin đồng kết tinh với AMG3054 được tải về Ngân hàng dữ
liệu protein (PDB ID: 5VBL) [18]. Cấu trúc của phức hợp được minh họa ở Hình 2.1,
trong đó phối tử AMG3054 được biểu diễn ở dạng peptid màu vàng, thụ thể apelin
với cấu trúc bậc 3 có màu xanh.

Hình 2.1. Cấu trúc của thụ thể apelin đồng kết tinh với AMG3054
2. Cơ sở dữ liệu cấu trúc và tác dụng sinh học của các phân tử nhỏ chủ vận thụ thể
apelin đã được công bố tại các bằng sáng chế US9156796 và WO2017100558A1 [5,
6].
3. Các thư viện lớn chứa các cấu trúc phân tử nhỏ được sử dụng để sàng lọc ảo. Hai
thư viện được sử dụng trong nghiên cứu này gồm cơ sở dữ liệu ZINC12 (với
22.723.923 hợp chất) [19, 20] và cơ sở dữ liệu Maybridge Screening and Fragments
Collection (với 59.520 hợp chất) [21].

12
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

2.2. PHƯƠNG PHÁP NGHIÊN CỨU


2.2.1. Thu thập cơ sở dữ liệu chất chủ vận thụ thể apelin
Cơ sở dữ liệu gồm 689 chất chủ vận thụ thể apelin thuộc hai khung cấu trúc 1H-
benzimidazol-5-carboxamid và 1H-pyrazol-3-carboxamid (Hình 2.2) có cùng
phương pháp thử hoạt tính sinh học bằng thử nghiệm calci huỳnh quang, có giá trị
EC50 từ 0,86 nM đến 44331 nM được thu thập từ hai bằng sáng chế US9156796 và
WO2017100558A [5, 6].

(A) (B)

Hình 2.2. Cấu trúc chung của các dẫn chất (A) 1H-benzimidazol-5-carboxamid; (B) 1H-
pyrazol-3-carboxamid.
Cấu trúc của các chất được vẽ bằng phần mềm ChemDraw 18.0. Sau đó, toàn bộ các
cấu trúc này được đưa vào phần mềm Molecular Operating Environment (MOE)
2015.10 [22] để lập cơ sở dữ liệu phục vụ cho việc xây dựng các mô hình dự đoán
hoạt tính chủ vận thụ thể apelin.
2.2.2. Phương pháp xây dựng mô hình 3D-pharmacophore
Trong đề tài này, mô hình 3D-pharmacophore được xây dựng bằng phương pháp dựa
trên cấu trúc ligand (ligand-based). Mô hình này sẽ được ứng dụng để sàng lọc các
chất có những đặc điểm cấu trúc cần thiết để có tác dụng chủ vận thụ thể apelin.
2.2.2.1. Chuẩn bị cơ sở dữ liệu
Từ cơ sở dữ liệu của 689 chất ban đầu, những chất có EC50 ≤ 100 nM được xác định
là những chất có hoạt tính chủ vận thụ thể apelin mạnh [23]. Những chất này được
xếp vào tập xây dựng (training set) để xây dựng mô hình 3D-pharmacophore. Các
mô hình sau khi được xây dựng xong cần phải được đánh giá. Tập hợp dùng để đánh
giá mô hình pharmacophore (tập đánh giá) bao gồm hai tập:
i. Tập dữ liệu 1: Gồm 300 chất có EC50 tốt nhất từ cơ sở dữ liệu (trong đó, bao gồm
123 chất xây dựng mô hình pharmacophore), gọi là tập active.
ii. Tập dữ liệu 2: Gồm 514 chất có EC50 chưa xác định, có tính chất đối lập với 123
chất chủ vận mạnh trong tập xây dựng. Việc sử dụng tập không hoạt tính (còn gọi là
tập decoy) để mô hình được đánh giá khách quan. Tập decoy gồm những chất giống

13
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

các chất có hoạt tính mạnh trong tập xây dựng về 5 thông số mô tả (khối lượng phân
tử, số liên kết quay được, tổng số nhóm cho hydro, tổng số nhóm nhận hydro và hệ
số phân bố octanol/ nước), nhưng các chất trong tập decoy không có tính chất hóa
học tương tự với bất kì chất nào trong tập xây dựng nó. Tập decoy trong nghiên cứu
này được xác định bằng phần mềm DecoyFinder [24].
2.2.2.2. Tạo cấu dạng của các chất trong cơ sở dữ liệu
Bước đầu tiên của việc xây dựng mô hình 3D-pharmacophore là tạo cấu dạng có thể
có đối với từng cấu trúc hóa học của phân tử hợp chất. Công cụ sử dụng để tạo cấu
dạng là Compute → Conformations → Import trong phần mềm MOE 2015.10. Công
cụ này dùng để tính toán các cấu dạng có năng lượng thấp của một tập hợp các phân
tử và lưu trữ chúng trong một cơ sở dữ liệu [22]. Các thông số của quá trình tạo cấu
dạng gồm:
- Giới hạn số cấu dạng cho mỗi chất (Conformations): 10.000
- Số bước tìm kiếm lặp lại (Stochatis Search Iteration Limit): 1.000
- Số bước tối thiểu hóa năng lượng (Energy Minimization Iteration Limit): 1.000
- Năng lượng giảm thiểu test gradient (Energy Minimization Gradient Test): 0,0001
2.2.2.3. Xây dựng mô hình 3D-pharmacophore
Quá trình xây dựng mô hình 3D-pharmacophore được thực hiện bằng công cụ
Pharmacophore Elucidator trong phần mềm MOE 2015.10. Mục đích của chương
trình này là tạo ra tất cả các truy vấn pharmacophore (pharmacophore query) có sự
chồng phủ tốt ở hầu hết các phân tử hợp chất có hoạt tính mạnh và tách biệt với các
phân tử không có hoạt tính nếu phân tử hợp chất không có hoạt tính cũng có trong
tập hợp dữ liệu [22].
Ứng dụng Pharmacophore Elucidator được thực hiện với cơ sở dữ liệu cấu dạng của
tập huấn luyện gồm 123 chất chủ vận mạnh thụ thể apelin. Ứng dụng sẽ tạo ra các
truy vấn có thể có dựa trên cấu dạng các chất trong tập dữ liệu.
2.2.2.4. Đánh giá mô hình 3D-pharmacophore
Sau khi có được nhiều mô hình pharmacophore được xây dựng từ các chất có hoạt
tính mạnh, tiến hành đánh giá mô hình bằng cách tìm các hợp chất thỏa và không
thỏa mô hình trong tập đánh giá (gồm tập hoạt tính và tập decoy ở mục 2.2.2.1) bằng
chương trình Pharmacophore Search trong phần mềm MOE 2015.10.
Đánh giá mô hình theo thang điểm của phần mềm MOE

14
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Quá trình đánh giá này diễn ra đồng thời khi xây dựng các mô hình. Kết quả được trả
về khi mô hình được tạo ra:
- Điểm chính xác (Accuracy scoring): Điểm chính xác tổng thể = m/n với n là số phân
tử trong tập hợp đầu vào và m là tổng số các phân tử có hoạt tính thỏa mô hình và số
các phân tử không có hoạt tính không thỏa mô hình.
- Điểm chồng phủ (Overlap scoring): Mô hình tạo ra được sử dụng để tìm những hơp
chất có hoạt tính. Với giả thuyết là một mô hình pharmacophore có thể chấp nhận
được phải gióng hàng tốt các phân tử có hoạt tính, việc tìm kiếm được thực hiện nhằm
tạo ra như một sự gióng hàng như vậy và được đánh giá bằng độ chồng phủ nguyên
tử. Điểm chồng phủ nằm trong khoảng [0, n] với n là số phân tử có hoạt tính. Số điểm
càng lớn cho thấy mức độ gióng hàng càng tốt.
Đánh giá theo điểm số GH (Goodness of hit list)
Các chất có hoạt tính, thỏa mô hình 3D-pharmacophore được gọi là TP (chất dương
tính thật). Các chất không có hoạt tính, không thỏa mô hình 3D-pharmacophore được
ký hiệu là TN (chất âm tính thật). Chất có hoạt tính, không thỏa mô hình 3D-
pharmacophore được gọi là FN (chất âm tính giả). Chất không có hoạt tính, thỏa mô
hình 3D-pharmacophore được gọi là FP (chất dương tính giả).
Các tiêu chuẩn được sử dụng để đánh giá bao gồm độ nhạy (Se), độ đặc hiệu (Sp), độ
đúng (Acc), tỷ suất hoạt tính (Ya) và điểm GH.
Độ nhạy (Se): là tỉ lệ của các chất có hoạt tính, thỏa mô hình 3D-pharmacophore
trong tập active. Giá trị này đánh giá mức độ chọn lọc của mô hình trên những chất
có hoạt tính sinh học tốt và được tính bằng công thức:
TP
Se =
TP + FN
Độ đặc hiệu (Sp): là tỉ lệ các chất không có hoạt tính, không thỏa mô hình 3D-
pharmacophore trong tập decoy. Giá trị này đánh giá mức độ chọn lọc của mô hình
trên những chất có hoạt tính sinh học yếu:
TN
Sp =
TN + FP
Tỷ suất hoạt tính (Ya): cho biết tỉ lệ chất có hoạt tính, thỏa mô hình 3D-
pharmacophore trên tổng số chất thỏa mô hình 3D-pharmacophore:
TP
Ya =
TP + FP

15
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Độ đúng (Acc): là khả năng dự đoán các chất được phân loại đúng bởi mô hình (TP
+ TN) trên toàn tập (N):
TP + TN
Acc =
N
Điểm số GH: đánh giá năng lực phân biệt của mô hình 3D-Pharmacophore. Giá trị
GH cao đồng nghĩa với tỉ lệ số chất có hoạt tính, thỏa mô hình và số chất không có
hoạt tính, không thỏa mô hình phải đồng thời đều cao. Giá trị GH đi từ 0 (mô hình
vô hiệu) đến 1 (mô hình lý tưởng), giá trị GH trên 0,7 cho thấy rằng mô hình có khả
năng dự đoán tốt [25]:
3 1
GH = ( × Ya + Se) × Sp
4 4
2.2.3. Phương pháp xây dựng mô hình 2D-QSAR
Nghiên cứu tiến hành xây dựng mô hình 2D-QSAR dùng để dự đoán hoạt tính sinh
học của các chất có tiềm năng chủ vận thụ thể apelin.
2.2.3.1. Chuẩn bị cơ sở dữ liệu và tính toán thông số mô tả phân tử
Cơ sở dữ liệu gồm 689 chất chủ vận thụ thể apelin được tối thiểu hóa năng lượng
bằng công cụ Energy Minimize của phần mềm MOE 2015.10 với thông số Gradient
= 0,0001 kcal/mol.
Vì giá trị EC50 (nM) của các chất chủ vận có khoảng biến thiên rất lớn nên được quy
đổi thành giá trị pEC50 = −log(EC50) bằng công cụ Compute → Calculator để phù
hợp cho việc xây dựng phương trình 2D-QSAR.
Thông số mô tả phân tử 2D của các chất được tính toán bằng phần mềm MOE 2015.10
và phần mềm PaDEL Descriptor. Trong đó, MOE 2015.10 có thể tính được 206 thông
số mô tả phân tử 2D và phần mềm PaDEL Descriptor có thể xác định được 1444
thông số mô tả phân tử 1D và 2D.
2.2.3.2. Lựa chọn thông số mô tả
Để lựa chọn thông số mô tả dùng cho xây dựng mô hình 2D-QSAR, cần phải loại bỏ
các thông số mô tả không có ý nghĩa, các thông số có tương quan cao với nhau, giữ
lại các thông số có tương quan tốt với giá trị pEC50. Tiến hành lựa chọn thông số mô
tả như sau:
- Loại bỏ các thông số mô tả chứa nhiều hơn 15% giá trị 0 bằng phần mềm Microsoft
Excel 365.
- Loại bỏ các thông số mô tả không có ý nghĩa (giá trị của tất cả các chất giống nhau)
bằng công cụ Remove Useless Attributes trên phần mềm RapidMiner 5.2.

16
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

- Chia tỉ lệ thông số mô tả để loại bỏ trọng số chỉ liên quan đến các đơn vị dùng để
biểu thị một thông số mô tả riêng biệt. Ví dụ, giá trị của một thông số mô tả có thể
gấp hàng trăm, hàng nghìn lần giá trị của môt thông số mô tả khác, nếu không quy về
một tỉ lệ nhất định ta đã vô tình chấp nhận thông số này quan trọng hơn thông số kia
gấp trăm, gấp nghìn lần. Nghiên cứu này chia tỉ lệ bằng thuật toán Range
transformation trong công cụ Normalize của phần mềm RapidMiner. Giá trị gốc của
các thông số được chia tỉ lệ một cách tự động sang giá trị từ 0 đến 1. Công thức chia
tỉ lệ một giá trị bất kì là tỉ số giữa độ lệch của giá trị đó so với giá trị nhỏ nhất và độ
lệch của giá trị lớn nhất so với giá trị nhỏ nhất.
- Cũng trên phần mềm RapidMiner, sử dụng công cụ Remove Correlated Attributes
để loại các thông số mô tả có tương quan chéo trên 90% với nhau để tránh việc chọn
2 hay nhiều thông số gần giống nhau vào mô hình 2D-QSAR.
- Sau cùng, phương pháp tìm kiếm BestFirst với thuật toán đánh giá CfsSubsetEval
trong phần mềm Weka 3.8 được sử dụng để tìm ra các thông số mô tả có giá trị liên
quan nhất với pEC50 thực nghiệm.
2.2.3.3. Loại các chất gây nhiễu
Các chất gây nhiễu được loại bỏ vì chúng làm cho kết quả đánh giá các mô hình trở
nên kém hơn. Loại nhiễu bằng phân tích thành phần chính – PCA là phương pháp
loại nhanh và chính xác các chất gây nhiễu do biễu diễn trực quan tập dữ liệu trong
không gian ít chiều. Trong không gian, dễ dàng thấy được mức độ tập trung của các
chất và chất nào nằm rời rạc so với vùng tuyến tính của tập dữ liệu [26].
Trong MOE, chọn Compute → Descriptors → Principal Components, chọn các
thông số mô tả đã được chọn bởi Weka, có bao nhiêu thông số mô tả sẽ xuất hiện
tương ứng bấy nhiêu PCA. Sau đó xác định vùng không gian 3 chiều bởi 3 trục PCA,
chọn Compute → Analysis → 3D Plot, trục X – Y – Z tương ứng PCA1 – PCA2 –
PCA3, Activity chọn pEC50, nhấn Plot, vùng không gian 3 chiều sẽ xuất hiện, các chất
nằm ngoài vùng không gian này sẽ bị loại.
2.2.3.4. Xây dựng mô hình 2D-QSAR
Nghiên cứu này sử dụng hai phương pháp khác nhau để xây dựng mô hình 2D-QSAR,
gồm phương pháp cổ điển (bình phương tối thiểu từng phần) và phương pháp máy
học hiện đại (mạng neuron nhân tạo).
Phương pháp bình phương tối thiểu từng phần (PLS)
Phương trình 2D-QSAR được xây dựng bằng phương pháp tối thiểu từng phần trên
MOE 2015.10. Chọn Compute → Model → QSAR, các thông số được thiết lập như
sau:

17
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

- Cột hoạt tính: pEC50.


- Phương pháp: PLS.
- Chọn các thông số mô tả, nhấn Fit để thực hiện phân tích hồi quy và xây dựng
phương trình 2D-QSAR, giá trị R2 và RMSE sẽ được hiển thị.
- Tiếp theo nhấn Validate và tích hết các ô trong hộp thoại xuất hiện → OK, giá trị
XR2 (Q2) sẽ được hiển thị.
- Nhấn Report để xem các thông số phân tích hồi quy và phương trình 2D-QSAR.
- Tiến hành Save để lưu phương trình 2D-QSAR vừa xây dựng trong bảng QuaSAR-
Model dưới dạng *.fit để ứng dựng dự đoán hoạt tính sinh học.
Miền ứng dụng của mô hình 2D-QSAR chính là miền giá trị của các thông số mô tả
được chọn để xây dựng mô hình trước khi chia tỉ lệ thông số mô tả.
Phương pháp mạng neuron nhiều lớp ngược hướng (CPG-NN)
Nghiên cứu này sử dụng phần mềm SONNIA được phát triển bởi công ty Molecular
Networks dựa trên mạng neuron tự tổ chức (SOM) và mạng neuron nhiều lớp ngược
hướng (CPG-NN). Do khả năng xây dựng các mô hình phi tuyến tính phức tạp,
SONNIA có nhiều ứng dụng trong thiết kế thuốc như ứng dụng trong nghiên cứu
QSAR, dự đoán tính chất dược động, phân tích dữ liệu của sàng lọc đầu vào cao,
phân tích tính đồng dạng và đa dạng của cơ sở dữ liệu hóa học tổ hợp, lựa chọn thông
số mô tả phân tử, phân loại và dự đoán hoạt tính sinh học,... [16].
Mạng neuron nhiều lớp ngược hướng (Counter-propagation) với kiểu mạng hình
xuyến (toroidal) được sử dụng để xây dựng mô hình. Kích thước mạng phụ thuộc
vào số lượng các chất trong cơ sở dữ liệu đưa vào và thường bao gồm √2N,
√N, √N/2, √N/4 neuron với N là số chất trong tập huấn luyện. Với kiểu mạng hình
xuyến đã chọn, kích cỡ mạng được cho là tốt nhất khi bằng căn bậc hai của số lượng
chất trong tập huấn luyện (√N) [27].
Các thông số khác được giữ nguyên mặc định của phần mềm SONNIA, vì ở phiên
bản 4.2, SONNIA đã được lập trình tự động lựa chọn số vòng huấn luyện tốt nhất cho
kích cỡ cơ sở dữ liệu đưa vào [28]. Trọng số liên kết của các neuron lớp Kohonen
được gán trị số ngẫu nhiên (random), số chu kỳ huấn luyện được thiết lập ở giá trị
mặc định: Epochs = 100; Interval = 1; Span(x) = Span(y) = N / 2; Step(x) = Step(y)
= Span/Epochs; Rate = 0,5; Rate Factor = 0,995.
Sau khi khởi tạo và huấn luyện, mô hình dùng để dự đoán chính là mạng đã được
học. Mạng được lưu lại bằng lệnh File → Write và lưu dưới dạng Network File
(*.knet). Đồng thời, SONNIA sẽ cung cấp bản đồ Kohonen cho cơ sở dữ liệu đưa vào

18
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

bằng lệnh Maps → Selected Maps. Từ bản đồ này, ta có thể xem sự phân bố của các
chất trong các neuron bằng lệnh Export Structure. Bản đồ đươc lưu lại bằng lệnh File
→ Write và lưu dưới dạng Map File (*.kmap). Giá trị dự đoán hoạt tính sinh học của
các chất có thể được ghi ra bằng lệnh File → Write và lưu dưới dạng Prediction File
(*.prd). Tất cả các tập tin được lưu bởi SONNIA đều ở dạng ASCII và có thể dễ dàng
đưa vào phần mềm Microsoft Excel 365 để đánh giá kết quả mô hình.
2.2.3.5. Đánh giá mô hình 2D-QSAR
Mục tiêu của nghiên cứu QSAR là xây dựng được mô hình có khả năng dự đoán tốt,
giá trị dự đoán và giá trị thực gần nhau. Điều đó thể hiện qua bình phương hệ số tương
quan R2 và căn của tổng bình phương phần dư RMSE của tập xây dựng mô hình.
Chính vì vậy mô hình sau khi xây dựng được cần phải tiến hành các đánh giá cần
thiết thì mới đảm bảo được khả năng dự đoán tốt.
Phân chia tập dữ liệu
Cơ sở dữ liệu được chia thành 2 phần: (1) Tập huấn luyện (tập train) chứa 80% số
chất dùng để xây dựng mô hình; (2) Tập kiểm tra (tập test) chứa 20% số chất dùng
để đánh giá mô hình đã xây dựng.
Trong nghiên cứu này, cơ sở dữ liệu ban đầu được chia theo phương pháp phân phối
đa dạng (diverse). Phân phối đa dạng là sắp xếp các chất trong tập dữ liệu dựa trên
khoảng cách từ chất này đến chất khác. Có nhiều cách tính khoảng cách giữa hai chất
phụ thuộc vào dữ liệu sử dụng là thông số mô tả (descriptors), dấu vân tay
(fingerprint) hay dữ liệu cấu dạng (conformation data). Với thông số mô tả, khoảng
cách giữa hai chất là khoảng cách Euclide giữa hai điểm đại diện cho hai chất trong
không gian n-chiều. Trong nghiên cứu này, việc phân chia được thực hiện bằng lệnh
Diverse subset trong MOE dựa trên 1650 thông số mô tả phân tử được tính ban đầu
[29]. Mục đích của phân chia dựa vào tính đa dạng là chọn ra một tập con khác biệt
nhất trong tập hợp ban đầu. Việc này thích hợp cho việc chọn tập xây dựng mô hình
có tính đại diện cho cả tập dữ liệu ban đầu.
Đánh giá loại-ra-một (leave one out – LOO)
Nghiên cứu áp dụng phương pháp đánh giá chéo LOO để đánh giá ngoại và đánh giá
nội. Trong đánh giá nội, kết quả được thể hiện qua giá trị trung bình bình phương hệ
số tương quan của các mô hình thứ cấp Q2 và RMSE được tính theo công thức sau:
∑(𝑌𝑝 − 𝑌𝑒 )2
Q2 = 1 −
∑(𝑌𝑒 − 𝑌̅𝑒 )2

19
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

1
RMSE = √ × ∑(Yp − 𝑌𝑒 )2
N

Trong đánh giá ngoại, kết quả được thể hiện qua giá trị R2 pred được tính theo công
thức sau:

2
∑(Yp(test) − Ye(test) )2
R pred =1 −
∑(Ye(test) − Y̅e )2

Trong đó:
𝑌𝑝 : Hoạt tính pEC50 dự đoán trên tập xây dựng
𝑌𝑒 : Hoạt tính pEC50 thực nghiệm trên tập xây dựng
Y̅e : Giá trị hoạt tính pEC50 thực nghiệm trung bình trên tập xây dựng
Yp(test) : Hoạt tính pEC50 dự đoán trên tập test
Ye(test) : Hoạt tính pEC50 thực nghiệm trên tập test

Mô hình được đánh giá là có khả năng dự đoán tốt khi Q2 > 0,5, R2 pred > 0,5 và
RMSE < 0,5 [30].
Đánh giá Roy
Giá trị R2 và Q2 thay đổi giữa các lần xây dựng (khi lựa chọn các tập xây dựng và tập
kiểm tra khác nhau) và giá trị hoạt tính thực nghiệm trung bình được sử dụng để tính
nên dẫn đến đánh giá sai nếu tập dữ liệu có khoảng giá trị lớn. Vì lý do đó, Roy và
cộng sự đề nghị sử dụng các giá trị dự đoán mới là 𝑟𝑚2 , 𝑟𝑚′2 , 𝑟̅̅̅ 2
𝑚 , ∆𝑟𝑚 , được tính toán
2

dựa trên mối tương quan giữa các giá trị thực nghiệm (r2) và dự đoán (𝑟02 )của các
đường thẳng hồi quy. (𝑟𝑚2 ) được tính dựa trên đường thẳng hồi quy có trục X là giá
trị dự đoán trục Y là giá trị thực nghiệm, ngược lại 𝑟𝑚′2 được tính dựa trên đường
thẳng hồi quy có trục X là giá trị thực nghiệm, trục Y là giá trị dự đoán, theo công
thức sau:

2
rm = r 2 × (1 − √r 2 − r02 )

′2
rm = r ′2 × (1 − √r ′2 − r0′2 )
2 ′2
2 =
rm + rm
rm
2
2 2 ′2 |
∆rm = |rm − rm

20
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Trong đó:
r2: Hệ số tương quan của phuong trình hồi qui
𝑟02 : Hệ số tương quan của phương trình hồi qui với hệ số chặn bằng 0
Đánh giá Roy được thực hiện trên cả tập xây dựng và tập kiểm tra. Mô hình được
2 > 0,5 và ∆r 2 < 0,2 [30].
đánh giá có khả năng dự đoán tốt khi rm m

Phương pháp Y ngẫu nhiên (Y-scrambling)


Phương pháp này được sử dụng để chứng tỏ kết quả độ đúng của các mô hình dự
đoán không phải là do ngẫu nhiên mà có được, đặc biệt là các mô hình sử dụng mạng
neuron dễ xảy ra hiện tượng “over-fitting” [31].
Giá trị hoạt tính sinh học của các chất trong tập xây dựng sẽ được xáo trộn một cách
ngẫu nhiên để xây dựng mô hình và cũng thực hiện các đánh giá như mục 0 và mục
0. Trong nghiên cứu này, quá trình này được thực hiện10 lần. Nếu kết quả đánh giá
giữa mô hình đã xây dựng với kết quả đánh giá mô hình Y ngẫu nhiên lớn hơn 0,2 thì
chứng minh được kết quả mô hình đã xây dựng là do mối tương quan giữa các thông
số mô tả phân tử với giá trị sinh học chứ không phải đạt được ngẫu nhiên nhờ thuật
toán đã sử dụng.
2.2.4. Phương pháp xây dựng mô hình mô tả phân tử docking
Trong nghiên cứu này, phương pháp docking tự động được sử dụng bằng cách dùng
công cụ FlexX được tích hợp trong phần mềm Lead IT 2.1.8.
2.2.4.1. Chuẩn bị cấu trúc protein
Cấu trúc của AMG3054 (peptid bắt chước apelin-17) đồng kết tinh với thụ thể được
tải về từ Protein Data Bank (PDB ID: 5VBL) [18] dưới dạng *.pdb. Cấu trúc thụ thể
apelin được chuẩn bị bằng công cụ QuickPrep, với các thông số quan trọng bao gồm:
- Protonate: proton hóa và tích điện cho các acid amin của protein.
- Tether và Fix: Các nguyên tử trong protein được xác định vùng không gian chuyển
động, nhằm đảm bảo các nguyên tử không lệch quá xa so với tọa độ ban đầu.
- Refine: Tối thiểu hóa năng lượng. Giá trị RMS Gradient là 0,0001 kcal/mol/Å.
Sau khi chuẩn bị với công cụ QuickPrep, protein được lưu dưới dạng file *.pdb.
Cấu trúc thụ thể apelin sau khi được chuẩn bị bằng phần mềm MOE, được đưa vào
phần mềm LeadIT 2.1.8 để tiến hành docking. Khoang gắn kết của thụ thể apelin
được xác định từ vị trí của phối tử AMG3054 (phối tử bắt chước apelin-17) sao cho
bán kính khoang là 10 Å.

21
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

2.2.4.2. Chuẩn bị cấu trúc phối tử để docking


Các phối tử trước khi docking được tối thiểu hóa năng lượng bằng công cụ công cụ
Energy Minimize của phần mềm MOE 2015.10 với thông số Gradient = 0,0001
kcal/mol. Lưu các phân tử sau khi được tối thiểu hóa năng lượng vào một cơ sở dữ
liệu dạng file *.sdf để có thể sử dụng cho docking.
2.2.4.3. Docking bằng phần mềm FlexX/Lead IT 2.1.8
Các phối tử sau khi tối thiểu hóa năng lượng được chuyển vào phần mềm theo đường
dẫn Docking → Define FlexX Docking → Docking library → Load. Quá trình
docking được thự hiện với các thông số được thiết lập như sau:
- Số lượng các cấu dạng liên kết (pose) giữ lại (Number of Poses to Keep) là 1.
- Số bước lặp tối đa (Maximum Number of Solutions per Iteration) là 1000.
- Số lần phân mảnh (Maximum Number of Solutions per Fragmentation) là 200.
Chọn Apply and Dock để bắt đầu quá trình docking. Kết quả docking được lưu dưới
dạng *.sdf và *.fxx.
2.2.4.4. Đánh giá kết quả
Các liên kết tạo thành giữa phối tử và protein bao gồm liên kết ion, liên kết hydro,
liên kết Van der Waals, liên kết π- π… được thể hiện qua điểm số docking (kJ/mol).
Kết quả docking cho biết ái lực gắn kết của phối tử với protein và tương tác giữa acid
amin xung quanh với phối tử.
Việc phân tích liên kết tạo thành giữa acid amin quan trọng của protein và phối tử
được thực hiện bằng công cụ Protein Ligand Interaction Fingerprints (PLIF) và được
quan sát trực quan bằng công cụ Ligand Interacteractions trong MOE.
2.2.5. Sàng lọc ảo khám phá chất chủ vận mới thụ thể apelin
2.2.5.1. Thư viện ứng dụng sàng lọc ảo
Thư viện ZINC12
ZINC là một trong những thư viện thu hút nhiều sự quan tâm nghiên cứu. Thứ nhất,
thư viện cấu trúc hóa học ZINC có khả năng cung cấp cấu dạng, chuẩn bị trong các
tập tin cấu trúc thích hợp với một số chương trình docking như là *.mol2, *.sdf
[20]. Thứ hai, thư viện ZINC có số lượng cấu trúc hóa học vô cùng đa dạng lên
đến hơn 20 triệu chất, được trình bày ở các dạng liên quan đến sinh học, được chú
trọng vào trạng thái đồng phân và proton hóa của cấu trúc, được sắp xếp thành các
tập hợp con liên quan đến quá trình khám phá thuốc [19] giúp tăng cường khả năng
tìm kiếm được các cấu trúc thỏa mãn yêu cầu. Thứ ba, đây là một cơ sở dữ liệu miễn

22
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

phí, dễ dàng truy cập tại địa chỉ http://zinc.docking.org/, với các hợp chất có sẵn về
mặt thương mại, cùng các thông tin đầy đủ của nhà cung cấp [19]. Điều này sẽ giúp
cho kết quả của các nghiên cứu sàng lọc và tìm kiếm các cấu trúc trên cơ sở dữ liệu
này trở nên có ý nghĩa hơn, vì các nghiên cứu nối tiếp (follow-up) có thể mua được
các cấu trúc này dễ dàng để thử nghiệm hoạt tính in vitro. Nghiên cứu này sử dụng
phiên bản ZINC12 với hơn 22 triệu chất và hơn 200 triệu cấu dạng để sàng lọc ảo.
Thư viện Maybridge
Maybridge là một thư viện rất đa dạng với hơn 53.000 hợp chấp, được biết đến rộng
rãi như một công cụ quan trọng trong những chương trình sàng lọc. Hầu hết các hợp
chất trong bộ sưu tập Maybridge thường tuân theo quy luật 5 Lipinski vì vậy có giá
trị ADME tốt (hấp thu, phân bố, chuyển hóa, thải trừ) điều này làm cho các hợp chất
trở thành ứng cử viên lý tưởng cho sự phát triển và vượt qua được thử nghiệm sàng
lọc ban đầu.
Maybridge tự tổng hợp ra gần như tất cả các hợp chất trong thư viện của mình, điều
này cho phép Maybridge tái cung cấp các chất dễ dàng hơn. Những hợp chất sàng lọc
này được tổng hợp chủ yếu với lượng tính bằng gam, đảm bảo khả năng cung cấp
nguyên liệu cao. Các hợp chất trong thư viện có sẵn ở nhiều dạng, bao gồm một số
được thiết kế sẵn hoặc có thể được lựa chọn trước. Các hợp chất có thể được cung
cấp dưới dạng bột khô hoặc màng film hoặc lọ với lượng tính bằng milligram, gram
hoặc micro/millimol được cân với độ chính xác cao, thuận tiện cho người dùng [21].
2.2.5.2. Quy trình sàng lọc ảo
Quy trình sàng lọc ảo các chất có tiềm năng chủ vận thụ thể apelin được tiến hành
như Hình 2.3.

23
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Các thư viện hợp chất: ZINC12, Maybridge


Tạo cấu dạng

Mô hình 3D-pharmacophore

Kết quả sàng lọc 1

Loại trùng lặp và xét “Druglike”


Đánh giá ADMET

Kết quả sàng lọc 2

Docking phân tử

Dự đoán hoạt
tính sinh học
(EC50)

Mô phỏng động
lực học phân tử

Hình 2.3. Quy trình sàng lọc ảo


Sàng lọc qua mô hình 3D-pharmacophore
Đối với thư viện Maybridge, trước khi sàng lọc qua mô hình 3D-pharmacophore, các
chất trong thư viện Maybridge phải được tạo cấu dạng như trình bày ở mục 2.2.2.2.
Sau đó, tập dữ liệu này được sàng lọc qua mô hình 3D-pharmacophore bằng công cụ
Pharmacophore Editor → Search trong phần mềm MOE 2015.10. Những chất nào
thỏa mãn mô hình 3D-pharmacophore sẽ được báo cáo kết quả trong một bảng dữ
liệu riêng.
Đối với thư viện ZINC12, vì thư viện này chứa 22.723.923 chất nên cách tiếp cận
bằng phần mềm như thư viện Maybridge sẽ gặp nhiều khó khăn do không đủ tài

24
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

nguyên máy tính và thời gian. Tuy nhiên, ZINC có sẵn chức năng hỗ trợ sàng lọc
online trên trang web ZINCPharmer (http://zincpharmer.csb.pitt.edu/), tại đây các
chất đã được chuẩn bị cấu dạng sẵn sàng cho việc sàng lọc qua mô hình 3D-
Pharmacophore. Mô hình 3DPharmacophore được lưu thành dạng file *.ph4 trong
MOE, sau đó được tải lên trang web http://zincpharmer.csb.pitt.edu/pharmer.html ở
tab Pharmachphore, trong tab Filters chọn các tùy chọn sau:
- Max Hits per Mol: 1.
- Subset selection: ZINC Purchasable.
Sau đó chọn Submit Query để tiến hành sàng lọc, sau khi sàng lọc xong chọn Save
Results để lưu kết quả dưới dạng file *.sdf.
Loại bỏ trùng lặp và chọn lọc “drug-like”
Tập dữ liệu Maybridge và ZINC12 có những chất không có cấu trúc của một thuốc
đường uống hoặc có những chất bị trùng lặp với nhau. Phần mềm MOE 2015.10 có
hỗ trợ công cụ Druglike (chọn những cấu trúc thỏa Luật 5 Lipinski để có thể sử dụng
bằng đường uống) và Unique (không chọn những cấu trúc lặp lại). Sau khi loại các
cấu trúc trùng lắp và chọn các “drug-like”, các chất được lưu dưới dạng file *.sdf để
tiến hành dự đoán đặc tính dược động học và độc tính [29].
Dự đoán đặc tính dược động học và độc tính (ADMET)
Để có thể đánh giá ADMET nhanh chóng, toàn diện và tiết kiệm, các mô hình sàng
lọc ảo đã được xây dựng nhằm cung cấp công cụ sàng lọc sơ bộ các thông số ADMET
trước khi tiến đến thử nghiệm in vitro và xa hơn là thử nghiệm tiền lâm sàng.
Đề tài sử dụng phần mềm ADMET PredictorTM 9.5 [32] của công ty Simulation Plus,
Mỹ, một phần mềm được ra mắt vào năm 1999, với tên ban đầu là QMPRPlus®. Phần
mềm ADMET PredictorTM đưa ra thuật ngữ rủi ro (risk) để đưa ra ngưỡng cho các
thông số ADMET được tính toán (đặc tính lý hóa, chuyển hóa và độc tính). Ngoài
giá trị rủi ro ADMET tổng, nhà phát triển còn đưa ra các giá trị cho 3 mô hình nhỏ
hơn là hấp thu, chuyển hóa, và độc tính. Các giá trị rủi ro không có đơn vị, sẽ tăng từ
0 cho tới vô cùng. Giá trị rủi ro càng cao, khả năng vượt qua được các đánh giá lâm
sàng và tiền lâm sàng càng thấp. Việc nghiên cứu thực hiện sàng lọc các chất dựa trên
rủi ro ADMET nhằm đảm bảo các “hit” cuối cùng có khả năng cao vượt qua các thử
nghiệm lâm sàng và tiền lâm sàng để được chấp thuận làm một thuốc dùng trong điều
trị trong tương lai.
Các thông số ADMET được tính bằng phần mềm ở pH sinh lý. Nghiên cứu chọn ra
các cấu trúc có giá trị rủi ro nhỏ hơn ngưỡng tham chiếu như trình bày trong Bảng
2.1.

25
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Bảng 2.1. Giá trị ngưỡng của các rủi ro được đề nghị bởi ADMET Predictor 9.5TM

Rủi ro chung Rủi ro hấp thu Rủi ro chuyển hóa Rủi ro độc tính

7,5 3,5 2,5 2

Sàng lọc qua mô hình mô tả phân tử docking


Các chất sau khi đạt các tiêu chí đánh giá ADMET, được tối thiểu hóa năng lượng
bằng MOE 2015.10 và tiến hành docking vào khoang gắn kết bằng phần mềm
LeadIT. Để đạt thông lượng cao trong sàng lọc, nghiên cứu này lấy kết quả Top1
trong quá trình docking.
Dự đoán hoạt tính chủ vận thụ thể apelin qua mô hình 2D-QSAR
Các chất docking thành công vào khoang gắn kết của thụ thể apelin được sàng lọc
qua miền ứng dụng của mô hình 2D-QSAR rồi dự đoán hoạt tính sinh học EC50.
Mô phỏng động lực học phân tử
Sau khi sàng lọc qua mô hình docking phân tử, phức hợp của các chất chủ vận tiềm
năng nhất với thụ thể apelin được khảo sát sâu hơn bằng phương pháp mô phỏng
động lực học phân tử (MDS). Công cụ được sử dụng để MDS là Desmond 4.7 được
phát triển bởi D. E. Shaw Research [33] tích hợp trong Maestro của gói phần mềm
Schrödinger 2018 [34]. Quá trình MDS gồm các bước [35]:
Chuẩn bị phức hợp protein – ligand
Cấu dạng docking tốt nhất của các chất với thụ thể apelin được lưu dưới dạng *.pdb.
Phức hợp được đưa vào phần mềm Maestro và chuẩn bị bằng công cụ Protein
Preparation Wizard bao gồm các bước như thêm hydro, tối thiểu hóa năng lượng và
tối ưu hóa các liên kết.
Xây dựng hệ mô phỏng
Việc xây dựng hệ mô phỏng được thực hiện bằng công cụ System Builder, với dung
môi nước sử dụng là TIP3P. Hệ được đặt trong một hộp với kích thước được xác định
sao cho các mặt của hộp cách các biên của protein ít nhất 10 Å. Sau đó, hệ được trung
hòa về điện tích bằng cách thêm ion (Na+ và Cl-, nồng độ NaCl là 0,15 M).
Chạy MDS
Hệ trên được mô phỏng động lực học phân tử trong thời gian 10 ns để bước đầu khảo
sát sự tương tác của các chất tiềm năng. Quá trình MDS được tiến hành trong điều
kiện nhiệt độ 300 K, áp suất 1 bar, cân bằng NPT và trường lực OPLS. Kết quả mô
phỏng được lưu mỗi 0,01 ns.

26
Khóa luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Đánh giá kết quả


Độ ổn định của protein và ligand được xác định bằng các giá trị RMSD, RMSF. Sự
tương tác của ligand với thụ thể được đánh giá bằng tần suất tạo các tương tác như
liên kết hydro, ion, kỵ nước, cầu nước.

27
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

CHƯƠNG 3. KẾT QUẢ VÀ BÀN LUẬN


3.1. MÔ HÌNH 3D-PHARMACOPHORE
Mô hình 3D-pharmacophore được xây dựng từ 123 chất có hoạt tính chủ vận thụ thể
apelin mạnh (tập xây dựng) được trình bày tại PHỤ LỤC 2. Kết quả thu được 3 mô
hình 3D-pharmacophore tiềm năng nhất và được trình bày ở Hình 3.1. Trong đó, các
khối cầu màu cam thể hiện trung tâm vòng thơm/vòng liên hợp π (Aro), khối cầu màu
xanh lá cây thể hiện trung tâm kỵ nước (Hyd) và khối cầu màu xanh dương thể hiện
vị trí nhận liên kết hydro (Acc).

Ph001: 1_Aro, 2_Aro, 3_Hyd, Ph002: 1_Aro, 2_Aro, 3_Hyd,


4_Acc2, 5_Acc2 4_Acc2, 5_Acc2

Ph003: 1_Aro, 2_Aro, 3_Hyd,


4_Acc2, 5_Acc2

Hình 3.1. Ba mô hình 3D-pharmacophore cho chất chủ vận thụ thể apelin
Cả 3 mô hình 3D-pharmacophore của các chất chủ vận thụ thể apelin đều chứa 5 yếu
tố: 2 trung tâm vòng thơm/vòng liên hợp π (F1:Aro và F2:Aro), 1 trung tâm kỵ nước
(F3:Hyd) và 2 trung tâm nhận liên kết hydro (F4:Acc2 và F5:Acc2). Mô hình này có
số đặc trưng kỵ nước chiếm phần lớn (3 trong 5 yếu tố). Điều này gợi ý rằng các cấu
trúc gắn kết thụ thể apelin có tính thân dầu cao. Để chọn mô hình tốt nhất ứng dụng
trong sàng lọc ảo chất chủ vận mới cho thụ thể apelin, 3 mô hình này cần được đánh
giá. Kết quả đánh giá sơ bộ bằng phần MOE 2015.10 được trình bày ở Bảng 3.1.

28
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

Bảng 3.1. Ba mô hình 3D-pharmacophore của các chất chủ vận thụ thể

Số
Số phân Điểm lượng Vòng Nhóm
Điểm Nhóm
tử liên chồng các thơm/vòng nhận
Mô chính xác kỵ
quan tới phủ yếu tố liên hợp π liên kết
hình (accuracy nước
mô hình (overlap trong hydro
scoring) (Aro) (Hyd)
(cover) scoring) mô (Acc2)
hình

Ph001 123 100,1 100% 5 2 1 2

Ph002 123 98,8 100% 5 2 1 2

Ph003 123 79,3 98% 5 2 1 2

Dựa vào điểm chồng phủ và điểm chính xác trong Bảng 3.1, cả ba mô hình 3D-
pharmacophore nhìn chung đều rất tốt. Trong đó mô hình Ph001 và Ph002 có điểm
chính xác tuyệt đối, cho thấy khả năng dự đoán các chất được phân loại đúng là rất
tốt. Ngoài ra hai mô hình này có điểm chồng phủ khá cao (100,1 và 98,8) cho thấy
khả năng gióng hàng các chất trong tập xây dựng là khá tốt.
Tuy nhiên, kết quả nói trên chỉ dựa trên việc đánh giá các chất trong tập xây dựng và
do đó thiếu tính khách quan. Vì vậy, 3 mô hình 3D-pharmacophore tiếp tục được
đánh giá theo điểm số GH (Goodness of hit list). Đánh giá dựa vào điểm số GH được
tiến hành trên các tập có hoạt tính sinh học yếu hoặc không xác định. Điều này đảm
bảo kết quả đánh giá có tính khách quan. Kết quả đánh giá được trình bày trong Bảng
3.2.
Kết quả đánh giá cho thấy mô hình Ph003 là mô hình có điểm GH và độ đúng cao
nhất trong ba mô hình thu được. Điểm GH = 0,92 > 0,70 cho thấy khả năng dự đoán
của mô hình này là khá tốt. Độ đúng thể hiện khả năng phân loại đúng của mô hình
và có giá trị lên đến 0,97. Đồng thời độ đặc hiệu của mô hình là 0,97, cho thấy tỉ lệ
nhầm lẫn chất không hoạt tính thành chất có hoạt tính của mô hình chỉ có 0,03. Điều
này có ý nghĩa rất quan trọng trong việc sàng lọc trên các cơ sở dữ liệu lớn, giúp hạn
chế việc giành thời gian và chi phí nghiên cứu cho các chất không có hoạt tính. Do
đó, mô hình Ph003 được chọn để ứng dụng sàng lọc ảo trên các cơ sở dữ liệu lớn.

29
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

Bảng 3.2. Kết quả đánh giá ba mô hình 3D-pharmacophore theo điểm số GH

Tập active Tập decoy Tỷ


Độ
Độ suất Độ
Mô (300) (514) đặc Điểm
nhạy hoạt đúng
hình hiệu GH
tính
(Sp) (Acc)
TP FN FP TN (Se)
(Ya)

Ph001 296 4 49 465 0,99 0,90 0,86 0,93 0,81

Ph002 296 4 27 487 0,99 0,95 0,92 0,96 0,88

Ph003 289 11 16 498 0,96 0,97 0,95 0,97 0,92

3.2. MÔ HÌNH 2D-QSAR


3.2.1. Cơ sở dữ liệu xây dựng mô hình 2D-QSAR
Từ cơ sở dữ liệu của 689 chất đã biết hoạt tính chủ vận thụ thể apelin (được liệt kê ở
PHỤ LỤC 1), có tổng cộng 1650 thông số mô tả phân tử được tính toán (gồm 206
thông số MOE và 1444 thông số PADEL). Sau khi loại bỏ các thông số không cần
thiết hoặc không liên quan đến hoạt tính sinh học, 6 thông số mô tả đã được lựa chọn
và được trình bày ở Bảng 3.3.

Bảng 3.3. Ý nghĩa của các thông số mô tả

TT Thông số mô tả Ý nghĩa

1 ast_violation Số lượng vi phạm giống mảnh cấu trúc astex

2 a_ICM Trung bình lượng thông tin nguyên tử

3 h_logP Hệ số phân bố octanol/nước

4 SpMin1_Bhm Giá trị riêng tuyệt đối nhỏ nhất của ma trận biến đổi
Burden - n 1/trọng số theo khối lượng tương đối

5 C2SP2 Carbon liên kết đối với hai nguyên tử carbon khác

6 WTPT-3 Tổng chiều dài đường dẫn bắt đầu từ các dị tố

Mức độ tương quan chéo giữa 6 thông số mô tả trên được trình bày ở Bảng 3.4. Các
thông số được chọn có tương quan thấp với nhau (dưới 80%).

30
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

Bảng 3.4. Mức độ tương quan giữa các thông số với nhau và với pEC50.

STT Thông số mô tả 1 2 3 4 5 6

1 ast_violation 1

2 a_ICM 0,31 1

3 h_logP -0,35 -0,53 1

4 SpMin1_Bhm 0,17 0,36 -0,21 1

5 C2SP2 -0,06 -0,1 0,51 -0,14 1

6 WTPT-3 0,44 0,78 -0,47 0,22 -0,01 1

Sau khi lựa chọn được thông số mô tả phù hợp, nghiên cứu tiến hành loại nhiễu bằng
phân tích thành phần chính (PCA). 9 chất nằm bên ngoài không gian PCA như minh
họa ở Hình 3.2 và được loại bỏ khỏi tập xây dựng mô hình 2D-QSAR. Tên gọi và
cấu trúc của các chất gây nhiễu được liệt kê ở PHỤ LỤC 3.

Hình 3.2. Kết quả loại nhiễu bằng PCA

31
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

3.2.2. Các mô hình 2D-QSAR


3.2.2.1. Mô hình 2D-QSAR xây dựng theo phương pháp bình phương tối thiểu
từng phần (PLS)
Mô hình QSAR-1 được xây dựng theo phương pháp PLS có dạng phương trình:
pEC50 = 5,32500 + 0,58549  ast_violation – 0,57459  a_ICM – 0,29320 
h_lopP + 1,80806  SpMin_Bhm – 1,38515  C2SP2 + 1,83406  WTPT-3
Mô hình được đánh giá chi tiết ở
Bảng 3.5.
Đồ thị biểu diễn sự tương quan giữa pEC50 thực nghiệm và dự đoán của tập huấn
luyện và tập kiểm tra được trình bày ở Hình 3.3. Nhìn chung, mô hình QSAR-1 được
xây dựng theo phương pháp PLS là một mô hình không tốt. Tập xây dựng có giá trị
R2 = 0,33 < 0,5 (tức mức độ tương quan giữa giá trị thực nghiệm và dự đoán là 33%,
khá thấp) và giá trị RMSE = 0,66 > 0,5 (thể hiện sai số lớn). Tập kiểm tra có giá trị
đánh giá không tốt với R2 = 0,15 < 0,5 và RMSE = 0,78 > 0,5.

Bảng 3.5. Kết quả đánh giá mô hình QSAR-1

Mô hình Tập xây Tiêu chuẩn


Tập kiểm tra Toàn tập
QSAR-1 dựng đánh giá
Số chất (N) 544 136 680
RMSE 0,66 0,78 0,61 < 0,5
R2 0,33 0,15 0,32 > 0,5
Q2 0,33 - 0,32
> 0,5
𝑹𝟐𝒑𝒓𝒆𝒅 - 0,45 -
𝒓𝟐𝒎 0,33 0,14 0,32
𝒓′𝟐
𝒎 -0,05 -0,10 -0,08

𝒓𝟐𝒎 0,14 0,02 0,12 > 0,5


∆𝒓𝟐𝒎 0,38 0,23 0,40 < 0,2

32
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

8.5 y = 0.3336x + 4.0143


8 R² = 0.3336

7.5
pEC50 dự đoán

7
6.5
Tập huấn luyện
6
Tập kiểm tra
5.5
y = 0.1958x + 5.6347
5 R² = 0.1509
4.5
4 5 6 7 8 9
pEC50 thực nghiệm

Hình 3.3. Mối tương quan pEC50 thực nghiệm và dự đoán của mô hình QSAR-1 xây dựng
theo phương pháp PLS
Như vậy, mô hình QSAR-1 xây dựng theo phương pháp PLS có khả năng dự đoán
kém và không được sử dụng để ứng dụng trong sàng lọc ảo.
3.2.2.2. Mô hình 2D-QSAR xây dựng bằng phương pháp mạng neuron (CPG-NN)
Với thuật toán mạng neuron kiểu CPG-NN, mô hình QSAR-2 được xây dựng. Mô
hình là một mạng neuron được huấn luyện với bản đồ tự tổ chức được minh họa ở
Hình 3.4. Những vùng màu tím thể hiện nhóm chất có hoạt tính mạnh, màu xanh là
trung bình và màu đỏ là hoạt tính kém.

33
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

Hình 3.4. Bản đồ tự tổ chức của tập huấn luyện và tập kiểm tra
Kết quả đánh giá chi tiết của mô hình QSAR-2 được trình bày ở Bảng 3.6. Trong đó,
tập xây dựng có giá trị R2 = 0,82 > 0,5 (thể hiện mức độ tương quan tốt giữa giá trị
thực nghiệm và dự đoán là 82%) và RMSE = 0,37 < 0,5 (thể hiện sai số chấp nhận
được giữa giá trị dự đoán so với thực nghiệm). Trong đánh giá Roy, tập xây dựng có
các giá trị 𝑟̅̅̅ 2
𝑚 = 0,73 > 0,5 và ∆𝑟𝑚 = 0,17 < 0,2, chứng tỏ đây là một mô hình tốt. Đối
2

với tập kiểm tra, giá trị R2 = 0,52 > 0,5 chấp nhận được nhưng giá trị RMSE = 0,61
lại cao hơn 0,5.
Đồ thị biểu diễn sự tương quan giữa pEC50 thực nghiệm và dự đoán được thể hiện ở
Hình 3.5. Theo đó, phần lớn giá trị dự đoán của tập kiểm tra nằm trong khoảng dự
đoán đúng 95% của mô hình.
Mô hình xây dựng bằng mạng neuron có một điểm cần chú ý là hiện tượng “học quá
mức” – overtraining và overfiting – dẫn đến khả năng dự đoán rất tốt cho các chất
tham gia mô hình nhưng lại dự đoán sai cho chất mới. Đánh giá Y ngẫu nhiên được
thực hiện và cho thấy hiệu giữa R2 ở tập huấn luyện so với R2 của 10 lần Y ngẫu nhiên
là 0,27. Giá trị này lớn hơn 0,20 chứng tỏ giá trị dự đoán từ mô hình không phải do
ngẫu nhiên mà có.

34
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

Bảng 3.6. Kết quả đánh giá mô hình QSAR-2 theo phương pháp CPG-NN

Mô hình Tập xây Tập kiểm Tiêu chuẩn


Toàn tập
QSAR-2 dựng tra đánh giá
Số chất (N) 544 136 680
RMSE 0,37 0,61 0,33 < 0,5
R2 0,82 0,52 0,82 > 0,5
Q2 0,82 - 0,82
> 0,5
𝑹𝟐𝒑𝒓𝒆𝒅 - 0,52 -

𝒓𝟐𝒎 0,82 0,45 0,80

𝒓′𝟐
𝒎 0,64 0,29 0,64

𝒓𝟐𝒎 0,73 0,37 0,72 > 0,5

∆𝒓𝟐𝒎 0,17 0,16 0,17 < 0,2

9
y = 0.8093x + 1.1641
8 R² = 0.8155
pEC50 dự đoán

5 Tập huấn luyện


y = 0.6057x + 2.4076 Tập kiểm tra
4 R² = 0.5182

3
4 5 6 7 8 9
pEC50 thực nghiệm

Hình 3.5. Mối tương quan pEC50 thực nghiệm và dự đoán của mô hình QSAR-2 xây dựng
theo phương pháp CPG-NN
Qua kết quả đánh giá cho thấy mô hình QSAR-2 xây dựng theo phương pháp CPG-
NN là một mô hình tương đối tốt. Mô hình này sẽ được ứng dụng để dự đoán giá trị

35
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

hoạt tính chủ vận thụ thể apelin. Các chất mới ngoài mô hình muốn dự đoán phải có
các giá trị thông số mô tả nằm trong phạm vi miền ứng dụng của mô hình được trình
bày ở Bảng 3.7.

Bảng 3.7. Miền ứng dụng của mô hình QSAR-2

Thông
ast_violation a_ICM h_logP SpMin1_Bhm C2SP2 WTPT-3
số

Giá trị
lớn 2 1,32 1,37 1.,95 4 14,77
nhất

Giá trị
nhỏ 4 1,96 8,07 2,05 15 48,52
nhất

3.3. MÔ HÌNH DOCKING PHÂN TỬ


3.3.1. Mô hình khoang gắn kết của thụ thể apelin
Thụ thể apelin có hai vị trí liên kết. Nghiên cứu này tiến hành trên vị trí 1, là vị trí
gắn kết sâu bên trong thụ thể. Trong khi đó, vị trí 2 trên thụ thể apelin có khoang gắn
kết nông. Từ vị trí của ligand AMG3054, khoang gắn kết được mở rộng 10 Å và thu
được mô hình như Hình 3.6.

Hình 3.6. Mô hình khoang gắn kết của thụ thể apelin

36
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

3.3.2. Khảo sát sự gắn kết của các phân tử nhỏ chủ vận thụ thể apelin
3.3.2.1. Kết quả docking của 689 chất từ hai bằng sáng chế
689 chất đã biết là có hoạt tính chủ vận thụ thể apelin trong cơ sở dữ liệu được dock
qua mô hình docking nói trên để nghiên cứu xu hướng sự gắn kết của các chất chủ
vận đối với thụ thể apelin. Phân tích này sẽ giúp xác định các acid amin và các vị trí
quan trọng đối với hoạt tính chủ vận. Kết quả thu được tất cả 689 chất đều dock thành
công vào khoang gắn kết của thụ thể apelin.

13% 12%

< -30 kJ/mol


Từ -30 đến -20 kJ/mol
Từ -20 đến -10 kJ/mol

75%

Hình 3.7. Phân bố điểm số docking của 689 chất chủ vận thụ thể apelin
Hình 3.7 cho thấy khả năng gắn kết tốt của toàn bộ các chất trong cơ sở dữ liệu từ hai
bằng sáng chế với thụ thể aplein và có điểm số docking thay đổi từ -12,06 kJ/mol đến
-35,58 kJ/mol. Những chất đạt điểm số docking từ -30 đến -20 kJ/mol thể hiện khá
năng gắn kết tốt vào thụ thể và có đến 75% số chất đạt được điểm số này. Có 12%
chất đã đạt điểm số < -30 kJ/mol, trong đó US9156796-89 có điểm số docking tốt
nhất (-35,58 kJ/mol), cho thấy khả năng gắn kết rất tốt.
3.3.2.2. Sự tương tác của các chất chủ vận với các acid amin của thụ thể apelin
Hình 3.8 thể hiện tỉ lệ % số chất tạo được tương tác với các acid amin của thụ thể
apelin. Có thể thấy 3 acid amin tương tác nhiều nhất là Trp24 (73%), Tyr93 (72%),
Arg168 (66%), cho thấy vai trò quan trọng của các acid amin trong khoang gắn kết
của thụ thể apelin.

37
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

80%
73% 72%
70% 66%

60%
50%
40%
30%
20%
10%
0%
Tyr21

Trp24
Tyr88
Tyr93
Asp23

Leu173

Thr176

Tyr182

Tyr185

Tyr264

Tyr271

Tyr299
Phe110
Arg168

Glu174

Lys178
Gln180
Cys181

Met183
Asp184

Glu194
Glu198

Lys268

Phe291
Hình 3.8. Biểu đồ tỉ lệ số chất tạo tương tác với các acid amin trong thụ thể apelin

5% 70%
60%
4%
50%
3% 40%

2% 30%
20%
1%
10%
0% 0%
Gln180

Glu198

Lys268
Trp24
Tyr88
Tyr93
Arg168
Leu173
Glu174

Lys178

Cys181

Met183
Asp184
Asp23

Thr176

Tyr182

Tyr185

Tyr264

Tyr271
Tyr299

Liên kết kỵ nước Liên kết hydro

Hình 3.9. Biểu đồ tần suất tạo liên kết kỵ nước và liên kết hydro với các acid amin của thụ
thể apelin
Nếu chỉ xét riêng từng loại liên kết, có thể thấy chỉ có 5 acid amin của khoang này
tạo được liên kết kỵ nước với các chất, trong đó có 3 acid amin có tỉ lệ tạo tương tác
với các chất nhiều nhất là Trp24, Phe261 và Arg168. Nếu tính theo liên kết hydro
(cũng là một loại liên kết mạnh) thì Arg168, Gln180 và Glu174 là những acid amin

38
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

có tần số tương tác cao khi tạo liên kết này với các chất chủ vận. Như vậy, 6 acid
amin quan trọng trong sự gắn kết với thụ thể apelin để cho tác dụng chủ vận được dự
đoán là Trp24, Arg168, Glu174, Gln180, Glu198 và Phe291.
3.3.2.3. Sự tương tác của các chất chủ vận mạnh với thụ thể apelin
Với mục tiêu tìm kiếm chất chủ vận mới và mạnh cho thụ thể apelin, nghiên cứu này
khảo sát sự gắn kết của các chất chủ vận mạnh nhất trên thụ thể apelin. Hình 3.10
biểu diễn tần suất tương tác giữa các acid amin của thụ thể với 123 chất chủ vận mạnh
(với EC50 ≤ 100 nM). Kết quả cho thấy Trp24, Arg168 và Phe291 vẫn là những acid
amin cho tương tác kỵ nước nhiều nhất. Đối với liên kết hydro, ngoài Arg168, Glu174
và Glu198 tạo tương tác nhiều nhất thì còn có sự xuất hiện của Lys268.
60%

6% 50%
5%
40%
4%
30%
3%
20%
2%
1% 10%

0% 0%
Asp23

Lys25

Met183
Arg168
Glu174
Thr176
Lys178
Gln180

Glu198
Tyr264
Lys268
Tyr271
Thr22

Trp24

Tyr88
Tyr93

Liên kết kỵ nước Liên kết hydro

Hình 3.10. Biểu đồ tần suất tạo liên kết kỵ nước và liên kết hydro giữa 123 chất chủ vận
mạnh với các acid amin tại khoang gắn kết của thụ thể apelin
Hình 3.11 thể hiện mô hình gắn kết 3D và tương tác 2D của WO2017100558A1-479,
là chất chủ vận mạnh nhất trên thụ thể apelin (EC50 = 0,86 nM) trong bằng sáng chế.
Chất này có điểm số docking -27,38 kJ/mol và nằm sâu trong khoang, giúp nó gắn
tốt vào thụ thể apelin. Chất này tạo được 5 liên kết hydro, trong đó có 2 liên kết với
acid amin quan trọng là Trp24 và Glu174.

39
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

WO2017100558A1-479
Điểm số docking: -27,38 kJ/mol
EC50 = 0,86 nM

Hình 3.11. Mô hình gắn kết 3D và tương tác 2D của WO2017100558A1-479 với thụ thể
apelin
3.4. ỨNG DỤNG SÀNG LỌC ẢO
3.4.1. Cơ sở dữ liệu để sàng lọc ảo
Các thư viện hợp chất được dùng để sàng lọc qua các mô hình đã xây dựng trong
nghiên cứu này được thu thập từ các nguồn như trình bày ở mục 2.2.5.1. Đây là các
chất có cấu trúc phân tử nhỏ, kết quả cụ thể được liệt kê ở Bảng 3.8.

Bảng 3.8. Các thư viện hợp chất dùng để sàng lọc ảo chất có tiềm năng chủ vận thụ thể
apelin

TT Tên thư viện Số lượng chất Tài liệu tham khảo

1 ZINC12 22.723.923 [36]

Thư viện mảnh cấu trúc Maybridge


2 (Maybridge Screening and 59.520 [21]
Fragments Collection)

40
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

3.4.2. Kết quả sàng lọc ảo các chất gắn kết thụ thể apelin
Cơ sở dữ liệu nói trên được sàng lọc theo quy trình ở Hình 2.3 và thu được kết quả
tóm tắt như Hình 3.12.

Các thư viện hoạt chất


ZINC12 (22.723.923 chất)
Maybridge (59.520 chất)

Mô hình
3D-pharmacophore

38.546 chất thỏa mô hình 3D-


pharmacophore
Mô hình dược động học
– độc tính

14.722 chất

Mô hình mô tả phân tử docking

10.404 chất dock thành công


Dự đoán hoạt tính sinh học
EC50, so sánh điểm số docking

• ZINC19634420
• ZINC02737937
• ZINC41124344
• ZINC09563058
• ZINC04044911
• HTS11958
• CD01296
• BTB02585

Hình 3.12. Kết quả sàng lọc ảo chất chủ vận thụ thể apelin
3.4.2.1. Sàng lọc qua mô hình 3D-pharmacophore
Các chất thuộc thư viện ZINC12 và Maybridge được sàng lọc qua mô hình 3D-
pharmacophore, kết quả thu được 38.546 chất thỏa mô hình. Trong đó có 24.483 chất
thuộc tập ZINC12 và 14.063 chất thuộc tập Maybridge. Tiếp tục sử dụng công cụ

41
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

Unique và Druglike trên phần mềm MOE 2015.10 để loại các chất trùng lặp và không
phù hợp để làm thuốc, chọn được 20.891 chất.
3.4.2.2. Sàng lọc qua mô hình dược động học – độc tính (ADMET)
20.891 chất nói trên tiếp tục được tính toán các giá trị rủi ro ADMET (hấp thu, phân
bố, chuyển hóa, thải trừ và độc tính) bằng phần mềm ADMET PredictorTM. Có 14.722
chất vượt qua được các đánh giá rủi ro của phần mềm và được trình ở Bảng 3.9. Đây
là các chất được hy vọng là có tiềm năng vượt qua được các thử nghiệm tiền lâm
sàng.

Bảng 3.9. Kết quả sàng lọc ADMET

Yêu cầu về ZINC12 Maybridge

ngưỡng rủi ro Thỏa Không thỏa Thỏa Không thỏa

Hấp thu ≤ 3,5 20.154 180 552 5

Chuyển hóa ≤ 2,5 16.391 3,943 460 97

Độc tính ≤ 2 17.892 2,442 60 497

Tổng ≤ 7,5 19.260 1,074 551 6

Tổng số chất 14.314 7020 408 149

3.4.2.3. Sàng lọc qua mô hình docking phân tử


Do hạn chế về thời gian và tài nguyên máy tính, nghiên cứu tiến hành docking 10.000
phân tử có RMSD tốt nhất (xác định khi sàng lọc qua mô hình 3D-pharmacophore)
của tập ZINC12 và tất cả 408 chất của tập Maybridge.
Kết quả docking trên tập ZINC12
Kết quả có 9998/10.000 chất docking thành công và có điểm số docking từ -11.35
đến -50,64 kJ/mol. Tỉ lệ docking thành công là 99,98%, kết quả cho thấy mô hình
3D-pharmacophore xây dựng tốt, có khả năng sàng lọc được các chất gắn kết tốt với
thụ thể apelin.

42
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

2% 2%

< -40 kJ/mol


33%
Từ -40 đến -30 kJ/mol
Từ -30 đến -20 kJ/mol
63% Từ -20 đến -10 kJ/mol

Hình 3.13. Biểu đồ phân bố điểm số docking trên tập ZINC12


Theo Hình 3.13, phần lớn các chất có điểm số docking nằm trong khoảng từ -20 đến
-30 kJ/mol. Có 185/9998 chất có điểm số docking nhỏ hơn -40 kJ/mol và 3295/9998
chất có điểm số docking từ -30 đến -40 kJ/mol. Nghiên cứu tiến hành tính toán thông
số mô tả, loại miền ứng dụng và dự đoán hoạt tính sinh học EC50 cho 9998 chất này.
Kết quả docking trên tập Maybridge
Kết quả có 406/408 chất docking thành công và có điểm số docking từ -16,90 đến -
43,09 kJ/mol. Tỉ lệ docking thành công là 99,51%, kết quả cũng cho thấy mô hình
3D-pharmacophore thể hiện năng lực sàng lọc tốt, có khả năng xác định được các
chất gắn kết tốt với thụ thể apelin trong tập Maybridge.

43
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

3% 1%

25% < -40 kJ/mol


Từ -40 đến -30 kJ/mol
Từ -30 đến -20 kJ/mol
Từ -20 đến -10 kJ/mol
71%

Hình 3.14. Biểu đồ phân bố điểm số docking trên tập Maybridge


Theo Hình 3.14, phần lớn các chất có điểm số docking nằm trong khoảng từ -20 đến
-30 kJ/mol. Có 6/406 chất có điểm số docking nhỏ hơn -40 kJ/mol và 100 chất có
điểm số docking từ -30 đến -40 kJ/mol. Nghiên cứu tiến hành tính toán thông số mô
tả, loại miền ứng dụng và dự đoán giá trị hoạt tính sinh học pEC50 cho 406 chất này.

44
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

3.4.3. Các chất tiềm năng nhất sàng lọc được


ZINC19634420
ZINC19634420 có giá trị dự đoán EC50 = 9,72 nM và là giá trị hoạt tính chủ vận cao
nhất trong tập ZINC12. Chất này có điểm số docking -32,09 kJ/mol và vị trí nằm sâu
trong khoang (Hình 3.15) cho thấy có khả năng gắn kết tốt với thụ thể apelin. Có thể
lí giải điều này là do liên kết được tạo bởi các acid amin quan trọng trong thụ thể
apelin và ZINC19634420. Chất này tạo được hai liên kết hydro giữa Arg168 bởi
nhóm -COOH và một liên kết kỵ nước giữa Trp24 với nhân thiophen.

ZINC19634420
Điểm số docking: -32,09 kJ/mol
EC50 dự đoán = 9,72 nM

Hình 3.15. Mô hình gắn kết 3D và tương tác 2D của ZINC19634420 với thụ thể apelin

45
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

ZINC02737937
ZINC02737937 có hoạt tính chủ vận dự đoán EC50 = 9,72 nM, cũng là giá trị hoạt
tính sinh học cao nhất trong tập ZINC12. Theo Hình 3.16, chất này có vị trí gắn kết
nông, gần miệng của khoang gắn kết. Tuy nghiên, điểm số docking -31,11 kJ/mol thể
hiện ZINC02737937 có khả năng gắn kết tốt với thụ thể apelin. Điều này có thể được
lí giải là do nhiều liên kết hydro được tạo bởi acid amin quan trọng trong thụ thể
apelin và ZINC02737937. Chất này tạo được một liên kết hydro giữa acid amin quan
trọng Trp24 với O của nhóm -CONH. Ngoài ra còn có các liên kết hydro được tạo
bởi Asp23 với O của -CONH; Tyr93 và Lys178 với nhóm -COOH và Thr176 với N
của dị vòng thiazol.

ZINC02737937
Điểm số docking: -31,11 kJ/mol
EC50 dự đoán = 9,72 nM

Hình 3.16. Mô hình gắn kết 3D và tương tác 2D của ZINC02737937 với thụ thể apelin

46
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

ZINC41124344
ZINC41124344 có giá trị dự đoán EC50 = 78,64 nM, là giá trị hoạt tính sinh học khá
tốt (cao thứ tư) trong tập ZINC12. Theo Hình 3.17, chất này có vị trí khá sâu bên trong
khoang gắn kết. ZINC41124344 có khả năng gắn kết tốt với khoang thụ thể apelin
với điểm số docking cao -46,89 kJ/mol. Nhiều liên kết được tạo bởi acid amin quan
trọng trong thụ thể apelin và ZINC41124344. Chất này tạo được một liên kết kỵ nước
giữa acid amin quan trọng Trp24 với nhân imidazol, hai liên kết hydro với nhóm NO2.
Ngoài ra, còn có liên kết kỵ nước được tạo bởi Tyr271 với nhân phenyl.

ZINC41124344
Điểm số docking: -46,89 kJ/mol
EC50 dự đoán = 78,64 nM

Hình 3.17. Mô hình gắn kết 3D và tương tác 2D của ZINC41124344 với thụ thể apelin

47
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

ZINC09563058
ZINC09563058 nằm sâu trong khoang gắn kết với điểm số docking cao -41,92
kJ/mol, cho thấy khả năng gắn kết tốt với thụ thể apelin. Theo Hình 3.18, nhiều liên
kết được tạo bởi acid amin quan trọng trong thụ thể apelin và ZINC09563058.
Hai liên kết kỵ nước tạo bởi acid amin quan trọng Trp24 với nhân pyrimidin và
pyrazol, hai liên kết hydro giữa Arg168 với nhóm NO2. ZINC09563058 có giá trị dự
đoán EC50 = 78,64 nM, là giá trị thể hiện hoạt tính chủ vận tốt thứ tư trong tập ZINC12.

ZINC09563058
Điểm số docking: -41,92 kJ/mol
EC50 dự đoán = 78,64 nM

Hình 3.18. Mô hình gắn kết 3D và tương tác 2D của ZINC09563058 với thụ thể apelin

48
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

ZINC04044911
ZINC04044911 nằm sâu trong khoang gắn kết với điểm số docking cao -44,45 kJ/mol
thể hiện khả năng gắn kết rất tốt với khoang thụ thể apelin. Theo Hình 3.19, nhiều
liên kết được tạo bởi acid amin quan trọng trong thụ thể apelin và ZINC04044911.
Chất này tạo được một liên kết hydro giữa acid amin quan trọng Trp168 với N của
vòng pyrazin. Ngoài ra, bốn liên kết hydro được tạo bởi giữa Tyr88, Cys181, Asp184
và Tyr185 với N và nhóm -COO-; một liên kết kỵ nước giữa Trp85 với nhân 1,2,5-
oxadiazol. ZINC04044911 có giá trị dự đoán EC50 = 728,24 nM, là một trong 6 giá
trị hoạt tính sinh học tốt nhất trong tập ZINC12.

ZINC04044911
Điểm số docking: -44,45 kJ/mol
EC50 dự đoán = 728,24 nM

Hình 3.19. Mô hình gắn kết 3D và tương tác 2D của ZINC04044911 với thụ thể apelin

49
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

MB-HTS11958
Đây là một chất từ thư viện Maybridge. Chất này có giá trị dự đoán EC50 = 78,64 nM,
là giá trị hoạt tính sinh học tốt nhất trong tập Maybridge.
Theo Hình 3.20, vị trí gắn kết của MB-HTS11958 nằm sâu trong khoang và có điểm
số docking -28,24 kJ/mol. Nhiều liên kết được tạo bởi acid amin quan trọng trong thụ
thể apelin và chất này. Cụ thể, MB-HTS11958 tạo được một liên kết kỵ nước giữa
acid amin quan trọng Trp24 với nhân phenyl; Gln180 tạo được một liên kết hydro với
lưu huỳnh. Ngoài ra, hai liên kết hydro được tạo bởi giữa Lys178, Cys181 với N của
nhóm -CN và lưu huỳnh.

MB-HTS11958
Điểm số docking: -28,24 kJ/mol
EC50 dự đoán = 78,64 nM

Hình 3.20. Mô hình gắn kết 3D và tương tác 2D của MB-HTS11958 với thụ thể apelin

50
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

MB-CD01296
Với vị trí gắn kết sâu trong khoang và có điểm số docking -33,87 kJ/mol, MB-
CD01296 thể hiện khả năng gắn kết tốt với khoang thụ thể apelin. Theo Hình 3.21,
hai liên kết hydro được tạo bởi acid amin quan trọng Arg168 trong thụ thể apelin và
nhóm -NO2. Chất này tạo được một liên kết kỵ nước với acid amin Tyr271. MB-
CD01296 là chất có tiềm năng, với giá trị dự đoán EC50 = 78,64 nM tốt nhất trong
tập Maybridge.

MB-CD01296
Điểm số docking: -33,87 kJ/mol
EC50 dự đoán = 78,64 nM

Hình 3.21. Mô hình gắn kết 3D và tương tác 2D của MB-CD01296 với thụ thể apelin

51
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

MB-BTB02585
MB-BTB02585 có giá trị dự đoán EC50 = 728,25 nM, là một trong 3 giá trị hoạt tính
sinh học tốt nhất trong tập Maybridge. Theo Hình 3.22, chất này có vị trí nằm sâu
trong khoang gắn kết với điểm số docking -36,88 kJ/mol, thể hiện khả năng gắn kết
tốt với khoang thụ thể apelin. Một liên kết hydro được tạo bởi acid amin quan trọng
Arg168 trong thụ thể apelin với -CONH của BTB02585. Chất này còn tạo được một
liên kết hydro với acid amin Cys181.

MB-BTB02585
Điểm số docking: -36,88 kJ/mol
EC50 dự đoán = 728,25 nM

Hình 3.22. Mô hình gắn kết 3D và tương tác 2D của BTB02585 với thụ thể apelin
Các chất tiềm năng khác
Kết quả sàng lọc ảo còn cho thấy nhiều chất có điểm số docking rất tốt nhưng không
nằm trong miền ứng dựng của mô hình 2D-QSAR. Điều này chứng tỏ đây có thể là
những chất có những đặc điểm cấu trúc khác với các chất thuộc 2 bằng sáng chế được
sử dụng để xây dựng mô hình QSAR. Kết quả này gợi ý rằng đó có thể là những chất
mới và có tiềm năng chủ vận mạnh thụ thể apelin. Tuy nhiên, tác dụng thực sự của
các chất này cần được chứng minh qua các thử nghiệm in vitro. Hai chất tiêu biểu là
ZINC15163181 và MB-SEW04180.

52
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

ZINC15163181 là chất có điểm số docking tốt nhất trong toàn bộ thư viện ZINC12,
là -50,64 kJ/mol. Theo Hình 3.23, chất này tạo được các liên kết với acid amin quan
trọng trong khoang gắn kết của thụ thể apelin. Một liên kết kỵ nước tạo bởi Trp24
với nhân pyrazin. Hai liên kết hydro giữa Arg168 và nhóm NO2. Ngoài ra, chất này
còn tạo được một liên kết hydro với Met88.

Điểm số docking: -50,64 kJ/mol

Hình 3.23. Mô hình tương tác 2D của ZINC15163181 với thụ thể apelin

Điểm số docking: -43,09 kJ/mol

Hình 3.24. Mô hình tương tác 2D của MB-SEW04180 với thụ thể apelin
Tương tự, MB-SEW04180 là chất có điểm số docking tốt nhất trong thư viện
Maybridge. Theo Hình 3.24, chất này tạo được liên kết với các acid amin quan trọng,

53
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

cho thấy khả năng gắn kết tốt với thụ thể apelin. Cụ thể, một liên kết hydro kỵ nước
tạo bởi Trp24 và nhân pyrazol. Đặc biệt, 6 liên kết hydro được tạo bởi chất này Trp24,
Arg168 và Gln180.
3.4.4. Kết quả mô phỏng động học phân tử cho các chất có tiềm năng nhất sàng
lọc được
Nghiên cứu này bước đầu khảo sát sự gắn kết của các chất tốt nhất với thụ thể apelin
bằng phương pháp mô phỏng động lực học phân tử (MDS) trong 10 ns. Thụ thể apelin
ở dạng không có ligand (apoprotein) và dạng phức hợp gắn với chất chủ vận thụ thể
apelin mạnh nhất trong bằng sáng chế - WO2017100558A1-479 (EC50 = 0,86 nM)
và hai chất tiềm năng thu được từ quá trình sàng lọc ảo (EC50 dự đoán lần lượt là 9,72
nM và 78,64 nM) được tập trung nghiên cứu.
Hình 3.25 biểu diễn đồ thị RMSD của carbon xương sống thụ thể apelin ở dạng
apoprotein (apo-APJ) và ở dạng phức hợp với các ligand. Kết quả cho thấy sau
khoảng 3 ns, protein bắt đầu ổn định (vị trí mũi tên) với độ dao động RMSD trong
khoảng 2 Å. Tuy nhiên, phức hợp của ZINC41124344 có xu hướng tiếp tục tăng
RMSD ở những thời điểm cuối, gợi ý rằng phức hợp này cần phải được chạy MDS
với thời gian lâu hơn nữa.

7
6
5
RMSD (Å)

4 Apo-APJ
WO2017100558A1-479
3
ZINC19634420
2
ZINC41124344
1
0
0 2 4 6 8 10
Thời gian (ns)

Hình 3.25. Đồ thị RMSD của carbon xương sống thụ thể apelin ở dạng apoprotein (apo-
thụ thể apelin) và ở dạng phức hợp với các ligand
Các liên kết hydro và tương tác kỵ nước đã được xác định là những yếu tố cần thiết
cho tác dụng chủ vận thụ thể apelin trong các mô hình pharmacophore cũng như kết
quả docking. Từ kết quả MDS, Hình 3.26 biểu diễn tần suất tương tác của các ligand

54
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

với thụ thể apelin. Các đồ thị cho thấy WO2017100558A1-479 tương tác kỵ nước
mạnh với Trp24, Tyr21 và tạo liên kết hydro với Thr22, Lys25.
Trong khi đó, ZINC19634420 nổi bật ở khả năng tạo liên kết hydro mạnh với Arg168,
Lys268 và tương tác kỵ nước với nhiều acid amin như Tyr93, Phe291, Trp85 và
Trp24. Tương tự, ZINC41124344 liên kết hydro mạnh với Arg168 và đặc biệt tạo
nhiều tương tác kỵ nước với Trp85, Phe291, Tyr88, Trp24, Tyr93, Tyr264, Tyr271
và Tyr299. Những kết quả này gợi ý tiềm năng chủ vận mạnh thụ thể apelin của 2
chất này. Chi tiết về sự tương tác của các ligand nói trên với thụ thể apelin được trình
bày ở Hình 3.27.

55
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

Hình 3.26. Tần suất tương tác của các ligand với thụ thể apelin

56
Khóa luận tốt nghiệp DSĐH Kết quả và bàn luận

WO2017100558A1-479

ZINC19634420 ZINC41124344

Hình 3.27. Sự tương tác của các ligand với thụ thể apelin

57
Khóa luận tốt nghiệp DSĐH Kết luận và đề nghị

CHƯƠNG 4. KẾT LUẬN VÀ ĐỀ NGHỊ


Thụ thể apelin là đích tác động quan trọng của nhiều bệnh lý về tim mạch và đang
được quan tâm nghiên cứu. Dựa trên những công bố từ 2 bằng sáng chế và cấu trúc
tinh thể của thụ thể apelin, đề tài này được tiến hành với mục tiêu tìm kiếm các phân
tử nhỏ mới có tiềm năng chủ vận thụ thể apelin.
Đề tài đã đạt được những mục tiêu đề ra. Trong đó, nghiên cứu đã sử dụng 5 phương
pháp in silico, gồm mô hình 3D-pharmacophore, mô hình đánh giá ADMET, mô hình
docking phân tử, mô hình 2D-QSAR và mô phỏng động lực học phân tử. Đề tài thu
thập được 689 chất thuộc hai bằng sáng chế để làm cơ sở dữ liệu xây dựng các mô
hình. Trong ba mô hình 3D-pharmacophore xây dựng được, mô hình Ph003 là mô
hình tốt nhất và đã thể hiện hiệu năng tốt trong quá trình sàng lọc ảo. Nghiên cứu đã
xây dựng được mô hình QSAR-2 theo phương pháp CPG-NN với kết quả đánh giá
tương đối tốt, ứng dụng trong dự đoán tác dụng sinh học của các chất. Một mô hình
docking phân tử cũng đã được xây dựng để đánh giá khả năng gắn kết của chất trên
thụ thể apelin.
Qua quá trình sàng lọc ảo, đề tài đã xác định được một số chất có tiềm năng chủ vận
thụ thể apelin, trong đó có 5 chất tiềm năng nhất từ tập ZINC12 và 3 chất từ tập
Maybridge và đã được trình bày ở trên. Ngoài ra, kết quả sàng lọc còn cho thấy một
số chất tiềm năng khác (ZINC15163181 và MB-SEW04180) nằm ngài miền ứng
dụng của mô hình QSAR nhưng có điểm số docking rất âm.
Để nghiên cứu sàng lọc các chất có tiềm năng chủ vận thụ thể apelin tiến xa hơn và
có thể ứng dụng trong lâm sàng để điều trị các bệnh lý liên quan, đề tài đề nghị thử
nghiệm in vitro để xác định hoạt tính sinh học của các chất tiềm năng thu được từ quá
trình sàng lọc in silico.

58
Khóa luận tốt nghiệp DSĐH Tài liệu tham khảo

TÀI LIỆU THAM KHẢO


[1] Bệnh tim mạch (CVD) ở Việt Nam". [Online]. Available:
https://www.who.int/vietnam/vi/health-topics/cardiovascular-disease. [Accessed:
06/08/2020-2020].
[2] Yamaleyeva L. M., Shaltout H. A. , Varagic J. (2016), "Apelin-13 in blood
pressure regulation and cardiovascular disease", Curr Opin Nephrol Hypertens, 25
(5), 396-403.
[3] Castan-Laurell I., Dray C., Attane C. et al. (2011), "Apelin, diabetes, and obesity",
Endocrine, 40 (1), 1-9.
[4] Murza A., Trân K., Bruneau-Cossette L. et al. (2019), "Apelins, ELABELA, and
their derivatives: Peptidic regulators of the cardiovascular system and beyond",
Peptide Science, 111 (1).
[5] Hachtel S., Wohlfart P., Weston J. et al. (2015), Benzoimidazole - carboxylic acid
amide dervatives as APJ receptor modulatorsUS 9,156,796 B2.
[6] Runyon S., P., Maitra R., Narayanan S. et al. (2017), Improved Apelin Receptor
(APJ) Agonists and Uses Thereof, US Patent No. WO 2017/100558 Al.
[7] Kuba K., Sato T., Imai Y. et al. (2019), "Apelin and Elabela/Toddler; double
ligands for APJ/Apelin receptor in heart development, physiology, and pathology",
Peptides, 111, 62-70.
[8] Tran K., Murza A., Sainsily X. et al. (2018), "A Systematic Exploration of
Macrocyclization in Apelin-13: Impact on Binding, Signaling, Stability, and
Cardiovascular Effects", J Med Chem, 61 (6), 2266-2277.
[9] Melgar-Lesmes P., Perramon M. , Jimenez W. (2019), "Roles of the Hepatic
Endocannabinoid and Apelin Systems in the Pathogenesis of Liver Fibrosis", Cells,
8 (11).
[10] Yingli Ma Y. Y., Yanbin Ma, ..., Wenge Zhong, Mingqiang Zhang, Fei Xu
(2017), "Structural Basis for Apelin Control of the Human Apelin Receptor",
CellPress.
[11] Yu X. H., Tang Z. B., Liu L. J. et al. (2014), "Apelin and its receptor APJ in
cardiovascular diseases", Clin Chim Acta, 428, 1-8.
[12] Huang Z., He L., Chen Z. et al. (2018), "Targeting drugs to APJ receptor: From
signaling to pathophysiological effects", J Cell Physiol, 234 (1), 61-74.
[13] Angela Giddings S. R., James Thomas, Julianne Tajuba, Katherine Bortoff,
Rangan Maitra (2010), "Development of a functional HTS assay for the APJ
receptor".

59
Khóa luận tốt nghiệp DSĐH Tài liệu tham khảo

[14] Yang S. Y. (2010), "Pharmacophore modeling and applications in drug


discovery: challenges and recent advances", Drug Discov Today, 15 (11-12), 444-
450.
[15] Langer T. , Wolber G. (2004), "Pharmacophore definition and 3D searches",
Drug Discov Today Technol, 1 (3), 203-207.
[16] SONNIA 4.2". [Online]. Available: http://www.molecular-networks.com.
[Accessed: 21/07/2020-2020].
[17] Chen Y. C. (2015), "Beware of docking!", Trends Pharmacol Sci, 36 (2), 78-95.
[18] (2017), "5VBL". [Online]. Available: https://www.rcsb.org/structure/5VBL.
[Accessed: 04/08/2020-2020].
[19] Irwin J. J., Sterling T., Mysinger M. M. et al. (2012), "ZINC: a free tool to
discover chemistry for biology", J Chem Inf Model, 52 (7), 1757-1768.
[20] Shoichet o. J. I. a. B. K. (2005), "ZINC - A Free Database of Commercially
Available Compounds for Virtual Screening", J. Chem. Inf. Model.
[21] Maybridge". [Online]. Available: https://www.maybridge.com/. [Accessed:
03/08/2020-2020].
[22] (2014), "Molecular Operating Environment (MOE) version 2015.10". [Online].
Available: http://www.chemcomp.com/. [Accessed: 15/04/2019].
[23] Narayanan S., Vasukuttan V., Rajagopal S. et al. (2020), "Identification of potent
pyrazole based APELIN receptor (APJ) agonists", Bioorg Med Chem, 28 (4), 115237.
[24] Cereto-Massagué A., Guasch L., Valls C. et al. (2012), "DecoyFinder: an easy-
to-use python GUI application for building target-specific decoy sets", Oxford
University Press.
[25] Seidel T., Ibis G. k., Bendix F. et al. (2010), "Strategies for 3D pharmacophore-
based virtual screening", Drug Discov Today Technol, 7 (4), e203-270.
[26] Bioinformatics Research Center N. C. S. U., "Introduction to Principal
Components and FactorAnalysis".
[27] Thai K. M. , Ecker G. F. (2008), "Classification models for HERG inhibitors by
counter-propagation neural networks", Chem Biol Drug Des, 72 (4), 279-289.
[28] New Features in Neural Network Package SONNIA Version 4.2". [Online].
Available: http://www.molecularnetworks.com/products/sonnia. [Accessed:
21/07/2020-2020].
[29] Chemical Computing Group Inc.
MOE 2015.10 ". [Online]. Available: https://www.chemcomp.com/. [Accessed:
21/07/2020-2020].

60
Khóa luận tốt nghiệp DSĐH Tài liệu tham khảo

[30] Ojha P. K., Mitra I., Das R. N. et al. (2011), "Further exploring rm2 metrics for
validation of QSPR models", Chemometrics and Intelligent Laboratory Systems, 107
(1), 194-205.
[31] Gramatica P. (2007), "Principles of QSAR models validation: internal and
external", QSAR & Combinatorial Science, 26 (5), 694-701.
[32] (2019), "ADMET Predictor 9.5". [Online]. Available: https://www.simulations-
plus.com/resource/admet-predictor-9-5-standalone-install/. [Accessed: 04/08/2020-
2020].
[33] (2016), "D. E. Shaw Research". [Online]. Available:
http://www.deshawresearch.com/. [Accessed: 10/06/2019].
[34] (2016), "Desmond 4.7". [Online]. Available:
https://www.schrodinger.com/desmond. [Accessed: 25/07/2019].
[35] D. E. Shaw Research (2014), "Desmond Users Guide", Release 3.6.1.1, 15-38.
[36] ZINCPurchasable". [Online]. Available: http://zincpharmer.csb.pitt.edu/.
[Accessed: 04/08/2020-2020].

61
Khóa luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC
PHỤ LỤC 1. Cấu trúc hóa học và giá trị hoạt tính sinh học của 689 chất thu thập từ
hai bằng sáng chế US9156796 và WO2017100558A1. ..............................................2
PHỤ LỤC 2. Danh sách 123 chất chủ vận mạnh thụ thể apelin của tập xây dựng mô
hình 3D-pharmacophore..............................................................................................3
PHỤ LỤC 3. Kết quả loại nhiễu PCA. .......................................................................6
PHỤ LỤC 4. Kết quả docking của các chất vào khoang gắn kết của thụ thể apelin
trong quá trình sàng lọc ảo. .........................................................................................8

PL.1
Khóa luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 1. Cấu trúc hóa học và giá trị hoạt tính sinh học của 689 chất thu thập từ
hai bằng sáng chế US9156796 và WO2017100558A1.

Cấu trúc hóa học và giá trị hoạt tính sinh học của 689 chất thu thập từ hai patent
US9156796 và WO2017100558A1 được lưu tại:
Trang: https://sites.google.com/view/apelin-receptor-agonist
File: CSDL_689_chat_chu_van_apelin.mdb

PL.2
Khóa luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 2. Danh sách 123 chất chủ vận mạnh thụ thể apelin của tập xây dựng mô
hình 3D-pharmacophore.

Tên chất EC50 (nM) Tên chất EC50 (nM)

WO2017100558A1_479.cdx 0.86 US9156796_60.cdx 46.00

WO2017100558A1_481.cdx 1.96 US9156796_99.cdx 46.00

WO2017100558A1_480.cdx 2.76 WO2017100558A1_400.cdx 46.00

WO2017100558A1_412.cdx 5.00 WO2017100558A1_603.cdx 46.00

WO2017100558A1_429.cdx 6.10 US9156796_107.cdx 47.00

WO2017100558A1_410.cdx 7.00 US9156796_72.cdx 47.00

WO2017100558A1_428.cdx 7.50 WO2017100558A1_515.cdx 47.00

WO2017100558A1_427.cdx 8.50 US9156796_106.cdx 48.00

WO2017100558A1_556.cdx 10.00 US9156796_53.cdx 48.00

WO2017100558A1_490.cdx 10.30 WO2017100558A1_413.cdx 49.00

WO2017100558A1_426.cdx 10.60 WO2017100558A1_626.cdx 49.00

WO2017100558A1_425.cdx 10.90 US9156796_163.cdx 51.00

WO2017100558A1_605.cdx 11.00 US9156796_77.cdx 53.00

WO2017100558A1_338.cdx 12.00 WO2017100558A1_604.cdx 55.00

WO2017100558A1_409.cdx 12.50 US9156796_65.cdx 56.00

WO2017100558A1_635.cdx 13.00 WO2017100558A1_436.cdx 58.00

US9156796_484.cdx 14.00 WO2017100558A1_504.cdx 59.00

WO2017100558A1_483.cdx 14.00 WO2017100558A1_628.cdx 61.00

WO2017100558A1_638.cdx 14.00 US9156796_76.cdx 62.00

WO2017100558A1_411.cdx 14.50 WO2017100558A1_335.cdx 63.00

WO2017100558A1-384.cdx 15.00 WO2017100558A1_408.cdx 64.00

PL.3
Khóa luận tốt nghiệp DSĐH Phụ lục

Tên chất EC50 (nM) Tên chất EC50 (nM)

WO2017100558A1_348.cdx 15.00 WO2017100558A1_522.cdx 64.00

WO2017100558A1_432.cdx 16.00 US9156796_11.cdx 65.00

WO2017100558A1_537.cdx 16.00 US9156796_73.cdx 65.00

WO2017100558A1_430.cdx 17.50 WO2017100558A1_404.cdx 65.00

US9156796_68.cdx 18.00 US9156796_75.cdx 66.00

WO2017100558A1_437.cdx 21.00 WO2017100558A1_655.cdx 66.00

WO2017100558A1_637.cdx 21.00 WO2017100558A1_600.cdx 67.00

WO2017100558A1_406.cdx 22.00 WO2017100558A1_491.cdx 68.00

WO2017100558A1_431.cdx 22.50 WO2017100558A1_607.cdx 69.00

WO2017100558A1_460.cdx 23.00 US9156796_400.cdx 70.00

WO2017100558A1_597.cdx 23.00 WO2017100558A1_452.cdx 70.00

WO2017100558A1_493.cdx 24.00 WO2017100558A1_624.cdx 70.00

WO2017100558A1_599.cdx 24.00 US9156796_71.cdx 73.00

WO2017100558A1_630.cdx 24.00 WO2017100558A1_351.cdx 73.00

WO2017100558A1_551.cdx 25.00 WO2017100558A1_443.cdx 73.00

WO2017100558A1_501.cdx 26.00 US9156796_121.cdx 74.00

WO2017100558A1_451.cdx 27.00 US9156796_61.cdx 75.00

WO2017100558A1_641.cdx 27.00 WO2017100558A1_631.cdx 75.00

WO2017100558A1_450.cdx 30.00 WO2017100558A1_502.cdx 77.00

WO2017100558A1_496.cdx 30.00 WO2017100558A1_629.cdx 77.00

WO2017100558A1_339.cdx 31.00 US9156796_125.cdx 78.00

WO2017100558A1_506.cdx 32.00 WO2017100558A1_578.cdx 78.00

WO2017100558A1_535.cdx 32.00 US9156796_67.cdx 79.00

PL.4
Khóa luận tốt nghiệp DSĐH Phụ lục

Tên chất EC50 (nM) Tên chất EC50 (nM)

WO2017100558A1_505.cdx 34.00 WO2017100558A1_500.cdx 79.00

WO2017100558A1_423.cdx 35.00 WO2017100558A1_514.cdx 79.00

WO2017100558A1_511.cdx 35.00 WO2017100558A1_593.cdx 79.00

WO2017100558A1_417.cdx 36.00 US9156796_22.cdx 80.00

WO2017100558A1_492.cdx 36.00 US9156796_79.cdx 80.00

US9156796_472.cdx 38.00 WO2017100558A1_296.cdx 83.00

WO2017100558A1_536.cdx 39.00 WO2017100558A1_447.cdx 84.00

WO2017100558A1_639.cdx 40.00 US9156796_66.cdx 87.00

US9156796_81.cdx 41.00 WO2017100558A1_634.cdx 87.00

US9156796_92.cdx 41.00 US9156796_86.cdx 88.00

US9156796_96.cdx 41.00 WO2017100558A1_596.cdx 88.00

WO2017100558A1_614.cdx 41.00 WO2017100558A1-372.cdx 90.00

WO2017100558A1_403.cdx 42.00 WO2017100558A1_575.cdx 91.00

WO2017100558A1_610.cdx 43.00 WO2017100558A1-380.cdx 94.00

WO2017100558A1_363.cdx 44.00 US9156796_95.cdx 95.00

WO2017100558A1_594.cdx 44.00 WO2017100558A1_609.cdx 98.00

WO2017100558A1_520.cdx 45.00 US9156796_399.cdx 99.00

PL.5
Khóa luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 3. Kết quả loại nhiễu PCA.

pEC50
STT ID Cấu trúc phân tử pEC50
dự đoán

1 WO2017100558A1_641 7,57 6,49

2 WO2017100558A1_299 5,54 5,42

3 WO2017100558A1_349 6,71 8,10

4 WO2017100558A1_378 5,03 5,25

PL.6
Khóa luận tốt nghiệp DSĐH Phụ lục

pEC50
STT ID Cấu trúc phân tử pEC50
dự đoán

5 WO2017100558A1_475 6,84 7,10

6 WO2017100558A1_371 5,42 7,09

7 WO2017100558A1_298 6,23 5,42

8 US9156796_165 5,10 5,00

9 WO2017100558A1_618 6,37 5,94

PL.7
Khóa luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 4. Kết quả docking của các chất vào khoang gắn kết của thụ thể apelin
trong quá trình sàng lọc ảo.

Danh sách các chất từ thư viện ZINC12 dock thành công vào thụ thể apelin được lưu
trữ tại:
Trang: https://sites.google.com/view/apelin-receptor-agonist
File: Docked_ZINC12.mdb
Các chất từ thư viện Maybridge dock thành công vào thụ thể apelin được lưu trữ tại:
Trang: https://sites.google.com/view/apelin-receptor-agonist
File: Docked_Maybridge.mdb

PL.8

You might also like