You are on page 1of 119

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ

ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH

NGUYỄN HOÀNG MINH

SÀNG LỌC IN SILICO CÁC PHÂN TỬ NHỎ CÓ TIỀM NĂNG GẮN KẾT
INTERLEUKIN-1β VÀ THỤ THỂ INTERLEUKIN-1

KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ ĐẠI HỌC

Thành phố Hồ Chí Minh – Năm 2020


BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ
ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH

NGUYỄN HOÀNG MINH

SÀNG LỌC IN SILICO CÁC PHÂN TỬ NHỎ CÓ TIỀM NĂNG GẮN KẾT
INTERLEUKIN-1β VÀ THỤ THỂ INTERLEUKIN-1

KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ ĐẠI HỌC

Giảng viên hướng dẫn: PGS. TS. Thái Khắc Minh


GS. TS. Trần Thành Đạo

Thành phố Hồ Chí Minh – Năm 2020


ĐẠI HỌC Y DƯỢC CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
THÀNH PHỐ HỒ CHÍ MINH Độc lập – Tự do – Hạnh phúc
KHOA DƯỢC

TP. Hồ Chí Minh, ngày tháng năm

GIẤY XÁC NHẬN ĐÃ BỔ SUNG, SỬA CHỮA KHÓA LUẬN THEO Ý


KIẾN ĐÓNG GÓP CỦA HỘI ĐỒNG

Tên đề tài khóa luận: Sàng lọc in silico các phân tử nhỏ có tiềm năng gắn kết
Interleukin-1β và thụ thể Interleukin-1
Họ và tên sinh viên: NGUYỄN HOÀNG MINH
Giảng viên hướng dẫn: PGS. TS. Thái Khắc Minh; GS. TS. Trần Thành Đạo
Khóa luận đã được bổ sung, sửa chữa các nội dung sau:
1. Chỉnh sửa, bổ sung và loại bỏ một số hình ảnh, bảng biểu
2. Bổ sung phụ lục
3. Sửa lỗi hành văn

Giảng viên hướng dẫn Giảng viên phản biện Chủ tịch hội đồng
XÁC NHẬN CỦA GIẢNG VIÊN HƯỚNG DẪN
CHO PHÉP SINH VIÊN NỘP KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Giảng viên hướng dẫn: PGS. TS. THÁI KHẮC MINH
GS. TS. TRẦN THÀNH ĐẠO
Đơn vị: Khoa Dược – Đại học Y Dược Thành phố Hồ Chí Minh
Tên đề tài hướng dẫn: Sàng lọc in silico các phân tử nhỏ có tiềm năng gắn kết
Interleukin-1β và thụ thể Interleukin-1
Sinh viên thực hiện đề tài: NGUYỄN HOÀNG MINH
Lớp: Dược chính quy 2015
Mã số sinh viên: 511156155
Tôi xin xác nhận sinh viên Nguyễn Hoàng Minh đã hoàn thành đề tài và cho phép
nộp khóa luận tốt nghiệp cho Khoa.
Giảng viên hướng dẫn

i
SÀNG LỌC IN SILICO CÁC PHÂN TỬ NHỎ CÓ TIỀM NĂNG GẮN KẾT
INTERLEUKIN-1β VÀ THỤ THỂ INTERLEUKIN-1
Nguyễn Hoàng Minh
Giảng viên hướng dẫn: PGS. TS. Thái Khắc Minh, GS. TS. Trần Thành Đạo
Đặt vấn đề
IL-1β là một cytokin thuộc thành viên họ IL-1. Khi kết hợp với thụ thể chính IL-1R1,
IL-1β có vai trò chuyên biệt điều hoà các phản ứng viêm trong cơ thể. Trong các bệnh
lý như viêm khớp dạng thấp, gout hay các bệnh tự viêm thường đi kèm với sự biểu
hiện quá mức của IL-1β. Do đó, việc ức chế IL-1β hoặc thụ thể IL-1R1 là một liệu
pháp tiềm năng trong điều trị các bệnh lý trên. Đề tài này được thực hiện với mục tiêu
sàng lọc 22 triệu chất của 7 CSDL khác nhau để tìm các phân tử nhỏ có tiềm năng ức
chế IL-1β hoặc thụ thể IL-1R1.
Đối tượng và phương pháp nghiên cứu
Đối tượng nghiên cứu: CSDL ZINC, MBHC, MBPPI, CDPPI, CDPM, UNDP, DB;
cấu trúc kết tinh IL-1β với canakinumab (5BVP), IL-1β tự do (9ILB), IL-1R1 với IL-
1β (1ITB); 8 mô hình pharmacophore cho các chất ức chế trên IL-1β và IL-1R1 từ
nghiên cứu của Lê Minh Trí, 2019.
Phương pháp nghiên cứu: Xây dựng mô hình 3D-pharmacophore bằng MOE 2015.10,
sàng lọc pharmacopore trên ZINCPharmer và MOE 2015.10, docking phân tử bằng
LeadIT 2.1.8, mô phỏng động lực học bằng GROMACS 2020.2 và tính toán năng
lượng gắn kết tự do bằng g_mmpbsa 5.1.2.
Kết quả và bàn luận
Sàng lọc 3D-pharmacophore đã thu được 2.235 chất trên IL-1β và 8.480 chất trên IL-
1R1. Đánh giá ADME thu được 202 và 1.054 chất lần lượt trên IL-1β và IL-1R1.
Bằng điểm số docking và tương tác với acid amin quan trọng, 5 chất trong vị trí β5-
β6 trên IL-1β được lựa chọn mô phỏng động lực học và tính toán năng lượng gắn kết
tự do. Trong số 5 chất tính toán năng lượng gắn kết tự do, 2 chất là T428-0731 và
P634-0250 có điểm số âm nhất. Hai chất này có thể được thử in vitro hoặc tiến hành
mô phỏng thời gian lâu hơn.
Kết luận và đề nghị
Các mô hình in silico đã được áp dụng để sàng lọc thành công trên 22 triệu chất. Tuy
vậy, vẫn còn các vị trí trên IL-1β chưa được mô phỏng động lực học là A và B và trên
IL-1R1 là rãnh D1-D2 và D2. Các kết quả từ nghiên cứu này có thể được tiếp tục thực
hiện để tìm ra các chất ức chế được IL-1β hoặc IL-1R1 thật sự trên in vitro.

ii
IN SILICO SCREENING FOR SMALL MOLECULES INHIBITORS
AGAINST INTERLEUKIN-1β AND INTERLEUKIN-1 RECEPTOR
Hoang-Minh NGUYEN
Supervisors: Assoc. Prof. PhD. Khac-Minh Thai, Prof. PhD. Thanh Dao Tran
Introduction
IL-1β is a cytokine from the IL-1 family. When bound to its main receptor, IL-1R1,
IL-1β plays a major role in regulating inflammatory activities in the body. Medical
conditions such as rheumatoid arthritis, gout or autoinflammatory diseases are linked
to the overexpression of IL-1β. Thus, inhibiting IL-1β or IL-1R1 is a promising
therapeutic target in management of such conditions. The purpose of this research is
to screen over 22 million molecules from 7 different datasets in order to find potential
therapeutic agents inhibiting IL-1β or IL-1R1.
Materials and methods
Material: ZINC, ZINC, MBHC, MBPPI, CDPPI, CDPM, UNDP and DB datasets;
crystallized structures of IL-1β with canakinumab (5BVP), free IL-1β (9ILB), IL-
1R1 with IL-1β (1ITB); 8 pharmacophore models targeting IL-1β and IL-1R1 from
the study of Minh Tri Le, 2019.
Methods: 3D-pharmacophore modelling using MOE 2015.10, pharmacophore
screening on ZINCPharmer and MOE 2015.10, molecular docking using LeadIT
2.1.8, molecular dynamics simulation on GROMACS 2020.2, and free binding
energy calculation using g_mmpbsa 5.1.2.
Conclusion
3D-pharmacophore screening returned with 2,235 molecules on IL-1β and 8,480 on
IL-1R1. 202 and 1,054 molecules on IL-1β and IL-1R1 after ADME evaluation. By
combingin docking scores and protein-ligand interaction fingerprint, 5 molecules on
β5-β6 loop of IL-1β were chosen to perform molecular dynamics simulation and free
binding energy calculation. Among 5 molecules, T428-0731 and P634-0250 returned
with the lowest docking score. These 2 molecules could be selected for in vitro
evaluation or performing longer dynamic simulation runs.
Conclusion
In silico models were successfully applied to screen over 22 million molecules.
However, there are still site A, B on IL-1β as well as D1-D2 junction, D2 site on IL-
1R1 that are yet to be performed molecular dynamics simulation. Results from this
study could be continued to search for experimental in vitro inhibitory activities.

iii
MỤC LỤC
ĐẶT VẤN ĐỀ ........................................................................................................... 1
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .................................................................... 2
1.1. TỔNG QUAN VỀ CYTOKIN VÀ INTERLEUKIN ...................................... 2
1.2. INTERLEUKIN-1β ......................................................................................... 6
1.3. CÁC THUỐC ỨC CHẾ HOẠT ĐỘNG IL-1β................................................ 7
1.4. CÁC VỊ TRÍ TƯƠNG TÁC TRÊN IL-1β và IL-1R1 ..................................... 8
1.5. THIẾT KẾ THUỐC HỢP LÝ ....................................................................... 10
CHƯƠNG 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU ....................... 13
2.1. XÂY DỰNG CÁC CƠ SỞ DỮ LIỆU SÀNG LỌC ẢO ............................... 14
2.2. XÂY DỰNG MÔ HÌNH 3D-PHARMACOPHORE .................................... 15
2.3. ĐÁNH GIÁ ADME ....................................................................................... 22
2.4. MÔ HÌNH MÔ TẢ PHÂN TỬ DOCKING .................................................. 26
2.5. PHÂN TÍCH KẾT QUẢ DOCKING ............................................................ 28
2.6. MÔ PHỎNG ĐỘNG LỰC HỌC PHÂN TỬ ................................................ 29
2.7. TÍNH TOÁN NĂNG LƯỢNG TỰ DO ........................................................ 34
CHƯƠNG 3. KẾT QUẢ VÀ BÀN LUẬN ............................................................. 36
3.1. KẾT QUẢ XÂY DỰNG CÁC TẬP CƠ SỞ DỮ LIỆU ................................ 36
3.2. KẾT QUẢ SÀNG LỌC PHARMACOPHORE ............................................ 37
3.3. KẾT QUẢ ĐÁNH GIÁ ADME .................................................................... 40
3.4. CÁC MÔ HÌNH DOCKING ......................................................................... 43
3.5. KẾT QUẢ PHÂN TÍCH PLIF ...................................................................... 46
3.6. ĐÁNH GIÁ MÔ PHỎNG ĐỘNG LỰC HỌC .............................................. 48
3.7. KẾT QUẢ TÍNH TOÁN NĂNG LƯỢNG TỰ DO ...................................... 54
3.8. BÀN LUẬN................................................................................................... 56
CHƯƠNG 4. KẾT LUẬN VÀ ĐỀ NGHỊ ............................................................... 59
TÀI LIỆU THAM KHẢO ....................................................................................... 60

iv
Khoá luận tốt nghiệp DSĐH Danh mục các chữ viết tắt

DANH MỤC CÁC CHỮ VIẾT TẮT


3D 3 chiều (3 Dimensions)
ADMET Hấp thu, phân bố, chuyển hoá, thải trừ, độc tính (Adsorption, Distribution,
Metabolism, Excretion, Toxicity)
CADD Thiết kế thuốc dựa trên sự trợ giúp của máy tính (Computer-Aided Drug
Design)
CAPS Sốt chu kỳ di truyền liên quan Cryopyrin
CDPM Cơ sở dữ liệu ChemDiv Peptidomimetics
CDPPI Cơ sở dữ liệu ChemDiv Protein-Protein Interaction
CDR Vùng quyết định bổ khuyết (complementary determining region)
CSDL Cơ sở dữ liệu
DB Cơ sở dữ liệu DrugBank
HVR Vùng siêu biến (Hypervariable region)
IL Interleulin
IL-1R Thụ thể IL-1 (Interleukin-1 receptor)
IL-1R1 Thụ thể IL-1 tuýp 1 (Interleukin-1 receptor type 1)
IL-1β Interleulin-1β
LBP Mô hình pharmacophore dựa trên cấu trúc phối tử
MBHC Cơ sở dữ liệu MayBridge HitCreator
MBPPI Cơ sở dữ liệu MayBridge Protein-Protein Interaction
MDS Mô phỏng động lực học (Molecular Dynamics Simulations)
MM- Tính toán năng lượng diện tích bề mặt cơ học phân tử Poisson-Boltmann
PBSA
ns Nano giây
PDB Ngân hàng dữ liệu protein (Protein Data Bank)
PLIF Dấu vân tay tương tác protein-phối tử (Protein-ligand interaction fingerprint
– PLIF)
PPI Tương tác protein-protein (protein-protein interaction)
ps Pico giây
SBP Mô hình pharmacophore dựa trên cấu trúc protein
SC Đường tiêm dưới da (Subcutaneous)
UNDP Cơ sở dữ liệu Universal Natural Products Database
vdw Van der Waals

v
Khoá luận tốt nghiệp DSĐH Danh mục bảng

DANH MỤC BẢNG


Bảng 1.1. Một số nhóm bệnh liên quan đến IL-1β .................................................... 6
Bảng 1.2. Các thuốc ức chế IL-1β đã được chấp thuận ............................................. 7
Bảng 1.3. Acid amin quan trọng trên IL-1β và IL-1R1 ............................................. 8
Bảng 2.1. Tương tác giữa canakinumab và vòng β5-β6 của IL-1β ......................... 17
Bảng 2.2. So sánh Pharmacophore Editor (MOE) và ZINCPhamer ....................... 19
Bảng 2.3. Những tinh chỉnh pharmacophore trên ZINCPharmer ............................ 20
Bảng 2.4. Luật Ghose, Verber, Muegge và Egan .................................................... 24
Bảng 2.5. Các mô hình và tiêu chí đánh giá ADME ............................................... 26
Bảng 2.6. Phân loại liên kết hydro ........................................................................... 33
Bảng 3.1. Kết quả sàng lọc CSDL ........................................................................... 36
Bảng 3.2. Tóm tắt 8 mô hình pharmacophore của Lê Minh Trí và cộng sự ............ 37
Bảng 3.3. Kết quả sàng lọc pharmacophore của CSDL ZINC ................................ 39
Bảng 3.4. Kết quả sàng lọc pharmacophore 6 CSDL .............................................. 40
Bảng 3.5. Kết quả sàng lọc pharmacophore trên 7 CSDL ....................................... 40
Bảng 3.6. Kết quả sàng lọc SwissADME ................................................................ 41
Bảng 3.7. Cấu trúc hoá học và tính chất của 5 chất hit ............................................ 49
Bảng 3.8. Kết quả tính toán năng lượng tự do ......................................................... 55

vi
Khoá luận tốt nghiệp DSĐH Danh mục hình

DANH MỤC HÌNH


Hình 1.1. Cơ chế hoạt động của cytokin .................................................................... 2
Hình 1.2. Con đường truyền tín hiệu của họ IL-1...................................................... 4
Hình 1.3. Cấu trúc một số cytokin họ IL-1 ................................................................ 5
Hình 1.4. Cấu trúc kháng thể ..................................................................................... 9
Hình 1.5. Cấu trúc kết tinh giữa IL-1β và canakinumab (5BVP, 2,20 Å) ................. 9
Hình 2.1. Các vị trí tác động trên IL-1β (a) và IL-1R1 (b) ...................................... 13
Hình 2.2. Các bước tiến hành nghiên cứu................................................................ 14
Hình 2.3. Bề mặt tương tác của IL-1β tại vòng β5-β6 với canakinumab ................ 16
Hình 2.4. Xếp chồng cấu trúc IL-1β tinh thể 5BVP (xanh dương) và 2I1B (đỏ) .... 16
Hình 2.6. Giao diện SwissADME ............................................................................ 22
Hình 2.7. Minh hoạ mô hình BOILED-Egg ............................................................ 23
Hình 2.10. Hộp mô phỏng động lực học .................................................................. 30
Hình 3.1. Tóm tắt kết quả nghiên cứu ..................................................................... 36
Hình 3.2. Mô hình Ph-1L1β-β5_β6 ......................................................................... 38
Hình 3.3. Mô hình BOILED-Egg trên IL-1β ........................................................... 42
Hình 3.4. Mô hình BOILED-Egg trên IL-1R1 ........................................................ 42
Hình 3.5. Vị trí docking β5-β6 ................................................................................. 43
Hình 3.6. Phân bố điểm số docking tại vị trí β5-β6 ................................................. 44
Hình 3.7. MHC09462 trên vòng β5-β6 (trái) và tương tác acid amin (phải) ........... 44
Hình 3.8. SA08-1111 trên vòng β5-β6 (trái) và tương tác acid amin (phải) ........... 45
Hình 3.9. T428-0731 trên vòng β5-β6 (trái) và tương tác acid amin (phải) ............ 45
Hình 3.10. P634-0250 trên vòng β5-β6 (trái) và tương tác acid amin (phải) .......... 46
Hình 3.11. S978-0388 trên vòng β5-β6 (trái) và tương tác acid amin (phải) .......... 46
Hình 3.12. Kết quả và lý giải phân tích PLIF trên β5-β6 ........................................ 47
Hình 3.13. Dấu vân tay tương tác acid amin với 618 cấu dạng trên vị trí β5-β6..... 48
Hình 3.14. RMSD của protein tự do và 5 phức hợp protein-phối tử ....................... 50
Hình 3.15. Bán kính xoay của protein tự do và 5 phức hợp protein-phối tử ........... 51
Hình 3.16. RMSF các acid amin của protein tự do và 5 phức hợp protein-phối tử . 52
Hình 3.17. Số liên kết hydro theo thời gian ............................................................. 53
Hình 3.18. Trung bình số liên kết hydro .................................................................. 54
Hình 3.19. Năng lượng gắn kết của T428-0731 theo thời gian ............................... 56

vii
Khoá luận tốt nghiệp DSĐH Lời cảm ơn

LỜI CẢM ƠN
Đầu tiên con xin phép được gởi lời cảm ơn đến ba và mẹ đã chăm lo cho con đến
ngày hôm nay, luôn tạo điều kiện hết mình để con có thể phát huy bản thân mình
cũng như làm những gì mình muốn.
Em xin cảm ơn thầy Thái Khắc Minh đã giúp đỡ và tạo điều kiện cho em được làm,
học tập và gặp gỡ mọi người trong lab 314 của mình. Em chưa từng nghĩ sẽ có ngày
được làm việc cùng mọi người như vậy. Cảm ơn thầy vì đã chỉ bảo, tạo điều kiện và
giúp đỡ em trong suốt thời gian làm khoá luận này. Ngoài ra, em cũng xin cảm ơn
thầy Mai Thành Tấn đã trực tiếp giúp đỡ và chỉ dạy em rất nhiều trong suốt thời gian
trên lab.
Em xin cảm ơn anh Bùi Quốc Dũng lớp Dược 2009 đã luôn ở lab để thảo luận và ăn
trưa với em. Cảm ơn anh Trần Thái Sơn cũng đã giúp đỡ em trong những lần anh tới
lab. Cảm ơn tất cả anh chị, bạn bè và các em khoá dưới trong lab tổng hợp đã cùng
ăn trưa với mình trong thời gian làm khoá luận. Ngoài ra mình xin cảm ơn các bạn
trong lab 314 đã giúp đỡ và đồng hành cũng mình trong suốt quãng thời gian này.
Xin cảm ơn các bạn Đỗ Trần Giang Sơn, Nguyễn Thị Thu Hạnh, Thái Ngọc Trâm,
Ngô Thanh Hằng, Phạm Xuân Tiên, Nguyễn Thị Ánh Tuyết và Nguyễn Hoàng Tiến
rất nhiều!
Cảm ơn các em Đắc Nhân, Mỹ Ngọc, Nhật Lễ lớp Dược 2016 và Thành Phương,
Thảo Nhung, Mỹ Ngọc lớp Dược 2017 đã giúp đỡ anh hoàn thành đề tài này.
Cảm ơn bạn Trần Ngọc Anh, người đã động viên và luôn ủng hộ mình trong thời gian
bận rộn này.
Cảm ơn tất cả mọi người đã trực tiếp và gián tiếp giúp đỡ để đề tài được hoàn thành!

viii
Khoá luận tốt nghiệp DSĐH Đặt vấn đề

ĐẶT VẤN ĐỀ
Interleukin-1β (IL-1β) là một thành viên trong họ IL-1. Khi liên kết với thụ thể chính
là thụ thể IL-1 tuýp 1 (IL-1R1) và đồng thụ thể IL-1RAcP tạo thành một phức hợp
ba thành phần, IL-1β mới có thể thực hiện hoạt động truyền tín hiệu. Vai trò chính
của IL-1β cũng như họ IL-1 trong sinh lý là điều hoà các phản viêm trong cơ thể [1].
Tuy vậy, trong một số bệnh lý tự viêm (autoinflammatory) như hội chứng sốt chu kỳ
di truyền liên quan cryopyrin (CAPS), sốt Địa Trung Hải có tính gia đình, hội chứng
liên quan thụ thể yếu tố hoại tử u chu kỳ,… thường ghi nhận sự biểu hiện quá mức
của IL-1β. Cytokin này cũng được ghi nhận với biểu hiện quá mức ở các bệnh thường
gặp như đái tháo đường tuýp 2, gout cấp và mạn, xơ vữa động mạch và ung thư phổi
[2]. Trong các cytokin họ IL-1, việc ức chế IL-1β được xem là đích tiềm năng trong
việc điều trị các bệnh lý đã nêu trên, đặc biệt là các bệnh tự viêm [3].
Hiện nay, chỉ có 3 thuốc được chấp thuận điều trị IL-1β là canakinumab, anakinra và
rilonacept. Các thuốc này đều là phân tử protein kích thước lớn và phải dùng đường
tiêm dưới da (SC), gây khó chịu cho người dùng cũng như chi phí cao [4].
Do đó, nhu cầu phát triển các thuốc phân tử nhỏ ức chế IL-1β và IL-1R1 là rất cần
thiết. Nghiên cứu của Lê Minh Trí và cộng sự [5] đã tiến hành sàng lọc các chất ức
chế IL-1β và IL-1R1. 8 mô hình pharmacophore (2 mô hình trên IL-1β và 6 trên IL-
1R1) đã được xây dựng và 7.616 chất của tập DrugBank (DB) [6] đã được tiến hành
docking. Kết quả nghiên cứu đã thu được 20 chất tốt nhất trên 4 vị trí, trong đó có 2
vị trí trên IL-1β và 2 vị trí trên IL-1R1.
Đề tài nghiên cứu này sẽ xây dựng thêm mô hình pharmacophore dựa trên tương tác
giữa canakinumab và IL-1β. Kết hợp với 8 mô hình của Lê Minh Trí [5], 7 cơ sở dữ
liệu là ZINC Purchasable [7], MayBridge HitCreator [8], MayBridge PPI [9],
ChemDiv Peptidomimetics [10], ChemDiv PPI [11], UNDP [12] và DrugBank [6] sẽ
được dùng để sàng lọc pharmacophore. Các chất sau đó sẽ được đánh giá dược động
lực học, docking, mô phỏng động lực học và tính năng lượng gắn kết tự do trên IL-
1β và IL-1R1 với hi vọng tìm ra các phân tử nhỏ có tác động trị liệu.
Nội dung nghiên cứu trong đề tài này bao gồm:
(1) Xây dựng 3D-pharmacophore dựa trên tương tác của canakinumab.
(2) Sàng lọc các mô hình pharmacophore trên 7 cơ sở dữ liệu.
(3) Đánh giá dược động lực học.
(4) Tiến hành docking và đánh giá kết quả docking.
(5) Mô phỏng động lực học.
(6) Tính toán năng lượng gắn kết tự do.

1
Cytokines
EN Benveniste, University of Alabama at Birmingham, Birmingham, AL, USA
Khoá
r luận tốt
2014 Elsevier nghiệp
Inc. All DSĐH
rights reserved. Tổng quan tài liệu nghiên cứu

Introduction allows STAT proteins to be recruited to the receptor and be-


come phosphorylated by the JAKs, leading to STAT
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU
The term cytokines (Greek cyto – cell and kinos – movement) is activation. Once activated, STATs dimerize, translocate to the
1.1. TỔNG QUAN VỀ CYTOKIN VÀ INTERLEUKIN
used to describe a broad range of structurally diverse mo-
lecular families and individual proteins best known for their
nucleus, and induce transcription of their target genes
(Figure 1(a)). There are four JAKs (JAK1–3 and TYK2) and
manyThuật ngữ
roles in “cytokin”
the immune system.(từCytokines
tiếng Hy makeLạp cyto – seven
up a large tế bào và (STAT1–4,
STATs kinos – 5A,sự 5B,
chuyển
and 6) động)
involved được
in this path-
group of proteins or glycoproteins that are secreted by cells of way. Another signaling pathway used by many cytokines (the
dùng để mô tả một họ các phân tử và protein riêng
the immune system, although it has now been appreciated
lẻ với cấu trúc đa dạng. Các cytokin
IL-1 and IL-17 families) is the nuclear factor-kappaB (NF-kB)
thatthường
many other được biếtaređến
cell types capablevới vai trò cytokines.
of producing trong hệ mễn pathway.dịch.
Here,Các cytokin
binding chiếm
of a cytokine to itstỷ lệ lớn
receptor activates
Cytokines function as signaling molecules with diverse and the IkB kinase (IKK), which then phosphorylates the inhibi-
cellprotein hoặc
type-specific glycoprotein
activities. They mediateđược tiết ra từ
their functions by những tế bàoIkB,của
tory protein hệtargeting
thus miễn this dịch. Tuyforvậy,
protein ubiquitin
hiện nay đã ghi nhận được nhiều tế bào khác có khả năng tiết cytokin [13].
binding to specific cell surface receptors, thereby activating (Ub)-mediated degradation. The liberated NF-kB dimer
intracellular signaling cascades that mediate gene induction translocates into the nucleus, undergoes phosphorylation, and
1.1.1.
within Cơ chế
the nucleus hoạt
(Figure 1).động của cytokin
Many cytokines use the Janus induces expression of its target genes (Figure 1(b)). The genes
Cytokin hoạt động dưới dạng phân tử truyền
kinase (JAK)/signal transducers and activators of transcription
(STAT) signaling pathway to mediate their responses. These
tin trong cơ thể. Các hoạt động này
induced by cytokines regulate cell activation, migration, pro-
liferation, differentiation, hematopoiesis, and apoptosis.
thường
include đa dạng
interleukin (IL)-2,và tuỳIL-6
-4, the thuộc
family,vào loạifamily,
the IL-12 tế bào mà cytokin
Cytokines táconđộng.
may act Cytokin
the cells thực
that secrete themhiện
(autocrine
and IL-13, which are described in the following sections. action) or on nearby cells (paracrine action). Cytokines are
hoạt động truyền tin này bằng cách bám vào các
On ligation of a receptor by its cytokine, receptor-associated
thụ thể bề mặt đặc hiệu. Sau đó, một
involved in virtually all aspects of both innate and adaptive
loạt
JAKs, whichcácaredẫn truyền
tyrosine kinasestín hiệu
(TKs), nội bàotyrosine
phosphorylate được kích hoạtresponses,
immune để điềuandhoà are hoạt độngimportant
particularly của gen in regu-
residues in the cytoplasmic domain of the receptor. This lating inflammation. Because of their effects on immune
trong nhân tế bào (Hình 1.1) [13].

IL-6 IL-1!
IL-1RAcP IL-1R1

JAK1 JAK2
$
IKK
" !
Thoái hoá
STAT3

Ub
STAT3

STAT3

Ub
Ub I#B
p50
I B p65
STAT3

IL-6
STAT3

IL-17
p50
p65 TNF-"

(a) (b)

Hình 1.1.
Figure 1 Janus kinase (JAK)/signal transducers and Cơ chế ofhoạt
activators động (STAT)
transcription của cytokin
and nuclear[13]
factor-kappaB (NF-kB) signaling pathways.
(a) IL-6 binds to its receptor, composed of two gp130 subunits (green) and the membrane-bound IL-6 receptor (mIL-6R) (blue), and activates
Nhiều cytokin sử dụng con đường truyền tin qua thụ thể Janus kinase (JAK)/Yếu tố
intracellular JAKs, predominantly JAK1 and JAK2, which phosphorylate STAT3. Once phosphorylated, STAT3 molecules dimerize, translocate to
the nucleus, and bind to STAT response elements in the promoters of target genes such as IL-17. (b) IL-1b binds to the IL-1R and activates IkB
chuyển đổi tín hiệu và yếu tố hoạt hoá phiên mã (signal transducers and activators of
kinase (IKK), which consists of three subunits: a, b, and g. IKK phosphorylates the inhibitory protein IkB and targets this protein for Ub-mediated
transcription - STAT). Các cytokin sử dụng con đường này bao gồm interleukin-2, -
degradation. The liberated NF-kB dimer (p65/p50) translocates into the nucleus, undergoes phosphorylation, and binds to kB elements in the
promoters of target genes to induce expression of genes such as IL-6 and TNF-a.
4, -6, -12 và -13. Khi gắn với cytokin, các thụ thể JAK (vốn là tyrosin kinase sẽ
phosphoryl hoá các acid amin tyrosin ở vùng nội bào của thụ thể. Nhờ đó, các protein
921
STAT sẽ được huy động và được
Encyclopedia of the Neurological Sciences, Volume 1
JAK phosphoryl hoá, dẫn đến kích hoạt các STAT
doi:10.1016/B978-0-12-385157-4.00175-5

2
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu

này. Khi được kích hoạt, STAT sẽ dimer hoá và chuyển dịch vào nhân tế bào, kích
hoạt phiên mã các gen đích (Hình 1.1a) [13].
Một con đường truyền tín hiệu khác mà cytokin sử dụng là yếu tố nhân kappa B
(Nuclear Factor-kappa B – NF-kB). Khi cytokin gắn kết với thụ thể sẽ hoạt hoá IkB
kinase (IKK). Tiếp tục, IKK sẽ phosphoryl hoá IkB (là một protein ức chế). IkB được
hoạt hoá sẽ kích hoạt con đường thoái hoá protein bằng ubiquitin (một protein đánh
dấu để nhận diện các protein cần thoái hoá). Khi được giải phóng khỏi IkB, dimer
NF-kB sẽ chuyển dịch vào nhân tế bào, được phosphoryl hoá và kích hoạt biểu hiện
gen (Hình 1.1b) [13].
1.1.2. Vai trò sinh lý của cytokin
Các gen được điều hoà bởi cytokin bao gồm gen điều hoà sự kích hoạt, di trú, tăng
sinh, biệt hoá, tạo hồng cầu và chết theo chu trình của tế bào. Các cytokin có thể tác
động lên chính tế bào đã sản sinh ra mình (tín hiệu “autocrine”) hoặc lên các tế bào
lân cận (tín hiệu “paracrine”) [13].
Cytokin tham gia gần như tất cả các hoạt động của miễn dịch thụ động và miễn dịch
chủ động. Cytokin còn có vai trò đặc biệt quan trọng trong điều hoà quá trình viêm.
Vì tác động của cytokin lên hệ miễn dịch và quá trình viêm nên cytokin được xem là
một đích tác động trị liệu tiềm năng [13].
1.1.3. Phân loại cytokin
Cytokin có thể được phân thành interleukin (IL), chemokin, yếu tố hoại tử khối u
(tumor necrosis factor – TNF), yếu tố kích thích tạo dòng (colony-stimulating factor
- CSF) và interferon dựa trên chức năng, tế bào tiết ra và đích tác động [13].
1.1.4. Interleukin
Thuật ngữ “interleukin” dùng để chỉ một nhóm các cytokin đa chức năng được tiết
bởi tế bào bạch cầu (leukocyte). Đầu tiên, vì IL được cho rằng chỉ tác động lên các tế
bào bạch cầu nên đã được đặt tên “interleukin” (ở giữa các bạch cầu) [13].
Chức năng của hệ miễn dịch phụ thuộc rất nhiều vào các IL, đặc biệt là trong quá
trình phát triển và biệt hoá tế bào T, tế bào B và tế bào gốc tạo máu (hematopoietic).
Hiện nay, đã tìm ra 36 loại IL khác nhau, được đánh số từ IL-1 đến IL-36. Tất cả các
IL đều có tác động đa hướng (pleiotropic - tác động trên nhiều hệ cơ quan). Nghiên
cứu sẽ tập trung vào họ IL-1 và cụ thể hơn là IL-1β [13].
1.1.5. Tổng quan về họ IL-1
Họ IL-1 bao gồm 11 protein có vai trò chính trong điều hoà hệ miễn dịch đặc hiệu,
không đặc hiệu và các bệnh viêm [1]. Trong đó IL-1⍺ và IL-1β là hai thành viên được
tìm thấy đầu tiên của họ [13].
Các thành viên trong họ IL-1 được chia ra làm bốn phân họ theo thụ thể gắn kết đặc
hiệu. Phân họ IL-1, IL-33, IL-36 đều có chung đồng thụ thể IL-1RAcP. Trong khi đó,
phân họ IL-18 sử dụng một đồng thụ thể đặc hiệu khác (IL-18RAcP) [14].

3
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu

1.1.5.1. Con đường truyền tín hiệu


Tất cả các thành viên trọng họ IL-1 đều là chất điều hoà viêm mạnh. Vì thế, hoạt động
của họ này được điều hoà qua nhiều cấp độ khác nhau bao gồm điều hoà phiên mã
gen, biểu hiện dạng tiền thân (proform), tiết ra từ tế bào và gắn kết thụ thể. Gần như
tất cả các cytokin đều được biểu hiện dưới dạng tiền thân, với vùng đầu tận N có
chiều dài dao động từ 100 acid amin (IL-33) đến chỉ một acid amin (IL-36Ra). Các
protease sẽ loại bỏ các acid amin đầu tận N này để tạo ra một IL trưởng thành, có khả
năng truyền tín hiệu. Các cytokin khi được tiết ra sẽ có thể gắn với thụ thể bề mặt và
thực hiện truyền tín hiệu. Cơ chế truyền tín hiệu ở giai đoạn đầu này gần như giống
nhau với tất cả cytokin trong họ IL-1 [1].
Các cytokin trong họ IL-1 thường dùng chung một thụ thể gắn kết chính (tuy có ái
lực khác nhau). Ví dụ, thụ thể interleukin-1 tuýp 1 (IL-1R1) gắn được với IL-1⍺, IL-
1β và IL-1Ra. Tương tự, thụ thể cho tác động ức chế là IL-1R2 cũng gắn được với ba
cytokin này. Khi cytokin gắn kết với thụ thể chính (ví dụ như IL-1β gắn IL-1R1), một
đồng thụ thể (như IL-1RacP) sẽ đến gắn kết với phức hợp cytokin-thụ thể chính, tạo
nên một phức hợp ba thành phần. Cả hai thụ thể chính và đồng thụ thể đều có một
vùng nội bào gọi là vùng thụ thể Toll/interleukin-1 (Toll/interleukin-1 receptor). Khi
phức hợp ba thành phần được hình thành (gồm cytokin, thụ thể chính và đồng thụ
thể), vùng TIR của thụ thể chính và đồng thụ thể sẽ gặp nhau, tạo thành con đường
truyền tín hiệu phụ thuộc Myd88 (Hình 1.2) [1].
Con đường truyền tính hiệu của họ IL-1 có thể được điều hoà bởi các cytokin đối vận
(biểu thị qua đường màu đỏ của Hình 1.2) như IL-1RA, IL-18BP, IL-38, IL36RA.
Các cytokin này gắn với thụ thể chính nhưng không cho đồng thụ thể tạo phức hợp
ba thành phần, làm gián đoạn đường truyền tín hiệu. Ngoài ra, các thụ thể mồi (decoy
receptor) như IL-1R2 cũng có thể cho tác động đối vận. Những thụ thể này không có
vùng TIR nội bào để truyền tín hiệu như thụ thể chính, làm các cytokin chủ vận không
truyền được tín hiệu khi gắn vào [1].

Hình 1.2. Con đường truyền tín hiệu của họ IL-1 [14]

4
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu

1.1.5.2. Cấu trúc


Hiện nay, cấu trúc tinh thể bằng phương pháp nhiễu xạ tia X với độ phân giải cao của
các IL-1 sau: IL-1⍺, IL-1β, IL-1Ra, IL-33 và IL-36ɣ; IL-18 và IL-37; IL-38 đã được
xác định [1].
Tất cả các IL-1 đều có chung cấu dạng β-trefoil (cấu trúc gấp nếp gồm 6 chuỗi kẹp
tóc β) và một lõi kỹ nước nằm ở trung tâm (Hình 1.3). Lõi này chứa 12 phiến β, với
6 phiến β (β1, β4, β5, β8, β9 và β12) tạo một cấu trúc thùng β song song ngược chiều
nhau. Việc đánh số các phiến β được tính từ đầu tận N của chuỗi acid amin. Tuy mô
Fields et al. Structural Biology of IL-1 Family
tuýp cấu trúc được bảo tồn giữa các cytokin trong họ, nhưng các cytokin này lại có
độ tương đồng về trình tự thấp [1].

Đầu N Đầu N

Đầu N
Đầu N
Hình 1.3. Cấu trúc một số cytokin họ IL-1 [1]
FIGURE 2 | Representation of cytokine structures. (A) The structure of IL-1β with its β-sheets and key loops labeled. (B) The structure of IL-33 with its β-sheets and
key loops labeled. (C) The structure of IL-36γ with its β-sheets and key loops labeled. (D) The structure of IL-18 with its β-sheets and key loops labeled.
A) IL-1β, B) IL-33, C) IL-36ɣ, D) IL-18

IL-36 agonist cytokines to induce IL-2 production, proliferate, and


The IL-36 receptor (IL-36R) is the most promiscuous primary be subsequently polarized for a Th1 response (36). In addition
receptor in the IL-1 family; it binds three agonist cytokines, IL- to T cells, IL-36 cytokines are involved in the regulation of
36α, IL-36β, and IL-36γ, as well as a single antagonist cytokine, dendritic cells (37). IL-36γ is the only agonist cytokine of the
or receptor antagonist, IL-36Ra. IL-36R, and the IL-36 cytokines5 IL-36 subfamily for which a high-resolution structure has been
were discovered separately through genome screening (31, 32). determined (Figure 2C) (38).
Both remained orphaned until their functional dependence was
shown (33). While IL-36α, IL-36β, IL-36γ, and IL-36Ra all lack an
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu

1.2. INTERLEUKIN-1BETA
1.2.1. Cấu trúc và cơ chế tác động IL-1β
Hình 1.3A cho thấy cấu trúc của IL-1β khá tương đồng với các cytokin khác trong
họ IL-1 (đã được trình bày ở mục 1.1.5.2). IL-1β được biểu hiện ở dạng tiền thân và
phải được cắt bởi caspase-1 để có thể trở thành dạng hoạt động. Các acid amin ở dạng
hoạt động của IL-1β nằm từ 117-269. IL-1β được sản xuất bởi các tế bào như bạch
cầu đơn nhân, đại thực bào và tế bào đuôi gai (dendritic) khi có tín hiệu từ mô hình
phân tử liên quan đến mầm bệnh (Pathogen-associated molecular pattern – PAMP)
hoặc từ cytokin. IL-1β cũng được sản xuất khi có sự hiện diện của chính IL-1β trong
trường hợp các phản ứng tự viêm (auto-inflammatory) [1].
Cơ chế truyền tín hiệu của IL-1β giống với các cytokin trong họ. Trong đó, IL-1β gắn
kết với thụ thể chính là IL-1R1 và đồng thụ thể IL-1RacP. Phức hợp ba thành phần
gồm IL-1β/IL-1R1/IL-1RaCP được hình thành. Tiếp theo, con đường truyền tín hiệu
phụ thuộc MyD88 (Hình 1.2) sẽ được hoạt hoá thông qua vùng TIR nội bào [1].
1.2.2. Các bệnh lý liên quan đến IL-1β
Trong các cytokin, họ IL-1 (và các thụ thể tương ứng) có liên quan chính đến các
bệnh lý viêm cấp và mạn. Đồng thời, trong 11 thành viên của họ IL-1 thì IL-1β là
mục tiêu điều trị tiềm năng cho các tình trạng viêm cục bộ và hệ thống [14].
Trong các bệnh tự viêm (autoinflammatory), yếu tố quan sát thường thấy nhất là sự
tăng giải phóng của IL-1β dạng hoạt động. Cơ chế của các bệnh này thường do đột
biến liên quan đến hoạt động của capase-1, dẫn đến tăng chuyển IL-1β từ dạng tiền
thân thành dạng hoạt động. Trong các bệnh tự viêm, việc ức chế tác động của IL-1β
làm giảm độ trầm trọng của bệnh nhanh chóng và lâu dài [14]. Ngoài ra, những bệnh
thường gặp như gout, đái tháo đường type 2, suy tim, viêm ngoại tâm mạc tái phát,
viêm khớp dạng thấp và đa u tuỷ tiềm tàng cũng đều cho đáp ứng khi ức chế tín hiệu
IL-1β [14]. Bảng 1.1 liệt kê một số bệnh liên quan đến hoạt động quá mức của IL-
1β. Các bệnh được chia làm bốn nhóm chính là bệnh tự viêm, hội chứng chuyển hoá,
viêm cấp, viêm mạn và ung thư ác tính.
Bảng 1.1. Một số nhóm bệnh liên quan đến IL-1β [14]
- Hội chứng sốt chu kỳ di truyền liên quan Cryopyrin
(CAPS)
- Sốt Địa trung hải có tính gia đình (FMF)
Bệnh tự viêm - Hội chứng tăng immunoglobulin D (HIDS)
- Rối loạn tự viêm liên quan NLRP12
- Hội chứng liên quan thụ thể yếu tố hoại tử u chu kỳ
- Viêm khớp dạng thấp
Hội chứng chuyển hoá - Đái tháo đường tuýp 2

6
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu

- Bệnh Alzheimer
- Béo phì thể trung tâm
- Gout cấp
Viêm cấp
- Hội chứng Muclke-Wells
- Gout mạn
Viêm mạn và ung thư - Tăng xâm lấn khối u trong ung thư vú
ác tính - Xơ vữa động mạch [15]
- Ung thư phổi [15]
1.3. CÁC THUỐC ỨC CHẾ HOẠT ĐỘNG IL-1BETA
Tới thời điểm hiện tại, chỉ có ba thuốc trên thị trường được phê duyệt bởi Cục quản
lý Thực phẩm và Dược phẩm Hoa Kỳ có tác dụng ức chế hoạt động của IL-1. Ba
thuốc này là canakinumab, rilonacept và anakinra (Bảng 1.2).
Bảng 1.2. Các thuốc ức chế IL-1β đã được chấp thuận [4]
Tên thuốc Cấu trúc và cơ chế tác động Chỉ định

• CAPS
• Sốt Địa Trung Hải có
tính gia đình
Kháng thể đơn dòng, vô hiệu hoá IL-
• Hội chứng liên quan
1β bằng cách gắn kết và cản trở việc
thụ thể yếu tố hoại tử u
Canakinumab gắn với thụ thể IL-1R. Gắn đặc hiệu
chu kỳ
trên IL-1β, không gắn với IL-1⍺ hay
• Hội chứng tăng
IL-RA.
immunoglobulin D
• Bệnh Still
• Gout

Protein tổng hợp từ IL-1R1, IL-


1RAcP và IgG1, cản trở không gian
Rilonacept • CAPS
do gắn kết với IL-1β. Rinolacept có
thể gắn cả IL-1⍺

• CAPS
IL-1RA người tái tổ hợp (153 acid
• Bệnh Still
Anakinra amin), gắn vào IL-1R1 và có tác
• Viêm khớp dạng thấp
dụng đối kháng thụ thể IL-1R1.
• Đợt gout cấp

7
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu

• Rối loạn viêm da hệ


thống khởi phát từ sơ
sinh
Một số phản ứng có hại của ba thuốc này bao gồm các phản ứng tại vị trí tiêm, nhiễm
trùng và viêm gan. Trong đó, phản ứng tại vị trí tiêm xảy ra ở hầu hết các bệnh nhân
dùng anakinra, 50% bệnh nhân dùng rilonacept và 10% dùng canakinumab. Nhiễm
trùng chỉ xảy ra với tần số rất thấp (1,8% ở anakinra, 0,31% ở canakinumab và chưa
xác định được ở rilonacept). Đối với viêm gan, ghi nhận tăng transaminase ở 4% bệnh
nhân dùng canakinumab và tăng nhẹ lipid máu thường gặp ở rilonacept [4].
1.4. CÁC VỊ TRÍ TƯƠNG TÁC TRÊN IL-1Β VÀ IL-1R1
1.4.1. IL-1β tương tác với IL-1R1
Dựa trên nghiên cứu trước của Lê Minh Trí và cộng sự [5], các acid amin tương tác
tiềm năng trên IL-1β và IL-1R1 sẽ được tóm tắt trong Bảng 1.3.
Bảng 1.3. Acid amin quan trọng trên IL-1β và IL-1R1 [5]
Vị trí A Vị trí B
IL-1β Arg11, Gln15, His30, Arg4, Leu6, Phe46, Ile56,
Gln32 Lys93, Lys103, Glu105
Rãnh D1-D2 D2
Glu11, Ile14, Val16,
IL-1R1
Ala109, Ile110, Tyr127, Lys114, Gly122, Arg163
Glu129
1.4.2. IL-1β tương tác với canakinumab
1.4.2.1. Cấu trúc kháng thể
Kháng thể là một phân tử glycoprotein với hình dạng chữ Y (Hình 1.4), được cấu
thành bởi 4 chuỗi polypeptid, trong đó có hai chuỗi nặng (H) và hai chuỗi nhẹ (L).
Những chuỗi này nối với nhau bởi các cầu nối disulfid [16].
Kháng thể được chia làm hai vùng (domain) là vùng hằng định (C) và vùng biến thiên
(V). Vùng hằng định, tức phần “chân” chữ Y không có vai trò nhận diện kháng
nguyên. Vùng biến thiên, nằm ở tận cùng “cánh tay” chữ Y, có vai trò nhận diện
kháng nguyên. Vị trí nhận diện kháng nguyên ở “cánh tay” chữ Y này được gọi là
một paratop, gồm một chuỗi nặng biến thiên (VH) và một chuỗi nhẹ biến thiên (VL).
Một kháng thể sẽ có hai paratop giống y hệt nhau. Vùng tương ứng trên kháng nguyên,
nơi được paratop gắn vào được gọi là epitop - vùng quyết định kháng nguyên (Hình
1.4). Khi so sánh các acid ở vùng biến thiên của các kháng thể với nhau sẽ thấy hầu
hết sự biến đổi này xảy ra ở ba vùng gọi là vùng siêu biến (HVR) hoặc vùng quyết
định bổ khuyết (CDR) [16].

8
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu
Structural and Functional Units of Ig

(vùng siêu biến) ! Phân tử


"Y"-sha

! Vùng Fa
Fab reg
đặc hiệu
antigen
Gắn kết
(gồm vù
(Fv regi
kháng
nguyên
Hoạt hoá
! Vùng F
Fc regio
tế bào hiệu động
effects.
lực
(Effector)
! Hinge
Vùng br

Hình 1.4. Cấu trúc kháng thể [17, 18]


1.4.2.2. Phức hợp IL-1β/Canakinumab
Make Research Easy
Nghiên cứu thực hiện xây dựng mô hình pharmacophore dựa trên tương tác protein-
protein (protein-protein interaction, PPI) giữa kháng thể đơn dòng canakinumab và
IL-1β. Cấu trúc tinh thể (Hình 1.5) được sử dụng là phức hợp kết tinh giữa
canakinumab và IL-1β tải về từ ngân hàng dữ liệu protein (Protein Data Bank – PDB
[19]), mã 5BVP [20].

Hình 1.5. Cấu trúc kết tinh giữa IL-1β và canakinumab (5BVP, 2,20 Å) [20]
Bề mặt tương tác protein-protein giữa 2 phân tử khá phẳng, ưa nước và có diện tích
lớn (1972 Å). Ở paratop của canakinumab, tất cả sáu CDR của canakinumab đều
tham gia gắn với kháng nguyên (H-CDR 1-3 và L-CDR 1-3). Epitop của IL-1β gồm
5 thành phần cấu trúc, tạo thành một bề mặt gần như phẳng và thân nước: vùng kẹp
tóc β2- β3 (acid amin 19 đến 27), vùng chuỗi ⍺ của vòng β3 đến β4 (acid amin 32
đến 39), vòng β5 đến β6 (acid amin 63 đến 66), vòng β7 đến β8 (acid amin 86 đến
88) và vòng β10 đến β11 (Asn 129). Các liên kết tạo với canakinumab bao gồm liên

9
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu

kết hydro (Asp35, Gln34, Glu37, Gln38, Lys65, Asn129) hoặc tương tác cầu muối
(Lys27, Glu64) [20].
1.5. THIẾT KẾ THUỐC HỢP LÝ
1.5.1. Mô hình pharmacophore
Một mô hình pharmacophore miêu tả sự sắp xếp các đặc tính phân tử mà một phối tử
phải có để có thể gắn một cách hiệu quả vào thụ thể. Các mô hình pharmacophore
được phát triển nhằm hiểu biết tốt hơn về tương tác giữa ligand-protein ở mức độ
phân tử. Pharmacophore đã được chứng minh là cực kỳ hiệu quả trong sàng lọc in
silico để tìm các phân tử có hoạt tính sinh học trên nhiều mục tiêu. Việc sử dụng
pharmacophore làm giảm số lượng hợp chất và chi phí phải trả trong quá trình sàng
lọc [21].
Mô hình harmacophore dựa trên phối tử (LBP) là các mô hình được xây từ một hoặc
nhiều phối tử có hoạt tính. Phương pháp này đã được sử dụng rộng rãi trong khám
phá và thiết kế các phân tử có hoạt tính sinh học [21].
Mặt khác, mô hình pharmacophore dựa trên cấu trúc protein (SBP) lại được xây dựng
từ cấu trúc 3D của một hoặc nhiều protein mục tiêu. Phương pháp này đang ngày
càng được quan tâm trong những năm gần đây. Một trong những lý do cho sự quan
tâm này là vì số lượng cấu trúc protein độ phân giải cao đang tăng rất nhanh. Hiện
nay, trên PDB đã có hơn 167.000 cấu trúc (tính đến 04/08/2020) [19]. SBP có thể là
công cụ để tìm hiểu tương tác phối tử-protein và cho phép nghiên cứu sàng lọc thư
viện hoá học (chemogenomic) với quy mô lớn. Từ những nghiên cứu như vậy, có thể
xác định các phối tử mới cho một protein hoặc tìm các đích mới cho phối tử [21].
Một số lợi điểm của SBP so với LBP bao gồm: 1) SBP cho phép tìm ra các khung
hoá học mới vì phương pháp này không dựa trên các kiểu hình hoá học có sẵn của
phối tử; 2) SBP có thể dùng để làm rõ cơ chế gắn kết của phối tử ngay trong khung
cấu trúc protein; 3) SBP giúp hiểu rõ hơn về khoang gắn kết phối tử [21].
Tuy vậy, khó khăn của SBP nằm ở việc chọn các thuộc tính bắt buộc trong một mô
hình. Tiêu chí chọn các thuộc tính này thường không rõ ràng, ngay cả khi có dữ liệu
thực nghiệm như đột biến tại khoang gắn kết. Số lượng cấu dạng và không gian xây
dựng lớn làm việc chọn các thuộc tính trong SBP khó hơn LBP. Thách thức của SBP
còn nằm ở khả năng giảm bớt các điểm thuộc tính pharmacophore để chỉ còn những
điểm có liên quan đến hoạt tính sinh học [21].
1.5.2. Đánh giá ADME
Một trong số các rủi ro của quá trình thiết kế và phát triển thuốc là việc không thoả
mãn các thông số dược động lực học (hấp thu, phân bố, chuyển hoá, thải trừ - ADME)
cho đến độc tính (toxicology). Toàn bộ quá trình này có thể gọi tắt là ADMET. Đây
là một trong những lý do chính của việc tuy các thuốc được khám phá ra trong những
năm gần đây tăng, nhưng số lượng thuốc được chấp thuận sử dụng lại không tăng

10
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu

nhiều. Ngoài ra, việc đánh giá ADMET bằng phương pháp in vitro hoặc in vivo
thường tốn thời gian, chi phí và khó có thể bao gồm được hết các chỉ tiêu. Vì vậy,
phương pháp đánh giá ADMET in silico tiết kiệm thời gian và công sức và chi phí là
một giải pháp đầy tiềm năng [22].
Đánh giá ADME in silico nhắm đến việc xây dựng các mô hình dựa trên dữ liệu thực
nghiệm để tính toán các tính chất của phân tử dựa trên mối liên quan định lượng giữa
cấu trúc và tính chất (QSPR). QSPR liên kết thông tin giữa cấu trúc và tính chất vật
lý, hoá học hoặc thậm chí sinh học (liên quan định lượng giữa cấu trúc và tác dụng –
QSAR) [23].
Nhược điểm của đánh giá ADME bằng phương pháp in silico là độ tin cậy của phương
pháp. Một phương pháp chỉ có thẻ tốt nếu dữ liệu và ý tưởng xây dựng phương pháp
tốt. Điều này yêu cầu đánh giá bằng dữ liệu thực nghiệm liên tục nhằm cải thiện
phương pháp. Ngoài ra, chất lượng của dữ liệu thực nghiệm đầu vào cũng rất quan
trọng vì các yếu tố sai sót, gây nhiễu trong quá trình thực nghiệm cũng có thể làm
ảnh hưởng đến độ tin cậy của phương pháp [23].
1.5.3. Mô hình mô tả phân tử docking
Mô hình mô tả phân tử Docking được là một phương pháp có vai trò lớn trong thiết
kế thuốc với sự trợ giúp của máy tính (CADD – Computer-Aided Drug Design).
Phương pháp này được dùng để đánh giá và dự đoán khả năng gắn kết của phân tử
nhỏ vào cấu trúc mục tiêu. Hiện nay, phương pháp docking bắt đầu được sử dụng phổ
biến vì tính đơn giản, dễ sử dụng và ít tốn thời gian trong các phương pháp sàng lọc
ảo. Ứng dụng của docking bao gồm nghiên cứu sự liên quan giữa cấu trúc-tác dụng,
tối ưu hoá chất khởi nguồn (lead optimization), tìm các chất khởi nguồn tiềm năng,
nghiên cứu các đột biến dựa trên việc đưa ra tiên đoán về giả thuyết gắn kết, hỗ trợ
đưa các chất nền hoặc chất ức chế vào bản đồ mật độ electron (electron density) trong
các cấu trúc nhiễu xạ tia X,… [24]
1.5.4. Mô phỏng động lực học
1.5.4.1. Tổng quan về mô phỏng động lực học
Mô phỏng động lực học phân tử (Molecular Dynamic Simulation – MD) là việc sử
dụng các kỹ thuật và thuật toán máy tính để khảo sát độ bền, độ chuyển động của các
thành phần đưa vào hệ, dưới một điều kiện nhiệt độ, áp suất và dung môi nhất định.
Các thành phần này có thể là nguyên tử (atom), phân tử (molecule) hoặc hạt
(particle),…[25]. Trong quá trình MD, các thành phần trong hệ sẽ được áp định luật
Newton và được dự đoán vị trí trong không gian trong tất cả thời gian thực hiện mô
phỏng. Kết quả của MD sẽ là một đoạn phim 3D mô tả quá trình chuyển động của
các thành phần trong hệ theo thời gian [26].
Điểm khác biệt lớn giữa MD và docking là sự có mặt của yếu tố thời gian. MD có thể
mô tả được sự thay đổi linh động của protein-phối tử theo thời gian. Trong khi đó,

11
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu

các phương pháp docking hiện nay thường chỉ mô tả được sự linh động của phối tử
và giữ phân tử protein cố định. Tuy MD là một bước quan trọng và cần thiết nhưng
lại có nhược điểm là giới hạn về thời gian mô phỏng (thường không quá 1 ms) và tài
nguyên máy tính. Do đó, MD chưa trở thành một buóc bắt buộc trong các bước thực
hiện CADD [26].
1.5.4.2. Phần mềm GROMACS
GROMACS (Groningen Machine for Chemical Simulation) là một phần mềm mô
phỏng động lực học linh hoạt, hiệu quả và miễn phí. GROMACS được thiết kế lần
đầu từ năm 1991 tại đại học Groningen, Hà Lan. Từ năm 2001 đến nay, phần mềm
được phát triển bởi nhóm nghiên cứu tại Viện công nghệ hoàng gia và đại học Uppsala,
Thuỵ Điển [27].
Phần mềm có thể thực hiện MD trên protein, phức hợp protein-phối tử, tính toán năng
lượng solvat hoá, mô phỏng hệ màng kép, gieo mẫu thiên vị (umbrella sampling),…
cùng với nhiều chức năng khác. GROMACS vận hành trên hệ điều hành Linux và có
thể sử dụng toàn bộ tài nguyên của máy (CPU và GPU) để thực hiện mô phỏng động
lực học [27].
1.5.5. Tính toán năng lượng tự do
Phương pháp tính toán năng lượng diện tích bề mặt cơ học phân tử Poisson-Boltmann
(Molecular Mechanisc Poisson-Boltzmann Surface Area – MM-PBSA) ước tính năng
lượng tự do của phân tử được ước tính bằng tổng năng lượng ở thể khí, năng lượng
solvat hoá và entropy của chất tan theo công thức (1) sau [28]:
𝐺! = 𝐸"" + 𝐺#$%&'( − 𝑇∆𝑆 (1)
Trong đó, năng lượng ở thể khí được ước tính bằng năng lượng cơ học phân tử của
phân tử (𝐸"" ). 𝐸"" được xác định bởi năng lượng liên kết, góc liên kết và năng
lượng biến dạng. Năng lượng solvat hoá (𝐺#$%&'( ) được tính từ hai năng lượng thành
phần là năng lượng solvat hoá phân cực và không phân cực. Cuối cùng, entropy (𝑇∆𝑆)
được ước tính bằng phân tích quasi-harmonic [28].
Ưu điểm của phương pháp này nằm ở việc sử dụng dữ liệu quỹ đạo (trajectory), là
kết quả của quá trình động lực học mà không cần phải thực hiện lại một mô phỏng
mới. Ngoài ra, MM-PBSA còn có khả năng tính toán ở nhiều phân tử sinh học khác
nhau, giúp việc áp dụng phương pháp này vào bước phân tích kết quả động lực học
trở nên dễ dàng [28].
Tuy vậy, điểm không chắc chắn nhất của phương pháp nằm ở bước ước tính entropy
của chất tan. Sai số ở bước này thường lớn, có thể lên đến ~ 5 kcal/mol cho cùng một
cấu trúc đã được tối thiểu và dùng chung một quỹ đạo động lực học [28].

12
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

CHƯƠNG 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN


CỨU
Nghiên cứu được thực hiện trên 5 vị trí tương tác của IL-1β và IL-1R1. Trong đó, 3
vị trí nằm trên Interleukin-1β là A, B và vòng β5-β6 (Hình 2.1a). 2 vị trí trên IL-1R1
là D2 (domain 2) và rãnh giữa D1-D2 (Hình 2.1b).
b)
a)

Hình 2.1. Các vị trí tác động trên IL-1β (a) và IL-1R1 (b)
Nghiên cứu sử dụng tương tác protein-protein giữa canakinumab và IL-1β để xây
dựng mô hình pharmacophore bằng phần mềm Molecular Operating Environment
(MOE) 2015.10 [29]. Sau đó, các tập cơ sở dữ liệu ZINC [7], MayBridge HitCreator
[8], MayBridge PPI [9], ChemDiv Peptidomimetics [10], ChemDiv PPI [11] và
UNDP [12] sẽ được tạo cấu dạng trên MOE 2015.10 và sàng lọc qua mô hình
pharmacophore đã xây cùng với 8 mô hình trong nghiên cứu trước của Lê Minh Trí
[5]. Kết quả sàng lọc pharmacophore sẽ được đánh giá ADME thông qua
SwissADME [30]. Tiếp đến, thực hiện docking các chất đã thoả thông số ADME trên
LeadIT 2.1.8 của BioSolveIT [31]. Các cấu dạng tốt nhất của docking sẽ được chọn
để thực hiện mô phỏng động lực học bằng Gromacs 2020.2 [32], trong trường lực
CHARMM27 [33, 34]. Sau đó, các chất này sẽ được tính toán năng lượng gắn kết tự
do (free binding energy) bằng công cụ g_mmpbsa 5.1.2 [35]. Hình 2.2 thể hiện khái
quát các phương pháp cũng như công cụ in silico mà nghiên cứu sẽ sử dụng.

13
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Chuẩn bị CSDL •MOE 2015.10

•MOE 2015.10
Pharmacophore
•ZINCPhamer

ADME •SwissADME

•LeadIT 2.1.8
Docking
•Sybyl-X 2.0
Đánh giá kết quả •MOE 2015.10
docking •LeadIT 2.1.8
Mô phỏng •Gromacs 2020.2
động lực học •Avogadro, SwissParam, VMD
•Gromacs 2018.1
ΔG
•G_mmpbsa 5.1.2

Hình 2.2. Các bước tiến hành nghiên cứu


2.1. XÂY DỰNG CÁC CƠ SỞ DỮ LIỆU SÀNG LỌC ẢO
Các tập CSDL được sử dụng cùng với số lượng hợp chất tương ứng tại thời điểm
nghiên cứu bao gồm:
1) ZINC Purchasable (ZINC), 21.777.093 chất [7]
2) Universal Product Database (UNDP), 229.358 chất [12]
3) MayBridge HitCreator (MBHC), 13.809 chất [8]
4) MayBridge Proten-Protein Interaction (MBPPI), 8.349 chất [9]
5) Chemdiv Peptidomimetics (CDPM), 12.455 chất [10]
6) Chemdiv PPI (CDPPI), 222.447 chất [11]
7) DrugBank (DB), 8.820 chất [6]
Tổng số hợp chất sử dụng trong nghiên cứu là 22.272.331. Tất cả 7 CSDL ở trên đều
được đưa qua phần mềm MOE 2015.10 [29] để chuẩn bị. Mục đích của bước chuẩn
bị này là xoá trùng lặp, chọn các hợp chất thoả luật 5-Lipinski và tạo cấu dạng để
thực hiện sàng lọc trên các mô hình pharmacophore. Tuy vậy, do bản chất tập ZINC
Purchasable được lưu trữ trực tuyến và phải sử dụng công cụ ZINCPharmer [36] do
nhà cung cấp xây dựng để thực hiện sàng lọc, nên các bước chuẩn bị chỉ áp dụng
được cho tập ZINC sau khi đã sàng lọc pharmacophore.
2.1.1. Xoá trùng lặp và sàng lọc qua định luật 5-Lipinski
Bước xoá trùng lặp và sàng lọc qua định luật 5-Lipinski được thực hiện trên MOE
2015.10 [29] như sau:

14
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

- Mở tập CSDL tải về dưới dạng tệp *.sdf, sau đó chuyển thành dạng *.mdb để
phần mềm có thể đọc được
- Xoá trùng lặp: Chọn cột mol à Select Entries à Unique; Sau đó đảo lại để chọn
các chất trùng nhau bằng Edit à Invert à Entry Selection; Xoá các chất trùng
bằng Edit à Delete à Selected Entries.
- Chọn các hợp chất thoả luật 5-Lipinski [37]: Chọn cột mol à Select Entries à
Druglike; Tiếp tục đảo lại để chọn các chất không thoả định luật Edit à Invert à
Entry Selection; Xoá các chất không thoả 5-Lipinski bằng Edit à Delete à
Selected Entries.
2.1.2. Tạo cấu dạng và tối thiểu hoá năng lượng để sàng lọc pharmacophore
Để có thể thực hiện sàng lọc qua mô hình pharmacophore, các hợp chất trong thư
viên phải được tạo cấu dạng và tối thiểu hoá năng lượng. Nghiên cứu sử dụng công
cụ Conformation Import (Compute à Conformations à Import) của MOE 2015.10
[29], các thông số thiết lập bao gồm:
- Số cấu dạng tối đa cho mỗi hợp chất (Conformations): 250
- Bộ lọc đầu vào (Descriptor Filter): Clear
- Số cấu dạng phân mảnh (fragment) tối đa (MM Settings à Refinement
Conformation Limit): 10.000
- Số bước tìm kiếm cấu dạng tối đa (MM Settings à Stochastic Search Iteration
Limit): 1.000
- Số bước tối thiểu hoá năng lượng (MM Settings à Energy Minimization Iteration
Limit): 1.000
- Gradient giảm năng lượng (MM Settings à Energy Minimization Gradient Test):
0,0001
2.2. XÂY DỰNG MÔ HÌNH 3D-PHARMACOPHORE
2.2.1. Xây dựng pharmacophore
Mô hình pharmacophore được xây dựng dựa trên tương tác protein-protein tại vòng
β5-β6 của interleukin-1β với canakinumab, với trọng tâm là các tương với acid amin
Glu 64 (Hình 2.3). Theo phân tích cấu trúc tia X mã 5BVP, các acid amin vùng epitop
của IL-1β cho nhiều tương tác liên phân tử nhất là Glu64, Gln38, Lys65, Asp35 và
Ser2. Trong đó, điều đáng chú ý là nhánh bên của Glu64 (trong vòng β5-β6) tương
tác với 4 vùng quyết định bổ khuyết (CDR) của canakinumab: L-CDR1, L-CDR2, L-
CDR3 và H-CDR3. So với các acid amin khác (vốn chỉ cho tương tác tối đa với 2
CDR), Glu64 là acid amin có nhiều tương tác với canakinumab nhất [20].

15
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Hình 2.3. Bề mặt tương tác của IL-1β tại vòng β5-β6 với canakinumab
(Canakinumab: Chuỗi xanh lục, C⍺ hồng; IL-1β: Chuỗi xám, C⍺ xanh pastel)
Cụ thể, nhóm carboxyl của acid amin Glu64 chồng lên vòng thơm của TyrL50, đồng
thời tạo tương tác cầu muối nằm ẩn sâu phía trong với ArgH101 của H-CDR3. Tương
tác với ArgH101 có sự tham gia của cả hai nguyên tử Nη2 và Nε (ArgH101 Nη2 –
Glu64: Oε1: 2,9 Å; Arg H101 Nε-Glu 64 Oε2: 2,8 Å). Ngoài ra, nhóm carboxyl của
Glu 64 cũng tạo liên kết hydro nhờ vào xúc tác của nước với O của ArgH101, Oη của
TyrL50 và Oε1 của GlnL53 [20].
Khi so sánh với cấu trúc IL-1β tự do (mã PDB: 2I1B) bằng cách xếp chồng (overlay),
vị trí cho thấy sự thay đổi cấu dạng lớn nhất là vòng β5-β6, nơi chứa các acid amin
Glu64, Lys65, Asn66 (Hình 2.4). Khi gắn với canakinumab, liên kết peptid giữa
Lys63 và Glu64 bị lật ngược và vị trí C⍺ của Glu64 di chuyển 3 Å. Hai acid amin
epitop Lys65 và Asn66 cũng di chuyển một đoạn 1,5-2,0 Å. Tuy vậy, định hướng liên
kết peptid giữa Leu62 và Lys63 không bị ảnh hưởng [20].

Hình 2.4. Xếp chồng cấu trúc IL-1β tinh thể 5BVP (xanh dương) và 2I1B (đỏ)

16
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Phân tích đột biến còn cho thấy vai trò quan trọng của Glu64 trong độ đặc hiệu gắn
kết của canakinumab. Trong đó, việc thay thế Glu64 bằng các acid amin khác sẽ gây
mất khả năng gắn kết của thuốc này trên IL-1β của người [20].
Vì những lý do này, nghiên cứu chọn xây dựng mô hình pharmacophore dựa trên
tương tác các acid amin của canakinumab trên vòng β5-β6 của IL-1β. Các tương tác
của 3 acid amin Glu64, Lys65 và Asn66 trên IL-1β được cụ thể hoá trong Bảng 1.1.
Bảng 2.1. Tương tác giữa canakinumab và vòng β5-β6 của IL-1β [20]
Epitop IL-1β Paratop canakinumab
Cấu trúc Acid amin tương Acid amin tương Cấu trúc
tác trực tiếp với tác trực tiếp với
canakinumab IL-1β
H-CDR3, L-
ArgH101, SerL32,
Glu64 CDR1, L-CDR2,
TyrL50, SerL91
L-CDR3
ThrH102, SerL91, H-CDR3, L-
Vòng β5-β6 Lys65
SerL92, PheL96 CDR3
Tyr H53, Asp
H-CDR2, L-
Asn66 H54, Ser L92, Ser
CDR3
L93
2.2.2. Công cụ xây dựng pharmacophore
Xây dựng mô hình pharmacophore cho các hợp chất gắn kết trên vòng β5-β6 cần sử
dụng 2 công cụ trong MOE 2015.10 [29] là tương tác protein (Protein Contacts) và
xây dựng pharmacophore (Pharmacophore Editor).
2.2.2.1. Công cụ tương tác protein (Protein Contacts)
Sau khi mở cấu trúc kết tinh mã 5BVP, truy cập công cụ qua Protein à Contacts….
Các thông số để phân tích trong Protein Contacts được thiết lập như sau:
- Các tương tác được chọn: van der Waals (distance), cộng hoá trị (covalent), vòng
thơm (arene), ion (ionic), kim loại (metal), hydro (hbond)
- Bộ lọc (Filter), giúp chọn ra đúng 3 acid amin trong vòng β5-β6:
“Glu64,Lys65,Asn66”
- Các thông số còn lại để mặc định
Sau đó, tiến hành tìm kiếm (Search) để tìm các tương tác có thể có. Kết quả 3 chiều
các tương tác thu được sẽ được hiển thị ở màn hình chính của MOE. Tất cả các tương
tác sẽ được chọn và cô lập (Isolate) để bắt đầu xây dựng mô hình pharmacophore dựa
trên tương tác giữa các acid amin trong Bảng 2.1, năng lượng tương tác (Interaction
energy) và tần số xuất hiện (Frequency) trong cửa sổ danh sách tương tác (Contact
List).

17
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

2.2.2.2. Công cụ Xây dựng pharmacophore (Pharmacophore Editor)


Công cụ Pharmacophore Editor được truy cập từ đường dẫn Compute à
Pharmacophore à Query Editor. Các thông số bao gồm:
- Title: Tên của mô hình
- Tạo các điểm của mô hình: Feature à Chọn đặc tính của điểm à Apply
- R: Bán kính trung bình của điểm pharmacophore, tính theo Å
- Essential: Tuỳ chọn điểm pharmacophore đó bắt buộc hay không
- Ignore: Bỏ qua điểm pharmacophore khi sàng lọc
- Parital Match (Ràng buộc một phần): Bắt buộc số điểm ít nhất phải thoả khi thực
hiện sàng lọc các hợp chất
- Volume (Ràng buộc thể tích): Có thể thiết lập các nguyên tử nằm hoàn toàn trong
điểm (Ligand Shape), không nằm trong điểm (Excluded) hoặc có ít nhất một
nguyên tử trong điểm (Occupied)
- Constraint: Ràng buộc giữa các điểm với nhau (ít nhất 2 điểm), từ đó có thể đưa
ra các điều kiện khi sàng lọc như thoả ít nhất 1 điểm (At least one) trong các điểm
đã ràng buộc.
2.2.3. Hiệu chỉnh mô hình pharmacophore trên ZINCPharmer
2.2.3.1. Công cụ ZINCPhamer
ZINCPharmer (http://zincpharmer.csb.pitt.edu) có giao diện trực tuyến cho phép tìm
kiếm các hợp chất trong CSDL ZINC bằng công cụ tìm kiếm pharmacophore là
Pharmer. ZINCPhamer cung cấp các công cụ giúp xây dựng và tinh chỉnh
pharmacophore trực tiếp từ cấu trúc phân tử. Một lần tìm kiếm 176 triệu cấu dạng
của 18,3 triệu hợp chất thường chỉ mất ít hơn một phút. Kết quả sau đó có thể được
xem ngay hoặc tải về để phân tích ngoại tuyến [36].
Mục tiêu của ZINCPhamer là nhằm gỡ bỏ rào cản trong thiết kế thuốc. Công cụ này
không cần phải mua, cài đặt hoặc xây dựng phần mềm mà chỉ cần dùng trình duyệt
web. Ngoài ra, ZINCPhamer sẽ chịu trách nhiệm tạo và lưu trữ các cơ sở dữ liệu cấu
dạng của những hợp chất có ý nghĩa sinh học và sẵn sàng được thương mại của CSDL
ZINC. Quan trọng hơn, khả năng tìm kiếm nhanh của ZINCPhamer (phần lớn chỉ tốn
vài phút hoặc thậm chí vài giây) tạo điều kiện tinh chỉnh pharmacophore nhiều lần
trên một tập dữ liệu hợp chất [36].
2.2.3.2. Tinh chỉnh các mô hình pharmacophore
Công cụ ZINCPhamer [36] và Pharmacophore Editor của MOE 2015.10 [29] có một
số điểm giống nhau nhất định. Tuy vậy, công cụ ZINCPhamer có giao diện, các điểm
thuộc tính và các điều kiện ràng buộc đơn giản hơn. Chi tiết về so sánh giữa 2 công
cụ được trình bày trong Bảng 2.2.

18
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Bảng 2.2. So sánh Pharmacophore Editor (MOE) và ZINCPhamer


Thuật ngữ tương đồng
Pharmacophore ZINCPhamer Ý nghĩa
Editor (MOE)
Don hydrogenDonor Nguyên tử cho liên kết hydro
Acc hydrogenAcceptor Nguyên tử nhận liên kết hydro
Ani NegativeIon Nguyên tử mang điện tích âm
Cat PositiveIon Nguyên tử mang điện tích dương
Hyd hydrophobic Nhóm kỵ nước
Aro Aromatic Vòng thơm, vòng liên hợp π
Thuật ngữ chỉ tồn tại ở Pharmacophore Ý nghĩa
Editor
Partial Match (At Least/All But) Ràng buộc một phần (ít nhất/tất
cả trừ)
Essential Thuộc tính bắt buộc
A & B (AND) Thoả 2 thuộc tính A, B tại một
toạ độ
A | B (OR) Thoả ít nhất A hoặc B tại một
toạ độ
Vì các mô hình pharmacophore được xây dựng ở Pharmacophore Editor (MOE), nên
khi sử dụng để sàng lọc bằng ZINCPharmer sẽ có một số tinh chỉnh nhất định để đảm
bảo các chất đầu ra ở ZINCPhamer thoả các yêu cầu đã có ở Pharmacophore Editor.
2.2.3.3. Các thao tác tinh chỉnh đã thực hiện trên ZINCPharmer
Sự khác biệt về thuật ngữ đã được trình bày ở Bảng 2.2 sẽ được sử dụng để tinh chỉnh
các mô hình pharmacophore. Những mô hình được tinh chỉnh bao gồm
pharmacophore do nghiên cứu tự xây dựng cũng như của nghiên cứu trước của Lê
Minh Trí [5].
Khi tải lên ZINCPhamer, các thuộc tính pharmacophore ràng buộc một phần (Partial
Match) của Pharmacophore Editor sẽ không được ghi nhận ở ZINCPharmer. Do đó,
các ràng buộc một phần sẽ được chia thành các tổ hợp ràng buộc. Mỗi thuộc tính sẽ
được xem là ràng buộc khi chọn “Enabled” trên ZINCPhamer. Các tổ hợp này sau
khi được sàng lọc riêng lẻ sẽ được tải về và gộp lại, xoá trùng lặp cũng như sàng lọc
qua luật 5-Lipinski [37]. Bảng 2.3 cho thấy những tinh chỉnh được thực hiện trên các
mô hình pharmacophore mà nghiên cứu sử dụng. Ở đây, mô hình Ph-IL1β-β5_β6 là
mô hình mới và 8 mô hình còn lại được kế thừa từ nghiên cứu của Lê Minh Trí và
cộng sự [5].

19
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Bảng 2.3. Những tinh chỉnh pharmacophore trên ZINCPharmer


Tên mô Hình ảnh Thao tác tinh chỉnh
hình
Ph-IL1β- Ràng buộc 4/6 thuộc
β5_β6 tính (F1, F2, F3,
Mô hình F4).
cho chất
gắn IL-1β
tại vị trí
β5-β6
Ph-IL1β- Ràng buộc 4/8 thuộc
A tính (F3, F4, F5, F8)
Mô hình
cho chất
gắn IL-1β
tại vị trí A

Ph-IL1β-B Ràng buộc 3/8 thuộc


Mô hình tính (F2, F3, F4).
cho chất Phải có ít nhất một
gắn IL-1β thuộc tính F7 hoặc
tại vị trí B F8.

Ph- Ràng buộc 3/6 thuộc


IL1R1-a1 tính (F1, F2, F3).
Mô hình Phải có ít nhất một
cho chất thuộc tính F4 hoặc
gắn IL- F5. F4 tạo thêm
1R1 tại thuộc tính nhận
hydro.

20
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

rãnh D1-
D2
Ph- Ràng buộc 3/6 thuộc
IL1R1-a2 tính (F1, F4, F5). F4
Mô hình tạo thêm thuộc tính
cho chất nhận hydro. F6 tạo
gắn IL- thêm thuộc tính cho
1R1 tại hydro.
rãnh D1-
D2

Ph- Ràng buộc 3/7 thuộc


IL1R1-a3 tính (F1, F3, F4). F2
Mô hình tạo thêm thuộc tính
cho chất nhận hydro. F2 thoả
gắn IL- ít nhất 1/2 thuộc
1R1 tại tính.
rãnh D1-
D2

Ph- Ràng buộc 4/6 thuộc


IL1R1-b1 tính (F1, F2, F3,
Mô hình F6). F6 tạo thêm
cho chất thuộc tính nhận
gắn IL- hydro. F5 tạo thêm
1R1 tại vị thuộc tính vòng
trí D2 thơm. F5 thoả ít
nhất một thuộc tính.

Ph- Thêm một thuộc


IL1R1-b2 tính nhận hydro tại
Mô hình F1.
cho chất
gắn IL-
1R1 tại vị
trí D2

21
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Ph- Ràng buộc 4/6 điểm


IL1R1-b3 (F1, F2, F4, F6).
Mô hình
cho chất
gắn IL-
1R1 tại vị
trí D2

2.3. ĐÁNH GIÁ ADME


2.3.1. Giới thiệu về SwissADME
SwissADME (http://www.swissadme.ch) [30] là công cụ trực tuyến cho phép truy
cập một loạt các mô hình dự đoán tin cậy và nhanh chóng. Các mô hình dự đoán này
bao gồm tính chất hoá lý, dược động, khả năng làm thuốc (drug-likeness) và độ dễ
tiếp cận với ngành hoá dược. Trong số này có một vài mô hình nội bộ như
BOILEDEgg [38], iLOGP [39] và Bioavailability Radar (Radar sinh khả dụng) [30].
Công cụ SwissADME cho phép đưa dữ liệu đầu vào được hiển thị dễ dàng thông qua
giao diện thân thiện người dùng và không cần phải đăng nhập (Hình 2.5).

Hình 2.5. Giao diện SwissADME


Ngoài các mô hình nội bộ (BOILEDEgg, iLOGP,…), lợi điểm của SwissADME khi
so sánh với các công cụ nổi tiếng khác (như pk-CSM và admetSAR) bao gồm: nhiều

22
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

cách đưa dữ liệu đầu vào, khả năng dự đoán một lúc nhiều phân tử, có thể hiển thị,
lưu và chia sẻ kết quả của từng phân tử hoặc toàn bộ tập dữ liệu. Ngoài ra,
SwissADME còn được tích hợp vào bộ công cụ SwissDrugDesign, được thiết kế bởi
Viện Tin Sinh học Thuỵ Sĩ (Swiss Institute of Bioinformatics). Kết quả thu được từ
SwissADME có thể được sử dụng ngay lập tức cho các công cụ CADD khác bao gồm
sàng lọc ảo dựa trên ligand (SwissSimilarity), dự đoán đích tác động sinh học
(SwissTargetPrediction), mô tả phân tử docking (SwissDock), thiết kế đẳng cấu sinh
học (SwissBioisostere) và động lực học phân tử (SwissParam) [30].
Sau khi tính toán, có thể lưu kết quả ở dạng tệp *.csv hoặc sao chép để thực hiện phân
tích thêm.
2.3.2. Cơ sở lý thuyết các mô hình
2.3.2.1. BOILED-Egg
Mô hình BOILED-Egg (Brain Or Intestinal Estimated Permeation) là một mô hình
dự đoán khả năng thấm thụ động của một chất qua ruột hoặc hàng rào máu não. Mô
hình này dựa trên tính việc tính toán tính thân dầu và phân cực của các phân tử nhỏ.
Mô hình thực hiện được điều này bằng cách sử dụng hai thông số lý hoá là hệ số phân
bố dầu-nước (logP) và diện tích bề mặt phân cực (PSA) [38].
Một chất được mô hình đánh giá là có khả năng hấp thu thụ động qua ruột khi có logP
trong khoảng -2,3+6,8 và PSA bé hơn 142 Å2 [38]. Chất có khả năng hấp thu thụ
động qua hàng rào máu não khi chất đó có PSA < 79 Å2 và logP trong khoảng +0,4-
+0,6. Hình 2.6 minh hoạ một mô hình BOILED-Egg. Trong đó, những chất nằm
trong phần màu trắng (lòng trắng) được dự đoán là có khả năng hấp thu thụ động qua
ruột. Những chất nằm trong vùng màu vàng (lòng đỏ) sẽ có khả năng hấp thu qua
được hàng rào máu não. Những chất nằm ngoài hai vùng này được dự đoán là không
có khả năng hấp thu thụ động đường uống.

Hình 2.6. Minh hoạ mô hình BOILED-Egg

23
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Ở đây, nghiên cứu tiến hành dự đoán bằng BOILED-Egg và chọn những chất có khả
năng hấp thu được qua đường uống.
2.3.2.2. PAINS
PAINS (Pan assay interference compounds), là khái niệm để chỉ các hợp chất chứa
các cấu trúc cho phản ứng sinh học mạnh trong các thử nghiệm, bất kể là protein đích
nào. Những chất như vậy khi được đem vào thử nghiệm sinh học sẽ cho kết quả
dương tính giả. Một số chất PAINS thường gặp là toxoflavin, isothiazolon, quinon,
catechol,… [40]
Nghiên cứu đã sử dụng mô hình dự đoán PAINS để loại bỏ những chất có khả năng
gây dương tính giả trong các thử nghiệm sinh học nếu có sau đó.
2.3.2.3. Brenk
Brenk là một danh sách gồm 105 mảnh (fragment) được xác định bởi Brenk và cộng
sự là dễ gây độc, chuyển hoá không ổn định hoặc có các tính chất dược động kém.
Bằng cách áp dụng mô hình này, chính Brenk và cộng sự đã sàng lọc và tìm được các
chất có khả năng thoả tiêu chí làm một chất khởi nguồn (leadlikeness) và có thể được
sử dụng để tiếp tục tối ưu hoá sâu hơn [41].
Brenk cũng là một mô hình được nghiên cứu sử dụng nhằm giảm số lượng hợp chất
đầu vào khi tiến hành docking.
2.3.2.4. Ghose (Amgen), Verber (GSK), Egan (Pharmacia) và Muegge (Bayer)
Giống như luật 5-Lipinski [37], các luật Ghose [42], Verber [43], Egan [44] và
Muegge [45] bao gồm những tiêu chí đánh giá để một chất có khả tiềm năng làm
thuốc phân tử nhỏ đường uống hay không. Các luật này lần lượt được các công ty
dược phẩm, công nghệ sinh học trên thế giới dùng như Amgen, GSK, Pharmacia và
Bayer. Chi tiết về tiêu chí của từng luật sẽ được nêu trong Bảng 2.4.
Bảng 2.4. Luật Ghose, Verber, Muegge và Egan
Ghose [42]
- -0,4 < logP < 5,6 Veber [43]
- 160 < MWa < 480 - Số liên kết xoay < 10
- 40 < MR < 130 - Diện tích bề mặt phân cực ≤ 140 Å2
- 20 < Số lượng nguyên tử < 70
Muegge [45] Egan [44]
Là một mô hình pharmacophore để phân Sử dụng mối tương quan giữa hai thông
biệt giữa hợp chất có khả năng làm thuốc số là AlogP98 và PSA để dự đoán các
hay không chất có khả năng thấm qua màng ruột
a) Khối lượng phân tử (MW); b) Khúc xạ phân tử mol (molar refractivity – MR)
Tất cả các chất trong nghiên cứu phải thoả tiêu chí của các luật này để được tiếp tục
thực hiện docking.

24
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

2.3.2.5. Tương tác cytochrom P450


SwissADME cho phép đánh giá một hợp chất có khả năng tương tác với CYP P450
hay không. Mô hình dự đoán được xây dựng bằng thuật toán SVM (support vector
machine algoritm), sử dụng những chất được lựa chọn kỹ càng và đã được biết có
khả năng ức chế cytochrom.Trong mô hình, kết quả trả về là “Yes” nếu chất đó có
khả năng ức chế cytochrom và “No” nếu chất đó không ức chế [30].
Nghiên cứu chỉ chọn lựa những hợp chất cho kết quả không tương tác với cytochrom
để tiến hành docking.
2.3.3. Tiến hành đánh giá bằng SwissADME
Các hợp chất sau khi được sàng lọc qua mô hình pharmacophore sẽ được chuyển
thành danh pháp SMILES trong phần mềm MOE 2015.10 bằng cách chọn cột mol à
File à Save as à Output: SMILES/Text (.txt).
Tệp .txt tạo thành chứa danh sách các hợp chất theo thứ tự tương ứng với tập dữ liệu
gốc sẽ được sao chép lên cửa sổ SMILES của SwissADME
(http://www.swissadme.ch) à chọn Run! để tiến hành đánh giá.
Kết quả được tải về ở mục Retrieve Data à CSV và đưa vào Microsoft Excel để thực
hiện sàng lọc bằng chức năng Filter. Các mô hình mà phần mềm sử dụng được trình
bày trong Bảng 2.5.

25
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Bảng 2.5. Các mô hình và tiêu chí đánh giá ADME


Mô hình Tiêu chí sàng lọc
PAINS Số vi phạm (violation) = 0
Brenk Số vi phạm = 0
Ghose (Amgen) Số vi phạm = 0
Verber (GSK) Số vi phạm = 0
Egen (Pharmacia) Số vi phạm = 0
Muegge (Bayer) Số vi phạm = 0
BOILED-Egg Khả năng hấp thu đường uống cao (GI absorption:
High)
Tương tác ức chế Không ức chế tất cả 5 cytochrom có trong mô hình
cytochrom P450 (CYP1A2, CYP2C19, CYP2C9, CYP2D6, CYP3A4)
Các chất thoả những tiêu chí sàng lọc trên sẽ được tiếp tục diễn dạt thông qua mô
hình BOILED-Egg nhằm dễ hình dung mối tương quan giữa TPSA và WLOGP của
từng chất.
2.4. MÔ HÌNH MÔ TẢ PHÂN TỬ DOCKING
Phương pháp mô tả phân tử docking cần dữ liệu đầu vào là cấu trúc 3D của protein
và phối tử. Đối với LeadIT 2.1.8 [31], cấu trúc phối tử sẽ được tạo cấu dạng và gắn
vào khoang gắn kết của protein. Phần mềm sau đó sẽ tiến hành đánh giá kết quả thông
qua điểm số docking và tương tác với acid amin của từng cấu dạng trong vị trí gắn
kết. Các bước để thực hiện docking bao gồm:
- Chuẩn bị cấu trúc 3D protein
- Chuẩn bị cấu trúc 3D phối tử
- Xây dựng mô hình khoang gắn kết
- Tiến hành docking và xuất kết quả
2.4.1. Chuẩn bị cấu trúc protein
Cấu trúc IL-1β và IL-1R1 được chuẩn bị trong MOE 2015.10 [29] bằng công cụ
Sequence Editor và QuickPrep.
Trong Sequence Editor, với cấu trúc IL-1β kết tinh với canakinumab (mã PDB:
5BVP), tiến hành xoá bỏ 2 chuỗi của canakinumab và chỉ giữ lại IL-1β. Ngoài ra,
nước kết tinh (HOH) và ion (CL) trong dung môi cũng sẽ được xoá bỏ.
Cấu trúc IL-1β tự do đã xoá nước này sẽ được chuẩn bị bằng công cụ QuickPrep với
các thông số bao gồm:
- Protonate3D: Xác định trạng thái ion hoá và thêm nguyên tử hydro vào các acid
amin
- Tether à Receptor: Ràng buộc không gian các nguyên tử của protein, đảm bảo
các nguyên tử không lệch quá xa so với toạ độ thực nghiệm

26
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

- Fix: Khi bật tính năng này chung với Tether, các nguyên tử xa hơn một khoảng
cách được đề ra (mặc định 8 Å) sẽ được ràng buộc và sửa toạ độ
- Refine: Tối thiểu hoá năng lượng với giá trị RMS là 0,0001 kcal/mol/A
Cấu trúc đã chuẩn bị của IL-1R1 (mã PDB: 1ITB) và IL-1β (mã PDB: 9ILB) trong
nghiên cứu trước của Lê Minh Trí và cộng sự [5] sẽ được sử dụng lại.
2.4.2. Chuẩn bị cấu trúc 3D phối tử
Các phối tử sau khi được sàng lọc pharmacophore sẽ giữ lại cấu dạng có RMSD thấp
nhất. Tiếp đến, các phối tử này sẽ được lần lượt chuyển thành tệp *.mol2 để tiến hành
chuẩn bị trong Sybyl-X 2.0 [46].
Các bước chuẩn bị trong Sybyl-X 2.0 bao gồm tối thiểu hoá năng lượng lần 1, động
lực học, sau đó tối thiểu hoá năng lượng lần 2. Các thông số tối thiểu hoá năng lượng
cho cả lần 1 và 2 được thiết lập như sau:
- Method (phương pháp): Conj Grad (Gradient liên hợp)
- Termination à Energy Change (Ngưng khi RMS đạt giá trị này): 0,0001 kcal/mol
- Max Iterations (số bước lặp lại): 10.0000
- Modify à Charge (Trường lực): Gasteiger-Huckel
- Các thông số khác được để mặc định
Động lực học phân tử được tiến hành bằng công cụ Compute à Dynamics à Setup
Simulated Annealing. Thông số Run = 5 và các thông số khác mặc định. Quá trình
động lực học mô phỏng luyện kim này có tác dụng giúp phân tử vượt qua trạng thái
năng lượng tối thiểu cục bộ. Sau đó, nhờ lần tối thiểu hoá năng lượng thứ 2 để tìm ra
trạng thái năng lượng tối thiểu toản phần của phân tử đó.
Sau khi thực hiện 3 bước chuẩn bị, các phối tử sẽ được lưu thành một tập dữ liệu
chung định dạng *.sdf để LeadIT 2.1.8 có thể đọc được và thực hiện docking.
2.4.3. Xây dựng mô hình khoang gắn kết
Cấu trúc protein đã được chuẩn bị được đưa vào LeadIT 2.1.8 bằng Load or Prepare
Receptor à Protein from File: Select…. Sau đó, đi tới Define Binding Site (Xác định
khoang gắn kết) mở Project Tree và đánh dấu “X” vào các acid amin quan trọng để
chỉ những acid amin này hiển thị trên cửa sổ chính. Tiến hành “ghim” các acid amin
này bằng cách nhấp chuột vào vị trí hiển thị tương ứng. Khi đã “ghim” tất cả các acid
amin quan trọng, mở khoang gắn kết với bán kính 6,5 Å (với các acid amin được
“ghim” là tâm vòng tròn mở khoang). Bán kính mở khoang này áp dụng cho tất cả
các vị trí gắn kết mà nghiên cứu sử dụng.
2.4.4. Docking bằng LeadIT 2.1.8
Khi khoang gắn kết đã được xây dựng, tiến hành docking bằng Docking à Define
FlexX Docking à Docking Library à Load File. Các thông số sử dụng khi docking
là:

27
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

- Number of Poses to Keep (Số cấu dạng giữ lại): Top10 (10)
- Docking Library: Thư viên phối tử được sử dụng
- Maximum Number of Solutions per Iteration (Số lần lặp lại tối đa): 1.000
- Maximum Number of Solutions per Fragmentation (Số lần phân mảnh tối đa): 200
Chọn Apply & Dock! Để bắt đầu docking.
Kết quả sau khi docking được lưu dưới dạng tệp *.sdf bằng đường dẫn Docking à
Export Poses…. Ngoài ra, toàn bộ quá trình docking cũng sẽ được lưu lại bằng đường
dẫn LeadIT à Save Project As…, tệp *.fxx.
2.5. PHÂN TÍCH KẾT QUẢ DOCKING
Mục đích chính của phương pháp docking là nhằm dự đoán cấu dạng gắn kết của
phối tử trên đích tác động. Để đánh giá kết quả docking, các phần mềm thường đưa
ra kết quả ở dạng điểm số nhằm phân hạng các cấu dạng để lựa chọn cấu dạng phù
hợp. Các mô hình cho điểm thường được xây dựng để phù hợp cho tất cả các đích
protein. Tuy vậy, độ chính xác của điểm số thường thay đổi rất nhiều khi đích tác
động thay đổi [47].
Do đó, để đảm bảo việc lựa chọn kết quả các cấu dạng tiềm năng được chính xác hơn,
nghiên cứu áp dụng phương pháp phân tích dấu vân tay tương tác protein-phối tử
(protein-ligand interaction fingerprint – PLIF) kết hợp với điểm số docking để phân
tích kết quả.
Phương pháp PLIF biểu thị tương tác phối tử-protein dưới dạng hình ảnh 1 chiều [48].
Trong đó, mỗi tương tác giữa acid amin trong protein và phối tử tương ứng với một
vạch đen trong biều đồ. Kết quả khi xếp chồng nhiều phối tử cùng tương tác tại một
vị trí gắn kết sẽ tạo ra nhiều mã vạch (barcode) xếp chồng lên nhau.
Tệp *.sdf sau khi docking sẽ được chuyển thành định dạng *.mdb để mở được trong
MOE 2015.10 để tiến hành phân tích kết quả bằng phương pháp PLIF (Protein-
Ligand Interaction Fingerprints). Phân tích PLIF (Hình 2.8) bao gồm bước tính toán
các tương tác protein-ligand và phân tích kết quả.
2.5.1. Tính toán tương tác protein-ligand
Các bước tính toán được cụ thể hoá như sau:
- Mở CSDL *.mdb sau khi docking. Tiếp đến, mở cấu trúc protein đã được dùng
để docking bằng LeadIT qua File à Open à *.pdb.
- Trong cửa sổ CSDL *.mdb, chọn Compute à PLIF à Generate…
- Trên cửa sổ PLIF Setup: Chọn Receptor: Receptor + Solvent. Ở Ligand: mol để
chọn cột chứa thông tin cấu dạng sau khi docking. Các thông số khác sẽ được để
mặc định. Sau khi thiết lập xong, chọn Prepare để thực hiện tính toán các tương
giữa protein và các cấu dạng phối tử.

28
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

2.5.2. Lựa chọn phối tử để mô phỏng động lực học:


Từ kết quả PLIF, cách chọn phối tử để mô phỏng động lực học được được trình bày
như sau:
- Sau khi tính toán PLIF xong, chọn Generate để tạo và quan sát kết quả. Để kết
quả được rõ ràng hơn, chọn Verbose List để hiển thị cụ thể tương tác trên mỗi acid
amin. Đồng thời, các dữ liệu trong mục Fields… như DOCKING_E_TOTAL hay
molecule (kết quả docking của LeadIT) có thể được dùng để làm rõ tên và điểm
số docking của từng cấu dạng cần phân tích.
- Kết quả ở phần Barcodes (Mã vạch), Population (Tỷ lệ cấu dạng tạo tương tác)
sẽ được trích xuất dạng hình ảnh bằng tính năng Export…
- Tất cả dữ liệu ở phần Entry List sẽ được sao chép và đưa vào Microsoft Excel để
phân tích thêm bằng tính năng Filter (lọc) của phần mềm này.
Vì lý do có nhiều vị trí docking và tài nguyên máy tính giới hạn, chỉ những cấu dạng
được dock trên vòng β5-β6 của IL-1β sẽ được tiếp tục sử dụng trong các mục sau của
nghiên cứu.
Các cấu dạng được chọn sẽ có tương tác với tất cả các acid amin quan trọng trong vị
trí vòng β5-β6 là Glu64, Lys65 và Asn66. Những cấu dạng nào không tương tác với
cả 3 acid amin này sẽ bị loại bỏ bằng tính năng Filter trong Microsoft Excel. Sau đó,
những cấu dạng này sẽ được sắp xếp theo điểm số docking theo thứ tự từ thấp (âm
nhất) đến cao. 5 phối tử với cấu dạng có điểm số docking âm nhất sẽ được lựa chọn
để thực hiện mô phỏng động lực học và tính toán năng lượng tự do.
2.6. MÔ PHỎNG ĐỘNG LỰC HỌC PHÂN TỬ
Nghiên cứu thực hiện mô phỏng động lực học phân tử IL-1β tự do và phức hợp IL-
1β-phối tử bằng phần mềm GROMACS 2020.2 [32], sử dụng trường lực
CHARMM27 [33, 34]. 5 phối tử được lựa chọn từ kết quả docking sẽ được mô phỏng
động lực học với thời gian là 20 ns (nano giây) cho mỗi hợp chất. Các bước mô phỏng
động lực học được miêu tả dưới đây. Các câu lệnh để thực hiện mô phỏng động sẽ
được trình bày trong PHỤ LỤC 1.
2.6.1. Tạo topology và toạ độ
2.6.1.1. Tạo topology cho IL-1β
Cấu trúc IL-1β (mã PDB: 5BVP) được chuẩn bị từ quá trình docking (đã xoá nước,
ràng buộc, tối thiểu hoá) được sử dụng tiếp tục trong bước mô phỏng động lực học
này.
Tệp tạo thành là “protein_processed.gro” và “topol.top” lần lượt là toạ độ và topology
cho protein, với *.gro là định dạng topology riêng của phần mềm Gromacs.
2.6.1.2. Tạo topology cho phối tử
Phối tử sẽ được lưu trong chung một thư mục với protein với tên “ligand.mol2”. Vì
trường lực được sử dụng là CHARMM27, trường lực cho tất cả nguyên tử (all-atom

29
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

force field), nên phải đảm bảo phối tử đã được được thêm hydro. Thực hiện điều này
bằng cách mở phối tử bằng phần mềm Avogadro [49], chọn Build à Add hydrogens.
Sau đó, tải tệp ligand.mol2 lên SwissPARAM (http://www.swissparam.ch) để lấy
topology cho phối tử là “ligand.itp”. Toạ độ phối tử được tạo bằng cách chuyển tệp
“ligand.pdb” thành “ligand.gro”.
2.6.1.3. Tạo topology và toạ độ cho phức hợp
Sau khi topology cho phối tử và protein được tạo, tiến hành tạo một tệp complex.gro
(sao chép từ protein_processed.gro). Mở tệp complex.gro bằng một phần mềm chỉnh
sửa chữ (Text Editor) bất kỳ và sao chép thông số toạ độ của nguyên tử trong
ligand.gro vào sau thông số của protein. Tiếp đến, sửa lại số nguyên tử cho đúng với
tổng số nguyên tử của phức hợp và lưu tệp complex.gro lại.
Mở tệp “topol.top” và thêm vào lệnh “Include ligand topologies” để phần mềm nhận
topology của phối tử.
2.6.2. Tạo hộp và solvat hoá
Phức hợp sẽ được mô phỏng động lực học trong một khối hộp, khoảng cách từ phức
hợp đến cạnh của hộp sẽ là 1,0 nm (d 1.0). Hình 2.7 minh hoạ hộp chứa phức hợp
chưa được solvat hoá. Hộp này sau đó sẽ được thêm nước (solvat hoá).

Hình 2.7. Hộp mô phỏng động lực học


(Xem bằng phần mềm PyMOL) [50]
2.6.3. Thêm ion và trung hoà điện tích
Hộp nước sau đó sẽ được thêm ion và trung hoà điện tích bằng dung dịch NaCl 0,15
M. Bước này yêu cầu tệp ions.mdp, các thông số tệp được trình bày ở PHỤ LỤC 2.
2.6.4. Tối thiểu hoá năng lượng
Trước khi tiến hành mô phỏng động lực học, hệ cần được tối thiểu hoá năng lượng
nhằm đảm bảo không có xung đột không gian (steric clashes) hoặc cấu trúc không
gian sai. Bước này cần thông số của tệp em.mdp (PHỤ LỤC 3).

30
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

2.6.5. Cân bằng


Giai đoạn cân bằng dung môi và ion là cần thiết cho hầu hết các loại mô phỏng động
lực học. Tuy vậy, quá trình mô phỏng phức hợp còn cần thêm bước ràng buộc phối
tử và điều chỉnh nhiệt độ (thermostat) nhằm đảo bảo mô phỏng động lực học diễn ra
ổn định.
2.6.5.1. Ràng buộc phối tử và điều chỉnh nhiệt độ
Ràng buộc phối tử
Để ràng buộc phối tử, cần tạo một tệp topology ràng buộc vị trí riêng. Đầu tiên, tạo
tệp index_ligand.ndx chỉ chứa các nguyên tử không phải hydro. Sau đó, tạo tệp
topology có phối tử đã được ràng buộc là posre_ligand.itp. Tiếp theo, cập nhật
topology của phối tử đã ràng buộc vào tệp topol.top chung bằng cách chép lệnh
“Ligand position restraints” vào trong tệp này.
Điều chỉnh nhiệt độ (Thermostat)
Để điều chỉnh nhiệt độ của phức hợp, cần tạo tệp index.ndx để kết hợp protein và
phối tử làm một. Tệp này cũng sẽ cần thiết trong các bước tiếp theo.
2.6.5.2. Cân bằng dung môi và ion
Tối thiểu hoá năng lượng tuy làm ổn định về mặt không gian của hệ, nhưng để quá
trình động lực học diễn ra ổn định, hệ cần được cân bằng về dung dịch và ion quanh
phức hợp. Nếu tiến hành mô phỏng động lực học mà không cân bằng, cả hệ mô phỏng
có thể sẽ không hoạt động. Lý do là vì dung môi (nước) hiện tại chỉ được tối ưu hoá
trong bản thân dung môi mà không phải là với chất tan (phức hợp). Do vậy, cần đưa
dung môi về về nhiệt độ hệ mô phỏng và đưa áp suất vào hệ để đạt được mật độ (thể
tích) phù hợp.
Giai đoạn cân bằng này sẽ chia làm 2 pha. Chi tiết các pha như sau:
- Pha 1 – NVT (hằng định số phần tử, thể tích và nhiệt độ) còn được gọi là giai
đoạn “đẳng nhiệt-đẳng tích” hoặc “chính tắc”. Cân bằng NVT giúp đưa hệ về
nhiệt độ mong muốn, cũng như ổn định nhiệt độ của hệ. Ở đây, thời gian thiết
lập là 100 ps và nhiệt độ là 300 K. Thông số cân bằng NVT sẽ có trong tệp
nvt.mdp, tại PHỤ LỤC 4.
- Pha 2 – NPT (hằng định số phần tử, áp suất và nhiệt độ) còn được gọi là giai đoạn
“đẳng nhiệt-đẳng áp”. Cân bằng NPT giúp đưa hệ về áp suất mong muốn cũng
như ổn định áp suất của hệ. Thời gian thiết lập là 100 ps và áp suất là 0,987 atm
(1 bar). Thông số cân bằng NPT sẽ có trong tệp npt.mdp, tại PHỤ LỤC 5.
2.6.6. Mô phỏng động lực học
Mô phỏng động lực học được thực hiện sau khi đã tối thiểu hoá năng lượng, cân bằng
nhiêt độ (300 K) và áp suất (1 bar) của hệ. Thời gian thực hiện mô phỏng sẽ là 20 ns,

31
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

với 2000 khung hình (frame). Các thông số động lực học trong tệp md.mdp sẽ được
cụ thể trong PHỤ LỤC 6.
2.6.7. Phân tích kết quả động lực học
Các lệnh để thực hiện phân tích kết quả động lực học sẽ nằm trong PHỤ LỤC 7.
2.6.7.1. Độ ổn định của protein tự do và phức hợp
Trong suốt quá trình mô phỏng động lực học (20 ns), có thể sử dụng giá trị RMSD
(căn bậc hai độ lệch trung bình bình phương) để đánh giá mức độ ổn định của các
nguyên tử trong điều kiện mô phỏng. Cụ thể hơn, RMSD có thể dùng để đánh giá
protein tự do, phối tử hoặc phức hợp có ổn định hay không. Công thức RMSD (2)
[27]:
)
𝑅𝑀𝑆𝐷(𝑡) , 𝑡* ) = 2" ∑,
+-) 𝑚+ ||𝑟+ (𝑡) ) − 𝑟+ (𝑡* )|| (2)
*

Với: ∑,+-) 𝑚+ và 𝑟+ (𝑡 ) là vị trí của nguyên tử i ở thời điểm t; M là tổng số nguyên tử


của phân tử được xét.
Thông thường, giá trị RMSD được tính trên mạch chính (backbone) của protein, bao
gồm những nguyên tử N, C⍺ và C của protein. Cấu trúc được xem là ổn định và có
ý nghĩa khi RMSD < 3,0 Å [51].
2.6.7.2. Khả năng duy trì cấu trúc không gian của protein
GROMACS có thể đo được độ “nén” (compactness) của protein nhờ thông số bán
kính quay (radius of gyration - 𝑅. ). Nếu cấu trúc không gian protein ổn định và duy
trì ở bậc 4 tốt, bán kính quay sẽ ổn định trong suốt thời gian mô phỏng. Bán kính
quay của protein được định nghĩa là căn bậc hai trung bình (root mean square) của
khoảng cách từng nguyên tử đến trọng tâm của protein [52]. Công thức bán kính quay
(3) được tính như sau [27]:
/! ‖𝒓! ‖" 2! #
𝑅. = ( )" (3)
/! 2!
Trong đó, 𝑚+ là trọng lượng của nguyên tử i và 𝒓+ là vị trí của nguyên tử i so với trọng
tâm của phân tử protein.
2.6.7.3. Độ linh động của acid amin và phối tử trong hệ
RMSF (Root mean square fluctuation) còn gọi là căn bậc hai độ dao động trung bình
bình phương. RMSF có thể được dùng để khảo sát sự linh động của các acid amin
trong protein hoặc các nguyên tử nặng của ligand trong hệ. Khác biệt chính giữa
RMSD và RMSF là RMSF cho giá trị trung bình của từng acid amin trong tổng thời
gian. Trong khi đó, RMSD cho giá trị cụ thể tại từng mốc thời gian xác định. Công
thức tính RMSF (4) như sau [53]:
) 567 *
𝑅𝑀𝑆𝐹+ = 23 ∑3($ -)9𝑟+ (𝑡4 ) − 𝑟+ 9 (4)

32
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

567
Trong đó, T là thời gian cần tính trung bình và 𝑟+ là vị trí tham chiếu của nguyên tử
i. Giá trị RMSF càng cao chứng tỏ acid amin đó linh động và ngược lại, giá trị RMSF
thấp cho thấy acid amin di chuyển giới hạn trong quá trình mô phỏng so với vị trí ban
đầu [54]. RMSF > 0,2 chứng tỏ acid amin (hoặc phối tử) đó linh động [55].
2.6.7.4. Liên kết hydro trong quá trình mô phỏng
Liên kết hydro sẽ được tính dựa trên kết quả động lực học bằng phần mềm VMD
1.9.4 [56]. Nghiên cứu sẽ tính toán số liên kết hydro mạnh hình thành theo thời gian,
cũng như các acid amin nào có xuất hiện liên kết hydro này. Liên kết hydro được
phân loại trong Bảng 2.6 [57].
Bảng 2.6. Phân loại liên kết hydro
Rất mạnh Mạnh Yếu
Năng lượng liên kết (kJ/mol) 63–167 17–63 <17
Ví dụ (F. . .H. . .F)- O-H…O=C C-H…O
(N. . .H. . .N)+ N-H…O=C N-H…F-C
P-OH…O=P O-H…O-H O-H…π
Độ dài liên kết H-A ≈ D-H H. . .A > D-H H. . .A >> D-H
Khoảng cách D. . .A (Å) 2,2–2,5 2,5–3,2 3,0–4,0
Khoảng cách H. . .A (Å) 1,2–1.5 1,5–2,2 2,0–3,0
Số liên kết ngắn hơn van der Waals 100% Gần 100% 30–80%
Góc D–H. . .A (º) 175–180 130–180 90–180
Trong thư mục chứa kết quả động lực học, mở Terminal và gõ “vmd” để truy cập
phần mềm VMD. Mở hai tệp là md_0_20.gro và md_0_20_fit.xtc bằng đường dẫn
File à New Molecule… à File name: (Chọn tệp) à Load. Sau đó, dùng công cụ
tính liên kết hydro trong Extensions à Analysis à Hydrogen Bonds. Ở đây, để tính
được liên kết hydro mạnh, thiết lập thông số như sau:
- Selection 1: protein
- Selection 2 (Optional): resname LIG
- Frames: all (lấy tất cả khung hình)
- Selection is the: Both (Xét cả liên kết cho và nhận)
- Donor-Acceptor Distance (Å): 3,2
- Angle cutoff (degrees): 50 (Những góc nhỏ hơn số này sẽ được ghi nhận)
- Calculate detailed info for: All hbonds (tính tất cả số liên kết hydro)
- Write to output file: Nhấn chọn để tạo tệp xuất ra.
Sau khi thiết lập thông số, chọn Find hydrogen Bonds! để tiến hành tìm liên kết hydro
và tạo các tệp đầu ra để phân tích thêm.

33
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Lưu ý, phần mềm VMD định nghĩa góc theo vector. Góc A-H-D theo định nghĩa của
VMD dựa trên trường lực CHARMM19 sẽ là góc giữa vector 𝐴𝐻 <<<<<<⃗ và <<<<<<⃗
𝐻𝐷 [58]. Đây
là góc kề bù của góc D-H…A (130-180º cho liên kết hydro mạnh).
2.7. TÍNH TOÁN NĂNG LƯỢNG TỰ DO
Tính toán năng lượng tự do của liên kết protein-phối tử được thực hiện dựa trên kết
quả mô phỏng động lực học, sử dụng phần mềm g_mmpbsa 5.1.2 [35]. Quá trình tính
toán sẽ trải qua 3 bước. Tuy vậy, để có thể sử dụng được phần mềm, kết quả động
lực học cần được tinh chỉnh về phiên bản phù hợp mà g_mmpbsa 5.1.2 có thể hiểu.
2.7.1. Thực hiện tính toán bằng g_mmpbsa 5.1.2
Năng lượng gắn kết tự do (binding free energy) của phức hợp protein-ligand được
tính toán bằng nguyên lý diện tích bề mặt cơ học phân tử (MM-PBSA). Công thức
(5) [55]:
∆𝐺%+ê9 ;ế( = 𝐺=>ứ@ − (𝐺=5$(6+9 + 𝐺%+.'9A ) (5)
Trong đó, 𝐺=>ứ@ là năng lượng của phức hợp protein-ligand, 𝐺=5$(6+9 và 𝐺%+.'9A lần
lượt là năng lượng của protein và phối tử trong dung môi nước. Năng lượng tự do của
từng thành phần trong công thức trên được tính như sau:
𝐺! = 𝐸"" + 𝐺#$%&'( − 𝑇∆𝑆
- 𝐺! có thể là 𝐺=>ứ@ , 𝐺=5$(6+9 hoặc 𝐺%+.'9A .
- 𝐸"" là thế năng cơ học phân tử trong chân không, bao gồm năng lượng liên kết
(𝐸%+ê9 ;ế( ) và năng lượng không liên kết (𝐸;>ô9. %+ê9 ;ế( ). 𝐸%+ê9 ;ế( là năng lượng
của các tương tác trong liên kết (bonded interactions) và được tính bằng 0 trong
một mô phỏng động lực học [59]. 𝐸&AC là năng lượng của tương tác van der Waals
và 𝐸6%6@ là năng lượng của các tương tác tĩnh điện. Công thức (6) [55]:
𝐸"" = 𝐸%+ê9 ;ế( + 𝐸;>ô9. %+ê9 ;ế( = 𝐸%+ê9 ;ế( + (𝐸&AC + 𝐸6%6@ ) (6)
- 𝐺#$%&'( là năng lượng solvat hoá, nghĩa là năng lượng cần để chuyển chất tan từ
chân không vào dung môi. Trong nguyên lý MM-PBSA, năng lượng solvat hoá
bao gồm 2 năng lượng thành phần là năng lượng solvat hoá phân cực (𝐺=>â9 @ự@ )
và năng lượng solvat hoá không phân cực (𝐺;>ô9. =>â9 @ự@ ) được tính như công
thức (7) sau [55]:
𝐺#$%&'( = 𝐺=>â9 @ự@ + 𝐺;>ô9. =>â9 @ự@ (7)
- 𝑇∆𝑆 là lượng entropy đóng góp vào hệ. T là nhiệt độ và ∆𝑆 là entropy. Tuy vậy,
việc ước tính entropy thường tốn nhiều thời gian và sai số thường lớn so với các
thành phần năng lượng khác. Thêm nữa, tổng năng lượng do entropy đóng góp
vào công thức thường không cao, và nhiều nghiên cứu đã cho thấy việc đưa
entropy vào công thức chỉ tăng mức tương quan với năng lượng thực nghiệm rất
nhỏ [35].

34
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu

Do đó, công thức tính năng lượng tự do có thể được viết lại như sau (8):
𝐺! = (𝐸&AC + 𝐸6%6@ ) + 𝐺=>â9 @ự@ + 𝐺;>ô9. =>â9 @ự@ (8)
Phần mềm g_mmpbsa sẽ thực hiện 3 bước tính năng lượng thành phần, lần lượt là thế
năng cơ học phân tử ( 𝐸"" = 𝐸&AC + 𝐸6%6@ ), năng lượng solvat hoá phân cực
(𝐺=>â9 @ự@ ) và năng lượng solvat hoá không phân cực (𝐺;>ô9. =>â9 @ự@ ). Các lệnh để
tính toán năng lượng sẽ được trình bày trong PHỤ LỤC 8.
2.7.1.1. Tính toán thế năng cơ học phân tử:
Kết quả sẽ tạo 2 tệp là energy_MM.xvg và contrib_MM.dat. Tệp energy_MM.xvg
chứa thông tin về kết quả thế năng trong chân không, contrib_MM.dat chứa năng
lượng mà từng acid amin đóng góp vào tổng thế năng cơ học phân tử.
2.7.1.2. Tính toán năng lượng solvat hoá phân cực
Bước này yêu cầu thông số từ tệp polar.mdp, sẽ được trình bày trong PHỤ LỤC 9.
Kết quả sẽ tạo 2 tệp polar.xvg và contrib_pol.dat. Tệp polar.xvg chứa thông tin năng
lượng solvat hoá phân cực, contrib_pol.dat chứa thông tin năng lượng mà từng acid
amin đóng góp vào tổng năng lượng solvat hoá.
2.7.1.3. Tính toán năng lượng solvat hoá không phân cực
Bước này cũng cần thông số lấy từ tệp apolar.mdp, chi tiết sẽ được trình bày trong
(PHỤ LỤC 10). Kết quả bước này sẽ tạo 2 tệp apolar_sasa.xvg và sasa_contrib.dat.
Tệp apolar_sasa.xvg cho kết quả năng lượng solvat hoá không phân cực của protein
tự do, phối tử tự do và phức hợp phối tử-protein. Tệp sasa_contrib.dat chứa thông tin
năng lượng từng acid amin đóng góp vào tổng năng lượng solvat hoá không phân cực.
2.7.1.4. Tính năng lượng gắn kết tự do
Sau khi đã tính 3 năng lượng thành phần, sử dụng tệp MmPbSaStat.py (PHỤ LỤC
11) để thực hiện tính tổng 3 thành phần này. Hai tệp tạo thành sẽ chứa kết quả tính
toán năng lượng gắn kết trung bình (summary_energy.dat) và sự biến thiên năng
lượng gắn kết theo thời gian (full_energy.dat).

35
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

CHƯƠNG 3. KẾT QUẢ VÀ BÀN LUẬN


Kết quả của nghiên cứu được tóm tắt qua Hình 3.1 dưới đây. Từ 22 triệu chất, bằng
7 mô hình in silico, nghiên cứu đã chọn ra được 1 chất có tiềm năng gắn kết với IL-
1β tại vị trí vòng β5-β6. Kết quả cụ thể của mỗi mô hình sẽ được nêu rõ ở từng mục
sau.
•Lượng chất đầu vào
22.272.331 chất
•Chuẩn bị CSDL
279.355 chất
•Sàng lọc pharmacophore
10.805 chất
•Đánh giá ADME
1256 chất
•Docking
•Đánh giá kết quả docking
5 chất
•Mô phỏng động lực học
•Tính toán năng lượng gắn kết tự do
1 chất

Hình 3.1. Tóm tắt kết quả nghiên cứu


3.1. KẾT QUẢ XÂY DỰNG CÁC TẬP CƠ SỞ DỮ LIỆU
Vì số lượng CSDL được sử dụng trong nghiên cứu là khá nhiều (7 CSDL, 22 triệu
chất) nên tất cả các tập này phải được chuẩn bị trước khi được sàng lọc
pharmacophore. Mục đích của bước này nhằm giảm số lượng các chất được sàng
pharmacophore, loại những chất không thoả luật 5-Lipinski [37] và loại những chất
trùng lặp. Bước này sẽ giúp đảm bảo phần nào chất lượng các chất được sàng lọc
pharmacophore, cũng như tiết kiệm thời gian và tài nguyên máy tính. Các CSDL sau
khi được xoá trùng lặp, sàng lọc qua luật 5-Lipinski trong MOE 2015.10 có kết quả
được trình bày trong Bảng 3.1.
Bảng 3.1. Kết quả sàng lọc CSDL
CSDL Lượng chất đầu
Kết quả sàng lọc Số chất bị loại bỏ
vào
MBHC 13.809 13.809 0
MBPPI 8.349 7.774 575
CDPM 12.455 12.318 137
CDPPI 222.447 215.329 7.118
UNDP 229.358 22.126 207.232
DB 8.820 7.999 821
Tổng 495.238 279.355 215.883

36
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

Từ kết quả có thể thấy số lượng hợp chất bị trùng lặp và không thoả luật 5-Lipinski
là khá nhiều, chiếm 43,59% số chất đầu vào (215.883/495.238). Trong đó, tập UNDP
có số hợp chất bị loại bỏ nhiều nhất, lên đến 90% số tổng số chất của tập. Tập MBHC,
MBPPI và DB lần lượt có chất bị loại là 0/13.809, 575/8.349 và 821/8.820.
Lưu ý, bước này chỉ áp dụng cho các tập có thể tải về lưu trữ ngoại tuyến, nên tập
ZINC sẽ không được chuẩn bị trong bước này mà sẽ được chuẩn bị sau khi đã sàng
lọc pharmacophore.
3.2. KẾT QUẢ SÀNG LỌC PHARMACOPHORE
Đề tài đã sử dụng 9 mô hình pharmacophore để sàng lọc trên tổng số 7 CSDL. Trong
đó, 8 mô hình pharmacophore là kết quả trong nghiên cứu của Lê Minh Trí [5] (Bảng
3.2) và một mô hình được xây dựng thêm là Ph-1L1β-β5_β6. Hình ảnh tất cả 9 mô
hình này trong MOE 2015.10 [29] sẽ có ở PHỤ LỤC 12.
Mô hình Ph-1L1β-β5_β6 này được xây dựng dựa trên tương tác của canakinumab và
IL-1β [20]. Trong tổng 7 CSDL, có 1 CSDL là ZINC Purchasable phải thực hiện sàng
lọc pharmacophore riêng bằng công cụ ZINCPhamer [36], 6 CSDL còn lại sẽ được
sàng lọc bằng MOE 2015.10 [29]. Kết quả sàng lọc pharmacophore từ ZINCPharmer
và từ MOE 2015.10 sau đó sẽ được gộp lại dựa trên vị trí tác động của IL-1β và của
IL-1R1.
Bảng 3.2. Tóm tắt 8 mô hình pharmacophore của Lê Minh Trí và cộng sự [5]
Đích tác Tên mô
Vị trí Cơ sở xây dựng mô hình
động hình
A Ph-IL1β-A Tương tác giữa IL-1β và IL-1R1
IL-1β
B Ph-IL1β-B Tương tác giữa IL-1β và IL-1R1
Ph-IL1R1-a1 Tương tác giữa IL-1R1 và IL-1RA
Rãnh D1- Ph-IL1R1-a2 Tương tác giữa IL-1R1 và IL-1β
D2 Các acid amin quan trọng của IL-
Ph-IL1R1-a3
1R1
IL-1R1 Ph-IL1R1-
Tương tác giữa IL-1R1 và IL-1RA
b1
Ph-IL1R1-
D2 Tương tác giữa IL-1R1 và IL-1β
b2
Ph-IL1R1- Các acid amin quan trọng của IL-
b3 1R1
Mô hình pharmacophore xây dựng được từ tương tác giữa canakinumab và IL-1β có
6 điểm, với 4 điểm bắt buộc là F1, F2, F3, F4. Hai điểm F5 và F6 là không bắt buộc.
Điểm F1 và F2 là hai ion dương, F3 và F4 là hai vị trí nhận liên kết hydro, F5 và F6
là cho hydro. F1, F2 là 2 điểm cho tương tác trên acid amin Glu64 của IL-1β. F3 và

37
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

F4 cho tương tác với acid amin Lys65. F5 và F6 cho tương tác với acid amin Asn66.
Hình 3.2 cho thấy hình ảnh mô hình pharmacophore và hình ảnh pharmacophore đặt
trên IL-1β. Mô hình Ph-1L1β-β5_β6 cùng với 8 mô hình trong nghiên cứu trước của
Lê Minh Trí [5] được dùng để sàng lọc trên các tập dữ liệu đã chuẩn bị.

Trái: Mô hình pharmacophore Ph-1L1β-β5_β6; Phải: Gióng hàng mô hình trên IL-1β
Dưới: Gióng hàng mô hình trên các acid amin tương tác (xanh: IL-1β, hồng:
canakinumab)
Hình 3.2. Mô hình Ph-1L1β-β5_β6
3.2.1. Kết quả sàng lọc mô hình pharmacophore trên CSDL ZINC
Như đã trình bày ở mục 2.1, các chất sau khi được sàng qua 9 mô hình pharmacophore
bằng ZINCPhamer được xoá trùng lặp và sàng qua định luật 5-Lipinski [37] bằng
MOE để đảm bảo thống nhất với 6 CSDL còn lại. Kết quả sàng lọc cụ thể của từng
mô hình sẽ được trình bày tại PHỤ LỤC 13. Ở đây, Bảng 3.3 sẽ trình bày kết quả
sàng lọc theo vị trí tác động.
Từ kết quả có thể thấy, 21 triệu chất trong tập ZINC Purchasable chỉ cho được một
lượng nhỏ chất thoả các vị trí tác động này. Cụ thể, vị trí A trên IL-1β chỉ có 1.772
chất tiềm năng (trên 21 triệu), lượng chất còn lại sau khi đã xoá trùng lặp và thoả luật

38
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

5-Lipinski chỉ còn 227 chất. Tương tự, vị trí B chỉ thu về 239 chất. Vị trí β5-β6 còn
8 chất là không trùng nhau và thoả luật 5-Lipinski.
Bảng 3.3. Kết quả sàng lọc pharmacophore của CSDL ZINC
Kết quả sàng trên Xoá trùng lặp &
Vị trí sàng lọc ZINCPharmer 5-Lipinski
(chất) (chất)
A 1.772 227
IL-1β B 1.195 239
β5-β6 39 8
Rãnh D1-D2 2.218 119
IL-1R1
D2 25.675 4.694
3.2.2. Kết quả sàng lọc mô hình pharmacophore với 6 CSDL còn lại
Khác với tập ZINC (phải sàng lọc trực tuyến bằng ZINCPharmer), 6 CSDL còn lại
(MBHC, MBPPI, CDPM, CDPPI, UNDP và DB) sẽ được sàng lọc pharmacophore
bằng MOE 2015.10. Ở 6 CSDL này, DrugBank đã được sàng lọc trong nghiên cứu
của Lê Minh Trí [5] bằng 8 mô hình pharmacophore trong Bảng 3.2. Do đó, riêng
với CSDL DrugBank, nghiên cứu chỉ sàng lọc trên vị trí β5-β6 của IL-1β (là vị trí
mới được xây dựng). Kết quả sàng lọc pharmacophore trên IL-1β và IL-1R1 sẽ được
trong Bảng 3.4.
Chi tiết kết quả sàng lọc trên từng mô hình pharmacophore của nghiên cứu sẽ có trong
PHỤ LỤC 14.
Kết quả cho thấy từ 6 CSDL với tổng 279.355 chất, số lượng chất thoả từng vị trí tác
động chiếm không tới 1%. Cụ thể, đối với 3 vị trí trên IL-1β (A, B và β5-β6), vị trí A
chỉ thu được 316 trên tổng 279.355 chất đầu vào (~0,1%). Vị trí B thu được
983/279.355 chất (~0,4%). Vị trí vòng β5-β6 thu được 552/279.355 chất (~0,2%).
Đối với 2 vị trí trên IL-1R1 (rãnh D1-D2 và D2), rãnh D1-D2 thu được 2.046/279.355
chất (~0,7%). Vị trí D2 thu được 1.621/279.355 chất (~0,6%). Kết quả từ 6 CSDL
này sau đó sẽ được cộng với kết quả của CSDL ZINC để thực hiện đánh giá ADME
và docking.

39
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

Bảng 3.4. Kết quả sàng lọc pharmacophore 6 CSDL


Vùng màu xám: Đã được thực hiện trong nghiên cứu của Lê Minh Trí và cộng sự [5]

Tổng
CSDL (và số chất đầu vào)
(chất)
Vị trí sàng MBHC MBPPI CDPM CDPPI UNDP DB
lọc (13.809 (7.774 (12.318 (215.329 (22.126 (7.999 279.355
chất) chất) chất) chất) chất) chất)
A 3 10 23 152 128 316
IL-
B 12 40 174 603 154 983

β5-β6 3 30 66 365 14 74 552
Rãnh
IL- D1- 16 101 294 1129 506 2.046
1R1 D2
D2 67 127 121 866 440 1.621
3.2.3. Tổng hợp kết quả sàng lọc pharmacophore
Kết quả số lượng chất thu về được trình bày ở Bảng 3.5. Tóm lại, với 7 CSDL sau
khi cộng gộp, ở 3 vị trí A, B và β5-β6 trên IL-1β lần lượt sẽ có lần lượt 543, 1.222 và
560 chất được đánh giá ADME. Ở 2 vị trí rãnh D1-D2 và D2 trên IL-1R1 sẽ có lần
lượt là 2.165 và 6.315 chất được đánh giá ADME
Bảng 3.5. Kết quả sàng lọc pharmacophore trên 7 CSDL
IL-1β IL-1R1
Cơ sở dữ liệu β5- Rãnh D1-
A B D2
β6 D2
6 CSDL: MBHC, MBPPI, CDPM, CDPPI,
316 983 552 2.046 1.621
UNDP, DB
ZINC 227 239 8 119 4.964
543 1.222 560 2.165 6.315
Tổng
2.235 8.480
Tóm lại, kết quả sàng lọc pharmacophore trên IL-1β thu được 2.235 chất và trên IL-
1R1thu được 8.480 chất.
3.3. KẾT QUẢ ĐÁNH GIÁ ADME
3.3.1. Kết quả sàng lọc bằng SwissADME
Kết quả sàng lọc pharmacophore từ 7 CSDL trong Bảng 3.5 sẽ được dự đoán ADME
bằng nhiều tiêu chí khác nhau. Các tiêu chí được dự đoán trên SwissADME [30] bao
gồm PAINS [40], Ghose (Amgen) [42], Veber (GSK) [43], Egan (Pharmacia) [44],
Muegge (Bayer) [45], Brenk [41], BOILED-Egg [38] và không ức chế cytochrom
P450 [30]. Các chất sau khi được sàng để thoả những tiêu chí này sẽ có khả năng đạt
những tiêu chuẩn cho các hợp chất dùng làm thuốc đường uống, cũng như có một độ

40
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

an toàn về dược động nhất định. Bảng 3.6 cho thấy số lượng hợp chất còn lại sau khi
đã sàng lọc qua những tiêu chí trên. Tổng số chất thoả đánh giá ADME trên IL-1β là
202, với 18 chất trên vị trí A, 82 chất trên vị trí B và 102 chất tại β5-β6. Trên IL-1R1
thu được 1.054 chất, với rãnh D1-D2 có 115 chất và vị trí D2 là 939 chất.
Bảng 3.6. Kết quả sàng lọc SwissADME
IL-1β IL1-R1
Vị trí β5- Rãnh D1-
A B D2
β6 D2
Số chất sau khi sàng pharmacophore 543 1.222 560 2.165 6.315
Số chất thoả các mô hình 18 82 102 115 939
SwissADME 202 1.054
3.3.2. Mô hình BOILED-Egg
Hình 3.3 và Hình 3.4 thể hiện vị trí các hợp chất đã được sàng lọc qua SwissADME
(ở mục 3.3.1) trong mô hình BOILED-Egg [38]. Hình 3.3 là mô hình cho các hợp
chất sẽ được docking trên IL-1β và Hình 3.4 là cho các hợp chất sẽ được docking
trên IL-1R1. Màu xanh dương nghĩa là chất đó được dự đoán là có chịu tác động của
bơm ngược P-gp, nghĩa là bị P-gp bơm ngược ra khỏi tế bào. Ngược lại, màu đỏ dự
đoán các chất không bị bơm ngược P-gp tác động. Các chất được dự đoán có khả
năng hấp thu thụ động qua ruột sẽ nằm trong vùng màu trắng (PSA < 142 Å2 và logP
trong khoảng -2,3—+6,8). Những chất được mô hình dự đoán là có thể hấp thu thụ
động qua hàng rào máu não sẽ nằm trong vùng màu vàng (PSA < 79 Å2 và logP từ
+0,4—+0,6).

41
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

Hình 3.3. Mô hình BOILED-Egg trên IL-1β: Trái: vị trí; A; Phải: vị trí B
Dưới: vị trí β5-β6

Hình 3.4. Mô hình BOILED-Egg trên IL-1R1: Trái: rãnh D1-D2; Phải: Vị trí D2
Từ Hình 3.3 và Hình 3.4, có thể thấy rằng tất cả các hợp chất đều nằm trong vùng
màu trắng (PSA < 142 Å2 và logP trong khoảng -2,3—+6,8). Kết quả này dự đoán
rằng tất cả các chất này đều có khả năng hấp thu thụ động qua đường uống. Tuy vậy,
chỉ một số nhỏ hợp chất nằm được trong vùng màu đỏ (PSA < 79 Å2 và logP từ
+0,4—+0,6) hoặc không chịu ảnh hưởng của bơm ngược P-gp (màu đỏ). Từ đó, có
thể nhận định rằng lượng hợp chất tiềm năng hấp thu thụ động qua hàng rào máu não

42
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

cũng như không bị ảnh hưởng của bơm ngược P-gp là khá ít, đặc biệt là những hợp
chất thoả cả 2 điều kiện này.
Kết quả những chất thoả các điều kiện đã lựa chọn trong SwissADME sẽ được tiến
hành docking trên 5 vị trí tương ứng (Bảng 3.6).
3.4. CÁC MÔ HÌNH DOCKING
Nghiên cứu thực hiện docking trên tổng cộng 5 vị trí (A, B, β5-β6, rãnh D1-D2 và
D2). Vì kết quả docking của vị trí β5-β6 được sử dụng để mô phỏng động lực học và
tính toán năng lượng gắn kết tự do nên sẽ được trình bày ở đây. Cấu trúc hoá học các
chất được sử dụng docking sẽ có trong PHỤ LỤC 15. Hình ảnh khoang docking ở 4
vị trí còn lại là A, B, rãnh D1-D2 và D2 sẽ được trình bày trong PHỤ LỤC 16.
Hình 3.5 cho thấy hình ảnh vị trí docking β5-β6 trên IL-1β. Các acid amin quan trọng
ở vị trí β5-β6 là Glu64, Lys65 và Asn66 đều được làm rõ trong hình vị trí gắn kết. Từ
Hình 3.5 có thể nhận thấy bề mặt tại vòng β5-β6 có diện tích khá nhỏ và liền mạch
(vì là 3 acid amin liền kề nhau), tạo điều kiện cho các phối tử dễ dàng gắn kết. Tuy
vậy, bề mặt này lại khá phẳng, không tạo thành khoang hay hố sâu nên các phối tử
có khả năng không thể duy trì được gắn kết lâu dài.

Hình 3.5. Vị trí docking β5-β6


Sau khi docking 102 chất (từ kết quả sàng lọc SwissADME) vào vị trí β5-β6 thu được
97/102 chất dock thành công và tạo được 968 cấu dạng. Mã số 97 chất này trong
CSDL và điểm số docking tương ứng với từng cấu dạng sẽ có trong PHỤ LỤC 17.
Hình 3.6 trình bày phân bố điểm số docking của 968 cấu dạng (97 chất) trong vị trí
β5-β6. Vị trí β5-β6 cho kết quả phân bố điểm docking âm nhất là -18,56 kJ/mol, 2
cấu dạng cho điểm số docking ≈ 0 kJ/mol. Trong đó, có 255 (26%) cấu dạng cho
điểm số docking từ -10 đến 0 kJ/mol. 587 (61%) cấu dạng cho điểm số docking từ -
15 đến -10 kJ/mol. 126 (13%) cấu dạng cho điểm số docking từ -15 đến -20 kJ/mol.
Lưu ý, kết quả docking và phân bố điểm số docking trên 4 vị trí còn lại sẽ có trong
PHỤ LỤC 18.

43
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

0
Điểm số docking (Kj/mol) -2
-4
-6
13%
-8 Từ -15 đến
-10 -20 kJ/mol
26%
-12 Từ -15 đến
-14 -10 kJ/mol
-16 61% Từ -10 đến
-18
0 kJ/mol
-20
0 500 1000
968 cấu dạng

Hình 3.6. Phân bố điểm số docking tại vị trí β5-β6


Trong số 97 chất được dock, 5 chất có điểm số docking âm nhất là MHC09481
(MBHC), SA08-1111 (CDPPI), T428-0731 (CDPPI), P634-0250 (CDPPI) và S978-
0388 (CDPPI) sẽ được trình bày sau đây, theo thứ tự điểm số docking tăng dần (từ
âm nhất đến dương nhất).
3.4.1. MHC09461
Hình 3.7 cho thấy MHC09461 của tập MBHC trên vị trí β5-β6 cũng như tương tác
acid amin của phối tử này. Đây là chất có điểm số docking âm nhất (-18,56 kJ/mol).
Phối tử này cho tương tác với đầy đủ 3 acid amin quan trọng trong khoang. Trong đó,
Glu64 tương tác với MHC09461 bằng liên kết ion và nhận hydro từ phối tử. Acid
amin Lys65 có một tương tác π-cation. Asn66 cho phối tử một hydro.

Điểm số docking: -18,56 kJ/mol


Hình 3.7. MHC09462 trên vòng β5-β6 (trái) và tương tác acid amin (phải)
3.4.2. SA08-1111
Hình 3.8 cho thấy kết quả docking của SA08-1111 (CDPPI) trên vị trí β5-β6. Điểm
số docking của phối tử này chỉ lớn hơn MHC09481 0,01 kJ/mol. Phối tử này cho
tương tác với cả 3 acid amin. Trong đó, acid amin cho nhiều tương tác nhất là Glu64,

44
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

với phối tử cho liên kết hydro và có liên kết ion. Lys65 chỉ cho tương tác van der
Waals. Asn 66 có tương tác π-hydro với phối tử. Ngoài ra, phối tử này còn tương tác
van der Waals với Pro87, Glu37 và Gln38 trong khoang gắn kết.

Điểm số docking: -18,55 kJ/mol


Hình 3.8. SA08-1111 trên vòng β5-β6 (trái) và tương tác acid amin (phải)
3.4.3. T428-0731
Hình 3.9 là kết quả docking phối tử T428-0731 của tập CDPPI trên vòng β5-β6. Phối
tử này có điểm số docking không chênh lệch nhiều với phối tử MHC09481, với điểm
là -18,11 kJ/mol. Phối tử T428-0731 cho tương tác với cả 3 acid amin quan trọng
trong khoang gắn kết. Cụ thể, Glu64 có tương tác nhận hydro và liên kết ion với phối
tử. Lys65 cho tương tác van der Waals. Asn66 có tương tác cho và nhận hydro với
phối tử. Ngoài ra, một acid amin không quan trọng là Lys63 lại nhận hydro từ phối
tử.

Điểm số docking: -18,11 kJ/mol


Hình 3.9. T428-0731 trên vòng β5-β6 (trái) và tương tác acid amin (phải)
3.4.4. P634-0250
Hình 3.10 là hình ảnh docking của phối tử P634-0250 của tập CDPPI trên vòng β5-
β6. Phối tử này có điểm số docking là -17,72 kJ/mol, chênh lệch gần -1 kJ/mol so với
phối tử có điểm âm nhất (MHC09461). Phối tử này tương tác cũng với cả 3 acid amin
quan trong. Với Glu64, phối tử có tương tác cho hydro và liên kết ion. Với Lys65,
phối tử cho liên kết hydro. Với Asn66, phối tử chỉ cho tương tác van der Waals. Các

45
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

acid amin khác không quan trọng có tương tác với P634-0250 là Met20, Gln39 và
Leu62. Trong đó, Met20, Gln39 và Leu62 đều nhận một hydro từ phối tử.

Điểm số docking: -17,72 kJ/mol


Hình 3.10. P634-0250 trên vòng β5-β6 (trái) và tương tác acid amin (phải)
3.4.5. S978-0388
Hình 3.11 biểu diễn phối tử S978-0388 của tập CDPPI trên vòng β5-β6 của IL-1β.
Điểm số docking của phối tử này là -17,43 kJ/mol, chênh lệch không lớn so với phối
tử P634-0250. Phối tử này cũng cho tương tác với đầy đủ 3 acid amin Glu64, Lys65
và Asn66. Cụ thể, acid amin Glu64 có liên kết ion và nhận hydro từ phối tử. Lys65
có tương tác π-cation với phối tử. Asn66 thì cho phối tử một hydro và tương tác π-
hydro với phối tử.

Điểm số docking: -17,43 kJ/mol


Hình 3.11. S978-0388 trên vòng β5-β6 (trái) và tương tác acid amin (phải)
3.5. PHÂN TÍCH DẤU VÂN TAY TƯƠNG TÁC PROTEIN-PHỐI TỬ
Như đã trình bày ở mục 2.5, để đảm bảo tất cả các chất được dock tương tác hết với
các acid amin trong vòng β5-β6, nghiên cứu sử dụng phương pháp phân tích dấu vân
tay tương tác giữa protein-phối tử (PLIF). Trong số 938 cấu dạng (của 97 chất) được

46
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

dock, chỉ những cấu dạng tương tác với cả 3 acid amin quan trọng trong β5-β6 (Glu65,
Lys65 và Asn66) được giữ lại.
Kết quả phân tích PLIF đã thu được 618 cấu dạng của 75 chất và loại được 22 chất.
Hình 3.12 là lý giải cũng như kết quả sàng lọc bằng phương pháp PLIF từ MOE
2015.10. Kết quả từ MOE được trích xuất và sử dụng tính năng filter của phần mềm
Excel. Cụ thể, ở 3 cột (cột J, Kvà L) chứa thông tin tương tác với acid amin lần lượt
là Glu64, Lys65 và Asn66, các cấu dạng không có tương tác sẽ bị bỏ ra ngoài. Sau
đó, cột điểm số docking (B) sẽ được xếp theo thứ tự từ nhỏ đến lớn (âm nhất đến
dương nhất).

Các acid amin quan trọng

Điểm số docking (Xếp từ âm nhất


đến dương nhất)

Số thự tự cấu dạng docking

Kết quả thu được 618/968 cấu dạng

Hình 3.12. Kết quả và lý giải phân tích PLIF trên β5-β6
Hình 3.13 biểu diễn tương tác 618 cấu dạng của 75 chất này trên các acid amin tại vị
trí docking β5-β6. Từ kết quả có thể thấy rằng, phân tích PLIF đã thu về tất cả các
cấu dạng có tương tác với 3 acid amin quan trọng (Glu64, Lys65 và Asn66). Ngoài
ra, phân tích PLIF còn cho thấy các cấu dạng này còn tương tác với các acid amin
khác như Lys63, Lys84 và Pro87 với một tỷ lệ khá thấp (< 20% tổng cấu dạng). Mã
số 75 chất này trong CSDL và điểm số docking tương ứng với từng cấu dạng sẽ có
trong PHỤ LỤC 19.

47
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

600

500

618 cấu dạng


400

300

200

100

6
3

37

39

64

7
20

n6
u6
o2

s6

s6

s8

o8
lu

ln

lu
et

Ly

Ly

Ly
As
Le
Pr

Pr
G

G
M

Acid amin

Hình 3.13. Dấu vân tay tương tác acid amin với 618 cấu dạng trên vị trí β5-β6
Sau khi phân tích PLIF và còn 75 chất tương tác với tất cả acid amin quan trọng trên
vòng β5-β6 của IL-1β, 5 chất có điểm số docking âm nhất sẽ được sử dụng để tiến
hành mô phỏng động lực học và tính toán năng lượng gắn kết tự do để đánh giá sâu
hơn khả năng gắn kết. Sau khi đánh giá PLIF, 5 chất có điểm số docking âm nhất vẫn
lần lượt là MHC09461 (tập MBHC) và 4 chất từ tập CDPPI là SA08-1111, T428-
0731, P634-0250 và S978-0388. Năm chất này đã được trình bày tương tác protein-
phối tử ở mục từ 3.4.1 đến 3.4.5.
3.6. ĐÁNH GIÁ MÔ PHỎNG ĐỘNG LỰC HỌC
Năm phối tử được sử dụng để mô phỏng động lực học đều có tương tác với tất cả các
acid amin quan trọng tại vị trí β5-β6 của IL-1β. Ngoài ra, đây là 5 chất có điểm số
docking âm nhất. Mã của 5 phối tử lần lượt là MHC09461 (MBHC), 4 chất từ tập
CDPPI là SA08-1111, T428-0731, P634-0250 và S978-0388. Cấu trúc 5 phối tử này
được trình bày ở Bảng 3.7. Theo cột tính chất hoá học có thể thấy rằng tất cả các cấu
trúc này đều thoả mãn các tiêu chí để được làm một thuốc phân tử nhỏ (theo luật 5-
Lipinski [37]).

48
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

Bảng 3.7. Cấu trúc hoá học và tính chất của 5 chất hit
Điểm số Tính
STT Mã Cấu trúc docking chất hoá
(kJ/mol) học
MWa:
401,50
MHC09461 N N
N LogPb:
1 -18,56
(C22H35N5O2) N O N 1,99
O HBAc: 5
HBDd: 0
MW:
383,49
SA08-1111 LogP:
5 N N
N N -18,55
(C21H29N5O2) 0,72
O
HN HBA: 7
O
HBD: 1
MW:
N 403,56
T428-0731 LogP:
2 N
H
N N O N -18,11
(C21H37N7O) N 1,69
N
H HBA: 5
HBD: 2
N N
MW:
NH 403, 56
O
P634-0250 LogP:
3 N -17,72
(C21H37N7O) N N
1,72
HBA: 5
NH
HBD: 2
MW:
O 412,53
S978-0388 N N LogP:
4 O -17,43
(C22H32N4O3) O 2,50
+HN NH+
HBA: 7
HBD: 0
a) Khối lượng phân tử. b) Hệ số phân bố dầu-nước, lấy từ CSDL của chất; c) Số nhóm
nhận liên kết hydro d) Số nhóm cho liên kết hydro

49
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

3.6.1. Độ ổn định của protein tự do và phức hợp


Để đảm bảo các thiết lập thông số mô phỏng động lực học cũng như cấu trúc của
protein là ổn định trong suốt thời gian mô phỏng, cần phải khảo sát giá trị RMSD.
Nếu giá trị này < 2,0 Å nghĩa là protein tự do hoặc phức hợp protein-phối tử ổn định
và kết quả động lực học có ý nghĩa [60]. Năm phức hợp protein-phối tử cũng như
protein tự do khi chồng lên nhau trong Hình 3.14 cho thấy sự tương đồng về giá trị
RMSD. Tất cả đều cho thấy độ ổn định chấp nhận được trong khoảng thời gian mô
phỏng động lực học (20 ns), biểu thị qua đường RMSD nằm ngang và không có xu
hướng tăng. RMSD nhìn chung dao động nằm trong khoảng từ 0,1-0,21 (Hình 3.14).
RMSD của các phối tử so với protein tự do sẽ được trình bày trong PHỤ LỤC 20.

0,25

0,2
RMSD (nm)

0,15 Protein
MHC09461
0,1 T428-0731
P634-0250
0,05 S978-0388
SA08-1111
0
0

0
0

00

00

00

00

50

00

50

00
25

50

75

10

12

15

17

20

Thời gian (ps)

Hình 3.14. RMSD của protein tự do và 5 phức hợp protein-phối tử


3.6.2. Khả năng duy trì cấu trúc không gian của protein
Khi hình dung một khối cầu có khối lượng bằng và trọng tâm trùng với protein đang
xét, bán kính xoay (Rg) khi đó của protein bằng bán kính của khối cầu này. Tuỳ theo
kích thước và độ nén của protein mà bán kính xoay này sẽ có độ dài khác nhau [61].
Mục đích xét bán kính xoay của protein tự do và phức hợp protein-ligand là để xem
khả năng duy trì cấu trúc không gian của protein trong suốt thời gian mô phỏng động
lực học. Khi protein không duy trì được bán kính xoay nghĩa là cấu trúc không gian
của protein này không ổn định. Ngược lại, bán kính xoay không tăng hoặc có xu
hướng giảm nghĩa là protein đang có cấu trúc không gian ổn định và kết quả động
lực học có ý nghĩa.

50
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

Kết quả từ Hình 3.15 khi xếp chồng bán kính xoay (Rg) của protein tự do và của
phức hợp protein-ligand cho thấy các đường này gần như chồng lên nhau và đều nằm
ngang. Giá trị Rg tuy dao động nhưng vẫn nằm ổn định trong khoảng từ 1,27 đến
1,32 nm trong suốt 20 ns. Kết quả này có thể nhận xét rằng cấu trúc không gian của
tất cả các protein (tự do hay phức hợp) đều được duy trì ổn định trong suốt quá trình
động lực học diễn ra (Hình 3.15). Cấu trúc không gian của protein được giữ ổn định
cho thấy kết quả mô phỏng động lực học là có ý nghĩa.
1,33
1,32
1,31
1,3 Protein
Rg (nm)

1,29 MHC09461
1,28 T428-0731
P634-0250
1,27
S978-0388
1,26
SA08-1111
1,25
0

00

00

00

0
00

50

00

50

00
25

50

75

10

12

15

17

20

Thời gian (ps)

Hình 3.15. Bán kính xoay của protein tự do và 5 phức hợp protein-phối tử
3.6.3. Độ linh động của acid amin
RMSF là giá trị để xét độ linh động của các acid amin trong một protein. Từ kết quả
RMSF, ta có thể thấy được vùng nào của protein là ổn định hoặc không. Thông
thường, các vùng có cấu trúc xoắn ⍺ hoặc β sẽ có RMSF thấp do có mạng lưới liên
kết hydro ổn định [61]. Khá giống với RMSD, RMSF xét tính ổn định của protein
theo thời gian. Tuy vậy, RMSF sẽ cho giá trị trung bình trên từng acid amin cụ thể
thay vì là giá trị theo thời gian như RMSD.
Hình 3.16 là kết quả xếp chồng các giá trị RMSF của các acid amin trong protein tự
do và phức hợp protein-phối tử. Giá trị này chồng lấp và khá tương đồng nhau. Đặc
biệt, ở vùng β5-β6 (acid amin 64-66) nơi thực hiện mô phỏng, giá trị RMSF < 0,2.
Kết quả này chứng tỏ các acid amin ở vùng này không di chuyển nhiều và khá ổn
định trong suốt quá trình MD.

51
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

0,4
0,35
0,3
Protein
RMSF (nm)

0,25
MHC09461
0,2
T428-0731
0,15
P634-0250
0,1 S978-0388
0,05 SA08-1111
0
3 18 33 48 63 78 93 108 123 138 153
Acid amin

Hình 3.16. RMSF các acid amin của protein tự do và 5 phức hợp protein-phối tử
3.6.4. Liên kết hydro trong quá trình mô phỏng
Từ các kết quả RMSD, bán kính xoay và RMSF, ta có thể kết luận rằng protein tự do
cũng như phức hợp protein-ligand ổn định trong suốt quá trình mô phỏng. Nhờ đó, ta
có thể thực hiện tính toán các bước sau, như tính toán số liên kết hydro hoặc tính toán
năng lượng gắn kết tự do,
3.6.4.1. Số liên kết hydro theo thời gian
Số liên kết hydro theo thời gian của 5 phức hợp được biểu diễn trong Hình 3.17.
Trong đó, chất cho nhiều liên kết hydro nhất là T428-0731, với tối đa 7 liên kết hydro
mạnh. Chất P634-0250 ở khoảng 18-20 ns cho số liên kết hydro rất ít, với chỉ một
liên kết hydro được duy trì trong suốt thời gian này. Ba chất còn lại là MHC09461,
S978-0388 và SA08-1111 đều có số liên kết hydro tối đa khá giống nhau, trong
khoảng từ 4-5 liên kết. Tuy vậy, chất SA08-1111 ở cuối thời gian mô phỏng (từ 19
ns) lại có dấu hiệu không hình thành liên kết hydro nữa. Tổng kết lại, có thể thấy chất
T428-0731 có tiềm năng gắn kết tối với thụ thể nhất. Điều này sẽ được minh chứng
ở kết quả tính toán năng lượng gắn kết tự do.

52
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

MHC09461 T428-0731
4 7
6

Số liên kết H
Số liên kết H

3 5
4
2
3
1 2
1
0 0
0

0
00

50

00

50

00

0
00

50

00

50

00
25

50

75

25

50

75
10

12

15

17

20

10

12

15

17

20
Thời gian (ps) Thời gian (ps)

P634-0250
6
5
Số liên kết H

4
3
2
1
0
0 250 500 750 1000 1250 1500 1750 2000
Thời gian (ps)

S978-0388
SA08-1111
5
4
4
3
Số liên kết H

Số liên kết H

3
2
2
1
1

0
0
00

50

00

50

00
0

0
0

0
00

50

00

50

00
0

25

50

75
25

50

75

10

12

15

17

20
10

12

15

17

20

Thời gian (ps) Thời gian (ps)

Hình 3.17. Số liên kết hydro theo thời gian


3.6.4.2. Trung bình số liên kết hydro
Hình 3.18 cho thấy số liên kết hydro trung bình trên tổng thời gian mô phỏng động
lực học. Tất cả 5 phối tử đều cho tương tác với acid amin Glu64 và tương tác này
chiếm tỷ lệ cao nhất trong tất cả các acid amin. Phối tử S978-0388 có số liên kết
hydro với acid amin Glu64 nhiều nhất (2 liên kết/20 ns). Ngược lại, phối tử SA08-

53
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

1111 có liên kết với acid amin Glu64 ít nhất. Các acid amin quan trọng còn lại (Lys65,
Asn66) đều có cho liên kết với phối tử nhưng với số lượng không đáng kể.

200,00%
Trung bình số liên kết hydro

150,00% GLN38
LYS63
GLU64
100,00%
Lys65
ASN66
50,00% LEU67
TYR90

0,00%
MHC09461 T428-0731 P634-0250 S978-0388 SA08-1111
Phối tử

Hình 3.18. Trung bình số liên kết hydro


3.7. KẾT QUẢ TÍNH TOÁN NĂNG LƯỢNG TỰ DO
Kết quả tính toán năng lượng cơ học phân tử (Evdw + Eelec), năng lượng solvat hoá
phân cực, năng lượng solvat hoá không phân cực và năng lượng gắn kết tự do của 5
phức hợp được trình bày trong Bảng 3.8.
Từ bảng kết quả, ta có thể thấy năng lượng gắn kết của các phối tử có một biên độ
dao động lớn. Trừ phối tử T428-0731, tất cả 4 phối tử khác đều có biên độ dao động
gần bằng hoặc lớn hơn năng lượng trung bình. Cụ thể, ở trường hợp phối tử SA08-
1111, biên độ dao động là ± 43,224 kJ/mol, lớn hơn mức năng lượng trung bình là -
19,237 kJ/mol. Điều này chứng tỏ phối tử này đã gắn kết không hoàn toàn, thuận
nghịch tại vị trí β5-β6. 3 phối tử còn lại là MHC09481, P634-0250 và S978-0388 có
mực năng lượng gắn kết khá tương đồng nhau, lần lượt là -55,453 kJ/mol, -66,998
kJ/mol và -53,599 kJ/mol. Trong ba phối tử này, phối tử có ái lực gắn kết mạnh nhất
là P634-0250, với năng lượng trung bình âm nhất (-66,998 kJ/mol). Phối tử cuối cùng
là T428-0731 với mức năng lượng âm nhất và biên độ dao động nhỏ nhất (-120,516
± 37,671 kJ/mol) sẽ là chất gắn kết tốt nhất với IL-1β trên vị trí β5-β6. Tóm lại, từ
kết quả tính toán năng lượng gắn kết tự do, phối tử có tiềm năng gắn kết trên IL-1β
nhất là T428-0731. Phối tử này có tiềm năng để được thử nghiệm in vitro nhằm xác
định khả năng ức chế IL-1β thực tế.
Ngoài ra, kết quả tính toán năng lượng gắn kết tự do còn cho thấy điểm số docking
không tương quan với năng lượng gắn kết. Ví dụ, tuy MHC09481 có điểm số docking

54
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

âm nhất nhưng lại không phải chất có năng lượng gắn kết âm nhất. Chất T428-0731
tuy có điểm số docking chỉ nằm hạng 3 nhưng lại cho khả năng gắn kết với thụ thể
tốt nhất. Đặc biệt, SA08-1111 tuy có điểm số docking đứng top 2, nhưng kết quả tính
toán năng lượng gắn kết lại cho thấy khả năng gắn kết của phối tử này là thấp nhất
trong 5 chất. Điều này có thể do năng lượng tương tác phụ thuộc vào số lượng và các
lực tương tác trong quá trình docking. Trong đó, một số chất sẽ cho năng lượng tương
tác âm hơn vì tương tác với các thành phần hặc acid amin không có vai trò hoạt tính
sinh học trong hệ.
Bảng 3.8. Kết quả tính toán năng lượng tự do

Evdw Eelec Gphân cực Gkhông phân cực ΔGliên kết


Phối tử
(kJ/mol) (kJ/mol) (kJ/mol) (kJ/mol) (kJ/mol)

MHC0 -85,558 ± -254,485 ± 296,153 ± -11,563 ± -55,453 ±


9481 26,829 89,148 64.628 1,684 29,467

P634- -80,279 ± -230,825 ± 255,115 ± -11,009 ± -66,998 ±


0250 27,115 173,014 154,496 1,634 40,968

S978- -40,479 ± -487,592 ± 484,841 ± -10,368 ± -53,599 ±


0388 14,827 68,703 68,621 1,714 26,029

SA08- -62,720 ± -189,832 ± 242,643 ± -19,237 ±


-9,327 ± 2,582
1111 30,301 165,977 129,636 43,224

T428- -73,311 ± -465,343 ± 430,546 ± -12,408 ± -120,516 ±


0731 36,453 76,262 98,580 4,029 37,671

Hình 3.19 biểu diễn sự biến thiên năng lượng gắn kết theo thời gian của chất T428-
0731. Từ kết quả có thể thấy sự gắn kết giữa protein và phối tử này có xu hướng chặt
hơn theo thời gian (đường xu hướng màu cam đi xuống). Trong suốt quá trình gắn,
phối tử chỉ liên kết không ổn định ở khoảng thời gian 1 ns (biểu thị ở năng lượng gắn
kết > 0 kJ/mol). Suốt quãng thời gian mô phỏng còn lại, năng lượng gắn kết của phối
tử có xu hướng ngày càng âm, điều này chứng tỏ rằng phối tử liên kết ngày càng tốt
với IL-1β. Kết quả này của phối tử cho thấy T428-0738 có tiềm năng để thử in vitro
nhất trong 5 phối tử được mô phỏng động lực học.

55
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

T428-0731

-50
ΔG (kJ/mol)

-100

-150

-200

-250
0 2500 5000 7500 10000 12500 15000 17500 20000
Thời gian (ps)

Hình 3.19. Năng lượng gắn kết của T428-0731 theo thời gian
3.8. BÀN LUẬN
Để tìm kiếm chất ức chế IL-1β tiềm năng, nghiên cứu đã thực hiện sàng lọc trên 6
CSDL với tổng số chất là 22 triệu và sử dụng nhiều mô hình in silico khác nhau. Sau
khi lựa chọn một trong 5 vị trí tác động ức chế IL-1β là β5-β6 để tiến hành phân tích
kết quả docking, nghiên cứu đã chọn ra được 5 hợp chất tiềm năng nhất để mô phỏng
động lực học và đánh giá năng lượng gắn kết tự do. Trong số 5 chất này, T428-0731
từ tập ChemDiv PPI đã cho kết quả khả quan, với xu hướng gắn kết tốt hơn theo thời
gian (dựa vào giá trị năng lượng gắn kết có xu hướng âm dần). Chất T428-0731 có
thể được thử nghiệm in vitro để đánh giá khả năng ức chế IL-1β, hoặc tiến hành mô
phỏng động lực học với thời gian dài hơn nhằm tiếp tục đánh giá khả năng gắn kết.
Tuy kết quả tính toán năng lượng không được tốt như T428-0731, nhưng chất P634-
0250 cũng có tiềm năng để được thử nghiệm in vitro hoặc mô phỏng động lực học
với thời gian dài hơn. Ngoài ra, nhờ vào kết quả tính toán năng lượng gắn kết, có thể
kết luận rằng giới hạn của phương pháp đánh giá điểm số docking cũng được thể hiện,
khi mà 5 chất có điểm số docking âm nhất khi được tính toán năng lượng gắn kết tự
do lại không cho kết quả tương quan.
Nghiên cứu chưa mô phỏng động lực học và thực hiện tính toán năng lượng tự do của
4 vị trí còn lại trên IL-1β và IL-1R1. Ngoài ra, các mô hình pharmacophore trên IL-
1R1 của Lê Minh Trí [5] vẫn chưa được đánh giá để chọn ra hoặc chỉnh sửa để có
một mô hình hoàn chỉnh nhất. Đặc biệt là 6 mô hình trên IL-1R1, vốn chỉ dành cho
được 2 vị trí tác động (3 mô hình trên vị trí rãnh D1-D2 và 3 mô hình trên vị trí D2).
Nếu thực hiện được đánh giá mô hình pharmacophore trên IL-1R1, thời gian và tài
nguyên máy tính tiêu hao có thể sẽ ít hơn so với cách mà đề tài này đã thực hiện.
Không những vậy, đề tài nghiên cứu sẽ trở nên dễ hiểu hơn khi có ít mô hình

56
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

pharmacophore hơn, dẫn đến ít kết quả hơn và tránh nhầm lẫn hoặc khó hiểu cho
người đọc. Tuy vậy, tại thời điểm nghiên cứu thì tập chất ức chế IL-1R1 đã có IC50
thực nghiệm chưa có, dẫn đến việc đánh giá là không khả thi. Ngoài ra, nhược điểm
của phương pháp tính năng lượng gắn kết của nghiên cứu là khả năng tính toán của
phương pháp MM-PBSA chỉ có thể tính năng lượng gắn kết tương đối. Kết quả của
MM-PBSA chỉ nên dùng để so sánh khả năng gắn giữa các phối tử trên cùng một vị
trí với nhau chứ không nên dùng để ước tính kết quả thực nghiệm.
So với nghiên cứu trước của Lê Minh Trí [5], đề tài này đã bổ sung thêm một mô
hình pharmacophore, sàng lọc với lượng chất lớn hơn (~22 triệu so với ~7.000 chất),
bổ sung thêm bước mô phỏng động lực học cũng như tính toán năng lượng gắn kết
tự do. Tuy vậy, nhờ vào 8 mô hình pharmacophore mà Lê Minh Trí [5] đã xây dựng,
đề tài mới có thể thực hiện docking trên nhiều vị trí tiềm năng khác nhau của IL-1β
và IL-1R1.
Hiện nay, các nghiên cứu để tìm ra những phân tử nhỏ ức chế IL-1β trên thế giới vẫn
được tiến hành và sử dụng nhiều mô hình in silico khác nhau như QSAR,
pharmacophore, docking, mô phỏng động lực học gia tốc,…
Nhóm nghiên cứu của Sobia và cộng sự (Pakistan) [62] vào năm 2015 đã tiến hành
xây dựng mô hình 2D-QSAR dựa trên các chất ức chế IL-1β đã có IC50 từ nghiên cứu
của Matsuda và cộng sự (2001) [63]. Tập xây dựng 2D-QSAR gồm 48 chất, là những
dẫn xuất của 3,4-bis (4-methoxyphenyl)-pyridazine và 4,6-bis (4-methoxyphenyl)-
2H-pyridazin-3-one. Tiếp đến, Sobia đã xây dựng mô hình pharmacophore dựa trên
phối tử và docking bằng 2 phần mềm khác nhau. Kết quả docking bằng 2 phần mềm
được so để chọn ra 7 chất phân tử nhỏ tiềm năng từ 7 triệu chất tập ZINC. 7 chất phân
tử nhỏ này không được Sobia nêu rõ cấu trúc trong bài báo được đăng tải. So với đề
tài này, nghiên cứu của Sobia chỉ dừng lại ở docking, không thực hiện MD hay tính
toán năng lượng gắn kết và cũng không thử hoạt tính sinh học. Ngoài ra, lượng chất
sàng lọc của Sobia chỉ khoảng 1/3 lượng chất của đề tài (7 triệu so với 22 triệu). Tuy
vậy, nhược điểm của đề tài này khi so sánh với nghiên cứu của Sobia là không thực
hiện xây dựng mô hình 2D-QSAR dựa trên các chất ức chế IL-1β và không xây dựng
pharmacophore dựa trên các phối tử có IC50 thực nghiệm.
Khá giống với nghiên cứu của Sobia, nghiên cứu của Sakhteman và cộng sự (Iran)
[64] vào năm 2017 đã tiến hành xây dựng 8 thông số mô tả QSAR để dự đoán khả
năng ức chế hoạt động của IL-1β. Sakhteman đã dùng 48 chất của Matsuda và cộng
sự để xây dựng nên mô hình QSAR này. Tương tự như khi so sánh với nghiên cứu
của Sobia, đề tài này không xây dựng mô hình QSAR để sàng lọc các chất ức chế IL-
1β. Tuy vậy, so với đề tài này, nghiên cứu của Sakhteman không thực hiện sàng lọc
trên các tập dữ liệu mà chỉ xây dựng mô hình QSAR.

57
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận

Một nghiên cứu khác của Yang (Hoa Kỳ) năm 2015 [65] đã thực hiện mô phỏng động
lực học gia tốc trên IL-1R1 để tìm ra cấu dạng không hoạt động tiềm năng của protein
này. Yang đã tìm được 4 có chất tiềm năng ức chế IL-1 bằng cơ chế “bẫy” cấu dạng
IL-1R1 ở dạng không hoạt động. Hướng đi của tác giả Yang rất tiềm năng đối với
mục tiêu ức chế IL-1R1. Tuy vậy, phương pháp động lực học gia tốc được sử dụng
trong nghiên cứu của Yang đòi hỏi rất nhiều tài nguyên máy tính cũng như thời gian
mô phỏng. So với đề tài này, phương pháp mô phỏng động lực học và docking của
Yang khác hoàn toàn. Yang sử dụng phương pháp động lực học gia tốc trên thụ thể
IL-1R1 và docking bằng tập dữ liệu phân mảnh (fragment) với 2.783 chất. Trong khi
đó, đề tài này sử dụng phương pháp mô phỏng động lực học truyền thống trên thụ thể
IL-1β, với các chất được dock đã có khả năng được thử in vitro mà không cần thực
hiện phải tối ưu hoá chất khởi nguồn. Tuy vậy, nghiên cứu của Yang thực hiện mô
phỏng động lực học trên 5 cấu trúc kết tinh của thụ thể IL-1R1, đây là một phân tử
protein có số acid amin gấp đôi so với IL-1β mà nghiên cứu đã thực hiện. Với điều
kiện tài nguyên máy tính hiện tại, đây là điều mà nghiên cứu chưa thể thực hiện được.

58
Khoá luận tốt nghiệp DSĐH Kết luận và đề nghị

CHƯƠNG 4. KẾT LUẬN VÀ ĐỀ NGHỊ


Hiện nay, các thuốc ức chế IL-1β được phê duyệt như canakinumab, anakinra và
rilonacept vẫn là những phân tử protein kích thước lớn, không thể dùng đường uống
mà phải tiêm dưới da. Trên thị trường chưa có bất kỳ một thuốc ức chế phân tử nhỏ
nào có khả năng tác động trên IL-1β để ức chế hoạt động của cytokin này. Vì thế,
việc tìm ra một thuốc phân tử nhỏ có khả năng ức chế hoặc IL-1β, hoặc thụ thể tương
ứng là IL-1R1 là một hướng phát triển đầy tiềm năng để điều trị các bệnh như viêm
khớp dạng thấp, gout cấp và mạn, các bệnh lý tự viêm,…
Dưới tình hình đó, nghiên cứu đã tiến hành sàng lọc in silico để tìm ra các chất phân
tử nhỏ có khả năng ức chế IL-1β hoặc thụ thể tương ứng là IL-1R1, với hi vọng tìm
được một thuốc trị liệu tiềm năng. Từ 22 triệu chất của 7 cơ sở dữ liệu, đề tài đã tiến
hành xây dựng và sàng lọc pharmacophore, đánh giá ADME và docking. Với những
phương pháp trên, tổng cộng có 3 vị trí của IL-1β và 2 vị trí của IL-1R1 đã có kết quả
docking. Trong đó, kết quả docking ở 1 vị trí trên IL-1β là vòng β5-β6 được lựa chọn
để mô phỏng động lực học và tính toán năng lượng gắn kết tự do. Dựa vào kết quả
tính toán năng lượng tự do và mô phỏng động lực học, đề tài đã tìm ra được 2 phân
tử nhỏ ức chế tiềm năng IL-1β từ tập ChemDiv PPI là T428-0731 và P634-0250.
Trong đó, T428-0731 là chất tiềm năng nhất để được thử in vitro nhằm đánh giá khả
năng ức chế IL-1β thực nghiệm.
Vì đề tài còn nhiều vị trí chưa thực hiện đánh giá kết quả docking, nên nghiên cứu
nối tiếp có thể bắt đầu từ đây để tiếp tục sàng lọc các chất ức chế IL-1β tiềm năng.
Ngoài ra, có thể cải thiện thời gian mô phỏng động lực học > 20 ns để đánh giá sâu
hơn các chất ức chế tiềm năng đã có, đặc biệt là T428-0731 và P634-0250. Hơn nữa,
để kết quả tính toán năng lượng tự do được chính xác hơn, đề tài đề xuất thực hiện
tính toán năng lượng bằng phương pháp “giả kim” (Alchemical). Phương pháp tính
toán năng lượng tự do giả kim là phương pháp tính toán năng lượng tự do tuyệt đối,
đưa ra kết quả sát với thực nghiệm hơn MM-PBSA. Ngoài ra, nghiên cứu nối tiếp có
thể thực hiện đánh giá thêm độ đặc hiệu của các chất đã docking trên các cytokin
khác hoặc thụ thể khác trong họ IL-1 để đảm bảo tác động đặc hiệu trên IL-1β (hoặc
tìm ra chất tác động trên cytokin khác). Không những vậy, hiện đã có cấu trúc kết
tinh giữa gevokizumab và IL-1β. Tuy gevokizumab chưa hoàn tất thử nghiệm lâm
sàng, nhưng nghiên cứu tương tác của gevokizumab trên IL-1β cũng là một hướng đi
đầy tiềm năng.

59
Khoá luận tốt nghiệp DSĐH Tài liệu tham khảo

TÀI LIỆU THAM KHẢO


[1]. Fields, J. K.; Günther, S.; Sundberg, E. J., Structural Basis of IL-1 Family
Cytokine Signaling. Frontiers in Immunology 2019, 10 (1412).
[2]. Kaneko, N.; Kurata, M.; Yamamoto, T.; Morikawa, S.; Masumoto, J., The role
of interleukin-1 in general pathology. Inflammation and Regeneration 2019, 39 (1),
12.
[3]. Dinarello, C. A., Interleukin-1 in the pathogenesis and treatment of inflammatory
diseases. Blood 2011, 117 (14), 3720-3732.
[4]. Nigrovic, P. A. Interleukin 1 inhibitors: Biology, principles of use, and adverse
events. https://www.uptodate.com/contents/interleukin-1-inhibitors-biology-
principles-of-use-and-adverse-events.
[5]. Tri, L. M.; Minh, T. K.; Hoan, P. N. K., Study on molecular models to screen
for small molecules of potential inhibitory activity on IL-1RI receptor of interleukin-
1β (IL-1β). Tạp Chí Dược Học 2019, 513, 43-48.
[6]. Wishart, D. S.; Knox, C.; Guo, A. C.; Shrivastava, S.; Hassanali, M.; Stothard,
P.; Chang, Z.; Woolsey, J., DrugBank: a comprehensive resource for in silico drug
discovery and exploration. Nucleic Acids Res 2006, 34 (Database issue), D668-D672.
[7]. Irwin, J. J.; Shoichet, B. K., ZINC--a free database of commercially available
compounds for virtual screening. J Chem Inf Model 2005, 45 (1), 177-82.
[8]. MayBridge HitCreator. Maybridge Value Stream, Bakewell Road,
Loughborough, Leicestershire LE11 5QY, UK: 2020.
[9]. MayBridge PPI. Maybridge Value Stream, Bakewell Road, Loughborough,
Leicestershire LE11 5QY, UK: 2020.
[10]. ChemDiv Peptidomimetics. Medicinal and Computational Chemistry Dept.,
ChemDiv, Inc: 2020.
[11]. ChemDiv PPI. Medicinal and Computational Chemistry Dept., ChemDiv, Inc:
2020.
[12]. The Universal Products Database (UNDP). Peking University, B., China, Ed.
Peking University: Peking University, Beijing, China, 2015.
[13]. Benveniste, E. N., Cytokines. In Encyclopedia of the Neurological Sciences
(Second Edition), Aminoff, M. J.; Daroff, R. B., Eds. Academic Press: Oxford, 2014;
pp 921-925.
[14]. Fahey, E.; Doyle, S. L., IL-1 Family Cytokine Regulation of Vascular
Permeability and Angiogenesis. Frontiers in immunology 2019, 10, 1426-1426.
[15]. Garon, E. B.; Chih-Hsin Yang, J.; Dubinett, S. M., The Role of Interleukin 1β
in the Pathogenesis of Lung Cancer. JTO Clinical and Research Reports 2020, 1 (1),
100001.
[16]. Rhoades, R.; Pflanzer, R. G., Human physiology. 2003.
[17]. Bio-Rad Laboratories, I. What is an Anti-idiotypic antibody? https://www.bio-
rad-antibodies.com/anti-idiotypic-antibody.html (accessed 04/08/2020).
[18]. Yu, H. Analyzing antibody sequence for recombinant antibody expression.
https://www.genscript.com/gsfiles/techfiles/Analyzing_antibody_sequence_for_rec
ombinant_antibody_expression.pdf (accessed 04/08/2020).

60
Khoá luận tốt nghiệp DSĐH Tài liệu tham khảo

[19]. Berman, H.; Henrick, K.; Nakamura, H., Announcing the worldwide Protein
Data Bank. Nature Structural & Molecular Biology 2003, 10 (12), 980-980.
[20]. Rondeau, J.-M.; Ramage, P.; Zurini, M.; Gram, H., The molecular mode of
action and species specificity of canakinumab, a human monoclonal antibody
neutralizing IL-1β. mAbs 2015, 7 (6), 1151-1160.
[21]. Sanders, M. P. A.; McGuire, R.; Roumen, L.; de Esch, I. J. P.; de Vlieg, J.;
Klomp, J. P. G.; de Graaf, C., From the protein's perspective: the benefits and
challenges of protein structure-based pharmacophore modeling. MedChemComm
2012, 3 (1), 28-38.
[22]. Dong, J.; Wang, N.-N.; Yao, Z.-J.; Zhang, L.; Cheng, Y.; Ouyang, D.; Lu,
A.-P.; Cao, D.-S., ADMETlab: a platform for systematic ADMET evaluation based
on a comprehensively collected ADMET database. Journal of Cheminformatics 2018,
10 (1), 29.
[23]. Krüger, A.; Gonçalves Maltarollo, V.; Wrenger, C.; Kronenberger, T., ADME
Profiling in Drug Discovery and a New Path Paved on Silica. In Drug Discovery and
Development - New Advances, 2020.
[24]. Kukol, A., Molecular modeling of proteins. 2008.
[25]. Schlick, T., Molecular modeling and simulation: an interdisciplinary guide: an
interdisciplinary guide. Springer Science & Business Media: 2010; Vol. 21.
[26]. Hollingsworth, S. A.; Dror, R. O., Molecular Dynamics Simulation for All.
Neuron 2018, 99 (6), 1129-1143.
[27]. Abraham, M.; Hess, B.; Spoel, D. v. d.; Lindahl., E. GROMACS Reference
Manual. ftp://ftp.gromacs.org/pub/manual/manual-2018.pdf (accessed 05/08/2020).
[28]. Homeyer, N.; Gohlke, H., Free Energy Calculations by the Molecular
Mechanics Poisson−Boltzmann Surface Area Method. Molecular Informatics 2012,
31 (2), 114-122.
[29]. Molecular Operating Environment (MOE), 2015.10; Chemical Computing
Group ULC, Montreal, QC, Canada: 2020.
[30]. Daina, A.; Michielin, O.; Zoete, V., SwissADME: a free web tool to evaluate
pharmacokinetics, drug-likeness and medicinal chemistry friendliness of small
molecules. Scientific Reports 2017, 7 (1), 42717.
[31]. LeadIT, BioSolveIT GmbH, Sankt Augustin, Germany, 2016: 2020.
[32]. Abraham, M. J.; Murtola, T.; Schulz, R.; Páll, S.; Smith, J. C.; Hess, B.;
Lindahl, E., GROMACS: High performance molecular simulations through multi-
level parallelism from laptops to supercomputers. SoftwareX 2015, 1-2, 19-25.
[33]. MacKerell, A. D.; Bashford, D.; Bellott, M.; Dunbrack, R. L.; Evanseck, J.
D.; Field, M. J.; Fischer, S.; Gao, J.; Guo, H.; Ha, S.; Joseph-McCarthy, D.;
Kuchnir, L.; Kuczera, K.; Lau, F. T. K.; Mattos, C.; Michnick, S.; Ngo, T.; Nguyen,
D. T.; Prodhom, B.; Reiher, W. E.; Roux, B.; Schlenkrich, M.; Smith, J. C.; Stote,
R.; Straub, J.; Watanabe, M.; Wiórkiewicz-Kuczera, J.; Yin, D.; Karplus, M., All-
Atom Empirical Potential for Molecular Modeling and Dynamics Studies of Proteins.
The Journal of Physical Chemistry B 1998, 102 (18), 3586-3616.

61
Khoá luận tốt nghiệp DSĐH Tài liệu tham khảo

[34]. Mackerell, A. D., Jr.; Feig, M.; Brooks, C. L., 3rd, Extending the treatment of
backbone energetics in protein force fields: limitations of gas-phase quantum
mechanics in reproducing protein conformational distributions in molecular
dynamics simulations. J Comput Chem 2004, 25 (11), 1400-15.
[35]. Kumari, R.; Kumar, R.; Lynn, A., g_mmpbsa—A GROMACS Tool for High-
Throughput MM-PBSA Calculations. Journal of Chemical Information and
Modeling 2014, 54 (7), 1951-1962.
[36]. Koes, D. R.; Camacho, C. J., ZINCPharmer: pharmacophore search of the ZINC
database. Nucleic Acids Res 2012, 40 (Web Server issue), W409-W414.
[37]. Lipinski, C. A.; Lombardo, F.; Dominy, B. W.; Feeney, P. J., Experimental
and computational approaches to estimate solubility and permeability in drug
discovery and development settings. Advanced Drug Delivery Reviews 1997, 23 (1),
3-25.
[38]. Daina, A.; Zoete, V., A BOILED-Egg To Predict Gastrointestinal Absorption
and Brain Penetration of Small Molecules. ChemMedChem 2016, 11 (11), 1117-1121.
[39]. Daina, A.; Michielin, O.; Zoete, V., iLOGP: A Simple, Robust, and Efficient
Description of n-Octanol/Water Partition Coefficient for Drug Design Using the
GB/SA Approach. Journal of Chemical Information and Modeling 2014, 54 (12),
3284-3301.
[40]. Baell, J. B.; Holloway, G. A., New Substructure Filters for Removal of Pan
Assay Interference Compounds (PAINS) from Screening Libraries and for Their
Exclusion in Bioassays. Journal of Medicinal Chemistry 2010, 53 (7), 2719-2740.
[41]. Brenk, R.; Schipani, A.; James, D.; Krasowski, A.; Gilbert, I. H.; Frearson,
J.; Wyatt, P. G., Lessons learnt from assembling screening libraries for drug
discovery for neglected diseases. ChemMedChem 2008, 3 (3), 435-44.
[42]. Ghose, A. K.; Viswanadhan, V. N.; Wendoloski, J. J., A knowledge-based
approach in designing combinatorial or medicinal chemistry libraries for drug
discovery. 1. A qualitative and quantitative characterization of known drug databases.
J Comb Chem 1999, 1 (1), 55-68.
[43]. Veber, D. F.; Johnson, S. R.; Cheng, H. Y.; Smith, B. R.; Ward, K. W.;
Kopple, K. D., Molecular properties that influence the oral bioavailability of drug
candidates. J Med Chem 2002, 45 (12), 2615-23.
[44]. Egan, W. J.; Merz, K. M., Jr.; Baldwin, J. J., Prediction of drug absorption
using multivariate statistics. J Med Chem 2000, 43 (21), 3867-77.
[45]. Muegge, I.; Heald, S. L.; Brittelli, D., Simple selection criteria for drug-like
chemical matter. J Med Chem 2001, 44 (12), 1841-6.
[46]. SYBYL-X 2.0, Tripos L.P.: St. Louis, MO, USA, 2011.
[47]. Jasper, J. B.; Humbeck, L.; Brinkjost, T.; Koch, O., A novel interaction
fingerprint derived from per atom score contributions: exhaustive evaluation of
interaction fingerprint performance in docking based virtual screening. Journal of
Cheminformatics 2018, 10 (1), 15.
[48]. Brewerton, S., The use of protein-ligand interaction fingerprints in docking.
Current opinion in drug discovery & development 2008, 11, 356-64.

62
Khoá luận tốt nghiệp DSĐH Tài liệu tham khảo

[49]. Hanwell, M. D.; Curtis, D. E.; Lonie, D. C.; Vandermeersch, T.; Zurek, E.;
Hutchison, G. R., Avogadro: an advanced semantic chemical editor, visualization,
and analysis platform. Journal of Cheminformatics 2012, 4 (1), 17.
[50]. Schrödinger, L. The PyMOL Molecular Graphics System, 1.2r3pre; 2020.
[51]. Reva, B. A.; Finkelstein, A. V.; Skolnick, J., What is the probability of a chance
prediction of a protein structure with an rmsd of 6 å? Folding and Design 1998, 3 (2),
141-147.
[52]. Ruczinski, I. Protein Folding and Structure Prediction - A Statistician’s View.
http://biostat.jhsph.edu/~iruczins/presentations/ruczinski.05.03.rutgers.pdf
(accessed 05/08/2020).
[53]. Jülich, F. Analysis of MD Simulations.
http://www.drugdesign.gr/uploads/7/6/0/2/7602318/lecture_mdanalysis.pdf
(accessed 05/08/2020).
[54]. Kumar, C. V.; Swetha, R. G.; Anbarasu, A.; Ramaiah, S., Computational
Analysis Reveals the Association of Threonine 118 Methionine Mutation in PMP22
Resulting in CMT-1A. Adv Bioinformatics 2014, 2014, 502618-502618.
[55]. Sundar, S.; Thangamani, L.; Manivel, G.; Kumar, P.; Piramanayagam, S.,
Molecular docking, molecular dynamics and MM/PBSA studies of FDA approved
drugs for protein kinase a of Mycobacterium tuberculosis; application insights of
drug repurposing. Informatics in Medicine Unlocked 2019, 16, 100210.
[56]. Humphrey, W.; Dalke, A.; Schulten, K., VMD: visual molecular dynamics. J
Mol Graph 1996, 14 (1), 33-8, 27-8.
[57]. Handbook of nanofabrication. 1st ed. ed.; Wiederrecht, G. P., Ed. Elsevier:
Amsterdam ;, 2010.
[58]. Brooks, B. R.; Bruccoleri, R. E.; Olafson, B. D.; States, D. J.; Swaminathan,
S.; Karplus, M., CHARMM: A program for macromolecular energy, minimization,
and dynamics calculations. Journal of Computational Chemistry 1983, 4 (2), 187-
217.
[59]. Kollman, P. A.; Massova, I.; Reyes, C.; Kuhn, B.; Huo, S.; Chong, L.; Lee,
M.; Lee, T.; Duan, Y.; Wang, W.; Donini, O.; Cieplak, P.; Srinivasan, J.; Case,
D. A.; Cheatham, T. E., 3rd, Calculating structures and free energies of complex
molecules: combining molecular mechanics and continuum models. Acc Chem Res
2000, 33 (12), 889-97.
[60]. Desmond 4.2 User manual.
http://gohom.win/ManualHom/Schrodinger/Schrodinger_2015-
2_docs/desmond/desmond_user_manual.pdf (accessed 06/08/2020).
[61]. Roccatano, D., A Short Introduction to the Molecular Dynamics Simulation of
Nanomaterials. 2018; pp 123-155.
[62]. Halim, S. A.; Jawad, M.; Ilyas, M.; Mir, Z.; Mirza, A. A.; Husnain, T., In
silico identification of novel IL-1β inhibitors to target protein–protein interfaces.
Computational Biology and Chemistry 2015, 58, 158-166.

63
Khoá luận tốt nghiệp DSĐH Tài liệu tham khảo

[63]. Matsuda, T.; Aoki, T.; Ohgiya, T.; Koshi, T.; Ohkuchi, M.; Shigyo, H.,
Synthesis and bioactivities of novel pyridazine derivatives: inhibitors of interleukin-
1 beta (IL-1beta) production. Bioorg Med Chem Lett 2001, 11 (17), 2369-72.
[64]. Sakhteman, A.; Edraki, N.; Hemmateenejad, B.; Miri, R.; Foroumadi, A.;
Shafiee, A.; Khoshneviszadeh, M., In Silico Screening of IL-1β Production Inhibitors
Using Chemometric Tools. Iran J Pharm Res 2017, 16 (2), 513-524.
[65]. Yang, C. Y., Identification of potential small molecule allosteric modulator sites
on IL-1R1 ectodomain using accelerated conformational sampling method. PLoS
One 2015, 10 (2), e0118671.

64
Khoá luận tốt nghiệp DSĐH Phụ lục

DANH MỤC PHỤ LỤC


PHỤ LỤC 1. Lệnh mô phỏng động lực học .............................................................. 2
PHỤ LỤC 2. Thông số tệp ions.mdp ......................................................................... 4
PHỤ LỤC 3. Thông số tệp em.mdp........................................................................... 5
PHỤ LỤC 4. Thông số tệp nvt.mdp (100 ps) ............................................................ 6
PHỤ LỤC 5. Thông số tệp npt.mdp (100 ps) ............................................................ 8
PHỤ LỤC 6. Thông số tệp md.mdp (20 ns, 2000 khung hình) ............................... 10
PHỤ LỤC 7. Các lệnh phân tích kết quả mô phỏng động lực học .......................... 12
PHỤ LỤC 8. Các lệnh tính toán năng lượng gắn kết tự do ..................................... 13
PHỤ LỤC 9. Thông số tệp polar.mdp ..................................................................... 14
PHỤ LỤC 10. Thông số tệp apolar.mdp ................................................................. 18
PHỤ LỤC 11. Thông số tệp MmPbSaStat.py chứa lệnh Python............................. 22
PHỤ LỤC 12. Hình ảnh 9 mô hình pharmacophore trên MOE 2015.10 ................ 34
PHỤ LỤC 14. Kết quả sàng lọc pharmacophore trên ZINCPhamermer ................. 37
PHỤ LỤC 15. Kết quả sàng lọc từng mô hình pharmacophore trên 6 CSDL ......... 38
PHỤ LỤC 16. Cấu trúc các phối tử được dùng docking trên 5 vị trí ...................... 39
PHỤ LỤC 17. Hình ảnh khoang docking ................................................................ 39
PHỤ LỤC 18. Danh sách 97 chất đã dock thành công trên vị trí β5-β6.................. 41
PHỤ LỤC 19. Kết quả docking trên 4 vị trí còn lại ................................................ 41
PHỤ LỤC 20. Danh sách 75 chất thoả phân tích PLIF trên β5-β6.......................... 41
PHỤ LỤC 21. Hình ảnh RMSD các phối tử xếp chồng trên RMSD protein tự do . 42
PHỤ LỤC 22. Kết quả MD ..................................................................................... 43
PHỤ LỤC 23. Kết quả tính toán năng lượng tự do ................................................. 44

PL.1
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 1. Lệnh mô phỏng động lực học


Tạo topology cho protein
gmx pdb2gmx -f protein.pdb -o protein_processed.gro -ignh
> 8: CHARMM27 all-atom force field (CHARM22 plus CMAP for
proteins)
> 1: TIP3P TIP 3-point, recommended
Tạo topology cho phối tử
gmx editconf -f ligand.pdb -o ligand.gro
Tạo hộp và solvat hoá
gmx editconf -f complex.gro -o newbox.gro -bt dodecahedron
-d 1.0
gmx solvate -cp newbox.gro -cs spc216.gro -p topol.top -
o solv.gro
Thêm ion và trung hoà điện tích
gmx grompp -f ions.mdp -c solv.gro -p topol.top -o
ions.tpr
gmx genion -s ions.tpr -o solv_ions.gro -p topol.top -
pname NA -nname CL -neutral
> 15 SOL
Tối thiểu hoá năng lượng
gmx grompp -f em.mdp -c solv_ions.gro -p topol.top -o
em.tpr
gmx mdrun -v -deffnm em
Ràng buộc phối tử
gmx make_ndx -f ligand.gro -o index_ligand.ndx
...
> 0 & ! a H
> q

gmx genrestr -f ligand.gro -n index_ligand.ndx -o


posre_ligand.itp -fc 1000 1000 1000
> 3 (System_&_1H*)
Điều chỉnh nhiệt độ (Thermostat)
gmx make_ndx -f em.gro -o index.ndx
> 1 | 13
> q
Cân bằng dung môi và ion
gmx grompp -f nvt.mdp -c em.gro -r em.gro -p topol.top -
n index.ndx -o nvt.tpr

PL.2
Khoá luận tốt nghiệp DSĐH Phụ lục

gmx mdrun -deffnm nvt -v


gmx grompp -f nvt.mdp -c em.gro -r em.gro -p topol.top -
n index.ndx -o nvt.tpr
gmx mdrun -deffnm nvt -v
Mô phỏng động lực học
gmx grompp -f md.mdp -c npt.gro -t npt.cpt -p topol.top
-n index.ndx -o md_0_20.tpr
gmx mdrun -deffnm md_0_20 -v

PL.3
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 2. Thông số tệp ions.mdp


; LINES STARTING WITH ';' ARE COMMENTS
title = Minimization ; Title of run

; Parameters describing what to do, when to stop and what


to save
integrator = steep ; Algorithm (steep =
steepest descent minimization)
emtol = 1000.0 ; Stop minimization when
the maximum force < 10.0 kJ/mol
emstep = 0.01 ; Energy step size
nsteps = 50000 ; Maximum number of
(minimization) steps to perform

; Parameters describing how to find the neighbors of each


atom and how to calculate the interactions
nstlist = 1 ; Frequency to update the
neighbor list and long range forces
cutoff-scheme = Verlet
ns_type = grid ; Method to determine
neighbor list (simple, grid)
rlist = 1.0 ; Cut-off for making neighbor
list (short range forces)
coulombtype = cutoff ; Treatment of long range
electrostatic interactions
rcoulomb = 1.0 ; long range electrostatic cut-off
rvdw = 1.0 ; long range Van der Waals cut-off
pbc = xyz ; Periodic Boundary
Conditions

PL.4
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 3. Thông số tệp em.mdp


; LINES STARTING WITH ';' ARE COMMENTS
title = Minimization ; Title of run

; Parameters describing what to do, when to stop and what


to save
integrator = steep ; Algorithm (steep =
steepest descent minimization)
emtol = 1000.0 ; Stop minimization when
the maximum force < 10.0 kJ/mol
emstep = 0.01 ; Energy step size
nsteps = 50000 ; Maximum number of
(minimization) steps to perform

; Parameters describing how to find the neighbors of each


atom and how to calculate the interactions
nstlist = 1 ; Frequency to update
the neighbor list and long range forces
cutoff-scheme = Verlet
ns_type = grid ; Method to
determine neighbor list (simple, grid)
rlist = 1.2 ; Cut-off for making
neighbor list (short range forces)
coulombtype = PME ; Treatment of long range
electrostatic interactions
rcoulomb = 1.2 ; long range electrostatic
cut-off
vdwtype = cutoff
vdw-modifier = force-switch
rvdw-switch = 1.0
rvdw = 1.2 ; long range Van der Waals
cut-off
pbc = xyz ; Periodic Boundary
Conditions
DispCorr = no

PL.5
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 4. Thông số tệp nvt.mdp (100 ps)


title = Protein-ligand complex NVT
equilibration
define = -DPOSRES ; position restrain
the protein and ligand
; Run parameters
integrator = md ; leap-frog integrator
nsteps = 50000 ; 2 * 50000 = 100 ps
dt = 0.002 ; 2 fs
; Output control
nstenergy = 500 ; save energies every 1.0
ps
nstlog = 500 ; update log file every
1.0 ps
nstxout-compressed = 500 ; save coordinates every
1.0 ps
; Bond parameters
continuation = no ; first dynamics run
constraint_algorithm = lincs ; holonomic constraints
constraints = h-bonds ; bonds to H are
constrained
lincs_iter = 1 ; accuracy of LINCS
lincs_order = 4 ; also related to
accuracy
; Neighbor searching and vdW
cutoff-scheme = Verlet
ns_type = grid ; search neighboring
grid cells
nstlist = 20 ; largely irrelevant
with Verlet
rlist = 1.2
vdwtype = cutoff
vdw-modifier = force-switch
rvdw-switch = 1.0
rvdw = 1.2 ; short-range van der
Waals cutoff (in nm)
; Electrostatics
coulombtype = PME ; Particle Mesh Ewald
for long-range electrostatics

PL.6
Khoá luận tốt nghiệp DSĐH Phụ lục

rcoulomb = 1.2 ; short-range


electrostatic cutoff (in nm)
pme_order = 4 ; cubic interpolation
fourierspacing = 0.16 ; grid spacing for
FFT
; Temperature coupling
tcoupl = V-rescale ;
modified Berendsen thermostat
tc-grps = Protein_LIG Water_and_ions ;
two coupling groups - more accurate
tau_t = 0.1 0.1 ;
time constant, in ps
ref_t = 300 300 ;
reference temperature, one for each group, in K
; Pressure coupling
pcoupl = no ; no pressure coupling
in NVT
; Periodic boundary conditions
pbc = xyz ; 3-D PBC
; Dispersion correction is not used for proteins with the
C36 additive FF
DispCorr = no
; Velocity generation
gen_vel = yes ; assign velocities
from Maxwell distribution
gen_temp = 300 ; temperature for
Maxwell distribution
gen_seed = -1 ; generate a random
seed

PL.7
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 5. Thông số tệp npt.mdp (100 ps)


title = Protein_LIG complex NPT
equilibration
define = -DPOSRES ; position restrain
the protein and ligand
; Run parameters
integrator = md ; leap-frog integrator
nsteps = 50000 ; 2 * 50000 = 100 ps
dt = 0.002 ; 2 fs
; Output control
nstenergy = 500 ; save energies every
1.0 ps
nstlog = 500 ; update log file
every 1.0 ps
nstxout-compressed = 500 ; save coordinates
every 1.0 ps
; Bond parameters
continuation = yes ; continuing from NVT
constraint_algorithm = lincs ; holonomic constraints
constraints = h-bonds ; bonds to H are
constrained
lincs_iter = 1 ; accuracy of LINCS
lincs_order = 4 ; also related to
accuracy
; Neighbor searching and vdW
cutoff-scheme = Verlet
ns_type = grid ; search neighboring
grid cells
nstlist = 20 ; largely irrelevant
with Verlet
rlist = 1.2
vdwtype = cutoff
vdw-modifier = force-switch
rvdw-switch = 1.0
rvdw = 1.2 ; short-range van der
Waals cutoff (in nm)
; Electrostatics
coulombtype = PME ; Particle Mesh Ewald
for long-range electrostatics

PL.8
Khoá luận tốt nghiệp DSĐH Phụ lục

rcoulomb = 1.2
pme_order = 4 ; cubic interpolation
fourierspacing = 0.16 ; grid spacing for
FFT
; Temperature coupling
tcoupl = V-rescale ;
modified Berendsen thermostat
tc-grps = Protein_LIG Water_and_ions ;
two coupling groups - more accurate
tau_t = 0.1 0.1 ;
time constant, in ps
ref_t = 300 300 ;
reference temperature, one for each group, in K
; Pressure coupling
pcoupl = Berendsen ;
pressure coupling is on for NPT
pcoupltype = isotropic ;
uniform scaling of box vectors
tau_p = 2.0 ;
time constant, in ps
ref_p = 1.0 ;
reference pressure, in bar
compressibility = 4.5e-5 ;
isothermal compressibility of water, bar^-1
refcoord_scaling = com
; Periodic boundary conditions
pbc = xyz ; 3-D PBC
; Dispersion correction is not used for proteins with the
C36 additive FF
DispCorr = no
; Velocity generation
gen_vel = no ; velocity generation
off after NVT

PL.9
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 6. Thông số tệp md.mdp (20 ns, 2000 khung hình)
title = Protein_LIG complex MD simulation
; Run parameters
integrator = md ; leap-frog integrator
nsteps = 10000000 ; 2 * 10000000 =
20000 ps (20 ns)
dt = 0.002 ; 2 fs
; Output control
nstenergy = 5000 ; save energies every
10.0 ps
nstlog = 5000 ; update log file
every 10.0 ps
nstxout-compressed = 5000 ; save coordinates
every 10.0 ps
; Bond parameters
continuation = yes ; continuing from NPT
constraint_algorithm = lincs ; holonomic constraints
constraints = h-bonds ; bonds to H are
constrained
lincs_iter = 1 ; accuracy of LINCS
lincs_order = 4 ; also related to
accuracy
; Neighbor searching and vdW
cutoff-scheme = Verlet
ns_type = grid ; search neighboring
grid cells
nstlist = 20 ; largely irrelevant
with Verlet
rlist = 1.2
vdwtype = cutoff
vdw-modifier = force-switch
rvdw-switch = 1.0
rvdw = 1.2 ; short-range van der
Waals cutoff (in nm)
; Electrostatics
coulombtype = PME ; Particle Mesh Ewald
for long-range electrostatics
rcoulomb = 1.2
pme_order = 4 ; cubic interpolation

PL.10
Khoá luận tốt nghiệp DSĐH Phụ lục

fourierspacing = 0.16 ; grid spacing for


FFT
; Temperature coupling
tcoupl = V-rescale ;
modified Berendsen thermostat
tc-grps = Protein_LIG Water_and_ions ;
two coupling groups - more accurate
tau_t = 0.1 0.1 ;
time constant, in ps
ref_t = 300 300 ;
reference temperature, one for each group, in K
; Pressure coupling
pcoupl = Parrinello-Rahman ;
pressure coupling is on for NPT
pcoupltype = isotropic ;
uniform scaling of box vectors
tau_p = 2.0 ;
time constant, in ps
ref_p = 1.0 ;
reference pressure, in bar
compressibility = 4.5e-5 ;
isothermal compressibility of water, bar^-1
; Periodic boundary conditions
pbc = xyz ; 3-D PBC
; Dispersion correction is not used for proteins with the
C36 additive FF
DispCorr = no
; Velocity generation
gen_vel = no ; continuing from NPT
equilibration

PL.11
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 7. Các lệnh phân tích kết quả mô phỏng động lực học
RMSD
gmx rms -s md_0_20.tpr -f md_0_20_fit.xtc -n index.ndx -
o rmsd.xvg
Khi được hỏi chọn phân tử để lấy làm tham chiếu (Select group for least squares fit),
chọn 4 (backbone) cho protein và 23 (LIG_NonH) cho phối tử. Chọn tương tự 4 hoặc
23 cho protein hoặc phối tử khi được hỏi chọn phân tử để thực hiện tính toán (Select
group for RMSD calculation).
Bán kính quay (radius of gyration)
gmx gyrate -f md_0_20_fit.xtc -s md_0_20.tpr -o
gyrate_protein.xvg
> 1 Protein
RMSF
gmx rmsf -f md_0_20_fit.xtc -s md_0_20.tpr -res -o
rmsf.xvg -n index.ndx
Có thể chọn 3 (C⍺) để xem độ linh động acid amin của protein hoặc 24 (LIG_&_!H)
để xem độ linh động từng nguyên tử trong phối tử.

PL.12
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 8. Các lệnh tính toán năng lượng gắn kết tự do
Tính toán thế năng cơ học phân tử:
g_mmpbsa -f md_0_20_fit.xtc -s md_0_20.tpr -n index.ndx -
pdie 2 -decomp
> 1
> 13
Trong đó, 1 là protein và 13 là ligand.
Tính toán năng lượng solvat hoá phân cực
g_mmpbsa -f md_0_20_fit.xtc -s md_0_20.tpr -i polar.mdp -
n index.ndx -nomme -pbsa -decomp -pol polar.xvg -pcon
contrib_pol.dat
> 1
> 13
Tương tự, 1 và protein và 13 là ligand.
Tính toán năng lượng solvat hoá không phân cực
g_mmpbsa -f md_0_20_fit.xtc -s md_0_20.tpr -n index.ndx -
i apolar_sasa.mdp -nomme -pbsa -decomp -apol
apolar_sasa.xvg -apcon sasa_contrib.dat
> 1 Protein
> 13 Ligand
Lựa chọn 1 và 13 lần lượt là protein và ligand.
Tính toán năng lượng gắn kết tự do
python MmPbSaStat.py -m energy_MM.xvg -p polar.xvg -a
apolar_sasa.xvg

PL.13
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 9. Thông số tệp polar.mdp


;Polar calculation: "yes" or "no"
polar = yes

;=============
;PSIZE options
;=============
;Factor by which to expand molecular dimensions to get
coarsegrid dimensions.
cfac = 1.5

;The desired fine mesh spacing (in A)


gridspace = 0.5

:Amount (in A) to add to molecular dimensions to get fine


grid dimensions.
fadd = 5

;Maximum memory (in MB) available per-processor for a


calculation.
gmemceil = 4000

;=============================================
;APBS kwywords for polar solvation calculation
;=============================================
;Charge of positive ions
pcharge = 1

;Radius of positive charged ions


prad = 0.95

;Concentration of positive charged ions


pconc = 0.150

;Charge of negative ions


ncharge = -1

;Radius of negative charged ions


nrad = 1.81

PL.14
Khoá luận tốt nghiệp DSĐH Phụ lục

;Concentration of negative charged ions


nconc = 0.150

;Solute dielectric constant


pdie = 2

;Solvent dielectric constant


sdie = 80

;Reference or vacuum dielectric constant


vdie = 1

;Solvent probe radius


srad = 1.4

;Method used to map biomolecular charges on grid. chgm =


spl0 or spl2 or spl4
chgm = spl4

;Model used to construct dielectric and ionic boundary.


srfm = smol or spl2 or spl4
srfm = smol

;Value for cubic spline window. Only used in case of srfm


= spl2 or spl4.
swin = 0.30

;Numebr of grid point per A^2. Not used when (srad = 0.0)
or (srfm = spl2 or spl4)
sdens = 10

;Temperature in K
temp = 300

;Type of boundary condition to solve PB equation. bcfl =


zero or sdh or mdh or focus or map
bcfl = mdh

PL.15
Khoá luận tốt nghiệp DSĐH Phụ lục

;Non-linear (npbe) or linear (lpbe) PB equation to solve


PBsolver = lpbe

;=======================================================
=
;APBS kwywords for Apolar/Non-polar solvation calculation
;=======================================================
=
;Non-polar solvation calculation: "yes" or "no"
apolar = no

;Repulsive contribution to Non-polar


;===SASA model ====

;Gamma (Surface Tension) kJ/(mol A^2)


gamma = 0.0226778

;Probe radius for SASA (A)


sasrad = 1.4

;Offset (c) kJ/mol


sasaconst = 3.84928

;===SAV model===
;Pressure kJ/(mol A^3)
press = 0

;Probe radius for SAV (A)


savrad = 0

;Offset (c) kJ/mol


savconst = 0

;Attractive contribution to Non-polar


;===WCA model ====
;using WCA method: "yes" or "no"

PL.16
Khoá luận tốt nghiệp DSĐH Phụ lục

WCA = no

;Probe radius for WCA


wcarad = 1.20

;bulk solvent density in A^3


bconc = 0.033428

;displacment in A for surface area derivative calculation


dpos = 0.05

;Quadrature grid points per A for molecular surface or


solvent accessible surface
APsdens = 20

;Quadrature grid spacing in A for volume integral


calculations
grid = 0.45 0.45 0.45

;Parameter to construct solvent related surface or volume


APsrfm = sacc

;Cubic spline window in A for spline based surface


definitions
APswin = 0.3

;Temperature in K
APtemp = 300

PL.17
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 10. Thông số tệp apolar.mdp


;Polar calculation: "yes" or "no"
polar = no

;=============
;PSIZE options
;=============
;Factor by which to expand molecular dimensions to get
coarsegrid dimensions.
cfac = 1.5

;The desired fine mesh spacing (in A)


gridspace = 0.5

:Amount (in A) to add to molecular dimensions to get fine


grid dimensions.
fadd = 5

;Maximum memory (in MB) available per-processor for a


calculation.
gmemceil = 4000

;=============================================
;APBS kwywords for polar solvation calculation
;=============================================
;Charge of positive ions
pcharge = 1

;Radius of positive charged ions


prad = 0.95

;Concentration of positive charged ions


pconc = 0.150

;Charge of negative ions


ncharge = -1

;Radius of negative charged ions


nrad = 1.81

PL.18
Khoá luận tốt nghiệp DSĐH Phụ lục

;Concentration of negative charged ions


nconc = 0.150

;Solute dielectric constant


pdie = 2

;Solvent dielectric constant


sdie = 80

;Reference or vacuum dielectric constant


vdie = 1

;Solvent probe radius


srad = 1.4

;Method used to map biomolecular charges on grid. chgm =


spl0 or spl2 or spl4
chgm = spl4

;Model used to construct dielectric and ionic boundary.


srfm = smol or spl2 or spl4
srfm = smol

;Value for cubic spline window. Only used in case of srfm


= spl2 or spl4.
swin = 0.30

;Numebr of grid point per A^2. Not used when (srad = 0.0)
or (srfm = spl2 or spl4)
sdens = 10

;Temperature in K
temp = 300

;Type of boundary condition to solve PB equation. bcfl =


zero or sdh or mdh or focus or map
bcfl = mdh

PL.19
Khoá luận tốt nghiệp DSĐH Phụ lục

;Non-linear (npbe) or linear (lpbe) PB equation to solve


PBsolver = lpbe

;=======================================================
=
;APBS kwywords for Apolar/Non-polar solvation calculation
;=======================================================
=
;Non-polar solvation calculation: "yes" or "no"
apolar = yes

;Repulsive contribution to Non-polar


;===SASA model ====

;Gamma (Surface Tension) kJ/(mol A^2)


gamma = 0.0226778

;Probe radius for SASA (A)


sasrad = 1.4

;Offset (c) kJ/mol


sasaconst = 3.84928

;===SAV model===
;Pressure kJ/(mol A^3)
press = 0

;Probe radius for SAV (A)


savrad = 0

;Offset (c) kJ/mol


savconst = 0

;Attractive contribution to Non-polar


;===WCA model ====
;using WCA method: "yes" or "no"

PL.20
Khoá luận tốt nghiệp DSĐH Phụ lục

WCA = no

;Probe radius for WCA


wcarad = 1.20

;bulk solvent density in A^3


bconc = 0.033428

;displacment in A for surface area derivative calculation


dpos = 0.05

;Quadrature grid points per A for molecular surface or


solvent accessible surface
APsdens = 20

;Quadrature grid spacing in A for volume integral


calculations
grid = 0.45 0.45 0.45

;Parameter to construct solvent related surface or volume


APsrfm = sacc

;Cubic spline window in A for spline based surface


definitions
APswin = 0.3

;Temperature in K
APtemp = 300

PL.21
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 11. Thông số tệp MmPbSaStat.py chứa lệnh Python


#!/usr/bin/python
#
# This file is part of g_mmpbsa.
#
# Authors: Rashmi Kumari and Andrew Lynn
# Contribution: Rajendra Kumar
#
# Copyright (C) 2013-2015 Rashmi Kumari and Andrew Lynn
#
# g_mmpbsa is free software: you can redistribute it
and/or modify
# it under the terms of the GNU General Public License as
published by
# the Free Software Foundation, either version 3 of the
License, or
# (at your option) any later version.
#
# g_mmpbsa is distributed in the hope that it will be
useful,
# but WITHOUT ANY WARRANTY; without even the implied
warranty of
# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
See the
# GNU General Public License for more details.
#
# You should have received a copy of the GNU General
Public License
# along with g_mmpbsa. If not, see
<http://www.gnu.org/licenses/>.
#
# THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND
CONTRIBUTORS
# "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING,
BUT NOT
# LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY
AND FITNESS FOR
# A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL
THE COPYRIGHT OWNER OR

PL.22
Khoá luận tốt nghiệp DSĐH Phụ lục

# CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,


INCIDENTAL, SPECIAL,
# EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
LIMITED TO,
# PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF
USE, DATA, OR
# PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
ON ANY THEORY OF
# LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR
TORT (INCLUDING
# NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE
USE OF THIS
# SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH
DAMAGE.
#
#
#

from __future__ import absolute_import, division,


print_function
from builtins import range
from builtins import object

import re
import sys
import numpy as np
import argparse
import os
import math

def main():
args = ParseOptions()
#File => Frame wise component energy
try:
frame_wise = open(args.outfr, 'w')
except:
raise IOError ('Could not open file {0} for
writing. \n' .format(args.outfr))

PL.23
Khoá luận tốt nghiệp DSĐH Phụ lục

frame_wise.write('#Time
E_VdW_mm(Protein)\tE_Elec_mm(Protein)\tE_Pol(Protein)\tE
_Apol(Protein)\tE_VdW_mm(Ligand)\tE_Elec_mm(Ligand)\tE_P
ol(Ligand)\tE_Apol(Ligand)\tE_VdW_mm(Complex)\tE_Elec_mm
(Complex)\tE_Pol(Complex)\tE_Apol(Complex)\tDelta_E_mm\t
Delta_E_Pol\tDelta_E_Apol\tDelta_E_binding\n')
#Complex Energy
c = []
if args.multiple:
MmFile, PolFile, APolFile =
ReadMetafile(args.metafile)
for i in range(len(MmFile)):
cTmp =
Complex(MmFile[i],PolFile[i],APolFile[i])
cTmp.CalcEnergy(args,frame_wise,i)
c.append(cTmp)
else:
cTmp =
Complex(args.molmech,args.polar,args.apolar)
cTmp.CalcEnergy(args,frame_wise,0)
c.append(cTmp)
#Summary in output files => "--outsum" and "--
outmeta" file options
Summary_Output_File(c, args)

class Complex(object):
def __init__(self,MmFile,PolFile,APolFile):
self.TotalEn = []
self.Vdw, self.Elec, self.Pol, self.Sas,
self.Sav, self.Wca =[], [], [], [], [], []
self.MmFile = MmFile
self.PolFile = PolFile
self.APolFile = APolFile
self.AvgEnBS = []
self.CI = []
self.FinalAvgEnergy = 0
self.StdErr = 0

PL.24
Khoá luận tốt nghiệp DSĐH Phụ lục

def CalcEnergy(self,args,frame_wise,idx):
mmEn = ReadData(self.MmFile,n=7)
polEn = ReadData(self.PolFile,n=4)
apolEn = ReadData(self.APolFile,n=10)
CheckEnData(mmEn,polEn,apolEn)

time, MM, Vdw, Elec, Pol, Apol, Sas, Sav, Wca =


[], [], [], [], [], [], [], [], []
for i in range(len(mmEn[0])):
#Vacuum MM
Energy = mmEn[5][i] + mmEn[6][i] -
(mmEn[1][i] + mmEn[2][i] + mmEn[3][i] + mmEn[4][i])
MM.append(Energy)
Energy = mmEn[5][i] - (mmEn[1][i] +
mmEn[3][i])
Vdw.append(Energy)
Energy = mmEn[6][i] - (mmEn[2][i] +
mmEn[4][i])
Elec.append(Energy)
# Polar
Energy = polEn[3][i] - (polEn[1][i] +
polEn[2][i])
Pol.append(Energy)
#Non-polar
Energy = apolEn[3][i] + apolEn[6][i] +
apolEn[9][i] - (apolEn[1][i] + apolEn[2][i] +
apolEn[4][i] + apolEn[5][i] + apolEn[7][i] +
apolEn[8][i])
Apol.append(Energy)
Energy = apolEn[3][i] - (apolEn[1][i] +
apolEn[2][i])
Sas.append(Energy)
Energy = apolEn[6][i] - (apolEn[4][i] +
apolEn[5][i])
Sav.append(Energy)
Energy = apolEn[9][i] - (apolEn[7][i] +
apolEn[8][i])

PL.25
Khoá luận tốt nghiệp DSĐH Phụ lục

Wca.append(Energy)
#Final Energy
time.append(mmEn[0][i])
Energy = MM[i] + Pol[i] + Apol[i]
self.TotalEn.append(Energy)

# Writing frame wise component energy to file


frame_wise.write('\n#Complex %d\n' % ( (idx+1)))
for i in range(len(time)):

frame_wise.write('%15.3lf %15.3lf %15.3lf %15.3lf %


15.3lf' % (time[i], mmEn[1][i], mmEn[2][i], polEn[1][i],
(apolEn[1][i] + apolEn[4][i] + apolEn[7][i])))

frame_wise.write('%15.3lf %15.3lf %15.3lf %15.3lf'


% (mmEn[3][i], mmEn[4][i], polEn[2][i],
(apolEn[2][i] + apolEn[5][i] + apolEn[8][i])))

frame_wise.write('%15.3lf %15.3lf %15.3lf %15.3lf'


% (mmEn[5][i], mmEn[6][i], polEn[3][i],
(apolEn[3][i] + apolEn[6][i] + apolEn[9][i])))

frame_wise.write('%15.3lf %15.3lf %15.3lf %15.3lf\n


' % (MM[i], Pol[i], Apol[i], self.TotalEn[i]))

#Bootstrap analysis energy components


if(args.bootstrap):
bsteps = args.nbstep
avg_energy, error = BootStrap(Vdw,bsteps)
self.Vdw.append(avg_energy)
self.Vdw.append(error)
avg_energy, error = BootStrap(Elec,bsteps)
self.Elec.append(avg_energy)
self.Elec.append(error)
avg_energy, error = BootStrap(Pol,bsteps)
self.Pol.append(avg_energy)
self.Pol.append(error)
avg_energy, error = BootStrap(Sas,bsteps)

PL.26
Khoá luận tốt nghiệp DSĐH Phụ lục

self.Sas.append(avg_energy)
self.Sas.append(error)
avg_energy, error = BootStrap(Sav,bsteps)
self.Sav.append(avg_energy)
self.Sav.append(error)
avg_energy, error = BootStrap(Wca,bsteps)
self.Wca.append(avg_energy)
self.Wca.append(error)
#Bootstrap => Final Average Energy
self.AvgEnBS, AvgEn, EnErr, CI =
ComplexBootStrap(self.TotalEn,bsteps)
self.FinalAvgEnergy = AvgEn
self.StdErr = EnErr
self.CI = CI
#If not bootstrap then average and standard
deviation
else:
self.Vdw.append(np.mean(Vdw))
self.Vdw.append(np.std(Vdw))
self.Elec.append(np.mean(Elec))
self.Elec.append(np.std(Elec))
self.Pol.append(np.mean(Pol))
self.Pol.append(np.std(Pol))
self.Sas.append(np.mean(Sas))
self.Sas.append(np.std(Sas))
self.Sav.append(np.mean(Sav))
self.Sav.append(np.std(Sav))
self.Wca.append(np.mean(Wca))
self.Wca.append(np.std(Wca))
self.FinalAvgEnergy =
np.mean(self.TotalEn)
self.StdErr = np.std(self.TotalEn)

def Summary_Output_File(AllComplex,args):
try:
fs = open(args.outsum,'w')
except:

PL.27
Khoá luận tốt nghiệp DSĐH Phụ lục

raise IOError ('Could not open file {0} for


writing. \n' .format(args.outsum))

if args.multiple:
try:
fm = open(args.outmeta,'w')
except:
raise IOError ('Could not open file {0} for
writing. \n' .format(args.outmeta))
fm.write('#
Complex_Number\t\tTotal_Binding_Energy\t\tError\n')

for n in range(len(AllComplex)):
fs.write('\n\n#Complex Number: %4d\n' % (n+1))
fs.write('===============\n SUMMARY
\n===============\n\n')
fs.write('\n van der Waal energy = %15.3lf
+/- %7.3lf kJ/mol\n' % (AllComplex[n].Vdw[0],
AllComplex[n].Vdw[1]))
fs.write('\n Electrostattic energy = %15.3lf
+/- %7.3lf kJ/mol\n' %
(AllComplex[n].Elec[0],AllComplex[n].Elec[1]))
fs.write('\n Polar solvation energy = %15.3lf
+/- %7.3lf kJ/mol\n' % (AllComplex[n].Pol[0],
AllComplex[n].Pol[1]))
fs.write('\n SASA energy = %15.3lf
+/- %7.3lf kJ/mol\n' % (AllComplex[n].Sas[0],
AllComplex[n].Sas[1]))
fs.write('\n SAV energy = %15.3lf
+/- %7.3lf kJ/mol\n' % (AllComplex[n].Sav[0],
AllComplex[n].Sav[1]))
fs.write('\n WCA energy = %15.3lf
+/- %7.3lf kJ/mol\n' % (AllComplex[n].Wca[0],
AllComplex[n].Wca[1]))
fs.write('\n Binding energy = %15.3lf
+/- %7.3lf kJ/mol\n' % (AllComplex[n].FinalAvgEnergy,
AllComplex[n].StdErr))

PL.28
Khoá luận tốt nghiệp DSĐH Phụ lục

fs.write('\n===============\n END
\n===============\n\n')

if args.multiple:
fm.write('%5d %15.3lf %7.3lf\n' % (n+1 ,
AllComplex[n].FinalAvgEnergy, AllComplex[n].StdErr))

def CheckEnData(mmEn,polEn,apolEn):
frame = len(mmEn[0])
for i in range(len(mmEn)):
if(len(mmEn[i]) != frame):
raise ValueError("In MM file, size of
columns are not equal.")

for i in range(len(polEn)):
if(len(polEn[i]) != frame):
raise ValueError("In Polar file, size of
columns are not equal.")

for i in range(len(apolEn)):
if(len(apolEn[i]) != frame):
raise ValueError("In APolar file, size of
columns are not equal.")

def ParseOptions():
parser = argparse.ArgumentParser()
parser.add_argument("-mt", "--multiple", help='If
given, calculate for multiple complexes. Need Metafile
containing path of energy files', action="store_true")
parser.add_argument("-mf", "--metafile",
help='Metafile containing path to energy files of each
complex in a row obtained from g_mmpbsa in following
order: \

[MM file] [Polar file] [ Non-polar file] ',action="store",


default='metafile.dat', metavar='metafile.dat')

PL.29
Khoá luận tốt nghiệp DSĐH Phụ lục

parser.add_argument("-m", "--molmech", help='Vacuum


Molecular Mechanics energy file obtained from
g_mmpbsa',action="store", default='energy_MM.xvg',
metavar='energy_MM.xvg')
parser.add_argument("-p", "--polar", help='Polar
solvation energy file obtained from
g_mmpbsa',action="store",default='polar.xvg',
metavar='polar.xvg')
parser.add_argument("-a", "--apolar", help='Non-
Polar solvation energy file obtained from
g_mmpbsa',action="store",default='apolar.xvg',metavar='a
polar.xvg')
parser.add_argument("-bs", "--bootstrap", help='If
given, Enable Boot Strap analysis',action="store_true")
parser.add_argument("-nbs", "--nbstep", help='Number
of boot strap steps for average energy
calculation',action="store", type=int, default=500,
metavar=500)
parser.add_argument("-of", "--outfr", help='Energy
File: All energy components frame
wise',action="store",default='full_energy.dat',
metavar='full_energy.dat')
parser.add_argument("-os", "--outsum", help='Final
Energy File: Full Summary of energy
components',action="store",default='summary_energy.dat',
metavar='summary_energy.dat')
parser.add_argument("-om", "--outmeta", help='Final
Energy File for Multiple Complexes: Complex wise final
binding
nergy',action="store",default='meta_energy.dat',metavar=
'meta_energy.dat')

if len(sys.argv) < 2:
print('ERROR: No input files. Need help!!!')
parser.print_help()
sys.exit(1)

args = parser.parse_args()

PL.30
Khoá luận tốt nghiệp DSĐH Phụ lục

if args.multiple:
if not os.path.exists(args.metafile):
print('\nERROR: {0} not
found....\n' .format(args.metafile))
parser.print_help()
sys.exit(1)
else:
if not os.path.exists(args.molmech):
print('\nERROR: {0} not
found....\n' .format(args.molmech))
parser.print_help()
sys.exit(1)
if not os.path.exists(args.polar):
print('\nERROR: {0} not
found....\n' .format(args.polar))
parser.print_help()
sys.exit(1)
if not os.path.exists(args.apolar):
print('\nERROR: {0} not
found....\n' .format(args.apolar))
parser.print_help()
sys.exit(1)

return args

def ReadData(FileName,n=2):
try:
infile = open(FileName,'r')
except:
raise IOError('Could not open file {0} for
reading. \n' .format(FileName))

x, data = [],[]
for line in infile:
line = line.rstrip('\n')
if not line.strip():
continue

PL.31
Khoá luận tốt nghiệp DSĐH Phụ lục

if(re.match('#|@',line)==None):
temp = line.split()
data.append(np.array(temp))
for j in range(0,n):
x_temp =[]
for i in range(len(data)):
try:
value = float(data[i][j])
except:
raise FloatingPointError('\nCould not
convert {0} to floating point number.. Something is wrong
in {1}..\n' .format(data[i][j], FileName))

x_temp.append(value)
x.append(x_temp)
return x

def ComplexBootStrap(x,step=1000):
avg =[]
x = np.array(x)
n = len(x)
idx = np.random.randint(0,n,(step,n))
sample_x = x[idx]
avg = np.sort(np.mean(sample_x,1))
CI_min = avg[int(0.005*step)]
CI_max = avg[int(0.995*step)]
#print('Energy = %13.3f; Confidance Interval = (-%-
5.3f / +%-5.3f)\n' % (np.mean(avg), (np.mean(avg)-CI_min),
(CI_max-np.mean(avg))))
return avg, np.mean(avg), np.std(avg),
[(np.mean(avg)-CI_min), (CI_max-np.mean(avg))]

def BootStrap (x,step=1000):


if(np.mean(x)) == 0:
return 0.000, 0.000
else:
avg =[]
x = np.array(x)

PL.32
Khoá luận tốt nghiệp DSĐH Phụ lục

n = len(x)
idx = np.random.randint(0,n,(step,n))
sample_x = x[idx]
avg = np.sort(np.mean(sample_x,1))
return np.mean(avg),np.std(avg)

def find_nearest_index(array,value):
idx = (np.abs(array-value)).argmin()
return idx

def ReadMetafile(metafile):
MmFile,PolFile, APolFile = [], [], []
FileList = open(metafile,'r')
for line in FileList:
line = line.rstrip('\n')
if not line.strip():
continue
temp = line.split()
MmFile.append(temp[0])
PolFile.append(temp[1])
APolFile.append(temp[2])

if not os.path.exists(temp[0]):
raise IOError('Could not open file {0} for
reading. \n' .format(temp[0]))

if not os.path.exists(temp[1]):
raise IOError('Could not open file {0} for
reading. \n' .format(temp[1]))

if not os.path.exists(temp[2]):
raise IOError('Could not open file {0} for
reading. \n' .format(temp[2]))

return MmFile, PolFile, APolFile

if __name__=="__main__":
main()

PL.33
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 12. Hình ảnh 9 mô hình pharmacophore trên MOE 2015.10
Mô hình Ph-IL1β–β5_β6:

Mô hình Ph-IL1β–A:

Mô hình Ph-IL1β–B:

PL.34
Khoá luận tốt nghiệp DSĐH Phụ lục

Mô hình Ph-IL1R1-a1:

Mô hình Ph-IL1R1-a2:

Mô hình Ph-IL1R1-a3:

PL.35
Khoá luận tốt nghiệp DSĐH Phụ lục

Mô hình Ph-IL1R1-b1:

Mô hình Ph-IL1R1-b2:

Mô hình Ph-IL1R1-b3:

PL.36
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 13. Kết quả sàng lọc pharmacophore trên ZINCPhamermer
Kết quả sàng trên Xoá trùng lặp &
Vị trí tác động Mô hình
ZINCPharmer 5-Lipinski
A: Ph-IL1β-A [5] 1.772 227
B: Ph-IL1β-B [5] 1.195 239
IL-1β
β5-β6: Ph-1L1β-
39 8
β5_β6
Rãnh D1-D2 2.218
Ph-IL1R1-a1 [5] 32
119
Ph-IL1R1-a2 [5] 158
Ph-IL1R1-a3 [5] 2.028
IL-1R1
D2 25.675
Ph-IL1R1-b1 [5] 90
4.694
Ph-IL1R1-b2 [5] 25.526
Ph-IL1R1-b3 [5] 59

PL.37
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 14. Kết quả sàng lọc từng mô hình pharmacophore trên 6 CSDL
Tổng
CSDL (và số chất đầu vào)
(chất)
MBHC MBPPI CDPM CDPPI UNDP DB
279.35
Vị trí sàng lọc (13.809 (7.774 (12.318 (215.32 (22.126 (7.999
5
chất) chất) chất) 9 chất) chất) chất)
A: Ph-
IL1R1- 3 10 23 152 128 316
A
B: Ph-
IL1R1- 12 40 174 603 154 983
IL-1β
B
β5-β6:
Ph-
3 30 66 365 14 74 552
IL1R1-
β5-β6
Rãnh
16 101 294 1129 506 2.046
D1-D2
Ph-
IL1R1- 10 84 121 395 324
a1
Ph-
IL1R1- 0 5 116 280 94
a2
Ph-
IL1R1- 7 29 93 549 224
IL1-R1 a3
D2 67 127 121 866 440 1.621
Ph-
IL1R1- 5 1 6 15 89
b1
Ph-
IL1R1- 3 5 4 32 308
b2
Ph-
IL1R1- 59 122 115 830 117
b3

PL.38
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 15. Cấu trúc các phối tử được dùng docking trên 5 vị trí
Truy cập vào đường dẫn: https://bit.ly/3fERkKp
Thư mục Docking_ligands
Tệp *.sdf chứa cấu trúc các phối tử đã được chuẩn bị bằng Sybyl X-2.0

PHỤ LỤC 16. Hình ảnh khoang docking


Vị trí A trên IL-1β:

Vị trí B trên IL-1β:

PL.39
Khoá luận tốt nghiệp DSĐH Phụ lục

Vị trí rãnh D1-D2 trên IL-1R1:

Vị trí D2 trên IL-1R1:

Truy cập vào đường dẫn: https://bit.ly/3fERkKp


Thư mục Docking_sites chứa cấu trúc protein đã được chuẩn bị để tiến hành docking.

PL.40
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 17. Danh sách 97 chất đã dock thành công trên vị trí β5-β6
Truy cập vào đường dẫn: https://bit.ly/3fERkKp
Tệp Site-β5_β6-97

PHỤ LỤC 18. Kết quả docking trên 4 vị trí còn lại
Truy cập vào đường dẫn: https://bit.ly/3fERkKp
Thư mục Docking_results chứa kết quả docking trên 4 vị trí còn lại dưới dạng tệp
*.fxx và *.sdf

PHỤ LỤC 19. Danh sách 75 chất thoả phân tích PLIF trên β5-β6
Truy cập vào đường dẫn: https://bit.ly/3fERkKp
Thư mục Docking_results
Tệp PLIF-β5_β6-75

PL.41
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 20. Hình ảnh RMSD các phối tử xếp chồng trên RMSD protein tự do
MHC09461
0,3

0,25
RMSD (nm)

0,2

0,15

0,1

0,05

0
0 2500 5000 7500 10000 12500 15000 17500 20000
Thời gian (ps)

Protein MHC09461

T428-0731
0,3

0,25
RMSD (nm)

0,2

0,15

0,1

0,05

0
0 2500 5000 7500 10000 12500 15000 17500 20000
Thời gian (ps)

Protein T428-0731

PL.42
Khoá luận tốt nghiệp DSĐH Phụ lục

P634-0250
0,4
0,35
0,3
RMSD (nm)

0,25
0,2
0,15
0,1
0,05
0
0 2500 5000 7500 10000 12500 15000 17500 20000
Thời gian (ps)

Protein P634-0250

S978-0388
0,25

0,2
RMSD (nm)

0,15

0,1

0,05

0
0 2500 5000 7500 10000 12500 15000 17500 20000
Thời gian (ps)

Protein S978-0388

SA08-1111
0,35
0,3
0,25
RMSD (nm)

0,2
0,15
0,1
0,05
0
0 2500 5000 7500 10000 12500 15000 17500 20000
Thời gian (ps)

Protein SA08-1111

PL.43
Khoá luận tốt nghiệp DSĐH Phụ lục

PHỤ LỤC 21. Kết quả MD


Truy cập vào đường dẫn: https://bit.ly/3fERkKp
Thư mục MD_result

PHỤ LỤC 22. Kết quả tính toán năng lượng tự do


Truy cập vào đường dẫn: https://bit.ly/3fERkKp
Thư mục Binding_E_Result

PL.44

You might also like