Professional Documents
Culture Documents
SÀNG LỌC IN SILICO CÁC PHÂN TỬ NHỎ CÓ TIỀM NĂNG GẮN KẾT
INTERLEUKIN-1β VÀ THỤ THỂ INTERLEUKIN-1
SÀNG LỌC IN SILICO CÁC PHÂN TỬ NHỎ CÓ TIỀM NĂNG GẮN KẾT
INTERLEUKIN-1β VÀ THỤ THỂ INTERLEUKIN-1
Tên đề tài khóa luận: Sàng lọc in silico các phân tử nhỏ có tiềm năng gắn kết
Interleukin-1β và thụ thể Interleukin-1
Họ và tên sinh viên: NGUYỄN HOÀNG MINH
Giảng viên hướng dẫn: PGS. TS. Thái Khắc Minh; GS. TS. Trần Thành Đạo
Khóa luận đã được bổ sung, sửa chữa các nội dung sau:
1. Chỉnh sửa, bổ sung và loại bỏ một số hình ảnh, bảng biểu
2. Bổ sung phụ lục
3. Sửa lỗi hành văn
Giảng viên hướng dẫn Giảng viên phản biện Chủ tịch hội đồng
XÁC NHẬN CỦA GIẢNG VIÊN HƯỚNG DẪN
CHO PHÉP SINH VIÊN NỘP KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Giảng viên hướng dẫn: PGS. TS. THÁI KHẮC MINH
GS. TS. TRẦN THÀNH ĐẠO
Đơn vị: Khoa Dược – Đại học Y Dược Thành phố Hồ Chí Minh
Tên đề tài hướng dẫn: Sàng lọc in silico các phân tử nhỏ có tiềm năng gắn kết
Interleukin-1β và thụ thể Interleukin-1
Sinh viên thực hiện đề tài: NGUYỄN HOÀNG MINH
Lớp: Dược chính quy 2015
Mã số sinh viên: 511156155
Tôi xin xác nhận sinh viên Nguyễn Hoàng Minh đã hoàn thành đề tài và cho phép
nộp khóa luận tốt nghiệp cho Khoa.
Giảng viên hướng dẫn
i
SÀNG LỌC IN SILICO CÁC PHÂN TỬ NHỎ CÓ TIỀM NĂNG GẮN KẾT
INTERLEUKIN-1β VÀ THỤ THỂ INTERLEUKIN-1
Nguyễn Hoàng Minh
Giảng viên hướng dẫn: PGS. TS. Thái Khắc Minh, GS. TS. Trần Thành Đạo
Đặt vấn đề
IL-1β là một cytokin thuộc thành viên họ IL-1. Khi kết hợp với thụ thể chính IL-1R1,
IL-1β có vai trò chuyên biệt điều hoà các phản ứng viêm trong cơ thể. Trong các bệnh
lý như viêm khớp dạng thấp, gout hay các bệnh tự viêm thường đi kèm với sự biểu
hiện quá mức của IL-1β. Do đó, việc ức chế IL-1β hoặc thụ thể IL-1R1 là một liệu
pháp tiềm năng trong điều trị các bệnh lý trên. Đề tài này được thực hiện với mục tiêu
sàng lọc 22 triệu chất của 7 CSDL khác nhau để tìm các phân tử nhỏ có tiềm năng ức
chế IL-1β hoặc thụ thể IL-1R1.
Đối tượng và phương pháp nghiên cứu
Đối tượng nghiên cứu: CSDL ZINC, MBHC, MBPPI, CDPPI, CDPM, UNDP, DB;
cấu trúc kết tinh IL-1β với canakinumab (5BVP), IL-1β tự do (9ILB), IL-1R1 với IL-
1β (1ITB); 8 mô hình pharmacophore cho các chất ức chế trên IL-1β và IL-1R1 từ
nghiên cứu của Lê Minh Trí, 2019.
Phương pháp nghiên cứu: Xây dựng mô hình 3D-pharmacophore bằng MOE 2015.10,
sàng lọc pharmacopore trên ZINCPharmer và MOE 2015.10, docking phân tử bằng
LeadIT 2.1.8, mô phỏng động lực học bằng GROMACS 2020.2 và tính toán năng
lượng gắn kết tự do bằng g_mmpbsa 5.1.2.
Kết quả và bàn luận
Sàng lọc 3D-pharmacophore đã thu được 2.235 chất trên IL-1β và 8.480 chất trên IL-
1R1. Đánh giá ADME thu được 202 và 1.054 chất lần lượt trên IL-1β và IL-1R1.
Bằng điểm số docking và tương tác với acid amin quan trọng, 5 chất trong vị trí β5-
β6 trên IL-1β được lựa chọn mô phỏng động lực học và tính toán năng lượng gắn kết
tự do. Trong số 5 chất tính toán năng lượng gắn kết tự do, 2 chất là T428-0731 và
P634-0250 có điểm số âm nhất. Hai chất này có thể được thử in vitro hoặc tiến hành
mô phỏng thời gian lâu hơn.
Kết luận và đề nghị
Các mô hình in silico đã được áp dụng để sàng lọc thành công trên 22 triệu chất. Tuy
vậy, vẫn còn các vị trí trên IL-1β chưa được mô phỏng động lực học là A và B và trên
IL-1R1 là rãnh D1-D2 và D2. Các kết quả từ nghiên cứu này có thể được tiếp tục thực
hiện để tìm ra các chất ức chế được IL-1β hoặc IL-1R1 thật sự trên in vitro.
ii
IN SILICO SCREENING FOR SMALL MOLECULES INHIBITORS
AGAINST INTERLEUKIN-1β AND INTERLEUKIN-1 RECEPTOR
Hoang-Minh NGUYEN
Supervisors: Assoc. Prof. PhD. Khac-Minh Thai, Prof. PhD. Thanh Dao Tran
Introduction
IL-1β is a cytokine from the IL-1 family. When bound to its main receptor, IL-1R1,
IL-1β plays a major role in regulating inflammatory activities in the body. Medical
conditions such as rheumatoid arthritis, gout or autoinflammatory diseases are linked
to the overexpression of IL-1β. Thus, inhibiting IL-1β or IL-1R1 is a promising
therapeutic target in management of such conditions. The purpose of this research is
to screen over 22 million molecules from 7 different datasets in order to find potential
therapeutic agents inhibiting IL-1β or IL-1R1.
Materials and methods
Material: ZINC, ZINC, MBHC, MBPPI, CDPPI, CDPM, UNDP and DB datasets;
crystallized structures of IL-1β with canakinumab (5BVP), free IL-1β (9ILB), IL-
1R1 with IL-1β (1ITB); 8 pharmacophore models targeting IL-1β and IL-1R1 from
the study of Minh Tri Le, 2019.
Methods: 3D-pharmacophore modelling using MOE 2015.10, pharmacophore
screening on ZINCPharmer and MOE 2015.10, molecular docking using LeadIT
2.1.8, molecular dynamics simulation on GROMACS 2020.2, and free binding
energy calculation using g_mmpbsa 5.1.2.
Conclusion
3D-pharmacophore screening returned with 2,235 molecules on IL-1β and 8,480 on
IL-1R1. 202 and 1,054 molecules on IL-1β and IL-1R1 after ADME evaluation. By
combingin docking scores and protein-ligand interaction fingerprint, 5 molecules on
β5-β6 loop of IL-1β were chosen to perform molecular dynamics simulation and free
binding energy calculation. Among 5 molecules, T428-0731 and P634-0250 returned
with the lowest docking score. These 2 molecules could be selected for in vitro
evaluation or performing longer dynamic simulation runs.
Conclusion
In silico models were successfully applied to screen over 22 million molecules.
However, there are still site A, B on IL-1β as well as D1-D2 junction, D2 site on IL-
1R1 that are yet to be performed molecular dynamics simulation. Results from this
study could be continued to search for experimental in vitro inhibitory activities.
iii
MỤC LỤC
ĐẶT VẤN ĐỀ ........................................................................................................... 1
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU .................................................................... 2
1.1. TỔNG QUAN VỀ CYTOKIN VÀ INTERLEUKIN ...................................... 2
1.2. INTERLEUKIN-1β ......................................................................................... 6
1.3. CÁC THUỐC ỨC CHẾ HOẠT ĐỘNG IL-1β................................................ 7
1.4. CÁC VỊ TRÍ TƯƠNG TÁC TRÊN IL-1β và IL-1R1 ..................................... 8
1.5. THIẾT KẾ THUỐC HỢP LÝ ....................................................................... 10
CHƯƠNG 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU ....................... 13
2.1. XÂY DỰNG CÁC CƠ SỞ DỮ LIỆU SÀNG LỌC ẢO ............................... 14
2.2. XÂY DỰNG MÔ HÌNH 3D-PHARMACOPHORE .................................... 15
2.3. ĐÁNH GIÁ ADME ....................................................................................... 22
2.4. MÔ HÌNH MÔ TẢ PHÂN TỬ DOCKING .................................................. 26
2.5. PHÂN TÍCH KẾT QUẢ DOCKING ............................................................ 28
2.6. MÔ PHỎNG ĐỘNG LỰC HỌC PHÂN TỬ ................................................ 29
2.7. TÍNH TOÁN NĂNG LƯỢNG TỰ DO ........................................................ 34
CHƯƠNG 3. KẾT QUẢ VÀ BÀN LUẬN ............................................................. 36
3.1. KẾT QUẢ XÂY DỰNG CÁC TẬP CƠ SỞ DỮ LIỆU ................................ 36
3.2. KẾT QUẢ SÀNG LỌC PHARMACOPHORE ............................................ 37
3.3. KẾT QUẢ ĐÁNH GIÁ ADME .................................................................... 40
3.4. CÁC MÔ HÌNH DOCKING ......................................................................... 43
3.5. KẾT QUẢ PHÂN TÍCH PLIF ...................................................................... 46
3.6. ĐÁNH GIÁ MÔ PHỎNG ĐỘNG LỰC HỌC .............................................. 48
3.7. KẾT QUẢ TÍNH TOÁN NĂNG LƯỢNG TỰ DO ...................................... 54
3.8. BÀN LUẬN................................................................................................... 56
CHƯƠNG 4. KẾT LUẬN VÀ ĐỀ NGHỊ ............................................................... 59
TÀI LIỆU THAM KHẢO ....................................................................................... 60
iv
Khoá luận tốt nghiệp DSĐH Danh mục các chữ viết tắt
v
Khoá luận tốt nghiệp DSĐH Danh mục bảng
vi
Khoá luận tốt nghiệp DSĐH Danh mục hình
vii
Khoá luận tốt nghiệp DSĐH Lời cảm ơn
LỜI CẢM ƠN
Đầu tiên con xin phép được gởi lời cảm ơn đến ba và mẹ đã chăm lo cho con đến
ngày hôm nay, luôn tạo điều kiện hết mình để con có thể phát huy bản thân mình
cũng như làm những gì mình muốn.
Em xin cảm ơn thầy Thái Khắc Minh đã giúp đỡ và tạo điều kiện cho em được làm,
học tập và gặp gỡ mọi người trong lab 314 của mình. Em chưa từng nghĩ sẽ có ngày
được làm việc cùng mọi người như vậy. Cảm ơn thầy vì đã chỉ bảo, tạo điều kiện và
giúp đỡ em trong suốt thời gian làm khoá luận này. Ngoài ra, em cũng xin cảm ơn
thầy Mai Thành Tấn đã trực tiếp giúp đỡ và chỉ dạy em rất nhiều trong suốt thời gian
trên lab.
Em xin cảm ơn anh Bùi Quốc Dũng lớp Dược 2009 đã luôn ở lab để thảo luận và ăn
trưa với em. Cảm ơn anh Trần Thái Sơn cũng đã giúp đỡ em trong những lần anh tới
lab. Cảm ơn tất cả anh chị, bạn bè và các em khoá dưới trong lab tổng hợp đã cùng
ăn trưa với mình trong thời gian làm khoá luận. Ngoài ra mình xin cảm ơn các bạn
trong lab 314 đã giúp đỡ và đồng hành cũng mình trong suốt quãng thời gian này.
Xin cảm ơn các bạn Đỗ Trần Giang Sơn, Nguyễn Thị Thu Hạnh, Thái Ngọc Trâm,
Ngô Thanh Hằng, Phạm Xuân Tiên, Nguyễn Thị Ánh Tuyết và Nguyễn Hoàng Tiến
rất nhiều!
Cảm ơn các em Đắc Nhân, Mỹ Ngọc, Nhật Lễ lớp Dược 2016 và Thành Phương,
Thảo Nhung, Mỹ Ngọc lớp Dược 2017 đã giúp đỡ anh hoàn thành đề tài này.
Cảm ơn bạn Trần Ngọc Anh, người đã động viên và luôn ủng hộ mình trong thời gian
bận rộn này.
Cảm ơn tất cả mọi người đã trực tiếp và gián tiếp giúp đỡ để đề tài được hoàn thành!
viii
Khoá luận tốt nghiệp DSĐH Đặt vấn đề
ĐẶT VẤN ĐỀ
Interleukin-1β (IL-1β) là một thành viên trong họ IL-1. Khi liên kết với thụ thể chính
là thụ thể IL-1 tuýp 1 (IL-1R1) và đồng thụ thể IL-1RAcP tạo thành một phức hợp
ba thành phần, IL-1β mới có thể thực hiện hoạt động truyền tín hiệu. Vai trò chính
của IL-1β cũng như họ IL-1 trong sinh lý là điều hoà các phản viêm trong cơ thể [1].
Tuy vậy, trong một số bệnh lý tự viêm (autoinflammatory) như hội chứng sốt chu kỳ
di truyền liên quan cryopyrin (CAPS), sốt Địa Trung Hải có tính gia đình, hội chứng
liên quan thụ thể yếu tố hoại tử u chu kỳ,… thường ghi nhận sự biểu hiện quá mức
của IL-1β. Cytokin này cũng được ghi nhận với biểu hiện quá mức ở các bệnh thường
gặp như đái tháo đường tuýp 2, gout cấp và mạn, xơ vữa động mạch và ung thư phổi
[2]. Trong các cytokin họ IL-1, việc ức chế IL-1β được xem là đích tiềm năng trong
việc điều trị các bệnh lý đã nêu trên, đặc biệt là các bệnh tự viêm [3].
Hiện nay, chỉ có 3 thuốc được chấp thuận điều trị IL-1β là canakinumab, anakinra và
rilonacept. Các thuốc này đều là phân tử protein kích thước lớn và phải dùng đường
tiêm dưới da (SC), gây khó chịu cho người dùng cũng như chi phí cao [4].
Do đó, nhu cầu phát triển các thuốc phân tử nhỏ ức chế IL-1β và IL-1R1 là rất cần
thiết. Nghiên cứu của Lê Minh Trí và cộng sự [5] đã tiến hành sàng lọc các chất ức
chế IL-1β và IL-1R1. 8 mô hình pharmacophore (2 mô hình trên IL-1β và 6 trên IL-
1R1) đã được xây dựng và 7.616 chất của tập DrugBank (DB) [6] đã được tiến hành
docking. Kết quả nghiên cứu đã thu được 20 chất tốt nhất trên 4 vị trí, trong đó có 2
vị trí trên IL-1β và 2 vị trí trên IL-1R1.
Đề tài nghiên cứu này sẽ xây dựng thêm mô hình pharmacophore dựa trên tương tác
giữa canakinumab và IL-1β. Kết hợp với 8 mô hình của Lê Minh Trí [5], 7 cơ sở dữ
liệu là ZINC Purchasable [7], MayBridge HitCreator [8], MayBridge PPI [9],
ChemDiv Peptidomimetics [10], ChemDiv PPI [11], UNDP [12] và DrugBank [6] sẽ
được dùng để sàng lọc pharmacophore. Các chất sau đó sẽ được đánh giá dược động
lực học, docking, mô phỏng động lực học và tính năng lượng gắn kết tự do trên IL-
1β và IL-1R1 với hi vọng tìm ra các phân tử nhỏ có tác động trị liệu.
Nội dung nghiên cứu trong đề tài này bao gồm:
(1) Xây dựng 3D-pharmacophore dựa trên tương tác của canakinumab.
(2) Sàng lọc các mô hình pharmacophore trên 7 cơ sở dữ liệu.
(3) Đánh giá dược động lực học.
(4) Tiến hành docking và đánh giá kết quả docking.
(5) Mô phỏng động lực học.
(6) Tính toán năng lượng gắn kết tự do.
1
Cytokines
EN Benveniste, University of Alabama at Birmingham, Birmingham, AL, USA
Khoá
r luận tốt
2014 Elsevier nghiệp
Inc. All DSĐH
rights reserved. Tổng quan tài liệu nghiên cứu
IL-6 IL-1!
IL-1RAcP IL-1R1
JAK1 JAK2
$
IKK
" !
Thoái hoá
STAT3
Ub
STAT3
STAT3
Ub
Ub I#B
p50
I B p65
STAT3
IL-6
STAT3
IL-17
p50
p65 TNF-"
(a) (b)
Hình 1.1.
Figure 1 Janus kinase (JAK)/signal transducers and Cơ chế ofhoạt
activators động (STAT)
transcription của cytokin
and nuclear[13]
factor-kappaB (NF-kB) signaling pathways.
(a) IL-6 binds to its receptor, composed of two gp130 subunits (green) and the membrane-bound IL-6 receptor (mIL-6R) (blue), and activates
Nhiều cytokin sử dụng con đường truyền tin qua thụ thể Janus kinase (JAK)/Yếu tố
intracellular JAKs, predominantly JAK1 and JAK2, which phosphorylate STAT3. Once phosphorylated, STAT3 molecules dimerize, translocate to
the nucleus, and bind to STAT response elements in the promoters of target genes such as IL-17. (b) IL-1b binds to the IL-1R and activates IkB
chuyển đổi tín hiệu và yếu tố hoạt hoá phiên mã (signal transducers and activators of
kinase (IKK), which consists of three subunits: a, b, and g. IKK phosphorylates the inhibitory protein IkB and targets this protein for Ub-mediated
transcription - STAT). Các cytokin sử dụng con đường này bao gồm interleukin-2, -
degradation. The liberated NF-kB dimer (p65/p50) translocates into the nucleus, undergoes phosphorylation, and binds to kB elements in the
promoters of target genes to induce expression of genes such as IL-6 and TNF-a.
4, -6, -12 và -13. Khi gắn với cytokin, các thụ thể JAK (vốn là tyrosin kinase sẽ
phosphoryl hoá các acid amin tyrosin ở vùng nội bào của thụ thể. Nhờ đó, các protein
921
STAT sẽ được huy động và được
Encyclopedia of the Neurological Sciences, Volume 1
JAK phosphoryl hoá, dẫn đến kích hoạt các STAT
doi:10.1016/B978-0-12-385157-4.00175-5
2
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu
này. Khi được kích hoạt, STAT sẽ dimer hoá và chuyển dịch vào nhân tế bào, kích
hoạt phiên mã các gen đích (Hình 1.1a) [13].
Một con đường truyền tín hiệu khác mà cytokin sử dụng là yếu tố nhân kappa B
(Nuclear Factor-kappa B – NF-kB). Khi cytokin gắn kết với thụ thể sẽ hoạt hoá IkB
kinase (IKK). Tiếp tục, IKK sẽ phosphoryl hoá IkB (là một protein ức chế). IkB được
hoạt hoá sẽ kích hoạt con đường thoái hoá protein bằng ubiquitin (một protein đánh
dấu để nhận diện các protein cần thoái hoá). Khi được giải phóng khỏi IkB, dimer
NF-kB sẽ chuyển dịch vào nhân tế bào, được phosphoryl hoá và kích hoạt biểu hiện
gen (Hình 1.1b) [13].
1.1.2. Vai trò sinh lý của cytokin
Các gen được điều hoà bởi cytokin bao gồm gen điều hoà sự kích hoạt, di trú, tăng
sinh, biệt hoá, tạo hồng cầu và chết theo chu trình của tế bào. Các cytokin có thể tác
động lên chính tế bào đã sản sinh ra mình (tín hiệu “autocrine”) hoặc lên các tế bào
lân cận (tín hiệu “paracrine”) [13].
Cytokin tham gia gần như tất cả các hoạt động của miễn dịch thụ động và miễn dịch
chủ động. Cytokin còn có vai trò đặc biệt quan trọng trong điều hoà quá trình viêm.
Vì tác động của cytokin lên hệ miễn dịch và quá trình viêm nên cytokin được xem là
một đích tác động trị liệu tiềm năng [13].
1.1.3. Phân loại cytokin
Cytokin có thể được phân thành interleukin (IL), chemokin, yếu tố hoại tử khối u
(tumor necrosis factor – TNF), yếu tố kích thích tạo dòng (colony-stimulating factor
- CSF) và interferon dựa trên chức năng, tế bào tiết ra và đích tác động [13].
1.1.4. Interleukin
Thuật ngữ “interleukin” dùng để chỉ một nhóm các cytokin đa chức năng được tiết
bởi tế bào bạch cầu (leukocyte). Đầu tiên, vì IL được cho rằng chỉ tác động lên các tế
bào bạch cầu nên đã được đặt tên “interleukin” (ở giữa các bạch cầu) [13].
Chức năng của hệ miễn dịch phụ thuộc rất nhiều vào các IL, đặc biệt là trong quá
trình phát triển và biệt hoá tế bào T, tế bào B và tế bào gốc tạo máu (hematopoietic).
Hiện nay, đã tìm ra 36 loại IL khác nhau, được đánh số từ IL-1 đến IL-36. Tất cả các
IL đều có tác động đa hướng (pleiotropic - tác động trên nhiều hệ cơ quan). Nghiên
cứu sẽ tập trung vào họ IL-1 và cụ thể hơn là IL-1β [13].
1.1.5. Tổng quan về họ IL-1
Họ IL-1 bao gồm 11 protein có vai trò chính trong điều hoà hệ miễn dịch đặc hiệu,
không đặc hiệu và các bệnh viêm [1]. Trong đó IL-1⍺ và IL-1β là hai thành viên được
tìm thấy đầu tiên của họ [13].
Các thành viên trong họ IL-1 được chia ra làm bốn phân họ theo thụ thể gắn kết đặc
hiệu. Phân họ IL-1, IL-33, IL-36 đều có chung đồng thụ thể IL-1RAcP. Trong khi đó,
phân họ IL-18 sử dụng một đồng thụ thể đặc hiệu khác (IL-18RAcP) [14].
3
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu
Hình 1.2. Con đường truyền tín hiệu của họ IL-1 [14]
4
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu
Đầu N Đầu N
Đầu N
Đầu N
Hình 1.3. Cấu trúc một số cytokin họ IL-1 [1]
FIGURE 2 | Representation of cytokine structures. (A) The structure of IL-1β with its β-sheets and key loops labeled. (B) The structure of IL-33 with its β-sheets and
key loops labeled. (C) The structure of IL-36γ with its β-sheets and key loops labeled. (D) The structure of IL-18 with its β-sheets and key loops labeled.
A) IL-1β, B) IL-33, C) IL-36ɣ, D) IL-18
1.2. INTERLEUKIN-1BETA
1.2.1. Cấu trúc và cơ chế tác động IL-1β
Hình 1.3A cho thấy cấu trúc của IL-1β khá tương đồng với các cytokin khác trong
họ IL-1 (đã được trình bày ở mục 1.1.5.2). IL-1β được biểu hiện ở dạng tiền thân và
phải được cắt bởi caspase-1 để có thể trở thành dạng hoạt động. Các acid amin ở dạng
hoạt động của IL-1β nằm từ 117-269. IL-1β được sản xuất bởi các tế bào như bạch
cầu đơn nhân, đại thực bào và tế bào đuôi gai (dendritic) khi có tín hiệu từ mô hình
phân tử liên quan đến mầm bệnh (Pathogen-associated molecular pattern – PAMP)
hoặc từ cytokin. IL-1β cũng được sản xuất khi có sự hiện diện của chính IL-1β trong
trường hợp các phản ứng tự viêm (auto-inflammatory) [1].
Cơ chế truyền tín hiệu của IL-1β giống với các cytokin trong họ. Trong đó, IL-1β gắn
kết với thụ thể chính là IL-1R1 và đồng thụ thể IL-1RacP. Phức hợp ba thành phần
gồm IL-1β/IL-1R1/IL-1RaCP được hình thành. Tiếp theo, con đường truyền tín hiệu
phụ thuộc MyD88 (Hình 1.2) sẽ được hoạt hoá thông qua vùng TIR nội bào [1].
1.2.2. Các bệnh lý liên quan đến IL-1β
Trong các cytokin, họ IL-1 (và các thụ thể tương ứng) có liên quan chính đến các
bệnh lý viêm cấp và mạn. Đồng thời, trong 11 thành viên của họ IL-1 thì IL-1β là
mục tiêu điều trị tiềm năng cho các tình trạng viêm cục bộ và hệ thống [14].
Trong các bệnh tự viêm (autoinflammatory), yếu tố quan sát thường thấy nhất là sự
tăng giải phóng của IL-1β dạng hoạt động. Cơ chế của các bệnh này thường do đột
biến liên quan đến hoạt động của capase-1, dẫn đến tăng chuyển IL-1β từ dạng tiền
thân thành dạng hoạt động. Trong các bệnh tự viêm, việc ức chế tác động của IL-1β
làm giảm độ trầm trọng của bệnh nhanh chóng và lâu dài [14]. Ngoài ra, những bệnh
thường gặp như gout, đái tháo đường type 2, suy tim, viêm ngoại tâm mạc tái phát,
viêm khớp dạng thấp và đa u tuỷ tiềm tàng cũng đều cho đáp ứng khi ức chế tín hiệu
IL-1β [14]. Bảng 1.1 liệt kê một số bệnh liên quan đến hoạt động quá mức của IL-
1β. Các bệnh được chia làm bốn nhóm chính là bệnh tự viêm, hội chứng chuyển hoá,
viêm cấp, viêm mạn và ung thư ác tính.
Bảng 1.1. Một số nhóm bệnh liên quan đến IL-1β [14]
- Hội chứng sốt chu kỳ di truyền liên quan Cryopyrin
(CAPS)
- Sốt Địa trung hải có tính gia đình (FMF)
Bệnh tự viêm - Hội chứng tăng immunoglobulin D (HIDS)
- Rối loạn tự viêm liên quan NLRP12
- Hội chứng liên quan thụ thể yếu tố hoại tử u chu kỳ
- Viêm khớp dạng thấp
Hội chứng chuyển hoá - Đái tháo đường tuýp 2
6
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu
- Bệnh Alzheimer
- Béo phì thể trung tâm
- Gout cấp
Viêm cấp
- Hội chứng Muclke-Wells
- Gout mạn
Viêm mạn và ung thư - Tăng xâm lấn khối u trong ung thư vú
ác tính - Xơ vữa động mạch [15]
- Ung thư phổi [15]
1.3. CÁC THUỐC ỨC CHẾ HOẠT ĐỘNG IL-1BETA
Tới thời điểm hiện tại, chỉ có ba thuốc trên thị trường được phê duyệt bởi Cục quản
lý Thực phẩm và Dược phẩm Hoa Kỳ có tác dụng ức chế hoạt động của IL-1. Ba
thuốc này là canakinumab, rilonacept và anakinra (Bảng 1.2).
Bảng 1.2. Các thuốc ức chế IL-1β đã được chấp thuận [4]
Tên thuốc Cấu trúc và cơ chế tác động Chỉ định
• CAPS
• Sốt Địa Trung Hải có
tính gia đình
Kháng thể đơn dòng, vô hiệu hoá IL-
• Hội chứng liên quan
1β bằng cách gắn kết và cản trở việc
thụ thể yếu tố hoại tử u
Canakinumab gắn với thụ thể IL-1R. Gắn đặc hiệu
chu kỳ
trên IL-1β, không gắn với IL-1⍺ hay
• Hội chứng tăng
IL-RA.
immunoglobulin D
• Bệnh Still
• Gout
• CAPS
IL-1RA người tái tổ hợp (153 acid
• Bệnh Still
Anakinra amin), gắn vào IL-1R1 và có tác
• Viêm khớp dạng thấp
dụng đối kháng thụ thể IL-1R1.
• Đợt gout cấp
7
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu
8
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu
Structural and Functional Units of Ig
! Vùng Fa
Fab reg
đặc hiệu
antigen
Gắn kết
(gồm vù
(Fv regi
kháng
nguyên
Hoạt hoá
! Vùng F
Fc regio
tế bào hiệu động
effects.
lực
(Effector)
! Hinge
Vùng br
Hình 1.5. Cấu trúc kết tinh giữa IL-1β và canakinumab (5BVP, 2,20 Å) [20]
Bề mặt tương tác protein-protein giữa 2 phân tử khá phẳng, ưa nước và có diện tích
lớn (1972 Å). Ở paratop của canakinumab, tất cả sáu CDR của canakinumab đều
tham gia gắn với kháng nguyên (H-CDR 1-3 và L-CDR 1-3). Epitop của IL-1β gồm
5 thành phần cấu trúc, tạo thành một bề mặt gần như phẳng và thân nước: vùng kẹp
tóc β2- β3 (acid amin 19 đến 27), vùng chuỗi ⍺ của vòng β3 đến β4 (acid amin 32
đến 39), vòng β5 đến β6 (acid amin 63 đến 66), vòng β7 đến β8 (acid amin 86 đến
88) và vòng β10 đến β11 (Asn 129). Các liên kết tạo với canakinumab bao gồm liên
9
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu
kết hydro (Asp35, Gln34, Glu37, Gln38, Lys65, Asn129) hoặc tương tác cầu muối
(Lys27, Glu64) [20].
1.5. THIẾT KẾ THUỐC HỢP LÝ
1.5.1. Mô hình pharmacophore
Một mô hình pharmacophore miêu tả sự sắp xếp các đặc tính phân tử mà một phối tử
phải có để có thể gắn một cách hiệu quả vào thụ thể. Các mô hình pharmacophore
được phát triển nhằm hiểu biết tốt hơn về tương tác giữa ligand-protein ở mức độ
phân tử. Pharmacophore đã được chứng minh là cực kỳ hiệu quả trong sàng lọc in
silico để tìm các phân tử có hoạt tính sinh học trên nhiều mục tiêu. Việc sử dụng
pharmacophore làm giảm số lượng hợp chất và chi phí phải trả trong quá trình sàng
lọc [21].
Mô hình harmacophore dựa trên phối tử (LBP) là các mô hình được xây từ một hoặc
nhiều phối tử có hoạt tính. Phương pháp này đã được sử dụng rộng rãi trong khám
phá và thiết kế các phân tử có hoạt tính sinh học [21].
Mặt khác, mô hình pharmacophore dựa trên cấu trúc protein (SBP) lại được xây dựng
từ cấu trúc 3D của một hoặc nhiều protein mục tiêu. Phương pháp này đang ngày
càng được quan tâm trong những năm gần đây. Một trong những lý do cho sự quan
tâm này là vì số lượng cấu trúc protein độ phân giải cao đang tăng rất nhanh. Hiện
nay, trên PDB đã có hơn 167.000 cấu trúc (tính đến 04/08/2020) [19]. SBP có thể là
công cụ để tìm hiểu tương tác phối tử-protein và cho phép nghiên cứu sàng lọc thư
viện hoá học (chemogenomic) với quy mô lớn. Từ những nghiên cứu như vậy, có thể
xác định các phối tử mới cho một protein hoặc tìm các đích mới cho phối tử [21].
Một số lợi điểm của SBP so với LBP bao gồm: 1) SBP cho phép tìm ra các khung
hoá học mới vì phương pháp này không dựa trên các kiểu hình hoá học có sẵn của
phối tử; 2) SBP có thể dùng để làm rõ cơ chế gắn kết của phối tử ngay trong khung
cấu trúc protein; 3) SBP giúp hiểu rõ hơn về khoang gắn kết phối tử [21].
Tuy vậy, khó khăn của SBP nằm ở việc chọn các thuộc tính bắt buộc trong một mô
hình. Tiêu chí chọn các thuộc tính này thường không rõ ràng, ngay cả khi có dữ liệu
thực nghiệm như đột biến tại khoang gắn kết. Số lượng cấu dạng và không gian xây
dựng lớn làm việc chọn các thuộc tính trong SBP khó hơn LBP. Thách thức của SBP
còn nằm ở khả năng giảm bớt các điểm thuộc tính pharmacophore để chỉ còn những
điểm có liên quan đến hoạt tính sinh học [21].
1.5.2. Đánh giá ADME
Một trong số các rủi ro của quá trình thiết kế và phát triển thuốc là việc không thoả
mãn các thông số dược động lực học (hấp thu, phân bố, chuyển hoá, thải trừ - ADME)
cho đến độc tính (toxicology). Toàn bộ quá trình này có thể gọi tắt là ADMET. Đây
là một trong những lý do chính của việc tuy các thuốc được khám phá ra trong những
năm gần đây tăng, nhưng số lượng thuốc được chấp thuận sử dụng lại không tăng
10
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu
nhiều. Ngoài ra, việc đánh giá ADMET bằng phương pháp in vitro hoặc in vivo
thường tốn thời gian, chi phí và khó có thể bao gồm được hết các chỉ tiêu. Vì vậy,
phương pháp đánh giá ADMET in silico tiết kiệm thời gian và công sức và chi phí là
một giải pháp đầy tiềm năng [22].
Đánh giá ADME in silico nhắm đến việc xây dựng các mô hình dựa trên dữ liệu thực
nghiệm để tính toán các tính chất của phân tử dựa trên mối liên quan định lượng giữa
cấu trúc và tính chất (QSPR). QSPR liên kết thông tin giữa cấu trúc và tính chất vật
lý, hoá học hoặc thậm chí sinh học (liên quan định lượng giữa cấu trúc và tác dụng –
QSAR) [23].
Nhược điểm của đánh giá ADME bằng phương pháp in silico là độ tin cậy của phương
pháp. Một phương pháp chỉ có thẻ tốt nếu dữ liệu và ý tưởng xây dựng phương pháp
tốt. Điều này yêu cầu đánh giá bằng dữ liệu thực nghiệm liên tục nhằm cải thiện
phương pháp. Ngoài ra, chất lượng của dữ liệu thực nghiệm đầu vào cũng rất quan
trọng vì các yếu tố sai sót, gây nhiễu trong quá trình thực nghiệm cũng có thể làm
ảnh hưởng đến độ tin cậy của phương pháp [23].
1.5.3. Mô hình mô tả phân tử docking
Mô hình mô tả phân tử Docking được là một phương pháp có vai trò lớn trong thiết
kế thuốc với sự trợ giúp của máy tính (CADD – Computer-Aided Drug Design).
Phương pháp này được dùng để đánh giá và dự đoán khả năng gắn kết của phân tử
nhỏ vào cấu trúc mục tiêu. Hiện nay, phương pháp docking bắt đầu được sử dụng phổ
biến vì tính đơn giản, dễ sử dụng và ít tốn thời gian trong các phương pháp sàng lọc
ảo. Ứng dụng của docking bao gồm nghiên cứu sự liên quan giữa cấu trúc-tác dụng,
tối ưu hoá chất khởi nguồn (lead optimization), tìm các chất khởi nguồn tiềm năng,
nghiên cứu các đột biến dựa trên việc đưa ra tiên đoán về giả thuyết gắn kết, hỗ trợ
đưa các chất nền hoặc chất ức chế vào bản đồ mật độ electron (electron density) trong
các cấu trúc nhiễu xạ tia X,… [24]
1.5.4. Mô phỏng động lực học
1.5.4.1. Tổng quan về mô phỏng động lực học
Mô phỏng động lực học phân tử (Molecular Dynamic Simulation – MD) là việc sử
dụng các kỹ thuật và thuật toán máy tính để khảo sát độ bền, độ chuyển động của các
thành phần đưa vào hệ, dưới một điều kiện nhiệt độ, áp suất và dung môi nhất định.
Các thành phần này có thể là nguyên tử (atom), phân tử (molecule) hoặc hạt
(particle),…[25]. Trong quá trình MD, các thành phần trong hệ sẽ được áp định luật
Newton và được dự đoán vị trí trong không gian trong tất cả thời gian thực hiện mô
phỏng. Kết quả của MD sẽ là một đoạn phim 3D mô tả quá trình chuyển động của
các thành phần trong hệ theo thời gian [26].
Điểm khác biệt lớn giữa MD và docking là sự có mặt của yếu tố thời gian. MD có thể
mô tả được sự thay đổi linh động của protein-phối tử theo thời gian. Trong khi đó,
11
Khoá luận tốt nghiệp DSĐH Tổng quan tài liệu nghiên cứu
các phương pháp docking hiện nay thường chỉ mô tả được sự linh động của phối tử
và giữ phân tử protein cố định. Tuy MD là một bước quan trọng và cần thiết nhưng
lại có nhược điểm là giới hạn về thời gian mô phỏng (thường không quá 1 ms) và tài
nguyên máy tính. Do đó, MD chưa trở thành một buóc bắt buộc trong các bước thực
hiện CADD [26].
1.5.4.2. Phần mềm GROMACS
GROMACS (Groningen Machine for Chemical Simulation) là một phần mềm mô
phỏng động lực học linh hoạt, hiệu quả và miễn phí. GROMACS được thiết kế lần
đầu từ năm 1991 tại đại học Groningen, Hà Lan. Từ năm 2001 đến nay, phần mềm
được phát triển bởi nhóm nghiên cứu tại Viện công nghệ hoàng gia và đại học Uppsala,
Thuỵ Điển [27].
Phần mềm có thể thực hiện MD trên protein, phức hợp protein-phối tử, tính toán năng
lượng solvat hoá, mô phỏng hệ màng kép, gieo mẫu thiên vị (umbrella sampling),…
cùng với nhiều chức năng khác. GROMACS vận hành trên hệ điều hành Linux và có
thể sử dụng toàn bộ tài nguyên của máy (CPU và GPU) để thực hiện mô phỏng động
lực học [27].
1.5.5. Tính toán năng lượng tự do
Phương pháp tính toán năng lượng diện tích bề mặt cơ học phân tử Poisson-Boltmann
(Molecular Mechanisc Poisson-Boltzmann Surface Area – MM-PBSA) ước tính năng
lượng tự do của phân tử được ước tính bằng tổng năng lượng ở thể khí, năng lượng
solvat hoá và entropy của chất tan theo công thức (1) sau [28]:
𝐺! = 𝐸"" + 𝐺#$%&'( − 𝑇∆𝑆 (1)
Trong đó, năng lượng ở thể khí được ước tính bằng năng lượng cơ học phân tử của
phân tử (𝐸"" ). 𝐸"" được xác định bởi năng lượng liên kết, góc liên kết và năng
lượng biến dạng. Năng lượng solvat hoá (𝐺#$%&'( ) được tính từ hai năng lượng thành
phần là năng lượng solvat hoá phân cực và không phân cực. Cuối cùng, entropy (𝑇∆𝑆)
được ước tính bằng phân tích quasi-harmonic [28].
Ưu điểm của phương pháp này nằm ở việc sử dụng dữ liệu quỹ đạo (trajectory), là
kết quả của quá trình động lực học mà không cần phải thực hiện lại một mô phỏng
mới. Ngoài ra, MM-PBSA còn có khả năng tính toán ở nhiều phân tử sinh học khác
nhau, giúp việc áp dụng phương pháp này vào bước phân tích kết quả động lực học
trở nên dễ dàng [28].
Tuy vậy, điểm không chắc chắn nhất của phương pháp nằm ở bước ước tính entropy
của chất tan. Sai số ở bước này thường lớn, có thể lên đến ~ 5 kcal/mol cho cùng một
cấu trúc đã được tối thiểu và dùng chung một quỹ đạo động lực học [28].
12
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
Hình 2.1. Các vị trí tác động trên IL-1β (a) và IL-1R1 (b)
Nghiên cứu sử dụng tương tác protein-protein giữa canakinumab và IL-1β để xây
dựng mô hình pharmacophore bằng phần mềm Molecular Operating Environment
(MOE) 2015.10 [29]. Sau đó, các tập cơ sở dữ liệu ZINC [7], MayBridge HitCreator
[8], MayBridge PPI [9], ChemDiv Peptidomimetics [10], ChemDiv PPI [11] và
UNDP [12] sẽ được tạo cấu dạng trên MOE 2015.10 và sàng lọc qua mô hình
pharmacophore đã xây cùng với 8 mô hình trong nghiên cứu trước của Lê Minh Trí
[5]. Kết quả sàng lọc pharmacophore sẽ được đánh giá ADME thông qua
SwissADME [30]. Tiếp đến, thực hiện docking các chất đã thoả thông số ADME trên
LeadIT 2.1.8 của BioSolveIT [31]. Các cấu dạng tốt nhất của docking sẽ được chọn
để thực hiện mô phỏng động lực học bằng Gromacs 2020.2 [32], trong trường lực
CHARMM27 [33, 34]. Sau đó, các chất này sẽ được tính toán năng lượng gắn kết tự
do (free binding energy) bằng công cụ g_mmpbsa 5.1.2 [35]. Hình 2.2 thể hiện khái
quát các phương pháp cũng như công cụ in silico mà nghiên cứu sẽ sử dụng.
13
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
•MOE 2015.10
Pharmacophore
•ZINCPhamer
ADME •SwissADME
•LeadIT 2.1.8
Docking
•Sybyl-X 2.0
Đánh giá kết quả •MOE 2015.10
docking •LeadIT 2.1.8
Mô phỏng •Gromacs 2020.2
động lực học •Avogadro, SwissParam, VMD
•Gromacs 2018.1
ΔG
•G_mmpbsa 5.1.2
14
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
- Mở tập CSDL tải về dưới dạng tệp *.sdf, sau đó chuyển thành dạng *.mdb để
phần mềm có thể đọc được
- Xoá trùng lặp: Chọn cột mol à Select Entries à Unique; Sau đó đảo lại để chọn
các chất trùng nhau bằng Edit à Invert à Entry Selection; Xoá các chất trùng
bằng Edit à Delete à Selected Entries.
- Chọn các hợp chất thoả luật 5-Lipinski [37]: Chọn cột mol à Select Entries à
Druglike; Tiếp tục đảo lại để chọn các chất không thoả định luật Edit à Invert à
Entry Selection; Xoá các chất không thoả 5-Lipinski bằng Edit à Delete à
Selected Entries.
2.1.2. Tạo cấu dạng và tối thiểu hoá năng lượng để sàng lọc pharmacophore
Để có thể thực hiện sàng lọc qua mô hình pharmacophore, các hợp chất trong thư
viên phải được tạo cấu dạng và tối thiểu hoá năng lượng. Nghiên cứu sử dụng công
cụ Conformation Import (Compute à Conformations à Import) của MOE 2015.10
[29], các thông số thiết lập bao gồm:
- Số cấu dạng tối đa cho mỗi hợp chất (Conformations): 250
- Bộ lọc đầu vào (Descriptor Filter): Clear
- Số cấu dạng phân mảnh (fragment) tối đa (MM Settings à Refinement
Conformation Limit): 10.000
- Số bước tìm kiếm cấu dạng tối đa (MM Settings à Stochastic Search Iteration
Limit): 1.000
- Số bước tối thiểu hoá năng lượng (MM Settings à Energy Minimization Iteration
Limit): 1.000
- Gradient giảm năng lượng (MM Settings à Energy Minimization Gradient Test):
0,0001
2.2. XÂY DỰNG MÔ HÌNH 3D-PHARMACOPHORE
2.2.1. Xây dựng pharmacophore
Mô hình pharmacophore được xây dựng dựa trên tương tác protein-protein tại vòng
β5-β6 của interleukin-1β với canakinumab, với trọng tâm là các tương với acid amin
Glu 64 (Hình 2.3). Theo phân tích cấu trúc tia X mã 5BVP, các acid amin vùng epitop
của IL-1β cho nhiều tương tác liên phân tử nhất là Glu64, Gln38, Lys65, Asp35 và
Ser2. Trong đó, điều đáng chú ý là nhánh bên của Glu64 (trong vòng β5-β6) tương
tác với 4 vùng quyết định bổ khuyết (CDR) của canakinumab: L-CDR1, L-CDR2, L-
CDR3 và H-CDR3. So với các acid amin khác (vốn chỉ cho tương tác tối đa với 2
CDR), Glu64 là acid amin có nhiều tương tác với canakinumab nhất [20].
15
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
Hình 2.3. Bề mặt tương tác của IL-1β tại vòng β5-β6 với canakinumab
(Canakinumab: Chuỗi xanh lục, C⍺ hồng; IL-1β: Chuỗi xám, C⍺ xanh pastel)
Cụ thể, nhóm carboxyl của acid amin Glu64 chồng lên vòng thơm của TyrL50, đồng
thời tạo tương tác cầu muối nằm ẩn sâu phía trong với ArgH101 của H-CDR3. Tương
tác với ArgH101 có sự tham gia của cả hai nguyên tử Nη2 và Nε (ArgH101 Nη2 –
Glu64: Oε1: 2,9 Å; Arg H101 Nε-Glu 64 Oε2: 2,8 Å). Ngoài ra, nhóm carboxyl của
Glu 64 cũng tạo liên kết hydro nhờ vào xúc tác của nước với O của ArgH101, Oη của
TyrL50 và Oε1 của GlnL53 [20].
Khi so sánh với cấu trúc IL-1β tự do (mã PDB: 2I1B) bằng cách xếp chồng (overlay),
vị trí cho thấy sự thay đổi cấu dạng lớn nhất là vòng β5-β6, nơi chứa các acid amin
Glu64, Lys65, Asn66 (Hình 2.4). Khi gắn với canakinumab, liên kết peptid giữa
Lys63 và Glu64 bị lật ngược và vị trí C⍺ của Glu64 di chuyển 3 Å. Hai acid amin
epitop Lys65 và Asn66 cũng di chuyển một đoạn 1,5-2,0 Å. Tuy vậy, định hướng liên
kết peptid giữa Leu62 và Lys63 không bị ảnh hưởng [20].
Hình 2.4. Xếp chồng cấu trúc IL-1β tinh thể 5BVP (xanh dương) và 2I1B (đỏ)
16
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
Phân tích đột biến còn cho thấy vai trò quan trọng của Glu64 trong độ đặc hiệu gắn
kết của canakinumab. Trong đó, việc thay thế Glu64 bằng các acid amin khác sẽ gây
mất khả năng gắn kết của thuốc này trên IL-1β của người [20].
Vì những lý do này, nghiên cứu chọn xây dựng mô hình pharmacophore dựa trên
tương tác các acid amin của canakinumab trên vòng β5-β6 của IL-1β. Các tương tác
của 3 acid amin Glu64, Lys65 và Asn66 trên IL-1β được cụ thể hoá trong Bảng 1.1.
Bảng 2.1. Tương tác giữa canakinumab và vòng β5-β6 của IL-1β [20]
Epitop IL-1β Paratop canakinumab
Cấu trúc Acid amin tương Acid amin tương Cấu trúc
tác trực tiếp với tác trực tiếp với
canakinumab IL-1β
H-CDR3, L-
ArgH101, SerL32,
Glu64 CDR1, L-CDR2,
TyrL50, SerL91
L-CDR3
ThrH102, SerL91, H-CDR3, L-
Vòng β5-β6 Lys65
SerL92, PheL96 CDR3
Tyr H53, Asp
H-CDR2, L-
Asn66 H54, Ser L92, Ser
CDR3
L93
2.2.2. Công cụ xây dựng pharmacophore
Xây dựng mô hình pharmacophore cho các hợp chất gắn kết trên vòng β5-β6 cần sử
dụng 2 công cụ trong MOE 2015.10 [29] là tương tác protein (Protein Contacts) và
xây dựng pharmacophore (Pharmacophore Editor).
2.2.2.1. Công cụ tương tác protein (Protein Contacts)
Sau khi mở cấu trúc kết tinh mã 5BVP, truy cập công cụ qua Protein à Contacts….
Các thông số để phân tích trong Protein Contacts được thiết lập như sau:
- Các tương tác được chọn: van der Waals (distance), cộng hoá trị (covalent), vòng
thơm (arene), ion (ionic), kim loại (metal), hydro (hbond)
- Bộ lọc (Filter), giúp chọn ra đúng 3 acid amin trong vòng β5-β6:
“Glu64,Lys65,Asn66”
- Các thông số còn lại để mặc định
Sau đó, tiến hành tìm kiếm (Search) để tìm các tương tác có thể có. Kết quả 3 chiều
các tương tác thu được sẽ được hiển thị ở màn hình chính của MOE. Tất cả các tương
tác sẽ được chọn và cô lập (Isolate) để bắt đầu xây dựng mô hình pharmacophore dựa
trên tương tác giữa các acid amin trong Bảng 2.1, năng lượng tương tác (Interaction
energy) và tần số xuất hiện (Frequency) trong cửa sổ danh sách tương tác (Contact
List).
17
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
18
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
19
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
20
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
rãnh D1-
D2
Ph- Ràng buộc 3/6 thuộc
IL1R1-a2 tính (F1, F4, F5). F4
Mô hình tạo thêm thuộc tính
cho chất nhận hydro. F6 tạo
gắn IL- thêm thuộc tính cho
1R1 tại hydro.
rãnh D1-
D2
21
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
22
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
cách đưa dữ liệu đầu vào, khả năng dự đoán một lúc nhiều phân tử, có thể hiển thị,
lưu và chia sẻ kết quả của từng phân tử hoặc toàn bộ tập dữ liệu. Ngoài ra,
SwissADME còn được tích hợp vào bộ công cụ SwissDrugDesign, được thiết kế bởi
Viện Tin Sinh học Thuỵ Sĩ (Swiss Institute of Bioinformatics). Kết quả thu được từ
SwissADME có thể được sử dụng ngay lập tức cho các công cụ CADD khác bao gồm
sàng lọc ảo dựa trên ligand (SwissSimilarity), dự đoán đích tác động sinh học
(SwissTargetPrediction), mô tả phân tử docking (SwissDock), thiết kế đẳng cấu sinh
học (SwissBioisostere) và động lực học phân tử (SwissParam) [30].
Sau khi tính toán, có thể lưu kết quả ở dạng tệp *.csv hoặc sao chép để thực hiện phân
tích thêm.
2.3.2. Cơ sở lý thuyết các mô hình
2.3.2.1. BOILED-Egg
Mô hình BOILED-Egg (Brain Or Intestinal Estimated Permeation) là một mô hình
dự đoán khả năng thấm thụ động của một chất qua ruột hoặc hàng rào máu não. Mô
hình này dựa trên tính việc tính toán tính thân dầu và phân cực của các phân tử nhỏ.
Mô hình thực hiện được điều này bằng cách sử dụng hai thông số lý hoá là hệ số phân
bố dầu-nước (logP) và diện tích bề mặt phân cực (PSA) [38].
Một chất được mô hình đánh giá là có khả năng hấp thu thụ động qua ruột khi có logP
trong khoảng -2,3+6,8 và PSA bé hơn 142 Å2 [38]. Chất có khả năng hấp thu thụ
động qua hàng rào máu não khi chất đó có PSA < 79 Å2 và logP trong khoảng +0,4-
+0,6. Hình 2.6 minh hoạ một mô hình BOILED-Egg. Trong đó, những chất nằm
trong phần màu trắng (lòng trắng) được dự đoán là có khả năng hấp thu thụ động qua
ruột. Những chất nằm trong vùng màu vàng (lòng đỏ) sẽ có khả năng hấp thu qua
được hàng rào máu não. Những chất nằm ngoài hai vùng này được dự đoán là không
có khả năng hấp thu thụ động đường uống.
23
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
Ở đây, nghiên cứu tiến hành dự đoán bằng BOILED-Egg và chọn những chất có khả
năng hấp thu được qua đường uống.
2.3.2.2. PAINS
PAINS (Pan assay interference compounds), là khái niệm để chỉ các hợp chất chứa
các cấu trúc cho phản ứng sinh học mạnh trong các thử nghiệm, bất kể là protein đích
nào. Những chất như vậy khi được đem vào thử nghiệm sinh học sẽ cho kết quả
dương tính giả. Một số chất PAINS thường gặp là toxoflavin, isothiazolon, quinon,
catechol,… [40]
Nghiên cứu đã sử dụng mô hình dự đoán PAINS để loại bỏ những chất có khả năng
gây dương tính giả trong các thử nghiệm sinh học nếu có sau đó.
2.3.2.3. Brenk
Brenk là một danh sách gồm 105 mảnh (fragment) được xác định bởi Brenk và cộng
sự là dễ gây độc, chuyển hoá không ổn định hoặc có các tính chất dược động kém.
Bằng cách áp dụng mô hình này, chính Brenk và cộng sự đã sàng lọc và tìm được các
chất có khả năng thoả tiêu chí làm một chất khởi nguồn (leadlikeness) và có thể được
sử dụng để tiếp tục tối ưu hoá sâu hơn [41].
Brenk cũng là một mô hình được nghiên cứu sử dụng nhằm giảm số lượng hợp chất
đầu vào khi tiến hành docking.
2.3.2.4. Ghose (Amgen), Verber (GSK), Egan (Pharmacia) và Muegge (Bayer)
Giống như luật 5-Lipinski [37], các luật Ghose [42], Verber [43], Egan [44] và
Muegge [45] bao gồm những tiêu chí đánh giá để một chất có khả tiềm năng làm
thuốc phân tử nhỏ đường uống hay không. Các luật này lần lượt được các công ty
dược phẩm, công nghệ sinh học trên thế giới dùng như Amgen, GSK, Pharmacia và
Bayer. Chi tiết về tiêu chí của từng luật sẽ được nêu trong Bảng 2.4.
Bảng 2.4. Luật Ghose, Verber, Muegge và Egan
Ghose [42]
- -0,4 < logP < 5,6 Veber [43]
- 160 < MWa < 480 - Số liên kết xoay < 10
- 40 < MR < 130 - Diện tích bề mặt phân cực ≤ 140 Å2
- 20 < Số lượng nguyên tử < 70
Muegge [45] Egan [44]
Là một mô hình pharmacophore để phân Sử dụng mối tương quan giữa hai thông
biệt giữa hợp chất có khả năng làm thuốc số là AlogP98 và PSA để dự đoán các
hay không chất có khả năng thấm qua màng ruột
a) Khối lượng phân tử (MW); b) Khúc xạ phân tử mol (molar refractivity – MR)
Tất cả các chất trong nghiên cứu phải thoả tiêu chí của các luật này để được tiếp tục
thực hiện docking.
24
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
25
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
26
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
- Fix: Khi bật tính năng này chung với Tether, các nguyên tử xa hơn một khoảng
cách được đề ra (mặc định 8 Å) sẽ được ràng buộc và sửa toạ độ
- Refine: Tối thiểu hoá năng lượng với giá trị RMS là 0,0001 kcal/mol/A
Cấu trúc đã chuẩn bị của IL-1R1 (mã PDB: 1ITB) và IL-1β (mã PDB: 9ILB) trong
nghiên cứu trước của Lê Minh Trí và cộng sự [5] sẽ được sử dụng lại.
2.4.2. Chuẩn bị cấu trúc 3D phối tử
Các phối tử sau khi được sàng lọc pharmacophore sẽ giữ lại cấu dạng có RMSD thấp
nhất. Tiếp đến, các phối tử này sẽ được lần lượt chuyển thành tệp *.mol2 để tiến hành
chuẩn bị trong Sybyl-X 2.0 [46].
Các bước chuẩn bị trong Sybyl-X 2.0 bao gồm tối thiểu hoá năng lượng lần 1, động
lực học, sau đó tối thiểu hoá năng lượng lần 2. Các thông số tối thiểu hoá năng lượng
cho cả lần 1 và 2 được thiết lập như sau:
- Method (phương pháp): Conj Grad (Gradient liên hợp)
- Termination à Energy Change (Ngưng khi RMS đạt giá trị này): 0,0001 kcal/mol
- Max Iterations (số bước lặp lại): 10.0000
- Modify à Charge (Trường lực): Gasteiger-Huckel
- Các thông số khác được để mặc định
Động lực học phân tử được tiến hành bằng công cụ Compute à Dynamics à Setup
Simulated Annealing. Thông số Run = 5 và các thông số khác mặc định. Quá trình
động lực học mô phỏng luyện kim này có tác dụng giúp phân tử vượt qua trạng thái
năng lượng tối thiểu cục bộ. Sau đó, nhờ lần tối thiểu hoá năng lượng thứ 2 để tìm ra
trạng thái năng lượng tối thiểu toản phần của phân tử đó.
Sau khi thực hiện 3 bước chuẩn bị, các phối tử sẽ được lưu thành một tập dữ liệu
chung định dạng *.sdf để LeadIT 2.1.8 có thể đọc được và thực hiện docking.
2.4.3. Xây dựng mô hình khoang gắn kết
Cấu trúc protein đã được chuẩn bị được đưa vào LeadIT 2.1.8 bằng Load or Prepare
Receptor à Protein from File: Select…. Sau đó, đi tới Define Binding Site (Xác định
khoang gắn kết) mở Project Tree và đánh dấu “X” vào các acid amin quan trọng để
chỉ những acid amin này hiển thị trên cửa sổ chính. Tiến hành “ghim” các acid amin
này bằng cách nhấp chuột vào vị trí hiển thị tương ứng. Khi đã “ghim” tất cả các acid
amin quan trọng, mở khoang gắn kết với bán kính 6,5 Å (với các acid amin được
“ghim” là tâm vòng tròn mở khoang). Bán kính mở khoang này áp dụng cho tất cả
các vị trí gắn kết mà nghiên cứu sử dụng.
2.4.4. Docking bằng LeadIT 2.1.8
Khi khoang gắn kết đã được xây dựng, tiến hành docking bằng Docking à Define
FlexX Docking à Docking Library à Load File. Các thông số sử dụng khi docking
là:
27
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
- Number of Poses to Keep (Số cấu dạng giữ lại): Top10 (10)
- Docking Library: Thư viên phối tử được sử dụng
- Maximum Number of Solutions per Iteration (Số lần lặp lại tối đa): 1.000
- Maximum Number of Solutions per Fragmentation (Số lần phân mảnh tối đa): 200
Chọn Apply & Dock! Để bắt đầu docking.
Kết quả sau khi docking được lưu dưới dạng tệp *.sdf bằng đường dẫn Docking à
Export Poses…. Ngoài ra, toàn bộ quá trình docking cũng sẽ được lưu lại bằng đường
dẫn LeadIT à Save Project As…, tệp *.fxx.
2.5. PHÂN TÍCH KẾT QUẢ DOCKING
Mục đích chính của phương pháp docking là nhằm dự đoán cấu dạng gắn kết của
phối tử trên đích tác động. Để đánh giá kết quả docking, các phần mềm thường đưa
ra kết quả ở dạng điểm số nhằm phân hạng các cấu dạng để lựa chọn cấu dạng phù
hợp. Các mô hình cho điểm thường được xây dựng để phù hợp cho tất cả các đích
protein. Tuy vậy, độ chính xác của điểm số thường thay đổi rất nhiều khi đích tác
động thay đổi [47].
Do đó, để đảm bảo việc lựa chọn kết quả các cấu dạng tiềm năng được chính xác hơn,
nghiên cứu áp dụng phương pháp phân tích dấu vân tay tương tác protein-phối tử
(protein-ligand interaction fingerprint – PLIF) kết hợp với điểm số docking để phân
tích kết quả.
Phương pháp PLIF biểu thị tương tác phối tử-protein dưới dạng hình ảnh 1 chiều [48].
Trong đó, mỗi tương tác giữa acid amin trong protein và phối tử tương ứng với một
vạch đen trong biều đồ. Kết quả khi xếp chồng nhiều phối tử cùng tương tác tại một
vị trí gắn kết sẽ tạo ra nhiều mã vạch (barcode) xếp chồng lên nhau.
Tệp *.sdf sau khi docking sẽ được chuyển thành định dạng *.mdb để mở được trong
MOE 2015.10 để tiến hành phân tích kết quả bằng phương pháp PLIF (Protein-
Ligand Interaction Fingerprints). Phân tích PLIF (Hình 2.8) bao gồm bước tính toán
các tương tác protein-ligand và phân tích kết quả.
2.5.1. Tính toán tương tác protein-ligand
Các bước tính toán được cụ thể hoá như sau:
- Mở CSDL *.mdb sau khi docking. Tiếp đến, mở cấu trúc protein đã được dùng
để docking bằng LeadIT qua File à Open à *.pdb.
- Trong cửa sổ CSDL *.mdb, chọn Compute à PLIF à Generate…
- Trên cửa sổ PLIF Setup: Chọn Receptor: Receptor + Solvent. Ở Ligand: mol để
chọn cột chứa thông tin cấu dạng sau khi docking. Các thông số khác sẽ được để
mặc định. Sau khi thiết lập xong, chọn Prepare để thực hiện tính toán các tương
giữa protein và các cấu dạng phối tử.
28
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
29
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
force field), nên phải đảm bảo phối tử đã được được thêm hydro. Thực hiện điều này
bằng cách mở phối tử bằng phần mềm Avogadro [49], chọn Build à Add hydrogens.
Sau đó, tải tệp ligand.mol2 lên SwissPARAM (http://www.swissparam.ch) để lấy
topology cho phối tử là “ligand.itp”. Toạ độ phối tử được tạo bằng cách chuyển tệp
“ligand.pdb” thành “ligand.gro”.
2.6.1.3. Tạo topology và toạ độ cho phức hợp
Sau khi topology cho phối tử và protein được tạo, tiến hành tạo một tệp complex.gro
(sao chép từ protein_processed.gro). Mở tệp complex.gro bằng một phần mềm chỉnh
sửa chữ (Text Editor) bất kỳ và sao chép thông số toạ độ của nguyên tử trong
ligand.gro vào sau thông số của protein. Tiếp đến, sửa lại số nguyên tử cho đúng với
tổng số nguyên tử của phức hợp và lưu tệp complex.gro lại.
Mở tệp “topol.top” và thêm vào lệnh “Include ligand topologies” để phần mềm nhận
topology của phối tử.
2.6.2. Tạo hộp và solvat hoá
Phức hợp sẽ được mô phỏng động lực học trong một khối hộp, khoảng cách từ phức
hợp đến cạnh của hộp sẽ là 1,0 nm (d 1.0). Hình 2.7 minh hoạ hộp chứa phức hợp
chưa được solvat hoá. Hộp này sau đó sẽ được thêm nước (solvat hoá).
30
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
31
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
với 2000 khung hình (frame). Các thông số động lực học trong tệp md.mdp sẽ được
cụ thể trong PHỤ LỤC 6.
2.6.7. Phân tích kết quả động lực học
Các lệnh để thực hiện phân tích kết quả động lực học sẽ nằm trong PHỤ LỤC 7.
2.6.7.1. Độ ổn định của protein tự do và phức hợp
Trong suốt quá trình mô phỏng động lực học (20 ns), có thể sử dụng giá trị RMSD
(căn bậc hai độ lệch trung bình bình phương) để đánh giá mức độ ổn định của các
nguyên tử trong điều kiện mô phỏng. Cụ thể hơn, RMSD có thể dùng để đánh giá
protein tự do, phối tử hoặc phức hợp có ổn định hay không. Công thức RMSD (2)
[27]:
)
𝑅𝑀𝑆𝐷(𝑡) , 𝑡* ) = 2" ∑,
+-) 𝑚+ ||𝑟+ (𝑡) ) − 𝑟+ (𝑡* )|| (2)
*
32
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
567
Trong đó, T là thời gian cần tính trung bình và 𝑟+ là vị trí tham chiếu của nguyên tử
i. Giá trị RMSF càng cao chứng tỏ acid amin đó linh động và ngược lại, giá trị RMSF
thấp cho thấy acid amin di chuyển giới hạn trong quá trình mô phỏng so với vị trí ban
đầu [54]. RMSF > 0,2 chứng tỏ acid amin (hoặc phối tử) đó linh động [55].
2.6.7.4. Liên kết hydro trong quá trình mô phỏng
Liên kết hydro sẽ được tính dựa trên kết quả động lực học bằng phần mềm VMD
1.9.4 [56]. Nghiên cứu sẽ tính toán số liên kết hydro mạnh hình thành theo thời gian,
cũng như các acid amin nào có xuất hiện liên kết hydro này. Liên kết hydro được
phân loại trong Bảng 2.6 [57].
Bảng 2.6. Phân loại liên kết hydro
Rất mạnh Mạnh Yếu
Năng lượng liên kết (kJ/mol) 63–167 17–63 <17
Ví dụ (F. . .H. . .F)- O-H…O=C C-H…O
(N. . .H. . .N)+ N-H…O=C N-H…F-C
P-OH…O=P O-H…O-H O-H…π
Độ dài liên kết H-A ≈ D-H H. . .A > D-H H. . .A >> D-H
Khoảng cách D. . .A (Å) 2,2–2,5 2,5–3,2 3,0–4,0
Khoảng cách H. . .A (Å) 1,2–1.5 1,5–2,2 2,0–3,0
Số liên kết ngắn hơn van der Waals 100% Gần 100% 30–80%
Góc D–H. . .A (º) 175–180 130–180 90–180
Trong thư mục chứa kết quả động lực học, mở Terminal và gõ “vmd” để truy cập
phần mềm VMD. Mở hai tệp là md_0_20.gro và md_0_20_fit.xtc bằng đường dẫn
File à New Molecule… à File name: (Chọn tệp) à Load. Sau đó, dùng công cụ
tính liên kết hydro trong Extensions à Analysis à Hydrogen Bonds. Ở đây, để tính
được liên kết hydro mạnh, thiết lập thông số như sau:
- Selection 1: protein
- Selection 2 (Optional): resname LIG
- Frames: all (lấy tất cả khung hình)
- Selection is the: Both (Xét cả liên kết cho và nhận)
- Donor-Acceptor Distance (Å): 3,2
- Angle cutoff (degrees): 50 (Những góc nhỏ hơn số này sẽ được ghi nhận)
- Calculate detailed info for: All hbonds (tính tất cả số liên kết hydro)
- Write to output file: Nhấn chọn để tạo tệp xuất ra.
Sau khi thiết lập thông số, chọn Find hydrogen Bonds! để tiến hành tìm liên kết hydro
và tạo các tệp đầu ra để phân tích thêm.
33
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
Lưu ý, phần mềm VMD định nghĩa góc theo vector. Góc A-H-D theo định nghĩa của
VMD dựa trên trường lực CHARMM19 sẽ là góc giữa vector 𝐴𝐻 <<<<<<⃗ và <<<<<<⃗
𝐻𝐷 [58]. Đây
là góc kề bù của góc D-H…A (130-180º cho liên kết hydro mạnh).
2.7. TÍNH TOÁN NĂNG LƯỢNG TỰ DO
Tính toán năng lượng tự do của liên kết protein-phối tử được thực hiện dựa trên kết
quả mô phỏng động lực học, sử dụng phần mềm g_mmpbsa 5.1.2 [35]. Quá trình tính
toán sẽ trải qua 3 bước. Tuy vậy, để có thể sử dụng được phần mềm, kết quả động
lực học cần được tinh chỉnh về phiên bản phù hợp mà g_mmpbsa 5.1.2 có thể hiểu.
2.7.1. Thực hiện tính toán bằng g_mmpbsa 5.1.2
Năng lượng gắn kết tự do (binding free energy) của phức hợp protein-ligand được
tính toán bằng nguyên lý diện tích bề mặt cơ học phân tử (MM-PBSA). Công thức
(5) [55]:
∆𝐺%+ê9 ;ế( = 𝐺=>ứ@ − (𝐺=5$(6+9 + 𝐺%+.'9A ) (5)
Trong đó, 𝐺=>ứ@ là năng lượng của phức hợp protein-ligand, 𝐺=5$(6+9 và 𝐺%+.'9A lần
lượt là năng lượng của protein và phối tử trong dung môi nước. Năng lượng tự do của
từng thành phần trong công thức trên được tính như sau:
𝐺! = 𝐸"" + 𝐺#$%&'( − 𝑇∆𝑆
- 𝐺! có thể là 𝐺=>ứ@ , 𝐺=5$(6+9 hoặc 𝐺%+.'9A .
- 𝐸"" là thế năng cơ học phân tử trong chân không, bao gồm năng lượng liên kết
(𝐸%+ê9 ;ế( ) và năng lượng không liên kết (𝐸;>ô9. %+ê9 ;ế( ). 𝐸%+ê9 ;ế( là năng lượng
của các tương tác trong liên kết (bonded interactions) và được tính bằng 0 trong
một mô phỏng động lực học [59]. 𝐸&AC là năng lượng của tương tác van der Waals
và 𝐸6%6@ là năng lượng của các tương tác tĩnh điện. Công thức (6) [55]:
𝐸"" = 𝐸%+ê9 ;ế( + 𝐸;>ô9. %+ê9 ;ế( = 𝐸%+ê9 ;ế( + (𝐸&AC + 𝐸6%6@ ) (6)
- 𝐺#$%&'( là năng lượng solvat hoá, nghĩa là năng lượng cần để chuyển chất tan từ
chân không vào dung môi. Trong nguyên lý MM-PBSA, năng lượng solvat hoá
bao gồm 2 năng lượng thành phần là năng lượng solvat hoá phân cực (𝐺=>â9 @ự@ )
và năng lượng solvat hoá không phân cực (𝐺;>ô9. =>â9 @ự@ ) được tính như công
thức (7) sau [55]:
𝐺#$%&'( = 𝐺=>â9 @ự@ + 𝐺;>ô9. =>â9 @ự@ (7)
- 𝑇∆𝑆 là lượng entropy đóng góp vào hệ. T là nhiệt độ và ∆𝑆 là entropy. Tuy vậy,
việc ước tính entropy thường tốn nhiều thời gian và sai số thường lớn so với các
thành phần năng lượng khác. Thêm nữa, tổng năng lượng do entropy đóng góp
vào công thức thường không cao, và nhiều nghiên cứu đã cho thấy việc đưa
entropy vào công thức chỉ tăng mức tương quan với năng lượng thực nghiệm rất
nhỏ [35].
34
Khoá luận tốt nghiệp DSĐH Đối tượng và phương pháp nghiên cứu
Do đó, công thức tính năng lượng tự do có thể được viết lại như sau (8):
𝐺! = (𝐸&AC + 𝐸6%6@ ) + 𝐺=>â9 @ự@ + 𝐺;>ô9. =>â9 @ự@ (8)
Phần mềm g_mmpbsa sẽ thực hiện 3 bước tính năng lượng thành phần, lần lượt là thế
năng cơ học phân tử ( 𝐸"" = 𝐸&AC + 𝐸6%6@ ), năng lượng solvat hoá phân cực
(𝐺=>â9 @ự@ ) và năng lượng solvat hoá không phân cực (𝐺;>ô9. =>â9 @ự@ ). Các lệnh để
tính toán năng lượng sẽ được trình bày trong PHỤ LỤC 8.
2.7.1.1. Tính toán thế năng cơ học phân tử:
Kết quả sẽ tạo 2 tệp là energy_MM.xvg và contrib_MM.dat. Tệp energy_MM.xvg
chứa thông tin về kết quả thế năng trong chân không, contrib_MM.dat chứa năng
lượng mà từng acid amin đóng góp vào tổng thế năng cơ học phân tử.
2.7.1.2. Tính toán năng lượng solvat hoá phân cực
Bước này yêu cầu thông số từ tệp polar.mdp, sẽ được trình bày trong PHỤ LỤC 9.
Kết quả sẽ tạo 2 tệp polar.xvg và contrib_pol.dat. Tệp polar.xvg chứa thông tin năng
lượng solvat hoá phân cực, contrib_pol.dat chứa thông tin năng lượng mà từng acid
amin đóng góp vào tổng năng lượng solvat hoá.
2.7.1.3. Tính toán năng lượng solvat hoá không phân cực
Bước này cũng cần thông số lấy từ tệp apolar.mdp, chi tiết sẽ được trình bày trong
(PHỤ LỤC 10). Kết quả bước này sẽ tạo 2 tệp apolar_sasa.xvg và sasa_contrib.dat.
Tệp apolar_sasa.xvg cho kết quả năng lượng solvat hoá không phân cực của protein
tự do, phối tử tự do và phức hợp phối tử-protein. Tệp sasa_contrib.dat chứa thông tin
năng lượng từng acid amin đóng góp vào tổng năng lượng solvat hoá không phân cực.
2.7.1.4. Tính năng lượng gắn kết tự do
Sau khi đã tính 3 năng lượng thành phần, sử dụng tệp MmPbSaStat.py (PHỤ LỤC
11) để thực hiện tính tổng 3 thành phần này. Hai tệp tạo thành sẽ chứa kết quả tính
toán năng lượng gắn kết trung bình (summary_energy.dat) và sự biến thiên năng
lượng gắn kết theo thời gian (full_energy.dat).
35
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
36
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
Từ kết quả có thể thấy số lượng hợp chất bị trùng lặp và không thoả luật 5-Lipinski
là khá nhiều, chiếm 43,59% số chất đầu vào (215.883/495.238). Trong đó, tập UNDP
có số hợp chất bị loại bỏ nhiều nhất, lên đến 90% số tổng số chất của tập. Tập MBHC,
MBPPI và DB lần lượt có chất bị loại là 0/13.809, 575/8.349 và 821/8.820.
Lưu ý, bước này chỉ áp dụng cho các tập có thể tải về lưu trữ ngoại tuyến, nên tập
ZINC sẽ không được chuẩn bị trong bước này mà sẽ được chuẩn bị sau khi đã sàng
lọc pharmacophore.
3.2. KẾT QUẢ SÀNG LỌC PHARMACOPHORE
Đề tài đã sử dụng 9 mô hình pharmacophore để sàng lọc trên tổng số 7 CSDL. Trong
đó, 8 mô hình pharmacophore là kết quả trong nghiên cứu của Lê Minh Trí [5] (Bảng
3.2) và một mô hình được xây dựng thêm là Ph-1L1β-β5_β6. Hình ảnh tất cả 9 mô
hình này trong MOE 2015.10 [29] sẽ có ở PHỤ LỤC 12.
Mô hình Ph-1L1β-β5_β6 này được xây dựng dựa trên tương tác của canakinumab và
IL-1β [20]. Trong tổng 7 CSDL, có 1 CSDL là ZINC Purchasable phải thực hiện sàng
lọc pharmacophore riêng bằng công cụ ZINCPhamer [36], 6 CSDL còn lại sẽ được
sàng lọc bằng MOE 2015.10 [29]. Kết quả sàng lọc pharmacophore từ ZINCPharmer
và từ MOE 2015.10 sau đó sẽ được gộp lại dựa trên vị trí tác động của IL-1β và của
IL-1R1.
Bảng 3.2. Tóm tắt 8 mô hình pharmacophore của Lê Minh Trí và cộng sự [5]
Đích tác Tên mô
Vị trí Cơ sở xây dựng mô hình
động hình
A Ph-IL1β-A Tương tác giữa IL-1β và IL-1R1
IL-1β
B Ph-IL1β-B Tương tác giữa IL-1β và IL-1R1
Ph-IL1R1-a1 Tương tác giữa IL-1R1 và IL-1RA
Rãnh D1- Ph-IL1R1-a2 Tương tác giữa IL-1R1 và IL-1β
D2 Các acid amin quan trọng của IL-
Ph-IL1R1-a3
1R1
IL-1R1 Ph-IL1R1-
Tương tác giữa IL-1R1 và IL-1RA
b1
Ph-IL1R1-
D2 Tương tác giữa IL-1R1 và IL-1β
b2
Ph-IL1R1- Các acid amin quan trọng của IL-
b3 1R1
Mô hình pharmacophore xây dựng được từ tương tác giữa canakinumab và IL-1β có
6 điểm, với 4 điểm bắt buộc là F1, F2, F3, F4. Hai điểm F5 và F6 là không bắt buộc.
Điểm F1 và F2 là hai ion dương, F3 và F4 là hai vị trí nhận liên kết hydro, F5 và F6
là cho hydro. F1, F2 là 2 điểm cho tương tác trên acid amin Glu64 của IL-1β. F3 và
37
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
F4 cho tương tác với acid amin Lys65. F5 và F6 cho tương tác với acid amin Asn66.
Hình 3.2 cho thấy hình ảnh mô hình pharmacophore và hình ảnh pharmacophore đặt
trên IL-1β. Mô hình Ph-1L1β-β5_β6 cùng với 8 mô hình trong nghiên cứu trước của
Lê Minh Trí [5] được dùng để sàng lọc trên các tập dữ liệu đã chuẩn bị.
Trái: Mô hình pharmacophore Ph-1L1β-β5_β6; Phải: Gióng hàng mô hình trên IL-1β
Dưới: Gióng hàng mô hình trên các acid amin tương tác (xanh: IL-1β, hồng:
canakinumab)
Hình 3.2. Mô hình Ph-1L1β-β5_β6
3.2.1. Kết quả sàng lọc mô hình pharmacophore trên CSDL ZINC
Như đã trình bày ở mục 2.1, các chất sau khi được sàng qua 9 mô hình pharmacophore
bằng ZINCPhamer được xoá trùng lặp và sàng qua định luật 5-Lipinski [37] bằng
MOE để đảm bảo thống nhất với 6 CSDL còn lại. Kết quả sàng lọc cụ thể của từng
mô hình sẽ được trình bày tại PHỤ LỤC 13. Ở đây, Bảng 3.3 sẽ trình bày kết quả
sàng lọc theo vị trí tác động.
Từ kết quả có thể thấy, 21 triệu chất trong tập ZINC Purchasable chỉ cho được một
lượng nhỏ chất thoả các vị trí tác động này. Cụ thể, vị trí A trên IL-1β chỉ có 1.772
chất tiềm năng (trên 21 triệu), lượng chất còn lại sau khi đã xoá trùng lặp và thoả luật
38
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
5-Lipinski chỉ còn 227 chất. Tương tự, vị trí B chỉ thu về 239 chất. Vị trí β5-β6 còn
8 chất là không trùng nhau và thoả luật 5-Lipinski.
Bảng 3.3. Kết quả sàng lọc pharmacophore của CSDL ZINC
Kết quả sàng trên Xoá trùng lặp &
Vị trí sàng lọc ZINCPharmer 5-Lipinski
(chất) (chất)
A 1.772 227
IL-1β B 1.195 239
β5-β6 39 8
Rãnh D1-D2 2.218 119
IL-1R1
D2 25.675 4.694
3.2.2. Kết quả sàng lọc mô hình pharmacophore với 6 CSDL còn lại
Khác với tập ZINC (phải sàng lọc trực tuyến bằng ZINCPharmer), 6 CSDL còn lại
(MBHC, MBPPI, CDPM, CDPPI, UNDP và DB) sẽ được sàng lọc pharmacophore
bằng MOE 2015.10. Ở 6 CSDL này, DrugBank đã được sàng lọc trong nghiên cứu
của Lê Minh Trí [5] bằng 8 mô hình pharmacophore trong Bảng 3.2. Do đó, riêng
với CSDL DrugBank, nghiên cứu chỉ sàng lọc trên vị trí β5-β6 của IL-1β (là vị trí
mới được xây dựng). Kết quả sàng lọc pharmacophore trên IL-1β và IL-1R1 sẽ được
trong Bảng 3.4.
Chi tiết kết quả sàng lọc trên từng mô hình pharmacophore của nghiên cứu sẽ có trong
PHỤ LỤC 14.
Kết quả cho thấy từ 6 CSDL với tổng 279.355 chất, số lượng chất thoả từng vị trí tác
động chiếm không tới 1%. Cụ thể, đối với 3 vị trí trên IL-1β (A, B và β5-β6), vị trí A
chỉ thu được 316 trên tổng 279.355 chất đầu vào (~0,1%). Vị trí B thu được
983/279.355 chất (~0,4%). Vị trí vòng β5-β6 thu được 552/279.355 chất (~0,2%).
Đối với 2 vị trí trên IL-1R1 (rãnh D1-D2 và D2), rãnh D1-D2 thu được 2.046/279.355
chất (~0,7%). Vị trí D2 thu được 1.621/279.355 chất (~0,6%). Kết quả từ 6 CSDL
này sau đó sẽ được cộng với kết quả của CSDL ZINC để thực hiện đánh giá ADME
và docking.
39
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
Tổng
CSDL (và số chất đầu vào)
(chất)
Vị trí sàng MBHC MBPPI CDPM CDPPI UNDP DB
lọc (13.809 (7.774 (12.318 (215.329 (22.126 (7.999 279.355
chất) chất) chất) chất) chất) chất)
A 3 10 23 152 128 316
IL-
B 12 40 174 603 154 983
1β
β5-β6 3 30 66 365 14 74 552
Rãnh
IL- D1- 16 101 294 1129 506 2.046
1R1 D2
D2 67 127 121 866 440 1.621
3.2.3. Tổng hợp kết quả sàng lọc pharmacophore
Kết quả số lượng chất thu về được trình bày ở Bảng 3.5. Tóm lại, với 7 CSDL sau
khi cộng gộp, ở 3 vị trí A, B và β5-β6 trên IL-1β lần lượt sẽ có lần lượt 543, 1.222 và
560 chất được đánh giá ADME. Ở 2 vị trí rãnh D1-D2 và D2 trên IL-1R1 sẽ có lần
lượt là 2.165 và 6.315 chất được đánh giá ADME
Bảng 3.5. Kết quả sàng lọc pharmacophore trên 7 CSDL
IL-1β IL-1R1
Cơ sở dữ liệu β5- Rãnh D1-
A B D2
β6 D2
6 CSDL: MBHC, MBPPI, CDPM, CDPPI,
316 983 552 2.046 1.621
UNDP, DB
ZINC 227 239 8 119 4.964
543 1.222 560 2.165 6.315
Tổng
2.235 8.480
Tóm lại, kết quả sàng lọc pharmacophore trên IL-1β thu được 2.235 chất và trên IL-
1R1thu được 8.480 chất.
3.3. KẾT QUẢ ĐÁNH GIÁ ADME
3.3.1. Kết quả sàng lọc bằng SwissADME
Kết quả sàng lọc pharmacophore từ 7 CSDL trong Bảng 3.5 sẽ được dự đoán ADME
bằng nhiều tiêu chí khác nhau. Các tiêu chí được dự đoán trên SwissADME [30] bao
gồm PAINS [40], Ghose (Amgen) [42], Veber (GSK) [43], Egan (Pharmacia) [44],
Muegge (Bayer) [45], Brenk [41], BOILED-Egg [38] và không ức chế cytochrom
P450 [30]. Các chất sau khi được sàng để thoả những tiêu chí này sẽ có khả năng đạt
những tiêu chuẩn cho các hợp chất dùng làm thuốc đường uống, cũng như có một độ
40
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
an toàn về dược động nhất định. Bảng 3.6 cho thấy số lượng hợp chất còn lại sau khi
đã sàng lọc qua những tiêu chí trên. Tổng số chất thoả đánh giá ADME trên IL-1β là
202, với 18 chất trên vị trí A, 82 chất trên vị trí B và 102 chất tại β5-β6. Trên IL-1R1
thu được 1.054 chất, với rãnh D1-D2 có 115 chất và vị trí D2 là 939 chất.
Bảng 3.6. Kết quả sàng lọc SwissADME
IL-1β IL1-R1
Vị trí β5- Rãnh D1-
A B D2
β6 D2
Số chất sau khi sàng pharmacophore 543 1.222 560 2.165 6.315
Số chất thoả các mô hình 18 82 102 115 939
SwissADME 202 1.054
3.3.2. Mô hình BOILED-Egg
Hình 3.3 và Hình 3.4 thể hiện vị trí các hợp chất đã được sàng lọc qua SwissADME
(ở mục 3.3.1) trong mô hình BOILED-Egg [38]. Hình 3.3 là mô hình cho các hợp
chất sẽ được docking trên IL-1β và Hình 3.4 là cho các hợp chất sẽ được docking
trên IL-1R1. Màu xanh dương nghĩa là chất đó được dự đoán là có chịu tác động của
bơm ngược P-gp, nghĩa là bị P-gp bơm ngược ra khỏi tế bào. Ngược lại, màu đỏ dự
đoán các chất không bị bơm ngược P-gp tác động. Các chất được dự đoán có khả
năng hấp thu thụ động qua ruột sẽ nằm trong vùng màu trắng (PSA < 142 Å2 và logP
trong khoảng -2,3—+6,8). Những chất được mô hình dự đoán là có thể hấp thu thụ
động qua hàng rào máu não sẽ nằm trong vùng màu vàng (PSA < 79 Å2 và logP từ
+0,4—+0,6).
41
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
Hình 3.3. Mô hình BOILED-Egg trên IL-1β: Trái: vị trí; A; Phải: vị trí B
Dưới: vị trí β5-β6
Hình 3.4. Mô hình BOILED-Egg trên IL-1R1: Trái: rãnh D1-D2; Phải: Vị trí D2
Từ Hình 3.3 và Hình 3.4, có thể thấy rằng tất cả các hợp chất đều nằm trong vùng
màu trắng (PSA < 142 Å2 và logP trong khoảng -2,3—+6,8). Kết quả này dự đoán
rằng tất cả các chất này đều có khả năng hấp thu thụ động qua đường uống. Tuy vậy,
chỉ một số nhỏ hợp chất nằm được trong vùng màu đỏ (PSA < 79 Å2 và logP từ
+0,4—+0,6) hoặc không chịu ảnh hưởng của bơm ngược P-gp (màu đỏ). Từ đó, có
thể nhận định rằng lượng hợp chất tiềm năng hấp thu thụ động qua hàng rào máu não
42
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
cũng như không bị ảnh hưởng của bơm ngược P-gp là khá ít, đặc biệt là những hợp
chất thoả cả 2 điều kiện này.
Kết quả những chất thoả các điều kiện đã lựa chọn trong SwissADME sẽ được tiến
hành docking trên 5 vị trí tương ứng (Bảng 3.6).
3.4. CÁC MÔ HÌNH DOCKING
Nghiên cứu thực hiện docking trên tổng cộng 5 vị trí (A, B, β5-β6, rãnh D1-D2 và
D2). Vì kết quả docking của vị trí β5-β6 được sử dụng để mô phỏng động lực học và
tính toán năng lượng gắn kết tự do nên sẽ được trình bày ở đây. Cấu trúc hoá học các
chất được sử dụng docking sẽ có trong PHỤ LỤC 15. Hình ảnh khoang docking ở 4
vị trí còn lại là A, B, rãnh D1-D2 và D2 sẽ được trình bày trong PHỤ LỤC 16.
Hình 3.5 cho thấy hình ảnh vị trí docking β5-β6 trên IL-1β. Các acid amin quan trọng
ở vị trí β5-β6 là Glu64, Lys65 và Asn66 đều được làm rõ trong hình vị trí gắn kết. Từ
Hình 3.5 có thể nhận thấy bề mặt tại vòng β5-β6 có diện tích khá nhỏ và liền mạch
(vì là 3 acid amin liền kề nhau), tạo điều kiện cho các phối tử dễ dàng gắn kết. Tuy
vậy, bề mặt này lại khá phẳng, không tạo thành khoang hay hố sâu nên các phối tử
có khả năng không thể duy trì được gắn kết lâu dài.
43
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
0
Điểm số docking (Kj/mol) -2
-4
-6
13%
-8 Từ -15 đến
-10 -20 kJ/mol
26%
-12 Từ -15 đến
-14 -10 kJ/mol
-16 61% Từ -10 đến
-18
0 kJ/mol
-20
0 500 1000
968 cấu dạng
44
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
với phối tử cho liên kết hydro và có liên kết ion. Lys65 chỉ cho tương tác van der
Waals. Asn 66 có tương tác π-hydro với phối tử. Ngoài ra, phối tử này còn tương tác
van der Waals với Pro87, Glu37 và Gln38 trong khoang gắn kết.
45
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
acid amin khác không quan trọng có tương tác với P634-0250 là Met20, Gln39 và
Leu62. Trong đó, Met20, Gln39 và Leu62 đều nhận một hydro từ phối tử.
46
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
dock, chỉ những cấu dạng tương tác với cả 3 acid amin quan trọng trong β5-β6 (Glu65,
Lys65 và Asn66) được giữ lại.
Kết quả phân tích PLIF đã thu được 618 cấu dạng của 75 chất và loại được 22 chất.
Hình 3.12 là lý giải cũng như kết quả sàng lọc bằng phương pháp PLIF từ MOE
2015.10. Kết quả từ MOE được trích xuất và sử dụng tính năng filter của phần mềm
Excel. Cụ thể, ở 3 cột (cột J, Kvà L) chứa thông tin tương tác với acid amin lần lượt
là Glu64, Lys65 và Asn66, các cấu dạng không có tương tác sẽ bị bỏ ra ngoài. Sau
đó, cột điểm số docking (B) sẽ được xếp theo thứ tự từ nhỏ đến lớn (âm nhất đến
dương nhất).
Hình 3.12. Kết quả và lý giải phân tích PLIF trên β5-β6
Hình 3.13 biểu diễn tương tác 618 cấu dạng của 75 chất này trên các acid amin tại vị
trí docking β5-β6. Từ kết quả có thể thấy rằng, phân tích PLIF đã thu về tất cả các
cấu dạng có tương tác với 3 acid amin quan trọng (Glu64, Lys65 và Asn66). Ngoài
ra, phân tích PLIF còn cho thấy các cấu dạng này còn tương tác với các acid amin
khác như Lys63, Lys84 và Pro87 với một tỷ lệ khá thấp (< 20% tổng cấu dạng). Mã
số 75 chất này trong CSDL và điểm số docking tương ứng với từng cấu dạng sẽ có
trong PHỤ LỤC 19.
47
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
600
500
300
200
100
6
3
37
39
64
7
20
n6
u6
o2
s6
s6
s8
o8
lu
ln
lu
et
Ly
Ly
Ly
As
Le
Pr
Pr
G
G
M
Acid amin
Hình 3.13. Dấu vân tay tương tác acid amin với 618 cấu dạng trên vị trí β5-β6
Sau khi phân tích PLIF và còn 75 chất tương tác với tất cả acid amin quan trọng trên
vòng β5-β6 của IL-1β, 5 chất có điểm số docking âm nhất sẽ được sử dụng để tiến
hành mô phỏng động lực học và tính toán năng lượng gắn kết tự do để đánh giá sâu
hơn khả năng gắn kết. Sau khi đánh giá PLIF, 5 chất có điểm số docking âm nhất vẫn
lần lượt là MHC09461 (tập MBHC) và 4 chất từ tập CDPPI là SA08-1111, T428-
0731, P634-0250 và S978-0388. Năm chất này đã được trình bày tương tác protein-
phối tử ở mục từ 3.4.1 đến 3.4.5.
3.6. ĐÁNH GIÁ MÔ PHỎNG ĐỘNG LỰC HỌC
Năm phối tử được sử dụng để mô phỏng động lực học đều có tương tác với tất cả các
acid amin quan trọng tại vị trí β5-β6 của IL-1β. Ngoài ra, đây là 5 chất có điểm số
docking âm nhất. Mã của 5 phối tử lần lượt là MHC09461 (MBHC), 4 chất từ tập
CDPPI là SA08-1111, T428-0731, P634-0250 và S978-0388. Cấu trúc 5 phối tử này
được trình bày ở Bảng 3.7. Theo cột tính chất hoá học có thể thấy rằng tất cả các cấu
trúc này đều thoả mãn các tiêu chí để được làm một thuốc phân tử nhỏ (theo luật 5-
Lipinski [37]).
48
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
Bảng 3.7. Cấu trúc hoá học và tính chất của 5 chất hit
Điểm số Tính
STT Mã Cấu trúc docking chất hoá
(kJ/mol) học
MWa:
401,50
MHC09461 N N
N LogPb:
1 -18,56
(C22H35N5O2) N O N 1,99
O HBAc: 5
HBDd: 0
MW:
383,49
SA08-1111 LogP:
5 N N
N N -18,55
(C21H29N5O2) 0,72
O
HN HBA: 7
O
HBD: 1
MW:
N 403,56
T428-0731 LogP:
2 N
H
N N O N -18,11
(C21H37N7O) N 1,69
N
H HBA: 5
HBD: 2
N N
MW:
NH 403, 56
O
P634-0250 LogP:
3 N -17,72
(C21H37N7O) N N
1,72
HBA: 5
NH
HBD: 2
MW:
O 412,53
S978-0388 N N LogP:
4 O -17,43
(C22H32N4O3) O 2,50
+HN NH+
HBA: 7
HBD: 0
a) Khối lượng phân tử. b) Hệ số phân bố dầu-nước, lấy từ CSDL của chất; c) Số nhóm
nhận liên kết hydro d) Số nhóm cho liên kết hydro
49
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
0,25
0,2
RMSD (nm)
0,15 Protein
MHC09461
0,1 T428-0731
P634-0250
0,05 S978-0388
SA08-1111
0
0
0
0
00
00
00
00
50
00
50
00
25
50
75
10
12
15
17
20
50
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
Kết quả từ Hình 3.15 khi xếp chồng bán kính xoay (Rg) của protein tự do và của
phức hợp protein-ligand cho thấy các đường này gần như chồng lên nhau và đều nằm
ngang. Giá trị Rg tuy dao động nhưng vẫn nằm ổn định trong khoảng từ 1,27 đến
1,32 nm trong suốt 20 ns. Kết quả này có thể nhận xét rằng cấu trúc không gian của
tất cả các protein (tự do hay phức hợp) đều được duy trì ổn định trong suốt quá trình
động lực học diễn ra (Hình 3.15). Cấu trúc không gian của protein được giữ ổn định
cho thấy kết quả mô phỏng động lực học là có ý nghĩa.
1,33
1,32
1,31
1,3 Protein
Rg (nm)
1,29 MHC09461
1,28 T428-0731
P634-0250
1,27
S978-0388
1,26
SA08-1111
1,25
0
00
00
00
0
00
50
00
50
00
25
50
75
10
12
15
17
20
Hình 3.15. Bán kính xoay của protein tự do và 5 phức hợp protein-phối tử
3.6.3. Độ linh động của acid amin
RMSF là giá trị để xét độ linh động của các acid amin trong một protein. Từ kết quả
RMSF, ta có thể thấy được vùng nào của protein là ổn định hoặc không. Thông
thường, các vùng có cấu trúc xoắn ⍺ hoặc β sẽ có RMSF thấp do có mạng lưới liên
kết hydro ổn định [61]. Khá giống với RMSD, RMSF xét tính ổn định của protein
theo thời gian. Tuy vậy, RMSF sẽ cho giá trị trung bình trên từng acid amin cụ thể
thay vì là giá trị theo thời gian như RMSD.
Hình 3.16 là kết quả xếp chồng các giá trị RMSF của các acid amin trong protein tự
do và phức hợp protein-phối tử. Giá trị này chồng lấp và khá tương đồng nhau. Đặc
biệt, ở vùng β5-β6 (acid amin 64-66) nơi thực hiện mô phỏng, giá trị RMSF < 0,2.
Kết quả này chứng tỏ các acid amin ở vùng này không di chuyển nhiều và khá ổn
định trong suốt quá trình MD.
51
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
0,4
0,35
0,3
Protein
RMSF (nm)
0,25
MHC09461
0,2
T428-0731
0,15
P634-0250
0,1 S978-0388
0,05 SA08-1111
0
3 18 33 48 63 78 93 108 123 138 153
Acid amin
Hình 3.16. RMSF các acid amin của protein tự do và 5 phức hợp protein-phối tử
3.6.4. Liên kết hydro trong quá trình mô phỏng
Từ các kết quả RMSD, bán kính xoay và RMSF, ta có thể kết luận rằng protein tự do
cũng như phức hợp protein-ligand ổn định trong suốt quá trình mô phỏng. Nhờ đó, ta
có thể thực hiện tính toán các bước sau, như tính toán số liên kết hydro hoặc tính toán
năng lượng gắn kết tự do,
3.6.4.1. Số liên kết hydro theo thời gian
Số liên kết hydro theo thời gian của 5 phức hợp được biểu diễn trong Hình 3.17.
Trong đó, chất cho nhiều liên kết hydro nhất là T428-0731, với tối đa 7 liên kết hydro
mạnh. Chất P634-0250 ở khoảng 18-20 ns cho số liên kết hydro rất ít, với chỉ một
liên kết hydro được duy trì trong suốt thời gian này. Ba chất còn lại là MHC09461,
S978-0388 và SA08-1111 đều có số liên kết hydro tối đa khá giống nhau, trong
khoảng từ 4-5 liên kết. Tuy vậy, chất SA08-1111 ở cuối thời gian mô phỏng (từ 19
ns) lại có dấu hiệu không hình thành liên kết hydro nữa. Tổng kết lại, có thể thấy chất
T428-0731 có tiềm năng gắn kết tối với thụ thể nhất. Điều này sẽ được minh chứng
ở kết quả tính toán năng lượng gắn kết tự do.
52
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
MHC09461 T428-0731
4 7
6
Số liên kết H
Số liên kết H
3 5
4
2
3
1 2
1
0 0
0
0
00
50
00
50
00
0
00
50
00
50
00
25
50
75
25
50
75
10
12
15
17
20
10
12
15
17
20
Thời gian (ps) Thời gian (ps)
P634-0250
6
5
Số liên kết H
4
3
2
1
0
0 250 500 750 1000 1250 1500 1750 2000
Thời gian (ps)
S978-0388
SA08-1111
5
4
4
3
Số liên kết H
Số liên kết H
3
2
2
1
1
0
0
00
50
00
50
00
0
0
0
0
00
50
00
50
00
0
25
50
75
25
50
75
10
12
15
17
20
10
12
15
17
20
53
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
1111 có liên kết với acid amin Glu64 ít nhất. Các acid amin quan trọng còn lại (Lys65,
Asn66) đều có cho liên kết với phối tử nhưng với số lượng không đáng kể.
200,00%
Trung bình số liên kết hydro
150,00% GLN38
LYS63
GLU64
100,00%
Lys65
ASN66
50,00% LEU67
TYR90
0,00%
MHC09461 T428-0731 P634-0250 S978-0388 SA08-1111
Phối tử
54
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
âm nhất nhưng lại không phải chất có năng lượng gắn kết âm nhất. Chất T428-0731
tuy có điểm số docking chỉ nằm hạng 3 nhưng lại cho khả năng gắn kết với thụ thể
tốt nhất. Đặc biệt, SA08-1111 tuy có điểm số docking đứng top 2, nhưng kết quả tính
toán năng lượng gắn kết lại cho thấy khả năng gắn kết của phối tử này là thấp nhất
trong 5 chất. Điều này có thể do năng lượng tương tác phụ thuộc vào số lượng và các
lực tương tác trong quá trình docking. Trong đó, một số chất sẽ cho năng lượng tương
tác âm hơn vì tương tác với các thành phần hặc acid amin không có vai trò hoạt tính
sinh học trong hệ.
Bảng 3.8. Kết quả tính toán năng lượng tự do
Hình 3.19 biểu diễn sự biến thiên năng lượng gắn kết theo thời gian của chất T428-
0731. Từ kết quả có thể thấy sự gắn kết giữa protein và phối tử này có xu hướng chặt
hơn theo thời gian (đường xu hướng màu cam đi xuống). Trong suốt quá trình gắn,
phối tử chỉ liên kết không ổn định ở khoảng thời gian 1 ns (biểu thị ở năng lượng gắn
kết > 0 kJ/mol). Suốt quãng thời gian mô phỏng còn lại, năng lượng gắn kết của phối
tử có xu hướng ngày càng âm, điều này chứng tỏ rằng phối tử liên kết ngày càng tốt
với IL-1β. Kết quả này của phối tử cho thấy T428-0738 có tiềm năng để thử in vitro
nhất trong 5 phối tử được mô phỏng động lực học.
55
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
T428-0731
-50
ΔG (kJ/mol)
-100
-150
-200
-250
0 2500 5000 7500 10000 12500 15000 17500 20000
Thời gian (ps)
Hình 3.19. Năng lượng gắn kết của T428-0731 theo thời gian
3.8. BÀN LUẬN
Để tìm kiếm chất ức chế IL-1β tiềm năng, nghiên cứu đã thực hiện sàng lọc trên 6
CSDL với tổng số chất là 22 triệu và sử dụng nhiều mô hình in silico khác nhau. Sau
khi lựa chọn một trong 5 vị trí tác động ức chế IL-1β là β5-β6 để tiến hành phân tích
kết quả docking, nghiên cứu đã chọn ra được 5 hợp chất tiềm năng nhất để mô phỏng
động lực học và đánh giá năng lượng gắn kết tự do. Trong số 5 chất này, T428-0731
từ tập ChemDiv PPI đã cho kết quả khả quan, với xu hướng gắn kết tốt hơn theo thời
gian (dựa vào giá trị năng lượng gắn kết có xu hướng âm dần). Chất T428-0731 có
thể được thử nghiệm in vitro để đánh giá khả năng ức chế IL-1β, hoặc tiến hành mô
phỏng động lực học với thời gian dài hơn nhằm tiếp tục đánh giá khả năng gắn kết.
Tuy kết quả tính toán năng lượng không được tốt như T428-0731, nhưng chất P634-
0250 cũng có tiềm năng để được thử nghiệm in vitro hoặc mô phỏng động lực học
với thời gian dài hơn. Ngoài ra, nhờ vào kết quả tính toán năng lượng gắn kết, có thể
kết luận rằng giới hạn của phương pháp đánh giá điểm số docking cũng được thể hiện,
khi mà 5 chất có điểm số docking âm nhất khi được tính toán năng lượng gắn kết tự
do lại không cho kết quả tương quan.
Nghiên cứu chưa mô phỏng động lực học và thực hiện tính toán năng lượng tự do của
4 vị trí còn lại trên IL-1β và IL-1R1. Ngoài ra, các mô hình pharmacophore trên IL-
1R1 của Lê Minh Trí [5] vẫn chưa được đánh giá để chọn ra hoặc chỉnh sửa để có
một mô hình hoàn chỉnh nhất. Đặc biệt là 6 mô hình trên IL-1R1, vốn chỉ dành cho
được 2 vị trí tác động (3 mô hình trên vị trí rãnh D1-D2 và 3 mô hình trên vị trí D2).
Nếu thực hiện được đánh giá mô hình pharmacophore trên IL-1R1, thời gian và tài
nguyên máy tính tiêu hao có thể sẽ ít hơn so với cách mà đề tài này đã thực hiện.
Không những vậy, đề tài nghiên cứu sẽ trở nên dễ hiểu hơn khi có ít mô hình
56
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
pharmacophore hơn, dẫn đến ít kết quả hơn và tránh nhầm lẫn hoặc khó hiểu cho
người đọc. Tuy vậy, tại thời điểm nghiên cứu thì tập chất ức chế IL-1R1 đã có IC50
thực nghiệm chưa có, dẫn đến việc đánh giá là không khả thi. Ngoài ra, nhược điểm
của phương pháp tính năng lượng gắn kết của nghiên cứu là khả năng tính toán của
phương pháp MM-PBSA chỉ có thể tính năng lượng gắn kết tương đối. Kết quả của
MM-PBSA chỉ nên dùng để so sánh khả năng gắn giữa các phối tử trên cùng một vị
trí với nhau chứ không nên dùng để ước tính kết quả thực nghiệm.
So với nghiên cứu trước của Lê Minh Trí [5], đề tài này đã bổ sung thêm một mô
hình pharmacophore, sàng lọc với lượng chất lớn hơn (~22 triệu so với ~7.000 chất),
bổ sung thêm bước mô phỏng động lực học cũng như tính toán năng lượng gắn kết
tự do. Tuy vậy, nhờ vào 8 mô hình pharmacophore mà Lê Minh Trí [5] đã xây dựng,
đề tài mới có thể thực hiện docking trên nhiều vị trí tiềm năng khác nhau của IL-1β
và IL-1R1.
Hiện nay, các nghiên cứu để tìm ra những phân tử nhỏ ức chế IL-1β trên thế giới vẫn
được tiến hành và sử dụng nhiều mô hình in silico khác nhau như QSAR,
pharmacophore, docking, mô phỏng động lực học gia tốc,…
Nhóm nghiên cứu của Sobia và cộng sự (Pakistan) [62] vào năm 2015 đã tiến hành
xây dựng mô hình 2D-QSAR dựa trên các chất ức chế IL-1β đã có IC50 từ nghiên cứu
của Matsuda và cộng sự (2001) [63]. Tập xây dựng 2D-QSAR gồm 48 chất, là những
dẫn xuất của 3,4-bis (4-methoxyphenyl)-pyridazine và 4,6-bis (4-methoxyphenyl)-
2H-pyridazin-3-one. Tiếp đến, Sobia đã xây dựng mô hình pharmacophore dựa trên
phối tử và docking bằng 2 phần mềm khác nhau. Kết quả docking bằng 2 phần mềm
được so để chọn ra 7 chất phân tử nhỏ tiềm năng từ 7 triệu chất tập ZINC. 7 chất phân
tử nhỏ này không được Sobia nêu rõ cấu trúc trong bài báo được đăng tải. So với đề
tài này, nghiên cứu của Sobia chỉ dừng lại ở docking, không thực hiện MD hay tính
toán năng lượng gắn kết và cũng không thử hoạt tính sinh học. Ngoài ra, lượng chất
sàng lọc của Sobia chỉ khoảng 1/3 lượng chất của đề tài (7 triệu so với 22 triệu). Tuy
vậy, nhược điểm của đề tài này khi so sánh với nghiên cứu của Sobia là không thực
hiện xây dựng mô hình 2D-QSAR dựa trên các chất ức chế IL-1β và không xây dựng
pharmacophore dựa trên các phối tử có IC50 thực nghiệm.
Khá giống với nghiên cứu của Sobia, nghiên cứu của Sakhteman và cộng sự (Iran)
[64] vào năm 2017 đã tiến hành xây dựng 8 thông số mô tả QSAR để dự đoán khả
năng ức chế hoạt động của IL-1β. Sakhteman đã dùng 48 chất của Matsuda và cộng
sự để xây dựng nên mô hình QSAR này. Tương tự như khi so sánh với nghiên cứu
của Sobia, đề tài này không xây dựng mô hình QSAR để sàng lọc các chất ức chế IL-
1β. Tuy vậy, so với đề tài này, nghiên cứu của Sakhteman không thực hiện sàng lọc
trên các tập dữ liệu mà chỉ xây dựng mô hình QSAR.
57
Khoá luận tốt nghiệp DSĐH Kết quả và bàn luận
Một nghiên cứu khác của Yang (Hoa Kỳ) năm 2015 [65] đã thực hiện mô phỏng động
lực học gia tốc trên IL-1R1 để tìm ra cấu dạng không hoạt động tiềm năng của protein
này. Yang đã tìm được 4 có chất tiềm năng ức chế IL-1 bằng cơ chế “bẫy” cấu dạng
IL-1R1 ở dạng không hoạt động. Hướng đi của tác giả Yang rất tiềm năng đối với
mục tiêu ức chế IL-1R1. Tuy vậy, phương pháp động lực học gia tốc được sử dụng
trong nghiên cứu của Yang đòi hỏi rất nhiều tài nguyên máy tính cũng như thời gian
mô phỏng. So với đề tài này, phương pháp mô phỏng động lực học và docking của
Yang khác hoàn toàn. Yang sử dụng phương pháp động lực học gia tốc trên thụ thể
IL-1R1 và docking bằng tập dữ liệu phân mảnh (fragment) với 2.783 chất. Trong khi
đó, đề tài này sử dụng phương pháp mô phỏng động lực học truyền thống trên thụ thể
IL-1β, với các chất được dock đã có khả năng được thử in vitro mà không cần thực
hiện phải tối ưu hoá chất khởi nguồn. Tuy vậy, nghiên cứu của Yang thực hiện mô
phỏng động lực học trên 5 cấu trúc kết tinh của thụ thể IL-1R1, đây là một phân tử
protein có số acid amin gấp đôi so với IL-1β mà nghiên cứu đã thực hiện. Với điều
kiện tài nguyên máy tính hiện tại, đây là điều mà nghiên cứu chưa thể thực hiện được.
58
Khoá luận tốt nghiệp DSĐH Kết luận và đề nghị
59
Khoá luận tốt nghiệp DSĐH Tài liệu tham khảo
60
Khoá luận tốt nghiệp DSĐH Tài liệu tham khảo
[19]. Berman, H.; Henrick, K.; Nakamura, H., Announcing the worldwide Protein
Data Bank. Nature Structural & Molecular Biology 2003, 10 (12), 980-980.
[20]. Rondeau, J.-M.; Ramage, P.; Zurini, M.; Gram, H., The molecular mode of
action and species specificity of canakinumab, a human monoclonal antibody
neutralizing IL-1β. mAbs 2015, 7 (6), 1151-1160.
[21]. Sanders, M. P. A.; McGuire, R.; Roumen, L.; de Esch, I. J. P.; de Vlieg, J.;
Klomp, J. P. G.; de Graaf, C., From the protein's perspective: the benefits and
challenges of protein structure-based pharmacophore modeling. MedChemComm
2012, 3 (1), 28-38.
[22]. Dong, J.; Wang, N.-N.; Yao, Z.-J.; Zhang, L.; Cheng, Y.; Ouyang, D.; Lu,
A.-P.; Cao, D.-S., ADMETlab: a platform for systematic ADMET evaluation based
on a comprehensively collected ADMET database. Journal of Cheminformatics 2018,
10 (1), 29.
[23]. Krüger, A.; Gonçalves Maltarollo, V.; Wrenger, C.; Kronenberger, T., ADME
Profiling in Drug Discovery and a New Path Paved on Silica. In Drug Discovery and
Development - New Advances, 2020.
[24]. Kukol, A., Molecular modeling of proteins. 2008.
[25]. Schlick, T., Molecular modeling and simulation: an interdisciplinary guide: an
interdisciplinary guide. Springer Science & Business Media: 2010; Vol. 21.
[26]. Hollingsworth, S. A.; Dror, R. O., Molecular Dynamics Simulation for All.
Neuron 2018, 99 (6), 1129-1143.
[27]. Abraham, M.; Hess, B.; Spoel, D. v. d.; Lindahl., E. GROMACS Reference
Manual. ftp://ftp.gromacs.org/pub/manual/manual-2018.pdf (accessed 05/08/2020).
[28]. Homeyer, N.; Gohlke, H., Free Energy Calculations by the Molecular
Mechanics Poisson−Boltzmann Surface Area Method. Molecular Informatics 2012,
31 (2), 114-122.
[29]. Molecular Operating Environment (MOE), 2015.10; Chemical Computing
Group ULC, Montreal, QC, Canada: 2020.
[30]. Daina, A.; Michielin, O.; Zoete, V., SwissADME: a free web tool to evaluate
pharmacokinetics, drug-likeness and medicinal chemistry friendliness of small
molecules. Scientific Reports 2017, 7 (1), 42717.
[31]. LeadIT, BioSolveIT GmbH, Sankt Augustin, Germany, 2016: 2020.
[32]. Abraham, M. J.; Murtola, T.; Schulz, R.; Páll, S.; Smith, J. C.; Hess, B.;
Lindahl, E., GROMACS: High performance molecular simulations through multi-
level parallelism from laptops to supercomputers. SoftwareX 2015, 1-2, 19-25.
[33]. MacKerell, A. D.; Bashford, D.; Bellott, M.; Dunbrack, R. L.; Evanseck, J.
D.; Field, M. J.; Fischer, S.; Gao, J.; Guo, H.; Ha, S.; Joseph-McCarthy, D.;
Kuchnir, L.; Kuczera, K.; Lau, F. T. K.; Mattos, C.; Michnick, S.; Ngo, T.; Nguyen,
D. T.; Prodhom, B.; Reiher, W. E.; Roux, B.; Schlenkrich, M.; Smith, J. C.; Stote,
R.; Straub, J.; Watanabe, M.; Wiórkiewicz-Kuczera, J.; Yin, D.; Karplus, M., All-
Atom Empirical Potential for Molecular Modeling and Dynamics Studies of Proteins.
The Journal of Physical Chemistry B 1998, 102 (18), 3586-3616.
61
Khoá luận tốt nghiệp DSĐH Tài liệu tham khảo
[34]. Mackerell, A. D., Jr.; Feig, M.; Brooks, C. L., 3rd, Extending the treatment of
backbone energetics in protein force fields: limitations of gas-phase quantum
mechanics in reproducing protein conformational distributions in molecular
dynamics simulations. J Comput Chem 2004, 25 (11), 1400-15.
[35]. Kumari, R.; Kumar, R.; Lynn, A., g_mmpbsa—A GROMACS Tool for High-
Throughput MM-PBSA Calculations. Journal of Chemical Information and
Modeling 2014, 54 (7), 1951-1962.
[36]. Koes, D. R.; Camacho, C. J., ZINCPharmer: pharmacophore search of the ZINC
database. Nucleic Acids Res 2012, 40 (Web Server issue), W409-W414.
[37]. Lipinski, C. A.; Lombardo, F.; Dominy, B. W.; Feeney, P. J., Experimental
and computational approaches to estimate solubility and permeability in drug
discovery and development settings. Advanced Drug Delivery Reviews 1997, 23 (1),
3-25.
[38]. Daina, A.; Zoete, V., A BOILED-Egg To Predict Gastrointestinal Absorption
and Brain Penetration of Small Molecules. ChemMedChem 2016, 11 (11), 1117-1121.
[39]. Daina, A.; Michielin, O.; Zoete, V., iLOGP: A Simple, Robust, and Efficient
Description of n-Octanol/Water Partition Coefficient for Drug Design Using the
GB/SA Approach. Journal of Chemical Information and Modeling 2014, 54 (12),
3284-3301.
[40]. Baell, J. B.; Holloway, G. A., New Substructure Filters for Removal of Pan
Assay Interference Compounds (PAINS) from Screening Libraries and for Their
Exclusion in Bioassays. Journal of Medicinal Chemistry 2010, 53 (7), 2719-2740.
[41]. Brenk, R.; Schipani, A.; James, D.; Krasowski, A.; Gilbert, I. H.; Frearson,
J.; Wyatt, P. G., Lessons learnt from assembling screening libraries for drug
discovery for neglected diseases. ChemMedChem 2008, 3 (3), 435-44.
[42]. Ghose, A. K.; Viswanadhan, V. N.; Wendoloski, J. J., A knowledge-based
approach in designing combinatorial or medicinal chemistry libraries for drug
discovery. 1. A qualitative and quantitative characterization of known drug databases.
J Comb Chem 1999, 1 (1), 55-68.
[43]. Veber, D. F.; Johnson, S. R.; Cheng, H. Y.; Smith, B. R.; Ward, K. W.;
Kopple, K. D., Molecular properties that influence the oral bioavailability of drug
candidates. J Med Chem 2002, 45 (12), 2615-23.
[44]. Egan, W. J.; Merz, K. M., Jr.; Baldwin, J. J., Prediction of drug absorption
using multivariate statistics. J Med Chem 2000, 43 (21), 3867-77.
[45]. Muegge, I.; Heald, S. L.; Brittelli, D., Simple selection criteria for drug-like
chemical matter. J Med Chem 2001, 44 (12), 1841-6.
[46]. SYBYL-X 2.0, Tripos L.P.: St. Louis, MO, USA, 2011.
[47]. Jasper, J. B.; Humbeck, L.; Brinkjost, T.; Koch, O., A novel interaction
fingerprint derived from per atom score contributions: exhaustive evaluation of
interaction fingerprint performance in docking based virtual screening. Journal of
Cheminformatics 2018, 10 (1), 15.
[48]. Brewerton, S., The use of protein-ligand interaction fingerprints in docking.
Current opinion in drug discovery & development 2008, 11, 356-64.
62
Khoá luận tốt nghiệp DSĐH Tài liệu tham khảo
[49]. Hanwell, M. D.; Curtis, D. E.; Lonie, D. C.; Vandermeersch, T.; Zurek, E.;
Hutchison, G. R., Avogadro: an advanced semantic chemical editor, visualization,
and analysis platform. Journal of Cheminformatics 2012, 4 (1), 17.
[50]. Schrödinger, L. The PyMOL Molecular Graphics System, 1.2r3pre; 2020.
[51]. Reva, B. A.; Finkelstein, A. V.; Skolnick, J., What is the probability of a chance
prediction of a protein structure with an rmsd of 6 å? Folding and Design 1998, 3 (2),
141-147.
[52]. Ruczinski, I. Protein Folding and Structure Prediction - A Statistician’s View.
http://biostat.jhsph.edu/~iruczins/presentations/ruczinski.05.03.rutgers.pdf
(accessed 05/08/2020).
[53]. Jülich, F. Analysis of MD Simulations.
http://www.drugdesign.gr/uploads/7/6/0/2/7602318/lecture_mdanalysis.pdf
(accessed 05/08/2020).
[54]. Kumar, C. V.; Swetha, R. G.; Anbarasu, A.; Ramaiah, S., Computational
Analysis Reveals the Association of Threonine 118 Methionine Mutation in PMP22
Resulting in CMT-1A. Adv Bioinformatics 2014, 2014, 502618-502618.
[55]. Sundar, S.; Thangamani, L.; Manivel, G.; Kumar, P.; Piramanayagam, S.,
Molecular docking, molecular dynamics and MM/PBSA studies of FDA approved
drugs for protein kinase a of Mycobacterium tuberculosis; application insights of
drug repurposing. Informatics in Medicine Unlocked 2019, 16, 100210.
[56]. Humphrey, W.; Dalke, A.; Schulten, K., VMD: visual molecular dynamics. J
Mol Graph 1996, 14 (1), 33-8, 27-8.
[57]. Handbook of nanofabrication. 1st ed. ed.; Wiederrecht, G. P., Ed. Elsevier:
Amsterdam ;, 2010.
[58]. Brooks, B. R.; Bruccoleri, R. E.; Olafson, B. D.; States, D. J.; Swaminathan,
S.; Karplus, M., CHARMM: A program for macromolecular energy, minimization,
and dynamics calculations. Journal of Computational Chemistry 1983, 4 (2), 187-
217.
[59]. Kollman, P. A.; Massova, I.; Reyes, C.; Kuhn, B.; Huo, S.; Chong, L.; Lee,
M.; Lee, T.; Duan, Y.; Wang, W.; Donini, O.; Cieplak, P.; Srinivasan, J.; Case,
D. A.; Cheatham, T. E., 3rd, Calculating structures and free energies of complex
molecules: combining molecular mechanics and continuum models. Acc Chem Res
2000, 33 (12), 889-97.
[60]. Desmond 4.2 User manual.
http://gohom.win/ManualHom/Schrodinger/Schrodinger_2015-
2_docs/desmond/desmond_user_manual.pdf (accessed 06/08/2020).
[61]. Roccatano, D., A Short Introduction to the Molecular Dynamics Simulation of
Nanomaterials. 2018; pp 123-155.
[62]. Halim, S. A.; Jawad, M.; Ilyas, M.; Mir, Z.; Mirza, A. A.; Husnain, T., In
silico identification of novel IL-1β inhibitors to target protein–protein interfaces.
Computational Biology and Chemistry 2015, 58, 158-166.
63
Khoá luận tốt nghiệp DSĐH Tài liệu tham khảo
[63]. Matsuda, T.; Aoki, T.; Ohgiya, T.; Koshi, T.; Ohkuchi, M.; Shigyo, H.,
Synthesis and bioactivities of novel pyridazine derivatives: inhibitors of interleukin-
1 beta (IL-1beta) production. Bioorg Med Chem Lett 2001, 11 (17), 2369-72.
[64]. Sakhteman, A.; Edraki, N.; Hemmateenejad, B.; Miri, R.; Foroumadi, A.;
Shafiee, A.; Khoshneviszadeh, M., In Silico Screening of IL-1β Production Inhibitors
Using Chemometric Tools. Iran J Pharm Res 2017, 16 (2), 513-524.
[65]. Yang, C. Y., Identification of potential small molecule allosteric modulator sites
on IL-1R1 ectodomain using accelerated conformational sampling method. PLoS
One 2015, 10 (2), e0118671.
64
Khoá luận tốt nghiệp DSĐH Phụ lục
PL.1
Khoá luận tốt nghiệp DSĐH Phụ lục
PL.2
Khoá luận tốt nghiệp DSĐH Phụ lục
PL.3
Khoá luận tốt nghiệp DSĐH Phụ lục
PL.4
Khoá luận tốt nghiệp DSĐH Phụ lục
PL.5
Khoá luận tốt nghiệp DSĐH Phụ lục
PL.6
Khoá luận tốt nghiệp DSĐH Phụ lục
PL.7
Khoá luận tốt nghiệp DSĐH Phụ lục
PL.8
Khoá luận tốt nghiệp DSĐH Phụ lục
rcoulomb = 1.2
pme_order = 4 ; cubic interpolation
fourierspacing = 0.16 ; grid spacing for
FFT
; Temperature coupling
tcoupl = V-rescale ;
modified Berendsen thermostat
tc-grps = Protein_LIG Water_and_ions ;
two coupling groups - more accurate
tau_t = 0.1 0.1 ;
time constant, in ps
ref_t = 300 300 ;
reference temperature, one for each group, in K
; Pressure coupling
pcoupl = Berendsen ;
pressure coupling is on for NPT
pcoupltype = isotropic ;
uniform scaling of box vectors
tau_p = 2.0 ;
time constant, in ps
ref_p = 1.0 ;
reference pressure, in bar
compressibility = 4.5e-5 ;
isothermal compressibility of water, bar^-1
refcoord_scaling = com
; Periodic boundary conditions
pbc = xyz ; 3-D PBC
; Dispersion correction is not used for proteins with the
C36 additive FF
DispCorr = no
; Velocity generation
gen_vel = no ; velocity generation
off after NVT
PL.9
Khoá luận tốt nghiệp DSĐH Phụ lục
PHỤ LỤC 6. Thông số tệp md.mdp (20 ns, 2000 khung hình)
title = Protein_LIG complex MD simulation
; Run parameters
integrator = md ; leap-frog integrator
nsteps = 10000000 ; 2 * 10000000 =
20000 ps (20 ns)
dt = 0.002 ; 2 fs
; Output control
nstenergy = 5000 ; save energies every
10.0 ps
nstlog = 5000 ; update log file
every 10.0 ps
nstxout-compressed = 5000 ; save coordinates
every 10.0 ps
; Bond parameters
continuation = yes ; continuing from NPT
constraint_algorithm = lincs ; holonomic constraints
constraints = h-bonds ; bonds to H are
constrained
lincs_iter = 1 ; accuracy of LINCS
lincs_order = 4 ; also related to
accuracy
; Neighbor searching and vdW
cutoff-scheme = Verlet
ns_type = grid ; search neighboring
grid cells
nstlist = 20 ; largely irrelevant
with Verlet
rlist = 1.2
vdwtype = cutoff
vdw-modifier = force-switch
rvdw-switch = 1.0
rvdw = 1.2 ; short-range van der
Waals cutoff (in nm)
; Electrostatics
coulombtype = PME ; Particle Mesh Ewald
for long-range electrostatics
rcoulomb = 1.2
pme_order = 4 ; cubic interpolation
PL.10
Khoá luận tốt nghiệp DSĐH Phụ lục
PL.11
Khoá luận tốt nghiệp DSĐH Phụ lục
PHỤ LỤC 7. Các lệnh phân tích kết quả mô phỏng động lực học
RMSD
gmx rms -s md_0_20.tpr -f md_0_20_fit.xtc -n index.ndx -
o rmsd.xvg
Khi được hỏi chọn phân tử để lấy làm tham chiếu (Select group for least squares fit),
chọn 4 (backbone) cho protein và 23 (LIG_NonH) cho phối tử. Chọn tương tự 4 hoặc
23 cho protein hoặc phối tử khi được hỏi chọn phân tử để thực hiện tính toán (Select
group for RMSD calculation).
Bán kính quay (radius of gyration)
gmx gyrate -f md_0_20_fit.xtc -s md_0_20.tpr -o
gyrate_protein.xvg
> 1 Protein
RMSF
gmx rmsf -f md_0_20_fit.xtc -s md_0_20.tpr -res -o
rmsf.xvg -n index.ndx
Có thể chọn 3 (C⍺) để xem độ linh động acid amin của protein hoặc 24 (LIG_&_!H)
để xem độ linh động từng nguyên tử trong phối tử.
PL.12
Khoá luận tốt nghiệp DSĐH Phụ lục
PHỤ LỤC 8. Các lệnh tính toán năng lượng gắn kết tự do
Tính toán thế năng cơ học phân tử:
g_mmpbsa -f md_0_20_fit.xtc -s md_0_20.tpr -n index.ndx -
pdie 2 -decomp
> 1
> 13
Trong đó, 1 là protein và 13 là ligand.
Tính toán năng lượng solvat hoá phân cực
g_mmpbsa -f md_0_20_fit.xtc -s md_0_20.tpr -i polar.mdp -
n index.ndx -nomme -pbsa -decomp -pol polar.xvg -pcon
contrib_pol.dat
> 1
> 13
Tương tự, 1 và protein và 13 là ligand.
Tính toán năng lượng solvat hoá không phân cực
g_mmpbsa -f md_0_20_fit.xtc -s md_0_20.tpr -n index.ndx -
i apolar_sasa.mdp -nomme -pbsa -decomp -apol
apolar_sasa.xvg -apcon sasa_contrib.dat
> 1 Protein
> 13 Ligand
Lựa chọn 1 và 13 lần lượt là protein và ligand.
Tính toán năng lượng gắn kết tự do
python MmPbSaStat.py -m energy_MM.xvg -p polar.xvg -a
apolar_sasa.xvg
PL.13
Khoá luận tốt nghiệp DSĐH Phụ lục
;=============
;PSIZE options
;=============
;Factor by which to expand molecular dimensions to get
coarsegrid dimensions.
cfac = 1.5
;=============================================
;APBS kwywords for polar solvation calculation
;=============================================
;Charge of positive ions
pcharge = 1
PL.14
Khoá luận tốt nghiệp DSĐH Phụ lục
;Numebr of grid point per A^2. Not used when (srad = 0.0)
or (srfm = spl2 or spl4)
sdens = 10
;Temperature in K
temp = 300
PL.15
Khoá luận tốt nghiệp DSĐH Phụ lục
;=======================================================
=
;APBS kwywords for Apolar/Non-polar solvation calculation
;=======================================================
=
;Non-polar solvation calculation: "yes" or "no"
apolar = no
;===SAV model===
;Pressure kJ/(mol A^3)
press = 0
PL.16
Khoá luận tốt nghiệp DSĐH Phụ lục
WCA = no
;Temperature in K
APtemp = 300
PL.17
Khoá luận tốt nghiệp DSĐH Phụ lục
;=============
;PSIZE options
;=============
;Factor by which to expand molecular dimensions to get
coarsegrid dimensions.
cfac = 1.5
;=============================================
;APBS kwywords for polar solvation calculation
;=============================================
;Charge of positive ions
pcharge = 1
PL.18
Khoá luận tốt nghiệp DSĐH Phụ lục
;Numebr of grid point per A^2. Not used when (srad = 0.0)
or (srfm = spl2 or spl4)
sdens = 10
;Temperature in K
temp = 300
PL.19
Khoá luận tốt nghiệp DSĐH Phụ lục
;=======================================================
=
;APBS kwywords for Apolar/Non-polar solvation calculation
;=======================================================
=
;Non-polar solvation calculation: "yes" or "no"
apolar = yes
;===SAV model===
;Pressure kJ/(mol A^3)
press = 0
PL.20
Khoá luận tốt nghiệp DSĐH Phụ lục
WCA = no
;Temperature in K
APtemp = 300
PL.21
Khoá luận tốt nghiệp DSĐH Phụ lục
PL.22
Khoá luận tốt nghiệp DSĐH Phụ lục
import re
import sys
import numpy as np
import argparse
import os
import math
def main():
args = ParseOptions()
#File => Frame wise component energy
try:
frame_wise = open(args.outfr, 'w')
except:
raise IOError ('Could not open file {0} for
writing. \n' .format(args.outfr))
PL.23
Khoá luận tốt nghiệp DSĐH Phụ lục
frame_wise.write('#Time
E_VdW_mm(Protein)\tE_Elec_mm(Protein)\tE_Pol(Protein)\tE
_Apol(Protein)\tE_VdW_mm(Ligand)\tE_Elec_mm(Ligand)\tE_P
ol(Ligand)\tE_Apol(Ligand)\tE_VdW_mm(Complex)\tE_Elec_mm
(Complex)\tE_Pol(Complex)\tE_Apol(Complex)\tDelta_E_mm\t
Delta_E_Pol\tDelta_E_Apol\tDelta_E_binding\n')
#Complex Energy
c = []
if args.multiple:
MmFile, PolFile, APolFile =
ReadMetafile(args.metafile)
for i in range(len(MmFile)):
cTmp =
Complex(MmFile[i],PolFile[i],APolFile[i])
cTmp.CalcEnergy(args,frame_wise,i)
c.append(cTmp)
else:
cTmp =
Complex(args.molmech,args.polar,args.apolar)
cTmp.CalcEnergy(args,frame_wise,0)
c.append(cTmp)
#Summary in output files => "--outsum" and "--
outmeta" file options
Summary_Output_File(c, args)
class Complex(object):
def __init__(self,MmFile,PolFile,APolFile):
self.TotalEn = []
self.Vdw, self.Elec, self.Pol, self.Sas,
self.Sav, self.Wca =[], [], [], [], [], []
self.MmFile = MmFile
self.PolFile = PolFile
self.APolFile = APolFile
self.AvgEnBS = []
self.CI = []
self.FinalAvgEnergy = 0
self.StdErr = 0
PL.24
Khoá luận tốt nghiệp DSĐH Phụ lục
def CalcEnergy(self,args,frame_wise,idx):
mmEn = ReadData(self.MmFile,n=7)
polEn = ReadData(self.PolFile,n=4)
apolEn = ReadData(self.APolFile,n=10)
CheckEnData(mmEn,polEn,apolEn)
PL.25
Khoá luận tốt nghiệp DSĐH Phụ lục
Wca.append(Energy)
#Final Energy
time.append(mmEn[0][i])
Energy = MM[i] + Pol[i] + Apol[i]
self.TotalEn.append(Energy)
PL.26
Khoá luận tốt nghiệp DSĐH Phụ lục
self.Sas.append(avg_energy)
self.Sas.append(error)
avg_energy, error = BootStrap(Sav,bsteps)
self.Sav.append(avg_energy)
self.Sav.append(error)
avg_energy, error = BootStrap(Wca,bsteps)
self.Wca.append(avg_energy)
self.Wca.append(error)
#Bootstrap => Final Average Energy
self.AvgEnBS, AvgEn, EnErr, CI =
ComplexBootStrap(self.TotalEn,bsteps)
self.FinalAvgEnergy = AvgEn
self.StdErr = EnErr
self.CI = CI
#If not bootstrap then average and standard
deviation
else:
self.Vdw.append(np.mean(Vdw))
self.Vdw.append(np.std(Vdw))
self.Elec.append(np.mean(Elec))
self.Elec.append(np.std(Elec))
self.Pol.append(np.mean(Pol))
self.Pol.append(np.std(Pol))
self.Sas.append(np.mean(Sas))
self.Sas.append(np.std(Sas))
self.Sav.append(np.mean(Sav))
self.Sav.append(np.std(Sav))
self.Wca.append(np.mean(Wca))
self.Wca.append(np.std(Wca))
self.FinalAvgEnergy =
np.mean(self.TotalEn)
self.StdErr = np.std(self.TotalEn)
def Summary_Output_File(AllComplex,args):
try:
fs = open(args.outsum,'w')
except:
PL.27
Khoá luận tốt nghiệp DSĐH Phụ lục
if args.multiple:
try:
fm = open(args.outmeta,'w')
except:
raise IOError ('Could not open file {0} for
writing. \n' .format(args.outmeta))
fm.write('#
Complex_Number\t\tTotal_Binding_Energy\t\tError\n')
for n in range(len(AllComplex)):
fs.write('\n\n#Complex Number: %4d\n' % (n+1))
fs.write('===============\n SUMMARY
\n===============\n\n')
fs.write('\n van der Waal energy = %15.3lf
+/- %7.3lf kJ/mol\n' % (AllComplex[n].Vdw[0],
AllComplex[n].Vdw[1]))
fs.write('\n Electrostattic energy = %15.3lf
+/- %7.3lf kJ/mol\n' %
(AllComplex[n].Elec[0],AllComplex[n].Elec[1]))
fs.write('\n Polar solvation energy = %15.3lf
+/- %7.3lf kJ/mol\n' % (AllComplex[n].Pol[0],
AllComplex[n].Pol[1]))
fs.write('\n SASA energy = %15.3lf
+/- %7.3lf kJ/mol\n' % (AllComplex[n].Sas[0],
AllComplex[n].Sas[1]))
fs.write('\n SAV energy = %15.3lf
+/- %7.3lf kJ/mol\n' % (AllComplex[n].Sav[0],
AllComplex[n].Sav[1]))
fs.write('\n WCA energy = %15.3lf
+/- %7.3lf kJ/mol\n' % (AllComplex[n].Wca[0],
AllComplex[n].Wca[1]))
fs.write('\n Binding energy = %15.3lf
+/- %7.3lf kJ/mol\n' % (AllComplex[n].FinalAvgEnergy,
AllComplex[n].StdErr))
PL.28
Khoá luận tốt nghiệp DSĐH Phụ lục
fs.write('\n===============\n END
\n===============\n\n')
if args.multiple:
fm.write('%5d %15.3lf %7.3lf\n' % (n+1 ,
AllComplex[n].FinalAvgEnergy, AllComplex[n].StdErr))
def CheckEnData(mmEn,polEn,apolEn):
frame = len(mmEn[0])
for i in range(len(mmEn)):
if(len(mmEn[i]) != frame):
raise ValueError("In MM file, size of
columns are not equal.")
for i in range(len(polEn)):
if(len(polEn[i]) != frame):
raise ValueError("In Polar file, size of
columns are not equal.")
for i in range(len(apolEn)):
if(len(apolEn[i]) != frame):
raise ValueError("In APolar file, size of
columns are not equal.")
def ParseOptions():
parser = argparse.ArgumentParser()
parser.add_argument("-mt", "--multiple", help='If
given, calculate for multiple complexes. Need Metafile
containing path of energy files', action="store_true")
parser.add_argument("-mf", "--metafile",
help='Metafile containing path to energy files of each
complex in a row obtained from g_mmpbsa in following
order: \
PL.29
Khoá luận tốt nghiệp DSĐH Phụ lục
if len(sys.argv) < 2:
print('ERROR: No input files. Need help!!!')
parser.print_help()
sys.exit(1)
args = parser.parse_args()
PL.30
Khoá luận tốt nghiệp DSĐH Phụ lục
if args.multiple:
if not os.path.exists(args.metafile):
print('\nERROR: {0} not
found....\n' .format(args.metafile))
parser.print_help()
sys.exit(1)
else:
if not os.path.exists(args.molmech):
print('\nERROR: {0} not
found....\n' .format(args.molmech))
parser.print_help()
sys.exit(1)
if not os.path.exists(args.polar):
print('\nERROR: {0} not
found....\n' .format(args.polar))
parser.print_help()
sys.exit(1)
if not os.path.exists(args.apolar):
print('\nERROR: {0} not
found....\n' .format(args.apolar))
parser.print_help()
sys.exit(1)
return args
def ReadData(FileName,n=2):
try:
infile = open(FileName,'r')
except:
raise IOError('Could not open file {0} for
reading. \n' .format(FileName))
x, data = [],[]
for line in infile:
line = line.rstrip('\n')
if not line.strip():
continue
PL.31
Khoá luận tốt nghiệp DSĐH Phụ lục
if(re.match('#|@',line)==None):
temp = line.split()
data.append(np.array(temp))
for j in range(0,n):
x_temp =[]
for i in range(len(data)):
try:
value = float(data[i][j])
except:
raise FloatingPointError('\nCould not
convert {0} to floating point number.. Something is wrong
in {1}..\n' .format(data[i][j], FileName))
x_temp.append(value)
x.append(x_temp)
return x
def ComplexBootStrap(x,step=1000):
avg =[]
x = np.array(x)
n = len(x)
idx = np.random.randint(0,n,(step,n))
sample_x = x[idx]
avg = np.sort(np.mean(sample_x,1))
CI_min = avg[int(0.005*step)]
CI_max = avg[int(0.995*step)]
#print('Energy = %13.3f; Confidance Interval = (-%-
5.3f / +%-5.3f)\n' % (np.mean(avg), (np.mean(avg)-CI_min),
(CI_max-np.mean(avg))))
return avg, np.mean(avg), np.std(avg),
[(np.mean(avg)-CI_min), (CI_max-np.mean(avg))]
PL.32
Khoá luận tốt nghiệp DSĐH Phụ lục
n = len(x)
idx = np.random.randint(0,n,(step,n))
sample_x = x[idx]
avg = np.sort(np.mean(sample_x,1))
return np.mean(avg),np.std(avg)
def find_nearest_index(array,value):
idx = (np.abs(array-value)).argmin()
return idx
def ReadMetafile(metafile):
MmFile,PolFile, APolFile = [], [], []
FileList = open(metafile,'r')
for line in FileList:
line = line.rstrip('\n')
if not line.strip():
continue
temp = line.split()
MmFile.append(temp[0])
PolFile.append(temp[1])
APolFile.append(temp[2])
if not os.path.exists(temp[0]):
raise IOError('Could not open file {0} for
reading. \n' .format(temp[0]))
if not os.path.exists(temp[1]):
raise IOError('Could not open file {0} for
reading. \n' .format(temp[1]))
if not os.path.exists(temp[2]):
raise IOError('Could not open file {0} for
reading. \n' .format(temp[2]))
if __name__=="__main__":
main()
PL.33
Khoá luận tốt nghiệp DSĐH Phụ lục
PHỤ LỤC 12. Hình ảnh 9 mô hình pharmacophore trên MOE 2015.10
Mô hình Ph-IL1β–β5_β6:
Mô hình Ph-IL1β–A:
Mô hình Ph-IL1β–B:
PL.34
Khoá luận tốt nghiệp DSĐH Phụ lục
Mô hình Ph-IL1R1-a1:
Mô hình Ph-IL1R1-a2:
Mô hình Ph-IL1R1-a3:
PL.35
Khoá luận tốt nghiệp DSĐH Phụ lục
Mô hình Ph-IL1R1-b1:
Mô hình Ph-IL1R1-b2:
Mô hình Ph-IL1R1-b3:
PL.36
Khoá luận tốt nghiệp DSĐH Phụ lục
PHỤ LỤC 13. Kết quả sàng lọc pharmacophore trên ZINCPhamermer
Kết quả sàng trên Xoá trùng lặp &
Vị trí tác động Mô hình
ZINCPharmer 5-Lipinski
A: Ph-IL1β-A [5] 1.772 227
B: Ph-IL1β-B [5] 1.195 239
IL-1β
β5-β6: Ph-1L1β-
39 8
β5_β6
Rãnh D1-D2 2.218
Ph-IL1R1-a1 [5] 32
119
Ph-IL1R1-a2 [5] 158
Ph-IL1R1-a3 [5] 2.028
IL-1R1
D2 25.675
Ph-IL1R1-b1 [5] 90
4.694
Ph-IL1R1-b2 [5] 25.526
Ph-IL1R1-b3 [5] 59
PL.37
Khoá luận tốt nghiệp DSĐH Phụ lục
PHỤ LỤC 14. Kết quả sàng lọc từng mô hình pharmacophore trên 6 CSDL
Tổng
CSDL (và số chất đầu vào)
(chất)
MBHC MBPPI CDPM CDPPI UNDP DB
279.35
Vị trí sàng lọc (13.809 (7.774 (12.318 (215.32 (22.126 (7.999
5
chất) chất) chất) 9 chất) chất) chất)
A: Ph-
IL1R1- 3 10 23 152 128 316
A
B: Ph-
IL1R1- 12 40 174 603 154 983
IL-1β
B
β5-β6:
Ph-
3 30 66 365 14 74 552
IL1R1-
β5-β6
Rãnh
16 101 294 1129 506 2.046
D1-D2
Ph-
IL1R1- 10 84 121 395 324
a1
Ph-
IL1R1- 0 5 116 280 94
a2
Ph-
IL1R1- 7 29 93 549 224
IL1-R1 a3
D2 67 127 121 866 440 1.621
Ph-
IL1R1- 5 1 6 15 89
b1
Ph-
IL1R1- 3 5 4 32 308
b2
Ph-
IL1R1- 59 122 115 830 117
b3
PL.38
Khoá luận tốt nghiệp DSĐH Phụ lục
PHỤ LỤC 15. Cấu trúc các phối tử được dùng docking trên 5 vị trí
Truy cập vào đường dẫn: https://bit.ly/3fERkKp
Thư mục Docking_ligands
Tệp *.sdf chứa cấu trúc các phối tử đã được chuẩn bị bằng Sybyl X-2.0
PL.39
Khoá luận tốt nghiệp DSĐH Phụ lục
PL.40
Khoá luận tốt nghiệp DSĐH Phụ lục
PHỤ LỤC 17. Danh sách 97 chất đã dock thành công trên vị trí β5-β6
Truy cập vào đường dẫn: https://bit.ly/3fERkKp
Tệp Site-β5_β6-97
PHỤ LỤC 18. Kết quả docking trên 4 vị trí còn lại
Truy cập vào đường dẫn: https://bit.ly/3fERkKp
Thư mục Docking_results chứa kết quả docking trên 4 vị trí còn lại dưới dạng tệp
*.fxx và *.sdf
PHỤ LỤC 19. Danh sách 75 chất thoả phân tích PLIF trên β5-β6
Truy cập vào đường dẫn: https://bit.ly/3fERkKp
Thư mục Docking_results
Tệp PLIF-β5_β6-75
PL.41
Khoá luận tốt nghiệp DSĐH Phụ lục
PHỤ LỤC 20. Hình ảnh RMSD các phối tử xếp chồng trên RMSD protein tự do
MHC09461
0,3
0,25
RMSD (nm)
0,2
0,15
0,1
0,05
0
0 2500 5000 7500 10000 12500 15000 17500 20000
Thời gian (ps)
Protein MHC09461
T428-0731
0,3
0,25
RMSD (nm)
0,2
0,15
0,1
0,05
0
0 2500 5000 7500 10000 12500 15000 17500 20000
Thời gian (ps)
Protein T428-0731
PL.42
Khoá luận tốt nghiệp DSĐH Phụ lục
P634-0250
0,4
0,35
0,3
RMSD (nm)
0,25
0,2
0,15
0,1
0,05
0
0 2500 5000 7500 10000 12500 15000 17500 20000
Thời gian (ps)
Protein P634-0250
S978-0388
0,25
0,2
RMSD (nm)
0,15
0,1
0,05
0
0 2500 5000 7500 10000 12500 15000 17500 20000
Thời gian (ps)
Protein S978-0388
SA08-1111
0,35
0,3
0,25
RMSD (nm)
0,2
0,15
0,1
0,05
0
0 2500 5000 7500 10000 12500 15000 17500 20000
Thời gian (ps)
Protein SA08-1111
PL.43
Khoá luận tốt nghiệp DSĐH Phụ lục
PL.44