3.2.2.1. Lấy mẫu
Sử dụng chức năng Docking phân mảnh cấu trúc trong phần mềm ICM thu được 282 kết quả. Một số kết quả phân mảnh nằm ngoài vị trí tương tác đã được xác định bị
27
loại đi, còn lại 240 phân mảnh cấu trúc tại 5 vị trí trên protein được đánh số từ 1 đến 5 (Hình 3.4). Dựa trên điểm số docking của ICM, chúng tôi lựa chọn từ mỗi vị trí một phân mảnh cấu trúc có điểm số tốt nhất (giá trị nhỏ nhất). Các điểm số docking, axít amin tương tác với từng phân mảnh cấu trúc được thể hiện ở Bảng 3.4. Khu vực số 1 định vị tại cổng vào của đường hầm trên, trong khi khu vực số 2 định vị tại cổng ra của đường hầm dưới. Khu vực số 3 và số 4 nằm tại khoang lớn liên kết giữa hai khu vực 1 và 2. Khu vực số 5 nằm ngay phía trên đường hầm dưới, nơi tập trung hàm lượng cao các axít amin thân dầu.
Hình 3.4. Năm khu vực tối ưu với các phân mảnh cấu trúc trên protein.
Năm phân mảnh đều có cấu trúc tương đối nhỏ, khối lượng phân tử trong khoảng từ 88 đến 150 Da. Giá trị logP của các phân mảnh đều lớn hơn 0, điều này chứng tỏ các phân mảnh này hòa tan trong pha dầu tốt hơn pha nước. Từ trên hình có thể thấy, phân mảnh số 2 và số 4 được đặt tại các vị trí thân nước trong trung tâm tương tác protein, điều này giải thích vì sao tại hai vị trí này, các phân mảnh có logP thấp được tối ưu hơn. Trong khi đó, phân mảnh 1, 3 và 5 đều nằm tại các vị trí thân dầu trên protein, đặc biệt là phân mảnh số 5 nằm tại khu vực chứa hàm lượng Phe, Tyr và Ile cao, do đó giá trị logP của các phân mảnh tại khu vực 5 là lớn nhất. Số lượng liên kết hidro cho nhận trên mỗi phân mảnh cũng được tính toán để thăm dò khả năng khởi tạo liên kết hidro giữa phân mảnh và thụ thể. Phân mảnh số 1 và số 2 có số lượng liên kết hidro cho nhận là lớn nhất, trong khi đó phân mảnh số 5 không hình thành được liên kết hidro cho và nhận.
1
2 3
28
Bảng 3.4. Năm cấu trúc phân mảnh tối ưu nhất.
Vị
trí Cấu trúc CTPT KLPT
a logPb HBAc HBDd Các axít amin
tương tác Vùng axít amin
1 C8H10N2O 150.1 1.3 2 2
A.Arg122, A.Leu139, A.Lys75
A.Lys75, A.Phe79, A.Arg122, A.Ile123, A.Arg126, A.Pro138, A.Leu139,
A.Tyr141, A.Asp142
2 C6H9N3 123.1 0.8 2 1 A.Ser205,
A.Tyr206
A.Arg126, A.Leu129, A.Ala143, A.Asn144, A.Ser205, A.Tyr206, A.Phe207, B.Lys66
3 C5H12O 88.09 1.6 1 1
A.Ala143, A.Asn144, A.Asp142,
A.Arg126, A.Tyr206, B.Ile63, B.Thr64, B.Leu65
4 C6H14N 100.1 0.8 0 1 B.Ser60 A.Arg122, B.Ser60, B.Lys61, B.Ile63,
B.Leu65, B.His78
5 C7H12 96.09 3.0 0 0
A.Ile118, A.Val121, A.Met125, A.Arg122, A.Tyr206, A.Phe207, B.Lys61, B.Ile63, B.Thr64, B.Ile62
Chú thích: (a) Khối lượng phân tử của phân mảnh (đơn vị Da). (b) Hệ số phân chia octanol-nước. (c) Số lượng liên kết hydro nhận. (d) Số lượng liên kết hydro cho.
29
3.2.2.2. Tính toán giá trị p
Điểm số docking trên phần ICM chịu ảnh hưởng lớn bởi số lượng liên kết hidro tương tác giữa phối tử và thụ thể. Chúng tôi xây dựng cơ sở dữ liệu điểm docking hoạt tính trên các protein đồng kết tinh của các phân mảnh để kiểm tra sự phân bố điểm docking hoạt tính của năm phân mảnh được xác định từ bước lấy mẫu (Hình 3.5). Dễ dàng nhận thấy rằng phân mảnh 1 và 2 cho điểm docking tốt hơn so với ba phân mảnh còn lại, trong khi đó điểm docking của phân mảnh 5 là kém nhất. Điều này cho thấy, không thể so sánh điểm số docking giữa các phân mảnh mà cần một phương pháp xếp hạng khác để lựa chọn phân mảnh có hoạt tính thực sự.
Hình 3.5. Phân bố điểm docking hoạt tính của năm phân mảnh
Nếu chỉ dựa trên điểm số docking để lựa chọn phân mảnh khởi đầu sẽ dẫn đến thiếu công bằng giữa các phân mảnh. Đó là lý do tại sao chúng tôi phải thực hiện chuẩn hóa điểm số docking dựa trên giá trị p, cung cấp độ tin cậy rằng một phân mảnh là có hoạt tính thực sự theo nghĩa tuyệt đối, thay vì chỉ xếp hạng nó so với các phân mảnh khác dựa trên điểm số docking.
Vì các phân mảnh là những cấu trúc nhỏ, khả năng gắn kết với thụ thể linh hoạt hơn so với các phân tử hoàn chỉnh, đó là lí do tỉ lệ dương tính giả khi sàng lọc các thư viện phân mảnh cao hơn khi sàng lọc các hợp chất. Do đó, chúng tôi xác thực trước việc chấm điểm cho từng phân mảnh. Điều này cho phép chúng tôi ước tính độ nhạy và độ
-40 -30 -20 -10 0 Điểm docking Phân mảnh 1 Phân mảnh 2 Phân mảnh 3 Phân mảnh 4 Phân mảnh 5
30
đặc hiệu (tỷ lệ dương tính thực sự trên âm tính thực sự) của từng phân mảnh cấu trúc. Bằng cách đó, số lượng các phân mảnh dương tính giả có thể giảm xuống.
Hình 3.6.A. Phân phối tích lũy Hình 3.6.B. Logarit của phân bố tích lũy
Hình 3.6. Phân phối tích lũy và logarit của nó đối với điểm docking mồi nhử.
Năm mô hình tính toán giá trị p được xây dựng dựa trên năm phân mảnh cấu trúc từ bước lấy mẫu. Chúng tôi docking từng phân mảnh cấu trúc vào protein đích và các protein của 4 phân mảnh cấu trúc còn lại, kết quả điểm docking hoạt tính và điểm docking mồi nhử của 5 phân mảnh cấu trúc trong phụ lục 3. Sau đó, chúng tôi xây dựng hàm phân phối tích lũy F(x) và hàm logarithm G(x) của hàm phân phối tích lũy của 5 phân mảnh cấu trúc (Hình 3.6). Tóm tắt các thông số của năm mô hình giá trị p của phân mảnh trên Bảng 3.5.
Xem xét đường xu hướng tuyến tính của 5 hàm G(x), chúng tôi nhận thấy cả năm đường tuyến tính đều có độ tương quan tốt (giá trị R2 > 0,9). Trong đó đường tuyến tính của mô hình phân mảnh số 3 có độ tương quan kém nhất (R2 = 0,9457), các đường tuyến tính của 4 phân mảnh còn lại đều có R2 trên 0,96.
Khi xét ngưỡng ϵ = 0,01 tất cả các mô hình đều không ghi nhận dương tính giả, mặc dù tỷ lệ âm tính giả ở mô hình phân mảnh 2 và 4 lớn, tuy nhiên trong thiết kế thuốc, khả năng loại trừ dương tính giả là quan trọng hơn nhiều so với âm tính giả. Từ đây chúng tôi lựa chọn điểm ngưỡng p < 0,01 cho việc lựa chọn các phân mảnh.
0.00 0.50 1.00 -50 -40 -30 -20 -10 0 10 20 P hân b ố tích lũ y
Điểm Docking mồi nhử
-2 -1.5 -1 -0.5 0 -40 -30 -20 -10 0 10 L og ar it củ a ph ân b ố tích lũ y
31
Bảng 3.5. Các thông số của năm mô hình giá trị p của phân mảnh
Phân mảnh R2 Hệ số phương trình tuyến tính Dương tính giả Âm tính giả
a b 1 0,9662 0,2837 2,5445 0 3 2 0,9855 0,5858 14,1493 0 53 3 0,9457 0,2418 1,1874 0 9 4 0,9642 0,5698 5,9928 0 19 5 0,9966 0,5304 3,6704 0 9
Dựa trên phương trình tuyến tính của các mô hình dự đoán, chúng tôi tính được giá trị p của mỗi phân mảnh cấu trúc khởi đầu (Hình 3.7). Lấy ngưỡng p < 0,01 (tức là có dưới 1% khả năng điểm docking được tạo ra bởi chất không có hoạt tính), chúng tôi lựa chọn hai phân mảnh cấu trúc số 1 và số 2 làm phân mảnh khởi đầu để chuyển tiếp sang giai đoạn liên kết các mảnh thành phân tử hoàn chỉnh.
Score = -36.7304 p = 0.000379781 Score = -37.3047 p = 0.000471263 Score = -23.7174 p = 0.010594002 Score = -15.9211 p = 0.046003271 Score = -11.4126 p = 0.092287826
Hình 3.7. 5 phân mảnh sau quá trình lấy mẫu cùng với điểm số (Score) và giá trị p.