Thu nhận dữ liệu kháng thể gắn peptide HA 32

Một phần của tài liệu Dự đoán epitope tế bào b không liên tục trên protein hemagglutinin của virus cúm a h5n1 (Trang 46 - 74)

Cấu trúc kháng thể gắn với peptide HA sẽ được thu nhận từ CSDL PDB. Các cấu trúc kháng thể gắn HA sẽđược tải về sau đó sẽ được chọn lọc theo hai tiêu chí: (1) phân tử HA gắn với kháng thể phải là một đoạn peptide ngắn và không có mặt phân tử nào khác, (2)cấu trúc được giải mã phải có chất lượng tốt (độ phân giải thấp)

2.2.2.3. Chuẩn bị tập tin đầu vào cho chương trình Autodock

Autodock yêu cầu thông tin cấu trúc của thụ thể và ligand nhập vào phải có

định dạng PDBQT. Định dạng này chứa thông tin về tọa độ và điện tích cho từng nguyên tử trong phân tử. Chương trình AutodockTool (ADT) được sử dụng để hỗ

trợ cho Autodock chuẩn bị tập tin cấu trúc và tập tin chứa các thông số cho quá trình chạy. Giao diện chương trình ADT được thể hiện trên hình 2.3.

Hình 2.3: Giao diện chương trình AutodockTool (ADT)

Tập tin PDB trước khi đưa vào chương trình ADT cần phải chọn một trường hợp cấu trúc, loại bỏ các trường hợp không cần thiết. Do CSDL PDB có thể ghi

nhận nhiều kết quả giải mã cấu trúc khác nhau trên cùng 1 protein, dẫn đến xuất hiện nhiều trường hợp cấu trúc khác nhau trong cùng một phân tử. Và việc loại bỏ

này giúp đảm bảo chỉ một cấu trúc được thực hiện trong quá trình khảo sát. Quá trình loại bỏđược thực hiện thông qua các đoạn mã trong chương trình Perl.

Sau đó, cấu trúc của kháng thể gắn peptide HA được nhập vào ADT. Tiếp theo ta tiến hành tối ưu hóa cấu trúc từ tập tin PDB. Việc tối ưu hóa cấu trúc là cần thiết vì cấu trúc được tải từ cơ sở dữ liệu PDB chưa thể tiến hành khảo sát gắn

được. Tối ưu hóa ởđây bao gồm: thêm nguyên tử Hydro, loại bỏ các phân tử nước, thêm điện tích cho các nguyên tử, và sau cùng là tách cấu trúc kháng thể và peptide của HA ra thành hai tập tin riêng.

Quá trình loại bỏ các phân tử nước được thực hiện bằng công cụ Delete AtomSet trong ADT. Công cụ Select From String (hình 2.4) giúp chọn tất cả các phân tử nước trong cấu trúc.

Hình 2.4: Chọn phân tử nước trong đại phân tử

Sau đó ta tiến hành thêm hydrogen phân cực (theo thuật toán của Gasteiger) theo phương pháp noBonOrders cho toàn bộ cấu trúc (hình 2.5). Việc chỉ thêm hydro phân cực vào phân tử nhằm giảm bớt thời gian tính toán những phần không cần thiết.

Lúc này, phân tử kháng thể đã được tối ưu hóa xong sẽ được lưu lại theo

Hình 2.5: Quá trình thêm Hydro

Tiếp theo, peptide HA gắn với kháng thể sẽ đóng vai trò ligand trong quá trình khảo sát gắn được tiến hành xác định nguyên tử tâm:

Ligand Æ Torsion Tree Æ Detect Root

Chương trình sẽ tựđộng tính toán để xác định nguyên tử tâm theo nguyên tắc sao cho nhánh lớn nhất trong cây được nhỏ nhất. Sau đó, ta quy định những liên kết có thể xoay được trong quá trình khảo sát ligand (Hình 2.6).

Do chương trình Autodock giới hạn số liên kết xoay là 32, nên trong quá trình khảo sát chúng tôi giữ khung sườn của peptide cố định, chỉ cho các liên kết của chuỗi bên xoay. Sau khi hoàn thành những bước trên, cấu trúc ligand được lưu lại với định dạng là PDBQT với tên là HA.pdbqt.

2.2.2.4. Chuẩn bị tập tin chứa thông số AutoGrid và thực thi Autogrid

Sau khi có các tập tin cấu trúc đầu vào, ta tạo các tập tin chứa các thông tin về các bản đồ grid được dùng trong quá trình khảo sát. Chương trình Autodock khảo sát gắn giữa protein và ligand bằng cách sử dụng bản đồgrid. Bản đồ grid bao gồm các điểm nút (node) cố định và cách đều nhau trong không gian cần khảo sát. Chương trình autogrid sẽ tính toán tương tác giữa các nguyên tử trong phân tử

protein đến các node và lưu thông tin vào các bản đồ grid. Mỗi loại nguyên tử trong ligand sẽ tương ứng với 1 bản đồ grid. Ngoài ra, chương trình còn tính toán thêm 1 bản đồ electron và 1 bản đồ desolvation. Các bản đồ này sẽ được chương trình Autogrid tựđộng tạo ra dựa vào phân tử ligand và phân tử protein. Ta cần xác định tọa độ không gian cần khảo sát cho chương trình Autogrid. Không gian khảo sát trên cấu trúc kháng thể được chọn tại vùng lõm mà phân tử peptide HA đã gắn trước đó. Giao diện xác định thông số cho Autogrid như trên hình 2.7. Sau đó, các thông số chạy của Autogrid được lưu lại vào tập tin HA.gpf (Hình 2.8).

Ta tiến hành chạy Autogrid4 bằng dòng lệnh :

Autogrid4 -p HA.gpf –l HA.glg&

Chương trình xuất ra tập tin kết quả với định dạng *.glg và các tập tin map phục vụ cho quá trình thực thi Autodock.

Hình 2.7: Giao diện xác định thông số cho Autogrid

2.2.2.5. Chuẩn bị tập tin chứa thông số Autodock và thực thi Autodock

Sau khi đã có các tập tin bản đồ grid từ chương trình Autogrid, ta tiến hành chuẩn bị tập tin thông số cho chương trình Autodock. Tập tin này cho Autodock biết các thông số trong quá trình khảo sát gắn cũng như giúp Autodock liên kết đến các tập tin chứa cấu trúc của kháng thể và ligand cũng như các tập tin được tạo ra từ

AutoGrid. Các thông số trong quá trình khảo sát bao gồm các thông số về thuật toán tìm kiếm và thuật toán tính điểm. (adsbygoogle = window.adsbygoogle || []).push({});

Ta sử dụng thuật toán tìm kiếm là thuật toán di truyền (GA-Genetic Algorithm) với các tham sốđược khảo sát bao gồm: số vòng chạy, số chu trình tính toán của thuật toán GA, số thế hệ, tỉ lệđột biến, tỉ lệ trao đổi chéo. Các thông số còn lại được dùng theo mặc định của chương trình. Sau đó các thông số được lưu vào tập tin HA.dpf (hình 2.9).

Ta tiến hành chạy Autodock bằng lệnh:

Autodock4 –p HA.dpf –l HA.dlg &

Kết quả xuất ra tập tin với định dạng là DLG chứa các thông số về năng lượng và tọa độ của ligand sau khi đã gắn kết.

2.2.2.6. Phân tích kết quả

Sau khi chạy Autodock, chương trình sẽ tạo ra tập tin kết quả có định dạng là DLG. Kết quả này cho biết các thông tin về tọa độ các nguyên tử trong ligand, năng lượng của cấu trạng gắn có năng lượng thấp nhất trong mỗi chu trình tính toán, và

độ tương đồng giữa các cấu trạng đó với nhau. Độ tương đồng cấu trạng được xác

định dựa trên độ sai lệch cấu trúc (RMSD, root-mean-square-deviation) của các nguyên tử Carbon anpha (CA) trên mạch chính. [13]

Công thức tính giá trị RMSD như sau:

Với xi: khoảng cách giữa hai nguyên tử Carbon alpha của amino acid thứ i trên hai phân tử

n: số Carbon alpha trong phân tử

Cấu trạng có năng lượng thấp nhất sẽ được so sánh với cấu trạng thực nghiệm ban đầu, từđó đánh giá để chọn ra bộ thông số tối ưu cho chương trình.

2.2.3. Thu nhận cấu trúc kháng thể

Cấu trúc kháng thể cần cho quá trình dựđoán là cấu trúc kháng thể người có khả năng gắn với epitope không liên tục của virus cúm A phân type H5N1. Các cấu trúc kháng thể gắn với HA sẽ được thu nhận từ CDL PDB, từ đó chọn ra cấu trúc kháng thể phù hợp.

2.2.4. Dự đoán epitope không liên tục tế bào B bằng server Discotope, từ đó thiết kế các peptide cần dựđoán thiết kế các peptide cần dựđoán

- Thu nhận cấu trúc phân tử HA: Cấu trúc phân tử HA sẽ được thu nhận từ

CSDL PDB với tiêu chí độ phân giải phải thấp và trong cấu trúc không có chứa phân tử nào khác ngoài protein HA.

- Sử dụng cấu trúc HA thu nhận được tiến hành dự đoán epitope tế bào B không liên tục bằng chương trình Discotope. Ngưỡng thông số cho chương trình được sử dụng mặc định là -7,7. Với ngưỡng thông số này, chương trình sẽ cho độ nhạy là 47% và độ chính xác là 75%. Kết quả

chương trình sẽ cho ra vị trí các gốc amino acid được dự đoán thuộc epitope tế bào B không liên tục.

- Thiết kế các đoạn peptide từ kết quả dựđoán của chương trình Discotope sao cho: (1) các đoạn peptide được thiết kế phải chứa các gốc được dự đoán bởi chương trình Discotope, (2) các gốc này phải gần nhau về mặt không gian và cả trên trình tự, (3) chiều dài các đoạn peptide thiết kế được chọn là 14 amino acid. Sau đó, cấu trúc các đoạn peptide này sẽ được thu nhận bằng cách cắt trực tiếp từ cấu trúc HA ban đầu thông qua chương trình Pymol

2.2.5. Thu nhận cấu trúc các epitope và non-epitope

Các epitope và non-epitope dùng làm mẫu chứng dương và chứng âm được thu nhận từ CSDL IEDB-3D. Dữ liệu được chọn sao cho các epitope không trùng với bất cứ non-epitope nào trong CSDL.

Về phía các non-epitope, ngoài tiêu chí không trùng với các epitope trong CSDL, các non-epitope này còn được chọn lọc sao cho không chứa các gốc amino acid được dựđoán là epitope không liên tục tế bào B bởi chương trình Discotope.

2.2.6. Khảo sát gắn cấu trúc kháng thể với các cấu trúc peptide dự đoán, epitope và non-epitope epitope và non-epitope

Sau khi khảo sát gắn giữa cấu trúc kháng thể và peptide HA thu nhận từ cấu trúc phức hợp kháng thể - peptide HA thực nghiệm, ta thu được bộ thông số tối ưu

phục vụ quá trình khảo sát gắn giữa kháng thể và peptide HA. Các cấu trúc peptide thiết kế được cùng với các epitope và non-epitope thu nhận từ CSDL IEDB-3D sẽ được sử dụng như mẫu đối chứng dương và mẫu đối chứng âm, sẽ lần lượt được khảo sát gắn với cấu trúc kháng thểđã chọn bằng bộ thông số tối ưu thu nhận trong quá trình khảo sát. Quá trình khảo sát cũng được tiến hành tương tự như đã nêu trong mc 2.2.2.

2.2.7. Phân tích kết quả khảo sát và đề xuất các epitope tế bào B không liên tục

Để xử lý kết quả khảo sát sự gắn kết peptide – kháng thể phục vụ dự đoán epitope, chúng tôi cũng tiến hành các phân tích trên cấu trạng có năng lượng thấp nhất. Quá trình phân tích bao gồm:

(1) Khảo sát năng lượng gắn kết giữa peptide và kháng thể : năng lượng này

được tính toán từ chương trình Autodock. Năng lượng gắn kết càng thấp thì liên kết giữa peptide và kháng thể càng bền. (adsbygoogle = window.adsbygoogle || []).push({});

(2) Khảo sát các liên kết giữa các nguyên tử trong phân tử peptide và kháng thể. Peptide và kháng thể gắn với nhau bởi các liên kết sau: liên kết Hydro, liên kết Van der Waals và liên kết tĩnh điện. Trong đó, liên kết Hydro đóng vai trò quan trọng nhất nên chúng tôi tập trung khảo sát loại liên kết này. Quá trình khảo sát được thực hiện dựa trên các điều kiện về khoảng cách,

điện tích và nhóm chức của liên kết hydrogen [19] và chỉ tiến hành trên các gốc hoạt động của phân tử kháng thể [2] với các gốc trên peptide đã được dự đoán là epitope không liên tục tế bào B bởi chương trình Discotope.

Dựa vào kết quả so sánh giữa các peptide cần dự đoán với các mẫu chứng dương và mẫu chứng âm, các peptide có khả năng gắn tốt với phân tử kháng thể sẽ được đề xuất làm epitope tế bào B không liên tục.

Chương 3: KT QU VÀ BIN LUN

3.1. Kho sát b thông s ti ưu cho chương trình Autodock

3.1.1. Thu nhận cấu trúc kháng thể gắn peptide HA

Cấu trúc kháng thể gắn peptide HA được thu nhận từ cơ sở dữ liệu Protein Data Bank (PDB). Dữ liệu sau khi tải về được tiến hành chọn lọc dựa trên tiêu chí cấu trúc được giải mã bằng phương pháp nhiễu xạ tia X với độ phân giải thấp và peptide gắn kháng thể là một mảnh nhỏ của HA. Chúng tôi thu nhận được 3 cấu trúc thỏa các tiêu chí trên với mã số lần lượt là 1FRG, 1HIN và 1IFH. Các cấu trúc này sẽđược dùng để khảo sát bộ thông số tối ưu cho chương trình Autodock. Thông tin của các cấu trúc được thể hiện trên bng 3.1

Bng 3.1: Cấu trúc kháng thể gắn HA thu nhận từ cơ sở dữ liệu PDB Mã số PDB Độ phân giải Kháng thể Peptide HA liên kết với kháng thể Vị trí Chiều dài Trình tự 1FRG 2,80 Å IGG2A-KAPPA 17/9 101-108 8 aa DVPDYASL

1HIN 3,10 Å IGG2A-KAPPA 17/9 100-107 8 aa YDVPDYAS

1IFH 2,80 Å IGG2A 26/9 FAB 101-107 7 aa DVPDYAS 3.1.2. Phân tích kết quả khảo sát gắn

Cấu trúc của các đoạn peptide trong 3 cấu trúc có mã số 1FRG, 1HIN và 1IFH được tác riêng ra khỏi cấu trúc kháng thể, sau khi xử lý, được tiến hành khảo sát gắn trở lại với cấu trúc kháng thể bằng các bộ thông số khác nhau.

Kết quả chương trình trả ra là các cấu trạng gắn kết giữa peptide và kháng thể. Các cấu trạng gắn sẽđược sắp xếp theo chiều tăng năng lượng, sau đó được xếp vào các nhóm tương đồng cấu trạng. Sự phân nhóm này giúp ta dễ dàng chọn ra

trạng có năng lượng thấp nhất thường là cấu trạng gần với thực tế nhất. Do đó, ở đây chúng tôi tiến hành so sánh cấu trạng có năng lượng thấp nhất với trạng thái gắn tự nhiên từ dữ liệu thực nghiệm bằng cách tính độ sai lệch cấu trúc RMSD đối với sườn carbon của phân tử peptide Bộ thông số tốt nhất được chọn là bộ thông số

cho kết quả có các giá trị RMSD là nhỏ nhất.

Hình 3.1 thể hiện các cấu trạng từ kết quả khảo sát gắn với bộ thông số tốt nhất và các cấu trạng trong cấu trúc ban đầu. Ta nhận thấy giữa cấu trạng thu được thông qua khảo sát gắn với cấu trạng từ thực nghiệm ban đầu có sự tương đồng rất cao. Sự tương đồng này được thể hiện rõ hơn ở kết quả tính toán giá trị RMSD được thể hiện trên bng 3.2.

Bng 3.2: Độ sai lệch cấu trúc giữa peptide HA sau khi khảo sát gắn

và peptide thực nghiệm

Cấu trúc RMSD (Å)

Peptide sau khi khảo sát gắn- peptide thực nghiệmban đầu (1FRG) 0.47 Peptide sau khi khảo sát gắn- peptide thực nghiệm ban đầu (1HIN) 0.56 Peptide sau khi khảo sát gắn- peptide thực nghiệm ban đầu (1IFH) 0.45

Độ sai lệch cấu trúc trong cả ba trường hợp đều rất nhỏ (từ 0.45Å đến 0.56Å) . cho thấy bộ thông số là phù hợp cho quá trình khảo sát.

Năng lượng của các trạng thái gắn của peptide lên từng kháng thể được thể

hiện trên bng 3.3. Kết quả năng lượng cho thấy các cấu trạng gắn đều đạt trạng thái ổn định.

Từ những kết quả trên, chúng tôi quyết định thu nhận và sử dụng bộ thông số

tối ưu trên để tiến hành khảo sát gắn cho các peptide cần dựđoán cũng như các mẫu chứng âm và chứng dương. Bộ thông số tối ưu được thể hiện trong bảng 3.4.

A B a. 1FRG b. 1HIN c. 1IFH Hình 3.1: Kết quả khảo sát gắn giữa peptide HA và kháng thể (A: kết quả khảo sát gắn in silico, B: kết quả giải mã cấu trúc thực nghiệm)

Bng 3.3: Năng lượng các trạng thái gắn kết của các peptide lên phân tử kháng thể STT Kháng thể- peptide Chiều dài (aa) Năng lượng nội phân tử Năng lượng liên phân tử Năng lượng khảo sát gắn 1 1FRG 8 -2.42 -15.56 -17.98 2 1HIN 10 -2.35 -11.71 -14.06 3 1IFH 9 -1.55 -13.36 -14.91

Bng 3.4: Bộ thông số tối ưu thu được

(các thông số còn lại dùng giá trị mặc định của chương trình Autodock 4.0)

Thông số Giá trị Kích thước quần thể 150 Số thế hệ tối đa 27000 Số lần tính toán năng lượng tối đa 25.000.000 Tỉ lệđột biến 0,02 Tỉ lệ trao đổi chéo 0,8 Số lần khảo sát 50

3.2. Thu nhn cu trúc kháng th (adsbygoogle = window.adsbygoogle || []).push({});

Cấu trúc kháng thể cần cho quá trình dựđoán là cấu trúc kháng thể người có khả năng gắn với epitope không liên tục của virus cúm A phân type H5N1. Tuy nhiên, trên ngân hàng dữ liệu PDB, đến thời điểm hiện tại, chúng tôi không thu nhận được cấu trúc nào thỏa điều kiện như trên. Thay vào đó, chúng tôi thu được

Một phần của tài liệu Dự đoán epitope tế bào b không liên tục trên protein hemagglutinin của virus cúm a h5n1 (Trang 46 - 74)