Thu nhận cấu trúc kháng thể gắn peptide HA

Một phần của tài liệu Dự đoán epitope tế bào b không liên tục trên protein hemagglutinin của virus cúm a h5n1 (Trang 56 - 74)

Cấu trúc kháng thể gắn peptide HA được thu nhận từ cơ sở dữ liệu Protein Data Bank (PDB). Dữ liệu sau khi tải về được tiến hành chọn lọc dựa trên tiêu chí cấu trúc được giải mã bằng phương pháp nhiễu xạ tia X với độ phân giải thấp và peptide gắn kháng thể là một mảnh nhỏ của HA. Chúng tôi thu nhận được 3 cấu trúc thỏa các tiêu chí trên với mã số lần lượt là 1FRG, 1HIN và 1IFH. Các cấu trúc này sẽđược dùng để khảo sát bộ thông số tối ưu cho chương trình Autodock. Thông tin của các cấu trúc được thể hiện trên bng 3.1

Bng 3.1: Cấu trúc kháng thể gắn HA thu nhận từ cơ sở dữ liệu PDB Mã số PDB Độ phân giải Kháng thể Peptide HA liên kết với kháng thể Vị trí Chiều dài Trình tự 1FRG 2,80 Å IGG2A-KAPPA 17/9 101-108 8 aa DVPDYASL

1HIN 3,10 Å IGG2A-KAPPA 17/9 100-107 8 aa YDVPDYAS

1IFH 2,80 Å IGG2A 26/9 FAB 101-107 7 aa DVPDYAS 3.1.2. Phân tích kết quả khảo sát gắn

Cấu trúc của các đoạn peptide trong 3 cấu trúc có mã số 1FRG, 1HIN và 1IFH được tác riêng ra khỏi cấu trúc kháng thể, sau khi xử lý, được tiến hành khảo sát gắn trở lại với cấu trúc kháng thể bằng các bộ thông số khác nhau.

Kết quả chương trình trả ra là các cấu trạng gắn kết giữa peptide và kháng thể. Các cấu trạng gắn sẽđược sắp xếp theo chiều tăng năng lượng, sau đó được xếp vào các nhóm tương đồng cấu trạng. Sự phân nhóm này giúp ta dễ dàng chọn ra

trạng có năng lượng thấp nhất thường là cấu trạng gần với thực tế nhất. Do đó, ở đây chúng tôi tiến hành so sánh cấu trạng có năng lượng thấp nhất với trạng thái gắn tự nhiên từ dữ liệu thực nghiệm bằng cách tính độ sai lệch cấu trúc RMSD đối với sườn carbon của phân tử peptide Bộ thông số tốt nhất được chọn là bộ thông số

cho kết quả có các giá trị RMSD là nhỏ nhất.

Hình 3.1 thể hiện các cấu trạng từ kết quả khảo sát gắn với bộ thông số tốt nhất và các cấu trạng trong cấu trúc ban đầu. Ta nhận thấy giữa cấu trạng thu được thông qua khảo sát gắn với cấu trạng từ thực nghiệm ban đầu có sự tương đồng rất cao. Sự tương đồng này được thể hiện rõ hơn ở kết quả tính toán giá trị RMSD được thể hiện trên bng 3.2.

Bng 3.2: Độ sai lệch cấu trúc giữa peptide HA sau khi khảo sát gắn

và peptide thực nghiệm

Cấu trúc RMSD (Å)

Peptide sau khi khảo sát gắn- peptide thực nghiệmban đầu (1FRG) 0.47 Peptide sau khi khảo sát gắn- peptide thực nghiệm ban đầu (1HIN) 0.56 Peptide sau khi khảo sát gắn- peptide thực nghiệm ban đầu (1IFH) 0.45

Độ sai lệch cấu trúc trong cả ba trường hợp đều rất nhỏ (từ 0.45Å đến 0.56Å) . cho thấy bộ thông số là phù hợp cho quá trình khảo sát.

Năng lượng của các trạng thái gắn của peptide lên từng kháng thể được thể

hiện trên bng 3.3. Kết quả năng lượng cho thấy các cấu trạng gắn đều đạt trạng thái ổn định.

Từ những kết quả trên, chúng tôi quyết định thu nhận và sử dụng bộ thông số

tối ưu trên để tiến hành khảo sát gắn cho các peptide cần dựđoán cũng như các mẫu chứng âm và chứng dương. Bộ thông số tối ưu được thể hiện trong bảng 3.4.

A B a. 1FRG b. 1HIN c. 1IFH Hình 3.1: Kết quả khảo sát gắn giữa peptide HA và kháng thể (A: kết quả khảo sát gắn in silico, B: kết quả giải mã cấu trúc thực nghiệm)

Bng 3.3: Năng lượng các trạng thái gắn kết của các peptide lên phân tử kháng thể STT Kháng thể- peptide Chiều dài (aa) Năng lượng nội phân tử Năng lượng liên phân tử Năng lượng khảo sát gắn 1 1FRG 8 -2.42 -15.56 -17.98 2 1HIN 10 -2.35 -11.71 -14.06 3 1IFH 9 -1.55 -13.36 -14.91

Bng 3.4: Bộ thông số tối ưu thu được

(các thông số còn lại dùng giá trị mặc định của chương trình Autodock 4.0)

Thông số Giá trị Kích thước quần thể 150 Số thế hệ tối đa 27000 Số lần tính toán năng lượng tối đa 25.000.000 Tỉ lệđột biến 0,02 Tỉ lệ trao đổi chéo 0,8 Số lần khảo sát 50

3.2. Thu nhn cu trúc kháng th

Cấu trúc kháng thể cần cho quá trình dựđoán là cấu trúc kháng thể người có khả năng gắn với epitope không liên tục của virus cúm A phân type H5N1. Tuy nhiên, trên ngân hàng dữ liệu PDB, đến thời điểm hiện tại, chúng tôi không thu nhận được cấu trúc nào thỏa điều kiện như trên. Thay vào đó, chúng tôi thu được cấu trúc kháng thể người gắn với protein HA của virus cúm A phân type H5N1 có mã số 3GBM. Do đó, tiếp theo chúng tôi cần kiểm tra phần epitope gắn với kháng thể trên có phải epitope không liên tục hay không. Dựa trên thông tin trong bài báo của D.C. Ekiert và cộng sự [2], chúng tôi nhận thấy epitope trên protein HA tương tác với phân tử kháng thể này là epitope không liên tục. Hình 3.2 cho thấy vị trí của các gốc trong epitope này tham gia vào tương tác với phân tử kháng thể.

Hình 3.2: Các gốc amino acid trên phân tử HA tham gia tương tác với phân tử

kháng thể. Màu hồng là phân tử HA1, màu xanh là phân tử HA2, các gốc amino acid tham gia vào tương tác được thể hiện bằng màu đậm hơn, màu đỏ là cac nguyên tử tham gia vào tương tác phân cực.

Bên cạnh đó, chúng tôi cũng tiến hành dự đoán epitope không liên tục cho phân tử HA trong cấu trúc trên bằng chương trình Discotope. Kết quả dựđoán của chương trình Discotope đối với các gốc amino acid trên phân tử protein HA có tham gia vào sự tương tác với phân tử kháng thểđược thể hiện trên bng 3.5.

Bng 3.5: Kết quả dựđoán bằng Discotope đối với các amino acid trên phân tử

protein HA có tham gia vào tương tác với phân tử kháng thể

Kháng nguyên Vị trí Kết quả từ Discotope Vị trí Kết quả từ Discotope HA1 38 - 291 E 40 - 292 E 41 - 293 E 42 - HA2 19 E 45 - 20 - 46 E 21 - 49 E 38 E 52 - 41 - 53 E 42 E 56 E

Một nửa số gốc amino acid trên được Discotope đánh giá là epitope không liên tục. Đồng thời, các gốc này nằm cạnh nhau về mặt không gian trong phân tử

Do đó, chúng tôi quyết định dùng cấu trúc kháng thể trong cấu trúc phức hợp có mã số 3GBM để tiến hành các nghiên cứu tiếp theo.

3.3. D đoán epitope không liên tc tế bào B bng chương trình Discotope, tđó thiết kế các peptide cn dđoán Discotope, tđó thiết kế các peptide cn dđoán

Trong các cấu trúc protein HA thu nhận được từ CSDL PDB, chúng tôi quyết định chọn cấu trúc có mã số 1JSM (hình 3.3) để tiến hành dự đoán epitope. Cấu trúc này chỉ chứa duy nhất 1 phân tử HA với độ phân giải bằng tia X khá tốt 1,90 Å.

Hình 3.3: Cấu trúc phân tử protein HA mã số 1JSM

Cấu trúc này sau đó được đưa vào chương trình Discotope để dự đoán epitope tế bào B không liên tục. Kết quả thu được 96 trong tổng số 321 amino acid

được chương trình dựđoán là thuộc các epitope không liên tục (hình 3.4).

Kết quả này chỉ bao gồm các gốc amino acid riêng lẻ, nó không cho biết các gốc nào thuộc cùng một epitope với nhau. Thêm nữa, tính chất không liên tục cũng gây nên hạn chế trong việc ứng dụng vào việc thiết kế vaccine. Do đó để có thểđưa vào khảo sát gắn với kháng thể, chúng tôi tiến hành chọn lọc và nối các mảnh

peptide không liên tục thành đoạn peptide liên tục. Để các peptide có khả năng là các epitope không liên tục, các gốc amino acid trong kết quả Discotope phải gần nhau về mặt không gian. Từ tiêu chí trên, chúng tôi thiết kếđược 7 đoạn peptide với chiều dài của đoạn dài nhất thu được là 14 amino acid. Do đó, chúng tôi quyết định chọn chiều dài chung cho các đoạn này là 14 để thuận tiện trong việc khảo sát về

sau. Các đoạn peptide có chiều dài nhỏ hơn sẽđược thu nhận thêm các amino acid ở

2 bên trên trình tự cho đủ chiều dài đặt ra. Từ đó, các peptide được chọn nối với nhau phải thỏa mãn tiêu chí về khoảng cách gần nhau cả trong không gian và trên trình tự. Dựa vào quy ước này, chúng tôi tiến hành thiết kếin silico các peptide liên tục chứa các phân đoạn peptide không liên tục được dựđoán từ Discotope.

Hình 3.4: Kết quả dựđoán epitope tế bào B không liên tục bằng chương trình Discotope trên cấu trúc 1JSM

Kết quả chúng tôi đã chọn và tổng hợp in silicođược 07 đoạn peptide dựa vào khoảng cách về không gian và trình tựđể tiến hành khảo sát gắn. Thông tin về

Cấu trúc của các đoạn peptide này được thu nhận trực tiếp bằng cách cắt từ

cấu trúc phân tử HA ban đầu thông qua chương trình Pymol

Bng 3.6: Các peptide được thiết kế

Peptid e Vị trí trên HA Trình tự (*) P_1 90-103 CYPENFNDYEELKH P_2 113-126 KIRIIPRSSWSNHD P_3 182-195 NDAAEQTKLYQNPT P_4 211-224 PEIATRPKVNGQSG

P_5 231-244 TILKPNDAINFESN P_6 285-298 INSSMPFHNIHPLT

P_7 300-313 GECPKYVKSGRLVL

(*) Phần in đậm là các peptide được dựđoán bởi Discotope, phần in thường là các đoạn nối giữa các peptide này

3.4. Thu nhn cu trúc các epitope và non-epitope

Dữ liệu trong CSDL IEDB-3D thu được rất nhiều, tuy nhiên lại có một số

trường hợp mâu thuẫn: 1 trình tự epitope và 1 trình tự non-epitope (trong các nghiên cứu của các nhóm tác giả khác nhau) có thể trùng lắp 1 phần hoặc hoàn toàn. Do đó chúng tôi lựa chọn epitope sao cho không trùng với bất cứ non-epitope nào trong CSDL. Về phần non-epitope, ngoài tiêu chí không trùng với các epitope trong CSDL, việc so sánh với kết quả dựđoán của chương trình Discotope cũng được tiến

hành nhằm đảm bảo không có gốc amino acid nào được dự đoán là epitope không liên tục tế bào B.

Dựa vào tiêu chí trên, chúng tôi thu nhận được 2 epitope thỏa điều kiện để

làm mẫu chứng dương và 3 non-epitope làm mẫu đối chứng âm. Thông tin về các epitope và non-epitope được nêu trong bng 3.7. Do không tìm được non-epitope trên chuỗi HA1 phù hợp với điều kiện nên chúng tôi quyết định chọn non-epitope trên chuỗi HA2. Do đây là dữ liệu non-epitope từ CSDL IEDB-3D có độ tin cậy cao nên vẫn có thể sử dụng làm đối chứng âm cho thí nghiệm.

Bng 3.7: Các epitope và non-epitope thu nhận được

Peptide Vị trí Chuỗi Trình tự

Epitope – Mẫu đối chứng dương

Pos_1 121-134 HA1 IQIIPSWSSHEASG

Pos_2 33-46 HA1 NVTVTHAQDILEKK

Non-epitope – Mẫu đối chứng âm

Neg_1 2-15 HA2 LFGAIAGFIEGGWQ Neg_2 23-36 HA2 GYHHSNEQGSGYAA Neg_3 42-56 HA2 QKAIDGVTNKVNSII

3.5. Kho sát gn cu trúc kháng th vi các cu trúc peptide dđoán, epitope và non-epitope dđoán, epitope và non-epitope

Đầu tiên, chúng tôi tiến hành phân tích năng lượng của các cấu trạng gắn giữa kháng thể với các peptide. Kết quả năng lượng của quá trình khảo sát gắn 07

phân tử peptide thiết kế, 02 epitope đối chứng dương và 03 non-epitope đối chứng âm lần lượt vào phân tử kháng thểđược trình bày trên bng 3.8bng 3.9.

Bng 3.8: Năng lượng các trạng thái gắn kết của các mẫu đối chứng dương và

đối chứng âm lên phân tử kháng thể

Peptide Trình tự Năng lượng nội phân tử (kcal/mol) Năng lượng liên phân tử (kcal/mol) Năng lượng gắn (kcal/mol)

Pos_1 QIIPKSSWSSHEASL -5.92 -11.29 -17.21

Pos_2 NVTVTHAQDILEKK -9.38 -.9.34 -18.72

Neg_1 LFGAIAGFIEGGWQG -5.82 -9.47 -15.29

Neg_2 GYHHSNEQGSGYAAD -4.15 -9.62 -13.77

Neg_3 QKAIDGVTNKVNSII -7.41 -8.17 -15.58

Dựa vào kết quả năng lượng khảo sát gắn của các mẫu đối chứng(bng 3.8), ta nhận thấy rằng năng lượng gắn của các peptide đối chứng dương thấp hơn so với các peptide đối chứng âm chứng tỏ khả năng gắn kết tạo cấu trạng bền hơn. Bên cạnh đó, trong số các peptide cần dựđoán, peptide P_3 có năng lượng gắn kết thấp nhất và tương đương với trường hợp của 2 mẫu đối chứng dương Pos_1 và Pos_2.

Bng 3.9: Năng lượng các trạng thái gắn kết của 07 peptide lên phân tử kháng thể Peptide Trình tự Năng lượng nội phân tử (kcal/mol) Năng lượng liên phân tử (kcal/mol) Năng lượng gắn (kcal/mol) P_1 CYPENFNDYEELKH -4.86 -10.20 -15.06 P_2 KIRIIPRSSWSNHD -4.40 -8.00 -12.40 P_3 NDAAEQTKLYQNPT -9.48 -7.68 -17.16 P_4 PEIATRPKVNGQSG -3.79 -8.26 -12.05

P_5 TILKPNDAINFESN -3.86 -7.77 -11.63

P_6 INSSMPFHNIHPLT -4.37 -6.23 -10.60

P_7 GECPKYVKSGRLVL -3.86 -5.46 -9.32

Tuy nhiên, độ chênh lệch năng lượng giữa các mẫu đối chứng dương và âm là không nhiều (-15.59 kcal/mol của Neg_3 so với -17.21 kcal/mol của Pos_1), do

đó nếu chỉ dựa vào năng lượng thì kết luận chưa chắc chắn.

Chúng tôi tiến hành phân tích các tương tác giữa các peptide với phân tử

kháng thể. Chúng tôi tập trung vào khảo sát liên kết Hydrogen giữa các gốc amino acid trên phân tử peptide đã được chương trình Discotope dự đoán với các gốc amino acid trên phân tử kháng thể được chứng minh là có vai trò trong tương tác với epitope [2]. Kết quảđược thể hiện trên bng 3.10.

Theo như kết quả khảo sát, chúng tôi nhận thấy peptide P_3 và peptide P_5 có số liên kết Hydrogen tạo thành lần lượt là 4 và 3 liên kết tương đương với trường hợp của 2 mẫu đối chứng dương là 3 và 5 liên kết. Bên cạnh đó, các mẫu đối chứng âm có số liên kết hydrogen tạo thành khá thấp, chỉ có peptide Neg_3 cho số liên kết khá cao là 3 liên kết. Tuy nhiên, do các peptide cần khảo sát và các mẫu đối chứng dương chỉ khảo sát liên kết đối với các gốc amino acid được dự đoán/khảo sát là thuộc epitope không liên tục, trong khi các mẫu đối chứng âm được khảo sát trên tất cả các gốc amino acid, nên số liên kết của trường hợp Neg_3 nhiều cũng không phản ánh chính xác được trong trường hợp này.

Bng 3.10: Số liên kết hydrogen khảo sát được

Peptide Số liên kết hydrogen Peptide Số liên kết hydrogen

P_1 0 Pos_1 5 P_2 1 Pos_2 3 P_3 4 Neg_1 0 P_4 1 Neg_2 1 P_5 3 Neg_3 3 P_6 0 P_7 0

Xét trường hợp giữa peptide P_3 và peptide P_5, peptide P_3 có năng lượng gắn kết thấp (-17,16 kcal/mol) và số liên kết tạo hydrogen tạo thành nhiều (5 liên

kết), so với peptide P_5 có năng lượng gắn kết cao hơn hẳn (-11.63 kcal/mol, cao hơn cả các mẫu đối chứng âm) và số liên kết hydrogen tạo thành ít hơn (3 liên kết) nên chúng tôi kết luận peptide P_3 có khả năng cao nhất là epitope.

Chương 4: KT LUN ĐỀ NGH

4.1. Kết lun

Trong khuôn khổ luận văn này, chúng tôi đã thực hiện được các nội dung sau :

- Khảo sát thành cộng bộ thông số tối ưu dùng cho khảo sát gắn giữa phân tử

kháng thể với phân tử peptide bằng chương trình Autodock: Dùng thuật toán tìm kiếm GA với các thông số: tích thước quần thể 150; số thế hệ tối đa 27.000; số lần tính năng lượng tối đa 25.000.000; tỉ lệđột biến 0,02; tỉ lệ trao

đổi chéo 0,8; số lần khảo sát 50.

- Thu nhận cấu trúc kháng thể dùng cho khảo sát gắn với các peptide cần dự đoán có mã số là 3GBM từ CSDL PDB

- Thực hiện dự đoán epitope không liên tục nhận diện bởi tế bào B bằng chương trình Discotope trên cấu trúc protein hemagglutinin có mã số 1JSM - Thiết kế in silico thành công 7 đoạn peptide từ kết quả chương trình

Discotope để phục vụ quá trình khảo sát gắn với kháng thể

- Thu nhận 2 epitope và 3 non-epitope làm mẫu đối chứng dương và đối chứng

Một phần của tài liệu Dự đoán epitope tế bào b không liên tục trên protein hemagglutinin của virus cúm a h5n1 (Trang 56 - 74)

Tải bản đầy đủ (PDF)

(74 trang)