Các phương pháp dựđoán epitope tế bào B đang dùng có thểđược phân chia thành bốn nhóm sau:
- Phương pháp áp dụng các thang tỉ lệ cấu trúc và tính chất hóa lý dựđoán các epitope tế bào B từ cấu trúc bậc một của protein
- Phương pháp máy học được đặt trên cơ sở khai thác các trình tự của các epitope tế bào B đã biết
- Phương pháp dựđoán dựa trên cấu trúc - Phương pháp khảo sát gắn
a. Phương pháp dựđoán dựa trên thang tỉ lệ tính chất lý hóa
Từ năm 1981, các phương pháp dựđoán epitope tế bào B đầu tiên được phát triển chủ yếu dựa trên các hệ thống thang tỉ lệ tính chất lý hóa. Các thang tỉ lệđược áp dụng bao gồm thang độ tiếp cận dung môi, tính kháng nguyên, độ linh động, độ ưa nước, độ kỵ nước, độ phân cực, đặc tính bề mặt, đặc trưng xoắn… Tiêu biểu cho hướng tiếp cận này có thể kể đến các phương pháp của Hopp và Woods (1981), Levitt (1976) và Parker. Các phương pháp này dựa trên thang độ ưa nước để dự đoán epitope tế bào B. Ngoài ra còn có phương pháp của Kolaskar dựa trên thang tỉ
lệ tính kháng nguyên, phương pháp của Pellequer áp dụng thang tỉ lệ tính chất cấu trúc, lý hóa. Tuy nhiên, các phương pháp dựđoán epitope tế bào B dựa trên thang tỉ
b. Phương pháp dựđoán sử dụng các mô hình máy học
Các phương pháp dựđoán epitope tế bào B sử dụng mô hình máy học dựa trên nguyên tắc xác định các mối liên hệ giữa các cặp giá trị dữ liệu đầu vào và dữ
liệu đầu ra tương ứng. Kết quả của việc ứng dụng các mô hình máy học giúp độ
chính xác trong dự đoán epitope tế bào B đạt khoảng 67%. Tiêu biểu cho phương pháp này có các công cụđã được xây dựng là ABCpred và Bepipred.
c. Phương pháp dựđoán sử dụng các thông tin về cấu trúc
Các phương pháp dự đoán dựa vào cấu trúc chủ yếu dựa vào thông tin cấu trúc của protein có sẵn trên cơ sở dữ liệu. Ngay cả khi cấu trúc protein chưa được biết đến, vẫn có thể dựđoán được cấu trúc thông qua các phương pháp như phương pháp mô hình hóa tương đồng.
Phương pháp dựa trên thông tin về cấu trúc đã giúp độ chính xác trong dự đoán epitope tế bào B được cải thiện khá nhiều (đạt khoảng 70%). Nhưng giá trị
này vẫn còn khá thấp, chúng ta cần có các công cụ khác hỗ trợ cho quá trình dự đoán epitope tế bào B. Hiện nay, phương pháp khảo sát gắn peptide – kháng thể đang được nhiều nhà nghiên cứu quan tâm, bởi đây là công cụ hỗ trợđắc lực giúp ta
đánh giá về khả năng gắn kết giữa peptide và kháng thể, từ đó có thể đề xuất các epitope tế bào B liên tục và không liên tục.
d. Phương pháp khảo sát gắn [16]
Ngày nay, việc hiểu rõ một cách chi tiết các tương tác giữa protein và ligand là rất cần thiết trong việc làm sáng tỏ nhiều hiện tượng sinh hóa và ứng dụng trong các vấn đền liên quan đến y dược, đặc biệt trong miễn dịch học. Từ khi ngành miễn dịch học bắt đầu phát triển, đã có rất nhiều các phương pháp và kỹ thuật xuất hiện hỗ trợ cho công việc nghiên cứu. Đến nay, một lượng lớn các phương pháp khảo sát dựa vào máy tính được đưa ra nhằm phục vụ cho việc nghiên cứu khả năng gắn kết
đặc biệt của kháng thể. Một trong các phương pháp đó, nổi bật lên là phương pháp khảo sát gắn dùng để khảo sát khả năng gắn của protein và ligand in silico giúp tìm ra vị trí và trạng thái gắn kết của phức hợp protein-ligand. Phương pháp này được
ứng dụng trong các lĩnh vực như thiết kế thuốc, khảo sát tương tác protein-ligand, tương tác kháng nguyên-kháng thể, nghiên cứu cơ chế phản ứng hóa học ...
Bắt đầu từ thập niên 80 đến nay, phương pháp gắn (khảo sát gắn) phân tử in silicođã trở thành một công cụ quan trọng trong sinh học phân tử cấu trúc và trong thiết kế thuốc trên máy tính.
Mục tiêu thực hiện khảo sát gắn phân tử protein và ligand là dựđoán các mô hình gắn kết tối ưu của một ligand với một protein đã biết cấu trúc không gian ba chiều. Để tạo phức hợp ổn định về cấu trúc và chức năng, ligand phải tương tác với protein tại một vị trí thích hợp. Vị trí này có các đặc trưng cấu trúc phù hợp với ligand và có thể thay đổi cấu hình. Một protein có thể gắn với nhiều ligand hay nhiều ligand có thể cạnh tranh một vị trí gắn với protein. Trong một số trường hợp, một ligand có thể gắn với protein tại nhiều vị trí.
Quá trình khảo sát gắn protein và ligand bao gồm ba giai đoạn: mô hình, gắn và đánh giá kết quả gắn. Các giai đoạn này được lặp lại cho đến khi tìm được vị trí gắn thích hợp về năng lượng cho phức hợp. Do đó, một chương trình khảo sát gắn thành công phải có khả năng tìm kiếm hiệu quả vị trí của ligand trong không gian cấu hình của protein và phải có hàm điểm đánh giá đúng kết quả của khảo sát gắn.
¾ Các thuật giải khảo sát gắn
Hiện nay, các thuật giải khảo sát gắn protein-ligand chủ yếu là cốđịnh phân tử protein và mô hình linh động của ligand. Do đó, thuật giải chỉ cần xem xét không gian cấu hình của ligand. Tuy nhiên, một cách lý tưởng cần khảo sát độ linh động của protein và một số phương pháp cũng được phát triển theo hướng này. Thuật giải khảo sát độ linh động của ligand được phân thành ba nhóm chính: thuật giải khảo sát gắn có hệ thống, thuật giải khảo sát gắn ngẫu nhiên và các phương pháp mô phỏng.
o Các thuật giải khảo sát gắn có hệ thống
Các thuật giải tìm kiếm có hệ thống xem xét tất cả các độ tự do trong phân tử. Các thuật giải này được chia làm ba loại chính: các phương pháp tìm kiếm cấu
hình, các phương pháp phân đoạn và các phương pháp cơ sở dữ liệu. Trong phương pháp tìm kiếm cấu hình, tất cả các góc quay trong ligand sẽđược khảo sát một cách hệ thống cho đến tất cả kết hợp có thể có được phát sinh và đánh giá. Do số lượng cấu trúc tăng theo số gốc quay nên phương pháp này đòi hỏi thời gian tính toán vô cùng lớn. Để có thể ứng dụng, thường phải cài đặt thêm các ràng buộc trên ligand
để giảm bớt lượng tính toán. Phương pháp phân đoạn là một trong những phương pháp được sử dụng nhiều trong khảo sát gắn phân tử. Phương pháp này gắn các phân đoạn vào vị trí hoạt động của protein và sau đó nối chúng lại với nhau bằng phương pháp cộng hóa trịđể tái tạo ligand; hay chia ligand thành một phân đoạn lõi cố định, gắn vào protein trước và các vùng linh động trong ligand sẽ được gắn vào sau. Phương pháp cơ sở dữ liệu giải quyết vấn đề tìm cấu hình thích hợp cho ligand bằng cách sử dụng thư viện các cấu hình sẵn có.
o Các thuật giải khảo sát gắn ngẫu nhiên
Các thuật giải tìm kiếm ngẫu nhiên khảo sát sự thay đổi ngẫu nhiên của ligand. Có ba phương pháp căn bản dựa trên thuật giải ngẫu nhiên: Monte Carlo (MC), thuật giải di truyền (GA) và các phương pháp tìm kiếm Tabu. Trong phương pháp Monte Carlo (MC), tiêu chuẩn chấp nhận cho một cấu hình mới dựa trên hàm xác suất Boltzmann. Phương pháp MC ưu điểm hơn phương pháp động học phân tử
do MC sử dụng các hàm năng lượng đơn giản hơn. Các thuật giải di truyền áp dụng các lý thuyết di truyền và tiến hóa phân tử trong khảo sát gắn. Thuật giải di truyền bắt đầu bằng một quần thể khởi tạo với các cấu hình khác nhau của ligand và protein. Mỗi cấu hình được định nghĩa như là một tập hợp các biến trạng thái (các gen) mô tả sựđịnh hướng, cấu hình...của ligand trong mối quan hệ với protein. Tập hợp đầy đủ các biến trạng thái gọi là kiểu gen, và tọa độ các nguyên tử ligand gọi là kiểu hình. Các toán tử di truyền (đột biến, trao đổi đoạn, chuyển đoạn) được áp dụng đến quần thể không gian cấu hình để tìm kiếm quần thể cuối cùng có năng lượng tối ưu.
o Các phương pháp mô phỏng
Các phương pháp mô phỏng là một cách tiếp cận khác của thuật giải khảo sát gắn, dựa trên các tiên đề trong vật lý cổ điển của Newton (định luật cân bằng chuyển động). Phương pháp mô phỏng có hai loại chính: động học phân tử (MD) và tối thiểu hóa năng lượng. Phương pháp động học phân tử là một công cụ mạnh và có ngưỡng rộng các ứng dụng. Tuy nhiên phương pháp này gặp một số hạn chế
trong định hướng mô phỏng vị trí ligand và có các hàng rào năng lượng cao. Một cách khắc phục hạn chế này là bắt đầu mô phỏng từ những vị trí ligand đã được khảo sát trước. Ứng dụng của mô phỏng chủ yếu tập trung vào phân tích tương tác protein-ligand. Các phương pháp tối thiểu hóa năng lượng ít được sử dụng nhất trong khảo sát gắn vì phương pháp này chỉđạt đến tối thiểu hóa năng lượng cục bộ. Tuy nhiên các phương pháp khảo sát gắn đề cập ở trên thường sử dụng phương pháp tối thiểu hóa năng lượng như một phương pháp hỗ trợ.
¾ Các phần mềm khảo sát gắn
Có nhiều chương trình khảo sát gắn đã và đang được xây dựng và phát triển. Tuy nhiên, thật khó để so sánh hiệu quả của các chương trình này. Autodock, Gold, FlexX là các chương trình khảo sát gắn phổ biến nhất, tiếp đến là chương trình Dock và ICM.
Đồ thị thống kê tình hình sử dụng của các chương trình khảo sát gắn năm 2006 (hình 1.13) cho thấy chương trình Autodock đang được sử dụng rất phổ biến trên thế giới. Thế mạnh của chương trình Autodock so với các chương trình khác là cho phép khảo sát sự gắn kết giữa phân tử ligand và thụ thể có xét đến độ linh động trong cấu hình. Autodock gồm hai chương trình chính: Autodock và Autogrid. Trong đó, Autodock thực hiện khảo sát gắn ligand trên mạng lưới đã được thiết lập thông qua Autogrid. Autodock sử dụng thuật giải di truyền của Lamarck, tuy nhiên cũng bao gồm thuật giải tìm kiếm Monte Carlo và thuật giải di truyền cổ điển nhưng không hiệu quả như thuật giải di truyền của Lamarck. Chương trình Autodock sử dụng hàm điểm dựa trên trường lực, cụ thể là trường lực Amber.
Chương trình đồ họa AutoDockTool (ADT) hỗ trợ rất tốt cho Autodock từ việc chuẩn bị dữ liệu đến xử lý kết quả. Ngoài ra, việc cho người dùng sử dụng miễn phí trong công tác nghiên cứu cũng góp phần vào mức độ phổ biến của Autodock. Cho
đến nay, Autodock đã được phân phối hơn 4000 bản cho các tổ chức chính phủ và phi chính phủ trên toàn thế giới. [21]
Hình 1.13: Thống kê tình hình sử dụng các chương trình khảo sát gắn (2006)
¾ Dựđoán epitope tế bào B bằng phương pháp khảo sát gắn[15]
Kháng thể có những đặc tính đặc biệt thích hợp cho việc nghiên cứu in silico
chẳng hạn kháng thể có khả năng nhận diện và gắn chính xác các phân tử giống nhau. Phần chịu trách nhiệm chính cho việc gắn kháng nguyên là phần linh động Fv (variable fragment) của vùng Fab (antigen-binding fragment). Cấu trúc gấp cuộn của kháng thể được bảo tồn cao, do đó tạo lợi thế cho kỹ thuật mô hình hóa tương
đồng để thu nhận cấu trúc không gian ba chiều từ thông tin cơ sở dữ liệu. Vị trí gắn kháng nguyên được xây dựng trên sườn cấu trúc vững chắc của phiến β, bao gồm 6
vùng siêu biến (CDR). Các vùng CDR này có thể nhận diện được do đó việc khảo sát khả năng gắn của kháng thể với ligand trở nên thuận lợi hơn.
Các ứng dụng khảo sát gắn kháng thể - epitope ngày một tăng cùng với sự
cải tiến dần trong phương pháp. Ban đầu, các nghiên cứu khảo sát gắn chỉ ở mức
đơn giản là xem xét kháng nguyên và peptide có cấu trúc cố định (rigid-docking). Sau đó, phân tử peptide được xem xét các liên kết xoay trong cấu trúc (flexible- docking) và hiện nay phân tử kháng thể cũng đã có thể khảo sát với các liên kết xoay. Tuy nhiên, khảo sát gắn luôn cho ra nhiều kết quả khác nhau và kết quả chính xác không phải lúc nào cũng nằm ở phần tốt nhất từ khảo sát gắn. Do đó, quá trình khảo sát gắn cần phải được chọn lựa phương pháp cũng như hàm tính điểm thích hợp; và cấu trúc kháng thể, peptide phải có chất lượng tốt.
Hiện nay, các nghiên cứu khảo sát gắn để dự đoán eptope tế bào B vẫn còn rất nhiều hạn chế do các epitope này phần lớn là không liên tục. Các phương pháp khảo sát gắn vẫn đang được phát triển để giải quyết tốt hơn vấn đề này. Các nghiên cứu khảo sát gắn peptide – kháng thể trên virus cúm A hiện nay chủ yếu được thực hiện trên hai protein là HA và NA.