3.1. KẾT QUẢ
3.1.9. Dự đoán vùng xuyên màng qua các chƣơng trình tin sinh học
Trong cấu trúc của protein, đặc biệt là các protein màng, vùng xuyên màng là một đặc điểm cấu tạo rất hấp dẫn cho các nghiên cứu vì chúng khơng những cho biết cách thức protein liên kết với màng mà cịn mơ tả đƣợc mức độ xuyên màng của từng protein đó. Các vùng xuyên màng của các protein màng thƣờng có cấu trúc α-helix hoặc β-sheet đối song song. Tuy nhiên cấu trúc β-sheet thƣờng không xuất hiện nhiều và chủ yếu chỉ xuất hiện ở màng ti thể. Cấu trúc chủ đạo vẫn là α-helix với khoảng 20 đến 25 acid amin kị nƣớc trên một vòng xoắn. Điều này đƣợc sử dụng làm nền tảng cho những nguyên lí hoạt động của các chƣơng trình dự đốn. Việc nghiên cứu vị trí, số lƣợng các vùng xuyên màng của protein có đóng góp lớn giúp các nhà hóa sinh học trong việc thiết kế thuốc hay kháng thể…. Từ đó rất nhiều chƣơng trình dự đốn về vùng xuyên màng của các protein đã ra đời nhƣng thƣờng đƣợc sử dụng nhất với độ chính xác khá cao là SOSUI, Phobius và TMHMM.
A
B
Hình 19. Hình ảnh minh họa kết quả dự đoán vùng xuyên màng của chƣơng trình TMHMM
A. Một protein đƣợc dự đốn khơng có vùng xuyên màng B. Một protein đƣợc dự đốn có vùng xun màng
A
B
C D
Hình 20. Hình ảnh minh họa kết quả dự đốn vùng xun màng của chƣơng trình SOSUI
A. Một protein đƣợc dự đốn có vùng xun màng
B. Một protein đƣợc dự đốn khơng có vùng xun màng
A. Protein có vùng xuyên màng B. Protein khơng có vùng xun màng
Hình 21. Hình ảnh minh họa kết quả dự đoán vùng xuyên màng của chƣơng trình Phobius
Mỗi chƣơng trình tin sinh học sử dụng các thuật tốn đƣợc phát triển riêng để dự đoán các vùng xuyên màng. Cơ sở mà những chƣơng trình này sử dụng chính là trình tự bậc một của các protein. Từ các trình tự acid amin cùng với dữ liệu về tính chất ƣa nƣớc, kị nƣớc của từng acid amin các chƣơng trình tin sinh sẽ đƣa ra các dự đốn về những vị trí có thể tạo xoắn α-helix, cấu trúc chủ đạo của các vùng xuyên màng. Vào năm 2009, cũng bằng việc sử dụng ba chƣơng trình này Markus Sällman Almén và cộng sự đã xác định đƣợc 14284 protein (theo Phobius), 14343 protein (theo SOSUI), 12233 protein (theo TMHMM) có ít nhất 1 vùng xuyên màng từ 69731 trình tự protein lấy từ chƣơng trình giải trình tự hệ gene ngƣời. Trong đó tác giả cũng nhận đƣợc 11211 (16,1%) protein nằm trong kết quả của cả ba chƣơng trình [9].
Trong nghiên cứu này, khi so sánh kết quả nhận diện của SOSUI, Phobius, TMHMM thì có 469 (38,6%) protein đƣợc cả ba chƣơng trình dự đốn là có vùng
xun màng. Sự chênh lệch kết quả trong cả ba chƣơng trình cũng khá nhỏ, điều này đã làm tăng tính chính xác của kết quả thu đƣợc (Hình 22). Nhóm các protein cịn lại, bao gồm những protein mà cả ba chƣơng trình đều dự đốn khơng có vùng xuyên màng, có thể thuộc nhóm các protein bám màng hay neo với màng thông qua một cầu nối khác. Chúng cũng vẫn có thể là protein xuyên màng với cấu trúc β- barrel vì các chƣơng trình dự đốn trên khơng đƣợc thiết kế để nhận ra cấu trúc này.
Bảng 8. Kết quả dự đốn vùng xun màng (TMD)
(Kí hiệu “∩” chỉ số kết quả trùng nhau của các chƣơng trình)
Chƣơng trình Số lƣợng protein có TMD SOSUI 598 Phobius 581 TMHMM 517 SOSUI ∩ Phobius 525 SOSUI ∩ TMHMM 490 Phobius ∩ TMHMM 488 (SOSUI ∩ Phobius) ∩ TMHMM 469
Hình 22. Hình ảnh so sánh kết quả dự đốn TMD giữa các chƣơng trình tin sinh học
581 598
Bảng 9. Kết quả dự đoán số lƣợng protein theo số vùng xuyên màng (TMD) Số lƣợng TMD SOSUI Phobius TMHMM 1 152 322 255 2 196 41 58 3 38 17 12 4 27 24 20B 5 21 4 10 6 34 14 34 7 25 50 36 8 20 22 14 9 9 7 4 10 13 6 11 > 10 63 74 63
Tuy sự tƣơng đồng về kết quả dự đốn có vùng xun màng của SOSUI, Phobius và TMHMM là khá cao nhƣng số lƣợng các vùng xuyên màng đƣợc dự đoán trên từng protein lại rất khác biệt giữa ba chƣơng trình. Phobius dự đốn có tới 322 protein chỉ có một vùng xuyên màng, trong khi kết quả của SOSUI chỉ là 152 protein – tức là chƣa bằng một nửa. Điều tƣơng tự cũng xuất hiện trong kết quả với những protein đƣợc dự đốn có hai vùng xun màng. Tuy vậy, với những protein có nhiều vùng xuyên màng thì kết quả của các chƣơng trình lại khơng sai khác nhiều. Đặc biệt, số lƣợng protein có trên 10 TMD là khá lớn, chiếm xấp xỉ 5% trong toàn bộ dữ liệu protein thu đƣợc theo kết quả của cả ba chƣơng trình dự đốn (Hình 23). Nhƣ vậy, có thể thấy rằng trong huyết thanh có khá nhiều protein xuyên màng có cấu trúc phức tạp vì số lƣợng α-helix của chúng tƣơng đối lớn.
Hình 23. Hình ảnh so sánh kết quả dự đốn số lƣợng TMD của các chƣơng trình tin sinh học