Thu phổ và nhận diện protein/peptide bằng phần mềm Mascot v1

Một phần của tài liệu Xây dựng ngân hàng dữ liệu hệ protein huyết thanh người việt nam để đối phó chẩn đoán bệnh đái tháo đường type 2 và ung thư (Trang 42 - 49)

1.2.T ối ưu hóa các phương pháp xử lý và phân tích mẫu

1.2.3.3.Thu phổ và nhận diện protein/peptide bằng phần mềm Mascot v1

Phổ 1DnanoLC-ESI-MS/MS và 2DnanoLC-ESI-MS/MS thu được bao gồm thông tin về phổ TOF MS và phổ MS/MS của mỗi peptide đã được phát hiện trong hỗn hợp. Các thông

42 tin này được tìm kiếm trên cơ sở dữ liệu NCBInr thông qua chương trình với các thông số sau (Hình 15).

Hình 15. Các thông số của phần mềm Mascot v1.8

- Cơ sở dữ liệu: NCBInr. - Phân loại: homo sapiens

- Cải biến cốđịnh: carbamindomethyl (C)

- Cải biến biến đổi: oxy hóa (methionine) xảy ra trong quá trình thủy phân - Sai số peptide:0,5 Da

- Sai số MS/MS: 0,5 Da

- Trạng thái tích điện của peptide: +2 hoặc +3 - Enzyme: trypsin

Với các thông số trên, phần mềm sẽ nhanh chóng cung cấp các peptide có thể thu được từ mỗi protein trong cơ sở dữ liệu, dựa trên cơ sở thông tin về trình tự amino acid của mỗi protein và đặc tính cắt đặc hiệu của trypsin, được gọi là các phổ TOF MS lý thuyết. Cũng từ thông tin về trình tự amino acid của mỗi peptide này phần mềm MASCOT v1.8 cũng cung

43 cấp thông tin về phổ MS/MS lý thuyết của mỗi peptide (thông tin khối của mỗi ion a, b, c, x, y, z…) nhờ thuật toán phân mảnh (Hình 16).

Hình 16. Sơđồ phân mảnh lý thuyết của ion pepide với trình tự tương ứng

Với quy tắc như vậy chúng tôi đã thu được rất nhiều mảnh peptide trên mỗi mẫu nghiên cứu. Các mảnh peptide sau đó sẽđược bắt cặp với các trình tự protein trên cơ sở dữ liệu và từđó chúng tôi sẽ xác định được sự có mặt của các protein trong mẫu huyết thanh mà chúng tôi quan tâm.

Ví dụ trong các mẫu phân tích trên, số peptide đã được phát hiện rất lớn khoảng từ 2000 đến 6000 mảnh peptide/ mẫu được giải trình tự. Dưới sự hỗ trợ của phần mềm Mascot v1.8 thì 215 protein trong tất cả 8 phân đoạn tiến hành cắt và thủy phân bằng enzyme trypsin đã được nhận dạng. Kết quả nhận dạng bằng phần mềm Mascot được minh họa trên Hình 17.

Hình 17. Hình ảnh minh hoạ kết quả nhận diện protein bằng phần mềm Mascot v1.8 thu

44

Thu ph MS/MS

Toàn bộ phổ MS/MS thu được qua phần mềm BioAnalyst QS v1.1 (Applied Biosystems) được tìm kiếm tổng hợp bằng công cụ Mascot v1.8 trên cơ sở dữ liệu NCBI. So sánh sự bắt gặp giá trị các mảnh ion thu được trong phổ MS/MS thực nghiệm và lý thuyết (với sai số± 0.5Da) cho phép xác định được trình tự peptide tương ứng. Mức độ tương đồng này được thể hiện qua giá trịđiểm số (score), với các sai số trên phần mềm tựđộng tính toán cho biết điểm số nhỏ nhất để trình tự peptid thu được có độ tin cậy >99.95%.

Qui trình thu phổ MS và MS/MS của các protein/peptide được mình họa trên Hình 18.

Hình 18. Qui trình thu phổ MS và MS/MS

Hiu qu ca lp chương trình IDA

Chương trình IDA cho phép thu tín hiệu độc lập, do đó các hỗn hợp ion sẽđược phân tách và các ion sẽ được thu tín hiệu riêng rẽ. Thông tin về phổ khối của các ion cũng như quá trình phân mảnh của chúng sẽđược ghi nhận tại detector. Phổ khối MS và MS/MS cho biết thông tin đầy đủ của ion sẽđược phân mảnh như thế nào và trình tự của nó sẽđược giải ra sao.

Dưới đây là một số minh họa về quá trình thu phổ của một số phân mảnh của một số protein đã được nhận diện (Hình 19, Hình 20, Hình 21).

45

Hình 19. A. Phổ TOF; B. Phổ MS/MS của Ig Mu heavy chain disease.

Hình 20. Phổ MS/MS của mảnh ion peptide với trình tự FYIASAFR đã được giải. Trình tự

46

Hình 21. Phổ MS/MS của mảnh ion peptide với trình tự LGGHLDAK đã được giải. Trình tự

này thuộc protein haptoglobin alpha 2.

Các kết quả trên cho thấy khả năng phân mảnh và giải trình tự peptide rất tốt, điều này cho thấy việc cài đặt các thông số của chương trình IDA thu tín hiệu độc lập là khá tối ưu. Kết quả này sẽđược ứng dụng cho việc phân tích và nhận diện các protein/proteome huyết thanh người.

Nhn din proteome huyết thanh

Với các phương pháp đã thiết lập, hệ protein huyết thanh người được cúng tôi phân tích, nhận diện và xác định với khoảng trên 4000 protein trong tổng số hơn 7000 peptide được nhận dạng với 7 triệu trình tự protein của tất cả các loài trên cơ sở dữ liệu NCBI. Điểm số nhỏ nhất để nhận diện một protein là 35. Các protein khác nhau có điểm số (trong kết quả tìm kiếm bằng Mascot) đảm bảo sự tương đồng giữa các phổ thực nghiệm và lý thuyết, mức độ đáng tin cậy của kết quả nhận dạng với mức ý nghĩa p<0,05. Hình 21 biểu thị mức độ phân bố của các protein theo điểm số. Tại điểm số từ 450 đến 480 có nhiều protein nhất với khoảng 25 protein. (adsbygoogle = window.adsbygoogle || []).push({});

Sau khi hoàn thành quá trình tìm kiếm, máy tính sẽđưa ra một file dữ liệu dạng HTML. File này sẽ liệt kê toàn bộ các kết quả có ý nghĩa, cùng với điểm số (score) dựa trên xác suất bắt gặp một trình tự peptide tương đồng đặc trưng cho protein đã được đăng ký trên cơ sở dữ liệu. Trong quá trình tìm kiếm, số lượng protein được phần mềm đưa ra trong khoảng 900 ± 100 protein nhưng sau khi tiến hành xác định, nhận dạng, so sánh và đối chiếu chúng tôi loại bớt những đoạn protein trùng lặp (các mảnh khác nhau của cùng một protein) và những protein không có độ tin cậy cao. Trong các mẫu phân tích, số peptide đã được phát hiện rất lớn khoảng từ 2000 đến 7000 mảnh peptide/mẫu được làm MS/MS.

47

Hình 22. Điểm số của các protein theo thuật toán Mowse với mức ý nghĩa P<0,05

Kết quả cũng cho thấy, các protein đã được nhận diện từ có sự phù hợp về hầu hết các thành phần cơ bản trong huyết thanh, từ các loại protein lưu chuyển chung nhất, đến các tác nhân đông máu, bổ thể, miễn dịch, protein gắn kết, cấu trúc, vận chuyển, enzyme, các chất ức chế protease, các loại cytokine, thụ thể, các protein vận chuyển màng, các protein giả thiết (hypothetical protein)... nhưđã được mô tả bằng cách tiếp cận tương tự.

Phân tích giải khối lượng các protein trong huyết thanh, chúng tôi nhận thấy biểu đồ phân bố của các protein này chủ yếu tập trung trong khoảng <200 kDa. Các protein có khối lượng lớn (> 200 kDa) thường là các protein màng (Hình 23).

Hình 23. Biểu đồ phân bố khối lượng của các protein huyết thanh

Một điểm đáng chú ý là khi nghiên cứu hệ protein huyết thanh bằng LC-MS/MS cho thấy khả năng phân tích và nhận diện khá toàn diện không chỉ về thành phần, mà còn cả những biến đổi của nhiều loại protein. Cũng chính vì vậy, những nghiên cứu với cách tiếp cận tương tự có thể giúp tìm kiếm những ứng viên protein marker đích thực giải thích các cơ chế bệnh sinh, phát hiện và chẩn đoán sớm.

48

Một phần của tài liệu Xây dựng ngân hàng dữ liệu hệ protein huyết thanh người việt nam để đối phó chẩn đoán bệnh đái tháo đường type 2 và ung thư (Trang 42 - 49)