3.3. Chú giải chức năng hệ phiên mã từ từ mô cơ và mô gan tụy tơm sú
Penaeus monodon
Q trình chú giải chức năng bằng BLASTX cho kết quả 1.950 (11,20%) unigene được tìm thấy trên cơ sở dữ liệu Nr-NCBI với tham số E-value 1e-6, như vậy có đến 15.456 unigene (88,80%) khơng tìm thấy tương đồng trên cơ sở dữ liệu NCBI với tham số E-value như trên. Độ dài của các unigene được chú giải chức năng trên Nr-NCBI cũng tập trung chủ yếu ở những unigene có độ dài lớn hơn 500 bp (Hình 3.4 A), trong đó những unigene khơng có kết quả BLASTX lại tập trung ở những unigene có độ dài dưới 500 bp (Hình 3.4 B).
A B
Hình 3.4. Phân bố độ dài trên tồn bộ unigene có kết quả BLASTX (A) và phân bố độ dài trên tồn bộ unigene khơng có kết quả BLASTX (B).
Vì khơng có hệ gen tham chiếu tơm sú nên sẽ có một lượng lớn unigene không thể chú giải chức năng. Số lượng unigene không được chú giải trong nghiên cứu của chúng tơi có thể là những trình tự bản phiên mã (transcript) mới và đặc trưng với
Penaeus monodon. Thêm vào đó, cịn có một lý do khác giải thích cho tỷ lệ chú giải
chức năng thấp là do các trình tự unigene sau khi lắp ráp có độ dài khá ngắn. Bên cạnh đó, trong nhóm giáp xác chỉ có duy nhất lồi mơ hình Daphnia pulex, loài
được sử dụng trong nghiên cứu độc học sinh thái, là có hệ gen tham chiếu [36]. Tỷ lệ chú giải các unigene trong hệ phiên mã tinh sạch của chúng tôi trên cơ sở dữ liệu Nr-NCBI bằng công cụ BLASTX (11,20%) là thấp hơn so với những dự án lắp ráp de novo với những lồi khơng phải là lồi mơ hình trong nhóm giáp xác. Trong nghiên cứu phân tích hệ phiên mã trên đối tượng cua Portunus trituberculatus của Jianjian Lv và cộng sự (2014) tỷ lệ chú giải trên Nr-NCBI là
18,04% [47]. Trong quá trình lắp ráp de novo hệ phiên mã các tác giả đã sử dụng các trình tự đọc từ nhiều loại mơ khác nhau của Portunus trituberculatus như mô gốc mắt, mô mang, mô ruột, mô gan tụy và mô cơ. Đối với nghiên cứu của Sookruksawong và cộng sự (2013) trên đối tượng tôm thẻ chân trắng Litopenaeus
vannamei, kết quả chú giải hệ phiên mã tơm lắp ráp từ các trình tự đọc từ mơ máu
trong đáp ứng miễn dịch đối với virus gây hội chứng Taura (Taura syndrome virus) trên cơ sỡ dữ liệu Nr-NCBI là 20% [64]. Trong điều kiện đáp ứng miễn dịch với virus, mức độ biểu hiện của các gen sẽ tăng cường, các gen đã được nghiên cứu và công bố trong các đối tượng tôm chủ yếu liên quan đến hệ miễn dịch nên kết quả chú giải sẽ cao hơn.
Trong nghiên cứu của Nguyễn Giang Thu và cộng sự (2015), các tác giả đã lắp ráp de novo hệ phiên mã tơm sú P. monodon từ các trình tự đọc thu được từ mơ máu, mô gan tụy, mô cơ với tỷ lệ chú giải trên Nr-NCBI là 25,4% [7]. Trong quá trình tiền xử lý bằng cơng cụ Trimmomatic, các trình tự đọc có điểm số QC > 20 được giữ lại. Bên cạnh đó trong quá trình tinh sạch hệ phiên mã, giá trị FPKM cutoff = 1 được sử dụng. Do vậy đã thu được kết quả tỷ lệ chú giải cao trên Nr- NCBI.
Trong nghiên cứu của chúng tơi, trong q trìnhxây dựng hệ phiên mã từ mơ cơ và mô gan tụy tôm sú P. monodon, tiền xử lý bằng công cụ Trimmomatic, chúng tơi sử dụng các trình tự đọc có chất lượng cao (QC > 30) để lắp ráp de novo hệ
phiên mã. Với mục đích sàng lọc các unigene thuộc các nhóm gen/gen giả định liên quan tới tính trạng tăng trưởng ở P. monodon đặc trưng cho mô cơ và mô gan tụy, trong quá trình tinh sạch hệ phiên mã giá trị FPKM cutoff = 5 được sử dụng để giữ lại những bản phiên mã có mức độ biểu hiện cao. Do vậy, số lượng unigene trong hệ phiên mã tinh sạch của chúng tơi thu được ít hơn, dẫn đến tỷ lệ chú giải thấp hơn trên Nr-NCBI.
Phân bố E-value của các kết quả chú giải chức năng trong Nr-NCBI của các unigene trong hệ phiên mã tinh sạch chúng tơi xây dựng cho thấy 59,03% có giá trị trong khoảng 0 –> 1.0e-30 và 45,66% số lượng trình tự có điểm số E-value có độ tin cậy nhất (E-value < 10-45) (Hình 3.5 A). Những kết quả như vậy đã khẳng định giá trị và độ tin cậy của kết quả lắp ráp de novo hệ phiên mã của chúng tôi. Bên
độ tương đồng (similarity) lớn hơn 60% và 30,17% số lượng trình tự có độ tương đồng lớn hơn 80% (Hình 3.5 B). Sau khi tìm kiếm tương đồng bằng BLASTX, chúng tơi so sánh trình tự unigene sau khi lắp ráp xuất hiện trong những loài nào trên cơ sở dữ liệu và thống kê phân bố loài trong bộ kết quả tin cậy nhất (E-value thấp nhất) và được thể hiện như trong hình 3.5 C . Kết quả cho thấy có 145 (7,32%) unigene cho kết quả chú giải tương đồng với loài Daphnia magna, trong đó 124 (6,26%), 110 (5,55%), 94 (4,75%), 87 (4,39%), 45 (2,27%), 42 (2,12%) unigene cho kết quả tương đồng với Penaeus monodon, Litopenaeus vannamei, Limulus polyphemus, Zootermopsis nevadensis, Procambarus clarkii, Fenneropenaeus chinensis (Hình 3.5C).
A
B
C