Chương 3 KẾT QUẢ NGHIÊN CỨU
3.3. Sàng lọc các đa hình nucleotide đơn (SNP) liên quan đến tính trạng
3.3.4. Xác định chỉ thị SNP và tương quan giữa các contig chứa SNP với gen
MHC
Từ các kết quả sàng lọc SNP và kết quả chú giải protein liên quan đến tính trạng tăng trưởng ở tôm sú (chỉ các contig chứa SNP được chọn để chú giải gen chức năng, sau đó so sánh trình tự của contig chứa SNP với trình tự của gen chức năng tương ứng để xác định loại nucleotide thay thế), chúng tôi đã xác định được vị trí SNP trên contig83953 và contig260347 ở tôm sú tăng trưởng nhanh như sau: SNP T C (Bảng 3.11) tại vị trí nucleotide thứ 20 trên mạch bổ sung với contig83953, tức là SNP A G trên mạch gốc contig83953 và SNP G A (Bảng 3.11) tại vị trí nucleotide thứ 19 trên contig260347. Ký pháp HGVS (Human Genome Variation Society) của hai SNP trên đây được thể hiện ở Bảng 3.12.
Bảng 3.12. Kết quả xác định SNP trên contig83953 và contig260347
Tên Contig Ký pháp HGVS của SNP tương ứng
Nucleotide thay thế
Nucleotide
tham chiếu Ghi chú
Contig83953 Contig83953:g.20T>C C T Trình tự bổ sung G A Trình tự mạch gốc Contig260347 Contig260347:g.19G>A A G Mạch gốc
Để xác định tương quan giữa các contig83953 và contig260347 chứa SNP với gen mã hóa protein MHC liên quan đến tăng trưởng ở tôm sú, chúng tôi đã tiến hành dịch mã các trình tự nucleotide của contig83953 và contig260347 thành các chuỗi amino acid tương ứng, sau đó so sánh với trình tự amino acid của gen mã hóa protein MHC. Kết quả dịch mã với 6 khung đọc (http://web.expasy.org) cho thấy:
này mã hóa chuỗi amino acid được dịch mã bắt đầu từ vị trí nucleotide thứ 2 theo chiều 5’3’ của mạch bổ sung với trình tự của contig83953; (2) Chuỗi amino acid được mã hóa bởi contig260347 thuộc khung đọc 5’3’
Frame 3 (+3). Khung đọc này mã hóa chuỗi amino acid được dịch mã bắt đầu từ vị trí nucleotide thứ 3 theo chiều 5’3’ của mạch gốc.
Kết quả dịch mã được trình bày ở Bảng 3.13.
Bảng 3.13. Trình tự amino acid tương ứng của contig83953 và contig260347
Tên contig Trình tự amino acid tương ứng (http://web.expasy.org) Tổng số amino acid của chuỗi Contig83953 AERAQTLANSAEKKQKNFDKIISEWKLKIDDL 32 Contig260347 RLEEAEMetQIESLNVKNLHLEKTKMetRA 30
Để kiểm tra sự chính xác của các trình tự amino acid, chúng tơi đã tiến hành Blast (Basic Local Alignment Search Tool) bằng công cụ Uniprot (http://www.uniprot.org) với cả hai loại dữ liệu đầu vào là trình tự amino acid và trình tự nucleotide của contig83953 và contig260347. Kết quả thu được từ hai loại dữ liệu đầu vào hoàn toàn trùng khớp nhau về tỷ lệ tương đồng giữa chuỗi amino acid của contig83953 và contig260347 so với protein MHC ở các loài khác nhau (Bảng 3.14 và Bảng 3.15).
Kết quả ở Bảng 3.14 cho thấy: trình tự amino acid tương ứng của contig83953 đạt tỷ lệ tương đồng cao nhất (90,6%) với trình tự amino acid của protein MHCa ở lồi tơm Penaeus japonicus, tỷ lệ tương đồng với MHC1 ở hai lồi tơm khác là Penaeus monodon và Litopenaeus vannamei cũng tương đối cao (đều
đạt 87,5%). Trong khi đó, kết quả ở Bảng 3.15 cho thấy: trình tự amino acid tương ứng của contig260347 đạt tỷ lệ tương đồng cao nhất (96,2%) với trình tự amino acid của protein MHC ở cả ba lồi tơm Penaeus monodon, Penaeus japonicus và
Bảng 3.14. Các tỷ lệ tương đồng cao nhất (top 5) giữa contig83953 với protein MHC STT GenBank ID Protein MHC (lồi tương ứng) Tỷ lệ tương đồng (%) Vị trí amino acid trên protein MHC 1 F8WR03 Myosin heavy chain type a
(Penaeus japonicus)
90,6% 1431-1462
2 K4Q111 Myosin heavy chain type 1 (Litopenaeus vannamei)
87,5% 1431-1462
3 K4Q4N8 Myosin heavy chain type 1 (Penaeus monodon)
87,5% 1432-1463
4 Q6XGZ8 Slow muscle myosin S1 heavy chain (Homarus americanus)
83,9% 30-60
5 B0W188 Myosin heavy chain (Culex quinquefasciatus)
80,6% 1399-1429
Bảng 3.15. Các tỷ lệ tương đồng cao nhất (top 5) giữa contig260347 với protein MHC STT GeneBank ID Protein MHC (loài tương ứng) Tỷ lệ tương đồng (%) Vị trí amino acid trên protein MHC 1 K4Q4N8 Myosin heavy chain type 1
(Penaeus monodon)
96,2 1396-1425
2 F8WR03 Myosin heavy chain type a (Penaeus japonicus)
96,2 1395-1420
3 K4Q111 Myosin heavy chain type 1 (Litopenaeus vannamei)
96,2 1395-1420
4 K4Q2Y1 Myosin heavy chain type 2 (Penaeus monodon)
76,0 1396-1418
5 K4Q2S1 Myosin heavy chain type 2 (Litopenaeus vannamei)
Như vậy, với việc sử dụng hệ gen tham chiếu tạm thời của tôm sú P. monodon được thiết lập de novo để sàng lọc SNP, nghiên cứu của chúng tôi đã xác
định được hai SNP ở nhóm tơm sú tăng trưởng nhanh.
3.3.5. Xác định vùng tương đồng giữa contig chứa SNP so với gen mã hóa protein MHC, xác định codon chứa SNP và vị trí tương ứng của chỉ thị SNP trên gen MHC
Bằng cách so sánh các chuỗi trình tự (nucleotide, amino acid) của contig83953 và contig260347 với trình tự của gen MHCa và MHC1 để xác định vùng tương đồng giữa chúng, chúng tôi đã xác định được vị trí phân vùng chức năng trên gen MHCa và MHC1 phù hợp với trình tự các contig83953 và contig260347 chứa SNP, đồng thời xác định chính xác codon chứa SNP cũng như sự biến đổi của amino acid có thể xảy ra do sự xuất hiện SNP (Hình 3.8, Hình 3.9, Hình 3.10, Hình 3.11).
Kết quả ở Hình 3.8 và Hình 3.9 cho thấy: vùng tương đồng về amino acid của contig83953 ở tôm sú P. Monodon trong nghiên cứu này so với protein MHCa ở tôm he Nhật bản P. Japonicus nằm trong khoảng vị trí amino acid 1431 - 1462; vị trí nucleotide tương đồng từ 4408 - 4505. Vùng tương đồng này thuộc phân vùng chức năng LMM (light meromyosin) trên phân tử protein myosin.
Kết quả ở Hình 3.10 và Hình 3.11 cho thấy: vùng tương đồng về amino acid của contig260347 ở tôm sú P. monodon trong nghiên cứu này so với protein MHC1 ở tôm sú trên genBank nằm trong khoảng vị trí amino acid 1396 - 1422; vị trí nucleotide tương đồng từ 4302 - 4379. Vùng tương đồng này cũng thuộc phân vùng chức năng LMM trên phân tử protein myosin.
Hình 3.9. Vùng tương đồng trình tự amino acid giữa contig83953 của tôm sú P. monodon với protein MHCa ở tôm he Nhật Bản P. japonicus
(vị trí amino acid 1431 - 1462) LMM S2 Contig 83953 Contig 83953 Contig 83953
Hình 3.8. Vùng tương đồng nucleotide giữa mạch bổ sung của contig83953 của tơm sú P. monodon so với trình tự gen MHCa ở tôm he
Nhật Bản P. japonicus (vị trí nucleotide 4408 - 4505).
Contig 83953
Contig 83953
Hình 3.10. Vùng tương đồng nucleotide giữa contig260347 so với trình tự gen MHC1 ở tơm sú P. monodon (vị trí nucleotide 4302 - 4379)
Contig260347
Contig260347
Hình 3.11. Vùng tương đồng trình tự amino acid giữa contig260347 với protein MHC1 ở tơm sú P. monodon (vị trí amino acid 1396 - 1422)
LMM S2
Contig260347
Các kết quả chỉ ra trên Hình 3.8, Hình 3.9, Hình 3.10, Hình 3.11 cho thấy rõ các codon chứa các SNP. Cụ thể như sau:
SNP T C tại vị trí nucleotide thứ 20 trên mạch bổ sung với contig83953 [Contig83953:g.20T>C], tức là SNP A G trên mạch gốc contig83953 được xác định là vị trí SNP A4486G trên gen MHCa (Hình 3.8). SNP này là nucleotide thứ 3 trong bộ ba (codon) mã hóa amino acid, làm biến đổi codon
AAA thành AAG. Cả hai codon này đều mã hóa amino acid Lysine (K) với
vị trí amino acid tương ứng trên protein MHCa là K1456K (Hình 3.9). Nói cách khác, SNP này khơng làm thay đổi amino acid tương ứng.
SNP G A tại vị trí nucleotide thứ 19 trên contig260347 [Contig260347:g.19G>A] được xác định là vị trí SNP G4320A trên gen
MHC1 (Hình 3.10). SNP này là nucleotide thứ 2 trong bộ ba mã hóa amino acid, làm biến đổi codon GGA (mã hóa amino acid Glycine - G) thành GAA (mã hóa amino acid Glutamic - E). Vị trí amino acid tương ứng trên protein MHC1 là G1401E (Hình 3.11).
3.4. SÀNG LỌC CHỈ THỊ SNP G>A Ở TÔM SÚ TĂNG TRƯỞNG NHANH BẰNG PHƯƠNG PHÁP KASP
Kết quả kiểm tra trên 40 mẫu tôm sú cái tăng trưởng nhanh thế hệ G1 (Hình 3.12) cho thấy: hầu hết các mẫu tơm sú tăng trưởng nhanh (28/40 mẫu) chứa SNP dạng đồng hợp tử A:A (màu xanh dương); chỉ có 2/40 mẫu chứa SNP dạng đồng hợp tử G:G (màu đỏ); còn lại là 10/40 mẫu chứa SNP dạng dị hợp tử G:A (màu xanh lá cây).
Kết quả này cho thấy: việc sử dụng các mồi xuôi và mồi ngược được thiết kế đặc hiệu với trình tự DNA chứa SNP G>A, trong đó trình tự mồi xi đặc hiệu với alen kiểu dại được gắn HEX-tail (màu đỏ) và trình tự mồi xi đặc hiệu với alen đột biến được gắn FAM-tail (màu xanh dương) đã phát hiện thấy đột biến G4320A thuộc gen MHC1 có mặt ở 38 trong số 40 mẫu tơm sú được kiểm tra (chiếm 95%). Trong số 38 cá thể tôm sú mang đột biến G4320A, có 28 cá thể mang kiểu gen đồng hợp tử (tương ứng với 28 tín hiệu huỳnh quang màu xanh dương) và có 10 cá
thể mang kiểu gen dị hợp tử (tương ứng với 10 tín hiệu huỳnh quang màu xanh lá cây) ở Hình 3.12.
Hình 3.12. Kết quả phân tích tín hiệu huỳnh quang trong kỹ thuật KASP sàng lọc chỉ thị SNP G>A thuộc gen MHC1 ở tôm sú tăng trưởng nhanh
- Các chấm màu xanh dương thể hiện các mẫu tơm sú tăng trưởng nhanh có đồng hợp tử A:A (28/40 mẫu);
- Các chấm màu đỏ thể hiện các mẫu tơm tăng trưởng nhanh có đồng hợp tử G:G 2/40 mẫu;
- Các chấm màu xanh lá cây thể hiện các mẫu tôm tăng trưởng nhanh có dị hợp tử G:A 10/40 mẫu;
- Các chấm màu đen là tín hiệu huỳnh quang bị nhiễu;
- Các mẫu đối chứng khơng có tín hiệu huỳnh quang (khơng xuất hiện trên hình).