Giải trình tự, kết nối các đoạn trình tự và thiết lập hệ gen tham chiếu tạm

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu đa hình hệ gen các dòng tôm sú (penaeus monodon) việt nam nhằm phục vụ công tác chọn giống tôm (Trang 99 - 102)

Chương 3 KẾT QUẢ NGHIÊN CỨU

3.3. Sàng lọc các đa hình nucleotide đơn (SNP) liên quan đến tính trạng

3.3.1. Giải trình tự, kết nối các đoạn trình tự và thiết lập hệ gen tham chiếu tạm

tạm thời

* Các thư viện DNA được tạo ra từ hai nhóm tơm sú tăng trưởng nhanh và tăng trưởng chậm được đánh giá bằng điện di tự động trước khi tiến hành giải trình tự, sử dụng các chỉ thị ngưỡng dưới và ngưỡng trên có kích thước lần lượt là 35bp và 10038bp (đây là các thơng số kích thước mặc định phù hợp với thiết bị điện di tự động 2100 Bioanalyzer của Agilent Technology). Kết quả đánh giá thư viện được thể hiện ở Hình 3.4.

Hình 3.4. Kết quả điện di tự động bằng máy 2100 Bioanalyzer (Agilent Technology) đánh giá thư viện DNA

- Vùng biểu thị cho thư viện DNA cần đánh giá nằm giữa chỉ thị ngưỡng dưới (kích thước 35 bp) và chỉ thị ngưỡng trên (kích thước 10038 bp). - Mồi kết đơi (primer dimer) có tín hiệu huỳnh quang thấp (khơng đáng kể).

Cườ n g đ h u ỳn h q u an g 10038 bp Size Standard Primer Dimer 35 bp Size Standard Thời gian 198 bp

Hình 3.4 cho thấy: Chỉ thị ngưỡng dưới được thể hiện bằng đỉnh 35 bp Size Standard, chỉ thị ngưỡng trên được thể hiện bằng đỉnh 10038 bp Size Standard. Vùng biểu thị cho thư viện DNA cần đánh giá nằm giữa hai ngưỡng này với cường độ huỳnh quang cao.

Mồi kết đôi (primer dimer) độ dài 78 bp có cường độ huỳnh quang thấp (gần ngang đường nền) nên có thể xem như khơng xuất hiện mồi kết đôi hoặc xuất hiện với nồng độ rất thấp.

Kích thước trung bình của thư viện là 208 bp. Như vậy, về cơ bản thư viện DNA phù hợp cho việc giải trình tự bằng NGS Illumina NexSeq500.

* Kết quả giải trình tự hệ gen tơm sú thuộc hai nhóm tơm tăng trưởng nhanh và tôm tăng trưởng chậm trên hệ thống Illumina NextSeq® 500 (với độ sâu giải trình tự 50x) đã thu được 145.836.644 đoạn trình tự thơ (raw reads); trong số đó có 120.438.739 (chiếm tỷ lệ 83%) đoạn trình tự mang barcode và điểm cắt của ApeKI. Sau khi tinh sạch loại bỏ các đoạn adaptor và các đoạn trình tự chất lượng thấp, thu được 102.505.713 (70,2%) đoạn trình tự có chất lượng tốt để sử dụng cho việc kết nối contig và thiết lập hệ gen tham chiếu tạm thời, với dung lượng dữ liệu khoảng 100 GB.

Từ 102.505.713 đoạn trình tự, sau khi kết nối (với độ sâu bao phủ, read depth, ≥ 10) đã thu được 510.076 contig với sự phân bố kích thước các contig được thể hiện ở Hình 3.5. Các contig có chiều dài 70 - 150 bp chiếm số lượng nhiều nhất (211.389), tiếp đến là các contig có chiều dài 150 - 300 bp và ít nhất là các contig có chiều dài 450 - 547 bp. Các contig kích thước ngắn dưới 70 bp bị loại bỏ.

Do chưa có hệ gen tham chiếu đối với lồi tơm sú Penaeus monodon nên

trong nghiên cứu này, từ dữ liệu giải trình tự các đoạn DNA có chất lượng tốt nhất, hệ gen tham chiếu tạm thời của tôm sú đã được thiết lập de novo, với kích thước 76.299.742 bp (Bảng 3.10). Hệ gen tham chiếu tạm thời này được sử dụng để sàng lọc các SNP và xác định chỉ thị SNP liên quan đến tính trạng tăng trưởng ở tơm sú.

Bảng 3.10. Tóm tắt kết quả xử lý dữ liệu giải trình tự GBS

Chỉ số phân tích Giá trị

Độ sâu giải trình tự 50x

Dung lượng dữ liệu (Gb) ~ 100

Số lượng đoạn trình tự thơ (raw reads) 145.836.644 Số lượng đoạn trình tự (read) sử dụng kết nối contig 102.505.713

Tổng số contig 510.076

Kích thước hệ gen tham chiếu tạm thời (bp) 76.229.742

Hình 3.5. Phân bố độ dài các contig sau tinh sạch

Các contig có kích thước 70 - 150 bp chiếm số lượng nhiều nhất (211.389), ít nhất là các contig có kích thước >450 bp, loại bỏ các contig

kích thước ngắn < 70bp. Số lượ ng c on tig

Theo tác giả You et al., 2010, kích thước hệ gen tơm sú có dung lượng khoảng 2.17×109

bp. Như vậy với hệ gen tham chiếu tạm thời được thiết lập de novo có kích thước 76.299.742 bp trong nghiên cứu này thì tỷ lệ bao phủ giải trình

tự đạt được khoảng 3,5%.

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu đa hình hệ gen các dòng tôm sú (penaeus monodon) việt nam nhằm phục vụ công tác chọn giống tôm (Trang 99 - 102)

Tải bản đầy đủ (PDF)

(193 trang)