Chương 2. VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.2. Phương pháp nghiên cứu
2.2.8. Kỹ thuật GBS phân tích hệ gen tôm sú
Kỹ thuật GBS được thực hiện theo các bước sau (Elshire et al., 2011):
Lựa chọn enzyme cắt hạn chế và thiết kế các adaptor
Enzyme cắt hạn chế (RE) được sử dụng là ApeKI. Đây là một endonuclease có khả năng nhận biết trình tự gồm 5 bp (GCWGC, trong đó W là A hoặc T) và cắt tạo ra một đầu so le 5’ gồm 3 bp.
Có 2 dạng adaptor khác nhau được sử dụng. Một barcode adaptor có cấu trúc đầu tận cùng gồm đoạn trình tự ngắn chứa từ 4 đến 8 bp ở đầu 3’ của sợi phía trên và một đoạn so le gồm 3 bp ở đầu 5’ của sợi phía dưới - bổ sung với đầu đính được tạo ra trên DNA khi cắt bởi enzyme ApeKI (CWG). Adaptor thứ hai là common adaptor chỉ có một đầu đính phù hợp với enzyme ApeKI. Các adaptor được thiết kế sao cho vị trí nhận biết của enzyme ApeKI không xuất hiện ở trình tự adaptor bất kỳ và không bắt cặp bổ sung trở lại sau khi gắn với DNA hệ gen.
Chuẩn bị dung dịch các adaptor
Các oligonucleotide sợi đôi của mỗi barcode adaptor và common adaptor được pha loóng riờng biệt trong dung dịch TE (mỗi loại 50 àL) và được biến tớnh trong một thiết bị chu trình nhiệt (với chu trình nhiệt như sau: 95oC, 2 phút; giảm xuống 25oC với tốc độ giảm 0,1oC/giây; 25oC, 30 phút; giữ ở 4oC); Sau đó, các bardode adaptor và common adaptor được định lượng bằng phương pháp sử dụng chất nhuộm màu có đặc tính xen cài vào giữa sợi (PicoGreen®; Invitrogen); Pha loãng cỏc dung dịch adaptor trong nước đến nồng độ 0,6 ng/àL (∼02 pmol/àL); Trộn hai
Hình 2.2. Trình tự các adaptor sử dụng trong xây dựng thư viện GBS (Nguồn: Elshire et al., 2011)
Vị trí chèn DNA
Trình tự
barcode Đầu nhô
ApeKI
loại dung dịch adaptor với nhau theo tỷ lệ 1:1; Lấy 6 àL (∼ 0,06 pmol mỗi adaptor) hỗn hợp adaptor chia đều vào khay PCR 96 giếng và làm khô.
Cắt DNA tổng số bằng enzyme cắt hạn chế ApeKI và gắn với adaptor
Các mẫu DNA tổng số (đã được tách chiết và tinh sạch, pha loãng đến nồng độ 100ng/10àL) được đưa lờn cỏc giếng riờng biệt cú chứa sẵn adaptor, làm khụ giếng một lần nữa. Các mẫu (DNA tổng số trong các giếng chứa các adaptor) được cắt bằng enzyme ApeKI trong 2 giờ ở nhiệt độ 75oC, tổng thể tích dung dịch phản ứng là 20àL. Thành phần phản ứng như sau:
Các adaptor được gắn vào các đầu đính của các đoạn DNA (sau khi cắt) bằng cỏch bổ sung 30 àL dung dịch chứa 1,66x ligase buffer với ATP và T4 ligase (640 đơn vị đầu đính) vào mỗi giếng; ủ mẫu ở nhiệt độ 22oC trong 60 phút và làm nóng đến 65oC trong 30 phút để bất hoạt enzyme T4 ligase. Các mẫu DNA sau khi cắt và gắn adaptor được tinh sạch bằng QIAquick PCR Purification Kit.
Phản ứng khuếch đại DNA
Các đoạn DNA tinh sạch từ các mẫu được trộn lại với nhau với tỷ lệ tương đương. Khoảng 100 ng sản phẩm DNA trộn từ các mẫu được sử dụng làm khuôn để tạo thư viện với cặp mồi primer1 và primer2 bắt cặp bổ sung với barcode adaptor và common adaptor:
Primer1: (5’-3’)AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTA CACGACGCTCTTCCGATCT
Primer2: (5’-3’)CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCC TGCTGAACCGCTCTTCCGATCT
Genomic DNA (100ng / àL) 2 àL NEB Buffer 3 (10X) 2 àL
ApeKI (4U/àL) 1 àL
dH20 15 àL
Tổng thể tớch 20 àL
Thành phần phản ứng PCR:
DNA 10 àL
NEB 2x Taq Master Mix 25 àL
PCR Primer Mix (12.5 pmol/àL mỗi loại) 2 àL
dH2O 13 àL
Tổng thể tớch 50 àL
Chu trình nhiệt của phản ứng PCR như sau: 72oC trong 5 phút; 98oC trong 30 giây; sau đó là 18 chu kỳ: 98oC trong 30 giây, 65oC trong 30 giây, 72oC trong 30 giây, cuối cùng là bước kéo dài chuỗi ở 72oC trong 5 phút.
Tập hợp các đoạn DNA được tạo ra từ một genome sau khi cắt bởi enzyme cắt hạn chế, gắn với adaptor (trong đó có một adaptor chứa barcode) và được khuếch đại tạo thành một “thư viện”. Sản phẩm PCR có kích thước từ 300-500 bp được thu nhận bằng phương pháp cắt gel và tinh sạch bằng QIAquick PCR Purification Kit.
Kích thước và độ sạch của thư viện DNA sau đó được đánh giá trên Bioanalyzer 2100 (Agilent Technology). Thư viện DNA được làm giàu và xác định trình tự cả
Hình 2.3. Các bước xây dựng thư viện GBS (Nguồn: Elshire et al., 2011)
1. Chuẩn bị mẫu DNA và các adaptor
2. Cắt DNA bằng ApeKI 3. Gắn adaptor
4. Trộn các mẫu và tinh sạch
5. PCR
6. Tinh sạch sản phẩm PCR
7. Đánh giá kích thước các phân
đoạn
hai chiều (pair-end) trên hệ thống Illumina NextSeq®500, theo hướng dẫn của nhà sản xuất, sử dụng NextSeq 500/550 High Output v2 Kit (300 chu kỳ).
(2) Xử lý dữ liệu GBS, thiết lập hệ gen tham chiếu tạm thời và xác định SNP Dữ liệu GBS được xử lý và phân tích để phát hiện các SNP dựa theo phương pháp GBS-SNP-CROP (GBS SNP-Calling Reference Optional Pipeline) được mô tả bởi Melo et al. (2016). Dữ liệu thô được chuyển thành định dạng Fastq bằng công cụ BCL2FASTQ 2.1. Chất lượng trình tự được đánh giá bằng FastQC. Trình tự adaptor được loại bỏ bằng phần mềm Trimmomatic software v.0.3.6 (Bolger et al., 2014). Trình tự của từng mẫu được tách ra trên cơ sở nhận biết trình tự barcode sử dụng công cụ In-house script do nhóm nghiên cứu tự phát triển. Do hệ gen tôm sú chưa được công bố trình tự tham chiếu nên chúng tôi đã sử dụng các mẫu lắp ráp de novo để tạo trình tự tham chiếu tạm thời theo phương pháp được mô tả bởi Melo et al. (2016), sử dụng các công cụ PEAR v.0.96 và USEARCH v.8.0.162 (Zhang et al., 2014; Edgar, 2010). Sau khi có trình tự tham chiếu, trình tự của các mẫu tôm sú được so sánh với trình tự tham chiếu bằng BWA-MEM v.0.7 (Li et al., 2009a). Dữ liệu SNP được truy xuất bằng công cụ SAMtools v.1.2 (Li et al., 2009b). SNP được xác định khi gióng hàng các contig và sự sai khác nucleotide được phát hiện trên ít nhất bốn trình tự. Chỉ các SNP hai allen đáp ứng mức độ lặp lại như trên mới được xác định là SNP (Melo et al., 2016; Nguyễn Minh Thành et al., 2015; Kumar, 2014).