Duy trì Chu kỳ Số chu kỳ
94oC 94oC 66oC 72oC 1 2 phút 20 giây 30 giây 2 phút - 94 o C 65oC 72oC 1 20 giây 30 giây 2 phút - 94 o C 64oC 72oC 1 20 giây 30 giây 2 phút - 94 o C 63oC 72oC 1 20 giây 30 giây 2 phút - 94 o C 62oC 72oC 1 20 giây 30 giây 2 phút - 94 o C 61oC 72oC 1 20 giây 30 giây 2 phút - 94 o C 60oC 72oC 1 20 giây 30 giây 2 phút - 94 o C 59oC 72oC 1 20 giây 30 giây 2 phút - 94 o C 58oC 72oC 1 20 giây 30 giây 2 phút - 94 o C 57oC 72oC 1 20 giây 30 giây 2 phút - 94 o C 56oC 72oC 25 20 giây 30 giây 2 phút 60oC - 72 o C 1 30 giây 2 phút 4oC - 72 o C 1 ∞ 2 phút
Thành phần của phản ứng khuếch đại chọn lọc:
Sản phẩm của phản ứng khuếch đại tiền chọn lọc 3 µL
Mồi Mse-CTT (5 µM) 1 µL
Mồi gắn huỳnh quang EcoRI-ACG JOE (1 µM) 1 µL
AFLP core mix 15 µL
Tổng thể tích 20 µL
Phản ứng được thực hiện bằng máy PCR với chu trình nhiệt được trình bày ở Bảng 2.7, bảo quản các sản phẩm của phản ứng khuếch đại chọn lọc ở 2-6oC nếu chưa sử dụng ngay cho bước thí nghiệm tiếp theo.
2.2.7. Phân tích kết quả AFLP trên máy xác định trình tự tự động sử dụng điện di mao quản và phần mềm phân tích đoạn
Sản phẩm của phản ứng khuếch đại chọn lọc được xác định bằng máy phân tích trình tự sử dụng điện di mao quản ABI3100 (ABI3100 Genetic Analyzer) của hãng Applied Biosystems. Thành phần dung dịch đệm nạp mẫu như sau:
Deionized formamide 1,25 µL
Blue dextran / 25 mM EDTA loading solution 0,25 µL GeneScan-500 [ROX] size standard 0,5 µL Sau khi nạp mẫu và chọn chế độ phân tích, thiết bị vận hành hoàn tồn tự động. Kết quả phân tích được xử lý trên máy tính bằng phần mềm GeneMapper® Software Version 4.1 AFLP® System Analysis (Invitrogen). Dữ liệu được xuất ra ở hai dạng: sơ đồ các peak (electropherogram) và bảng dữ liệu về sự xuất hiện/vắng mặt của các băng phân tích. Trong ma trận nhị phân, giá trị 1 xuất hiện có nghĩa là có băng sản phẩm PCR, giá trị 0 xuất hiện là khơng có băng. Các alen được đếm thông qua giá trị 1 hoặc 0. Dữ liệu được phân tích bằng việc sử dụng phối hợp các phần mềm PhyLip v3.6a3 Inference Package (Felsenstein et al., 1989), 100 giá trị
bootstrap được tạo ra sử dụng phần mềm SEQBOOT và 100 cây bootstrap được xây dựng. Cây phát sinh chủng loại được dựng bằng phần mềm MEGA (Kumar et al.,
2001). Kỹ thuật AFLP được thực hiện lặp lại ít nhất 2 lần đối với mỗi mẫu để kiểm chứng kết quả phân tích.
2.2.8. Kỹ thuật GBS phân tích hệ gen tơm sú
(1) Xây dựng thư viện GBS
Kỹ thuật GBS được thực hiện theo các bước sau (Elshire et al., 2011): Lựa chọn enzyme cắt hạn chế và thiết kế các adaptor
Enzyme cắt hạn chế (RE) được sử dụng là ApeKI. Đây là một endonuclease có khả năng nhận biết trình tự gồm 5 bp (GCWGC, trong đó W là A hoặc T) và cắt tạo ra một đầu so le 5’ gồm 3 bp.
Có 2 dạng adaptor khác nhau được sử dụng. Một barcode adaptor có cấu trúc đầu tận cùng gồm đoạn trình tự ngắn chứa từ 4 đến 8 bp ở đầu 3’ của sợi phía trên và một đoạn so le gồm 3 bp ở đầu 5’ của sợi phía dưới - bổ sung với đầu đính được tạo ra trên DNA khi cắt bởi enzyme ApeKI (CWG). Adaptor thứ hai là common
adaptor chỉ có một đầu đính phù hợp với enzyme ApeKI. Các adaptor được thiết kế sao cho vị trí nhận biết của enzyme ApeKI khơng xuất hiện ở trình tự adaptor bất kỳ và khơng bắt cặp bổ sung trở lại sau khi gắn với DNA hệ gen.
Chuẩn bị dung dịch các adaptor
Các oligonucleotide sợi đôi của mỗi barcode adaptor và common adaptor được pha loãng riêng biệt trong dung dịch TE (mỗi loại 50 µL) và được biến tính trong một thiết bị chu trình nhiệt (với chu trình nhiệt như sau: 95oC, 2 phút; giảm xuống 25oC với tốc độ giảm 0,1oC/giây; 25oC, 30 phút; giữ ở 4oC); Sau đó, các bardode adaptor và common adaptor được định lượng bằng phương pháp sử dụng chất nhuộm màu có đặc tính xen cài vào giữa sợi (PicoGreen®; Invitrogen); Pha lỗng
Hình 2.2. Trình tự các adaptor sử dụng trong xây dựng thư viện GBS
(Nguồn: Elshire et al., 2011)
Vị trí chèn DNA
Trình tự
barcode Đầu nhơ ApeKI
loại dung dịch adaptor với nhau theo tỷ lệ 1:1; Lấy 6 µL (∼ 0,06 pmol mỗi adaptor) hỗn hợp adaptor chia đều vào khay PCR 96 giếng và làm khô.
Cắt DNA tổng số bằng enzyme cắt hạn chế ApeKI và gắn với adaptor
Các mẫu DNA tổng số (đã được tách chiết và tinh sạch, pha loãng đến nồng độ 100ng/10µL) được đưa lên các giếng riêng biệt có chứa sẵn adaptor, làm khô giếng một lần nữa. Các mẫu (DNA tổng số trong các giếng chứa các adaptor) được cắt bằng enzyme ApeKI trong 2 giờ ở nhiệt độ 75oC, tổng thể tích dung dịch phản ứng là 20µL. Thành phần phản ứng như sau:
Các adaptor được gắn vào các đầu đính của các đoạn DNA (sau khi cắt) bằng cách bổ sung 30 µL dung dịch chứa 1,66x ligase buffer với ATP và T4 ligase (640 đơn vị đầu đính) vào mỗi giếng; ủ mẫu ở nhiệt độ 22oC trong 60 phút và làm nóng đến 65o
C trong 30 phút để bất hoạt enzyme T4 ligase. Các mẫu DNA sau khi cắt và gắn adaptor được tinh sạch bằng QIAquick PCR Purification Kit.
Phản ứng khuếch đại DNA
Các đoạn DNA tinh sạch từ các mẫu được trộn lại với nhau với tỷ lệ tương đương. Khoảng 100 ng sản phẩm DNA trộn từ các mẫu được sử dụng làm khuôn để tạo thư viện với cặp mồi primer1 và primer2 bắt cặp bổ sung với barcode adaptor và common adaptor: Primer1: (5’-3’)AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTA CACGACGCTCTTCCGATCT Primer2: (5’-3’)CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCC TGCTGAACCGCTCTTCCGATCT Genomic DNA (100ng / µL) 2 µL NEB Buffer 3 (10X) 2 µL ApeKI (4U/µL) 1 µL dH20 15 µL Tổng thể tích 20 µL
Thành phần phản ứng PCR:
DNA 10 µL
NEB 2x Taq Master Mix 25 µL
PCR Primer Mix (12.5 pmol/µL mỗi loại) 2 µL
dH2O 13 µL
Tổng thể tích 50 µL
Chu trình nhiệt của phản ứng PCR như sau: 72oC trong 5 phút; 98oC trong 30 giây; sau đó là 18 chu kỳ: 98oC trong 30 giây, 65oC trong 30 giây, 72oC trong 30 giây, cuối cùng là bước kéo dài chuỗi ở 72oC trong 5 phút.
Tập hợp các đoạn DNA được tạo ra từ một genome sau khi cắt bởi enzyme cắt hạn chế, gắn với adaptor (trong đó có một adaptor chứa barcode) và được khuếch đại tạo thành một “thư viện”. Sản phẩm PCR có kích thước từ 300-500 bp được thu nhận bằng phương pháp cắt gel và tinh sạch bằng QIAquick PCR Purification Kit. Kích thước và độ sạch của thư viện DNA sau đó được đánh giá trên Bioanalyzer 2100 (Agilent Technology). Thư viện DNA được làm giàu và xác định trình tự cả
Hình 2.3. Các bước xây dựng thư viện GBS
(Nguồn: Elshire et al., 2011) 1. Chuẩn bị mẫu DNA và các adaptor 2. Cắt DNA bằng ApeKI 3. Gắn adaptor 4. Trộn các mẫu và tinh sạch 5. PCR 6. Tinh sạch sản phẩm PCR 7. Đánh giá kích thước các phân đoạn
hai chiều (pair-end) trên hệ thống Illumina NextSeq®500, theo hướng dẫn của nhà sản xuất, sử dụng NextSeq 500/550 High Output v2 Kit (300 chu kỳ).
(2) Xử lý dữ liệu GBS, thiết lập hệ gen tham chiếu tạm thời và xác định SNP
Dữ liệu GBS được xử lý và phân tích để phát hiện các SNP dựa theo phương pháp GBS-SNP-CROP (GBS SNP-Calling Reference Optional Pipeline) được mô tả bởi Melo et al. (2016). Dữ liệu thô được chuyển thành định dạng Fastq bằng công cụ BCL2FASTQ 2.1. Chất lượng trình tự được đánh giá bằng FastQC. Trình tự adaptor được loại bỏ bằng phần mềm Trimmomatic software v.0.3.6 (Bolger et al., 2014). Trình tự của từng mẫu được tách ra trên cơ sở nhận biết trình tự barcode sử dụng cơng cụ In-house script do nhóm nghiên cứu tự phát triển. Do hệ gen tôm sú chưa được cơng bố trình tự tham chiếu nên chúng tôi đã sử dụng các mẫu lắp ráp de
novo để tạo trình tự tham chiếu tạm thời theo phương pháp được mô tả bởi Melo et al. (2016), sử dụng các công cụ PEAR v.0.96 và USEARCH v.8.0.162 (Zhang et al., 2014; Edgar, 2010). Sau khi có trình tự tham chiếu, trình tự của các mẫu tơm sú
được so sánh với trình tự tham chiếu bằng BWA-MEM v.0.7 (Li et al., 2009a). Dữ liệu SNP được truy xuất bằng công cụ SAMtools v.1.2 (Li et al., 2009b). SNP được xác định khi gióng hàng các contig và sự sai khác nucleotide được phát hiện trên ít nhất bốn trình tự. Chỉ các SNP hai allen đáp ứng mức độ lặp lại như trên mới được xác định là SNP (Melo et al., 2016; Nguyễn Minh Thành et al., 2015; Kumar,
2014).
2.2.9. Chú giải các đoạn trình tự và xác định gen liên quan
Công cụ BlastX (E-value < 1e-6) được sử dụng để so sánh các contig với cơ sở dữ liệu NCBI non-redundant (Nr-NCBI) nhằm tìm kiếm sự tương đồng giữa các contig cần phân tích với các trình tự protein trên Ngân hàng cơ sở dữ liệu NCBI (National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov/) (Jung et al., 2011). Kết quả tìm kiếm được truy xuất dưới dạng danh sách các gen chức năng với các thông tin về geneID, protein được mã hóa và tên lồi tương ứng. Danh sách này được sử dụng để xác định gen mã hóa protein liên quan đến tăng trưởng ở tôm sú
bằng cách đối chiếu với 22 loại protein đã biết liên quan đến tăng trưởng trong họ giáp xác (Bảng 2.8).
Bảng 2.8. Danh sách 22 loại protein liên quan đến tính trạng tăng trưởng ở họ giáp xác (Nguồn: Jung et al., 2013)
STT Tên protein STT Tên protein
1 5-Hydroxytryptamine receptor (5-HT) 12 Translin-associated factor X (TRAX) 2 Alpha-amylase 13 Candidate growth genes effect on
moulting
3 Cathepsin L 14 Actin
4 Cyclophilin (Cyps) 15 Crustacean hyperglycaemic hormone (CHH)
5 Fatty acid-binding protein (FANTs) 16 Eyestalk factors
6 Fibrillarin 17 Moult inhibiting hormone (MIH) 7 Glyceradehyde-3-phosphate
dehydrogenase (GAPDH)
18 Candidate muscle build-up or degradation genes involved in moulting
8 Growth hormone and insulin-like growth factor
19 Methyl farnesoate (MF) and
farneosoic acid O-methyltransferase (FAMeT)
9 Myostatin and growth differentiation factor 8/11
20 Heat shock proteins (HSPs)
10 Signal transducer and activator of transcription (STAT)
21 Myosin heavy chain
11 Secreted protein acidic and rich in cysteine (SPARC)
22 Ubiquitin
2.2.10. Xác định trình tự amino acid của contig và đánh giá mức độ tương đồng với gen mã hóa protein quan tâm đồng với gen mã hóa protein quan tâm
Cơng cụ Expasy (http://web.expasy.org) được sử dụng để xác định trình tự amino acid tương ứng với trình tự nucleotide của contig quan tâm bằng cách kiểm tra toàn bộ 6 khung đọc mở 5’3’Frame 1 (+1), 5’3’ Frame 2 (+2), 5’3’ Frame 3 (+3), 3’5’ Frame 1 (-1) , 3’5’ Frame 2 (-2), 3’5’ Frame 3 (-3). Sáu khung đọc mở này tạo ra 6 kiểu trình tự amino acid khác nhau đối với mỗi contig, tiếp tục sử dụng công cụ Uniprot (http://www.uniprot.org) để chọn ra kiểu trình tự amino acid có tỷ lệ tương đồng cao nhất so với trình tự amino acid của protein quan tâm.
2.2.11. Phương pháp KASP
Phương pháp KASP sử dụng bộ Kit của Hãng LGC Genomics. Các bước tiến hành theo quy trình của Hãng (https://www.lgcgroup.com/kasp).
Chỉ thị phân tử SNP liên quan tới tính trạng tăng trưởng nhanh ở tơm sú thuộc gen mã hóa Myosin heavy chain type 1 được sử dụng để kiểm tra trên 40 cá thể tôm sú tăng trưởng nhanh thuộc thế hệ G1 bằng kỹ thuật KASP. Các mồi xuôi và mồi ngược được thiết kế đặc hiệu với trình tự DNA chứa SNP này. Nồng độ DNA mỗi mẫu sử dụng là 50ng. Thí nghiệm bố trí 2 ống đối chứng âm để so sánh.
Thành phần hỗn hợp phản ứng
DNA template (nồng độ 50 ng) 5 µL
2x Master mix 5 µL
Primer mix 0,14 µL
Tổng thể tích 10 µL
(Ở ống đối chứng âm, DNA template được thay thế bằng nước). Chu kỳ nhiệt của phản ứng KASP như sau: