Phƣơng pháp giải trình tự NGS – nền tảng của GBS

Một phần của tài liệu (LUẬN văn THẠC sĩ) xác định các gen alen đặc thù liên quan đến sự phát triển bộ rễ của các giống lúa việt nam (Trang 37 - 41)

Phần 2 Tổng quan tài liệu

2.3. Nguyên lý và ứng dụng của GBS

2.3.1. Phƣơng pháp giải trình tự NGS – nền tảng của GBS

Phƣơng pháp phân tích kiểu gen dựa vào giải trình tự GBS (Genotyping By Sequencing) đƣợc phát triển từ phƣơng pháp giải trình tự NGS (Next Generation Sequencing). Dựa vào việc giải trình tự nhiều mẫu trong cùng một lần và so sánh cùng lúc nhiều genome để xác định sự khác nhau về kiểu gen giữa các mẫu giống dựa trên sự đa hình của genome đã phân tích.

Những hạn chế về trang thiết bị và giá thành cao của phƣơng pháp giải trình tự Sanger đã hạn chế sự phát triển của các nghiên cứu giải trình tự tồn bộ genome ở các loài sinh vật. Nhất là khi nhu cầu giải trình tự khơng chỉ dừng lại ở một giống/lồi mơ hình mà mong muốn đi sâu nghiên cứu và can thiệp vào genome của chúng ngày càng mạnh mẽ. Phƣơng pháp NGS (Next – Generation – Sequencing) ra đời đã mang đến hai cải tiến lớn nhất trong lĩnh vực giải trình tự ADN hiện nay: 1) sự gia tăng đáng kể số lƣợng mẫu đƣợc đƣa vào trong cùng một lần giải trình tự; 2) chi phí cho mỗi base đƣợc giải trình tự ngày càng giảm. Phƣơng pháp này dựa trên kỹ thuật giải trình tự song song, đồng thời giải trình tự của nhiều đoạn ADN và phân tích hình ảnh với hiệu suất làm việc có thể từ hàng trăm triệu đến hàng tỷ nucleotide trong một lần chạy (Shendure and Ji, 2008). Hiện nay, hệ thống giải trình tự bằng cơng nghệ NGS có thể đƣợc chia thành hai loại đƣợc gọi là “second-generation” và “third-generation”, sự phân chia này chủ yếu dựa trên nguồn gốc ADN khuôn đƣợc cố định trƣớc khi đƣa vào giải trình tự, và thế hệ nhân dịng của ADN đƣợc đọc trình tự (Niedringhaus et al., 2011). Các phƣơng pháp giải trình tự NGS có thể đƣợc tiến hành thơng qua nhiều hệ thống đọc trình tự khác nhau nhƣng chúng đều tuân theo một mơ hình tƣơng tự cho việc chuẩn bị ADN khuôn, cả hai đầu của đoạn ADN đã đƣợc cắt ngẫu nhiên đều đƣợc gắn với với các đoạn tiếp hợp (adapter). Các đoạn phân tử ADN đã đƣợc khuếch đại đƣợc cố định trên một bề mặt sau đó sẽ tạo ra hàng tỷ đoạn trình tự trong cùng một thời gian. Giải trình tự đƣợc thực hiện lặp đi lặp lại nhiều lần trên các đoạn tổng hợp từ 1 hoặc 1 chuỗi nucleotide thơng qua việc xác định các tín hiệu phát ra bằng các máy đọc trình tự (Metzker, 2010).

Giải trình tự bằng phƣơng pháp NGS lần đầu tiên đƣợc thực hiện thành công trên hệ thống máy Roche 454 GS20, và sau đó đƣợc thay thế bằng hệ thống máy Roche 454 FLX Titanium (Margulies et al., 2005). Hệ thống máy Roche 454 FLX Titaniumcó khả năng tổng hợp khoảng 450 Mbp các trình tự trong thời gian 10 giờ hoạt động, chiều dài trình tự đƣợc đọc có thể lên đến 600 bp với độ chính xác tới 99,99% (Thudi et al., 2012). Phƣơng pháp giải trình NGS đƣợc thực hiện bằng Illumina (Bentley et al., 2008) có chiều dài trình tự đƣợc đọc ngắn hơn, chỉ từ 50 đến 150 bp, nhƣng lƣợng tổng trình tự đầu vào có thể lên đến 1.5 Gbp đến 600 Gbp, tùy từng hệ thống máy móc sử dụng. Hai hệ thống máy giải trình tự Illumina hay đƣợc sử dụng nhất hiện nay là Illumina MiSeq và HiSeq2500. Trong phƣơng pháp Illumina, chu kỳ giải trình tự đƣợc thực hiện

dựa trên sự tổng hợp các đoạn trình tự có khn mẫu từ các dịng ADN đơn lẻ đƣợc khuếch đại nhờ phản ứng PCR. Phản ứng khuếch đại PCR đƣợc thực hiện sử dụng một quy trình khuếch đại có chứa pha rắn đƣợc gọi là “bridge amplification” (Fedurco et al., 2006), phƣơng pháp này có thể tổng hợp đƣợc 1000 bản sao từ một phân tử ADN khuôn ban đầu, các bản sao này sẽ đƣợc phân thành một nhóm. Việc giải trình tự đƣợc thực hiện nhờ các deoxyribonucleotide kết thúc đƣợc đánh dấu bằng thuốc nhuộm huỳnh quang (có màu khác nhau cho từng loại) trong hàng loạt các chu kỳ tổng hợp ADN mà mỗi lần đoạn trình tự đƣợc tổng hợp chỉ hơn kém nhau 1 nucleotide, việc xác định các tín hiệu huỳnh quang và sự phân tách giữa các nhãn huỳnh quang cùng với các gốc hóa học tại đầu 3’ của mạch ADN đƣợc tổng hợp cho phép chu kỳ tiếp theo tiếp tục đƣợc thực hiện bình thƣờng. Bên cạnh dịng máy giải trình tự Illumina, chúng ta có thể kể đến một số hệ thống giải trình tự khác nhƣ: Life Technologies 5500xl (Thudi

et al., 2012), Iron Torrent PCM (Rothberg et al., 2011).

Hiện nay, phƣơng pháp giải trình tự NGS, đặc biệt là phƣơng pháp giải trình tự NGS ở thế hệ thứ hai (second- generation sequencing) đƣợc sử dụng phổ biến và ứng dụng vào nhiều nghiên cứu khác nhau, từ những nghiên cứu hệ gen ở sinh vật tiền nhân và sinh vật nhân chuẩn đến các nghiên cứu so sánh, khám phá sự biến đổi của các của các vùng gen đích, gen chức năng; từ các nghiên cứu các yếu tố phiên mã và các “small RNAs” đến các nghiên cứu epigenetics, nghiên cứu cấu trúc nhiễm sắc thể, các nghiên cứu phân loại lồi thơng qua các nghiên cứu metagenomics.

Có thể hình dung q trình giải trình tự theo phƣơng pháp NGS theo sơ đồ tại Hình 2.5.

ADN tổng số trong genome đƣợc cắt thành từng đoạn bởi các enzyme giới hạn, tại đầu của các điểm cắt sẽ đƣợc gắn với các bộ tiếp nối (adapter) phù hợp có gắn mã vạch, sau đó hai đầu có adapter của các đoạn oligo này đƣợc cố định lên một bề mặt đƣợc gọi là “Cluster Station”; phản ứng PCR sẽ đƣợc thực hiện trực tiếp trên các “Cluster Station” nhờ sự có mặt của các kênh dẫn nucleotide tự do trên bề mặt “Cluster Station” và enzyme ADN polymerase; mỗi một sợi ADN sẽ là mạch khuôn để tổng hợp nên một cụm các phân tử ADN có cùng nguồn gốc, mỗi một cụm có khoảng 1 triệu các bản sao từ sợ ADN ban đầu, số lƣợng này đủ để xác định chính xác tín hiệu thu đƣợc trong q trình giải trình tự.

Chú thích: (a) các bƣớc giải trình tự theo phƣơng pháp của Sanger: ADN đƣợc cắt sau đó đƣợc biến nạp vào vetor plasmid và đƣợc chuyển vào E. coli để nhân bản. Mỗi dòng ADN đƣợc clone sẽ đƣợc khuếch đại bằng phản ứng PCR, sau đó mỗi một dịng ADN sẽ đƣợc đƣa vào một chu trình giải trình tự riêng biệt. (b) các bƣớc giải trình tự theo phƣơng pháp NGS: ADN sẽ đƣợc cắt, sau đó đƣợc gắn các bộ tiếp nối, và đƣợc gắn lên một mảng có các điểm tiếp nối giữ chặt đoạn ADN, sau đó quá trình nhân bản ADN đƣợc diễn ra trên mảng cùng một lúc các đoạn ADN khác nhau, sử dụng nu bổ sung có gắn thuốc nhuộm

huỳnh quang, sản phẩm nhân bản đƣợc đƣa vào máy quét để xác định trình tự của đoạn ADN gốc.

Hình 2.5. Các bƣớc giải trình tự theo phƣơng pháp Sanger (a) và NGS (b)

Nguồn: Shendure and Ji (2008) Các nucleotide tự do đƣợc đánh dấu huỳnh quang bởi 4 màu khác nhau đặc trƣng cho bốn loại nucleotide khác nhau. Tại đầu 3’ nhóm –OH bị chặn hóa học khiến cho mạch ADN mới tổng hợp đƣợc sẽ dừng lại tại các nucleotide đƣợc đánh dấu. Máy nhận biết tín hiệu huỳnh quang bằng laze sẽ chịu trách nhiệm

nhận biết màu sắc của mỗi nucleotide mới đƣợc gắn vào trong quá trình tổng hợp, hình ảnh nhận biết sẽ đƣợc ghi nhận, sau mỗi lần ghi nhận hình ảnh nhóm – OH tại đầu 3’ sẽ đƣợc loại bỏ chặn hóa học để q trình tổng hợp đƣợc tiếp tục. Hàng loạt các bƣớc này sẽ đƣợc lặp lại mang tính chu kỳ, tùy theo chế độ đƣợc cài đặt bởi ngƣời điều khiển máy mà mỗi chu kỳ có thể đọc đƣợc khoảng 25-35 bp. Mức độ chính xác và chất lƣợng của các chuỗi trình tự đƣợc đọc sẽ đƣợc đánh giá, các chuỗi trình tự có chất lƣợng kém sẽ bị loại bỏ (Mardis, 2008).

Một phần của tài liệu (LUẬN văn THẠC sĩ) xác định các gen alen đặc thù liên quan đến sự phát triển bộ rễ của các giống lúa việt nam (Trang 37 - 41)

Tải bản đầy đủ (PDF)

(168 trang)