CHƢƠNG I TỔNG QUAN TÀI LIỆU
1.6 Công nghệ giải trìnhtự thế hệ mới
Các kỹ thuật đọc trình tự gen đã trở nên đơn giản và nhanh hơn nhờ sự ứng dụng huỳnh quang phân tích tự động[29]. Các công nghệ đọc trình tự mới luôn hƣớng tới làm tăng dung lƣợng (throughput), làm giảm thời gian và giá thành.
Giải trình tự thế hệ mới (NGS: next generation sequencing)là một bƣớc tiến vƣợt bậc về công nghệ đọc trình tự, cho phép đọc đƣợc từ 8Gb - 600Gb tức là cho phép đọc trình tự nguyên bộ gene còn đƣợc gọi là đọc trình tự bộ gene (whole genome sequencing).
Nguyên lý đọc trình tự gen thế hệ mới: theo 2 nguyên lý chính. Nguyên lý thứ nhất đọc trình tự bằng tổng hợp (sequencing by synthesis, SBS) đã
đƣợc các thế hệ máy Roche 454, Ion Torrent và Illumina sử dụng. Nguyên lý thứ hai đó là đọc trình tự gắn nối (sequencing by ligation, SBL) đƣợc sử dụng ở máy SOLiD do George Church phát minh. SBL đã đƣợc sử dụng để xác định trình tự genome và là nền tảng cho các thiết bị đọc trình tự thế hệ mới. Công nghệ đọc trình tự gen thế hệ mới đƣợc thực hiện theo 3 bƣớc chính nhƣ sau:
- Chuẩn bị các đoạn DNA và gắn lên các giá bám: Trƣớc hết DNA bộ gene đƣợc cắt nhỏ thành các đoạn DNA ngắnnhờ siêu âm hay nhờ khí dung, sau đó 2 đầu các đoạn DNA ngắn này đƣợc gắn 2 đoạn adapter có trình tự nhận biết bởi các đoạn dò và trình tự mồi PCR. Các đoạn DNA này sẽ đƣợc gắn lêncác giá bám là các hạt nano (Roche 454, SOLiD hay Ion Torrent) hay trên các vi bản (Illumina) nhờ các đoạn dò đặc hiệu adapter đã gắn sẵn trên các giá bám này.
- Khuếch đại các đoạn DNA trên giá bám bằng mồi đặc hiệu adapter: Nếu giá bám là vi bản thì thành phần PCR đƣợc bơm trải lên vi bản và khi thực hiện PCRsẽ có từng cụm sản phẩm khuyếch đại đƣợc gắn trên các vị trí tách rời nhau. Nếu giá bám là các vi hạt thì phải nhũ hoá thành phần PCR để các giọt nhũ chỉ chứa một vi hạt, nhờ vậy sau khi thực hiện PCR mỗi vi hạt chỉcó một loại sản phẩm khuyếch đại bám lên. Sauđó, các vi hạt đƣợc loại bỏ nhũ dịch và bơm vào một vi chip có chứa hàng chục ngàn đến hàng trăm ngàn giếng kích thƣớc nano (nanowell), kích thƣớc này cho phép mỗi nanowell chỉ chứa đƣợc một vi hạt.
- Đọc trình tự bằng tổng hợp hoặc bằng gắn nối: Nguyên tắc cũng gần giống pyrosequencing, tuy nhiên có một số điểm khác biệt bao gồm: (i) Thay vì phải huỷ bỏ các thành phần A T, C, và G còn dƣ thừa trong phản ứng trƣớc khi cho thành phần tham gia mới vào thì ở đọc trình tự thế hệ mới, thành phần tham gia đọc trình tự dƣ thừa này đƣợc thu hồi sau khi thu đƣợc tín hiệu và bơm
thành phần tham gia mới; (ii) Tín hiệu tổng hợp đƣợc ghi nhận sau mỗi lần bơm các thành phần tham gia vào có thể là tín hiệu phát quang dựa trên hệ thống luciferinluciferase (Roche 454),tín hiệu điện do thay đổi pH, tín hiệu huỳnh quang đƣợc đánh dấu trên các nucleotide A, T, C hay G hay cũng có thể là tín hiệu huỳnh quang đƣợc gắn lên probe;(iii) Tổng hợp mạch bổ sung dựa trên mạch khuôn có thể là kéo dài đầu 3’ của mạch bổ sung bằng các nucleotide (A, T, C hay G) và cứ mỗi khi một nucleotide đƣợc kéo dài thì sẽ có một tín hiệu phát quang (Roche 454), huỳnh quang (Illumina) hay pH (ion Torrent) đƣợc ghi nhận, hay có thể là kéo dài đầu 3’ của mạch bổ sung mỗi lần 2 base nhờ sự kéo dài và nối đoạn dò dựa trên sợi khuôn và cứ mỗi khi tổng hợp đƣợc 2 base thì sẽ có một tín hiệu huỳnh quang đƣợc ghi nhận (SOLiD)
Thứ tự của các lần bổ sung các thành phần đọc trình tự vào chip nanowell hay vào vi bản đƣợc máy tính ghi lại đồng thời với thứ tự và cƣờng độ tín hiệu tổng hợp sợi bổ sung của từng cụm DNA bám lên vi bản hay trên vi hạt, nhờ vậy mà sẽ đọc đƣợc trình tự của các đoạn DNA trên từng cụm. Vì có đến hàng trăm ngàn cụm nên sẽ có hàng trăm ngàn trình tự sẽ đƣợc đọc, tƣơng ứng với hàng trăm ngàn đoạn DNA từ bộ gene sẽ đọc đƣợc. Các trình tự của các đoạn đọc đƣợc sẽ đƣợc phần mềm của thiết bị nối lại với nhau bằng cách so sánh trình tự, tìm các đoạn trùng lặp ở hai đầu và nhƣ vậy là sẽ có kết quả của trình tự nguyên bộ gene[36, 37].