3. Các phương pháp giải trình tự DNA
3.2. Giải trình tự DNA bằng kỹ thuật pyrosequencing
Kỹ thuật này được sáng tạo đầu tiên bởi Păl Nyrén và Mostafa Ronaghi của Viện Kỹ thuật Stockholm, Thụy Điển năm 1996. Đây là một hệ thống giải trình tự DNA hai bước có độ tương đồng cao với dung lượng lớn hơn rất nhiều so với hệ thống giải trình tự Sanger và là hệ thống được kết hợp với việc khuếch đại số lượng lớn các đoạn DNA và pyrosequencing dung khối lớn trong các giếng picotiter.
Nguyên lý Ộgiải trình tự bằng việc tổng hợpỢ bao gồm khởi động một sợi DNA được giải trình tự và giải trình sợi DNA bổ sung bằng phản ứng của enzyme,cũng dựa trên việc nhận biết các pyrophosphate (PPi) được giải phóng trong quá trình gắn nucleotide, tạo ra một tắn hiệu ánh sáng, hiệu quả hơn kỹ thuật kết thúc chuỗi bằng dideoxynucleotide.
Các sợi khuôn đem giải trình tự có thể được chuẩn bị bằng cả hai phương pháp là: chuẩn bị sợi khuôn pha rắn Ờ solid phase template preparation (streptavidin-coated magnetic bead, hạt thủy tinh từ tắnh có bọc
streptavidin) và chuẩn bị sợi khuôn mang enzyme Ờ enzymatic template preparation (apyrase và exonuclease).
Đầu tiên DNA được cắt thành các đoạn đầu bằng (blunt end), và được gắn các oligonucleotide adaptor vào cả hai đầu. Từng đoạn này sau đó gắn với một hạt thủy tinh, và sẽ được khuếch đại bằng PCR trong các giọt nhũ dầu- nước, tạo ra nhiều bản sao đoạn DNA trên mỗi hạt thủy tinh. Sau đó các hạt thủy tinh được giữ trong các giếng picotiter trên một cơ chất dạng sợi, và giải trình tự.
Quá trình giải trình tự diễn ra qua 5 bước (sử dụng hệ thống Genome Sequence LFX cho việc giải trình tự hệ phiên mã-transcriptome):(1) Sợi khuôn là một sản phẩm PCR sợi đơn, được lai với một primer giải trình tự; (2) Ủ với các enzyme DNA polymerase, ATP sulfurylase, luciferase và apyrase cũng như các cơ chất adenosine 5Ỗ phosphosulfate (APS) và luciferin; (3) Khi dNTP đầu tiên được bắt cặp bổ sung, nó được gắn với sợi DNA khuôn nhờ DNA polymerase và kèm theo sẽ giải phóng một PPi; (4) PPi được biến đổi thành ATP nhờ enzyme ATP sulfyrelase cùng với sự tham gia của APS; (5) Biến đổi luciferin thành oxyluciferin nhờ licuferase xúc tác, tạo ra ánh sáng nhìn thấy với độ sáng tương ứng với lượng ATP tạo thành. Ánh sáng này được nhận viết bởi một camera và phân tắch bởi một chương trình phần mềm.
Apyrase làm suy biến các nucleotide không bắt cặp và ATP. Sau quá trình làm suy biến, phản ứng bắt đầu lại với nucleotide khác được gắn vào. Sau một quá trình liên tục, sợi DNA bổ sung được tổng hợp xong và việc giải trình tự nucleotide được xác định từ các đỉnh tắn hiệu dựa trên "dấu vết của pyrogram (pyrogram trace)".
Kỹ thuật pyrosequencing có một số hạn chế như sau: (1) Phần mềm Newbler tập hợp dữ liệu đọc trong Ộflow spaceỢ hơn là Ộnucleotide space nên chỉ xác định được mật độ ánh sáng (light intensity) mà không dự đoán trình tự
các đoạn đọc; (2) Thiết bị tập hợp trình tự được thiết kế để sửa các lỗi hệ thống kết hợp với kỹ thuật pyrosequencing như các lỗi liên quan tới chuỗi đồng hình (homopolymer); (3) Chất lượng các bản đọc trình tự của 454 pyrosequencing và kết quả tập hợp dữ liệu không được mô tả chắnh xác; (4) Chiều dài các đoạn đọc ngắn, khoảng 300-500 nucleotide, ngắn hơn đoạn đọc bởi phương pháp kết thúc chuỗi Ờ Sanger (800-1000 nucleotide) nên gặp khó khăn khi tập hợp đoạn, nhất là đối với các trình tự DNA lặp; (5) Thiết bị tập hợp trình tự Newbler của 454 được đánh giá là thực hiện kém hiệu quả đối với các vùng lặp lại. Tuy nhiên, vấn đề này có thể giải quyết bằng phương pháp là kết hợp thông tin nối tiếp (scaffold information) từ các trình tự kết thúc được tạo dòng theo cách truyền thốn bằng dữ liệu của kỹ thuật 454.
Những ưu điểm của kỹ thuật pyrosequencing gồm: (1) Tắnh linh hoạt cao khi kết cặp primer, phân tắch được nhiều đột biến, dữ liệu và thông tin trình tự tập hợp được đầy đủ; (2) Có độ nhạy cao hơn hẳn so với phương pháp giải trình tự truyền thống với độ chắnh xác là 99,9% với các đoạn 200 base và 99% với các đoạn 400 base; (3) Pyrosequencing giải trình tự được 400-600 triệu bp trong 10 giờ vì vậy giá thành thấp hơn khi giải trình tự lượng lớn DNA với thời gian nhất định so với khi sử dụng phương pháp Sanger Ờ mất nhiều ngày để giải trình tự một lượng DNA tương đương [Hall N., 2007].