trình tự gen thế hệ thứ hai NGS.
Giải trình tự ADN đã xuất hiện từ rất lâu kể từ khi phương pháp kết thúc chuỗi của Sanger ra đời năm 1977 [53], giúp các nhà khoa học đã đạt được khả năng giải mã trình tự ADN một cách tin cậy. Sau đó, hãng Applied Biosystems đã giới thiệu các hệ thống giải trình tự tự động sử dụng điện di mao quản (Capillary electrophoresis - CE), AB370 vào năm 1987 và AB3730xl vào năm 1998, các thiết bị này trở thành công cụ chính hỗ trợ trong dự án giải trình tự hệ gen người[11]. Những công nghệ này được coi là các thiết bị có công suất cao thời bấy giờ, sau đó tới năm 2005 khi thiết bị Genome Analyzer xuất hiện vào năm 2005 đã có thể giải trình tự từ 84 kilobase (kb) đến 1 gigabase (Gb) trên 1 lần chạy.
Kỹ thuật giải trình tự các đoạn đọc ngắn, song song cùng lúc một lượng lớn đoạn đọc là một cách tiếp cận khác giúp tạo ra cuộc cách mạng lớn trong lịch sử giải trình tự và tạo ra giải trình tự thế hệ mới. Từ thời điểm đó trở đi, đầu ra dữ liệu của giải trình tự thế hệ tiếp theo (Next Generation Sequencing - NGS) đã tăng lên rất nhiều và cũng nhiều thế hệ thiết bị giải trình tự của các hãng ra đời và cải tiến [76].
Nguyên lý của kỹ thuật NGS dựa trên việc sử dụng phức hợp các enzymes ADN polymerase và các deoxyribonucleotide triphosphates (dNTPs) có gắn huỳnh quang, các phức hợp này tác động vào ADN khuôn trong từng chu kì tổng hợp ADN trong quá trình giải trình tự. Ở mỗi chu kì, các nucleotit được giải mã thông qua các dấu huỳnh quang gắn trên các nucleotit bổ sung. Sự khác biệt quan trọng là thay vì
giải trình tự từng đoạn ADN đơn lẻ, có trình tự ngắn thì NGS nâng cấp lên thành thực hiện trên hàng triệu đoạn đọc trong cùng một thời điểm. Hơn 90% dữ liệu giải trình tự gen trên thế giới được thực hiện bởi các hệ thống giải trình tự gen của hãng Illumina với công nghệ vừa sinh tổng hợp vừa đọc trình tự (Sequencing By Synthesis-SBS) với độ chính xác cao, dữ liệu đầu ra thành công lớn và khả năng đọc các nucleotit trên Q30 [76].
Qui trình giải trình tự gen của Illumina bao gồm 4 bước cơ bản (hình 6):
- Chuẩn bị thư viện: Các đoạn trình tự ADN hoặc cADN được cắt một cách ngẫu nhiên thành các đoạn ngắn, các đoạn này được gắn các trình tự vào hai đầu 5’ và 3’. Các trình tự được thêm vào bao gồm phần trình tự nucleotit để nhận biết các mẫu riêng biệt, phần tiếp theo là phần trình tự nucleotit bổ sung với các nucleotit trên giá thể của máy giải trình tự có tên gọi flowcell. Sau khi đoạn ADN được gắn hoàn thiện sẽ được khuếch đại sử dụng phản ứng PCR (Polymerase Chain Reaction) và tinh sạch sản phẩm trước khi đưa vào giải trình tự.
- Tạo cluster: Thư viện sau khi chuẩn bị được chuyển vào flowcell nơi các đoạn đọc được bám vào, dựa trên nguyên tắc bổ sung giữa trình tự gắn ở đầu 3’ và 5’ và các nucleotit gắn sẵn trên flowcell. Các đoạn ADN sau khi được bám trên flowcell sẽ được khuếch đại thành hàng triệu bản sao theo nguyên tắc bắc cầu tạo thành các cụm trình tự riêng biệt (cluster). Khi các cluster được hoàn thiện thì quá trình đọc trình tự có thể bắt đầu.
- Đọc trình tự: Enzyme ADN polymerase và mồi được bổ sung vào cùng với 4 loại nucleotit có gắn huỳnh quang mang gốc khóa ở 3’OH. Các nucleotit này sẽ bắt cặp với các nucleotit trên các mạch ADN trong cụm cluster theo nguyên tắc bổ sung, đồng thời làm cho phản ứng tổng hợp tạm thời dừng lại. Sau đó tia laser được chiếu vào để kích thích phát huỳnh quang và camera sẽ ghi lại huỳnh quang tương ứng với các nucleotit tại thời điểm đó. Kế tiếp, gốc khóa 3’OH được cắt ra, huỳnh quang cũng bị loại bỏ và rửa trôi cùng với các nucleotit không được gắn, chu trình lặp lại khi hết độ dài của trình tự đoạn đích.
- Phân tích dữ liệu: Các đoạn trinh tự sau khi giải trình tự được gắn với các trình tự tham chiếu để đưa ra kết quả là các trình tự cuối cùng. Đồng thời phần mềm phân tích sẽ so sánh và tách riêng trình tự các mẫu đầu vào thành các file riêng biệt.
Kỹ thuật này tạo ra cuộc cách mạng trong công nghệ sinh học và ứng dụng trong cả nghiên cứu và chẩn đoán lâm sàng. Việc ứng dụng công nghệ giải trình tự
gen thế hệ thứ hai ở một số nước châu Âu và châu Mỹ để phân tích NST của phôi nang bắt đầu áp dụng rộng rãi vào năm 2014 [18].
Sàng lọc rối loạn nhiễm sắc thể trước chuyển phôi dựa trên kỹ thuật NGS khác nhau rất nhiều so với các kỹ thuật khác. PGS-NGS thực hiện chỉ trên một hoặc một vài tế bào phôi, dữ liệu chính xác, kỹ thuật phân tích đơn giản, các thiết bị đáng tin cậy và có giá thành hợp lý. Sàng lọc rối loạn NST dựa trên kỹ thuật NGS tạo ra nhiều lợi ích hơn a-CGH như giảm chi phí giải trình tự, có khả năng đánh giá tổn thương cấu trúc NST, khả năng tự động hóa cao giúp giảm thiểu những sai sót trong quá trình thực hiện [4, 39, 73].
CHƯƠNG 2: ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU