Sự ra mắt của nền tang giải trình tự hiệu năng cao đầu tiên vào giữa những năm 2000 đã làm giảm 50000 lần giá thành giải trình tự gen so với chị phí trước đó của Dự án Hệ øen người, và
Trang 1BỘ MÔN CÔNG NGHỆ SINH HỌC
CÔNG NGHỆ GIẢI TRÌNH TỰ GEN THẺ HỆ MỚI
NEXT GENERATION SEQUENCING (NGS)
GVHD: PGS TS Hoang Anh Hoang
Nhom 1 Lớp: L02
Danh sách thành viên thực hiện
Trang 2
MỤC LỤC
BẢNG CHỮ VIẾT TẮTT - 5- + St té tr HH tri 4
NGS - Next Generation Sequericing - - + <1 HH 5
| Phương pháp Pyr0sequencing - - - not HH nh kế 6
1 Giới thiệu về Pyrosequencing - + ++s+s+s+s+eexzerereesrerererersrsrxree 6
3 Ua va mhuroe digi .cccecccccscssesescsescssesescsesescesesesesescssesesesesescessseseaeacenecesenss 14
SA cốc nố ố ố -Q.HẬH)H 16
2 Nguyên liệu : - LH Ho KH Ho KH 16
3 Quy trình thực hiện ST TH KH TH HH 16 K69) 171,11 qsấd 16 3.2 Giải trình tt SÓLiÏ) SG SH» HH kg Hà 17 3.3 Phím tích dữ liỆM eee HH TH kh KH 20
0 ẽố n 20
5 Ứng dụng cho mẫu DNA -. + + 5S StSESEEExrkEeEerrrreerrrrrrerereerrrre 20
IV Phuong phap Oxford Nanopore DNA Sequencing Technologies 22
1 Gidi thiéu vé Nanopore sequencing .ccccccscscsseseesssceseceseseseeseceteneseaeees 22
2 Nguyên liệu -Ă LH TH HH KH ok HE: 22
b0 70/0 (0, Ngagaa Ả 22
2 Ÿ/2i:I9 0n e 22
Trang 32.3 NA@MOPOME o.oo ố 22
2.4 Dung Dich Dién Lyte (Electrolyte SOUUtiOn) cccccccccc cece eee e eee eeeeetees 23 2.5 Thiét Bi Doc (Sequencing Device) csccccccecsesesvsvsvscsesesvevsisesesvsvsvscsenesveresens 23 2.6 Thiét Bi Do Dién (Electrical Measurement Device) o.cccccccecccceeeceeceess 23
Trang 4DANH MUC HINH
Hình 1.1 Tạo thự viện DNA wocceccecccccccccccccccccccccceuuuuuuseuuesuaeceeeuseeeeeeeeeeeeeeseeeeeeseeuuaaaaaaaas 8
Hinh 2.4 Két Qua thu Guo an 14
Hinh 3.1 Qua trinh chuan bi thư viện DNA giải trình tự SOLiD 17
Hình 3.2 Sự phân bó và ghi nhãn thuốc nhuộm huỳnh quang dụa trên hai
Hình 3.3 Trình tự SOLiD -c S.S12 + HT HH TH HT HT HH Tho kh Hành 19 Hình 4.1 NaiODOFG - - - SH TH TH KH TH TH HH KH 23
Hình 4.2 Thiết bị đọc gen - MinION - -cHn HH TH Hit 24
Hình 4.3 Quá trình GT'T qua Nanopore - <1 nhi 25
Trang 5BANG CHU VIET TAT
1 Deoxyribonucleic acid DNA
2 Sequencing Giải trình tự GTT
3 Next Generation Sequencing Giai trình tự gen thế hệ mới | NGS
4 | Oxford Nanopore Technologie ONT
6 Ribonucleic acid RNA
Trang 6
NGS - Next Generation Sequencing
Giải trình tự gen là kỹ thuật xác định trình tự DNA của các sen cụ thể, mã hóa hoặc không mã hóa cho các protein chức năng liên quan Với sự phát hiện ra câu trúc DNA đã có những bước tiễn dài trong hiểu biết về tính phức tạp và đa dạng của hệ gen Tuy nhiên, hạn chế về lưu lượng xử lý và giá thành cao của giải trình tự là những rào cản chính vào thời điểm đó Sự ra mắt của nền tang giải trình tự hiệu năng cao
đầu tiên vào giữa những năm 2000 đã làm giảm 50000 lần giá thành giải trình tự gen
so với chị phí trước đó của Dự án Hệ øen người, và được đặt tên là giải trình tự thế
hệ mới (NGS- Next Generation Sequencing) Công nghệ này ban đầu được gọi là
“massively-parallel sequencing”, vì nó cho phép xác định trình tự của nhiều sợi DNA cùng một lúc, thay vì một sợi một lần như với phương pháp giải trình tự truyền thống của Sanger bằng điện di Công nghệ này đã cách mạng hóa khoa học sinh học, cho phép các phòng thí nghiệm thực hiện một loạt các ứng dụng và nghiên cứu các hệ thống sinh học ở một mức độ chưa từng có
Các ứng dụng của NG§S rất đa đạng và phong phú Ví dụ, NGS cho phép các phòng thí nghiệm:
« Xac định trình tự toàn bộ penome nhanh chóng
- Sử dụng RNA sequencing (RNA-Seq) để khám phá các biến thê RNA mới hoặc các điểm nối RNA, hoặc định lượng mRNA cho phân tích biểu hiện sen
- _ Phân tích các yếu tô di truyền như methylation toàn bộ bộ gen và tương tác
DNA-protein
- -_ Xác định trình tự mẫu ung thư đê nghiên cứu các sự sai khác trong thông tin
di truyền
Ý nghĩa của NGS là nó đã cơ bản thay đôi những câu hỏi mà các nhà khoa học có
thê đặt ra và trả lời NGS cung cấp mức độ thông tin vượt xa khả năng của các công nghệ xác định trình tự DNA truyền thông NGS tao ra khéi lượng đữ liệu xác định trình tự DNA rất lớn, và cả về chi phí lẫn thời gian đều ít tốn kém hơn so với phương
pháp Sanger
Trang 7| Phuong phap Pyrosequencing
1 Giới thiệu về Pyrosequencing
Pyroinatine là một phương pháp giải trình tự DNA Nó dựa trên sự phát hiện
giải phóng pyrophosphate (PPi) khi đNTP được thêm vảo chuỗi
Nguyên tắc cơ bản
- Một mạch DNA mới được tổng hợp trên mạch khuôn mẫu
- Trong qua trinh tong hop DNA, lién két phosphodiester được hình thành giữa
nucleotide cuối cùng của chuỗi đang phát triển va nucleotide bé sung sắp tới Kết qua
là Pyrophosphate (PPi) được giải phóng
- Do do, mỗi khi một nucleotide bổ sung được kết hợp vào chuỗi được tông hợp, một pyrophosphate sẽ được giải phóng
- Pyrophosphate nay được phát hiện trong quá trình pyro và tạo cơ sở cho việc xác định trình tự DNA của chuỗi mẫu
Nguyên tắc Ppi- Pyrophosphate được giải phóng -_Pyrophosphate được phát hiện bằng phản ứng xếp tầng enzyme dẫn đến sự phát
PPi +APS — ATP + Sulfate (duoc xuc tac boi ATP-sulfurylase) Phan ứng 2:
- _ Trong phản ứng tiếp theo, ATP này được enzyme luciferase sử dụng đề chuyên
Lucifer thanh Oxyluciferin va tao ra anh sang
ATP + luciferin + O2 + AMP + PPi + oxyluciferin + CO2 + Anh sang (duoc
xúc tac boi luciferase);
Trang 8- Do đó, pyrophosphate được giải phóng trong quá trình tổng hợp DNA co thé được phát hiện bằng cách phát ra ánh sáng Việc phát hiện pyrophosphate này là cơ
SỞ của việc giải trình tự DNA và do đó có tên là pyrophosphate
2 Nguyên liệu - S
- Đoạn DNA mâu Đoạn DNA này sẽ là chuỗi mẫu của chúng ta Đoạn DNA nay duoc thiết kế ở một đầu với trình tự bổ sung cho đoạn mỗi
- Primer
- Deoxynucleotides dNTPs (dATPaS, dCTP, dGTP, dTTP), ở đây dATP bình
thường được thay thế bằng dATPøS Đó là deoxyadenosine alpha Theotriphosphate
- Su thay thé nay 1a can thiết vì enzyme luciferase cũng sử dụng ATP để tạo ra ánh sáng Đề tránh các tín hiệu sai lên pyrophosphate trong quá trình tạo trình tự pyro, việc thay thế này được thực hiện
- Enzyme DNA polymerase, dé tong hop chudi moi
- Cac chat nén khac can thiét : Adenosine Phosphosulfate (APS), Luciferin
- Cac enzyme khac cần thiết : ATP sulfurylase, Luciferase, Mot loại enzyme được gọi là Apyrase cũng cần thiết (Enzym này loại bỏ các nucleotide không được
sử dung Vi vay, no la enzyme phan huy nucleotide.)
3 Quy trinh thực hiện
- Bước I: Tạo thư viện DNA DNA được cắt nhỏ thành các mảnh nhỏ ( 300-800 bp) với enzyme cắt đầu bằng Các adapter ngắn ( A và B) sau đó được nối vào hai đầu của mỗi mảnh DNA Các adapter này sẽ làm trình tự mỗi cho emnPCR và giải trình tự, đồng thời chứa một
vị trí bám để tính sạch mẫu Thư viện DNA khuôn mạch đơn (sst-DNA) 6 cuối bước này được đánh giá về chất lượng, và lượng tối ưu cần cho enPCR được xác định bằng chuẩn độ
Trang 9= Genome fragmented by nebulization
® No cloning: no colony picking
* sstDNA library created with adaptors The adaptors are used as primers, and for binding to beads
= A/B fragments selected using streptavidin-biotin purification
Hinh 1.1 Tao thie vién DNA
- Buéc 2: PCR nhii twong (emPCR) + Thư vién ssDNA duoc cé dinh 1én DNA capture bead dac biét Mỗi bead có mang một đoạn sst-IDNA duy nhất Thư viện đính hạt bead được nhũ tương hóa với các hóa chất dùng cho khuếch đại trong một hỗn hợp dầu trong nước
+ Mỗi bead được bắt giữ riêng rẽ trong một microreactor đề thực hiện PCR Sự
khuếch đại tạo ra các mảnh DNA giống nhau cô định trên bead và đặc hiệu theo bead
+ Sau khi khuếch đại xong, hỗn hợp chứa bead được chuyền lên đĩa PicoTiter
chứa các giếng đường kính 44um- chỉ vừa cho một bead lọt vảo
+ Ở bước nảy, DNA polymerase được thêm vảo, cùng với các enzyme khác (ATP sulfurylase, Luciferase) va cac chat nén (Adenosine Phosphosulfate, Luciferin) can thiết dé phat hién pyrophosphate
Trang 10
8 hours
Anneal sstDNA Emulsify beads and Clonal amplification Break microreactors,
to an excess of PCR reagents in occurs inside enrich for DNA-
DNA Capture water-in-oil microreactors positive beads
Beads microreactors
sstDNA librarV ————~- Clonally-ampilified sstDNA attached to bead
(millions of copies per bead)
Hinh 1.2 emPCR
- Bước 3: Giải trình tự các đoạn DA đã gắn trên mỗi bead theo nguyén Ip pyrosequencing
+ Sau bước thứ hai, một trong bốn loại nucleotide được thêm vào
+ DNA polymerase xúc tác cho phản ứng kéo dài chuỗi DNA, tại đó các dNTP được liên kết vào chuỗi DNA sẽ giải phóng ra PPi Số lượng PPi giải phóng sẽ tý lệ với số lượng phân tử của 1 loại dNTP được gắn vào chuỗi
+ PPi phản ứng với APS để giải phóng ATP dưới sự xúc tác của enzyme
sulfurylase
ATP 1a co chat cho luciferase, xúc tác cho phản ứng chuyên hóa luciferin thanh oxyluciferin phát ra ánh sáng nhìn thấy, c6 thé ghi lại bằng camera Cường độ sáng
sẽ ty lệ với số lượng phân tử A'TP được tạo thành
+ Kết thúc phản ứng, các đNTP còn thừa lại sẽ bị phân hủy bởi Apyrase
Trang 11Hinh 1.3 Nucleotide duoc them vào
Hinh 1.4 Gidi trình tự + Bén loai dNTP sé duge bom vao trong giếng phản ứng luân phiên nỗi tiếp nhau
- Bước 4: Ghép nỗi các đoạn DNA đã được giải trình tự bằng phần mém tin sinh dé tao ra mot trình tị đây đủ của genome
+ Các thé hé may dung nguyén ly nay 1a Pyrosequencing AB của Viện công nghệ Hoang gia, Uppsala, Thuy Dién va 454 Life Sciences GS cua hang Roche
10
Trang 124 Uunhuge diém
O Uu diém:
- Độ dài đọc được là 400bp với độ chính xác cao
- Cong nghé cao hon Sanger, giải trình tự hệ gen mà không cần tách dòng tạo thư viện
- Thư viện DNA có thể được mã hóa và tách riêng trong suốt quá trình phân tích kết quả
LH Nhược điểm:
- Khó phân tích chính xác các trình tự của 1 loại Nu lặp lại liên tục từ 6 nu trở lên,
vi du TTTTTT
- Phức tạp và nhiều công đoạn
- Giá thành cao hơn so với các phương pháp khác
5 Ứng dụng
Kỹ thuật pyrosequencing có thê được ứng dụng trong nhiều lĩnh vực sinh học như: y học, môi trường, pháp y, vệ sinh thực phâm Trong đó ở lĩnh vực y học lâm sàng đã có nhiều ứng dụng quan trọng như:
- Phát hiện nhiều đột biến DNA có liên quan đến nhiều loại ung thư, từ đó giúp chân đoán nguy cơ mắc bệnh, tiên lượng và điều trị đích ung thu
- Chân đoán một số bệnh não và thần kinh
- Chân đoán nhiều bệnh di truyền
- Xác định type và các allel kháng nguyên bạch cầu người HLA có liên quan đến bệnh lý, sóp phần chấn đoán nguy cơ mắc bệnh, đánh giá và tiên lượng khả năng phép tạng
- Phát hiện sự nhiễm và định type nhiều loại virus, vi khuẩn, ký sinh trủng và nắm
11
Trang 13Il Céng nghé giai trinh ty SBS
Sequencing By Synthesis (SBS): được phát triển bởi Solexa (sau này là
Illumina) vào năm 2005
2.1.Chuan bj thir vién DNA
* Cat doan DNA mau thanh cac doan nho
« Điện di đề phân tách DNA mẫu theo kích thước khoảng 200 — 300bp
« Gắn thêm 2 Adaptor(P5 - P7) vào 2 đầu của DNA
* Adaptor: Đoạn trình tự khoảng 60bp bao gồm: Trình tự bổ sung các đoạn mỗi
có định trên giếng - Trình tự bô sung với méi PCR
Hinh 2.1 Adaptor va DNA fragment
2.2 Tao Cluster
* Chuan bi giéng gm Co cac doan mdi (b6 sung voi P5 va P7) duoc cé dinh dau
- Load mẫu vào giéng, các đoạn DNA mang adaptor sẽ bắt cặp tương ứng
« Khuếch đại số lượng DNA lên băng phương pháp PCR và phương pháp bắt
cau
+ Cat va rửa trôi mạch bỏ sung, giữ lai mach chinh(méi xudi) dé tao ra trình tự
cluster 1 chiều => Giải trình tự chiều thứ 1
12
Trang 14Hinh 2.2 Tao cluster 2.3.Giải trình tự
* Cho DNA polymerase, mdi, dNTP có huỳnh quang - block ở đầu 3”
* Nucleotide dugc gan vao — phan wng dung lại
* Cam bién nhan tin hiệu huỳnh quang
« Gốc khóa ở đầu 5ˆ được cắt ra, loại bỏ huỳnh quang
13
Trang 15Hình 2.3 Nucleotide có gắn huynh quang va khéa dau 3’
« Tiếp tục phản ứng đến khi hét độ dài trình tự quan tâm
‹ Rứa trôi sản phàm chiều thứ
« Lặp lại bước PCR bac cầu nhưng lần này mạch DNA (mài xuôi) bị cắt - rửa
- Sử dụng phan mém tin sinh, tong hop trình tự ban đầu
Hinh 2.4 Ket qud thu duoc
3 Ưu và nhược điểm
Trang 16« Giá thành cao
« Chiều dài mỗi đoạn DNA đọc được chỉ từ 200 - 250nu(độ chính xác ở base
250 là 99%)
15
Trang 17Ill Giải trình tự kết nối SOLiD
1 Nguồn gốc ra đời:
Giải trình tự SOLiD (Giải trình tự bằng quá trình thắt và phát hiện
Oligonucleotide), được phát triển bởi Applied Biosystems (Life Technologies, hiện
là một phân cua Thermo Fisher Scientific), sử dụng phương pháp giải trình tự dựa trên sự thắt độc đáo Nó liên quan đến việc gan cac oligonucleotide duge danh dau huỳnh quang vào các đoạn DNA, sau đó là nhiều vòng giải trình tự bằng cách thắt Giải trình tự SOLID mang lại độ chính xác cao và được sử dụng cho các ứng dụng như giải trình tự toàn bộ bộ gen, sắp xếp lại trình tự và phân tích quá trình methyl
hóa DNA
2 Nguyên liệu :
- Mẫu DNA: DNA cần được thu thập và chuẩn bị sao cho nó sẵn sảng tham gia
vào quá trinh sequencing
- Hạt Từ Tính: Hạt từ tính thường được sử dụng để giữ các đoạn DNA mục tiêu trong quá trình chuân bị mẫu và khuếch đại
- Thuốc Nhuộm Huỳnh Quang: Thuốc nhuộm huỳnh quang được sử dụng đề đánh dẫu các đoạn DNA và giúp xác định trinh ty trong qua trinh sequencing
- Enzyme Ligase: Enzyme ligase c6 thé duoc sử dụng để liên kết các đoạn oligonucleotide và tạo ra các liên kết cộng hóa trị giữa chúng
- Adapter: Là các đoạn sen được gắn vào hai đầu của các đoạn gen cần đọc
- Olieonucleotide Gắn Adapter: Các đoạn oligonucleotide được sử dụng để gắn adapter vào đầu của các đoạn DNA mục tiêu Adapter này sẽ chứa các đoạn đặc biệt
đề kết hợp với các hạt từ tính và tham gia vào quá trình sequencing
- Polymerase và Nucleotide: Polymerase và nucleotide được sử dụng trong quá
trình khuếch đại để tạo ra hàng triệu bản sao của DNA mục tiêu
3 Quy trình thực hiện
16