Khuếch đại các đoạn DNA đã gắn Adaptor

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu hệ phiên mã từ mô cơ của tôm sú penaeus monodon tại việt nam (Trang 37 - 59)

CHƢƠNG III : VẬT LIỆU, NỘI DUNG, PHƢƠNG PHÁP NGHIÊN CỨU

3.3. Phƣơng pháp nghiên cứu

3.3.4. Khuếch đại các đoạn DNA đã gắn Adaptor

Các đoạn DNA đã gắn Adaptor đƣợc khuếch đại bằng PCR với cặp mồi đặc hiệu gắn adaptor sau đó đƣợc chuyển đi giải trình tự tại Công ty cổ phần vật tƣ khoa học Biomedic nhờ máy Illumina MiSeq.

Phản ứng khuếch đại cDNA:

Thành phần Số lƣợng

Platinum® PCR SuperMix High Fidelity

45l

Ion 5’ PCR Primer v2 1 l

Ion 3′ PCR Primer v2 1 l

Tổng 47 l

Chuyển 6 l mẫu cDNA vào ống PCR mới. Chuyển 47l PCR mix vào 6 l mẫu cDNA ở trên. Đảo ống phản ứng để hòa tan đều

Chạy PCR với chu trình nhiệt nhƣ sau

Các bƣớc Nhiệt độ Thời gian

Kéo dài 94 ºC 2 phút

Chu kỳ 1 (2 chu kỳ) 94 ºC 30 giây 50 ºC 30 giây 68 ºC 30 giây

Chu kỳ 2 (14 chu kỳ) 94 ºC 30 giây 62 ºC 30 giây 68 ºC 30 giây

Kéo dài 68 ºC 5 phút

Tinh sạch cDNA vừa khuếch đại: cDNA đƣợc tinh sạch bằng hạt từ (Nucleic Acid Beads) và các dung dịch đệm đƣợc cung cấp cùng với kit trên.

3.3.5. Giải trình tự gen trên máy Illumina MiSeq

Kết quả kiểm tra trên thiết bị Bioanalyzer (hình 4. và 5) cho thấy: các băng điện di chủ yếu ở kích thƣớc từ 264-500bp . Mẫu GM4 đạt nồng độ 17,1 ng/µl. Nhƣ vậy thƣ viện cDNA tổng hợp từ mô cơ tôm sú đạt tiêu chuẩn để cho phản ứng đọc trình tự bằng máy xác đinh trình tự gen thế hệ mới NGS Illumina MiSeq.

Chúng tôi đã kết hợp với Công ty cổ phần vật tƣ khoa học Biomedic để giải trình tự gen trên máy xác định trình tự gen thế hệ mới (NGS) Illumina MiSeq. Máy Illumina MiSeq là máy giải trình tự gen thế hệ mới có thể đạt tới công suất 8 Gb (8 tỷ bazơ cho một lần chạy) dựa trên nguyên lý cụm DNA đồng nhất gắn trên mỗi điểm của Flow Cell (FC). Nguyên lý FC đƣợc minh họa trên hình 4.

Hình 4. FC chứa 8 kênh (A), trong mỗi kênh của FC (B) đã đƣợc gắn hàng triệu primer xuôi (F) và ngƣợc (R) bằng liên kết cộng hóa trị. Các mồi này bắt cặp bổ sung với đầu gắn adaptor trên các đoạn cDNA tổng hợp từ phân đoạn mRNA tôm sú.

Sản phẩm PCR sau khi khuếch đại từ các đoạn gắn adaptor đƣợc biến tính không hồi tính bằng dung dịch NaOH sau đó đƣa vào FC. Các DNA sợi đơn sẽ bắt cặp bổ dung với các primer đã gắn sẵn trên các kênh của FC. Sự có mặt của enzyme Taq DNA polymerase làm cho phản ứng kéo dài chuỗi từ đầu 5’ đến 3’ sẽ xảy ra nhƣ đƣợc minh họa trong hình 5. Sau khi sợi mới đƣợc hình thành, và gắn với primer trong FC, ta biến tính và bỏ sợi gốc hình 6. Sau đó đầu 3’ của sợi mới tổng hợp bắt cặp bổ sung với primer gắn trên FC và quá trình kéo dài chuỗi nhờ Taq lại xảy ra nhƣ hình 7. Tiếp theo là quá trình hình thành cụm (Cluster) DNA đồng nhất trên mỗi vị trí của FC nhờ quá trình hình thành cầu nối và khuếch đại cầu nối, biến tính tạo mạch thẳng và cắt bỏ sợi nghĩa khỏi FC (Hình 8).

A

B

F R

Số hoá bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 35

Hình 5. Tổng hợp sợi DNA mới nhờ Taq DNA polymerase, primer gắn FC và khuôn là cDNA sợi đơn gắn adaptor tổng hợp từ mRNA mô cơ tôm sú.

Hình 6. Sợi DNA tổng hợp mới gắn với một vị trí nhất định trên FC.

Sợi DNA mới Sợi DNA gốc sử dụng làm khuôn download by : skknchat@gmail.com

Hình 7. Đầu 3’ của sợi mới tổng hợp bắt cặp bổ sung với primer xuôi (F) gắn trên FC và quá trình kéo dài chuỗi nhờ Taq lại xảy ra.

Hình 8. Quá trình hình thành cụm (Cluster) DNA đồng nhất trên mỗi vị trí của FC nhờ hình thành cầu nối (A) và khuếch đại cầu nối (B), biến tính tạo

mạch thẳng (C) và cắt bỏ sợi nghĩa khỏi FC (D).

Bƣớc cuối cùng là bƣớc giải trình tự bằng việc bổ sung các primer giải trình tự bắt cặp bổ sung với adaptor ở đầu 3’ của các sợi gắn FC và kéo dài

C

B A

chuỗi nhờ Taq DNA polymerase với 4 bazơ gắn 4 chất phát màu khác nhau theo nguyên lý kết thúc hồi tính (Reversible Terminator) nhƣ mô tả trong hình 9.

Hình 9. Giải trình tự bằng việc bổ sung các primer giải trình tự bắt cặp bổ sung với adaptor ở đầu 3’ của các sợi gắn FC (A) và kéo dài chuỗi nhờ Taq

DNA polymerase với 4 bazơ gắn 4 chất màu khác nhau theo nguyên lý kết thúc hồi tính (Reversible Terminator, B).

DNA (0.1-1.0 ug)

Single molecule array Sample

preparation Cluster growth

5’ 5’ 3’ G T C A G T C A G T C A C A G T C A T C A C C T A G C G T A G T 1 2 3 4 5 6 7 8 9 Base calling T GCTA CGA T … Sequencing DNA (0.1-1.0 ug)

Single molecule array Sample

preparation Cluster growth

5’ 5’ 3’ G T C A G T C A G T C A 5’ 5’ 3’ 5’ 3’ G T C A G T C A G T C A G G T T C C A A G G T T C C A A G G T T C C A A C A G T C A T C A C C T A G C G T A C A G T C A T C A C C T A G C G T A G G T T 1 1 22 333 444 55 66 77 88 99 Base calling T GCTA CGA T … Base calling T GCTA CGA T … T GCTA CGA T … T GCTA CGA T … T GCTA CGA T … Sequencing B A

Sau khi giải tình tự hệ phiên mã mô cơ tôm sú chúng tôi đã thu đƣợc dữ liệu trình tự. Dữ liệu trình tự sau khi giải mã sẽ đƣợc xử lý và phân tích thu đƣợc các kết quả dƣới đây.

CHƢƠNG IV: KẾT QUẢ VÀ THẢO LUẬN

4.1. Kết quả tách chiết, tinh chế mRNA từ mô cơ của tôm sú và tổng hợp cDNA

Để có thể giải mã đƣợc hệ phiên mã của mô cơ tôm sú, trƣớc chết chúng tôi phải tách chiết và tinh chế đƣợc mRNA từ mô. Sau khi tách chiết và tinh chế, mRNA đƣợc phân cắt thành các đoạn nhỏ và tiến hành tổng hợp cDNA. Toàn bộ quá trình thực hiện đƣợc mô tả trong hình 10.

Hình 10. Các bƣớc tách chiết, tinh chế phân cắt và tổng hợp cDNA

Mô cơ đƣợc thu nhân từ 10 mẫu tôm sú bắt đƣợc ở vùng biển Nghệ An (Bắc Trung Bộ). Mô đƣợc nghiền trong nitơ lỏng sau đó đƣợc tách chiết bằng phƣơng pháp Trizol. RNA tổng số sau khi tách chiết đƣơc kiểm tra bằng máy quang phổ NanoDrop, kết quả tách chiết RNA tổng số đƣợc nêu ở bảng 4.1.

Bảng 4.1. Kết quả tách chiết RNA mô cơ của 10 mẫu tôm sú

thu nhận từ vùng biển Nghệ An

Mẫu A260 A260/A280

Hàm lƣợng (ng) NA1 58.057 1.31 2322.3 NA2 58.62 1.33 2344.8 NA3 53.801 1.05 2152.1 NA4 60.257 1.76 2410.3 NA5 59.645 1.86 2350.3 NA6 56.242 1.32 2249.7 NA7 55.39 1.13 2215.6 NA8 57.395 1.94 2295.8 NA9 59.645 1.82 2385.8 NA10 60.649 1.71 2425.9

Kết quả từ bảng 4.1 cho thấy RNA tổng số thu đƣợc từ mô cơ của 10 mẫu tôm thu nhận từ vùng biển Nghệ An tƣơng đối đồng đều, giao động từ 2152,1 ng đến 2425,9 ng. Hàm lƣợng RNA tổng số đạt từ 1000 ng cho phép thực hiện bƣớc tiếp theo là tinh chế mRNA để phục vụ cho việc tổng hợp cDNA. Chúng tôi đã chọn hai mẫu có nồng độ RNA tổng số cao nhất là NA9 với hàm lƣợng RNA tổng số là 2385,8 ng và NA10 với hàm lƣợng RNA tổng số là 2425,9 ng để thực hiện việc tinh chế mRNA phục vụ cho bƣớc tổng hợp cDNA. Sử dụng Kit tinh chế mRNA theo nguyên lý gắn hạt từ tính Dynabeads mRNA DIRECT TM

Micro Kit. Chúng tôi đã thu đƣợc 2 mẫu mRNA từ tôm NA9 và NA10 có đủ hàm lƣợng và độ sạch để có thể tiến hành các bƣớc tiếp theo. Kết quả tinh chế mRNA đƣợc phản ánh ở bảng 4.2.

Bảng 4.2. Kết quả tinh chế mRNA từ 10 RNA tổng số Mẫu A260 A260/A280 Hàm lƣợng (ng/l) NA9 0.576 1.82 23 NA10 0.715 1.88 28.6

Để có thể tổng hợp cDNA và tiến hành các bƣớc tiếp theo cho việc giải mã hệ phiên mã thì hàm lƣợng mRNA phải đạt >20 ng/l và A260/A280 phải đạt tối thiểu 1,8. nhƣ vậy mẫu NA9 và NA10 đạt yêu cầu cho việc tổng hợp cDNA.

4.2. Kết quả tổng hợp cDNA, gắn adaptor và khuếch đại các đoạn gen đã gắn adaptor bằng PCR

Sau khi có kết quả tinh chế mRNA, mRNA đƣợc phân cắt, tổng hợp cDNA và khuếch đại bằng PCR, sau đó điện di trên gel agarose để chọn các phân đoạn thích hợp cho giải trình tự gen. Quá trình thực hiện đƣợc mô tả trong hình 11.

Hinh 11. Các bƣớc gắn adaptor, khuếch đại bằng PCR và chọn đoạn gen có độ dài thích hợp để giải trình tự.

Chúng tôi đã kiểm tra thƣ viện cDNA sau khi làm giàu bằng PCR nhờ máy phân tích Bioanalyzer sử dụng chip DNA . Kết quả kiểm tra đƣợc phản ánh trên hình 12.

Hình 12. Kiểm tra thƣ viện cDNA nhờ máy phân tích Bioanalyzer. mRNA đƣợc tinh chế từ mô cơ tôm sú, cắt thành các phân đoạn. cDNA đƣợc tổng hợp từ các phân đoạn mRNA, gắn adaptor và làm giàu bằng

Hình 13. Kiểm tra thƣ viện cDNA nhờ máy phân tích Bioanalyzer.

4.3. Lắp ráp de novo hệ phiên mã

Dữ liệu trình tự sau khi giải mã sẽ đƣợc tiền xử lý để loại bỏ adaptor và trình tự xấu do lỗi của máy giải trình tự. Những trình tự đọc có chất lƣợng base quá thấp (chất lƣợng nhỏ hơn 20) cũng nhƣ số base nhiễu nhiều (mỗi trình tự đọc có >2% N base) sẽ đƣợc chỉnh sửa bằng công cụ cutadapt (https://code.google.com/p/cutadapt/). Những trình tự đọc chất lƣợng cao từ mô cơ đƣợc lắp ráp để tạo nên hệ phiên mã bao gồm các transcript của tôm sú bằng phần mềm Trinity (http://trinityrnaseq.sourceforge.net/) (Grabherr et al., 2011) với tham số mặc định. Tiếp theo phần mềm TGICL (Pertea et al., 2003) sẽ làm giảm sự dƣ thừa trong dữ liệu transcript chỉ để lại nhƣng transcript ƣu tú nhất, hay còn gọi là unigene.

Kết quả chất lƣợng giải trình tự mô cơ đƣợc phản ánh trên hình 14.

Hình 15. Chất lƣợng trình tự theo vị trí trên trình tự đọc mô cơ sau khi tiền xử lý

Hình 16. Chất lƣợng trình tự theo vị trí trên trình tự đọc mô cơ sau khi tiền xử lý

Hình 18. Phân bố Contigs theo độ dài lắp ráp 4.4. Chú giải và phân loại unigene trong hệ phiên mã

Chú giải chức năng cho các unigene trong hệ phiên mã đòi hỏi phải sử dụng những thuật toán tìm kiếm tƣơng đồng trên các cơ sở dữ liệu protein quan trọng. Trong nghiên cứu này, chúng tôi sử dụng công cụ BLAST với chế độ BLASTx để so sánh toàn bộ unigene lên các cơ sở dữ liệu NCBI non-redundant protein Swiss-Prot (http://www.expasy.ch/sprot) và Kyoto Encyclopedia of Genes and Genomes (KEGG; http://www.genome.jp/kegg/) với tham số E-value là 1e-6. Trong trƣờng hợp kết quả chú giải trên các cơ sở dữ liệu là khác nhau thì thứ tự ƣu tiên kết quả chú giải các vùng mã hóa protein là Nr, Swiss-Prot và KEGG. Trong khi đó với những unigene không đƣợc chú giải trên các cơ sở dữ liệu, phần mềm ESTScan (Iseli et al., 1999) sẽ dự đoán vùng mã hóa tiềm năng trong chuỗi trình tự của unigene. Kết quả chú giải từ ngân hàng Nr sau đó đƣợc phần mềm Blast2GO (Conesa et al., 2005) sử dụng để lấy ra mã Gene Ontology (GO) riêng biệt cho mỗi unigene. Toàn bộ unigene trong hệ phiên mã sẽ đƣợc

ánh xạ vào các mã GO và phân loại dựa vào 3 hạng mục: quá trình sinh học, thành phần tế bào và phân tử chức năng. Kết phân tích đƣợc nêu trong bảng 4.3.

Bảng 4.3. Thông tin về transcriptome mô cơ tôm sú Mô cơ Số Contigs lắp ráp 167.907 Số contigs bắt cặp đạt ≥ 97% với các trình tự trong GenBank 265 Tổng số Blast hit 10.970 Các SNPs 26.160 Các Microsatellites 104.815

Kết quả trong bảng 4.3. cho thấy, sau khi giải mã và phân tích transcriptome mô cơ tôm sú chúng tôi đã thu đƣợc 167.907 contig. Có 265 contig bắt cặp đạt tới trên 97% với các trình tự trong GenBank. Các contig này có thuộc các gen của tôm sú đã đƣợc nghiên cứu và công bố trong GenBank. Tổng số Blast hit đạt 10.970. Số này có thể thuộc các gen chƣa đƣợc công bố của tôm sú. Hệ gen tôm sú chƣa đƣợc giải mã và công bố trong GenBank vì vậy việc tìm hiểu hệ phiên mã của các mô tôm sú sẽ cung cấp các thông tin quan trọng để chú giải gen trong hệ gen và khai thác các marker để phục vụ cho nghiên cứu lập bản đò gen tôm sú. Khai thác hệ phiên mã mô cơ tôm sú đã giải trình tự, chúng tôi thu đƣợc 26.160 SNPs và 104.815 microsatellites. Chúng tôi sẽ tiếp tục khai thác các marker này kết hợp với hệ phiên mã các mô khác của tôm sú để tạo ra một sơ sở dữ liệu phục vụ cho các nghiên cứu cơ bản và ứng dụng trong công tác chọn giống tôm sú.

KẾT LUẬN

Từ các kết quả đã nghiên cứu trình bày ở trên, chúng tôi có một số kết luận nhƣ sau.

1. Đã giải mã thành công hệ phiên mã mô cơ tôm sú bằng máy xác định trình tự gen thế hệ mới Illumina MiSeq.

2. Đã phân tích và lắp ráp đƣợc 167.907 contig từ kết quả giải trình tự hệ phiên mã mô cơ tôm sú.

3. Đã xác định đƣợc 265 contig có độ tƣơng đồng ≥ 97% so với các trình tự trong GenBank.

4. Tổng số contig có Blast hit đạt 10.970.

5. Đã tìm đƣợc 26.160 SNPs và 104.815 microsatellites từ các contig đã thu đƣợc từ thƣ viện cDNA transcriptome mô cơ tôm sú.

KIẾN NGHỊ

1. Tiếp tục nghiên cứu định tên các gen biểu hiện từ hệ phiên mã mô cơ tôm sú.

2. Nghiên cứu khả năng ứng dụng các marker đã thu đƣợc để ứng dụng trong lập bản đồ gen tôm sú.

TÀI LIỆU THAM KHẢO

1. Lehnert SA, Wilson KJ, Byrne K, Moore SS (1999) Tissue-specific expressed sequence tags from the black tiger shrimp Penaeus monodon. Mar Biotechnol 1(5):465–476.

2. Sritunyalucksana K, Söderhäll K (2000) The proPO and clotting system in crustaceans. Aquaculture 191:53–69.

3. Briggs, H. 2001. "Dispute Over Number of Human Genes," BBC News Online.

4. Gross PS, Bartlett TC, Browdy CL, Chapman RW, Warr GW (2001). Immune gene discovery by expressed sequence tag analysis of hemocytes and hepatopancreas in the pacific white shrimp, Litopenaeus vannamei, and the Atlantic white shrimp, L. setiferus. Dev Comp Immunol 25(7):565–577.

5. Wright, F., et al. 2001. "A Draft Annotation and Overview of the Human Genome," Genome Biology 2, 1-18.

6. Iwanaga S (2002) The molecular basis of innate immunity in the horseshoe crab. Curr Opin Immunol 14:87–95.

7. Supungul P, Klinbunga S, Pichyangkura R, Jitrapakdee S, Hirono I, Aoki T, Tassanakajon A (2002) Identification of immune-related genes in hemocytes of black tiger shrimp (Penaeus monodon). Mar Biotechnol 4(5):487–494.

8. Pennisi, E. 2003. "A Low Number Wins the GeneSweep Pool," Science 300, 1484.

9. Smith VJ, Brown JH, Hauton C (2003) Immunostimulation in crustaceans: does it really protect against infection? Fish Shellfish Immunol 15:71–90.

10. Leelatanawit R, Klinbunga S, Puanglarp N, Tassanakajon A, Jarayabhand P, Hirono I, Aoki T, Menasveta P. Isolation and characterization of differentially

expressed genes in ovaries and testes of the giant tiger shrimp (Penaeus monodon). Mar Biotechnol 2004; 6:S506-S510.

11. Tonganunt M, Phongdara A, Chotigeat W, Fujise K. Identification and characterization of syntenin binding protein in the black tiger shrimp Penaeus monodon. J Biotechnol 2005; 120(2):135-45.

12. Klinbunga S, Preechaphol R, Thumrungtanakit S, Leelatanawit R, Aoki T, Jarayabhand P, Menasveta P. Genetic diversity of the giant tiger shrimp (Penaeus monodon) in Thailand revealed by PCR-SSCP of polymorphic EST- derived markers. Biochem Genet 2006; 44(5-6):222-36.

13. Maneeruttanarungroj C, Pongsomboon S, Wuthisuthimethavee S, Klinbunga S, Wilson KJ, Swan J, Li Y, Whan V, Chu KH, Li CP, Tong J, Glenn K, Rothschild M, Jerry D, Tassanakajon A. Development of polymorphic expressed sequence tag-derived microsatellites for the extension of the genetic linkage map of the black tiger shrimp (Penaeus monodon). Anim Genet 2006; 37(4):363-8. 14. O'Leary NA, Trent HF III, Robalino J, Peck MET, Mckillen DJ, Gross PS

(2006) Analysis of multiple tissue-specific cDNA libraries from the Pacific whiteleg shrimp, Litopenaeus vannamei. Integrative and Comparative Biology 46:931–939.

15. Alcivar-Warren A, Meehan-Meola D, Wang Y, Guo X, Zhou L, Xiang J, Moss S, Arce S, Warren W, Xu Z, Bell K. Isolation and mapping of telomeric

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu hệ phiên mã từ mô cơ của tôm sú penaeus monodon tại việt nam (Trang 37 - 59)

Tải bản đầy đủ (PDF)

(59 trang)