Rumisha et al., 2017; Yu et al., 2017; Qiu et al, 2018; Kundu et al., 2018; Zhao et al., 2018; Santos et al., 2018; Siddique et al., 2018).
Mỗi loại chỉ thị DNA được phát triển bằng một kỹ thuật tương ứng. Các kỹ thuật chỉ thị DNA được chia thành các nhóm chính là: các kỹ thuật không sử dụng phản ứng PCR và các kỹ thuật sử dụng phản ứng PCR.
Kỹ thuật phân tích đa hình DNA nhân bản ngẫu nhiên (RAPD)
Sự phát triển của PCR đã dẫn đến những tiến bộ vượt bậc trong việc cải tiến các kỹ thuật phân tích chỉ thị DNA. Trong số các kỹ thuật phân tích chỉ thị DNA sử dụng PCR, RAPD và AFLP được sử dụng rộng rãi nhất (Nguyễn Đức Thành, 2014). Cơ sở của kỹ thuật RAPD là sự nhân bản DNA genome bằng phản ứng PCR với các mồi ngẫu nhiên để tạo ra sự đa hình DNA do sự tái sắp xếp hoặc mất nucleotide ở vị trí bắt cặp của mồi (Williams et al., 1990). Nói cách khác, đây là phương pháp khuếch đại ngẫu nhiên các locus chưa biết bằng PCR (Vaseeharan et al., 2013). Mồi sử dụng cho kỹ thuật RAPD là các mồi ngẫu nhiên, thường là 10 nucleotide và có nhiệt độ kéo dài mồi thấp (34 - 37oC). Mặc dù trình tự mồi RAPD là ngẫu nhiên nhưng phải đạt được hai tiêu chí là: tỷ lệ GC tối thiểu là 40% (thường
là 50-80%) và không có trình tự base đầu xuôi và ngược giống nhau. Sản phẩm PCR-RAPD thường được phân tách trên gel agarose 1,5 - 2,0 (Vaseeharan et al., 2013). Cơ sở phân tử của kỹ thuật RAPD được thể hiện ở Hình 1.3.
Kỹ thuật RAPD không cần thông tin về genome của đối tượng nghiên cứu và có thể ứng dụng cho các loài khác nhau với các mồi chung. Kỹ thuật này đơn giản và dễ thực hiện. Điểm hạn chế là sản phẩm PCR không ổn định do mồi ngắn, nhiệt độ bắt mồi thấp. Ngoài ra, kỹ thuật này tạo ra các chỉ thị trội do đó không phân biệt được các cá thể dị hợp tử với các cá thể đồng hợp tử. RADP được sử dụng nhiều trong nghiên cứu đa dạng di truyền giữa các loài thực vật (Kawa et al., 2009; Khan et al., 2010; Nguyen Duc Thanh et al., 2009a; Nguyễn Đức Thành et al., 2009b;
Nguyễn Đức Thành et al., 2000; Nguyen Duc Thanh et al., 2012; Tivang et al., 1996), trong nghiên cứu đặc điểm của giống và đánh giá biến đổi di truyền (Martin et al., 2002), trong xác định loài (Fouly et al., 1996; Rossi et al., 2000) và xác định con lai (Baird et al., 1992; Rokkan et al., 1994).
Kỹ thuật phân tích đa hình độ dài đoạn cắt hạn chế (RFLP)
RFLP là loại kỹ thuật phân tích chỉ thị DNA không sử dụng PCR. Trong kỹ thuật RFLP, đa hình DNA được xác định bằng cách lai đoạn dò DNA đánh dấu
Hình 1.3. Cơ sở phân tử của kỹ thuật RAPD (Nguồn: Liu & Cordes, 2004)
A. Sự thay thế base tại các vị trí liên kết mồi
Sản phẩm PCS Không có sản phẩm PCS Đột biến
base đơn
B. Sự chèn/xóa giữa hai RAPD primer
(DNA probe) với DNA sau khi cắt bằng enzyme cắt hạn chế và được thấm truyền lên màng lai bằng phương pháp Southern. Kết quả tạo ra hình ảnh các phân đoạn DNA khác nhau. Việc xác định các phân đoạn DNA được tiến hành bằng cách lai các phân đoạn DNA này với đoạn dò được đánh dấu huỳnh quang hoặc phóng xạ để có thể phát hiện bằng phản ứng huỳnh quang hoặc phim chụp phóng xạ (Hình 1.4) (Nguyễn Đức Thành, 2014; Vaseeharan et al., 2013).
Các chỉ thị RFLP có mức đa hình cao, đồng trội (nên có thể phân biệt được các cá thể dị hợp tử và đồng hợp tử) và khả năng lặp lại cao. Kỹ thuật RFLP cũng cho phép phân tích đồng thời nhiều mẫu. Tuy nhiên, kỹ thuật này không được dùng rộng rãi vì một số hạn chế như: cần nhiều DNA chất lượng cao, phải phát triển thư viện đoạn dò cho từng loài, cần thông tin về trình tự để tạo đoạn dò, không thuận tiện cho việc tự động hóa, mức độ đa hình và số lượng locus đối với mỗi lần phân tích thấp, đòi hỏi nhiều thời gian, tốn kém. Trong những thập niên 80 và 90 của thế kỷ trước, kỹ thuật RFLP được sử dụng trong lập bản đồ genome (Graner et al., 1991; Lander & Botstain, 1989), xác định giống (Karp et al., 1998). RFLP được dùng trong nghiên cứu quan hệ giữa các nhóm phân loại gần (Miller & Tanksley, 1990), đa dạng di truyền (Dubreuil et al., 1996), trong lai tạo và chuyển gen vào cá thể khác (introgression) bao gồm cả chuyển gen giữa cây trồng và cỏ dại (Clausen
& Spooner, 1998).
Hình 1.4. Các bước thực hiện kỹ thuật RFLP (Nguồn: Nguyễn Đức Thành, 2014)
Kỹ thuật phân tích đa hình vi vệ tinh (microsatellite)
Đây là nhóm kỹ thuật sử dụng các cặp mồi đặc trưng để nhân các vùng genome có các nucleotide lặp lại ở các vị trí khác nhau. Chỉ thị microsatellite được ưa chuộng trong các nghiên cứu về đa dạng di truyền vì chúng thể hiện mức độ biến đổi rất cao ở cá thể và quần thể. Microsatellite có thể là các trình tự lặp lại đơn giản (như: TGTGTGTGTG) hoặc phức tạp (như: GAA (GA)17 GAA) của các trình tự DNA ngắn, được tìm thấy rải rác hàng chục thậm chí hàng trăm, hàng ngàn lần trong toàn bộ hệ gen của hầu hết các loài eukaryote. Đây là loại trình tự lặp quan trọng nhất. Chúng lặp lại trước sau và thay đổi về số lượng ở các locus khác nhau cũng như ở các cá thể khác nhau (Vaseeharan et al., 2013). Microsatellite có khuynh hướng phân bố đồng đều trong hệ gen trên tất cả các nhiễm sắc thể và tất cả các vùng của nhiễm sắc thể. Chúng được tìm thấy bên trong các vùng gen mã hóa (Liu et al., 2001c), các intron và trong các trình tự không chứa gen. Hầu hết các locus microsatellite tương đối nhỏ. Đặc điểm này rất quan trọng đối với kỹ thuật gen sử dụng PCR. Nói chung, các microsatellite chứa một số lượng lớn đoạn lặp lại thì tính đa hình cao hơn, mặc dù sự đa hình cũng đã được quan sát thấy ở các microsatellite chỉ có 5 lần lặp lại (Karsi et al., 2002b; Liu & Cordes, 2004).
Hình 1.5. Minh họa đa hình microsatellite
(Nguồn: http://genomics.cafs.ac.cn/ssrdb/index.php?do=about) A: Các alen chứa microsatellite đa hình
B: Kết quả điện di phân tách các alen khác nhau ở các kiểu gen đồng hợp tử (1/1, 2/1, 3/3) so với các kiểu gen dị hợp tử (1/2, 1/3, 2/3).
A
B
Đa hình microsatellite dựa trên cơ sở sự khác nhau về kích thước. Sự khác nhau này gây ra do số lượng khác nhau của các đơn vị lặp chứa trong các alen tại một locus nhất định. Tỉ lệ đột biến khoảng 10-2 trên mỗi thế hệ (Weber & Wong, 1993; Crawford & Cuthbertson, 1996) và nguyên nhân được cho là do sai sót của enzyme polymerase trong quá trình sao chép DNA, dẫn đến những khác biệt về số lượng các đơn vị lặp lại (Liu & Cordes, 2004). Hình 1.5 minh họa đa hình microsatellite.
Kỹ thuật phân tích đa hình nucleotide đơn (SNP)
SNP là các đa hình được tạo ra bởi các đột biến điểm làm xuất hiện các alen khác nhau do sự thay thế nucleotide hoặc chèn/xóa nucleotide đơn ở một vị trí nhất định bên trong một locus. Những khác biệt về trình tự đó đã được mô tả từ khi DNA bắt đầu được giải trình tự vào năm 1977. Tuy nhiên, khả năng phân tích SNP nhanh chóng trong một số lượng lớn mẫu chỉ được thực hiện khi có ứng dụng của công nghệ chip gen vào cuối những năm 1990. SNP trở thành tiêu điểm trong việc phát triển marker phân tử vì chúng là loại đa hình phong phú nhất trong bất kỳ sinh vật nào, thích hợp với việc tự động hóa và chỉ ra được các đa hình bị ẩn đi hoặc không phát hiện được bởi các marker và các phương pháp khác (Vaseeharan et al., 2013;
Liu & Cordes, 2004).
Về lý thuyết, một SNP bên trong một locus có thể tạo ra 4 alen. Tuy nhiên trong thực tế, hầu hết các SNP thường chỉ hạn chế từ một đến hai alen (thường là hai pyrimidine C/T hoặc hai purin A/G) và được coi như là hai alen. Tuy giá trị thông tin đa hình (PIC) của các SNP không cao bằng các microsatellite đa alen, nhưng hạn chế này lại được cân bằng bởi số lượng rất lớn của chúng. Các marker SNP được di truyền theo kiểu marker đồng trội (Liu & Cordes, 2004). Ở ngô cứ 60 đến 100 bp có một SNP (Ching et al., 2002), ở người 90% thay đổi trình tự là thay đổi nucleotide đơn và cứ 1000 bp có một SNP (Sachidanandam et al., 2001;
Nguyễn Đức Thành, 2014).
Trong những năm gần đây, SNP được ứng dụng rộng rãi như một loại CTPT hiệu quả trong các chương trình chọn giống dựa trên chỉ thị phân tử (MAS) (Majeed
et al., 2019). Các ứng dụng chủ yếu của SNP trong thủy sản là các nghiên cứu hệ gen và được sử dụng như là các marker chẩn đoán bệnh. Vì là phần chính của các chip gen nên chúng được coi như là các marker thế hệ mới trong lĩnh vực thủy sản (Vaseeharan et al., 2013). Hình 1.6 minh họa chỉ thị đa hình SNP.
Có nhiều phương pháp phát hiện SNP, trong đó giải trình tự DNA là phương pháp chính xác nhất và được sử dụng nhiều nhất. (Liu & Cordes, 2004). Việc phân tích trực tiếp sự khác nhau trong trình tự giữa nhiều cá thể với số lượng lớn các locus có thể được thực hiện bởi công nghệ giải trình tự thế hệ mới (NGS) (Nguyễn Đức Thành, 2014). SNP thường được sử dụng trong lập bản đồ di truyền (Kim et al., 2010; Raman et al., 2014; Wu et al., 2014), trong nghiên cứu đa dạng di truyền (Frascaroli et al., 2013; Kaur et al., 2014) và trong chọn giống (Ha et al., 2007).
Kỹ thuật phân tích đa hình độ dài các đoạn khuếch đại (AFLP)
Kỹ thuật AFLP được sử dụng để phân tích sự đa hình DNA bằng cách nhận biết đồng thời hàng trăm phân đoạn DNA đã được khuếch đại chọn lọc. Kỹ thuật này được giới thiệu lần đầu tiên bởi Vos et al. (1995). Quy trình thực hiện AFLP gồm các bước: cắt DNA hệ gen, gắn các phân đoạn DNA với các adaptor thích hợp, phản ứng PCR tiền khuếch đại và khuếch đại chọn lọc. Hai enzyme cắt hạn chế thường được sử dụng phối hợp là EcoRI (có trình tự nhận biết 6 base) và MseI (có trình tự nhận biết 4 base). Một số mồi đánh dấu huỳnh quang thường được sử dụng
b c a
Hình 1.6. Minh họa SNP trong một đoạn DNA sợi kép ở ba cá thể giả định Cây 1 (a) dạng dị hợp tử, Cây 2 và Cây 3 (b và c) dạng đồng hợp tử.
(Nguồn: http://www.treeimprovement.org/content/figure-1)
cho phản ứng khuếch đại chọn lọc AFLP như: EcoRI-ACT FAM, EcoRI-ACA FAM, EcoRI-AAC NED, EcoRI-ACC NED, EcoRI-AGC NED, EcoRI-AAG JOE, EcoRI-AGG JOE, EcoRI-ACG JOE. Các sản phẩm khuếch đại AFLP (các đoạn DNA có kích thước khác nhau) được phân tách bằng điện di và nhận diện các đoạn có mặt hay vắng mặt trong số các mẫu dựa vào các tín hiệu huỳnh quang trên các thiết bị chuyên biệt. AFLP có thể được sử dụng cho nhiều mục đích khác nhau như:
kiểm tra tính đồng nhất hay mức độ tương đồng về mặt di truyền, xác định các locus, xác định kiểu di truyền của các cá thể hoặc phân biệt các cá thể dựa trên các alen (Applied Biosystems, 2010. AFLP® Plant Mapping Protocol).
Ưu điểm nổi bật của AFLP là khả năng sàng lọc đồng thời nhiều vùng DNA khác nhau phân bố ngẫu nhiên trên toàn hệ gen. AFLP kết hợp được những thế mạnh của cả RFLP và RAPD và khắc phục được những hạn chế của chúng. Phương pháp này dựa trên cơ sở PCR và không cần biết trước thông tin về trình tự như đối với RFLP. Đây là phương pháp đáng tin cậy vì tính nghiêm ngặt cao của PCR, trái với nhược điểm về độ lặp lại thấp của RAPD. Ưu điểm chính của AFLP là một số lượng lớn các đa hình có thể được ghi nhận trên một bản gel polyacrylamide duy nhất mà không cần bất kỳ nghiên cứu hay phát triển nào trước đó. Tương tự như đối với RAPD, việc phân tích AFLP cho phép sàng lọc nhiều locus bên trong hệ gen trong một thời gian tương đối ngắn và không đắt tiền (Vaseeharan et al., 2013).
Cũng giống như RAPD, các marker AFLP được di truyền dưới dạng các marker trội: Nếu bố mẹ là đồng hợp tử thì tất cả các băng tổng hợp từ bố và mẹ sẽ thể hiện ở thế hệ F1, trong khi đó các băng dị hợp tử sẽ tách biệt (Liu et al., 1998; 1999).
Hạn chế chính của AFLP là cần có thiết bị chuyên biệt như máy giải trình tự tự động để phân tích các tín hiệu huỳnh quang, các phương pháp điện di truyền thống cũng có thể được sử dụng nhưng chúng lại đòi hỏi phải sử dụng các đánh dấu phóng xạ hoặc các kỹ thuật nhuộm đặc biệt như nhuộm bạc (Liu & Cordes, 2004). Hạn chế khác của AFLP về mặt phương pháp luận là khó để phân tích do số lượng lớn các phân đoạn không liên quan cũng được quan sát thấy (trên gel) cùng với các phân đoạn đa hình (như đối với RAPD) (Vaseeharan et al., 2013). Các bước chính của kỹ
thuật AFLP được mô tả ở Hình 1.7.
(a) Chuẩn bị mẫu DNA tổng số
Enzyme cắt hạn chế (MseI và EcoRI)
và DNA ligase
MseI adaptor
EcoRI adaptor
(b) Cắt bằng enzyme và gắn các adaptor
Vị trí cắt MseI Vị trí cắt EcoRI
MseI adaptor EcoRI adaptor
(c) Khuếch đại chọn lọc
Hình 1.7. Các bước chính của kỹ thuật AFLP (Nguồn: Mueller & Wolfenbarger, 1999)
(a) Chuẩn bị mẫu: Hỗn hợp phản ứng chứa DNA tổng số, các enzyme cắt hạn chế và các adaptor; (b) Phản ứng cắt DNA tổng số bằng enzyme cắt hạn
chế và gắn các adaptor; (c) Phản ứng khuếch đại chọn lọc.
Thiết bị phân tích: Máy xác định trình tự tự động sử dụng điện di mao quản ABI3100 (ABI3100 Genetic Analyzer) được sử dụng khá phổ biến trong nghiên cứu phân tích AFLP để đánh giá tính đa hình hệ gen. Loại thiết bị này có nhiều tính năng vượt trội như: mẫu được phân tích hoàn toàn tự động, hiệu suất cao, nguyên lý phát hiện dựa trên tín hiệu huỳnh quang, hệ thống bao gồm nhiều mao quản (multi- capillary) có thể phân tích đồng thời 4, 16, 48 hoặc 96 mẫu. Việc phân tích được thực hiện tự động, không cần giám sát từ bước tải mẫu, phân tách, phát hiện tín hiệu, tạo lập và lưu trữ dữ liệu (www.appliedbiosystems.com).
Phần mềm phân tích dữ liệu AFLP: Để hoàn thành thí nghiệm phân tích AFLP một cách thành công thì yếu tố quan trọng là phần mềm phân tích phải có khả năng ghi nhận một cách chính xác và có độ lặp lại cao đối với các mẫu phân tích. Phần mềm GeneMapper® Software Version 4.1 hoặc một số phiên bản khác có tính năng tương tự hoặc cao hơn cho phép phân tích dữ liệu điện di và dữ liệu giải trình tự các băng AFLP trên máy xác định trình tự tự động theo một phương pháp mới với những tính năng đảm bảo cho việc phân tính chính xác và đảm bảo độ lặp lại.
Những tính năng này bao gồm khả năng sử dụng các file dữ liệu của các mẫu phân tích để tạo ra tập hợp thông tin di truyền của các mẫu đó. Ngoài ra, phần mềm còn có tính năng xuất biểu đồ tùy chọn cho phép các biểu đồ (với mỗi biểu đồ được biểu thị bằng một màu duy nhất) được chồng lên nhau.
Phần mềm này sử dụng các thuật toán phân tích tiên tiến có thể xác định nhanh chóng và chính xác các peak đa hình và các peak phổ biến trong một lượng lớn các mẫu. Tính năng đánh giá chất lượng phân tích (GQ) cho phép ghi nhận các dữ liệu mẫu không rõ ràng/các tín hiệu bị mờ có chất lượng thấp để kiểm tra lại bằng phương pháp thủ công. Khi hoàn thành bước phân tích dữ liệu, phần mềm tự động tập hợp các kết quả theo một định dạng chuẩn gồm 2 phần, từ đó có thể xuất dữ liệu cho các bước phân tích tiếp theo. Phần mềm còn có một tính năng thuận tiện khác là
“Report Manager” cho phép tạo ra các báo cáo chứa các kết quả phân tích cuối cùng có thể được in ra hoặc được xuất ra cho các bước phân tích khác. Người sử dụng có thể tùy chỉnh định dạng của các báo cáo này phù hợp với từng nghiên cứu cụ thể.