(Nguồn: http://genomics.cafs.ac.cn/ssrdb/index.php?do=about)
A: Các alen chứa microsatellite đa hình
A
Đa hình microsatellite dựa trên cơ sở sự khác nhau về kích thước. Sự khác nhau này gây ra do số lượng khác nhau của các đơn vị lặp chứa trong các alen tại một locus nhất định. Tỉ lệ đột biến khoảng 10-2
trên mỗi thế hệ (Weber & Wong, 1993; Crawford & Cuthbertson, 1996) và nguyên nhân được cho là do sai sót của enzyme polymerase trong quá trình sao chép DNA, dẫn đến những khác biệt về số lượng các đơn vị lặp lại (Liu & Cordes, 2004). Hình 1.5 minh họa đa hình microsatellite.
Kỹ thuật phân tích đa hình nucleotide đơn (SNP)
SNP là các đa hình được tạo ra bởi các đột biến điểm làm xuất hiện các alen khác nhau do sự thay thế nucleotide hoặc chèn/xóa nucleotide đơn ở một vị trí nhất định bên trong một locus. Những khác biệt về trình tự đó đã được mơ tả từ khi DNA bắt đầu được giải trình tự vào năm 1977. Tuy nhiên, khả năng phân tích SNP nhanh chóng trong một số lượng lớn mẫu chỉ được thực hiện khi có ứng dụng của cơng nghệ chip gen vào cuối những năm 1990. SNP trở thành tiêu điểm trong việc phát triển marker phân tử vì chúng là loại đa hình phong phú nhất trong bất kỳ sinh vật nào, thích hợp với việc tự động hóa và chỉ ra được các đa hình bị ẩn đi hoặc không phát hiện được bởi các marker và các phương pháp khác (Vaseeharan et al., 2013; Liu & Cordes, 2004).
Về lý thuyết, một SNP bên trong một locus có thể tạo ra 4 alen. Tuy nhiên trong thực tế, hầu hết các SNP thường chỉ hạn chế từ một đến hai alen (thường là hai pyrimidine C/T hoặc hai purin A/G) và được coi như là hai alen. Tuy giá trị thông tin đa hình (PIC) của các SNP không cao bằng các microsatellite đa alen, nhưng hạn chế này lại được cân bằng bởi số lượng rất lớn của chúng. Các marker SNP được di truyền theo kiểu marker đồng trội (Liu & Cordes, 2004). Ở ngô cứ 60 đến 100 bp có một SNP (Ching et al., 2002), ở người 90% thay đổi trình tự là thay đổi nucleotide đơn và cứ 1000 bp có một SNP (Sachidanandam et al., 2001; Nguyễn Đức Thành, 2014).
Trong những năm gần đây, SNP được ứng dụng rộng rãi như một loại CTPT hiệu quả trong các chương trình chọn giống dựa trên chỉ thị phân tử (MAS) (Majeed
et al., 2019). Các ứng dụng chủ yếu của SNP trong thủy sản là các nghiên cứu hệ
gen và được sử dụng như là các marker chẩn đốn bệnh. Vì là phần chính của các chip gen nên chúng được coi như là các marker thế hệ mới trong lĩnh vực thủy sản (Vaseeharan et al., 2013). Hình 1.6 minh họa chỉ thị đa hình SNP.
Có nhiều phương pháp phát hiện SNP, trong đó giải trình tự DNA là phương pháp chính xác nhất và được sử dụng nhiều nhất. (Liu & Cordes, 2004). Việc phân tích trực tiếp sự khác nhau trong trình tự giữa nhiều cá thể với số lượng lớn các locus có thể được thực hiện bởi cơng nghệ giải trình tự thế hệ mới (NGS) (Nguyễn Đức Thành, 2014). SNP thường được sử dụng trong lập bản đồ di truyền (Kim et al., 2010; Raman et al., 2014; Wu et al., 2014), trong nghiên cứu đa dạng di truyền
(Frascaroli et al., 2013; Kaur et al., 2014) và trong chọn giống (Ha et al., 2007). Kỹ thuật phân tích đa hình độ dài các đoạn khuếch đại (AFLP)
Kỹ thuật AFLP được sử dụng để phân tích sự đa hình DNA bằng cách nhận biết đồng thời hàng trăm phân đoạn DNA đã được khuếch đại chọn lọc. Kỹ thuật này được giới thiệu lần đầu tiên bởi Vos et al. (1995). Quy trình thực hiện AFLP
gồm các bước: cắt DNA hệ gen, gắn các phân đoạn DNA với các adaptor thích hợp, phản ứng PCR tiền khuếch đại và khuếch đại chọn lọc. Hai enzyme cắt hạn chế thường được sử dụng phối hợp là EcoRI (có trình tự nhận biết 6 base) và MseI (có trình tự nhận biết 4 base). Một số mồi đánh dấu huỳnh quang thường được sử dụng
b
c a
Hình 1.6. Minh họa SNP trong một đoạn DNA sợi kép ở ba cá thể giả định
Cây 1 (a) dạng dị hợp tử, Cây 2 và Cây 3 (b và c) dạng đồng hợp tử. (Nguồn: http://www.treeimprovement.org/content/figure-1)
cho phản ứng khuếch đại chọn lọc AFLP như: EcoRI-ACT FAM, EcoRI-ACA FAM, EcoRI-AAC NED, EcoRI-ACC NED, EcoRI-AGC NED, EcoRI-AAG JOE, EcoRI-AGG JOE, EcoRI-ACG JOE. Các sản phẩm khuếch đại AFLP (các đoạn DNA có kích thước khác nhau) được phân tách bằng điện di và nhận diện các đoạn có mặt hay vắng mặt trong số các mẫu dựa vào các tín hiệu huỳnh quang trên các thiết bị chuyên biệt. AFLP có thể được sử dụng cho nhiều mục đích khác nhau như: kiểm tra tính đồng nhất hay mức độ tương đồng về mặt di truyền, xác định các locus, xác định kiểu di truyền của các cá thể hoặc phân biệt các cá thể dựa trên các alen (Applied Biosystems, 2010. AFLP® Plant Mapping Protocol).
Ưu điểm nổi bật của AFLP là khả năng sàng lọc đồng thời nhiều vùng DNA khác nhau phân bố ngẫu nhiên trên toàn hệ gen. AFLP kết hợp được những thế mạnh của cả RFLP và RAPD và khắc phục được những hạn chế của chúng. Phương pháp này dựa trên cơ sở PCR và khơng cần biết trước thơng tin về trình tự như đối với RFLP. Đây là phương pháp đáng tin cậy vì tính nghiêm ngặt cao của PCR, trái với nhược điểm về độ lặp lại thấp của RAPD. Ưu điểm chính của AFLP là một số lượng lớn các đa hình có thể được ghi nhận trên một bản gel polyacrylamide duy nhất mà không cần bất kỳ nghiên cứu hay phát triển nào trước đó. Tương tự như đối với RAPD, việc phân tích AFLP cho phép sàng lọc nhiều locus bên trong hệ gen trong một thời gian tương đối ngắn và không đắt tiền (Vaseeharan et al., 2013).
Cũng giống như RAPD, các marker AFLP được di truyền dưới dạng các marker trội: Nếu bố mẹ là đồng hợp tử thì tất cả các băng tổng hợp từ bố và mẹ sẽ thể hiện ở thế hệ F1, trong khi đó các băng dị hợp tử sẽ tách biệt (Liu et al., 1998; 1999).
Hạn chế chính của AFLP là cần có thiết bị chun biệt như máy giải trình tự tự động để phân tích các tín hiệu huỳnh quang, các phương pháp điện di truyền thống cũng có thể được sử dụng nhưng chúng lại đòi hỏi phải sử dụng các đánh dấu phóng xạ hoặc các kỹ thuật nhuộm đặc biệt như nhuộm bạc (Liu & Cordes, 2004). Hạn chế khác của AFLP về mặt phương pháp luận là khó để phân tích do số lượng lớn các phân đoạn không liên quan cũng được quan sát thấy (trên gel) cùng với các phân đoạn đa hình (như đối với RAPD) (Vaseeharan et al., 2013). Các bước chính của kỹ
thuật AFLP được mơ tả ở Hình 1.7.
(a) Chuẩn bị mẫu
DNA tổng số Enzyme cắt hạn chế (MseI và EcoRI) và DNA ligase MseI adaptor EcoRI adaptor (b) Cắt bằng enzyme và gắn các adaptor Vị trí cắt MseI Vị trí cắt EcoRI
MseI adaptor EcoRI adaptor
(c) Khuếch đại chọn lọc
Hình 1.7. Các bước chính của kỹ thuật AFLP
(Nguồn: Mueller & Wolfenbarger, 1999)
(a) Chuẩn bị mẫu: Hỗn hợp phản ứng chứa DNA tổng số, các enzyme cắt hạn chế và các adaptor; (b) Phản ứng cắt DNA tổng số bằng enzyme cắt hạn
Thiết bị phân tích: Máy xác định trình tự tự động sử dụng điện di mao quản ABI3100 (ABI3100 Genetic Analyzer) được sử dụng khá phổ biến trong nghiên cứu phân tích AFLP để đánh giá tính đa hình hệ gen. Loại thiết bị này có nhiều tính năng vượt trội như: mẫu được phân tích hồn tồn tự động, hiệu suất cao, nguyên lý phát hiện dựa trên tín hiệu huỳnh quang, hệ thống bao gồm nhiều mao quản (multi- capillary) có thể phân tích đồng thời 4, 16, 48 hoặc 96 mẫu. Việc phân tích được thực hiện tự động, không cần giám sát từ bước tải mẫu, phân tách, phát hiện tín hiệu, tạo lập và lưu trữ dữ liệu (www.appliedbiosystems.com).
Phần mềm phân tích dữ liệu AFLP: Để hồn thành thí nghiệm phân tích AFLP
một cách thành cơng thì yếu tố quan trọng là phần mềm phân tích phải có khả năng ghi nhận một cách chính xác và có độ lặp lại cao đối với các mẫu phân tích. Phần mềm GeneMapper® Software Version 4.1 hoặc một số phiên bản khác có tính năng tương tự hoặc cao hơn cho phép phân tích dữ liệu điện di và dữ liệu giải trình tự các băng AFLP trên máy xác định trình tự tự động theo một phương pháp mới với những tính năng đảm bảo cho việc phân tính chính xác và đảm bảo độ lặp lại. Những tính năng này bao gồm khả năng sử dụng các file dữ liệu của các mẫu phân tích để tạo ra tập hợp thơng tin di truyền của các mẫu đó. Ngồi ra, phần mềm cịn có tính năng xuất biểu đồ tùy chọn cho phép các biểu đồ (với mỗi biểu đồ được biểu thị bằng một màu duy nhất) được chồng lên nhau.
Phần mềm này sử dụng các thuật tốn phân tích tiên tiến có thể xác định nhanh chóng và chính xác các peak đa hình và các peak phổ biến trong một lượng lớn các mẫu. Tính năng đánh giá chất lượng phân tích (GQ) cho phép ghi nhận các dữ liệu mẫu khơng rõ ràng/các tín hiệu bị mờ có chất lượng thấp để kiểm tra lại bằng phương pháp thủ cơng. Khi hồn thành bước phân tích dữ liệu, phần mềm tự động tập hợp các kết quả theo một định dạng chuẩn gồm 2 phần, từ đó có thể xuất dữ liệu cho các bước phân tích tiếp theo. Phần mềm cịn có một tính năng thuận tiện khác là “Report Manager” cho phép tạo ra các báo cáo chứa các kết quả phân tích cuối cùng có thể được in ra hoặc được xuất ra cho các bước phân tích khác. Người sử dụng có thể tùy chỉnh định dạng của các báo cáo này phù hợp với từng nghiên cứu cụ thể.
1.3. ỨNG DỤNG KỸ THUẬT PHÂN TÍCH CHỈ THỊ PHÂN TỬ TRONG NGHIÊN CỨU ĐA HÌNH HỆ GEN TƠM SÚ NGHIÊN CỨU ĐA HÌNH HỆ GEN TƠM SÚ
Thông tin về đa dạng di truyền của các quần thể tôm tự nhiên và nuôi trồng rất cần thiết đối với việc quản lý bền vững nguồn tài nguyên thủy sản, duy trì nịi giống, góp phần bảo tồn tính đa dạng của thủy vực và phục vụ công tác chọn giống. Đối với lĩnh vực nghiên cứu đa hình di truyền ở sinh vật nói chung và ở tơm sú nói riêng, ngồi các đặc điểm về hình thái, sinh hóa của lồi thì các CTPT là cơng cụ hữu hiệu để khảo sát đa hình hệ gen, xác định chính xác nhóm phân loại cũng như phân biệt giữa hai lồi giống nhau về đặc điểm hình thái và xác định các biến dị di truyền (Aziz et al., 2011). Việc ứng dụng công nghệ gen trong lĩnh vực thủy sản đã tạo nên những thành tựu đáng kể giúp tăng năng suất và bảo tồn đa dạng sinh học (Wenne, 2018; McAndrew & Napier, 2010; Abdelrahman et al., 2017; Macqueen et
al., 2017). Nhiều cơng trình nghiên cứu về đa hình hệ gen của các quần thể tơm sú
đã được công bố.
Benzie (2000) đã khảo sát các lồi tơm thuộc họ tôm he (Penaeid) và kết luận: ở quần thể tôm tự nhiên, việc đánh giá biến dị sử dụng các chỉ thị DNA cho thấy mức độ đa dạng cao hơn so với các chỉ thị allozyme. Tuy nhiên, các chỉ thị DNA có xu hướng củng cố kết quả quan sát được dựa trên các số liệu về allozyme. Từ năm 1997, nhóm nghiên cứu của giáo sư Tassanakajon (Thái Lan) đã sử dụng các chỉ thị RAPD để xác định đa dạng di truyền ở ba quần thể tự nhiên của tôm sú Thái Lan. Sử dụng 200 primer để sàng lọc, trong đó 84 primer cho sản phẩm khuếch đại. Kết quả cho thấy mức độ đa hình khác nhau đáng kể giữa các quần thể (Tassanakajon et
al., 1997). Trước đó, trong một nghiên cứu khác vào năm 1995, Garcia & Benzie đã
phát hiện tỷ lệ đa hình 6-7 % ở các quần thể P. monodon và cho rằng phương pháp RAPD rất hữu ích trong việc cung cấp chỉ thị cho việc tạo giống tôm Penaeid (Garcia & Benzie, 1995).
Trong nghiên cứu của Pan et al. (2004), 23 chỉ thị microsatellite đa hình đã
được sử dụng để đánh giá đa hình hệ gen ở tơm sú P. monodon. Microsatellite cũng đã được sử dụng trong nghiên cứu cấu trúc di truyền quần thể tôm sú ở Australia và
Thái Lan (Brooker et al., 2000; Tassanakajon et al., 2003). Nghiên cứu trên 312
mẫu tôm, Brooker et al. đã xác định được số lượng các alen có mặt ở các locus
Pmo9, Pmo25 và Pmo27 lần lượt là 84, 34 và 35. Phân tích đa dạng về độ dài của 3 locus microsatellite ở 5 quần thể khác nhau đã cho thấy sự khác biệt đáng kể giữa các quần thể ở vùng bờ biển phía Tây so với các quần thể ở vùng bờ biển phía Đơng và phía Nam (Brooker et al. 2000).
AFLP thường được sử dụng cùng với microsatellite để đánh giá đa dạng di truyền và lập bản đồ hệ gen tôm sú và các lồi thủy sản. Nhiều cơng trình nghiên cứu quần thể tơm sử dụng kỹ thuật AFLP đã được công bố (Liu et al., 1998, 1999; Wuthisuthimethavee et al., 2005; Zhang et al., 2007; Staelens et al., 2018…). Bản
đồ CTPT mật độ thấp của các lồi thủy sản như cá rơ phi, cá da trơn, tôm sú, cá bơn Nhật Bản và cá hồi Đại Tây Dương đã được xây dựng. Bản đồ CTPT mật độ cao ở cá hồi đã được công bố vào năm 2003. Theo Nichols et al. (2003), phần lớn các
CTPT ở cá (khoảng 1300 chỉ thị) trải rộng khắp toàn bộ hệ gen của chúng là chỉ thị AFLP và có khoảng 200 chỉ thị là microsatellite dạng nguyên gốc (Maqsood & Ahmad, 2017). Điều này cho thấy phạm vi ứng dụng rộng rãi và hiệu quả của chỉ thị AFLP trong lĩnh vực nghiên cứu đa hình di truyền các loài thủy sản.
Benzie et al. (2002) đã sử dụng kết hợp các chỉ thị mtDNA và RFLP để nghiên cứu quần thể tôm sú P. monodon ở vùng Ấn Độ Dương - Thái Bình Dương. Kết quả nghiên cứu cho thấy đa dạng di truyền cao nhất thể hiện ở quần thể vùng Indonesia, thấp hơn ở các quần thể vùng Philippine và Australia và thấp rõ rệt ở các quần thể Đông Nam châu Phi và Tây Australia. Đa dạng di truyền thấp ở các quần thể ranh giới về mặt địa lý ở vùng Đông Nam châu Phi và Tây Australia được xem là do các trở ngại về địa lý.
Kết hợp kỹ thuật RAPD và đa hình mtDNA (DNA ribosome 16S và một tổ hợp gồm 2 gen COI-COII), Klinbunga et al. (2001) đã nghiên cứu các quần thể tôm sú P. monodon thu nhận từ 5 khu vực, bao gồm Chumphon và Trat (Vịnh Thailand), Phangnga, Satun và Trang (Andaman Sea). Trong nghiên cứu phân tích mtDNA, các tác giả đã chỉ ra các dạng đơn bội tổ hợp của 37 mtDNA, tính đa dạng cao của
thể đơn bội (0,855) và tính đa dạng nucleotide (3,328 %) đối với P. monodon. Khác biệt về quần thể của P. monodon giữa vùng biển Andaman và vùng Vịnh Thái Lan được thể hiện rõ rệt (p < 0,0001). Các kết quả khác biệt quần thể là có ý nghĩa về di truyền giữa các quần thể vùng Chumphon và Trat khi sử dụng RAPD. Trái lại khi phân tích đa hình mtDNA thì các kết quả thu được không cho thấy được sự khác biệt giữa các mẫu này. Từ những phát hiện này, các tác giả đã kết luận rằng với giả định về tính trung lập chọn lọc của marker ty thể, có thể tồn tại dịng chảy gen thiên về giới tính cái giữa các quần thể P. monodon vùng Trat và Chumphon và tạo nên
một dạng khác biệt có tính bất thường.
Khamnamtong et al. (2009) đã nghiên cứu các quần thể tôm P. monodon ở các vùng biển Thái Lan (Satun, Trang, Phangnaga và Raong ở biển Andaman; Chumphon và Trat ở vịnh Thailand) bằng cách kiểm tra sự đa hình của COI ty thể. Mức độ đa dạng nucleotide trung bình giữa một cặp mitotype COI trên tất cả các mẫu là 6,604%; cho thấy sự đa dạng di truyền cao. Sự đa dạng di truyền cao ở tôm
P. monodon Thái Lan cho thấy rằng mỗi quần thể di truyền là một đơn vị quản lý
riêng biệt vì nó thể hiện các đặc điểm về động học và thành phần quần thể duy nhất đối với sự cải thiện di truyền các tính trạng quan trọng về mặt kinh tế thông qua chương trình chọn lọc sinh sản (Vaseeharan et al., 2013).
Wuthisuthimethavee et al. (2005) đã xây dựng một bản đồ liên kết dựa trên
microsatellite ở P. monodon, sử dụng 57 chỉ thị SSLP (Single Sequence Length Polymorphism), 1 chỉ thị EST (Expressed Sequence Tag), 1 chỉ thị SCAR (một chỉ thị PCR bắt nguồn từ AFLP dựa trên đa hình về tăng trưởng của P. monodon) và 76