Đa hình phân tử là sự khác biệt về mặt di truyền ở cấp độ phân tử giữa các cá thể trong quần thể. Nghiên cứu đa hình phân tử dựa trên cơ sở các chỉ thị phân tử (CTPT), so với các quan sát, nghiên cứu truyền thống - chủ yếu là các chỉ tiêu về hình thái và một số chỉ tiêu sinh hoá, các CTPT có một số ưu điểm vượt trội:
- CTPT phản ánh mức độ biến động rất cao trong phân tử DNA, chính vì thế nghiên cứu đa hình phân tử không cần phải gây đột biến.
- CTPT phản ánh trực tiếp kiểu gen, nó không phụ thuộc vào yếu tố môi trường, mô và giai đoạn phát triển. Do vậy, các kỹ thuật phân tử chỉ cần lượng nhỏ của bất kỳ loại mô nào, bất kỳ trạng thái, giai đoạn phát triển nào miễn là từ đó có thể tách được một lượng nhỏ DNA đủ cho phân tích [1], [9].
Dưới đây là một số kỹ thuật phân tử thường được sử dụng trong nghiên cứu đa hình:
Nguyễn Thị Lan 24
1.4.1. Kỹ thuật PCR
Phương pháp PCR được Kary Mullis phát minh vào năm 1985 và tiếp tục được hoàn thiện, phát triển thông qua sự phân lập và sản xuất enzyme tổng hợp DNA chịu nhiệt từ vi khuẩn Thermus aquaticus, cùng với đó là sự thiết kế thành công các máy chu kỳ nhiệt cho phép nhanh chóng và chính xác nhiệt độ cho từng giai đoạn phản ứng. Cho đến nay kỹ thuật PCR được xem như là một trong những phương pháp nền quan trọng của công nghệ sinh học hiện đại [13].
Các thành phần của phản ứng PCR bao gồm [13]:
- Enzyme chịu nhiệt, thường sử dụng là DNA Taq polymerase. Enzyme này có hoạt tính tối đa ở 720C và bền được với nhiệt độ.
- 4 loại dNTP là: Adenine, Thymine, Guanine, Cytosine (dATP, dTTP, dGTP, dCTP).
- DNA chứa các đoạn DNA mục tiêu sẽ được nhân bản trong ống phản ứng.
- Các đoạn mồi (primer) xuôi và ngược là các đoạn oligonucleotide có chiều dài khoảng 20 – 30 nucleotide và có trình tự bổ sung một cách đặc hiệu với trình tự của 2 đầu đoạn DNA sẽ được nhân bản.
- Ion Mg++ trong muối MgCl2,, đệm buffer… ở nồng độ thích hợp.
Nguyên tắc của PCR: Về mặt nguyên tắc, một chu kỳ PCR sẽ bao gồm 3 giai đoạn nhiệt độ chính [13], [26]:
- Đầu tiên, nhiệt độ được đưa lên 940C, ở nhiệt độ này các liên kết hydro của mạch đôi DNA sẽ bị mất đi, nhờ vậy DNA đích bị tách (biến tính) thành các mạch đơn. Giai đoạn nhiệt độ này được gọi là giai đoạn biến tính.
- Tiếp theo, nhiệt độ sẽ được hạ đến 450C – 650C là nhiệt độ thích hợp để các đoạn mồi tìm đến bắt cặp bổ sung vào hai đầu của đoạn DNA đích, giai đoạn nhiệt độ này được gọi là giai đoạn bắt cặp.
Nguyễn Thị Lan 25
- Cuối cùng, nhiệt độ được đưa lên 720C là nhiệt độ cho hoạt tính của enzyme DNA Taq polymerase nhằm kéo dài các dNTP về phía đầu 3’ của đoạn mồi đang bắt cặp trên đầu 5’ của sợi DNA đích để bắt đầu cho sự tổng hợp nên mạch bổ sung.
Như vậy, qua một chu kỳ nhiệt, một DNA đích đã được nhân bản thành hai bản sao và nếu chu kỳ này được lặp đi lặp lại liên tục 30 đến 40 lần thì từ một DNA đích đã nhân bản thành 230 đến 240 bản sao.
Ưu và nhược điểm của phương pháp PCR
- Ưu điểm: Thời gian thực hiện nhanh, sau 3 giờ có thể khuếch đại được một trình tự đoạn gen đang quan tâm, thực hiện đơn giản và ít tốn kém, độ tinh sạch của mẫu không cần cao,…
- Nhược điểm: Phải có mồi đặc hiệu cho đoạn DNA cần khuếch đại, xuất hiện các băng phụ làm kết quả thiếu chính xác…
Ứng dụng của kỹ thuật PCR
PCR có phạm vi ứng dụng rất rộng trong công nghệ sinh học hiện đại [13]:
- Trong nghiên cứu genome: Nhân bản phân tử bằng PCR, PCR tái tổ hợp, kỹ thuật fingerprinting DNase I, multiplex PCR…
- Trong y học: Phát hiện tế bào T/virus gây ung thư máu, phát hiện virus viêm gan B, phát hiện virus Dengue gây bệnh sốt xuất huyết, phát hiện vi khuẩn lao...
1.4.2. Kỹ thuật RAPD
RAPD (Random Amplified Polymorphism DNA) – Là phương pháp phân tích đa dạng DNA khuyếch đại ngẫu nhiên, kỹ thuật này được phát hiện vào năm 1990 (Welsh và McClelland; William và cs). Phương pháp RAPD thực chất là quá trình nhân bản các đoạn DNA bằng kỹ thuật PCR có sử dụng các mồi thiết kế ngẫu nhiên (khoảng 10 nucleotide). Các mồi này sẽ bắt cặp một cách ngẫu nhiên với DNA khuôn ở vị trí bất kỳ nào mà tại đó có trình tự bổ sung với nó [17]. Các sản phẩm RAPD được phân tích bằng cách điện di trên gel. Hệ gen của hai loài khác
Nguyễn Thị Lan 26
nhau sẽ cho những đoạn băng trên gel khác nhau, từ đó có thể so sánh sự đa dạng sinh học của các giống.
Ƣu điểm và nhƣợc điểm của RAPD:
Ƣu điểm:
- Phát hiện tính đa dạng đáng tin (sự thay đổi thêm bớt nucleotide, xen đoạn…đều làm thay đổi kích thước đoạn nhân bản).
- Bộ mồi có thể sử dụng cho các loài khác nhau.
- Phương pháp này tiến hành đơn giản hơn so với RFLP, thời gian ngắn hơn (2 – 4 giờ), ít tốn kém.
- Phù hợp cho phân tích đa dạng di truyền và lập bản đồ gen.
Nhƣợc điểm:
- Sự xuất hiện các băng tính trội, điều đó không phân biệt được cá thể đồng hợp tử và cá thể dị hợp tử.
- Tính lập lại không cao do primer là primer ngẫu nhiên và phụ thuộc điều kiện phản ứng PCR.
- Trở ngại trong việc giải thích các băng có cùng tốc độ di chuyển.
1.4.3. Kỹ thuật RFLP
RFLP (Restriction Fragment Length Polymorphism DNA) – là kỹ thuật nghiên cứu tính đa hình chiều dài của các phân đoạn DNA dựa trên điểm cắt các enzim giới hạn (Restriction Enzyme, RE). Khi ủ DNA với enzim giới hạn trong dung dịch đệm thích hợp ở pH, nhiệt độ thích hợp sẽ sẽ tạo ra những phân đoạn DNA với kích thước khác nhau, từ đó lập nên các bản đồ gen [17].
Nguyên tắc của kỹ thuật này dựa trên độ đặc hiệu của các enzim cắt giới hạn đối với vị trí nhận biết của chúng trên DNA bộ gen. Kết quả tạo ra nhiều đoạn cắt giới hạn có kích thước và số lượng khác nhau, phụ thuộc vào số lượng và vị trí của các trình tự nhận biết đặc hiệu của từng RE. Để nhận biết và tách ly các đoạn cắt
Nguyễn Thị Lan 27
giới hạn, ta tiến hành điện di kết hợp với lai Southern blot và sử dụng mẫu dò thích hợp được gắn thêm đuôi chất phóng xạ hoặc enzym [18].
Quy trình thực hiện gồm các bước:
- Tách chiết và tinh sạch DNA.
- Cắt các mẫu DNA cần phân tích bởi cùng một cặp RE.
- Điện di và thực hiện lai Southern blot.
- Xác định đa dạng di truyền các đoạn cắt giới hạn, lập bản đồ di truyền các đoạn cắt giới hạn [18], [47].
Ƣu điểm và khuyết điểm của kỹ thuật RFLP
- RFLP có ưu điểm là marker đồng trội cho phép phân biệt được cá thể đồng hợp và dị hợp. Do kích thước DNA khảo sát trong RFLP lớn vì vậy số lượng dấu phân tử (marker) tạo ra nhiều đủ đáp ứng nhu cầu nghiên cứu.
- Tuy nhiên do qui trình thực hiện phức tạp, nguy hiểm đối với sức khoẻ người nghiên cứu (sử dụng phóng xạ đánh dấu) và DNA yêu cầu có chất lượng cao đã làm hạn chế việc sử dụng kỹ thuật này.
Cùng với sự phát triển kỹ thuật PCR, kỹ thuật PCR-RFLP trở nên đơn giản hơn. Một cặp mồi oligonucleotide có thể dùng khuếch đại một vùng DNA cần khảo sát, sau đó đoạn DNA được khuếch đại được cắt bằng các RE, điện di và phân tích trên gel nhuộm ethidium bromide hoặc nhuộm bạc. PCR-RFLP bỏ qua bước lai nên giá thành rẻ hơn và ít nguy hiểm hơn phương pháp RFLP [46], [47].
1.4.4. Kỹ thuật AFLP
Kỹ thuật AFLP (Amplified Fragments Length Polymorphism) được hiểu là sự đa dạng của các đoạn DNA được nhân lên có định hướng sau khi bị cắt bởi 2 enzim giới hạn, sử dụng những phân đoạn DNA làm khuôn cho phản ứng khuếch đại PCR. Là kỹ thuật kết hợp giữa RFLP và RAPD, AFLP là một trong những kỹ thuật in dấu DNA được phát triển bởi Vos và cộng sự năm 1995. Kỹ thuật này là
Nguyễn Thị Lan 28
một công cụ hữu ích để xác nhận nhiều loci của đa hình DNA mà không cần phải biết trước thông tin về trình tự DNA của chúng (Michelmore và ctv., 1998), phương pháp này có thể đưa ra nhanh chóng một ước lượng độ đa dạng di truyền trong và giữa những quần thể với nhau (Breyen và ctv., 1997; Cervera và ctv.,1996). . Sự ra đời của kỹ thuật AFLP là chìa khóa cho các nhà sinh học phân tử [48].
Nguyên tắc của phương pháp AFLP cũng giống như RFLP, điểm khác biệt cơ bản là AFLP không cần tiến hành lai phân tử (lai Southern blot ), do vậy thực hiện nhanh hơn.
Ƣu và nhƣợc điểm của AFLP:
Ƣu điểm:
- AFLP nhanh, đơn giản không phức tạp như RFLP nhưng vẫn khảo sát được toàn bộ gen.
- Kỹ thuật này chỉ cần lượng ít DNA ban đầu - Không cần biết trước trình tự đích
- Có độ lặp lại phản ứng cao
-Các mồi sử dụng không cần đặc hiệu loài
- Khuếch đại có chọn lọc một lượng lớn các đoạn DNA đa hình trong một phản ứng PCR, phù hợp cho việc phân tích đa dạng giữa các quần thể có quan hệ gần nhau.
Nhƣợc điểm:
- AFLP tạo ra một lượng lớn thông tin cần phải được phân tích tự động, vì thế cần sự giúp đỡ của kỹ thuật máy tính cao.
- AFLP là một marker trội, điều này làm hạn chế nhận biết cá thể đồng hợp và dị hợp.
- Lệ thuộc nhiều vào thao tác ở những bước đầu để có được phổ diện các phân đoạn DNA lý tưởng.
Nguyễn Thị Lan 29
- Nhân viên phải có kỹ thuật phòng thí nghiệm và đặc biệt là phân tích dữ liệu.
1.4.5. Kỹ thuật SSR
Kỹ thuật SSR (Simple Sequence Repeats) còn được gọi là kỹ thuật microsatellies (vi vệ tinh). Kỹ thuật này được Litt và Luty phát triển năm 1989 dựa trên nguyên tắc của PCR [1].
Trong cấu trúc hệ gen của sinh vật nhân chuẩn tồn tại một loạt các trình tự nucleotide lặp lại, chúng đặc trưng cho loài. SSR gồm 2 – 5 nucleotide lặp lại nhiều lần. Ví dụ: (AT)n, (AG)n, (AGTC)n. SSR nằm rải rác trong hệ gen của động vật và thực vật bậc cao. Đoạn mồi được thiết kế dựa trên vùng bảo thủ ở hai đầu của đoạn SSR. Số lần lặp lại nhiều lần làm cho các phân đoạn DNA được nhân có độ dài ngắn khác nhau. Các trình tự lặp lại thường có ở vùng dị nhiễm sắc trên mỗi nhiễm sắc thể. Chúng có vai trò điều hoà hoạt động của các gen, góp phần làm tăng tính ổn định cơ học của nhiễm sắc thể trong phân bào, nó có thể mang thông tin di truyền liên quan đến sự xác định giới tính ở cả động vật và thực vật. Do sự khác nhau về số lượng nucleotide trong mỗi đơn vị lặp lại mà số đơn vị lặp lại xuất hiện sự đa hình về độ dài của SSR được nhân bản. Mức độ đa hình được xác định sau khi điện di sản phẩm trên gel agarose và gel polyacrylamide. SSR là công cụ hữu ích trong phân tích hệ gen và chọn giống cây trồng vì đây là chỉ thị đồng trội có khả năng phát hiện tính đa hình rất cao [17].
Các bước tiến hành:
- Tách chiết, tinh sạch DNA
- Thực hiện PCR với mồi cho vùng bảo thủ ở hai bên đoạn lặp lại
- Điện di sản phẩm PCR, tính toán số liệu, so sánh sự sai khác, giống nhau của băng.
- Xử lý số liệu bằng các phần mềm chuyên dụng
Nguyễn Thị Lan 30
- Kỹ thuật SSR đơn giản, không tốn kém, là chỉ thị đồng trội nên được sử dụng để phát hiện cá thể dị hợp tử.
- Kỹ thuật SSR cho phép phát hiện nhanh đa hình phân tử giữa các cá thể. SSR được ứng dụng trong nghiên cứu di truyền quần thể, đánh giá mức độ đa dạng, nghiên cứu phát sinh chủng loại, xác định quan hệ huyết thống….
1.4.6. Kỹ thuật ISSR
Kỹ thuật ISSR (Inter simple sequence repeat - PCR hay SSR - anchored PCR) hoặc SSR neo, trong đó mồi sử dụng là đoạn trình tự microsatellite có chứa đoạn ngắn oligonucleotide neo ở đầu 5’ hay 3’, được gắn với DNA khuôn và bằng PCR, vùng khuyếch đại này được coi là sản phẩm riêng biệt. Trình tự khuếch đại của ISSR-PCR có thể được sử dụng cho DNA fingerprinting, kỹ thuật này hữu ích cho các phân tích phân loại sinh vật hoặc có thể giới hạn loài, sự đa dạng trong chuỗi thấp hơn kỹ thuật SSR [50].
Kỹ thuật ISSR ngày càng được nghiên cứu một cách rộng rãi ở cả thực vật, lẫn động vật, đặc biệt là động vật không xương sống [36]. Một lợi thế to lớn của ISSR là phổ mồi rộng cho nhiều loài động vật và thực vật, do vậy mà kỹ thuật này không cần phải thiết kế mồi PCR cho từng loài giống như microsatellites. Hơn nữa,
Sản phẩm PCR mồi neo đầu 3’
Hình 5. Sơ đồ phản ứng ISSR
Nguyễn Thị Lan 31
ISSR đòi hỏi ít các bước thử nghiệm nên chi phí ít hơn so với RFLP và độ tin cậy và lặp lại cao hơn so với RAPD [36].
Kỹ thuật này tạo ra số lượng lớn marker do cùng lúc gắn với nhiều microsatellite locus và cho phép hiển thị nhiều mẫu trên gel đơn nên được sử dụng nhiều trong nghiên cứu đa dạng di truyền, phân tích sự hình thành loài, bảo tồn sinh học, sinh thái học phân tử và tiến hoá loài [51].
1.4.7. Phần mềm NTSYSpc
Phần mềm NTSYSpc (Numerical Taxonomy and Multivariate Analysis System for personal computer) hiện được sử dụng rất phổ biến trong các viện nghiên cứu sinh học và trong các trường đại học.
Phần mềm NTSYSpc là phần mềm dùng để thống kê đặc điểm di truyền trong kỹ thuật DNA dựa vào kỹ thuật PCR mẫu DNA và sau đó điện di. Thông thường trong tự nhiên về mặt hình thái có những sinh vật hay cây có hình dáng bề ngoài rất giống nhau nhưng về bản chất di truyền thì khác nhau. Do vậy, việc thống kê tính giống và khác nhau của quần thể hay cá thể là việc rất cần thiết trong việc chọn tạo giống cho sản xuất cũng như việc phòng trừ sâu bệnh.
Một trong những ứng dụng hữu ích và phổ biến nhất của NTSYSpc là giải thích sự đa dạng của tập hợp sinh vật thông qua mối quan hệ giữa chúng trong lịch sử tiến hóa, đó là ứng dụng xây dựng cây tiến hóa thông qua dữ liệu mô tả tập hợp sinh vật. Ứng dụng phương pháp phân nhóm di truyền để xây dựng cây phân nhóm nhằm mục đích tuyển chọn các dòng bố mẹ có khoảng cách di truyền xa nhau, có năng suất phẩm chất tốt nhằm tăng mục tiêu xuất hiện ưu thế lai [54].
Lịch sử phát triển phần mềm
NTSYS phiên bản đầu tiên được xây dựng bằng ngôn ngữ lập trình FORTRAN cho hệ thống máy tính IBM 360/50 tại Đại học Kansas 1966. Đến năm 1985, F. Jame Rohlf và các nhà tin sinh học khác đã thiết kế nên NTSYSpc dựa trên nền của NTSYS, NTSYSpc có thể sử dụng độc lập trên hệ thống máy tính cá nhân
Nguyễn Thị Lan 32
(pc). Ngoài công cụ chính là phân nhóm dữ liệu trong lĩnh vực sinh học (thao tác và xây dựng cấu trúc đối với các dữ liệu đa biến), chương trình còn được ứng dụng rộng rãi trong nhiều lĩnh vực khác.
Trong lĩnh vực sinh học, chương trình có những ứng dụng riêng biệt. Với mục tiêu phân loại theo kiểu hình, NTSYSpc được sử dụng để phát hiện, mô tả mô hình của đa dạng sinh học và phân nhóm kết quả trên cơ sở tương đồng của dữ liệu đa biến [54].
Phạm vi ứng dụng phần mềm
NTSYSpc là hệ thống những chương trình được dùng để truy tìm và xuất ra màn hình cấu trúc của dữ liệu nhiều chiều, chẳng hạn bạn muốn khám phá một mẫu dữ liệu nào đó mà nó có chứa các thông tin đến từ hai hay nhiều quần thể riêng biệt.
Điều thú vị là khám phá ra những biến có tính tương quan cao. Trước đây chương trình được sử dụng trong sinh học, trong các lĩnh vực phân tích số học, nhưng không dừng lại ở đó chương trình còn được sử dụng rộng rãi trong hình thái học và các nghành khoa học phân loại số học, ứng dụng kỹ thuật đại diện cho các tập con của phép phân tích dữ liệu đa chiều và các hàm chứa các phương pháp phân tích trong lĩnh vực nhận dạng.
Bên trong lĩnh vực sinh học nó có thể phân biệt hai khả năng khác gần nhau nhất để phân loại. Trong phenetic (phân loại theo kiểu hình) quan tâm khám phá những mẫu mang tính đa dạng và sắp xếp mức độ phân loại dựa trên các phép tính tương quan từ dữ liệu nhiều chiều. Trong cladistic (phân loại theo nhánh) người ta thường quan tâm tới vấn đề tiến hóa của sinh vật. Giới phân tích sử dụng nó như một công cụ để xếp hạng mức độ sai khác giữa các dữ liệu.
Những phương pháp chuyên dụng được sử dụng để phân tích dữ liệu, những dữ liệu này được mã hóa thành dạng số liệu, các số liệu này sẽ được phân tích và sắp xếp lại thành một khối dữ liệu có tính tương quan lẫn nhau, từ đó dữ liệu có thể được truy xuất ra dạng biểu đồ hình cây (còn gọi là cây tiến hóa), dựa vào cây tiến hóa này mà giới nghiên cứu hi vọng đánh giá được mức độ đa dạng trong di truyền