CHƯƠNG III. KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN
3.5. Xây dựng chỉ thị DNA để nhận dạng Xáo tam phân P. trimera
3.5.6. Đánh giá chỉ thị phân tử dựa vào phân tích khoảng cách mã vạch
Từ kết quả phân tích cây tiến hóa và các vị trí nucleotide khác biệt đặc thù cho loài Xáo tam phân từ các chỉ thị ITS, matK và rbcL (lưu ý chỉ thị rbcL không đưa ra vùng/vị trí nucleotide đặc thù), để xác định khả năng phát triển chỉ thị phân tử DNA làm vùng trình tự mã vạch, phân tích sâu hơn bằng chương trình ExcaliBAR được thực hiện nhằm xác định khoảng cách loài giữa các mẫu nghiên cứu khi phân tích bằng mỗi vùng trình tự lựa chọn, ITS, matK, rbcL và trình tự ghép nối (tổ hợp cả 3 vùng trình tự kể trên thành một trình tự).
Để đánh giá chỉ thị phân tử sử dụng làm DNA mã vạch, phân tích khoảng cách phân biệt loài giữa các mẫu phân tích bằng chương trình ExcaliBAR dựa vào ma trận khoảng cách được tạo bởi chương trình MEGA-X cho thấy, khoảng cách trong loài (intraspecific distance) và khoảng cách giữa các loài (interspecific distance) tương ứng với các trình tự ITS, matK, rbcL và trình tự ghép nối cả 3 trình tự ITS + matK+rbcL (concatenated sequence) lần lượt là 0,11 ± 0,01, 0,29 ± 0,02, rbcL 0,48 ± 0,05 và 0,05 ± 0,0001 (Bảng 3.6).
Sự chồng lấp khoảng cách xảy ra khi 2 khoảng giá trị trong loài và giữa các loài giao nhau. Khoảng cách tối thiểu giữa các trình tự đã quan sát được trong các trường hợp ITS, rbcL và các trình tự ghép nối (Bảng 3.6). Trong trường hợp matK, khoảng cách mã rõ rệt giữa 2 khoảng giá trị trong loài và giữa các loài với giá trị khoảng cách trong loài cao nhất (maximum intraspecific distance) là 0,0028 và khoảng cách giữa các loài nhỏ nhất (minimum interspecific distance) là 0,0056.
Biểu đồ (histogram) và khoảng cách Ranked pairwise (K2P) cho thấy có sự khác biệt đáng kể trong trường hợp của matK và rbcL (Hình 3.27B và 3.27C).
Bảng 3.6. Khoảng cách trong loài và giữa loài của các dữ liệu trình tự
Overall mean dist. (*) Minimum
Maximum Average
Ghi chú: (*) trình tựghép nối cả3 trình tựITS + matK + rbcL.
Hình 3.27. Biểu đồ khoảng cách Histogram và ranked pairwise giữa các trình tự bằng chương trình ABGD
Khoảng cách trong loài và giữa các loài được tính bằng chương trình ABGD (automated barcode gap discovery). ITS (A), matK (B), rbcL (C) và trình tự ghép nối (D) giữa các
trình tự chỉ thị DNA của P. trimera và các loài gần gũi.
Khoảng cách trong loài tối đa và giữa các loài tối thiểu trong bảng 3.6 phù hợp với kết quả phân tích tiến hóa trong cây phát sinh loài. Kết quả phân tích cho thấy, matK được coi là 1 chỉ thị DNA (DNA barcode) ứng cử viên hiệu quả để nhận dạng và phân biệt Xáo tam phân P. trimera với các loài họ hàng trong chi Paramignya và một số loài thuộc chi khác trong họ Rutaceae. Sự hiện diện của các nhanh kề cận nhau (paraphyletic group) trong cây phát sinh loài dựa vào trình tự
rbcL đã phần nào phản ánh mối quan hệ chưa thực sự rõ ràng giữa các loài có mối quan hệ rất gần nhau.
Sự chồng khoảng cách của các giá trị “Maximum intraspecific distance”
“minimum interspecific distance” giữa các loài P. trimera với P. armata và P.
monophylla cho thấy rbcL không phải là ứng cử viên phù hợp để phát triển chỉ thị DNA ít nhất đối với các loài thuộc chi Paramignya nhằm phân biệt giữa P. trimera với các loài khác thuộc chi Paramignya. Kết quả cũng phù hợp với kết quả trong nghiên cứu về phát sinh loài bằng trình tự nucleotide của phân họ Aurantioideae (sub-family) sử dụng trình tự DNA lục lạp (cpDNA) [98]. Sự trùng lặp giữa khoảng cách giữa giá trị “Maximum intraspecific distance” “minimum interspecific distance” cho thấy P. trimera và các dạng trung gian có thể là con lai giữa các loài P. trimera với P. monophylla hoặc P. armata (Bảng 3.6).
Dựa trên cả dữ liệu về hình thái và trình tự DNA của P. trimera và các loài họ hàng, việc đề xuất sử dụng trình tự matK làm chỉ thị phân tử DNA barcode để nhận dạng và phân biệt loài Xáo tam phân với các loài khác thuộc chi Paramignya. Thực tế cho thấy, một chỉ thị chỉ đáng tin cậy khi có khoảng cách đủ lớn giữa các giá trị
“Maximum intraspecific distance” và “minimum interspecific distance”. Việc sử dụng giá trị trung bình thay vì khoảng cách giữa 2 giá trị khoảng cách trên có thể làm tăng khoảng cách giữa các chỉ thị DNA barcode dẫn đến nhận dạng loài không chính xác. Do đó, trong trường hợp của P. trimera, cách tiếp cận sử dụng chỉ thị matK vì chỉ thị này đáp ứng được yêu cầu về sự khác biệt giữa 2 giá trị khoảng cách. Mặc dù biểu đồ và khoảng cách theo cặp được xếp hạng (K2P) được phân tích bởi chương trình ABGD cho thấy khoảng cách rõ ràng trong cả hai trường hợp matK và rbcL (Hình 3.27), nhưng khoảng cách mã vạch rõ ràng chỉ xác định được trong trường hợp của matK chứ không phải rbcL. Các trình tự DNA khác bao gồm ITS, rbcL và các trình tự ghép nối đã cho thấy không hiệu quả để giải quyết các mối quan hệ giữa Xáo tam phân và các loài khác thuộc chi Paramignya, chẳng hạn như P. armata, P. scandens, P. monophylla và P. rectispinosa.
Từ kết quả phân tích kết hợp giữa việc xác định vùng trình tự chung (consensus) và phân tích khoảng cách phân biệt loài của các chỉ thị ITS, matK và rbcL cho thấy, so với trình tự matK và rbcL, mặc dù ITS cho thấy tỷ lệ nucleotide đa hình cao hơn và có nhiều vị trí giàu thông tin hơn (infomative sites) nhưng ITS không
đủ điều kiện để phát triển chỉ thị phân tử (DNA mã vạch/DNA barcode) để phân biệt giữa các loài thuộc chi Paramignya. Mặc dù sự so sánh này chỉ mang tính tương đối do các bộ dữ liệu về các loài thuộc chi Paramignya còn hạn chế và chưa đồng bộ.
Tuy nhiên, kết quả thu được từ nghiên cứu này cũng đã cung cấp thêm thông tin chi tiết về mức độ hiệu quả của việc lựa chọn trình tự chỉ thị DNA để phát triển DNA mã vạch để nhận dạng chính xác P. trimera cũng như các loài thuộc chi Paramignya. Nguyên nhân của vấn đề này do nhiều yếu tố, trong đó quan trọng nhất là số lượng mẫu chưa thực sự đủ lớn khi thu thập ở các vị trí trí địa lý khác nhau, đồng thời sự thiếu nhất quán hoặc hoàn toàn chắc chắn về mặt dữ liệu hình thái cũng như thuật toán phân tích khi xây dựng các cây tiến hóa. Ngoài ra, hiện tượng lai xa, hiện tượng tự bất hợp, sinh sản vô phối và đột biến ngẫu nhiên giữa các mẫu dẫn đến khó khăn hoặc nhiễu khi phân tích kết quả.
Sự tương hợp rộng về khả năng sinh sản và giao phấn giữa các loài trong chi Paramignya và các chi khác trong họ Rutaceae cũng là một trong những nguyên nhân dẫn đến khó khăn trong việc xác định phân loại. Mặc dù cơ sở dữ liệu toàn diện như hệ thống BOLD đã được phát triển nhanh chóng trong thời gian gần đây nhưng bộ dữ liệu về chỉ thị phân tử hay DNA mã vạch còn rất hạn chế, đặc biệt đối với loài Xáo tam phân cũng như chi Paramignya. Việc kiểm tra hiệu quả (validation) của các DNA mã vạch để đánh giá mức độ chính xác trong việc nhận dạng và phân biệt loài cũng gặp nhiều khó khăn. Tuy vậy, kết quả nghiên cứu này cũng góp phần quan trọng trong việc xây dựng và phát triển các chỉ thị phân tử DNA hoặc DNA mã vạch. Việc nhận dạng và phân biệt loài chính xác sẽ chỉ hiệu quả khi các cơ sở phân loại hình thái, hệ thống học thực vật được mô tả một cách vững chắc, ổn định và số lượng mẫu cho phân tích trình tự đủ lớn. Rõ ràng chỉ thị DNA hay DNA mã vạch vẫn là một hệ thống nhận dạng và xác định loài hiệu quả bằng cách lựa chọn một trình tự đặc thù loài được chuẩn hóa làm mã vạch. Tuy nhiên, câu hỏi về vùng DNA nào có thể được sử dụng làm mã vạch tiêu chuẩn cho các loài thuộc chi Paramignya vẫn cần được nghiên cứu để giải quyết một cách thỏa đáng trong việc nhận dạng loài Xáo tam phân cũng như các loài khác thuộc chi Paramignya.
Dựa trên kết quả thu được từ nghiên cứu này, chúng tôi đề xuất sử dụng trình tự DNA lục lạp matK làm chỉ thị DNA để nhận dạng và phân biệt Xáo tam phân với các loài thuộc chi Paramignya. Việc kết hợp với các dữ liệu khác sẽ giúp giảm thiểu
xác suất nhận dạng sai. Do đó, việc nghiên cứu hệ thống sâu hơn và xác định loài của chi Paramignya vẫn cần thiết để cung cấp dữ liệu tham khảo để phát triển DNA mã vạch và phân biệt loài. Trên cơ sở đó cung cấp nền tảng lý thuyết và hỗ trợ hiệu quả cho việc xác định chính xác để nhân giống và bảo tồn các cây thuốc có giá trị.