1.4.1. Ứng dụng ở thực vật nói chung
Nghiên cứu mã vạch ADN thực vật đã vượt xa nhiệm vụ so sánh các vùng ADN khác nhau để tiến tới những ứng dụng thực tế hơn. Các ứng dụng này có thể được chia thành hai loại rộng. Một là để cung cấp cái nhìn sâu hơn vào phân loại học ở cấp độ loài và đóng góp vào quá trình phân loại học: nhận diện và phân chia ranh giới giữa các loài. Ứng dụng thứ hai, và là ứng dụng chính, là hỗ trợ quá trình nhận diện các mẫu vật không nhận biết được hoặc chưa xác định được thuộc loài nào. Mã vạch DNA thực vật có khả năng cung cấp cái nhìn sâu vào phân loại cấp độ loài trong những nhóm có hình thái đơn giản, nhóm có phân bố rất rộng, nhóm có kích thước nhỏ, và / hoặc những nhóm đã được phân loại nhưng không đầy đủ, chưa tương xứng với đặc điểm đa dạng của chúng (ví dụ như một số trường hợp không thể dựa trên nguyên tắc phân loại hình thái học để đánh giá, phân loại, hoặc đã được phân loại nhưng chưa thực sự triệt để). Phương pháp tiếp cận mã vạch ADN đã cung cấp các thông tin hữu ích về những bí ẩn trong đa dạng loài của nhóm thực vật bryophytes (rêu) [60]. Phương pháp này từ lâu đã được sử dụng để phân định các loài trong nhóm này [34], do đó tiêu chuẩn hóa và mở rộng các hoạt động của mã vạch ADN là một sự tiến triển tự nhiên. ADN mã vạch cũng được sử dụng để tăng cường sự hiểu biết các loài thực vật có hạt, hoặc thông qua đó đóng góp đến sự khám phá các loài ẩn danh [31].
Hiện nay có rất nhiều ngành nghề liên quan đến việc thực hiện hoặc sử dụng nhận dạng thực vật (Bảng 1), ví dụ như phân loại học, sinh thái học, bảo vệ môi trường, lâm nghiệp, nông nghiệp, các nhà khoa học pháp y, hải quan và cán bộ kiểm dịch, và trong nhiều tình huống mà các phương pháp tiếp cận mã vạch sẽ dẫn đến việc xác định “nhóm loài” hơn là loài. Tuy nhiên, đối với một số ứng dụng, thậm
chí là một mã vạch ADN với khả năng phân biệt tương đối khiêm tốn cũng có thể hữu ích. Tình huống cụ thể bao gồm:
(1) nghiên cứu vùng địa lý nhằm đánh giá sự đa dạng tại một vùng hoặc một khu vực, nơi mà nhiều trong số những mẫu nghiên cứu không nhất thiết phải có mối quan hệ chặt chẽ với nhau
(2) với các loài có giá trị thương mại, mục tiêu của mã vạch là để phân biệt một tập hợp các loài mục tiêu mà ta quan tâm, với những loài họ hàng xa có tiềm năng thay thế hoặc để xác định các thành viên của các nhóm phân loại cao hơn (ví dụ như họ, chi) hơn là xác định một loài cụ thể, và
(3) khi cần nhận diện một vật mẫu nào đó mà người sử dụng hoàn toàn không có ý tưởng hay sự quen thuộc nào về vật mẫu đó thuộc họ nào. Trong tình huống này, việc xác định một nhóm các loài có liên quan sẽ rất hữu ích vì nó có thể thu hẹp phạm vi các lựa chọn lại và có thể sử dụng kết hợp với khóa phân loại hình thái học hoặc tham khảo ý kiến chuyên gia để có được một xác định cuối cùng.
Trong dãy các ứng dụng, ADN mã vạch còn được sử dụng để xác định các rễ cây, cây giống, hoặc giai đoạn sống chưa rõ (ví dụ như cây dương xỉ gametophytes). ADN mã vạch đã cung cấp một con đường thực tế hơn để có thể xác định trong những tình huống này [40]. Kesanakurthi và cộng sự [40] sử dụng riêng lẻ chuỗi rbcL để thực hiện phân chia đến các loài (hoặc nhóm loài) cho 85% các mẫu rễ kiểm tra, cho phép kiểm tra chi tiết các yếu tố sinh thái. Tương tự như vậy, mã vạch DNA có thể nhận diện các mẫu vật, vật liệu đã được xử lý bằng cách này hay cách khác, chẳng hạn như phân tích chế độ ăn uống của động vật ăn cỏ [72], các sản phẩm thực phẩm, hoặc các thành phần của các loại thuốc thảo dược [71].
Baker và Little sử dụng mã vạch ADN matK để làm nổi bật các loài thực vật bị xác định nhầm trong thảo dược bổ sung [46]. Hơn 1/4 thảo dược thương mại có sẵn của Black Cohosh được kiểm tra và phát hiện không chứa loài Actea raceomosa
Bắc Mỹ, mà thay vào đó là loài Actea Châu Á. Một ứng dụng khác đang nổi lên của mã vạch ADN ở thực vật là việc xác định các loài được bảo vệ trong thương mại.
Bảng 1. Bảng liệt kê một số các nghiên cứu sử dụng mã vạch ADN nhƣ một công cụ nhận diện [25] Ứng dụng Dấu chuẩn mã vạch sử dụng Ghi chú Nhận dạng những loài lan ẩn danh [48] MatK Nhận dạng những loài Conocephalum (rêu) ẩn danh [61] RbcL Nhận diện những loài Taxus ẩn danh [56] nrITS, trnL-F, trnH-psbA, matK, rbcL
trnH-psbA đã được đánh giá như vùng biểu hiện tốt nhất Nhận diện những loài
Herbertus (rêu) ẩn danh
rcbL+matK+trnH- psbA+nrITS
matK và nrITS đánh giá là vùng biểu hiện tốt nhất Nhận diện những cây con trên một mảng rừng nhiệt đới [27] nrITS, trnH-psbA, rbcL, matK (và những vùng khác)
trnH-psbA đã được đánh giá là vùng biều hiện tốt nhất
Nhận diện các cây thảo dược Trung Quốc họ Polygonaceae [70]
trnH-psbA
Nhận diện các cây thảo dược Trung Quốc họ Fabaceae [25] [24]
nrITS2, matK
Nhận diện loài
Phyllanthus trong thuốc thảo dược [71]
trnH-psbA
Nhận dạng loài Actaea
trong thuốc thảo dược
MatK
Nhận dạng những loài cây thảo dược [16]
nrITS2, nrlITS, matK, rcbL, psbA-trnH (và các vùng khác)
nrITS2 được đánh giá là dấu chuẩn thể hiện tốt nhất
Nhận dạng loài xâm lấn (Cardamine)
nrITS, trnL intron, trnL-F
Nhận dạng loài xâm lấn (Hydrocotyle)
trnH-psbA matK gây nhiều vấn đề khó khăn trong việc khuyếch đại, nên bị loại bỏ Nhận dạng rễ trong công xã đồng cỏ [40] rbcL Nhận dạng thể giao tử của Osmunda rbcL Nhận dạng thể giao tử của dương xỉ nước
rbcL, trnL-F, trnL intron (và các vùng khác)
trnL intron ít thông tin do độ bao phủ thấp trong cơ sở dữ liệu tham khảo
Nhận dạng những sản phẩm và gỗ trong danh sách CITES [64] matK (phân tích SNP trong trình tự mã vạch) Nhận dạng những thực vật có độc [14] matK, trnH-psbA và các vùng khác
matK được ưu tiên hơn
Nhận dạng những loài quả mọng trong thức ăn [35]
nrITS
matK và trnH-psbA được chỉ ra là không đủ độ biến đổi Nhận dạng những thực
vật cấu thành bữa ăn của động vật ăn cỏ
trnL P6 loop, trnL intron,
trnH-psbA
Có khoảng 29.000 loài cây trồng được bảo hộ trong Công ước CITES (Công ước về buôn bán quốc tế các loài động vật, thực vật hoang dã nguy cấp (http://www.cites.org/eng/disc/species.shtml), và việc phát triển các phương pháp hiệu quả để phân biệt loài nằm trong danh sách CITES với những loài không nằm trong danh sách CITES. Ogden và cộng sự [64] phát triển một cách tiếp cận kiểu gien SNP dựa trên ADN mã vạch gen matK để phân biệt giữa các sản phẩm gỗ của
Ramin (Gonostylus)-loài được CITES bảo vệ, với các loài không cùng họ hoặc loài có cấu trúc giải phẫu tương tự nhưng quan hệ xa- không được bảo vệ bởi CITES.
Bảng 2. Một số dự án mã vạch ADN thực vật đang thực hiện hay đang trong giai đoạn dự kiến năm 2011 [31]
Dự án Cơ quan nghiên cứu
Cây BOL: mã vạch các loài cây trên thế giới
Vườn thực vật New York Cỏ BOL: mã vạch cho thực vật cỏ và giống
cỏ
Đại học Adelaide và Đại học British Columbia
Hệ thực vật của công viên quốc gia Kruger Đại học Johannesburg Hệ thực vật của khu bảo tồn Guanacaste
Costa Rica
Đại học Pennsylvania
Hệ thực vật Hàn Quốc Đại học Korean
Mã vạch thực vật Trung Quốc: mã vạch thực vật của 5000 loài thực vật Trung Quốc
Viện thực vật Kunming
Mã vạch ADN miêu tả cho tất cả các loài thực vật hạt kín
Vườn thực vật New York Mã vạch ADN của trung tâm những mảnh
rừng nhiệt đới
Viện Smithsonian
Mã vạch ADN cho thực vật dược liệu Trung Quốc
Viện phát triển thực vật dược liệu Beijing
Mã vạch ADN cho hệ thực vật xứ Wales Vườn thực vật quốc gia của Wales Mã vạch ADN cho ngành rêu ở Anh Vườn thực vật hoàng gia Edinburgh
Việc thành lập một thư viện tài liệu tham khảo phù hợp là điều kiện quan trọng tiên quyết cho các ứng dụng của mã vạch ADN, điều này đòi hỏi các dữ liệu về mã vạch ADN phải được xây dựng từ các mẫu xác định và được đảm bảo về độ
tin cậy và chuẩn xác. Có rất nhiều kế hoạch dựa trên phân loại học và vùng phân bố địa lí phức tạp của các mẫu được tiến hành nhằm góp phần hướng tới thư viện tham khảo này, một số dự án được liệt kê ở Bảng 2. Ngoài các dự án này, còn có các
chuỗi thông tin được lưu trữ trong GenBank, nó đã cung cấp một nguồn hữu ích cho việc nhận dạng. Các mẫu đối chiếu gắn với các tiêu chuẩn mã vạch ở GenBank và các cơ sở dữ liệu như cơ sở dữ liệu Barcode of Life (BOLD) [66] trở nên mạnh mẽ hơn rất nhiều: chúng được chứng thực và đảm bảo thông tin, trình tự, tập tin và được liên kết với các siêu dữ liệu khác.
Ở nước ta, rất nhiều nghiên cứu về nguồn gốc tiến hóa của thực vật trên cơ sở phân tích một số vùng ADN đã được thực hiện. Huỳnh Thị Thu Huệ và cộng sự đã phân lập và xác định trình tự gen 18S rRNA của 4 loài Bình vôi ở Việt Nam [3]. Nguyễn Đức Thành và cộng sự đã sử dụng một số chuỗi gen lục lạp trong nghiên cứu đa dạng di truyền và xuất xứ một số loài cây lâm nghiệp, trong đó có một số loài bị đe dọa [7]. Những kết quả nghiên cứu trên chỉ ra rằng mã vạch ADN là công cụ hữu hiệu trong nghiên cứu đa dạng di truyền và bằng cách so sánh mã vạch ADN ở một vài sinh vật khác với các mã vạch đã được biên soạn trong thư viện thông tin có thể giúp nhận diện loài, loài mới hoặc các loài quý hiếm.
1.4.2. Ứng dụng mã vạch ADN trong nhận biết cây dƣợc liệu
Cây thuốc là nguồn gốc của một số lượng lớn các loại thuốc thiết yếu trong y học phương Tây và là cơ sở của thuốc thảo dược, đó không chỉ là nguồn chính chăm sóc sức khỏe cho hầu hết dân số thế giới ở các nước đang phát triển mà còn ngày càng phổ biến ở các quốc gia phát triển[38], [41], [63]. Sự gia tăng nhu cầu sử dụng các sản phẩm từ thực vật để làm thuốc đã được đáp ứng bởi một ngành công nghiệp mở, được đảm bảo về hiệu quả, chất lượng và an toàn [21], [37]. Thực vật dùng làm thuốc thảo dược luôn cần được xác định ở cấp độ loài, vì vậy, xác định chính xác là một bước quan trọng để có thể đảm bảo về chất lượng sản phẩm và có tầm quan trọng trong việc nghiên cứu các đặc tính của sự đa dạng di truyền [9], [32], phát sinh loài và phát sinh vùng địa lý [79] cũng như bảo vệ các loài có nguy cơ tuyệt chủng.
Ngày nay, đến 80% dân số thế giới đã sử dụng y học cổ truyền cho mục đích chăm sóc sức khỏe và chữa bệnh [65], trong đó Trung Quốc có lịch sử rất lâu đời về việc sử dụng nguyên liệu từ thảo dược có nguồn gốc từ hơn 10.000 loài, hơn 2.000 chi và 400 họ để làm thuốc [16]. Hiện nay, các thị trường xuyên quốc gia về nguồn nguyên liệu thảo dược dùng trong sản xuất dược phẩm có tiềm năng rất lớn và đang tiếp tục phát triển. Doanh thu từ thảo dược đạt đến 14 tỷ USD tại Trung Quốc trong năm 2005 và 5 tỷ USD tại Châu Âu trong năm 2004 [65]. Cùng với sự phát triển của thị trường thảo dược, sự giả mạo các nguyên liệu thảo dược thuốc cũng trở thành vấn đề toàn cầu. Các nguyên liệu thảo dược này có thể được thay thế bằng các loại thảo mộc khác có quan hệ họ hàng gần gũi, thậm chí từ những nguyên liệu giả mạo. Việc giả mạo các nguyên liệu thảo dược thường là do:
(i) vật liệu không phân biệt được bằng đăc điểm hình thái (ii) những vật liệu có tên tương tự nhau, và
(iii) việc thay thế những nguyên liệu có giá trị kinh tế bằng nguyên liệu khác rẻ tiền hơn.
Tuy nhiên, việc xác định chính xác các nguyên liệu thảo dược làm thuốc theo phương pháp truyền thống như sự đánh giá cảm quan và phương pháp hóa học đôi khi gặp nhiều khó khăn, đặc biệt là những nguyên liệu có nguồn gốc từ thực vật đã được chế biến một phần hoặc ở dạng bột. Vì vậy, phương pháp sử dụng các dấu chuẩn phân tử rõ ràng là chính xác và phổ biến hơn, cho phép những người dù k phải là chuyên gia cũng có khả năng nhận biết được nguồn gốc các loại thực vật chỉ từ một lượng mẫu mô nhỏ. Mã vạch ADN đã trở thành phương pháp chính được sử dụng trong lĩnh vực đa dạng sinh học và các công trình bảo tồn trong những năm gần đây, ở đây, ứng dụng của mã vạch ADN được xem xét là để kiểm soát chất lượng sản phẩm và trong công tác điều tra . Việc nhận biết các nguyên liệu thảo dược sử dụng phương pháp mã vạch AND có thể bảo vệ người dụng tránh khỏi tác dụng độc hại của các loại thuốc giả mạo, đặc biệt trong nhiều trường hợp có thể nguy hiểm đến tính mạng. Vì vậy, một cơ sở dữ liệu DNA barcode bao gồm các
Bảng 3. Những cặp mồi đƣợc sử dụng thông dụng trong việc khuyếch đại và giải trình tự các mã vạch ADN [52] Barcode Mồi Trình tự TLTK ITS ITS5 (f) GGAAGTAAAAGTCGTAACAAGG ITS4 (r) TCCTCCGCTTATTGATATGC P1f ATTGAATGGTCCGGTGAAGTGTTCG [18] P2r AATTCCCCGGTTCGCTCGCCGTTAC [18] matK 3F_KIM f CGTACAGTACTTTTGTGTTTACGAG [28] 1R-KIM r ACCCAGTCCATCTGGAAATCTTGGTTC [28] matK_1F GAACTCGTCGGATGGAGTG [77] matK_1R GAGAAATCTTTTTCATTACTACAGTG [77] matK_2F CGTACTTTTATGTTTACAGGCTAA [77] matK-2R TAAACGATCCTCTCATTCACGA [77] matK_390(f) CGATCTATTCATTCAATATTTC [19] matK_1326(r) TCTAGCACACGAAAGTCGAAGT [19] rbcL a_f ATGTCACCACAAACAGAGACTAAAGC [43] a_r CTTCTGCTACAAATAAGAATCGATCTC [43] 1F ATGTCACCACAAACAGAAAC [22] 724R TCGCATGTACCTGCAGTAGC [22] trnH- psbA trnHf_05 (f) CGCGCATGGTGGATTCACAATCC [44] psbA3‟f (r) GTTATGCATGAACGTAATGCTC [44] trnH(GUG) (f) ACTGCCTTGATCCACTTGGC [11] psbA (r) CGAAGCTCCATCTACAAATGG [11]
trình tự DNA có thể phân biệt được ở các mức độ phân loại khác nhau là rất cần thiết để nhận dạng.Gần đây, một cơ sở dữ liệu mã vạch ADN online đầu tiên
Medicinal Materials DNA Barcode Database
(http://www.cuhk.edu.hk/icm/mmdbd.htm), đã được xây dựng, cho phép người sử dụng có thể tìm và phân tích trình tự ADN của nhiều nguyên liệu thảo dược. Cơ sở dữ liệu chứa khoảng 20.000 trình tự ADN của 1.300 loài dược liệu bao gồm Dược phẩm của nước Cộng hòa nhân dân Trung Quốc (Pharmacopoeia of the People‟s Republic of China) và Dược điển Hoa Kỳ (The United States Pharmacopoeia) [52], và có bốn mã vạch ADN tiêu chuẩn đại diện cho trên 50% trình tự của các nguyên liệu thảo dược. Trình tự ITS được sử dụng thường xuyên nhất (28%), tiếp theo là
trnH-psbA (9%), rbcL (8%) và matK (8%). Ngoài ra, đoạn xen trnL - trnF ở lục lạp và 5S rDNA cũng được sử dụng như các trình tự dấu chuẩn ADN. Dưới đây trình bày một số mã vạch ADN đã được nghiên cứu và ứng dụng trong các cây dược liệu.
Vùng gen ITS được sử dụng như trình tự phổ biến nhất để làm mã vạch và xác thực các nguyên liệu thảo dược. Ví dụ, ITS cung cấp số lượng thông tin đặc trưng lớn nhất và khả năng xử lý tốt nhất 6 mẫu của Hedyotis L có họ với Rubiaceae [39]. ITS đã được sử dụng thành công để phân biệt 14 lòai Hedyotis L, bao gồm cả loài chính thống trong phương thuốc điều trị khối u “Baihuasheshecao” có nguồn gốc từ H. diffusa Willd, và cả loài giả mạo có nguồn gốc từ H. corymbosa
(L.) Lam [53]. Do mức độ biến đổi giữa các các cá thể trong loài rất nhỏ (<0.5%) nhưng giữa các loài khác nhau thì lớn( >16%) khiến cho ITS trở nên phù hợp để phân biệt được 2 loài khác nhau. ITS cũng hữu dụng trong việc phân biệt Baihuasheshecao được làm giả từ một số loài thuộc các họ khác , như Sagina japonica (Sw. ) Ohwi, Stellaria alsine Grimm và Arenaria serpyllifolia L. Tuy nhiên, trong một số trường hợp sự biến đổi, sai khác của ITS giữa các loài khác nhau là nhỏ. Ví dụ, nó không có khả năng phân biệt nhiều loài Aconitum L. bao gồm A. carmichaeli Debeaux và A.kusnezoffii Rchbb. Cả hai đều được coi như là các thảo dược làm thuốc “Wutou” trong thảo điển của Trung Quốc. ITS cũng không có khả năng phân biệt được Bupleurum chinense DC. (Apiaceae) từ B.
scorzonerifolium Willd, cả hai đều được coi là “Chaihu, mặc dù, B.