Hỗ trợ định danh các mẫu nấm ký sinh côn trùng thu được tại vùng núi langbiang, đà lạt, lâm đồng bằng phương pháp phân tích phả hệ phân tử

Đà Lạt, Lim Đồng bảng phương pháp phán tích phả hệ phân tử.Ý kiền cùa giáo viên hướng dln về việc cho phép học viên dược bảo vộ luận vân tmớc HộiThành phổ Hồ Chi Minh, ngày...tháng...nám

GIỚI THIỆU

Cơ sở hình thành luận văn

Cordyceps Fr thuộc chi nấm ký sinh trên côn trùng và một số loài động vật chân khớp Điểm đặc biệt của chi nấm này là sự đa dạng về loài và có giá trị dược liệu cao Do đó, Cordyceps được được sử dụng phổ biến trong lĩnh vực như y học Đồng thời chi nấm này cũng được sử dụng rộng rãi trong nông nghiệp Nghiên cứu về loài nấm này cho thấy chúng chứa hàm lượng chất dinh dưỡng có giá trị cao Các loài nấm này thường xuất hiện ở miền núi với độ cao từ 4.000 m trở lên so với mực nước biển, điều kiện khí hậu gần giống với các vùng Thanh Hải (Tây Tạng) hoặc Tứ Xuyên (Trung Quốc) Tại Việt Nam, khí hậu nhiệt đới, lượng mưa cao là điều kiện phù hợp cho sự phát triển của các loài thuộc chi nấm này Sự đa dạng của các loài thuộc chi nấm này đã được nhiều nhà khoa học, nhà nghiên cứu quan tâm Do đó, việc tìm hiểu và triển khai các nghiên cứu về chủng nấm Cordyceps là rất quan trọngvà dự kiến mang lại nhiều lợi ích ở Việt Nam Bên cạnh đó, việc nghiên cứu

Cordyceps cũng đóng góp vào bảo vệ và khai thác các nguồn tài nguyên thiên nhiên quý này

Tiêu chuẩn vàng cho việc phân loại, định danh các loài nấm nói chung và Cordyceps nói riêng là dựa trên việc giải phẫu mô tả hình thái, chẳng hạn cấu trúc cơ thể, hình dáng, kích thước của nang, bào tử, … Riêng đối với các loài nấm thuộc chi này, một thách thức khi thực hiện nghiên cứu định danh nấm ký sinh côn trùng là có những loài có nhiều đặc điểm hình thái tương đồng, nhưng chúng có thể biến đổi tùy theo vùng địa lý và môi trường sinh sống Ngoài ra, một đặc điểm khó khăn cho phân loại nấm bằng hình thái là khả năng tồn tại ở hai dạng khác nhau, đó là dạng hữu tính (teleomorph) và dạng vô tính (anamorph)

Do đó, việc sử dụng công cụ hình thái trong định danh loài nấm này gặp không ít khó khăn

Vì vậy, việc sử dụng phân tích trình tự phân tử của một số gene cụ thể đã và đang được chứng minh là một công cụ mạnh mẽ hỗ trợ cho việc phân loại nấm Cordyceps ở cấp độ cao hơn (loài) trong trường hợp mà các mẫu chỉ được xác định ở cấp độ thấp (chi hoặc phân chi) Việc này giúp tăng tiềm năng phát hiện, phân biệt các loài, đặc biệt là khi các đặc điểm hình thái không thể đảm bảo tính chính xác hoặc vẫn còn tranh cãi Tuy nhiên, việc nghiên cứu toàn diện về các loài nấm Cordyceps ở Việt Nam dựa vào hình thái và trình tự phân tử vẫn còn chưa hoàn chỉnh Do đó, thiết lập quy trình định danh dựa trên công cụ tin sinh học và sinh học phân tử là cấp thiết và đặc biệt quan trọng Điều này không chỉ giúp mở rộng thông tin về sự đa dạng của nấm Cordyceps ở Việt Nam mà còn đóng góp vào lĩnh vực nghiên cứu và trong ứng dụng

Trong thời điểm hiện tại, nghiên cứu trong lĩnh vực này hướng tới tiếp cận phân tích đồng thời nhiều gene (hoặc thậm chí toàn bộ bộ gene) thay vì từng gene đơn lẻ, điều này giúp hỗ trợ hiệu quả trong việc định danh hình thái

Các gene rRNA có vai trò quan trọng trong việc thể hiện mối quan hệ tiến hóa giữa các loài Những gene này đã được giải trình tự tại các locus và có mối quan hệ chặt chẽ trong quá trình phát triển tiến hóa Vì thế, các gene này được bảo tồn trong đa số các loài, được chọn để nghiên cứu trong quá trình phân loại và xác định sự giống nhau giữa chúng Một đặc điểm đáng lưu ý là chúng bảo tồn và có sự biến đổi chậm, do đó chúng sử dụng thường xuyên như một công cụ hữu ích nhằm xây dựng cây phát sinh phân tử, đánh giá sự khác biệt giữa các loài và xác định đặc điểm di truyền đặc thù Gene thường trực (housekeeping genes) là ví dụ về vùng gene có tính bảo tồn cao và có xu hướng tiến hóa chậm hơn các gene khác Chúng thường là yếu tố quan trọng trong việc duy trì các hoạt động cơ bản và quy trình sống của tế bào Điều này làm cho các gene thường trực trở thành một nguồn thông tin vô cùng có ích trong nghiên cứu nhận dạng và đánh giá sự tương quan giữa các loài Dựa trên điểm tương đồng hoặc khác biệt trong trình tự của những gene này có thể dựng cây phát sinh loài để phân loại các loài nấm một cách hiệu quả

Khu vực núi LangBiang ở Đà Lạt, tỉnh Lâm Đồng với độ cao và khí hậu phù hợp cho các loài nấm Cordydeps phát triển, đồng thời nơi đây tồn tại nhiều loài cây và côn trùng, là các loài côn trùng thường được nấm Cordyceps ký sinh Do đó, nghiên cứu sự đa dạng di truyền của Cordyceps tại đây có khả năng cung cấp thông tin có ích về cách chúng tương tác với vật chủ và môi trường xung quanh Năm 2021, Lao Đức Thuận và cộng sự đã đề xuất việc phát hiện một loài mới thuộc chi Ophiocordyceps, được gọi là O langbianensis, và loài này có quan hệ gần với loài O Brunneipunctata (Thuan et al., 2021) Trong nghiên cứu mới nhất vào năm 2022, Lao Đức Thuận và nhóm nghiên cứu đã lần đầu tiên công bố sự hiện diện của loài nấm Metacordyceps neogunnii (Metacordyceps, Clavicipitaceae) tại Việt Nam thông qua phân tích các vùng gene ITS, Rpb1, Tef1 (Thuan et al., 2022) Dưới góc nhìn đó, sự tăng cường quan tâm và nghiên cứu đối với các loài nấm ký sinh phát triển trên côn trùng tại vùng núi LangBiang thông qua việc sử dụng các phương pháp phân tích mới là rất cần thiết Thông tin về loài nấm Cordyceps tại khu vực như này là thách thức lớn và còn nhiều khía cạnh cần được khám phá Nghiên cứu “Hỗ trợ định danh các mẫu nấm Cordyceps thu thập tại dãy núi LangBiang, Đà Lạt, Lâm Đồng bằng phương pháp phân tích sinh loài phân tử” tại khu vực dãy núi LangBiang được xem như một bước quan trọng đối với

4 việc khám phá và tìm hiểu về các loài nấm Cordyceps Định hướng của nghiên cứu là tiến hành thông qua phương pháp phân tích phát sinh loài dựa trên việc phân tích các gene, hướng tới hỗ trợ xác định và định danh các mẫu nấm Cordyceps đã thu thập từ vùng này.

Mục tiêu nghiên cứu

Xây dựng một phương pháp phân tích phát sinh phân tử trên các gene cụ thể hỗ trợ định danh cấp loài mẫu nấm thuộc chi Cordyceps (họ Clavicipitaceae) và ứng dụng trong việc hỗ trợ định danh một số mẫu nấm ký sinh côn trùng thu thập tại dãy núi LangBiang, Đà Lạt, tỉnh Lâm Đồng

- Xây dựng phương pháp luận: cây phả hệ đơn, đa gene hướng tới hỗ trợ định danh các loài nấm được tìm thấy ở khu vực núi LangBiang, Đà Lạt, Lâm Đồng

- Áp dụng phương pháp luận đã xây dựng trong việc hộ trợ định danh một số mẫu nấm ký sinh côn trùng thu nhận tại tại dãy núi LangBiang, Đà Lạt, tỉnh Lâm Đồng.

Câu hỏi nghiên cứu

Việc sự dụng dữ liệu phân tử phả hệ đa gene có thực sự hỗ trợ đặc lực cho việc định danh một số loài nấm thuộc chi nấm ký sinh côn trùng?

Phạm vi và đối tượng nghiên cứu

Các mẫu nấm sử dụng trong nghiên cứu được thu thập tại núi LangBiang, Đà Lạt, Lâm Đồng Các mẫu nấm này đã được bước đầu định danh hình thái tại Viện Nghiên cứu và ứng dụng nông nghiệp công nghệ cao, Đại học Đà Lạt, tỉnh Lâm Đồng Các gene sử dụng trong nghiên cứu này bao gồm: nrLSU, nrSSU, Rpb1, ITS và tef.

Phương pháp nghiên cứu

Ý nghĩa nghiên cứu

Công bố thông tin về các loài nấm ký sinh trên côn trùng ở vùng núi LangBiang, Đà Lạt, Lâm Đồng không chỉ tạo điều kiện phát triển nghiên cứu ứng dụng trong đời sống mà còn đóng góp vào danh mục gene của các loài nấm Cordyceps ở Việt Nam Điều này sẽ đóng góp đáng kể cho việc phát triển nguồn tài nguyên dược liệu và thực phẩm chức năng tại Việt Nam Sự chú trọng đến việc bảo tồn, sử dụng tài nguyên thiên nhiên một cách bền vững là góp phần giữ gìn và đẩy mạnh phát triển vững bền đất nước

Kết cấu của luận văn

Danh mục hình và đồ thị

Danh mục từ viết tắt

Chương 2: Cơ sở tổng quan nghiên cứu

Chương 3: Vật liệu và phương pháp nghiên cứu Chương 4: Kết quả nghiên cứu

Chương 5: Kết luận và kiến nghị

CƠ SỞ TỔNG QUAN

Tổng quan về chi nấm Cordyceps Fr

1.1 Sơ lược về chi nấm Cordyceps Fr

Cordyceps Fr là loại nấm ký sinh trên công trùng thuộc phân ngành Ascomycota, họ Clavicipitaceae, bộ Hypocreales, lớp Pyrenomycetes (Sung et al., 2007) Chúng thường ký sinh ở các loài động vật chân đốt, nhất là các bộ Coleoptera và Lepidoptera, và đã có khoảng 200 loài Cordyceps ký sinh được ghi nhận trên các bộ này (Mongkolsamrit et al.,

2020; Shrestha et al., 2016; Wang et al., 2020) Cordyceps Fr thực hiện quá trình sinh sản thông qua bào tử hữu tính (ascospores) hoặc bào tử vô tính (conidia), hoặc cả hai (Mora et al., 2018) Theo phân loại truyền thống, hầu hết các loài trong nhóm này thuộc chi

Cordyceps Vào năm 2007, Sung và cộng sự đã sử dụng dữ liệu phân tích di truyền nhằm phân loại lại các loại nấm này Sung và cộng sự tái cấu trúc lại 162 đơn vị phân loài, bao gồm họ Clavicipitaceae với các chi Metacordyceps; họ Cordycipitaceae với chi Cordyceps sensu stricto (Cordyceps s.s); và họ Ophiocordycipitaceae bao gồm chi Ophiocordyceps và Elaphocordyceps (Sung et al., 2007) Vì vậy, khái niệm ‘Cordyceps’ đã được mở rộng từ chi trước đây là Cordyceps Fr thành Cordyceps s.l Hiện nay, đã có hơn 400 loài nấm Cordyceps được nghiên cứu và định danh, với khoảng 120 loài được tìm thấy ở Trung

Quốc Những loài này thường được phân loại dựa vào những nghiên cứu phân loại truyền thống, phương pháp giải phẫu hình thái như như Kobayashi (1982) và Main (1958), và chúng thuộc họ Clavicipitaceae (Kobayasi, 1982; Mains, 1958) Các nghiên cứu trước đã phân tích và công bố rằng Cordyceps chứa nhiều hợp chất sinh học có giá trị cao, chẳng hạn adenosine, cordycepin, acid cordycepic, ergosterol, và 6 polysaccharides Các hợp chất này có nhiều tác dụng dược lý rất quan trọng và được ứng dụng trong các liệu pháp miễn dịch, ung thư, chống oxy hóa, chống viêm và kháng khuẩn Ngoài ra, Cordyceps còn có khả năng giúp phục hồi tổn thương gan (Das et al., 2021)

1.2 Tiềm năng ứng dụng Ứng dụng trong nông nghiệp

Một số loại nấm này được dùng để kiểm soát sinh vật gây hại như sâu bệnh ở Việt Nam, ví dụ như việc sử dụng nấm Metarhizium anisopliae để kiểm soát và phòng ngừa bọ cánh cứng Diocalandra frumenti Fabricius gây hại cho cây dừa (Ửng & Nương, 2019), đồng thời phòng trừ rầy nâu và rầy lưng trắng (Pham et al., 2020) Sử dụng đặc tính gây bệnh của ba loài nấm ký sinh bao gồm Metarhizium anisopliae, Beauveria bassiana và Paecilomyces sp đã góp phần loại bỏ côn trùng gây hại cho cây khoai lang (Kim Sơn & Văn Vàng và Trần

Văn Hai, 2016) Những công trình nghiên cứu về nấm ký sinh trên rệp sáp và rầy đã xác định khả năng của chúng trong việc giảm thiểu thiệt hại do sâu bệnh gây ra Trong nghiên cứu này, có tổng cộng 07 loài được định danh thông qua cách giải trình tự gene Những loài này bao gồm Beauveria bassiana, Cordyceps cicadae, Cordyceps takaomontana, Metarhizium cylindrosporae, Cordyceps bassiana, Paecilomyces lilacinus, Paecilomyces hepiali (Thị

Lan Hoa et al., 2016) Ứng dụng trong lĩnh vực y học

Nhiều loài nấm thuộc chi Cordyceps có chứa nhiều hợp chất khác nhau có thể hỗ trợ kiểm soát khối u phát triển, tăng cường hệ thống miễn dịch và cải thiện phản ứng miễn dịch Điều này đem lại nhiều lợi ích quan trọng cho bệnh nhân ung thư (Das et al., 2021) Cordycepin (3-deoxyadenosine) là một hợp chất chính đã được nghiên cứu chủ yếu vì tiềm năng trong việc ngăn chặn sự phát triển của ung thư, kiểm soát đường huyết, cân bằng lipid máu cũng như có tác dụng chống viêm, cân bằng hệ thống miễn dịch, chống oxy hóa, ngăn ngừa quá trình lão hóa, kháng virus, hỗ trợ sức khỏe gan, giảm căng thẳng và hỗ trợ tim mạch Ngoài ra, Cordycepin còn được sử dụng trong ngành mỹ phẩm làm đẹp (Ashraf et al.,

2020) Một số nghiên cứu cụ thể đã được công bố chỉ ra rằng Cordyceps militaris có khả năng chống ung thư (Jo et al., 2020) C militaris cũng đã được nghiên cứu và đã thể hiện tác dụng ức chế phản ứng viêm trong tổn thương mô, viêm đại tràng và dị ứng (Phull et al.,

2022) Nhiều nghiên cứu gần đây đã dự báo khả năng của Cordycepin trong việc ức chế các protein liên quan đến SARS-CoV-2 dựa trên các phương pháp tính toán (Rabie, 2022) Tại Việt Nam, chiết xuất nấm Cordyceps militaris đã được áp dụng để tăng quá trình tạo tế bào da, tái tạo cấu trúc da bị tổn thương và đã thí nghiệm trên chuột (Thi Nguyen et al., 2022).

CÁC PHƯƠNG PHÁP định danh LOÀI

2.1 Định danh dựa vào hình thái

Việc phân loại dựa trên các thông tin về hình thái là một phương pháp truyền thống, là tiêu chuẩn vàng và hữu ích để xác định và phân loại các loài nấm ký sinh côn trùng Bên cạnh đó, phương pháp định danh này vẫn còn có một số hạn chế: các loài có đặc điểm hình thái giống nhau hoặc có sự thay đổi trong chu kỳ phát triển dễ dẫn đến sự nhầm lẫn trong định danh Hệ thống phân loại của Kobayashi vào năm 1982 đã đóng góp quan trọng đối với việc sắp xếp các nhóm Cordyceps và Torrubiella bao gồm: 282 loài Cordyceps, 59 loài Torrubiella và 75 loài thuộc các chi có mối quan hệ gần Những đặc điểm này, bao gồm hình dạng của bào tử, độ dày của đầu bào tử và cách các bào tử dạng sợi phân tách, là các

9 dữ liệu cần thiết để xác định và phân loại chúng (Kobayasi, 1982) Một số ví dụ: Đặc điểm nhận dạng hình thái đặc trưng của Cordyceps sensu stricto (Cordyceps s.s.) bao gồm thân mềm, thường có màu vàng nhạt hoặc nhạt màu (ví dụ Cordyceps militaris) Chúng phát triển bằng cách ký sinh vào ấu trùng hoặc nhộng của các bộ Lepidoptera và Coleoptera, chúngg thường ở trong các lớp lá mục, rêu và lớp đất trên bề mặt Chi Elaphocordyceps thường phát triển trên nhộng ve sầu Trong khi đó, chi Metacordyceps xuất hiện với quả thể nấm có sự biến đổi màu sắc đa dạng, từ trắng (như Metarcordyceps youngmunensis) đến các tông màu như màu hoa cà, tím hoặc xanh lục Khi khô, các mẫu nấm Metacordyceps thường có màu sắc đậm hơn hoặc chuyển thành màu đen Chất nền của những loài thuộc chi

Metacordyceps thường hiển thị cấu trúc sợi và thường mỏng hơn so với những loài thuộc chi Cordyceps sensu stricto Ký chủ của Metacordyceps có tập tính sống ở sâu trong đất

Chi Ophiocordyceps thường có sắc tố màu sẫm và thường tấn công ấu trùng, các loài nấm thuộc chi này được tìm thấy trong đất, ví dụ như Ophiocordyceps sinensis, hoặc trên gỗ mục nát như Ophiocordyceps variabilis Quả thể của chúng có nhiều hình dạng như dạng sợi, dẻo hoặc hình chùy và thường có cấu trúc dạng sợi (Sung et al, 2007)

Phương pháp định danh bằng hình thái phụ thuộc nhiều vào sự chuyên môn của người thực hiện Các hạn chế này liên quan đến quá trình thu thập mẫu, trình trạng bảo quản mẫu và những trường hợp vật chủ đã bị phân hủy và không thể xác định được Ngoài ra, đối với nhiều loài nấm, việc duy trì sự phát triển chúng trong môi trường phòng thí nghiệm không thể thực hiện được, điều này làm cho việc xác định chúng trở nên khó khăn Vì vậy, đã xuất hiện nhiều phương pháp định danh và phân loại khác nhau để bổ sung cho phương pháp nhận dạng dựa trên hình thái

2.2 Định danh dựa vào phân tích phân tử

Những tiến bộ vượt bậc trong lĩnh vực sinh học phân tử, tin sinh học đã mở ra những thay đổi đáng kể trong công tác định danh loài, cụ thể là ứng dụng tin học trong sinh học trong việc định danh và phân loại các loài thuộc chi nấm ký sinh côn trùng Các phương pháp phân tử đã hỗ trợ rất nhiều trong việc xác định loài và phân loại, đặc biệt là khi phân tích hình thái có thể dẫn đến nhầm lẫn giữa các dạng vô tính và hữu tính của sinh vật Một trong những nghiên cứu điển hình được công bố năm 2007 bởi Sung và cộng sự về việc tiến hành phân loại toàn diện các nhóm nấm, đặc biệt là các loài thuộc họ Clavicipitaceae (Sung et al., 2007) Tác giả đã tổng hợp dữ liệu từ 5 đến 7 gene khác nhau (nrSSU, nrLSU, Tef1,

Rpb1, Rpb2, Tub và Atp6) và kết hợp chúng Nghiên cứu trên tạo ra một nền tảng dữ liệu

10 vững chắc cho việc phân chia các loài nấm thành ba họ cụ thể: họ Cordycipitaceae với chi

Cordyceps; họ Ophiocordycipitaceae gồm 02 chi Ophiocordyceps và Elaphocordyceps, họ Clavicipitaceae với các chi Metacordyceps, Hypocrella, Regiocrella và Torrubiella (Sung et al., 2007) Nghiên cứu này được xem như atlas cho việc ứng dụng tin học trong sinh học phân tử hỗ trợ định danh nấm ký sinh côn trùng Những tiến bộ tiến bộ trong lĩnh vực phân loại học và phân tích phân tử đã cung cấp nhiều bằng chứng quan trọng trong nghiên cứu về định danh các loài nấm

Vào năm 2017, nghiên cứu của Wen và cộng có sự kết hợp giữa các đặc điểm hình thái và dữ liệu phân tử từ nhiều gene khác nhau, bao gồm ITS, 18S, tef1 và Rpb1 của mẫu nấm Cordyceps gunnii từ Trung Quốc và Tasmania, Úc Kết quả cho thấy mẫu Cordyceps gunnii ở Trung Quốc thực tế là một loài mới được đặt tên là Metacordyceps neogunnii Điều này đã làm sáng tỏ sự hiểu lầm kéo dài hơn 30 năm liên quan đến việc xác định loài này ở Trung Quốc, khi nó bị nhầm lẫn với 'Cordyceps gunnii' Ở Tasmania, mẫu Cordyceps gunnii được xác định là thuộc họ Ophiocordycipitaceae dựa trên việc phân tích đa gene và các đặc điểm hình thái (Wen et al., 2017)

Một nghiên cứu tại Thái Lan đã sử dụng thông tin từ nhiều gene, bao gồm ITS, LSU,

Rpb1, Rpb2 và tef1 để tiến hành phân tích phân tử và nhận định sự phân chia giữa các nhóm nấm Kết quả này đã giúp phát hiện bốn loài nấm mới thuộc chi Blackwellomyces và năm loài khác thuộc chi Cordyceps Cụ thể, năm loài mới này là Cordyceps brevistroma, Cordyceps neopruinosa, Cordyceps inthanonensis và Cordyceps parvistroma, ký sinh trên ấu trùng và kén thuộc bộ Lepidopteran (Mongkolsamrit et al., 2020)

Nghiên cứu của Negi và cộng sự thực hiện vào năm 2012 đã công bố sự xuất hiện của hai loài mới là Cordyceps kurijimeaensis và C nirtolii, thuộc họ Clavicipitaceae, ngành

Ascomycetes Những loài nấm này được thu thập từ các khu rừng trong Vùng Munsyari trên dãy Himalaya, thuộc bang Uttarakhand, Ấn Độ C kurijimeaensis có cùng loài vật chủ với

Cordyceps (hay còn gọi là Ophiocordyceps) sinensis, chúng phát triển trên ấu trùng của loài Hepialus armoricanus, trong khi C nirtolii được ghi nhận trên loài Melanotus communis

Hiện nay, các phương pháp phân tích phân tử ngày càng quan trọng trong nghiên cứu phân loại học và đem lại giải pháp cho những thách thức mà phân loại học truyền thống thường gặp phải Phương pháp phân tích phân tử không chỉ mang lại sự đổi mới trong nghiên cứu phân loại học mà còn giúp giải quyết những thách thức phức tạp về đa dạng di

11 truyền và phát sinh loài Nó cung cấp nền tảng cho việc nghiên cứu khoa học mạnh mẽ để xác minh kết quả từ quá trình định danh dựa trên sự nhận biết các đặc tính hình thái nhờ vào những thông tin chính xác và đáng tin cậy

Việc chọn các đoạn DNA, RNA và protein để phân tích là khâu quan trọng khi thực hiện định danh phân tử Những trình tự chọn lọc cần phải kết hợp giữa tính chất bảo tồn trong một loài cụ thể (để đánh giá mối quan hệ trong một nhóm loài) và điểm khác biệt quan trọng giữa các dạng sống khác nhau (để phân biệt giữa các nhóm loài) Các gene thường được sử dụng bao gồm Rpb1, Tef1, tub, atp6 và các vùng D1/D2 của tiểu đơn vị lớn (LSU) thuộc cụm gene rDNA Những gene này đã được sử dụng thành công để định danh và phân loại các loài (Sung et al., 2007)

DNA ribosome rDNA, hoặc DNA ribosome, là một tập hợp các gene mã hóa cho RNA ribosome, một phân tử góp phần quan trọng cho nghiên cứu về tiến hóa rDNA thường được tập trung nghiên cứu do nhiều ưu điểm: (1) Nhiều bản sao gene và đặc biệt vì nó không mã hóa cho protein nào Các bản sao của gene này thường nằm gần nhau trên cùng một vị trí trên chuỗi DNA (được gọi là locus), và chúng liên quan chặt chẽ đến sự thay đổi di truyền và phát sinh loài (2) Phần lớn của phân tử rDNA thường có độ bảo tồn tương đối cao, do đó chúng được sử dụng như một cơ sở để phát hiện sự giống nhau và sự khác nhau của các sinh vật Phân tử DNA ribosome gồm nhiều đơn vị tái lặp, mỗi đơn vị này bao gồm vùng nrLSU, vùng

18S, ITS, 5,8S, 5S RNA và vùng IGS Vùng IGS (intergeneic spacer) chứa phần ETS

nghiên cứu trong nước

Trương Bình Nguyên và cộng sự đã bắt đầu nghiên cứu về các loài nấm Cordyceps bản địa tại vùng cao nguyên LangBiang, Lâm Đồng từ năm 2010 và đưa ra nhiều thông tin hữu ích về đặc tính sinh học của chúng Nhóm nghiên cứu thu thập 124 mẫu nấm trong khu vực này, đồng thời nghiên cứu 85 mẫu nấm Cordyceps và tiến hành đánh giá hình thái và giải phẫu của chúng, đưa ra định danh sơ bộ ở mức chi Dữ liệu từ nghiên cứu cho thấy có tổng cộng 12 chi khác nhau, bao gồm chi Cordyceps (37 mẫu), chi Ophiocordyceps (8 mẫu), chi Isaria (15 mẫu), chi Metarhizium (7 mẫu), chi Beauveria (6 mẫu), chi Hirsutella (4 mẫu), chi Torrubiella (2 mẫu), chi Gibellula (2 mẫu), chi Hypocrella (1 mẫu), chi

Akanthomyces (1 mẫu), chi Aschersonia (1 mẫu) và chi Hymenostibe (1 mẫu) Bên cạnh đó, nhóm nghiên cứu đã thành công trong việc thực hiện tách chiết DNA từ các mẫu nấm, lựa chọn các đoạn mồi để khuếch đại vùng gene ITS1-5.8S-ITS2, và tiến hành giải trình tự các gene này Điều này giúp họ xác định các loài nấm Cordyceps tại khu vực này và đề xuất các trình tự gene chính xác hơn để nghiên cứu và phân loại loài nấm này (Lê et al., 2015)

Nghiên cứu của Lao Đức Thuận năm 2022 đã công bố việc phát hiện loài nấm

Metacordyceps neogunnii (Metacordyceps, Clavicipitaceae) Để nhận diện loài này, nghiên cứu đã áp dụng cả phân tích hình thái và phân tích phân tử đa gene Phân tích hình thái đã cho thấy sự tương đồng trong các đặc điểm hình thái giữa các biến thể của Metacordyceps neogunnii ở khu vực núi LangBiang, Đà Lạt, Lâm Đồng và loài M neogunnii T.C Wen &

K.D Hyde ở Trung Quốc Tuy nhiên, chúng khác biệt với loài Cordyceps neogunnii (Berk.) Berk Phân tích đa gene của các vùng gene ITS, tef và Rpb1 đã xác nhận rằng các mẫu nấm thu thập thực sự thuộc loài M neogunnii Thông tin này cung cấp kiến thức quan trọng liên quan đến xác định và phân loại loài nấm Metacordyceps neogunnii tại khu vực núi

LangBiang, Đà Lạt, Lâm Đồng, và cũng như mối liên quan của chúng với các loài khác (D

Các phương pháp và kỹ thuật phân tử

4.1 Tách chiết và khuếch đại trình tự

Tách chiết DNA từ các mẫu nấm thường bao gồm ba bước quan trọng: (1) phá vỡ thành tế bào, (2) biến tính protein, và (3)thu thập DNA Thành tế bào nấm có cấu trúc phức tạp làm cho quá trình tách chiết và thu DNA trở nên phức tạp hơn Để khắc phục vấn đề này, Kuo và cộng sự đã thực hiện thử nghiệm có áp dụng các chất bổ trợ khi tách chiết DNA Họ sử dụng β-mecaptoethanol để loại bỏ protein bằng cách cắt đứt liên kết disulfide, từ đó làm cho quá trình tủa protein dễ dàng hơn Họ cũng sử dụng CTAB (Cetyltrimethyl ammonium bromide) để giúp thu thập DNA với độ tinh sạch cao, tăng cường hiệu suất tách chiết (Kuo et al., 2007; Anderson et al., 2003)

Kary Mullis đã phát minh kỹ thuật PCR vào năm 1983, một công cụ cực kỳ mạnh mẽ cho việc khuếch đại DNA PCR sử dụng các yếu tố của quá trình nhân bản tự nhiên để nhân đôi một đoạn ngắn của DNA trong ống nghiệm Quá trình này liên quan đến sự sử dụng DNA mẫu, dNTP (nucleotide tái cấu trúc), mồi, enzyme polymerase, MgCl2 (magnesium chloride), và dung dịch đệm

Giải trình tự là kỹ thuật xác định trình tự nucleotide trên phân tử DNA được xác định Để thực hiện thì có hai phương pháp chính, bao gồm phương pháp hóa học (Maxam và Gilbert, 1977) và phương pháp enzyme học (Sanger và cộng sự, 1977) Dựa trên việc sử dụng các phản ứng hóa học, phương pháp của Maxam và Gilbert thực hiện phân tích đặc hiệu và cắt phân tử DNA thành nhiều đoạn có kích thước và cấu trúc khác nhau, giúp xác định các nucleotide cũng như vị trí của chúng trên chuỗi DNA Phương pháp enzyme học của Sanger dựa trên việc sử dụng enzyme DNA polymerase để tạo ra các chuỗi bổ sung cho các trình tự cụ thể trên DNA Khi sử dụng cả dideoxynucleotide (nucleotide không có khả năng tiếp tục sự tổng hợp chuỗi DNA) và deoxynucleotide thông thường, quá trình tổng hợp sẽ tạo ra một nhóm các đoạn DNA với chiều dài và khác cấu trúc Hai phương pháp đều góp phần quan trọng đối với việc xác định trình tự nucleotide trên DNA, đồng thời phổ biến trong lĩnh vực nghiên cứu gene và sinh học phân tử

Hiện nay, kỹ thuật tự động hóa giải trình tự DNA đang trở nên ngày càng phổ biến hơn Kỹ thuật này thường được gọi là "Dye-termination sequencing" hoặc "Sanger sequencing with fluorescent labeling." Trong phương pháp này, ddNTP được dùng với các đánh dấu huỳnh quang khác nhau cho mỗi loại ddNTP Mỗi loại ddNTP có một màu fluorescent cụ thể, với bước sóng phát xạ huỳnh quang riêng biệt Khi ddNTP này được thêm vào chuỗi DNA trong quá trình khuếch đại, nó sẽ dừng sự phát triển của chuỗi vì thiếu nhóm phosphate ở vị trí 3' của nucleotide, không cho phép tiếp tục tổng hợp DNA Sau khi quá trình giải trình tự hoàn tất, có thể sử dụng máy đọc tự động để phân tích trình tự Máy này sẽ đọc màu fluorescent của từng ddNTP trong chuỗi, và từ đó xác định trình tự của DNA dựa vào sự xuất hiện của các màu fluorescent khác nhau Ưu điểm của kỹ thuật này là rất hiệu quả, nhanh chóng và đáng tin cậy trong việc xác định trình tự DNA.

Nghiên cứu phát sinh loài

Phát sinh chủng loại phân tử là một lĩnh vực trong ngành phả hệ học nhằm tìm hiểu mối quan hệ về tiến hóa giữa các loài, các cá thể, gene hoặc protein thông qua việc so sánh sự tương đồng của DNA hoặc protein, thường bằng việc áp dụng các thuật toán xác định Các nhà nghiên cứu khoa học áp dụng các công cụ tin sinh học để tổng hợp và đánh giá dữ liệu, mô phỏng quá trình tiến hóa và xây dựng cây phả hệ để phân tích mối liên hệ của các đối tượng nghiên cứu (Pevsner et al., 2015; Salemi et al., 2009) Kết quả phân tích thường được biểu diễn bằng cách vẽ cây phát sinh loài phân tử, còn được gọi là biểu đồ phân nhánh

(Dowell, 2008) Sử dụng các đặc điểm phân tử như các đoạn DNA hoặc protein đã trở thành một yếu tố quan trọng khi nghiên cứu về phát sinh loài trong thời gian gần đây Sự tiến bộ trong kỹ thuật giải trình tự DNA và phát triển của các kỹ thuật phân tích thống kê đã đem lại động lực mới cho lĩnh vực này, mở ra cơ hội để khám phá và hiểu rõ hơn về mối tương quan tiến hóa giữa các loài khác biệt

Nghiên cứu phát sinh loài bằng phân tích phân tử bao gồm các bước sau:

Quá trình hiệu chỉnh các trình tự DNA được thực hiện tự động bằng máy tính hoặc thủ công Thông thường, phần mềm như Clustal X/W thường được sử dụng để tự động hiệu chỉnh trình tự Tuy nhiên, đối với các gene hoặc vùng DNA có độ biến đổi cao và chứa các kết quả chèn hoặc xóa nucleotide (indels), quá trình hiệu chỉnh trình tự tự động có thể dẫn đến sai sót Một phương pháp xử lý indels phổ biến là loại bỏ tất cả các vùng chứa indel Điểm mạnh của phương pháp tiếp cận này là nó cho phép mô hình hóa tất cả các biến thể trong trình tự bằng một mô hình thay thế khác Tuy nhiên, phương pháp này có hạn chế là thông tin về sự phát sinh loài trong vùng indel cũng bị loại bỏ Vì vậy, với các gene hoặc vùng DNA có sự biến đổi cao, thường cần phải tiến hành căn chỉnh thủ công, tức là xem xét và điều chỉnh từng phần của trình tự bằng cách thủ công Quá trình này được xem là lần cuối cùng để nghiên cứu viên kiểm tra tính chính xác của trình tự trước khi tiến hành phân tích Các vùng không thể căn chỉnh sẽ được loại bỏ khỏi phân tích để bảo đảm sự chính xác của dữ liệu kết quả

(2) Lựa chọn mô hình tiến hóa phù hợp nhất

Mô hình tiến hóa sử dụng để nghiên cứu trình tự DNA đang ngày càng phức tạp hơn Những tham số cơ bản bao gồm tần số cơ sở, ma trận tốc độ thay đổi, phân bố gamma, tỷ lệ vị trí không đổi và đồng tiến hóa Ban đầu, giả định ban đầu về mô hình đơn giản nhất định là tần suất xuất hiện của những loại base là giống nhau, như vậy mỗi loại base (A, T, G, C) có xác suất xuất hiện 25% tại mỗi vị trí cụ thể trong trình tự Tuy nhiên, thực tế thường khác biệt, và tần suất cơ sở thường ước tính dựa vào dữ liệu thực tế đến từ các tập dữ liệu cụ thể

Do đó, tần suất của từng loại cơ sở có thể thay đổi đối với các tập dữ liệu không giống nhau Đối với mô hình tiến hóa đơn giản nhất thì tốc độ biến đổi được cho là như nhau với tất cả các loại đột biến điểm Như vậy, mô hình chỉ dùng một biến thể để mô phỏng sự thay đổi trình tự Hai loại biến thể quan trọng thường được sử dụng: đồng hóa và không đồng nhất Đồng hóa biểu thị sự tương tự giữa các trình tự, trong khi không đồng nhất biểu thị sự khác

17 biệt Hai loại biến thể này thường được gán giá trị khác nhau để mô phỏng tính đa dạng của tiến trình tiến hóa

Mô hình hồi biến tổng quát theo thời gian (General time reversible model) thực sự là một mô hình phát triển trong lĩnh vực tiến hóa phân tử Mô hình này được thiết kế để xem xét sự biến đổi trong trình tự DNA hoặc protein một cách tổng quát và phức tạp hơn Mô hình GTR giả định rằng có tổng cộng 6 loại biến và mỗi loại biến đổi có tốc độ biến đổi riêng của nó Mô hình GTR là một trong số những mô hình tiến hóa phổ biến và hiệu quả được áp dụng khi phân tích phát sinh loài phân tử, đặc biệt khi có nhiều sự biến đổi phức tạp diễn ra trên chuỗi trình tự Nó cho phép người nghiên cứu ước tính tốc độ biến đổi riêng cho từng loại biến đổi và từ đó dựng các cây phả hệ tiến hóa chính xác hơn Tốc độ của các biến đổi này được mô phỏng theo phân bố gamma, và mô hình cũng xem xét tỷ lệ các vị trí không bị biến đổi Các dữ liệu và phép tính này gắn liền với mô hình tiến hóa và áp dụng tiến hóa phân tử để xem xét sự thay đổi và đa dạng của các phần tử DNA Cả hai thông số này được tính toán để cung cấp dữ liệu về đặc điểm cụ thể của trình tự và tốc độ tiến hóa của nó Các mô hình phát sinh loài thường sử dụng thông số này để cải thiện tính chính xác của cây phả hệ tiến hóa và hiểu sâu hơn về mối quan hệ giữa các loài dựa trên dữ liệu phân tử Ngoài ra, mô hình hồi biến tổng quát theo thời gian (GTR) có thể đưa ra cái nhìn tổng quan cho quá trình tiến hóa và sự tương tự giữa các trình tự Mô hình này cung cấp sự linh hoạt trong việc đánh giá tốc độ biến đổi và tính đa dạng của các vùng DNA Tính đa dạng và tốc độ biến đổi của DNA là yếu tố quan trọng trong việc hiểu và mô hình hóa quá trình tiến hóa của các loài Các chương trình phân tích phát sinh loài như PAUP sử dụng các thông số này để tạo ra nhiều mô hình tiến hóa khác nhau, cung cấp các phương pháp đa dạng để nghiên cứu và so sánh quá trình tiến hóa trên các trình tự Sự kết hợp của các thông số này cung cấp một hệ thống đầy đủ cho việc nghiên cứu tiến hóa phân tử và giúp nghiên cứu sinh học phát sinh loài hiểu rõ hơn về mối liên hệ di truyền giữa các loài khác nhau Hiện nay, các phương pháp như kiểm tra tỷ lệ khả năng theo cấp bậc (như hLRTs) và sử dụng tiêu chuẩn thông tin Akaike (AIC) và thông tin Bayesian (BIC) giúp tìm được mô hình tiến hóa mà dữ liệu phù hợp nhất Bằng cách này, đảm bảo rằng phân tích sử dụng mô hình mạnh mẽ và chính xác, giúp chúng ta hiểu sâu hơn về tiến hóa trong các loài và hệ sinh thái khác nhau

(3) Xây dựng cây phát sinh phân tử

Mục tiêu của phân loại phát sinh loài là xây dựng một cây tiến hóa tốt nhất hoặc gần đúng nhất để biểu thị sự tiến hóa của gene hoặc loài đang được nghiên cứu (Salemi et al.,

2009) Những phương pháp thường được sử dụng chia thành hai nhóm chính:

Phương pháp dựa trên khoảng cách: đây là một nhóm phương pháp, ví dụ như Neighbor-Joining và UPGMA Thuật toán này cố gắng giảm tổng chiều dài của các nhánh trên cây Nó bắt đầu bằng việc tạo một cây với tất cả các lá (chuỗi trình tự) và sau đó lặp đi lặp lại để gộp các cụm có thể kết hợp với nhau để giảm tổng chiều dài của cây Phương pháp khoảng cách có thể tái tạo cây chính xác nếu tất cả các sự kiện phân kỳ di truyền được phản ánh chính xác trong trình tự Khoảng cách cặp được tính toán dựa trên ước tính khả năng tối đa của tỷ lệ thay thế Phương pháp này giúp hiểu rõ các đặc điểm và cơ chế tiến hóa đã được nghiên cứu kỹ lưỡng và có thể sử dụng các thông số cụ thể và mô hình đã biết để giải quyết vấn đề Tuy nhiên, nhược điểm của nó là nó loại bỏ thông tin có thể dẫn đến mất thông tin về sự thay đổi trong quá trình tiến hóa dẫn đến giảm tính chính xác có thể ảnh hưởng đến khả năng phát hiện sự khác biệt giữa các loài hoặc phân nhánh tiến hóa (Salemi et al., 2009)

Có hai phương pháp phổ biến dựa trên đặc tính trong phân tích phát sinh loài là Maximum Parsimony (MP) và Maximum Likelihood (ML) Phương pháp MP giả thuyết rằng cây tiến hóa tối ưu là cây ngắn và ít thay đổi nhất Nó cố gắng tìm cây tiến hóa sao cho số lần thay đổi tiến hóa là ít nhất để lý giải sự không giống nhau giữa các đơn vị phân loại hiện có Điều này thường đồng nghĩa với việc tạo ra một cây với tổng chiều dài ngắn nhất Tuy nhiên, việc thực hiện điều này có thể yêu cầu một khoảng thời gian đáng kể Cây tốt nhất trong MP thường là cây có điểm thấp nhất (Jill Harrison & Langdale, 2006) Phương pháp

MP không hiệu quả khi tỷ lệ giữa các vùng quan trọng không đồng nhất khác nhau MP có thể dẫn đến nhiều cây có cùng số điểm vì mỗi cây được xem là tối ưu, do đó, chỉ có các cụm xảy ra trong vùng đồng nhất của tất cả các cây mới được coi là hỗ trợ Phương pháp ML tái tạo cây tiến hóa từ dữ liệu dựa trên một hàm toán tính toán xác suất ML chọn cây tiến hóa trong khi phân tích dữ liệu theo một mô hình cụ thể với xác suất cao nhất Dù là quá trình tốn thời gian, phương pháp này thường mang lại kết quả đáng tin cậy nhất (Jill Harrison & Langdale, 2006)

Thực tế, một cây tiến hóa có thể có xác suất cao nhất theo một mô hình nhất định, nhưng lại có xác suất thấp hơn nhiều khi sử dụng mô hình khác Vì vậy, việc tối ưu hóa và

19 so sánh kết quả từ nhiều phương pháp là cần thiết để tìm ra cây phát sinh loài tốt nhất dựa trên bộ dữ liệu, đồng thời đảm bảo độ tin cậy của cây phát sinh loài được xây dựng và giúp loại bỏ các sai sót có thể xuất hiện khi chỉ sử dụng một phương pháp duy nhất

(4) Đánh giá cây phát sinh phân tử

Phân tích bootstrap là công cụ quan trọng dùng trong nghiên cứu phát sinh loài và phân tử, dùng để đánh giá độ tin cậy cây phát sinh loài bằng cách xác định mức độ tin cậy của sự phân nhóm loài trên cây dựa vào các mẫu phụ được tạo ra từ dữ liệu ban đầu Phương pháp này đã được giới thiệu bởi Felsenstein vào năm 1985 và đã trở thành công cụ quan trọng trong lĩnh vực phát sinh loài Trước hết, nhiều bộ số liệu mới được tạo ra từ dữ liệu ban đầu bằng cách lấy mẫu ngẫu nhiên các cột trạng thái từ dữ liệu gốc Mỗi tập dữ liệu mới này có cùng tổng số vị trí như dữ liệu gốc, nhưng một số vị trí có thể được nhân đôi hoặc bị loại bỏ Sau đó, số lần một nhánh cụ thể (một đơn vị phân loại) xuất hiện trong các cây phát sinh loài được tính toán từ các tập dữ liệu mới này, và con số này thường được gọi là giá trị bootstrap Nó biểu thị mức độ đồng nhất hoặc tin cậy của một nhánh cụ thể trên cây phát sinh loài Nếu một nhánh xuất hiện trong hầu hết hoặc tất cả các cây được tạo ra từ các tập dữ liệu mới, giá trị bootstrap sẽ cao, cho thấy sự tin cậy trong việc phân nhóm loài trên nhánh đó Ngược lại, nếu một nhánh ít xuất hiện hoặc không xuất hiện trong các cây, giá trị bootstrap sẽ thấp, cho thấy sự không chắc chắn trong phân nhóm loài trên nhánh đó

Giá trị bootstrap liên quan đến một nhánh cụ thể trong cây phát sinh loài và cho biết mức độ hỗ trợ của nó từ dữ liệu mẫu Nó thường được diễn giải như một tỷ lệ lặp lại (bootstrap) hỗ trợ các đơn ngành của nhánh Giá trị bootstrap cao hơn, ví dụ như trên 70%, thường được coi là đáng tin cậy và cho thấy rằng nhánh này được hỗ trợ mạnh từ dữ liệu (Salemi et al., 2009) Tuy nhiên, cần lưu ý rằng giá trị bootstrap không phải lúc nào cũng đảm bảo độ tin cậy tuyệt đối Có thể có các yếu tố khác, chẳng hạn như sự chọn lọc mẫu ban đầu hoặc đặc tính của dữ liệu, có thể gây ra tác động tới kết quả bootstrap

VẬT LIỆU VÀ PHƯƠNG PHÁP

Vật liệu

Mẫu nấm ký sinh trên côn trùng được thu thập ở khu vực núi LangBiang, Đà Lạt, tỉnh Lâm Đồng do TS Trương Bình Nguyên cung cấp Các mẫu nấm được ký hiệu là T001, T002, T003, T004, T005 Các mẫu nấm sau khi thu nhận được tiến hành định danh hình thái tại Viện Nghiên cứu và ứng dụng nông nghiệp công nghệ cao, Đại học Đà Lạt, tỉnh Lâm Đồng

Kết quả định danh các mẫu hình thái là T001: Cordyceps takaomontana, T002:

Simphicillium lamellicola, T003: Ophiocordyceps sphecocephala, T004: Cordyceps nichunkispora, T005: Ophiocordyceps langbianensis

Hình 3.1: Hình thái mẫu nấm

Hình 3.2: Hình thái mẫu nấm T002: Simphicillium lamellicola

Hình 3.3: Hình thái của mẫu T003: Ophiocordyceps sphecocephala

Hình 3.4: Hình thái của mẫu

Hình 3.5: Hình thái của mẫu T005: Ophiocordyceps langbianensis

1.2 Dụng cụ, thiết bị và hóa chất

- Máy Vortex (Vortex ZX3, Velp Ý)

- Máy ly tâm lạnh (Hettich Universal 320R, Đức)

- Bộ dụng cụ điện di DNA (Biorad)

- Bộ dụng cụ đọc kết quả điện di

- Máy đo quang phổ (Scanning UV/VIS, Smart Spec, BioRad)

- Dùng cho quá trình tách chiết DNA: Tris-HCl pH 8 1M, EDTA 0.5M 2%, SDS 10%, NaCl 2.5M, β-mercaptoethanol 99.9%, 1% CTAB, dd H2O (đã hấp), proteinase K 1mg/ml, PCI: Phenol/chloroform/isoamylalcohol (25:24:1 v/v/v), Phenol, Chloroform, TE 1X, Isoamylalcohol, Ethanol 70%, Isopropanol

- Dùng cho quá trình PCR và điện di: Master Mix (2X) (bio-line), Primer forward 10 μM, Primer reverses 10 μM, dd H2O (đã hấp), Agarose, TBE 1X, Gel red 6X, Thang phân tử 100bp (hãng sản xuất: BIOLINE, cat No: BIO-30056)

Các phần mềm sử dụng trong nghiên cứu

- NCBI (https://www.ncbi.nlm.nih.gov/): NCBI cung cấp một loạt các công cụ và tài nguyên, bao gồm cơ sở dữ liệu về trình tự nucleotide và protein, phân loại, geneome, và nhiều thông tin hữu ích khác

- BLAST (NCBI) (https://blast.ncbi.nlm.nih.gov/Blast.cgi): BLAST là một công cụ quan trọng cho việc so sánh đoạn mồi hoặc trình tự với các dữ liệu trình tự lớn tại Genebank Nó giúp xác định sự tương đồng giữa trình tự và cung cấp thông tin liên quan quan trọng

- IDT analyzer (https://sg.idtdna.com/calc/analyzer): IDT Analyzer là một công cụ hữu ích để phân tích các thông số quan trọng của đoạn mồi DNA, như chiều dài, %GC, nhiệt độ nóng chảy và khả năng hình thành cấu trúc thứ cấp Điều này quan trọng khi thiết kế mồi cho các thí nghiệm phân tử

- BioEdit 7.7.1: BioEdit là một phần mềm miễn phí cho việc xem, hiệu chỉnh và phân tích trình tự nucleotide Nó cung cấp các công cụ để xem và so sánh trình tự, cũng như phân tích sự tương đồng

- MEGA X: MEGA là phần mềm mạnh mẽ cho việc xây dựng cây phát sinh loài, một công cụ quan trọng trong nghiên cứu phát sinh loài và tiến hóa Nó hỗ trợ các phương pháp phân tích tiến hóa như Maximum Parsimony, Maximum Likelihood và Neighbor-Joining

Hình 3.6 : Tổng quan về giai đoạn thực hiện dự án

2.1 Xây dựng cơ sở dữ liệu

Thu thập các thông tin dữ liệu gene từ những mẫu nấm ký sinh côn trùng Các mẫu này được lấy từ nguồn dữ liệu đáng tin cậy như NCBI, PUBMED, Web of Science, Embase Database, v.v Để thực hiện việc này, các từ khóa như 'ITS', 'nrSSU', 'nrLSU', 'Tef1', 'Rpb1', 'Atp6', 'tub', 'molecular phylogeney', 'cordyceps' được sử dụng để tìm kiếm các gene có liên quan

Sau khi thu thập các trình tự gene, chúng sẽ được so sánh và phân tích để so sánh mức độ tương đồng Quá trình này bao gồm việc sắp xếp các trình tự này thành các cột, và điều này thường thực hiện bằng việc áp dụng phần mềm như Clustal hoặc Seaview

Dữ liệu về các cặp mồi đặc hiệu khuếch đại cho các vùng gene (như ITS, nrSSU, nrLSU, Tef1, Rpb1, Atp6, Tub) được thể hiện trong Bảng 3.1

Khuyếch đại các vùng gene mục tiêu

Giải trình tự và hiệu chỉnh trình tự

Xây dựng cơ sở dữ liệu

Xây dựng cây phả hệ phân tử đã gene

Bảng 3.1: Trình tự mồi sử dụng trong nghiên cứu

Gene Tên mồi Trình tự (5’ – 3’) Chiều Tài liệu tham khảo nrLSU

LR5 ATCCTGAGGGAAACTTC R nrSSU NS1 GTAGTCATATGCTTGTCTC F (White et al., 1990)

Rpb1 CRPB1 CCWGGYTTYATCAAGAARGT F (Castlebury et al., 2004)

Atp6 Atp6- C1A AGAWCAATTYGAARTRAGAG F (Castlebury et al., 2004)

K = G/T, I = A/C/G, N = anybase; F: Mồi xuôi; R: Mồi ngược Quá trình được thực hiện bao gồm việc đánh giá những thông số vật lý của các cặp mồi trong đề tài bằng phần mềm trực tuyến IDT analyzer (www.idtdna.com/analyzer/Applications/OligoAnalyzer) Các thông số của mồi phải tuân theo một số yêu cầu và tiêu chuẩn quan trọng sau: chiều dài mồi hải nằm trong khoảng từ 17 đến 28 bp, tỷ lệ GC (%GC) trong mồi nên nằm trong khoảng từ 40% đến 60%, mồi không nên chứa chuỗi liên tiếp dài hơn 3 bp của base G hoặc C tại đầu 3’ của mồi, nhiệt độ nóng chảy trong khoảng từ 50°C đến 65°C, ∆G (kcal/mole) của hệ mồi phải lớn hơn hoặc bằng -9 kcal/mole

Sau khi đã đảm bảo rằng các mồi thỏa các tiêu chuẩn vật lý cần thiết, quá trình kiểm tra độ đặc hiệu của mồi tiếp tục thông qua công cụ BLAST trên NCBI, từ đó xác minh mức độ tương đồng giữa mồi và các trình tự khác

Tiến trình thực hiện

2.1 Tách chiết DNA bằng phương pháp Phenol/Chloroform

Bước 1: Ly giải tế bào với lysis buffer có sử dụng β-mercaptoethanol (phá vỡ cấu trúc xơ) và CTAB

- Lấy khoảng 1,5 g mẫu cho vào ống eppendorf

- Bổ sung 700 àl dung dịch lysis buffer bao gồm: 70àl Tris - HCl pH 1M, 392àl NaCl 2,5M, 140àl CTAB 10%, 14àl β - mercaptoethanol 99,9%, 14àl dd H2O, 70àl Proteinase K 1mg/ml Lắc đều ống

Bước 2: Bỏ Protein và các thành phần phụ

- Ly tâm ở tốc độ 13.000 vòng/phút trong 10 phút, bỏ tủa, thu dịch nổi

- Thờm vào 700 àl dung dịch PCI (phenol/chloroform/isoamylalcohol tỷ lệ tương ứng là 25:24:1), đảo đều ống và ly tâm ở 13.000 vòng/phút ở 40°C trong 10 phút

- Thu dịch nổi và thêm vào 1 thể tích chloroform, lắc đều Ly tâm 13.000 vòng/ phút tại 4 0 C trong 10 phút

- Thu dịch nổi và bổ sung 1/10 thể tích NaOAC 3M, lắc đều Sau đó, bổ sung 1 thể tích isopropanol, lắc đều và ủ ở nhiệt độ 4 0 C trong vòng 2 giờ

- Ly tâm 13.000 vòng/phút trong 20 phút Bỏ dịch nổi, thu tủa

- Bổ sung 1ml ethanol 70 0 , ly tâm 13.000 vòng/phút trong 10 phút ở 4 0 C, bỏ dịch nổi

- Loại bỏ ethanol và làm khô cặn ở 50 0 C

- Bổ sung 50 àl TE (1X) vào ống

- Bảo quản mẫu ở nhiệt độ -20 0 C

Bước 3: Kiểm tra sản phẩm DNA thu được sau khi tách chiết

Tỷ lệ OD260/OD280 được sử dụng để đo lường chất lượng và hàm lượng DNA thu được sau quá trình tách chiết Để làm điều này, pha loãng DNA 50 lần bằng dung dịch TE (1X), đo độ hấp thu của mẫu thử ở bước sóng 260 nm và 280 nm Xác định tỷ lệ OD260/OD280 bằng cách đo sự hấp thu ánh sáng của mẫu DNA tại bước sóng 260 nm và

280 nm Khi DNA tinh sạch và không có sự có mặt của protein và hợp chất nền khác, tỷ lệ này trong khoảng từ 1,8 đến 2,0 Đây là một kết quả mong muốn, vì nó cho thấy DNA có chất lượng cao và không bị nhiễm protein hoặc các hợp chất nền khác

2.2 Phản ứng PCR khuếch đại gene mục tiêu và giải trình tự

Phản ứng PCR được thực hiện với thành phần phản ứng:

Chương trình luân nhiệt như sau:

Hình 3.7: Chu trình nhiệt độ chung Chú thích: X là nhiệt độ bắt cặp tối ưu của mồi

Sau quá trình PCR, kiểm tra sản phẩm PCR trên gel agarose 1.5% sử dụng dung dịch đệm TBE, điện thế 100V trong 30 phút Sau khi chạy gel, sử dụng máy chụp ảnh gel của BioRad để đọc kết quả Sau khi xác định sản phẩm PCR, làm sạch và gửi mẫu giải trình tự tại công ty Nam Khoa

2.3 Phân loại và phân tích phả hệ phân tử a) Hiệu chỉnh trình tự

Quá trình kiểm tra và hiệu chỉnh kết quả giải trình tự bằng phần mềm BioEdit 7.7.1, đây là khâu quan trọng trong việc đảm bảo tính chính xác và chất lượng của dữ liệu trình tự Đầu tiên, kiểm tra các tín hiệu ở cả hai đầu của mồi, nếu có các đoạn có tín hiệu không rõ ràng, thì phải thực hiện quá trình hiệu chỉnh Đối với mạch xuôi, trình tự được lưu thành tệp fasta như thông thường, trong khi đối với mạch ngược, cần chuyển nó thành mạch xuôi trước rồi lưu thành tệp fasta

Sử dụng phần mềm BioEdit 7.7.1 để thực hiện việc sấp gióng cột và kiểm tra độ tương đồng giữa hai mạch Nếu phát hiện bất kỳ lỗi nào như không khớp hoặc khoảng trống, sử dụng tính năng chỉnh sửa trong BioEdit 7.7.1 để sửa lỗi Quá trình so sánh và kiểm tra sẽ được tiến hành nhiều lần để bảo đảm kết quả cuối cùng là có được đoạn DNA có tính chính xác cao nhất Sau khi hoàn thành quá trình sắp xếp và kiểm tra, lưu trình tự cuối cùng với tất cả các thay đổi đã được thực hiện b) So sánh với cơ sở dữ liệu trên Genebank

Sau khi trình tự PCR đã được hiệu chỉnh, nó sẽ được thực hiện quá trình BLAST để xác minh tính chính xác của trình tự và tìm kiếm các trình tự tương đồng trên Genebank hoặc trong cơ sở dữ liệu trình tự khác

Việc hiệu chuẩn trình tự được thực hiện hoàn tất nếu kết quả tìm kiếm trình tự tương đồng nhất quán, nghĩa là có một hoặc nhiều trình tự có độ dài và cấu trúc nucleotide hoàn toàn giống nhau so với trình tự được kiểm tra Tuy nhiên, nếu trình tự đã chỉnh sửa khác với các trình tự trên Genebank của NCBI thì cần kiểm tra các nucleotide có những khác biệt này Sử dụng BioEdit 7.7.1 để kiểm tra các sai lệch có thể xuất phát từ lỗi kỹ thuật trong quá trình hiệu chỉnh Trường hợp peak trên BioEdit 7.7.1 không rõ ràng và không thể xác định nucleotide nào bị sai khác, thì quy trình giải quyết sẽ là tải các trình tự có độ giống nhau trên 50% so với trình tự của đề tài từ nguồn dữ liệu Genebank trên NCBI Tiếp theo thực hiện sấp giống cột trình tự của đề tài với các trình tự này và kiểm tra tần suất của việc xuất hiện các nucleotide tại vị trí cần kiểm tra Dựa vào tần suất này để xác định nucleotide cần thay thế ở vị trí đó Quá trình kiểm tra và hiệu chỉnh lại sẽ tiếp tục cho đến khi thu nhận được trình tự có độ tin cậy và độ chính xác tối ưu Bằng cách so sánh và kiểm tra với trình tự tương đồng thì có thể chắc chắn rằng trình tự của đề tài đang được điều chỉnh một cách chính xác và thích hợp với các trình tự liên quan trên Genebank c) Xây dựng bộ dữ liệu phân tử

Chuẩn bị bộ cơ sở dữ liệu cục bộ cho từng gene Cordyceps Fr., sử dụng thông tin từ các nguồn và tham khảo chủ yếu là các bài báo của Sung và cộng sự (2007) Sử dụng phần mềm BioEdit 7.7.1 để thực hiện việc sấp gióng cột cho từng cơ sở dữ liệu giúp loại bỏ các vùng trình tự không rõ ràng hoặc không chính xác, đảm bảo rằng dữ liệu sẵn sàng cho phần tiếp theo của quá trình phân tích

Sau quá trình sấp gióng cột và hiệu chỉnh, tiến hành thực hiện phân tích bộ dữ liệu

28 này bằng phần mềm MEGA X MEGA là công cụ quan trọng khi thực hiện nghiên cứu phát sinh phân tử, cho phép xây dựng cây phát sinh bằng các phương pháp như Maximum Parsimony, Maximum Likelihood và Neighbor-Joining d) Dò tìm mô hình tiến hóa phù hợp nhất

Việc xây dựng cây Maximum Likelihood là một thành phần quan trọng của nghiên cứu phát sinh loài và phân tích phả hệ phân tử Để xác định mô hình tiến hóa phù hợp nhất cho việc xây dựng cây Maximum Likelihood sử dụng chức năng “Find Best DNA/Protein Models (ML)” của phần mềm MEGA X Một số mô hình đơn giản cho dữ liệu nucleotide như Jukes Cantor (JC) và Kimura 2-parameter (K2) giả định rằng tất cả nucleotide xuất hiện với tần suất bằng nhau, và nhiều mô hình phức tạp hơn như Felsenstein, Hasegawa–Kishono–Yano (HKY), và General Time Reversible (GTR) giả định tốc độ thay thế và tần suất nucleotide khác nhau

Mô hình thay thế trong ngữ cảnh của nghiên cứu tiến hóa và phân tích phát sinh loài là một công cụ toán học giúp mô phỏng và hiểu quá trình thay đổi của các đơn vị di truyền, như nucleotide hoặc amino acid, qua thời gian Các mô hình này đóng vai trò quan trọng trong việc xây dựng cây phát sinh loài và ước lượng khoảng cách tiến hóa giữa các loài Một số mô hình đơn giản cho dữ liệu nucleotide như Jukes Cantor (JC) và Kimura 2-parameter (K2) giả định rằng tất cả nucleotide xuất hiện với tần suất bằng nhau; mô hình Tamura 3-parameter (T92) mô tả tốc độ thay thế của nucleotide; mô hình Hasegawa-Kishino-Yano (HKY) dùng để điều chỉnh thêm tần suất nucleotide; mô hình General Time Reversible (GTR) cho phép tất cả loại thay thế và tần suất nucleotide khác nhau; và mô hình TN93 (Tamura-Nei 1993) cải tiến của T92 với xem xét thêm sự chệch ở vị trí thứ ba của codon Lựa chọn giữa các mô hình phụ thuộc vào nhiều yếu tố và có thể được thực hiện bằng các phương pháp đánh giá như Bayesian information criterion (BIC) và corrected Akaike information criterion (AICc) MEGA là một trong những phần mềm hỗ trợ hiển thị mô hình tiến hóa sử dụng trong bộ dữ liệu cụ thể (Arenas, 2015) e) Xây dựng cây phát sinh loài

Có ba phương pháp xây phát sinh loài khác nhau bao gồm Maximum Likelihood, Neighbor Joining, Maximum Parsimony (Kumar, 2013) Phương pháp Maximum Parsimony với giá trị bootstrap được thiết lập là 1000 lần là một cách thường dùng để xác định mức tin cậy của các nhánh trong cây phát sinh loài Ngưỡng thông thường sử dụng là 70% hoặc 75% Điều này có nghĩa rằng nếu một nhánh xuất hiện trong ít nhất 70% hoặc

75% của các cây con, thì nhánh đó được coi là được ủng hộ mạnh mẽ Trong ngữ cảnh này, một giá trị bootstrap lớn hơn ngưỡng này (70% hoặc 75%) cho thấy mức độ tin cậy cao hơn cho nhánh đó

Tuy nhiên, ngưỡng đánh giá này có thể thay đổi tùy mục tiêu của nghiên cứu và mức độ tin cậy mong muốn Nghiên cứu phức tạp và quan trọng thường yêu cầu mức độ ủng hộ cao hơn (ví dụ: 90% hoặc 95%) để chắc chắn rằng các nhánh được ủng hộ đều là nhánh có ý nghĩa thực sự Trong một số trường hợp, mức độ ủng hộ thấp hơn (ví dụ: 50%) có thể vẫn chấp nhận được nếu nghiên cứu không đòi hỏi độ tin cậy cao

Sự lựa chọn của ngưỡng nên dựa trên tính toán cân nhắc giữa mức độ tin cậy và số lượng nhánh được chấp nhận Ngưỡng cao hơn đồng nghĩa với việc chấp nhận ít nhánh hơn vì chúng phải đạt đến mức độ ủng hộ cao hơn, trong khi ngưỡng thấp hơn có thể dẫn đến việc chấp nhận nhiều nhánh hơn nhưng với mức độ tin cậy thấp hơn

KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN

Khảo sát mồi

1.1 Kết quả kiểm tra thông số vật lý của mồi

Các cặp mồi được chọn dựa trên thông tin từ các nghiên cứu đã công bố, tuy nhiên, để đảm bảo độ tin cậy và tính ứng dụng các mồi này trong nghiên cứu hiện tại, các tiêu chuẩn vật lý của từng mồi đã được tái kiểm tra bằng phần mềm OligoAnalyzer (https://sg.idtdna.com/calc/analyzer) Kết quả được thể hiện trong Bảng 4.1

Bảng 4.1: Kết quả thông số vật lí của các mồi

Gene Tên mồi Độ dài

Cấu trúc kẹp tóc (Kcal/mol)

Cấu trúc tự bắt cặp (Kcal/mol) nrLSU LR0R 19 52,60 53,30 -0,24 -8,05

Nhìn chung, các mồi đã được kiểm tra và đáp ứng tiêu chuẩn về độ dài (17 đến 30 nu) và không tạo thành cấu trúc kẹp tóc (∆G ≥ -9,0 kcal/mol) Tuy nhiên, về nhiệt độ nóng chảy, hầu hết các mồi có Tm thấp hơn so với tiêu chuẩn (60 - 64°C) Các mồi tiêu chuẩn bao gồm các mồi mã hóa gene Tef1 (983F và 2218R) và tub (T22) Các mồi có nhiệt độ nóng chảy thấp có thể dẫn đến sự không đặc hiệu trong phản ứng PCR và tạo ra sản phẩm không mong muốn

Về tỷ lệ GC, cặp mồi ATPC1A và ATPC2A có tỷ lệ GC thấp hơn một chút so với tỷ lệ GC tiêu chuẩn (35-60%) có thể làm giảm tính đặc hiệu của mồi và ảnh hưởng hiệu quả phản ứng PCR Một số mồi, như mồi RPB1Cr, 983F và ATPC1A, có khả năng hình thành cấu trúc tự bắt cặp (self-dimer) do có mức năng lượng tự do thấp, và các mồi CRPB1 và T12 có mức năng lượng tự do thấp hơn một chút (∆G ≤ -9,0 kcal/mol) Sự có mặt của các cấu trúc tự bắt cặp có năng lượng tự do thấp có thể có các rủi ro khi thực hiện quá trình PCR Các cặp mồi với khả năng tự bắt cặp dễ dàng có có các sản phẩm PCR không mong muốn bằng cách tạo ra cấu trúc chéo hoặc tự bắt cặp, gây nên sự nhiễu loạn trong phản ứng

Chênh lệch nhiệt độ nóng chảy quá lớn giữa cặp mồi có thể gây ra sự không đồng nhất trong phản ứng PCR (không nên vượt quá 2°C) Kết quả ở Bảng 4.2 cho thấy hai cặp mồi mã hóa cho gene nrSSU và Tef là đáp ứng tiêu chuẩn này Các cặp mồi còn lại có sự chênh lệch lớn đáng kể, trong khoảng từ 2,9°C đến 9,6°C Kết quả này có ý nghĩa rằng quá trình tối ưu hóa phản ứng PCR cần phải được tiến hành một cách cẩn thận để tránh tạo ra sản phẩm phụ, do sự kết hợp của các mồi xảy ra ở nhiệt độ quá thấp Đối với các chuẩn hình thành cấu trúc bắt cặp chéo (heterodimer), các cặp mồi ít có khả năng hình thành cấu trúc này và đáp ứng tiêu chuẩn về năng lượng tự do (∆G ≥ -9,0 kcal/mol) Điều này có nghĩa rằng các mồi này có thể hoạt động hiệu quả trong phản ứng PCR mà không gặp sự cản trở từ việc hình thành cấu trúc heterodimer

Nhiệt độ bắt cặp được đề xuất cho các cặp mồi dựa trên hướng dẫn của IDT và thông tin này đã được liệt kê trong Bảng 4.2 Theo hướng dẫn này, Ta được thiết lập thấp hơn Tm ít nhất là 5°C Trong trường hợp các cặp mồi chưa thỏa các điều kiện khảo sát, trong quá trình khuếch đại cần phải tối ưu khi kết quả chưa tốt Nguyên nhân là do các cặp mồi này có thể tạo thành các cấu trúc tự bắt cặp cao, do chênh lệch lớn về nhiệt độ nóng chảy Việc này có thể dẫn đến sự tạo thành các cấu trúc phức tạp trong quá trình PCR, và tạo thành các sản phẩm phụ hoặc giảm hiệu suất phản ứng Vì vậy, để đảm bảo rằng các cặp mồi này hoạt động hiệu quả, tối ưu hóa cẩn thận cần được thực hiện, và nhiệt độ bắt cặp cần phải được xác định một cách chính xác để để đạt được sản lượng cần thiết và đảm bảo độ chính xác

Bảng 4.2: Kết quả các thông số vật lý của các cặp mồi và Ta (nhiệt độ bắt cặp) đề xuất

Hiệu số nhiệt độ nóng chảy ( o C)

Cấu trúc bắt cặp chéo (Kcal/mol)

Nhiệt độ bắt cặp đề xuất ( o C) nrLSU LR0R – LR5 5,3 -6,14 46 nrSSU NS1 – NS4 1,5 -3,90 43

1.2 Kết quả kiểm tra độ đặc hiệu của mồi

Dựa trên kết quả BLAST, tổng thể các mồi dùng trong đề tài nghiên cứu khuếch đại chính xác của các trình tự gene mục tiêu ở cả ba họ nấm: Ophiocordycipitaceae, Clavicipitaceae, và Cordycipitaceae Do đó, dựa trên những kết quả thu được, khẳng định rằng các đoạn mồi trong nghiên cứu này có độ đặc hiệu cao đối với phân tích dữ liệu về gene bằng phương pháp tính toán (in silico) (Bảng 3.2, Hình 3.1)

Sự không giống nhau về độ dài của trình tự gene mục tiêu khi được khuyếch đại, một số gene cho thấy sự tương tự về độ dài của trình tự khuếch đại ở cả ba họ nấm Tuy nhiên, còn có các gene khác mà trình tự khuếch đại có độ dài khác nhau, với sự chênh lệch dao động từ 10 đến 100 cặp base (bp) Điều đó cho thấy rằng sự biến đổi lớn về kích thước của trình tự gene mục tiêu trong quá trình phiên mã giữa các loài thuộc họ nấm khác nhau Sự biến đổi này trong độ dài trình tự gene có thể là kết quả của sự tiến hóa Sự tiến hóa có thể làm thay đổi trong cấu trúc và kích thước của các gene Sự biến đổi về độ dài trình tự gene là một phần của sự phức tạp trong quá trình tiến hóa và quan trọng đối với quá trình thích nghi của các loài với môi trường và chức năng gene khác nhau

Bảng 4.3: Kết quả phân tích mồi đặc hiệu sử dụng Primer – BLAST

Gene Tên cặp mồi Kết quả Primer - BLAST

Cordycipitaceae Clavicipitaceae Ophiocordycipitaceae nrLSU LR0R/LR5

Ngoài ra, trong trường hợp của gene Rpb1, có ít trình tự thuộc họ Ophiocordycipitaceae được công bố trong cơ sở dữ liệu Genbank Nguyên nhân có khả

35 năng do sự thiếu hụt thông tin trong cơ sở dữ liệu Sự thiếu hụt này gây khó khăn cho việc tìm ra những điểm tương đồng trong quá trình BLAST và kết quả là chỉ một số lượng nhỏ trình tự gene Rpb1 được tìm thấy trong họ Ophiocordycipitaceae

Hình 4.1: Kết quả kiểm tra cặp mồi CRPB1- RPB1Cr bằng công cụ BLAST (NCBI)

Kết quả thực nghiệm

2.1 Kết quả tách chiết và khuếch đại gene mục tiêu

Nghiên cứu sử dụng năm mẫu nấm được thu thập từ dãy núi LangBiang, Đà Lạt, tỉnh Lâm Đồng Tiến hành tách chiết DNA bằng phương pháp phenol/chloroform và thêm β- mercaptoetanol và CTAB Các bước sóng 260 và 280 nm đã được sử dụng nhằm đánh giá chất lượng và độ tinh khiết của DNA được tách chiết

Các phép đo OD cho thấy tỷ lệ OD260/OD280 trong khoảng từ 1,8 đến 2 (Bảng 4.4) Điều này chứng minh rằng DNA đã tinh sạch và nồng độ DNA đủ để thực hiện phản ứng PCR để khuếch đại gene mục tiêu

Bảng 4.4: Kết quả đánh giá chất lượng và độ tinh khiết của DNA được tách chiết của 05 mẫu nấm sử dụng trong đề tài

OD260/OD280 Độ hấp thụ tại OD260

Sau khi thực hiện phản ứng PCR bằng cách sử dụng cặp mồi sử dụng DNA đã tách chiết các vùng gene nrLSU, nrSSU, rpb1, ITS và Tef được khuếch đại, tiến hành điện di xác định kích thước các băng khuếch đại

Hình 4.2: Kết quả điện di sản phẩm khuếch đại của các gene mục tiêu

Hình 4.2 thể hiện rằng tất cả các mẫu đều được khuếch đại thành công có kích thước tương ứng với kích thước được xác định bằng kỹ thuật phân tích in silico Các băng khuếch đại đạt kích thước dự kiến, với dải sáng và ổn định và không có dải sản phẩm PCR ký sinh Đồng thời, chứng âm không ghi nhận được băng Điều này khẳng định các mẫu không bị nhiễm Phản ứng PCR đã khuếch đại chính xác vùng gene mong muốn, cụ thể các băng có kích thước 950 bp, 1100 bp, 700 bp, 1000 bp, 800 bp lần lượt đại diện cho các gene nrLSU, nrSSU, ITS, tef, rpb1 Do đó, quy trình này đã chứng minh hiệu quả tốt và phù hợp để tách chiết và khuếch đại các gene nrLSU, nrSSU, rpb1, ITS, Tef với nhiệt độ bắt cặp đã được đề xuất Các sản phẩm khuếch đại đã được gửi đi để tiến hành quá trình giải trình tự tại công ty Nam Khoa

2.2 Kết quả hiệu chỉnh trình tự

Kết quả giải trình tự được phân tích và hiệu chỉnh bằng BioEdit 7.7.1, báo cáo này trình bày chi tiết quá trình hiệu chỉnh trình tự nrLSU mẫu T003 được định danh hình thái là

Ophiocordyceps sphecocephala làm đại diện Trình tự gene nrLSU mẫu T003 trước khi hiệu chỉnh có chiều dài mạch xuôi 936 bp và mạch ngược 935 bp Trình tự của mạch ngược được tiến hành đảo chiều và bắt cặp bổ sung với mạch xuôi Sau đó, trình tự của mạch xuôi và mạch ngược được sấp gióng cột để xác định và hiệu chỉnh các nu (sóng) không rõ ràng Các vùng tín hiệu ở đầu 5’ và 3’ ở mạch xuôi và mạch ngược thường cho tín hiệu không rõ ràng (Hình 4.3), do đó, các vùng này thường được loại bỏ để tránh sai lệch Các vùng nằm giữa cho tín hiệu rõ ràng chỉ một vài vị trí tại hai đầu trình tự có tín hiệu không rõ và một vài vị trí mismatch trong trình tự Vì vậy, cần phải tiến hành hiệu chỉnh trình tự này

Hình 4.3: Mô tả sự sai khác nu ở hai mạch xuôi và ngược gene nrLSU ở đầu 5'

Tổng cộng có 25 trình tự được khuếch đại và hiệu chỉnh thành công Các trình tự sau khi được hiệu chỉnh sẽ được tiến hành BLAST để tìm trình tự tương đồng nhất trên Genbank (NCBI) (Bảng 4.4)

Bảng 4.4: Kết quả trình tự tương thích nhất trên BLAST

Chiều dài trình tự sau hiệu chỉnh (bp)

T001 nrLSU 916 Cordyceps takaomontana MW504705 1618 1618 100 99.77 nrSSU 1884 Cordyceps takaomontana AB044631 1932 1932 99 100

Rpb1 738 Cordyceps takaomontana MF416642 1304 1304 97 99.31 tef 773 Cordyceps takaomontana MF416642 1589 1589 100 99.1 T002 nrLSU 866 Simplicillium sp MW493117 1600 1600 100 100

Rpb1 776 Simplicillium lanosoniveum MW893683 660 660 99 83.52 tef 971 Simplicillium lamellicola DQ522356 1753 1753 92 99.69

T003 nrLSU 935 Ophiocordyceps sphecocephala JN941441 1598 1598 96 98.78 nrSSU 1033 Ophiocordyceps sphecocephala JN941697 1810 1810 99 98.55

Rpb1 - - - - - - - tef 999 Ophiocordyceps sphecocephala DQ522336 1751 1751 99 99.79

T004 nrLSU 886 Cordyceps ninchukispora EF468846 1585 1585 99 99.43 nrSSU 991 Cordyceps ninchukispora EF468991 1831 1831 100 100

Rpb1 711 Cordyceps ninchukispora MF416635 1042 1042 100 93.11 tef 995 Cordyceps ninchukispora EF468794 1783 1783 97 99.9

T005 nrLSU 856 Ophiocordyceps langbianensis MT928306 1581 1581 91 100 nrSSU 1093 Ophiocordyceps langbianensis MT928355 1832 1832 98 99.03

Rpb1 656 Ophiocordyceps brunneipunctata DQ522369 1026 1026 62 94.85 tef 992 Ophiocordyceps furcatosubulata MT774242 1711 1711 100 100

“-”: không có dữ liệu Kết quả thu được cho thấy các trình tự thu nhận được có tính chính xác cao Nói cách khác, kết quả BLAST từ Genebank chỉ ra rằng khối dữ liệu phân tích thuộc về các loài nấm trong chi thuộc các họ Ophiocordycipitaceae, Clavicipitaceae và Cordycipitaceae Sau khi xử lý, các trình tự được phối hợp với các bộ dữ liệu từ các công bố khoa học liên quan và các trình tự thu được sẽ được kiểm tra BLAST nhằm xây dựng cơ sở dữ liệu Tuy nhiên, đối

40 với mẫu T003, chúng tôi không giải trình tự được mẫu gene Rpb1 Nguyên nhân không giải được trình tự gene Rpb1 của mẫu T003 có thể do một số yếu tố như mẫu DNA không đủ chất lượng dẫn đến sai sót trong quá trình giải trình tự, các lỗi trong quá trình giải trình tự có thể khiến cho dữ liệu không chính xác Các dữ liệu thu nhận được vẫn được tiến hành để xây dựng cây phả hệ phân tử

2.3 Tạo bộ cơ sở dữ liệu

Bước quan trọng của việc thiết lập quy trình xây dựng phả hệ phân tử chính là xây dựng bộ dữ liệu trình tự các gene của các loài thuộc các chi, họ quan tâm Tập dữ liệu cho 5 gene (nrLSU, nrSSU, Rpb1, ITS và tef) bao gồm tổng cộng 52, 52, 48, 39, và 52 loài đại diện cho đa dạng hình thái và sinh thái các chi thuộc họ Ophiocordycipitaceae, Clavicipitaceae và Cordycipitaceae, bao gồm Glomerella cingulata có vai trò là nhóm ngoại (Bảng 4.5) Những loài này ký sinh trên thực vật và được xếp vào bộ Glomerellales có mối quan hệ họ hàng với bộ Hypocreale nhưng không thuộc vào các họ chính đã được đề cập Đồng thời, một CSDL mới bằng cách kết hợp 5 gene nrLSU-nrSSU-Rpb1-ITS-tef gồm

37 trình tự, trong đó có 2 trình tự của nhóm ngoại được xây dựng Chi tiết được trình bày trong Bảng 4.5

Bảng 4.5: Thông tin các trình tự đã thu thập và dùng để tạo bộ cơ sở dữ liệu

Taxon Họ nrLSU nrSSU rpb1 ITS Tef

Claviceps fusiformis Clavicipitaceae U17402 DQ522539 DQ522366 JN049817 DQ522320

Claviceps paspali Clavicipitaceae U47826 U32401 DQ522367 JN049818 DQ522321

Claviceps purpurea Clavicipitaceae AF543789 AF543765 AY489648 KJ529004 AF543778

Claviceps purpurea Clavicipitaceae EF469075 EF469122 EF469087 KX977396 EF469058

Metacordyceps chlamydosporia Clavicipitaceae DQ518758 DQ522544 DQ522372 JN049821 EF469069

Metacordyceps taii Clavicipitaceae AF543787 AF543763 DQ522383 JN049829 AF543775

Conoideocrella luteorostrata Clavicipitaceae EF468850 EF468995 EF468906 JN049859 EF468801

Conoideocrella luteorostrata Clavicipitaceae EF468849 EF468994 EF468905 JN049860 EF468800

Ophiocordyceps acicularis Ophiocordycipitaceae EF468805 EF468950 EF468852 JN049820 EF468744

Ophiocordyceps acicularis Ophiocordycipitaceae EF468804 EF468951 EF468853 GU723772 EF468745

Ophiocordyceps brunneipunctata Ophiocordycipitaceae DQ518756 DQ522542 DQ522369 GU723777 DQ522324

Ophiocordyceps sinensis Ophiocordycipitaceae EF468827 MF403011 EF468874 JN049854 EF468767

Ophiocordyceps stylophora Ophiocordycipitaceae EF468837 EF468982 EF468882 – EF468777

Ophiocordyceps stylophora Ophiocordycipitaceae DQ518766 DQ522552 DQ522382 JN049828 DQ522337

Ophiocordyceps langbianensis Ophiocordycipitaceae MT928306 MT928355 - - -

Ophiocordyceps australis Ophiocordycipitaceae DQ518768 DQ522554 DQ522385 – DQ522339

Ophiocordyceps variabilis Ophiocordycipitaceae EF468839 EF468985 EF468885 – EF468779

Ophiocordyceps entomorrhiza Ophiocordycipitaceae EF468809 EF468954 EF468857 JN049850 EF468749

Ophiocordyceps gracilis Ophiocordycipitaceae EF468810 EF468955 EF468858 AJ786563 EF468750

Ophiocordyceps gracilis Ophiocordycipitaceae EF468811 EF468956 EF468859 AJ786564 EF468751

Ophiocordyceps heteropoda Ophiocordycipitaceae AY489722 AY489690 AY489651 FJ765028 AY489617

Ophiocordyceps heteropoda Ophiocordycipitaceae EF468812 EF468957 EF468860 JN049852 EF468752

Ophiocordyceps nigrella Ophiocordycipitaceae EF468818 EF468963 EF468866 JN049853 EF468758

Ophiocordyceps sphecocephala Ophiocordycipitaceae JN941441 JN941700 JN992434 AJ536550 DQ522336

Ophiocordyceps rhizoidea Ophiocordycipitaceae EF468825 EF468970 EF468873 JN049857 EF468764

Ophiocordyceps rhizoidea Ophiocordycipitaceae EF468824 EF468969 EF468872 MH754720 EF468765

Cordyceps Cordycipitaceae MW504705 AB044631 MF416642 JQ009304 MF362094

Cordyceps cf pruinosa Cordycipitaceae EF468820 EF468965 EF468868 – DQ522351

Cordyceps cf pruinosa Cordycipitaceae EF468821 EF468966 EF468869 – EF468762

Cordyceps cf pruinosa Cordycipitaceae EF468823 EF468968 EF468871 – EF468761

Cordyceps cicadae Cordycipitaceae MH879588 MH879636 MH885438 MH937743 MH879662

Cordyceps cicadae Cordycipitaceae MK761212 MK761207 MF416653 MH937742 MK770631

Cordyceps kyusyuensis Cordycipitaceae EF468813 EF468960 EF468863 – EF468754

Cordyceps militaris Cordycipitaceae AY184966 AY184977 DQ522377 JN049825 DQ522332

Cordyceps pruinosa Cordycipitaceae AY184968 AY184979 DQ522397 – EF468763

Cordyceps scarabaeicola Cordycipitaceae AF339524 AF339574 DQ522380 JN049827 DQ522335

Cordyceps staphylinidicola Cordycipitaceae EF468836 EF468981 EF468881 – EF468776

Lecanicillium antillanum Cordycipitaceae AF339536 AF339585 DQ522396 MH861888 DQ522350

Lecanicillium fusisporum Cordycipitaceae AF339549 AF339598 EF468889 – EF468783

Lecanicillium psalliotae Cordycipitaceae AF339559 AF339608 EF468890 – EF468784

Lecanicillium tenuipes Cordycipitaceae AF339526 AF339576 DQ522387 JN036556 DQ522341

Cordyceps ninchukispora Cordycipitaceae EF468846 EF468991 EF468900 FJ765277 EF468795

Cordyceps ninchukispora Cordycipitaceae EF468847 EF468992 EF468901 FJ765271 EF468794

Simplicillium lamellicola Cordycipitaceae AF339552 AF339601 DQ522404 MH854806 DQ522356

Simplicillium lanosoniveum Cordycipitaceae AF339554 AF339603 DQ522405 – DQ522358

Simplicillium lanosoniveum Cordycipitaceae AF339553 AF339602 DQ522406 AJ292396 DQ522357

Simplicillium obclavatum Cordycipitaceae AF339517 AF339567 – MH860859 EF468798

Glomerella cingulata Glomerellaceae AF543786 AF543762 AY489659 FJ904831 AF543773

Glomerella cingulata Glomerellaceae U48428 U48427 DQ858454 EU520087 AF543772

Chú thích: “-” không có trình tự

2.4 Kết quả xây dựng cây phát sinh loài

Toàn bộ cơ sở dữ liệu của các gene mục tiêu được sắp xếp sử dụng Clustalw trong MEGA X để tạo thành bộ dữ liệu hoàn chỉnh cho từng gene Sau đó, sử dụng bộ dữ liệu này để tạo ba cây phát sinh phân tử sử dụng các phương pháp Neighbor-Joining (NJ), Maximum Likelihood (ML), và Maximum Parsimony (MP) Các cây phát sinh phân tử này được sử dụng như các cây tham chiếu cục bộ cho phân tích tiến hóa

Sau khi có được trình tự gene của 05 mẫu nấm ký sinh côn trùng sử dụng trong đề tài, tiến hành định danh chúng bằng cách xem xét các vùng gene mục tiêu được đề cập

Tiếp theo, sử dụng tính năng "Tìm mô hình DNA/Protein tốt nhất" (ML) có sẵn trong phần mềm MEGA X để kiểm tra từng cơ sở dữ liệu đơn lẻ hoặc kết hợp của từng gene Mục tiêu là được tìm mô hình tiến hóa phù hợp nhất cho từng tập dữ liệu Kết quả của quá trình này được trình bày trong Bảng 4.6, trong đó việc chọn mô hình dựa trên điểm số Bayers (BIC) thấp nhất cho từng dữ liệu

Bảng 4.6: Kết quả tìm kiếm mô hình phù hợp nhất và kích thước khối dữ liệu

Gene Mô hình nrLSU TN93+G, BIC = 7257.052, AICc = 6305.634, InL = -3035.270 nrSSU K2+G+I, BIC = 7368.446, AICc = 6365.534, InL = -3068.500

Tef TN93+G+I, BIC = 13929.656, AICc = 12912.903, InL = -6336.042 nrLSU-nrSSU-

Rpb1-ITS-tef GTR+G+I, BIC = 31191.341, AICc = 30406.250, InL = -15118.029

Ghi chú: TR: General Time Reversible; HKY: Hasegawa-Kishino-Yano; TN93: Tamura- Nei; T92: Tamura 3-parameter; K2: Kimura 2-parameter; JC: Jukes-Cantor; G: Phân phối gamma; I: tính bất biến Kết quả cho thấy sự khác biệt về mô hình đối với từng khối dữ liệu đơn lẻ Trong đó khối dữ liệu nrLSU, nrSSU, Rpb1, ITS và tef có các mô hình đơn giản hơn so với khối dữ liệu nrLSU-nrSSU-Rpb1-ITS-tef Điều này cho thấy khi tăng kích thước bộ dữ liệu thì mô hình cũng tăng lên về độ phức tạp Kết quả có được CSDL gene nrLSU có 57 trình tự với chiều dài 479 bp, CSDL gene nrSSU có 57 trình tự với chiều dài 747 bp, Rpb1 có 51 trình tự với chiều dài 1313 bp, ITS có 41 trình tự với chiều dài 487 bp, tef có 56 trình tự với chiều dài 454 bp và CSDL nrLSU-nrSSU-Rpb1-ITS-tef có 32 trình tự với chiều dài 2 662 bp

Xây dựng cây phả hệ các vùng gene mục tiêu bằng ba phương pháp NJ, ML, MP Các cây đều được thiết lập chạy với bootstrap 1000 lần, riêng với phương pháp ML chạy với các mô hình tiến hóa đã dò tìm được như trên Kết quả địa hình học (topology) của các cây phát sinh loài được tạo bởi ba phương pháp NJ, MP, ML đều thống nhất trong sự phân bố các loài mục tiêu với các loài tham khảo Giá trị bootstrap trên các cây phả hệ (NJ/MP/ML) đều có ý nghĩa (lớn hơn 50)

Hình 4.4: Cây phát sinh phân tử của nrLSU được dựng và đánh giá bằng Maximum

Likelihood với 1000 lần phân tích bootstrap Giá trị của mỗi nhánh tương ứng với các phương pháp NJ, MP và ML

Hình 4.5: Cây phát sinh phân tử của nrSSU được dựng và đánh giá bằng Maximum

Hình 4.6: Cây phát sinh phân tử của Rpb1 được dựng và đánh giá bằng Maximum

Tiêu đề	Hỗ Trợ Định Danh Các Mẫu Nấm Ký Sinh Côn Trùng Thu Được Tại Vùng Núi Langbiang, Đà Lạt, Lâm Đồng Bằng Phương Pháp Phân Tích Phả Hệ Phân Tử
Tác giả	Phạm Thị Thúy Ngọc
Người hướng dẫn	TS. Lao Đức Thuận
Trường học	Trường Đại Học Mở Thành Phố Hồ Chí Minh
Chuyên ngành	Công Nghệ Sinh Học
Thể loại	luận văn thạc sĩ
Năm xuất bản	2023
Thành phố	TP. Hồ Chí Minh

Định dạng
Số trang	75
Dung lượng	1,63 MB