So với các kỹ thuật thông thường dựa trên phương pháp nuôi cấy, giải trình tự toàn bộ hệ gen cho phép xácđịnh đáng tin cậy quần thể vi sinh vật sống trong mô thực vật ở cấp độ loài.. Sự
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NÔNG LÂM TP HỒ CHÍ MINH
KHOA KHOA HỌC SINH HỌC
CHẨN ĐOÁN BỆNH THỰC VẬT BẰNG SINH HỌC PHÂN TỬ
ASSOCIATION OF MICROBIOME DIVERSITY WITH
DISEASE SYMPTOMS IN BRASSICA OLERACEA LEAVES
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NÔNG LÂM TP HỒ CHÍ MINH
KHOA KHOA HỌC SINH HỌC
CHẨN ĐOÁN BỆNH THỰC VẬT BẰNG SINH HỌC PHÂN TỬ
ASSOCIATION OF MICROBIOME DIVERSITY WITH
DISEASE SYMPTOMS IN BRASSICA OLERACEA LEAVES
Trang 3TÓM TẮT
Bắp cải (Brassica oleracea), một loại cây trồng có tầm quan trọng kinh tế lớn
trên toàn thế giới, bị ảnh hưởng bởi nhiều loại bệnh do nhiều loại vi sinh vật gây ra,bao gồm nấm, nấm nhầy, vi khuẩn và vi rút, dẫn đến thiệt hại đáng kể về năng suất vàchất lượng Sự gia tăng các bộ gen tham khảo của vi khuẩn liên quan đến thực vậtcùng với những tiến bộ gần đây trong phương pháp tiếp cận metagenomics mang đếnnhững cơ hội mới để xác định vi khuẩn liên quan đến các triệu chứng khác biệt trên lá
Brassica Trong nghiên cứu này, metagenomics shotgun đã được sử dụng để điều tra
quần xã vi sinh vật trên lá cây B oleracea từ đất nông nghiệp So với các kỹ thuật
thông thường dựa trên phương pháp nuôi cấy, giải trình tự toàn bộ hệ gen cho phép xácđịnh đáng tin cậy quần thể vi sinh vật sống trong mô thực vật ở cấp độ loài Các lákhông có triệu chứng và có triệu chứng biểu hiện các triệu chứng bệnh khác nhau đã
được kiểm tra Ở những lá không có triệu chứng, loài Xanthomonas là đơn vị phân loại
phong phú nhất Sự phong phú tương đối của quần xã vi khuẩn và nấm thay đổi tùythuộc vào các triệu chứng bệnh trên lá Hệ vi sinh vật của lá biểu hiện mức độ bệnh
nhẹ đến nặng được làm giàu bởi quần thể vi khuẩn (Sphingomonas, Methylobacterium,
Paracoccus) và ở mức độ thấp hơn ở một số đơn vị phân loại nấm, chẳng hạn như Alternaria và Colletotrichum (ví dụ: ở lá có mức độ hoại tử cao) Loài Sclerotinia có
nhiều ở lá bị hư hại nghiêm trọng ( S sclerotium, S trifolium, S bolearis ), tiếp theo là loài Botrytis Các loài vi khuẩn và nấm phổ biến và đặc hiệu liên quan đến các triệu
chứng bệnh đã được xác định Cuối cùng, phân tích các chức năng của gen trong dữliệu metagenomics cho thấy sự phong phú của các enzym hoạt động carbohydrate cókhả năng liên quan đến khả năng gây bệnh, có sự phân bố cũng khác nhau giữa các
nhóm mức độ nghiêm trọng của bệnh Hiểu được hệ vi sinh vật lá B oleracea trong hệ
sinh thái nông nghiệp sẽ mở đường cho việc quản lý hiệu quả các bệnh trên loại câytrồng này
Trang 4Cabbage (Brassica oleracea), a crop of major economic importance worldwide,
is affected by numerous diseases, which are caused by a wide range ofmicroorganisms, including fungi, oomycetes, bacteria, and viruses, which lead toimportant losses in yield and quality The increasing availability of reference genomes
of plant-associated microbes together with recent advances in metagenomicapproaches provide new opportunities to identify microbes linked to distinctsymptomatology in Brassica leaves In this study, shotgun metagenomics was used to
investigate the microbial com- munity in leaves of B oleracea plants from agricultural
farmlands Compared with conventional techniques based on culture-based methods,whole-genome shotgun sequencing allows the reliable identification of the microbialpopulation inhabiting a plant tissue at the species level Asymptomatic andsymptomatic leaves showing different disease symptoms were examined In theasymptomatic leaves, Xanthomonas species were the most abundant taxa The relativeabundance of bacterial and fungal communities varied depending on disease symptoms
on the leaf The microbiome of the leaves showing mild to severe levels of disease wasenriched in bacterial populations (Sphingomonas, Methylobacterium, Paracoccus) and
to a lesser degree in some fungal taxa, such as Alternaria and Colletotrichum (e.g., inleaves with high levels of necrotic lesions) Sclerotinia species were highly abundant
in severely damaged leaves (S sclerotium, S trifolium, S bolearis), followed byBotrytis species The common and specific bacterial and fungal species associated todisease symptoms were identified Finally, the analysis of the gene functions in themetagenomic data revealed enrichment in carbohydrate-active enzymes potentiallyinvolved in pathogenicity, whose distribution also var- ied among disease severity
groups Understanding the B oleracea leaf microbiome in agricultural ecosystems will
pave the way for the efficient management of diseases in this crop
Trang 5MỤC LỤC
Trang
TÓM TẮT i
ABSTRACT ii
MỤC LỤC iii
DANH SÁCH CÁC CHỮ VIẾT TẮT iv
DANH SÁCH CÁC HÌNH v
CHƯƠNG 1 MỞ ĐẦU 1
1.1 Đặt vấn đề 1
1.2 Mục tiêu đề tài 2
1.3 Nội dung thực hiện 2
CHƯƠNG 2 TỔNG QUAN TÀI LIỆU 3
2.1 Giới thiệu về cây bắp cải Brassica sp 3
2.2 Giới thiệu về kỹ thuật Metagenomics 6
CHƯƠNG 3 VẬT LIỆU VÀ PHƯƠNG PHÁP 10
3.1 Vật liệu thực vật 10
3.2 Phương pháp tiến hành 10
3.2.1 Chiết xuất DNA, chuẩn bị thư viện và giải trình tự Metagenomics 10
3.2.2 Xử xý dữ liệu giải trình tự và lắp ráp Metagenome 11
3.2.3 Dự đoán gen và chú thích phân loại 12
CHƯƠNG 4: KẾT QUẢ VÀ THẢO LUẬN 14
4.1 Kết quả 14
4.1.1 Tiền xử lý dữ liệu và lắp ráp Metagenome 16
4.1.2 Quần xã Vi sinh vật trên lá B oleracea trong điều kiện nhiễm bệnh tự nhiên 16
4.1.3 Quần xã Vi khuẩn trên lá B oleracea trong điều kiện nhiễm bệnh tự nhiên 19
4.1.4 Quần xã Nấm trên lá B oleracea trong điều kiện nhiễm bệnh tự nhiên 23
4.1.5 Vi vinh vật phổ biến và đặc trưng trên lá B oleracea trong điều kiện nhiễm bệnh tự nhiên 25
4.1.6 Phân tích chức năng của Metagenomes B oleracea 28
4.2 Thảo luận 30
CHƯƠNG 5: KẾT LUẬN 35
Trang 6NMDS : Nonmetric multidimensional scaling
PCR : Polymerase chain reaction
Xcc : Xanthomonas campestris pv campestris.
Trang 7DANH SÁCH CÁC HÌNH
Trang
Hình 4.1 Các triệu chứng bệnh điển hình ở các nhóm lá B oleracea (A) Các
nhóm mẫu chính; (B) Các nhóm mẫu bổ sung; (I) Nhóm lá không có triệu chứng; (II) Nhóm lá có triệu chứng nhẹ; (III) Nhóm lá có triệu chứng nặng; (IV) Nhóm lá bị bệnh
ở mép; (V) Nhóm lá có triệu chứng nặng, ảnh hưởng đến vùng trung tâm-cuống lá 15
Hình 4.2 Phân tích quy mô đa chiều phi tuyến tính (NMDS) của dữ liệu
metagenomic từ lá B oleracea ở cấp độ ngành (NMDS1) và (NMDS2) hai trục tọa
độ được tạo ra bởi thuật toán NMDS để giảm dữ liệu đa chiều (nhiều loại vi sinh vật khác nhau) thành không gian hai chiều (trên mặt phẳng) dễ hình dung 17
Hình 4.3 Thành phần phân loại học của cộng đồng vi sinh vật trên lá B oleracea không có triệu chứng và có triệu chứng (A) Phân loại phân loại học ở cấp độ giới
(B) Phân loại phân loại học ở cấp độ ngành 18
Hình 4.4 Thành phần vi sinh vật của lá B oleracea (Nhóm I) ở cấp độ chi Mỗi
biểu đồ được tạo ra từ việc kết hợp các unigene của cả 3 mẫu (bên trái) Các vòng tròn đại diện cho các cấp bậc phân loại khác nhau: (k) giới; (p) ngành; (c) lớp; (o) bộ; (f) họ; và (g) chi và các phần hình quạt đại diện cho các taxa riêng biệt 20
Hình 4.5 Thành phần vi sinh vật của lá B oleracea (Nhóm II (A) và Nhóm III (B)) ở cấp độ chi Mỗi biểu đồ được tạo bằng cách kết hợp các unigene của cả 3 mẫu
mỗi nhóm (bên trái) Các vòng tròn đại diện cho các cấp bậc phân loại khác nhau: (k) giới; (p) ngành; (c) lớp; (o) bộ; (f) họ; và (g) chi) và các phần hình quạt đại diện cho các taxa riêng biệt 21
Hình 4.6 Thành phần vi sinh vật của lá B oleracea (Nhóm IV (A) và Nhóm V (B))
ở cấp độ chi Mỗi biểu đồ được tạo bằng cách kết hợp các unigene của cả 3 mẫu mỗi
nhóm (bên trái) Các vòng tròn đại diện cho các cấp bậc phân loại khác nhau: (k) giới; (p) ngành; (c) lớp; (o) bộ; (f) họ; và (g) chi) và các phần hình quạt đại diện cho các taxa riêng biệt 22
Hình 4.7 Các loài nấm có sự khác biệt đáng kể về độ phong phú tương đối giữa các
nhóm lá B oleracea 26
Trang 8Hình 4.8 Các loài vi khuẩn có sự khác biệt đáng kể về độ phong phú tương đối giữa
Trang 9CHƯƠNG 1 MỞ ĐẦU
1.1 Đặt vấn đề
Cải bắp (Brassica oleracea) là một loại cây trồng có tầm quan trọng kinh tế lớn
trên toàn thế giới, được sử dụng rộng rãi làm rau ăn Tuy nhiên, cây cải bắp dễ bị tấncông bởi nhiều loại bệnh do vi sinh vật gây ra như nấm, vi khuẩn, oomycetes và virus,dẫn đến những tổn thất đáng kể về năng suất và chất lượng Việc sử dụng các biệnpháp bảo vệ cây trồng bằng hóa chất nông nghiệp hiện nay không chỉ gây ra những tácđộng tiêu cực về kinh tế mà còn có những ảnh hưởng xấu đến môi trường và sức khỏecon người Biến đổi khí hậu, sự thay đổi của mầm bệnh và các hoạt động canh tác liêntục với cường độ cao cũng góp phần làm bùng phát dịch bệnh, gây ra những tháchthức lớn cho sản xuất cải bắp Do đó, việc tìm kiếm các giải pháp bền vững và thânthiện với môi trường để quản lý dịch bệnh trên cây cải bắp là vô cùng cần thiết
Các nghiên cứu gần đây đã chỉ ra rằng, hệ vi sinh vật liên quan đến cây trồngđóng vai trò quan trọng trong sức khỏe và sự phát triển của cây Hệ vi sinh vật này cóthể có lợi hoặc gây hại cho cây trồng, ảnh hưởng đến khả năng hấp thụ chất dinhdưỡng, khả năng chống chịu bệnh tật và các quá trình sinh lý khác Việc nghiên cứu hệ
vi sinh vật trên lá cây cải bắp có thể mở ra những hướng đi mới trong việc quản lý dịchbệnh một cách hiệu quả và bền vững
Các phương pháp truyền thống dựa trên nuôi cấy vi sinh vật trong phòng thínghiệm có nhiều hạn chế, không thể xác định được toàn bộ các vi sinh vật có mặttrong một môi trường cụ thể Sự phát triển của các kỹ thuật giải trình tự gen thế hệ mới(metagenomics) đã cung cấp một công cụ mạnh mẽ để phân tích toàn bộ vật liệu ditruyền của hệ vi sinh vật trong mô thực vật mà không cần phải nuôi cấy chúng.Phương pháp này cho phép xác định một cách tin cậy các vi sinh vật có mặt trong môthực vật ở cấp độ loài và đánh giá sự đa dạng của quần thể vi sinh vật
Mặc dù tầm quan trọng của cây cải bắp và vai trò của hệ vi sinh vật trong sứckhỏe thực vật đã được công nhận, nhưng các nghiên cứu về hệ vi sinh vật trên lá cảibắp vẫn còn rất hạn chế Hầu hết các nghiên cứu trước đây tập trung vào hệ vi sinh vật
ở rễ và hạt của các cây họ cải khác (ví dụ, B napus), mà chưa có nhiều thông tin về hệ
vi sinh vật trên lá cây B oleracea, đặc biệt là sự liên quan giữa cấu trúc của hệ vi sinh
Trang 10vật này với các triệu chứng bệnh khác nhau Do đó, việc nghiên cứu sâu hơn về hệ visinh vật trên lá cây cải bắp là rất quan trọng để hiểu rõ hơn về tương tác giữa cây trồng
và mầm bệnh, từ đó phát triển các biện pháp quản lý dịch bệnh hiệu quả và giảm thiểuviệc sử dụng thuốc trừ sâu
1.2 Mục tiêu đề tài
Mô tả đặc điểm thành phần và sự đa dạng của hệ vi sinh vật trên lá cây cải bắp
(B oleracea var capitata) được trồng trong điều kiện tự nhiên Sử dụng phương pháp
giải trình tự metagenomics để phân tích hệ vi sinh vật trên lá của cây cải bắp
Xác định các loài vi sinh vật (vi khuẩn và nấm) cụ thể liên quan đến các triệuchứng bệnh khác nhau trên lá cây cải bắp Phân tích sự khác biệt về thành phần và sốlượng của các loài vi sinh vật giữa các lá không triệu chứng và các lá có triệu chứngbệnh khác nhau
Nghiên cứu sự phong phú của các enzyme hoạt động trên carbohydrate(CAZymes) trong các quần thể vi sinh vật khác nhau trên lá cây cải bắp Đánh giá sựphân bố của các enzyme này liên quan đến mức độ nghiêm trọng của bệnh
Đóng góp vào sự hiểu biết về mối tương tác giữa cây trồng và mầm bệnh trong
hệ sinh thái nông nghiệp Cung cấp thông tin cơ bản để phát triển các chiến lược quản
lý bệnh hiệu quả hơn và bền vững hơn cho cây cải bắp
1.3 Nội dung thực hiện
Thu thập và phân loại mẫu lá cải bắp: Các mẫu lá được thu thập từ các cây cảibắp trồng trong điều kiện tự nhiên và được phân loại thành các nhóm khác nhau dựatrên các triệu chứng bệnh quan sát được Các nhóm bao gồm: lá không có triệu chứng,
lá có triệu chứng nhẹ, lá có triệu chứng nặng, lá có tổn thương ở rìa, và lá bị triệuchứng nghiêm trọng
Chiết xuất DNA và chuẩn bị thư viện: DNA được chiết xuất từ các mẫu lá, sau
đó được xử lý để tạo thư viện DNA sẵn sàng cho giải trình tự
Giải trình tự metagenomics: Phương pháp giải trình tự shotgun metagenomicsđược sử dụng để xác định trình tự DNA của tất cả các vi sinh vật có trong mẫu lá
Trang 11CHƯƠNG 2 TỔNG QUAN TÀI LIỆU
2.1 Giới thiệu về cây bắp cải Brassica sp.
Chi Brassica, một thành viên của họ Brassicaceae (trước đây gọi là Cruciferae),
là một họ thực vật hai lá mầm có tầm quan trọng về kinh tế và khoa học Nó chứa một
số lượng lớn các loài cây trồng cung cấp rễ, lá, thân, chồi, hoa và hạt ăn được trên toàn
thế giới Các loài rau thuộc chi Brassica bao gồm B oleracea (bắp cải, súp lơ, bông cải xanh, cải brussel, cải xoăn), B rapa (củ cải, cải thảo), B napus (cải dầu), B.
carinata và B juncea (mù tạt) Trong số đó, B oleracea, B napus và B rapa là các
loài Brassica được trồng rộng rãi nhất Ngoài tầm quan trọng về nông học, họ Brassicaceae còn bao gồm cây mô hình thiết yếu Arabidopsis thaliana.
Cây Brassica dễ mắc các bệnh do nhiều loại vi sinh vật gây ra như nấm,
oomycetes, vi khuẩn và virus, gây ra những tổn thất lớn về năng suất cả về chất lượng
và số lượng Các mầm bệnh nấm hoặc oomycete quan trọng nhất ảnh hưởng đến các
loài Brassica (và các bệnh chúng gây ra) là Sclerotinia sclerotiorum (nấm mốc trắng);
Alternaria spp (đốm lá Alternaria), Hyaloperonospora parasitica (sương mai), Erysiphe cruciferarum (nấm phấn trắng), Rhizoctonia solani (thối thân), Pythium spp.
(lụi cây), Fusarium oxysporum (héo rũ Fusarium), Mycosphaerella brassicicola (đốm vòng), Plasmodiophora brassicae (bệnh sưng rễ) và Leptosphaeria maculans (bệnh thối đen), Colletotrichum spp (bệnh than), và Phytophthora spp (thối rễ
Phytophthora) Trong số đó, đốm lá Alternaria, chủ yếu do A brassicicola, A brassicae và đôi khi là A alternata gây ra, là một trong những bệnh nấm có tác động
lớn nhất đến bắp cải (B oleracea), dẫn đến những tổn thất đáng kể về năng suất Về các mầm bệnh vi khuẩn, Xanthomonas campestris (thối đen), Erwinia spp (thối nhũn)
và Pseudomonas spp (thối nhũn vi khuẩn) được coi là những mầm bệnh vi khuẩn có tác động lớn nhất có thể lây nhiễm sang các cây trồng Brassica Đặc biệt, X.
campestris pv campestris (Xcc) gây ra bệnh thối đen, một trong những bệnh vi khuẩn
phổ biến nhất ở các cây trồng Brassica Bệnh này đã được xác định ở tất cả các khu vực trồng Brassica, gây ra những tổn thất kinh tế đáng kể Đáng tiếc là chỉ có một vài
nguồn kháng bệnh đã được xác định, do đó cản trở việc kháng lại bệnh này trong cácchương trình nhân giống
Trang 12Bệnh thối nhũn vi khuẩn là một nhóm bệnh thường thấy ở các loại rau họ cải có thể do
một số vi khuẩn gây ra, phổ biến nhất là Erwinia spp (E carotova, còn được gọi là
Pectobacterium carotovorum) và một số loài Pseudomonas Vi khuẩn có thể xâm nhập
vào cây chủ thông qua các vết thương do nguyên nhân tự nhiên, vết côn trùng cắn,bệnh tật và tổn thương cơ học Khả năng gây bệnh của các mầm bệnh vi khuẩn nàyđược xác định bởi việc sản xuất các enzyme phân hủy thành tế bào thực vật Cùng với
đó, bệnh thối nhũn được biết đến với mùi hôi thối khó chịu đi kèm với sự phân hủycủa mô thực vật Một khi vi khuẩn thối nhũn đã lây nhiễm vào mô thực vật, không cóphương pháp điều trị hiệu quả Do đó, bệnh thối nhũn vi khuẩn cần được kiểm soátthông qua các biện pháp canh tác
Các biện pháp hiện tại để bảo vệ cây trồng Brassica khỏi bệnh tật dựa vào việc
sử dụng hóa chất nông nghiệp, điều này không chỉ có tác động tiêu cực về kinh tế màcòn có những tác dụng phụ có hại đối với môi trường và sức khỏe con người Biến đổikhí hậu, sự thay đổi của mầm bệnh và các hoạt động canh tác liên tục với cường độcao góp phần gây ra các đợt bùng phát dịch bệnh, gây ra các mối đe dọa đối với sản
xuất Brassica hiện tại Sự gia tăng đáng kể trong việc trồng Brassica trên toàn thế giới
cũng đã góp phần vào sự bùng phát của các dịch bệnh mới, một số trong đó trước đâykhông được coi là đáng quan tâm Trong những năm gần đây, các nỗ lực đang đượcthực hiện để xác định các gen kháng bệnh (R) để sử dụng trong các chương trình nhân
giống nhằm cải thiện khả năng kháng bệnh ở Brassica spp Đến năm 2000, đã có sự
gia tăng đáng kể trong sản lượng các loại rau họ cải như bắp cải, súp lơ và bông cảixanh (từ 68,1 lên 91,1 triệu tấn), nhưng kể từ đó, sản lượng của chúng vẫn ổn định ởmức trung bình 89,7 triệu tấn mỗi năm (từ 2000 đến 2020) Ngoài việc nhân giống cácgiống cây trồng mới có năng suất cao, cần phải giảm tổn thất năng suất do bệnh tật với
ít đầu vào hóa chất nông nghiệp hơn Việc phát hiện và xác định mầm bệnh là điều cơ
bản để kiểm soát thành công các bệnh trên cây Brassica Dự báo có thể giúp thông báo
các ứng dụng thuốc trừ sâu chính xác, điều này cũng tối đa hóa hiệu quả của chúng vàgiảm tác động đến môi trường
Thực vật và các vi sinh vật liên quan của chúng tạo thành các thực thể chức năngdựa vào nhau Trong tương tác này, hệ vi sinh vật liên quan đến thực vật có thể có lợihoặc có hại cho cây chủ theo nhiều cách khác nhau Chúng có thể có lợi cho cây bằngcách cải thiện sự hấp thụ chất dinh dưỡng và bảo vệ cây khỏi sự xâm nhiễm của mầm
Trang 13bệnh thông qua việc tiết ra các hợp chất kháng khuẩn, cạnh tranh tài nguyên và khônggian hoặc kích thích phản ứng miễn dịch của vật chủ Bằng chứng cũng ủng hộ rằngcác cây khỏe mạnh và không có triệu chứng cùng tồn tại với các tập hợp vi sinh vật đadạng Khả năng của một số vi khuẩn bảo vệ cây khỏi mầm bệnh đã được chứng minh
rõ ràng Hầu hết các vi khuẩn này thuộc các chi Pseudomonas, Streptomyces, Bacillus,
Paenibacillus, Enterobacter, Burkholderia và Paraburkholderia Tuy nhiên, vi sinh
vật liên quan đến thực vật dễ bị thay đổi trong môi trường, chẳng hạn như biến đổi khíhậu và chế độ tưới tiêu Tuy nhiên, kiến thức hiện tại của chúng ta về sự tương tác giữathực vật, hệ vi sinh vật và các động lực ảnh hưởng đến động lực của hệ vi sinh vật đểđịnh hình hiệu suất của thực vật trong hệ sinh thái còn hạn chế Tuy nhiên, việc tíchhợp những hiểu biết sâu sắc về thành phần hệ vi sinh vật và ảnh hưởng của các liên kếtthực vật - vi sinh vật trong sự phát triển của bệnh có thể góp phần tăng năng suất các
loại rau Brassica Người ta tin rằng, trong thời gian ngắn, có thể thao tác các cộng
đồng vi sinh vật để cải thiện hiệu suất và khả năng kháng bệnh của cây trồng cũng nhưphát triển các chất kích thích sinh học mới
Theo truyền thống, nghiên cứu về các vi sinh vật trong mô thực vật dựa vào việcxác định các sinh vật được nuôi cấy trong điều kiện phòng thí nghiệm Tuy nhiên, cácphương pháp như vậy tốn nhiều công sức và bị hạn chế bởi thực tế là không phải tất cảcác vi sinh vật có trong một môi trường cụ thể đều có thể được nuôi cấy Ngoài ra,chẩn đoán bệnh dựa trên việc quan sát các triệu chứng trong mô thực vật đòi hỏichuyên môn và có thể là thách thức vì các mầm bệnh khác nhau có thể gây ra các triệuchứng tương tự Trong những năm gần đây, các chiến lược metagenomic kết hợp vớicông nghệ giải trình tự thông lượng cao đã được phát triển và ứng dụng thành công để
mô tả đặc điểm của cộng đồng vi sinh vật cư trú trong mô thực vật Metagenomics cókhả năng phân tích toàn bộ vật liệu di truyền có trong mô thực vật mà không cần phảinuôi cấy vi sinh vật trong phòng thí nghiệm Hai chiến lược chính đã được phát triển
để phân tích metagenomic về hệ vi sinh vật thực vật, cụ thể là, metabarcoding các trình
tự DNA marker được khuếch đại (hoặc giải trình tự mục tiêu) và giải trình tự toàn bộ
bộ gen (hoặc shotgun metagenomics) Giải trình tự mục tiêu liên quan đến việc khuếchđại PCR các đoạn DNA đặc hiệu gen, thường là DNA ribosome, để xác định các nhómphân loại cụ thể có trong mẫu, sau đó được lập hồ sơ phân loại bằng cách sử dụng cơ
sở dữ liệu tham chiếu Tuy nhiên, các phương pháp dựa trên amplicon có một số hạn
Trang 14chế, vì các mồi phổ quát có thể khuếch đại các gen từ các dòng phân loại khác nhauvới các hiệu quả khác nhau Không giống như metagenomics amplicon, shotgunmetagenomics khám phá toàn bộ vật liệu DNA của mô thực vật mà không yêu cầukhuếch đại PCR, cung cấp dữ liệu về đa dạng sinh học loài và cho các loài thiểu số,thường cung cấp độ phân giải phát sinh loài tốt hơn so với giải trình tự mục tiêu.
Như đã đề cập trước đây, chi Brassica bao gồm các loại cây trồng làm vườn quan
trọng, chẳng hạn như bông cải xanh, cải brussel, bắp cải, súp lơ, cải xoăn và củ cải Do
tác động kinh tế của các bệnh ảnh hưởng đến các loài Brassica, các phương pháp phân
tử khác nhau ban đầu được phát triển để phát hiện và định lượng các mầm bệnh
Brassica cụ thể trong khi vượt qua những hạn chế liên quan đến các quy trình vi sinh
vật truyền thống, phụ thuộc vào nuôi cấy Ví dụ, các phương pháp dựa trên PCR (PCRthông thường hoặc PCR thời gian thực) đã được áp dụng để phát hiện các mầm bệnh
Brassica là A brassicae và A brassicicola Những tiến bộ trong các phương pháp
metagenomic và các công cụ tin sinh học đã cung cấp cơ hội để lập hồ sơ cấu trúccộng đồng vi sinh vật tổng thể có trong một mô thực vật nhất định Tuy nhiên, một vàinghiên cứu đã được thực hiện để mô tả đặc điểm của hệ vi sinh vật của các loại cây
trồng Brassica, hầu hết trong số đó tập trung vào các cộng đồng vi khuẩn (ví dụ: giải trình tự amplicon 16S rRNA) Các cộng đồng vi sinh vật liên quan đến rễ và hạt ở B.
napus (cải dầu) đã được mô tả Các loại nấm nội sinh từ B oleracea var acephala (cải
xoăn) và B rapa (cải thảo) cũng đã được báo cáo Ngược lại, một số ít nghiên cứu đã tập trung vào sự đa dạng của quần thể vi sinh vật trong lá B oleracea, mặc dù lá
Brassica dễ bị một loạt các mầm bệnh cần được theo dõi để đạt được sản lượng mong
muốn Tương tự, mối liên hệ giữa cấu trúc cộng đồng vi sinh vật và các triệu chứng
bệnh trên lá B oleracea vẫn chưa được khám phá Tác động tiềm tàng của thành phần
hệ vi sinh vật của các bộ phận ăn được của rau Brassica đối với các vấn đề sức khỏe
cũng đáng được các nhà nghiên cứu quan tâm Xét đến tầm quan trọng về nông học và
kinh tế của B oleracea, cần phải nghiên cứu thêm để làm rõ các mầm bệnh vi sinh vật
liên quan đến các triệu chứng bệnh ở cây trồng này, với mục tiêu giảm đáng kể việc sửdụng thuốc trừ sâu trên đồng ruộng
2.2 Giới thiệu về kỹ thuật Metagenomics
Metagenomics là một kỹ thuật phân tích mạnh mẽ cho phép nghiên cứu toàn bộvật liệu di truyền (DNA hoặc RNA) có trong một mẫu môi trường phức tạp, mà không
Trang 15cần phải nuôi cấy các vi sinh vật riêng lẻ trong phòng thí nghiệm Kỹ thuật này mở racánh cửa để khám phá sự đa dạng và chức năng của cộng đồng vi sinh vật trong các hệsinh thái khác nhau, đặc biệt là những hệ sinh thái mà nhiều loài vi sinh vật không thểnuôi cấy được bằng các phương pháp truyền thống Metagenomics đã trở thành mộtcông cụ không thể thiếu trong nghiên cứu về vi sinh vật học, sinh thái học và bệnh họcthực vật.
Các bước cơ bản của kỹ thuật Metagenomics:
Thu thập mẫu: Bước đầu tiên là thu thập mẫu từ môi trường nghiên cứu Mẫu cóthể là đất, nước, trầm tích, mô thực vật, hoặc bất kỳ môi trường nào khác chứa vi sinhvật Việc lựa chọn và thu thập mẫu một cách cẩn thận là rất quan trọng để đảm bảotính đại diện của dữ liệu
Chiết xuất vật liệu di truyền (DNA/RNA): Sau khi thu thập mẫu, toàn bộ vật liệu
di truyền, bao gồm DNA và đôi khi cả RNA, sẽ được chiết xuất từ mẫu Quá trìnhchiết xuất này cần phải hiệu quả để đảm bảo thu được tất cả các vật liệu di truyền cótrong mẫu
Giải trình tự (Sequencing): Vật liệu di truyền đã chiết xuất sẽ được giải trình tựbằng công nghệ giải trình tự thế hệ mới (Next-Generation Sequencing - NGS) Côngnghệ NGS cho phép tạo ra hàng triệu hoặc thậm chí hàng tỷ đoạn đọc ngắn (reads) từDNA/RNA của mẫu Các công nghệ giải trình tự khác nhau có thể được sử dụng, tùythuộc vào mục tiêu nghiên cứu và ngân sách
Phân tích dữ liệu (Bioinformatics): Các đoạn đọc ngắn thu được từ quá trình giảitrình tự sẽ được xử lý bằng các công cụ tin sinh học Các công cụ này bao gồm việcloại bỏ các đoạn đọc chất lượng thấp, sắp xếp các đoạn đọc với nhau (assembly) để tạothành các đoạn dài hơn (contigs hoặc scaftigs), xác định các gen và các loài vi sinh vật
có mặt trong mẫu Các công cụ tin sinh học cũng giúp phân tích chức năng của các gen
và tương tác giữa các vi sinh vật
Các phương pháp Metagenomics chính:
Có hai phương pháp chính trong metagenomics:
Metabarcoding (Targeted sequencing): Phương pháp này sử dụng các đoạn mồi(primers) đặc hiệu để khuếch đại các đoạn DNA ngắn, thường là các gen rRNA (ví dụgen 16S rRNA cho vi khuẩn, gen ITS cho nấm), từ mẫu Các đoạn DNA được khuếchđại sau đó được giải trình tự và so sánh với các cơ sở dữ liệu để xác định các loài vi
Trang 16sinh vật có mặt trong mẫu Phương pháp này thường được sử dụng để khảo sát đa dạngsinh học của cộng đồng vi sinh vật Tuy nhiên, metabarcoding có thể có một số hạnchế do việc sử dụng các đoạn mồi phổ quát có thể không khuếch đại đều tất cả các loài
vi sinh vật
Shotgun Metagenomics (Whole-genome sequencing): Phương pháp này giảitrình tự toàn bộ DNA từ mẫu, không cần khuếch đại các gen đặc hiệu Điều này chophép xác định tất cả các gen và các loài vi sinh vật có trong mẫu, bao gồm cả nhữngloài hiếm gặp Shotgun metagenomics cung cấp thông tin chi tiết hơn về thành phầnloài và chức năng gen so với metabarcoding Tuy nhiên, phương pháp này có thể tốnkém hơn về chi phí và đòi hỏi năng lực phân tích dữ liệu lớn
Ý nghĩa của kỹ thuật Metagenomics trong nghiên cứu:
Khám phá sự đa dạng sinh học: Metagenomics cho phép khám phá sự đa dạngcủa các loài vi sinh vật trong các môi trường khác nhau, bao gồm cả những loài chưađược biết đến
Hiểu rõ chức năng của vi sinh vật: Metagenomics giúp xác định các gen chứcnăng của vi sinh vật, từ đó hiểu rõ hơn về vai trò của chúng trong các quá trình sinhhọc
Nghiên cứu tương tác vi sinh vật: Metagenomics cho phép nghiên cứu sự tươngtác giữa các vi sinh vật trong một cộng đồng, mở ra hướng tiếp cận mới trong việchiểu rõ hơn về các hệ sinh thái phức tạp
Phát triển các giải pháp sinh học: Metagenomics cung cấp thông tin quan trọng
để phát triển các giải pháp sinh học trong nông nghiệp, y tế và môi trường
Nghiên cứu về bệnh thực vật: Metagenomics giúp xác định các loài vi sinh vậtgây bệnh và các cơ chế gây bệnh của chúng, từ đó phát triển các biện pháp kiểm soátbệnh hiệu quả hơn
Tóm lại, metagenomics là một công cụ mạnh mẽ giúp nghiên cứu hệ vi sinh vậtmột cách toàn diện, cung cấp thông tin chi tiết về thành phần loài, chức năng gen vàtương tác giữa các vi sinh vật Kỹ thuật này đóng vai trò quan trọng trong nghiên cứu
về hệ vi sinh vật trên lá cải bắp, giúp các nhà khoa học hiểu rõ hơn về mối liên hệ giữa
vi sinh vật và triệu chứng bệnh, mở ra hướng tiếp cận mới trong việc quản lý dịchbệnh cây trồng một cách bền vững
2.3 Ứng dụng của Metagenomics trong bài báo:
Trang 17Trong bài báo "Association of Microbiome Diversity with Disease Symptoms inBrassica oleracea Leaves", kỹ thuật shotgun metagenomics (giải trình tự toàn bộ hệgen) đã được sử dụng để nghiên cứu hệ vi sinh vật trên lá cải bắp Khác với cácphương pháp truyền thống dựa trên nuôi cấy vi sinh vật, shotgun metagenomics chophép xác định đáng tin cậy các quần thể vi sinh vật cư trú trong mô thực vật ở cấp độloài Phương pháp này có những ưu điểm sau:
Không cần nuôi cấy: Metagenomics loại bỏ nhu cầu nuôi cấy vi sinh vật, giúp xác địnhđược cả những loài không thể nuôi cấy bằng phương pháp truyền thống
Độ phân giải cao: Giải trình tự toàn bộ hệ gen (shotgun metagenomics) cung cấp thôngtin chi tiết về thành phần loài và chức năng gen, cho phép phân tích sâu hơn về sự đadạng và hoạt động của hệ vi sinh vật
Phân tích đồng thời: Metagenomics cho phép phân tích đồng thời nhiều loài vi sinh vậttrong cùng một mẫu, giúp hiểu rõ hơn về tương tác giữa các loài trong hệ sinh thái
Cụ thể, trong nghiên cứu này, metagenomics đã được sử dụng để:
Xác định thành phần vi sinh vật: Xác định các loài vi khuẩn, nấm và các vi sinh vậtkhác hiện diện trên lá cải bắp, từ đó xác định sự khác biệt về thành phần loài giữa cácnhóm lá khác nhau (lá không triệu chứng, lá có triệu chứng nhẹ, lá có triệu chứngnặng)
Phân tích chức năng gen: Xác định các gen mã hóa enzyme phân giải carbohydrate(CAZymes) và các gen liên quan đến sự gây bệnh của vi sinh vật, giúp hiểu rõ hơn về
cơ chế gây bệnh
Liên kết vi sinh vật với triệu chứng bệnh: Tìm ra mối liên hệ giữa các loài vi sinh vật
cụ thể và các triệu chứng bệnh khác nhau trên lá cải bắp Ví dụ, lá không triệu chứng
(Nhóm I) giàu Xanthomonas, trong khi lá bị bệnh nặng (Nhóm V) giàu Sclerotinia.
Tóm lại, metagenomics đã đóng vai trò quan trọng trong nghiên cứu này bằng cáchcung cấp một cái nhìn toàn diện về hệ vi sinh vật trên lá cải bắp và mối liên hệ củachúng với các triệu chứng bệnh, mở ra hướng tiếp cận mới trong việc quản lý dịchbệnh cây trồng
Trang 18CHƯƠNG 3 VẬT LIỆU VÀ PHƯƠNG PHÁP
3.1 Vật liệu thực vật
Lá bắp cải ( B.oleracea var capitata ) được thu thập từ các cây bị nhiễm bệnh
tự nhiên được trồng tại một cánh đồng thương mại nằm dọc theo bờ biển Địa TrungHải phía đông của Tây Ban Nha (tọa độ GPS, 41◦38′55,0 ′′ N; 2◦45′38,3 ′′ E) vào tháng
11 năm 2022 Cây Brassica đã được trồng mỗi vụ trong ruộng của nông dân.
Các cây được trồng theo các phương pháp quản lý thường được nông dân sửdụng trong các cánh đồng bắp cải thương mại ở vùng đông bắc Tây Ban Nha, chủ yếubao gồm xử lý bằng thuốc trừ sâu
Để thu thập thông tin chi tiết nhất về sự đa dạng của vi sinh vật, lá khỏe mạnh(không có triệu chứng, được đặt tên là Nhóm I) và lá bị bệnh (được đặt tên là Nhóm II,Nhóm III, Nhóm IV và Nhóm V) đã được thu thập từ các cây phân bố trên khắp đồngruộng Đối với mỗi nhóm, 3 mẫu đã được kiểm tra (ví dụ: mẫu I.1, I.2 và I.3), mỗi mẫubao gồm một nhóm ít nhất 4 lá
Lá không được khử trùng để bảo tồn cả thực vật biểu sinh và nội sinh
Các mẫu được bảo quản ở −80oC cho đến khi phân tích tiếp theo
3.2 Phương pháp tiến hành
3.2.1 Chiết xuất DNA, chuẩn bị thư viện và giải trình tự Metagenomics
Vật liệu lá được nghiền thành bột trong nitơ lỏng Cùng một lượng (0,3g) vậtliệu được nghiền được sử dụng cho mỗi lần chiết xuất DNA.DNA bộ gen thu đượcbằng cách sử dụng MATAB (100 mM TRIS-HCl pH 8.0, 1.4 M NaCl, 20 mM EDTA,2% MATAB, chứa 1% PEG 6000 và 0.5% natri sunfit) làm dung dịch đệm chiết xuất(6 mL MATAB/g trọng lượng tươi) với các sửa đổi Ba chế phẩm DNA được tạo từmỗi nhóm lá và được xử lý tiếp Giải trình tự metagenomics shotgun được thực hiệntại Novogene (Cambridge, Vương quốc Anh) Điều này bao gồm việc cắt DNA bộ genthành các đoạn ngắn, sau đó được sửa chữa đầu cuối, gắn đuôi A và nối với các bộđiều hợp Illumina Các đoạn có bộ điều hợp được khuếch đại bằng PCR, lựa chọn kíchthước và tinh chế Chất lượng và phân bố kích thước của thư viện được đánh giá bằngQubit để định lượng và bộ phân tích sinh học để xác định kích thước Cuối cùng, các
Trang 19thư viện được định lượng đã được giải trình tự trên nền tảng Illumina bởi Novogene,dựa trên nồng độ thư viện cần thiết và dữ liệu đầu ra.
3.2.2 Xử xý dữ liệu giải trình tự và lắp ráp Metagenome
Các đoạn đọc thô được lọc để loại bỏ các base chất lượng thấp (giá trị Q ≤ 38;ngưỡng 40 bp), các base mơ hồ ở đầu cuối trình tự (số lượng nucleotide mơ hồ tối đađược phép trong trình tự sau khi cắt tỉa: 10 bp) và các trình tự bộ điều hợp (chồng chéotối thiểu: 15 bp).Điểm số chất lượng phred Q là thước đo tiêu chuẩn về chất lượng củaviệc xác định các base được tạo ra bởi máy giải trình tự Điểm số chất lượng phred là
30 cho biết độ chính xác gọi base là 99,9%, trong khi giá trị Q là 40 cho biết độ chínhxác là 99,99% (hoặc xác suất gọi base không chính xác là 1 trong 10.000 nt) Q 38 cónghĩa là xác suất là 1 trên 6310 nt Do đó, các trình tự đã được cắt tỉa / lọc của chúngtôi chứa nt được máy giải trình tự gọi chính xác ở mức đó hoặc cao hơn
Các đoạn đọc đã được cắt tỉa và lọc sau đó được ánh xạ tới bộ gen tham chiếu
Brassica oleracea var Capitata [https://www.ncbi.nlm.nih.gov/assembly
(v2.2.4; http://bowtie-bio.sourceforge.net/ bowtie2/index.shtml) (truy cập vào ngày 1tháng 1 năm 2024), và các kết quả dương tính đã bị loại bỏ để tạo ra một bộ dữ liệusạch cuối cùng
Metagenomes được lắp ráp độc lập cho mỗi mẫu bằng cách sử dụng các bộ dữliệu sạch Dữ liệu sạch cho mỗi mẫu được lắp ráp để tạo ra các đoạn giàn giáo bằngphần mềm MEGAHIT (v1.0.4; https://github.com/voutcn/megahit) (truy cập vào ngày
1 tháng 1 năm 2024) với tham số - -presets meta-large Các khung được chia thành cácđoạn con (trình tự liên tục không có N trong khung) Các đoạn đọc chưa được lắp ráp
từ tất cả các mẫu được gộp chung để tạo ra một (sử dụng các tham số tương tự như vớicác lắp ráp riêng lẻ) để thu thập thông tin về các loài có độ phong phú thấp Các đoạncon có chiều dài ngắn hơn 500 bp đã bị lọc ra khỏi các lắp ráp riêng lẻ và hỗn hợp, vàtập hợp các trình tự cuối cùng thu được đã được chọn để dự đoán và chú thích gen tiếptheo
Thang đo chiều không tuyến tính (NMDS) được thực hiện bằng cách sử dụngcác hàm ordinate và plot_ordination từ gói phyloseq R (v1.30.0) bằng cách sử dụngkhoảng cách Bray – Curtis Các bộ dữ liệu hỗ trợ kết luận của nghiên cứu này có sẵn
Trang 20tại cơ sở dữ liệu Kho lưu trữ Nucleotide Châu Âu (ENA) với mã truy cậpPRJEB71999.
3.2.3 Dự đoán gen và chú thích phân loại
Các đoạn con (≥500 bp) từ tất cả các lắp ráp được sử dụng để dự đoán khungđọc mở (ORF) bằng MetaGeneMark (v2.10; http://topaz.gatech.edu/ GeneMark) (truycập vào ngày 1 tháng 1 năm 2024), không xem xét các dự đoán ngắn hơn 100 bp CácORF kết quả được khử trùng bằng CD-HIT (v4.5.8; http://www.bioinformatics.org/cd-hit) (truy cập vào ngày 1 tháng 1 năm 2024) với các tham số -c 0.95, -G 0, -aS 0.9, -g
1, -d 0 Đối với mỗi cụm ORF chồng chéo, ORF dài nhất được chọn làm gen đại diện(unigene) để tạo ra một tập hợp unigene cuối cùng (danh mục gen)
Dữ liệu sạch được ánh xạ vào danh mục gen bằng cách sử dụng Bowtie2 vớicác tham số end-to-end sensitive -I 200 -X 400 để tính toán độ phong phú của genbằng công thức:
G k=r k
L k .
1
∑1=1
n r i
L i
Trong đó r là số lượng đoạn đọc ánh xạvà L là chiều dài gen
Để chú thích phân loại, DIAMOND v0.9.9.110 đã được sử dụng để căn chỉnhcác trình tự unigene được phát hiện với tất cả các trình tự vi khuẩn, nấm, vi khuẩn cổ
và virus từ cơ sở dữ liệu NR của NCBI (tính đến ngày 01-02-2018), với blastp đượcđặt thành e 1 × 10−5 Sau đó, từ kết quả căn chỉnh của mỗi trình tự, những trình tự cógiá trị e ≤ min giá trị e ×10 đã được chọn Khi thu được nhiều kết quả căn chỉnh, thuậttoán LCA, được áp dụng để phân loại phân loại hệ thống bằng phần mềm MEGANv6.13.1, đã được áp dụng để xác định thông tin chú thích loài của trình tự
Độ phong phú tương đối ở các cấp phân loại khác nhau được nhập vào R bằngcách sử dụng phyloseq v1.30 và được kiểm tra bằng cách sử dụng biểu đồ cột (giới,ngành) và bản đồ nhiệt (loài) Để biểu diễn dữ liệu trong mỗi nhóm, các giá trị đã đượcthêm vào và dữ liệu được chuẩn hóa thành 100% Độ phong phú tương đối của cácđơn vị phân loại trên nhiều cấp độ của hệ thống phân cấp được hiển thị bằng cách sửdụng biểu đồ Krona bằng cách sử dụng gói R psadd v0.1.3
Trang 21Để liên kết các chức năng enzyme phân hủy, sửa đổi hoặc tạo carbohydrate vớicác nhóm lá cụ thể, các trình tự mã hóa protein đã được ánh xạ dựa trên cơ sở dữ liệuenzym hoạt động carbohydrate (CAZymes) (v2014.11.25) Cơ sở dữ liệu chứa sáu lớpchức năng: glycoside hydrolase, glycosyl transferase, polysaccharide lyase,carbohydrate esterase, hoạt động phụ trợ và mô-đun liên kết carbohydrate.