Vùng ITS-rDNA là vùng trình tự tương đối bảo tồn và có ý nghĩa trong nghiên cứu phân loại, vì thế vùng này đã được chọn làm cơ sở phân tử cho việc định danh các dòng nấm Colletotrichum t
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỒ CHÍ MINH
KHOA CÔNG NGHỆ SINH HỌC
*************
KHÓA LUẬN TỐT NGHIỆP
ĐỊNH DANH NẤM Colletotrichum DỰA VÀO TRÌNH TỰ
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỒ CHÍ MINH
KHOA CÔNG NGHỆ SINH HỌC
*************
KHÓA LUẬN TỐT NGHIỆP
ĐỊNH DANH NẤM Colletotrichum DỰA VÀO TRÌNH TỰ
VÙNG ITS-rDNA
KS NGUYỄN VĂN LẪM
Tháng 7/2009
Trang 3LỜI CẢM ƠN
Con xin gửi lời cảm ơn sâu sắc nhất đến Mẹ, không gì có thể so sánh với tình yêu con
dành cho Mẹ, người đã sinh thành, dưỡng dục, nuôi con khôn lớn lên người
Em xin chân thành cảm ơn:
Các Thầy Cô trong trường Đại học Nông Lâm TP Hồ Chí Minh đã tận tình
truyền đạt kiến thức cho em trong suốt 4 năm học
TS Lê Đình Đôn đã tận tình chỉ dẫn em trong suốt quá trình thực hiện khóa
luận
Anh Nguyễn Văn Lẫm, chị Trần Thị Vân đã hết lòng hướng dẫn em trong quá
trình thực hiện khóa luận
Các anh chị trong Viện Công Nghệ Sinh Học Và Môi Trường đã động viên,
chia sẻ kinh nghiệm và giúp đỡ em trong quá trình thực hiện khóa luận
Xin chân thành cảm ơn
Hoàng Văn Dương
Trang 4TÓM TẮT
Đề tài “ Định danh nấm Colletotrichum dựa trên trình tự vùng ITS – rDNA ”
được thực hiện tại phòng I5, khoa công nghệ sinh học và tại Viện Công Nghệ Sinh Học Và Môi Trường, trường Đại Học Nông Lâm Thành Phố Hồ Chí Minh từ ngày
20/02/2009 đến 30/07/2009 nhằm định danh một số dòng nấm Colletotrichum tại Việt
Nam, làm cơ sở cho việc kiểm soát hiệu quả các bệnh do loại nấm này gây ra
Colletotrichum là một loại nấm bệnh cây trồng, gây thiệt hại kinh tế lớn trên nhiều loại
kí chủ khác nhau Chính vì vậy việc kiểm soát hiệu quả các bệnh gây ra bởi
Colletotrichum là rất quan trọng
Định danh các dòng Colletotrichum được thực hiện dựa trên kết quả định danh
hình thái đã có và những phân tích trên vùng ITS-rDNA Vùng ITS-rDNA là vùng trình tự tương đối bảo tồn và có ý nghĩa trong nghiên cứu phân loại, vì thế vùng này đã
được chọn làm cơ sở phân tử cho việc định danh các dòng nấm Colletotrichum trong
nghiên cứu này
Nội dung nghiên cứu là phục hồi, nhân sinh khối các dòng nấm Colletotrichum,
thực hiện phản ứng PCR với cặp mồi ITS4 – ITS5 nhằm khuếch đại vùng
ITS1-5.8S-ITS2 Trình tự vùng ITS1-5.8S-ITS2 của các dòng nấm Colletotrichum trong nước
được so sánh với các loài trên GenBank sử dụng chương trình BLAST trên NCBI Để
định danh phân tử và xác định mối quan hệ di truyền của các dòng nấm Colletotrichum
trong nước, các cây phân nhóm được xây dựng dựa trên trình tự vùng ITS1 - 5.8S - ITS2 của các dòng nấm trong nước và một số loài trên GenBank Cây phát sinh loài này được xây dựng sử dụng phương pháp Neigbor Joining trong chương trình MEGA
Kết quả của nghiên cứu này là định danh được một số dòng Colletotrichum trong nước Các loài Colletotrichum đã gây bệnh trên cây trồng tại một số vùng ở Việt Nam được xác định trên cao su: C acutatum; địa lan: C gloeosporioides; dâu tây: C
acutatum; cà phê: C gloeosporiodes; ớt: C capsici Xác định được vùng biến đổi nhất
trong toàn vùng ITS – rDNA là vùng ITS1 Như vậy, vùng ITS – rDNA có thể được sử
dụng hiệu quả trong việc định danh các dòng nấm Colletotrichum, tuy nhiên cũng có
những loài không thể phân biệt được dựa trên trình tự ITS – rDNA do đó việc kết hợp thêm những phương pháp khác hay phân tích trên những vùng gen khác là cần thiết
Trang 5SUMMARY
The title of research is: “IDENTIFICATION OF Colletotrichum SPECIES BASED
ON ITS-rDNA REGION” The research is carried out from 20 February, 2009 to 30 Junly, 2009 at I5 department, Faculty of Biotechnology, Nong Lam University and Research Institute For Biotechnology and Environment, Nong Lam University with
the goal is accurate identification of Colletotrichum species in some regions in Viet Nam so that we can control this plant pathogen effectively The genus Colletotrichum
is considered major plant pathogen worldwide Colletotrichum cause significant economic damage to crops in tropical, subtropical, and temperate regions Accurate
identification of Colletotrichum species responsible for epidemics is essential for
developing and implementing effective disease control strategies
Identification of Colletotrichum isolates based on the morphology results and
analysing ITS – rDNA region ITS – rDNA region is a fairly conservative sequence and significant for taxonomic research Thus, ITS – rDNA region is selected for
identifying Collectotrichum isolates in this research
Content of this research is : inoculating Colletotrichum isolates in broth culture,
extracted DNA and amplified the ITS1 - 5,8 S - ITS2 region with two primers ITS4 and ITS5 580 bp products have been obtained ITS1-5.8S-ITS2 region of
Colletotrichum isolates in Viet Nam have been compared with data in GenBank using
BLAST program in NCBI To find the evolution relationship of Colletotrichum
isolates and test the results of identification morphology, we have constructed phylogenetic trees using Neigbor Joining in MEGA
The result of this research are: identifided some Colletotrichum isolates and
findding ITS1 region is the most variable in ITS – rDNA region So ITS – rDNA
region can be used to identify Colletotrichum species However, some Colletotrichum
species aren’t distinguishable based on ITS – rDNA, so we should use ITS – rDNA
along with other techniques or other genes to identify Colletotrichum species
Trang 6MỤC LỤC
Lời cảm ơn iii
Tóm tắt iv
Summary v
Mục lục vi
Danh sách các bảng ix
Danh sách các hình x
Chương 1 MỞ ĐẦU 1
1.1 Đặt vấn đề 1
1.2 Yêu cầu của đề tài 2
1.3 Mục đích của đề tài 2
1.4 Nội dung thực hiện 2
Chương 2 TỔNG QUAN TÀI LIỆU 3
2.1 Giới thiệu về nấm Colletotrichum 3
2.1.1 Vị trí phân loại 3
2.1.2 Đặc điểm hình thái 3
2.1.3 Bệnh thán thư do Colletotrichum 4
2.2 Giới thiệu kỹ thuật PCR và phương pháp giải trình tự DNA 6
2.2.1 Kỹ thuật PCR 6
2.2.2 Các phương pháp giải trình tự DNA 9
2.3 Tổng quan về vùng ITS-rDNA 10
2.3.1 Giới thiệu về vùng rDNA và vùng ITS 10
2.3.2 rDNA trong nghiên cứu phát sinh loài 10
2.4.1 Chức năng của chương trình BLAST 11
2.4.2 Cơ sở dữ liệu của BLAST 12
2.4.3 Lựa chọn chương trình BLAST phù hợp 13
2.4.4 Các bước thực hiện BLAST 15
2.5 Giới thiệu cây phát sinh loài 15
2.5.1 Khái niệm cây phát sinh loài 15
2.5.2 Cấu trúc cây phát sinh loài 16
Trang 72.5.3 Một số lưu ý về cây phát sinh loài 17
2.5.4 Các bước cơ bản để tiến hành nghiên cứu phát sinh loài dựa vào phân tử 17
2.5.5 Chọn lựa phương pháp xây dựng cây phát sinh loài thích hợp 17
2.6 Tình hình nghiên cứu định danh Colletotrichum trên thế giới 18
2.7 Tình hình nghiên cứu định danh Colletotrichum trong nước 20
Chương 3 VÂT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 22
3.1 Thời gian, địa điểm nghiên cứu 22
3.2 Vật liệu 22
3.2.1 Đối tượng nghiên cứu 22
3.2.3 Hoá chất và thiết bị 24
3.3 Phương pháp 24
3.3.1 Phục hồi các dòng nấm Colletotrichum trên môi trường PGA 24
3.3.2 Nhân, thu sinh khối và nghiền mẫu nấm 24
3.3.3 Ly trích DNA từ nấm đã được nghiền mịn 25
3.3.4 Điện di kiểm tra kết quả ly trích DNA và PCR 26
3.3.5 Thực hiện phản ứng PCR khuếch đại vùng ITS – rDNA 26
3.3.6 Phương pháp xử lý số liệu 27
Chương 4 KẾT QUẢ VÀ THẢO LUẬN 43
4.1 Kết quả nhân sinh khối 43
4.2 Kết quả ly trích DNA 43
4.3 Kết quả khuếch đại trình tự vùng ITS1-5.8S-ITS2 44
4.4 Kết quả phân nhóm các loài Colletotrichum trong nước và nước ngoài 44
4.5 Kết quả định danh các dòng Colletotrichum 47
4.6 Xác định vùng tiến hóa nhanh nhất trong toàn vùng ITS - rDNA 56
4.6.1 Phân nhóm loài Colletotrichum dựa vào trình tự ITS1 56
4.6.2 Phân nhóm các loài Colletotrichum dựa vào trình tự vùng ITS2 59
4.7 Phân tích mối quan hệ di truyền của các dòng Colletotrichum trong nước .59
Chương 5 KẾT LUẬN VÀ ĐỀ NGHỊ 61
5.1 Kết luận 61
5.2 Đề nghị 61
TÀI LIỆU THAM KHẢO 62
PHỤ LỤC………
Trang 8EDTA: Ethylene Diamin Tetracetic Acid
ETS: External Transcribed Spacer - Vùng phiên mã bên ngoài
IGS: Intergenic spacer – khoảng giữa hai gen
ITS: Internal Transcribed Spacer - vùng phiên mã bên trong
LSU: Large Subunit - Tiểu đơn vị lớn
NCBI: National Center for Biotechnology Informatic - Trung tâm quốc gia về sinh tin sinh học
PCR: Polymerase Chain Reaction
PGA: Potato glucose agar
rDNA: ribosomal DNA
RAPD: Random Amplified Polymorphism DNA - Đa hình DNA được khuếch đại
ngẫu nhiên
RNA: Ribonucleic acid
RFLP: Restriction Fragment Length Polymorphism - Đa hình chiều dài đoạn cắt giới hạn
SDS: Sodium Dodecyl Sulfate
SSU: Small Subunit - Tiểu đơn vị nhỏ
Taq: Thermus aquaticus
TAE: Tricacetic ethylene diamine tetra acetate
TE: Tris ethylene diamine tetra acetate
Tm: Melting Tempereture - Nhiệt độ nóng chảy
Trang 9DANH SÁCH CÁC BẢNG
Bảng 2.1 Cơ sở dữ liệu protein 12
Bảng 2.2 Cơ sở dữ liệu nucleotide 13
Bảng 2.3 Lựa chọn chương trình cho trình tự protein 14
Bảng 2.4 Lựa chọn chương trình cho trình tự nucleotide 15
Bảng 3.1 Các dòng nấm Colletotrichum được sử dụng trong nghiên cứu này 22
Bảng 3.2 Các loài Colletotrichum trên GenBank 23
Bảng 3.3 Thành phần các chất cho 1 phản ứng PCR thể tích 50l 26
Bảng 4.1 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CS1 .47
Bảng 4.2 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CS2 .47
Bảng 4.3 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CS3 .48
Bảng 4.4 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CS4 48
Bảng 4.5 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng Ot1 49
Bảng 4.6 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng Ot2 50
Bảng 4.7 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng DL1 50
Bảng 4.8 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng DL2 51
Bảng 4.9 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng DL3 51
Bảng 4.10 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng Nh1 52
Bảng 4.11 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng Nh2 52
Bảng 4.12 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CP1 53
Bảng 4.13 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CP2 53
Bảng 4.14 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CP3 53
Bảng 4.15 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CP4 54
Bảng 4.16 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CP5 54
Bảng 4.17 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng DT1 55
Bảng 4.18 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng DT2 55
Bảng 4.19 Kết quả định danh 18 dòng Colletotrichum 56
Trang 10DANH SÁCH CÁC HÌNH
Hình 2.1 Nấm Colletotrichum .3
Hình 2.2 Bệnh thán thư do nấm Colletotrichum 4
Hình 2.3 Quá trình xâm nhiễm Colletotrichum trên cây trồng 5
Hình 2.4 Sơ đồ vùng ITS - rDNA của nấm .10
Hình 2.5 Các loại cây phát sinh loài .16
Hình 2.6 Sơ đồ lựa chọn phương pháp tạo cây phát sinh loài 18
Hình 4.1 Kết quả ly trích DNA tổng số các dòng nấm Colletotrichum .43
Hình 4.2 Kết quả PCR các dòng nấm Colletotrichum 44
Hình 4.3 Cây phân nhóm các loài Colletotrichum dựa trên vùng ITS – rDNA 45
Hình 4.4 Cây phân nhóm loài Colletotrichum dựa vào vùng ITS1 57
Hình 4.5 Cây phân nhóm loài Colletotrichum dựa trên trình tự vùng ITS2 58
Hình 4.6 Cây phát sinh loài các dòng Colletotrichum trong nước .59
Trang 11cây trồng lâu năm, cây ăn trái, ngũ cốc, cây họ đậu, rau
Để kiểm soát bệnh hiệu quả, trước tiên phải xác định chính xác loài gây bệnh vì
các loài Colletotrichum khác nhau có sự nhạy cảm khác nhau đối các loại thuốc diệt nấm, ví dụ: C acutatum có mức nhạy cảm trung bình với thuốc diệt nấm benzimidazole, trong khi C gloeosporioides lại có độ nhạy cảm cao ( Freeman và ctv,
1998 ) Trong khi ranh giới giữa các giống loài ngày nay khá rõ ràng, thì ranh giới
giữa các loài trong giống Colletotrichum vẫn chưa được chấp nhận rộng rãi Những
khái niệm phân loại của nhóm này chủ yếu dựa theo von Arx (1957, 1970) và Sutton (1980) Những đặc điểm hình thái như màu sắc khuẩn lạc, hình dạng, kích cỡ bào tử, nhiệt độ tối ưu, tốc độ phát triển và khoảng vật chủ đã được sử dụng như những
phương pháp truyền thống để xác định loài Colletotrichum ( Wharton và Uribeondo,
2002 ) Do ảnh hưởng của môi trường những đặc điểm hình thái có thể thay đổi và những tiêu chuẩn này trong nhiều trường hợp không thể cho kết quả định danh chính
xác, đồng thời nhiều loài Colletotrichum có khoảng ký chủ rộng như Colletotrichum
acutatum có thể gây bệnh trên xoài, dâu tây, cao su, táo, lê Do đó không thể dựa vào
khoảng ký chủ để định danh trong những trường hợp này
Hiện nay sinh học phân tử đã đưa ra nhiều phương pháp đáng tin cậy trong việc phân loại, đặc biệt là sự xác định loài, quan hệ bên trong loài và giữa các loài
Colletotrichum Nhiều kỹ thuật phân tử khác nhau đã được sử dụng thành công để định
danh loài Colletotrichum chủ yếu dựa trên sự phân tích trình tự DNA, do trình tự
DNA không bị ảnh hưởng trực tiếp bởi các yếu tố môi trường Những kỹ thuật phân tử
được sử dụng trong định danh Colletotrichum như: phân tích trình tự rDNA, A+T-rich
DNA RFLPs, ap-PCR Trong đó, phân tích trình tự rDNA, đặc biệt là vùng ITS, đã
được sử dụng rộng rãi trong các nghiên cứu định danh Colletotrichum do rDNA lặp lại
nhiều lần trên genome và những biến đổi trên rDNA có ý nghĩa lớn trong phân tích
Trang 12tiến hóa, chính vì vậy vùng ITS – rDNA đã được sử dụng trong nghiên cứu này để
định danh các dòng nấm Colletotrichum ở một số vùng tại Việt Nam
1.2 Yêu cầu của đề tài
- Ly trích DNA của các dòng nấm
- Đọc trình tự vùng gen ITS1 – 5,8 S – ITS2
- Định danh các dòng nấm Colletotrichum trên một số cây trồng tại Việt Nam
1.3 Mục đích của đề tài
- Định danh các dòng nấm Colletotrichum trên một số cây trồng tại Việt Nam
dựa trên vùng ITS – rDNA
1.4 Nội dung thực hiện
- Phục hồi, nhân sinh khối các dòng Colletotrichum
- Khuếch đại vùng gen ITS1 – 5,8 S – ITS2 của các dòng nấm Colletotrichum
dùng cặp mồi ITS4 – ITS5
- Định danh và xác định mối quan hệ di truyền của các dòng nấm
Colletotrichum dựa trên trình tự vùng ITS – rDNA
Trang 13Chương 2 TỔNG QUAN TÀI LIỆU
2.1 Giới thiệu về nấm Colletotrichum
2.1.1 Vị trí phân loại (wikipedia)
Sợi nấm Colletotrichum nội sinh, mảnh, phân nhánh, có vách ngăn, sợi nấm có nội
bào và gian bào Nhiều hạt dầu được sản xuất trong mỗi tế bào của hệ sợi nấm Khi chín sợi nấm trở nên sậm màu và bện xoắn lại thành dạng chất nền nhỏ dưới lớp ngoài cùng
Hình 2.1 Nấm Colletotrichum a) Colletotrichum gloeosporioides;
b) Colletotrichum acutatum (bioblaze, 2008)
Colletotrichum sinh sản vô tính bằng bào tử đính, bào tử đính phát triển trên
cuống bào tử trong dạng thể quả là cụm cuống bào tử Cụm cuống bào tử có dạng đĩa phẳng, mặt sau có cấu trúc phấn mịn, mỗi cụm cuống bào tử gồm lớp chất nền, bề mặt
Trang 14sản sinh cuống bào tử trong suốt Cuống bào tử không có vách ngăn kéo dài đơn bào, dạng liềm, cong, bào tử trong suốt Cùng với bào tử và cuống bào tử là các lông cứng trên mỗi cụm cuống bào tử, lông dài cứng, thuôn nhọn, không phân nhánh và đa bào
cấu trúc như tơ cứng Theo Frost (1964), một vài loài của Colletotrichum có hoặc
không có lông cứng có thể được kiểm soát bởi sự thay đổi độ ẩm
Sự hình thành một số lớn của bào tử gây nứt gãy trên biểu bì vật chủ, gặp điều kiện thuận lợi, mỗi bào tử mọc từ một đến nhiều ống mầm để hình thành hệ sợi nấm
Đĩa bám là dạng của Colletotrichum trong nuôi cấy Sợi nấm già đôi khi hình thành
vách dày, màu nâu sậm, hình cầu hoặc không đều gọi là hậu bào tử (Chlamydospores),
nó có thể ở tận cùng hoặc chen giữa sợi nấm và tồn tại trong thời gian dài và khi tách
ra chúng cũng mọc mầm để hình thành sợi nấm mới (Cao Ngọc Điệp, 2007)
2.1.3 Bệnh thán thư do Colletotrichum
Thán thư là bệnh nguy hiểm trên cây trồng, bệnh này xuất hiện ở nhiều loại cây
khác nhau trên khắp thế giới Colletotrichum gây bệnh thán thư thường tấn công cành
non, lá non, hoa và trái với những triệu chứng bệnh điển hình như: trên hoa, bệnh làm rụng hoa; ở lá, đốm bệnh có màu xám nâu, tạo các đốm cháy; ngọn, cành non có các đốm bệnh màu nâu xám, vùng bị bệnh sẽ khô đi làm rụng lá và khô chết đọt; trên trái,
vỏ trái có những đốm đen hơi tròn hay bầu dục, lõm vào Bệnh này xuất hiện ở cả những mô đang phát triển lẫn mô trưởng thành, gây hại cả trước và sau thu hoạch
Colletotrichum có thể xâm nhập và không biểu hiện ngay mà khi có điều kiện thuận
lợi mới gây bệnh Bệnh thán thư do Colletotrichum gây hại chủ yếu ở những phần trên
mặt đất, tuy nhiên rễ và thân củ cũng có khả năng nhiễm bệnh
Hình 2.2 Bệnh thán thư do nấm Colletotrichum (a) Bệnh thán thư trên nho;
(b) bệnh thán thư trên dâu tây (Leonor Leandro, 2001)
Trang 15Hình 2.3 Quá trình xâm nhiễm Colletotrichum trên cây trồng
(Wharton và Uribeondo, 2003)
Trên ớt, trái ớt đã lớn, khi bị nhiễm bệnh, xuất hiện những vết lõm xuống, hình
vòng tròn, hơi ướt Khi gặp thời tiết thuận lợi, bệnh lan ra rất nhanh, vết bệnh có màu
nâu nhạt đến đậm Trên trái, nơi bị bệnh nặng, xuất hiện những hạch bào tử màu vàng
Ngoài ra, bệnh còn tấn công trên cây con gây chết rạp lá ớt và gây hiện tượng đốm
Bệnh này có thể gây thất thu đến 80 – 90%
Trên cà phê, bệnh xuất hiện ở giai đoạn từ khi cây cà phê ra hoa đến trái chín Bệnh làm khô đen lá, quả, cành và thậm chí cả thân Trên lá, các vết bệnh có
vòng đồng tâm Đặc biệt nấm bệnh hay xâm nhập ở đầu lá nên thường thấy lá khô
cháy từ ngoài chóp lá vào Trên cành, bệnh thường tấn công trên các cành đang
hóa gỗ, xâm nhập chủ yếu ở đầu cành mang quả và các vết nứt tạo nên những vết
nâu lõm xuống làm vỏ biến màu nâu đen và khô dần Nếu bệnh nặng, nấm tấn
công cả cành lớn và lan vào cả thân, làm rụng lá, để lại những cành trơ trụi khô
đen Trên trái, bệnh để lại những vết lõm ở phần vỏ sau đó trái biến màu nâu nhạt,
khô đen và rụng sớm
Trên sầu riêng, bệnh phát triển nhiều trên lá, tạo những đốm bệnh riêng biệt, tròn và hoại tử hoặc có hình bất dạng, thường ở rìa và chóp lá Đốm lá có màu nâu xám nhạt với các vòng đồng tâm hoặc các vòng xung quanh vết bệnh với
một số bào tử màu đen, xung quanh vết bệnh thường có ranh giới màu nâu vàng
Trang 16Bệnh thường phát sinh trên lá già, lá bánh tẻ Lá bệnh trên cây con hay cây bị suy yếu dễ rụng sớm
2.2 Giới thiệu kỹ thuật PCR và phương pháp giải trình tự DNA
2.2.1 Kỹ thuật PCR
2.2.1.1 Khái niệm chung
Kỹ thuật PCR (phản ứng chuỗi trùng hợp - polymerase chain reaction), là kỹ thuật tổng hợp nhân tạo các đoạn DNA với tốc độ nhanh, chính xác cao được thực hiện trong máy chu trình nhiệt (máy PCR) Kỹ thuật này khuếch đại một trình tự đích DNA ban đầu thành hàng triệu bản sao nhờ hoạt động của enzyme polymerase và cặp primer đặc hiệu cho đoạn DNA cần được khuếch đại (Trịnh Đình Đạt, 2006)
2.2.1.2 Nguyên lý
Kỹ thuật PCR tuân thủ những nguyên tắc cơ bản của sao chép DNA trong cơ thể như: đoạn DNA cần mở xoắn thành hai mạch đơn, cần các cặp mồi (mồi xuôi, mồi ngược), cần nguyên liệu và điều kiện môi trường thích hợp và enzym DNA polymerase Tuy nhiên kỹ thuật PCR có khác là dùng nhiệt độ cao thay cho helicase kết hợp với DNA polymerase chịu nhiệt và hệ thống điều nhiệt thích hợp cho từng giai đoạn phản ứng tổng hợp cùng với các đoạn mồi được thiết kế chủ động
DNA polymerase: Là enzym xúc tác cho quá trình lắp ráp các nucleotit A, T, G,
C vào mạch DNA mới đang tổng hợp, có nhiều loại DNA polymerase: Taq DNA
polymerase, Pfu DNA polymerase, T4 DNA polymerase, Tth DNA polymerase,… đây
các là enzyme chịu nhiệt cao DNA polymerase được sử dụng phổ biến là Taq DNA polymerase tách chiết từ vi khuẩn Thermus aquaticus (vi khuẩn suối nước nóng) Taq polymerase quá cao sẽ dẫn đến các kết quả không chuyên tính, còn nếu nồng độ Taq
polymerase quá thấp sẽ không có đủ số lượng enzyme để xúc tác tạo ra sản phẩm PCR theo ý muốn
Mồi (primer): Primer có vai trò rất quan trọng trong tiến trình khuếch đại của phản ứng PCR Đoạn mồi là các oligonucleotit có độ dài 6 – 30 nucleotit, có trình tự
Trang 17bắt cặp bổ sung với trình tự hai đầu mạch khuôn Trình tự primer được chọn sao cho không có sự bắt cặp bổ sung giữa primer “xuôi” và primer “ngược”, không có những cấu trúc “primer dimer” do sự bắt cặp bổ sung giữa các thành phần khác nhau của một primer Mồi phải đảm bảo đủ dài để đảm bảo bắt cặp chính xác Nhiệt độ nóng chảy
Tm của mồi xuôi và mồi ngược không được cách biệt quá xa Các primer phải đặc trưng cho trình tự DNA cần khuếch đại, không trùng với trình tự lặp lại trên gen Công thức tính nhiệt độ gắn mồi:
- Đối với mồi ≤ 20: Tm = [ 2( A + T ) + 4( G + C )]0C
- Đối với mồi > 20: Tm = 22 + 1,46[2(G + C ) + ( A + T)]0C
Nồng độ mồi thường khoảng 100 – 500 nM
Thời gian gắn mồi khoảng 30 – 60 giây
Bốn loại nucleotid (dNTP): dATP, dTTP, dGTP, dCTP là ngyên liệu tạo nên mạch DNA mới, thường được sử dụng ở nồng độ 100 - 200µM mỗi loại nucleotid Nếu nồng độ cao hơn dễ dẫn đến sự khuếch đại sản phẩm dương tính giả hay tạp nhiễm Sự mất cân bằng trong thành phần các nucleotid lại làm tăng các lỗi sao chép của polymerase
Dung dịch đệm (buffer): Thành phần dung dịch đệm của phản ứng PCR thường phụ thuộc vào loại enzym DNA polymerase sử dụng trong PCR
Nồng độ Mg2+ thường trong khoảng 0,5 – 5 mM Mg2+ có tác dụng gắn liên kết dNTP với DNA polymerase, tăng khả năng bám nối của mồi
2.2.1.4 Các chu kỳ của phản ứng PCR
Sự khuếch đại được thực hiện nhờ chu trình nhiệt lặp lại
Phản ứng PCR gồm nhiều chu kỳ lặp lại nối tiếp nhau Mỗi chu kỳ gồm 3 giai đoạn: Giai đoạn 1 (giai đoạn biến tính: tách sợi đơn DNA, denaturation): ở điều kiện nhiệt độ cao phân tử DNA từ mạch đôi tách ra thành dạng mạch đơn dùng làm khuôn
để tổng hợp mạch mới DNA, nhiệt độ thừơng là 94 - 950C trong 30 - 60 giây
Giai đoạn 2 (giai đoạn bắt cặp giữa primer và khuôn, anealation): khi nhiệt độ
hạ thấp hơn nhiệt độ nóng chảy Tm của primer, primer sẽ bắt cặp với mạch khuôn tại
vị trí có trình tự bổ sung với primer Nhiệt độ cho giai đoạn này 50 - 640C Đây là giai đoạn quan trọng Nhiệt độ gắn mồi phải đảm bảo đúng để khả năng gắn tốt nhất, tránh hiện tượng gắn không đặc hiệu
Giai đoạn 3 (giai đoạn tổng hợp, kéo dài, elongation): nhiệt độ tăng lên 68 -
720C, ở nhiệt độ này Taq DNA polymerase hoạt động tối ưu Trong khoảng 30 giây
Trang 18cho đến vài phút tùy theo kích thước cần khuếch đại Khi đó Taq DNA polymerase
tổng hợp mạch DNA mới dựa trên trình tự của mạch khuôn, độ dài đoạn khuếch đại là khoảng cách giữa hai primer đơn đã bắt cặp với 2 DNA khuôn mạch đơn, các nucleotid lần lượt được gắn vào mỗi đầu DNA khuôn sợi đơn , gắn kế tiếp các nucleotid của primer và chiều bổ sung là 5’ ở trên cả 2 DNA sợi đơn
Trong phản ứng PCR một chu kỳ gồm 3 giai đoạn trên sẽ được lập đi lập lại nhiều chu kỳ và làm gia tăng số lượng DNA theo cấp số nhân, số chu kỳ thường trong khoảng 25 - 50 Số chu kỳ trong phản ứng thông thường không được quá cao, do phản ứng PCR diễn tiến trong các chu kỳ đầu số lượng bản sao tăng theo cấp số nhân tỉ lệ với lượng mẫu ban đầu, sau đó hiệu quả khuếch đại giảm hẳn vì những nguyên nhân sau: sự phân huỷ và cạn kiệt các thành phần của phản ứng, sự xuất hiện các sản phẩm phụ làm ức chế phản ứng khuếch đại, các bản sao vừa được tổng hợp không bắt cặp với mồi mà chúng tự bắt cặp với nhau Số chu kỳ cho một phản ứng còn phụ thuộc vào
số lượng mẫu ban đầu
Sản phẩm khuếch đại được tính như sau: Tổng số DNA khuếch đại = m x 2n Trong đó: n là số chu kỳ thực hiện, m là số bản sao ban đầu của chuỗi trình tự DNA cần nhân ra
Tách nhanh chóng, chính xác từng gen hoặc từng đoạn DNA riêng biệt
Là kỹ thuật nền cho các nghiên cứu di truyền phân tử như xác định trình tự gen,
đa hình DNA, xác định marker phân tử cho chọn giống, phát hiện đột biến gen,… Phát hiện DNA có tính đa hình nhờ PCR
Xác định giới tính động vật ở giai đoạn phôi, thai
Chẩn đoán nhanh nhạy các bệnh di truyền, bệnh nhiễm trùng ( virus, vi khuẩn, nấm,…)
Khôi phục gen của các sinh vật cổ cách đây hàng triệu năm
Trang 19 Xác định nguồn gốc hài cốt, quan hệ họ hàng, xác định cá thể dùng trong việc xác định huyết thống cũng như trong khoa học hình sự
PCR là kỹ thuật chuẩn và từ đó cải tiến để tăng thêm hiệu quả nghiên cứu cho những gene có tính đa hình cao hay lập bản đồ di truyền, bản đồ vật lý Tính đa hình của gene được ứng dụng rất nhiều trong di truyền và chọn giống
PCR chuẩn cần phải biết trước trình tự đầu tiên của gen để thiết kế các primer đặc hiệu Tuy nhiên có những nghiên cứu thực hiện trên những vùng thông tin về các chuỗi mã di truyền trên vùng genome một số đối tượng chưa biết trước Cho nên để phát hiện tính đa hình của DNA trên những vùng chưa biết trước đó ta phải cải tiến kỹ thuật PCR để có thể ứng dụng vào những nghiên tính đa hình hay những trình tự DNA ngắn hay tính lập lại của một vùng nào đó của genome
2.2.2 Các phương pháp giải trình tự DNA
Muốn nghiên cứu trình tự các nucleotit của một gen, một đoạn DNA, hoặc cả phân tử DNA cần tiến hành giải trình tự DNA Sau đây là hai phương pháp giải trình
tự DNA chủ yếu thường dùng
2.2.2.1 Phương pháp hóa học ( Phương pháp Maxam và Gilbert )
Nguyên lý của phương pháp hóa học là các đoạn DNA có số lượng trình
tự nucleotit giống nhau được đánh dấu bằng đồng vị phóng xạ P31 ở đầu 5’ Các đoạn DNA đã mang dấu phóng xạ được chia thành 4 nhóm Mỗi nhóm được xử
lý bằng các chất hóa học khác nhau nhằm bẻ gãy các đoạn DNA ở các vị trí khác nhau ở một hay hai loại bazơ nitơ khác nhau Kết quả sau khi xử lý tạo thành các đoạn DNA bị cắt ngẫu nhiên có kích thước khác nhau Bốn nhóm sau khi cắt được đem đi điện di trên gel polyacrylamid và thu được các băng DNA khác nhau theo thứ tự Tùy theo đoạn nucleotit dài ngắn khác nhau sẽ thu được trật tự băng khác nhau Các đoạn nucleotit ngắn chạy nhanh, các đoạn nucleotit dài chạy chậm Nhờ phương pháp phóng xạ tự ghi, thu được các băng khác nhau trên bản gel sau điện di (Trịnh Đình Đạt, 2006)
2.2.2.2 Phương pháp dideoxy
Nguyên lý của phương pháp xác định trình tự DNA dideoxy của F Sanger (1977) là phương pháp sử dụng enzym DNA polymerase và các dideoxy Dideoxy là các nucleotit mất cả hai nhóm OH ở vị trí cacbon 2 và 3 trên phân tử đường pentose
Trang 20Phương pháp này dựa trên nguyên tắc là DNA polymerase xúc tác cho việc kéo dài
chuỗi polynucleotit khi gặp các dideoxynucleotit thì dừng lại Do vậy các đoạn
polynucleotit sẽ có chiều dài khác nhau
2.3 Tổng quan về vùng ITS-rDNA
2.3.1 Giới thiệu về vùng rDNA và vùng ITS
rDNA là nhóm gene mã hoá rRNA của ribosome và đóng vai trò quan trọng
trong các nghiên cứu quan hệ phát sinh loài Các bản sao của gen nằm liên tiếp trên
một locus và liên quan mật thiết tới quá trình tiến hoá
Hình 2.4 Sơ đồ vùng ITS - rDNA của nấm. NTS): vùng không phiên mã; ETS): vùng
phiên mã bên ngoài; ITS): vùng phiên mã bên trong (Wikipedia)
rDNA chứa vùng 18S, ITS1, 5.8S, ITS2, 28S và vùng IGS (bao gồm vùng
phiên mã bên ngoài, vùng không phiên mã và vùng kết thúc phiên mã) Vùng phiên mã
18S hình thành tiểu đơn vị nhỏ (SSU), trong khi 28S, 5.8S và 5S, mã hóa bởi một gen
không thuộc rDNA, hình thành tiểu đơn vị lớn (LSU) của ribosome RNA Những vùng
ITS được phiên mã (tổng hợp từ RNA), nhưng bị phân cắt trước khi rRNA hoàn thiện
được hình thành, tuy nhiên vùng ITS lại có chức năng trong sự hình thành ribosome
IGS là vùng kém bảo tồn nhất của rDNA
Các nhóm gen gồm nhiều bản sao lập lại, mỗi đơn vị lặp lại chứa một vùng
phiên mã (ETS, ITS1, ITS2, 18S, 25S và 5,8S) và một vùng không phiên mã (NTS)
Các rDNA 5.8S, 18S, 28S phiên mã thành các tiền rRNA riêng rẽ, nằm xen kẽ với các
vùng phiên mã bên trong (ITS) và các vùng phiên mã bên ngoài (ETS) rDNA 5.8 S có kích thước rất nhỏ và ít có sự biến đổi song rRNA 5.8S là thành phần
không thể thiếu của nu-LSU- rRNA, có vai trò ổn định cấu trúc ribosome và thúc đẩy
quá trình tổng hợp protein (Szymanski và cộng sự, 2001)
2.3.2 rDNA trong nghiên cứu phát sinh loài
Trình tự rDNA được sử dụng trong nhiều nghiên cứu quan hệ phát sinh loài trên
một phạm vi rộng , từ những nghiên cứu giữa những nòi giống cơ bản của sự sống đến
quan hệ giữa những loài có quan hệ gần rDNA có thể được áp dụng trong nhiều
Trang 21trường hợp như vậy là do rDNA bao gồm nhiều mức độ tiến hóa trong những vùng khác nhau và sự hiện diện nhiều bản sao trong mỗi genome rDNA có thể được phân tích dựa trên kỹ thuật giải trình tự trực tiếp RNA, DNA hay sử dụng enzym cắt
Vùng được nghiên cứu nhiều nhất của rDNA là vùng mã hóa cho tiểu đơn vị nhỏ 16-18S rRNA Gen này được nghiên cứu phổ biến do nó là vùng tiến hóa chậm trong sinh vật, vì thế có thể được sử dụng để nghiên cứu những sự kiện tiến hóa cổ xưa Ngoài ra, tỉ lệ thay đổi thấp cho phép tạo ra những primer phổ biến, điều này giúp cho việc giải trình tự của những nhóm sinh vật mà trước đây chưa được nghiên cứu
Gene mã hóa cho tiểu đơn vị lớn 23-28S rRNA có kích thước lớn hơn và tiến hóa nhanh hơn so với tiểu đơn vị nhỏ Gene này có thể được dùng cho những so sánh
cổ xưa, tuy nhiên nó chủ yếu được sử dụng để nghiên cứu những sự kiện tiến hóa trong đại cổ sinh và đại trung sinh Gene này có nhiều domain khác nhau hay những đoạn mở rộng, vì thế kích cỡ của gene thay đổi đáng kể giữa các nghành Những domain khác nhau này có thể được sử dụng cho việc tìm hiểu những sự kiện tiến hóa tương đối gần (trong kỷ thứ 3), mặc dù những vùng sử dụng cho nghiên cứu phải được chọn lựa cẩn thận
Gene mã hóa cho 5.8S rRNA của eukaryotes (tương ứng với vùng gene mã hóa cho tiểu đơn vị lớn của prokaryotes) có ứng dụng trong phân tích tiến hóa giống với gene mã hóa cho tiểu đơn vị nhỏ, mặc dù kích thước ngắn giới hạn hiệu quả của nó trong nghiên cứu tiến hóa
Vùng không mã hóa cho rRNA có thể được sử dụng để tìm hiểu quan hệ phát sinh loài trong những loài có quan hệ gần Ngoài ra những thay đổi trong vùng này cũng có thể được sử dụng trong định danh loài, nghiên cứu sự lai giống, và như những marker trong nghiên cứu di truyền quần thể Vùng NTS tiến hóa nhanh nhất và vùng ITS bảo tồn hơn Việc khuếch đại hai vùng ITS1, ITS2 là khá dễ dàng bằng phản ứng PCR do những vùng bảo tồn của 18S, 5.8S và 28S có thể được sử dụng để thiết kế những primer phổ biến Vì thế việc sử dụng vùng này trong nghiên cứu tiến hóa của những loài có quan hệ gần đang trở lên phổ biến (Hillis và Dixon, 1991)
2.4 Giới thiệu chương trình BLAST
2.4.1 Chức năng của chương trình BLAST
Sự so sánh những trình tự nucleotide hay protein của cùng một sinh vật hay của những sinh vật khác nhau có vai trò quan trọng trong những nghiên cứu sinh học phân
Trang 22tử Sự giống nhau giữa các trình tự có thể cho biết chức năng của gen mới, tiên đoán những thành viên mới của một họ gen, cũng như quan hệ tiến hóa Việc tìm sự giống nhau giữa các trình tự có thể được sử dụng để tiên đoán vị trí và chức năng của những vùng điều hòa phiên mã và mã hóa protein ( Nguyễn Văn Cách, 2005)
Basic Local Alignment Search Tool (BLAST) là chương trình được sử dụng phổ biến nhất cho việc tính toán sự tương đồng của các trình tự
2.4.2 Cơ sở dữ liệu của BLAST
Một chương trình BLAST có 4 yếu tố: trình tự cần so sánh, cơ sở dữ liệu, chương trình sử dụng và mục đích tìm kiếm Để chọn lựa chương trình BLAST thích hợp, trước tiên cần biết những cơ sở dữ liệu và dạng trình tự trong cơ sở
dữ liệu đó Tùy theo loại trình tự mà phân thành hai nhóm là cơ sở dữ liệu nucleotide và protein
Bảng 2.1 Cơ sở dữ liệu protein
Database Giải thích
nr non-redundant, bao gồm dữ liệu từ Genbank + PDB + SwissProt
+ PIR + PRP, không bao gồm env_nr refseq Những trình tự protein từ NCBI Reference Sequence project
swissprot Những trình tự protein từ cơ sở dữ liệu của SWISS-PROT
pat Những trình tự protein có bản quyền của GenBank
month Tất cả các trình tự mới từ GenBank + PDB + SwissProt + PIR +
COG v1.00 ² 4873 PSSMs từ NCBI COG
KOG v1.00 ² 4825 PSSMs từ NCBI KOG
CDD v2.05 ² 11399 PSSMs từ NCBI curated cd
Trang 23Bảng 2.2 Cơ sở dữ liệu nucleotide
Database Giải thích
nr Tất cả trình tự từ GenBank + EMBL + DDBJ + PDB ( ngoại trừ
các trình tự ETS, STS, GSS, 0, 1, 2 HTGS )
refseq_mrna Những trình tự mRNA từ NCBI Refence Sequence Project
refseq_genomic Những trình tự genome từ NCBI Refence Sequence Project
est Những trình tự trong GenBank + EMBL + DDBJ từ phần ETS est_human Những trình tự ETS của người
est_mouse Những trình tự ETS của chuột
est_others Những trình tự ETS của những sinh vật khác, ngoài
người và chuột gss Trình tự genome chung
htgs Những trình tự genome chưa hoàn thiện: phase 0, 1, 2
pat Những trình tự nucleotide có bản quyền của GenBank
pdb Những trình tự nhận được từ cấu trúc ba chiều của protein từ
Protein Data Bank
month Trình tự nucleotide mới từ GenBank + EMBL + DDBJ + PDB
trong 30 ngày gần nhất
alu_repeats alu_repeats từ REPBASE
dbsts Những trình tự từ phần STS của GenBank + EMBL + DDBJ
chromosome Genomes và chromosomes hoàn chỉnh từ NCBI Reference
Sequence project
wgs Nhóm những trình tự của toàn bộ Genome Shotgun
env_nt Trình tự từ những mẫu thu được từ môi trường
2.4.3 Lựa chọn chương trình BLAST phù hợp
Đây là bước thao tác đầu tiên yêu cầu người phân tích phải xác định rõ chương trình BLAST nào sẽ được sử dụng Việc lựa chọn chương trình BLAST thích hợp cho một tìm kiếm phụ thuộc vào 3 yếu tố: Bản chất của trình tự sử dụng cho BLAST ; mục đích và cơ sở dữ liệu mà chương trình sử dụng
Các chương trình BLAST trên NCBI gồm:
blastn (nucleotide BLAST): So sánh trình tự DNA với cơ sở dữ liệu DNA
Trang 24blastp (protein BLAST): So sánh trình tự protein với cơ sở dữ liệu protein
blastx (translated BLAST): Dịch mã trình tự DNA thành 6 trình tự protein sử dụng
6 khung đọc có thể xảy ra, sau đó so sánh mỗi protein này với cơ sở dữ liệu protein tblastn (translated BLAST): Dịch mỗi trình tự DNA thành cơ sở dữ liệu gồm 6 protein có thể xảy ra, sau đó so sánh trình tự protein nhập vào với mỗi protein trong cơ sở
dữ liệu này
tblastx (translated BLAST): Sử dụng thuật toán phức tạp nhất, dịch mã DNA nhập và từ một cơ sở dữ liệu thành những nhóm 6 protein có thể xảy ra sau đó thực hiện tìm kiếm với những protein này
Bảng 2.3 Lựa chọn chương trình cho trình tự protein
Chiều dài Cơ sở dữ liệu Mục đích Chương trình
Nhận biết trình tự discontiguous megablast,
megablast, or blastn Tìm những trình tự
tương đồng
discontiguous megablast
or blastn
Tìm những trình tự tương đồng, từ Trace archive
Trace megablast, or Trace discontiguous megablast
Nucleotide
Tìm những trình tự protein giống với trình tự protein
mà trình tự đang xem xét
mã hóa trong cơ sở dữ liệu dịch mã từ nucleotide
Translated BLAST (blastx)
sở dữ liệu protein
Translated BLAST (tblastx)
7 – 20 bp Nucleotide
Tìm vị trí gắn primer hay bản đồ những motif ngắn gần nhau
Search for short, nearly exact matches
Trang 25Bảng 2.4 Lựa chọn chương trình cho trình tự nucleotide
Nhận biết hay tìm kiếm những trình tự protein tương đồng
Standard Protein BLAST (blastp) Tìm thành viên của một họ
protein hay xây dựng một ma trận tỷ số vị trí chuyên biệt
PSI-BLAST
Tìm những protein tương đồng theo một mẫu đã biết PHI-BLAST
Tìm những domain bảo tồn CD-search
(RPS-BLAST) peptide
Tìm những domain bảo tồn
và nhận biết các trình tự protein khác có cấu trúc domain tương tự
Conserved Domain ArchitectureRetrieval Tool (CDART)
15 hay dài
hơn
nucleotide
Tìm những protein tương đồng trong cơ sở dữ liệu dịch mã từ nucleotide
Translated BLAST (tblastn)
5 - 15 peptide Tìm những peptide motif Search for short,
nearly exact matches
2.4.4 Các bước thực hiện BLAST
Thực hiện một chương trình BLAST gồm 4 bước:
Bước 1: Chọn trình tự Trình tự có thể ở dạng FASTA hay accession number Bước 2: Chọn chương trình BLAST phù hợp
Bước 3: Chọn cơ sở dữ liệu
Bước 4: Chọn tham số Có thể chọn sinh vật, mở hay đóng chức năng filtering, thay đổi expect value, thay đổi kích cỡ chữ, thay đổi định dạng kết quả
2.5 Giới thiệu cây phát sinh loài
2.5.1 Khái niệm cây phát sinh loài
Cây phát sinh loài là sơ đồ hình cây miêu tả lịch sử tiến hóa của một nhóm các loài với những đặc tính khác nhau nhưng cùng có mối quan hệ họ hàng với nhau và
Trang 26cùng hình thành từ một tổ tiên chung trong quá khứ Trong một cây phát sinh loài, mỗi node bao gồm những thành viên có cùng một tổ tiên chung gần nhất, chiều dài của nhánh trong một số cây tương ứng với ước lượng thời gian Mỗi node tương ứng với một đơn vị phân loại (Kliman và Sheehy, 2008)
2.5.2 Cấu trúc cây phát sinh loài
Cây phát sinh loài gồm hai loại: cây có gốc (rooted tree) và cây không gốc (unrooted tree) Cả hai loại đều bao gồm những nhánh, node trong và node ngoài Chiều dài của nhánh có thể chỉ thời gian tiến hóa, khoảng cách di truyền node trong là HTU (hypothetical taxonomic units), node ngoài là OTU (operation taxonomic units) Những cây có gốc vừa chỉ con đường tiến hóa từ một tổ tiên chung tới những OTU và mối quan
hệ giữ những OTU trong khi cây không gốc chỉ cho biết mối quan hệ giữa các OTU
Cây phát sinh loài có thể được xây dựng từ những dữ liệu hình thái (ví dụ: màu
mỏ, số chân) hay dữ liệu phân tử (trình tự DNA và protein) Ngày nay, cây phát sinh loài thường dựa trên các dữ liệu phân tử, do dữ liệu phân tử có nhiều thuận lợi hơn so với các dữ liệu hình thái: những dữ liệu phân tử có thể được ghi nhận một cách rõ ràng, mỗi cá thể có thể cung cấp nhiều dữ liệu khác nhau
Hình 2.5 Các loại cây phát sinh loài a) Cây có gốc; b) Cây không gốc; A, B, C, là những
HTU ; D, E, F, G,H là những OTU (Chính Hoàng, 2005)
Cây có gốc có thể được tạo bằng cách thêm vào một outgroup trong dữ liệu Một outgroup là một OTU chứa những thông tin bên ngoài mà phân nhánh trước tiên trong cây phát sinh loài
Topology là trật tự của các node trên cây phát sinh loài Một vài yếu tố ảnh hưởng đến trật tự của các node trên cây phát sinh loài: Trình tự DNA hay Protein dùng trong phân tích; phương pháp áp dụng: Distance hay Parasimony; số OTU có trong alignment; thứ tự của các OTU trong alignment; sự lựa chọn một outgroup phù hợp
Trang 272.5.3 Một số lưu ý về cây phát sinh loài
Hiện nay chưa có ứng dụng lý thuyết hoặc thực tiễn của bất kì thuật toán nào được chấp nhận bởi cả cộng đồng khoa học
Việc ứng dụng các phần mền khác nhau với cùng một dữ liệu có khả năng cho những kết quả khác nhau và những thay đổi nhỏ của dữ liệu cũng có thể thay đổi lớn tới kết quả
Quan hệ được tạo ra từ dữ liệu trình tự thực chất thể hiện mối quan hệ giữa các gen, không luôn luôn thể hiện mối quan hệ giữa các sinh vật
Trình tự của một số gen hay một số dạng khác của dữ liệu trình tự có thể không
có cùng lịch sử tiến hóa với loài mà có những trình tự này
Những gen khác nhau tiến hóa với tốc độ khác nhau và luôn có khả năng xảy ra
sự di chuyển gen ngang (do lai giống, hay nhận trực tiếp DNA) (Chính Hoàng, 2005)
2.5.4 Các bước cơ bản để tiến hành nghiên cứu phát sinh loài dựa vào phân tử
Xác định mục tiêu, lấy mẫu sinh vật và họ gene
Chọn marker phân tử, tức gene hay protein cần đọc trình tự
Đọc trình tự, hiệu chỉnh trình tự
Sắp xếp thẳng hàng các trình tự
Chọn mô hình tiến hóa
Phân tích sự phát sinh chủng loại
Đọc cây tiến hóa
Kiểm tra cây tiến hóa
Chấp nhận kết quả hoặc quay lại bước 2
2.5.5 Chọn lựa phương pháp xây dựng cây phát sinh loài thích hợp
Hiện nay, không có phương pháp xây dựng cây phát sinh loài nào đảm bảo chắc chắn phản ánh đúng quan hệ tiến hóa của một dữ liệu trình tự Mặc dù đã có nhiều cố gắng để so sánh độ tin cậy của các phương pháp, tuy nhiên chưa có một mô hình thống
kê nào để so sánh những cây tạo ra từ những phương pháp khác nhau Mô hình sau có thể được áp dụng để lựa chọn phương pháp để dựng một cây phát sinh loài dựa trên kết quả sắp thẳng hàng nhiều trình tự (Chính Hoàng, 2005)
Trang 28Hình 2.6 Sơ đồ lựa chọn phương pháp tạo cây phát sinh loài (Chính Hoàng, 2005)
2.6 Tình hình nghiên cứu định danh Colletotrichum trên thế giới
Giống Colletotrichum là một trong những nấm gây bệnh cây trồng nguy hiểm
trên thế giới, việc định danh chính xác loài là yếu tố quan trọng để kiểm soát hiệu quả mầm bệnh hiệu quả Hiện nay đã có nhiều công trình nghiên cứu nhằm xác định các
loài Colletorichum gây bệnh ở nhiều nơi trên thế giới
Photita và cộng sự (2005), đã nghiên cứu đặc điểm hình thái và phân tử của
những loài Colletotrichum từ những cây trồng nhiệt đới tại Thái Lan, kiểm tra xem
liệu sự phân loại dựa trên các đặc điểm hình thái có giống với những phân tích trình tự
phân tử 34 dòng Colletotrichum spp được phân lập từ chuối, gừng, Euphatorium
thymifolia, đậu lành, nhãn, xoài, và Draceana sanderiana Vùng ITS1 – 5.8S – ITS2
được khuếch đại sử dụng cặp mồi ITS4 và ITS5 (White và cộng sự, 1990) Vùng trình
tự này được so sánh với cơ sở dữ liệu trên GenBank sử dụng chương trình BLAST
Trong nghiên cứu này hầu hết những dòng Colletotrichum từ cùng vật chủ với cùng
những đặc điểm hình thái được xác định là cùng loài khi sử dụng những dữ liệu phân
tử Những dòng Colletotrichum từ cùng vật chủ nhưng có đặc điểm hình thái khác
nhau được xác định là những loài khác nhau và điều này cũng đúng với những dữ liệu
phân tử Tuy nhiên có một dòng Colletotrichum từ chuối có những đặc điểm hình thái
giống với các dòng khác nhưng lại tách thành một nhóm riêng trong phân tích phát sinh loài Tóm lại, từ sự phân tích trình tự vùng ITS có thể cung cấp thêm những hiểu
biết về phân loại Colletotrichum nhưng việc sử dụng những phân tích phân tử sử dụng
những gene khác hay những phương pháp tốt hơn là cần thiết
Freeman và cộng sự (2000) thực hiện những phân tích phân tử những loài
Colletotrichum từ quả hạnh và những trái cây khác Những dòng Colletotrichum spp
Trang 29từ quả hạnh, lê tàu, dâu tây Israel và những dòng từ quần thể quả hạnh màu hồng tại
Mỹ được phân tích sử dụng nhiều phương pháp phân tử khác nhau và được so sánh với
định danh hình thái Những primer khuếch đại đặc hiệu bao gồm ITS4 – CaInt2 cho
C acutatum và ITS4 – CgInt cho C gloeosporioides, khuếch đại vùng ITS1 dùng cặp
mồi ITS1 – ITS4 Những primer đặc hiệu cho thấy những dòng từ lê tàu là thuộc loài
C gloeosporioides, những dòng quả hạnh Mỹ, dâu tây Israel là C.acutatum Tuy nhiên
những dòng từ quả hạnh Israel định danh hình thái là C gloeosporioides lại phản ứng với cặp mồi đặc hiệu cho C acutatum Những phân tích phân tử dựa trên Arbitrarily
primed polymerase chain reaction và A+T-rich DNA xác định những quần thể từ quả hạnh và dâu tây là tách biệt Phân tích trình tự vùng ITS 1 – 5.8S – ITS 2 cho thấy sự
tương đồng từ 97,03 – 98,72 % trong những dòng từ quả hạnh Israel, C acutatum từ quả hạnh Mỹ, và C acutatum từ dâu tây Israel Sự tương đồng của những quần thể trên với C gloeosporioides từ lê tàu là 92,42 – 92, 86 % Phân tích trình tự DNA trên
toàn vùng ITS phù hợp với cây phát sinh loài tạo ra từ vùng ITS1 của 14 loài
Colletotrichum khác nhau Mặc dù theo phân tích hình thái những dòng từ quả hạnh
Israel là đặc biệt nhưng dựa trên cây phát sinh loài thì quần thể này nằm cùng nhóm
với loài C acutatum
Jo Anne và các cộng sự (2005) nghiên cứu mối quan hệ di truyền và độ nhạy
của thuốc diệt nấm tới những dòng Colletotrichum graminicola từ cỏ mặt ở Bắc Mỹ
Quan hệ phát sinh loài của những dòng nấm từ những vùng khác nhau của Mỹ và Canada được đánh giá bằng trình tự vùng ITS-rDNA Để phân tích quan hệ phát sinh loài, trình tự ITS1-5.8S-ITS2 của DNA ribosome được khuếch đại dùng cặp mồi ITS1
- ITS4 Trong khi tất cả các phương pháp phân tích chỉ ra những dòng xâm nhiễm cỏ mặt là phân biệt với những dòng xâm nhiễm ngũ cốc thì chỉ với sự phân tích trình tự vùng ITS không thể chỉ ra mối quan hệ này Lịch sử tiến hóa của những loài
Colletotrichum xâm nhiễm cỏ mặt vẫn không rõ ràng, với giá trị bootstrap thấp trong
nhiều nhánh và sự mâu thuẫn khi những phương pháp khác nhau được sử dụng để tạo cây phát sinh loài Rõ ràng vùng ITS không có đủ tín hiệu về quan hệ phát sinh loài để đánh giá độc lập quan hệ giữa những phân loại có quan hệ gần, điều này thể hiện ở giá trị bootstrap thấp tại nhiều node trên cây phát sinh loài
F farr và cộng sự (2006) đã nghiên cứu những loài Colletotrichum trên
Agavaceae tại Mỹ Trình tự LSU và ITS trên rDNA được khuếch đại dùng cặp mồi
Trang 30LR0R và LR7; ITS1-F và ITS4 (White và cộng sự, 1990) Một cây phát sinh loài dựa trên sự kết nối trình tự ITS và LSU, sử dụng phương pháp maximum parsimony đã được xây dựng Những node trên cây này có giá trị bootstrap từ trung bình (50 – 70%)
đến cao (> 70 %) Colletotrichum agaves và C dracaenophilum là hai loài đặc hiệu đối với kí chủ và phân biệt với những loài khác trong giống Colletotrichum, điều này
phù hợp với quan sát trên cây phát sinh loài Cũng dựa trên cây phát sinh loài có thể
thấy C phormii có quan hệ gần với C acutatum
2.7 Tình hình nghiên cứu định danh Colletotrichum trong nước
Hiện nay trong nước cũng có nhiều công trình nghiên cứu nhằm định danh loài
Colletotrichum gây bệnh trên nhiều loại cây trồng khác nhau
Nghiên cứu một số biện pháp quản lý bệnh thán thư hại nho theo hướng sản xuất nho an toàn tại Ninh Thuận do KS Mai Văn Hào (Viện Nghiên cứu và Phát triển Cây bông) làm chủ nhiệm Đề tài được thực hiện trong 2 năm 2004 – 2005, phối hợp với CABI định danh được tác nhân gây bệnh thán thư trên cây nho tại Ninh Thuận là
do nấm Elsinoe ampelina và Colletotrichum gloeosporioides Trong đó,
Colletotrichum gloeosporioides xuất hiện và gây hại phổ biến Ngoài ra, đề tài cũng đã
chọn và khuyến cáo được các loại thuốc có khả năng phòng trừ được các nấm gây bệnh thán thư hại nho
Phân loài nấm Colletotrichum gây bệnh thán thư trên xoài và sầu riêng tại đồng bằng sông Cửu Long do Lê Hoàng Lệ Thủy và Phạm Văn Kim thực hiện (2005) Một
trăm lẻ năm chủng nấm gây bệnh thán thư trên xoài (73 chủng) và sầu riêng (32 chủng), được phân lập từ các mẫu bệnh thu thập tại các tỉnh Tiền Giang, Đồng Tháp, Vĩnh Long, An Giang, Sóc Trăng, Cần Thơ, Cà Mau và Trà Vinh; và được khảo sát các đặc tính sinh học Dựa trên đặc tính sinh học và bảng phân loài của Sutton (1980), Simmonds (1965), Mordue (1971), Swart (1999) và CABI (2003), đã xác định được
tên hai loài nấm là Colletotrichum acutatum và Colletotrichum gloeosporioides và một loài nấm còn lại chưa xác định được tên là Colletotrichum sp
Viện di truyền nông nghiệp đã thu thập được 90 mẫu bệnh thán thư trên quả, lá, cành cà phê tại Ba Vì và 21 mẫu bệnh thán thư trên quả, lá, cành cà phê tại Buôn Mê
Thuột Đã phân lập được 50 chủng nấm Colletotrichum tại Ba Vì và 5 chủng nấm
Colletotrichum tại Buôn Mê Thuột Dựa vào đặc điểm hình thái học và sử dụng đoạn
mồi đặc hiệu NMS1/NMS2 tại vùng tiểu ti thể (mtSSU) để phân loại nấm đến cấp độ
Trang 31loài đã nhận dạng được 32 dòng Colletotrichum từ quả cà phê tại hai vùng Ba Vì và Buôn Mê Thuột Trong đó có 31 dòng là C gloeosporioides , 1 dòng là C acutatum Riêng dòng C capsici được nhận dạng qua dạng bào tử hình trăng khuyết Đa dạng di truyền của 20 dòng C gloeosporioides trong đó 19 dòng từ Ba Vì và 1 dòng Buôn Mê
Thuột đã được phân tích dùng kỹ thuật RAPD