2. Đặc điểm của chi Begomovirus
4.2.3.2. So sánh trình tự 3 virus với các begomovirus đã công bố
Vì cả 3 mẫu virus Dudu31, Cachua89 và Cà chua100 gần gũi nhất với ToLCHV trong tìm kiếm BLAST nên chúng tôi đã so sánh chúng với nhau. Ngoài ra, các virus có khả năng hình thành các sự kiện tái tổ hợp với 3 virus này cũng được so sánh.
Các trình tự so sánh bao gồm toàn bộ bộ gen, vùng IR, ORF V1/ CP và ORF C1/ Rep. Các trình tự được căn trình tự đa chuỗi dùng tùy chọn ClustalV (MegAlign, Lasergen) theo hướng dẫn của Fauquet và cộng sự (2008). Kết quả so sánh được trình bày ở Bảng 4.6.
Bảng 4.6. So sánh trình tự của 3 virus Dudu31, Cachua89 và Cachua100 với một số begomovirus
Mức đồng nhất/tương đồng (%) Virus trên GenBank
Genome (nt) IR (nt) CP (nt) CP (Pr) Rep (nt) Rep (Pr) Dudu31 ToLCHV[HaNHK8]-FN434083 95.9 91.8 95.3 96.5 96.6 97.8 Cachua89 93.7 83.3 98.4 97.3 90.8 92 Cachua100 86.3 64.3 91.3 96.5 88.6 91.7 ToLCVV-AF264063 83.1 68.6 92.1 95.3 86.2 87 AGLCV[G52]-AJ851005 82.9 77.2 90.9 96.5 77.2 83.1 TYLCVNVDQ641697, 82.4 69.7 92.7 95.3 76.6 82.8 PaLCuCNV[G43]-AJ876548 82.3 61.7 92 96.9 80.7 84.5 TYLCTHV-AY514630 77.4 67.5 72.5 78.1 85.3 87.5 Cachua89 Dudu31 93.7 83.3 98.4 97.3 90.8 92 ToLCHV(HaNHK8)-FN434083 93 82.2 96.5 99.2 91.2 92.2 Cachua100 87.7 71 92 99.2 89.6 92 ToLCVV-AF264063 86.3 83.2 93.1 98.1 89.4 90.6 PaLCuCNV(G43)-AJ876548 84.6 72 92.7 99.6 81.9 85 AGLCV(G52)-AJ851005 83.4 79 91.7 99.2 78.9 83.4 TYLCVNV-DQ641697, 83.3 71.9 93.6 98.1 77.6 81.7 TYLCTHV-AY514630 78.9 73.1 73.2 80.5 87.9 90.3 Cachua100 Cachua89 87.7 71 92 99.2 89.6 92 ToLCHV(HaNHK8)-FN434083 87.6 65.1 91.3 98.4 90.4 92.2 PaLCuCNV(G43)-AJ876548 87 92 95.7 99.6 84.5 86.7 Dudu 31 86.3 64.3 91.3 96.5 88.6 91.7 AGLCV(G52)-AJ851005 84.9 60.3 97.4 99.2 77.3 82.8 ToLCVV-AF264063 82.6 73.5 90.5 97.7 86.1 87.5 TYLCTHV-AY514630 80 76.5 71.2 80.1 89.4 92.5 TYLCVNV- DQ641697 78.9 64 90.1 98.1 74.5 80.6
Ghi chú: nt: mức nucleotide; Pr: mức protein. Về thuật ngữ, “mức đồng nhất (identity)” dùng để
so sánh trình tự nucleotide còn “mức tương đồng (similarity)” dùng để so sánh trình tự amino acid.
So sánh toàn bộ bộ gen của 3 mẫu virus với nhau thấy mẫu Dudu31 và Cachua89
đồng nhất 93.7 % chứng tỏ chúng là thành viên của cùng 1 loài (ngưỡng loài là 89 %
đồng nhất trên toàn bộ gen). Mẫu Cachua100 có mức đồng nhất nucleotide với mẫu Dudu31 và Cachua89 lần lượt là 86.3 và 87.7 % chứng tỏ mẫu Cacchua100 thuộc 1 loài khác.
So sánh mẫu Dudu31 và Cachua89 với 6 virus gần gũi đã công bố sẵn có trên GenBank thấy 2 mẫu này có mức đồng nhất rất cao trên toàn bộ bộ gien (lần lượt 95.9 và 93 %) với cùng một virus ToLCHV (isolate HaNHK8, FN434083) phân lập từ cà chua tại
đảo Hải Nam (Trung Quốc) mới được công bố gần đây (Zhang và cộng sự, 2010). Mức
độ đồng nhất cao này vượt xa ngưỡng phân biệt loài (89 %) chứng tỏ 2 mẫu virus Dudu31 và Cachua89 là thành viên của loài Tomato leaf curl Hainan virus. Với các virus còn lại, 2 virus này có mức đồng nhất trình tự trên toàn bộ bộ gen <87 %.
So sánh trình tự gen CP thấy Dudu31 và Cachua89 có mức đồng nhất nucleotide và mức tương đồng amino acid rất cao với với các virus khác, cao nhất với ToLCH- HaNHK8 (95.3 – 98.4 % ở mức nucleotide và 96.5 – 97.3 ở mức amino acid). Thậm chí, khi so sánh với 4 virus thuộc các loài khác là ToLCVV, AGLCV, TYLCVNV và PaLCuCNV thì các giá trịđồng nhất/tương đồng của gen CP của 2 mẫu virus cũng rất cao (đều > 90 % ở cả 2 mức nucleotide và amino acid, Bảng 4.6).
So sánh trình tự gen Rep cho thấy Dudu31 và Cachua 89 có mứa đồng nhất/tương
đồng cao với ToLCH-HaNHK8 (91.2-96.6 % ở mức nucleotide và 92.0 – 97.8 % ở mức amino acid). Tuy nhiên, khi so với các virus khác không cùng loài thì các giá trị so sánh nhìn chung <90 % ở cả 2 mức.
So sánh trình tự IR thấy cả 2 mẫu Dudu31 và Cachua 89 có mức đồng nhất với các virus khác thấp hơn nhiều. Ngoại trừ Dudu31 có mức đồng nhất IR bằng 91.8 % với ToLCH-HaNHK8 thì tất cả các giá trị còn lại của cả 2 virus đều <83.3 % khi so với các virus khác
Đối với mẫu Cachua100, quyết định vị trí phân loại của mẫu này là không dễ vì nó có mức đồng nhất nucleotide trên toàn bộ bộ gen gần xấp xỉ ngưỡng 89 % (87.7 % với mẫu Cachua89 và 87.6 % với mẫu ToLCHV-HaNHK8 và 87 % với PaLCuCNV-G43).
So sánh gen CP thấy mẫu Cachua100 cũng có mức đồng nhất/ tương đồng rất cao với nhiều virus GenBank. Ngoại trừ đối với TYLCVNV thì CP của Cachua100 đồng nhất/tương đồng > 90 % so với các virus còn lại (Bảng 4.6). Đáng chú ý, Cachua100 có mức đồng nhất/tương đồng CP cực kỳ cao với AGLCV(G52) (lần lượt 97.4 % và 99.2 %, Bảng 4.6), trong khi chỉ có mức đồng nhất 84.9 % trên cả bộ gen. Kết quả này gợi ý đã có một sự kiện tái tổ hợp ở gen CP liên quan đến 2 virus.
So sánh gen Rep thấy Cachua100 có mức đồng nhất/tương đồng cao nhất với Cachua89 (89.6 và 92 %), ToLCHV-HaNHK8 (90.4 và 92.2 %), và TYLCTHV (89.4
và 92 %). Đáng chú ý là mức đồng nhất trên toàn bộ bộ gen giữa Cachua100 và TYLCTHV khá thấp, chỉ 80 %. Sự không tương xứng này gợi ý có tái tổ hợp liên quan
đến 2 virus.
So sánh trình tự IR thấy mức đồng nhất của Cachua100 cũng thấp so với các virus khác. Ngoại trừđối vớiPaLCuCNV(G43) có mức đồng nhất IR bằng 92 % thì đối với các virus khác, giá trị này của Cachua100 chỉ tối đa 76.5 % (với TYLTHV).).
Nhìn chung so sánh các vùng gen thấy 1 xu thế chung là vùng IR có mức độ đồng nhất thấp hơn nhiều so với 2 vùng mã hóa CP và Rep thậm chí của các loài khác nhau.
Điều này phản ánh một thực tế là CP và Rep là các protein đa chức năng, chịu trách nhiệm cho các chức năng sinh học quan trọng của begomovirus như tái sinh, vận chuyển, lắp ráp virion, tương tác với protein ký chủ, lan truyền qua vector. Hậu quả là các đột biến có ý nghĩa (làm thay đổi trình tự amino acid) trên 2 gen này phần lớn là các đột biến gây chết, làm mất ưu thế thích nghi của virus. Nói cách khác đây là 2 gen của begomovirus chịu áp lực chọn lọc rất cao (Rojas và cộng sự, 2005). Trái lại, ở vùng IR, ngoài đoạn chứa ori (chiếm khoảng 40 % kích thước) cần cho chức năng tái sinh của virus thì các
vùng còn lại dường như chịu áp lực chọn lọc thấp. Đặc điểm “mềm dẻo” này của vùng IR làm tăng khả năng thích nghi của begomovirus vì nhóm virus này có 2 kiểu tái sinh: kiểu 1 là theo cơ chế vòng lăn truyền thống (RCR, rolling circular replication) và kiểu 2 mới
được chứng minh gần đây (Alberter và cộng sự, 2005; Jeske và cộng sự, 2001; Preiss and Jeske, 2003) là theo cơ chế phụ thuộc tái tổ hợp (RDR, recombination dependent replication). Nhiều bằng chứng cho thấy các vùng nằm 2 đầu của IR là các điểm nóng “hot pot” cho quá trình tái sinh theo cơ chế phụ thuộc tái tổ hợp xảy ra và các đột biến ở 2
đầu vùng IR cho phép các virus khác nhau có thể dễ dàng tái tổ hợp nếu chúng cùng nhiễm trong tế bào (Rojas và cộng sự, 2005).