2. Đặc điểm của chi Begomovirus
4.2. Đặc trưng phân tử của ba mẫu virus Cachua100, Cachua89 và Dudu31
Tổ chức bộ gen của ba mẫu virus được thực hiện bằng chương trình Vector NTI Suite 7 và đươc trình bày ở Bảng 4.4 và Hình 4.7.
Bộ gen của cả 3 virus được giải trình tựđều có kích thước và cấu trúc tương tự như
các virus thuộc chi Begomovirus nhóm Cựu thế giới. Toàn bộ bộ gen có kích thước khoảng 2.7 kb (2740 nt - Cachua100; 2743 nt - Cachua 89; 2748 nt – Dudu31). Trình tự
bắt đầu tại vị trí nucleotid thứ 8 (A) của chuỗi bảo thủ TAATATTAC (là vị trí cắt và nối bởi protein Rep trên DNA genome trong quá trình tái bản theo cơ chế vòng lăn).
Sử dụng phần mềm VectorNTI để tìm kiếm các ORF trên cả 3 phân tử genome, chúng tôi thấy trên mỗi phân tử có rất nhiều ORF khác nhau xắp xếp trên cả 2 chiều. Tuy nhiên, mỗi phân tử đều chứa 6 ORF đặc trưng cho bộ gen của các begomovirus gồm 2 ORF trên sợi virus (V2, V1, cùng chiều kim đồng hồ) và 4 ORF trên sợi bổ sung với sợi virus (C4, C1, C2, C3, ngược chiều kim đồng hồ) (Hình 4.7).
Trên sợi virus, ORF V2 (mã hóa protein V2) của cả 3 virus đều có kích thước 348 nt (116 aa). Phía đầu 3’ của ORF V2 là ORF V1 (mã hóa cho protein vỏ CP). ORF V1 của cả 3 virus đều có kích thước 771 nt (257 aa). Tương tự như của các begomovirus khác, 2 ORF này gối lên nhau 187 nt.
Trên sợi bổ sung, ORF lớn nhất là ORF C1 (mã hóa protein Rep), đều có kích thước bằng 1083 nt (361 aa) cho cả 3 virus. ORF nhỏ nhất là ORF C4 (mã hóa protein C4) nằm gọn trong đầu 5’ của ORF C1 với kích thước giống nhau cho cả 3 virus là 291 nt (97 aa) (Hình 4.7). Hai ORF còn lại là C2 (mã hóa protein TrAP) và C3 (mã hóa protein REn) đều có kích thước bằng nhau là 402 nt (134 aa). Như một qui luật chung đối với tất cả các beomovirus, ORF C4 và ORF C2 luôn nằm trên một khung đọc mã (c1, c2, c3 lần lượt đối với Dudu31, Cachua89 và Cachua100).
Bộ gen của 3 virus đều có một vùng liên gen không phiên mã (IR, Intergenic Region) kích thước khoảng 270 nt có vị trí tính từđầu 5’ của ORF C1 tới đầu 5’ của ORF V2 tương tự như IR của các begomovirus khác. IR có chứa nguồn gốc tái bản (ori, origin of replication) với nhiều dấu hiệu quan trọng như trình bày ở phần 4.2.2.1.
Bảng 4.4.Đặc điểm bộ gen của 3 mẫu begomovirus
Genome/ORF Chỉ tiêu Đu đủ31 Cà chua89 Cà chua100
DNA genome Kích thước (nt) 2748 2743 2740
Vị trí (từ nt tới nt) 2600 - 131 2600 - 131 2596 - 127 IR Kích thước (nt) 280 275 273 Vị trí (từ nt tới nt) 292 - 1062 292 - 1062 288 - 1058 Kích thước (nt) 771 771 771 V1(CP) Khung đọc mã d1 d3 d3 Vị trí (từ nt tới nt) 132 - 479 132 - 479 128 - 475 Kích thước (nt) 348 348 348 V2 (V2) Khung đọc mã d3 d3 d2 Vị trí (từ nt tới nt) 1517 - 2599 1517 - 2599 1513 - 2595 Kích thước (nt) 1083 1083 1083 C1(Rep) Khung đọc mã c3 c3 c2 Vị trí (từ nt tới nt) 1210 - 1611 1210 - 1611 1206 - 1607 Kích thước (nt) 402 402 402 C2 (TrAP) Khung đọc mã c1 c2 c3 Vị trí (từ nt tới nt) 1065 - 1466 1065 - 1466 1061 - 1462 Kích thước (nt) 402 402 402 C3 (Ren) Khung đọc mã c2 c3 c1 Vị trí (từ nt tới nt) 2152 - 2442 2152 - 2442 2148 - 2438 Kích thước (nt) 291 291 291 C4 (C4) Khung đọc mã c1 c2 c3
Hình 4.7: Tổ chức bộ gen của 3 mẫu virus. Khung đọc mã d (direct) trên sợi virus còn c (complementary) trên sợi bổ sung.
Cachua100 2740 nt V1 (CP) 288 – 1058 d3 V2 (V2) 128 – 475 d2 C1 (Rep) 1513 – 2595 c2 C2 (TrAP) 1206 – 1607 c3 C3 (REn) 1061 – 1462 c1 C4 (C4) 2148 – 2438 c3 IR Cặp tóc Cachua89 2743 nt V1 (CP) 292 – 1062 d1 V2 (V2) 132 – 479 d3 C1 (Rep) 1517 – 2599 c1 C2 (TrAP) 1210 – 1611 c2 C3 (REn) 1065 – 1466 c3 C4 (C4) 2152 – 2442 c2 IR Cặp tóc Dudu31 2748 nt V1 (CP) 292 – 1062 d1 V2 (V2) 132 – 479 d3 C1 (Rep) 1517 – 2599 c3 C2 (TrAP) 1210 – 1611 c1 C3 (REn) 1065 – 1466 c2 C4 (C4) 2152 – 2442 c1 Cặp tóc IR
4.2.2. Phân tích các motif chức năng trên bộ gen của 3 mẫu virus
Gen Rep, gen CP và vùng IR chiếm gần 80 % bộ gen của begomovirus. Đây cũng là các vùng chứa nhiều dấu hiệu (motif) quan trọng liên quan tới tái sinh, tái tổ hợp, đặc hiệu vector và xâm nhiễm của begomovirus. Vì vậy chúng tôi tiến hành phân tích 3 vùng này của ba mẫu virus.
4.2.2.1. Phân tích vùng liên gen IR của 3 mẫu virus
Vùng liên gen (IR) của begomovirus chứa một vùng rất quan trọng liên quan đến sự tái bản của begomovirus gọi là vùng ori (origin of replication). Vùng ori bao gồm:
(i) một cấu trúc kẹp tóc (hairpin), cũng thường được gọi là cấu trúc thân-thòng lọng (stem-loop), với phần thân là 2 chuỗi đối song giàu GC bao quanh phần đầu dạng vòng giàu AT chứa một chuỗi 9 nt TAATATTAC giống nhau ở tất cả các begomovirus
được phát hiện cho tới nay (Hình 4.8 A). Vị trí TA cuối cùng (đóng hộp) của chuỗi bất biến TAATATTAC chính là nơi protein Rep của begomovirus cắt và nối sợi DNA của virus trong quá trình tái sinh.
(ii) một vùng liên kết protein Rep nằm ở thượng lưu của cấu trúc kẹp tóc (Hình 4.8 A). Vùng này chứa nhiều dấu hiệu như hộp TATA và quan trọng nhất là các chuỗi lặp gọi là iteron (iterated sequences) – vị trí mà protein Rep của virus sẽ liên kết để khởi đầu quá trình tái bản (Hình 4.8 B). Các chuỗi iteron thường chứa 2 - 4 gốc G. Trình tự, số lượng, cách xắp xếp và vị trí tương đối với nhau của các chuỗi iteron nhìn chung đặc hiệu cho mỗi begomovirus (Hình 4.8 C) và tương ứng với trình tự aa phần đầu amin của protein Rep.
Phân tích vùng IR của 3 begomovirus trong nghiên cứu này thấy chúng đều chứa 1 vùng ori với các chuỗi điển hình cho begomovirus gồm (i) một cấu trúc kẹp tóc dài 33 nt GCGGCCATCCGTATAATATTACCGGATGGCCGC chứa chuỗi bất biến TAATATTAC ở phần đầu giống như của các begomovirus khác (Hình 4.8 D, E, F).
Khi phân tích các chuỗi iteron, chúng tôi thấy mẫu Dudu31 có 2 chuỗi iteron với trình tự GGGTC cách nhau 30 nt (Hình 4.8 D). Hai mẫu Cachua89 và Cachua 100 có
Hình 4.8. (A) Sơđồ vùng ori của begomovirus (Fontes và cộng sự, 1994). (B) Liên kết đặc hiệu của protein Rep trên vùng ori để khởi đầu quá trình tái bản bộ gen begomovirus (Luque và cộng
sự, 2002). (C) Minh họa trình tự và cách xắp xếp iteron của một số begomovirus (Arguello- Astorga, 1994). (D), (E), (F) là vùng IR của 3 virus Dudu31, Cachua89 và Cachua100 với các cấu
trúc và chuỗi chức năng được đánh dấu.
vùng ori đồng nhất chứa 3 chuỗi iteron với trình tự GGTGT, trong đó cụm 2 iteron ngay sát đầu 5’ của hộp TATA cách chuỗi iteron còn lại 22 nt. Ngoài ra, ori của 2 virus này còn có 1 chuỗi iteron có trình tự đảo (ACACC) ở ngay sau đầu 3’ của hộp TATA (Hình 4.8 E, F).
A B C Trình tự vùng IR của Dudu31
GTTGACTTGGTCAATCGGGTCCTCTCAAACTTAGCTATGCAATCGGGGAATGGGTCCTTATTTATATGTGAGGACCTAAATGGCACAATTG
TAAATAATCATATTAAATCCAAAATTCAAATTGGTAAAGCGGCCATCCGTATAATATTACCGGATGGCCGCGATTTTTTTTACATGGTCCC
CACCACTAATAAATGTTCTCCACTTAGATCGCTCCCTCAAAGCCTATTTAATTCAAATCCATTATATATACTTGGTCCCCAAGTACTCACT
TTAAAAT
D Trình tự vùng IR của Cachua89
TGACTGGTCAATCGGTGTCTCTTAAACTTGGCTATGCAATTGGTGTCTGGTGTCTTATTTATATGTGGACACCAAATGGCATTATCGTAAT TCCTAAAAGAAATTCAAAATTCAAATTGGTAAAGCGGCCATCCGTATAATATTACCGGATGGCCGCGATTTTTTTTACATGGTCCCCACCA
CTAACAAATGTCCTCCACTTAGAACGCTCCCTCAAAGCCTATTTAATTCAAATCCAT TATA TATACTTGGTCCCCAAGTACTCACTTTAAA
AT
E Trình tự vùng IR của Cachua100
TGACTGGTCAATCGGTGTCTCTCAAACTTGGCTATGCAATTGGTGTCTGGGGTCTTATTTATATGTGGACACCAAATGGCATTAATGTAAT TATGATTATGAAATTCAAAATTCAAATTCCAAAAGCGGCCATCCGTATAATATTACCGGATGGCCGCGATTTTTTTTAAAGTGGTCCCCGC
ATGCGCTCCTGCCCAATCCTATCCACTCCTCAAAGCTAAATTATTAATTTGTCTCCTATATAACTTGGTCCCCAAGTAGTCACGTCAAAC
4.2.2.2. Phân tích protein Rep của 3 mẫu virus
Protein Rep (Replication associated protein) là một protein lớn nhất của begomovirus và là một protein đa chức năng, trong đó các chức năng quan trọng nhất đều liên quan đến quá trình tái bản.
Nhận biết và liên kết DNA. Để khởi đầu quá trình tái bản, protein Rep cần phải nhận biết và liên kết với vùng ori. Tính đặc hiệu của Rep trong quá trình trình nhận biết và liên kết đã được chứng minh liên quan tới các chuỗi iteron như trình bày ở phần 4.2.2.1 và đầu N của Rep. Đầu N của protein Rep chứa một chuỗi X-nX-2X-1FX1X2X3
(với X-n là aa đầu tiên của protein còn F là aa bất biến) gọi là chuỗi nhận biết iteron IRD (Interon-Related Domain) (Argüello-Astorga & Ruiz-Medrano, 2001).
Phân tích chuỗi IRD của cả 3 mẫu virus thấy có sự khác nhau rõ rệt. Chuỗi IRD của Dudu31 là MPPPKKFLIN còn của 2 mẫu Cachua89 và Cachua100 đều giống nhau với trình tự là MAPPNKFRIN (Hình 4.9.C). Đối chiếu thấy trình tự của các chuỗi IRD này phù hợp với trình tự của các chuỗi iteron và tương ứng với phân loại trình tự
IRD/iteron của Argüello-Astorga & Ruiz-Medrano (2001).
Cắt và nối DNA. Protein Rep không phải là một polymerase nhưng có hoạt tính endonuclease và ligase và đóng vai trò cực kỳ quan trọng trong quá trình tái bản bộ gen begomovirus. Sau khi liên kết vào vùng ori, Rep sẽ cắt giữa nucleotides số 7 và 8 trên chuỗi bất biến (TAATATT7OH-PA8C) để khởi đầu quá trình tổng hợp liên tục sợi virus theo cơ chế vòng lăn. Sợi virus hình thành sẽ được cắt và nối lại để tạo bộ gen virus hoàn chỉnh. Vùng liên quan đến chức năng này là phần đầu N (khoảng 1/3 – 1/2 chiều dài). Ba motif chức năng bảo thủ cao ở vùng này là motif I (FLTY), motif II (HLH) và motif III (DVKAYMDKD). Trong 3 motif này, motif I và II là bất biến còn motif III chứa gốc Y bất biến cần cho cả hoạt tính cắt và nối (Laufs và cộng sự, 1995; Orozco và cộng sự, 1997) (Hình 4.9. A, B).
Hình 4.9. (A) Sơđồ các vùng chức năng của begomovirus (Hanley-Bowdoin và cộng sự, 1999). (B) Bốn motif liên quan đến hoạt tính cắt – nối DNA và liên kết ATP của protein Rep của begomovirus (Laufs và cộng sự, 1995). (C) là protein Rep của 3 virus Dudu31, Cachua89 và Cachua100 với các chuỗi chức năng được đánh dấu mầu và các gốc aa bất biến được đóng hộp.
Như trình bày ở Hình 4.9.C, phần đầu N của protein Rep của 3 virus đều chứa 3 motif I, II và III giống như của các begomovirus khác.
A B
IRD Motif I Motif II
Dudu31 MPPPKKFLINAKNYFLTYPHCSLSKEEALSQLLALTTPTNKLFIRICRELHEDGSPHLHV 60 Cachua89 MAPPNKFRINAKKYFLTYPHCSLTKEEALSQLKNLETPVNKLFIRICREFHEDGTPHLHV 60 Cachua100 MAPPNKFRINAKNYFLTYPHCSLTKEEALSQIKALETPTNKLFIRICRELHEDGSPHLHV 60 Motif III Dudu31 LIQFEGKFKCQNNRFFDLVSPTRSAHFHPNIQSAKSSTDVKAYMDKDGGVIDHGVFQIDG 120 Cachua89 LIQFEGKFQCKNQRFFDLTSPSRSAHFHPNIQAAKSSTDVKSYMDKDGDVLDHGLFQIDG 120 Cachua100 LIQFEGKFQCRNQRFFDLISQTRSAHFHPNIQGAKSSTDVKTYMEKDGDVLDHGVFQIDG 120 α Helix 4 Dudu31 RSARGGCQSANDAYAEAINSGSKATALNILREKAPKDFVLQFHNLNSNLDRIFTPPMEVY 180 Cachua89 RSARGGCQSANDAYAEAINSGSKTSALNILREKAPKDYVLQFHNLNNNLDRIFTPPMEVY 180 Cachua100 RSARGGCQSANDAYAEAINSGSKASALNILREKAPKDFVLQFHNLNSNLDRIFTPPIEEY 180 (P-loop) Dudu31 VSPFSSSSFDRVPEELEEWAAENVVSAAARPLRPVSIVIEGDSRTGKTMWARSLGPHNYL 240 Cachua89 VSPFSSSSFDRVPEELEEWAAENVVSAAARPLRPISIVIEGDSRTGKTMWARSLGPHNYL 240 Cachua100 ISPFSSSSFDQVPEELDEWAIENVVSAAARPLRPVSIVIEGDSRTGKTMWARSLGPHNYL 240 Dudu31 CGHLDLSPKVYSNDAWYNVIDDVDPHYLKHFKEFMGAQRDWQSNTKYGKPVQIKGGIPTI 300 Cachua89 CGHLDLSPKVYNNDAWYNVIDDVDPHYLKHFKEFMGAQRDWQSNTKYGKPVQIKGGIPTI 300 Cachua100 CGHLDLSPKVYSNDAWFNVIDDVDPHYLKHFKEFMGAQRDWQSNTKYGKPVQIKGGIPTI 300 Dudu31 FLCNPGPNSSYKEFLEEEKNSALKNWAIKNAIFVTLQVALYSGSYQGATPQRRESNEETES 361 Cachua89 FLCNPGPNSSYKEFLEEEKNSALKNWAIKNAIFVTLQGALYSGSYQGATPQRQESNEETES 361 Cachua100 FLCNPGPNSSYKEFLDEEKNSALKNWAIKNAIFVTLQGTLYSGSYQGATPQRQESYEETES 361 C
Tương tác với các yếu tố ký chủ liên quan đến bộ máy tái bản. Quá trình tái bản của begomovirus xảy ra trong nhân tế bào, kể cảở các tế bào không phân chia. Do vậy, sau khi nhiễm vào tế bào, begomovirus phải khởi động bộ máy tái sinh của tế bào. Một trong các protein của tế bào ký chủ thực vật điều khiển chu kỳ tế bào là pRBR (plant retinoblastoma-related protein) - chịu trách nhiệm chuyển chu kỳ tế bào từ pha G1 sang pha S (pha tổng hợp). Protein Rep của TYLCV đã được chứng minh tương tác với pRBR thông qua 1 motif xoắn α (α helix) nằm ở phần đầu N có trình tự 11 nt KEEALQIIREKI (Argüello-Astorga và cộng sự, 2004).
Dùng phương pháp Chou-Fasman (phần mềm Protean, Lasergen), chúng tôi đã tìm
được chuỗi xoắn α tương tự nhau ở cả 3 virus là KATALNILREKA (Dudu31), KTSALNILREKA (Cachua90) và KATALNILREKA (Cachua100) trong đó gốc A (đóng hộp) là bất biến đối với nhiều begomovirus khác còn 2 gốc gạch chân là khác nhau trong 3 virus này (Hình 4.9.C).
Hoạt tính ATPase. Trong qua trình tái bản, Rep của begomovirrus cũng cần năng lượng. Ở phần đầu C của Rep có một motif tương tự motif P-loop của các protein thủy phân NTP. Desbiez và cộng sự (1995) đã chứng minh motif P-loop (GXXXXGKT230) giúp Rep của Tomato Golden mosaic virus (TGMV) liên kết và thủy phân ATP của tế bào ký chủ.
Phân tích phần đầu C của Rep đã phát hiện một chuỗi P-loop giống nhau ở cả 3 virus với trình tự GDSRTGKT và nằm ở vị trí 221-228 tính từ đầu N của Rep (Hình 4.9.C)
4.2.2.3. Phân tích protein CP của 3 mẫu virus
CP (Coat Protein) của begomovirus cũng là một protein đa chức năng với 3 chức năng quan trọng nhất là lắp ráp thành phân tử virus, lan truyền qua vector, nhập nhân tế
bào ký chủ.
Lắp ráp phân tử. Một trong các chức năng quan trong nhất của CP là tạo thành vỏ bọc của phân tử virus. Để hoàn thành chức năng này, CP phải có khả năng liên kết với nhau (liên
kết CP-CP). Các nghiên cứu cho thấy, phần đầu N của 1 phân tử CP này sẽ liên kết với phần
đầu C của 1 phân tử CP khác (Hallan và Gafni, 2001). Ngoài ra, 1 số gốc aa nằm ở phần trung tâm của CP cũng cần cho liên kết CP-CP (Noris và cộng sự, 1998).
Đối với 3 virus trong nghiên cứu này, 2 gốc K (đánh dấu ‡) và T (đánh dấu ↓) như
trình bày trên Hình 4.10. nằm ở vùng trung tâm tương ứng với 2 gốc aa đã được chứng minh cần cho liên kết CP-CP của TYLCV (Noris và cộng sự, 1998), trong đó nếu gốc K bịđột biến sang P có thể làm biến đổi cấu trúc thứ cấp của CP dẫn tới mất khả năng liên kết CP-CP và hậu quả là không hình thành phân tử virus.
Lan truyền qua vector. Các begomovirus lan truyền ngoài tự nhiên nhờ bọ phấn (B. tabaci) theo kiểu bền vững tuần hoàn có nghĩa virus phải được hút qua vòi, vào ruột, vào xoang cơ thể, quay trở lại tuyến nước bọt. Vùng CP liên quan đến khả năng lan truyền qua bọ
phấn của begomovirrus đã được chứng minh nằm ở vùng trung tâm (vị trí khoảng từ 120 – 180 aa) (Harrison và cộng sự, 2002).
So sánh với các nghiên cứu đã công bố (Harison và cộng sự, 2002), các gốc aa quan trọng qui định khả năng lan truyền qua bọ phấn trên vùng trung tâm CP của 3 virus, như trình bày trên Hình 4.10, gồm K (đánh dấu ‡), N, F, D, Q, L (đánh dấu ▼). Tất cả các gốc này đều tương tự với các gốc tương ứng của phần lớn các begomovirus khác. Gây đột biến ở các vị trí này có thể làm mất hoặc phục hồi khả năng lan truyền qua bọ phấn của begomovirus (Noris và cộng sự, 1998; Kheyr-Pour và cộng sự, 2000; Hohnle và cộng sự, 2001).
Nhập nhân tế bào ký chủ. Các begomovirus là các virus DNA, vì vậy, quá trình tái sinh bộ gen virus phải được thực hiện trong nhân tế bào ký chủ. Ngay khi xâm nhập được vào tế bào ký chủ, protein duy nhất của virus có mặt là CP, và do đó nó tham gia vào việc vận chuyển DNA của virus vào trong nhân thông qua lỗ màng nhân. Phức hợp DNA-CP của virus phải được liên kết với các phân tử vận chuyển trung gian của tế bào ký chủ gọi là karyopherins. Để được các phân tử karyopherin nhận biết và liên kết, protein virus phải có các dấu hiệu nhập nhân (NLS, Nuclear Localizing Signals). Dấu hiệu nhập nhân NLS của phần lớn protein hoạt động trong tế bào thực vật có cấu trúc đặc trưng gồm 2 chuỗi aa kiềm (K/R) cách nhau bởi 1 số aa (không nhỏ hơn 4) (Gafni và Epel, 2002). Đối với các
begomovirus, các dấu hiệu NLS này đã được xác định nằm cảở 3 vùng (đầu N, trung tâm và
đầu C) (Kunik và cộng sự, 1998; Unseld và cộng sự, 2001).
Tìm kiếm trên CP của 3 virus đã cho thấy có 5 vùng NLS giàu aa kiềm (K/R) (Hình 4.10). Hai vùng NLS1 (KR) và NLS2 (KVR/PRR) đầu N cách nhau bởi 8 aa có trình tự và vị
trí giống 2 NLS của Tomato yellow leaf curl virus (TYLCV) (Kunik và cộng sự, 1998). Đối với TYLCV, 2 NLS này là đủ cho chức năng nhập nhân của CP.
Ba dấu hiệu nhập nhân còn lại, NLS3 (RPMYRK, phần đầu N), NLS4 (RVGKRFCVK, phần trung tâm) và NLS5 (RKFMK, phần đầu C) cũng được tìm thấy trên CP của cả 3 virus (Hình 4.10). Như đã được chứng minh đối với CP của African cassava mosaic virus (ACMV), NLS3 có tác dụng bổ trợ NLS1 và NLS2 cho chức năng nhập nhân còn NLS4 và NLS5 là các dấu hiệu nhập nhân độc lập (Unseld và cộng sự, 2001). NLS1 NLS2 NLS3 Dudu31 MPKRPADIVIPTPASKVPRRLNFDSPYASRAAAPTVLVTNKRRSWVNRPMYRKPRMYRTY 60 Cachua89 MSKRPADIVISTPASKVRRRLNFDSPYASRAAAPTVLVTNKRRSWVNRPMYRKPRMYRMY 60 Cachua100 MSKRPADIVISTPASKVRRRLNFDSPYVSRAAAPTVLVTNKRRSWVNRPMYRKPRMYRMY 60 NLS4 Dudu31 KSPDVPRGCEGPCKVQSYEQRHDVEHVGKVICVSDVTRGNGLTHRVGKRFCVKSVYVLGK 120 Cachua89 KSPDVPRGCEGPCKVQSYEQRHDVAHVGKVICVSDVTRGNGLTHRVGKRFCVKSVYVLGK 120 Cachua100 KSPDVPRGCEGPCKVQSYEQRHDVAHVGKVICVSDVTRGNGLTHRVGKRFCVKSVYVLGK 120 ‡▼ ↓ ▼ ▼ ▼ ▼
Dudu31 IWMDEKIKTKNHTNTVMFFLVRDRRPFGTPQDFGQVFNMYDNEPSTATVKNDNRDRFQVL 180 Cachua89 IWMDENIKTKNHTNTVMFFLVRDRRPFGTPQDFGQVFNMYDNEPSTATVKNDNRDRFQVL 180 Cachua100 IWMDENIKTKNHTNTVMFFLVRDRRPFGTPQDFGQVFNMYDNEPSTATVKNDNRDRFQVL 180
NLS5 Dudu31 RRFQATATGGQYASKEQAIVRKFMKVNNHVTYNHQEAAKYDNHTENALLLYMACTHASNP 240 Cachua89 RRFQATVTGGQYASKEQAIVRKFMKVNNHVTYNHQEAAKYDNHTENALLLYMACTHASNP 240 Cachua100 RRIQATVTGGQYASKEQAIVRKFMKVNNHVTYNHQEAAKYDNHTENALLLYMACTHASNP 240 Dudu31 VYATLKIRIYFYDSVQN 257 Cachua89 VYATLKIRIYFYDSVQN 257 Cachua100 VYATLKIRIYFYDSVQN 257
Hình 4.10. Protein CP của 3 virus Dudu31, Cachua89 và Cachua100 với các motif hoặc gốc aa chủ chốt liên quan đến các chức năng lắp ráp virion, lan truyền qua vector và nhập nhân được in
4.2.3. So sánh trình tự và phân tích phả hệ của 3 mẫu virus 4.2.3.1. Tìm kiếm chuỗi tương đồng trên GenBank 4.2.3.1. Tìm kiếm chuỗi tương đồng trên GenBank
Sử dụng phần mềm BLAST trên NCBI, chúng tôi đã tìm kiếm chuỗi gần gũi trên Genbank đối với 3 virus Dudu31, Cachua90 và Cachua 100 dựa trên toàn bộ bộ gen.
Kết quả tìm kiếm cho thấy các virus trên GenBank gần gũi nhất với các virus này là các virus phân lập từ cà chua hoặc đu đủ tại Việt Nam hoặc phía Nam Trung Quốc. Virus được công bố sẵn có trên GenBank gần gũi nhất với cả 3 virus đều là Tomato leaf curl Hainan virus (ToLCHV) gồm 2 isolate là HaNHK7 (FN256261) và HaNHK8 (FN434083) (Bảng 4.5). Cả 2 isolate này đều mới được phân lập gần đây tại đảo Hải Nam (Trung Quốc) (Zhang và cộng sự, 2010).
Bảng 4.5: Virus được công bố sẵn có trên GenBank gần gũi nhất với 3 mẫu virus.
Tên mẫu Virus đã công bố trên GenBank Genbank Mã số score Max Query Coverage
Max Identity
Tomato leaf curl Hainan virus isolate HaNHK7 FN256261 4549 100% 96% Dudu
31 Tomato leaf curl Hainan virus isolate HaNHK8 FN434083 4538 100% 96% Tomato leaf curl Hainan virus isolate HaNHK7 FN256261 4205 100% 94%