1 5AZAA004 DT DT-KuA-3 pCambia SeqF 3 38 2 5AZAA005 DT DT-KuA-3 pCambia SeqR 77
3.3.2. Phân tích các motif chức năng trên bộ gene của 5 mẫu virus
Gene Rep, gene CP và vùng IR chiếm gần 80 % bộ gene của begomovirus. Đây cũng là các vùng chứa nhiều dấu hiệu (motif) quan trọng liên quan tới tái sinh, tái tổ hợp, đặc hiệu vector và xâm nhiễm của begomovirus. Vì vậy chúng tôi tiến hành phân tích 3 vùng này của 5 mẫu virus.
3.3.2.1. Phân tích vùng chung CR (common region) giữa DNA-A và DNA-B
Tương tự như tất cả các begomovirrus có bộ gene kép khác, vùng liên gene không dịch mã IR của cả DNA-A và DNA-B của 5 mẫu KuMV có chứa một vùng có trình tự và mức độ đồng nhất rất cao gọi là vùng chung CR (common region). CR chứa một vùng rất quan trọng liên quan đến sự tái bản của begomovirus gọi là vùng ori (origin of replication). Vùng ori bao gồm:
(i) Một cấu trúc kẹp tóc (hairpin), cũng thường được gọi là cấu trúc thân- thòng lọng (stem-loop), với phần thân là 2 chuỗi đối song giàu GC bao quanh phần đầu dạng vòng giàu AT chứa một chuỗi 9 nt TAATATTAC giống nhau ở tất cả các begomovirus được phát hiện cho tới nay (Hình 3.9A). Vị trí TA cuối cùng (đóng hộp) của chuỗi bất biến TAATATTAC chính là nơi protein Rep của begomovirus cắt và nối sợi DNA của virus trong quá trình tái sinh.
(ii) Một vùng liên kết protein Rep nằm ở thượng lưu của cấu trúc kẹp tóc (Hình 3.9). Vùng này chứa nhiều dấu hiệu như hộp TATA và quan trọng nhất là các chuỗi lặp gọi là iteron (iterated sequences) – vị trí mà protein Rep của virus sẽ liên kết để khởi đầu quá trình tái bản (Hình 3.9). Các chuỗi iteron thường chứa 2 - 4 gốc G. Trình tự, số lượng, cách xắp xếp và vị trí tương đối với nhau của các chuỗi iteron nhìn chung đặc hiệu cho mỗi begomovirus (Hình 3.9B, C) và tương ứng với trình tự axit amin phần đầu amin của protein Rep.
Phân tích vùng CR của 4 mẫu virus (VNP134, VNP 951, VNP963 và DT1) cho thấy chúng có nhiều đặc điểm khác với vùng CR của các begomovirus có bộ gene kép khác. Nhìn chung đối với các begomovirus có bộ gene kép, vùng CR thường có mức độ đồng nhất rất cao. Tuy nhiên, vùng CR của DNA-A và DNA-B của 4 mẫu virus chỉ có phần chứa interon và chuỗi bất biến là giống nhau còn khoảng 20 nt sát đầu 5’ của cấu trúc kẹp tóc và thậm chí phần thân của cấu trúc kẹp
Học viện Nông nghiệp Việt Nam – Luận văn Thạc sỹ Khoa học Nông nghiệp Page 42
tóc hoàn toàn khác nhau. Tuy nhiên vì đoạn chứa chuỗi iteron của vùng CR giữa hai chuỗi và người ta đã chứng minh rằng chỉ cần tạo cấu trúc kẹp tóc thì protein Rep vẫn có thể nhận biết và thực hiện quá trình cắt và nối trong quá trình tái sinh phân tử DNA-A và cả DNA-B.
D
Hình 3.9. Kết quả phân tích các motif chức năng trên vùng chung CR (common region) của 5 mẫu virus.
Học viện Nông nghiệp Việt Nam – Luận văn Thạc sỹ Khoa học Nông nghiệp Page 43
Ghi chú: A. Sơđồ vùng ori của begomovirus (Fontes et al., 1994); B. Liên kết đặc hiệu của protein Rep trên vùng ori để khởi đầu quá trình tái bản bộ gene begomovirus (Luque et al., 2002); C. Minh họa trình tự và cách sắp xếp iteron của một số begomovirus (Argüello-Astorga et al., 1994); D. Vùng chung CR của DNA-A và DNA-B của KuMV mẫu VNP134, VNP951, VNP963 và DT1, và vùng chung CR của DNA-A của mẫu VNP335 với chuỗi iteron được in béo và gạch chân, chuỗi kẹp tóc được gạch chân còn chuỗi bất biến được đóng hộp.
Đối với mẫu VNP335 do chưa nhân dòng thành công được DNA-B của virus này nên chúng tôi chưa thể so sánh vùng CR của hai phân tử DNA-A và DNA-B. Tuy nhiên vùng khi phân tích vùng IR của mẫu VNP335 chúng tôi đã phát hiện cấu trúc kẹp tóc chứa chuỗi bất biến TAATATTAC và chuỗi iteron tương tự 4 mẫu virus đã phân tích (Hình 3.9D).
3.3.2.2. Phân tích protein Rep của 5 mẫu virus
Protein Rep (Replication associated protein) là một protein lớn nhất của begomovirus và là một protein đa chức năng, trong đó các chức năng quan trọng nhất đều liên quan đến quá trình tái bản.
Nhận biết và liên kết DNA. Để khởi đầu quá trình tái bản, protein Rep cần phải nhận biết và liên kết với vùng ori. Tính đặc hiệu của Rep trong quá trình trình nhận biết và liên kết đã được chứng minh liên quan tới các chuỗi iteron như trình bày ở phần 3.2.2.1 và đầu N của Rep. Đầu N của protein Rep chứa một chuỗi X-nX- 2X-1FX1X2X3 (với X-n là aa đầu tiên của protein còn F là aa bất biến) gọi là chuỗi nhận biết iteron IRD (Interon-Related Domain) (Argüello-Astorga and Ruiz- Medrano, 2001).
Phân tích chuỗi IRD của cả 5 mẫu virus chúng hoàn toàn đồng nhất với trình tự MSRPKGFRVN (Hình 3.10). Đối chiếu thấy trình tự của các chuỗi IRD thuộc nhóm ngoại lệ có nghĩa chúng có chuỗi IRD duy nhất và trình tự iteron cũng duy nhất theo phân loại trình tự IRD/iteron của Argüello-Astorga and Ruiz- Medrano (2001).
Cắt và nối DNA. Protein Rep không phải là một polymerase nhưng có hoạt tính endonuclease và ligase và đóng vai trò cực kỳ quan trọng trong quá trình tái
Học viện Nông nghiệp Việt Nam – Luận văn Thạc sỹ Khoa học Nông nghiệp Page 44
bản bộ gene begomovirus. Sau khi liên kết vào vùng ori, Rep sẽ cắt giữa nucleotides số 7 và 8 trên chuỗi bất biến (TAATATT7OH-PA8C) để khởi đầu quá trình tổng hợp liên tục sợi virus theo cơ chế vòng lăn. Sợi virus hình thành sẽđược cắt và nối lại để tạo bộ gene virus hoàn chỉnh. Vùng liên quan đến chức năng này là phần đầu N (khoảng 1/3 – 1/2 chiều dài). Ba motif chức năng bảo thủ cao ở vùng này là motif I (FLTY), motif II (HLH) và motif III (DVKAYMDKD). Trong 3 motif này, motif I và II là bất biến còn motif III chứa gốc Y bất biến cần cho cả hoạt tính cắt và nối (Laufs et al., 1995; Orozco et al., 1997) (Hình 3.10A,B).
Như trình bày ở Hình 3.10C, phần đầu N của protein Rep của 5 virus đều chứa 3 motif I, II và III giống như của các begomovirus khác.
Tương tác với các yếu tố ký chủ liên quan đến bộ máy tái bản. Quá trình tái bản của begomovirus xảy ra trong nhân tế bào, kể cả ở các tế bào không phân chia. Do vậy, sau khi nhiễm vào tế bào, begomovirus phải khởi động bộ máy tái sinh của tế bào. Một trong các protein của tế bào ký chủ thực vật điều khiển chu kỳ tế bào là pRBR (plant retinoblastoma-related protein) - chịu trách nhiệm chuyển chu kỳ tế bào từ pha G1 sang pha S (pha tổng hợp). Protein Rep của TYLCV đã được chứng minh tương tác với pRBR thông qua 1 motif xoắn α (α helix) nằm ở phần đầu N có trình tự 11 nt KEEALQIIREKI (Arguello-Astorga et al., 2004).
Dùng phương pháp Chou-Fasman (phần mềm Protean, Lasergen), chúng tôi đã tìm được chuỗi xoắn α tương tự nhau ở cả 5 virus là TSALNILREKA trong đó gốc A (đóng hộp) là bất biến đối với nhiều begomovirus (Hình 3.10C).
Hoạt tính ATPase. Trong qua trình tái bản, Rep của begomovirrus cũng cần năng lượng. Ở phần đầu C của Rep có một motif tương tự motif P-loop của các protein thủy phân NTP. Desbiez et al. (1995) đã chứng minh motif P-loop (GXXXXGKT230) giúp Rep của Tomato Golden mosaic virus (TGMV) liên kết và thủy phân ATP của tế bào ký chủ.
Phân tích phần đầu C của Rep đã phát hiện một chuỗi P-loop giống nhau ở cả 5 virus với trình tự GE/DSRTGKT và nằm ở vị trí 221-228 tính từ đầu N của Rep (Hình 3.10.C).
Học viện Nông nghiệp Việt Nam – Luận văn Thạc sỹ Khoa học Nông nghiệp Page 45
Hình 3.10. Kết quả phân tích các motif chức năng trên protein Rep của 5 mẫu virus.
Ghi chú: A. Sơ đồ các vùng chức năng của begomovirus (Hanley-Bowdoin et al., 1999); B. Bốn motif liên quan đến hoạt tính cắt - nối DNA và liên kết ATP của protein Rep của begomovirus (Laufs et al., 1995); C. là protein Rep của 5 mẫu KuMV với các motif chức năng được đánh dấu và các gốc axit amin bất biến được đóng hộp.
Học viện Nông nghiệp Việt Nam – Luận văn Thạc sỹ Khoa học Nông nghiệp Page 46
3.3.2.3. Phân tích protein CP của 5 mẫu virus
CP (Coat Protein) của begomovirus cũng là một protein đa chức năng với 3 chức năng quan trọng nhất là lắp ráp thành phân tử virus, lan truyền qua vector, nhập nhân tế bào ký chủ.
Lắp ráp phân tử. Một trong các chức năng quan trọng nhất của CP là tạo thành vỏ bọc của phân tử virus. Để hoàn thành chức năng này, CP phải có khả năng liên kết với nhau (liên kết CP-CP). Các nghiên cứu cho thấy, phần đầu N của 1 phân tử CP này sẽ liên kết với phần đầu C của 1 phân tử CP khác (Hallan and Gafni, 2001). Ngoài ra, 1 số gốc aa nằm ở phần trung tâm của CP cũng cần cho liên kết CP-CP (Noris et al., 1998).
Đối với 5 virus trong nghiên cứu này, 2 gốc K (đánh dấu ‡) và S (đánh dấu ↓) như trình bày trên Hình 3.11. nằm ở vùng trung tâm tương ứng với 2 gốc aa đã được chứng minh cần cho liên kết CP-CP của TYLCV (Noris et al., 1998), trong đó nếu gốc K bịđột biến sang P có thể làm biến đổi cấu trúc thứ cấp của CP dẫn tới mất khả năng liên kết CP-CP và hậu quả là không hình thành phân tử virus. So sánh với nhiều begomovirus khác thấy ở vị trí gốc S thì chúng hoặc S hoặc T.
Lan truyền qua vector. Các begomovirus lan truyền ngoài tự nhiên nhờ bọ phấn (B. tabaci) theo kiểu bền vững tuần hoàn có nghĩa virus phải được hút qua vòi, vào ruột, vào xoang cơ thể, quay trở lại tuyến nước bọt. Vùng CP liên quan đến khả năng lan truyền qua bọ phấn của begomovirrus đã được chứng minh nằm ở vùng trung tâm (vị trí khoảng từ 120 – 180 aa) (Harrison et al., 2002).
So sánh với các nghiên cứu đã công bố (Harrison et al., 2002), các gốc aa quan trọng qui định khả năng lan truyền qua bọ phấn trên vùng trung tâm CP của 5 virus, như trình bày trên Hình 3.11, gồm K (đánh dấu ‡), N, F, D, Q, L (đánh dấu ▼). Tất cả các gốc này đều tương tự với các gốc tương ứng của phần lớn các begomovirus khác. Gây đột biến ở các vị trí này có thể làm mất hoặc phục hồi khả năng lan truyền qua bọ phấn của begomovirus (Noris et al., 1998; Kheyr-Pour et al., 2000; Höhnle et al., 2001).
Nhập nhân tế bào ký chủ. Các begomovirus là các virus DNA, vì vậy, quá trình tái sinh bộ gene virus phải được thực hiện trong nhân tế bào ký chủ. Ngay
Học viện Nông nghiệp Việt Nam – Luận văn Thạc sỹ Khoa học Nông nghiệp Page 47
khi xâm nhập được vào tế bào ký chủ, protein duy nhất của virus có mặt là CP, và do đó nó tham gia vào việc vận chuyển DNA của virus vào trong nhân thông qua lỗ màng nhân. Phức hợp DNA-CP của virus phải được liên kết với các phân tử vận chuyển trung gian của tế bào ký chủ gọi là karyopherins. Để được các phân tử karyopherin nhận biết và liên kết, protein virus phải có các dấu hiệu nhập nhân
(NLS, Nuclear Localizing Signals). Dấu hiệu nhập nhân NLS của phần lớn protein hoạt động trong tế bào thực vật có cấu trúc đặc trưng gồm 2 chuỗi aa kiềm (K/R) cách nhau bởi 1 số aa (không nhỏ hơn 4) (Gafni and Epel, 2002). Đối với các begomovirus, các dấu hiệu NLS này đã được xác định nằm cả ở 3 vùng (đầu N, trung tâm và đầu C) (Kunik et al., 1998; Unseld et al., 2001).
Tìm kiếm trên CP của 5 virus đã cho thấy có 5 vùng NLS giàu aa kiềm (K/R) (Hình 3.11). Hai vùng NLS1 (KR) và NLS2 (RRR) đầu N cách nhau bởi 13 aa có trình tự và vị trí giống 2 NLS của Tomato yellow leaf curl virus (TYLCV) (Kunik et al., 1998). Đối với TYLCV, 2 NLS này là đủ cho chức năng nhập nhân của CP.
Hình 3.11. Protein CP của 5 mẫu KuMV với các motif hoặc gốc axít amin chủ chốt liên quan đến các chức năng lắp ráp virion, lan truyền qua vector và nhập
Học viện Nông nghiệp Việt Nam – Luận văn Thạc sỹ Khoa học Nông nghiệp Page 48
Ba dấu hiệu nhập nhân còn lại, NLS3 (RPMYRK, phần đầu N), NLS4 (RVGKRFCIK, phần trung tâm) và NLS5 (RRFYK, phần đầu C) cũng được tìm thấy trên CP của cả 5 virus (Hình 3.11). Như đã được chứng minh đối với CP của African cassava mosaic virus (ACMV), NLS3 có tác dụng bổ trợ NLS1 và NLS2 cho chức năng nhập nhân còn NLS4 và NLS5 là các dấu hiệu nhập nhân độc lập (Unseld et al., 2001).