Phương pháp và phần mềm phân tích chuỗi DNA- 123docz.net

2. Đặc điểm của chi Begomovirus

3.2.8. Phương pháp và phần mềm phân tích chuỗi DNA

Chương trình BLAST ( NCBI ) Chương trình BioEdit 7.0.9

Chương trình DNAstar 7.1 (Lasergene) Chương trình Vecter NTI 9.0 (Invitrogene) Chương trình ClustalX 2.0 và Mega 4.0.

Phần IV. KẾT QUẢ VÀ THẢO LUẬN

4.1. Nhân dòng và giải trình tự toàn bộ gen của ba mẫu virus Cachua 100, Cachua 89 và Dudu 31

Trong năm 2009, Lê Văn Hải (CNSH50) đã phân lập được 3 begomovirus chưa từng được phát hiện ở Việt Nam gây hại trên cây đu đủ và cà chua. Tác giảđã giải trình tự

trực tiếp khoảng 1.2 kb (~ 40 % kích thước bộ gien trung bình của begomovirus) của cả 3 virus này.

Vì danh tính và vị trí phân loại của begomovirus chỉ có thể được xác định chính xác dựa trên toàn bộ trình tự phân tử DNA của begomovirus nên mục tiêu của phần 4.1 của chúng tôi là giải trình tự toàn bộ bộ gen của 3 virus này. Ba mẫu virus được chúng tôi ký hiệu là Dudu31, Cachua 89 và Cachua100 dựa trên cây ký chủ và mã mẫu cây bệnh (Bảng 4.1).

Bảng 4.1. Nguồn gốc 3 mẫu virus được nghiên cứu trong báo cáo này

Mẫu virus Mã mẫu cây Cây ký chủ Thời gian thu mẫu Địa điểm Triệu chứng

Dudu31 31 Đu đủ 7/2008 Yên Mỹ-Hưng Yên Xoắn lá Cachua89 89 Cà chua 9/2008 Đa tốn-Gia Lâm-Hà Nôi Xoăn vàng lá Cachua100 100 Cà chua 9/2008 Yên Mỹ - Thanh Trì - Hà Nội Xăn vàng lá

Ghi chú: DNA tổng sốđã được chiết từ trước (năm 2009) và bảo quản ở -20 OC

4.1.1. Thiết kế mồi nhân toàn bộ bộ gen của 3 mẫu virus

Begomovirus là các virus có bộ gen DNA dạng vòng, kích thước khoảng 2.7 – 2.8 kb. Để nhân toàn bộ bộ gen của begomovirus, người ta thường sử dụng 1 cặp mồi liền kề

nhưng ngược chiều nhau gọi là mồi “back-to-back”, được thiết kế trên một trình tự đã biết. Dựa trên 3 trình tự thu được khi giải trình tự trực tiếp mẫu virus của Lê Văn Hải (mỗi trình có kích thước 819 nt), chúng tôi thiết kế mồi để nhân toàn bộ DNA của ba mẫu virus. Nhìn chung, đối với mỗi một virus, người ta sẽ sử dụng một cặp mồi liền kề riêng.

Tuy nhiên, khi căn trình tự đa chuỗi bằng phần mềm Seqman (gói phần mềm Lasergen, hãng DNASTAR), chúng tôi thấy có nhiều vùng bảo thủ của cả 3 chuỗi virus. Dựa trên 1 vùng bảo thủ dài 43 nt (vị trí 559 tới vị trí 601, Hình 4.1), chúng tôi đã thiết kế 1 cặp mồi chung liền kề ký hiêu là Hai50F (xuôi dòng) và Hai50R (ngược dòng) để nhân toàn bộ

genome của 3 virus (Bảng 4.2). Vị trí tương đối của cặp mồi chung liền kề trên genome của begomovirus được trình bày ở Hình 4.2.

Hình 4.1. Vùng bảo thủ dùng để thiết kế mồi chung liền kề nhân toàn bộ bộ gen của 3 mẫu virus Dudu31, Cachua 89 và Cachua100. Vùng thiết kế mồi được bôi đen.

Bảng 4.2: Các mồi liền kề nhân toàn bộ bộ gen của ba mẫu virus Cachua 100, Cachua 89 và Dudu 31 Chuỗi Đặc điểm Đoạn bảo thủ 5’CCTCAGGTTGTAATTGAATTGGACTTGTATTGTGATGATGTCG3’ Trình tự : 5’GGACTTGTATTGTGATGATGTCG3’ Chiều dài: 23nt Hàm lượng GC: 43 % Mồi Hai50F Tm: 51.2 °C Trình tự: 5’CCAATTCAATTACAACCTGAGG3’ Chiều dài: 22nt Hàm lượng GC: 41 % Mồi Hai50R Tm: 50.7 °C

Ghi chú: Hai nucleotid gối nhau của 2 mồi được đóng hộp. Tm của mồi được tính theo phần mềm Oligo Calc (http://www.basic.northwestern.edu/biotools/oligocalc.html)

Hình 4.2. Vị trí tương đối của cặp mồi chung liền kề Hai50F/Hai50R trên bộ gen của begomovirus

4.1.2. Nhân toàn bộ bộ gen của 3 mẫu virus bằng PCR

Do đặc điểm bộ gen của virus lớn (khoảng 2.7 kb) và đểđảm bảo trình tự DNA thu

được không bị lỗi cũng như tăng tính đặc hiệu, chúng tôi sử dụng kit Expand Long Template PCR System (hãng Roche) với đệm phản ứng số 3 (chứa thêm chất tNy rửa) để

thực hiện phản ứng. Phản ứng PCR nhân toàn bộ bộ gen của 3 virus đã được thực hiện với cặp mồi liền kề chung Hai50F/Hai50R với DNA tổng số chiết từ mẫu cây nhiễm bệnh năm 2009 và bảo quản từ trước ở -20 OC. Kết quả điện di sản phNm PCR cho thấy cả 3 mẫu đều tạo băng sản phNm PCR kích thước xấp xỉ 2.7 kb chứng tỏ toàn bộ bộ gen của ba mẫu virus đã được nhân dòng thành công (Hình 4.3).

M Dudu 31 Cachua 89 Cachua10

Hình 4.3. PCR nhân toàn bộ DNA-A của ba mẫu virus. M là thang DNA 1 kb (Fermentas).

~2.7 kb

Hai50F Hai50R

3.0 kb 2.5 kb

Sản phNm PCR của 3 mẫu được cắt khỏi agarose gel và được được tinh sạch bằng kít thôi gel Pure LinkTM Quick Gel Extraction Kit (Invitrogen) cho các thí nghiệm tiếp theo.

4.1.3. Nhân dòng bộ gen của 3 mẫu virus trong vi khu6n E.coli

Để nhân dòng bộ gen của ba mẫu virus, chúng tôi sử dụng bộ kít nhân dòng InsTAclone™ PCR Cloning Kit của hãng Fermentas và nguồn tế bào E. coli dòng XL1- Blue của hãng Stratagen. Toàn bộ qui trình nhân dòng được thực hiện theo hướng dẫn của nhà sản xuất.

Đầu tiên, sản phNm PCR tinh chiết ở trên được nối vào vector nhân dòng pTZ57R/T sẵn có trong kit theo hướng dẫn của nhà sản xuất. Tiếp theo chúng tôi sử dụng tế bào vi khuNn E. coli chủng XL-1 Blue có để làm nguồn tế bào khả biến bằng cách nuôi vi khuNn trong môi trường CM và xử lý tế bào với đệm T sẵn có trong kit InsTAclone™ PCR Cloning. Vector tái tổ hợp ở trên được biến nạp vào tế bào vi khuNn khả biến bằng cách hỗn hợp chúng với nhau và ủ trên đá trong 15 phút (không cần sốc nhiệt). Ngoài ra, chúng tôi cũng biến nạp vector pTZ57R/T dạng vòng sẵn có trong kít (DNA1 control) làm

đối chứng hiệu quả biến nạp.

Để chọn lọc dòng vi khuNn mang vector tái tổ hợp, các tế bào vi khuNn sau khi biến nạp được cấy trải trên môi trường chọn lọc (môi trường LB agar chứa tetracycline, ampicilline, IPTG và Xgal) và ủ qua đêm ở 37 0C.

Quan sát các đĩa nuôi cấy qua đêm (Hình 4.4) cho thấy:

Ởđĩa đối chứng, xuất hiện rất nhiều khuNn lạc (> 200) khuNn lạc trắng đặc trưng E. coli chứng tỏđiều kiện và hiệu quả biến nạp tốt.

Ở cả ba đĩa thí nghiệm Cachua 100, Cachua 89 và Dudu 31 xuất hiện cả 2 loại khuNn lạc trắng và xanh nhạt với số lương ít hơn nhiều so với đối chứng (<100). Kết quả

Hình 4.4. Các mẫu vi khuNn XL1-blue biến nạp được cấy trải và ủ qua đêm trên môi trường chọn lọc trắng xanh.

(1): Mẫu đối chứng (với DNA1 control); (2): Mẫu biến nạp Cachua 89; (3): Mẫu biến nạp Cachua 100; (4) Mẫu biến nạp Dudu 31

4.1.4. Kiểm tra kết quả biến nạp vector tái tổ hợp bằng enzyme cắt giới hạn

Tuy nhiên, không phải tất cả các khuNn lạc trắng đều chứa sản phNm DNA đúng vì nhiều phân tử DNA có thể gẫy hoặc phân hủy từng phần trong quá trình tinh chiết vẫn nối

được vào vector nhân dòng. Vì vậy, để kiểm tra và chọn các dòng vi khuNn mang vector chứa sản phNm nối đúng, chúng tôi chọn 4 khuNn lạc trắng ở mỗi mẫu đĩa vi khuNn biến nạp và cấy đơn khuNn lạc vào ống nghiệm chứa môi trường LB lỏng (4 mL) chứa kháng sinh ampicilline. Các ống nghiệm được nuôi ở nhiệt độ 370C, lắc 250 vòng/phút qua đêm. Tiếp theo, vector tái tổ hợp được tinh chiết từ tế bào vi khuNn dùng kít tinh chiết palasmid là Accuprep Plasmid Mini Extraction Kit (hãng Bioneer). Sự có mặt của DNA virus trong vector tái tổ hợp tinh chiết (miniprep) được kiểm tra bằng hai emzym cắt giới hạn là BamHI và E.coRI. Hai enzyme này sẽ giải phóng sản phNm nối khỏi vector nhân dòng. Kết quả kiểm tra được trình bày ở Bảng 4.3 và Hình 4.5.

Kết quả cho thấy 11/12 dòng kiểm tra đều chứa băng vector (~2.8 kb). Trong số

(tổng các băng của sản phNm nối ~ 2.7-2.8 kb tương ứng với kích thước bộ gen virus). Các dòng đúng này là 31-1, 31-2, 31-3 (mẫu biến nạp Dudu31), 89-4 (mẫu biến nạp Cachua89), 100-1, 100-2, 100-4 (mẫu biến nạp Cachua100).

Chúng tôi đã chọn các dòng 31-1, 89-4, 100-4 để giải trình tự.

Bảng 4.3. Kiểm tra vector tái tổ hợp (miniprep) bằng BamHI và E.coRI

Sản ph6m nối (kb) Mẫu biến nạp Dòng (clone) Băng vector (kb) Băng Tổng Kết luận sản ph6m nối 31-1 2.8 1.25; 1.1; 0.35 2.7 Đúng 31-2 2.8 1.25; 0.65; 0.4; 0.35 2.75 Đúng 31-3 2.8 1.25; 1.1; 0.35 2.7 Đúng Dudu31 31-4 2.8 1.25; 0.4; 0.3 1.95 Đứt gẫy 89-1 2.8 - Vector tự nối 89-2 2.8 0.6; 0.35 0.95 Đứt gẫy 89-3 2.8 0.3; 0.35 0.65 Đứt gẫy Cachua89 89-4 2.8 1.25; 0.65; 0.4; 0.35 2.75 Đúng 100-1 2.8 1.25; 1.1; 0.35 2.7 Đúng

100-2 - - Nhiễm tạp/tinh chiết? 100-3 2.8 1.25; 1.1; 0.35 2.7 Đúng

Cachua100

100-4 2.8 1.25; 1.1; 0.35 2.7 Đúng

Hình 4.5: Kết quảđiện di sản phNm miniprep đã được cắt bằng BamHI và E.coRI . Các giếng 31-1, -2,-3, -4 là của mẫu Dudu31. Các giếng 89-1, -2,-3, -4 là của mẫu Cachua89. Các

giếng 100-1, -2,-3, -4 là của mẫu Cachua100.

4.1.5. Kết quả giải trình tự gen

Việc giải trình tự toàn bộ bộ gen của 3 mẫu virus được thực hiện trên khuôn vector tái tổ hơp tinh chiết (miniprep). Phản ứng giải trình tự được thực hiện với kit BigDye terminator (hãng A&B). Sau khi thực hiện phản ứng giải trình tự tại TT bệnh cây nhiệt

đới, hỗn hợp phản ứng được làm khô và gửi đọc bằng điện di mao quản tại tại Viện CNSH-Viện Khoa Học Công Nghệ Quốc Gia.

Vì bộ gen của virus khá lớn nên chúng tôi tiến hành giải trình tự hai lần theo cả 2 chiều (Hình 4.6). Lần thứ nhất chúng tôi sử dụng 2 mồi được thiết kế trên vector là SeqF và SeqR. Với trình tự thu được từ lần thứ nhất của ba mẫu virus, chúng tôi thực hiện căn trình tự và thiết kế 2 mồi giải trình tự chung cho cả 3 chuỗi để thực hiện tiếp việc giải trình tự lần 2 cho phần còn lại của bộ gen. Hai mồi cho lần giải trình tự thứ 2 này được ký

hiệu là HaiSeqF (5’GACCTCCTTTTGTTTGTGAC3’) và HaiSeqR

Hình 4.6: Sơđồ giải trình tự bộ gen của 3 mẫu virus được dòng hóa trên vector pTZ57R/T. Kết quả sau khi giải trình tự chúng tôi thu được bốn trình tự cho mỗi mẫu. Tất cả

các trình tựđều có chất lượng tốt (đồ thị trình tự rõ ràng, không nhiễu) với chiều dài đọc

được khoảng 800 bp (Phụ lục 2).

Các trình tự này cùng với trình tự thu được khi giải trình tự trực tiếp (Lê Văn Hải, 2009) được chúng tôi lắp ráp và biên tập bằng chương trình Seqman (Lasergen, DNASTAR). Cuối cùng, chúng tôi thu được một trình tự genome duy nhất cho mỗi virus. Các trình tự này (Phụ lục 3) đã được gửi trên GenBank.

DNA virus

Bộ gen virus

SeqF HaiSeqF HaiSeqR SeqR

pTZ57R/T pTZ57R/T

4.2. Đặc trưng phân tử của ba mẫu virus Cachua 100, Cachua 89 và Dudu 31 4.2.1. Tổ chức bộ gen 4.2.1. Tổ chức bộ gen

Tổ chức bộ gen của ba mẫu virus được thực hiện bằng chương trình Vector NTI Suite 7 và đươc trình bày ở Bảng 4.4 và Hình 4.7.

Bộ gen của cả 3 virus được giải trình tựđều có kích thước và cấu trúc tương tự như

các virus thuộc chi Begomovirus nhóm Cựu thế giới. Toàn bộ bộ gen có kích thước khoảng 2.7 kb (2740 nt - Cachua100; 2743 nt - Cachua 89; 2748 nt – Dudu31). Trình tự

bắt đầu tại vị trí nucleotid thứ 8 (A) của chuỗi bảo thủ TAATATTAC (là vị trí cắt và nối bởi protein Rep trên DNA genome trong quá trình tái bản theo cơ chế vòng lăn).

Sử dụng phần mềm VectorNTI để tìm kiếm các ORF trên cả 3 phân tử genome, chúng tôi thấy trên mỗi phân tử có rất nhiều ORF khác nhau xắp xếp trên cả 2 chiều. Tuy nhiên, mỗi phân tử đều chứa 6 ORF đặc trưng cho bộ gen của các begomovirus gồm 2 ORF trên sợi virus (V2, V1, cùng chiều kim đồng hồ) và 4 ORF trên sợi bổ sung với sợi virus (C4, C1, C2, C3, ngược chiều kim đồng hồ) (Hình 4.7).

Trên sợi virus, ORF V2 (mã hóa protein V2) của cả 3 virus đều có kích thước 348 nt (116 aa). Phía đầu 3’ của ORF V2 là ORF V1 (mã hóa cho protein vỏ CP). ORF V1 của cả 3 virus đều có kích thước 771 nt (257 aa). Tương tự như của các begomovirus khác, 2 ORF này gối lên nhau 187 nt.

Trên sợi bổ sung, ORF lớn nhất là ORF C1 (mã hóa protein Rep), đều có kích thước bằng 1083 nt (361 aa) cho cả 3 virus. ORF nhỏ nhất là ORF C4 (mã hóa protein C4) nằm gọn trong đầu 5’ của ORF C1 với kích thước giống nhau cho cả 3 virus là 291 nt (97 aa) (Hình 4.7). Hai ORF còn lại là C2 (mã hóa protein TrAP) và C3 (mã hóa protein REn) đều có kích thước bằng nhau là 402 nt (134 aa). Như một qui luật chung đối với tất cả các beomovirus, ORF C4 và ORF C2 luôn nằm trên một khung đọc mã (c1, c2, c3 lần lượt đối với Dudu31, Cachua89 và Cachua100).

Bộ gen của 3 virus đều có một vùng liên gen không phiên mã (IR, Intergenic Region) kích thước khoảng 270 nt có vị trí tính từđầu 5’ của ORF C1 tới đầu 5’ của ORF V2 tương tự như IR của các begomovirus khác. IR có chứa nguồn gốc tái bản (ori, origin of replication) với nhiều dấu hiệu quan trọng như trình bày ở phần 4.2.2.1.

Bảng 4.4.Đặc điểm bộ gen của 3 mẫu begomovirus

Genome/ORF Chỉ tiêu Đu đủ31 Cà chua89 Cà chua100

DNA genome Kích thước (nt) 2748 2743 2740

Vị trí (từ nt tới nt) 2600 - 131 2600 - 131 2596 - 127 IR Kích thước (nt) 280 275 273 Vị trí (từ nt tới nt) 292 - 1062 292 - 1062 288 - 1058 Kích thước (nt) 771 771 771 V1(CP) Khung đọc mã d1 d3 d3 Vị trí (từ nt tới nt) 132 - 479 132 - 479 128 - 475 Kích thước (nt) 348 348 348 V2 (V2) Khung đọc mã d3 d3 d2 Vị trí (từ nt tới nt) 1517 - 2599 1517 - 2599 1513 - 2595 Kích thước (nt) 1083 1083 1083 C1(Rep) Khung đọc mã c3 c3 c2 Vị trí (từ nt tới nt) 1210 - 1611 1210 - 1611 1206 - 1607 Kích thước (nt) 402 402 402 C2 (TrAP) Khung đọc mã c1 c2 c3 Vị trí (từ nt tới nt) 1065 - 1466 1065 - 1466 1061 - 1462 Kích thước (nt) 402 402 402 C3 (Ren) Khung đọc mã c2 c3 c1 Vị trí (từ nt tới nt) 2152 - 2442 2152 - 2442 2148 - 2438 Kích thước (nt) 291 291 291 C4 (C4) Khung đọc mã c1 c2 c3

Hình 4.7: Tổ chức bộ gen của 3 mẫu virus. Khung đọc mã d (direct) trên sợi virus còn c (complementary) trên sợi bổ sung.

Cachua100 2740 nt V1 (CP) 288 – 1058 d3 V2 (V2) 128 – 475 d2 C1 (Rep) 1513 – 2595 c2 C2 (TrAP) 1206 – 1607 c3 C3 (REn) 1061 – 1462 c1 C4 (C4) 2148 – 2438 c3 IR Cặp tóc Cachua89 2743 nt V1 (CP) 292 – 1062 d1 V2 (V2) 132 – 479 d3 C1 (Rep) 1517 – 2599 c1 C2 (TrAP) 1210 – 1611 c2 C3 (REn) 1065 – 1466 c3 C4 (C4) 2152 – 2442 c2 IR Cặp tóc Dudu31 2748 nt V1 (CP) 292 – 1062 d1 V2 (V2) 132 – 479 d3 C1 (Rep) 1517 – 2599 c3 C2 (TrAP) 1210 – 1611 c1 C3 (REn) 1065 – 1466 c2 C4 (C4) 2152 – 2442 c1 Cặp tóc IR

4.2.2. Phân tích các motif chức năng trên bộ gen của 3 mẫu virus

Gen Rep, gen CP và vùng IR chiếm gần 80 % bộ gen của begomovirus. Đây cũng là các vùng chứa nhiều dấu hiệu (motif) quan trọng liên quan tới tái sinh, tái tổ hợp, đặc hiệu vector và xâm nhiễm của begomovirus. Vì vậy chúng tôi tiến hành phân tích 3 vùng này của ba mẫu virus.

4.2.2.1. Phân tích vùng liên gen IR của 3 mẫu virus

Vùng liên gen (IR) của begomovirus chứa một vùng rất quan trọng liên quan đến sự tái bản của begomovirus gọi là vùng ori (origin of replication). Vùng ori bao gồm:

(i) một cấu trúc kẹp tóc (hairpin), cũng thường được gọi là cấu trúc thân-thòng lọng (stem-loop), với phần thân là 2 chuỗi đối song giàu GC bao quanh phần đầu dạng vòng giàu AT chứa một chuỗi 9 nt TAATATTAC giống nhau ở tất cả các begomovirus

được phát hiện cho tới nay (Hình 4.8 A). Vị trí TA cuối cùng (đóng hộp) của chuỗi bất biến TAATATTAC chính là nơi protein Rep của begomovirus cắt và nối sợi DNA của virus trong quá trình tái sinh.

(ii) một vùng liên kết protein Rep nằm ở thượng lưu của cấu trúc kẹp tóc (Hình 4.8 A). Vùng này chứa nhiều dấu hiệu như hộp TATA và quan trọng nhất là các chuỗi lặp gọi là iteron (iterated sequences) – vị trí mà protein Rep của virus sẽ liên kết để khởi đầu quá trình tái bản (Hình 4.8 B). Các chuỗi iteron thường chứa 2 - 4 gốc G. Trình tự, số lượng, cách xắp xếp và vị trí tương đối với nhau của các chuỗi iteron nhìn chung đặc hiệu cho

Phương pháp và phần mềm phân tích chuỗi DNA

Kết quả giải trình tự gen

Phân tích protein Rep của 3 mẫu virus