Nhờ sự phát triển của kỹ thuật giải trình tự, một số lƣợng lớn các gene hsp-70
và RT-RNaseH đã đƣợc giải trình tự. Những trình tự gene này đƣợc lƣu trữ trong CSDL sinh học lớn nhƣ NCBI, EMBL, DDBj, … Vì các CSDL này quá lớn và chứa rất nhiều thông tin khác nhau, không tập trung thành từng gene cụ thể nên khó có thể thực hiện việc truy xuất các thông tin phục vụ trực tiếp cho một nghiên cứu chuyên biệt. Do vậy, chúng tôi đã tập hợp các trình tự gene hsp-70 (của Closteroviridae) và
RT-RNaseH (của Caulimoviridae). Để xây dựng CSDL riêng cho hai gene này. Đồng thời xác định các loài trong họ có chứa hai gene trên.
Về sinh vật
CSDL lƣu trữ hai họ, 7 giống, 56 loài. Số lƣợng trình tự thu nhận ở bảng 4.1.
Về trình tự
CSDL gene hsp-70 và RT-RNaseH gồm 325 trình tự (hsp-70 và RT-RNaseH), kết quả chi tiết ở bảng III.3.2. và III.3.3. CSDL gene này đƣợc phân chia thành hai nhóm trình tự hsp-70 thuộc Closteroviridae và RT-RNaseH thuộc Caulimoviridae, tƣơng ứng với mỗi gene có thông tin về protein tƣơng ứng.
Bảng 4.1 Tổng số trình tự trong CSDL gene hsp-70 và RT-RNaseH Họ Số trình tự gene Số trình tự protein Closteroviridae 125 125 Caulimoviridae 200 200 Bảng 4.2 Số trình tự gene hsp-70 Họ Genus Species Số trình tự Closteroviridae Ampelovirus
Grapevine leafroll-associated virus 1 45
Grapevine leafroll-associated virus 3 16
Grapevine leafroll-associated virus 9 2
Closterovirus
Beet yellows virus 3
Apricot stem pitting asso 3
Mint virus 1 4
Citrus tristeza virus 6
Little cherry virus 1 2
Grapevine leafroll-associated virus 2 2
Crinivirus
Sweet potato chlorotic stunt virus 16
Cucurbit yellow stunting disorder
virus 3
Tomato infectious chlorosis virus 9
Potato yellow vein virus 7
Tomato chlorosis virus 4
Beet pseudo-yellows virus 3
Tổng số trinh tự 125
Tƣơng tự, số trình tự về protein của họ Closteroviridae cũng thu nhận đƣợc với số lƣợng tƣơng ứng với gene hsp-70 (mỗi trình tự điều có một trình tự protein tƣơng ứng trong CSDL).
Bảng 4.3 Số trình tự gene RT-RNaseH
Họ Genus Species Số trình tự
Caulimoviridae Badnavirus
Banana streak Obino l'Ewai virus 13
Banana streak Goldfinger virus 10
Banana streak Uganda A virus 11
Banana streak Uganda B virus 2
Banana streak Uganda C virus 1
Banana streak Uganda D virus 2
Banana streak Uganda E virus 3
Banana streak Uganda F virus 2
Banana streak Uganda G virus 2
Banana streak Uganda H virus 2
Banana streak Uganda I virus 26
Banana streak Uganda J virus 4
Banana streak Uganda K virus 4
Banana streak Uganda L virus 20
Banana streak Uganda M virus 32
Banana streak virus 1
Rubus yellow net virus 2
Stilbocarpa mosaic bacilliform
virus 1
Banana streak OL virus 2
Taro bacilliform virus 9
Citrus yellow mosaic virus 2
Bougainvillea spectabilis chlorotic
vein-banding virus 1 Pineapple bacilliform virus 1
Sugarcane bacilliform virus 1
Cacao swollen shoot virus 5
Kalanchoe top-spotting virus 1
Banana streak virus strain
Acuminata Vietnam 1 Banana streak Mys virus 1
Caulimovirus
Cauliflower mosaic virus 8
Blueberry red ringspot virus 2
Dahlia mosaic virus 2
Carnation etched ring virus 2
Horseradish latent virus 1
Peanut chlorotic streak virus 2
Cassava vein mosaic virus 2
Figwort mosaic virus 2
Petuvirus Petunia vein clearing virus 4
Soymovirus
Peanut chlorotic streak virus 2
Soybean chlorotic mottle virus 2
Tổng số trình tự 200
Trong CSDL chứa hai đối tƣợng chính thì còn chứa đối tƣợng phụ nhằm cung cấp các thông tin khác để bổ sung cho hai đối tƣợng chính nhƣ: tên tác giả, tên bài báo, cây phân loài,…
CSDL về hai gene hsp-70 và RT-RNaseH, rất tiện ích cho việc truy xuất, nghiên cứu các thông tin liên quan đến trình tự DNA, protein, loài, các đặc trƣng của từng loài chứa hai gene này, tiết kiệm thời gian tìm hiểu, nắm bắt thông tin nhanh. CSDL này đƣợc xây dựng trên hai gene khá bảo tồn ở hai loài nên chúng ta có thể dựa vào các thông tin trong CSDL để nghiên cứu các hiện tƣợng biến chủng trong họ, giúp đƣa ra các kết luận chính xác về các biến chủng xảy ra ở trên hai gene này. Nhƣng CSDL nhỏ, chỉ có 325 trình tự gene hsp-70 và RT-RNaseH ở hai họ virus, chứa lƣợng thông tin ít và chƣa có chế độ bảo mật. Ở cấp độ phòng thí nghiệm, cơ quan nghiên cứu hay trƣờng đại học thì việc xây dựng CSDL cho từng đối tƣợng (về một gene, một sinh vật,…) thì rất tiện ích để phục vụ cho các nghiên cứu về một đối tƣợng nhất định.
46