CSDL trình tự gene hsp-70 và RT-RNaseH

Một phần của tài liệu Xây dựng cơ sở dữ liệu Gene (Trang 54 - 58)

Nhờ sự phát triển của kỹ thuật giải trình tự, một số lƣợng lớn các gene hsp-70

RT-RNaseH đã đƣợc giải trình tự. Những trình tự gene này đƣợc lƣu trữ trong CSDL sinh học lớn nhƣ NCBI, EMBL, DDBj, … Vì các CSDL này quá lớn và chứa rất nhiều thông tin khác nhau, không tập trung thành từng gene cụ thể nên khó có thể thực hiện việc truy xuất các thông tin phục vụ trực tiếp cho một nghiên cứu chuyên biệt. Do vậy, chúng tôi đã tập hợp các trình tự gene hsp-70 (của Closteroviridae) và

RT-RNaseH (của Caulimoviridae). Để xây dựng CSDL riêng cho hai gene này. Đồng thời xác định các loài trong họ có chứa hai gene trên.

Về sinh vật

CSDL lƣu trữ hai họ, 7 giống, 56 loài. Số lƣợng trình tự thu nhận ở bảng 4.1.

Về trình tự

CSDL gene hsp-70RT-RNaseH gồm 325 trình tự (hsp-70RT-RNaseH), kết quả chi tiết ở bảng III.3.2. và III.3.3. CSDL gene này đƣợc phân chia thành hai nhóm trình tự hsp-70 thuộc ClosteroviridaeRT-RNaseH thuộc Caulimoviridae, tƣơng ứng với mỗi gene có thông tin về protein tƣơng ứng.

Bảng 4.1 Tổng số trình tự trong CSDL gene hsp-70RT-RNaseH Họ Số trình tự gene Số trình tự protein Closteroviridae 125 125 Caulimoviridae 200 200 Bảng 4.2 Số trình tự gene hsp-70 Họ Genus Species Số trình tự Closteroviridae Ampelovirus

Grapevine leafroll-associated virus 1 45

Grapevine leafroll-associated virus 3 16

Grapevine leafroll-associated virus 9 2

Closterovirus

Beet yellows virus 3

Apricot stem pitting asso 3

Mint virus 1 4

Citrus tristeza virus 6

Little cherry virus 1 2

Grapevine leafroll-associated virus 2 2

Crinivirus

Sweet potato chlorotic stunt virus 16

Cucurbit yellow stunting disorder

virus 3

Tomato infectious chlorosis virus 9

Potato yellow vein virus 7

Tomato chlorosis virus 4

Beet pseudo-yellows virus 3

Tổng số trinh tự 125

Tƣơng tự, số trình tự về protein của họ Closteroviridae cũng thu nhận đƣợc với số lƣợng tƣơng ứng với gene hsp-70 (mỗi trình tự điều có một trình tự protein tƣơng ứng trong CSDL).

Bảng 4.3 Số trình tự gene RT-RNaseH

Họ Genus Species Số trình tự

Caulimoviridae Badnavirus (adsbygoogle = window.adsbygoogle || []).push({});

Banana streak Obino l'Ewai virus 13

Banana streak Goldfinger virus 10

Banana streak Uganda A virus 11

Banana streak Uganda B virus 2

Banana streak Uganda C virus 1

Banana streak Uganda D virus 2

Banana streak Uganda E virus 3

Banana streak Uganda F virus 2

Banana streak Uganda G virus 2

Banana streak Uganda H virus 2

Banana streak Uganda I virus 26

Banana streak Uganda J virus 4

Banana streak Uganda K virus 4

Banana streak Uganda L virus 20

Banana streak Uganda M virus 32

Banana streak virus 1

Rubus yellow net virus 2

Stilbocarpa mosaic bacilliform

virus 1

Banana streak OL virus 2

Taro bacilliform virus 9

Citrus yellow mosaic virus 2

Bougainvillea spectabilis chlorotic

vein-banding virus 1 Pineapple bacilliform virus 1

Sugarcane bacilliform virus 1

Cacao swollen shoot virus 5

Kalanchoe top-spotting virus 1

Banana streak virus strain

Acuminata Vietnam 1 Banana streak Mys virus 1

Caulimovirus (adsbygoogle = window.adsbygoogle || []).push({});

Cauliflower mosaic virus 8

Blueberry red ringspot virus 2

Dahlia mosaic virus 2

Carnation etched ring virus 2

Horseradish latent virus 1

Peanut chlorotic streak virus 2

Cassava vein mosaic virus 2

Figwort mosaic virus 2

Petuvirus Petunia vein clearing virus 4

Soymovirus

Peanut chlorotic streak virus 2

Soybean chlorotic mottle virus 2

Tổng số trình tự 200

Trong CSDL chứa hai đối tƣợng chính thì còn chứa đối tƣợng phụ nhằm cung cấp các thông tin khác để bổ sung cho hai đối tƣợng chính nhƣ: tên tác giả, tên bài báo, cây phân loài,…

CSDL về hai gene hsp-70RT-RNaseH, rất tiện ích cho việc truy xuất, nghiên cứu các thông tin liên quan đến trình tự DNA, protein, loài, các đặc trƣng của từng loài chứa hai gene này, tiết kiệm thời gian tìm hiểu, nắm bắt thông tin nhanh. CSDL này đƣợc xây dựng trên hai gene khá bảo tồn ở hai loài nên chúng ta có thể dựa vào các thông tin trong CSDL để nghiên cứu các hiện tƣợng biến chủng trong họ, giúp đƣa ra các kết luận chính xác về các biến chủng xảy ra ở trên hai gene này. Nhƣng CSDL nhỏ, chỉ có 325 trình tự gene hsp-70RT-RNaseH ở hai họ virus, chứa lƣợng thông tin ít và chƣa có chế độ bảo mật. Ở cấp độ phòng thí nghiệm, cơ quan nghiên cứu hay trƣờng đại học thì việc xây dựng CSDL cho từng đối tƣợng (về một gene, một sinh vật,…) thì rất tiện ích để phục vụ cho các nghiên cứu về một đối tƣợng nhất định.

46

Một phần của tài liệu Xây dựng cơ sở dữ liệu Gene (Trang 54 - 58)