Khai thác và x lý thơng tin

Một phần của tài liệu Hỗ trợ định danh nấm ký sinh côn trùng dựa trên phân tích phả hệ vùng gen RPB1 (Trang 25 - 26)

Hi n nay cĩ r t nhi u d ng c s d li u thu c nhi u l nh v c v c sinh h c khác nhau, trong đĩ d li u v sinh h c phân t luơn chi m u th do tính đ c thù trong nghiên c u.

Trong nghiên c u sinh h c phân t , th ng xuyên ph i làm vi c trên các đ i t ng là nucleic acid (DNA) và protein. ây là các d ng trình t sinh h c đ c l u ph bi n trong các c s d li u sinh h c. Hi n nay, các thơng tin này đ c l u tr ch y u trong các c s d li u l n trên th gi i nh h th ng GenBank (NCBI, USA), EMBL (European Molecular Biology Laboratory, UK), DDBJ (DNA Database of Janpan, JP) và m t s h th ng c s d li u khác trên th gi i.

C s d li u NCBI

NCBI (National Center for Biotechnology Information) là tài nguyên qu c gia c a M v thơng tin sinh h c phân t . NCBI t o thành và l u tr nh ng c s d

16 li u c ng c ng, qu n lý nghiên c u trong sinh h c tính tốn, phát tri n nh ng cơng c ph n m m thơng tin b gen, ph bi n các thơng tin v Y-Sinh h c... Trang web NCBI liên t c c p nh t thơng tin, t o ra các c s d li u và cơng c m i cho vi c khai thác d li u. NCBI cung c p nhi u kh n ng tìm ki m tài li u, c s d li u phân t , b gen và cơng c tin sinh h c.

M t ch ng trình tìm ki m và so sánh trình t t ng đ ng đ c nhi u ng i dùng nh t hi n nay cĩ tên là BLAST (Basic Local Alignment Search Tool) trên NCBI. Ch ng trình này th c hi n so sánh trình t DNA và protein nh p vào v i nh ng trình t trong c s d li u (GenBank, EMBL...) và l a ch n các trình t cĩ m c đ t ng đ ng t cao đ n th p. Ch ng trình BLAST giúp chúng ta nhanh chĩng tìm ra nh ng trình t sinh h c t ng đ ng (n u cĩ) v i trình t b n yêu c u. Ngồi ra, BLAST cịn cung c p nh ng s li u v t l t ng đ ng, ngu n g c các trình t t ng đ ng...

B ng 1.1. Các ch c n ng Blast trên NCBI

Tên Nh p vào K t qu c s d li u

Blastp Protein Protein

Blastn Nucleic acid Nucleic acid

Blastx Nucleic acid ( đ c d ch mã) Protein

Tblastn Protein Nucleic acid ( đ c d ch mã)

Tblastx Nucleic acid( đ c d ch mã) Nucleic acid ( đ c d ch mã)

Một phần của tài liệu Hỗ trợ định danh nấm ký sinh côn trùng dựa trên phân tích phả hệ vùng gen RPB1 (Trang 25 - 26)