Cơ sở dữ liệu sinh học

Dữ liệu sinh học đang đƣợc thu nhận với tốc độ rất nhanh. Đến tháng 8 năm 2000, ngân hàng dữ liệu GENEBANK đã có 8.214.000 mục liên quan đến các trình tự sinh học DNA và cơ sở dữ liệu SWISS-PROT có 88.166 mục liên quan đến các trình tự protein. Trung bình những sơ sở dữ liệu đang tăng gấp đôi kích thƣớc sau mỗi chu kỳ 15 tháng. Ngoài ra sự ra đời của vô số dự án nghiên cứu gen, xác định cấu trúc protein đƣợc mã hóa trong bộ gen... đã tạo ra một lƣợng lớn thông tin sinh học và thông tin này ngày càng đa dạng và phong phú.

Do dữ liệu sinh học tăng trƣởng mạnh mẽ nên công cụ tin học đã trở thành một phƣơng tiện không thể thiếu trong phân tích xử lý dữ liệu sinh học. Công nghệ thông tin có thể quản lý nguồn dữ liệu khổng lồ, phân tích các dữ liệu đa dạng và luôn biến đổi trong thế giới tự nhiên. Ngành Sinh Tin học đƣợc xem là lĩnh vực nghiên cứu liên ngành nhằm kết hợp các kỹ thuật xử lý, tính toán và tổ chức thông tin bằng thiết bị tin học với các kỹ thuật, công cụ phổ biến trong ngành sinh học phân tử.

Sinh tin học hiện đang là ngành nghiên cứu khoa học khá mới tại Việt Nam , ra đời với mục tiêu xây dựng các công cụ để tính toán , mô phỏng và đƣa ra những chƣơng trình máy tính phục vụ nghiên cứu sinh học.

Có thể tiến hành phân lập SSR từ bất cứ đọan gen mong muốn nào

trên NCBI và các cơ sở dữ liệu sinh học lớn khác

Nếu không có cơ sở dữ liệu EST thì không thể tiến hành phân lập SSR

Một số cơ sở dữ liệu lớn, trực tuyến đã đƣợc xây dựng để cung cấp thông tin cho các nhà nghiên cứu sinh học nhƣ NCBI, EBI, SIB, DDBJ,…

Các chƣơng trình phân tích trình tự