Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 39 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
39
Dung lượng
2,64 MB
Nội dung
Người hướng dẫn: TS.VÕ VĂN TOÀN
Người thực hiện: TRẦN THỊ PHƯƠNG
ANH
Lớp: Sinhhọc thực nghiệm khóa 15
1. CƠ SỞ DỮLIỆUSINH HỌC
CHƯƠNG II.TÌMKIẾMDỮLIỆUSINH HỌC
1.1. Khái quát chung về cơ sở dữliệusinh học
Cơ sở dữliệusinhhọc (CSDL) trong chương này chủ
yếu đề cập đến các thông tin về trình tự Axit nucleic
(ADN, ARN), trình tự axit amin của các phân tử Protein,
thông tin về cấu trúc và giải phẫu của một số Genom, mô
hình cấu trúc không gian của các đại phân tử.
CHƯƠNG II.TÌMKIẾMDỮLIỆUSINH HỌC
1.1. Khái quát chung về cơ sở dữliệusinh học
1.2. Cơ sở dữliệu về các trình tự
1. CƠ SỞ DỮLIỆUSINH HỌC
Năm cơ sở dữliệu trình tự chính trên mạng Internet cung
cấp thông tin về trình tự Nucleotide và Protein:
-
The EMBL Nucleotide Sequence Database
-
The GenBank sequence database
-
The DNA Data Bank of Japan (DDBJ)
-
The Swiss-Prot
-
Protein Information Resource (PIR)
1.2. Cơ sở dữliệu về các trình tự
Năm cơ sở dữliệu trình tự chính trên mạng Internet cung
cấp thông tin về trình tự nucleotide và protein:
1.2. Cơ sở dữliệu về các trình tự
a.EMBL Cơ sở dữliệu trình tự nucleotide (còn được gọi
là ngân hàng EMBL) cấu thành tài nguyên trình tự
nucleotide chính của châu Âu.
CSDL của EMBL/EBI
Năm cơ sở dữliệu trình tự chính trên mạng Internet cung
cấp thông tin về trình tự nucleotide và protein:
1.2. Cơ sở dữliệu về các trình tự
a. EMBL Cơ sở dữliệu trình tự nucleotide (còn được gọi
là ngân hàng EMBL) cấu thành tài nguyên trình tự
nucleotide chính của châu Âu.
b. GenBank là một phần của chương trình hợp tác quốc tế
về cơ sở dữliệu trình tự nucleotide, bao gồm ngân hàng dữ
liệu ADN của Nhật Bản (DDBJ), Phòng thí nghiệm Sinhhọc
phân tử châu Âu (EMBL), và GenBank tại NCBI.
b. GenBank là một phần của chương trình hợp tác quốc tế
về cơ sở dữliệu trình tự nucleotide, bao gồm ngân hàng dữ
liệu ADN của Nhật Bản (DDBJ), Phòng thí nghiệm Sinhhọc
phân tử châu Âu (EMBL), và GenBank tại NCBI.
GenBank là một bộ sưu tập của tất cả các trình tự DNA
được công khai. Trong GenBank các cá nhân, các nhà khoa
học từ khắp nơi trên thế giới, cũng như từ các trung tâm lớn
tham gia vào dự án nghiên cứu bộ gen con người. Số lượng
các trình tự DNA được lưu trữ trong cơ sở dữliệu GenBank,
từ tất cả các sinh vật, gần đây đã đạt đến số lượng khổng lồ
và tiếp tục phát triển với một tốc độ nhanh chóng.
Năm cơ sở dữliệu trình tự chính trên mạng Internet cung
cấp thông tin về trình tự nucleotide và protein:
1.2. Cơ sở dữliệu về các trình tự
a. EMBL
b. GenBank
c. DDBJ
Ngân hàng dữliệu DNA của Nhật Bản là ngân hàng dữ
liệu về các trình tự nucleotide duy nhất ở châu Á, đó là nơi
chính thức thu thập trình tự nucleotide được tìm ra bởi các
nhà nghiên cứu .Cơ sở dữliệu này trao đổi các dữliệu thu
thập với Cơ sở dữliệu EMBL viện tinsinhhọc châu âu
và GenBank / NCBI trên cơ sở hàng ngày, ba cơ sở dữliệu
chia sẻ dữliệu hầu như tất cả dữliệutại bất kỳ thời gian nào.
CSDL của DDBJ
[...]... sở dữliệu y sinhhọc NIH là cơ sở nghiên cứu y sinhhọc lớn nhất trên thế giới CSDL của NCBI CHƯƠNG II TÌMKIẾMDỮLIỆUSINHHỌC 1 CƠ SỞ DỮLIỆUSINHHỌC 1.1 Khái quát chung về cơ sở dữliệusinhhọc 1.2 Cơ sở dữliệu về các trình tự Trình tự DNA GenBank http://www.ncbi.nlm.nih.gov/Genbank/GenbankOverview.html Cơ sở dữliệu Nucleotide EMBL http://www.ebi.ac.uk/embl/index.html DDBJ (ngân hàng dữ liệu. .. http://www.expasy.uniprot.org CHƯƠNG II TÌMKIẾMDỮLIỆUSINHHỌC 1 CƠ SỞ DỮLIỆUSINHHỌC 1.1 Khái quát chung về cơ sở dữliệusinhhọc 1.2 Cơ sở dữliệu về các trình tự Protein cấu trúc Ngân hàng dữliệu protein (PDB) http://www.rcsb.org/pdb/ cơ sở dữliệu Mô hình hóa phân tử (NCBI) http://www.ncbi.nlm.nih.gov/Structure/MMDB/mmdb.html Protein cấu trúc: Ngân hàng dữliệu protein (PDB) http://www.rcsb.org/pdb/... http://www.ebi.ac.uk/embl/index.html DDBJ (ngân hàng dữliệu DNA Nhật Bản) http://www.ddbj.nig.ac.jp/ CHƯƠNG II TÌMKIẾMDỮLIỆUSINHHỌC 1 CƠ SỞ DỮLIỆUSINHHỌC 1.1 Khái quát chung về cơ sở dữliệusinhhọc 1.2 Cơ sở dữliệu về các trình tự Trình tự Protein UniProt (Universal Resource Protein) http://www.expasy.uniprot.org bao gồm SWISS-PROT, TrEMBL, PIR Cơ sở dữliệu protein (NCBI) http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Protein... http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=genomeprj Thông tin về bộ gen của một số loài (con người, cây Arabidopsis, Saccharomyces cerevisiae) được cung cấp bởi MIPS (http://mips.gsf.de ) The Munich Information Center Protein Sequences CHƯƠNG II TÌMKIẾMDỮLIỆUSINHHỌC 1 CƠ SỞ DỮLIỆUSINHHỌC 1.1 Khái quát chung về cơ sở dữliệusinhhọc 1.2 Cơ sở dữliệu về các trình tự NCBI thành lập vào ngày 04 Tháng... giới để hỗ trợ các dữliệu protein và di truyền CSDL của PIR CHƯƠNG II TÌMKIẾMDỮLIỆUSINHHỌC 1 CƠ SỞ DỮLIỆUSINHHỌC 1.1 Khái quát chung về cơ sở dữliệusinhhọc 1.2 Cơ sở dữliệu về các trình tự Trong thập niên 70, các phương pháp cô lập trình tự ADN đã được thành lập và ý tưởng về lập bản đồ toàn bộ bộ gen được hình thành Một số loài sinh vật (virút, E.coli, nấm men, ruồi giấm) đã nhanh chóng... Fasta-Genome server Tìmkiếm bằng Fasta trong máy chủ genome Fasta-WGS server Tìmkiếm bằng Fasta trong máy chủ WGS (các genome thu được bằng phương pháp shotgun Whole genome shotgun - WGS) Các công cụ tìmkiếm chuyên biệt cho DNA Công cụ Ứng dụng, mô tả Blast2-ASD Tìmkiếm trình tự giống nhau nhờ máy chủ Blast2-ASD Blast2-Parasite Tìmkiếm trình tự giống nhau nhờ máy chủ Parasite Genomes blast Fasta-ASD... Hai chương trình có thể được sử dụng để tìm kiếm, so sánh mức độ giống nhau và mức độ tương đồng suy diễn là BLAST or Fasta Công cụ tìmkiếm DNA và Protein chung Công cụ Ứng dụng, mô tả Blast2-WU Protein Tìm kiếm CSDL protein (Blast 2.0 with gaps) của Washington University Blast2-WU Nucleotide Tìmkiếm CSDL nucleotide (Blast 2.0 with gaps) Washington University Blast2-NCBI Protein Chương trình tìm kiếm. .. liệu có thể được tìmkiếm có hệ thống, bởi các từ khoá, hoặc bằng trình tự giống nhau 1.3 Cơ sở dữliệu về các tác phẩm và sáng chế Các trình duyệt Entrez cũng cung cấp khả năng tìmkiếm MEDLINE (cơ sở dữliệu về y học) (http://www.ncbi.nlm.nih.gov/entrez/query.fcgi) một cơ sở dữliệu về ấn phẩm sinhhọc và y tế có thể được truy cập tại Thư viện Y khoa Quốc gia Trích dẫn bao gồm cả thông tin về trình... (http://bioinformatics.ubc.ca/resources/links_directory/) là một nguồn tài nguyên cộng đồng trực tuyến có chứa các công cụ, cơ sở dữ liệu, tài nguyên cho tinsinhhọc và nghiên cứu sinhhọc phân tử 2 CÁC CÔNG CỤ TÌM KIẾM, PHÂN TÍCH CÁC CSDL 2.1 Công cụ của EMBL/EBI a/ Similarity & Homology: Công cụ phân tích mức độ giống nhau và tương đồng giữa các trình tự • Các công cụ như: Fasta, Blast, MPsrch và Scanps Dạng tìm kiếm và kết quả trả về qua... 1.2 Cơ sở dữliệu về các trình tự Năm cơ sở dữliệu trình tự chính trên mạng Internet cung cấp thông tin về trình tự nucleotide và protein: a EMBL b GenBank c DDBJ d Swiss-Prot e The Protein Information Resource (PIR) được tích hợp tài nguyên sinhhọc công cộng để hỗ trợ nghiên cứu di truyền, protein và nghiên cứu khoa học Hiện nay, PIR cung cấp các nguồn lực hàng đầu thế giới để hỗ trợ các dữliệu protein .
Lớp: Sinh học thực nghiệm khóa 15
1. CƠ SỞ DỮ LIỆU SINH HỌC
CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC
1.1. Khái quát chung về cơ sở dữ liệu sinh học
Cơ sở dữ liệu.
Sequences.
1. CƠ SỞ DỮ LIỆU SINH HỌC
CHƯƠNG II. TÌM KIẾM DỮ LIỆU SINH HỌC
1.1. Khái quát chung về cơ sở dữ liệu sinh học
1.2. Cơ sở dữ liệu về các trình