CSDL Nucleotide (Nucleotide Databases)

Một phần của tài liệu Giới thiệu về internet và sự ra đời của tin sinh học (Trang 69 - 79)

c/ CSDL Nucleotide (Nucleotide Databases)

 CSDL trỡnh tự nucleotide của EMBL là một thành viờn cỏc CSDL trỡnh tự nucleotide của EMBL là một thành viờn cỏc nước chõu Âu trong 3 CSDL lớn nhất thế giới. Cú thể truy nước chõu Âu trong 3 CSDL lớn nhất thế giới. Cú thể truy cập vào hàng trăm trỡnh tự genom hoàn chỉnh cựng với cỏc cập vào hàng trăm trỡnh tự genom hoàn chỉnh cựng với cỏc

sản phẩm protein dịch mó nhờ mỏy chủ của EBI. sản phẩm protein dịch mó nhờ mỏy chủ của EBI.

ASD: ASD: CSDL phõn cắt nảy sinhCSDL phõn cắt nảy sinh ( (Alternative Splicing Alternative Splicing Database) chứa dữ liệu về cỏc exon phõn cắt phỏt sinh Database) chứa dữ liệu về cỏc exon phõn cắt phỏt sinh cựng với cỏc thụng tin bổ sung đi kốm. Dự ỏn ASD nhằm cựng với cỏc thụng tin bổ sung đi kốm. Dự ỏn ASD nhằm hiểu rừ hơn về cơ chế cắt ghộp nảy sinh ở quy mụ genome. hiểu rừ hơn về cơ chế cắt ghộp nảy sinh ở quy mụ genome.

ATD: CSDL đa dạng về cỏc bản phiờn mó nảy sinh (Alternate Transcript Diversity Database ATD) chứa dữ liệu về cỏc bản phiờn mó trong đú mỗi bản phiờn mó được mụ tả cho một dạng cắt ghộp nảy sinh và sự polyadenyl húa nảy sinh (alternative polyadenylation).

EMBL-Align database: CSDL so sỏnh nhiều trỡnh tự.

EMBL-Bank: Ngõn hàng EMBL cũn được gọi là CSDL trỡnh tự nucleotide EMBL, đúng gúp vào nguồn trỡnh tự nucleotide sơ cấp của chõu Âu.

EMBL CDS: là một CSDL của trỡnh tự nucleotide của trỡnh tự mó húa (CDS coding sequence)

Ensembl: Mụ tả tự động của cỏc genome eukaryote.

Genomes Server: một cỏi nhỡn tổng quan của cỏc genom hoàn chỉnh ở EBI. Những trang web này cho phộp truy cập với một số lượng lớn cỏc genom hoàn chỉnh.

Genome Reviews: CSDL genom được chỉnh sửa bao gồm cỏc phiờn bản chớnh xỏc của cỏc mục tra cứu (entry) genom hoàn chỉnh từ CSDL trỡnh tự nucleotide của EMBL/GenBank/DDBJ

Karyn's Genomes: thu thập và mụ tả một số trỡnh tự genom.

IMGT/HLA: CSDL di truyền miễn dịch, bao gồm CSDL IMGT/HLA của phức hệ phự hợp tổ chức (MHC). CSDL di truyền miễn dịch IMGT/LIGM bao gồm CSDL IMGT/LIGM của cỏc Ig và cỏc thụ thể tế bào T.

IPD: CSDL đa hỡnh miễn dịch (Immuno Polymorphism Database IPD), bao gồm cỏc gen đa hỡnh của hệ thống miễn dịch, chẳng hạn như KIR, HPA và MHC khụng phải của người.

LGICdb: CSDL cỏc chất gắn cỏc kờnh Ion (Ligand Gated Ion Channel Database)

Mutations: Dự ỏn CSDL sự đa hỡnh trỡnh tự (Sequence variation database project)

Parasites: CSDL genome ký sinh (Parasite Genome databases).

d/ CSDL protein (Protein Databases)d/ CSDL protein (Protein Databases)

EBI đó phỏt triển và duy trỡ một số CSDL protein cú liờn EBI đó phỏt triển và duy trỡ một số CSDL protein cú liờn

quan với nhau. Danh sỏch của cỏc dự ỏn và CSDL: quan với nhau. Danh sỏch của cỏc dự ỏn và CSDL:

CluSTr:CluSTr: Đề xuất một sự phõn loại tự động của Đề xuất một sự phõn loại tự động của UniProtKB/Swiss-Prot + UniProtKB/TrEMBL.

UniProtKB/Swiss-Prot + UniProtKB/TrEMBL.

CSA:CSA: Tập hợp cỏc vị trớ xỳc tỏc (Catalytic Site Atlas) là Tập hợp cỏc vị trớ xỳc tỏc (Catalytic Site Atlas) là một nguồn của cỏc vị trớ xỳc tỏc và cỏc gốc được tỡm thấy một nguồn của cỏc vị trớ xỳc tỏc và cỏc gốc được tỡm thấy

ở cỏc enzym bằng cỏch sử dụng CSDL cấu trỳc. ở cỏc enzym bằng cỏch sử dụng CSDL cấu trỳc.

GO: GO: Cỏc trang của hiệp hội Gene Ontology của EBI.Cỏc trang của hiệp hội Gene Ontology của EBI.

GOAGOA: Cung cấp cỏc thụng tin về sản phẩm gen vào : Cung cấp cỏc thụng tin về sản phẩm gen vào nguồn GO

nguồn GO..

HPIHPI: Cỏc proteomic của người ban đầu (Human : Cỏc proteomic của người ban đầu (Human Proteomics Initiative) là một khởi xướng bởi SIB và EBI Proteomics Initiative) là một khởi xướng bởi SIB và EBI để mụ tả tất cả cỏc trỡnh tự đó biết của người theo tiờu để mụ tả tất cả cỏc trỡnh tự đó biết của người theo tiờu

chuẩn chất lượng của UniProtKB/Swiss-Prot. chuẩn chất lượng của UniProtKB/Swiss-Prot.

IntActIntAct: Là một CSDL đi kốm với hệ thống phõn tớch, nú : Là một CSDL đi kốm với hệ thống phõn tớch, nú cung cấp một giao diện truy vấn và một module để phõn cung cấp một giao diện truy vấn và một module để phõn

tớch cỏc dữ liệu. tớch cỏc dữ liệu. (adsbygoogle = window.adsbygoogle || []).push({});

IntEnz:IntEnz: CSDL liờn quan giữa cỏc enzym (Integrated CSDL liờn quan giữa cỏc enzym (Integrated relational Enzyme database) chứa cỏc dữ liệu enzym relational Enzyme database) chứa cỏc dữ liệu enzym được chứng nhận bởi hội đồng định tờn (Nomenclature được chứng nhận bởi hội đồng định tờn (Nomenclature Committee) với mục đớch là để tạo ra một CSDL cỏc Committee) với mục đớch là để tạo ra một CSDL cỏc

enzym cú mối quan hệ đơn. enzym cú mối quan hệ đơn.

InterPro: InterPro: CSDL là một sự kết hợp của nguồn tài liệu CSDL là một sự kết hợp của nguồn tài liệu trớch dẫn cho cỏc họ proein, cỏc domain và cỏc vị trớ hoạt trớch dẫn cho cỏc họ proein, cỏc domain và cỏc vị trớ hoạt

động. động.

IPI:IPI: (International Protein Index) một hệ thống proteom (International Protein Index) một hệ thống proteom khụng dư thừa (non-redundant) được xõy dựng từ khụng dư thừa (non-redundant) được xõy dựng từ UniProtKB/Swiss-Prot, UniProtKB/TrEMBL, Ensembl và UniProtKB/Swiss-Prot, UniProtKB/TrEMBL, Ensembl và

RefSeq. RefSeq.

PANDITPANDIT: là một bộ cỏc chương trỡnh so sỏnh trỡnh tự và : là một bộ cỏc chương trỡnh so sỏnh trỡnh tự và xõy dựng cõy phõn loại.

Proteome Analysis: Proteome Analysis: Phõn tớch so sỏnh và thống kờ cỏc Phõn tớch so sỏnh và thống kờ cỏc proteom của cỏc sinh vật.

proteom của cỏc sinh vật.

UniProtUniProt: Nguồn Protein phổ biến cho cỏc trỡnh tự protein : Nguồn Protein phổ biến cho cỏc trỡnh tự protein và trung tõm của cỏc CSDL protein cho cỏc ngõn hàng và trung tõm của cỏc CSDL protein cho cỏc ngõn hàng

CSDL khỏc. CSDL khỏc.

UniProt ArchiveUniProt Archive:: Một phần trỡnh tự protein được trớch Một phần trỡnh tự protein được trớch ra từ CSDL cụng khai chỉ chứa cỏc trỡnh tự protein.

ra từ CSDL cụng khai chỉ chứa cỏc trỡnh tự protein.

UniProt/UniRefUniProt/UniRef Features clustering of similar Features clustering of similar sequences to yield a representative subset of sequences. sequences to yield a representative subset of sequences.

This produces very fast search times. This produces very fast search times.

UniProtKB/Swiss-ProtUniProtKB/Swiss-Prot: CSDL trỡnh tự protein được mụ : CSDL trỡnh tự protein được mụ tả, một phần của UniProtKB.

tả, một phần của UniProtKB.

UniProtKB/TrEMBL: UniProtKB/TrEMBL: Một CSDL protein được tạo ra Một CSDL protein được tạo ra bằng mỏy tớnh, là một phần của UniProtKB.

Một phần của tài liệu Giới thiệu về internet và sự ra đời của tin sinh học (Trang 69 - 79)