- NCBI (USA); NCBI (USA);
10.276.161 bản ghi trỡnh tự ở nhỏnh WGS vào 8/2005.
10.276.161 bản ghi trỡnh tự ở nhỏnh WGS vào 8/2005.
Chẳng hạn, chỳng ta cú thể xem bản ghi cho một gen của Chẳng hạn, chỳng ta cú thể xem bản ghi cho một gen của
Saccharomyces cerevisiae
Saccharomyces cerevisiae thỡ GenBank đó cung cấp đầy đủ. thỡ GenBank đó cung cấp đầy đủ.
Cứ sau 2 thỏng, một phiờn bản update được đưa ra.
Cứ sau 2 thỏng, một phiờn bản update được đưa ra.
GenBank là một phần của (International Nucleotide GenBank là một phần của (International Nucleotide Sequence Database Collaboration) bao gồm ở DDBJ, EMBL
Sequence Database Collaboration) bao gồm ở DDBJ, EMBL
và NCBI. Ba tổ chức này trao đổi dữ liệu với nhau hàng
và NCBI. Ba tổ chức này trao đổi dữ liệu với nhau hàng
ngày.
Trong lần cụng bố gần đõy nhất, INSDC cho biết CSDL Trong lần cụng bố gần đõy nhất, INSDC cho biết CSDL trỡnh tự DNA đó vượt quỏ 100 Gb. GenBank là một thành
trỡnh tự DNA đó vượt quỏ 100 Gb. GenBank là một thành
viờn quan trọng đúng gúp cho mức này và tất nhiờn đú là
viờn quan trọng đúng gúp cho mức này và tất nhiờn đú là
kết quả đúng gúp của rất nhiều cỏc nhà khoa học trờn toàn
kết quả đúng gúp của rất nhiều cỏc nhà khoa học trờn toàn
thế giới.
thế giới.
dbESTdbEST (data base of Expressed Sequence Tags): Theo (data base of Expressed Sequence Tags): Theo
Nature Genetics 4:332-3; 1993 thỡ dbEST là một tập hợp
Nature Genetics 4:332-3; 1993 thỡ dbEST là một tập hợp
của cỏc trỡnh tự đeo thẻ hoặc cỏc trỡnh tự ngắn, duy nhất
của cỏc trỡnh tự đeo thẻ hoặc cỏc trỡnh tự ngắn, duy nhất
lấy từ mRNA (cDNA). dbEST cũng là một nhỏnh của
lấy từ mRNA (cDNA). dbEST cũng là một nhỏnh của
GenBank.
dbGSSdbGSS (data base of Genome Survey Sequences): cũng là (data base of Genome Survey Sequences): cũng là một nhỏnh của GenBank nhưng khỏc với dbEST là hầu hết
một nhỏnh của GenBank nhưng khỏc với dbEST là hầu hết
cỏc trỡnh tự đều cú nguồn gốc từ genomic chứ khụng phải là
cỏc trỡnh tự đều cú nguồn gốc từ genomic chứ khụng phải là
cDNA (mRNA). Nhỏnh dbGSS chứa cỏc dạng dữ liệu sau:
cDNA (mRNA). Nhỏnh dbGSS chứa cỏc dạng dữ liệu sau:
•Single - pass genom sequence
•Cỏc trỡnh t t n cựng c a cosmid/BAC/YACự ậ ủ
•Cỏc trỡnh t Alu PCRự
•Cỏc trỡnh t transposon đự ược đeo th ẻ
(transposon –tagged).
dbSNPdbSNP (data base of Single-base Nucleotide Polymorphism): (data base of Single-base Nucleotide Polymorphism): là CSDL cỏc đa hỡnh do sự thay thế hoặc thờm, bớt một
là CSDL cỏc đa hỡnh do sự thay thế hoặc thờm, bớt một
nucleotide.
RefSeq: RefSeq: CSDL của cỏc trỡnh tự tra cứu khụng cú sự dư thừa CSDL của cỏc trỡnh tự tra cứu khụng cú sự dư thừa (non-redundant reference sequence) bao gồm: cỏc đoạn
(non-redundant reference sequence) bao gồm: cỏc đoạn
contig DNA genom, cỏc mRNA, cỏc protein của cỏc gen đó
contig DNA genom, cỏc mRNA, cỏc protein của cỏc gen đó
biết.
biết.
dbSTSdbSTS (data base of sequence tagged sites): CSDL của cỏc (data base of sequence tagged sites): CSDL của cỏc
vị trớ trỡnh tự được đeo thẻ hoặc cỏc trỡnh tự ngắn thường
vị trớ trỡnh tự được đeo thẻ hoặc cỏc trỡnh tự ngắn thường
chỉ cú mặt một lần duy nhất trong genom.
chỉ cú mặt một lần duy nhất trong genom.
UniSTS: UniSTS: là một cơ sở dữ liệu toàn diện của cỏc STS (cỏc vị là một cơ sở dữ liệu toàn diện của cỏc STS (cỏc vị
trớ đỏnh dấu trỡnh tự) được lấy từ cỏc bản đồ STS và cỏc thớ
trớ đỏnh dấu trỡnh tự) được lấy từ cỏc bản đồ STS và cỏc thớ
nghiệm khỏc.
nghiệm khỏc.
UniGene:UniGene: Tập hợp của cỏc trỡnh tự EST và cỏc trỡnh tự Tập hợp của cỏc trỡnh tự EST và cỏc trỡnh tự
mRNA cú chiều dài đầy đủ được nhúm vào cỏc cụm và mỗi
mRNA cú chiều dài đầy đủ được nhúm vào cỏc cụm và mỗi
cụm đại diện cho một gene duy nhất được biết hoặc gene
cụm đại diện cho một gene duy nhất được biết hoặc gene
người được mụ tả cựng với bản đồ và những thụng tin về
người được mụ tả cựng với bản đồ và những thụng tin về
quỏ trỡnh biểu hiện gen.
dbHTGdbHTG (data base of high-throughput genom (data base of high-throughput genom sequence):