gene 16S và 23S rRNA
Sơ đồ tóm tắt quá trình thu nhận nhƣ sau:
Sơ đồ tóm tắt quá trình thu nhận mẫu tin của hai gene 16S và 23S rRNA
Các bƣớc thực hiện cụ thể nhƣ sau:
– Từ trình duyệt web ta vào trang Home Page của NCBI theo địa chỉ:
http://www.ncbi.nlm.nih.gov/ . Trong khung Search chọn Nucleotide. – Nhập từ khóa tìm kiếm trong khung for
Từ khóa sử dụng lần lƣợt cho từng gene là:„16S ribosomal RNA gene complete sequence NOT 23S‟ và „23S ribosomal RNA gene complete sequence NOT 16S‟
– Nhấn nút Go hoặc Enter để tìm kiếm.
Dùng Perl script tải về tất cả các trình tự có ACCESSION NUMBER
của hai gene 16S và 23S rRNA
TỪ KHÓA
ACCESSION NUMBER
NCBI
Toàn bộ thông tin về trình tự gene 16S và 23S rRNA
Hình 3.1.Tìm kiếm bằng từ khóa trong trang Home Pagecủa NCBI
Kết quả tìm kiếm đƣợc trình bày nhƣ hình sau
Hình 3.2. Trang kết quả tìm kiếm bằng từ khóa chogene 16S rRNA
Hình 3.3.Kết quả tìm kiếm thể hiện ở dạng text
– Chỉ chọn những mã số truy cập có phần tóm tắt phía dƣới là “complete sequence”, không lấy những mã số truy cập có phần tóm tắt là “partial sequence”.
– Dùng ngôn ngữ Perl để viết script tách lấy tất cả mã số truy cập và lƣu vào một file dạng (.txt)
Hình 3.4.File text chứa mã số truy cập
– Từ những mã số truy cập tách đƣợc ở bƣớc trên viết script kết nối với CSDL GenBank, tải về những mẫu tin chứa trình tự và thông tin liên quan của gene.
Tất cả các mẫu tin tải về đƣợc lƣu trong hai thƣ mục tƣơng ứng cho hai gene.
Chi tiết một mẫu tin thu đƣợc nhƣ hình dƣới đây
Hình 3.6.Một mẫu tin của gene 16S rRNAcó mã số truy cập AB016268
LOCUS AB016268 1524 bp DNA linear BCT 10-MAY-2000 DEFINITION Alteromonas sp. gene for 16S rRNA, strain NIBH P3M26, complete sequence.
ACCESSION AB016268
VERSION AB016268.1 GI:6691642 KEYWORDS 16S rRNA; 16S ribosomal RNA. SOURCE Alteromonas sp.
ORGANISM Alteromonas sp.
Bacteria; Proteobacteria; Gammaproteobacteria; Alteromonadales; Alteromonadaceae; Alteromonas.
REFERENCE 1 (sites)
AUTHORS Maruyama,A., Honda,D., Yamamoto,H., Kitamura,K. and Higashihara,T. TITLE Phylogenetic analysis of psychrophilic bacteria isolated from the Japan Trench, including a description of the deep-sea species Psychrobacter pacificensis sp. nov
JOURNAL Int. J. Syst. Evol. Microbiol. 50 Pt 2, 835-846 (2000) PUBMED 10758895
REFERENCE 2 (bases 1 to 1524)
AUTHORS Maruyama,A. and Kitamura,K. TITLE Direct Submission
JOURNAL Submitted (16-JUL-1998) Akihiko Maruyama, National Institute of Bioscience and Human-Technology, Department of Applied and
Environmental Microbiology; 1-1 Higashi, Tsukuba, Ibaraki 305-8566, Japan (E-mail:maruyama@nibh.go.jp, Tel:+81-298-54-6062,
Fax:+81-298-54-6412) FEATURES Location/Qualifiers source 1..1524 /organism="Alteromonas sp." /mol_type="genomic DNA" /strain="NIBH P1M3" /db_xref="taxon:232" rRNA 1..1524
/product="16S ribosomal RNA" ORIGIN
1 agagtttgat catggctcag attgaacgct ggcggcaggc ctaacacatg caagtcgagc 61 ggtaacagaa agtagcttgc tactttgctg acgagcggcg gacgggtgag taatgcttgg 121 gaacatgcct tgaggtgggg gacaacagtt ggaaacgact gctaataccg cataatgtct 181 acggaccaaa gggggctcgc tctcgccttt agattggccc aagtgggatt agctagttgg 241 tgaggtaatg gctcaccaag gcaacgatcc ctagctggtt tgagaggatg accagccaca 301 ctggaactga gacacggtcc agactcctac gggaggcagc agtggggaat attgcacaat 361 gggcgaaatg atgcagccat gccgcgtgtg tgaagaaggc cttcgggttg taaagcactt 421 tcagtcagga ggaaagggtg tnagttaata cctcatatct ntgacgttac tgacagaaga 481 agcaccggct aactccgtgc cagcagccgc ggtaatacgg agggtgcgag cgttaatcgg 541 aattactggg cgtaaagcgt acgcaggcgg tttgttaagc gagatgtgaa agccccgggc 601 tcaacctggg aactgcattt cgaactggca aactagagtg tgatagaggg tggtagaatt 661 tcaggtgtag cggtgaaatg cgtagagatc tgaaggaata ccgatggcga aggcagccac 721 ctgggtcaac actgacgctc atgtacgaaa gcgtggggag caaacgggat tagatacccc 781 ggtagtccac gccgtaaacg atgtctacta gaagctcgga acctcggttc tgtttttcaa 841 agctaacgca ttaagtagac cgcctgggcg agtacggccg caaggttaaa actcaaatgg 901 attgacgggg gcccgcacaa gcggtggagc atgtngttta attcgatgca acgcgaagaa 961 ccttacctac acttgacata cagagaactt tctagagata gattggtgcc ttcgggaact 1021 ctgatacagg tgctgcatgg ctgtcgtcag ctcgtgttgt gagatgttgg gttaagtccc 1081 gcaacgagcg caacccctat ccttagttgc tagcaggtaa tgctgagaac tctaaggaga 1141 ctgccggtga taaaccggag gaaggtgggg acgacgtcaa gtcatcatgg cccttacgtg 1201 tagggctaca cacgtgctac aatggcgcat acagagtgct gcgaacctgc gaaggtaagc 1261 gaatcactta aagtgcgtcg tagtccggat tggagtctgc aactcgactc catgaagtcg 1321 gaatcgctag taatcgcgta tcagaatgac gcggtgaata cgttcccggg ccttgtacac 1381 accgcccgtc acaccatggg agtgggttgc tccagaagta gatagtctaa ccctcgggag 1441 gacgtttacc acggagtatt catgactggg gtgaagtcgt aacaaggtag ccctagggga 1501 acctggggtt ggatcacctc ctta