Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 47 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
47
Dung lượng
8,44 MB
Nội dung
TÌMKIẾMTRÌNHTỰSINHHỌCVÀĐĂNG KÝ TRÌNHTỰTRÊN CƠ SỞDỮLIỆU Mục tiêu của bài học Có khả tìmkiếm được những trìnhtựsinhhọc như DNA, RNA, Protein. Đăng ký những trìnhtự đã nghiên cứu được lên Cơ sởdữliệu sinh học bằng phần mềm Sequin. Tìmki m trình t sinh h cế ự ọ 2 Nguyên tắc trong giải trìnhtự Phương pháp Sanger: là phương pháp dựa trên sự tổng hợp gián đoạn DNA. Dựa theo phương pháp này chúng ta có thể xác định được trìnhtự nucleotide của DNA hay RNA (ATGC… TTT) 3 Tìmki m trình t sinh h cế ự ọ Nhiễm sắc thể, DNA, Gene, Nucleotide Gi i thi u môn h cớ ệ ọ 4 Gửi trìnhtự lên Genebank của NCBI Trìnhtự đã giải Gi i thi u môn h cớ ệ ọ 5 Đưa vào cơ sởdữliệu sinh học: -NCBI - Các cơ sởdữliệu khác Sequin Nguyên tắc tìmkiếmtrìnhtự sau khi đã giải trìnhtự 1.Tìm bằng từ khóa: 2.Công cụ tìmkiếm -Mã số truy cập -Tên (gene hay Protein) -GI -Độ dài trìnhtự -Trọng lượng phân tử -Tên tác giả giải trìnhtự 3. Lọc trìnhtự 6 Tìmki m trình t sinh h cế ự ọ Kết quả cần tìm Kết quả cần tìmTìmki m trình t sinh h cế ự ọ 7 Tìmkiếmtrìnhtựsinhhọc qua NCBI Click Tìmki m trình t sinh h cế ự ọ 8 Tìmkiếmtrìnhtự DNA Tìmkiếmtrìnhtự qua mã số truy cập Tìmki m trình t sinh h cế ự ọ 9 Mã số truy cập của một trìnhtự là mã số do các nhà quản trị CSDLSH đặt cho một trình tự, thường códạng : 8 ký tự : 2 chữ và 6 số ví dụ như AY690640 6 ký tự : 1 chữ và 5 số ví dụ như U20068 TÌMKIẾMTRÌNHTỰSINHHỌC QUA MÃ SỐ TRUY CẬP Tìmki m trình t sinh h cế ự ọ 10 [...]... Công trình này được đăng tải bởi tạp chí nào? Tác giả là ai? Trả lời 2: Giới thiệu môn học 21 Tìmkiếmtrìnhtự protein Tìmkiếmtrìnhtựsinhhọc 22 Tìmkiếmtrìnhtự qua tên sinh vật Giới thiệu môn học 23 Định dạngtrìnhtựdạng FASTA Giới thiệu môn học 24 Thẻ giới hạn phạm vi tìmkiếmtrìnhtự protein [ALL] : Tất cả các trường tìmkiếm [ACCN] : Mã số truy cập của trìnhtự - Accession...Kết quả tìmtrìnhtự DNA qua mã số truy cập Giới thiệu môn học 11 Tìmkiếmtrìnhtự qua tên gene Tìmkiếmtrìnhtựsinhhọc 12 Tìmkiếmtrìnhtựsinhhọc 13 Cách lấy trìnhtự theo định dang FASTA Giới thiệu môn học 14 Định dạng FASTA FASTA là một giải thuật bắt cặp trìnhtự được David J Lipman và William R Pearson miêu tả lần đầu tiên vào năm 1985 (Rapid and sensitive protein... trìnhtự protein là độc tố bền nhiệt có tên là ST (ST toxin) Câu hỏi: Có bao nhiêu mục bài liên quan đến trìnhtự protein yêu cầu được tìm thấy Trìnhtự protein ST toxin chủ yếu liên quan đến loài nào ? Đặc điểm của protein này? Trả lời: Cách mã hóa dùng trong trìnhtự amino acid Giới thiệu môn học 26 Tìmkiếmtrìnhtựsinhhọc 27 Phần mềm Sequin Tìmkiếmtrìnhtựsinhhọc 28 Giới thiệu môn học 29... mRNA NM_123456 Tìmkiếmtrình s sinhhọc 17 V í dụ 2: NC_12345 Giới thiệu môn học 18 Kết quả tìmkiếm bộ gene Giới thiệu môn học 19 Thẻ giới hạn phạm vi tìmkiếm DNA [ALL] : Tất cả các trường tìmkiếm [ACCN]: Mã số truy cập của trìnhtự - Accession number [GI] : Số gi [AUTH] : Tên tác giả giải trình tự- author name [PDAT] : Ngày trìnhtự được chỉnh sửa hay ngày trìnhtự được cập nhật... publication date [ORGN] : Sinh vật chứa trìnhtự đó - organism [TITL] :Định nghĩa trìnhtự trong mẫu tin – title [SLEN] :Chiều dài của trìnhtự - Sequence length [GENE] : Tên gene Tìmkiếmtrìnhtự môn học 20 BÀI TẬP Chúng ta thực tập tìmkiếmtrìnhtự gen có tên là ST GENE và lấy đoạn nucleotide theo định dạng FASTA Câu hỏi 1: Kết quả có bao nhiêu mục tìm thấy ? Trả lời 1: Câu hỏi 2: Trìnhtự DNA này dài bao... giải trình tự- author name [PDAT] : Ngày trìnhtự được chỉnh sửa hay ngày trìnhtự được cập nhật (update) – publication date [ORGN] : Sinh vật chứa trìnhtự đó - organism [TITL] : Định nghĩa trìnhtự trong mẫu tin – title [SLEN] : Chiều dài của trìnhtự - Sequence length [PROT] : Tên protein – Protein name [MOLWT] : Trọng lượng phân tử protein Giới thiệu môn học 25 Bài tập Chúng ta thực tập tìmkiếm trình. .. 28 Giới thiệu môn học 29 Các download phần mềm sequin trong NCBI Giới thiệu môn học 30 Cách đăng ký trìnhtự đã được giải mã qua phần mềm sequin Chọn Genebank (NCBI) Giới thiệu môn học 31 Bước 1: Điền thông tin Giới thiệu môn học 32 Tìmkiếmtrìnhtựsinhhọc 33 Giới thiệu môn học 34 Giới thiệu môn học 35 Giới thiệu môn học 36 ... sinhhọc cần dữ liệutrình tự gene hoặc protein theo kiểu định dạng FASTA như ví dụ minh hoạ dưới đây: >tên trìnhtự gattctcacttggtctgctgcaaggacgcggaccattaaaactgttcatggcccttgtggcgttctcgttt cctaacaatcccaccaacagcagggatactaaaaagatggggaacgatcaaaaaatcaaaagctat caatgtcttgagagggttcaggaaagagattggaaggatgctgaacatcttgaacaggagacgcag gacagcaggcgtgattgttatgttgattccacagcgatggcgttccatttaaccacacgcaatgg Tìmkiếm trình. .. trìnhtựsinhhọc 15 Một số mã số truy cập của RefSeq database 1 mRNAs and Proteins NM_123456 NP_123456 NR_123456 XM_123456 XP_123456 XR_123456 2 Chromosome NC_123455 4 Assemblies NT_123456 Curated mRNA Curated Protein Curated non-coding RNA Predicted mRNA Predicted Protein Predicted non-coding RNA Microbial replicons, organelle genomes, human chromosomes Contig Tìmkiếmtrìnhtựsinhhọc . TÌM KIẾM TRÌNH TỰ SINH HỌC VÀ ĐĂNG KÝ TRÌNH TỰ TRÊN CƠ SỞ DỮ LIỆU Mục tiêu của bài học Có khả tìm kiếm được những trình tự sinh học như DNA,. h cớ ệ ọ 5 Đưa vào cơ sở dữ liệu sinh học: -NCBI - Các cơ sở dữ liệu khác Sequin Nguyên tắc tìm kiếm trình tự sau khi đã giải trình tự 1 .Tìm bằng từ khóa: