Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 47 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
47
Dung lượng
8,44 MB
Nội dung
TÌMKIẾMTRÌNH
TỰ SINHHỌCVÀĐĂNGKÝ
TRÌNH TỰTRÊN CƠ SỞDỮ LIỆU
Mục tiêu của bài học
Có khả tìmkiếm được những trìnhtựsinhhọc
như DNA, RNA, Protein.
Đăng ký những trìnhtự đã nghiên cứu được lên
Cơ sởdữliệu sinh học bằng phần mềm Sequin.
Tìm ki m trình t sinh h cế ự ọ
2
Nguyên tắc trong giải trình tự
Phương pháp Sanger: là phương pháp dựa trên sự tổng
hợp gián đoạn DNA.
Dựa theo phương pháp này chúng ta có thể xác định
được trìnhtự nucleotide của DNA hay RNA (ATGC…
TTT)
3
Tìm ki m trình t sinh h cế ự ọ
Nhiễm sắc thể, DNA, Gene, Nucleotide
Gi i thi u môn h cớ ệ ọ
4
Gửi trìnhtự lên Genebank của NCBI
Trìnhtự đã giải
Gi i thi u môn h cớ ệ ọ
5
Đưa vào cơ sởdữliệu sinh học:
-NCBI
- Các cơ sởdữliệu khác
Sequin
Nguyên tắc tìmkiếmtrìnhtự sau khi đã giải trình tự
1.Tìm bằng từ khóa: 2.Công cụ tìmkiếm
-Mã số truy cập
-Tên (gene hay Protein)
-GI
-Độ dài trình tự
-Trọng lượng phân tử
-Tên tác giả giải trình tự
3. Lọc trìnhtự
6
Tìm ki m trình t sinh h cế ự ọ
Kết quả
cần tìm
Kết quả
cần tìm
Tìm ki m trình t sinh h cế ự ọ
7
Tìm kiếmtrìnhtựsinhhọc qua NCBI
Click
Tìm ki m trình t sinh h cế ự ọ
8
Tìm kiếmtrìnhtự DNA
Tìm kiếmtrìnhtự qua mã số truy cập
Tìm ki m trình t sinh h cế ự ọ
9
Mã số truy cập của một trìnhtự là mã số do các nhà quản trị
CSDLSH đặt cho một trình tự, thường códạng :
8 kýtự : 2 chữ và 6 số ví dụ như AY690640
6 kýtự : 1 chữ và 5 số ví dụ như U20068
TÌM KIẾMTRÌNHTỰSINHHỌC QUA MÃ SỐ TRUY CẬP
Tìm ki m trình t sinh h cế ự ọ
10
[...]... Công trình này được đăng tải bởi tạp chí nào? Tác giả là ai? Trả lời 2: Giới thiệu môn học 21 Tìmkiếmtrìnhtự protein Tìmkiếmtrìnhtựsinhhọc 22 Tìmkiếmtrìnhtự qua tên sinh vật Giới thiệu môn học 23 Định dạngtrìnhtựdạng FASTA Giới thiệu môn học 24 Thẻ giới hạn phạm vi tìmkiếmtrìnhtự protein [ALL] : Tất cả các trường tìmkiếm [ACCN] : Mã số truy cập của trìnhtự - Accession...Kết quả tìmtrìnhtự DNA qua mã số truy cập Giới thiệu môn học 11 Tìmkiếmtrìnhtự qua tên gene Tìmkiếmtrìnhtựsinhhọc 12 Tìmkiếmtrìnhtựsinhhọc 13 Cách lấy trìnhtự theo định dang FASTA Giới thiệu môn học 14 Định dạng FASTA FASTA là một giải thuật bắt cặp trìnhtự được David J Lipman và William R Pearson miêu tả lần đầu tiên vào năm 1985 (Rapid and sensitive protein... trìnhtự protein là độc tố bền nhiệt có tên là ST (ST toxin) Câu hỏi: Có bao nhiêu mục bài liên quan đến trìnhtự protein yêu cầu được tìm thấy Trìnhtự protein ST toxin chủ yếu liên quan đến loài nào ? Đặc điểm của protein này? Trả lời: Cách mã hóa dùng trong trìnhtự amino acid Giới thiệu môn học 26 Tìmkiếmtrìnhtựsinhhọc 27 Phần mềm Sequin Tìmkiếmtrìnhtựsinhhọc 28 Giới thiệu môn học 29... mRNA NM_123456 Tìmkiếmtrình s sinhhọc 17 V í dụ 2: NC_12345 Giới thiệu môn học 18 Kết quả tìmkiếm bộ gene Giới thiệu môn học 19 Thẻ giới hạn phạm vi tìmkiếm DNA [ALL] : Tất cả các trường tìmkiếm [ACCN]: Mã số truy cập của trìnhtự - Accession number [GI] : Số gi [AUTH] : Tên tác giả giải trình tự- author name [PDAT] : Ngày trìnhtự được chỉnh sửa hay ngày trìnhtự được cập nhật... publication date [ORGN] : Sinh vật chứa trìnhtự đó - organism [TITL] :Định nghĩa trìnhtự trong mẫu tin – title [SLEN] :Chiều dài của trìnhtự - Sequence length [GENE] : Tên gene Tìmkiếmtrìnhtự môn học 20 BÀI TẬP Chúng ta thực tập tìmkiếmtrìnhtự gen có tên là ST GENE và lấy đoạn nucleotide theo định dạng FASTA Câu hỏi 1: Kết quả có bao nhiêu mục tìm thấy ? Trả lời 1: Câu hỏi 2: Trìnhtự DNA này dài bao... giải trình tự- author name [PDAT] : Ngày trìnhtự được chỉnh sửa hay ngày trìnhtự được cập nhật (update) – publication date [ORGN] : Sinh vật chứa trìnhtự đó - organism [TITL] : Định nghĩa trìnhtự trong mẫu tin – title [SLEN] : Chiều dài của trìnhtự - Sequence length [PROT] : Tên protein – Protein name [MOLWT] : Trọng lượng phân tử protein Giới thiệu môn học 25 Bài tập Chúng ta thực tập tìmkiếm trình. .. 28 Giới thiệu môn học 29 Các download phần mềm sequin trong NCBI Giới thiệu môn học 30 Cách đăngkýtrìnhtự đã được giải mã qua phần mềm sequin Chọn Genebank (NCBI) Giới thiệu môn học 31 Bước 1: Điền thông tin Giới thiệu môn học 32 Tìmkiếmtrìnhtựsinhhọc 33 Giới thiệu môn học 34 Giới thiệu môn học 35 Giới thiệu môn học 36 ... sinhhọc cần dữ liệutrình tự gene hoặc protein theo kiểu định dạng FASTA như ví dụ minh hoạ dưới đây: >tên trìnhtự gattctcacttggtctgctgcaaggacgcggaccattaaaactgttcatggcccttgtggcgttctcgt ttcctaacaatcccaccaacagcagggatactaaaaagatggggaacgatcaaaaaatcaaaagct atcaatgtcttgagagggttcaggaaagagattggaaggatgctgaacatcttgaacaggagacgc aggacagcaggcgtgattgttatgttgattccacagcgatggcgttccatttaaccacacgcaatgg Tìmkiếm trình. .. trìnhtựsinhhọc 15 Một số mã số truy cập của RefSeq database 1 mRNAs and Proteins NM_123456 NP_123456 NR_123456 XM_123456 XP_123456 XR_123456 2 Chromosome NC_123455 4 Assemblies NT_123456 Curated mRNA Curated Protein Curated non-coding RNA Predicted mRNA Predicted Protein Predicted non-coding RNA Microbial replicons, organelle genomes, human chromosomes Contig Tìmkiếmtrìnhtựsinhhọc . TÌM KIẾM TRÌNH
TỰ SINH HỌC VÀ ĐĂNG KÝ
TRÌNH TỰ TRÊN CƠ SỞ DỮ LIỆU
Mục tiêu của bài học
Có khả tìm kiếm được những trình tự sinh học
như DNA,. cớ ệ ọ
5
Đưa vào cơ sở dữ liệu sinh học:
-NCBI
- Các cơ sở dữ liệu khác
Sequin
Nguyên tắc tìm kiếm trình tự sau khi đã giải trình tự
1 .Tìm bằng từ khóa: