– Những đoạn trình tự chứa những đoạn lặp lại – Nhiệm vụ của bạn là phân mảnh lại các đoạn này với nhau và lập nên 1 trình tự genome hoàn chỉnh – Sau đó, dẫn xuất genome đó, tìm kiếm cá
Trang 1KIỂM TRA SỰ KHÁC BIỆT TRONG CÁC
TRÌNH TỰ TIẾN HÓA
Bài thực hành Tin sinh học số 3 GV: ThS Nguyễn Thành Luân
luannt@cntp.edu.vn
CÁC QUY ĐỊNH CHUNG TRONG THỜI
GIAN THỰC HÀNH
THỜI GIAN THỰC HÀNH VỚI MÁY
KHÔNG LÀM BẤT KỲ CÔNG VIỆC RIÊNG NÀO VỚI MÁY
TỰ LÀM VIỆC, THỜI GIAN KIỂM TRA THEO NHÓM HOẶC CÁ
Trang 2CÀI ĐẶT PHẦN MỀM
hành 03.rar
VẤN ĐỀ - TRIỆU CHỨNG
SINH HỌC
Một bệnh nhân được báo cáo tại 1 bệnh viện với sự phát triển khác thường ở mắt (ảnh)
Trang 3VẤN ĐỀ SINH HỌC
Các bác sĩ tiến hành phẫu thuật mắt và lấy
ra 1 con ấu trùng trong cơ thể từ vết thương
đó (ảnh dưới) Mang đi giải mã trình tự
GIỚI THIỆU CSDL BOLDSYSTEMS
Được thiết kế để hỗ trợ sự phát triển và ứng dụng của các CSDL Barcode DNA
nhập liệu CSDL, 1 hệ thống máy chủ CSDL barcode và khu vực chọn lọc CSDL
nghiên cứu nào đam mê trong lĩnh vực DNA Barcoding
Trang 4Giới thiệu Barcode Of Life Database
(BOLD)
Chứa trên 800,000 trình tự barcode (2010)
Được đóng góp bởi nhiều nhà khoa học và nghiên cứu viên trên toàn thế giới
DNA được tách chiết từ cơ thể SV, phóng đại gen COI sau đó giải mã trình tự gen
Trình tự sau đó được đưa vào BOLD kết hợp với tên loài phù hợp với mã barcode đã được giải mã
THAO TÁC THỰC HÀNH
Để xác định loài chưa biết tên đó, vào trang web (http://www.boldsystems.org) Click vào mục
“Identification”
Dán đoạn trình tự GEN THỰC HÀNH SỐ 03 vào mục textbox của Animal Identification (COI)
Click vào mục “Submit” Sau đó, chờ cho việc phân tích hoàn tất, bạn sẽ được dẫn đến 1 trang mới với danh sách các loài, phân loại của loài đó và tỷ lệ tương đồng với những loài khác
Trang 5Giao diện BOLDSYSTEMS
Di chuyển xuống dưới và Dán trình
tự ở dạng fasta SUBMIT
Nguồn: Ratnasingham, S & Hebert, P D N (2007) BOLD: The Barcode of Life Data System (www.barcodinglife.org) Molecular Ecology Notes 7,
355-364 DOI: 10.1111/j.1471-8286.2006.01678
TRẢ LỜI CÂU HỎI
trình tự?
Loài nào được phân loại và chi tiết loài được phân loại?
trùng gây bệnh ở người hay không? (dùng Google search hay theo tênS)
Trang 6CSDL INSECT/SPIDERS
http://insects.suite1 01.com/article.cfm/
screwworm_parasi tic_fly
KẾT LUẬN CỦA BÁC SỸ
kỳ quan trọng cho việc quyết định phương pháp điều trị cho bệnh nhân Loài đặc biệt này chỉ có thể
ký sinh trên 1 người trong giai đoạn ấu trùng
nào còn sót lại để dẫn đến sự tàn phá cơ thể bệnh nhân Tuy nhiên, những ký sinh trùng khác như giun móc, giun sán không nằm trong trường hợp này
Trang 7Xây dựng và dẫn xuất 1 đoạn genome nhỏ
Mục đích bài tập:
– Thực hiện việc xây dựng 1 chương trình genome từ dữ liệu của
1 đoạn genome ti thể
– Đoạn gen ti thể của 1 loài giun tròn với mỗi phân mảnh trình tự khoảng 500 –800 nucleotide
– Những đoạn trình tự chứa những đoạn lặp lại – Nhiệm vụ của bạn là phân mảnh lại các đoạn này với nhau và lập nên 1 trình tự genome hoàn chỉnh
– Sau đó, dẫn xuất genome đó, tìm kiếm các gen trên đoạn genome đó, chính xác nơi nào nó bắt đầu, nơi nào nó kết thúc
Nhiệm vụ của bạn là xác định vị trí của 6 nhóm gen liên kết protein (protein coding gene) và 5 gen tRNA
Xây dựng và dẫn xuất 1 đoạn genome nhỏ
pháp Walking và các báo cáo khoa học muốn được công nhận phải có đầy đủ 2 sợi (Double strands) của chuỗi DNA đã được giải mã
mỗi đoạn trình tự riêng lẻ như mỗi sợi của chuỗi DNA phải bổ sung 1 cách chính xác
Trang 8THAO TÁC THỰC HÀNH
Mở file mt_fwd_frags.abi trong FILE THUC HANH 03 bằng BioEdit
File này chứa 17 đoạn trình tự với độ dài khoảng 500-800 nucleotide
Để tìm thấy nơi nào đoạn trình tự bị lặp lại với 1 đoạnh trình tự khác trong CSDL, chúng ta sử dụng chương trình CONTIG ASSEMBLY
trong BioEdit
Chương trình này sẽ nói cho bạn nơi nào những trình tự bị trùng lắp và
có thể gắn kết những mảnh DNA liên kề đơn lẻ với nhau
Chọn „Accessory Application‟ ở Menu, và chọn „CAP ContigAssembly Program‟
Click vào “Run Application”
Giao diện BioEdit
Trang 9THAO TÁC THỰC HÀNH
Kết quả phân tích trình tự hoàn tất khi có chữ “SHOW” xuất hiện
Để xem kết quả của việc phân tích, đóng cửa sổ này
Bạn sẽ thấy được 1 đoạn trình tự khoảng hơn 8000 base pair và kéo sang phải sẽ thấy các đoạn trùng lắp trên DNA
Đoạn trình tự kết nối với nhau sẽ được chỉ với đoạn trình tự cuối cùng nằm phía dưới ký hiệu là Contig-0 Đây là đoạn trình tự giải
mã xuôi (Forward sequence)
Để SAVE đoạn trình tự này, xóa tất cá các trình tự nhỏ khác bằng phím CTRL + DEL, chỉ lưu lại 1 đoạn CONTIG-0
Sau đó chọn File ở Menu, Save As tên file là
CONTIG_FWD.FAS
THAO TÁC THỰC HÀNH
Lặp lại quá trình trên nhưng chọn file là mt_rev_frags.abi cho đoạn gen phiên mã ngược Save đoạn gen giải mã là
CONTIG_REV.FAS
Để xem 2 sợi DNA từ 2 đoạn trình tự có chính xác kết hợp bổ sung với nhau hay không, mở file CONTIG_FWD.FAS vào mục FILE ở Menu, chọn Import Sequence Alignment Import file CONTIG_REV.FAS
Chúng có vẻ không bổ sung kết hợp cho nhau vì chúng kết hợp từ những đoạn gen từ 2 sợi khác nhau nên để thấy chúng kết hợp bổ sung nhau, bạn phải xem 1 đoạn từ phải sang trái hay dùng kỹ thuật phiên mã ngược 1 trong 2 sợi của chuỗi DNA
Trang 10THAO TÁC THỰC HÀNH
Click vào 1 trong 2 đoạn trình tự để highlight
nó Vào mục Sequence ở Menu chọn
„Nucleic Acid‟ chọn „Reverse Complement‟
Nó sẽ hiện ra 1 bằng chứng 2 đoạn gen trình
tự phải được kết hợp chính xác với nhau Để kiểm tra lại lần cuối 1 cách nhanh chóng, click vào biểu tượng dưới đây:
HOÀN THÀNH CÂU 2 (5’)
Tiếp theo, bạn sẽ phải lập bản đồ vị trí gen trên đoạn genome vừa phân loại được Copy đoạn genome vừa giải mã được vào file Gen thực hành 03.doc
Vào ORFinder theo link
http://www.ncbi.nlm.nih.gov/gorf/gorf.html
in để thấy các đoạn đọc mở (Open Reading Frames) trong đoạn trình tự của bạn
Trang 11ORF Finder
Dán đoạn trình tự của bạn vào textbox và chọn “Invertebrate Mitochondrial” ở mục
Genetic Code (vì chúng ta biết đây là loài động vật không xương sống (giun tròn)
Click vào OrfFind Sau khi quá trình phân tích hoàn tất, bạn sẽ thấy 1 kết quả như hình:
Ý nghĩa biểu diễn trong ORF
Mỗi thanh trong khung đọc mở miêu tả 1 trong 6 khung đọc khác nhau
– 3 thanh đầu mô tả khung đọc mở cho 3 đoạn gen phiên mã xuôi (Forward reading frames),
– 3 thanh cuối mô tả 3 đoạn gen phiên mã ngược (Reverse reading frames)
– Chúng ta cần xác định 6 gen mã hóa protein (protein coding gene) nên chúng ta tìm hiểu đoạn đọc mở dài nhất biểu hiện bằng đoạn đọc có màu xanh dài nhất
Click vào đoạn đọc mở đơn lẻ màu xanh (Single ORF) Nó sẽ chuyển từ màu xanh sang hồng khi bạn click vào
Ví dụ: Click vào biểu tượng khung đọc mở bên trái, thanh đầu tiên dài nhất, đoạn dịch mã sẽ biểu hiện trình tự với
aa khởi đầu là Methionine và kết thúc với 1 codon kết
Trang 12TRẢ LỜI CÂU HỎI (5’)
Hãy trả lời câu hỏi vào Bảng 1
Hướng dẫn (Hints)
(Đây là gen mã hóa protein) Click vào thanh
„View Report‟
biểu thị tất cả những gen về ti thể liên quan đến đoạn đọc mở trên Nếu có, bạn đã thành công trong việc xác định khung đọc mở và thêm vào bảng báo
Trang 13Tìm kiếm các đoạn tRNA
Bạn mong muốn tìm kiếm 5 đoạn gen tRNA trong trình tự genome ti thể của bạn
Copy đoạn genome trình tự của bạn vào tRNAScantheo link:
http://lowelab.ucsc.edu/tRNAscan-SE/
Dán đoạn trình tự của bạn vào textbox chỉnh ở
phần „Source‟ sang Nematode Mito, và đặt ở mục
„Genetic Code for tRNA Isotype Prediction‟ thành
„Invertebrate Mito‟
Ghi rõ ở mục „Cove Score Cutoff‟ là 15
Tìm kiếm tRNA – Kết quả
Click vào nút Run tRNAScan
Chờ quá trình phân tích dữ liệu hoàn tất, bạn
sẽ thấy 1 danh sách các gen tRNA với vị trí chúng được đánh dấu và cove score (điểm vòng)
Điểm vòng là 1 sự chỉ thị các phân mảnh trình
tự được phân loại có thể gắn vào trong 1 cấu trúc tRNA vòng xoay đặc biệt 1 cách đặc hiệu
Trang 14Tìm kiếm tRNA (5’)
Tìm kiếm 5 gen tRNA và điền vào bảng
1
2
3
4
5
KẾT THÚC BÀI THỰC HÀNH
Chuẩn bị kiểm tra tại lớp 5%
Làm thêm các bài tập trong giáo trình thực
hành
Mang theo USB 3G cho thực hành môn học