BẢN CHUẨN Mr. Chung _______________ Giáo trình, bài giảng TIN SINH HỌC Tin sinh học là một môn học khá mới mẻ đối với Việt Nam. Các giáo trình về tin sinh học bằng tiếng Việt còn rất ít. Chính vì vậy, giáo trình được biên soạn nhằm cung cấp cho sinh viên và bạn đọc những kiến thức về lĩnh vực công nghệ sinh học như cách phân tích trình tự DNA, các cơ sở dữ liệu công nghệ sinh học lớn trên thế giới, hướng dẫn thiết kế bản đồ enzyme giới hạn và thiết kế mồi. Giới thiệu các phần mềm và website dùng trong nghiên cứu đa dạng sinh học, khả năng ứng dụng của kỹ thuật trong quản lý môi trường và chẩn đoán y học. Ngoài ra, tác giả đã giới thiệu một số phần mềm miễn phí, thông dụng như: SeqVerter, DNAClub, Clusta X, DNA club, FastPCR, Primer3, PyMol, SeqVerter v.v…
BÀI GIẢNG ĐIỆN TỬ ỨNG DỤNG TIN HỌC TRONG SINH HỌC (Informatics applycation in biology) Người soạn: Lê Phương Chung Bộ môn CNSH – Viện CNSH & MT Mở đầu Giới thiệu tin học ứng dụng tin học sinh học “The two technologies that will shape the next century are biotechnology and information technology” Bill Gates Sự đời tin sinh học Buổi bình minh trình tự: Trình tự Protein, trình tự axit nucleic Sự xuất thông tin cấu trúc, chức trình tự protein, DNA dẫn tới nhu cầu quản lý, so sánh dự đoán cấu trúc chức sinh vật Sự phát triển ngành khoa học khác đặc biệt công nghệ thông tin, máy tính Bio (Sinh học) + informatics (Khoa học tính toán) = Bioinformatics (Giải toán sinh học việc sử dụng phương pháp khoa học tính toán) Tin sinh học (Bioinformatic) hiểu ngành khoa học phân tích dự đoán đặc tính đối tượng sinh học, sở tích hợp lực hoạt động hữu lĩnh vực khoa học công nghệ: - khoa học sinh học - lực quản trị xử lý số liệu máy tính - tổ chức quản lý khai thác liệu thông tin quy mô toàn cầu Các từ đồng nghĩa: Computational biology, Computational molecular biology, Biocomputing Vai trò Tin sinh học Tập hợp, lưu trữ, xếp, truy xuất chia sẻ sở liệu Hỗ trợ cho việc tìm kiếm, phân tích, xử lý dự đoán kết nghiên cứu Hỗ trợ nghiên cứu cấu trúc không gian phân tử Hỗ trợ nghiên cứu đa dạng tiến hoá sinh vật Xu hướng phát triển Tin sinh học Quản lý sở liệu Phân tích, biên dịch liệu Phát triển thuật toán Các cấu trúc sở liệu Thiết kế giao diện hiển thị 10 255 256 257 258 259 260 Ý nghĩa vùng bảo tồn (CDD) - Để xác định vùng chức protein - Để dự đoán chức protein, chức mà chưa biết - Để thiết lập mối quan hệ tiến hóa họ protein - Để giải thích nghiên cứu đột biến - Để dự đoán cấu trúc protein mà chưa biết cấu trúc 261 262 263 PHẦN MỀM HỮU ÍCH TRONG TIN SINH HỌC 264 MỘT SỐ PHẦN MỀM ĐÃ SỬ DỤNG VÀ THỰC TẬP Bioedit Sequin DNA Club CN3D 265 DNA club phần mềm phân tích DNA Thiết kế mồi, đánh giá mồi, chọn lựa mồi Lập đồ enzyme cắt giới hạn Tạo trình tự reverse complement Dịch mã trình tự Tìm trình tự DNA, tìm khung đọc mở (Open Reading Frame) 266 Phần mềm Clustal Clustalx phần mềm dùng cho việc so sánh tương đồng hai hay nhiều trình tự sinh học Clustalx mô tả kết hệ thống màu sắc ký hiệu bậc nét đặc trưng đoạn tương đồng ClustalX ngày trở nên hữu ích cho nhà nghiên cứu việc tìm kiếm vùng bảo tồn trình tự DNA protein 267 Clustalx thường sử dụng để giải toán hàng đa trình tự; Điều đặc biệt quan trọng phân loại học ClustalX ngày trở nên hữu ích cho nhà nghiên cứu việc tìm kiếm vùng bảo tồn trình tự DNA protein Ví dụ: Để phát đột biến ta phải tìm trình tự gen chủng hoang dại trình tự gen chủng cho đột biến 268 Ngoài có phần mềm online http://molbiol-tools.ca/ http://bips.u-strasbg.fr/EMBOSS/ 269 [...]... FASTA PCR Splicing Query ORF (Open Reading Frame) Tm (Melting temperature) Exon 23 Vấn đề 1 Cơ sở dữ liệu công nghệ sinh học 24 Đặc điểm cơ sở dữ liệu công nghệ sinh học -Nguồn cơ sở dữ liệu vô cùng đa dạng, phong phú, gia tăng mạnh mẽ theo thời gian - Chiếm khối lượng lớn nhất và đa dạng nhất là các kết quả nghiên cứu trên các đối tượng sinh học - Các dữ liệu này được biểu diễn dưới dạng số hay ký... tài nguyên (không download những tập tin quá lớn mà chẳng để làm gì, đặc biệt trong giờ cao điểm • Không xoá tập tin của người khác • Không xâm phạm, phát tán những thông tin có tính chất riêng tư của người khác • Không truy cập, phát tán những thông tin phản động… 22 Một số thuật ngữ tin sinh thường gặp trên internet Accession Alignment Plasmid Transcription DNA sequencing Primer Translation gi Promoter... Nguyễn Văn Cách (2006) Tin sinh học, Nxb Khoa học và Kỹ thuật, Hà nội 2) Arthur M L (2002) Introduction to Bioinformatics, Published in the United States by Oxford University Press Inc., New York 3) Baxevanis,A D and Francis Ouellette, B.F (2001) Bioinformatics a Practical guide to the Analysis of Genes and Protein, John Wiley & Sons, INC 4) Bryan B (2001) Bioinformatics Computing, Pretice Hall Pub... Bioinformatics: Sequence and Genome Analysis, Cold Spring Harbor Press, New York 6) Shui Q.Y (2008)Bioinformatics: A Practical Approach, CRC Press, Taylor & Francis Group 11 Tài liệu tham khảo Thư viện Trường đại học Nha Trang 1, Intelligent Bioinformatics: The Application of Artificial Intelligence Techniques to Bioinformatics Problems 2, Machine Learning in Bioinformatics (Wiley Series in Bioinformatics) 3, Bioinformatics:... và dữ liệu thứ cấp 25 - Dữ liệu thông tin thông thường: sách, báo, tạp chí… - Dữ liệu về phân loại học - Dữ liệu về cấu trúc và đặc tính của nucleotide và genom Mỗi cơ sở dữ liệu có thể định hướng tập trung vào các mảng thông tin riêng Song phải đảm bảo tiêu chí: dễ dàng truy cập, quản lý và khai thác cho người khác dữ liệu, nhằm hỗ trợ và giúp họ tìm được thông tin mong muôn! 26 NCBI National Center... định được đoạn ADN đó của sinh vật nào Biết được trình tự sắp xếp các nucleotit của một đoạn ADN có thể suy ra trình tự các axit amin tương ứng trên mạch polypeptide nếu đoạn ADN đó mã hóa Xác định đột biến, sự sai khác về trình tự nucleotit trong cùng một sản phẩm gen (isozyme, allozyme…) có ý nghĩa trong nghiên cứu tiến hóa và ứng dụng thực tiễn 32 Về mặt phân loại sinh học, đối với một số gen... ta có thể phát hiện sớm bằng kỹ thuật PCR, lai ADN để ngăn chặn, điều trị Thiết kế những cặp mồi (primer) để nhân bản các đoạn này cho những mục đích nghiên cứu khác nhau như : Nghiên cứu sự có mặt của gen đó trong các sinh vật khác nhau 34 Từ trình tự nucleotit của một phân tử ADN có thể biết được bản đồ các vị trí nhận biết của các enzym cắt hạn chế Điều này đặc biệt có ý nghĩa trong kỹ nghệ ADN... hoạt động của các gen đó 35 Một trong những ứng dụng quan trọng đó là chuyển gen để tạo ra các sinh vật mới mang những đặc tính mong muốn hoặc có thể chuyển gen vào các tế bào vi khuẩn, nấm men… để sản xuất sản phẩm gen theo con đường tái tổ hợp (protein, enzym, vaccine và các hợp chất có hoạt tính sinh học) Từ trình tự axit amin của phân tử protein, có thể suy diễn ra trình tự nucleotit của gen... mặt phân loại sinh học, đối với một số gen có tính bảo thủ cao, mang tính đặc thù loài, chẳng hạn các gen mã hóa cho ARN ribosome (rRNA) Dựa vào những trình tự ADN của các gen này ở những loài sinh vật khác nhau mà người ta có thể so sánh chúng trên cơ sở xác định mức độ sai khác về trình tự nucleotit từ đó mô phỏng mối quan hệ loài, dưới loài 33 Biết được trình tự của một gen (chẳng hạn gen ung... kết các tổ chức, trung tâm, viện nghiên cứu, trường học • Để máy tính hoạt động hiệu quả thì chúng phải cùng chia sẻ một phương tiện truyền thông được gọi chung là TCP/IP 13 TCP/IP (Transmission Control Protocol/ Internet Protocol) gọi là giao thức truyền dữ liệu/ giao thức Internet Giao thức này cho phép các máy tính trên mạng trao đổi dữ liệu với nhau một cách thống nhất, tương tự như một ngôn ngữ ... (Khoa học tính toán) = Bioinformatics (Giải toán sinh học việc sử dụng phương pháp khoa học tính toán) Tin sinh học (Bioinformatic) hiểu ngành khoa học phân tích dự đoán đặc tính đối tượng sinh học, ... đầu Giới thiệu tin học ứng dụng tin học sinh học “The two technologies that will shape the next century are biotechnology and information technology” Bill Gates Sự đời tin sinh học Buổi bình... tin cấu trúc, chức trình tự protein, DNA dẫn tới nhu cầu quản lý, so sánh dự đoán cấu trúc chức sinh vật Sự phát triển ngành khoa học khác đặc biệt công nghệ thông tin, máy tính Bio (Sinh học)