Tin sinh học dự đoán cấu trúc protein

43 1.4K 4
Tin sinh học  dự đoán cấu trúc protein

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Ngày nay, Công nghệ sinh học được xác định là một nghành khoa học kỹ thuậtmang tính chiến lược ở nhiều quốc gia tiến bộ trên thế giới. Trong đó, công nghệ gen vàkỹ thuật di truyền được xem là lĩnh vực nghiên cứu trọng điểm. Mà đối tượng nghiên cứuchủ yếu của công nghệ gen và kỹ thuật di truyền là những đại phân tử sinh học (DNA,RNA, protein). Khi làm việc trên các đối tượng này, một trong những yếu tố quan trongquyết định sự thành công là việc con người phải nắm được hình dạng thực tế cấu trúctrong không gian của chúng.Watson và Crick đã ghi tên mình vào lịch sử nhân loại khi là 2 người đầu tiên tìmra cấu trúc DNA người. Từ công trình nghiên cứu này chúng ta đã có thể giải đáp chohàng trăm câu hỏi về di truyền ở người. Protein cũng là đối tượng nghiên cứu quan trọngcủa Công nghệ gen và có nhiều ứng dụng trực tiếp đến đời sống cũng như sản xuất. Dođó yêu cầu đặt ra là cần phải tìm hiểu được cấu trúc không gian của chúng nhằm hiểu rõđược quá trình hoạt động của các protein.

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KĨ THUẬT HÓA HỌC BỘ MÔN CÔNG NGHỆ SINH HỌC ĐỒ ÁN MÔN HỌC TIN SINH HỌC – DỰ ĐOÁN CẤU TRÚC PROTEIN SVTH: Phạm Hà Huy GVHD: TS. Huỳnh Ngọc Oanh MSSV: 60700959 Tp. Hồ Chí Minh, Tháng 6 / 2011 NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN MỤC LỤC DANH MỤC HÌNH vi DANH MỤC BẢNG vii DANH MỤC VIẾT TẮT viii CHƯƠNG 1. MỞ ĐẦU 1 CHƯƠNG 2. TỔNG QUAN VỀ DỰ ĐOÁN CẤU TRÚC PROTEIN 2 2.1. TẦM QUAN TRỌNG CỦA VIỆC DỰ ĐOÁN CẤU TRÚC 2 2.1.1. Cấu trúc protein: 2 2.1.2. Chức năng của protein 3 2.1.3. Ảnh hưởng của cấu trúc đến chức năng protein 4 2.2. CÁC CƠ SỞ CHO VIỆC DỰ ĐOÁN CẤU TRÚC 5 CHƯƠNG 3. CÁC PHƯƠNG PHÁP DỰ ĐOÁN CẤU TRÚC PROTEIN 7 3.1. AB INITIO 7 3.2. PROTEIN THREADING 7 3.3. HOMOLOGY MODELING [9]: 8 3.3.1. Quy trình thực hiện 8 3.3.2. Một số công cụ hỗ trợ của phầm mềm máy tính tiêu biểu 13 3.4. SO SÁNH CÁC PHƯƠNG PHÁP DỰ ĐOÁN CẤU TRÚC 15 3.5. ĐÁNH GIÁ CHẤT LƯỢNG MÔ HÌNH : 17 3.5.1. Tính chính xác về hoá học lập thể 17 3.5.2. Độ tin cậy của Fold : 20 3.5.3. Công cụ hỗ trợ PROCHECK 23 CHƯƠNG 4. MỘT VÍ DỤ VỀ DỰ ĐOÁN CẤU TRÚC PROTEIN 25 4.1. TÌM TRÌNH TỰ TƯƠNG ĐỒNG 25 4.2. SẮP GIÓNG CỘT : 28 4.3. XÂY DỰNG MÔ HÌNH CẤU TRÚC : 30 4.4. KIỂM TRA CẤU TRÚC: 32 CHƯƠNG 5. KẾT LUẬN VÀ KIẾN NGHỊ 33 5.1. Kết luận: 33 5.2. Kiến Nghị 33 CHƯƠNG 6. TÀI LIỆU THAM KHẢO 34 DANH MỤC HÌNH Hinh 1. Các loại cấu trúc 3D của Protein 3 Hinh 2. Cấu trúc 3D của một số Protein tiêu biểu 3 Hinh 3. Biểu đồ xác định mã di truyền 6 Hinh 4. Quy trình dự đoán cấu trúc protein bằng phương pháp mô hình hoá tương đồng 10 Hinh 5. Ký hiệu các góc xoắn của khung sườn trong cấu trúc protein 19 Hinh 6. Cấu trúc mắt người 25 Hinh 7. Website BLAST 26 Hinh 8. Giao diện tìm kiếm trình tự tương đồng 26 Hinh 9. Kết quả tìm kiếm trình tự tương đồng được biệu thị bằng màu sắc 27 Hinh 10. Kết quả tìm kiếm trình tự tương đồng 27 Hinh 11. Giao diện website CLUSTALW 2 28 Hinh 12. Những bước cần thiết để thực hiện sắp gióng cột 29 Hinh 13. Kết quả sau khi sử dụng CLUSTALW 2 30 Hinh 14. Giao diện website SWISS-MODEL 31 Hinh 15. Giao diện khai báo SWISS-MODEL 31 Hinh 16. Mô hình kết quả 32 DANH MỤC BẢNG Bảng 1. Tóm lược và so sánh 3 nhóm phương pháp dùng trong dự đoán cấu trúc protein 23 Bảng 1. Tóm tắt giá trị trung bình của các tham số hóa học lập thể 25 DANH MỤC VIẾT TẮT 3D 3 Dimentional BLAST Basic Local Aligment Search Tool PDB Protein Data Bank DOPE-score Discrete Optimized Protein Energy score ID Identification number NCBI National Center for Biotechnology Information CSDL Cơ Sở Dữ Liệu PSI-BLAST position-specific iterative BLAST Đồ án - Dự đoán cấu trúc protein 1 CHƯƠNG 1. MỞ ĐẦU Ngày nay, Công nghệ sinh học được xác định là một nghành khoa học kỹ thuật mang tính chiến lược ở nhiều quốc gia tiến bộ trên thế giới. Trong đó, công nghệ gen và kỹ thuật di truyền được xem là lĩnh vực nghiên cứu trọng điểm. Mà đối tượng nghiên cứu chủ yếu của công nghệ gen và kỹ thuật di truyền là những đại phân tử sinh học (DNA, RNA, protein). Khi làm việc trên các đối tượng này, một trong những yếu tố quan trong quyết định sự thành công là việc con người phải nắm được hình dạng thực tế cấu trúc trong không gian của chúng. Watson và Crick đã ghi tên mình vào lịch sử nhân loại khi là 2 người đầu tiên tìm ra cấu trúc DNA người. Từ công trình nghiên cứu này chúng ta đã có thể giải đáp cho hàng trăm câu hỏi về di truyền ở người. Protein cũng là đối tượng nghiên cứu quan trọng của Công nghệ gen và có nhiều ứng dụng trực tiếp đến đời sống cũng như sản xuất. Do đó yêu cầu đặt ra là cần phải tìm hiểu được cấu trúc không gian của chúng nhằm hiểu rõ được quá trình hoạt động của các protein. Trước đây, Để tìm hiểu cấu trúc không gian của một protein các nhà khoa học phải mất rất nhiều thời gian ( có khi đến hàng năm trời ) để thực hiện phương pháp X-ray và NMR. Ngược lại để biết trình tự amino acid của một protein thì rất nhanh. Theo thống kê đến tháng 8 năm 2008, có hơn 52.500 protein đã được xác định cấu trúc không gian, trong khi đó có đến hơn 6 triệu protein đã được xác định trình tự amino acid.[1] Ngày nay, nhờ sự tiến bộ của kỹ thuật máy tính chúng ta đã có thể sử dụng những chương trình máy tính để so sánh sự giống nhau giữa trình tự amino acid của protein mục tiêu với những protein đã biết cấu trúc không gian , từ đó dự đoán được cấu trúc của protein mục tiêu. Đây là một hướng nghiên cứu quan trọng của lĩnh vực tin sinh hoc và có nhiều ứng dụng được trong thực tiễn .Đã có rất nhiều nghiên cứu về đề tài này trên thế giới và đạt được nhiều thành quả nhất định. Trong phạm vi đồ án chuyên nghành, em chỉ xin trình bày một số kiến thức tổng quan để có thể có cái nhìn khái quát và đầy đủ nhất về hướng nghiên cứu này Đồ án - Dự đoán cấu trúc protein 2 CHƯƠNG 2. TỔNG QUAN VỀ DỰ ĐOÁN CẤU TRÚC PROTEIN 2.1. TẦM QUAN TRỌNG CỦA VIỆC DỰ ĐOÁN CẤU TRÚC 2.1.1. Cấu trúc protein: Protein là một hợp chất đại phân tử được tạo thành từ rất nhiều các đơn phân là các axit amin. Axit amin được cấu tạo bởi ba thành phần: một là nhóm amin (-NH 2 ), hai là nhóm cacboxyl (-COOH) và cuối cùng là nguyên tử cacbon trung tâm đính với một nguyên tử hyđro và nhóm biến đổi R quyết định tính chất của axit amin.Người ta phân ra có bốn loại protein theo cấu trúc: � Cấu trúc bậc một: Cấu trúc bậc một (primary structure) của phân tử protein được biểu hiện là số lượng của các mạch polypeptide, số lượng và trình tự của các axit amin trên mỗi mạch.Vì vậy cấu trúc bậc một của các protein khác nhau có sự dao động lớn, nên cá loại protein có được là một con số khổng lồ. � Cấu trúc bậc hai (xoắn alpha và beta): Các protein không chỉ là một chuỗi thẳng các axit amin nối lại với nhau, mà chúng còn cuộn lại trong một cấu trúc không gian phức tạp. Chính điều này đóng vai trò chủ yếu trong xác định các tính chất sinh học đặc trưng cho từng loại protein. Đặc tính không gian ba chiều này là hệ quả của sự tương tác giữa các peptide trong protein. Vào năm 1951, L.Pauling và B.Corey cho thấy các liên kết hydro bên trong phân tử tạo nên và ổn định cấu trúc xoắn alpha.Cấu trúc xoắn alpha có dạng đơn giản nhất ở một số protein sợi (fibrous protein). Một cách sắp xếp khác của mạch polypeptide tạo nên kiểu cấu trúc bậc hai khác gọi là cấu trúc beta, thường được gọi là các phiến xếp (pleated sheet). Nhờ sự sắp xếp như vậy nên protein dẻo, chắc, lại chịu sức căng như các loại protein của tơ lụa, mạng nhện, lông vũ … � Cấu trúc bậc ba: Các protein khối cuộn (globular protein) có cấu trúc không gian phức tạp hơn nhiều so với protein sợi, các mạch polypeptide của chúng cuộn lại phức tạp có dạng cuộn hay khối cầu , nhờ các nhóm gốc bên R tích điện hay phân cực. Các protein cuộn gồm các enzym, các hormon protein, các kháng thể và phần lớn các protein của máu. � Cấu trúc bậc bốn: Khi một protein khối cuộn gồm hai hay nhiều hơn các mạch polypeptide độc lập gắn lại với nhau, thường nhờ liên kết yếu, sẽ có cấu trúc bậc bốn. [...]...Đồ án - Dự đoán cấu trúc protein Hinh 1 Các loại cấu trúc 3D của protein Hinh 2 Cấu trúc 3D của một số protein tiêu biểu 2.1.2 Chức năng của protein Các protein có chức năng rất đa dạng Chúng thực hiện hầu hết các chức năng căn bản của chất sống như: chất xúc tác các phản ứng sinh học, phân tử cấu trúc của tế bào, 3 Đồ án - Dự đoán cấu trúc protein tham gia vào sự vận động, dự trữ và vận chuyển... của những protein đã biết trình tự trong ngân hàng thông tin Qua sự tương đồng như vậy, ta sẽ dự đoán toàn bộ được cấu trúc 3D của một protein chưa có cấu trúc không gian Hinh 3 Biểu đồ xác định mã di truyền 6 Đồ án - Dự đoán cấu trúc protein CHƯƠNG 3 CÁC PHƯƠNG PHÁP DỰ ĐOÁN CẤU TRÚC PROTEIN 3.1 AB INITIO Dựa trên giả thiết protein “ fold “ trong không gian đến trạng thái năng lượng nhiệt động học tối... càng gần với cấu trúc thực R-factor có thể giảm một cách cố ý bằng nhiều cách, và do đó trong nhiều trường hợp không còn chỉ thị tốt cho chất lượng cấu trúc Thông thường, cấu trúc có độ phân giải tốt hơn hoặc bằng 2.0 Å được xem là có thể tin cậy Nếu cấu trúc đó có R-factor thấp hơn 20% có thể cho là cấu trúc đúng về cơ bản 9 Đồ án - Dự đoán cấu trúc protein Hinh 4 Quy trình dự đoán cấu trúc protein bằng... những phần mềm có thể dự đoán cấu trúc của một protein đã xác định rõ trình tự amino acid trên cấu trúc bậc một Chúng ta đã có những protein biết rõ trình tự amino acid và cũng đã được xác định cấu trúc 3D thông qua thực nghiệm Dựa trên ngân hàng thông tin đó, chúng ta sẽ so sánh 5 Đồ án - Dự đoán cấu trúc protein toàn phần hoặc một đoạn trình tự amino acid của protein cần xác định cấu trúc 3D với những... khi không tìm được một cấu trúc có họ hàng với trình tự mục tiêu, vẫn có thể chọn cấu trúc từ các “ fold ” trong cơ sở dữ liệu đã có thay vì dự đoán từ đầu Protein threading là thuật ngữ chỉ chung các phương pháp dự đoán cấu trúc dựa trên khuôn mẫu cấu trúc sẵn có, nhưng áp dụng với các trình tự không tìm được tương đồng trong cơ sở dữ liệu cấu trúc Protein threading có thể chỉ dựa trên trình tự thuần... Đã có rất nhiều dự án nghiên cứu cấu trúc 3D của nhiều loại protein nhưng rất ít protein được nghiên cứu cấu trúc 3D bằng thực nghiệm Và chẳng thể nào tin rằng hàng tỷ protein sẽ được tìm ra cấu trúc 3D bằng thực nghiệm Ngày nay, nhờ sự tiến bộ công nghệ thông tin và sự phát triển những thuật toán máy máy tính Dựa trên mối quan hệ protein tương đồng và sự tạo thành cấu trúc 3D từ cấu trúc bậc một Chúng... trung tâm hoạt động còn lại Enzyme cũng sẽ bất hoạt nếu ta đun nóng để làm mất cấu trúc không gian của protein 2.2 CÁC CƠ SỞ CHO VIỆC DỰ ĐOÁN CẤU TRÚC Tuy phân tử protein có nhiều cấu trúc khác nhau nhưng có nhiều cơ sở cho rằng chính cấu trúc bậc một xác định cấu trúc không gian tự nhiên của phân tử protein Đặc biệt, cấu trúc bậc một tạo thuận lợi nhất về mặt năng lượng để ổn định mạch polypeptide... dụng cấu trúc (phục vụ tiếp Thuật giải so sánh trình thông tin từ cấu trúc khuôn cận theo hướng đơn giản tự - cấu trúc (dùng cho (sao chép tọa độ; tính toán hóa) Ưu điểm threading) giới hạn lập thể…) Không phụ thuộc cơ sở Độ chính xác cao dữ liệu cấu trúc Chất lượng mô hình tốt 16 Đồ án - Dự đoán cấu trúc protein Yêu cầu tài nguyên máy tính lớn Nhược điểm Trong nhiều trường hợp, cấu trúc tự nhiên của protein. .. Dự đoán cấu trúc protein CHƯƠNG 4 MỘT VÍ DỤ VỀ DỰ ĐOÁN CẤU TRÚC PROTEIN Để giúp chi phần lý thuyết ở trên dễ hiểu, sau đây đồ án sẽ thực hiện mô hình hoá cho một protein Quy trình thực hiện trải qua 4 bước như trình bày ở trên và sử dụng nhiều website nhằm tạo ra cái nhìn tổng quan nhất về các công cụ phục vụ cho việc dự đoán cấu trúc protein Đồ án sẽ chọn một protein đã biết chắc chắn cấu trúc qua... lượng bên trong, vì chất lượng lập thể của một cấu trúc được xác định dựa trên tọa độ của các nguyên tử trong bản thân cấu trúc đó, hoàn toàn không phụ thuộc một cấu trúc nào khác Chất lượng gấp cuộn của một cấu trúc protein được xác định thông qua việc so sánh cấu trúc đó với một tập hợp các cấu trúc chuẩn được cho là tốt Nhiều hệ thống điểm đã được xây dựng và thử nghiệm nhằm tối ưu hóa quá trình so . này Đồ án - Dự đoán cấu trúc protein 2 CHƯƠNG 2. TỔNG QUAN VỀ DỰ ĐOÁN CẤU TRÚC PROTEIN 2.1. TẦM QUAN TRỌNG CỦA VIỆC DỰ ĐOÁN CẤU TRÚC 2.1.1. Cấu trúc protein: Protein là một hợp. QUAN VỀ DỰ ĐOÁN CẤU TRÚC PROTEIN 2 2.1. TẦM QUAN TRỌNG CỦA VIỆC DỰ ĐOÁN CẤU TRÚC 2 2.1.1. Cấu trúc protein: 2 2.1.2. Chức năng của protein 3 2.1.3. Ảnh hưởng của cấu trúc đến chức năng protein. có thể tin cậy. Nếu cấu trúc đó có R-factor thấp hơn 20% có thể cho là cấu trúc đúng về cơ bản. Đồ án - Dự đoán cấu trúc protein 10 Hinh 4. Quy trình dự đoán cấu trúc protein

Ngày đăng: 18/04/2015, 16:43

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan