1. Trang chủ
  2. » Thể loại khác

Dự đoán tương tác giữa các Protein dựa trên thuật toán Deep Learning (Luận văn thạc sĩ)

33 238 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 33
Dung lượng 385,46 KB
File đính kèm Luận văn Full.rar (1 MB)

Nội dung

Dự đoán tương tác giữa các Protein dựa trên thuật toán Deep Learning (Luận văn thạc sĩ)Dự đoán tương tác giữa các Protein dựa trên thuật toán Deep Learning (Luận văn thạc sĩ)Dự đoán tương tác giữa các Protein dựa trên thuật toán Deep Learning (Luận văn thạc sĩ)Dự đoán tương tác giữa các Protein dựa trên thuật toán Deep Learning (Luận văn thạc sĩ)Dự đoán tương tác giữa các Protein dựa trên thuật toán Deep Learning (Luận văn thạc sĩ)Dự đoán tương tác giữa các Protein dựa trên thuật toán Deep Learning (Luận văn thạc sĩ)Dự đoán tương tác giữa các Protein dựa trên thuật toán Deep Learning (Luận văn thạc sĩ)Dự đoán tương tác giữa các Protein dựa trên thuật toán Deep Learning (Luận văn thạc sĩ)Dự đoán tương tác giữa các Protein dựa trên thuật toán Deep Learning (Luận văn thạc sĩ)

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG QUỐC HÙNG DỰ ĐOÁN SỰ TƯƠNG TÁC GIỮA CÁC PROTEIN DỰA TRÊN KỸ THUẬT HỌC SÂU LUẬN VĂN THẠC SĨ Ngành Công nghệ thông tin HÀ NỘI - 2017 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CƠNG NGHỆ ĐẶNG QUỐC HÙNG DỰ ĐỐN SỰ TƯƠNG TÁC GIỮA CÁC PROTEIN DỰA TRÊN KỸ THUẬT HỌC SÂU Ngành: Công nghệ thông tin Chuyên ngành: Kỹ thuật phần mềm Mã số: 60480103 TÓM TẮT LUẬN VĂN THẠC SĨ Ngành Công nghệ thông tin HÀ NỘI - 2017 LỜI CẢM ƠN Đầu tiên, em xin gửi lời cảm ơn chân thành sâu sắc đến thầy Đặng Thanh Hải, người trực tiếp hướng dẫn, bảo tận tình, giúp đỡ em suốt trình học tập, nghiên cứu thực đề tài Em xin bày tỏ lòng biết ơn sâu sắc đến Thầy Cô giảng viên cán Khoa Công nghệ thơng tin nói riêng trường Đại học Cơng nghệ - Đại học Quốc Gia Hà Nội nói chung, dành hết tâm huyết, tận tình hướng dẫn học viên chúng em suốt quãng thời gian qua Em xin cảm ơn Khoa Công nghệ thông tin tạo điều kiện cho chúng em học tập môi trường nghiên cứu lành mạnh thuận lợi để chúng em phát triển niềm đam mê Mình xin gửi lời cảm ơn tới bạn Trác Quang Thịnh hỗ trợ bạn suốt thời gian nghiên cứu Cuối cùng, xin gửi lời cảm ơn tới bạn trường ủng hộ giúp đỡ tơi suốt q trình học tập thực đề tài Hà Nội, ngày 12 tháng 10 năm 2017 Học viên Đặng Quốc Hùng LỜI CAM ĐOAN Em xin cam đoan phương pháp kỹ thuật sử dụng nghiên cứu tương tác protein dựathuật học sâu trình bày luận văn em thực hướng dẫn Thầy Đặng Thanh Hải Tất tham khảo từ nghiên cứu liên quan trích dẫn nguồn gốc rõ ràng từ danh mục tài liệu tham khảo luận văn Trong luận văn này, khơng có việc chép tài liệu, cơng trình nghiên cứu người khác mà khơng ghi rõ tài liệu tham khảo Nếu phát có gian lận nào, em xin hồn tồn chịu trách nhiệm trước hội đồng kết luận văn Hà Nội, ngày 12 tháng 10 năm 2017 Học viên Đặng Quốc Hùng MỤC LỤC DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT DANH MỤC CÁC HÌNH VẼ DANH MỤC CÁC BẢNG MỞ ĐẦU CHƯƠNG TỔNG QUAN VỀ DỰ ĐOÁN TƯƠNG TÁC PROTEINS 1.1 Giới thiệu tương tác proteins 1.2 Một số phương pháp dự đốn tương tác Proteins điển hình 1.2.1 Dự đốn dựa thơng tin chuỗi 1.2.1.1 Mô hình dựa thuật tốn SVM 1.2.1.2 riêng Mơ hình dựa học máy cực đoan phân tích thành phần 1.2.2 Dự đốn dựa thơng tin cấu trúc protein 1.2.2.1 Mô hình PrISE 1.2.2.2 Mơ hình Zhang .8 1.2.2.3 Mơ hình iLoops CHƯƠNG KỸ THUẬT HỌC SÂU (DEEP LEARNING) 11 2.1 Giới thiệu học sâu (Deep Learning) 11 2.2 Phân loại mạng học sâu (Deep Learning) 11 2.3 Mạng nơ ron tích chập (Convolutional neural network - CNN) 11 CHƯƠNG MƠ HÌNH DỰ ĐỐN TƯƠNG TÁC PROTEINS DỰA TRÊN KỸ THUẬT HỌC SÂU (DEEP LEARNING) 16 3.1 Giới thiệu mơ hình 16 3.2 Xây dựng mơ hình .18 3.3 Nguồn liệu tương tác protein 20 3.4 Đánh giá mơ hình 20 KẾT LUẬN 21 TÀI LIỆU THAM KHẢO 23 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT STT 10 11 12 13 14 15 16 17 18 Tiếng Anh Activation function Area under the curve (AUC) Convolutional layer Convolutional Neural Networks (CNNs) Distribution Feature map Filter Fully connected Kernel K-fold cross validation Layer Linear Overfitting Quasi Sequence Order (QSO) Stride Support vector machine (SVM) Threshold Protein - Protein interactions(PPIs) Tiếng Việt Hàm kích hoạt Diện tích đường cong Lớp tích chập Mạng nơ ron tích chập Phân phối Lớp ánh xạ đặc trưng Bộ lọc Kết nối đầy đủ Hàm nhân Kiểm định chéo k-fold Lớp/tầng Tuyến tính Q vừa liệu Trình tự Quasi Bước trượt Máy véc tơ hỗ trợ Ngưỡng Sự tương tác protein DANH MỤC CÁC HÌNH VẼ Hình 1.1 Phương pháp SVM Hình 2.1 Các thành phần cấu trúc nơron Hình 2.10 Cấu trúc mạng nơ ron tích chập Hình 2.11 Ma trận đầu vào mạng CNN Hình 2.12 Tích chập lọc vùng liệu vào Hình 2.13 Đồ thị hàm ReLU Hình 2.14 Phương pháp MaxPooling với cửa sổ 2x2 bước trượt Hình 2.15 Lớp liên kết đầy đủ Hình 3.1 Q trình dự đốn tương tác proteins Hình 3.2 Ví dụ cặp protein tương tác Hình 3.3 Mơ hình dự đốn tương tác Protein Hình 3.4 Mơ hình dự đốn với thơng số cụ thể Hình 3.5 Đồ thị thể độ đo AUC DANH MỤC CÁC BẢNG Bảng 3.1 Cách tính véc tơ amino axit Bảng 3.2 Ma trận nhầm lẫn Bảng 3.3 Thống kê độ đo mơ hình tập huấn luyện Bảng 3.4 Thống kê độ đo mơ hình dự đốn tập đánh giá MỞ ĐẦU Protein hay gọi chất đạm đại phân tử cấu tạo theo nguyên tắc đa phân mà đơn phân amino axit Amino axit cấu tạo ba thành phần: nhóm amin (-NH2), hai nhóm cacboxyl (-COOH) cuối nguyên tử cacbon trung tâm đính với ngun tử hyđro nhóm biến đổi R định tính chất amino axit [55] Protein amino axit đóng vai trò vơ quan trọng thể sống, bao gồm: tảng tạo nên sức sống thể, tham gia trình trao đổi chất dinh dưỡng, điều hồ nước, chất bảo vệ thể, cung cấp lượng cho hoạt động sống Tương tác protein trình tác động qua lại protein với protein với phân tử khác tế bào Sự tương tác tác động tới hoạt động tế bào ảnh hưởng đến trình sống thể sống Protein tương tác protein trung tâm hầu hết q trình sinh học Thơng thường, protein hoạt động cách độc lập mà thực chức chúng thông qua tương tác với đơn vị phân tử sinh học khác Do đó, việc kiểm tra tương tác protein-protein (PPI) cần thiết để hiểu chế phân tử trình sinh học, dự đoán tương tác protein toán quan trọng ưu tiên ngành khoa học sinh học Tương tác protein thường xác định phương pháp lý hóa sinh, phương pháp nghiên cứu thực nghiệm phòng thí nghiệm Tuy nhiên, phương pháp thực nghiệm đắt tiền, thời gian có tỉ lệ thành cơng thấp Do đó, việc phát triển mơ hình tính tốn đáng tin cậy tạo thuận lợi cho việc xác định tương tác protein có ý nghĩa thực tiễn to lớn giúp phát tương tác protein có khả xảy cao làm tiền đề cung cấp tập lựa chọn ưu tiên cho thực nghiệm nhằm đem lại khả thành công cao tiết kiệm chi phí thực nghiệm Những lý thúc đẩy phát triển mạnh hướng nghiên cứu tin sinh học Một số lượng lớn phương pháp tính tốn đề xuất để dự đốn tương tác Proteins Nội dung luận văn chia thành chương sau: Chương giới thiệu cách sơ lược toán dự đoán tương tác proteins mơ hình dự đốn tương ứng điển hình, gần Chương trình bày kiến thức mạng nơ ron, kỹ thuật học sâu sâu vào mạng nơ ron tích chập Chương trình bày xây dựng mơ hình để dự đốn, kết đạt mơ hình đồng thời so sánh kết phương pháp khác, qua có nhìn tổng quan chất lượng phương pháp CHƯƠNG TỔNG QUAN VỀ DỰ ĐOÁN TƯƠNG TÁC PROTEINS 1.1 Giới thiệu tương tác proteins Protein đại phân tử cấu tạo theo nguyên tắc đa phân mà đơn phân axít amin Chúng kết hợp với thành mạch dài nhờ liên kết peptide (gọi chuỗi polypeptide) Các chuỗi xoắn cuộn gấp theo nhiều cách để tạo thành bậc cấu trúc không gian khác protein Trong tế bào động vật, protein có vai trò quan trọng Chúng tham gia cấu trúc tế bào, enzym xúc tác cho q trình sinh lý sinh hóa xảy tế bào Protein tham gia vào trình vận chuyển, bảo vệ, điều khiển, nơi dự trữ chất dinh dưỡng, nhận biết loại phân tử khác nhau, chịu trách nhiệm vận động thể sống mức tế bào thể Các chức nhiều phân tử protein đặc hiệu đảm nhiệm Tương tác protein trình tác động qua lại protein với protein với phân tử khác tế bào Sự tương tác tác động tới hoạt động tế bào ảnh hưởng đến trình sống thể sống Dựa vào đặc điểm chức cấu trúc PPIs phân loại theo nhiều cách khác theo bề mặt tương tác PPIs Homo heterooligomeric, theo ổn định phân loại thành: bắt buộc không bắt buộc, theo mức độ bền vững phân loại thành: PPIs yếu PPIs bền Một tương tác phân loại khác điều kiện khác Ví dụ, PPI tương tác yếu thể (in Vivo) trở thành tương tác bền điều kiện định tế bào Theo quan sát, protein thực chức chúng mà thường kết hợp với protein khác cách hình thành mạng tương tác protein protein khổng lồ Tập hợp tương tác protein gọi mạng tương tác proteinprotein (protein – protein interactions - PPIs) Việc tạo đồ tương tác PPIs không cung cấp nhìn sâu sắc chức protein mà giúp làm rõ chế phân tử tế bào Nghiên cứu PPIs bước để tìm hiểu chức protein tế bào Theo Phizicky Fields, PPIs làm thay đổi tính chất enzymes, tạo vị trí liên kết mới, ngừng hoạt động phá hủy protein dẫn đến thay đổi đặc tính protein Mạng PPIs định nghĩa hệ thống phức tạp proteins liên kết tương tác chúng Mạng PPIs thường biểu diễn đồ thị bao gồm đỉnh cạnh, proteins biểu diễn đỉnh đồ thị, cạnh biểu diễn tương tác proteins Căn vào đồ thị này, phương pháp tính tốn khác khai phá liệu, học máy, phương pháp thống kê thiết kế để tổ chức mạng PPI cấp độ khác Việc kiểm tra mơ hình đồ thị mạng mang lại nhiều hiểu biết, ví dụ proteins láng giềng ... DỰ ĐOÁN TƯƠNG TÁC PROTEINS 1.1 Giới thiệu tương tác proteins 1.2 Một số phương pháp dự đốn tương tác Proteins điển hình 1.2.1 Dự đốn dựa thơng tin chuỗi 1.2.1.1 Mơ hình dựa thuật. .. phương pháp tính toán đề xuất để dự đoán tương tác Proteins Nội dung luận văn chia thành chương sau: Chương giới thiệu cách sơ lược toán dự đoán tương tác proteins mơ hình dự đốn tương ứng điển... MƠ HÌNH DỰ ĐỐN TƯƠNG TÁC PROTEINS DỰA TRÊN KỸ THUẬT HỌC SÂU (DEEP LEARNING) 16 3.1 Giới thiệu mơ hình 16 3.2 Xây dựng mơ hình .18 3.3 Nguồn liệu tương tác protein

Ngày đăng: 19/01/2018, 10:13

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w