1. Trang chủ
  2. » Tất cả

(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu

47 9 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu(Luận văn thạc sĩ) Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG QUỐC HÙNG DỰ ĐOÁN SỰ TƯƠNG TÁC GIỮA CÁC PROTEIN DỰA TRÊN KỸ THUẬT HỌC SÂU LUẬN VĂN THẠC SĨ Ngành Công nghệ thông tin HÀ NỘI - 2017 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CƠNG NGHỆ ĐẶNG QUỐC HÙNG DỰ ĐỐN SỰ TƯƠNG TÁC GIỮA CÁC PROTEIN DỰA TRÊN KỸ THUẬT HỌC SÂU Ngành: Công nghệ thông tin Chuyên ngành: Kỹ thuật phần mềm Mã số: 60480103 LUẬN VĂN THẠC SĨ Ngành Công nghệ thông tin NGƯỜI HƯỚNG DẪN KHOA HỌC: TS Đặng Thanh Hải HÀ NỘI - 2017 LỜI CẢM ƠN Đầu tiên, em xin gửi lời cảm ơn chân thành sâu sắc đến thầy Đặng Thanh Hải, người trực tiếp hướng dẫn, bảo tận tình, giúp đỡ em suốt trình học tập, nghiên cứu thực đề tài Em xin bày tỏ lòng biết ơn sâu sắc đến Thầy Cô giảng viên cán Khoa Cơng nghệ thơng tin nói riêng trường Đại học Công nghệ - Đại học Quốc Gia Hà Nội nói chung, dành hết tâm huyết, tận tình hướng dẫn học viên chúng em suốt quãng thời gian qua Em xin cảm ơn Khoa Công nghệ thông tin tạo điều kiện cho chúng em học tập môi trường nghiên cứu lành mạnh thuận lợi để chúng em phát triển niềm đam mê Mình xin gửi lời cảm ơn tới bạn Trác Quang Thịnh hỗ trợ bạn suốt thời gian nghiên cứu Cuối cùng, xin gửi lời cảm ơn tới bạn trường ủng hộ giúp đỡ tơi suốt q trình học tập thực đề tài Hà Nội, ngày 12 tháng 10 năm 2017 Học viên Đặng Quốc Hùng LỜI CAM ĐOAN Em xin cam đoan phương pháp kỹ thuật sử dụng nghiên cứu tương tác protein dựa kĩ thuật học sâu trình bày luận văn em thực hướng dẫn Thầy Đặng Thanh Hải Tất tham khảo từ nghiên cứu liên quan trích dẫn nguồn gốc rõ ràng từ danh mục tài liệu tham khảo luận văn Trong luận văn này, việc chép tài liệu, cơng trình nghiên cứu người khác mà không ghi rõ tài liệu tham khảo Nếu phát có gian lận nào, em xin hoàn toàn chịu trách nhiệm trước hội đồng kết luận văn Hà Nội, ngày 12 tháng 10 năm 2017 Học viên Đặng Quốc Hùng MỤC LỤC DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT DANH MỤC CÁC HÌNH VẼ DANH MỤC BẢNG MỞ ĐẦU CHƯƠNG TỔNG QUAN VỀ DỰ ĐOÁN TƯƠNG TÁC PROTEINS 1.1 Giới thiệu tương tác proteins 1.2 Một số phương pháp dự đoán tương tác Proteins điển hình Dự đốn dựa thông tin chuỗi 1.2.1 1.2.1.1 Mơ hình dựa thuật toán SVM 1.2.1.2 riêng Mơ hình dựa học máy cực đoan phân tích thành phần Dự đốn dựa thông tin cấu trúc protein 1.2.2 1.2.2.1 Mơ hình PrISE 1.2.2.2 Mơ hình Zhang .8 1.2.2.3 Mơ hình iLoops CHƯƠNG TỔNG QUAN VỀ KỸ THUẬT HỌC SÂU (DEEP LEARNING) 11 2.1 Giới thiệu mạng nơron sinh học 11 2.2 Mạng Nơ ron nhân tạo .11 Các thành phần mạng Nơ ron nhân tạo 14 2.2.1 2.2.1.1 Đơn vị xử lý .14 2.2.1.2 Hàm kích hoạt 15 2.2.1.3 Các hình trạng mạng 16 2.2.2 Các phương pháp học mạng nơ ron 17 2.2.2.1 Học có giám sát 18 2.2.2.2 Học khơng có giám sát 18 2.2.3 Ứng dụng mạng nơ ron 18 2.2.4 Thuật toán lan truyền ngược 19 2.3 Giới thiệu học sâu (Deep Learning) 24 2.3.1 Phân loại mạng học sâu (Deep Learning) 24 2.3.2 Mạng nơ ron tích chập (Convolutional neural network - CNN) .25 CHƯƠNG MƠ HÌNH DỰ ĐỐN TƯƠNG TÁC PROTEINS DỰA TRÊN KỸ THUẬT HỌC SÂU (DEEP LEARNING) 29 3.1 Giới thiệu mô hình 29 3.2 Xây dựng mơ hình .31 3.3 Nguồn liệu tương tác protein 33 3.4 Đánh giá mơ hình 33 KẾT LUẬN 35 TÀI LIỆU THAM KHẢO 36 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT STT 10 11 12 13 14 15 16 17 18 Tiếng Anh Activation function Area under the curve (AUC) Convolutional layer Convolutional Neural Networks (CNNs) Distribution Feature map Filter Fully connected Kernel K-fold cross validation Layer Linear Overfitting Quasi Sequence Order (QSO) Stride Support vector machine (SVM) Threshold Protein - Protein interaction (PPI) Tiếng Việt Hàm kích hoạt Diện tích đường cong Tầng tích chập Mạng nơ ron tích chập Phân phối Ánh xạ đặc trưng Bộ lọc Kết nối đầy đủ Hàm nhân Kiểm định chéo k-fold Lớp/tầng Tuyến tính Quá vừa liệu Trình tự Quasi Bước trượt Máy véc tơ hỗ trợ Ngưỡng Tương tác protein DANH MỤC CÁC HÌNH VẼ Hình 1.1 Phương pháp SVM Hình 2.1 Các thành phần cấu trúc nơron Hình 2.2 Mơ hình MCP Neurons Hình 2.3 Nơ ron sinh học mơ hình MCP Hình 2.4 Đơn vị xử lý Hình 2.5 Hàm bước nhị phân Hình 2.6 Mạng nơ ron truyền thẳng lớp Hình 2.7 Mạng nơ ron truyền thẳng nhiều lớp Hình 2.8 Mạng hồi quy lớp Hình 2.9 Mạng Perceptron lớp Hình 2.10 Cấu trúc mạng nơ ron tích chập Hình 2.11 Ma trận đầu vào mạng CNN Hình 2.12 Tích chập lọc vùng liệu vào Hình 2.13 Đồ thị hàm ReLU Hình 2.14 Phương pháp MaxPooling với cửa sổ 2x2 bước trượt Hình 2.15 Lớp liên kết đầy đủ Hình 3.1 Q trình dự đốn tương tác proteins Hình 3.2 Ví dụ cặp protein tương tác Hình 3.3 Mơ hình dự đốn tương tác Protein Hình 3.4 Mơ hình dự đốn với thơng số cụ thể Hình 3.5 Đồ thị thể độ đo AUC DANH MỤC CÁC BẢNG Bảng 3.1 Cách tính véc tơ amino axit Bảng 3.2 Ma trận nhầm lẫn Bảng 3.3 Thống kê độ đo mơ hình tập huấn luyện Bảng 3.4 Thống kê độ đo mơ hình dự đoán tập đánh giá MỞ ĐẦU Protein hay gọi chất đạm đại phân tử cấu tạo theo nguyên tắc đa phân mà đơn phân amino axit Amino axit cấu tạo ba thành phần: nhóm amin (-NH2), hai nhóm cacboxyl (-COOH) cuối nguyên tử cacbon trung tâm đính với nguyên tử hyđro nhóm biến đổi R định tính chất amino axit [55] Protein amino axit đóng vai trị vơ quan trọng thể sống, bao gồm: tảng tạo nên sức sống thể, tham gia trình trao đổi chất dinh dưỡng, điều hoà nước, chất bảo vệ thể, cung cấp lượng cho hoạt động sống Tương tác protein trình tác động qua lại protein với protein với phân tử khác tế bào Sự tương tác tác động tới hoạt động tế bào ảnh hưởng đến trình sống thể sống Protein tương tác protein trung tâm hầu hết q trình sinh học Thơng thường, protein hoạt động cách độc lập mà thực chức chúng thông qua tương tác với đơn vị phân tử sinh học khác Do đó, việc kiểm tra tương tác protein-protein (PPI) cần thiết để hiểu chế phân tử q trình sinh học, dự đốn tương tác protein toán quan trọng ưu tiên ngành khoa học sinh học Tương tác protein thường xác định phương pháp lý hóa sinh, phương pháp nghiên cứu thực nghiệm phịng thí nghiệm Tuy nhiên, phương pháp thực nghiệm đắt tiền, thời gian có tỉ lệ thành cơng thấp Do đó, việc phát triển mơ hình tính tốn đáng tin cậy tạo thuận lợi cho việc xác định tương tác protein có ý nghĩa thực tiễn to lớn giúp phát tương tác protein có khả xảy cao làm tiền đề cung cấp tập lựa chọn ưu tiên cho thực nghiệm nhằm đem lại khả thành công cao tiết kiệm chi phí thực nghiệm Những lý thúc đẩy phát triển mạnh hướng nghiên cứu tin sinh học phát triển mơ hình tính tốn tiên tiến để dự đốn tương tác Proteins Nội dung luận văn chia thành chương sau: Chương giới thiệu tổng quan toán dự đoán tương tác proteins mơ hình dự đốn tương ứng điển hình, gần Chương trình bày kiến thức mạng nơ ron, kỹ thuật học sâu sâu vào mạng nơ ron tích chập Chương trình bày xây dựng mơ hình dự đốn tương tác protein, kết đạt mơ hình đồng thời so sánh kết phương pháp khác, qua có nhìn tổng quan chất lượng phương pháp ...ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẶNG QUỐC HÙNG DỰ ĐOÁN SỰ TƯƠNG TÁC GIỮA CÁC PROTEIN DỰA TRÊN KỸ THUẬT HỌC SÂU Ngành: Công nghệ thông tin Chuyên ngành: Kỹ thuật phần mềm... ĐOÁN TƯƠNG TÁC PROTEINS 1.1 Giới thiệu tương tác proteins 1.2 Một số phương pháp dự đoán tương tác Proteins điển hình Dự đốn dựa thông tin chuỗi 1.2.1 1.2.1.1 Mơ hình dựa thuật. .. để dự đốn tương tác Proteins 1.2.1 Dự đốn dựa thơng tin chuỗi Các dự đoán PPIs thực cách kết hợp thông tin tương tác biết với thông tin liên quan đến tương đồng chuỗi axit amin Phương pháp dựa

Ngày đăng: 23/01/2023, 09:42

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN