1. Trang chủ
  2. » Lịch sử lớp 12

Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu

53 14 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 53
Dung lượng 1,46 MB

Nội dung

Nội dung của bài toán trong nghiên cứu này là: đầu vào là tập các dữ liệu quan hệ tương tác giữa các cặp protein – protein đã được gán nhãn theo 2 lớp (dương tính – có tương tác, âm tí[r]

Ngày đăng: 15/01/2021, 13:07

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] R. E. H. Geoffrey M. Cooper (2004). The Cell: A Molecular Approach, 832 pages Sách, tạp chí
Tiêu đề: The Cell: A Molecular Approach
Tác giả: R. E. H. Geoffrey M. Cooper
Năm: 2004
[6] G. Waksman (2005). Proteomics and Protein-Protein Interactions: Biology, Chemistry, Bioinformatics, and Drug Design, pp. 90-91 Sách, tạp chí
Tiêu đề: Proteomics and Protein-Protein Interactions: Biology, Chemistry, Bioinformatics, and Drug Design
Tác giả: G. Waksman
Năm: 2005
[7] T. M. Mitchell (1997). Machine Learning. McGraw-Hill Science/Engineering/ Math, (March 1, 1997), pp. 3-5 Sách, tạp chí
Tiêu đề: McGraw-Hill Science/Engineering/ "Math
Tác giả: T. M. Mitchell
Năm: 1997
[8] I. Rish (2001). An empirical study of the naive Bayes classifier, pp. 2-3 Sách, tạp chí
Tiêu đề: An empirical study of the naive Bayes classifier
Tác giả: I. Rish
Năm: 2001
[9] O. M. Lior Rokach (2008). Data mining with decision trees: theory and applications. World Scientific Publishing Co. Pte. Ltd, pp.4-5 Sách, tạp chí
Tiêu đề: World Scientific Publishing Co. Pte. Ltd
Tác giả: O. M. Lior Rokach
Năm: 2008
[10] Zhang Q. et al (2012). Structure-based prediction of protein-protein interactions on a genome-wide scale, pp. 2-3 Sách, tạp chí
Tiêu đề: Structure-based prediction of protein-protein interactions on a genome-wide scale
Tác giả: Zhang Q. et al
Năm: 2012
[11] Pitre S. et al (2006). PIPE: a protein-protein interaction prediction engine based on the re-occurring short polypeptide sequences between known interacting protein pairs, pp. 2-3 Sách, tạp chí
Tiêu đề: PIPE: a protein-protein interaction prediction engine based on the re-occurring short polypeptide sequences between known interacting protein pairs
Tác giả: Pitre S. et al
Năm: 2006
[12] Liu B. et al (2009). Prediction of protein-protein interactions based on, pp. 2-3 Sách, tạp chí
Tiêu đề: Prediction of protein-protein interactions based on
Tác giả: Liu B. et al
Năm: 2009
[13] Urquiza J. et al (2011). Method for Prediction of Protein-Protein Interactions in Yeast Using Genomics/Proteomics Information and Feature Selection, pp. 2-3 Sách, tạp chí
Tiêu đề: Method for Prediction of Protein-Protein Interactions in Yeast Using Genomics/Proteomics Information and Feature Selection
Tác giả: Urquiza J. et al
Năm: 2011
[14] Szklarczyk D. et al (2011). The STRING database in 2011: functional interaction networks of proteins, globally integrated and scored, pp. 2-3 Sách, tạp chí
Tiêu đề: The STRING database in 2011: functional interaction networks of proteins, globally integrated and scored
Tác giả: Szklarczyk D. et al
Năm: 2011
[15] Cai L. et al (2003). SVM-Prot: web-based support vector machine software for functional classification of a protein from its primary sequence, pp.3-4 Sách, tạp chí
Tiêu đề: SVM-Prot: web-based support vector machine software for functional classification of a protein from its primary sequence
Tác giả: Cai L. et al
Năm: 2003
[16] Zou Q et al (2013). Identifying Multi-Functional Enzyme by Hierarchical. Journal of Computational & Theoretical Nanoscience, pp. 1038-1043 Sách, tạp chí
Tiêu đề: Journal of Computational & Theoretical Nanoscience
Tác giả: Zou Q et al
Năm: 2013
[17] Ioannis X. et al (2000). DIP: the Database of Interacting Proteins. PubMed Central, pp. 289-291 Sách, tạp chí
Tiêu đề: PubMed Central
Tác giả: Ioannis X. et al
Năm: 2000
[18] Philipp B. et al (2014). Negatome 2.0: a database of non-interacting proteins derived by literature mining, manual annotation and protein structure analysis.PubMed Central, 42:D396-D400 Sách, tạp chí
Tiêu đề: PubMed Central
Tác giả: Philipp B. et al
Năm: 2014
[19] Liu B. et al (2008). A discriminative method for protein remote homology detection and fold recognition combining Top-n-grams and latent semantic analysis. BMC Bioinformatics, 9:510 Sách, tạp chí
Tiêu đề: BMC Bioinformatics
Tác giả: Liu B. et al
Năm: 2008
[20] Zhu-Hong Y. et al (2015). Predicting Protein-Protein Interactions from Primary Protein Sequences Using a Novel Multi-Scale Local Feature Representation Scheme and the Random Forest. PLoS One 10 Sách, tạp chí
Tiêu đề: PLoS One
Tác giả: Zhu-Hong Y. et al
Năm: 2015
[2] P. J. Chaput (2012).[online] Available at: http://www.futura-sciences.com/sante/ actualites/medecine-alzheimer-parkinson-nouvelle-piste-300-maladies-35922/[Accessed 12 September 2017] Link
[4] R. Bailey (2017). [online] Available at: https://www.thoughtco.com/protein-function-373550 [Accessed 12 September 2017] Link
[5] G. Filiano (2016). [online]. Available at: http://sb.cc.stonybrook.edu/news/ general/2016-07-12-new-method-to-model-protein-interactions-may-help-accelerate-drug-development.php [Accessed 12 September 2017] Link

HÌNH ẢNH LIÊN QUAN

Hình 2-1: Minh họa cấu trúc 3D một protein [2] - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 2 1: Minh họa cấu trúc 3D một protein [2] (Trang 11)
Hình 2-2: Cấu tạo của một amino acid - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 2 2: Cấu tạo của một amino acid (Trang 12)
Hình 2-3: Minh họa tương tác protei n– protein [5] - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 2 3: Minh họa tương tác protei n– protein [5] (Trang 14)
quả đầu ra là tương tác hoặc khơng tương tác. Sau khi thuật tốn tạo ra một mơ hình, tức là một hàm số mà đầu vào là một dữ liệu quan hệ protein – protein và đầu ra là một  nhãn tương tác, hoặc khơng tương tác, khi nhận được một quan hệ protein – protein m - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
qu ả đầu ra là tương tác hoặc khơng tương tác. Sau khi thuật tốn tạo ra một mơ hình, tức là một hàm số mà đầu vào là một dữ liệu quan hệ protein – protein và đầu ra là một nhãn tương tác, hoặc khơng tương tác, khi nhận được một quan hệ protein – protein m (Trang 16)
Hình dạng của một cây quyết định là một cấu trúc cĩ thành phần: cĩ node trên cùng được gọi là gốc, đĩ là thuộc tính cĩ giá trị là điểm chia phân lớp tốt nhất trong tất cả các  thuộc tính, các node ngồi cùng là các lá của cây quyết định, biểu thị cho các l - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình d ạng của một cây quyết định là một cấu trúc cĩ thành phần: cĩ node trên cùng được gọi là gốc, đĩ là thuộc tính cĩ giá trị là điểm chia phân lớp tốt nhất trong tất cả các thuộc tính, các node ngồi cùng là các lá của cây quyết định, biểu thị cho các l (Trang 18)
Hình 2-5: Minh họa thuật tốn SVM - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 2 5: Minh họa thuật tốn SVM (Trang 19)
Hình 2-6: So sánh bộ phân lớp đơn lẻ và bộ phân lớp tổng hợp - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 2 6: So sánh bộ phân lớp đơn lẻ và bộ phân lớp tổng hợp (Trang 20)
Hình 2-7: Mơ hình hoạt động Bagging - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 2 7: Mơ hình hoạt động Bagging (Trang 21)
Hình 2-8: Mơ hình hoạt động Boosting - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 2 8: Mơ hình hoạt động Boosting (Trang 22)
Hình 2-9: Mơ hình hoạt động RandomForest - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 2 9: Mơ hình hoạt động RandomForest (Trang 23)
Bảng 2-3: Bảng giá trị ma trận confusion (chưa chuẩn hĩa) - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Bảng 2 3: Bảng giá trị ma trận confusion (chưa chuẩn hĩa) (Trang 24)
Hình 3-1: Sơ đồ phương pháp trích xuất thuộc tính n-gram - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 3 1: Sơ đồ phương pháp trích xuất thuộc tính n-gram (Trang 29)
Bảng 3-1: Bảng chia nhĩm 20 amino acid dựa vào tính lưỡng cực và khối lượng mạch nhánh - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Bảng 3 1: Bảng chia nhĩm 20 amino acid dựa vào tính lưỡng cực và khối lượng mạch nhánh (Trang 30)
4.1.1 Yêu cầu cấu hình - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
4.1.1 Yêu cầu cấu hình (Trang 36)
Hình 4-3: Giao diện chức năng lựa chọn thuộc tính/đặc trưng - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 4 3: Giao diện chức năng lựa chọn thuộc tính/đặc trưng (Trang 37)
Hình 4-2: Giao diện chức năng trích xuất thuộc tính/đặc trưng - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 4 2: Giao diện chức năng trích xuất thuộc tính/đặc trưng (Trang 37)
Hình 4-4: Giao diện chức năng Phân lớp thuộc tính/đặc trưng - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 4 4: Giao diện chức năng Phân lớp thuộc tính/đặc trưng (Trang 38)
Hình 4-5: Giao diện chức năng Đánh giá mơ hình thuật tốn - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 4 5: Giao diện chức năng Đánh giá mơ hình thuật tốn (Trang 38)
Bảng 4-1: Bảng giá trị phân lớp dự đốn - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Bảng 4 1: Bảng giá trị phân lớp dự đốn (Trang 39)
Trong bảng biểu diễn kết quả ta xếp thành từng cặp theo luật: thuật tốn phân lớp đơn lẻ A - thuật tốn phân lớp tổng hợp cĩ cơ sở là thuật tốn phân lớp đơn lẻ A tương  ứng - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
rong bảng biểu diễn kết quả ta xếp thành từng cặp theo luật: thuật tốn phân lớp đơn lẻ A - thuật tốn phân lớp tổng hợp cĩ cơ sở là thuật tốn phân lớp đơn lẻ A tương ứng (Trang 40)
Bảng 4-5: Thời gian thực hiện phương pháp trích xuất thuộc tính MLD, giảm chiều cịn 100 thuộc tính  - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Bảng 4 5: Thời gian thực hiện phương pháp trích xuất thuộc tính MLD, giảm chiều cịn 100 thuộc tính (Trang 42)
Bảng 4-4: Kết quả thực nghiệm phương pháp trích xuất thuộc tính MLD, giảm chiều cịn 100 thuộc tính  - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Bảng 4 4: Kết quả thực nghiệm phương pháp trích xuất thuộc tính MLD, giảm chiều cịn 100 thuộc tính (Trang 42)
Hình 4-7: Biểu đồ kết quả thực nghiệm phương pháp trích xuất thuộc tính MLD, giảm chiều cịn 100 thuộc tính  - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 4 7: Biểu đồ kết quả thực nghiệm phương pháp trích xuất thuộc tính MLD, giảm chiều cịn 100 thuộc tính (Trang 43)
Bảng 4-6: Kết quả thực nghiệm phương pháp trích xuất thuộc tính n-gram, khơng giảm chiều thuộc tính  - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Bảng 4 6: Kết quả thực nghiệm phương pháp trích xuất thuộc tính n-gram, khơng giảm chiều thuộc tính (Trang 44)
Bảng 4-7: Thời gian thực hiện phương pháp trích xuất thuộc tính n-gram, khơng giảm chiều thuộc tính  - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Bảng 4 7: Thời gian thực hiện phương pháp trích xuất thuộc tính n-gram, khơng giảm chiều thuộc tính (Trang 44)
Hình 4-8: Biểu đồ kết quả thực nghiệm phương pháp trích xuất thuộc tính n-gram, khơng giảm chiều số thuộc tính  - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 4 8: Biểu đồ kết quả thực nghiệm phương pháp trích xuất thuộc tính n-gram, khơng giảm chiều số thuộc tính (Trang 45)
Bảng 4-9: Thời gian thực hiện phương pháp trích xuất thuộc tính n-gram, giảm chiều cịn 100 thuộc tính  - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Bảng 4 9: Thời gian thực hiện phương pháp trích xuất thuộc tính n-gram, giảm chiều cịn 100 thuộc tính (Trang 46)
Bảng 4-8: Kết quả thực nghiệm phương pháp trích xuất thuộc tính n-gram, giảm chiều cịn 100 thuộc tính  - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Bảng 4 8: Kết quả thực nghiệm phương pháp trích xuất thuộc tính n-gram, giảm chiều cịn 100 thuộc tính (Trang 46)
Hình 4-9: Biểu đồ kết quả thực nghiệm phương pháp trích xuất thuộc tính n-gram, giảm chiều cịn 100 thuộc tính  - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
Hình 4 9: Biểu đồ kết quả thực nghiệm phương pháp trích xuất thuộc tính n-gram, giảm chiều cịn 100 thuộc tính (Trang 47)
Tổng kết, ta cĩ bảng rút gọn kết quả thực nghiệm trong nghiên cứu cho các phương pháp trích xuất thuộc tính/đặc trưng, các phương pháp phân lớp như sau:  - Dự đoán tương tác protein-protein sử dụng kỹ thuật khai phá dữ liệu
ng kết, ta cĩ bảng rút gọn kết quả thực nghiệm trong nghiên cứu cho các phương pháp trích xuất thuộc tính/đặc trưng, các phương pháp phân lớp như sau: (Trang 48)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w