Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.Dự đoán cấu trúc bậc hai của phân tử sinh học trên cơ sở kết hợp một số kỹ thuật tính toán mềm.
ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐOÀN DUY BÌNH DỰ ĐỐN CẤU TRÚC BẬC HAI CỦA PHÂN TỬ SINH HỌC TRÊN CƠ SỞ KẾT HỢP MỘT SỐ KỸ THUẬT TÍNH TỐN MỀM LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng – 2023 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐỒN DUY BÌNH DỰ ĐỐN CẤU TRÚC BẬC HAI CỦA PHÂN TỬ SINH HỌC TRÊN CƠ SỞ KẾT HỢP MỘT SỐ KỸ THUẬT TÍNH TỐN MỀM Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 9.48.01.01 Người hướng dẫn khoa học: TS Phạm Minh Tuấn TS Đặng Đức Long LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng – 2023 LỜI CẢM ƠN Trước trình bày nội dung luận án, để có thành ngày hôm nay, suốt thời gian thực luận án này, nhận quan tâm giúp đỡ, hỗ trợ nhiệt tình lời động viên chân thành, quý báu từ quý Thầy Cô người thân, bạn bè Với lòng biết ơn sâu sắc, trước tiên xin gởi lời cảm ơn chân thành đến người thân gia đình – họ khơng ngại khó khăn, gian nan vất vả để tạo điều kiện thuận lợi cho suốt thời gian học tập, người tiếp thêm sức mạnh hỗ trợ vượt qua khó khăn để hồn thành luận án Tơi xin bày tỏ lịng biết ơn sâu sắc tới Tiến sỹ Phạm Minh Tuấn, Tiến sỹ Đặng Đức Long người tận tình quan tâm, động viên, giúp đỡ trực tiếp hướng dẫn suốt thời gian học tập trình nghiên cứu để tơi hồn thành luận án Tơi xin bày tỏ lịng biết ơn chân thành tới tồn thể Thầy Cô, Cán Nhân viên khoa Công nghệ Thông tin Phòng Ban chức trường Đại học Bách Khoa, Đại Học Đà Nẵng tận tình hướng dẫn, cung cấp tài liệu, động viên củng cố niềm tin ý chí cho tơi vượt qua chặng đường khó khăn suốt q trình nghiên cứu khoa trường Tôi xin chân thành cảm ơn tới toàn thể đồng nghiệp khoa Tin học trường Đại học Sư Phạm, Đại học Đà Nẵng tạo điều kiện cho mặt thời gian để tơi hồn thành luận án Tơi xin chân thành cảm ơn đến trường Đại học Sư phạm, Đại học Đà Nẵng tạo điều kiện mặt q trình tơi học tập, nghiên cứu hoàn thành luận án i Nhân dịp xin gửi lời cảm ơn chân thành tới tồn thể gia đình, bạn bè anh chị em NCS khoa Công nghệ Thông tin bên tôi, cổ vũ, động viên, giúp đỡ suốt trình học tập trường Đà Nẵng, ngày tháng năm 2023 Nghiên cứu sinh Đồn Duy Bình ii Mục lục Chương Tổng quan RNA, cấu trúc bậc hai RNA tính tốn mềm 1.1 Công nghệ sinh học 1.2 Tin sinh học 1.3 Cấu trúc Ribonucleic Acid (RNA) khái niệm liên quan 11 1.3.1 Cấu trúc RNA 11 1.3.2 Các khái niệm liên quan đến RNA 15 1.3.3 Dự đoán cấu trúc RNA 17 1.3.4 Các cách biểu diễn cấu trúc bậc hai RNA 19 1.3.5 Các phương pháp dự đoán cấu trúc bậc hai RNA, tồn hướng nghiên cứu phát triển 20 1.4 Tính tốn mềm 24 1.4.1 Thuật toán Di truyền - (Genetic Algorithm - GA) 25 1.4.2 Logic mờ đặc trưng tập mờ 27 1.4.3 Mạng nơ-ron nhân tạo (Artificial Neural Network - ANN) 33 1.4.4 Mạng nơ-ron hồi quy 34 1.4.5 Mạng nơ-ron dài ngắn hạn (Long Short-Term Memory - LSTM) 35 1.5 Kết luận Chương 37 Chương Đề xuất phương pháp kết hợp tính tốn mềm để dự đốn cấu trúc bậc hai phân tử sinh học 38 2.1 Bài toán dự đoán cấu trúc bậc hai phân tử sinh học 39 iii MỤC LỤC MỤC LỤC 2.2 Các tham số nhiệt động học 41 2.2.1 Năng lượng tự cho vòng xếp chồng (Stack loop): 41 2.2.2 Những lượng gây ổn định theo kích thước vịng: 41 2.2.3 Năng lượng tự cho vịng kẹp tóc (hairpin loops) tổng qt: 42 2.2.4 Năng lượng tự cho vòng kẹp tóc (hairpin loops) với chiều dài 4: 43 2.2.5 Năng lượng tự cho vòng lặp (internal loops) tổng quát: 43 2.2.6 Năng lượng tự cho vòng lặp (internal loops) đối xứng với kích thước 2: 44 2.2.7 Năng lượng tự cho vịng lặp (internal loops) khơng đối xứng có kích thước 3: 44 2.2.8 Năng lượng tự cho vòng lặp (internal loops) đối xứng với kích thước 4: 44 2.2.9 Năng lượng tự cho điểm bên (External): 44 2.2.10 Các quy tắc lượng tự hổn hợp: 45 2.3 Tính tốn lượng tự cấu trúc bậc hai 47 2.3.1 Những hàm tổng quát 47 2.3.2 Tính lượng tự cho vòng xếp chồng 49 2.3.3 Tính tốn lượng tự cho vịng kẹp tóc 49 2.3.4 Tính tốn lượng tự cho vòng lặp 51 2.3.5 Tính lượng tự cho vịng nhiều nhánh 53 2.3.6 Tính tốn lượng tự cho cấu trúc nhiều miền 54 iv MỤC LỤC MỤC LỤC 2.4 Các phương pháp đề xuất 55 2.4.1 Thuật toán di truyền 55 2.4.2 Kết hợp thuật toán di truyền với logic mờ 66 2.4.3 Kết hợp thuật toán di truyền với mạng nơ-ron nhân tạo, cụ thể mạng LSTM 76 2.5 Kết luận Chương 78 Chương Áp dụng tính tốn mềm cho tốn dự đốn cấu trúc bậc hai RNA 81 3.1 Cơ sở liệu RNA 81 3.2 Bộ liệu 83 3.3 Kết thực nghiệm 83 3.4 Thuật toán di truyền 86 3.4.1 Khởi tạo tham số cho thuật toán di truyền 86 3.4.2 Kết thực nghiệm 87 3.4.3 So sánh 89 3.5 Kết hợp thuật toán di truyền với logic mờ 93 3.5.1 Khởi tạo tham số cho thuật toán di truyền kết hợp với logic mờ 93 3.5.2 Kết thực nghiệm 93 3.5.3 So sánh 96 3.6 Phương pháp kết hợp thuật toán di truyền với mạng LSTM 98 3.6.1 Mơ hình kết hợp GA với LSTM 98 3.6.2 Kết thực nghiệm 99 v MỤC LỤC MỤC LỤC 3.6.3 So sánh 102 3.7 Kết luận Chương 104 i SARS-CoV-2 - 88 Bases i Thông tin chuỗi (Bảng 13 ): i Thuật toán di truyền i Kết hợp thuật toán di truyền với logic mờ iii Phương pháp kết hợp thuật toán di truyền với mạng LSTM iii II Virus E.Coli với chiều dài 221 nucleotides iv Thông tin chuỗi (Bảng 17) iv Thuật toán di truyền iv Kết hợp thuật toán di truyền với logic mờ v Phương pháp kết hợp thuật toán di truyền với mạng LSTM vii III Virus Bmori với chiều dài 498 nucleotides vii Thông tin chuỗi (Bảng :21 vii Thuật toán di truyền vii Kết hợp thuật toán di truyền với logic mờ ix Phương pháp kết hợp thuật toán di truyền với mạng LSTM x IV Schizosaccharomyces pombe với chiều dài 119 nucleotides xi Thông tin chuỗi (Bảng 25 ) xi Thuật toán di truyền xi Kết hợp thuật toán di truyền với logic mờ xiii I vi MỤC LỤC MỤC LỤC Phương pháp kết hợp thuật toán di truyền với mạng LSTM xiv V Oryza sativa Japonica Group (Japanese rice) với chiều dài 324 nucleotides xv Thông tin chuỗi (Bảng 29 ): xv Thuật toán di truyền xvi Kết hợp thuật toán di truyền với logic mờ xvi Phương pháp kết hợp thuật toán di truyền với mạng LSTM xvii VI Mycoplasma capricolum với chiều dài 865 nucleotides xviii Thông tin chuỗi (Bảng 33 ): xviii Thuật toán di truyền xix Kết hợp thuật toán di truyền với logic mờ xx Phương pháp kết hợp thuật toán di truyền với mạng LSTM xx VII.Cúm mùa Mỹ - Influenza A virus với chiều dài 543 nucleotides xxi Thông tin chuỗi (Bảng 37 ): xxi Thuật toán di truyền xxii Kết hợp thuật toán di truyền với logic mờ xxiv Phương pháp kết hợp thuật toán di truyền với mạng LSTM xxvi VIII.Bạch hầu - Corynebacterium diphtheriae với chiều dài 176 nucleotides xxvii Thông tin chuỗi (Bảng 41 ): xxvii Thuật toán di truyền xxvii Kết hợp thuật toán di truyền với logic mờ xxviii Phương pháp kết hợp thuật toán di truyền với mạng LSTM vii xxix MỤC LỤC MỤC LỤC IX Tay chân miệng (loại gây biến chứng thần kinh)- Coxsackie A16 với chiều dài 252 nucleotides xxx Thông tin chuỗi (Bảng 45 ): xxx Thuật toán di truyền xxx Kết hợp thuật toán di truyền với logic mờ xxxi Phương pháp kết hợp thuật toán di truyền với mạng LSTM xxxiii X Tay chân miệng (loại gây biến chứng nguy hiểm)- Enterovirus A71 với chiều dài 252 nucleotides xxxiv Thông tin chuỗi (Bảng 49): xxxiv Thuật toán di truyền xxxv Kết hợp thuật toán di truyền với logic mờ xxxvi Phương pháp kết hợp thuật toán di truyền với mạng LSTM xxxvi viii Hình 29: Cấu trúc chuỗi Mycoplasma capricolum với chiều dài 865 nucleotides với thuật toán di truyền kết hợp với LSTM Bảng 37: Thông tin chuỗi Cúm mùa Mỹ - Influenza A virus với chiều dài 543 nucleotides Tên chuỗi Influenza A virus 543 nucleotides Thông tin Chuỗi - Organism: Influenza A virus (A/turkey /Oregon /1/1971(H7N3)) - Accession:JQ436727.1: 543:ncRNA - Mol Type:transcribed RNA - Topology:LINEAR - Base Count:543 - Dataclass:STD - Tax Division:VRL - Strain:A/turkey /Oregon/1/1971 - Country:USA AAGGUGUCAUCCGAUUUACUGUUCUUGAAG UCCCAGCGCAAAAUGCCAUAAGUACCACGU UCCCUUAUACUGGAGAUCCUCCAUACAGCC AUGGAACAGGAACAGGAUACACCAUGGACA CGGUCAACAGAACACAUCAAUAUUCAGAAA AGGGGAAGUGGACAACAAACACGGAAACUG GAGCGCCCCAGCUUAACCCAAUUGUUGCAA CUACACACUCCUGGAUUCCUAAGAGGAACC GCUCUAUCCUCAACACAAGCCAAAGGGGAA UUCUUGAGGAUGAAAAGAUGUAUCAAAAGU GCUGCAACCUGUUCGAGAAAUUCUUCCCCA GUAGUUCAUACAGAAGGCCGGUUGGAAUCU CUAGCAUGGUGGAGGCCAUGGUGUCUAGGG CCCGGAUUGAUGCCAGGAUUGACUUCGAGU CUGGGCGGAUUAAGAAAGAAGAGUUCGCUG AGAUCAUGAAGAUCUGUUCCACCAUUGAAG AGCUCAGACGGCAAAAAUAGUGAAUUUAGC UUGUCCUUCAUGAAAAAAUGCCUUGUUUCU ACU Kết hợp thuật toán di truyền với logic mờ Kết quả: (Bảng 39) xxiv Bảng 38: Năng lượng cấu trúc chuỗi Cúm mùa Mỹ - Influenza A virus với chiều dài 543 nucleotides Thuật toán quy hoạch động Thuật toán di truyền Năng lương Cấu trúc -94.69 (((((.(((( .(( )).((( (( ))))) (((( )))) ))))))))) ((((( ((((.(((((( (( (((( )))) )) )))))) )))) )))))((.((((( ))))))) ((((( ((( (( )) )))))))) ((((( (((( ((( (((( (((((((( (((((((.((((.(((((((( )))))))) )))) ))))).)) )))))))) )))).))) )))) ))))) Năng lượng Cấu trúc -131.0 (((((.((( ((( (((.((((( ((((((((((( ((((.((((((( ((((( ))))).(( (((((( )))))) )) (( )).) )))))).)))).(((((( (( (((( )))) )) )))))) (((.((((( )))))))).((.((((( ((( (( )) )))))))))) .)) ))))(((((.(((.(((( )))) ((( ))) ))).) )))) (((((((.(((( )))).))).)))).((((((((((( (( )) )).)))))))))))))) ))))).)))))).)) ) (((((((((( ((( ((((( ((( ))) ))) )) ))) )).)))))))) ))))) Hình 30: Cấu trúc chuỗi Cúm mùa Mỹ - Influenza A virus với chiều dài 543 nucleotides với thuật toán quy hoạch động Bảng 39: Năng lượng cấu trúc chuỗi Cúm mùa Mỹ - Influenza A virus với chiều dài 543 nucleotides Thuật toán di truyền kết hợp với logic mờ Thuật toán di truyền Năng lương Cấu trúc -131.0 (((((.((( ((( (((.((((( ((((((((((( ((((.((((((( ((((( ))))).(( (((((( )))))) )) (( )).) )))))).)))).(((((( (( (((( )))) )) )))))) (((.((((( )))))))).((.((((( ((( (( )) )))))))))) .)) ))))(((((.(((.(((( )))) ((( ))) ))).) )))) (((((((.(((( )))).))).)))).((((((((((( (( )) )).)))))))))))))) ))))).)))))).)) ) (((((((((( ((( ((((( ((( ))) ))) )) ))) )).)))))))) ))))) Năng lượng Cấu trúc -137.6 (((((.(((( .(((((((( (((((((.((( ))).((( (( ))))).)))).))) ((((( ))))).)))) ))))))))))))) (((((.((( ((((((((((((( ((.(((((( )))).)) )) .((((( (((.((((( )))))))).((.((((( ((( (( )) )))))))))) (((( )) )).))))).)))))) .))))))) ((((((( .(((( ((( (((( (((((((((.((.((((((( )) ))))))) (((((((.((((.(((((((( )))))))) )))) ))))).)) ))))))))) )))).))) )))) .) )))))) )))))))) xxv Hình 31: Cấu trúc chuỗi Cúm mùa Mỹ - Influenza A virus với chiều dài 543 nucleotides với thuật toán di truyền Cấu trúc thể sau (Hình 32): Hình 32: Cấu trúc chuỗi Cúm mùa Mỹ - Influenza A virus với chiều dài 543 nucleotides với thuật toán di truyền kết hợp với logic mờ Phương pháp kết hợp thuật toán di truyền với mạng LSTM Kết quả: (Bảng 40) Cấu trúc thể sau (Hình 33): xxvi Bảng 40: Năng lượng cấu trúc chuỗi Cúm mùa Mỹ - Influenza A virus với chiều dài 543 nucleotides Thuật toán quy di truyền kết hợp với logic mờ Thuật toán di truyền kết hợp với LSTM Năng lương Cấu trúc -137.6 (((((.(((( .(((((((( (((((((.((( ))).((( (( ))))).)))).))) ((((( ))))).)))) ))))))))))))) (((((.((( ((((((((((((( ((.(((((( )))).)) )) .((((( (((.((((( )))))))).((.((((( ((( (( )) )))))))))) (((( )) )).))))).)))))) .))))))) ((((((( .(((( ((( (((( (((((((((.((.((((((( )) ))))))) (((((((.((((.(((((((( )))))))) )))) ))))).)) ))))))))) )))).))) )))) .) )))))) )))))))) Năng lượng Cấu trúc -139.6 (((((.(((( .(((((((( (((((((.((( ))).((( (( ))))).)))).))) ((((( ))))).)))) ))))))))))))) (((((.((( (((.((((((( .(((( ((((.(((((( (( (((( )))) )) )))))) )))) )))).((.((((( ))))))) (((((( ((( (( )) ))))))))) ))))) .)) ))) )))))))).(((((( .(( ((((( ((((((.( ((((((.((.(((.(((((( )))))) ((((.(((( (((( (( ((((.(((((((.((((.(((((((( )))))))) )))) ))))).)).)))) )))))) )))))))) ))) )).))))))).).)))))))))) Hình 33: Cấu trúc chuỗi Cúm mùa Mỹ - Influenza A virus với chiều dài 543 nucleotides với thuật toán di truyền kết hợp với LSTM VIII Bạch hầu - Corynebacterium diphtheriae với chiều dài 176 nucleotides Thông tin chuỗi (Bảng 41 ): Thuật toán di truyền Kết quả: (Bảng 42) xxvii Bảng 41: Thông tin chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides Tên chuỗi Thông tin Chuỗi Corynebacterium diphtheriae 176 nucleotides - Organism: Corynebacterium diphtheriae - Study Title: Corynebacterium diphtheriae Genome sequencing and assembly - Center Name: University of Lodz - Study Name:Corynebacterium diphtheriae - PROJECT-ID:355988 - ENA-FIRST-PUBLIC:2017-04-19 - ENA-LAST-UPDATE:2018-03-19 - Base count: 176 GUUGGUGGUUAUUGUGUCGG GGGUACGCCCGGUCCCUUUC CGAACCCGGAAGCUAAGCCC GAUUGCGCUGAUGGUACUGC ACCAUGGAGGGUCCCUUUCC GAACCCGGAAGCUAAGCCCG AUUGCGCUGAUGGUACUGCA CCUGGGAGGGUGUGGGAGAG UAGGUCGCCGCCAACC Bảng 42: Năng lượng cấu trúc chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides Thuật toán quy hoạch động Thuật toán di truyền Năng lương Cấu trúc -61.80 (((((((((.((( ((((( ))))) (((((( ((( ((( ((( ))).((((( ))))) (((( ((((( ( )))))) )))) ))) ))) (((((( ))) ))).)))))) ))).))))))))) Năng lượng Cấu trúc -63.11 ((((((((( (( (((.(((( (((( .((((( .(( ((( (((( ((((( ))))) (((( ((((( ( )))))) )))) )))) ))) )) ))))))))) )))) ))) ))))))))))) Cấu trúc thể sau (Hình 34, Hình 35): Kết hợp thuật tốn di truyền với logic mờ Kết quả: (Bảng 43) Bảng 43: Năng lượng cấu trúc chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides Thuật toán di truyền kết hợp với logic mờ Thuật toán di truyền Năng lương Cấu trúc -63.11 ((((((((( (( (((.(((( (((( .((((( .(( ((( (((( ((((( ))))) (((( ((((( ( )))))) )))) )))) ))) )) ))))))))) )))) ))) ))))))))))) Năng lượng Cấu trúc -64.50 (((((((((.((( ((((( ))))) (((((( (((( .((( (((( ((((( ))))) (((( ((((( ( )))))) )))) )))) ((( ))).))).))) ) )))))) ))).))))))))) Cấu trúc thể sau (Hình 36): xxviii Hình 34: Cấu trúc chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides với thuật toán quy hoạch động Hình 35: Cấu trúc chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides với thuật toán GA Phương pháp kết hợp thuật toán di truyền với mạng LSTM Kết quả: (Bảng 44) Cấu trúc thể sau (Hình 37): xxix Hình 36: Cấu trúc chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides với thuật toán di truyền kết hợp logic mờ Bảng 44: Năng lượng cấu trúc chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides Thuật toán di truyền kết hợp logic mờ IX Thuật toán di truyền kết hợp với LSTM Năng lương Cấu trúc -64.50 (((((((((.((( ((((( ))))) (((((( (((( .((( (((( ((((( ))))) (((( ((((( ( )))))) )))) )))) ((( ))).))).))) ) )))))) ))).))))))))) Năng lượng Cấu trúc -68.60 (((((((((.((( (((( )))).(((( ((( ((((( .(( ((( (((( ((((( ))))) (((( ((((( ( )))))) )))) )))) ))) )) ))))).))) )))) ))).))))))))) Tay chân miệng (loại gây biến chứng thần kinh)- Coxsackie A16 với chiều dài 252 nucleotides Thơng tin chuỗi (Bảng 45 ): Thuật tốn di truyền Kết quả: (Bảng 46) Cấu trúc thể sau (Hình 38, Hình 39): xxx Hình 37: Cấu trúc chuỗi Corynebacterium diphtheriae với chiều dài 176 nucleotides với thuật toán di truyền kết hợp LSTM Bảng 45: Thông tin chuỗi Coxsackie A16 với chiều dài 252 nucleotides Tên chuỗi Thông tin Chuỗi Coxsackie A16 252 nucleotides - Organism: Coxsackie virus A16 - Accession:U05876 - Mol Type:genomic RNA - Topology:LINEAR - Base Count:252 - Dataclass:STD - Tax Division:VRL - Strain:G-10 - Host:Homo sapiens - Ít gây biến chứng thần kinh ACAGGACGCUCUAAUAUGGACAUGGUGCAA AGAGUCUAUUGAGCUAGUUAGUAGUCCUCC GGCCCCUGAAUGCGGCUAAUCCUAACUGCG GAGCACAUACCCUCGACCCAGGGGGCAGUG UGUCGUAACGGGCAACUCUGCAGCGGAACC GACUACUUUGGGUGUCCGUGUUUCCUUUUA UUCUUAUACUGGCUGCUUAUGGUGACAAUU GAAAGAUUGUUACCAUAUAGCUAUUGGAUU GGCCAUCCGGUG Kết hợp thuật toán di truyền với logic mờ Kết quả: (Bảng 47) Cấu trúc thể sau (Hình 40): xxxi Bảng 46: Năng lượng cấu trúc chuỗi Coxsackie A16 với chiều dài 252 nucleotides Thuật toán quy hoạch động Thuật toán di truyền Năng lương Cấu trúc -79.16 ((((((((( (((((( )))))).)))) )))))(((( ((((((((( (((((((((((((.( (((( ))))) ))))) (( )) )))))))) ((.(( (( )))) (((.(((( )))).))).(((((( (((((((((( ))))))))))))).))) ))))))))))) )))) Năng lượng Cấu trúc -80.10 .(( ))((((((((((((((.((( ))).))) ( ((((((.((((.(((((( ((((.(( )).)))).((( .))) ))))))(((( (((( )))) )))) )))) ))))))) ))))))))))) (((((( (((((( (((((((((( ))))))))))))).))) ((( ))).)))) )) Hình 38: Cấu trúc chuỗi Coxsackie A16 với chiều dài 252 nucleotides với thuật toán quy hoạch động Bảng 47: Năng lượng cấu trúc chuỗi Coxsackie A16 với chiều dài 252 nucleotides Thuật toán di truyền kết hợp với logic mờ Thuật toán di truyền Năng lương Cấu trúc -80.10 .(( ))((((((((((((((.((( ))).))) ( ((((((.((((.(((((( ((((.(( )).)))).((( .))) ))))))(((( (((( )))) )))) )))) ))))))) ))))))))))) (((((( (((((( (((((((((( ))))))))))))).))) ((( ))).)))) )) Năng lượng Cấu trúc -85.90 ((.((( ((.((.(( (((.((((((( ))) )))) ))) )))).)) ((((((((( .(((((((((.( (((( ))))) )))))) ((((((.(((( (((( ) ).)) )))))))))) ))) (((((( ((( (((((((((( ))))))))))))))))))) ))))))))).))).) ) xxxii Hình 39: Cấu trúc chuỗi Coxsackie A16 với chiều dài 252 nucleotides với thuật toán di truyền Hình 40: Cấu trúc chuỗi Coxsackie A16 với chiều dài 252 nucleotides với thuật toán di truyền kết hợp logic mờ Phương pháp kết hợp thuật toán di truyền với mạng LSTM Kết quả: (Bảng 48) Cấu trúc thể sau (Hình 41): xxxiii Bảng 48: Năng lượng cấu trúc chuỗi Coxsackie A16 với chiều dài 252 nucleotides Thuật toán di truyền kết hợp với logic mờ Thuật toán di truyền kết hợp với LSTM Năng lương Cấu trúc -85.90 ((.((( ((.((.(( (((.((((((( ))) )))) ))) )))).)) ((((((((( .(((((((((.( (((( ))))) )))))) ((((((.(((( (((( ) ).)) )))))))))) ))) (((((( ((( (((((((((( ))))))))))))))))))) ))))))))).))).) ) Năng lượng Cấu trúc -87.90 ((.(((.(((( (((((( )))))).)))) ((( ( ((( ))) )))) ((((((((( (((((((((((((.( (((( ))))) ))))) (( )) ))))))))((((.(( (( )))) )))) (((((( ((( (((((((((( ))))))))))))))))))) ))))))))).))).) ) Hình 41: Cấu trúc chuỗi Coxsackie A16 với chiều dài 252 nucleotides với thuật toán di truyền kết hợp LSTM X Tay chân miệng (loại gây biến chứng nguy hiểm)- Enterovirus A71 với chiều dài 252 nucleotides Thông tin chuỗi (Bảng 49): xxxiv Bảng 49: Thông tin chuỗi Enterovirus A71 với chiều dài 252 nucleotides Tên chuỗi Thông tin Chuỗi Enterovirus A71 252 nucleotides - Organism: Entero virus A71 - Accession:U22521 - Mol Type:genomic RNA - Topology:LINEAR - Base Count:252 - Dataclass:STD - Tax Division:VRL - Strain:BrCr - Host:Homo sapiens - Gây biến chứng nguy hiểm AUAGGACGCUCUAAUACGGACAUGGCGUGA AGAGUCUAUUGAGCUAGUUAGUAGUCCUCC GGCCCCUGAAUGCGGCUAAUCCUAACUGCG GAGCACAUACCCUUAAUCCAAAGGGCAGUG UGUCGUAACGGGCAACUCUGCAGCGGAACC GACUACUUUGGGUGUCCGUGUUUCUUUUUA UUCUUGUAUUGGCUGCUUAUGGUGACAAUU AAAGAAUUGUUACCAUAUAGCUAUUGGAUU GGCCAUCCAGUG Thuật toán di truyền Kết quả: (Bảng 50) Bảng 50: Năng lượng cấu trúc chuỗi Enterovirus A71 với chiều dài 252 nucleotides Thuật toán quy hoạch động Thuật toán di truyền Năng lương Cấu trúc -74.16 (((((( (((((((((.(((( (((.((((((( ))) )))) ))) (( )).)))).((( (((((((((((((.( (((( ))))) ))))) (( )) )))))))).))).(( (( )))) ))))))))) .))))))((((( (((((( (((((((((( ))))))))))))).))) ((( ))).)))) ) Năng lượng Cấu trúc -76.75 (((( ((((((((( ((.((((((((( (((( ((( ( ((( ))) )))) )))) ((( (((((((((((((.( (((( ))))) ))))) )))))))).))) )))).))))).))))))))))) )))).(( )).(((((( (((((((((( ))))))))))))).))).((((((( )))))) ) Cấu trúc thể sau (Hình 42, Hình 43): xxxv Hình 42: Cấu trúc chuỗi Enterovirus A71 với chiều dài 252 nucleotides với thuật toán quy hoạch động Hình 43: Cấu trúc chuỗi Enterovirus A71 - 252 nucleotides với thuật toán GA Kết hợp thuật toán di truyền với logic mờ Kết quả: (Bảng 51) Cấu trúc thể sau (Hình 44): Phương pháp kết hợp thuật toán di truyền với mạng LSTM Kết quả: (Bảng 52) xxxvi Bảng 51: Năng lượng cấu trúc chuỗi Enterovirus A71 với chiều dài 252 nucleotides Thuật toán di truyền kết hợp với logic mờ Thuật toán di truyền Năng lương Cấu trúc -76.75 (((( ((((((((( ((.((((((((( (((( ((( ( ((( ))) )))) )))) ((( (((((((((((((.( (((( ))))) ))))) )))))))).))) )))).))))).))))))))))) )))).(( )).(((((( (((((((((( ))))))))))))).))).((((((( )))))) ) Năng lượng Cấu trúc -79.57 (((((( ((((((((( ((.((((((((( (((( ((( ( ((( ))) )))) )))) ((( (((((((((((((.( (((( ))))) ))))) )))))))).))) )))).))))).))))))))))) .)))))) ((((((((((( (((((((((( ))))))))))))).))) .))))) Hình 44: Cấu trúc chuỗi Enterovirus A71 - 252 nucleotides với thuật toán GA kết hợp logic mờ Bảng 52: Năng lượng cấu trúc chuỗi Enterovirus A71 với chiều dài 252 nucleotides Thuật toán di truyền kết hợp với logic mờ Thuật toán di truyền kết hợp với LSTM Năng lương Cấu trúc -79.57 (((((( ((((((((( ((.((((((((( (((( ((( ( ((( ))) )))) )))) ((( (((((((((((((.( (((( ))))) ))))) )))))))).))) )))).))))).))))))))))) .)))))) ((((((((((( (((((((((( ))))))))))))).))) .))))) Năng lượng Cấu trúc -82.36 (((((( ((((((((( ((.((((((((( (((( ((( ( ((( ))) )))) )))) ((( (((((((((((((.( (((( ))))) ))))) (( )) )))))))).))) )))).))))).))))))))))) .)))))) ((((( ((( (((((((((( ))))))))))))))))))((((((( )))))) ) Cấu trúc thể sau (Hình 45): xxxvii Hình 45: Cấu trúc chuỗi Enterovirus A71 - 252 nucleotides với thuật toán GA kết hợp LSTM xxxviii